You are on page 1of 581

Vjerojatnost i statistika

kratak uvod

prema ponajboljim autorima sastavio


Zvonko Glumac
c 2015. Zvonko Glumac
Copyright

P UBLISHED BY P UBLISHER

BOOK - WEBSITE . COM

Permission is given to copy these documents for educational purposes.

First printing, III 2006.


Smrt jednog čovjeka je tragedija,
a smrt tisuća njih samo statistika.
Josif Visarionovič Džugašvili - Staljin
Sadržaj

1 Kombinatorika . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.1 Permutacije 17
1.1.1 Grupa permutacija . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.2 Varijacije 22
1.3 Kombinacije 24
1.4 Binomni poučak 34

2 Osnovni pojmovi vjerojatnosti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41


2.1 Definicija osnovnih pojmova 41
2.2 Računske operacije s vjerojatnostima 52
2.2.1 "ILI" vjerojatnost: zbrajanje vjerojatnosti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
2.2.2 "I" vjerojatnost: množenje vjerojatnosti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
2.3 Uvjetna (relativna) vjerojatnost 70
2.4 Adicijski i multiplikacijski teorem 74
2.5 Bayesov teorem 80
2.6 Problemi s višestrukim izborom 96

3 Nasumične varijable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101


3.1 Nasumične varijable 101
3.2 Diskretne nasumične varijable 102
3.2.1 Jedna diskretna nasumična varijabla . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
3.2.2 Više diskretnih nasumičnih varijabla . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
3.3 Kontinuirane nasumične varijable 106
3.3.1 Jedna kontinuirana nasumična varijabla . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
3.3.2 Više kontinuiranih nasumičnih varijabla . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
3.4 Usrednjavanje 117
3.4.1 Osnovi teorije igara . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
3.4.2 Srednje vrijednosti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
3.4.3 Momenti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
3.4.4 Matrične opservable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
3.4.5 Mjere disperzije . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
3.4.6 Mjere simetrije . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
3.5 Parcijalne gustoće vjerojatnosti 140
3.6 Preobrazbe varijabla 147
3.6.1 Preobrazba jedne diskretne nasumične varijable . . . . . . . . . . . . . . . . . . . . . 147
3.6.2 Preobrazba više diskretnih nasumičnih varijabla . . . . . . . . . . . . . . . . . . . . . . 149
3.6.3 Preobrazba jedne kontinuirane nasumične varijable . . . . . . . . . . . . . . . . . . 150
3.6.4 Preobrazba više kontinuiranih nasumičnih varijabla . . . . . . . . . . . . . . . . . . . 155
3.7 Teoremi o nasumičnim varijablama 164

4 Raspodjele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
4.1 Raspodjele diskretnih nasumičnih varijabla 171
4.1.1 Jednolika raspodjela . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
4.1.2 Geometrijska raspodjela . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
4.1.3 Binomna raspodjela . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
4.1.4 Negativna binomna raspodjela . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197
4.1.5 Polinomna raspodjela . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197
4.1.6 Poissonova raspodjela . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198
4.1.7 Hipergeometrijska raspodjela . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206
4.1.8 Paretova raspodjela . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212
4.1.9 Zipf - Mandelbrotova raspodjela . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214
4.1.10 Benfordova raspodjela . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215
4.1.11 Raspodjele statističke fizike . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215
4.2 Raspodjele kontinuiranih nasumičnih varijabla 227
4.2.1 Jednolika raspodjela . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227
4.2.2 Gaußova ili normalna raspodjela . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228
4.2.3 Logaritamsko - Gaußova raspodjela . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254
4.2.4 Maxwell-Boltzmannova ili gama raspodjela . . . . . . . . . . . . . . . . . . . . . . . . . 254
4.2.5 Beta raspodjela . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 259
4.2.6 χ 2 raspodjela . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 260
4.2.7 Bose-Einsteinova raspodjela . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 260
4.2.8 Fermi-Diracova raspodjela . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261
4.2.9 t raspodjela . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262
4.2.10 Eksponencijalna raspodjela . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263
4.2.11 Cauchyjeva i Breit-Wignerova raspodjela . . . . . . . . . . . . . . . . . . . . . . . . . . . 268
4.2.12 Fisherova raspodjela . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268
4.2.13 Opća krivulja raspodjele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268

5 Entropija, vjerojatnost, informacija . . . . . . . . . . . . . . . . . . . . . . . . . . 273


5.1 Entropija 273
5.2 Maksimum usrednjene entropije - diskretno 288
5.3 Maksimum usrednjene entropije - kontinuirano 298
5.3.1 Entropija prepletenosti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 302
5.3.2 Tsallisova entropija . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304
5.3.3 von Neumannova entropija . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 305
5.4 Informacija 305
5.5 Entropija izvora informacije 308

6 Funkcija izvodnica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 313


6.1 Funkcija izvodnica raspodjele vjerojatnosti 313
6.2 Funkcija izvodnica momenata - Laplaceova preobrazba 315
6.2.1 Definicija i svojstva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 315
6.2.2 Diskretne varijable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 319
6.2.3 Kontinuirane varijable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322
6.2.4 Granični teorem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 329
6.3 Karakteristična funkcija - Fourierova preobrazba 331
6.3.1 Definicija i svojstva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 331
6.3.2 Diskretne varijable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 338
6.3.3 Kontinuirane varijable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 340
6.4 Kumulantna funkcija 345
6.4.1 Wickov teorem i Feynmanovi dijagrami . . . . . . . . . . . . . . . . . . . . . . . . . . . . 360
6.4.2 Kumulantna funkcija - veza sa statističkom fizikom . . . . . . . . . . . . . . . . . . . . 361
6.4.3 Faktorijelni momenti i faktorijelni kumulanti . . . . . . . . . . . . . . . . . . . . . . . . . . 362

7 Središnji granični teorem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 369


7.1 Čebiševljev teorem 369
7.1.1 Općenitija formulacija . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 371
7.1.2 Konvergencija u teoriji vjerojatnosti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 371
7.1.3 Slabi zakon velikih brojeva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 371
7.2 Bernoullijev teorem ili zakon velikih brojeva 372
7.3 Središnji granični teorem 373

8 Teorija grešaka . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 379


8.1 Metoda najmanjih kvadrata 379
8.2 Prilagodba direktnih opažanja jednake točnosti 383
8.2.1 Greška funkcije . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 384
8.2.2 Standardna devijacija aritmetičke sredine . . . . . . . . . . . . . . . . . . . . . . . . . . 389
8.3 Prilagodba direktnih opažanja različite točnosti 391
8.4 Prilagodba posrednih opažanja - LSA 394
8.5 Prilagodba vezanih opažanja 410
8.6 Kriging 411
8.6.1 Jednostavni kriging . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413
8.6.2 Uobičajeni kriging . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 416
8.6.3 Kriging s trendom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 416
9 Teorija korelacija . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 419
9.1 Krivulja korelacije i momenti 424
9.2 Linearna korelacija 427
9.3 Nelinearna korelacija 435
9.4 Stupanj koreliranosti 437
9.4.1 Linearna korelacija - koeficijent korelacije . . . . . . . . . . . . . . . . . . . . . . . . . . 437
9.4.2 Nelinearna korelacija - indeks korelacije . . . . . . . . . . . . . . . . . . . . . . . . . . . . 442
9.4.3 Krivulja korelacije - omjer korelacije . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 447

9.5 Višestruka i djelomična korelacija 450


9.5.1 Višestruka korelacija . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 450
9.5.2 Djelomična korelacija . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 454
9.5.3 Korelacije nenumeričkih osobina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 454

10 Teorija uzoraka . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 457


10.1 Osnovni pojmovi 457
10.2 Testovi 465
10.2.1 χ2 test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 466
10.2.2 χ2
i procjena točnosti prilagodbe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 473
10.2.3 Studentova t-raspodjela i t-test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 478
10.2.4 Fisherov i F-test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 480
10.2.5 Točnost LSA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 480

11 Procjene . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 485
11.1 Nepristrane procjene 485
11.1.1 Najbolja nepristrana procjena . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 486
11.1.2 Intervalne procjene . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 489
11.1.3 Monte Carlo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 489

12 Statistički testovi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 493


12.1 Pogreške 493
12.2 Neyman - Pearsonova lema 497
12.3 U-test signifikantnosti 497
12.4 Usporedba varijance uzorka i hipotetične varijance osnovnog skupa499
12.5 Studentova t-raspodjela i t-test 500
12.6 Studentov t-test 503

13 Korelacijske funkcije . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 509


13.1 Uvod 509
13.2 Ergodičnost 512
14 Nasumičan hod . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 515
14.1 Nasumičan hod u jednoj dimenziji 516
14.2 Nasumični hod u dvije i tri dimenzije 531
14.3 Lévyeva raspodjela 533
14.3.1 Karakteristična funkcija . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 535
14.3.2 Lévyev let . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 537

A Matematički dodatak . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 543


A.1 Taylorov razvoj 543
A.2 Redovi 544
A.3 Neodred̄eni integrali 546
A.4 Odred̄eni integrali 547
A.5 Gaußian or Stratonovich-Hubbard transformation 550
A.6 Razvoji u red 552
A.7 Koordinatni sustavi 553
A.8 Specijalne funkcije 554
A.9 Linearna algebra 555
A.10 Redovi 556
A.11 Trigonometrija 556
A.12 Mali trikovi 557

B Literatura, popis pojmova i autora . . . . . . . . . . . . . . . . . . . . . . . . . . 573

Popis literature . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 573


Knjige 573
Članci 575

Popis pojmova . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 577

Popis autora . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 581


Kazalo kratica i simbola

~
A vektorski potencijal
af anomalna dimenzija homogene funkcije f
a velika poluos elipse
ubrzanje, ~a = d~v dt

~a

~
B indukcija magnetskog polja
b mala poluos elipse
~b vektor koji spaja ishodište koordinatnog sustava sa središtem mase sustava čestica

c brzina svjetlosti u vakuumu, 2.9979250(10) 108 m s−1

D dimenzija prostora
D konstanta difuzije

E ukupna energija
Ek ukupna kinetička energija
Ek,t translacijska kinetička energija
Ek,vrt kinetička energija vrtnje
Ep potencijalna energija
~
E električno
√ polje
e = a 2 − b 2 /a, ekscentricitet elipse
~e j jedinični vektori u smjerovima glavnih osi krutog tijela

F ≡ U − T S, slobodna energija
F ≡ ln( Z ), bezdimenzijska  negativna vrijednost slobodne energije
u Fx (k ) ≡ ln [ Zx (k)] = ln exk x , kumulantna funkcija

Rx
F(x) = −∞ ρ(η ) dη, kumulativna funkcija raspodjele vjerojatnosti
~
F sila
12

G univerzalna konstanta gravitacije, 6.6732(31) 10−11 N m2 kg−2


G ≡ U + P V − T S, Gibbsova energija
g standardno ubrzanje u Zemljinom gravitacijskom polju, 9.80665 m s−2
g(~r ) korelacijska funkcija
g metrički tenzor
gij komponente metričkog tenzora

H Hamiltonova funkcija
H jakost magnetskog polja
h Planckova konstanta, 6.626 . . . · 10−34 Js
h̄ Planckova konstanta podijeljena s 2 π: h̄ = h/(2 π )

I, Iα α moment tromosti oko zadane osi


Iα β devijacijski (centrifugalni) momenti tromosti
J Jacobijeva determinanta

J0 konstanta vezanja

K ≡ J0 /(kB T ), bezdimenzijska inverzna temperatura


~L moment količine gibanja, ~L =~r × ~p
L iznos momenta količine gibanja, L = ~L

L Lagrangeova funkcija, L = Ek − E p
l duljina dužine

~
M moment sile, M ~ =~r × F~
M magnetizacija (cijelog sustava)
m magnetizacija po čestici
m masa tijela ili čestice

P = d0 W dt , snaga


P tlak
Pdsp disipacijska funkcija
Pa paskal, jedinica za mjerenje tlaka
~p količina gibanja, ~p = m~v

q električni naboj
q ekstenzivna varijabla, konjugirana varijabli Q
qi poopćena koordinata
Q električni naboj
Q intenzivna varijabla, konjugirana varijabli q
d0Q mali iznos topline

R električni (omski) otpor


Rnh holonoman uvjet na gibanje
Rnhn neholonoman uvjet na gibanje
R polumjer
~r radij vektor
r,~er koordinata i jedinični vektor sfernog koordinatnog sustava
13

S(q) = kB ln [ P(q)], entropija kao funkcija ekstenzivne varijable q ≡ U , E, m, · · ·


S = S/kB , bezdimenzijska entropija
S ploha; ploština plohe
~S usmjerana ploha (smjer je odred̄en gradijentom u danoj točki)
S djelovanje
s = S/N entropija po čestici
s = s(~r ) skalarno polje
s izvor, nehomogeni član diferencijalne jednadžbe
sn spin čestice smještene u točki (čvoru) n
s broj stupnjeva slobode
sec sekunda

T temperatura (Kelvin)
T period, f (t) ≡ f (t + T ), periodičnost funkcije u vremenu
t temperatura (Celzij)
t vrijeme

U = ∑n Pn En , unutrašnja energija sustava


V volumen
V elektroststki skalarni potencijal
~
V vektor (općenito)
brzina, ~v = d~r dt

~v

W rad, W = F ~ · d~r
R
W vat, mjerna jedinica za snagu
W derivacija vjerojatnosti po vremenu
d 0W mali iznos rada

x,~ex koordinata i jedinični vektor pravokutnog koordinatnog sustava

y,~ey koordinata i jedinični vektor pravokutnog koordinatnog sustava

Z particijska funkcija
Z funkcija izvodnica
Z
e karakteristična funkcija

kutno ubrzanje, ~α = d~ω dt




β = 1/(kB T ), inverzna temperatura

Γ Christoffelovi simboli
Γ Gama funkcija
γ koeficijent prigušenja kod harmonijskog titranja

δ( a, b) Kroneckerov simbol: jednak jedinici ako je a = b, a nuli ako je a 6= b


δ ( x − x0 ) jednodimenzijska Diracova δ funkcija

e ekscentricitet elipse e = a2 − b2 /a
ei j k Levi-Civita tenzor
14

ζ (x) Riemannova zeta funkcija


Θ jedan od Eulerovih kutova
Θ funkcija velikih odstupanja
θ,~e θ koordinata i jedinični vektor sfernog koordinatnog sustava

κ zakrivljenost ili fleksija κ = 1/R


λ kut kolatitude
λ valna duljina f ( x ) = f ( x + λ), periodičnost u prostoru

λ Lagrangeov množitelj
linijska masena gustoća, λm = dm dl

λm
linijska gustoća električnog naboja, λq = dq dl

λq
µ reducirana masa, 1/µ = 1/m1 + 1/m2 + · · ·
ν frekvencija, inverzna vrijednost perioda ν = 1/T
ξ korelacijska dužina
ξ (t) nasumična sila

Ω broj konfiguracija

ρ,~e ρ koordinata i jedinični vektor kružnog cilindričnog (polarnog) koordinatnog sustava


= dm dV , volumna masena gustoća

ρm
ρq = dq dV, volumna gustoća električnog naboja
ρ = dP( x ) dx , gustoća vjerojatnosti kontinuirane nasumične varijable x

površinska masena gustoća, σm = dm dS



σm
površinska gustoća električnog naboja, σq = dq dS

σq
σ standardna devijacija
Φ jedan od Eulerovih kutova
ϕ,~e ϕ koordinata i jedinični vektor cilindričnog (polarnog) koordinatnog sustava
Ψ jedan od Eulerovih kutova
ψ otklon čestice sredstva kod titrajnog ili valnog gibanja
ψ QM valna funkcija
kutna brzina, k~ω k = dϕ dt


Grčko slovo ∆ ispred odred̄enog simbola označava promjenu označene veličine za


konačan iznos. Npr.

∆ A = Akon − A poč .

Slovo d ispred odred̄enog simbola označava infinitezimalnu promjenu označene veli-


čine. Npr.

dV
~ (q) = V ~ ( q ).
~ (q + d q) − V

Diferencijali volumena će se označavati s dV ili s d3 r, a diferencijali površine s dS ili s


d2 r.
Uvod

Postoje NUŽNI dogad̄aji. To su svi oni dogad̄aji za koje je nemoguće da se ne dogode:


izvedite njihalo iz ravnoteže i otpustite i ono će se njihati; magnetizirana igla će se
orjentirati u smjeru silnica magnetskog polja; zraka svetlosti će se reflektrati i refraktirati
na granici dva optička sredstva, itd.

Postoje NEMOGU ĆI dogad̄aji. To su svi dogad̄aji čije je ostvarenje nezamislivo: tije-
kom vremena, ljudi postaju stariji, a ne mlad̄i; zagrijavanjem vode, ne može se dobiti
led i slično.

I konačno, SLU ČAJNI dogad̄aji su svi oni dogad̄aji koji nisu ni nužni, ali ni nemo-
gući: izvlačenjem karte iz špila, zna se da će se izvući jedna (a ne nijedna) od karata, ali
se ne zna koja će to karta biti.
U tom smislu, sučajan dogad̄aj negira i nužan, ali i nemoguć dogad̄aj.
... dovršiti ...
1. Kombinatorika

T EORIJA VJEROJATNOSTI često i obilno koristi pojmove i rezultate jednog dijela ma-
tematike koji se zove kombinatorika. Stoga ćemo se upoznati s kombinatorikom u
onoj mjeri i na onaj način koji će biti potreban za praćenje daljeg izlaganja. Izložit će
se pojmovi permutacije, varijacije i kombinacije, sve s ponavljanjem i bez ponavljanja
elemenata (slika 1.1)

Slika 1.1: Kombinatorički pojmovi izloženi u ovom odjeljku.

bez ponavljanja

PERMUTACIJE
poredak
je važan
s ponavljanjem

bez ponavljanja
VARIJACIJE poredak
je važan

s ponavljanjem

bez ponavljanja
KOMBINACIJE poredak
nije važan
s ponavljanjem

1.1 Permutacije
Jedan od osnovnih kombinatoričkih pojmova jeste pojam permutacije.
P ERMUTIRATI SKUP OD N RAZLI ČITIH ELEMENATA ZNA ČI NAPRAVITI
N ZADANIH ELEMENATA .
SVE MOGU ĆE RAZLI ČITE KONFIGURACIJE SVIH

P ERMUTACIJE BEZ PONAVLJANJA : PN


Započnimo s jednim jednostavnim primjerom. Zadan je skup od četiri različita simbola
18 Poglavlje 1. Kombinatorika

(♦, ∆, ⊕, †), četiri slova (s, i, a, y) ili naprosto četiri broja (12 + 0.3ı, 8.03, 3/2, 8π ). Od
elemenata tih skupova je moguće napraviti 4 ! = 1 · 2 · 3 · 4 = 24 različitih konfiguracija
kao što je to pokazano u tablici 1.1. Gornji je poredak dobiven tako što smo uzeli da

Tablica 1.1: Dva primjera permutacija četiri simbola (♦, ∆, ⊕, †) i četiri broja (1, 2, 3, 4).

1. ♦ ∆ ⊕ † 1 2 3 4
2. ♦ ∆ † ⊕ 1 2 4 3
3. ♦ ⊕ ∆ † 1 3 2 4
4. ♦ ⊕ † ∆ 1 3 4 2
5. ♦ † ∆ ⊕ 1 4 2 3
6. ♦ † ⊕ ∆ 1 4 3 2
7. ∆ ♦ ⊕ † 2 1 3 4
8. ∆ ♦ † ⊕ 2 1 4 3
9. ∆ ⊕ ♦ † 2 3 1 4
10. ∆ ⊕ † ♦ 2 3 4 1
11. ∆ † ♦ ⊕ 2 4 1 3
12. ∆ † ⊕ ♦ 2 4 3 1
13. ⊕ ♦ ∆ † 3 1 2 4
14. ⊕ ♦ † ∆ 3 1 4 2
15. ⊕ ∆ ♦ † 3 2 1 4
16. ⊕ ∆ † ♦ 3 2 4 1
17. ⊕ † ♦ ∆ 3 4 1 2
18. ⊕ † ∆ ♦ 3 4 2 1
19. † ♦ ∆ ⊕ 4 1 2 3
20. † ♦ ⊕ ∆ 4 1 3 2
21. † ∆ ♦ ⊕ 4 2 1 3
22. † ∆ ⊕ ♦ 4 2 3 1
23. † ⊕ ♦ ∆ 4 3 1 2
24. † ⊕ ∆ ♦ 4 3 2 1

početni poredak definira redoslijed; zatim smo uvijek mijenjali po DVA člana, idući
od početka prema kraju. Time smo, ujedno, na ovom primjeru i pokazali da se svaka
proizvoljna permutacija može napisati kao kombinacija samo parnih permutacija (onih
u kojima samo jedan par elemenata zamjeni mjesta).
Pokažimo da skup od N različitih elemenata ima

PN = N ! = 1 · 2 · . . . · ( N − 1) · N (1.1)

različitih permutacija. Jasno je da je broj permutacija jednog elementa, označimo ga s A,


jednak jedan

PN = 1 = 1 = 1 !. (1.2)

Broj permutacija skupa od dva elementa, { A, B}, ćemo dobiti tako što ćemo ovaj drugi
element, označen s B, kombinirati na sve moguće načine s permutacijama jednog
1.1 Permutacije 19

elementa: u ovom jednostavnom slučaju to znači da B može doći samo ispred i iza A, tj.
postoje samo dvije mogućnosti

A , A −→ A B, B A,

pa je zato

PN = 2 = PN = 1 · 2 = 1 · 2 = 2 !.

Sada dodajemo i treći element C. Sve permutacije tri elementa, { A, B, C }, dobivaju se


tako da se krene od svih permutacija dva elementa i promatra se gdje se sve može
postaviti treći element. Tih mjesta sada ima tri: iza, izmed̄u i ispred:

AB ⇒ AB , A B, AB −→ A B C, A C B, CAB
BA ⇒ BA ,B A, BA −→ B A C, B C A, C B A.

Svaka od permutacija iz PN = 2 je generirala tri nove permutacije, pa je zato

PN = 3 = PN = 2 · 3 = 1 · 2 · 3 = 3 ! = 6.

Iz gornjeg postupka se vidi da za svaki zadani poredak N elemenata, postoji N + 1


mjesto na koje se može postaviti N + 1-vi element (ta mjesta su prikazana crticama)

aN + 1 −→ a1 a2 a3 · · · aN .

Dakle, svaka pojedina permutacija od N elemenata. će generirati novih N + 1 permuta-


cija N plus jednog elementa. Zato će ukupni broj permutacija N + 1-og elementa, PN + 1 ,
biti jednak

PN + 1 = PN · ( N + 1).

Uzastopnom primjenom gornje rekurzije i relacije (1.2), lako se dolazi do

PN + 1 = PN · ( N + 1) = PN - 1 N ( N + 1) = PN - 2 ( N − 1) N ( N + 1) = · · · = ( N + 1) !,

čime je dokazana relacija (1.1).


Ista se relacija može dokazati i ovako: ako je na raspolaganju N elemenata, tada za prvi
možemo odabrati bilo koji od njih N; kada smo odabrali prvi, za drugi možemo odabrati
bilo koji od preostalih N − 1 elemenata, tako da prva dva elementa mogu biti odabrana
na N · ( N − 1) načina; treći element može biti bilo koji od preostalih N − 2 elemenata,
pa se prva tri elementa mogu izabrati na N · ( N − 1) · ( N − 2) načina; ovaj postupak
nastavljamo sve dok ne dod̄emo do posljednjeg elementa kojeg možemo odabrati na
samo jedan način, čime smo opet došli do izraza (1.1).

P ERMUTACIJE S PONAVLJANJEM : PNM


Pogledajmo sada koliki je broj permutacija skupa od N elemenata od kojih su njih M
med̄usobno jednaki.
Primjer 1.1 P ERMUTACIJE ČETIRI ELEMENTA
Započnimo s jednim primjerom: zadan je skup od četiri elementa od kojih su dva ista

{ A, A, B, C }, N = 4, M = 2.

Treba naći sve permutacije.


20 Poglavlje 1. Kombinatorika

Primjetimo da zamjena ISTIH elemenata ne daje novu permutaciju. Dva su elementa ista,
pa permutacija tih istih elemenat ima 2 ! = 2, ove permutacije ne daju novu permutaciju
cijelog skupa.

A A B C, B A A C, C A A B,
A A C B, B A C A, C A B A,
A B A C, B C A A, C B A A
A B C A,
A C A B,
A C B A,

Tako će sada umjesto 4 ! = 24 permutacija, preostati samo 4 !/2 ! = 12 permutacija. Da


smo umjesto A A imali A A 0 , svaka od gornjih 12 permutacija bi dala dvije nove
permutacije; npr.

B C A A ⇒ B C A A 0, B C A0 A

i mi bismo od gornjih 12 permutacija dobili 24 permutacije 4 različita elementa. 

Sličnim razmišljanjem dolazimo do zaključka da je broj permutacija A A A B C za 3 !


manji od broja permutacija pet različitih elemenata, jer će svaka permutacija oblika

··· A··· A··· A···

generirati 6 = 3 ! novih permutacija oblika

· · · A · · · A0 · · · A00 · · · ,

ako se A-ovi med̄usobno razlikuju. Sada je lako vidjeti da je općenito

N!
PNM = .
M!
Može se dogoditi da unutar N elemenata postoje dvije ili više skupina istih elemenata,
npr.

{ A, A, A, A, B, B, C D · · · }.

Sličnim razmišljanjem kao gore, dolazi se do općenitog rezultata za broj permutacija N


elemenata sa skupinama od M1 , M2 , · · · istih elemenata

N!
PNM1 ,M2 ,··· = . (1.3)
M1 ! · M2 ! · . . .

1.1.1 Grupa permutacija


Pokažimo da sve permutacije N elemenata čine algebarsku strukturu koja se zove grupa

n o
G = gj , · ,
1.1 Permutacije 21

gdje su g j elementi grupe, a s · je označena grupna binarna operacija (množenje, zbra-


janje, ili kako već želimo nazvati tu operaciju). Prisjetimo se osnovnih svojstava grupe.

(1) Ako su gi i g j elementi grupe tada je i

gi · g j = g k

takod̄er element grupe (zatvorenost grupe).


(2) Postoji neutralni element grupe, I, sa svojstvom da je za svaki element grupe gi

gi · I = I · gi = gi .

Ako je binarna operacija množenje, neutralni element se zove jedinica, a ako je binarna
operacija zbrajanje, neutralni element se zove nula.
(3) Za svaki element grupe gi , postoji inverzni element g j = gi−1 , takod̄er element grupe,
sa svojstvom

gi · gi−1 = gi−1 · gi = I.

(4) Asocijativnost

gi · ( g j · g k ) = ( gi · g j ) · g k .

Ako za bilo koja dva elementa grupe vrijedi

gi · g j = g j · gi ,

grupa se naziva Abelova grupa ili komutativna grupa.

 Primjer 1.2 G RUPA PERMUTACIJA TRI ELEMENTA


Za primjer ćemo navesti permutacije tri elementa, definirati med̄u njima grupnu opera-
ciju (množenje) i pokazati da skup svih permutacija tri elementa zajedno s grupnom
operacijom čini grupu.
Svih šest permutacija tri elementa jesu

1 2 3 1 2 3 1 2 3
     
g1 = ≡ I, g2 = , g3 = ,
1 2 3 1 3 2 2 1 3
1 2 3 1 2 3 1 2 3
     
g4 = , g5 = , g6 = .
2 3 1 3 1 2 3 2 1

Pokažimo na jednom primjeru prvo svojstvo

1 2 3 1 2 3 1 2 3
     
g2 · g4 = · = = g3 .
1 3 2 2 3 1 2 1 3

Pokažimo na jednom primjeru drugo svojstvo

1 2 3 1 2 3 1 2 3
     
g5 · I = · = = g5
3 1 2 1 2 3 3 1 2
1 2 3 1 2 3 1 2 3
     
I · g5 = · = = g5
1 2 3 3 1 2 3 1 2
22 Poglavlje 1. Kombinatorika

Pokažimo na jednom primjeru treće svojstvo

1 2 3 1 2 3 1 2 3
     
g5 · g4 = · = = I,
3 1 2 2 3 1 1 2 3
1 2 3 1 2 3 1 2 3
     
g4 · g5 = · = = I.
2 3 1 3 1 2 1 2 3

Jedan primjer asocijativnosti

1 2 3 1 2 3 1 2 3
    
g4 · ( g5 · g6 ) = ·
2 3 1 3 1 2 3 2 1
1 2 3 1 2 3 1 2 3
     
= · = = g6 .
2 3 1 1 3 2 3 2 1

1 2 3 1 2 3 1 2 3
    
( g4 · g5 ) · g6 = ·
2 3 1 3 1 2 3 2 1
1 2 3 1 2 3 1 2 3
     
= · = = g6 .
1 2 3 3 2 1 3 2 1

Provjerimo, na jednom primjeru, je li grupa komutativna

1 2 3 1 2 3 1 2 3
     
g3 · g4 = · = = g6 ,
2 1 3 2 3 1 3 2 1
1 2 3 1 2 3 1 2 3
     
g4 · g3 = · = = g2 .
2 3 1 2 1 3 1 3 2

Ova grupa nije komutativna. Postoje i komutativne grupe i one se nazivaju i Abelove1
grupe. 

1.2 Varijacije
VARIJACIJE BEZ PONAVLJANJA ; VNM
Kod varijacija je, slično kao kod permutacija, važan poredak elemenata, ali za razliku
od permutacija, u varijacijama ne sudjeluje svih N elemenata, nego samo njih M < N.
Izračunajmo najprije VN1 . Jasno je da N elemenata možemo razvrstati u skupine veličine
1 na N raznih načina, tj. da je

VN1 = N.

Npr. za N = 5 elemenata iz skupa { A, B, C, D, E}, sve varijacije prvog reda su

A, B, C, D, E.

Koristeći VN1 napravimo varijacije drugog reda od N elemenata, VN2 : njih ćemo konstru-
irati tako što ćemo svakoj varijaciji VN1 dodati jedan od preostalih ( N − 1) elemenata2

VN2 = ( N − 1) VN1 = ( N − 1) N.
1 Prema
norveškom matematičaru Nielsu Henriku Abelu (1802. – 1829.).
2(N
− 1) elemenata zato jer nije dozvoljeno ponavljanje, pa na raspolaganju ne stoji N, nego N − 1
elemenata.
1.2 Varijacije 23

Npr. za N = 5 elemenata, sve varijacije drugog reda su

A, B A, C A, D A, E
B, A B, C B, D B, E
C, A C, B C, D C, E
D, A D, B D, C D, E
E, A E, B E, C E, D

Slično se dobiva i

VN3 = ( N − 2) VN2 = ( N − 2) ( N − 1) N

i općenito
N!
VNM = [ N − ( M − 1)] VNM - 1 = ( N − M + 1) · · · ( N − 2) ( N − 1) N =
( N − M) !

N!
VNM = . (1.4)
( N − M) !

Primjetimo još jednom da su varijacije bez ponavljanja slične permutacijama bez ponav-
ljanja, po tome što je važan poredak elemenata u nizu, a razlikuju se od njih po tome
što u varijacijama ne sudjeluje svih N elemenata, nego samo njih M < N. Ili. drugim
rječima, varijacije bez ponavljanja od M = N elemenata su isto što i permutacije N
elemenata - prema (1.4) je

VNN = N ! = PN .

VARIJACIJE S PONAVLJANJEM
Varijacije s ponavljanjem od N elemenata M-tog reda predstavljaju sve moguće kon-
figuracije N elemenata u skupine od po M elemenata s time da je važan redoslijed
elemenata unutar skupine.
Označimo broj varijacija s ponavljanjem od N elemenata M-tog reda sa VN0 M .
Očito je

VN0 1 = N.

Varijacije s ponavljanjem drugog reda, dobijemo pomoću varijacija s ponavljanjem


prvog reda tako da svakoj od VN0 1 varijacija pridružimo jedan od N elemenata, tako da
je

VN0 2 = N · VN0 1 = N 2 .

Npr. sve varijacije pet elemenata {1, 2, 3, 4, 5} drugog reda su

1, 1 1, 2 1, 3 1, 4 1, 5
2, 1 2, 2 2, 3 2, 4 2, 5
3, 1 3, 2 3, 3 3, 4 3, 5
4, 1 4, 2 4, 3 4, 4 4, 5
5, 1 5, 2 5, 3 5, 4 5, 5
24 Poglavlje 1. Kombinatorika

Slično se i varijacije s ponavljanjem trećeg reda, dobiju pomoću varijacija s ponavljanjem


drugog reda tako da svakoj od VN0 2 varijacija pridružimo jedan od N elemenata, tako da
je

VN0 3 = N · VN0 2 = N 3 .

Iz ovog nije teško shvatiti da je općenito broj varijacije s ponavljanjem od N elemenata


M-tog reda, jednak

VN0 M = N M . (1.5)

1.3 Kombinacije
KOMBINACIJE BEZ PONAVLJANJA
Za razliku od permutacija i varijacija, u kombinacijama NIJE važan poredak elemenata
u pojedinoj skupini. U kombinacijama ne sudjeluje svih N elemenata, nego samo njih
M < N. Sastavljanjem kombinacija bez ponavljanja nazivamo slijedeći postupak: od N
različitih elemenata treba izdvojiti sve med̄usobno različite skupine od po M elemenata.
Veličina skupine se naziva i red ili razred kombinacije, pa se tako broj kombinacija bez
ponavljanja M-tog reda od N elemenata označava s

K NM .

Primjer 1.3 K OMBINACIJE PET ELEMENATA


Započnimo i ovde s primjerom: N = 5 elemenata { A, B, C, D, E} treba rasporediti u
skupine od po M = 3 elementa

A B C, A B D, A B E,
A C D, A C E,
A D E,

B C D, B C E,
B D E,

C D E

Kada kažemo da raspored elemenata unutar skupine nije važan, to znači da je skupina
C D E ista kao i skupina E D C itd. Vidimo da je u ovom primjeru

5 5·4·3
 
3
K5 = = = 10.
3 1·2·3


Poopćimo razmatranje iz gornjeg primjera tako što ćemo ga povezati s brojem varijacija
N elemenata M tog reda bez ponavljanja, koji je prema (1.4) jednak

N!
VNM = .
( N − M) !
1.3 Kombinacije 25

Kod varijacija je poredak važan, kod kombinacija nije. To znači da sve one varijacije koje
sadrže iste elemente, ali u različitom poretku, odgovaraju jednoj jedinoj kombinaciji.
Npr.

ABC, ACB, BAC, BCA, CAB, CBA

su M ! = 3 ! = 6 varijacija M = 3-eg reda od kojih se može napraviti samo jedna kom-


binacija koja će sadržavati A, B i C. Očito, ovakvo razmišljanje vrijedi i za sve ostale
varijacije bilo kojeg reda M: uvijek će M ! varijacija davati samo jednu kombinaciju.
Posljedica toga je da će broj kombinacija N elemenata M-tog reda bez ponavljanja biti
M ! puta manji od broja varijacija N elemenata M-tog reda bez ponavljanja

VNM N!
K NM = =
M! M ! ( N − M) !

N N!
 
K NM = = . (1.6)
M M ! ( N − M) !

Primjetimo i da se na kombinacije N elemenata M-tog reda bez ponavljanja, može


gledati i kao na permutacije N elemenata s ponavljanjem, (1.3), tako da zamislimo kako
postoje dvije grupe jednakih elemenata - jedne od M članova i druge od N − M članova

N!
K NM = = PNM, N - M .
M ! · ( N − M) !

K OMBINACIJE S PONAVLJANJEM : K N0 M
Kombinacije s ponavljanjem se razlikuju od kombinacija bez ponavljanja po tome što
se sada u skupini mogu ponavljati isti elementi. Ponovo, poredak elemenata unutar
skupine nije važan.
 Primjer 1.4 K OMBINACIJE ČETIRI ELEMENTA
Npr. za skupinu od četiri elementa {1, 2, 3, 4} sve kombinacije s ponavljanjem trećeg
reda su:

1, 1, 1, 1, 1, 2, 1, 1, 3, 1, 1, 4,
1, 2, 2, 1, 2, 3, 1, 2, 4,
1, 3, 3, 1, 3, 4,
1, 4, 4,

2, 2, 2, 2, 2, 3, 2, 2, 4,
2, 3, 3, 2, 3, 4,
2, 4, 4,

3, 3, 3, 3, 3, 4,
3, 4, 4,

4, 4, 4.
26 Poglavlje 1. Kombinatorika

Broj kombinacija N elemenata M-tog reda s ponavljanjem, označit ćemo s K N0 M . Kako


odrediti taj broj? Jedan zgodan način da se prebroji gornja konfiguracija jest slijedeći:
prvom elementu svake skupine pribrojimo nulu, drugom elementu jedinicu, a trećem
dvojku (slika 1.2). Ovime SE NE MIJENJA BROJ SKUPINA, već samo njihov sadržaj, što za

Slika 1.2: Odred̄ivanje broja kombinacija s ponavljanjem.

+0 +1 +2

1 2 3=M

+0 +1 +2 +(M-1)
. . . . . .
1 2 3 M–2 M–1 M

samo brojanje skupina i nije važno. Tako se dolazi do

1, 2, 3, 1, 2, 4, 1, 2, 5, 1, 2, 6,
1, 3, 4, 1, 3, 5, 1, 3, 6,
1, 4, 5, 1, 4, 6,
1, 5, 6,

2, 3, 4, 2, 3, 5, 2, 3, 6,
2, 4, 5, 2, 4, 6,
2, 5, 6,

3, 4, 5, 3, 4, 6,
3, 5, 6,

4, 5, 6.

No, ovo što smo dobili nije ništa drugi nego kombinacije BEZ ponavljanja šest elemenata
trećeg reda

K40 3 = K63 .

Opisani se postupak lako poopći na kombinacije s ponavljanjem N elemenata M-tog


reda: pojedinim elementima grupe veličine M pribrojimo brojeve 0, 1, 2, · · · , ( M − 1)
i tako ih preslikamo u kombinacije bez ponavljanja M-tog reda, ali od N + M − 1
elemenata. Zato zaključujemo da je općenito

K N0 M = K NM + M - 1 .
1.3 Kombinacije 27

N+M−1
 
0M
KN = . (1.7)
M

Primjetimo na kraju i da kod kombinacija i varijacija bez ponavljanja, mora biti M < N,
dok kod kombinacija i varijacija s ponavljanjem taj uvjet nije nužan.
28 Poglavlje 1. Kombinatorika

S AŽETAK :

Permutacije bez ponavljanja PN = N !,

N!
Permutacije s ponavljanjem PNM1 ,M2 ,··· = ,
M1 ! M2 ! · · ·

N!
Varijacije bez ponavljanja VNM = ,
( N − M) !

Varijacije s ponavljanjem VN0 M = N M ,

N
 
Kombinacije bez ponavljanja K =
M
N ,
M

N+M−1
 
0M
Kombinacije s ponavljanjem KN =
M
1.3 Kombinacije 29

Zadatak 1.1 Koliko se različitih riječi može napraviti od slova iz riječi


(a) fizika,
(b) matematika? 

Rješenje:
U riječi je važan poredak slova, pa se zato ovdje radi o permutacijama (moraju se koristiti sva
slova, pa zato nisu varijacije). Budući da se neka slova pojavljuju više puta (ponavljaju se), to će
biti permutacije s ponavljanjem. Prema (1.3) je:

(a) fizika
6!
P62 = = 360.
2!
(b) matematika
2,3,2 10 !
P10 = = 151 200.
2! · 3! · 2!

Zadatak 1.2 Koliko postoji mogućih načina ispunjavanja listića Lota 7/39 s jednim
dopunskim brojem? 

Rješenje:
S obzirom da nije važan poredak kojim se ispunjava listić, odabir prvih sedam brojeva predstavlja
kombinacija bez ponavljanja 39 elemenata sedmog reda
39 39 !
 
7
K39 = = = 15 380 937.
7 7 ! 32 !
Dopunski, osmi broj se od preostala 32 broja može odabrati na
32
 
1
K32 = = 32.
1
načina (kombinacije 32 elementa prvog reda).
Ukupan broj popunjavanja listića sa 7 + 1 brojeva je, prema tome, jednak
39 32
   
· = 492 189 984.
7 1

Zadatak 1.3 Koliko dijagonala ima pravilni N-terokut? 

Rješenje:
Odabere se jedan od N vrhova - dijagonala ne može ići na taj vrh niti na dva prva susjedna vrha,
nego mora ići na jedan od preostalih N − 3 vrhova
⇒ N ( N − 3).
No, svaka dijagonala spaja dva vrha, pa će se zato ista dijagoala brojati dva puta, iz čega slijedi
da je traženi broj dijagonala jednak
1
N ( N − 3).
2
30 Poglavlje 1. Kombinatorika

Zadatak 1.4 U ravnini je zadano šest točaka od kojih po tri ne leže na istom pravcu.
Koliko je različitih pravaca odred̄eno s tih šest točaka, a koliko različitih
trokuta? 

Rješenje:
Pravac je odred̄en s dvije točke (čiji poredak nije važan), pa je zato
6
 
2
Npravaca = K6 = = 15.
2
Trokut je odred̄en s tri točke (čiji poredak nije važan), pa je zato
6
 
3
Ntrokuta = K6 = = 20.
3

Zadatak 1.5 Na koliko se načina osam predmeta može podijeliti med̄u četiri osobe,
tako da svaka osoba dobije po dva predmeta? 

Rješenje:

8 6 4 2
    
K82 · K62 · K42 · K22 = = 2 520.
2 2 2 2

Zadatak 1.6 U skupu od 50 proizvoda nalazi se 40 dobrih i 10 s greškom. Na koliko


se načina može formirati uzorak od 5 proizvoda, tako da u njemu budu
3 dobra i 2 proizvoda s greškom? 

Rješenje:
Tri dobra od ukupno 40, se može odabrati na
40 40 · 39 · 38
 
3
K40 = = = 9 880
3 1 · 2 · 3
načina. Isto tako, 2 s greškom od 10 s greškom možemo odabrati na
10 10 · 9
 
2
K10 = = = 45
2 1 · 2
načina. Svaki od ova dva odabira se može med̄usobno kombinirati, tako da je ukupan broj odabira
jednak
3 2
K40 · K10 = 9 880 · 45 = 444 600.
Ovaj se problem može definirati i općenitije: od N proizvoda, njih M su ispravni, a ostalih
N − M imaju grešku. Pitanje je nakoliko se načina može formirati uzorak od N proizvoda, tako
da u njemu bude x proizvoda bez greške i N − x sa greškom? Razmišljamo kao i na početku:
od M ispravnih proizvoda, njih x možemo odabrati na KM x načina; od N − M proizvoda s
N −x
greškom, njih N − x možemo odabrati na KN −M načina. Traženi uzorak nastaje kombiniranjem
bilo kojih parova ispravnih i proizvoda s greškom, tj. postoji
M N −M M! (N − M) !
   
x N −x
KM · KN −M = · = ·
x N−x x ! (M − x ) ! ( N − x ) ! (N − M − N + x ) !
ražličitih mogućnosti.
1.3 Kombinacije 31

Zadatak 1.7 Skup od dvadeset proizvoda sadrži pet neispravnih komada.


(a) Na koliko se različitih načina može formirati uzorak koji bi sadrža-
vao četiri ispravna i tri neispravna proizvoda?
(b) Na koliko se različitih načina može formirati uzorak od šest pro-
izvoda, koji bi sadržavao sve ispravne proizvode? 

Rješenje:
(a)

15 5
  
= ... = 13 650.
4 3
(a)

15 5
  
= ... = 5 005.
6 0

Zadatak 1.8 Student piše domaću zadaću uz pomoć petoro kolega. Koliko on može
formirati sastanaka različitih i po broju i po sastavu nazočnih? 

Rješenje:
Budući da je student o kome je riječ, uvijek nazočan sastancima, broj ostalih kolega na sastancima
varira od 1 do 5.
broj kolega na sastanku broj realizacija

5
 
1 = 5,
1

5
 
2 = 10,
2

5
 
3 = 10,
3

5
 
4 = 5,
4

5
 
5 =1.
5
Ukupan broj sastanaka različitih i po broju i po sastavu nazočnih je
5 + 10 + 10 + 5 + 1 = 2 5 − 1 = 31.

Zadatak 1.9 U laboratoriju se nalazi po jedan otpornik slijedećih otpora:

1 Ω, 2 Ω, 5 Ω, 20 Ω, 35 Ω.

(a) Koliko se različitih otpora može formirati spajanjem tri otpornika u


32 Poglavlje 1. Kombinatorika

seriju? Koji su to otpori?


(b) Koliko se otpora uopće može formirati serijskim spajanjem gornjih
otpornika (bez obzira na broj otpornika u seriji)? 

Rješenje:
(a)
Budući da poredak otpornika nije važan, radi se o kombinacijama bez ponavljanja od pet elemenata
trećeg reda
5
 
3
K5 = = 10.
3

1+2+5= 8 1 + 5 + 20 = 26 1 + 20 + 35 = 56
1 + 2 + 20 = 23 1 + 5 + 35 = 41
1 + 2 + 35 = 38

2 + 5 + 20 = 27 2 + 20 + 35 = 57
2 + 5 + 35 = 42

5 + 20 + 35 = 60

⇒ R(Ω) = {8, 23, 26, 27, 38, 41, 42, 56, 57, 60}.
(b)
Moguće je napraviti seriju od jednog, dva, tri, četiri ili pet otpornika. Svaka se serija može
formirati na (n5 ) načina i zato je ukupan broj serija jednak
5 5 5 5 5
         
+ + + + = 2 5 − 1 = 31.
1 2 3 4 5

Zadatak 1.10 Snop od 52 karte sastoji se od karata u četiri boje, sa po 13 različitih


vrijednosti. Iz snopa se biraju 2 karte, ali tako da nakon svakog izbora
karte zapišemo njezinu vrijednost, a samu kartu vratimo u snop. Na
koliko se načina mogu odabrati
(a) dvije karte iste boje,
(b) dvije karte iste jakosti? 

Rješenje:
(a)

13 + 2 − 1 14 · 13
 
02
4 · K13 =4· =4· = 364.
2 2
(b)

4+2−1 5·4
 
13 · K40 2 = 13 · = 13 · = 130.
2 2
1.3 Kombinacije 33

Zadatak 1.11 Skup S ima N elemenata sn . Koristeći kombinatoričke argumente,


odredite broj podskupova tog skupa (računajući i prazan skup i cijeli
skup). 

Rješenje:

S = { s1 , s2 , · · · , s N }

Uoči se jedan od podskupova S - ako je sn element tog podskupa, pridruži mu se vrijednost 1, a


ako nije, pridruži mu se vrijednost 0. Na taj je načini zapis svakog podskupa oblika

{· · · , 1, 1, 0, 1, 0, 0, · · · , }.

Budući da se na svakom od N mjesta može naći nula ili jedan, to je ukupan broj mogućih
konfiguracija jednak

2 N,

tj. postoji toliko podskupova skupa S.

Zadatak 1.12 Na raspolaganju su vam znamenke 2, 4, 7, 9. Koliko različitih trozna-


menkastih brojeva možete napisati od zadane četiri znamenke ako
(a) se znamenke mogu ponavljati;
(b) se znamenke ne mogu ponavljati? 

Rješenje:
To su varijacije s ponavljanjem četiri elementa trećeg reda

222 242 272 292


224 244 274 294
227 247 277 297
229 249 279 299

422 442 472 492


424 444 474 494
427 447 477 497
429 449 479 499

itd.

kojih ima

4 3 = 64.

Ako se znamenke ne mogu ponavljati, onda su to varijacije bez ponavljanja, kojih ima (samo)

N! 4!
= = 24.
( N − M) ! 1 !
34 Poglavlje 1. Kombinatorika

247 249 274 279 294 297

427 429 472 479 492 497

724 729 742 749 792 794

924 927 942 947 972 974

Zadatak 1.13 Koliko prirodnih brojeva manjih od 10 8 sadrži točno pet znamenaka
7? 

Rješenje:
Za zapis broja manjeg od 10 8 , potrebno je 8 znamenaka. Prema uvjetu zadatka, pet od tih osam
znamenaka mora imati vrijednost 7. Položaji tih pet znamenaka nisu važni (jer su znamenke iste),
pa je broj načina na koje se može odabrati položaj tih pet znamenaka jednak broju kombinacija
osam elemenata petog reda
8 8 8 · 7 · 6
   
5
K8 = = = = 56.
5 3 1 · 2 · 3
Preostala su još tri mjesta. Na njih može doći bilo koja znamenka osim 7, dakle jedna od slijedećih
devet znamenaka
0, 1, 2, 3, 4, 5, 6, 8, 9.
Ove su znamenke med̄usobno različite i njihov različit položaj daje različite znamenke, pa se tu
radi o varijacijama (nisu permutacije jer nisu u igri svih devet gornjih znamenaka, nego samo
njih tri). Budući da se znamenke smiju i ponavljati (ponavljanje takod̄er generira novi broj), to
se radi o varijacjama s ponavljanjem 9 elemenata trećeg reda, a prema (1.5), tavih varijacija ima
V90 3 = 9 3 = 729.
Svakom od 56 poredaka sedmica, može se pridružiti svaki od 729 poredaka ostalih devet zname-
naka, pa je zato ukupan broj prirodnih brojeva manjih od 10 8 koji sadrže točno pet znamenaka 7
jednak
K85 · V90 3 = 56 · 729 = 40 824.

1.4 Binomni poučak


Zadani su proizvoljne veličine A i B i prirodan broj N. Zadatak je naći raspis N-te
potencije binoma
( A + B) N
u red potencija po A i B. Ovaj se zadatak može riješiti na više načina, a jedan je način i
primjenom kombinatorike. Gornja je potencija jednaka umnošku N binoma
( A + B) · ( A + B) · ( A + B) · . . . · ( A + B)
1 2 3 ... N.
1.4 Binomni poučak 35

Pomnožimo gornje zagrade i zapitajmo se koliko će se puta pojaviti potencija A N ? Da


bi se dobila N-ta potencija elementa A, potrebno je iz svakog od N binoma izdvojiti A i
pomnožiti ih. Očito postoji samo jedan način da se iz svakog binoma izdvoji A i zato će
se u razvoju gornjeg umnoška, A N pojaviti u obliku

1 · A N.

S kojim množiteljem će se pojaviti A N −1 ? Ako iz N − 1 zagrada (binoma) uzmemo A a


iz one preostale uzmemo B, dobit ćemo A N −1 B. Ta jedna zagrada iz koje uzimamo B se
može odabrati med̄u N zagrada na N različitih načina (ona može biti prva, druga, ...,
N-ta) i zato član s A N −1 glasi

N · A N −1 B.

Sada tražimo član s A N −2 . Iz N − 2 zagrada uzimamo A, a iz preostale dvije zagrade


uzimamo B. No, od N zagrada, dvije se mogu odabrati na K N2 = ( N2 ) načina (kombinacije
bez ponavljanja: svejedno je jesmo li B uzeli iz 6. i 43. zagrade ili iz 43. i 6. zagrade), pa
je zato član s potencijom A N −2 jednak

N
 
· A N −2 B 2 .
2

Iz ovoga je već jasno kako treba nastaviti: član s potencijom A N −n je

N
 
· A N −n B n .
n
S gornjim općenitim izrazom smo u mogućnosti napisati i potpuni razvoj N-te potencije
binoma
N N N N
       
( A + B) N = AN + A N −1 B + A N −2 B 2 + · · · + A N −n B n +
0 1 2 n
N N
   
N −1
+ ··· + AB + B N,
N−1 N

N
N
 
( A + B) = N
∑ n
A N −n B n . (1.8)
n =0

P OSEBNI SLU ČAJEVI


- ako se odabere da je A = B, relacija (1.8) vodi na
N
N
 
N
2 = ∑ n
,
n =0

- ako se odabere da je A = − B, relacija (1.8) vodi na


N
N
 
0= ∑ (−1) n
n
.
n =0

Binomni poučak može poslužiti kao ishodište za izračunavanje nekih zbrojeva koji
sadrže binomne koeficijente. Evo jednog primjera.
36 Poglavlje 1. Kombinatorika

 Primjer 1.5 Izračunajmo

N
N
 
∑ nk
n
, k = 1, 2, 3, 4, 5, 6.
n =0

Izvedimo najprije izraz za k = 1:


N
N
  

N
( x + y) = ∑ n
x N −n n
y
∂y
n =0
N
N
 
N ( x + y ) N −1 = ∑ x N − n n y n −1

n =0 n x = y =1
N
N
 
N 2 N −1 = ∑ n
n
.
n =0

Sličnim postupkom (višim derivacijama) se dolazi do


N
N
 
∑ n2
n
= 2 N −2 N ( N + 1 ),
n =0
N
3 N
 
∑ n
n
= 2 N −3 N 2 ( N + 3 ),
n =0
N
4 N
 
∑ n
n
= 2 N −4 N ( N + 1)( N 2 + 5N − 2),
n =0
N
5 N
 
∑ n
n
= 2 N −5 N 2 ( N 3 + 10N 2 + 15N − 10),
n =0
N
6 N
 
∑ n
n
= 2 N −6 N ( N + 1)( N 4 + 14N 3 + 31N 2 − 46N + 16).
n =0

Koeficijenti polinoma koji se pojavljuje u okrugloj zagradi na desnoj strani, mogu se naći
na web stranici The On-Line Encyclopedia of Integer Sequences, https : //oeis.org/A102573.


P OOP ĆENJE
Gornje se razmatranje može poopćiti na raspis N-te potencije zbroja tri, četiri i više
članova

( A + B + C) N , ( A + B + C + D) N , ···

Dvostrukom primjenom (1.8), dolazi se do


N
N
 
( A + B + C) N
= [( A + B) + C ] = ∑ N
( A + B ) N −n C n
n =0 n
N N −n   
N N−n

=∑ ∑ A N −n−m B m C n
n =0 m =0 n m
N N − n1
N!
= ∑ ∑ n1 ! n2 ! ( N − n1 − n2 ) !
A N − n1 − n2 B n2 C n1 . (1.9)
n1 =0 n2 =0
1.4 Binomni poučak 37

Primjenom rezultata za razvoj binoma i trinoma, dolazi se do


N
N
 
( A + B + C + D) N
= [( A + B + C ) + D ] = ∑ N
( A + B + C ) N −n D n
n =0 n
N N −n N −n−m   
N N−n N−n−m
 
=∑ ∑ ∑ A N −n−m−l Bl C m D n
n =0 m =0 l =0
n m l
N N − n1 N − n1 − n2
N!
= ∑ ∑ ∑ n1 ! n2 ! n3 ! ( N − n1 − n2 − n3 ) !
A N − n1 − n2 − n3 B n3 C n2 D n1 .
n1 =0 n2 =0 n3 =0

Sada je već posve očito kako se gornji postupak može i dalje poopćavati.

G EOMETRIJSKI
Skica geometrijskog dokaza binomnog poučka za N = 2 i N = 3 je prikazna na slikama
1.3 i 1.4.
Slika 1.3: Skica geometrijskog dokaza binomnog poučka za N = 2.

ac b c c2
ab b2
bc
ab b2

a2 ab
ac

a2 ab

Slika 1.4: Skica geometrijskog dokaza binomnog poučka za N = 3.

b3

a3
38 Poglavlje 1. Kombinatorika

Zadatak 1.14 Izračunajte koeficijent uz a 36 iz razvoja

( a 6 + b 7 ) 22 .

Rješenje:
Prema (1.8) je
22
22
 
6
(a + b ) 7 22
= ∑ k
( a 6 ) k (b 7 ) 22−k .
k =0


36 6 k
a = (a )

k =6

prema tome, (binomni) koeficijent je


22 22
   
= = 74 613.
k 6

Zadatak 1.15 Izračunajte izraz uz z 9 iz razvoja

(x + y 2 + z 3 ) 7.

Rješenje:
Prema (1.9) je
7 7− n
7!
(x + y 2 + z 3 ) 7 = ∑ ∑ n ! m ! (7 − n − m ) !
x 7− n − m y 2 m z 3 n .
n =0 m =0


z9 = z3n

n =3

prema tome, izraz uz z 9 je


7−3 4
7! 7!
∑ 3 ! m ! (7 − 3 − m ) !
x 7−3− m y 2 m = ∑
3 ! m ! ( 4 − m ) !
x 4− m y 2 m
m =0 m =0
= 35 x 4 + 140 x 3 y 2 + 210 x 2 y 4 + 140 xy 6 + 35 y 8 .

Zadatak 1.16 Dokažite

N N
   
= .
M N−M


Rješenje:

N N! N! N
   
= = = .
M M !( N − M) ! ( N − M) ! [ N − ( N − M)] ! N−M
1.4 Binomni poučak 39

Zadatak 1.17 Dokažite

N N N+1
     
+ = .
M M+1 M+1


Rješenje:

N N N! N!
   
+ = +
M M+1 M ! ( N − M ) ! ( M + 1) ! ( N − M − 1) !
( M + 1) + ( N − M ) N+1
= N! = N!
( M + 1) ! ( N − M ) ! ( M + 1) ! ( N − M ) !
( N + 1) ! N+1
 
= = .
( M + 1) ! [( N + 1) − ( M + 1)]) ! M+1

Zadatak 1.18 Koristeći binomni poučak, napišite

1
(1 − z ) k +1
u obliku reda potencija. 

Rješenje:

−(k + 1) (−) 2 (k + 1)(k + 2)


(1 − z)−(k+1) =1 + (−z) + (−z) 2
1! 2!
(−) 3 (k + 1)(k + 2)(k + 3)
+ (−z) 3 + · · ·
3!
∞ ∞ 
(k + n) ! n k+n

=∑ z =∑ z n.
n =0 k ! n ! n =0 k
40 Poglavlje 1. Kombinatorika

Literatura korištena u ovom poglavlju:

1. G. B. A RFKEN I H. J. W EBER.
Mathematical Methods for Physicists. Academic Press, San Diego, 1995
2. V ERA Č ULJAK.
Vjerojatnost i statistika. 2011. URL: www.grad.hr/vera/webnastava/vjerojatnostistatistika/
vis-pdf.pdf
3. N EVEN E LEZOVI Ć.
Vjerojatnost i statistika. Element, Zagreb, 2008
4. C HARLES M. G RINSTEAD I J. L AURIE S NELL.
Introduction to probability. 2019. URL: https://www.math.dartmouth.edu/~prob/
prob/prob.pdf
5. Ivo PAVLI Ć.
Statistička teorija i primjena. Panorama, Zagreb, 1965
6. M IROSLAV P OŽEK.
Osnove teorije vjerojatnosti i matematičke statistike. 2003. URL: https://www.scribd.
com / document / 56377048 / Osnove - teorije - vjerojatnosti - i - matematicke -
statistike
7. V LADIMIR V RANI Ć.
Vjerojatnost i statistika. Tehnička knjiga, Zagreb, 1971
2. Osnovni pojmovi vjerojatnosti

Bog ili postoji ili ne postoji. Pa zašto onda ne okušati sreću? Kladiti se.
Okladiti se da Bog postoji. Ako dobijete, dobijete sve. Ako izgubite, ne izgubite ništa.

Blaise Pascal (19. VI 1623. – 19. VIII 1662.)

2.1 Definicija osnovnih pojmova

T EORIJA VJEROJATNOSTI svoj početak, u XVII stoljeću, duguje zanimanju prema


igrama na sreću dvojice francuskih fizičara i matematičara. To su bili: Blaise Pascal
i Pierre de Fermat1 . Zamoljeni od svojih prijatelja da im pomognu u igrama na sreću, oni

Slika 2.1: Blaise Pascal (lijevo) i Pierre de Fermat (desno).

su započeli razvijati jedan matematički aparat koji se danas naziva teorija vjerojatnosti i
1 Blaise Pascal, 1623 - 1662, i Pierre de Fermat , 1601 - 1665, francuski fizičari i matematičari.
42 Poglavlje 2. Osnovni pojmovi vjerojatnosti

statistika2 . Ovakav pristup rješavanju matematičkih problema kasnije se pokazao kao


jako prikladan (a negdje i jedini moguć) u mnogim znanstvenim disciplinama (kao što
su npr. kinetička teorija plinova, statistička fizika, kvantna fizika, itd.) i u gospodarstvu
(u novije vrijeme sve više u području financijskog poslovanja). Prije nego što počnemo
govoriti o vjerojatnosti, pokušat ćemo preciznije definirati neke pojmove koje ćemo
često koristiti.

D ETERMINISTI ČKI I NASUMI ČNI POKUSI


Kada se proučava vjerojatnost, svaki proces promatranja nekog dogad̄aja se naziva
POKUSOM, a rezultat promatranja se naziva ISHODOM pokusa. Pokus se naziva nasumič-
nim (indeterminističkim) pokusom, ako se njegov ISHOD NE MOŽE PREDVIDJETI. Tipični
primjeri nasumičnih pokusa su: bacanje simetrične kovanice ili kocke, izvlačenje karte iz
snopa i sl. Ako se ishod pokusa može predvidjeti, tada se pokus naziva determinističkim.
Npr. zagrijavanjem metalne cijevi, uvijek će se dobiti isti rezultat: duljina cijevi će se
povećati.
Objasnimo pojam nasumičnog pokusa na najjednostavnijem mogućem primjeru, a to je
bacanje kovanice u zrak i promatranju koja će strana biti okrenuta prema gore. Strogo
gledano to NIJE nasumičan pokus. Zašto? Ako ja znam pod kojim je kutom i kojom
početnom brzinom kovanica bačena u zrak, ako znam na koji način na kovanicu djeluju
sile otpora zraka i gravitacija, ako znam svojstva podloge na koju će kovanica pasti,
onda ja mogu sve to uvrstiti u Newtonove jednadžbe gibanja i izračunati u kojem
će se položaju naći kovanica u trenutku pada na tlo. U tom smislu ovaj pokus nije3
nasumičan. No, jasno je da svi oni ako, koji se gore spominju, praktički nikada nisu
zadovoljeni i zato nitko i ne pokušava provesti ovakav račun. Mi naprosto kažemo,
da zato jer je kovanica manje-više simetrična, posve je SLU ČAJNO hoće li se okrenuti
jedna ili druga strana. Primjetimo ono bitno, a to da mi sada govorimo o nasumičnosti
samo zato jer NEMAMO DOVOLJNO INFORMACIJA: kada bismo znali sve one gornje ako
i uz dovoljno jako računalo (naša vještina računanja se podrazumjeva), ishod pokusa
više ne bi bio nasumičan nego izvjestan. Ukratko, nasumičnim pokusom ćemo nazivati
pokus čiji se ishod PRAKTI ČKI ne može predvidjeti.

P OTPUN SKUP
Skup SVIH mogućih ishoda nasumičnog pokusa se naziva potpun ili osnovni skup.
Označavat ćemo ga s Ω . Pokus ne može završiti ishodom koji nije element potpunog
skupa.

E LEMENTARAN DOGAÐAJ
Svakom ishodu slučajnog pokusa odgovara jedan element u Ω . Svaki od tih ishoda
nazivamo elementarnim dogad̄ajem. Elementarne ćemo dogad̄aje označavati s ω.

 Primjer 2.1 Jedan jednostavan primjer, je potpuni skup za pokus koji se sastoji u
jednom bacanju jedne kovanice: Postoje samo dva moguća ishoda: glava (G) i pismo (P)

Ω = { G, P}

2 Vidjeti primjer 2.18


3 Kvantnomehaničkanemogućnost preciznog odred̄enja položaja i brzine svakog djelića bačene kova-
nice, ovom primjeru nije bitna (ne inzistiramo na tolikoj preciznosti).
2.1 Definicija osnovnih pojmova 43

a elementarni dogad̄aji su
ω1 = G, ω2 = P.
Sličan je i primjer, potpunog skupa za pokus koji se sastoji u jednom bacanju jedne
kocke.
Ω = {1, 2, 3, 4, 5, 6}.
Jedan primjer elementarnog dogad̄aja je pojavljivanje broja 2. To je elementarni dogad̄aj
koji se sastoji u tome da je bačena kocka pokazala broj 2.
ωi = 2.


Osnovni skup se naziva DISKRETNIM ako se sastoji od konačnog (kao (a) iz zadatka
2.1) ili prebrojivo beskonačnog broja elemenata (kao u (b) istog zadatka). Ako se iz-
med̄u elemenata osnovnog skupa i prirodnih brojeva može uspostaviti jedan-jedan
preslikavanja, skup se naziva prebrojivim (cijeli zadatak 2.1). Osnovni skup se naziva
KONTINUIRANIM, ako njegovi elementi čine kontinuum (kao u zadatku 2.2).

S LOŽEN DOGAÐAJ
Složenim dogad̄ajem se naziva svaki podskup osnovnog skupa Ω .

 Primjer 2.2 Vezano za primjer 2.1, složeni dogad̄aj A se može definirati kao dogad̄aj

da kocka pokaže paran broj. Taj je dogad̄aj prikazan podskupom od Ω (prikazati ovo
grafički)
A = {2, 4, 6}.


Postoje dvije definicije vjerojatnosti: vjerojatnost a priori i vjerojatnost a posteriori.


V JEROJATNOST A PRIORI
Promatrajmo neki odred̄eni proces koji ima N JEDNAKO MOGU ĆIH ishoda, tj. N ele-
mentarnih dogad̄aja. Na tom procesu uočavamo jedan (složeni) dogad̄aj, koji označimo
s A, i koji se ostvari kroz NA elementarnih dogad̄aja. Vjerojatnost, P( A), da se dogad̄aj
A ostvari, DEFINIRA se kao

NA
P( A) = . (2.1)
N

To je ono što ćemo kasnije nazivati vjerojatnost A PRIORI. Dakle, vjerojatnost je omjer
broja elementarnih dogad̄aja kojima se ostvaruje dogad̄aj A i ukupnog broja svih ele-
mentarnih dogad̄aja (ili, kako se to obično kaže: povoljno kroz moguće)4 .
 Primjer 2.3 Za primjer ćemo izračunati vjerojatnost dogad̄aja A = (bačena kocka je
pokazala paran broj). Ukupan broj ishoda bacajna kocke je N = 6, a broj povoljnih
ishoda je NA = 3, pa je zato, prema (2.1),
NA 3 1
P( A) = = = .
N 6 2


4 Ova definicija potječe od Laplacea, Théorie analytique des probabilités, 1812.


44 Poglavlje 2. Osnovni pojmovi vjerojatnosti

 Primjer 2.4 Pomoću definicije (2.1) možemo odgovoriti na pitanja tipa: ako se u nekoj
kutiji nalazi 100 kuglica, koje su posve iste osim što se razlikuju u boji: 50 ih je bijelih,
40 crvenih i 10 plavih; pitanje je kolika je vjerojatnost da se nasumičnim izvlačenjem
jedne kuglice, izvuče kuglica odred̄ene boje? U skladu s definicijom 2.1, odgovor je

50 1 40 2 10 1
P(b) = = , P(c) = = , P( p) = = .
100 2 100 5 100 10
Primjetimo da je zbroj sve tri vjerojatnosti jednak jedinici (sigurno će se izvuči kuglica
neke boje)

P(b) + P(c) + P( p) = 1.

Budući da je uvijek

0 ≤ NA ≤ N,

to će uvijek biti

0 ≤ P( A) ≤ 1. (2.2)

Posebno, ako je A elementaran dogad̄aj, tada je NA = 1 i P( A) = 1/N. Ako promatramo


više složenih dogad̄aja, onda je vjerojatniji onaj složeni dogad̄aj koji se ostvaruje kroz
veći broj elementarnih dogad̄aja. Ako niti jedan od elementarnih dogad̄ja ne vodi na
ostvarenje složenog dogad̄aja A, tada je

NA = 0 ⇒ P( A) = 0.

Vjerojatnost iznosa 0 se pridružuje dogad̄aju koji se ne može ostvariti. Naprotiv, ako


svaki od elementarnih dogad̄aja vodi na ostvarenje složenog dogad̄aja A, tada je

NA = N ⇒ P( A) = 1.

Vjerojatnost iznosa 1 se pridružuje dogad̄aju koji se mora dogoditi5 . Iz gornjeg izlaganja


vidimo da vjerojatnost u odred̄enom smislu mjeri nasumičnost, tj. nasumičan dogad̄aj.
Definicija vjerojatnosti (2.1) ima jednu MANJKAVOST: ona vrijedi samo onda ako su svi
dogad̄aji jednako mogući, pa je zato dovoljno voditi računa samo o tome koliko ih ima
(tj. prebrojati ih). No, što se krije iza riječi JEDNAKO MOGU ĆI? Ne znači li to upravo:
jednako vjerojatni? Vjerojatnost definiramo pomoću vjerojatnosti. Vrtimo se u krugu i
uistinu nismo definirali vjerojatnost.

V JEROJATNOST A POSTERIORI
Evo jednostavnog primjera - baca se simetrična kocka i pitanje je kolika je vjerojatnost
da se okrene broj pet? U skladu s definicijom (2.1), ta je vjerojatnost jednaka 1/6. No,
kolika je ta vjerojatnost ako se baca NESIMETRI ČNA kocka? Definicija (2.1) ne daje
5 Ako je dogad̄aj nemoguć, njegova je vjerojatnost jednaka nuli. No, obrat ne vrijedi: ako je vjerojatnost

jednaka nuli, to još ne znači da je dogad̄aj neostvariv. Slično, ako je sigurno da će se dogad̄aj ostvariti,
njegova je vjerojatnost jednaka jedinici. Ali, ako je vjerojatnost jednak jedan, to još uvijek ne znači da
će se dogad̄aj sigurno ostvariti. U vezi s ovime, treba pogledati primjere navedene kod kontinuiranih
vjerojatnosti.
2.1 Definicija osnovnih pojmova 45

odgovor na to pitanje. Ona nam ne omogućava niti da kažemo kolika je vjerojatnost da


će neki čovjek iz promatrane skupine oboljeti od odred̄ene bolesti ili što slično. U ovim
se slučajevima koristi A POSTERIORI definicija vjerojatnosti ili STATISTI ČKA definicija
vjerojatnosti. Suština ove definicije je u slijedećem: izvodi se neki pokus, mjerenje ili
nešto slično6 što ćemo općenito nazivati procesom, kojim se utvrd̄uje je li se dogad̄aj
A već ostvario ili nije. Ako je, pod istim uvjetima, izvedeno N pokusa, pri čemu se
dogad̄aj A ostvario NA puta, definiramo RELATIVNU FREKVENCIJU f rel ( A) dogad̄aja A
kao omjer
NA
f rel ( A) = . (2.3)
N
Ova relativna frekvencija još uvijek NIJE isto što i vjerojatnost a posteriori. Tek u granici
kada broj promatranih procesa (pokusa), N, postane vrlo velik (tj. kada teži prema
beskonačnosti), ova frekvencija postaje a posteriorna vjerojatnost

NA
P( A) = lim . (2.4)
N→∞ N

Primjetimo da N i NA iz gornje relacije nemaju isto značenje kao N i NA iz (2.1).

Precizniju definiciju vjerojatnosti a posteriori je dao Mises7 1919:


(1) O vjerojatnosti se može govoriti samo ako postoji točno ograničeni skup dogad̄aja
(to može biti i proces koji se ponavlja u vremenu).
(2) Spomenuti skup dogad̄aja (tj. ponavljani proces), mora zadovoljavati dva uvjeta:
(a) relativne frekvencije pojedinih obilježja moraju imati točno odred̄ene granične
vrijednosti u granici kada broj elemenata skupa neizmjerno raste;
(b) te granične vrijednosti se ne smiju promijeniti, ako se ukloni jedan dio
elemenata iz skupa.
(3) Ovaj uvjet iz (b) se naziva načelo nereda ili načelom isključenog sistema igre.
(4) Granična vrijednost iz (a) naziva se vjerojatnost obilježja unutar promatranog skupa.

 Primjer 2.5 Evo jednog lijepog primjera kojeg dugujemo strpljenju jednog züriškog

astronoma po imenu R. Wolf. On je, 1850. godine bacao dvije kocke i brojao je koliko će
se puta okrenuti različiti brojevi. Evo njegovih rezultata.

Kada se bacaju dvije kocke, moguća su 36 ishoda prikazna tablicom 2.1. Šest kom-
binacija rezultira istim brojem na obje kocke, a 30 kombinacija rezultira različitim
brojevima. Prema tome je apriorna vjerojatnost da se u danom bacanju pojave dva
različita broja, jednaka
30
P= = 0.83̇.
36
Evo Wolfovih eksperimentalnih rezultata, tablica 2.2, za relativnu frekvenciju f rel ,
prikazanih u ovisnosti o broju bacanja N. Vidi se da ovi rezultati samo približno
6 npr. praćenje zdravstvenog stanja neke skupine ljudi tijekom dužeg vremenskog perioda
7 Richard Edler von Mises, 19. IV 1883. – 14. VII 1953, austro-ugarsko američki fizičar.
46 Poglavlje 2. Osnovni pojmovi vjerojatnosti

Tablica 2.1: Mogući ishodi bacanja dvije kocke.

11 12 13 14 15 16
21 22 23 24 25 26
31 32 33 34 35 36
41 42 43 44 45 46
51 52 53 54 55 56
61 62 63 64 65 66

Tablica 2.2: Wolfovi eksperimentalni ishodi za relativnu frekvenciju f rel .

N 100 1 000 10 000 100 000

f rel 0.88 0.836 0.8351 0.83533

potvrd̄uju apriornu vjerojatnost 0.83̇, iako se od nje JASNO RAZLIKUJU. Od kuda potječe
ta razlika? Od neidelanosti kocaka koje je Wolf koristio. S nekim drugim parom
kocaka bi se dobili i drukčiji rezultati, koji bi opet bili bliski, ali ne i jednaki apriornoj
vjerojatnosti. Gornja vjerojatnost (tj. relativna frekvencija) se odnosi baš na onaj par
kocaka koji je koristio Wolf, dok se apriorna vjerojatnost odnosi na idealne kocke. 

Iz gornjeg se primjera vidi da što je veći broj bacanja N, to relativna frekvencija teži jed-
noj graničnoj vrijednosti koju zovemo vjerojatnost a posteriori ili statistička vjerojatnost,
a koja je po svojoj vrijednosti, jako bliska apriornoj vjerojatnosti istog procesa. Zašto
(samo) bliska, a ne i jednaka? Zato jer se apriorna vjerojatnost odnosi na IDEALNE kocke
koje se bacaju pod IDEALNO jednakim uvjetima. U stvarnosti, ništa nije idealno (razlike
uvijek postoje i one se nastoje učiniti što manjima u pokusima - to je velika vještina
eksperimentalnih fizičara) i zato ne smijemo očekivati a priornu vjerojatnost kao rezultat
graničnog procesa.

Z AKON VELIKIH BROJEVA :


O zakonu velikih brojeva će se nešto više i nešto kvantitativnije reći u odjeljku 7. Za sada
samo recimo da kada broj pokusa raste, apsolutna vrijednost razlike izmed̄u relativne
frekvencije i apriorne vjerojatnosti, opada. Ili, malo drukčije rečeno,

ONO ŠTO NA JEDNOM POJEDINOM PRIMJERU IZGLEDA KAO NASUMI ČNOST, POKAZUJE
SE KAO ZAKONITOST KADA SE GLEDA VELIKI BROJ DOGAÐAJA .

Ili, koristeći druge riječi,

TVRDNJE KOJE IZNOSIMO ODNOSE SE NA NEKI VELIKI SKUP DOGAÐAJA , A NE NA


POJEDINI DOGAÐAJ .

Za ilustraciju, evo dva primjera:


2.1 Definicija osnovnih pojmova 47

 Primjer 2.6 Neki čovjek doživi prometnu nezgodu; za njega i ljude iz njegove okoline
to je posve izniman dogad̄aj, no ako se promatra cijeli naraštaj kome taj čovjek pripada
i ako se zna da u njegovoj dobnoj skupini npr. 1% ljudi godišnje doživi prometnu
nezgodu, onda prometna nezgoda toga čovjeka prestaje biti iznenad̄ujući i izniman
dogad̄aj i postaje samo još jedan primjer koji se lijepo uklapa u predvid̄anja temeljena
na vjerojatnosti. Ne zna se točno koji će čovjek doživjeti nezgodu, ali se zna da će se to
zadesiti otprilike 1% osoba te dobne skupine. 

 Primjer 2.7 Jedan manje morbidan primjer se odnosi na rulet: U ožujku 1953. na ruletu
u Monte Carlu je odigrano 4 894 igara, pri čemu je kuglica pala na crno polje 2 396
puta, na crveno 2 360 puta i na bijelo 138 puta. Ako uzmemo u obzir da su apriorne
vjerojatnosti za crveno i crno polje jednake med̄usobno i jednake 18/37, a za bijelo 1/37,
vidi se da su odstupaja relativnih frekvencija od apriornih vjerojatnosti reda 1%

rel 2 396 18
f crno = = 0.48958 · · · , Pcrno = ≈ 0.486486 · · · ∆ = 0.0063,
4 894 37
rel 2 360 18
f crveno = = 0.48222 · · · , Pcrveno = ≈ 0.486486 · · · ∆ = 0.0088,
4 894 37
rel 138 1
f bijelo = = 0.0281978 · · · , Pbijelo = ≈ 0.027027 · · · ∆ = 0.0424,
4 894 37

gdje je
rel
f α − Pα

∆= .
( f αrel + Pα )/2

Slično kao i u prethodnom primjeru, mi nismo u stanju reći hoće li se u danom bacanju
kuglica zaustaviti na crnom, crvenom ili bijelom polju, ali smo u mogućnosti reći da će
se u nekoliko tisuća bacanja kuglica zaustaviti otprilike toliko i toliko puta na pojedinom
polju. 

Zadatak 2.1 Napišite potpuni skup za pokus koji se sastoji u:


(a) bacanju kovanice dva puta i
(b) bacamo kovanicu i brojimo koliko je bacanja potrebno da bi se
pojavilo pismo. 

Rješenje:
(a) Sada postoje četiri moguća ishoda, pa je

Ω = { GG, GP, PG, PP}.

(b) Pismo se može pojaviti nakon prvog, drugog, itd. bacanja, pa je zato

Ω = {1, 2, 3, · · · }.

Zadatak 2.2 Napišite osnovni skup za nasumični pokus koji se sastoji od mjerenja
(u satima) vremena života jednog tranzistora. 
48 Poglavlje 2. Osnovni pojmovi vjerojatnosti

Rješenje:
Vrijeme života tranzistora može biti bilo koji realan pozitivan broj, pa je zato

Ω = { t : 0 ≤ t ≤ ∞ },

gdje je t vrijeme života.

Zadatak 2.3 Pokus se sastoji u bacanju dvije kocke.


(a) Napišite osnovni skup.
(b) Definirajte (složeni) dogad̄aj A koji se sastoji u tome da je zbroj
točkica na kockama jednak 7.
(c) Definirajte (složeni) dogad̄aj B koji se sastoji u tome da je zbroj
točkica na kockama veći od 10.
(d) Definirajte (složeni) dogad̄aj C koji se sastoji u tome da je zbroj
točkica na kockama veći od 12. 

Rješenje:
(a) Potpuni skup se može napisati kao skup ured̄enih parova brojeva (i, j), gdje svaki od brojeva i
i j poprima sve vrijednosti prirodnih brojeva od 1 do 6 (uključivo). Broj i pokazuje broj točkica
na prvoj, a j na drugoj kocki.

11 12 13 14 15 16

21 22 23 24 25 26

31 32 33 34 35 36

41 42 43 44 45 46

51 52 53 54 55 56

61 62 63 64 65 66

To se, kraće, piše kao

Ω = {(i, j) : i, j = 1, 2, 3, 4, 5, 6}.

(b) Dogad̄aj A je podskup od Ω , koji se sastoji od slijedećih šest elemenata

A = {(1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)}.

(c) Dogad̄aj B je podskup od Ω , koji se sastoji od tri elemenata

B = {(5, 6), (6, 6), (6, 5)}.

(d) Zbroj točkica na dvije kocke ne može biti veći od 12, i zato je nemoguć dogad̄aj, predstavljen
praznim skupom

C = ∅.
2.1 Definicija osnovnih pojmova 49

Zadatak 2.4 Bačeno je dvanaest kocaka. Kolika je vjerojatnost da se svaki od brojeva


1, 2, 3, 4, 5, 6, pojavi dva puta? 

Rješenje:
Prema (2.1) je

NA
P( A) = ,
N
gdje je A dogad̄aj da se svaki od šest brojeva pojavi dva puta. S N je označen ukupan broj
mogućih ishoda bacanja 12 kocaka. Svaka kocka može pokazati bilo koji od 6 brojeva neovisno o
ostalim kockama, pa je zato

N = 6 · . . . · 6 = 612 .

Koliko ima povoljnih ishoda? Povoljan ishod je svaka permutacija niza

1 1 2 2 3 3 4 4 5 5 6 6.

Prema (1.3), takvih permutacija ima

12 ! 12 !
NA = = .
2! 2! 2! 2! 2! 2! (2 ! ) 6
Tražena vjerojatnost je

12 !
(2 ! ) 6
P= = 0.00344 = 0.344 %.
612

Zadatak 2.5 Ispunili ste jednu kombinaciju lota 7/39.


(a) Kolika je vjerojatnost da ćete pogoditi sedmicu?
(b) Kolika je vjerojatnost da ćete pogoditi šesticu?
(c) Kolika je vjerojatnost da ćete pogoditi peticu?
(d) Kolika je vjerojatnost da ćete pogoditi četvorku?
(e) Kolika je vjerojatnost da ćete pogoditi trojku? 

Rješenje:
Prema (2.1) je

N7
P (7) = ,
N
N je broj mogućih načina da se od 39 brojeva odabere njih sedam, a taj je broj prema rješenju
zadatka 1.2, jednak broju kombinacija bez ponavljanja 39 elemenata sedmog razreda

39 39 !
 
7
N = K39 = = = 15 380 937.
7 7 ! 32 !

(a)
Povoljna je samo jedna od tih kombinacija (ona koju ste upisali),

7 39 − 7
  
N7 = 1 = ,
7 0
50 Poglavlje 2. Osnovni pojmovi vjerojatnosti

pa je zato tražena vjerojatnost jednaka


7 39 − 7
  

7 0 1
P7 = = = 6.50155 · 10−8 = 0.0000000650155.
39 15 380 937
 

7
(b)
Od sedam brojeva, njih se šest može odabrati na (76) načina. Onaj sedmi broj može biti bilo koji
od preostalih 39 − 7 brojeva (sedam brojeva je označio igrač, pa ovaj jedan broj mora biti jedan
od tih neoznačenih brojeva). Zato povoljnih odabira šestica ima
7 39 − 7
  
N6 = = 7 · 32,
6 1
pa je tražena vjerojatnost jednaka
7 39 − 7
  

N6 6 1 7 · 32
P6 = = = = 0.0000145635.
N 39 15 380 937
 

7
(c)
Od sedam brojeva, njih se pet može odabrati na (75) načina. Preostala dva broja mogu biti bilo
koja od preostalih 39 − 7 brojeva. Zato povoljnih odabira petica ima
7 39 − 7
  
N5 = = 16 · 21 · 31,
5 2
pa je zato tražena vjerojatnost jednaka
7 39 − 7
  

N5 5 2 16 · 21 · 31
P5 = = = = 0.000677202.
N 39 15 380 937
 

7
(d)
Od sedam brojeva, njih četiri se može odabrati na (74) načina. Preostala tri broja mogu biti bilo
koja od preostalih 39 − 7 broja. Zato povoljnih odabira četvorki ima
7 39 − 7
  
N4 = = 7 · 25 · 31 · 32,
4 3
pa je zato tražena vjerojatnost jednaka
7 39 − 4
  

N4 4 3 7 · 25 · 31 · 32
P4 = = = = 0.0112867 ≈ 1.1 %.
N 39 15 380 937
 

7
(e)
Od sedam brojeva, njih tri se može odabrati na (73) načina. Preostala četiri broja mogu biti bilo
koja od preostalih 39 − 7 broja. Zato povoljnih odabira trojki ima
7 39 − 7
  
N3 = = 7 · 8 · 25 · 29 · 31,
3 4
2.1 Definicija osnovnih pojmova 51

pa je zato tražena vjerojatnost jednaka

7 39 − 7
  

N3 3 4 7 · 8 · 25 · 29 · 31
P3 = = = = 0.0818286 ≈ 8.1 %.
N 39 15 380 937
 

Ako ispunjavate listić u kojemu smijete označiti 10 brojeva, tada su odgovarajuće vjerojatnosti
dobitka jednake

1039 − 10
  

7 0
P7 = = 7.80187 · 10−6 ,
39
 

7
10 39 − 10
  

6 1
P6 = = 0.000395945 ≈ 0.04 %,
39
 

7
10 39 − 10
  

5 2
P5 = = 0.00665187 ≈ 0.67 %,
39
 

7
10 39 − 10
  

4 3
P4 = = 0.049889 ≈ 4.99 %
39
 

7
10 39 − 10
  

3 4
P3 = = 0.185302 ≈ 18.53 %.
39
 

Zadatak 2.6 U skupu od dvadeset i pet proizvoda, pet ih je neispravno.


(a) Kolika je vjerojatnost da prvi nasumice uzeti proizvod bude neispra-
van?
(b) Iz skupa uzmemo odjednom pet proizvoda. Kolika je vjerojatnost
da med̄u njima budu dva neispravna? 

Rješenje:
(a) (b)

5 5 20
    

1 2 3
pa = = 0.2 pb = = 0.214 568.
25 25
   

1 5
52 Poglavlje 2. Osnovni pojmovi vjerojatnosti

2.2 Računske operacije s vjerojatnostima


Često se nasumični dogad̄aji mogu zamisliti kao kombinacija (kompozicija) više elemen-
tarnih ili nekih drugih (manje) složenih dogad̄aja. U ovom ćemo odjeljku pokazati kako
se vjerojatnost takvih složenih dogad̄aja, može izračunati iz vjerojatnosti jednostavnijih
dogad̄aja.

2.2.1 "ILI" vjerojatnost: zbrajanje vjerojatnosti


I SKLJU ČIVI DOGAÐAJI
Za dva složena dogad̄aja A i B kažemo da su isključivi, ako ne postoji elementaran
dogad̄aj koji ostvaruje oba ova dogad̄aja. Npr. kod bacanja kocke dogad̄aji A = „pojavit
će se paran broj manji od 6” i B = „pojavit će se neparan broj manji od 5” su med̄usobno
isključivi jer nijedan od elementarnih dogad̄aja (pojavljivanje 1, 2, 3, 4, 5 ili 6), ne vodi
na istovremeno ostvarenje dogad̄aja A i B. Vizualno si to možemo predočiti na slijedeći
način: neka su svi elementarni dogad̄aji ω i diskretni8 i predstavljeni točkama u ravnini
(slika 2.2), tada možemo konstruirati podskupove α( A) i β( B) elementarnih dogad̄aja
koji sadrže elementarne dogad̄aje koji vode na ostvarenje (redom) ILI dogad̄aja A ILI
dogad̄aja B. Neka od N elementarnih dogad̄aja, njih NA vode na ostvarenje dogad̄aja

Slika 2.2: Uz definiciju zbrajanja vjerojatnosti. A i B su isključivi dogad̄aji.

ωi

α( A) β( B)

A, a njih NB na ostvarenje dogad̄aja B. Po definiciji vjerojatnosti kao omjera povoljnih


i svih mogućih dogad̄aja zaključujemo: povoljni su svi oni dogad̄aji koji rezultiraju
ostvarenjem A ili B, a takvih je NA + NB ; svih mogućih dogad̄aja ima N. Prema tome je

NA + NB N N
P( A + B) = = A + B = P ( A ) + P ( B ).
N N N
Gornje razmatranje možemo poopćiti na proizvoljan broj od k dogad̄aja A1 , A2 , · · · , Ak ,
koji se med̄usobno potpuno isključuju. Oznakom

A1 + A2 + · · · + A k

ćemo označiti dogad̄aj koji se sastoji u ostvarenju jednog (bilo kojeg) od dogad̄aja Ai :
ili A1 ili A2 , ili itd. Primjetimo da znak + kada stoji med̄u dogad̄ajima (čita se ili i
8 Slično se može govoriti i o kontinuiranim dogad̄ajima.
2.2 Računske operacije s vjerojatnostima 53

označava jednu logičku operaciju), ne znači isto što i znak + kada stoji med̄u brojevima
(čita se plus i označava algebarsku operaciju). Takod̄er riječ ILI ovdje ima svoje isključivo
značenje: ili jedno ili drugo, ali NE I OBA ZAJEDNO. Neka Nk elementarnih dogad̄aja
ostvaruje dogad̄aj Ak , tada je
N1 + N2 + · · · + NK N N2 N
P ( A1 + A2 + · · · + A K ) = = 1+ + ··· + K
N N N N
= P ( A1 ) + P ( A2 ) + · · · + P ( A K ).
Vjerojatnost ostvarenja dogad̄aja A1 + A2 + · · · + AK jednaka

P ( A1 + A2 + · · · + A K ) = P ( A1 ) + P ( A2 ) + · · · + P ( A K ). (2.5)

Gornja se relacija može napisati i kraće kao


K K
!
P ∑ Ak = ∑ P ( A k ).
k =1 k =1

Algebarskim jezikom rečeno, zbrajanje vjerojatnosti isključivih dogad̄aja je linearan


operator9 .

V JEROJATNOST NEOSTVARENJA DOGAÐAJA


Neka je zadan dogad̄aj A. U promatranom procesu, taj se dogad̄aj može ili ostvariti ili
ne ostvariti, treće mogućnosti nema. Neostvarenje dogad̄aja A je opet jedan dogad̄aj
koji ćemo označiti s A. Sa sigurnošću možemo reći da će se dogad̄aj A ili ostvariti ili ne
ostvariti. Siguran dogad̄aj ima vjerojatnost jednaku jedan, pa zato pišemo

P( A) + P( A) = 1.

Do istog rezultata dolazimo i pomoću gornjeg pravila o zbrajanju vjerojatnosti isključi-


vih dogad̄aja: ako je NA broj elementarnih dogad̄aja koji ostvaruje A, tada je N − NA
broj elementarnih dogad̄aja koji ostvaruje A, pa je prema (2.5)
NA N − NA
P( A + A) = P( A) + P( A) = + = 1.
N N
Vjerojatnost da se dogad̄aj A ne ostvari, označavamo i s

Q( A) ≡ P( A) ⇒ P( A) + Q( A) = 1.

N ORMIRANJE
Ako se promatra skup isključivih dogad̄aja A1 , A2 , · · · , AK , za koje je

N1 + N2 + · · · + NK = N,

tada je vjerojatnost da se dogodi ili A1 ili A2 ili ... ili AK jednaka jedinici

P( A1 ) + P( A2 ) + · · · + P( AK ) = 1. (2.6)

tj. sigurno je da će se ostvariti jedan od navedenih dogad̄aja. Ta se činjenica naziva i


NORMIRANJE VJEROJATNOSTI .

9 Primjetimo da se na lijevoj strani zbrajaju dogad̄aji, a na desnoj vjerojatnosti tih dogad̄aja.


54 Poglavlje 2. Osnovni pojmovi vjerojatnosti

 Primjer 2.8 K UGLICE


U kutiji se nalazi šest plavih i četiri crvene kuglice. Nasumično se biraju tri kuglice.
Kolika je vjerojatnost
(a) da su sve tri plave,
(b) da su sve tri iste boje
(c) da su dvije plave i jedna crvena?

6
 

3 1
( a) P( ppp) =   = ,
10 6
3
6 4
   

3 3 1
(b) P( ppp + ccc) = (2.5) = P( ppp) + P(ccc) =   +   = ,
10 10 5
3 3
6 4
  

2 1 1
(c) P( ppc) =   = .
10 2
3


 Primjer 2.9 J OŠ KUGLICA


U kutiji se nalazi Nb bijelih i Nc crnih kuglice (Nb > 2, Nc > 2). Iz kutije se istovremeno
izvlače dvije kuglice. Koji je dogad̄aj vjerojatniji:
A = kuglice su iste boje;
B = kuglice su različitih boja?

P( A) = P(bb) + P(cc), P ( B ) = 1 − P ( A ).

Nb Nc
   

2 2
P(bb) =  , P(cc) = 
Nb + Nc Nb + Nc


2 2

Nb ( Nb − 1) + Nc ( Nc − 1)
=⇒ P( A) = ,
( Nb + Nc )( Nb + Nc − 1)

2Nb Nc
=⇒ P( B) = .
( Nb + Nc )( Nb + Nc − 1)

Da bi se odredilo koji je dogad̄aj vjerojatniji, treba promotriti omjer

P( A) N ( N − 1) + Nc ( Nc − 1)
= b b
P( B) 2Nb Nc

Dogad̄aj A je vjerojatniji od dogad̄aja B ako je P( A) > P( B), tj. ako je

Nb ( Nb − 1) + Nc ( Nc − 1) > 2Nb Nc .
2.2 Računske operacije s vjerojatnostima 55

Oba su dogad̄aja jednako vjerojatna, ako je P( A) = P( B), tj. ako je

Nb ( Nb − 1) + Nc ( Nc − 1) = 2Nb Nc .

Dogad̄aj B je vjerojatniji od dogad̄aja A ako je P( B) > P( A), tj. ako je

Nb ( Nb − 1) + Nc ( Nc − 1) < 2Nb Nc .

 Primjer 2.10 R OÐENDANI


U prostoriji se nalazi N osoba. Elementarni dogad̄aji su rod̄endani tih osoba. Potrebno
je odrediti:
(a) Kako izgleda osnovni skup?
(b) Kolika je vjerojatnost da bar dvije osobe imaju rod̄endan istog dana?
(c) Izračunajte tu vjerojatnost za N = 50.
(d) Koliko veliki treba biti N, pa da tražena vjerojatnost bude veća od 0.5?

(a) Radi jednostavnosti, zaboravit ćemo na prijestupne godine, i reći ćemo da godina
ima 365 dana. Budući da ne znamo kada je koja osoba rod̄ena10 moramo dopustiti
mogućnost da je rod̄ena bilo kojeg od 365 dana u godini. Rod̄endan svake od N osoba
ćemo označiti s

rj, j = 1, 2, 3, · · · , N,

pri čemu svaki r j može označavati bilo koji dan u godini, tj.

r j ∈ {1, 2, 3, · · · , 365}, j = 1, 2, 3, · · · , N.

Osnovni skup sastoji od NΩ = 365 N (sjetimo se kombinatorike - to su varijacije s


ponavljanjem) N-torki brojeva oblika

(r1 , r2 , · · · , rN ),

gdje svaki r j označava dan rod̄enja j-te osobe u prostoriji

Ω = (r1 , r2 , · · · , rN ) : r j = 1, 2, 3, · · · , 365 .


(b) Označimo s P(m) vjerojatnost da točno m osoba ima rod̄endan istog dana. Prema
normiranju vjerojanosti je

P(0) + P(2) + P(3) + · · · + P( N ) = 1.

Vjerojatnost Pbar 2 , da bar dvije osobe imaju isti rod̄endan je, prema gornjoj relaciji,
jednaka

Pbar 2 = P(2) + P(3) + · · · + P( N ) = 1 − P(0). (2.7)

Kolika je vjerojatnost P(0) da sve osobe imaju rod̄endane u razne dane (naravno, ako
je N < 365)? Krenimo redom: rod̄endan prve osobe može biti bilo koji od 365 dana u
godini; da bi se rod̄endan druge osobe razlikovao od rod̄endana prve osobe, on mora
pasti u jedan (bilo koji) od preostalih 364 dana. To znači da je broj elemenata iz Ω
10 Kada bismo znali kada je koja osoba rod̄ena, ne bi imalo smisla računati vjerojatnosti nečega što već sa

sigurnošću znamo.
56 Poglavlje 2. Osnovni pojmovi vjerojatnosti

u kojima dvije osobe nemaju isti rod̄endan jednak 365 · 364. Sada želimo isključiti i
treću osobu. Njezin rod̄endan mora pasti u jedan od preostala 363 dana, što vodi na
365 · 364 · 363 elemenata. Ovaj se postupak jednostavno nastavlja sve do isključenja i
N-te osobe, a broj N-torki koje zadovoljavaju postavljeni uvjet je

N0 = 365 · 364 · 363 · . . . · (365 − N + 1).

Prema definiciji vjerojatnosti (2.1) je

N0 365 · 364 · 363 · . . . · (365 − N + 1)


P (0) = = .
NΩ 365 N
To je vjerojatnost da nema dvije osobe s istim rod̄endanom. Prema (2.7) vjerojatnost da
bar dvije osobe imaju isti rod̄endan je

365 · 364 · 363 · . . . · (365 − N + 1)


Pbar 2 = 1 − P(0) = 1 − . (2.8)
365 N
(c) Uvrštavanjem N = 50 u gornju formulu, dobivamo

365 364 363 316


Pbar 2 = 1 − · · · ... · ≈ 0.97.
365 365 365 365
Dakle, u skupu od 50 osoba, postoji vjerojatnost od 97% da bar dvije osobe imaju isti
rod̄endan.
(d) Uvrštavanjem N = 23 u (2.8), dobiva se

Pbar 2 ≈ 0.507.

To znači da ako se u prostoriji nalaze najmanje 23 osobe, vjerojatnost da bar dvije imaju
isti rod̄endan, je veća od 0.5. Vrijednosti Pbar 2 za još nekoliko vrijednosti N, dano je
donjom tablicom

N 10 20 22 23 30
Pbar 2 0.117 0.411 0.476 0.507 0.706

N 40 50 60 70 80
Pbar 2 0.891 0.97 0.994 0.9992 0.9999 .


2.2.2 "I" vjerojatnost: množenje vjerojatnosti


Pretpostavimo sada da postoje dva dogad̄aja A i B čija se ostvarenja med̄usobno NE
ISKLJU ČUJU . Npr. bacaju se istodobno kovanica i kocka. Dogad̄aj A je da će kovanica
pokazati pismo (bez obzira na kocku), a dogad̄aj B je da će kocka pokazati paran broj
(bez obzira što pokaže kovanica).
Definira se dogad̄aj „A i B”

A · B

koji se sastoji u istovremenom ostvarenju i dogad̄aja A i dogad̄aja B. Svaki povoljan


dogad̄aj koji vodi na ostvarenje A mogu kombinirati sa svakim povoljnim dogad̄ajem
koji vodi na ostvarenje B. (slika 2.3). Neka se dogad̄aj A ostvaruje kroz NA od N1
mogućih elementarnih dogad̄aja, a B kroz NB elementarnih dogad̄aja od N2 mogućih
2.2 Računske operacije s vjerojatnostima 57

elementarnih dogad̄aja. Vjerojatnost dogad̄aja i A i B je opet dana omjerom povoljnih i


svih mogućih dogad̄aja. Koliko ima povoljnih? Svaki povoljni dogad̄aj od A možemo
potpuno slobodno (bez ikakvih uvjeta) kombinirati sa svakim povoljnim dogad̄ajem
od B, tako da imamo sve skupa NA · NB povoljnih elementarnih dogad̄aja koji vode
na ishod i A i B. Slično i svaki mogući dogad̄aj od A možemo kombinirati sa svakim
mogućim dogad̄ajem od B i tako dobivamo sveukupno N1 · N2 mogućih dogad̄aja, pa
je vjerojatnost

NA · NB N N
P( A · B) = = A · B = P ( A ) · P ( B ).
N1 · N2 N1 N2

 Primjer 2.11 K OCKA I KOVANICA


Pokus se sastoji u istovremenom bacanju kocke i kovanice. Mogućih ishoda bacanja
kovanice ima N1 = 2, a mogućih ishoda bacanja kocke ima N2 = 6. Potpuni skup ishoda
ovog pokusa, se može zapisati kao

Ω = { P1, P2, P3, P4, P5, P6, G1, G2, G3, G4, G5, G6}

i prikazan je slikom 2.3. Ako je A dogad̄aj da kovanica pokaže pismo, a B je dogad̄aj da

Slika 2.3: Uz definiciju množenja vjerojatnosti.

G1 G2 P2 P1

G3 G4 P4 P3

G5 G6 P6 P5

kocka pokaže paran broj, tada je NA = 1, NB = 3 i

NA · NB 1·3 1
P( AB) = = = P( A) P( B) = .
N1 · N2 2·6 4


Općenito ćemo dogad̄aj koji se sastoji u istovremenom ostvarivanju i A1 i A2 i A3 i itd.,


označiti s

A1 · A2 · . . . · A k

Primjetimo da sada znak · kada stoji med̄u dogad̄ajima (čita se i i označava logičku
operaciju), ne znači isto što i znak · kada stoji med̄u brojevima (čita se puta i označava
algebarsku operaciju). Neka Ni elementarnih dogad̄aja ostvaruje dogad̄aj Ai , tada
58 Poglavlje 2. Osnovni pojmovi vjerojatnosti

izmed̄u N k mogućih dogad̄aja, postoji njih N1 · N2 · . . . · Nk različitih dogad̄aja koji


ostvaruju A1 · A2 · . . . · Ak . Prema definiciji vjerojatnosti

N1 · N2 · . . . · Nk N N2 N
P ( A1 · A2 · . . . · A k ) = k
= 1· · . . . · k = P ( A1 ) · P ( A2 ) · . . . · P ( A k ).
N N N N
Vjerojatnost ostvarenja dogad̄aja A1 · A2 · . . . · Ak je

P ( A1 · A2 · . . . · A k ) = P ( A1 ) · P ( A2 ) · . . . · P ( A k ). (2.9)

Gornja se relacija može napisati11 i kraće kao


k k
!
P ∏ Ai = ∏ P ( A i ).
i =1 i =1

 Primjer 2.12 K OCKE

Problem kockica je stvarni problem koji potječe od Chevalier de Méré-a (1607-1684),


prijatelja Pascala i Fermata. Točnije, radi se o dva problema.
Prvi se problem sastoji u ....dovršiti
Drugi problem (usporediti s 2.18) se sastoji u ... dovršiti.. 

 Primjer 2.13 B ERNOULLIJEVI POKUSI


Pokažimo sada kako se u rješavanju jednog konkretnog problema KOMBINIRAJU i i ili
vjerojatnosti.
Promatra se niz od N pokusa. Svaki od N pokusa može okončati na samo DVA moguća
načina: ili se uočeni dogad̄aj A ostvario s vjerojatnošću p ili se nije ostvario s vjerojat-
nošću q = 1 − p. Ova vjerojatnost p je ista u svih N pokusa. Traži se vjerojatnost P(n)
da se uočeni dogad̄aj ostvario točno n puta, gdje je n neki prirodan broj izmed̄u 0 i N.

Što možemo reći o ovom nizu pokusa? Najprije, znamo da mora vrijediti normiranje
vjerojatnosti: A se dogodio ili nijednom ili jednom ili dva puta itd. sve do mogućnosti
da se A dogodio svih N puta

P(0) + P(1) + P(2) + · · · + P( N ) = 1.

Kako izračunati gornje P(n)? Započnimo s nečim jednostavnim. Kolika je vjerojatnost


P( N ) da se A dogodio svih N puta? Vjerojatnost da se A dogodio u prvom pokusu je

p.

Vjerojatnost da se A dogodio u prvom i drugom pokusu je, prema (2.9),

p · p.

Vjerojatnost da se A dogodio u prvom i drugom i trećem pokusu je, opet prema (2.9),

p · p · p.

Itd., vjerojatnost da se A dogodio u svih N pokusa je

P( N ) = p N .
11 Primjetimo da se na lijevoj strani množe dogad̄aji, a na desnoj vjerojatnosti tih dogad̄aja.
2.2 Računske operacije s vjerojatnostima 59

Slično možemo računati i P(0). Vjerojatnost da se A nije dogodio u prvom pokusu je

q = 1 − p.

Vjerojatnost da se A nije dogodio u prvom i drugom pokusu je, prema (2.9),

q · q.

Vjerojatnost da se A nije dogodio u prvom i drugom i trećem pokusu je, opet prema
(2.9),

q · q · q.

Itd., vjerojatnost da se A nije dogodio u svih N pokusa je

P (0) = q N .

Slijedeći, malo složeniji zadatak je odrediti kolika je vjerojatnost da se A ostvari BAR


JEDNOM ; dakle ili jednom ili dva puta ili tri puta ili · · · ili N puta? Prema pravilu o
zbrajanju vjerojatnosti (2.5) to je

Pbar jednom = P(1) + P(2) + · · · + P( N ).

Očito su tu sadržane sve mogućnosti osim mogućnosti da se A ne ostvari nijednom


(tj. da se ostvari nula puta). Budući da smo upravo zaključili da je vjerojatnost N
neostvarenja A jednaka q N , to vjerojatnost bar jednog ostvarenja A mora biti jednaka

Pbar jednom = 1 − P(0) = 1 − q N .

Kako izračunati vjerojatnost da se A dogodi točno jednom?


U N pokusa, dogad̄aj A se može ostvariti jednom na N različitih načina. Može se
dogoditi u prvom pokusu s vjerojatnošću

p q q q q · · · q q = p · q N −1

ili u drugom pokusu s vjerojatnošću

q p q q q · · · q q = p · q N −1

ili u trećem pokusu s vjerojatnošću

q q p q q · · · q q = p · q N −1

itd. sve do mogućnosti da se A dogodi u N-tom pokusu

q q q q q · · · q p = p · q N −1 .

Svih N gornjih članova ima istu vjerojatnost, p · q N −1 , i zato je ukupna vjerojatnost da


se A ostvari dočno jednom jednaka

N 1 N −1
 
N −1 N −1 N −1
P (1) = p · q +p·q + ··· + p · q = p q .
1
60 Poglavlje 2. Osnovni pojmovi vjerojatnosti

Dva ostvarenja dogad̄aja A u nizu od N pokusa se mogu dogoditi na ( N2 ) načina (ili


prvi i drugi puta ili prvi i treći puta ili prvi i četvrti puta, · · · , ili drugi i treći puta, ili
drugi i četvrti puta, itd.)
p p q q q · · · q q = p 2 · q N −2
p q p q q · · · q q = p 2 · q N −2
p q q p q · · · q q = p 2 · q N −2
..
.

q p p q q · · · q q = p 2 · q N −2
q p q p q · · · q q = p 2 · q N −2
q p q q p · · · q q = p 2 · q N −2
..
.

q q p p q · · · q q = p 2 · q N −2
q q p q p · · · q q = p 2 · q N −2
..
.
a svaki ima istu vjerojatnost p 2 q N −2 , tako da je njihov zbroj jednak
N
 
P (2) = p 2 q N −2 .
2
Sada je već lako zaključiti da će, općenito, vjerojatnost P(n) da se u N pokusa A ostvari
n puta biti

N
 
P(n) = p n q N −n . (2.10)
n

Izrazi gornjeg tipa koji daju vrijednost vjerojatnosti za danu vrijednost varijable (u ovom
slučaju varijabla n je diskretna), nazivaju se RASPODJELE VJEROJATNOSTI. Raspodjelama
vjerojatnosti je posvećen odjeljak 4.
Lako je vidjeti da je vjerojatnost definirana izrazom (2.10) normirana. Koristeći binomni
poučak (1.8), odmah se dobiva
N N  
N
∑ P(n) = ∑ n p n q N−n = ( p + q) N = 1.
n =0 n =0

Više detalja o ovoj temi se nalazi u odjeljku 4.1.3. 

 Primjer 2.14 P REKINUTA IGRA


I ovo je problem koji potječe od već spomeutoga Chevalier de Méré-a, spomenutog u
primjeru 2.12 Dva igrača igraju igru na sreću uz dogovor da svaki igrač daje jednake
uloge i da će prvi igrač koji osvoji odred̄eni broj bodova prikupiti cijeli ulog. Pretpos-
tavimo da je igra prekinuta prije nego što je bilo koji igrač pobijedio. Na koji način će
igrači pošteno podijeliti ulog? Jasno je da igrač koji je do prekida osvojio više bodova,
treba dobiti i veći dio ukupnog iznosa. Neka su igrači označeni s A i B. ... dovršiti 
2.2 Računske operacije s vjerojatnostima 61

 Primjer 2.15 Č EBIŠEVLJEV PROBLEM


Potrebno je odrediti vjerojatnost da se nasumice napisan razlomak ne može skratiti.
Dijeljenjem nekog prirodnog broja većeg od prirodnog broja n s brojem n, moguće je
dobiti n različitih ostataka: 0, 1, 2, · · · , n − 1. Broj je djeljiv s n ako je ostatak nula, što
znači da od navedenih n ostataka samo jedan odgovara djeljivosti s n. Prema tome od
n mogućih ostataka, samo je jedan povoljan, pa je zato njegova vjerojatnost jednaka
(povoljno kroz moguće)

1
p= .
n
Promotrimo sada razlomak b/c. Vjerojatnost da je b djeljivo s n je 1/n i vjerojatnost da
je c djeljivo s n je 1/n, pa je vjerojatnost da su i b i c djeljivi s n jednaka

11 1
= 2.
nn n
Vjerojatnost da b i c nisu istovremeno djeljivi s n je, prema gornjemu, jednaka

1
1− .
n2
Sjetimo se našeg zadatka: naći vjerojatnost da se razlomak ne može skratiti - tj. da b i c
nisu istovremeno djeljivi s nijednim prostim brojem većim od jedan: niti s 2 niti s 3 niti
s 5 itd. To je primjer ”i” vjerojatnosti i zato traženu vjerojatnost dobijemo uzastopnom
primjenom gornjeg izraza za sve proste brojeve

1 1 1
   
P= 1− 2 1− 2 1 − 2 ···
2 3 5

Iz ovog izraza je

1 1 1 1
= ···
P 1 − 2 2 1 − 3 2 1 − 512
1 1

Taylorovim razvojem

1
= 1 + x + x2 + x3 + · · · ,
1−x

izraz za 1/P postaje

1 1 1 1 1 1 1 1 1 1
   
= 1 + 2 + 4 + 6 + ··· 1 + 2 + 4 + 6 + ··· 1 + 2 + 4 + 6 + ··· ···
P 2 2 2 3 3 3 5 5 5

Da bismo razumjeli čemuje jednak gornji umnožak, treba se sjetiti OSNOVNOG TEOREMA
ARITMETIKE : SVAKI PRIRODAN BROJ SE MOŽE NAPISATI KAO UMNOŽAK POTENCIJA
PROSTIH BROJEVA . Primjetimo da u gornjim izrazima množimo recipročne vrijednosti
potencija kvadrata svih prostih brojeva, pa će zato rezultat tih množenja biti upravo
jednak zbroju recipročnih vrijednosti kvadrata svih prirodnih brojeva

1 1 1 1 1 π2
= 1 + 2 + 2 + 2 + 2 + · · · = ζ (2) = ,
P 2 3 4 5 6
62 Poglavlje 2. Osnovni pojmovi vjerojatnosti

Tablica 2.3: Uz primjer (2.15).

k 3 4 6 10 20 40 44

p 0.7778 0.6875 0.6389 0.6300 0.6375 0.6119 0.6234

gdje je ζ (s), Riemannova zeta funkcija12 .


Dakle, vjerojatnost da se nasumično odabrani razlomak ne može kratiti je

6
P= = 0.60792 . . .
π2

i veća je od 12 . Ovaj se rezultat može i numerički provjeriti: uzmimo prvih k prirodnih


brojeva; od njih se može napraviti k 2 razlomaka; od tih k 2 razlomaka njih K (k ) se
ne može skratiti; prema tome je vjerojatnost da se razlomak ne može kratiti jednaka
(povoljno kroz moguće)

K (k)
P= .
k2
Npr. za k = 3 postoji devet razlomaka:

1 1 1 2 2 2 3 3 3
,
1 2 3 1 2 3 1 2 3
od čega se njih 7 ne može skratiti, pa je zato P = 7/9 = 0.7̇. Tablica 2.3 daje vrijednosti
P za nekoliko k-ova. Vidimo da se, s porastom k, vrijednost P približava teorijski
predvid̄enoj vrijednosti. 

 Primjer 2.16 R OÐENDAN , OPET


Koliko osoba treba biti u skupini, pa da bi vjerojatnost da bar jedna od njih ima rod̄endan
kada i Vi, bila veća od 0.5?
Iako ovaj zadatak liči na primjer 2.10, ipak se od njega jako razlikuje: u svakoj skupini
sa više od 366 ljudi sigurno je (dakle, vjerojatnost je jednaka jedan) da će bar dvoje ljudi
imati isti rod̄endan. Naprotiv, moguće je zamisliti skupinu od proizvoljno velikog broja
ljudi, a da nijedan od njih nema rod̄endan kada i Vi.
Radi jednostavnosti, neka opet godina ima 365 dana. Vjerojatnost da jedna osoba nema
rod̄endan istog dana kada i Vi (dakle rod̄ena je jednog od preostala 364 dana) je

365 − 1
P (1) = .
365
Vjerojatnost da nijedna od N osoba nema rod̄endan kada i Vi je (to je i vjerojatnost
primjenjena N puta)
N
365 − 1

P( N ) = .
365
12 Vidjeti npr. G LUMAC, Matematičke metode fizike.
2.2 Računske operacije s vjerojatnostima 63

Suprotno od „nijedna” je „bar jedna” i zato je


N
364

Pbar jedna = 1 − .
365

Da bi, prema uvjetu zadatka, bilo Pbar jedna > 0.5, mora biti
N
364

< 0.5
365
ln(0.5)
N> ≈ 252.652 · · · .
ln(364/365)

Dakle, ako je u skupini bar 253 ljudi, vjerojatnost da netko ima rod̄endan kada i Vi je
veća od 0.5. 

 Primjer 2.17 N POKUSA

Izvodi se niz od N pokusa. Vjerojatnost da se neki dogad̄aj dogodi u jednom pokusu je


ista u svim pokusima i jednaka je p. Koliko puta treba izvršiti pokus, pa da možemo s
vjerojatnošću P očekivati da će se uoćeni dogad̄aj, dogoditi bar jednom?
Neka je N broj koliko puta treba izvesti pokus, pa da bude ispunjen uvjet zadatka.
Normiranje

P(0) + P(1) + P(2) + · · · + P( N ) = 1,


Pbar 1 = P(1) + P(2) + · · · + P( N ) = 1 − P(0).

Gore, kod objašnjenja Bernoullijevih pokusa, je pokazano da je vjerojatnost da se dogad̄aj


ne dogodi niti jednom u N pokusa jednaka q N , gdje je q = 1 − p. Prema tome je
vjerojatnost da će se dogoditi bar jednom jednaka

Pbar 1 = 1 − q N .

No, prema uvjetu zadatka, je taj isti Pbar 1 jednak

Pbar 1 = P,

iz čega slijedi

ln(1 − P)
P = 1 − q N = 1 − (1 − p ) N ⇒ N= .
ln(1 − p)

Npr., u igri bacanja kocke se pitamo koliko puta treba baciti kocku, pa da se s vjerojat-
nošću 12 može očekivati da se bar jednom pojavi broj dva. Prema gornjem rezultatu,
broj bacanja je

ln(1 − P) ln 1 − 12

N= =  = · · · = 3.8 .
ln(1 − p) ln 1 − 16

1
Znači da su potrebna najmanje 4 bacanja da bi se s vjerojatnošću 2 bar jednom pojavila
dvojka. 

Primjer 2.18 D VIJE KOCKE


Koliko puta treba baciti dvije kocke, pa da s vjerojatnošću P možemo očekivati da se
64 Poglavlje 2. Osnovni pojmovi vjerojatnosti

bar jednom pojave dvije dvojke?


Vjerojatnost da se na obje kocke okrene dvojka je
11 1
p= = .
6 6 36
Vjerojatnost da na obje kocke neće biti dvojka je
35
q=1− p= .
36
Vjerojatnost da se N puta neće okrenuti dvojka na obje kocke je q N . Vjerojatnost da se
dvije dvojke okrenu bar jednom u N bacanja je

ln(1 − P)
P = 1 − qN ⇒ N=
ln(1 − p)

kao i u primjeru 2.17. Uzme li se za P = 12 , slijedi da je N = 24.6051, tj. potrebno je


najmanje 25 bacanja. O ovome su problemu kroz pisma diskutirali Pascal i Fermat
godine 1654., što se uzima za početak teorije vjerojatnosti. 

 Primjer 2.19 B ACANJE KOVANICE


Idealna kovanica se baca dok se ne pojavi pismo.
(a) Kako izgleda potpuni skup?
(b) Kolika je vjerojatnost pojave pisma u prvih pet bacanja?
(c) Kolika je vjerojatnost da se pismo uopće ne pojavi?
(a)
n o
Ω = P, GP, GGP, GGGP, GGGGP, · · · .

(b) Vjerojatnost da se pismo pojavi u bilo kojem od prvih 5 bacanja je



p1 do 5 = p1 + p2 + p3 + p4 + p5 = p + qp + qqp + qqqp + qqqqp

p=q=1/2
1 1 1 1 1 31
= + + + + = ,
2 22 23 24 25 32
pri čemu je q vjerojatnost pojave glave, a p je vjerojatnost pojave pisma.
(c) Vjerojatnost da se pismo pojavi u bilo kojem od prvih n bacanja je
1 1 1 1 1
p1 do n = + 2 + 3 + 4 + ··· + n.
2 2 2 2 2
Vjerojatnost da se pismo uopće pojavi u bilo kojem bacanju je

1 1 1 1 1 1 1 1 1
 
lim p1 do n ≡ P∞ = + 2 + 3 + 4 + · · · = 1 + + 2 + 3 + 4 + ···
n→∞ 2 2 2 2 2 2 2 2 2
1 1
= = 1.
2 1 − 12

tj. , nakon n → ∞ bacanja, pismo će se sigurno pojaviti i stoga je vjerojatnost da se pismo
uopće ne pojavi jednaka

Pne = 1 − P∞ = 0.


2.2 Računske operacije s vjerojatnostima 65

 Primjer 2.20 I GRA S VRA ĆANJEM


U kutiji su dvije bijele i četiri crne kuglice. Dva igrača izvlače naizmjence po jednu
kuglicu i nakon izvlačenja ju vraćaju u kutiju. Pobjednik je onaj igrač koji prvi izvuče
bijelu kuglicu. Izračunajte vjerojatnosti da
(a) pobjedi prvi igrač,
(b) pobjedi drugi igrač,
(c) igra završi u prva četiri izvlačenja.

Vjerojatnost da se izvuče bijela kuglica je


2
P(b) = ,
6
a vjerojatnost da se izvuče crna kuglica je
4
P(c) = .
6
Budući da se poslije svakog izvlačenja, kuglice vraćaju, to su vjerojatnosti P(b) i P(c)
iste u svakom izvlačenju za oba igrača.
(a) Da bi pobijedio prvi igrač on mora ili prvi izvuči bijelu ili mora izvući crnu i drugi
igrač izvući crnu i onda opet prvi igrač bijelu itd. Stoga je vjerojatnost da prvi igrač
pobjedi jednaka
P (1) = P ( b )1 + P ( c )1 P ( c )2 P ( b )1 + P ( c )1 P ( c )2 P ( c )1 P ( c )2 P ( b )1 + · · ·
"  2  4 #
2 4 4 2 4 4 4 4 2 2 4 4
= + + + ··· = 1+ + + ···
6 6 6 6 6 6 6 6 6 6 6 6
2 1 3
= = .
6 1 − 2 2 5
3
(b) Ili će pobijediti prvi ili drugi igrač. Zato je
2
P (2) = 1 − P (1) = .
5
Drukčije
P (2) = P ( c )1 P ( b )2 + P ( c )1 P ( c )2 P ( c )1 P ( b )2 + · · ·
"  2  4 #
4 2 4 4 4 2 2 4 4 4
= + + ··· = 1+ + + ···
6 6 6 6 6 6 6 6 6 6
2 4 1 2
= 2
= .
6 6 1− 2  5
3
(c) Kako sve može završiti igra nakon četiri izvlačenja, bez obzira koji igrač pobjedi?
pobjeda prvog u 1. ili 3. izvlačenju P ( b )1 + P ( c )1 P ( c )2 P ( b )1 ,
ili pobjeda drugog u 2. ili 4. izvlačenju P ( c )1 P ( b )2 + P ( c )1 P ( c )2 P ( c )1 P ( b )2 .

2 4 4 2 4 2 4 4 4 2
   
P (4) = + + +
6 6 6 6 b 6 6 6 6 6 6 c
"   2   3#
2 4 4 4 65
= 1+ + + = .
6 6 6 6 81

66 Poglavlje 2. Osnovni pojmovi vjerojatnosti

 Primjer 2.21 I GRA BEZ VRA ĆANJA


U kutiji su dvije bijele i četiri crne kuglice. Dva igrača izvlače naizmjence po jednu
kuglicu i nakon izvlačenja ju ne vraćaju u kutiju. Pobjednik je onaj igrač koji prvi izvuče
bijelu kuglicu. Izračunajte vjerojatnosti da
(a) pobjedi prvi igrač,
(b) pobjedi drugi igrač,
(c) igra završi u prva četiri izvlačenja.

Za razliku od prethodnog zadataka, gdje su se kuglice vraćale u kutiju, sada se kuglice


ne vraćaju. To znači da vjerojatnosti izvlačenja bijele i crne kuglice nisu iste u svim
izvlačenjima. To takod̄er i znači da je moguće samo pet izvlačenja. Evo tih pet mogućih
izvlačenja:

2 5
 
P(b) = , =
6 15
 b
4 2 4
 
P(cb) = = ,
6 5 15
 c  b  
4 3 2 3
P(ccb) = = ,
6 5 4 15
 c  c  b  
4 3 2 2 2
P(cccb) = = ,
6 5 4 3 15
 c  c  c  b  
4 3 2 1 2 1
P(ccccb) = = .
6 c 5 c 4 c 3 c 2 b 15

Primjetite da je izvlačenje cccccb nemoguće, jer su u kutiji samo četiri crne kuglice.
Uočimo i normiranje

P(b) + P(cb) + P(ccb) + P(cccb) + P(ccccb) = 1.

(a) Pobjeda prvog igrača se ostvaruje na slijedeći način

3
P(1) = P(b) + P(ccb) + P(ccccb) = .
5
(b) Pobjeda drugog igrača se ostvaruje na slijedeći način

2
P(2) = P(cb) + P(cccb) = .
5
Dakle, bez obzira vraćaju li se kuglice ili ne vraćaju, vjerojatnije je da će pobjediti onaj
igrač koji započinje igru.
(c) Igra završava u prva četiri izvlačenja

14
P četiri izvlačenja = 1 − P(ccccb) = .
15


 Primjer 2.22 P ONAVLJANJE POKUSA


Vjerojatnost ostvarenja nekog dogad̄aja u pojedinom pokusu iznosi 0.2. Koliko puta
treba ponoviti pokus, pa da vjerojatnost da se uočeni dogad̄aj dogodi bar dva puta,
bude 0.9?
2.2 Računske operacije s vjerojatnostima 67

Koristeći normiranje vjerojatnosti


N
∑ P(n) = 1,
n =0

tražena vjerojatnost je

Pbar 2 puta = P(2) + P(3) + · · · + P( N ) = 1 − P(0) − P(1).

1
U skladu s (2.10), iz gornjeg izraza
slijedi

Pbar 2 puta = 0.9 = 1 − 0.8 N − N · 0.2 · 0.8 N −1 .


f(N)

0.5

Gornji problem nije analitički rješiv,


ali se zato rješiv grafički. Tako je na
0
slici lijevo prikazana funkcija

f ( N ) = 0.9 − 1 + 0.8 N + N · 0.2 · 0.8 N −1 .


0 5 10 15 20
N

Funkcija prolazi kroz nulu za

N ≈ 18,

pa je to i rješenje postavljenog zadatka. 

 Primjer 2.23 N EISPRAVNI PROIZVODI


Vjerojatnost da stroj napravi neispravan proizvod je 0.1. Kontrola se izvodi uzorcima
od po dvadeset proizvoda. Ako se u uzorku nad̄u više od četiri neispravna proizvoda,
stroj se zaustavlja. Kolika je vjerojatnost da se, pri opisanoj kontroli, stroj nepotrebno
zaustavi, tj. da tako veliki broj neispravnih proizvoda nije posljedica povećanja postotka
škarta, već nasumični dogad̄aj koji je nastupio kao rezultat prvotnog postotka škarta?

PL = 0.1 ≡ p, PD = 1 − PL = 0.9 ≡ q,
N = 20, NL = 0, 1, 2, 3, 4 → prolaz

20 0 20 20 1 19 20 20 20
        
2 18 3 17
Pprolaz = p q + p q + p q + p q + p 4 q16
0 1 2 3 4
= · · · = 0.956 825 50 · · ·
Pzaust = 1 − Pprolaz = 0.0432 · · · .

Primjer 2.24 D VIJE ŠAHOVSKE KRALJICE


Na praznu šahovsku ploču dimenzija n × n, nasumično su postavljene dvije kraljice.
Potrebno je odrediti vjerojatnost da se one ne napadaju i dobiveni rezultat izvrijedniti
za n = 8.
Podijelimo u mislima cijelu ploču na slojeve počevši od rubnog sloja prema unutra.
Rubni sloj sadrži

n + n + ( n − 2) + ( n − 2) = 4( n − 1)
68 Poglavlje 2. Osnovni pojmovi vjerojatnosti

polja. Drugi sloj od ruba sadrži

( n − 2) + ( n − 2) + ( n − 4) + ( n − 4) = 4( n − 3)

polja. Treći sloj od ruba sadrži

( n − 4) + ( n − 4) + ( n − 6) + ( n − 6) = 4( n − 5)

polja. Četvrti sloj od ruba sadrži

( n − 6) + ( n − 6) + ( n − 8) + ( n − 8) = 4( n − 7)

polja, itd.
Ako se prva kraljica nalazi u jednom od kutova prvog sloja, tada ona napada

vodoravno + okomito + dijagonalno 1 + dijagonalno 2


n + ( n − 1) + ( n − 1) + 0 = 3n − 2

polja, pa je slobodno (nije napadnuto)

n 2 − 3n + 2 = (n − 1)(n − 2)

polja. Ako je prva kraljica na bilo kojem drugom polju prvog sloja, osim u kutovima,
tada ona napada

vodoravno + okomito + dijagonalno 1 + dijagonalno 2


n + ( n − 1) + ( n − 2) + 1 = 3n − 2
n + ( n − 1) + ( n − 3) + 2 = 3n − 2
itd.

polja, pa je uvijek slobodno (nije napadnuto)

n 2 − 3n + 2 = (n − 1)(n − 2)

polja. Prvi (rubni) sloj sadrži 4(n − 1) polja, pa je pridružena vjerojatnost da kraljica
smještena u bilo koje od tih polja ne napada onu drugu kraljicu je

(n − 1)(n − 2) n 2 − 3n − 2
P1 = 4(n − 1) = 4 ( n − 1 ) .
n 2 ( n 2 − 1) n 2 ( n 2 − 1)

Nazivnik razlomka je broj svih mogućih razmještaja dvije kraljice na ploču dimenzija
n × n. Neka se sada s prva kraljica nalazi u jednom od kutova drugog sloja. Tada ona
napada

vodoravno + okomito + dijagonalno 1 + dijagonalno 2


n + ( n − 1) + ( n − 1) + 2 = 3n

polja, pa je slobodno (nije napadnuto)

n 2 − 3n = n(n − 3)
2.2 Računske operacije s vjerojatnostima 69

polja. Ako je prva kraljica na bilo kojem drugom polju drugog sloja, osim u kutovima,
tada ona napada
vodoravno + okomito + dijagonalno 1 + dijagonalno 2
n + ( n − 1) + ( n − 2) + 3 = 3n
n + ( n − 1) + ( n − 3) + 4 = 3n
itd.
polja, pa je uvijek slobodno (nije napadnuto)
n 2 − 3n = n(n − 3)
polja. Drugi sloj sadrži 4(n − 3) polja, pa je pridružena vjerojatnost da kraljica smještena
u bilo koje od tih polja ne napada onu drugu kraljicu je
n ( n − 3) n 2 − 3n
P2 = 4(n − 3) = 4 ( n − 3 ) .
n 2 ( n 2 − 1) n 2 ( n 2 − 1)
Neka se sada s prva kraljica nalazi u jednom od kutova trećeg sloja. Tada ona napada
vodoravno + okomito + dijagonalno 1 + dijagonalno 2
n + ( n − 1) + ( n − 1) + 4 = 3n + 2
polja, pa je slobodno (nije napadnuto)
n 2 − 3n − 2
polja. Ako je prva kraljica na bilo kojem drugom polju trećeg sloja, osim u kutovima,
tada ona napada
vodoravno + okomito + dijagonalno 1 + dijagonalno 2
n + ( n − 1) + ( n − 2) + 5 = 3n + 2
n + ( n − 1) + ( n − 3) + 6 = 3n + 2
itd.
polja, pa je uvijek slobodno (nije napadnuto)
n 2 − 3n − 2
polja. treći sloj sadrži 4(n − 5) polja, pa je pridružena vjerojatnost da kraljica smještena
u bilo koje od tih polja ne napada onu drugu kraljicu je
n 2 − 3n − 2
P3 = 4(n − 5) .
n 2 ( n 2 − 1)
Ove tri vjerojatnosti su dovoljne da se prepozna uzorak
4
P1 = · (n − 1) n 2 − 3n − 2 ,

n 2 (n 2 − 1)
4
P2 = · (n − 3) n 2 − 3n ,

n 2 (n 2 − 1)
4
P3 = · (n − 5) n 2 − 3n − 2 ,

n 2 ( n 2 − 1)
..
.
4
Pl = · [n − (2l − 1)] n 2 − 3n + 2(2 − l ) .
 
n 2 (n 2 − 1)
70 Poglavlje 2. Osnovni pojmovi vjerojatnosti

Za ploču duljine n (za parni n), bit će n/2 slojeva, pa je ukupna vjerojatnost da jedna
kraljica ne napada drugu, jednaka

n/2 n/2
4
P= ∑ Pl =
− 1) ∑
[n − (2l − 1)] n 2 − 3n + 2(2 − l ) .
 
l =1
n 2 (n 2 l =1

U gornjem računu pojavljuju se tablične vrijednosti zbrojeva

n/2
n
∑ l0 =
2
,
l =1
n/2
n ( n + 2)
∑ l1 =
8
,
l =1
n/2
n(n + 1)(n + 2)
∑ l2 =
24
,
l =1

koje, uvrštene u prethodni izraz za P daju konačnu vjerojatnost

(3n − 1)(n − 2)
P= .
3n(n + 1)

Za n = 8, gornji rezultat vodi na P = 0.638̇. 

Zadatak 2.7 Sami si zadajte nekoliko (bar tri) vrijednosti N i p i pomoću (2.10)
nacrtajte raspodjelu P(n). 

2.3 Uvjetna (relativna) vjerojatnost


Postoje slučajevi kada se jednom dogad̄aju, čija se vjerojatnost računa, postavljaju odre-
d̄eni uvjeti, tj. ostvarenje jednog dogad̄aja OVISI O OSTVARENJIMA NEKIH DRUGIH
DOGAÐAJA . Vjerojatnost takvog dogad̄aja ćemo zvati uvjetna ili relativna vjerojatnost.
U tom smislu su vjerojatnosti koje smo do sada promatrali bile APSOLUTNE, jer nisu
ovisile o drugim dogad̄ajima. U daljem izlaganju, koristit ćemo se jednim primjerom:

Primjer 2.25 U kutiji se nalaze kuglice s dva obilježja: bojom (bijela, crna ili plava) i
brojem (jedan ili dva). Broj bijelih kuglica ćemo označiti s Nb , a broj bijelih kuglica s
brojem j = 1, 2 ćemo označiti s Nb,j i slično i za crne i plave kuglice:

Nb = Nb,1 + Nb,2 , N1 = Nb,1 + Nc,1 + Np,1 ,


Nc = Nc,1 + Nc,2 , N2 = Nb,2 + Nc,2 + Np,2 .
Np = Np,1 + Np,2 .

Ukupan broj kuglica, N, se može napisati na nekoliko načina

N = Nb + Nc + Np ,
N = N1 + N2 ,
N = Nb,1 + Nb,2 + Nc,1 + Nc,2 + Np,1 + Np,2 .


2.3 Uvjetna (relativna) vjerojatnost 71

A PSOLUTNE VJEROJATNOSTI :
Prvi tip pitanja koje se postavlja, jeste:

KOLIKA JE VJEROJATNOST DA SE IZ KUTIJE IZVU ČE


KUGLICA S BROJEM JEDAN , NEOVISNO O NJEZINOJ BOJI ?

Kuglica s brojem jedan ima

N1 = Nb,1 + Nc,1 + Np,1 ,

a ukupan broj kuglica u kutiji je

N = Nb,1 + Nb,2 + Nc,1 + Nc,2 + Np,1 + Np,2 ,

pa je zato tražena vjerojatnost, prema (2.1), jednaka

N1 Nb,1 + Nc,1 + Np,1


P (1) = = .
N Nb,1 + Nb,2 + Nc,1 + Nc,2 + Np,1 + Np,2

Sličnim zaključivanjem računamo i vjerojatnost da se izvuče bijela kuglica

Nb Nb,1 + Nb,2
P(b) = = ,
N Nb,1 + Nb,2 + Nc,1 + Nc,2 + Np,1 + Np,2

ili da se izvuče bijela kuglica s brojem jedan

Nb,1 Nb,1
P(b1) = = ,
N Nb,1 + Nb,2 + Nc,1 + Nc,2 + Np,1 + Np,2

ili crna kuglica s brojem dva

Nc,2 Nc,2
P(c2) = = .
N Nb,1 + Nb,2 + Nc,1 + Nc,2 + Np,1 + Np,2

To su primjeri apsolutnih vjerojatnosti, jer na proces (izvlačenje) nisu postavljeni nikakvi


uvjeti.

R ELATIVNE VJEROJATNOSTI :
Drugi tip pitanja koje se postavlja, jeste npr.:

KOLIKA JE VJEROJATNOST DA JE IZVU ČENA KUGLICA S BROJEM


JEDAN , AKO ZNAMO DA JE IZVU ČENA BIJELA KUGLICA ?

Ovo je primjer uvjetne ili relativne vjerojatnosti. Polazimo od toga da već JESTE izvučena
bijela kuglica i pitamo se je li ona označena s jedinicom. Bijelih kuglica ima

Nb = Nb,1 + Nb,2 ,

pa je zato ova uvjetna vjerojatnost jednaka

Nb,1 Nb,1
P(1/b) = = .
Nb Nb,1 + Nb,2

Slično pitanje je ovo: izvučena je kuglica označena jedinicom; kolika je vjerojatnost da


je ona bijele boje? I ovo je primjer uvjetne vjerojatnosti: uvjet je da je izvučena kuglica
72 Poglavlje 2. Osnovni pojmovi vjerojatnosti

označena jedinicom (bez obzira na boju i sve ostale karakteristike, ako ih ima). Takvih
kuglica ima

N1 = Nb,1 + Nc,1 + Np,1 ,

a bijelih kuglica označenih jedinicom ima Nb,1 . Prema tome je tražena vjerojatnost
jednaka
Nb,1 Nb,1
P(b/1) = = .
N1 Nb,1 + Nc,1 + Np,1

Povežimo sada apsolutne i uvjetne (relativne) vjerojatnosti u ovom primjeru. Iz gore


navedenih izraza, lako je vidjeti da je
P(b1) P(b1)
P(1/b) = , P(b/1) =
P(b) P (1)
P(b1) = P(1/b) P(b), P(b1) = P(b/1) P(1).

Na ovom primjeru vidimo kako se RELATIVNA ( UVJETNA ) VJEROJATNOST MOŽE RA ČU -


NATI IZ APSOLUTNIH VJEROJATNOSTI: vjerojatnost da se izvuče kuglica s brojem jedan,
ako je izvučena bijela kuglica, jednaka je omjeru apsolutne vjerojatnosti da se izvuče
bijela kuglica s brojem jedan i apsolutne vjerojatnosti da se uopće izvuče bijela kuglica.
Općenitije se može reći ovako: ako u nekom nasumičnom procesu pratimo dva doga-
d̄aja (ili, kako se to još ponekad kaže, dva obilježja): A (pojavu boje) i B (pojavu broja),
tada je vjerojatnost da se dogodio B, ako znamo da se dogodio A, jednaka

P( AB)
P( B/A) = . (2.11)
P( A)

To je lako razumjeti pomoću pravila o množenju vjerojatnosti (2.9): ako je P( A) vjerojat-


nost dogad̄aja A, a P( B/A) vjerojatnost da se dogodio B ako znamo da se dogodio A,
tada je vjerojatnost da su se ostvarila oba dogad̄aja (i vjerojatnost) naprosto jednaka

P( AB) = P( B/A) · P( A). (2.12)

Slično, ako je P( B) vjerojatnost da se dogodi B, a P( A/B) vjerojatnost da se dogodi A


ako znamo da se dogodio B, tada je vjerojatnost da se ostvare oba dogad̄aja jednaka

P( AB) = P( A/B) · P( B). (2.13)

Gornje dvije relacije su primjeri onoga što će se u slijedećem odjeljku nazvati multipli-
kacijski teorem.

Zadatak 2.8 Promatra se skup od 20 000 osoba. Muškaraca je 10 000 i žena je 10 000.
U skupu je slijepo na boje 500 muškaraca i 25 žena. Promataju se dva
dogad̄aja: dogad̄aj A je biti slijep na boje, a dogad̄aj B je biti muškarac.
(a) Izračunaje apsolutnu vjerojatnost dogad̄aja A.
(b) Izračunajte apsolutnu vjerojatnost da je muškarac slijep na boje.
(c) Izračunajte relativnu vjerojatnost da je osoba muškarac, ako je slijepa
na boje.
2.3 Uvjetna (relativna) vjerojatnost 73

(d) Pomoću (a), (b) i (c), provjerite multiplikacijski teorem. 

Rješenje:
(a) Apsolutna vjerojatnost dogad̄aja A je omjer osoba slijepih na boje i ukupnog broja osoba
500 + 25 525
P( A) = = .
20 000 20 000
(b) Apsolutna vjerojatnost da je osoba muškarac slijep na boje je jednaka omjeru muškaraca
slijepih na boje i ukupnog broja osoba
500
P( AB) = .
20 000
(c) Relativna vjerojatnost da je netko muškarac, ako je slijep na boje je
500
P( B/A) = .
525
(d) Iz ovog primjera vidimo da vrijedi (2.12)
500 525 500
P( AB) = P( B/A) · P( A) = · = .
525 20 000 20 000

Zadatak 2.9 U kutiji su 4 crne i 6 bijelih kuglica. Izvlače se jedna po jedna, dvije
kugice. Kolika je vjerojatnost da će druga kuglica biti bijela, ako je
(a) prva kuglica bila bijela,
(b) prva kuglica bila crna?
(A) Izračunajte (a) i (b) ako se prva kuglica ne vraća u kutiju i (B) ako se
prva kuglica vraća u kutiju. 

Rješenje:
(A a) Vjerojatnost da je prva bijela je
6
P(1B) = .
10
Vjerojatnost da je i druga bijela je
5
P(2B/1B) = .
9
(A b) Vjerojatnost da je prva crna je
4
P(1C ) = .
10
Vjerojatnost da je druga bijela je
6
P(2B/1B) = .
9
(B a) = (B b) Ako se prva kuglica vraća, obje su vjerojatnosti jednake
6
P(2B/1Cili1B) = .
10
74 Poglavlje 2. Osnovni pojmovi vjerojatnosti

2.4 Adicijski i multiplikacijski teorem


Poopćimo razmatranja iz prethodnog odjeljka koristeći se terminima vjerojatnosti a
posteriori. Izvodi se N pokusa i promatra se (ne)ostvarenje dva dogad̄aja, A i B, unutar
tih pokusa. Dogad̄aju A i B nisu13 med̄usobno isključivi. Postoje četiri moguća ishoda
svakog od N pokusa:

( N1 : A, B) u N1 pokusa se A dogodio, a B nije ,

( N2 : A, B) u N2 pokusa se A nije dogodio, a B jeste,

( N3 : A, B) u N3 pokusa su se dogodili i A i B,

( N4 : A, B) u N4 pokusa se nisu dogodili ni A ni B.

Naravno da pri tome vrijedi

N1 + N2 + N3 + N4 = N.

Relativna frekvencija da se dogodi A i relativna frekvencija da se dogodi B su, redom,


N1 + N3 N2 + N3
f rel ( A) = , f rel ( B) = .
N N
Relativna frekvencija da se dogodi ili A ili B ili oba (sada A i B nisu isključivi dogad̄aji),
je
N1 + N2 + N3
f rel ( A + B) = .
N
Relativna frekvencija da se dogode i A i B je
N3
f rel ( AB) = .
N
Relativna frekvencija da se dogodi B, ako znamo da se dogodio A je
N3
f rel ( B/A) = .
N1 + N3
Relativna frekvencija da se dogodi A, ako znamo da se dogodio B je
N3
f rel ( A/B) = .
N2 + N3

Sada želimo f rel ( A + B) povezati s f rel ( A) i f rel ( B). Ranije, (2.5), kada su A i B bili
isključivi dogad̄aji, bilo je, (2.5),

f rel ( A + B) = f rel ( A) + f rel ( B).

Pogledajmo što se dobiva sada kada A i B nisu isključivi dogad̄aji. Iz gornjih izraza
izravno slijedi
N1 + N2 + N3 N1 + N3 N2 + N3 N3
f rel ( A + B) = = + − = f rel ( A) + f rel ( B) − f rel ( AB).
N N N N
13 To su npr. boja i broj na kuglicama iz primjera u prethodnom odjeljku.
2.4 Adicijski i multiplikacijski teorem 75

Osim toga, želimo i f rel ( AB) povezati s uvjetnim vjerojatnostima f rel ( B/A) i f rel ( A/B)

N3 N3 N + N3
f rel ( AB) = = · 1 = f rel ( B/A) · f rel ( A),
N N1 + N3 N
N3 N3 N2 + N3
= = · = f rel ( A/B) · f rel ( B).
N N2 + N3 N

S obzirom da, s porastom N → ∞, relativne frekvencije teže vjerojatnostima, gornje


relacije prelaze u

P( A + B) = P( A) + P( B) − P( AB),
(2.14)
P( AB) = P( B/A) · P( A) = P( A/B) · P( B).

Prva od gornjih jednadžba se zove ADICIJSKI TEOREM, a druga MULTIPLIKACIJSKI


TEOREM. Adicijski teorem se može iskazati na slijedeći način: vjerojatnost da se dogodi
bar jedan od dva dogad̄aja (tj. ili jedan ili oba) P( A + B), jednaka je zbroju vjerojatnosti
svakog pojedinog dogad̄aja, umanjenom za vjerojatnost da se dogode oba. Ovo je lako
razumjeti pomoću
slike 2.4: vjerojatnost P( A + B) je srazmjerna svim točkama (dogad̄ajima) sadržanim u

Slika 2.4: Uz definiciju zbrajnja vjerojatnosti, kada A i B nisu isključivi dogad̄aji, relacija
(2.14).

ωi

α( A) α∩β β( B)

područjima α i β; no ako bih zbrojio točke u ta dva područja, onda bih točke iz presjeka
α ∩ β brojao dva puta, pa da bih eliminirao to dvostruko zbrajanje, moram jednom
oduzeti točke iz presjeka, a to je upravo oduzimanje vjerojatnosti P( AB) u izrazu (2.14).
Ovaj je teorem poopćenje pravila o zbrajanju vjerojatnosti (2.5), gdje smo pretpostavili
da je istodobno ostvarenje oba dogad̄aja isključeno. Zaista, ako je nemoguće da se A i B
dogode istovremeno, tada je P( AB) = 0 i P( A + B) je jednako (2.5).
Ovaj se teorem može proširiti i na više od dva dogad̄aja. Npr. ako se promatraju tri
dogad̄aja A, B i C i pitamo se kolika je vjerojatnost da se dogodi bar jedan od njih (tj.
ili da se dogodi jedan ili bilo koja dva ili da se dogode sva tri). Na slici 2.5 to znači da
moramo zbrojiti sve dogad̄aje sadržane u području A, B i C (označeno zelenim), pazeći
pri tome da nijedan dogad̄aj ne računamo dva ili više puta. Koristeći relaciju (2.14),
76 Poglavlje 2. Osnovni pojmovi vjerojatnosti

Slika 2.5: Uz definiciju adicijskog teorema, relacija (2.15).

A B

dolazi se do
P( A + B + C ) = P(( A + B) + C ) = (2.14) = P( A + B) + P(C ) − P(( A + B)C )
= P( A + B) + P(C ) − P( AC + BC )
= (2.14) = P( A) + P( B) − P( AB) + P(C ) − P( AC ) − P( BC ) + P( ABC )
= P( A) + P( B) + P(C ) − P( AB) − P( AC ) − P( BC ) + P( ABC ). (2.15)
I dalje, ako se analiziraju četiri dogad̄aja, A, B, C i D, a koristeći (2.14) i (2.15), dolazi do
P( A + B + C + D ) = P(( A + B + C ) + D ) = (2.14) = P( A + B + C ) + P( D ) − P(( A + B + C ) D )
= (2.15) = P( A) + P( B) + P(C ) − P( AB) − P( AC ) − P( BC ) + P( ABC )
+ P( D ) − P( AD + BD + CD )
= (2.15) = P( A) + P( B) + P(C ) + P( D )
− P( AB) − P( AC ) − P( AD ) − P( BC ) − P( BD ) − P(CD )
+ P( ABC ) + P( ABD ) + P( ACD ) + P( BCD )
− P( ABCD ).
Ako za neki opći i proizvoljni broj dogad̄aja s:
S1 označimo zbroj apsolutnih vjerojatnosti svih pojedinih dogad̄aja: P( A) + P( B) + · · · ;
S2 označimo zbroj apsolutnih vjerojatnosti svih parova dogad̄aja: P( AB) + P( AC ) + · · · ;
S3 označimo zbroj apsolutnih vjerojatnosti svih trostrukih dogad̄aja: P( ABC ) + P( ABD ) +
···;
itd. tada se adicijski teorem može napisati kao

P ( A + B + · · · ) = S1 − S2 + S3 − · · · . (2.16)

Gornji je izraz u literaturi poznat i kao P OINCARÉOVA formula.

Drugi izraz iz (2.14) se naziva MULTIPLIKACIJSKI TEOREM i riječima se može iskazati


kao: Vjerojatnost ostvarenja dva dogad̄aja jednaka je umnošku apsolutne vjerojatnosti
da se dogodi prvi i relativne vjerojatnosti drugog

P( AB) = P( A/B) P( B), (2.17)


2.4 Adicijski i multiplikacijski teorem 77

pri čemu je pretpostavljeno da su dogad̄aji A i B med̄usobno ZAVISNI.

Ukoliko su dogad̄aji med̄usobno NEZAVISNI, tada je relativna vjerojatnost P( A/B)


jednaka apsolutnoj P( A)

P( A/B) = P( A),

i gornja relacija postaje

P( AB) = P( A) P( B),

što je upravo izraz (2.9) za vjerojatnost nezavisnih dogad̄aja.

Gornje pravilo za vjerojatnost ostvarenja dva dogad̄aja, lako je poopćiti i na više doga-
d̄aja (primjetimo ULAN ČANOST dogad̄aja):

P( ABC ) = (2.17) = P( A/BC ) P( BC ) = (2.17) = P( A/BC ) P( B/C ) P(C ), (2.18)

itd.

P( ABC ) = P( A/BC ) P( B/C ) P(C ),


P( ABCD ) = P( A/BCD ) P( B/CD ) P(C/D ) P( D ),
..
.

Primjer 2.26 I ZVLA ČENJE KUGLICA S BROJEVIMA


Kutija sadrži N kuglica označenih brojevima od 1 do N. Kuglice izvlačimo iz kutije i
ne vraćamo ih. Ako izvučemo svih N kuglica, kolika je vjerojatnost da nijedna kuglica
neće biti izvučena u onom izvlačenju po redu koje je jednako broju na kuglici (kuglica s
brojem 1 neće biti izvučena u prvom izvlačenju, kuglica s brojem 2 neće biti izvučena u
drugom izvlačenju itd.)?

Ako izračunamo vjerojatnost P da bar jedna kuglica bude izvučena u izvlačenju koje je
jednako broju na kuglici, tada je odgovor na postavljeno pitanje jednak 1 − P. Označimo
s P( A) vjerojatnost da kuglica s brojem jedan bude izvučena u prvom izvlačenju; s
P( B) vjerojatnost da kuglica s brojem 2 bude izvučena u drugom izvlačenju itd. Prema
adicijskom teoremu, tj. Poincaréovoj formuli (2.16), vjerojatnost P je jednaka

P ≡ P ( A + B + · · · ) = S1 − S2 + S3 − · · ·

Vjerojatnost S1 označava

S1 = P ( A ) + P ( B ) + P ( C ) + · · ·

S P( A) je označena vjerojatnost da prva izvučena kuglica nosi broj jedan. Ona je jednaka
omjeru broja povoljnih i svih mogućih izvlačenja. Postoji sve skupa N! načina da se
izvuče N kuglica. Ako je prva kuglica imala broj jedan, preostalih N − 1 kuglica se
može izvući na ( N − 1)! načina. Prema tome je
( N − 1) ! 1
P( A) = = .
N! N
Ista je i vjerojatnost da druga po redu bude izvučena kuglica s brojem 2 itd.
1 1 1 1
S1 = + + . . . + = N = 1.
N N N N
78 Poglavlje 2. Osnovni pojmovi vjerojatnosti

Slično se računa i S2 : neka je P( AB) vjerojatnost da se prvim izvlačenjem izvuče kuglica


s brojem 1, a drugim izvlačenjem kuglica s brojem 2. Istim razmišljanjem kao ranije,
dobiva se
( N − 2) !
P( AB) = .
N!
Ista je tolika i vjerojatnost da prvo bude izvučena kuglica 1, a treća kuglica 3, itd. ili da
drugim izvlačenjem bude izvučena kuglica 2, a trećim kuglica 3 itd. Koliko ima ovih
kombinacija? Kuglica 1 se može kombinirati s ( N − 1) preostalih kuglica, kuglica 2 se
može kombinirati s ( N − 2) preostalih kuglica itd. Sve skupa postoji

N−1 N
 
( N − 1) + ( N − 2) + . . . + 2 + 1 = N = ,
2 2
što daje za S2

N ( N − 2) ! N! ( N − 2) ! 1
 
S2 = = = .
2 N! ( N − 2)!2! N! 2!
Na sličan se način dolazi i do
1 1 1
S3 = , S4 = , ··· SN = .
3! 4! N!
Stoga je i tražena vjerojatnost P jednaka
1 1 1 1 1
P=1− + − + · · · + (−1)n−1 + · · · + (−1) N −1 .
2! 3! 4! n! N!
To je vjerojatnost da bar jedna kuglica bude izvučena pod svojim rednim brojem. Ono
što mi želimo izračunati je
1 1 1 1
Q=1−P= − + + · · · + (−1) N .
2! 3! 4! N!
U granici kada N → ∞, gornji zbroj je jednak 1/e
1 1
Q= = 0.36787944 . . . ⇒ P=1− = 0.63212055 . . .
e e
Ovaj je problem postavljen i riješen godine 1708. u vezi igre s 13 karata, gdje dobiva
igrač koji izvuče kartu označenu s brojem koji odgovara broju izvlačenja. Time su se
bavili Nikola Bernoulli (1687 - 1759) i Leonhard Euler (1707 - 1783) koji je i našao vezu s
brojem e. 

Zadatak 2.10 Iz dva snopa igraćih karata od po 52 karte svaki, izvlači se po jedna
karta. Kolika je vjerojatnost da će bar jedna karta biti pikova dama? 

Rješenje:
Zadatkom su definirana dva dogad̄aja: A - izvući pikovu damu iz prvog snopa i B - izvući pikovu
damu iz drugog snopa. Ova su dva dogad̄aja med̄usobno neovisna (jedan ne isključuje drugi).
Vjerojatnost da se iz prvog snopa karata izvuče pikova dama je
1
P( A) = .
52
2.4 Adicijski i multiplikacijski teorem 79

Ista je i vjerojatnost da se pikova dama izvuče iz drugog snopa


1
P( B) = .
52
Vjerojatnost da se pikova dama izvuče i iz prvog i iz drugog snopa je
1 1
P( AB) = .
52 52
Prema adicijskom teoremu (2.14), vjerojatnost da bar jedna karta (tj. ili jedna ili obje) bude
pikova dama je
1 1 1 1 103
P( A + B) = P( A) + P( B) − P( AB) = + − = .
52 52 52 52 2704
Do istog se rezultata dolazi i drukčijim razmišljanjem: kolika je vjerojatnost da se niti iz prvog
niti iz drugog snopa ne izvuče pikova dama
2
51 51 51

Q= = .
52 52 52
Prema tome, vjerojatnost da se izvuče bar jedna pikova dama je
2
51 52 2 − 51 2 2704 − 2601 103

P=1−Q=1− = 2
= = .
52 52 2704 2704

Zadatak 2.11 Kocka I ima 4 crne i 2 bijele plohe, a kocka I I ima 2 crne i 4 bijele plohe.
Baca se kovanica. Ako se okrene pismo, tada se N puta baca kocka I,
a ako padne glava tada se N puta baca kocka I I. Kocka je N puta za
redom pokazala crnu plohu. Kolika je vjerojatnost da je to kocka I? 

Rješenje:
Označimo pojavu crne plohe sa C. Apsolutna vjerojatnost da padne pismo i da se N puta okrene
crna ploha kocke I je
 N
1 4
P( IC ) = .
2 6
Isto tako, apsolutna vjerojatnost da se to dogodi kocki I I je
 N
1 2
P( I IC ) = .
2 6
Vjerojatnost da se N puta okrene crna ploha (neovisno o kocki je)

P(C ) = P( IC ) + P( I IC ).

Prema tome, ako znamo da se crna ploha okrenula N puta, vjerojatnost da se to dogodilo kockom
I je jednaka

P( IC ) 1
P( I/C ) =
P(C )
= ··· = N .
1 + 12
80 Poglavlje 2. Osnovni pojmovi vjerojatnosti

Zadatak 2.12 Trgovina voćem se opskrbljuje lubenicamama od tri dobavljača. Od


prvog nabavlja 42 %, od drugog 18 %, a od trećeg 40 %. Kod prvog
dobavljača je 18 % lubenica prve klase, kod drugog 23 %, a kod trećeg
27 %. Kolika je vjerojatnost da nasumice odabrana lubenica bude prve
klase? 

Rješenje:
dovršiti
Zadatak 2.13 U kutiji su tri kuglice. Kuglice su ili bijele ili crne boje, ali ne znamo
koliko je kuglica bijelo, a koliko crno. Iz kuglice se nasumice izvuče
jedna kuglica i pokaže se da je ona bijela. Izračunajte vjerojatnost da
kutija sadrži 0, 1, 2 ili 3 bijele kuglice. 

Rješenje:
dovršiti
Zadatak 2.14 U prvoj kutiji se nalaze dvije bijele i četiri crne kuglice, a u drugoj kutiji
su tri bijele i dvije crne kuglice. Iz prve kutije se nasumično biraju
dvije kuglice i prebace u drugu kutiju. Zatim se iz druge kutije izvuče
jedna kuglica. Kolika je vjerojatnost da je ta kuglica bijela? 

Rješenje:
Postoje tri mogućnosti:
1. Prebačene su dvije bijele kuglice i sada su u drugoj kutiji pet bijelih i dvije crne kuglice.
2. Prebačene su jedna bijela i jedna crna kuglica i sada su u drugoj kutiji četiri bijele i tri crne
kuglice.
3. Prebačene su dvije crne kuglice i sada su u drugoj kutiji tri bijele i četiri crne kuglice.
Vjerojatnosti za ove tri mogućnosti su, redom

(22) (21) (41) (42)


P (1) = , P (2) = , P (3) = ,
(62) (62) (62)
... dovršiti
Zadatak 2.15 Neki je čovjek napisao N pisama namjenjenih različitim primateljima,
i zalijepio ih u kuverte. Zatim je nasumice ispisao N adresa primatelja
po tim kuvertama. Kolika je vjerojatnost da je bar jedno pismo otišlo
na pravu adresu? 

Rješenje:
dovršiti ...

2.5 Bayesov teorem


Polazište u izvodu Bayesova14 teorema su izrazi za relativnu (uvjetnu) vjerojatnost (2.12)
i (2.13)
P( AB) = P( B/A) · P( A), P( AB) = P( A/B) · P( B). (2.19)
Eliminacijom P( AB), iz gornjih izraza dobiva se veza med̄u relativnim vjerojatnostima

14 Thomas Bayes (čita se Bejz), 1701. – 7. IV 1761., engleski matematičar, filozof i prezbiterijanski svećenik.

Njegov rad, danas poznat kao Bayesov teroem, objavljen je posmrtno, 1764. godine.
2.5 Bayesov teorem 81

Slika 2.6: Thomas Bayes

P( B)
P( B/A) = P( A/B). (2.20)
P( A)

Gornji izraz kaže kolika je vjerojatnost da se dogodi B, ako znamo da se dogodio A.


Osnovno je da tu vjerojatnost računamo pomoću P( A/B), dakle pomoću vjerojatnosti
da se dogodi A, ako znamo da se dogodio B. Razmišljamo o dogad̄ajima B kao o
hipotetičkom (modućem) uzroku i dogad̄aju A kao posljedici. Prilagodimo notaciju
ovim novim nazivima

B → Hn je jedan od mogućih uzroka, jedna hipoteza


A → X posljedica.

Kako ćemo sada interpretirati izraz P( Hn /X )? T O JE VJEROJATNOST DA POSLJEDICA


X IMA Hn ZA UZROK. Ovaj je izraz poznat kao B AYESOV TEOREM. Njegovo izravno
poopćenje nalazi primjenu u prirodnim znanostima (ali isto tako i u društvenim i ostalim
znanostima), jer omogućava ispitivanje nepoznatih veza: imamo neku pojavu za koju
nismo sigurni koji od mogućih N uzroka ju izaziva. U tom slučaju, Bayesov teorem nam
omogućava da izračunamo vjerojatnost da je pojedini dogad̄aj uzrok opaženoj pojavi.
Pretpostavimo da postoji N dogad̄aja Hn (hipoteza) koji se uvijek po dva med̄usobno
isključuju: nikada NE MOGU ISTODOBNO nastupiti bilo koja dva od njih

H1 , H2 , · · · , HN .

Zamislimo sada jedan dogad̄aj označen s X koji nastupa nakon bilo kojeg od gornjih
dogad̄aja Hn . Tada (2.20) čitamo kao

P( Hn )
P( Hn /X ) = P( X/Hn ).
P( X )

Označimo s P( XHn ) vjerojatnost da su se dogodili Hn i X (naravno, ne istovremeno).


Tada je, prema adicijskom teoremu, (2.5), vjerojatnost da se dogodi X jednaka zbroju
vjerojatnosti da se dogodi bilo koji od dogad̄aja XHn (sjetimo se da su Hn med̄usobno
isključivi dogad̄aji)

P( X ) = P( XH1 ) + P( XH2 ) + · · · + P( XHN )

Primjenom Bayesova teorema (2.20), dobiva se

P( Hn ) P( Hn )
P( Hn /X ) = P( X/Hn ) = P( X/Hn ).
P( X ) P( XH1 ) + P( XH2 ) + · · · P( XHN )

No, ako relaciju (2.13), koja sada glasi

P( XHn ) = P( X/Hn ) · P( Hn )
82 Poglavlje 2. Osnovni pojmovi vjerojatnosti

uvrstimo u gornji izraz, dolazimo do Bayesova teorema u najopćenitijem obliku

P( Hn )
P( Hn /X ) = P( X/Hn ).
P( X/H1 ) P( H1 ) + P( X/H2 ) P( H2 ) + · · · + P( X/HN ) P( HN )

(2.21)
Za dogad̄aj X znamo da je posljedica jednog od dogad̄aja H1 , H2 , · · · , HN (od kojih se
ne mogu dva dogoditi istodobno). Dogad̄aje Hn zovemo hipotetičkim uzrocima od X.
Gornji izraz kaže kolika je vjerojatnost dogad̄aja Hn , nakon što mi već znamo da se
dogodio X.

Primjer 2.27 T RI KUTIJE


U tri kutije označene s I, I I i I I I su smještene kuglice na slijedeći način:
( I ), 1 bijela, 2 plave, 3 crvene;
( I I ), 2 bijele, 1 plava, 1 crvena;
( I I I ), 4 bijele, 5 plavih, 3 crvene.
nasumično je odabrana jedna kutija i iz nje su izvučene dvije kuglice: jedna je bijela, a
druga crvena. Kolika je vjerojatnost da su one izvučene iz kutije I, iz kutije I I i iz kutije
I I I?

Postavljajući zadatak u terminima Bayesovog teorema (2.21), kažemo da su mogući


uzroci dogad̄aji H1 , H2 i H3 izvlačenja iz kutija I, I I i I I I. Posljedica je dogad̄aj X, iz-
vlačenje jedne bijele i jedne crvene kuglice. Iz (2.21) trebamo izračunati P( Hn /X ) za
n = 1, 2, 3
P( H1 )
P( H1 /X ) = P( X/H1 ),
P( X/H1 ) P( H1 ) + P( X/H2 ) P( H2 ) + P( X/H3 ) P( H3 )
P( H2 )
P( H2 /X ) = P( X/H2 ),
P( X/H1 ) P( H1 ) + P( X/H2 ) P( H2 ) + P( X/H3 ) P( H3 )
P( H3 )
P( H3 /X ) = P( X/H3 ).
P( X/H1 ) P( H1 ) + P( X/H2 ) P( H2 ) + P( X/H3 ) P( H3 )
Smisao Bayesovog teorema je u tome da je sve vjerojatnosti na desnim stranama gornjih
izraza posve jednostavno izračunati.
Vjerojatnost odabira bilo koje od tri kutije je ista i zato iznosi
1
P( H1 ) = P( H2 ) = P( H3 ) = .
3
S P( X/H1 ) je označena vjerojatnost izvlačenja jedne bijele i jedne crvene kuglice iz
kutije I. Računamo povoljna i sva moguća izvlačenja. Povoljno - bijela je samo jedna,
crvene su tri, što sve skupa daje 1 · 3 = 3 mogućnosti da se izvuče jednabijela
 i jedna
6
crvena kuglica. Moguće - izmed̄u 6 kuglica, 2 kuglice se mogu izvući na različitih
2
načina
1 3
  

1 1 1
P( X/H1 ) =   = .
6 5
2
2.5 Bayesov teorem 83

Sličnim razmišljanjem za kutije II i III, dolazi se do

2 1 4 3
     

1 1 1 1 1 2
P( X/H2 ) =   = , P( X/H3 ) =   = .
4 3 12 11
2 2
Pomoću gornjih vjerojatnost i Bayesova teorema (2.21), slijedi

P( H1 )
P( H1 /X ) = P( X/H1 )
P( X/H1 ) P( H1 ) + P( X/H2 ) P( H2 ) + P( X/H3 ) P( H3 )
1
3 1 33
= 11 11 2 1
= ,
53 + 33 + 11 3
5 118
P( H2 )
P( H2 /X ) = P( X/H2 )
P( X/H1 ) P( H1 ) + P( X/H2 ) P( H2 ) + P( X/H3 ) P( H3 )
1
3 1 55
= 11 11 2 1
= ,
53 + 33 + 11 3
3 118
P( H3 )
P( H3 /X ) = P( X/H3 )
P( X/H1 ) P( H1 ) + P( X/H2 ) P( H2 ) + P( X/H3 ) P( H3 )
1
3 2 30
= 11 11 2 1
= .
53 + 33 + 11 3
11 118

Vjerojatnost da su jedna bijela i jedna crvena kuglica izvučene iz kutije I je 33/118, da


su izvučene iz kutije I I je 55/118, a da su izvučene iz kutije I I I je 30/118. Budući da
kuglice moraju biti izvučene iz jedne od kutija, to zbroj gornjih vjerojatnosti mora biti
jednak jedinici
33 55 30
P( H1 /X ) + P( H2 /X ) + P( H3 /X ) = + + = 1.
118 118 118
Time smo se uvjerili da je vjerojatnost normirana. 

VJEROJATNOST BUDU ĆIH DOGAÐAJA


dovršiti

GRANICE POVJERENJA
Izvodi se niz pokusa. U svakom pojedinom pokusu je ista vjerojatnost p da se ostvari
uočeni dogad̄a A. Vjerojatnost p je nepoznata, ali je poznato da ima jednu od R ∈ N
mogućih vrijednosti (hipoteza)

r 1 2 R
 
, r ∈ {1, 2, · · · , R} ⇒ p∈ , ,··· , .
R R R R
Neka je Hr dogad̄aj koji se sastoji u tome da p ima vrijednost p = r/R Pretpostavlja
se da su vjerojatnosti ostvarenja svih R dogad̄aja Hr med̄usobno jednake i zato (zbog
normiranja) iznose
1
P( Hr ) = , r ∈ {1, 2, · · · , R}.
R
U N ponovljenih pokusa, dogad̄aj A se ostvario n puta, tako da je njegova relativna
frekvencija ostvarenja jednaka n/N. Potrebno je odrediti vjerojatnost da se vrijednost
84 Poglavlje 2. Osnovni pojmovi vjerojatnosti

vjerojatnosti p nalazi u intervalu


 
α β
, , α, β ∈ R , 0 ≤ α ≤ β ≤ R.
R R

U simboličkom zapisu, zadatak je odrediti vjerojatnost


    
α β α β
P p∈ , =P ≤p≤ . (2.22)
R R R R

Uvjetna vjerojatnost da se u N pokusa A ostvario n puta uz uvjet da se ostvario i Hr ,


tj. uz uvjet da p ima vrijednost r/R, je dana binomnom raspodjelom (Bernoullijevi
dogad̄aji, (2.10))

N N r n r  N −n
     
n N −n
P( A/Hr ) = p (1 − p ) = 1− .
n n R R

Kada je poznata P( A/Hr ), onda se vjerojatnost P( Hr /A), da p ima vrijednost r/R uz


uvjet da se A ostvario n puta u N pokusa, dana Bayesovim teoremom (2.21)

P( Hn )
P( Hn /A) = P( A/Hn )
P( A/H1 ) P( H1 ) + P( A/H2 ) P( H2 ) + · · · + P( A/HR ) P( HR )
1
R
=
1 n 1 N −n 1 R n
 N −n 1 ·
( Nn ) 1− + · · · + ( Nn ) 1 − RR
  
R R R
    R 
R
N r n r N −n
· 1−
n R R
1  r n  r  N −n
= · 1 − .
1 n 1 N −n R n N −n R R
1− 1− R
   
R R + ··· + R R

Vjerojatnost (2.22) je jednaka zbroju gornjih vjerojatnosti za sve r izmed̄u r1 i r2 , pri čemu
je r1 najmanji prirodan broj veći ili jednak α, a r2 je najveći prirodan broj manji ili jednak
β
r2
r n r N −n
∑ 1−
 
  r2 R R
α β r =r1
P
R
≤p≤
R
= ∑ P( Hr /A) = R
.
r =r1 r n r N −n
∑ 1−
 
R R
r =1

U granici kada brojevi r1 , r2 i R rastu u beskonačnost, uz uvjet da njihovi omjeri r1 /R i


r2 /R ostaju konačni i jednaki
r1 r2
→ p1 , → p2 ,
R R
gornji zbrojevi prelaze u integrale

Rp
R2 r n r N −n Rp2
1− dr x n (1 − x ) N −n dx
 
  r2 R R
α β Rp1 p1
P
R
≤p≤
R
= ∑ P( Hr /A) →
RR
=
R1
.
r =r1 r n r N −n N −n
1− dr yn (1 − y ) dy
 
R R
0 0
2.5 Bayesov teorem 85

U nazivniku gornjeg izraza se pojavljuje potpuna beta-funkcija15 , koja se ponekad


naziva i Eulerov integral prve vrste
Z 1
β(m, n) = β(n, m) ≡ x m−1 (1 − x ) n−1 dx , Re (m) > 0, Re (n) > 0.
0

Sukladno tomu, integral u brojniku istog izraza se može izraziti preko nepotpune
beta-funkcije, definirane izrazom
Z z
β(z; m, n) ≡ x m−1 (1 − x ) n−1 dx , Re (m) > 0, Re (n) > 0.
0

Vezano za nepotpunu beta-funkciju, u literaturi se koristi i izraz Čebiševljev integral za


Z
x p (1 − x )q dx = β( x; 1 + p, 1 + q).

Vratimo se polaznoj vjerojatnosti koja se sada može napisati kao


R p2 n Rp
0
x (1 − x ) N −n dx − 0 1 x n (1 − x ) N −n dx
P ( p1 ≤ p ≤ p2 ) = R1 .
0
y n (1 − y) N −n dy
Uz oznaku
Z p
1
I p (n + 1, N − n + 1) ≡ x n (1 − x ) N −n dx ,
β(n + 1, N − n + 1) 0

tražena vjerojatnost je jednaka


P ( p1 ≤ p ≤ p2 ) = I p2 (n + 1, N − n + 1) − I p1 (n + 1, N − n + 1). (2.23)
Numeričke vrijednosti integrala I p su dane u tablicama (npr. I VANOVI Ć, Teorija verovat-
noće, tablica 1, str. 309). Ako se u gornjem izrazu odabere p1 = 0, tada slijedi vjerojatnost
da je p ≤ p2 , uz uvjet da se u N pokusa A ostvario n puta, jednaka
P ( p ≤ p2 ) = I p2 (n + 1, N − n + 1).
Ovime se i (2.23) piše kao
P ( p1 ≤ p ≤ p2 ) = P ( p ≤ p2 ) − P ( p ≤ p1 ) . (2.24)
Primjer 2.28 Izvodi se niz nezavisnih pokusa u kojima se u svakom pojedinom pokusu
dogad̄aj A može ostvariti s vjerojatnošću p, koja je nepoznata. Ako se u nizu od dvadeset
nezavisnih pokusa, A ostvario dvanaest puta, kolika je vjerojatnost da je p ∈ [0.4, 0.6]?
Prema (2.23) ta je vjerojatnost jednaka
P (0.4 ≤ p ≤ 0.6) = I0.6 (13, 9) − I0.4 (13, 9).
No, gornjih vrijednosti integrala nema u tablici. Zato se postupa na slijedeći način. Lako
se pokazuje da je
I p ( a, b) + I1− p (b, a) = 1 ⇒ I p ( a, b) = 1 − I1− p (b, a). (2.25)
Kombiniranjem gornje dvije relacije, dobiva se
P (0.4 ≤ p ≤ 0.6) = I0.6 (13, 9) − I0.4 (13, 9) = 1 − I0.4 (9, 13) − 1 + I0.6 (9, 13)
= 0.5237 − 0.0352 = 0.4885.


15 Vidjeti npr. dio o gama funkciju u poglavlju o specijalnim funkcijama u G LUMAC , Matematičke metode

fizike
86 Poglavlje 2. Osnovni pojmovi vjerojatnosti

 Primjer 2.29 dovršiti 

 Primjer 2.30 dovršiti 

 Primjer 2.31 Izvodi se niz pokusa. U svakom pojedinom pokusu je vjerojatnost p


da se ostvari odabrani dogad̄aj. Vjerojatnost p je nepoznata. Ako je poznato da se u
prvih N izvod̄enja pokusa, uočeni dogad̄aj ostvario n puta, kolika je vjerojatnost da se u
slijedećih M pokusa, dogad̄aj ostvari m puta?
dovršiti 

 Primjer 2.32 Izvodi se niz pokusa. U svakom pojedinom pokusu je vjerojatnost p da


se ostvari dogad̄aj A. Vjerojatnost p je nepoznata. Iz fizikalnih ili nekih drugih razloga
vjeruje se da vrijednost p leži u intervalu [ p1 , p2 ]. Neka je e RIZIK da p ima vrijednost
izvan tog intervala. Ako se u N pokusa A ostvario n puta, tada je prema normiranju
vjerojatnosti i prema (2.24)

P( p1 ≤ p ≤ p2 ) = 1 − e, ∀e ∈ [0, 1],
P ( p1 ≤ p ≤ p2 ) = P ( p ≤ p2 ) − P ( p ≤ p1 ) .

Odabirom p1 i p2 tako da vrijede donje dvije nejednakosti

e
P ( p ≤ p1 ) = I p1 (n + 1, N − n + 1) ≤ ,
2
(2.26)
e
P ( p ≤ p2 ) = I p2 (n + 1, N − n + 1) ≥ 1 − .
2

bit će

P( p1 ≤ p ≤ p2 ) = P ( p ≤ p2 ) − P ( p ≤ p1 ) ≥ 1 − e. (2.27)

Ako se u N nezavisnih pokusa A ostvario n puta, tako da je vjerojatnost ostvarenja A


u svakom pojedinom pokusu ista i jednaka p, tada je vjerojatnost da p leži u intervalu
[ p1 , p2 ] veća ili jednaka 1 − e za svaki e ∈ [0, 1]. Ova se tvrdnja može iskazati i preko
vjerojatnosti da p ne leži u intervalu [ p1 , p2 ]

P( p 6∈ [ p1 , p2 ]) < e.

Neka p ima jednu konkretnu vrijednost p = p0 koja se naziva HIPOTEZA. Ako je


p0 ∈ [ p1 , p2 ] i ako je e dovoljno mali, tada se smatra da nema razloga odbaciti hipotezu,
jer joj rezultati pokusa ne proturječe. Vrijednost e se naziva koeficijent rizika i njegov
je odabir subjektivnog karaktera. Donja granica, 1 − e vjerojatnosti da je p ∈ [ p1 , p2 ] se
naziva koeficijent sigurnosti. Vrijednosti p1 i p2 se nazivaju granice povjerenja, a interval
[ p1 , p2 ] je interval povjerenja.
Evo i numeričkog primjera.
Kovanica se baca trideset puta, pri čemu se glava pojavi sedamnaest puta.Može li se, uz
rizik od 1% prihvatiti hipoteza da je vjerojatnost pojavljivanja glave p0 = 0.5? Iz relacija
2.5 Bayesov teorem 87

(2.26) i već spomenute tablice se dobiva


P ( p ≤ p1 ) = I p1 (18, 14) ≤ 0.005
= 1 − I1− p1 (14, 18) ≤ 0.005
⇒ I1− p1 (14, 18) ≥ 1 − 0.005 = 0.995 ⇒ 1 − p1 = 0.8
⇒ p1 = 0.2,
P ( p ≤ p2 ) = I p2 (18, 14) ≥ 1 − 0.005
= 1 − I1− p2 (14, 18) ≥ 0.995
⇒ I1− p2 (14, 18) ≤ 0.005 ⇒ 1 − p2 = 0.3
⇒ p2 = 0.7.
Prema (2.27)
P(0.2 ≤ p ≤ 0.7) ≥ 1 − e = 0.99.
Dakle, ako se u nizu od trideset bacanja kovanice, glava pojavila sedamnaest puta,
s vjerojatnošću većom od 99 % može se smatrati da vjerojatnost pojavljivanja glave
kovanice leži unutar intervala [0.2, 0.7]. Iz toga slijedi da eksperimentalni podaci ne
proturječe hipotezi p0 = 0.5.
Provedite isti račun za e = 5 %. 

PRIMJENA U GENETICI
Češki svećenik Johann Gregor Mendel (1822. - 1884.) je, izvodeći svoje poznate pokuse
s križanjem različitih sorata graška, zasnovao jednu, tada novu, znanstvenu disciplinu
koja se danas naziva genetika. Mendel je imao dvije sorte graška: zeleni i žuti. To je
prva generacija čistih sorata. Njihovim križanjem dobiva drugu generaciju (hibridnu) u
kojoj su sve biljke žute boje. Križanjem ovih hibrida dobiva treću generaciju (takod̄er
hibridnu) u kojoj ima i zelenog i žutog graška. Od ukupno 8 023 biljke u trećoj generaciji,
njih 6 022 su bile žute, a 2 001 zelene. Dakle, u dobroj približnosti, omjer je bio 3 : 1 za
žutu boju. Da bi objasnio rezultat ovog svog pokusa, Mendel je općenito pretpostavio
postojanje dominantnih D i recesivnih r osobina živih bića. Za grašak je to značilo
da je žuta boja je dominantna, Ž ≡ D, a zelena je recesivna osobina, z ≡ r. Križanjem
dvije biljke koje obje imaju dominantnu osobinu i potomci će imati (samo) dominantnu
osobinu. Isti tako, križanjem dvije biljke koje obje imaju recesivnu osobinu i potomci
će imati (samo) recesivnu osobinu. To je bila njegova prva generacija biljaka. Druga
generacija je nastala križanjem jedne biljke koja ima samo gene s dominantnom osobi-
nom i jedne biljke koja ima gene samo s recesivnom osobinom. Rezultat su bile biljke
koje su u sebi nosile i dominantnu i recesivnu osobinu (konkretno boju). Dominantna je
prevladala i sve biljke druge generacije bile su žute
1. gen. Ž Ž × zz → 1. križanje → 2. gen. Žz
2. gen. Žz × Žz → 2. križanje → 3. gen. Ž Ž + Žz + Žz + zz.
Vidi se da će u trećoj16 generaciji kod 3/4 biljaka
Ž Ž + Žz + Žz
prevladavati dominantna osobina (žuta boja), a samo kod 1/4 će se pojaviti recesivna
osobina (zelena boja). To je objašnjenje njegovog pokusa, a ujedno i objašnjenje propa-
gacije odred̄enih osobina živih jedinki kroz generacije.
16 Naravno da oznaka Žz označava biljku istih osobina kao i z Ž, zatim Ž Ž ≡ Ž, itd.
88 Poglavlje 2. Osnovni pojmovi vjerojatnosti

Pogledajmo primjer križanja kada NEMA dominantnih / recesivnih osobina. To je npr.


križanje stanovništva bijele, B, i crne, C, boje kože. (Je li ovakav pokus uistinu ikada
proveden?). Prvim križanjem ljudi sa samo bijelim genima i ljudi sa samo crnim genima
dobiva se druga generacij ljudi koji nisu ni bijeli ni crni (melezi)

1. gen. BB × CC → 1. križanje → 2. gen. BC.

Križanjem osoba iz druge generacije, dobit će se bijelci, melezi i crnci

2. gen. BC × BC → 2. križanje → 3. gen. BB + BC + BC + CC,

s pripadnim vjerojatnostima

1
P(bijelac) = P( BB) = ,
4
1
P(melez) = P( BC ) = ,
2
1
P(crnac) = P(CC ) = .
4
Općenito se može reći da će rezultat križanja DD × DD uvijek biti jedinka s D osobinom

DD × D → DD.

Izražena u terminima uvjetnih vjerojatnosti, ova tvrdnja je

P( DD/DD × DD ) = 1,
P( Dr/DD × DD ) = 0, (2.28)
P(rr/DD × DD ) = 0.

Rezultat križanja DD × Dr je

DD × Dr → DD + Dr,

što se u terminima uvjetnih vjerojatnosti zapisuje kao

1
P( DD/DD × Dr ) = ,
2
1
P( Dr/DD × Dr ) = , (2.29)
2
P(rr/DD × Dr ) = 0.

Rezultat križanja DD × rr je

DD × rr → Dr,

što se u terminima uvjetnih vjerojatnosti zapisuje kao

P( DD/DD × rr ) = 0,
P( Dr/DD × rr ) = 1, (2.30)
P(rr/DD × rr ) = 0.
2.5 Bayesov teorem 89

Rezultat križanja Dr × Dr je

Dr × Dr → DD + Dr + Dr + rr,

što se u terminima uvjetnih vjerojatnosti zapisuje kao

1
P( DD/Dr × Dr ) = ,
4
1
P( Dr/Dr × Dr ) = , (2.31)
2
1
P(rr/Dr × Dr ) = .
4
Rezultat križanja Dr × rr je

Dr × rr → Dr + rr,

što se u terminima uvjetnih vjerojatnosti zapisuje kao

P( DD/Dr × rr ) = 0,
1
P( Dr/Dr × rr ) = , (2.32)
2
1
P(rr/Dr × rr ) = .
2
Rezultat križanja rr × rr je

rr × rr → rr,

što se u terminima uvjetnih vjerojatnosti zapisuje kao

P( DD/rr × rr ) = 0,
P( Dr/rr × rr ) = 0, (2.33)
P(rr/rr × rr ) = 1.

Vratimo se opet grašku. Postavlja se pitanje: križana su dva hibridna žuta graška (ne
zna se kojoj generaciji pripadaju) i dobiven je opet žuti grašak

Žz × Žz → Žx, (2.34)

gdje x nepoznanica koja može biti x = Ž ili x = z. Daljim križanjem hibrida Žx s
hibridom Žz dobiveno je N biljaka i sve su bile žute, tj.

Žx × Žz → Žy. (2.35)

Pitanje glasi: kolika je vjerojatnost17 da je x = Ž? Vratimo se križanju (procesu) (2.35) i


iskažimo ga u terminima uvjetne vjerojatnosti: znamo da se dogodilo križanje Žx × Žz
i pitamo se koliko je vjerojatno da će rezultat križanja biti žute boje, tj. da će bili oblika
Ž Ž ili Žz

P( Ž Ž + Žz/ Žx × Žz) =?


17 Ovaj problem potječe od engleske matematičarke Florence Nightingale David, (23. VIII 1909. – 23. VII

1993.) .
90 Poglavlje 2. Osnovni pojmovi vjerojatnosti

Osobina x može imati jednu od dvije vrijednosti: ili je Ž ili je z, pa postoje i dvije
hipoteze

H1 : x = Ž, H2 : x = z.

Ako je istinita prva hipoteza, tj. ako (2.35) glasi

Ž Ž × Žz → Žy,

tada je, prema (2.29), vjerojatnost da potomak bude žute boje, ako su roditelji bili
Ž Ž × Žz, jednaka

1 1
P( ZˇŽ + Žz/ Ž Ž × Žz) = P( Ž Ž/ Ž Ž × Žz) + P( Žz/ Ž Ž × Žz) = + = 1,
2 2
tj. sigurno je da će potomak biti žute boje. Ako je istinita druga hipoteza, tj. ako (2.35)
glasi

Žz × Žz → Žy,

tada je, prema (2.31), vjerojatnost da potomak bude žute boje, ako su roditelji bili
Žz × Žz, jednaka

1 1 3
P( Ž Ž + Žz/ Žz × Žz) = P( Ž Ž/ Žz × Žz) + P( Žz/ Žz × Žz) = + = .
4 2 4

Označimo dogad̄aj da je biljka žute boje slovom A Ž ≡ Ž Ž + Žz. Gornje dvije vjerojat-
nosti se tada kratko mogu zapisati kao uvjetne vjerojatnosti

3
P( A Ž /H1 ) = 1, P( A Ž /H2 ) = .
4
To su vjerojatnosti koje se odnose na jednu biljku. Vjerojatnosti da je svih N biljaka te
generacije žuto, dobije primjenom i vjerojatnosti N puta za svaku od dvije promatrane
hipoteze
 N
N 3
P( N A Ž /H1 ) = 1 = 1, P( N A Ž /H2 ) = .
4

Nadalje, križanjem dva hibrida, Žz × Žz iz (2.34), općenito se dobiju četiri kombinacije:
Ž Ž, Žz, Žz, zz. Prema tome, uvjetna vjerojatnost da se u paru pojavi Ž, ako znamo da
drugi član para jeste Ž, je

1
P( x = Ž/ Ž ) ≡ P( H1 ) = .
3
Isto tako, uvjetna vjerojatnost da se u paru pojavi z, ako znamo da drugi član para jeste
Ž, je

2
P( x = z/ Ž ) ≡ P( H2 ) = .
3
Sada možemo odgovoriti na pitanje postavljeno relacijom (2.35): ako su križane dvije
biljke obje sastava Žz, kolika je vjerojatnost da je u (2.35), x = Ž, uz uvjet da je svih N
2.5 Bayesov teorem 91

biljaka nastalih križanjem, žute boje. Odgovor je dan Bayesovim teoremom (2.21) i glasi

P( H1 )
P( H1 /N A Ž ) = P( N A Ž /H1 )
P( N A Ž /H1 ) P( H1 ) + P( N A Ž /H2 ) P( H2 )
1
3 1
=  N · 1N =  N .
1 3 2 3
1N · + · 1+2
3 4 3 4

Slično se dolazi i do izraza za vjerojatnost druge hipoteze, x = z

Slika 2.7: Ilustracija P( H1 /N A Ž ).

0.9

0.8
P (H1/N AZ)

0.7

0.6

0.5

0.4

0 5 10 15 20
N

P( H2 )
P( H2 /N A Ž ) = P( N Ž/H2 )
P( N A Ž /H1 ) P( H1 ) + P( N A Ž /H2 ) P( H2 )
2  N
3 3 2
=  N · =  N .
1 2 3 4 4
+ 2+
3 3 4 3

Primjetimo da je zadovoljeno normiranje vjerojatnosti

P( H1 /N A Ž ) + P( H2 /N A Ž ) = 1.

Evo i nekoliko numeričkih vrijednosti za navedene vjerojatnosti (zbog normiranja


dovoljno je računati samo jednu od njih)

N 1 2 5 10 20
P( H1 /N A Ž ) 0.4 0.470588 0.678146 0.898774 0.993698.

S porastom broja biljaka, sve je veća vjerojatnost da je x = Ž, slika 2.7.

PRIMJENA U MEDICINI
... dovršiti ...

M ONTY H ALLOV PROBLEM


92 Poglavlje 2. Osnovni pojmovi vjerojatnosti

Pretpostavimo da na nekom game showu igrač bira jedna od triju ponud̄enih vrata: iza
jednih vrata je automobil, a iza ostalih su koze. Igrač izabire vrata, npr. broj jedan, a
voditelj, koji zna što je iza vrata, otvori neka druga vrata, npr. broj dva, iza kojih je koza,
kao na slici 2.8. Zatim voditelj upita igrača želi li promijenti svoj izbor i umjesto vrata

Slika 2.8: Ilustracija Monty Hallovog problema.

broj jedan, izabrati vrata broj tri. Pitanje je je li povoljnije promjeniti izbor i odlučiti se
vrata broj tri, ili je povoljnije ostati na prvotnom izboru vrata broj jedan?
Do odgovora se može doći koristeći Bayesov teorem. Uvedimo nasumičnu varijablu A
(kao automobil) koja može imati tri diskretne vrijednosti: A = 1 ako je automobil iza
vrata broj jedan, A = 2 ako je automobil iza vrata broj dva i A = 3 ako je automobil iza
vrata broj tri. U početku, bez ikakvih dodatnih informacija, moramo zaključiti da je
1
P ( A = 1) = P ( A = 2) = P ( A = 3) = .
3
Neka varijabla B označava broj vrata koja je otvorio voditelj. Bez gubitka općenitosti
(translacijska invarijantnost) možemo razmotriti situaciju u kojoj igrač odabire vrata
broj jedan, a voditelj otvara vrat broj dva iza kojih je koza. Ukoliko je automobil iza
vrata broj jedan, a voditelj uvijek otvara vrata iza kojih nije automobil, vjerojatnost da
voditelj otvori vrata broj dva je
1
P( B = 2/A = 1) = .
2
Ukoliko je automobil iza vrata broj dva, voditelj ih sigurno neće otvoriti

P( B = 2/A = 2) = 0.

Ukoliko je automobil iza vrata broj tri, voditelj će sigurno otvoriti vrata broj dva

P( B = 2/A = 3) = 1.

Da bi se ustanovilo treba li ili ne treba promijeniti prvotni izbor, potrebno je izračunati


P( A = 1/B = 2), P( A = 2/B = 2) i P( A = 3/B = 2). Ako je automobil iza drugih vrata,
voditelj ih sigurno neće otvoriti izato je P( A = 2/B = 2) = 0. Ostale vjerojatnosti se
računaju Bayesovim teoremom, (2.21),

P( B = 2/A = j) P( A = j) P( A = j)
P( A = j/B = 2) = = 3 P( B = 2/A = j).
P ( B = 2) ∑i=1 P( B = 2/A = i ) P( A = i )
2.5 Bayesov teorem 93

Nazivnik je isti za sve vrijednosti j i jednak je


3
∑ P( B = 2/A = i ) P( A = i ) = P(2/1) P( A = 1) + P(2/2) P( A = 2) + P(2/3) P( A = 3)
i =1
1 1 1 1 1
= · +0· +1· = .
2 3 3 3 2
Tražene vjerojatnosti su
1
P ( A = 1) 3 1 1
P( A = 1/B = 2) = P( B = 2/A = 1) = = ,
1 1 2 3
2 2
1
P ( A = 2) 3
P( A = 2/B = 2) = P( B = 2/A = 2) = 0 = 0,
1 1
2 2
1
P ( A = 3) 3 2
P( A = 3/B = 2) = P( B = 2/A = 3) = 1= .
1 1 3
2 2
Ukoliko igrač promjeni svoj prvotni izbor i umjesto vrata broj jedan odabere vrata broj
tri, udvostručit će vjerojatnost dobitka nagrade.

Zadatak 2.16 dovršiti 

Rješenje:
dovršiti
Zadatak 2.17 U kutiji su tri kuglice. Kuglice su ili bijele ili crne boje, ali ne znamo
koliko je kuglica bijelo, a koliko crno. Iz kuglice se nasumice izvuče
jedna kuglica i pokaže se da je ona bijela. Izračunajte vjerojatnost da
se u kutiji nalazi 0, 1, 2 ili 3 bijele kuglice. 

Rješenje:
U kontekstu Bayesovog teorema (2.21)

P( Hn )
P( Hn /X ) = P( X/Hn ),
P( X/H1 ) P( H1 ) + P( X/H2 ) P( H2 ) + · · · + P( X/HN ) P( HN )
postoje četiri hipoteze, koje su sve a priori jednako vjerojatne: H0 u kutiji nijedna kuglica nije
bijela, H1 u kutiji je jedna bijela kuglica, H2 u kutiji su dvije bijele kuglice, H3 u kutiji su tri
bijele kuglice. Zbog normiranja vjerojatnosti, očito mora biti
1
P( H0 ) = P( H1 ) = P( H2 ) = P( H3 ) = .
4
Dogad̄aj X iz Bayesovog teorema je u ovom slučaju izvlačenje bijele kuglice. Uvjetene vjerojat-
nosti da je izvučena bijela kuglica uz uvjet da vrijedi hipoteza Hj su

0 1 2 3
P( X/H0 ) = , P( X/H1 ) = , P( X/H2 ) = , P( X/H3 ) = .
3 3 3 3
94 Poglavlje 2. Osnovni pojmovi vjerojatnosti

Uvrštavanje ovih vjerojatnosti u Bayesov teorem odmah daje konačne rezultate

P( H0 )
P( H0 /X ) = P( X/H0 )
P( X/H0 ) P( H0 ) + P( X/H1 ) P( H1 ) + P( X/H2 ) P( H2 ) + P( X/H3 ) P( H3 )
1
4
= 11 21 31
· 0 = 0,
0+ 34 + 34 + 34
P( H1 )
P( H1 /X ) = P( X/H1 )
P( X/H0 ) P( H0 ) + P( X/H1 ) P( H1 ) + P( X/H2 ) P( H2 ) + P( X/H3 ) P( H3 )
1
4 1 1
= 11 21 31
· =
0+ 34 + 34 + 34
3 6
P( H2 )
P( H2 /X ) = P( X/H2 )
P( X/H0 ) P( H0 ) + P( X/H1 ) P( H1 ) + P( X/H2 ) P( H2 ) + P( X/H3 ) P( H3 )
1
4 2 1
= 11 21 31
· =
0+ 34 + 34 + 34
3 3
P( H2 )
P( H3 /X ) = P( X/H3 )
P( X/H0 ) P( H0 ) + P( X/H1 ) P( H1 ) + P( X/H2 ) P( H2 ) + P( X/H3 ) P( H3 )
1
4 3 1
= 11 21 31
· = .
0+ 34 + 34 + 34
3 2

Primjetimo i da je uvjetna raspodjela vjerjatnosti P( Hj /X ) normirana

3
1 1 1
∑ P( Hj /X ) = 0 + + + = 1.
6 3 2
j =0

Zadatak 2.18 Izvor emitira poruke koje se sastoje od niza znakova 0 i 1. Vjerojatnost
emitiranja znaka 0 je 0.4, a znaka 1 je 0.6. Na izlazu iz izvora se 10 %
svih znakova pogrešno interpretira. Ako je primljena poruka 101,
kolika je vjerojatnost da je ona i poslana? 

Rješenje:

P(1e) = 0.6, vjerojatnost emitiranja 1,


P(0e) = 0.4, vjerojatnost emitiranja 0,

P(1/0) = P(0/1) = 0.1, vjerojatnost greške na izlazu iz emitera,


P(1/1) = P(0/0) = 0.9, vjerojatnost da na izlazu iz emitera ne dod̄e do greške,

P(1e/1d) =? vjerojatnost da se detektira 1, ako je 1 emitiran,


P(0e/0d) =? vjerojatnost da se detektira 0, ako je 0 emitirana.

Koristeći Bayesov teorem (2.21), treba izračunati P(1e/1d) i P(0e/0d), a zatim je tražena
vjerojatnost emitiranja i detekcije 101 jednaka

P(101) = P(1e/1d) · P(0e/0d) · P(1e/1d).


2.5 Bayesov teorem 95

Prema (2.21) je

P(1e)
P(1e/1d) = P(1/1) = 0.931 934 · · · ,
P(1/1) P(1e) + P(1/0) P(0e)
P(0e)
P(0e/0d) = P(1/1) = 0.857 143 · · · .
P(0/1) P(1e) + P(0/0) P(0e)

Pomoću gornjih vrijednosti je i

P(101) = P(1e/1d) · P(0e/0d) · P(1e/1d) = 0.742 992 · · · .

Zadatak 2.19 Dva strijelca su, nezavisno jedan od drugoga, gad̄ali istu metu, svaki
ispalivši po jedan hitac. Vjerojatnost da je prvi strijelac pogodio metu
je 0.8, a da je pogodio drugi vjerojatnost je 0.4. Poslije gad̄anja oba
strijelca, ustanovljeno je da je meta pogod̄ena jednim hicem. Kolika je
vjerojatnost da je prvi strijelac pogodio metu? 

Rješenje:
Definirajmo slijedeće dogad̄aje:
A: meta je pogod̄ena jednim hicem
A/H1 : prvi je pogodio, a drugi promašio,
A/H2 : prvi je promašio, a drugi pogodio,
H1 : puca prvi strijelac
H2 : puca drugi strijelac

P( A/H1 ) = 0.8(1 − 0.4),


P( A/H2 ) = 0.4(1 − 0.8).

Sigurno je da su oba strijelca pucala, pa je zato

P( H1 ) = P( H2 ) = 1.

Prema Bayesovu teoremu, (2.21), je

P( H1 ) 6
P( H1 /A) = P( A/H1 ) = = 0.857143.
P( A/H1 ) P( H1 ) + P( A/H2 ) 7

Zadatak 2.20 U jedanaest posuda Un , n = 0, 1, · · · , 10 nalazi se n bijelih i 10 − n crnih


kuglica. Nasumice je odabrana jedna posuda i iz nje je izvučena jedna
bijela kuglica. Kolika je vjerojatnost da je kuglica izvučena iz posude
Un ? . 

n
P(Un ) = .
55
Rješenje:
96 Poglavlje 2. Osnovni pojmovi vjerojatnosti

2.6 Problemi s višestrukim izborom


Problemi ovog tipa se pojavljuju u teorji gad̄anja (lovac - divljač, projektil - meta, ...),
teoriji raspodjele (dostava pošte, kupljene robe, ... ), u prometu (odabir cestovnih
pravaca, ...) i slično, a rješavaju se primjenom Poincaréove formule (2.16).
 Primjer 2.33 J EDAN ZRAKOPLOV
Na jedan neprijateljski zrakoplov je istovremno ispaljeno N projektila. Vjerojatnost
pogotka svakog pojedinog projektila je p. Potrebno je odrediti vjerojatnost da zrakoplov
bude pogod̄en.
Zrakoplov neće biti pogod̄en, ako svih N projektila promaši. Vjerojatnost tog dogad̄aja
je
(1 − p ) N .
Vjerojatnost da bar jedan projektil pogodi je tada jednaka

Slika 2.9: Vjerojatnost (2.36).

0.9

0.8

0.7

0.6
P (p, N)

0.5

0.4
N=1
0.3 N=2
N=4
0.2 N=8

0.1

0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
p

P( p, N ) = 1 − (1 − p) N . (2.36)


Ukoliko svaki projektil sa sigurnošću, p = 1, pogad̄a metu, nema smisla slati pojedinačne
zrakoplove, jer će ih obrana sve srušiti. Zato se u slučaju kada se pretpostavlja vrlo
visoka vjerojatnost pogotka projektilom, šalju skupine zrakoplova, jer tada kao što ćemo
vidjeti iz slijedećih primjera, postoji veća ili manja vjerojatnost da dio zrakoplova preleti
obranu neoštećen.
 Primjer 2.34 T RI ZRAKOPLOVA
Na skupinu od n = 3 zrakoplova, Z1 , Z2 i Z3 , ispaljena su N = 4 projektila, od kojih
svaki sa sigurnošću, p = 1, pogad̄a metu. Treba odrediti kolika je vjerojatnost da jedan
zrakoplov preleti obranu neoštećen.

n N = 81
je broj načina na koji N projektila može pogoditi n meta. Neka zn označava broj
projektila koji je pogodio zrakoplov Zn . Prema postavljenom uvjetu (svaki projektil
pogad̄a metu) mora biti ukupan broj pogodaka jednak
z1 + z2 + z3 + z4 = 4.
2.6 Problemi s višestrukim izborom 97

Donja tablica pokazuje sve moguće vrijednosti zn koje zadovoljaju gornji uvjet, kao i
broj njihovih pojavljivanja ν (na koliko načina četri projektila mogu pogoditi tri mete)

Z1 Z2 Z3 ν

4 0 0 1
0 4 0 1
0 0 4 1
3 1 0 4
3 0 1 4
1 3 0 4
0 3 1 4
1 0 3 4
0 1 3 4
2 2 0 6
2 0 2 6
0 2 2 6
2 1 1 12
1 2 1 12
1 1 2 12
Objasnimo značenje gornje tablice. U slijedećom nizovima od četiri broja, broj na prvom
mjestu označava koji je avion pogodio prvi projektil, broj na drugom mjestu označava
avion koji je pogodio drugi projektil itd. Tako npr. drugi red gornje tablice je opisan
jednim nizom brojeva

(2, 2, 2, 2),
što znači da su sva četiri projektila pogodila drugi zrakoplov. Četvrti red simbolizira
četiri načina na koje prvi zrakoplov može biti pogod̄en s tri projektila, drugi s jednim
projektilom, a treći je promašen

(1, 1, 1, 2), (1, 1, 2, 1), (1, 2, 1, 1), (2, 1, 1, 1),


i slično za ostale konfiguracije s vrijednošću ν = 4. Deseti red simbolizira šest načina na
koje prvi zrakoplov može biti pogod̄en s dva projektila, drugi s dva projektila, a treći je
promašen

(1, 1, 2, 2), (1, 2, 1, 2), (1, 2, 2, 1), (2, 1, 1, 2), (2, 1, 2, 1), (2, 2, 1, 1).
i slično za ostale konfiguracije s vrijednošću ν = 6. Trinaesti red simbolizira dvanaest
načina na koje prvi zrakoplov može biti pogod̄en s dva projektila, drugi s jednim i treći
s jednim projektilom

(1, 1, 2, 3), (1, 1, 3, 2), (1, 2, 1, 3), (1, 3, 1, 2), (1, 2, 3, 1), (1, 3, 2, 1),
(2, 1, 1, 3), (3, 1, 1, 2), (2, 1, 3, 1), (3, 1, 2, 1),
(2, 3, 1, 1), (3, 2, 1, 1),
i slično za ostale konfiguracije s vrijednošću ν = 12. Neka je broj pogod̄enih zrakoplova
nasumična varijabla x ∈ {0, 1, 2, 3}. Iz gornje tablice se tada lako očitavaju vjerojatnosti
P( j) da je pogod̄eno j zrakoplova
0 3 42 36
P (0) = , P (1) = , P (2) = , P (3) = .
81 81 81 81
98 Poglavlje 2. Osnovni pojmovi vjerojatnosti

Primjetimo da je raspodjela vjerojatnosti normirana


P(0) + P(1) + P(2) + p(3) = 1.
Vjerojatnost da jedan zrakoplov prod̄e neoštećen je jednak vjerojatnosti da dva budu
pogod̄ena, tj
42
P (2) = = 0.518519.
81
Iz ovog primjera se vidi da je u interesu napadača da se kreće u gustim formacijama jer
je tada veća vjerojatnost da više projektla pogodi istu metu, tj. da dio zrakoplova prod̄e
neoštećen. 

 Primjer 2.35 S KUPINA ZRAKOPLOVA


Ovaj primjer je poopćenje prethodnog. Na skupinu od n zrakoplova ispaljeno je N
projektila, N ≥ n, od kojih svaki sa sigurnošću, p = 1, pogad̄a metu. Treba odrediti
kolika je vjerojatnost da jedan zrakoplov preleti obranu neoštećen.

nN
je broj načina na koji N projektila može pogoditi n meta (varijacije n elemenata N-tog
razreda s ponavljanjem). Zrakoplov Z1 će proći neoštećen, ako svih N projektila pogodi
preostalih n − 1 zrakoplova. To su opet varijacije N-tog razreda s ponavljanjem, ali sada
ne od n nego od n − 1 elemenata
( n − 1) N ,
pa je zato vjerojatnost da jedan odred̄eni zrakoplov prod̄e neoštećen (svejedno je je li to
Z1 ili Z2 ili neki treći) jednaka

( n − 1) N 1 N
 
P (1) = = 1 − .
nN n
Istim razmišljanjem se dolazi do zaključka da je vjerojatnost neoštećenog preleta m
odred̄enih zrakoplova jednaka
(n − m) N  mN
= 1 − ,
nN n
a vjerojatnost da neoštećeno preleti m ≤ n bilo kojih zrakoplova iz skupine, je jednaka
n (n − m) N n mN
   
P(m) = = 1 − .
m nN m n
Prema adicijskom teoremu (2.16) vjerojatnost neoštećenog preleta bar jednog zrakoplova
(ili jedan ili dva ili tri ili .... ili svih n) je
n
1 N 2 N 3 N
!  
n n n n +1 n nN
        
P ∑ Zi = 1− − 1− + 1− − . . . (−1) 1−
i =1
1 n 2 n 3 n n | {zn }
=0
n −1
i +1 n i N
  
= ∑ (−1) 1− −1+1
i =1
i n
n −1
i +1 n i N
  
= 1 + ∑ (−1) 1− .
i =0
i n
2.6 Problemi s višestrukim izborom 99

Suprotna vjerojatnost, da neće nijedan zrakoplov preletjeti neoštećen, nego da će svi biti
pogod̄eni je tada jednaka

n n −1
i N n −1 i N
!
i +1 n i n
     
1 − P ∑ Zi = − ∑ (−1) 1− = ∑ (−1) 1− .
i =1 i =0
i n i =0
i n

Vjerojatnost da neoštećeno preleti m od n zrakoplova i da preostalih n − m bude pogo-


d̄eno je, prema gornjim razmatranjima, jednaka
N
n m  N n−m i n−m i
   
P(m, n − m) = 1− · ∑ (−1) 1−
m n i =0
i n−m
  n−m N
n n−m m+i
 
= · ∑ (−1) i 1− .
m i =0
i n

dovršiti 

 Primjer 2.36 S KUPINA ZRAKOPLOVA , p < 1


Sada se promatra realističniji slučaj kada projektili pogad̄aju metu s pojedinačnom
vjerojatnošću pogotka jednakom 0 ≤ p ≤ 1. Treba naći vjerojatnost da će ispaljivanjem
N projektila na n zrakoplova biti pogod̄eno njih m.
Svaki projektil može ili pogoditi metu s vjerojatnošću p ili ju promašiti s vjerojatnošću
1 − p, pa je vjerojatnost da od N projektila njih r pogodi metu jednaka (binomna
vjerojatnost)

N
 
p r (1 − p ) N −r .
r


dovršiti
100 Poglavlje 2. Osnovni pojmovi vjerojatnosti

Literatura korištena u ovom poglavlju:

1. N EVEN E LEZOVI Ć.


Vjerojatnost i statistika 1 - diskretna vjerojatnost. Element, Zagreb, 2008
2. P. H SU H WEI.
Theory and problems of probability, random variables and random processes. McGraw -
Hill, 1997
3. B RANISLAV I VANOVI Ć.
Teorija verovatnoće. Univerzitetski udžbenici. Naučna knjiga, Beograd, 1977, stra-
nica 328
4. Ivo PAVLI Ć.
Statistička teorija i primjena. Panorama, Zagreb, 1965
5. K EN R ILEY , M ICHAEL H OBSON I S TEPHEN B ENCE.
Mathematical Methods for Physics and Engineering. Cambridge Univ. Press, 2006
6. I VAN S UPEK.
Teorijska fizika i struktura materije, 2. Školska knjiga, Zagreb, 1997
7. V LADIMIR V RANI Ć.
Vjerojatnost i statistika. Tehnička knjiga, Zagreb, 1971
3. Nasumične varijable

Dobar kršćanin morao bi se čuvati matema-


tičara i ostalih koji rade prazna predvid̄anja.
Opasnost već postoji da su matematičari
sklopili ugovor sa vragom kako bi čovjeku
zamračili duh i vezali ga uz pakao.

Aurelije Augustin,
rimski pisac, filozof i teolog

3.1 Nasumične varijable


Ako pokus ima više različitih ishoda, od kojih se svaki ostvaruje s odred̄enom vjero-
jatnošću, tada ishode pokusa shvaćamo kao NASUMI ČNU ( STOHASTI ČNU , SLU ČAJNU )
VARIJABLU, x, koja može poprimiti odred̄ene vrijednosti, diskretne ili kontinuirane, koje
opisuju ishod pokusa.

 Primjer 3.1 K OCKA


U jednostavnom pokusu koji se sastoji od bacanja savršene kocke, nasumična varijabla
x može poprimiti šest različitih diskretnih vrijednosti

x ∈ {1, 2, 3, 4, 5, 6},

sve sa istom (konstantnom) vjerojatnošću

1
P( x ) = , ∀ x.
6


Primjer 3.2 B ERNOULLIJEVI POKUSI


U primjeru 2.13 o Bernoullijevim pokusima, n, broj koji kaže u koliko od N pokusa se
dogodio odabrani dogad̄aj, diskretna nasumična varijabla koja može poprimiti jednu
102 Poglavlje 3. Nasumične varijable

od vrijednosti x = n za

n ∈ {0, 1, 2, · · · , N },

s vjerojatnošću koja nije konstantna nego ovisi o vrijednosti n i jednaka je, prema (2.10),

N
 
P(n) = p n q N −n , p = 1 − q = const.
n


Kao što sam naziv kaže, nasumična je varijabla x ona čija vrijednost x ovisi o slučaju,
tj. praktički se ne može točno unaprijed1 predvidjeti iz početnih uvjeta. Nasumične
varijable mogu biti diskretne, ako poprimaju diskretan skup vrijednosti (npr. P ili G pri
bacanju kovanice ili n iz gornjeg primjera) ili kontinuirane, ako poprimaju kontinuirane
vrijednosti iz nekog intervala (vrijednosti vremena, dužine, površine itd. u nekom
pokusu). Takod̄er, može se promatrati samo jedna nasumična varijabla ili više njih.
Općenito će se govoriti o N nasumičnih varijabla (diskretnih ili kontinuiranih)

x1 , x2 , · · · , xN .

Ove je varijable ponekad zgodno shvatiti kao komponente vektora koji se tada naziva
NASUMI ČNI VEKTOR

~x = ( x1 , x2 , · · · , xN ).

Kada se govori o više nasumičnih varijabla, moguće je da su neke od njih med̄usobno


ovisne ili neovisne.

Pomoću (realnih) nasumičnih varijabla x1 i x2 , može se konstruirati KOMPLEKSNA


nasumična varijabla

z = x1 + ı x2 ,

gdje je ı imaginarna jedinica, ı 2 = −1. I kompleksna nasumična varijabla z može biti


diskretna ili kontinuirana.

Vjerojatnost ostvarenja različitih vrijednosti pojedine nasumične varijable, ne mora


biti konstantna, nego se može mijenjati, kao što se to npr. vidi iz izraza (2.10). Za
diskretne nasumične varijable, ove promjene opisuje VJEROJATNOST P( x ), dok će se
za kontinuirane nasumične varijable pojam vjerojatnosti P( x ) pokazati neprikladnim i
umjesto njega će se uvesti pojam GUSTO ĆE VJEROJATNOSTI ρ( x ).

3.2 Diskretne nasumične varijable


3.2.1 Jedna diskretna nasumična varijabla
U dosadašnjem izlaganju smo promatrali pokuse čiji su se ishodi opisivali diskretnim
vrijednostima: bacanje kocke ili kovanice i slično.
Vrijednosti diskretne nasumične varijabla x će se označavati s x, pri čemu x poprima
samo diskretan niz vrijednosti. Ova se vjerojatnost označava kao

P( x )
1 tj. prije izvedbe pokusa
3.2 Diskretne nasumične varijable 103

Slika 3.1: Nasumične varijable - sažetak.

SLUČAJNE VARIJABLE

diskretne kontinuirane

X X1, X2, X3, ... X X1, X2, X3, ...

ovisne neovisne ovisne neovisne

i naziva se RASPODJELA VJEROJATNOSTI. Tvrdnja da je sigurno da će x poprimiti neku


od svojih vrijednosti piše se u obliku2 (zbrajanje, ili vjerojatnosti)

∑ P(x) = 1.
x

i naziva se normiranjem vjerojatnosti.


Vjerojatnost da varijabla x poprimi bilo koju vrijednost izmed̄u x p i xk je dana slijedećim
zbrojem vjerojatnosti (ili vjerojatnost)
xk
P ( x p ≤ x ≤ x k ) = P ( x p ) + P ( x p +1 ) + P ( x p +2 ) + · · · + P ( x k ) = ∑ P ( x ).
x=x p

 Primjer 3.3 P ROSJE ČNA OCJENA


Raspodjela nasumične varijable (diskretne ili kontinuirane) je niz brojeva koji opisuju
vjerojatnost (ili učestalost) pojavljivanja te varijable. Pojasnimo to na jednom ekstremno
jednostavnom primjeru. Potrebno je izračunati srednju (prosječnu) ocjenu iz fizike u
nekom razredu neke škole. Označimo tu srednju ocjenu s hni. Kako se računa hni? Ako
razred polazi N = 23 učenika, a ocjenu j-tog učenika označimo s n j , tada se srednja
ocjena računa kao
n1 + n2 + n3 + . . . + nN
hni = .
N
No, gornji se izraz može napisati drukčije. Mi znamo da svi n j mogu poprimiti samo pet
vrijednosti {1, 2, 3, 4, 5}, tako da u brojniku gornjeg izraza ima puno istih brojeva, koje
je zgodno grupirati. Neka je Nn broj koliko se puta ocjena n ∈ {1, 2, 3, 4, 5} pojavljuje u
brojniku. Tada je
1 · N1 + 2 · N2 + 3 · N3 + 4 · N4 + 5 · N5
hni = , N1 + N2 + N3 + N4 + N5 = N.
N
Brojevi
Nn
P(n) ≡
N
2 Kada na znaku zbrajanja nisu označene granice zbrajanja, znači da se zbraja po svim mogućim

vrijednostima varijable x.
104 Poglavlje 3. Nasumične varijable

jesu vjerojatnosti da nasumice odabrani učenik iz razreda ima ocjenu jednaku n. Cijeli
skup { P(n); n = 1, 2, 3, 4, 5} se naziva normirana (diskretna) raspodjela vjerojatnosti i
skraćeno se označava jednostavno s P(n)

5 5
∑ P(n) = 1, hni = ∑ n P ( n ).
n =1 n =1

Iako su svi n j prirodni brojevi, hni je općenito realan broj.


Na sličan način se uvodi i raspodjela vjerojatnosti (točnije, njezina gustoća) za konti-
nuirane nasumične varijable. Ovome ćemo se još vratiti kada bude riječ o aritmetičkoj
srednjoj vrijednosti u primjeru 3.13. 

K UMULATIVNOM FUNKCIJOM RASPODJELE F


varijable x, naziva se zbroj (usporediti s (3.6) za kontinuiranu nasumičnu varijablu) svih
vjerojatnosti čiji je argument x 0 ≤ x

F ( x ) = P( x 0 ≤ x ) = ∑ P ( x 0 ). (3.1)
x ≤x
0

Na slici 3.2 je prikazana kumulativna funkcija raspodjele za raspodjelu vjerojatnosti iz


primjera 3.1.

Slika 3.2: Kumulativna funkcija raspodjele za raspodjelu vjerojatnosti iz primjera 3.1.

F(x)

6/6
5/6
4/6
3/6
2/6
1/6
x
1 2 3 4 5 6 7 8 9

 Primjer 3.4 L INEARNA RASPODJELA


Diskretna nasumična varijabla x može poprimiti vrijednosti 1, 2, · · · , N, s vjerojatnošću
razmjernom vrijednosti varijable. Treba naći raspodjelu vjerojatnosti P( x ).
Ako je vjerojatnost razmjerna vrijednosti varijable, tada je

P( x ) = a + b · x,

gdje su a i b konstante. Konstanta a se odred̄uje na slijedeći način: x može poprimati


samo vrijednosti 1, 2, · · · , N, tj. vjerojatnost da x ima neku drugu vrijednost je jednaka
nuli; posebno je vjerojatnost da je x = 0 jednaka nuli iz čega slijedi zaključak da je a = 0.
Konstanta b se odred̄uje iz uvjeta normiranja: zbroj vjerojatnosti svih dogad̄aja mora
3.2 Diskretne nasumične varijable 105

biti jednak jedinici (nešto se mora dogoditi)


N
∑ P ( x ) = P (1) + P (2) + · · · + P ( N ) = 1
x =1
2
b · 1 + b · 2 + b · 3 + · · · + b · N = b (1 + 2 + · · · + N ) = 1 ⇒ = b.
N ( N + 1)
Iz čega slijedi
2x
P( x ) = .
N ( N + 1)


3.2.2 Više diskretnih nasumičnih varijabla


Moguće je promatrati i dvije ili više diskretnih nasumičnih varijabla

x1 , x2 , x3 , · · · ,

koje mogu poprimati vrjednosti iz istog ili različitih osnovnih skupova. Radi jednos-
tavnosti prikaza, umjesto općenite višedimenzijske varijable, govorit ćemo o DVODI -
MENZIJSKOJ nasumičnoj varijabli ( x1 , x2 ). Varijabla x1 može poprimiti bilo koju od N1
diskretnih vrijednosti, a varijabla x2 bilo koju od N2 diskretnih vrijednosti. Vjerojatnost
da je varijabla x1 poprimila jednu odred̄enu vrijednost x1 , i da je istovremeno varijabla
x2 poprimila jednu odred̄enu vrijednost x2 , ćemo označiti s

P ( x1 , x2 ).

Iskaz da je sigurno da će x1 poprimiti neku od N1 vrijednosti x1 i da će x2 poprimiti


neku od N2 vrijednosti x2 , piše se u obliku (zbrajanje, ili vjerojatnosti)

∑ ∑ P(x , x ) = 1.1 2
x1 x2

i naziva se normiranjem vjerojatnosti. Općenito, za više od dvije vrijable

∑ ∑ ∑ · · · P(x , x , x , · · · ) = 1.
1 2 3
x1 x2 x3

Vjerojatnost da varijabla x1 poprimi bilo koju vrijednost izmed̄u x p,1 i xk,1 , a da varijabla
x2 poprimi bilo koju vrijednost izmed̄u x p,2 i xk,2 , je dana slijedećim zbrojem vjerojatnosti
(ili vjerojatnost)
xk,1 xk,2
P( x p,1 ≤ x1 ≤ xk,1 , x p,2 ≤ x2 ≤ xk,2 ) = ∑ ∑ P ( x1 , x2 ).
x1 = x p,1 x2 = x p,2

K UMULATIVNOM FUNKCIJOM RASPODJELE F


varijabla x1 , x2 , naziva se zbroj

F ( x1 , x2 ) = P( x10 ≤ x1 , x20 ≤ x2 ) = ∑ 0∑
0
P( x10 , x20 ).
x1 ≤ x1 x2 ≤ x2

S TATISTI ČKA ( NE ) OVISNOST


Kada se govori o više diskretnih nasumičnih varijabla, tada je važan i pojam statističke
106 Poglavlje 3. Nasumične varijable

neovisnosti. Za dvije nasumične (stohastične) varijable x1 i x2 se kaže da su statistički


neovisne, ako se njihova zajednička vjerojatnost može napisati u obliku umnoška
vjerojatnosti pojedinih varijabla

P( x1 , x2 ) = P1 ( x1 ) P2 ( x2 ).

I općenito, za više od dvije varijable

P( x1 , x2 , x3 , · · · ) = P1 ( x1 ) P2 ( x2 ) P3 ( x3 ) · · · . (3.2)

Ako zapis u gornjem obliku nije moguć, varijable su statistički ovisne i tada je

P( x1 , x2 , x3 , · · · ) 6= P1 ( x1 ) P2 ( x2 ) P3 ( x3 ) · · · .

3.3 Kontinuirane nasumične varijable


3.3.1 Jedna kontinuirana nasumična varijabla
Osim pokusa čiji se ishodi opisuju diskretnom varijablom, postoji čitav niz problema
čija vjerojatnost ovisi o parametrima koji se KONTINUIRANO mijenjaju, bilo u VREMENU
bilo u PROSTORU3 . Pokušajmo vjerojatnost nasumične varijable x koja poprima KONTI -
NUIRANE vrijednosti x iz intervala h − ∞, + ∞ i definirati na sličan način kako smo to
radili za diskretnu varijablu. Evo primjera:
Primjer 3.5 V JEROJATNOST vs. GUSTO ĆA VJEROJATNOSTI
Definirajmo dva problema: jedan s diskretnom i drugi s kontinuranom nasumičnom
varijablom.
Diskretni primjer: u kutiji su dvije bijele i tri crne kuglice; izvlači se se jedna kuglica i
pitanje je kolika je vjerojatnost da to bude bijela kuglica; naravno da je odgovor (povoljno
kroz moguće)
2
P(b) = .
5
Kontinuirani primjer: nasumično se odabire jedna točka na osi x iz intervala [−2.006, +3.1209]
i pitamo se kolika je vjerojatnost da odaberem točku x = 0.0022? Povoljna je samo jedna
točka, a budući da zadani interval sadrži (kontinuirano) beskonačno mnogo točaka, to
je

1
P( x = 0.0022) = = 0.



Gornji je primjer lako poopćiti do zaključka da je vjerojatnost svake pojedine vrijednosti


kontinuirane varijable egzaktno jednaka nuli

P( x ) = 0. (3.3)

Iz gornjeg primjera se vidi da definiciji vjerojatnosti kontinuiranih varijabla, treba pris-


tupiti malo opreznije. Iako je vjerojatnost da kontinuirana varijabla poprimi točno
odred̄enu vrijednost, jednaka nuli, ono što je RAZLI ČITO od nule jeste vjerojatnost pri-
družena jednom INTERVALU vrijednosti x. Ovo pridruživanje se izvodi uvod̄enjem
3 Vjerojatnostima koje kontinuirano ovise o prostornim varijablama (geometrijske vjerojatnosti, str. 113)
3.3 Kontinuirane nasumične varijable 107

funkcije raspodjele GUSTO ĆE VJEROJATNOSTI ρ( x ) sa slijedećim svojstvima:

(1) ρ( x ) ≥ 0, ∀ x,
Z +∞
(2) ρ( x ) dx = 1, normiranje, (3.4)
−∞
(3) ρ( x ) je po dijelovima kontinuirana,
Z xk
(4) P( x p < x ≤ xk ) = ρ( x ) dx , x p < xk .
xp

Prvo od gornjih svojstava samo kaže da je vjerojatnost pozitivna veličina, tj da ρ( x ) leži


iznad ili na osi x. Ako x ne prima vrijednosti iz intervala h −∞, +∞ i, nego iz [ a, b], tada
nomiranje (2) glasi
Z b
ρ( x ) dx = 1.
a

To znači da je površina ispod krivulje na slici 3.3.A, jednak jedinici. Svojstvo (3)
osigurava da imamo posla sa lijepim funkcijama, a (4) daje geometrijsku interpretaciju
vjerojatnosti da x poprimi bio koju vrijednost iz intervala ( x p , xk ): ona je numerički
jednaka površini ispod krivulje tj. integralu gustoće vjerojatnosti (s odgovarajućim
granicama), kao na slici 3.3.A. Ovo svojstvo (4) ima za posljedicu (3.3).
Ako su

x p = x, xk = x + dx ,

tada je ρ( x ) približno konstantna na intervalu [ x, x + dx ] i (4) postaje

Slika 3.3: (A) Vjerojatnost P( x p < x < xk ) da x poprimi vrijednost iz intervala ( x p , xk ) je


jednaka osjenčenom dijelu. (B) F ( x0 ) je vjerojatnost da x poprimi bilo koju vrijednost
manju od x0 .

ρ( x ) ρ( x )
( A) ( B)

x x
a xp xk b a x 0 b

Z x+dx
ρ( x 0 ) dx 0 = P( x < x 0 ≤ x + dx )
x
Z x+dx
ρ( x ) dx = dP ( x )
x
dP( x )
ρ( x ) dx = dP ( x ) ⇒ ρ( x ) = . (3.5)
dx
108 Poglavlje 3. Nasumične varijable

Diferencijal vjerojatnosti4

dP ( x ) = ρ( x ) dx

predstavlja vjerojatnost da se vrijednosti nasumične varijable x nalaze u intervalu


( x, x + dx ). Takod̄er je koristan i pojam KUMULATIVNE FUNKCIJE RASPODJELE F ( x ),
koja predstavlja vjerojatnost da nasumična varijabla poprimi bilo koju vrijednost manju
od neke unaprijed zadane vrijednosti x (slika 3.3.B).
Z x Z x
F(x) = ρ(η ) dη = dP (η ). (3.6)
−∞ −∞

Usporedite gornji izraz s (3.1) kod diskretne nasumične varijable.


Prema definicijama (3.4) i (3.6) je (slika 3.3)
Z xk
P( x p < x ≤ xk ) = ρ( x ) dx = F ( xk ) − F ( x p ).
xp

Ovaj izraz ujedno i definira funkciju F kao primitivnu funkciju gustoće vjerojatnosti, tj.

dF ( x )
ρ( x ) = . (3.7)
dx
Usporedbom (3.5) i (3.7) uočavamo jednakost diferencijala,

dP ( x ) = dF ( x ),

ali ne i samih funkcija5 P, točka (4) iz (3.4) i F, (3.6).

Primjer 3.6 N ASUMI ČAN PRAVAC


Zadatak je nasumice povući pravac kroz točku (0, 1) i naći vjerojatnost da pravac
sječe apscisu u nekoj
točki x (kao na slici). Promatrajmo
kut θ ∈ (−π/2, +π/2) koji pravac
zatvara s ordinatom. Vjerojatnost
da on poprimi vrijednost u inter-
1 valu (θ, θ + dθ ) je (povoljno kroz
θ
moguće)


dP = .
π
0 x

Sa slike se vidi da je tan(θ ) = x/1, pa je

dx
θ = arctan( x ) ⇒ dθ = .
1 + x2
4 Primjetite da se gustoća vjerojatnosti definira na isti način kao i gustoća mase, gustoća naboja, gustoća
energija ili bilo koja druga gustoća neke fizičke √ veličine.
5 Tako npr. f ( x ) = x + 6 i f ( x ) = x − 37.12 imaju iste diferencijale d f = d f , ali su med̄usobno
1 2 1 2
različite f 1 ( x ) 6= f 2 ( x ).
3.3 Kontinuirane nasumične varijable 109

Pravac odred̄en kutom iz intervala (θ, θ + dθ ), presjeca apscisu u intervalu ( x, x + dx ) s


traženom vjerojatnošću
dθ 1 1
dP = = dx ≡ ρ( x ) dx ⇒ ρ( x ) = .
π π (1 + x 2 ) π (1 + x 2 )
Ova raspodjela gustoće vjerojatnosti se
naziva C AUCHYJEVA raspodjela (odjeljak
4.2.11). Iz gornjeg izraza i slike vidimo
da nemaju sve točke apscise jednaku vje-
rojatnost da ih presječe pravac: što su
točke dalje od ishodišta (veći x) vjerojatnost
je manja. Primjetimo da kutu θ iz inter-
vala (−π/2, +π/2), odgovara x iz intervala
(−∞, +∞). Provjerimo na kraju i normira-
nje vjerojatnosti

Z +∞ Z +∞ +∞
dx 1
dP ( x ) = arctan( x ) = 1.

2
=
−∞ −∞ π (1 + x ) π −∞


Zadatak 3.1 Unutar intervala [0, 1], nasumično se odabiru dva broja x i y. Odredite
vjerojatnost da bude: (a) x > y, (b) x + y < 3/2, (c) x = y. 

Rješenje:
(a) Nacrta se pravac y = x, a tražena vjerojatnost je jednaka omjeru ploštine površine označenog
trokuta sa slike 3.4 i ploštine površine jediničnog kvadrata

Slika 3.4: Tražena površina je unutar kvadrata i ispod pravca x = y.

y
x
=
y

x
1

ploština površine trokuta 0.5 1


Pa = = = .
ploština površine kvadrata 1 2
(b) Nacrta se pravac y = − x + 3/2, a tražena vjerojatnost je jednaka omjeru ploštine označene
površine sa slike 3.5 i ploštine površine jediničnog kvadrata
ploština površina osjenčenog dijela 7/8 7
Pb = = = .
ploština površina kvadrata 1 8
110 Poglavlje 3. Nasumične varijable

Slika 3.5: Tražena površina je unutar kvadrata i ispod pravca x = − x + 3/2.

y
=

x
+
3
2
x
1

(c) Nacrta se pravac y = x (slika 3.6, a tražena vjerojatnost je jednaka omjeru ploštine "površine"
tog pravca (koja je jednaka nuli) i ploštine površine jediničnog kvadrata

Slika 3.6: Plotina površine pravca x = y je nula.

y
x
=
y

x
1

"ploština" površine pravca 0


Pc = = = 0.
ploština površina kvadrata 1

Zadatak 3.2 Trenutak u kome signal stiže do prijemnika je nasumična varijabla iz


intervala [0, T ]. Prijemnik neće registrirati drugi signal, ukoliko je
razlika izmed̄u dva uzastopna signala manja od τ, za τ  T. Odredite
vjerojatnost da prijemnik ne registrira drugi signal. 

Rješenje:
dovršiti
Zadatak 3.3 Nasumično se odabiru brojevi x ∈ [0, 1] i y ∈ [0, 2]. Izračunajte vjerojat-
nost da zbroj x + y bude veći od dva, a umnožak xy manji od jedan.


Rješenje:
dovršiti
3.3 Kontinuirane nasumične varijable 111

Zadatak 3.4 Kontinuirana nasumična varijabla x je opisana gustoćom vjerojatnosti

 A cos(2x ), −π/4 < x < π/4,


ρ( x ) =
0, inače .

(a) Izračunajte A.
(b) Izračunajte funkciju raspodjele.
(c) Izračunajte P(0 < x < π/8). 

Rješenje:
(a)
Konstanta A se računa iz uvjeta normiranja vjerojatnosti
Z Z π/4
1= ρ( x ) dx = A cos(2x ) dx = · · · = A.
−π/4

(b)
Za −π/4 ≤ x ≤ π/4, funkcija raspodjele se računa prema (3.6)
Z x Z x
1
F(x) = ρ(u) du = cos(2u) du = [sin(2x ) + 1],
−∞ −π/4 2

0, x ≤ −π/4,






1
F(x) = 2 [sin(2x ) + 1], −π/4 ≤ x ≤ π/4,




1, x ≥ π/4.

(c)
Tražena se vjerojatnost računa prema (3.4)

2
Z π/8
P(0 < x ≤ π/8) = cos(2x ) dx = · · · = .
0 4

Zadatak 3.5 Kontinuirana nasumična varijabla x iz intervala [2, 8], opisana je gus-
toćom vjerojatnosti jednakom a( x + 3), gdje je a konstanta. (a) Izra-
čunajte a. (b) Izračunajte P(3 < x < 5). (c) Izračunajte P( x ≥ 4). (d)
Izračunajte P(| x − 5| < 0.5). 

Rješenje:
(a)
Z 8 8
x2

a ( x + 3) dx = 1=a 2 + 3x = a 48,
2 2

1
=⇒ a =
48
112 Poglavlje 3. Nasumične varijable

(b)
Z 5
1 7
P (3 < x < 5) = ( x + 3) dx = · · · = .
48 3 24
(c)
Z 8
1 3
P ( x ≥ 4) = ( x + 3) dx = · · · = .
48 4 4
(d)
Z 5.5
1 1
P(| x − 5| < 0.5) = ( x + 3) dx = · · · = .
48 4.5 6

3.3.2 Više kontinuiranih nasumičnih varijabla


Slično diskretnim varijablama, moguće je promatrati raspodjele više nasumičnih konti-
nuiranih varijabla. Radi jednostavnosti, ograničimo se opet na dvije: x1 i x2 . One mogu
poprimati vrijednosti iz intervala x1 ∈ ( a, b), x2 ∈ (c, d). Funkcija gustoće vjerojatnosti
ρ( x1 , x2 ) je funkcija sa slijedećim svojstvima:

(1) ρ( x1 , x2 ) ≥ 0, ∀ x1 , x2 ,
Z b Z d
(2) dx1 dx2 ρ( x1 , x2 ) = 1, normiranje (3.8)
a c
Z x1,k Z x2,k
(3) P( x1,p ≤ x1 ≤ x1,k , x2,p ≤ x2 ≤ x2,k ) = dx1 dx2 ρ( x1 , x2 ),
x1,p x2,p

gdje je s P( x1,p ≤ x1 ≤ x1,k , x2,p ≤ x2 ≤ x2,k ) označena vjerojatnost da vrijednosti varijabla


x1 i x2 budu unutar označenog područja. U skladu s gornjom definicijom,

dP ( x1 , x2 ) = ρ( x1 , x2 ) dx1 dx2

je vjerojatnost da varijabla x1 poprimi vrijednost iz intervala ( x1 , x1 + dx1 ), a varijabla x2


iz intervala ( x2 , x2 + dx2 ). U nastavku izlaganja ćemo, radi jednostavnosti, smatrati da
je ( a, b) = (−∞, +∞), kao i da je (c, d) = (−∞, +∞). Poopćenje gornjih pojmova na N
nasumičnih varijabla je očito.

Takod̄er je koristan i pojam KUMULATIVNE FUNKCIJE RASPODJELE F ( x1 , x2 , · · · ), koja


predstavlja vjerojatnost da nasumična varijabla poprimi bilo koju vrijednost manju od
neke unaprijed zadane vrijednosti x j (usporediti s (3.6)).
Z x1 Z x2
F ( x1 , x2 , · · · ) = dη 1 dη 2 ρ(η1 , η2 , · · · ). (3.9)
−∞ −∞

Prema definicijama (3.8) i (3.9) je (za npr. dvije varijable)


Z x1,k Z x2,k
P( x1,p ≤ x1 ≤ x1,k , x2,p ≤ x2 ≤ x2,k ) = dη 1 dη 2 ρ(η1 , η2 ) = F ( x1,k , x2,k ) − F ( x1,p , x2,p ).
x1,p x2,p

Ovaj izraz ujedno i definira funkciju F kao primitivnu funkciju gustoće vjerojatnosti, tj.

∂2 F ( x1 , x2 )
ρ ( x1 , x2 ) = . (3.10)
∂x1 ∂x2
3.3 Kontinuirane nasumične varijable 113

S TATISTI ČKA ( NE ) OVISNOST


Kada se govori o više nasumičnih varijabla, tada je važan i pojam statističke neovisnosti.
Za dvije nasumične (stohastične) varijable x1 i x2 se kaže da su statistički neovisne, ako se
njihova zajednička gustoća vjerojatnosti može napisati u obliku umnoška vjerojatnosti
pojedinih varijabla

ρ ( x1 , x2 ) = ρ1 ( x1 ) ρ2 ( x2 ). (3.11)

Ako su varijable med̄usobno ovisne tada

ρ ( x1 , x2 ) 6 = ρ1 ( x1 ) ρ2 ( x2 ).

I općenito za N neovisnih varijabla je

ρ ( x1 , x2 , · · · , xN ) = ρ1 ( x1 ) ρ2 ( x2 ) · · · ρ N ( xN ). (3.12)

Ako su varijable med̄usobno ovisne tada

ρ ( x1 , x2 , · · · , xN ) 6 = ρ1 ( x1 ) ρ2 ( x2 ) · · · ρ N ( xN ). (3.13)

 Primjer 3.7 S TATISTI ČKA ( NE ) OVISNOST Gustoća vjerojatnosti kontinuiranih nasumič-


nih varijabla x i y je dana sa

 k e−(x+2y) , x > 0, y > 0,


ρ( x, y) =
0 inače ,

gdje je k konstanta. Jesu li x i y med̄usobno ovisne ili neovisne varijable? Izračunajte k.


Izračunajte P( x > 1, y < 1), P( x < y), P( x ≤ 2).

ρ( x, y) = k e−(x+2y) = k1 e− x · k2 e−2y ≡ ρ1 ( x ) ρ2 (y), k ≡ k1 · k2 ,

pa su varijable x i y statistički neovisne.


Z
ρ( x, y) dx dy = 1,
Z ∞ Z ∞
k e− x dx e−2y dy = 1 ⇒ k = 2.
0 0

Z ∞ Z 1
P( x > 1, y < 1) = 2 e −x
dx e−2y dy = e−1 − e−3
1 0
Z ∞ Z y
−2y 1
P( x < y) = 2 e dy e− x dx = ,
0 0 3
Z ∞ Z 2
P ( x < 2) = 2 e−2y dy e− x dx = 1 − e−2 .
0 0


G EOMETRIJSKE VJEROJATNOSTI
Kao poseban slučaj vjerojatnosti opisan kontinuiranim nasumičnim varijablama, navo-
dimo geometrijske vjerojatnosti (ne treba ih pomiješati s geometrijskom raspodjelom
vjerojatnosti iz odjeljka 4.1.2). One mogu biti opisane s jednom ili s više varijabla.
I ovdje se vjerojatnost računa po općem receptu koji je izložen na početku: povoljno
kroz moguće. Radi lakšeg razumjevanja, evo nekoliko primjera.
114 Poglavlje 3. Nasumične varijable

 Primjer 3.8 J EDNA DIMENZIJA


Kolika je vjerojatnost da se nasumično odabrana točka na liniji AD, nalazi unutar linije
BC? (slika 3.7.A)
Ako napravimo posve razumnu pretpostavku da je odabir svake točke unutar linije AD
jednako vjerojatan, tada je tražena vjerojatnost očito jednaka omjeru duljina zadanih
linija (povoljno kroz moguće)

Z C
dl
BC
P= = Z BD .
AD
dl
A

Primjetimo da ovdje ne računamo vjerojatnost odabira odred̄ene točke, već vjerojatnost


da ta točka pripada luku krivulje. 

Slika 3.7: (a) Ilustracija računa vjerojatnosti da se nasumično odabrana točka na liniji AD,
nalazi unutar linije BC. (b) Ilustracija računa vjerojatnosti da se nasumično odabrana
točka iz područja A, nalazi unutar područja B.

( a) (b)

B
A C B
D
A

 Primjer 3.9 D VIJE DIMENZIJE


Slično se može formulirati i dvodimenzijski problem (slika 3.7.B): kolika je vjerojatnost
da se nasumično odabrana točka iz područja A nalazi u području B?
Iz pretpostavke da je odabir svake točke iz A jednako vjerojatan, slijedi da je tražena
vjerojatnost jednaka omjeru ploština površina B i A (opet povoljno kroz moguće)

Z
dx dy
P = ZB .
dx dy
A

Primjer 3.10 K RUG I KRUŽNICA


U krugu polumjera R sa središtem u točki O, odaberu se proizvoljno dvije
3.3 Kontinuirane nasumične varijable 115

točke T1 i T2 . Kolika je vjerojatnost da će


kružnica sa središtem u T1 i polumjera T1 T2
ležati unutar zadanog kruga (slika lijevo).
T2
T1 Odredimo najprije položaj točke T1 . Vjero-
jatnost da se T1 nalazi negdje unutar kruž-
nog vijenca unutarnjeg polumjera r i vanj-
skog r + dr, je jednaka omjeru površina vi-
O r jenca i cijelog kruga
R (r + dr ) 2 π − r 2 π
dP1 =
R−r R 2π
1 2
= 2 (2r dr + (dr ) 2 ) ≈ 2 r dr .
R R

Da bi se kružnica sa središtem u T1 ležala unutar zadanog kruga, njezin polumjer mora


biti najviše jednak R − r. Vjerojatnost P2 da će T2 ležati unutar kružnice sa središtem u
T1 i polumjera R − r je jednaka omjeru površina ova dva kruga

(R − r) 2 π R 2 − 2Rr + r 2
P2 = = .
R 2π R2
Tražena vjerojatnost je i vjerojatnost: T1 se mora nalaziti izmed̄u r i r + dr (ta je vjerojat-
nost dana sa dP1 ) i T2 se mora nalaziti unutar kruga polumjera R − r (ta je vjerojatnost
dana sa P2 )
2
dP = dP1 · P2 = ( R 2 r − 2Rr 2 + r 3 ) dr .
R4
Budući da r može imati bilo koju vrijednost izmed̄u 0 i R, to je ukupna vjerojatnost
jednaka
Z R Z R
2 1
P= dP = ( R 2 r − 2Rr 2 + r 3 ) dr = .
0 R4 0 6


Zadatak 3.6 Na dužini duljine a se označe dvije točke x i y kao na slici. Kolika je

vjerojatnost da je udaljenost iz-


b
med̄u x i y veća od zadane duljine
b?

x y

Rješenje:
Odredimo najprije položaje točaka x i y. Vjerojatnost da x leži unutar intervala ( x, x + dx ) je
116 Poglavlje 3. Nasumične varijable

jednaka dx /a. Vjerojatnost da y leži unutar intervala (y, y + dy) je jednaka dy /a. Vjerojatnost
da x leži unutar intervala ( x, x + dx ) i da y leži unutar intervala (y, y + dy) je jednaka

dx dy dx dy
dP = · = .
a a a2

Ukupnu vjerojatnost odred̄ujemo integriranjem dP uz uvjete na granice integracije tako da budu


zadovoljeni zahtjevi iz zadatka: x može biti bilo koja točka izmed̄u 0 i a − b (kada bi x bio izvan
ovih granica, tada udaljenost od x do y ne bi mogla biti veća od b); iz istog razloga, y mora ležati
desno od x + b, a lijevo od a

Z a−b Z a Z a−b
1 2
P=2 dx dy = ( a − x − b) dx
a2 0 x +b a2 0
a−b 2
 a−b
2 1 2 1
  
= ax − x 2 − bx = 2 ( a − b) 2 =
a2 2 0 a 2 a

Množitelj 2 dolazi od one druge mogućnosti u kojoj je y lijevo od x. Simbolički

P = P ( x < y ) + P ( y < x ) = 2 P ( x < y ).

Zadatak 3.7 Nasumičnim postupkom se odabire broj iz intervala [0, 1]. Kolika je
vjerojatnost da će dvadest osma znamenka u njegovom decimalnom
zapisu biti veća od pet? 

Rješenje:
Budući da je postupak odabira broja posve nasumičan, na dvadest osmoj decimali (kao i na bilo
kojoj drugoj decimali) može biti bilo koja znamenka izmed̄u 0 i 9. Znamenaka većih od 5 ima
četiri: 6, 7, 8, 9, pa je zato tražena vjerojatnost jednaka

4
P= .
10

Zadatak 3.8 Mladić i djevojka se dogovore da će se sastati na starom kamenom


mostu u vrijeme izmed̄u 20 i 21 sata. Tko dod̄e prvi čekat će najviše 20
minuta. Kolika je vjerojatnost da se mladić i djevojka sastanu? 

Rješenje:
Budući da će i mladić i djevojka sigurno doći na odred̄eno mjesto unutar jednog sata, to se
3.4 Usrednjavanje 117

d potpuni skup dogad̄aja može prikazati kao kva-


drat duljine stranice 60 minuta (slika ). Crvena
6O isprekidana linija predstavlja istovremeni dola-
zak mladića i djevojke. Povoljni su svi oni doga-
d̄aji kod kojih je razlika izmed̄u dolaska mladića i
djevojke manja ili jednaka 20 minuta. Označimo
li vrijeme dolaska mladića s m, a djevojke s d,
tada se ovaj uvjet piše kao

d = m − 20,
2O
ako je djevojka stigla prije mladića, ili

m d = m + 20,
2O 6O
ako je djevojka stigla poslije mladića
(crtkano područje izmed̄u dvije crne dužine na slici ). Tražena vjerojatnost je jednaka omjeru
površine omed̄ene kvadratom i pravcima i površine cijelog kvadrata

(60−20) 2 (60−20) 2
60 2 − 2 − 2 5
P= = .
60 2 9

3.4 Usrednjavanje
3.4.1 Osnovi teorije igara
Matematičko očekivanje se definira u terminima igara na sreću na slijedeći način: u
nekoj igri na sreću, vjerojatnost da će igrač osvojiti DOBITAK iznosa D, je p. Tada je
matematičko očekivanje (vjerojatnost dobitka), E, veličina definirana izrazom

E = p D. (3.14)

U gornjem izrazu treba uzeti u obzir i mogućnost gubitka uloga (gubitak se shvaća kao
dobitak iznosa nula) s vjerojatnošću 1 − p, pa bi nadopunjena gornja relacija glasila

E = p · D + (1 − p) · 0.

To je primjer ili vjerojatnosti: ili se dobije D s vjerojatnoššću p, ili se dobije 0 s vjerojat-


nošću 1 − p. Na taj način je vjerojatnost normirana, tj. zbroj svih vjerojatnosti (dobitka i
gubitka) jednak je jedan, kao što i treba biti.
Ako je ULOG igrača jednak E, igra se smatra PRAVEDNOM. Prirodno je gornji izraz
poopćiti na igru s više dobitaka: ako u igri postoji N dobitaka (od kojih je jedan zapravo
gubitak), iznosa Dn , od kojih svaki ima vjerojatnost pn da će ga igrač osvojiti, tada se
matematičko očekivanje definira kao zbroj matematičkih očekivanja svakog pojedinog
dobitka (ili će se s vjerojatnošću p 1 ostvariti dobitak D1 ili će se s vjerojatnošću p 2
ostvariti dobitak D2 ili ... itd. ...)
N
E= ∑ p n Dn , (3.15)
n =1
118 Poglavlje 3. Nasumične varijable

(usporedite s (3.20)). Naravno da, kao i uvijek, zbroj svih vjerojatnosti mora dati
jedinicu6 (normiranje vjerojatnosti)
N
∑ pn = 1.
n =1

Evo ilustracije na primjeru ruleta.


 Primjer 3.11 R ULET
Rulet se sastoji od 37 polja od kojih je 18 crvenih, 18 crnih i jedno je bijelo. Ako igrač
uloži iznos E na jednu boju i kuglica se zaustavi na toj boji, igrač dobiva dvostruko od
uloženog, ako se kuglica zaustavi na bijelom polju, ulog ostaje za slijedeću igru, a ako se
kuglica zaustavi na polju s onom drugom bojom, igrač gubi ulog. U terminima gornjih
formula to znači da postoje tri moguća dobitka: prvi je dobitak jednak dvostrukom
ulogu,

D1 = 2 · E,

a vjerojatnost ovog dobitka je


18
P (1) = ,
37
drugi je dobitak jednak ulogu

D2 = 1 · E,

a vjerojatnost je
1
P (2) = ,
37
treći dobitak je

D3 = 0 · E

(pa je to zapravo gubitak uloga) s vjerojatnošću


18
P (3) = .
37
Iz (3.15) se vidi da se za matematičko očekivanje dobije
3
18 1 18
∑ Dn P ( n ) =
37
· 2E +
37
· 1E +
37
· 0 = E,
n =1

iz čega slijedi da je rulet pravedna igra . Uvjerimo se još i da je vjerojatnost normirana


3
18 1 18
∑ P(n) = + +
37 37 37
= 1.
n =1


 Primjer 3.12 B ACANJE KOVANICE


dovršiti 

6 Jedan od Dn ima vrijednost nula, tj. to je gubitak uloga


3.4 Usrednjavanje 119

Zadatak 3.9 Mirko i Slavko igraju sa dvije kocke. Mirko dobiva ako padne zbroj
sedam, a Slavko ako padne zbroj deset. Dobitak iznosi 1 200 kn. Ako
ne padne ni zbroj sedam ni zbroj deset, svaki od igrača dobiva 600 kn.
Koliki moraju biti ulozi Mirka i Slavka, pa da igra bude pravedna? 

Rješenje:

Mirko Ω7 : {(1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)} , N7 = 6,

Slavko Ω10 : {(4, 6), (5, 5), (6, 4)} , N10 = 3.


Postoji 6 načina da zbroj bude 7, postoje 3 načina da zbroj bude 10 i postoji 36 − 6 − 3 = 27
načina da zbroj ne bude ni 7 ni 10. Zato su vjerojatnosti dane sa
6 1
p7 = = ,
36 6
3 1
p10 = = ,
36 12
27 3
postalo = = .
36 4
Prema uvjetima zadatka, očekivani dobici su
EMirko = p7 · 1 200 + postalo · 600 + p10 · 0 = 650,
ESlavko = p7 · 0 + postalo · 600 + p10 · 1 200 = 550.
EMirko + ESlavko = 650 + 550 = 1 200.
Da bi igra bila pravedna, Mirko treba uložiti 650 kn, a Slavko 550 kn.

Zadatak 3.10 Mirko se kladi sa Slavkom da će sa tri kocke u jednom bacanju pogoditi
zbroj 15. Ako Mirko ulaže iznos od 10 kuna, koliko mora Slavko
isplatiti Mirku, pa da igra bude pravedna 

Rješenje:
Bacajući tri kocke, postoji 6 3 raznih mogućih kombinacija zbrojeva, od čega njih 10 vodi na zbroj
15
Ω15 = {(6, 6, 3), (6, 3, 6), (3, 6, 6), (6, 5, 4), (6, 4, 5),
(5, 6, 4), (4, 6, 5), (5, 4, 6), (4, 5, 6), (5, 5, 5)}
Zato je vjerojatnost da Mirko dobije okladu, tj.da se pokaže zbroj 15 jednaka
10
p15 = .
216
Uvjet za pravednu igru je da je matematičko očekivanje jednako ulogu,
E = p D,
pa je Mirkov ulog E = 10 kn, a Slavkov ulog je D (u ovom primjeru Slavkov ulog je dobitak sa
Mirkovog stanovišta).
10
10 = D ⇒ D = 216.
216
Ako Mirko zaista s tri kocke u jednom bacanju okrene zbroj 15, Slavko mu mora isplatiti 216
kuna. S druge strane, ako se to ne dogodi, Slavko dobiva Mirkovih 10 kuna.
120 Poglavlje 3. Nasumične varijable

Zadatak 3.11 Evo jednog primjera igranja tombole. U jednoj kutiji se nalazi 90 plo-
čica označenih brojevima od 1 do 90. Prije početka igre, igrač označi tri
broja na koja igra. Zatim se iz kutije nasumično izvuče pet brojeva. Uko-
liko se tri igračeva broja nalaze med̄u tih 5 izvučenih brojeva, on dobiva
20 000 kuna. Koliki mora biti njegov ulog, da bi igra bila pravedna? 

Rješenje:
Da bi igra bila pravedna, igračev ulog mora biti jednak matematičkom očekivanju E, gdje je
E = pD. U tom je izrazu p vjerojatnost da se izvuku njegova tri broja, a D je dobitak od
20 000 kn. Izračunajmo p kao omjer povoljnih i svih mogućih kombinacija. Od 90 brojava, njih
5 se može odabrati na (90 5 ) načina. Koliko ima povoljnih kombinacija? Ako sam od 90 brojeva
izdvojio tri koja dobivaju, ostalo ih je još 87. Od tih 87 mogu izabrati još bilo koja 2 broja (jer se
ukupno izvlači 5 brojeva) na (87 2 ) načina. Zato je

(33)(87
2) 1 1
p = = = ,
(90
6 · 22 · 89 11 748
5)
1
E = pD = · 20 000 = 1.7 .
11 748

Igrač treba uložiti 1.7 kuna.

3.4.2 Srednje vrijednosti


Promatra se jedno diskretno ili kontinuirano obilježje x na osnovnom skupu. Svaki po-
jedini element skupa može imati različite vrijednosti tog obilježja. Osnovna informacija
vezana za skup i obilježje x je SREDNJA VRIJEDNOST obilježja. Na odred̄eni način ona
opisuje vrijednost obilježja pridruženu osnovnom SKUPU KAO CJELINI (a ne svakom
pojedinom elementu). Najčešće se koriste tri načina računanja srednjih vrijednosti:

1. aritmetička sredina,

2. geometrijska sredina,

3. harmonijska sredina.

A RITMETI ČKA SREDINA

 Primjer 3.13 S REDNJA OCJENA Prisjetimo se primjera 3.3 i računa srednje ocjene, h x i,
učenika nekog razreda iz nekog odred̄enog predmeta: zbrojimo ocjene, xn , svih učenika
i podjelimo brojem učenika, N (aritmetička sredina)

x1 + x2 + . . . + xN
hxi = .
N
No, gornji se postupak može provesti i drukčije: u zbroju x1 + x2 + . . . + xN postoji puno
istih vrijednosti, jer ocjene mogu biti samo prirodni brojevi izmed̄u 1 i 5. prebrojimo
koliko med̄u njima ima jedinica, koliko dvojki itd. i te brojeve nazovemo N1 , N2 , . . . i
gornju srednju vrijednost napišemo u obliku

1 · N1 + 2 · N2 + 3 · N3 + 4 · N4 + 5 · N5
hxi = , N = N1 + N2 + N3 + N4 + N5 .
N
3.4 Usrednjavanje 121

Sada se možemo zapitati: kolika je vjerojatnost da nasumično odabrani učenik ima


ocjenu x ∈ {1, 2, 3, 4, 5}? Prema definiciji vjerojatnosti a posteriori, ..., za veliki N ta je
vjerojatnost jednaka
Nx
P( x ) = , x = 1, 2, 3, 4, 5.
N
S tim u skladu, gornja srednja vrijednost (aritmetička sredina) se može napisati u obliku

5
hxi = ∑ x P ( x ).
x =1

Ovim postupkom je uvedena raspodjela vjerojatnosti, P( x ), za ovaj jednostavan pro-


blem. Primjetimo da je raspodjela normirana
5
∑ P( x ) = 1.
x =1

Poopćenjem ovog postupka se vidi kako porijeklo i smisao uvod̄enja pojma raspodjele
vjerojatnosti: to je skraćeni način da se zapiše aritmetička sredina. No, kada je raspodjela
vjerojatnosti jednom uvedena, ona može poslužiti i za račun drugih karakterističnih
veličina kojima se opisuju nasumični dogad̄aji.
Naravno da u ovom primjeru dobivanje odred̄ene ocjene nije nasumičan dogad̄aj sa
stanovišta pojedinog učenika, jer to ovisi o njegovom angažmanu oko danog predmeta,
no sa stanovišta vanjskog promatrača koji nasumuce odabire jednog učenika, njegov
odabir, tj. učenikova ocjena je potpuno nasumičan dogad̄aj. 

Neka je P( x ) vjerojatnosti da diskretna realna nasumična varijabla ima vrijednosti iz


skupa { x1 , x2 , . . . , xn }. Ili, za kontinuiranu nasumičnu varijablu x, neka je ρ( x ) pridru-
žena gustoća vjerojatnosti. Tada se aritmetička srednja vrijednost nasumične varijable x
definira kao
N Z
A( x ) = ∑ xn · P(n)  x ρ( x ) dx ≡ h x i .
n =1

Ako je x diskretna nasumična varijabla, za aritmetičku sredinu se može dobiti broj


/ { x1 , x2 , . . . , xn }. Ako su sve vjerojatnosti med̄usobno jednake, pn = 1/N, tada je
A( x ) ∈
A( x ) jednostavno
N
!
1
N n∑
A( x ) ≡ x = xn .
=1

Aritmetička sredina se kraće može izračunati pomoću težina ili relativnih frekvencija.
Neka obilježje x može poprimiti M različitih vrijednosti xm s pripadnim težinama tm za
m = 1, 2, · · · , M. Tada je
M M
1
x=
N ∑ xm tm , ∑ tm = N. (3.16)
m =1 m =1

Aritmetička sredina se može računati i preko relativnih frekvencija f rel = tm /N


M M
x= ∑ xm f mrel , ∑ f mrel = 1. (3.17)
m =1 m =1
122 Poglavlje 3. Nasumične varijable

 Primjer 3.14 V ODIKOV ATOM


U kvantnoj mehanici je diferencijal vjerojatnosti nalaženja elektrona u malom volumenu
oko zadane točke, dan sa

dP (~r ) = kΨk 2 d3 r ,

gdje je Ψ(~r ) valna funkcija elektrona dobivena rješavanjem Schrödingerove valne


jednadžbe. Za elektron u 1 s stanju atoma vodika, valna funkcija je

Ψ1 s (~r ) = N e−r/a0 ,

gdje je N konstanta normiranja valne funkcije, a a0 je Bohrov polumjer. Zadatak je


izračunati srednju vrijednost udaljenosti 1 s elektrona od središta atoma vodika.
Najprije treba odrediti konstantu normiranja. Ona se lako dobiva iz uvjeta normiranja
vjerojatnosti, točka (2) iz (3.4),
Z Z Z
1= kΨ1 s k 2 d3 r = N 2 e−2r/a0 r 2 dr sin(θ ) dθ dϕ = N 2 e−2r/a0 r 2 dr 4π.

Integral po r je tablični integral (povezan s gama funkcijom7 , pa se za N konačno dobiva

1
N2= .
π a03
Tražena srednja udaljenost 1 s elektrona od središta atoma je tada, prema (3.27),
Z ∞
1 3
Z
hr i ≡ h1s|r |1si = r kΨ1 s k 2 d3 r = 4π r 3 e−2r/a0 dr = a0 .
π a03 0 2
Ova se udaljenost obično naziva polumjer atoma. 

Zadatak 3.12 Osnovni skup su svi polaznici kolegija Osnove fizičih mjerenja i statističke
analize, a promatrano obilježje x je ocjena na prvom kolokviju. Od 47
polaznika njih 7 je ocjenjeno s odličnim, 16 s vrlo dobrim, 13 sa dobrim,
5 s dovoljnim, a 6 sa nedovoljnim. Treba izračunati aritmetičku sredinu
ocjene za sve polaznike. 

Rješenje:
Broj elemenata osnovnog skupa je N = 47. Promatrano obilježeje (ocjena) može imati M = 5
različitih vrijednosti x = 1, 2, 3, 4, 5 s težinama

t( x = 1) = 6, t( x = 2) = 5, t( x = 3) = 13, t( x = 4) = 16, t( x = 5) = 7,

tj. s relativnim frekvencijama f rel ( x )


6 5 13 16 7
f rel (1) = , f rel (2) = , f rel (3) = , f rel (4) = , f rel (5) = .
47 47 47 47 47
Aritmetičku sredinu računamo pomoću (3.16) ili (3.17)
M
1
x= ∑ x f rel ( x ) =
47
(6 · 1 + 5 · 2 + 13 · 3 + 16 · 4 + 7 · 5) = 3.28 .
x =1
7 Vidjeti npr. odjeljak o specijalnim funkcijama u G LUMAC, Matematičke metode fizike
3.4 Usrednjavanje 123

Krivulja frekvencija je prikazana na slici ??.

G EOMETRIJSKA SREDINA
Neka je P(n) vjerojatnosti da diskretna realna nasumična varijabla ima vrijednosti iz
skupa { x1 , x2 , . . . , xn }. Ili, za kontinuiranu nasumičnu varijablu x, neka je ρ( x ) pridru-
žena gustoća vjerojatnosti. Tada se geometrijska srednja vrijednost nasumične varijable
xn definira kao
N
G(x) = ∏ ( xn ) P(n) .
n =1

Primjetimo da je G ( x ) = 0 čim je bar jedna od varijabla xn = 0. Ako su sve vjerojatnosti


med̄usobno jednake, P(n) = 1/N, tada je G ( x ) jednostavno N-ti korjen iz umnoška
! 1/N
N
G(x) = ∏ xn .
n =1

Gornji je postupak kraći, ako računamo s težinama


G ( x ) = ( x1t1 · x2t2 · . . . · x tMM )1/N .
Geometrijska sredina se koristi npr. u analizi skupova koji rastu (u vremenu) s ge-
ometrijskom progresijom (kao što je to npr. porast stanovnika neke države, kretanje
cijena ili što slično). Zbog visokih potencija koje se pojavljuju u računu, geometrijski je
sredinu nešto teže računati nego aritmetičku. Veza aritmetičke i geometrijske sredine se
uspostavlja logaritmiranjem
N
1
ln [ G ( x )] = ∑ P(n) ln( xn ) =
N
[t1 ln( x1 ) + t2 ln( x2 ) + · · · + t M ln( x M )],
n =1

tj. logaritam geometrijske srednje vrijednosti x je jednak aritmetičkoj sredini varijable


ln( x ). Za kontinuiranu varijablu je
Z
ln [ G ( x )] = ln( x ) ρ( x ) dx .

Zadatak 3.13 Geometrijska sredina skupa iz prethodnog primjera je

g = (16 · 25 · 313 · 416 · 57 )1/47 = 2.97 < x .

Rješenje:
dovršiti

H ARMONIJSKA SREDINA
Neka je P(n) vjerojatnosti da diskretna realna nasumična varijabla ima vrijednosti iz
skupa { x1 , x2 , . . . , xn }. Ili, za kontinuiranu nasumičnu varijablu x, neka je ρ( x ) pridru-
žena gustoća vjerojatnosti. Tada se harmonijska srednja vrijednost, H ( x ), nasumične
varijable xn definira kao
N Z +∞
1 1 1
= ∑ P(n) = ρ( x ) dx . (3.18)
H ( x ) n =1 xn −∞ xn
124 Poglavlje 3. Nasumične varijable

Recipročna vrijednost harmonijske sredine varijable x je jednaka aritmetičkoj sredini


varijable 1/x. Ako su sve vjerojatnosti med̄usobno jednake, P(n) = 1/N, tada je H ( x )

1 1 1 1 1 t1 t2 t
   
= + 00 + · · · = + + ··· + M .
H N x0 x N x1 x2 xM

Harmonijska sredina se pojavljuje kod računa srednjeg vremena u odred̄enim procesima,


kod opisa gibanja dva tijela (reducirana masa), kod Zipf-Mandelbrotove raspodjele u
odjeljku 4.1.9 i slično.

Poopćeni harmonijski brojevi

N
1
H ( N, α) = ∑ nα
.
n =1

Zadatak 3.14 Harmonijska sredina skupa iz prethodnog primjera je

1 1 6 5 13 16 7
 
= + + + + ⇒ h = 2.58 < g.
h 47 1 2 3 4 5


Rješenje:
dovršiti

Na ovim primjerima primjećujemo i općenito svojstvo ovih sredina

H ( x ) < G ( x ) < A ( x ).

M OD , KVARTILI ( MEDIJAN )
Osim navedenih srednjih vrijednosti, često se koriste i slijedeće veličine: mod i kvartili
(medijan).

Mod je ona vrijednost statističkog obilježja x koja je u skupu zastupljena najvećim


brojem članova. U zadatku 3.12 to je ocjena 4, jer nju ima najveći broj elemenata skupa.
Na slici 3.8, to je točka mod (najveća vrijednost ordinate),

d f rel

= 0.
dx x=mod

Ako postoji samo jedan maksimum, raspodjela je unimodalna, a ako postoje dva ili više
maksimuma, raspodjela je bimodalna ili multimodalna. Točka u kojoj raspodjela ima
minimalnu vrijednost, zove se antimod. Ako je raspodjela simetrična i unimodalna,
tada su mod, medijan i aritmetička sredina med̄usobno jednaki. Za diskretne varijable,
MEDIJAN, µ predstavlja onu vrijednost obilježja koja ima svojstvo da je broj elemenata sa
vrijednošći manjom ili jednakom medijanu, jednak broju elemenata s vrijednošću većom
ili jednakom medijanu i jednak 1/2 za kontinuirane, tj. N/2 za diskretne varijable
Z +∞
1
Z µ
ρ( x ) dx = ρ( x ) dx = .
−∞ µ 2
3.4 Usrednjavanje 125

Slika 3.8: Ilustracija moda mod i aritmetičke


sredine X . Slika 3.9: Ilustracija sva tri kvartila.

ρ (x)
ρ (x)

mod x K2
x
X K 1
K3

Postoje tri kvartila, K1 , K2 , K3 , koji površinu ispod krivulje ρ( x ) dijele na četiri jednaka
dijela. Oni predstavljaju vrijednosti nezavisne varijable x sa slijedećim svojstvima (slika
3.9), a mogu se izraziti preko kumulativne funkcije (3.6),
Z K1
1
ρ( x ) dx = P( x ≤ K1 ) = F (K1 ) = ,
−∞ 4

Z K2
2
ρ( x ) dx = P( x ≤ K2 ) = F (K2 ) = ,
−∞ 4

Z K3
3
ρ( x ) dx = P( x ≤ K3 ) = F (K3 ) = .
−∞ 4
drugi kvartil se naziva i medijan i prema gornjoj definiciji ima svojstvo da je površna
ispod krivulje sa slike 3.9 lijevo od okomice kroz K2 jednaka površini desno od okomice.
Prvi se kvartil još naziva i donji, a treći se kvartil naziva i gornji kvartil. Lijevo od
okomice kroz prvi kvartil se nalazi četvrtina površine ispod krivulje, a lijevo od trećeg
kvartila se nalazi tri četvrtine površine.
Slično, prvi kvartil predstavlja onu vrijednost obilježja koja ima svojstvo da je broj ele-
menata sa vrijednošći manjom ili jednakom prvom kvartilu jednaka N/4. Treći kvartil
predstavlja onu vrijednost obilježja koja ima svojstvo da je broj elemenata sa vrijednošći
manjom ili jednakom prvom kvartilu jednaka 3N/4.
Kod nekih raspodjela se može dogoditi da neke od ovih karakterističnih vrijednosti
budu med̄usobno jednake.

MEDIJAL Medijal m se definira jedna polovina aritmetičke sredine


Z m
1
xρ( x ) dx = A ( x ).
−∞ 2

 Primjer 3.15 Izračunajte mod raspodjele gustoće vjerojatnosti udaljenosti elektrona od


ishodišta
4r 2 −2r/a0
ρ (r ) = e .
a03
126 Poglavlje 3. Nasumične varijable

dovršiti 

Primjer 3.16 R A ČUN BROJA e


Postoji nekoliko načina definiranja i računanja broja e ≈ 2.718 281 828 459 045 235 36 . . .,
baze prirodnog logaritma: preko integrala
Z e
dx
= 1,
1 x
preko zbroja

1
e= ∑ n! ,
n =1

ili kao limes


N
1

e = lim 1+ .
N →∞ N
U ovom primjeru će se pokazati kako se broj e može izračunati kao aritmetička sredina
jednog niza nasumičnih brojeva. Nasumice se redom odabiru brojevi iz intervala [0, 1].
Pokus okončava onda kada zbroj prethodno odabranih brojeva premaši jedan. Pitanje
je kolika je aritmetička srednja vrijednost broja pribrojnika u takvom pokusu? Ili,
ako pokus shvatimo kao vremenski niz (svaki odabir nasumičnog broja traje jednu
vremensku jedinicu), pitanje glasi koliko je srednje vrijeme trajanja pokusa? Opisani
pokus je izveden N = 10 6 puta i dobiveni rezultati su prikazni donjom tablicom. Prvi
stupac je broj pribrojnika u zbroju ili trajanje pokusa u odgovarajućim vremenskim
jedinicama, t.
t n n/N
2 500777 0.500777
3 332736 0.332736
4 124875 0.124875
5 33465 0.033465
(3.19)
6 6827 0.006827
7 1130 0.001130
8 172 0.000172
9 14 0.000014
10 4 0.000004
Aritmetička srednja vrijednost duljine trajanja pokusa je
A( x ) = 2 · 0.500777 + 3 · 0.332736 + . . . + 10 · 0.000004 = 2.7170009999999998.
dovršiti 

 Primjer 3.17 A RITMETI ČKA vs. HARMONIJSKA SREDINA

Ako diskretna nasumična varijabla x poprima pozitivna vrijednosti x1 , x2 , x3 , . . . , xN , s


vjerojatnostima p1 , p2 , p3 , . . . , pN , treba pokazati da je aritmetička sredine takve varijable,
veća od harmonijske
A ( x ) > H ( x ).
dovršiti 
3.4 Usrednjavanje 127

Zadatak 3.15 U zadatku 3.12 to znači da 23 učenika treba imati ocjenu veću ili
jednaku medijanu i isto toliko ih mora imati ocjenu manju ili jednaku
od medijana: dakle 7 odličnih i 16 vrlo dobrih su iznad medijana, a
12 dobrih, 5 dovoljnih i 6 nedovoljnih su ispod medijana, dok je sam
medijan ocjena dobar. 

Rješenje:
dovršiti

3.4.3 Momenti
Vratimo se pojmu aritmetičke sredine (za diskretne i kontinuirane varijable)
Z +∞
A( x ) = ∑ xn P(n) ←→ x ρ( x ) dx ,
n −∞

i primjenimo ga na potencije nasumične varijable, x k


Z +∞
A( x ) = ∑
k
xnk P(n) ←→ x k ρ( x ) dx .
n −∞

Time se dolazi do pojma momenta raspodjele.

M OMENTI RASPODJELE ZA DISKRETNE VARIJABLE


Za početak ćemo razmotriti jednu diskretnu nasumičnu varijablu x, koja poprima N
vrijednosti

xn , n = 1, 2, · · · , N.

i opisana je normiranom raspodjelom vjerojatnosti P(n)


N
∑ P(n) = P(1) + P(2) + · · · + P( N ) = 1.
n =1

Srednja vrijednost ili matematičko očekivanje nasumične varijable x se definira kao


aritmetička sredina varijable x

A( x ) ≡ h x i = ∑ x n P ( n ), (3.20)
n

gdje zbroj ide po svim mogućim vrijednostima varijable x. Općenito, matematičko


očekivanje bilo koje funkcije f ( x ), se računa kao aritmetička sredina te funkcije

A( f ( x )) ≡ h f ( x )i = ∑ f ( x n ) P ( n ). (3.21)
n

Poseban slučaj gornjih srednjih vrijednosti jesu MOMENTI, koji se dobiju kada se za
funkciju f iz gornjeg izraza, odabere potencija nasumične varijable
D E
x k = ∑ xnk P(n). (3.22)
n

Matematičko očekivanje bilo koje funkcije više nasumičnih varijabla, npr. f ( x1 , x2 ), se


računa kao kao aritmetička sredina te funkcije

A( f ( x1 , x2 )) ≡ h f ( x1 , x2 )i = ∑∑ f ( xn , xm ) P(n, m), (3.23)


n m
128 Poglavlje 3. Nasumične varijable

gdje zbrojevi idu po svim mogućim vrijednostima varijabla x1 i x2 . Tako se npr. momenti
više diskretnih varijabla

x1 , x2 , x3 , · · · ,

u skladu s (3.23), računaju kao,

x1k1 x2k2 x3k3 · · · = ∑ ∑ ∑ · · · xnk1 xmk2 xlk3 · · · P(n, m, l, · · · ).


D E

n m l

Ako su sve varijable med̄usobno statistički nezavisne, tada je

P(n, m, l, , · · · ) = P1 (n) P2 (m) P3 (l ) · · · ,

pa je gornji moment jednak

x1k1 x2k2 x3k3 · · · = x1k1 x2k2 x3k3 · · · .


D E D ED ED E
(3.24)

Vratimo se jednoj diskretnoj nasumičnoj varijabli. Pretpostavimo da je raspodjela


vjerojatnosti P(n) NEPOZNATA, ali da su POZNATI MOMENTI, (3.22),
D E N
xk = ∑ xnk P(n), k = 1, 2, · · · , N.
n =1

Želimo pokazati da poznavanje PRVIH N gornjih momenta raspodjele, jednoznačno


odred̄uje raspodjelu P(n). Raspišimo redom prvih N momenata
N
hxi = ∑ x n P ( n ) = x1 · P (1) + x2 · P (2) + · · · + xN · P ( N ), (3.25)
n =1
N
x2 = ∑ xn2 P(n) = x12 · P(1) + x22 · P(2) + · · · + xN2 · P( N ), (3.26)


n =1
..
.
D E N
xN = ∑ xnN P(n) = x1N · P(1) + x2N · P(2) + · · · + xNN · P( N ).
n =1

Gornji sustav od N jednadžba sadrži N nepoznanica

P (1), P (2), · · · , P ( N ).

Taj se sustav rješava tako što se najprije napiše u matričnom obliku kao

MP ~ ,
~ =A

s nepoznatim vektorom P ~ . Matrica M je jednaka,

x1 x2 · · · xN
 
 x2 x2 · · · x2 
 1 2 N
M= . .. .. ,
 .. . . 
N N
x1 x2 · · · xN N
3.4 Usrednjavanje 129

a vektori P
~ iA~ su

P (1)
h x2i
   
 P (2)   x 
P~ =  .. ,  .. .
~ =
A
 
 .   . 

N
P( N ) x

Budući da je determinanta matrice M

Det (M) 6= 0,

postoji inverzna matrica i rješenje gornjeg sustava je dano sa

~ = M−1 A
P ~ .

Gornja relacija pokazuje kako se iz svih poznatih momenata, može izračunati raspo-
djela vjerojatnosti P(n). Dakle, momenti raspodjele su veličine koje u cjelosti odred̄uju
samu raspodjelu vjerojatnosti. Kada su zadani momenti i sama vjerojatnost se može
izračunati.
Primjetimo da gornji izvod vrijedi za diskretnu varijablu koja može imati konačan niz
vrijednosti, no gornji se rezultat može poopćiti i na diskretne varijable s beskonačnom
domenom, kao i na kontinuirane varijable.

 Primjer 3.18 Diskretna nasumična varijabla ima vrijednosti

x1 = 4, x2 = 5, x3 = 6.

Iz poznatih vrijednosti prva tri momenta

h x i = 5.33333, x 2 = 29, x 3 = 160.333,




treba izračunati raspodjelu vjerojatnosti.


Prema gornjem izlaganju je

x1 x2 x3 P (1) x
    
h i
MP
~ =A
~  x12 x22 x32   P(2) =  x 2 .



x13 x23 x33 P (3) x3

Kada se uvrste brojevi, dobije se

4 5 6 P (1) 5.33333
    
16 25 36   P(2) =  29 .
64 125 216 P (3) 160.333

~ = M −1 A
Rješenje gornje jednadžbe se dobiva invertiranjem matrice, P ~ , i daje

P(1) = dovriti


130 Poglavlje 3. Nasumične varijable

M OMENTI RASPODJELE ZA KONTINUIRANE VARIJABLE


Slično kao i kod diskretnih varijabli (uz zamjenu zbrajanja integriranjem), matematičko
očekivanje varijable x se računa kao aritmetička sredina
Z +∞
A( x ) ≡ h x i = x ρ( x ) dx , (3.27)
−∞

ili, općenito, matematičko očekivanje proizvoljne funkcije f ( x )


Z +∞
A[ f ( x )] ≡ h f ( x )i = f ( x ) ρ( x ) dx .
−∞

Slično kao i kod diskretnih varijabli (uz zamjenu zbrajanja integriranjem), matematičko
očekivanje proizvoljne funkcije f ( x1 , x2 ) se računa kao
Z +∞
A( f ( x1 , x2 )) ≡ h f ( x1 , x2 )i = f ( x1 , x2 ) ρ( x1 , x2 ) dx1 dx2 . (3.28)
−∞

Odabere li se za funkciju f potencija nasumične varijable, dolazi se do pojma momenta


kontinuirane nasumične varijable
D E Z +∞
k
x = x k ρ( x ) dx (3.29)
−∞

naziva m-ti moment raspodjele varijable x.


Ako postoji N nasumičnih kontinuiranih varijabla

x1 , x2 , · · · , xN ,

opisanih normiranom gustoćom vjerojatnosti

ρ ( x1 , x2 , · · · , xN ),

tada se momenti gornje raspodjele, u skladu s (3.28), definiraju kao

Z +∞
x1m1 x2m2 . . . xNm N = x1m1 x2m2 . . . xNm N ρ( x1 , x2 , · · · , xN ) dx1 dx2 . . . dxN . (3.30)

−∞

Ako su varijable statistički neovisne, (3.12),

ρ ( x1 , x2 , x3 , · · · ) = ρ1 ( x1 ) ρ2 ( x2 ) ρ3 ( x3 ) · · · ,

tada za momente vrijedi

x1n1 x2n2 x3n3 · · · = x1n1 h x2n2 i x3n3 · · · . (3.31)





Vrlo je vjerojatno da su se čitatelji već susretali s momentima raspodjele u različitim


dijelovima fizike iako te veličine možda i nisu nazivane momentima odgovarajuće
raspodjele. Evo nekoliko primjera:
3.4 Usrednjavanje 131

 Primjer 3.19 S TATISTI ČKA FIZIKA (1)


U klasičnoj statističkoj fizici, particijska funkcija (statistički zbroj, Zustandssumme), Z,
sustava se računa kao
1
Z = ∑ NE e− β E , β= ,
E
k B T

gdje je E energija pojedine mikroskopske konfiguracije sustava, a NE je broj mikroskop-


skih konfiguracija iste energije. Unutarnja energija, U cijelog sustava, se računa kao

∂ ln( Z ) ∑ E NE e− β E
U=− = E 0 .
∂β ∑ E0 NE0 e− β E
Označi li se s
NE e− β E
P( E) =
∑ E0 NE0 e− β E
0, ∑ P(E) = 1,
E

normirana vjerojatnost pojavljivanja konfiguracije s energijom E (povoljno kroz sve


moguće), tada se unutrašnja enrgija U iščitava kao
U = ∑ E P( E) = h Ei ,
E

a to je upravo izraz oblika prvog momenta energije E, (3.25). 

 Primjer 3.20 S TATISTI ČKA FIZIKA (2)


Slijedeći je primjer računa specifične topline u okviru statističke fizike. Tamo se kao
bitan dio funkcije raspodjele pojavljuje tzv. Boltzmannov faktor
J0
e− β H (C) , β= ,
kB T
gdje je H hamiltonijan sustava, a C je oznaka konfiguracije sustava,
C ≡ ( S1 , S2 , . . . , S N )
(stanje u kojem se nalazi svaka pojedina čestica sustava). Vjerojatnost dane konfiguracije
je
e− β H (C)
P(C) = , Z = ∑ e− β H (C)
Z C

Energija E sustava je prvi moment gornje raspodjele (vidjeti primjer 3.19)


1
E = h H i = ∑ H (C) P(C) = ∑ H (C) e−β H(C) .
C Z C

Za račun specifične topline


 ∆Q
H 2 − hHi 2 =


C = kB β 2 ,
∆T
potreban je i drugi moment raspodjele
H = ∑ H (C) H (C) P(C),

2
C

a to je upravo izraz oblika drugog momenta, (3.26). 


132 Poglavlje 3. Nasumične varijable

 Primjer 3.21 K LASI ČNA MEHANIKA (1)


Ovo je primjer iz klasične mehanike. Ako se funkcija masene gustoće nekog tijela,
ρm (~r ), podjeljena s ukupnom masom (radi normiranja), shvati kao funkcija raspodjele
vjerojatnosti
ρm (~r )
ρ(~r ) ≡ ,
m
tada je središte mase toga tijela ~r SM , upravo prvi moment raspodjele8 , (3.25),
~r ρm (~r ) dV
Z R Z
~r SM = ~r ρ(~r ) dV = RV , m= ρm (~r ) dV ,
V V m
ρ (~r ) dV V

ili, po komponentama
ρm ( x, y, z)
Z
hxi = x dx dy dz = xSM ,
V m
ρm ( x, y, z)
Z
hyi = y dx dy dz = ySM ,
V m
ρm ( x, y, z)
Z
hzi = z dx dy dz = zSM .
V m
Normiranje
ρm ( x, y, z) m
Z
dV = = 1.
V m m


 Primjer 3.22 K LASI ČNA MEHANIKA (2)

Još jedan primjer iz mehanike, ovoga puta iz prostorne vrtnje krutog tijela9 . Aksijalni
momenti tromosti Ixx , Iyy , Izz oko osi x, y i z su definirani kao
1 1
Z
Ixx = (y 2 + z 2 ) ρm ( x, y, z) dx dy dz ,
m m
1 1
Z
Iyy = ( x 2 + z 2 ) ρm ( x, y, z) dx dy dz ,
m m
1 1
Z
Izz = ( x 2 + y 2 ) ρm ( x, y, z) dx dy dz .
m m
Shvati li se u gornjim izrazima masena gustoća ρm podjeljena s ukupnom masom, kao
(normirana) gustoća vjerojatnosti,
ρm (~r )
ρ(~r ) ≡ ,
m
tada su aksijalni momenti dani zbrojem odgovarajućih drugih momenata raspodjele,
(3.26),
Ixx = m y 2 + z 2 , Iyy = m x 2 + z 2 , Izz = m x 2 + y 2 .


 

 



8 Vidjeti npr. odjeljak Središte mase u G LUMAC, Klasična mehanika


9 Vidjeti npr. odjeljak Prostorno gibanje krutog tijela u G LUMAC, Klasična mehanika
3.4 Usrednjavanje 133

Osim aksijalnih, u opisu prostorne vrtnje krutog tijela pojavljuju se devijacijski momenti
(ili centrifugalni momenti ili umnošci tromosti)
Z
Ixy = Iyx = − x y ρm ( x, y, z) dx dy dz ,
Z
Ixz = Izx = − x z ρm ( x, y, z) dx dy dz ,
Z
Iyz = Izy = − y z ρm ( x, y, z) dx dy dz .

Istim postupkom
E kao i za aksijalne momente, dolazi se do devijacijskih momenata u
obliku x1k1 x2k2
D

Ixy = Iyx = −m h x Y i , Ixz = Izx = −m h x Z i , Iyz = Izy = −m hy Z i .




Primjetimo još i da MOMENTI NE MORAJU BITI DEFINIRANI za pojedine raspodjele


vjerojatnosti.
 Primjer 3.23 Neka se npr. diskretna varijabla x

xn = 2 n , n = 0, 1, 2, 3, · · · ,
pojavljuje s vjerojatnošću
1
P(n) = , n = 0, 1, 2, 3, · · · .
2n +1
Ova je vjerojatnost normirana
1 1 1 1 1 1 1 1 1
 
+ 2 + 3 + ··· = 1 + + 2 + 3 + ··· = 1
= 1,
2 2 2 2 2 2 2 2 1− 2

ali prvi moment (kao ni viši momenti) raspodjele ne postoji (nije konačan)
∞ ∞ ∞
1 1
hxi = ∑ xn P(n) = ∑ 2n
2n +1
= ∑ 2
= ∞.
n =0 n =0 n =0


Osim samih momenata, definiraju se i k-ti CENTRALNI MOMENTI s oznakom Mk , koji se


za jednu diskretnu varijablu računaju kao
 k
Mk = ∑ x n − h x i P ( n ) , (3.32)
n

ili, za jednu kontinuiranu varijablu,


Z +∞  k
Mk = x − h x i ρ( x ) dx . (3.33)
−∞
Slično se definiraju i centralni momenti za raspodjele dvije
  k  l
∑∑ n x − h x i x − h x i P(n, m), diskretno


 1 m 2
n m


Mk,l =
 +∞  k  l

 Z

 x1 − h x1 i x2 − h x2 i ρ( x1 , x2 ) dx1 dx2 , kontinuirano.
−∞
134 Poglavlje 3. Nasumične varijable

ili više nasumičnih varijabla. Prema gornjim definicijama je

M0 = M0,0 = 1, M1 = M1,0 = M0,1 = M1,1 = 0,

pa su ova dva momenta ista za svaku funkciju raspodjele P(n, m, ....) i prema tome ne
daju nikakvu informaciju o skupu na koji se odnose. Drugi centralni moment se naziva
VARIJANCA ili kvadrat standardne devijacije

  2
∑ xn − h x i P ( n ), diskretno



n


M2 ( x ) ≡ Var ( x ) ≡ σ 2 ( x ) = (3.34)

 Z +∞  2
x − hxi ρ( x ) dx , kontinuirano.



−∞

i mjeri srednje kvadratno10 odstupanje x od srednje vrijednosti h x i. O ovoj veličini će


biti više riječi u odjeljku 3.4.5

Razvojem potencije binoma u (3.32) i (3.33), dolazi se do općeg izraza za K-ti centralni
moment izražen preko (običnih) momenata

K
K
 
(−1) K−k x k h x i K−k .
D E
MK = ∑ k
(3.35)
k =0

Prvih nekoliko centralnih momenta je:

M2 = x 2 − h x i 2 ,

M3 = x 3 − 3 x 2 h x i + 2 h x i 3 , (3.36)


M4 = x 4 − 4 x 3 h x i + 6 x 2 h x i 2 − 3 h x i 4 .
D E

..
.

Samo su prva tri centralna momenta jednaki prvim trima kumulantima, (6.45), dok se
ostali centralni momenti razliku od kumulanata. Općenito će se o kumulantima govoriti
kasnije, u odjeljku 6.4.

Osim centralnih momenata, definiraju se i POMO ĆNI MOMENTI MK0

∑ ( x n − a ) K P ( n ),


 diskretno
n


MK0 = Z +∞
( x − a) K ρ( x ) dx ,

kontinuirano,



−∞

za konstantni a 6= h x i i a 6= 0 se obično odabire neka od gore spomenutih srednjih


vrijednosti kao što su geometrijska ili harmonijska sredina, mod, kvartili, medijan ili
nešto slično specifično za problem koji se razmatra.

10 I time eliminira predznak.


3.4 Usrednjavanje 135

3.4.4 Matrične opservable


Promatra se pokus koji može rezultirati samo ostvarenjem ili neostvarenjem jednog
dogad̄aja. Vjerojatnost da se dogad̄aj ostvari je P(1) = p, a vjerojatnost da se ne ostvari
je P(2) = 1 − p. Opišimo ovaj pokus vektorom rapodjele vjerojatnosti
  √
P (1) p
p
√ p
 q q  h i
| Pi = = , h P| = P (1), P (2) = p, 1 − p .
P (2) 1− p
p p

U ovakvom zapisu, normiranje vjerojatnosti je dano skalarnim umnoškom

h P| Pi = p + 1 − p = 1.

Neka je r1 = r kada kada se uočeni dogad̄aj ostvari, a r2 = −r, kada se ne ostvari. U


skladu s ... prosječna vrijednost varijable r je
2
hr i = ∑ rn · P(n) = rp + (−r )(1 − p) = r (2p − 1).
n =1

Definirajmo operator R čije se svojstvene vrijednosti rn nazivaju vrijednosti opservable.


Gornja srednja vrijednost, hr i, se može dobiti i matričnim putem, pri čemu je matrica
operatora R jednaka

r 0
 
R= , R 2 = r 2 1, R 3 = r 2 R, itd. ,
0 −r

a srednja vrijednost opservable je


 √ √
√ p r 0 p √ r p
   
hr i = h P|R| Pi = [ p, 1 − p] = [ p, 1 − p] = r (2p − 1).
p
0 −r 1− p −r 1 − p
p p

Pored operatora R , mogu se uvesti i neki drugi operatori. Npr. operator F koja uvodi
dinamiku u pokus. Dinamika se sastoji u tome da operator F promjeni rezultat pokusa
iz ostvarenje  neostvarenje

0 1 P (2)
  p 
F= , F | Pi = ,
1 0 P (1)
p

0 1 r 0 0 1 −r 0
     
F RF =
|
= ,
1 0 0 −r 1 0 0 r
h P|F| R F| Pi = (−r )(2p − 1) = h−r i .

Očito, matrica F| R F je matrica operatora čije su svojstvene vrijednosti (opservable) −r


kada se uočeni dogad̄aj ostvari, a r kada se ne ostvari i po tome su jednake negativnim
svojstvenim vrijednostima operatora R . Nadalje, pomoću operatora R i F mogu se
definirati i drugi operatori. Npr. matrica operatora R F je

0 r
 
R·F= ,
−r 0
sa svojstvenim vrijednostima µ± = ± i r. No, ove svojstvene vrijednosti nisu realne i
zato nisu opservable. Tako je npr.

0 r p P (1)
q q   p 
h P |R F| P i = P (1), P (2) = 0.
−r 0 P (2)
136 Poglavlje 3. Nasumične varijable

Slično se dobije i za operator F | R

0 −r
 
F ·R=
|
, µ± = ± i r,
r 0
0 −r p P (1)
q q   p 
h P |F R| P i =
|
P (1), P (2) = 0.
r 0 P (2)

Definirajmo algebru opservabli promatranog pokusa kao skup V svih matrica oblika

V = a 1 + b R, (3.37)

gdje su a i b realni skalari. Pokažimo da je ona zatvorena na matrično množenje i da je


komutativan, tj. da vrijede slijedeća dva svojstva

V1 , V2 ∈ V ⇒ V1 · V2 ∈ V,
V1 , V2 ∈ V ⇒ V1 · V2 = V2 · V1 .

Neka su

V1 = a1 1 + b1 R, V2 = a2 1 + b2 R,

tada je

V1 · V2 = ( a1 1 + b1 R) · ( a2 1 + b2 R) = ( a1 a2 + b1 b2 ) 1 + ( a1 b2 + b1 a2 ) R,

a to je opet matrica oblika (3.37). Isto tako je i

V2 · V1 = a1 a2 + b1 b2 1 + a1 b2 + b1 a2 R = V1 · V2 ,
 

pa su time dokazana oba navedena svojstva. Primjetimo da je i matrica F| R F oblika


(3.37)

−r 0


F RF =
|
= a1 + bR .

0 r a=0,b=−1

Kako izgledaju svojstvene vrijednosti tj. opservable proizvoljne matrice V

a + br 0 c 0
   
V = a1 + bR = ≡ .
0 a − br 0 d

Iz gornjeg izraza se iščitava da je V matrica operatora V sa svojstvom da pridružena


mu opservabla ima vrijednost c kada se dogad̄aj ostvari, a vrijednost d kada se dogad̄aj
ne ostvari.

Kakav je učinak matrica koje nisu elementi V (nisu dijagonalne)? Npr.

r 1
  q
0
R = R0 P R0 P = r [ P(1) − P(2)] + P(1) P(2).



0 −r
3.4 Usrednjavanje 137

3.4.5 Mjere disperzije


Pod mjerama disperzije se podrazumjevaju veličine koje mjere odstupanja nasumične
varijable od jedne od srednjih vrijednosti navedenih u prethodnom odjeljku.

Radi jednostavnosti, promatrajmo jednodimenzijsku diskretnu nasumičnu varijablu


(obilježje) x čije su vrijednosti xn , opisane normiranom raspodjelom vjerojatnosti P(n)

∑ P(n) = 1.
n

Primjetimo da je, po samoj definiciji srednje vrijednosti, (3.20), srednje odstupanje


varijable x od h x i jednako nuli
h x − h x ii = ∑ ( xn − h x i) P(n) = ∑ xn P(n) − h x i ∑ P(n) = hxi − hxi = 0. (3.38)
n n n

To je i razlog zašto se h x i naziva srednja vrijednost: u gornjem smislu, h x i predstavlja


sredinu skupa { xn }.

S TATISTI ČKA SREDNJA VRIJEDNOST je po svojoj definiciji analogna matematičkom


očekivanju u teoriji vjerojatnosti, jer je ona jednaka zbroju umnožaka vrijednosti pojedi-
nog obilježja s njegovom relativnom frekvencijom.

Općenito su elementi skupa različiti od njegove srednje vrijednosti h x i, pa je od interesa


naći nekakvu veličinu koja će mjeriti ODSTUPANJE svakog pojedinog elementa od sred-
nje vrijednosti cijelog skupa. Gore smo pokazali da za takvu mjeru ne možemo uzeti
veličinu x − h x i, jer je njezina srednja vrijednost jednaka nuli: jednostavno rečeno h x i je
odabran upravo tako da se zbroj pozitivnih odstupanja i zbroj negativnih odstupanja
egzaktno poništi. Očito je da treba naći veličinu kod koje će se ovo poništavanje izmed̄u
pozitivnog i negativnog doprinisa izbjeći. To se postiže ili promatranjem apsolutnih
vrijednosti odstupanja nasumične varijable od odabrane srednje vrijednosti, ili proma-
tranjem jedne od parnih potencija odstupanja nasumične varijable od odabrane srednje
vrijednosti
| x − h x i|, ( x − h x i) 2k .
Kao primjere apsolutne vrijednosti odstupanja od odabrane srednje vrijednosti, navo-
dimo apsolutno odstupanje od srednje vrijednosti
Z +∞ Z hxi Z +∞
h| x − h x i|i = | x − h x i| ρ( x ) dx = (h x i − x ) ρ( x ) dx + ( x − h x i) ρ( x ) dx ,
−∞ −∞ hxi

ili apsolutno odstupanje od medijana


Z +∞ Z µ Z +∞
h| x − µ|i = | x − µ| ρ( x ) dx = (µ − x ) ρ( x ) dx + ( x − µ) ρ( x ) dx .
−∞ −∞ µ

Druga mogućnost je računanje kvadrata odstupanja od aritmetičke sredine, ( x − h x i) 2 .


Opet će svi članovi uvijek biti pozitivni i dobit će se jedna pozitivno definitna konačna
veličina, s oznakom σ 2 . Ona sadrži informaciju koliko se, u srednjem, nasumična
varijabla razlikuje od svoje aritmetičke srednje vrijednosti

∑ ( xn − h x i) 2 P(n), diskr.



n
E 
σ 2 = ( x − h x i) 2 =
D
Z +∞
( x − h x i) 2 ρ( x ) dx ,

kont.



−∞
138 Poglavlje 3. Nasumične varijable

Ova se veličina prepoznaje kao drugi centralni moment, ..., i naziva se srednje kvadratno
odstupanje ili VARIJANCA, dok se sama σ naziva STANDARDNA DEVIJACIJA.
Primjetimo da je gornjim izrazom, zbog dimenzija, definiran kvadrat σ (ako je x veličina
koja se mjeri u paskalima, onda se i srednje odstupanje te veličine mora mjeriti tim
istim jedinicama, a ne njihovim kvadratom). Često se kaže i da je σ mjera FLUKTUACIJE
varijable x: vrijednosti x fluktuiraju oko srednje vrijednosti h x i, a σ mjeri iznos tih
fluktuacija. Primjetimo da se σ 2 može napisati i preko momenata, ..., raspodjele

σ 2 = ∑ ( xn − h x i) 2 P(n) = ∑ xn2 − 2xn h x i + h x i 2 P(n)


 

n n
=∑ xn2 P(n) − 2 h x i ∑ xn P(n) + h x i 2 ∑ P(n)
n n n
2 2 2 2 2
= x − 2 hxi + hxi = x − hxi .


Ukoliko varijabla x ima fizičku dimenziju, varijanca ima dimenziju kvadrata x, stan-
dardna devijacija ili standardno odstupanje
q q q
σ = Var ( x ) = ( x − h x i) 2 = h x 2 i − h x i 2 (3.39)

ima ISTU DIMENZIJU kao i nasumična varijabla x. Standardna devijacija opisuje veličinu
(širinu) pojasa oko h x i u kojemu se nalazi većina (oko 67 %, vidjeti odjeljak ...) vrijednosti
x. Ono što je važno zapravo i nije sama veličina rasipanja vrijednosti x oko h x i, nego
RELATIVNA VELI ČINA tog rasipanja u odnosu na h x i,

σ
hxi

(ako su xn i h x i, veliki11 po iznosu, i σ može biti velik po apsolutnom iznosu). Ovaj


omjer se naziva KVOCJENT VARIJACIJE i npr. u zadatku 3.16 iznosi

1.215
= 0.3708 . . . ,
3.2766
što je uistinu desetak puta manje od same vrijednosti h x i.

Osim kvadrata srednje udaljenosti nasumične varijable od aritmetičke sredine, mogu se


koristiti i druge parne potencije

∑ ( xn − h x i) 2k P(n),


 diskretno
n


σ 2k = Z +∞
( x − h x i) 2k ρ( x ) dx ,

kontinuirano,



−∞

Pogledajmo u kakvom su med̄usobnom odnosu nabrojane mjere disperzije. Započnimo


s apsolutnim vrijednostima i pokažimo da je odstupanje oblika
Z +∞
h| x − a|i = | x − a| ρ( x ) dx ,
−∞

najmanje onda kada se za a odabere medijan, a ≡ µ.


11 Ukoliko je h x i = 0, kvocjent varijacije se definira dijeljenjem σ nekom drugom, različitom od nule,

srednjom vrijednošću.
3.4 Usrednjavanje 139

dovršiti
Pokažimo i da je varijanca donja granica niza

σ 2 = min σ 2k , k ∈ N.
k

dovršiti
Primjer 3.24 Potrebno je izračunati standardnu devijaciju raspodjele gustoće vjerojat-
nosti nalaženja elektrona iz primjera (3.15).
dovršiti 

Zadatak 3.16 U zadatku 3.12, standardna devijacija je jednaka


r
7 · 1.7234 2 + 16 · 0.7234 2 + 13 · 0.2766 2 + 5 · 1.2766 2 + 6 · 2.2766 2
σ=
√ 47
= 1.4767 = 1.215 .

Prosječno odstupanje od aritmetičke sredine, 3.2766, na jednu i drugu


stranu iznosi 1.215. 

Rješenje:
dovršiti
Zadatak 3.17 Mjerenjem su dobiveni slijedeći rezultati za vrijednosti x varijable x i
pridružene težine t( x ):

x t( x )

4.92 - 4.94 2
4.95 - 4.97 7
4.98 - 5.00 14
5.01 - 5.03 10
5.04 - 5.06 6
5.07 - 5.09 3

Izračunajte aritmetičku sredinu i standardnu devijaciju. 

Rješenje:
dovršiti

3.4.6 Mjere simetrije


Osim mjera disperzije, postoje i veličine koje opisuju oblik raspodjele. Dvije načešće
korištene se definiraju pomoću centralnih momenata, M3 i M4 . To su koeficijenti
ASIMETRIJE α4 (engl. skewness) i SPLJOŠTENOSTI α 4 (engl. kurtosis)

x − 3 x 2 hxi + 2 hxi 3

3
M3


α3 = 3 = ,
σ σ3
x − 4 x hxi + 6 x hxi 2 − 3 hxi 4

4
3
2
M4
α4 = 4 = . (3.40)
σ σ4
Primjetimo da ukoliko varijable x i nose neku fizičku dimenziju, koeficijenti α4 i α 4
su bezdimenzijski brojevi. U nastavku izlaganja će se pokazati (navesti gdje) da je za
140 Poglavlje 3. Nasumične varijable

SIMETRI ČNE RASPODJELE približno

0 ≤ |α4 | ≤ 0.1

(ali postoje i asimetrične raspodjele za koje je takod̄er α4 = 0). Ako je 0.1 ≤ α4 ≤ 0.25,
raspodjela je malo asimetrična, ako je 0.25 ≤ |α4 | ≤ 0.5 tada je srednje asimetrična i ako je
0.5 ≤ |α4 |, raspodjela se smatra jako asimetričnom. Na slici 3.10 se vidi gama-raspodjela
iz odjeljka 4.2.4 čija je vrijednost koeficijenta α4 , (4.99) jednaka

Slika 3.10: Asimetrija gama (lijevo) i binomne (desno) raspodjele.

0.25
p = 0.9
p = 0.1

0.2
p = 0.5
0.15

P(n)
0.1

0.05

-0.05
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
n/ 20

2
α3 = √ ,
n

tj. porastom parametra n raspodjela je sve manje asimetrična.


Na slici 3.10 se vidi promjena asimetrije binomne raspodjele iz odjeljka 4.1.3, u ovisnosti
o parametru p ∈ [0, 1] Prema (4.30), koeficijent asimetrije je jednak

1 − 2p
α3 = p .
N p (1 − p )

Kontraprimjer: dovršiti

O spljoštenosti recimo, za sada, samo toliko da se NORMALNOM SPLJOŠTENOSTI smatra


ona za koju je

α 4 = 3.

Ako je α 4 < 3, raspodjela je široka (engl. platycurtic), a ako je α 4 > 3, raspodjela je uska
(engl. leptocurtic)

3.5 Parcijalne gustoće vjerojatnosti


Neka je zadano N nasumičnih kontinuiranih varijabla

x1 , x2 , · · · , xN ,
3.5 Parcijalne gustoće vjerojatnosti 141

opisanih normiranom gustoćom vjerojatnosti ρ( x1 , x2 , · · · , xN ), tako da je


Z
ρ( x1 , x2 , · · · , xN ) dx1 dx2 . . . dxN = 1.

Parcijalnim (djelomičnim) gustoćama vjerojatnosti nazivaju se marginalna i uvjetna


vjerojatnost.

M ARGINALNA VJEROJATNOST
Marginalnom gustoćom vjerojatnosti ρ se naziva vjerojatnost koja se odnosi na samo
JEDAN DIO od ukupno N varijabla. Vrijednosti ostalih varijabla nas ne zanimaju, tj. one
mogu imati BILO KOJU od svojih vrijednosti. Zato se npr. marginalna vjerojatnost koja
opisuje prvih n varijabla dobije tako da se naprosto prointegrira po vrijednostima svih
preostalih x n+ 1 , x n+ 2 , · · · , xN varijabla
Z
ρ n ( x1 , x2 , · · · , x n ) = ρ( x1 , x2 , · · · , xn , x n+ 1 , · · · xN ) dx n+ 1 dx n+ 2 . . . dxN . (3.41)

Slično je npr. i marginalna vjerojatnost koja opisuje posljednjih N − n varijabla jednaka


Z
ρ N − n ( x n+ 1 , · · · , x N ) = ρ( x1 , x2 , · · · , xn , x n+ 1 , · · · xN ) dx1 dx2 . . . dx n ,

ili, marginalna vjerojatnost varijabla x 6 i x 8 je


Z
ρ 6,8 ( x 6 , x 8 ) = ρ( x1 , x2 , · · · , xN ) dx1 . . . dx 5 dx 7 dx 9 . . . dxN ,

Primjetimo da iz normiranja ρ( x1 , x2 , · · · , xN ), slijedi i normiranje marginalnih vjerojat-


nosti.

U VJETNA VJEROJATNOST
Druga vrsta parcijalne vjerojatnosti se dobije iz ρ( x1 , x2 , · · · , xN ) tako da se vrijednosti
jednog dijela varijabla učine FIKSNIM. Neka su npr. varijable

x n +1 , x n +2 , . . . , x N

fiksne. Traži se vjerojatnost ostalih varijabla. Takva se vjerojatnost naziva UVJETNA


vjerojatnost (u odjeljku 2.3 je definirana uvjetna vjerojatnost dvije varijable - u ovom
odjeljku se izvodi poopćenje pojma uvjetne vjerojatnosti na više varijabla)

ρn/N −n ( x1 , x2 , · · · , xn / x n+ 1 , · · · xN ).

A PSOLUTNA vjerojatnost ρ je povezana s UVJETNOM vjerojatnošću ρn/N −n i MARGINAL -


NOM vjerojatnošću ρ N −n relacijom

ρ( x1 , x2 , · · · , xN ) = ρn/N −n ( x1 , x2 , · · · , xn / x n+ 1 , · · · xN ) ρ N −n ( x n+ 1 , · · · , xN ). (3.42)

To je poopćenje izraza (2.12) na više kontinuiranih varijabla. Iz gornje se relacije vidi da


je normiranje uvjetne vjerojatnosti, posljedica normiranja ρ i ρ N −n .
142 Poglavlje 3. Nasumične varijable

 Primjer 3.25 2D G AUSSOVA RASPODJELA


Zadana je jedna raspodjela dvije varijable (u odjeljku 4.2.2 se ta raspodjela definira kao
normalna ili Gaußova raspodjela) −∞ < x1 , x2 < +∞,

1 − λ2 1  2
 
2
ρ G ( x1 , x2 ) = exp − x1 − 2λx1 x2 + x2 , −1 < λ < 1.
2πσ 2 2σ 2

kvadratna forma u argumentu eksponencijalne funkcije se može shvatiti i kao potenci-


jalna energija sustava dva jednaka harmonijska oscilatora čija je energija med̄udjelovanja
dana sa 2λx1 x2 , a λ se pojavljuje kao konstanta vezanja.
Potrebno je izračunati marginalne i uvjetne vjerojatnosti za svaku varijablu. Zbog
simetrije gornjeg izraza na zamjenu x1  x2 ,

ρ G ( x1 , x2 ) = ρ G ( x2 , x1 ),

dovoljno je izračunavati samo za jednu varijablu.


Parametar −1 < λ < 1 osigurava normiranje i realnost gornjeg izraza. Primjetimo usput
da se argument eksponencijalne funkcije može napisati kao matrični element

− h x |A| x i

pri čemu su

x
 
h x | = x1 x2 , |xi = 1
 
x2
1 1 −λ 1 1 − λ2
 
A= , Tr (A) = 2 , Det (A) = .
2σ −λ 1
2 σ 2σ2

Izračunajmo marginalne vjerojatnosti. Prema (3.41), marginalna vjerojatnost je jednaka

Z +∞
s Z +∞
1 − λ2 1  2
 
2
ρ 1, G ( x1 ) = dx2 ρ G ( x1 , x2 ) = dx 2 exp − x − 2λx x
1 2 + x .
−∞ (2πσ 2 ) 2 −∞ 2σ 2 1 2

Gornji integral je tablični integral oblika (A.45), ili još jednostavnije,


Z +∞ √
2
e−η dη = π,
−∞

što vodi na marginalnu vjerojatnost



1 − λ2 1 − λ2 2
 
ρ 1, G ( x1 ) = √ exp − x .
σ 2π 2σ 2 1

Uvede li se pokrata

σ2 1
σλ2 = = ,
1−λ 2 2 Det (A)

dolazi se do jednostavnijeg zapisa


! !
1 x2 1 x2
ρ 1, G ( x1 ) = q exp − 1 2 , ⇒ ρ 2, G ( x2 ) = q exp − 2 2 .
2πσλ2 2σλ 2πσλ2 2σλ
3.5 Parcijalne gustoće vjerojatnosti 143

Izračunajmo još i uvjetne vjerojatnosti kao u (3.42)

q h  i
1− λ 2 1
ρ G ( x1 , x2 ) (2πσ 2 ) 2
exp − x12 − 2λx1 x2 + x22
2σ 2
ρ G ( x1 | x2 ) = =
ρ 2, G ( x2 )
h i
√ 1 2 exp − 1 2 x22
2πσλ 2σλ

1 1
 
= √ exp − 2 ( x1 − λ x2 ) 2 .
σ 2π 2σ

Za λ = 0, je x1 neovisno o varijabli x2 , dok se za λ 6= 0, dobiva Gaußova raspodjela


varijable x1 centrirana oko h x1 i ≡ λ x2 . 

 Primjer 3.26 N- DIM . G AUSSOVA RASPODJELA


Gaußova raspodjela više varijabla

" #
1
ρG ( x1 , x2 , . . . , x N ) = N exp − ∑∑ Ai,j ( xi − h xi i) x j − x j ,


2 i j

dovršiti 

 Primjer 3.27 K VADRAT √


Položaj nasumično odabrane točke ( x, y) unutar kvadrata duljine stranice 2 je dvo-
dimenzijska nasumična varijabla. Svaki odabir točke je jednako vjerojatan. Ako se
dijagonale kvadrata poklapaju s koordinatnim osima, potrebno je izračunati:
(a) gustoću raspodjele vjerojatnosti dvodimenzijske nasumična varijable;
(b) marginalne gustoće vjerojatnosti;
(c) uvjetne gustoće ρ( x/y) i ρ(y/x );
(d) jesu li x i y (ne)zavisne nasumične varijable? Zašto?
Prema uvjetu zadatka, kvadrat je postavljn kao na slici.

y
(a) Budući da je svaki odabir točke jed-
1 nako vjerojatan, to je gustoća konstantna,
ρ( x, y) ≡ ρ0 , pa je zbog normiranja
y
x
1+

=
1−
=

Z Z
1= ρ0 dx dy = ρ0 dx dy .
x
y

1 x ♦ ♦

−1 Površina kvadrata je jednaka 2, pa je zato


y

1
1+
=


 , za točke unutar kvadrata


1−

2
=

ρ0 =
x

−1 
0, za točke izvan kvadrata.

144 Poglavlje 3. Nasumične varijable

(b) Račun marginalnih gustoća


Z
ρx (x) = ρ0 dy , uz fiksni x
 Z 1+ x

 2 dy, −1 ≤ x ≤ 0,
1 0


=
2  Z 1− x
 2 dy, 0 ≤ x ≤ 1,


0
 1 + x, −1 ≤ x ≤ 0 
 

= = 1 − | x |, −1 ≤ x ≤ 1.
1 − x, 0 ≤ x ≤ 1.
 

Problem je simetričan na zamjenu x i y, pa se zato odmah može napisati i da je ρy (y) =


1 − |y|, a može se i računati

1+ y 1 1+y
 Z 
ρ( x, y) dx = x =1+y, −1 ≤ y ≤ 0, 

 
2 −1− y
 
 −1− y

 


ρy (y) = = 1 − | y |.
1− y 1 1−y

 Z 

ρ( x, y) dx = x =1−y, 0≤y≤1. 

 
2 −1+ y

 

−1+ y

(c) Račun uvjetnih gustoća: prema relaciji (3.42)

ρ( x, y) 1 ρ( x, y) 1
ρ( x/y) = = , ρ(y/x ) = = .
ρy (y) 2(1 − |y|) ρx (x) 2(1 − | x |)

(d) Ako su x i y nezavisne nasumične varijable, tada prema relaciji (3.12) mora vrijediti

ρ( x, y) = ρ x ( x ) ρy (y),
1
6= (1 − | x |) (1 − |y|),
2
i varijable su zavisne. 

Zadatak 3.18 U kutiji se nalaze dvije bijele i tri crne kuglice. Izvlače se odjednom
dvije kuglice. Izračunajte srednju vrijednost i varijancu broja bijelih kuglica. 

Rješenje:
dovršiti
Zadatak 3.19 Izvodi se gad̄anje u metu do prvog pogotka. Izračunajte srednju vri-
jednost i varijancu broja hitaca. Vjerojatnost pogotka kod svakog hica je konstantna i
jednaka p. 

Rješenje:
dovršiti
Zadatak 3.20 Izračunajte marginalne gustoće vjerojatnosti dvodimenzijskih gustoća
3.5 Parcijalne gustoće vjerojatnosti 145

vjerojatnosti:
 −(x+y)
 e , x > 0, y > 0,
( a) ρ( x, y) =
0, inače .

(n − 1)(n − 2)

, x > 0, y > 0, n 6= 1,

(1 + x + y ) n


(b) ρ( x, y) =

0, inače .

Rješenje:
dovršiti
Zadatak 3.21 Zadana je gustoća vjerojatnosti nasumičnih vrijabla x i y

ρ( x, y) = 6x 2 y, 0 < x < 1, 0 < y < 1.

Jesu li x i y statistički neovisne? Izračunajte vjerojatnost

P(0 < x < 1/2, 1/2 < y < 2).

Rješenje:
U skladu s (3.12), dvije su varijable statistički neovisne ako je

ρ( x, y) = ρ x ( x ) ρy (y),

gdje su ρ x ( x ) i ρy (y) marginalne gustoće vjerojatnosti definirane u (3.41)

Z Z 1
ρx (x) = ρ( x, y) dy = 6x 2 y dy = 3x 2 ,
0
Z Z 1
ρY ( y ) = ρ( x, y) dx = 6y x 2 dx = 2y.
0

Iz gornjih izraza se vidi da je uvjet neovisnosti (3.12) ispunjen, pa zaključujemo da su x i y


neovisne varijable.
U skladu s (3.8), tražena se vjerojatnost računa kao (primjetimo da je, prema uvjetu zadatka,
ρ( x, y) = 0 za y ≥ 1)

Z 1/2 Z 1
3
P(0 < x < 1/2, 1/2 < y < 2) = dx dy 6x 2 y = .
0 1/2 32

Zadatak 3.22 Nasumice se odabire broj x iz intervala [0, a]. Nakon toga se nasumice
odabire broj y iz intervala [0, x ].
Potrebno je izračunati gustoću vjerojatnosti y i hY i. 

Rješenje:
146 Poglavlje 3. Nasumične varijable

Z a
1
x ∈ [0, a] ρx (x) = , ρ x ( x ) dx = 1,
a 0
Z x
1
y ∈ [0, x ] ρy (y/x ) = , ρy (y/x ) dy = 1.
x 0

Vjerojatnost ρ x ( x ) je apsolutna, a ρy (y/x ) je uvjetna vjerojatnost. Prema (3.42) je

ρ( x, y) = ρy (y/x ) ρ x ( x ),

a prema (3.41) je
Z a Z a
ρ(y) = ρ( x, y) dx = ρy (y/x ) ρ x ( x ) dx ,
0 0

pri čemu je

0 ≤ y ≤ x ≤ a.

Izravnim uvrštavanjem se dobiva


Z a
1 1 1
ρ(y) = dx = [ln( a) − ln(y)], y ∈ [0, a].
y x a a

Srednja vrijednost je
Z a a ln( a) a
Z a
1 1
Z Z
hyi = y ρ(y) dy = y [ln( a) − ln(y)] dy = y dy − y ln(y) dy
0
a Z0 a a  a 0 a 0
ln( a) y 2 1 y 2 1 a
 
d ln(y) − y dy = .

= −
a 2 0 a 0
2 2 4

Zadatak 3.23 Unutar kruga jediničnog polumjera, nasumično se odabire jedna točka.
Polarne koordinate te točke su ρ i ϕ.
Izračunajte funkciju gustoće vjerojat-
nosti ove dvije varijable

φ(ρ, ϕ).

Izračunajte marginalne vjerojatnosti.


Jesu li ρ i ϕ statistički neovisne nasu-
mične varijable?

Rješenje:
Prema definiciji (3.9), funkcija raspodjele F (ρ, ϕ) je dana omjerom površine zasjenjenog dijela
(kružnog isječka, ρ 2 π · ( ϕ/2π )) sa gornje slike i ukupne površine jediničnog kruga (1 2 π)

ρ 2 π 2π
ϕ
ρ2 ϕ
F (ρ, ϕ) = =
12 π 2π
3.6 Preobrazbe varijabla 147

Koristeći (3.10), iz gornjeg se izraza dobiva gustoća vjerojatnosti

∂2 F (ρ, ϕ) ρ
φ(ρ, ϕ) = = .
∂ρ∂ϕ π

Provjera normiranja
Z 1 Z 2π

Z
φ(ρ, ϕ) dρ dϕ = ρ dρ = 1.
0 0 π
Račun marginalnih gustoća vjerojatnosti
Z 2π Z 2π
ρ
φρ (ρ) = φ(ρ, ϕ) dϕ = dϕ = 2 ρ,
0 0 π
Z 1 Z 1
ρ 1
φ ϕ ( ϕ) = φ(ρ, ϕ) dρ = dρ = .
0 0 π 2π
Budući da je

ρ 1
φ(ρ, ϕ) = = 2ρ = φρ (ρ) · φ ϕ ( ϕ),
π 2π
to su ρ i ϕ statistički neovisne varijable.

3.6 Preobrazbe varijabla


3.6.1 Preobrazba jedne diskretne nasumične varijable
U ovom ćemo odjeljku riješiti problem čije su pretpostavke slijedeće: zadana je diskretna
nasumična (stohastična) varijabla x koja prima vrijednosti x1 , x2 , · · · , xN s POZNATOM
raspodjelom vjerojatnosti P( x ). Ako je zadano (tj. poznato) realno JEDNOZNA ČNO
preslikavanje12 (funkcija)

x → y = f ( x ),

tada je i y diskretna nasumična (stohastična) varijabla, koja poprima vrijednosti y1 , y2 , · · · , yN .


U nastavku ovog odjeljka, zadatak je
NA ĆI RASPODJELU VJEROJATNOSTI R (y ) IZ POZNATIH P ( x ) I f ( x )
i njezinu kumulativnu funkciju raspodjele G = G (y).

Primjenom ili vjerojatnosti dolazi se do vjerojatnosti da varijabla y poprimi odred̄enu


fiksnu vrijednost yn naprosto u obliku zbroja svih vjerojatnosti P(n) za sve one xn (ako
ih ima više) koji, relacijom f ( xn ) = yn daju tu fiksnu vrijednost yn . Simbolički

R(yn ) = ∑ m
P ( x m ). (3.43)
f ( xm )=yn

Kumulativna funkcija raspodjele je tada

G (y) = ∑ n
R ( y n ).
yn ≤y

12 Usporediti s odjeljkom Stohastički procesi u G LUMAC, Statistička fizika.


148 Poglavlje 3. Nasumične varijable

 Primjer 3.28 K VADRATNO PRESLIKAVANJE


Nasumična varijabla x ima vrijednosti iz skupa

{−2, −1, 1, 2}.

Raspodjela vjerojatnosti diskretne nasumične varijable x je dana sa

P(−2) = 0.2, P(−1) = 0.3, P(1) = 0.4, P(2) = 0.1.

Potrebno je izračunati raspodjelu diskretne nasumične varijable

y = x 2, xn ∈ {−2, −1, 1, 2} ⇒ yn ∈ {1, 4}.

U skladu s relacijom (3.43) je

R(1) = P(−1) + P(1) = 0.7,


R(4) = P(−2) + P(2) = 0.3.

Normiranja

∑ P(n) = P(−2) + P(−1) + P(1) + P(2) = 1,


xn

∑ R(yn ) = R(1) + R(4) = 1.


yn

Primjer 3.29 K OSINUSOVO PRESLIKAVANJE


Raspodjela vjerojatnosti diskretne nasumične varijable je dana sa

1
P( x ) = , x = 1, 2, 3, · · · .
2x
Potrebno je izračunati raspodjelu diskretne nasumične varijable

y = cos(π x ).

Kad su vrijednosti x jednake x = 1, 2, 3, · · · , varijabla y je ili +1 ili −1. Zato je, skladu s
relacijom (3.43),

1 1 1 2
 
R(−1) = P(1) + P(3) + P(5) + · · · = 1 + 1 + 2 + ··· = ,
2 4 4 3
1 1 1 1
 
R(+1) = P(2) + P(4) + P(6) + · · · = 2 1 + 1 + 2 + · · · = .
2 4 4 3

U gornjem smo računu koristili izraz za zbroj geometrijskog reda



1
∑ rk =
1−r
, |r | < 1.
k =0

Zadatak 3.24 Neka je F ( x ) kumulativna funkcija raspodjele varijable x. Odredite


kumulativnu funkciju raspodjele varijable − x. 
3.6 Preobrazbe varijabla 149

Rješenje:
Nova nasumična varijabla je

y = − x.

Prema (3.1) je

F ( x ) = P ( x 0 ≤ x ), G ( y ) = R ( y 0 ≤ y ).

Nadalje je, prema (3.43),

G (y) = R(y 0 ≤ y) = P(− x 0 ≤ − x ) = P( x 0 > x ) = 1 − P( x 0 ≤ x ) = 1 − F ( x ).

Tako je konačno dobiveno

G (y) = 1 − F (−y)

3.6.2 Preobrazba više diskretnih nasumičnih varijabla


Promatraju se dvije diskretne nasumične varijable x1 ∈ Ω1 i x2 ∈ Ω2 opisane vjerojat-
nošću P( x1 , x2 ). Svaka funkcija konstruirana od diskretnih nasumičnih varijabla x1 i x2
je nova diskretna nasumična varijabla

y = f ( x1 , x2 ) (3.44)

čiju raspodjelu vjerojatnosti R(y) treba odrediti.


Prema samoj definiciji vjerojatnosti, R(y) je jednaka zbroju (ili vjerojatnost) vjerojatnosti
za sve parove varijabla x1 i x2 koje zadovoljavaju relaciju (3.44)

R(y) = ∑ ∑ P ( x1 , x2 ) = ∑ ∑ P(x , x )δy, f (x ,x ) ,


1 2 1 2
x1 x2 x1 x2
| {z }
y = f ( x1 , x2 )

gdje je korišten Kroneckerov simbol

 1, a=b

δa,b = (3.45)
0, a 6= b.

Ponovo je kumulativna funkcija raspodjele dana sa

G (y) = ∑n
R ( y n ).
yn ≤y

Ako je nova varijabla y jednostavno zbroj starih varijabla

y = f ( x1 , x2 ) = x1 + x2 .

Zadatak je izračunati R(y).

R(y) = ∑ ∑ P(x , x ) δ y,x +x .


1 2 1 2
x1 x2
150 Poglavlje 3. Nasumične varijable

Ako za svaku vrijednost x1 u zbroju po x2 postoji(e) član(ovi) za koje je x2 = y − x1 , tada


će Kroneckerov simbol biti jednak jedinici, dok je za ostale x2 jednak nuli. To poništava
zbroj po x2 i ostavlja
R ( y ) = ∑ P ( x1 , y − x1 ).
x1

Neka su sada x1 i x2 još i statistički NEZAVISNE varijable, tako da je


P( x1 , x2 ) = P1 ( x1 ) P2 ( x2 ).
Kombiniranjem gornja dva izraza dolazi se do
R(y) = ∑ P1 ( x1 ) · P2 (y − x1 ). (3.46)
x1

Gornji se izraz zove KONVOLUCIJA vjerojatnosti P1 ( x1 ) i P2 ( x2 ). Usporedite gornji izraz


s (3.60) za kontinuirane varijable. Konvolucija dvije funkcije se takod̄er definira i u
teoriji integralnih preobrazbi13 .

 Primjer 3.30
y = a1 x1 + a2 x2 , ⇒ R(y) = ∑ P( x1 , y/a2 − a1 x1 /a2 ),
x1

ili, ako su x1 i x2 nezavisne, tada je


R(y) = ∑ P1 ( x1 ) · P2 (y/a2 − a1 x1 /a2 ).
x1


Sličan se postupak može provesti i za tri nezavisne varijable: x1 ∈ Ω1 , x2 ∈ Ω2 , x3 ∈ Ω4


P( x1 , x2 , x3 ) = P1 ( x1 ) P2 ( x2 ) P3 ( x3 ),
y = x1 + x2 + x3 ,
R(y) = ∑ ∑ ∑ P1 (x ) · P2 (x ) · P3 (x ) δy,x +x +x
1 2 3 1 2 3
x1 x2 x3

=∑ ∑ P1 (x ) · P2 (x ) · P3 (y − x
1 2 1 − x2 ). (3.47)
x1 x2

Gornji se izraz zove konvolucija vjerojatnosti P1 ( x1 ), P2 ( x2 ) i P3 ( x2 ). Usporedite gornji


izraz s (3.63) za kontinuirane varijable. Pokažimo i da se (3.47) može dobiti dvostrukom
primjenom (3.46) ... dovršiti ...
Poopćenje na proizvoljan broj sumanada je sada očito.

3.6.3 Preobrazba jedne kontinuirane nasumične varijable


U ovom ćemo odjeljku riješiti problem čije su pretpostavke slijedeće: zadana je konti-
nuirana nasumična (stohastična) varijabla x koja prima vrijednosti iz intervala ( a, b) s
POZNATOM raspodjelom gustoće vjerojatnosti ρ ( x ). Ako je zadano (tj. poznato) realno
JEDNOZNA ČNO preslikavanje (funkcija)

x → y = f ( x ),
tada je i y nasumična (stohastična) varijabla, koja poprima vrijednosti iz intervala (c, d),
gdje je
c = f ( a ), d = f ( b ).
U nastavku ovog odjeljka, zadatak je
13 Vidjeti npr. odjeljak Integralne preobrazbe u G LUMAC, Matematičke metode fizike.
3.6 Preobrazbe varijabla 151

Slika 3.11: Funkcije raspodjela F ( x ) i G (y), u slučaju kada je f ( x ) monotono rastuća


funkcija.

NA ĆI GUSTO ĆU VJEROJATNOSTI φ = φ (y ) IZ POZNATIH ρ ( x ) I f ( x )


i njezinu kumulativnu funkciju raspodjele G = G (y).

Zadatak 3.25 Pokažite da su ρ(v) i φ( E) iz gornjeg primjera, normirane gustoće


vjerojatnosti. 

Rješenje:
dovršiti

I NTEGRALNA DEFINICIJA φ(y)


Vjerojatnost φ(y) da y ima vrijednosti iz intervala (y, y + dy) se može definirati relacijom

Z
φ(y) dy = ρ( x ) dx , (3.48)
y< f ( x )<y+dy

gdje se integracija po x proteže preko svih x-eva koji zadovoljavaju nejednakosti

y < f ( x ) < y + dy .

Druga je mogućnost da se gustoća φ(y) definira pomoću Diracove δ-funkcije14


Z h i
φ(y) = δ y − f ( x ) ρ( x ) dx . (3.49)

Postoji takod̄er i mogućnost da je jedna nova nasumična varijabla y funkcija nekoliko


nasumičnih varijabla x1 , x2 , x3 , · · ·

y = f ( x1 , x2 , x3 , · · · ).

U tom slučaju se, u skladu s gornjim definicijama, gustoća vjerojatnosti φ(y) definira
kao
Z h i
φ(y) = δ y − f ( x1 , x2 , x3 , · · · ) ρ( x1 , x2 , x3 , · · · ) dx1 dx2 dx3 · · · . (3.50)

14 Vidjeti npr. poglavlje o specijalnim funkcijama u G LUMAC, Matematičke metode fizike


152 Poglavlje 3. Nasumične varijable

Ako su sve varijable xn med̄usobno nezavisne, tada je


Z h i
φ(y) = δ y − f ( x1 , x2 , x3 , · · · ) ρ1 ( x1 ) ρ2 ( x2 ) ρ3 ( x3 ) · · · dx1 dx2 dx3 · · · (3.51)

D IFERENCIJALNA DEFINICIJA φ(y)


Izvedimo izraz za φ(y) koristeći se definicijom (3.48).
Za gustoće vjerojatnosti varijable x, vrijedi (uz F ( a) = 0)
Z b Z x
dF ( x )
ρ( x ) dx = 1, ρ( x 0 ) dx 0 = F ( x ) − F ( a), ρ( x ) = .
a a dx

Ako je preslikavanje f monotono rastuća funkcija, tada je c < d i G (c) = 0


Z d Z y
dG (y)
φ(y) dy = 1, φ(y 0 ) dy 0 = G (y) − G (c), φ(y) = .
c c dy

Ako je preslikavanje f monotono opadajuća funkcija, tada je d < c i G (d) = 0


Z c Z y
dG (y)
φ(y) dy = 1, φ(y 0 ) dy 0 = G (y) − G (d), φ(y) = .
d d dy

Ako f ( x ) uopće nije monotona funkcija, tada se interval (c, d) može podjeliti na podin-
tervale u kojima f ( x ) ima dobro definiranu monotonost.

Pretpostavimo, za početak, da je f MONOTONO RASTU ĆA funkcija, pri čemu je

f ( a) = c < d = f (b) uz a < b.

U tom slučaju, iz a < x slijedi f ( a) = c < y = f ( x ). To znači da će se vjerojatnost


P( a < x 0 < x ) da je x 0 veće od a i manje od x, preslikati u vjerojatnost P(c < y 0 < y) da
je y 0 veće od c i manje od y. Napisano preko funkcije raspodjele, to znači da je (slika
3.11)

P ( a < x 0 < x ) = R ( c < y 0 < y ),


Z x Z y
ρ( x 0 ) dx 0 = φ(y 0 ) dy 0 ,
a c
F ( x ) = G ( y ).

Prema (3.7) je i

dG (y) dF ( x ) dF ( x ) dx dx
φ(y) = = = = ρ( x ) .
dy dy dx dy dy

Time je dobivena tražena veza med̄u funkcijama raspodjela φ(y) i ρ( x )

dx
φ(y) = ρ( x ) . (3.52)
dy

Za monotono rastuću funkciju y = f ( x ), gornja je derivacija uvijek POZITIVNA, ρ( x ) je


pozitivno po definiciji, pa zaključujemo da je i φ(y) uvijek pozitivno kao što i mora biti
s obzirom da predstavlja gustoću vjerojatnosti.
3.6 Preobrazbe varijabla 153

Slika 3.12: Funkcije raspodjela F ( x ) i G (y), u slučaju kada je f ( x ) monotono opadajuća


funkcija.

Neka je sada y = f ( x ) monotono opadajuća funkcija od x, kao na slici 3.12

f ( a) = c > d = f (b) uz a < b.

U tom slučaju iz a < x slijedi c = f ( a) > y = f ( x ). To znači da je vjerojatnost da


varijabla x poprimi vrijednost izmed̄u a i x, jednaka vjerojatnosti da varijabla y poprimi
vrijednosti izmed̄u c i y

P ( a < x 0 < x ) = P ( y < y 0 < c ),


Z x Z c Z c Z y
ρ( x 0 ) dx 0 = φ(y 0 ) dy 0 = φ(y) dy − φ(y 0 ) dy 0 ,
a y d d
F ( x ) = 1 − G ( y ).

Iz ovoga neposredno slijedi

dG (y) dF ( x ) dF ( x ) dx dx
φ(y) = =− =− = −ρ( x ) .
dy dy dx dy dy

No, ako je y = f ( x ) monotono opadajuća funkcija, tada je i dx dy < 0, pa gornja veza




zapravo glasi

dx

φ(y) = ρ( x ) (3.53)
dy

i opet φ(y) ima samo POZITIVNE vrijednosti. Usporedbom s (3.52), vidimo da gornji
izraz vrijedi i za monotono opadajuće, kao i za monotono rastuće funkcije y = f ( x ).
Ukoliko f nije monotona funkcija, onda je ona monotona po svojim dijelovima, a na
svaki taj dio se primjenjuju gornja razmatranja, tako da veza (3.53) izmed̄u φ i ρ vrijedi
za SVAKU f ( x ) (a ne samo za monotonu).
154 Poglavlje 3. Nasumične varijable

Do gornjeg se rezultata može doći i ovim jednostavnim razmatranjem: uočen je je-


dan nasumičan dogad̄aj, A, čije se ostvarenje može opisati bilo varijablom x,
Z
PA = ρ( x ) dx ,
A

bilo varijablom y
Z
PA = φ(y) dy .
A

Kao što je poznato15 , veza med̄u diferencijalima integracije je dana jakobijanom

dx = |J | dy ,

gdje je s | J | označena apsolutna vrijednost jakobijana prijalaza iz varijable x u varijablu


y

dx dx

J = ⇒ φ(y) = ρ( x ) ,
dy dy

a to je opet (3.53).
 Primjer 3.31 S TATISTI ČKA FIZIKA
Jedan primjer preobrazbe varijable je veza med̄u raspodjelama brzine v i energije E
čestica klasičnog idealnog plina (Maxwellova raspodjela)
s
2 m 3 2 −mv 2 /(2k B T )
 
x ≡ v, ρ(v) = v e
π kB T
2 √ −E/(k T )
y ≡ E, φ( E) = p Ee B

π (k B T ) 3

m x2
y = f (x) = .
2
Uvjerite se da je

dx

φ(y) = ρ( x ) .
dy


Zadatak 3.26 Nasumična varijabla x ∈ (−∞, +∞) je opisana gustoćom vjerojatnosti


(Cauchyjeva raspodjela)

1
ρ( x ) = .
π (1 + x 2 )

Nad̄ite gustoću vjerojatnosti varijable y, ako je y = ax 2 za a > 0. Koje


vrijednosti poprima y? 

15 Vidjeti npr. poglavlje Sustavi čestica u G LUMAC, Klasična mehanika.


3.6 Preobrazbe varijabla 155

Rješenje:

dx
= 1 .

dy 2a| x |

Budući da je x ∈ (−∞, +∞), a y ∈ (0, +∞), to su svakoj vrijednosti y pridružene dvije


vrijednosti x, tako da je

1 1 a
φ(y) = 2 2
= √ .
π (1 + x ) 2a| x | π ( a + y) y

Uvjerite se da je raspodjela normirana,


Z +∞
φ(y) dy =? = 1.
0

Uputa: uvedite novu varijablu y/a = η.


p

Zadatak 3.27 Maxwellova raspodjela gustoće vjerojatnosti količine gibanja idealnog


plina je

4π 2
ρ( p) = p 2 e− p /(2mk B T ) .
(2πmk B T )3/2
Polazeći od gornjeg izraza izračunajte raspodjelu gustoća vjerojatnosti
energije. 

Rješenje:

p2
E=
2m
dovršiti

3.6.4 Preobrazba više kontinuiranih nasumičnih varijabla


Razmatranja iz prethodnog odjeljka se mogu izravno poopćiti na N nasumičnih varijabla

x1 , x2 , · · · , xN ,

opisanih gustoćom vjerojatnosti

ρ ( x1 , x2 , · · · , xN ).

Od varijabla xn se funkcijama f n , konstruiraju nove nasumične varijable yn s vrijednos-


tima

y1 = f 1 ( x1 , x2 , · · · , xN ),
y2 = f 2 ( x1 , x2 , · · · , xN ),
..
.
yN = f N ( x1 , x2 , · · · , xN ).
156 Poglavlje 3. Nasumične varijable

Uz pretpostavku da su preslikavanja f n bijekcije, postojat će i inverzna preslikavanja


x 1 = g1 ( y 1 , y 2 , · · · , y N ) ,
x 2 = g2 ( y 1 , y 2 , · · · , y N ) ,
..
.
xN = g N ( y1 , y2 , · · · , yN ).
Zadatak je
IZRA ČUNATI GUSTO ĆU VJEROJATNOSTI φ(y1 , y2 , · · · , yN ) ZA VARIJABLE yn .
Zamislimo, na trenutak, jedan malo drukčiji zadatak: treba izračunati masu sadržanu u
jednom dijelu volumena V0 , ako je raspodjela mase u prostoru opisana svojom masenom
gustoćom. Zadatak se može riješiti na više načina. Navedimo samo dva: gledano iz
pravokutnog sustava je
Z
m= ρm ( x, y, z) dx dy dz ,
V0

a gledano iz sfernog koordinatnog sustava je ta ista masa dana s


Z
m= φm (r, θ, ϕ) dr dθ dϕ .
V0

Da bi prošle svim točkama volumena V0 , varijable ( x, y, z) i (r, θ ϕ) moraju poprimiti


različite vrijednosti. Budući da oba gornja integrala opisuju istu masu, mora biti
Z Z
ρm ( x, y, z) dx dy dz = φm (r, θ, ϕ) dr dθ dϕ .
V0 V0

Slično je i s vjerojatnostima: želimo opisati vjerojatnost nekog dogad̄aja A, ali pomoću


različitih skupova koordinata: skupa xn i skupa yn . Vjerojatnost ISTOG dogad̄aja A
može se iskazati bilo preko varijabla xn , bilo preko varijabla Yn
Z
PA = ρ( x1 , x2 , · · · , xN ) dx1 · · · dxN ,
ZA
PA = φ(y1 , y2 , · · · , yN ) dy1 · · · dyN ,
A

iz čega izravno slijedi


Z Z
ρ( x1 , x2 , · · · , xN ) dx1 · · · dxN = φ(y1 , y2 , · · · , yN ) dy1 · · · dyN . (3.54)
A A

Kao što je poznato16 , umnošci diferencijala dx1 · · · dxN i dy1 · · · dyN povezani su jakobi-
janom J na slijedeći način
dx1 · · · dxN = |J | dy1 · · · dyN , (3.55)
gdje je s | J | označena apsolutna vrijednost jakobijana prijalaza iz varijabla xn u varijable
yn . Sam je jakobijan dan determinantom

∂x1 ∂x1
∂y1 · · · ∂yN

∂( x1 , x2 , · · · , xN ) . ..

J = = .. . (3.56)
∂ ( y1 , y2 , · · · , yN )
∂xN ∂xN
∂y1 · · · ∂yN

16 Vidjeti npr. poglavlje Sustavi čestica u G LUMAC, Klasična mehanika.


3.6 Preobrazbe varijabla 157

Sada se izraz (3.55) uvrsti na lijevu stranu jednakosti (3.54), koja tada postaje
Z Z
ρ( x1 , x2 , · · · , xN ) · |J | · dy1 · · · dyN = φ(y1 , y2 , · · · , yN ) dy1 · · · dyN .
A A

Usporedbom podintegralnih funkcija, dobiva se tražena veza med̄u vjerojatnostima


varijabla xn i Yn

∂ ( x1 , x2 , · · · , xN )

φ ( y1 , y2 , · · · , yN ) = ρ ( x1 , x2 , · · · , xN )
. (3.57)
∂ ( y1 , y2 , · · · , yN )

Kada je N = 1, gornji se izraz svodi na (3.53).

Zadatak 3.28 Izračunajte jakobijane prijelaza iz:


(a) pravokutnog u cilindrični koordinatni sustav,
(b) pravokutnog u sferni koordinatni sustav. 

Rješenje:
Vidjeti npr. u G LUMAC, Klasična mehanika.

Pokažimo kako se gornji postupak primjenjuje kada broj novih varijabla ym NIJE ISTI
BROJ kao i broj starih varijabla xn .

D VIJE NASUMI ČNE VARIJABLE


Ograničimo se, za početak, na dvije nasumične varijable x1 , x2 , od kojih želimo napraviti
jednu novu nasumičnu varijablu

y = f x1 , x2


i naći gustoću vjerojatnosti te nove varijable φ(y), ako nam je poznata gustoća vjerojat-
nosti početnih varijabla ρ( x1 , x2 ) i funkcija preslikavanja f .
Da bismo mogli primjeniti rezultat (3.57) na rješavanje ovog problema, uvest ćemo
(formalno) dvije nove varijable y1 , y2 , od kojih će prva nova zapravo biti jednostavno
jednaka prvoj staroj varijabli x1 , dok će Druga će biti jednaka f x1 , x2

y1 = f 1 ( x1 , x2 ) = x1 ,
y2 = f 2 ( x1 , x2 ) = f ( x1 , x2 ) = y.

Inverzne veze su

x 1 = g1 ( y 1 , y 2 ) = y 1 , (3.58)
x 2 = g2 ( y 1 , y 2 )

Jakobijan prijelaza iz ( x1 , x2 ) u (y1 , y2 ) dobiva se iz (3.56)

∂x1 ∂x1

1 0
∂( x1 , x2 ) ∂y1

∂y2 ∂x2
= = ∂x ∂x2 = .
∂(y1 , y2 ) ∂x2 ∂x2 2 ∂y2
∂y1 ∂y2
∂y1 ∂y2

158 Poglavlje 3. Nasumične varijable

Nula17 u gornjoj determinanti dolazi od toga što, prema (3.58), x1 ovisi samo o y1 , a ne i
o y2 . No, prema definiciji je

y1 = x1 , y2 ≡ y,

pa, u skladu s (3.57) pišemo



∂x2
φ( x1 , y) = ρ( x1 , x2 ) .
∂y
Gustoća vjerojatnosti same varijable y se dobije relacijom (3.41) kao MARGINALNA
gustoća vjerojatnosti od φ( x1 , y) ili, jednostavnije rečeno, φ( x1 , y) se prointegrira po x1 , a
rezultat je gustoća vjerojatnosti varijable y
Z xk
φ(y) = dx1 φ( x1 , y),
xp

Z xk ∂g2 ( x1 , y)

φ(y) = dx1 ρ[ x1 , g2 ( x1 , y)]
. (3.59)
xp ∂y

 Primjer 3.32 N EKOLIKO PRESLIKAVANJA


Iz poznate gustoće vjerojatnosti ρ( x1 , x2 ) treba izračunati gustoću vjerojatnosti φ(y)
varijable y, ako je:
(a) y = a1 x1 + a2 x2 , (b) y = − a1 x1 + a2 x2 , (c) y = x1 · x2 , (d) y = x2 /x1 , za konstantne a j .
Tražena vjerojatnost φ(y) se računa iz relacije (3.59)
Z xk
1 a1 = 1, 1

∂g2
( a ) g2 = y − x 1 , φ ( y ) = ρ( x1 , y/a2 − a1 x1 /a2 ) dx1 ,
a2 a2 ∂y a2 a2 x p
Z xk
1 a1 = 1, 1

∂g2
( b ) g2 = y + x 1 , φ ( y ) = ρ( x1 , y/a2 + a1 x1 /a2 ) dx1 ,
a2 a2 ∂y a2 a2 x p
Z xk
y = 1 , 1

∂g2
( c ) g2 = , φ ( y ) = dx1 ρ( x1 , y/x1 ) ,
x1 ∂y | x1 | xp | x1 |

∂g2 Z xk
( d ) g2 = y · x 1 , ∂y = | x1 |,
φ(y) = dx1 | x1 | ρ( x1 , y · x1 ).
xp

Neka su sada x1 i x2 NEZAVISNE nasumične varijable, opisane gustoćom vjerojatnosti


ρ( x1 , x2 ). Zbog njihove nezavisnosti, gustoća ρ( x1 , x2 ) se može napisati u obliku umnoška

ρ ( x1 , x2 ) = ρ1 ( x1 ) ρ2 ( x2 ).

U skladu s primjerom 3.32.(a), gustoća nasumične varijable

y = x1 + x2

je tada jednaka
Z xk Z xk
φ(y) = dx1 ρ( x1 , y − x1 ) = dx1 ρ1 ( x1 ) ρ2 (y − x1 ). (3.60)
xp xp

17 Za
derivaciju ∂x2 ∂y1 ≡ ∂x2 ∂x1 ne možemo reći je li nula ili nije, jer ne znamo jesu li x1 i x2
 

med̄usobno ovisni li neovisni.


3.6 Preobrazbe varijabla 159

drugi integral desne strane gornjeg izraza se naziva KONVOLUCIJA funkcija ρ1 i ρ2 ,


označava se kao
φ ( y ) = ρ1 ? ρ2
i predstavlja ekvivalent relacije (3.46) za diskretne varijable.

 Primjer 3.33 Z BROJ DVIJE VARIJABLE

Nezavisne nasumične varijable x i y opisane su normiranim gustoćama vjerojatnosti


ρ x ( x ) = α e−αx , x > 0,
− βy
ρy (y) = β e , y > 0, α 6= β.
Potrebno je izračunati gustoću vjerojatnosti nasumične varijable
z = x + y.
Prema (3.60) je
Z b
φ(z) = dx ρ x ( x ) ρy (z − x ).
a

Pozornost treba obratiti na granice integracije po x: budući da su i x i y pozitivni, to je i


z pozitivan; da bi pri tome vrijedila i relacija z = x + y, varijabla integracije x ne smije
biti veća od z (jer bi tada y moralo biti negativno); zaključak je da se integrira po x od
nula do z
Z z
αβ  −αz 
φ(z) = dx α e−αx β e− β(z− x) = e − e− βz , z > 0.
0 β−α
Provjerite normiranje φ(z). 

 Primjer 3.34 U MNOŽAK DVIJE VARIJABLE

Nezavisne nasumične varijable x i y opisane su normiranim gustoćama vjerojatnosti


(a)
1 2
ρ x ( x ) = √ e− x /2 , −∞ < x < +∞,

2 /2
ρ y ( y ) = y e− y , y > 0, i nula inače.
(b)
1
ρx (x) = √ , | x | < 1, i nula inače
π 1 − x2
2 /2
ρ y ( y ) = y e− y , y > 0, i nula inače.
Potrebno je izračunati gustoću vjerojatnosti nasumične varijable
z = x · y.
Prema (3.60) je
Z b
φ(z) = dx ρ x ( x ) ρy (z − x ).
a

dovršiti ... Provjerite normiranje φ(z). 


160 Poglavlje 3. Nasumične varijable

T RI NASUMI ČNE VARIJABLE


Provedimo sličan račun kao gore, ali za tri nasumične varijable x1 , x2 , x3 , od kojih treba
napraviti jednu novu nasumičnu varijablu

y = f x1 , x2 , x3


i naći gustoću vjerojatnosti te nove varijable φ(y), ako je poznata gustoća vjerojatnosti
početnih varijabla ρ( x1 , x2 , x3 ). Da bi se mogao primjeniti rezultat (3.57) na rješavanje
ovog problema, uvode se (formalno) tri nove varijable y1 , y2 , y3 , od kojih će prve dvije
zapravo biti  jednostavno jednake starim varijablama x1 , x2 , a treća će biti jednaka y =
f x1 , x2 , x3

y1 = f 1 ( x1 , x2 , x3 ) = x1 ,
y2 = f 2 ( x1 , x2 , x3 ) = x2 ,
y3 = f 3 ( x1 , x2 , x3 ).

Inverzne veze su

x 1 = g1 ( y 1 , y 2 , y 3 ) = y 1 ,
x 2 = g2 ( y 1 , y 2 , y 3 ) = y 2 , (3.61)
x 3 = g3 ( y 1 , y 2 , y 3 ) .

Jakobijan prijelaza iz ( x1 , x2 , x3 ) u (y1 , y2 , y3 ) dobiva se iz (3.56)

∂x1 ∂x1 ∂x1




∂y1 ∂y2 ∂x3 1 0 0


∂( x1 , x2 , x3 ) ∂x2 ∂x2 0 1 0 ∂x3

∂x2
= = = .
∂(y1 , y2 , y3 ) ∂y1 ∂y2 ∂x3 ∂x3 ∂x3 ∂x3 ∂y3
∂y1 ∂y2 ∂y3

∂x3 ∂x3 ∂x3

∂y ∂y2 ∂y
1 3

Nule u gornjoj determinanti dolaze od toga što, prema (3.61), x1 ovisi samo o y1 , a ne i o
y2 ni y3 i x2 ovisi samo o y2 , a ne i o y1 ni y3 . No, prema definiciji je

y3 ≡ y,

pa, u skladu s (3.57), pišemo



∂x3
φ( x1 , x2 , y) = ρ( x1 , x2 , x3 ) .
∂y

Gustoća vjerojatnosti varijable y se dobije kao marginalna gustoća vjerojatnosti od


φ( x1 , x2 , y) ili, jednostavnije rečeno, φ( x1 , x2 , y) se prointegrira po x1 , x2 , a rezultat je
gustoća vjerojatnosti varijable y

Z +∞ Z +∞
∂g3 ( x1 , x2 , y)

φ(y) = dx1 dx2 ρ[ x1 , x2 , g3 ( x1 , x2 , y)]
. (3.62)
−∞ −∞ ∂y
3.6 Preobrazbe varijabla 161

 Primjer 3.35 Iz poznate gustoće vjerojatnosti ρ( x1 , x2 , x3 ) treba izračunati gustoću vje-


rojatnosti φ(y) varijable y, ako je:
(a) y = x1 + x2 + x3 ,
(b) y = x1 − x2 + x3 ,
(c) y = x1 · x2 · x3 ,
(d) y = x3 /( x1 · x2 ),
Tražena vjerojatnost φ(y) se računa iz relacije (3.62)

∂g3 Z +∞ Z +∞
( a) g3 = y − x1 − x2 = 1, φ ( y ) = dx 1 dx2 ρ( x1 , x2 , y − x1 − x2 ) ,
∂y −∞ −∞

∂g3 Z +∞ Z +∞
( b ) g3 = y − x 1 + x 2 = 1, φ(y) = dx1 dx2 ρ( x1 , x2 , y − x1 + x2 ) ,
∂y −∞ −∞
Z +∞ Z +∞
y = 1 , φ(y) = 1

∂g3
( c ) g3 = dx 1 dx2 ρ( x1 , x2 , y/( x1 x2 )) ,
x1 x2 ∂y | x1 x2 | −∞ −∞ | x 1 x2 |

∂g3 Z +∞ Z +∞
( d ) g3 = y x 1 x 2 = | x1 x2 |, φ ( y ) = dx 1 dx2 | x1 x2 | ρ( x1 , x2 , y x1 x2 ) .
∂y −∞ −∞


Neka su sada x1 , x2 i x3 NEZAVISNE nasumične varijable, opisane gustoćom vjerojatnosti


ρ( x1 , x2 , x3 ). Zbog njihove nezavisnosti, gustoća ρ( x1 , x2 , x3 ) se može napisati u obliku
umnoška
ρ ( x1 , x2 , x3 ) = ρ1 ( x1 ) ρ2 ( x2 ) ρ3 ( x3 ).
U skladu s primjerom 3.35.a, gustoća nasumične varijable
y = x1 + x2 + x3
je tada jednaka
Z +∞ Z +∞
φ(y) = dx1 dx2 ρ( x1 , x2 , y − x1 − x2 )
−∞ −∞
Z +∞ Z +∞
= dx1 dx2 ρ1 ( x1 ) ρ2 ( x2 ) ρ3 (y − x1 − x2 ). (3.63)
−∞ −∞

To je ekvivalent relacije (3.47) za diskretne varijable.


Gornji se integral naziva KONVOLUCIJA tri funkcije ρ1 , ρ2 i ρ3 i označava se kao
φ ( y ) = ρ1 ? ρ2 ? ρ3 .
Primjetimo još i da se gornji rezultat može dobiti dvostrukom primjenom (3.60). Napi-
šimo (3.60) u obliku
Z +∞
φ(y) = dt ρ1,2 (t) ρ3 (y − t).
−∞

Sada i ρ1,2 (t) napišemo opet pomoću (3.60)


Z +∞
ρ1,2 (t) = dx1 ρ1 ( x1 ) ρ2 (t − x1 ).
−∞

Gornji izraz za ρ1,2 (t) uvrstimo u izraz za φ(y)


Z +∞ Z +∞
φ(y) = dt dx1 ρ1 ( x1 ) ρ2 (t − x1 ) ρ3 ( y − t ).
−∞
| −∞ {z }
= ρ1,2 (t)
162 Poglavlje 3. Nasumične varijable

Posljednji je korak, umjesto varijable t uvesti novu varijablu x2


+∞ +∞
x2 = t − x1 dx2 = dt ,

−∞ −∞

nakon čega φ(y) postaje


Z +∞ Z +∞
φ(y) = dx1 dx2 ρ1 ( x1 ) ρ2 ( x2 ) ρ3 (y − x1 − x2 ).
−∞ −∞

Rezultati (3.60) i (3.63) su mogu poopćiti: ako su nezavisne nasumične varijable

x1 , x2 , · · · , xN

opisane gustoćama vjerojatnosti

ρ1 ( x1 ), ρ2 ( x2 ), · · · , ρ N ( xN ),

tada je nasumična varijabla

y = x1 + x2 + · · · + xN

opisana gustoćom vjerojatnosti φ(y) koja je dana kao konvolucija gustoća ρn

φ ( y ) = ρ1 ? ρ2 ? · · · ? ρ N

ili eksplicitno kao


Z +∞
φ(y) = dx1 dx2 · · · dxN-1 ρ1 ( x1 ) ρ2 ( x2 ) ρ3 ( x3 ) · · · ρ N −1 ( xN-1 ) ρ N (y − x1 − x2 − · · · − xN-1 ).
−∞

Zadatak 3.29 Nasumična varijabla x je raspodjeljena po Gaußovoj raspodjeli s h x i i


σ 2 . Izračunajte raspodjelu varijable y = ax + b, ako su a i b konstante. 

Rješenje:

1 2 2
ρ( x ) = √ e−(x−hxi) /(2σ ) ,
σ 2π
dx

φ(y) = ρ( x ) ,
dy
dx 1 1

y = ax + b ⇒ = ⇒ φ(y) = ρ( x ) ,
dy a | a|
1 2 2 2
φ(y) = √ e−(y−b−ahxi) /(2a σ ) .
| a|σ 2π

P REOBRAZBE MOMENATA
Iz odjeljka 3.6.3 je poznata veza (3.53) izmed̄u gustoća vjerojatnosti ρ( x ) i φ(y). Postavlja
se pitanje

KAKO IZRA ČUNATI MOMENATE NASUMI ČNE VARIJABLE y,


3.6 Preobrazbe varijabla 163

PREKO GUSTO ĆE RASPODJELE VARIJABLE x.

Krenimo od definicije k-tog momenta varijable y, uz pretpostavku da je f monotono


rastuća funkcija
d
b
 
y = f x ,

c a

Z d
hy m i = y m φ(y) dy , (3.64)
c
koja, posredstvom veze (3.52),
dx
φ(y) = ρ( x ) ,
dy
prelazi u
Z b h Z b h
m
im dx im
hy i = f (x) ρ( x ) dy = f (x) ρ( x ) dx = h f m i .
a dy a

Posebno, za m = 1, dobiva se očekivanje (srednja vrijednost) varijable y


Z b
E(y) ≡ hyi = f ( x ) ρ( x ) dx .
a
Sličan je postupak i kada je f monotono opadajuća funkcija.

Zadatak 3.30 Promatra se kontinuirana varijabla x koja poprima vrijednosti iz inter-


vala x ∈ (0, 4) i čija je raspodjela gustoće vjerojatnosti dana sa
x
ρ( x ) = .
8
Nova varijabla y je povezana sa x relacijom

y = f ( x ) = 3x + 2.

Treba izračunati funkciju raspodjele gustoće vjerojatnosti varijable y i


srednje vrijednosti varijabla x i y. 

Rješenje:
Ako je područje vrijednosti varijable x interval (0, 4), tada varijabla y poprima vrijednosti u
intervalu (2, 14). Funkcija f je monotona, pa je zato
dx x 1 1 y−2 y−2
φ(y) = ρ( x ) = = = .
dy 8 3 24 3 72
Provjera normiranja ρ( x ) i φ(y)
4
1 x 2
Z 4
1 4
Z
ρ( x ) dx = x dx = = 1.
0 8 0 8 2 0
Z 14 Z 14
1
φ(y) dy = (y − 2) dy
2 72 2
 2 14
1 y 1 14 2 − 2 2
 
= − 2y = − 2(14 − 2) = 1.
72 2 2 72 2
164 Poglavlje 3. Nasumične varijable

Srednje vrijednosti
8
x 3
Z 4
8
hxi = x ρ( x ) dx = = ,
0 24
0 3
14
y3
Z 14
1

2
hyi = y φ(y) dy = −y = 10.
2 720 3 2

Primjetimo da je

y = 3x + 2, & hyi = 3 h x i + 2.

3.7 Teoremi o nasumičnim varijablama


Radi jednostavnosti, u nastavku izlaganja ćemo se ograničiti na kontinuirane varijable
xn , a svi rezultati se, pomoću zamjene integriranja zbrajanjem, mogu lako prevesti na
jezik diskretnih varijabla.
Pogledajmo čemu je jednaka srednja vrijednost (prvi moment) varijable y, ako je ona
zadana kao linearna kombinacija varijabla x1 i x2

y = f ( x1 , x2 ) = a1 x1 + a2 x2 , a j = const.

Najprije se računa gustoća vjerojatnosti varijable y. Za rješavanje ovog problema koristit


će se (3.50)
Z h i
φ(y) = δ y − f ( x1 , x2 ) ρ( x1 , x2 ) dx1 dx2 .

Prema definiciji, (3.64), prvi moment nasumične varijable je


Z Z Z h i
hyi = y φ(y) dy = y dy δ y − ( a1 x1 + a2 x2 ) ρ( x1 , x2 ) dx1 dx2
Z Z Z
= ( a1 x1 + a2 x2 ) ρ( x1 , x2 ) dx1 dx2 = a1 x1 ρ( x1 , x2 ) dx1 dx2 + a2 x2 ρ( x1 , x2 ) dx1 dx2
= a1 h x1 i + a2 h x2 i . (3.65)

Do istog se rezultata dolazi i slijedećim računom


Z +∞ Z +∞
h y i = h a1 x1 + a2 x2 i = dx1 dx2 ( a1 x1 + a2 x2 ) ρ( x1 , x2 )
−∞ −∞
Z +∞ Z +∞ Z +∞ Z +∞
= a1 x1 dx1 ρ( x1 , x2 ) dx2 + a2 ρ( x1 , x2 ) dx1 x2 dx2
−∞ −∞ −∞ −∞
= a1 h x1 i + a2 h x2 i .

Iz oba izvoda je očito da se isti rezultat dobije bez obzira jesu li x1 i x2 med̄usobno ovisne
ili neovisne varijable, kao i da ga je lako poopćiti na proizvoljan broj od N nasumičnih
varijabla

y = a1 x1 + a2 x2 + · · · + aN xN ,

h a1 x1 + a2 x2 + · · · + aN xN i = a1 h x1 i + a2 h x2 i + · · · + aN h xN i , (3.66)
3.7 Teoremi o nasumičnim varijablama 165

neovisno o tome jesu li x1 , x2 , . . . , xN , med̄usobno zavisne ili nezavisne varijable.

Promatrajmo dvije nasumične varijable (svejedno je jesu li diskretne ili kontinuirane) x1


i x2 i izračunajmo varijancu njihove linearne kombinacije
a1 x1 + a2 x2 , a j = const.
Sjetimo se da je, prema (3.34), varijanca x jednaka
Var ( x ) = x 2 − h x i 2 .

Prema tome je i

Var ( a1 x1 + a2 x2 ) = ( a1 x1 + a2 x2 ) 2 − h a1 x1 + a2 x2 i 2
D E

= a12 x12 + 2a1 a2 x1 x2 + a22 x22 − a12 h x1 i 2 + 2a1 a2 h x1 i h x2 i + a22 h x2 i 2



 

= a12 x12 − h x1 i 2 + a22 x22 − h x2 i 2 + 2a1 a2 h x1 x2 i − h x1 i h x2 i .



 
  

U gornjem se izrazu prepoznaju varijance x1 i x2


Var ( x1 ) = x12 − h x1 i 2 Var ( x2 ) = x22 − h x2 i 2 ,


a takod̄er se pojavila i jedna nova veličina koja se naziva KOVARIJANCA (usporediti s


(6.52), (9.10) i odjeljkom 13)

Cov( xi , x j ) ≡ xi x j − h xi i x j . (3.67)


U gornjem primjeru to je
Cov( x1 , x2 ) = h x1 x2 i − h x1 i h x2 i .
Parovi nasumičnih varijabli čija je kovarijanca jednaka nuli, nazivaju se NEKORELIRANE
nasumične varijable (mogu biti i diskretne i kontinuirane)
h x1 x2 i = h x1 i h x2 i . (3.68)
Primjetimo da varijable koje su statistički neovisne, (3.12), (3.31), jesu ujedno i nekoreli-
rane. No, obrat ne vrijedi - ako su varijable nekorelirane, nije nužno da su i statistički
neovisne.
Sada se za varijancu linearne kombinacije dvije nasumične varijable može napisati
Var ( a1 x1 + a2 x2 ) = a12 Var ( x1 ) + a22 Var ( x2 ) + 2a1 a2 Cov( x1 , x2 ). (3.69)
Primjetimo da je npr.
Var ( x1 − x2 ) = Var ( x1 ) + Var ( x2 ) − 2 Cov( x1 , x2 ).
Izraz (3.69) lako poopćiti na proizvoljan broj nasumičnih varijabla
Var ( a1 x1 + a2 x2 + a3 x3 + · · · ) = a12 Var ( x1 ) + a22 Var ( x2 ) + a32 Var ( x3 ) + · · ·
+ 2a1 a2 Cov( x1 , x2 ) + 2a1 a3 Cov( x1 , x3 ) + · · ·
+ 2a2 a3 Cov( x2 , x3 ) + 2a2 a4 Cov( x2 , x4 ) + · · ·
.
+ ..

= ∑ an2 Var ( xn ) + 2 ∑ ∑ an am Cov( xn , xm ).


n n m
n<m
166 Poglavlje 3. Nasumične varijable

 Primjer 3.36 Promotrimo ponovo raspodjelu iz primjera 3.25


s
1 − λ2 1  2
 
2
ρ G ( x1 , x2 ) = exp − x1 − 2λx1 x2 + x2 .
(2πσ 2 ) 2 2σ 2

Potrebno je izračunati kovarijancu varijabla x1 i x2 . Momenti se računaju kao


Z +∞ Z +∞
h x1m i = dx1 dx2 x1m ρ G ( x1 , x2 )
−∞ −∞
Z +∞ Z +∞
h x1 x2 i = dx1 dx2 x1 x2 ρ G ( x1 , x2 ).
−∞ −∞

iz čega se lako dobiva

σ2
h x1 i = 0, x12 = σλ2 x12 − h x1 i 2 = σλ2 , σλ2 =




1 − λ2
λ
h x1 x2 i = σ 2 .
1 − λ2

Izračunajmo i kovarijancu

λ
hh x1 x2 ii ≡ h x1 x2 i − h x1 i h x2 i = h x1 x2 i = σ 2 .
1 − λ2

Normirana kovarijanca je

hh x x ii
q
1 2
= λ
x12 x22

iz čega se vidi da je parametar λ mjera korelacije med̄u varijablama x1 i x2 . U granici


λ → 0, varijable x1 i x2 su nekorelirane

1 x2 1 x2
   
ρ G ( x1 , x2 ) = √ exp − 1 2 √ exp − 2 2 = ρ G ( x1 ) · ρ G ( x2 ).
2πσ 2 2σ 2πσ 2 2σ

U granici λ → 1, varijable x1 i x2 su maksimalno korelirane i raspodjela ovisi samo


njihovoj razlici

( x1 − x2 ) 2
 
ρ G ( x1 , x2 ) ∼ exp − .
2σ 2

U ovoj granici jakog vezanja, vjerojatnost samih iznosa x1 i x2 ne odred̄uje vjerojatnost,


nego je vjerojatnost odred̄ena samo njihovom razlikom - tj. najvjerojatnije su one
raspodjele gdje je razlika izmed̄u x1 i x2 što manja, dok sami iznosi x1 i x2 mogu biti i
proizvoljno veliki. 

Vratimo se opet statistički NEOVISNIM varijablama x1 i x2 , prema (3.12) njihova je gustoća


vjerojatnosti dana sa

ρ ( x1 , x2 ) = ρ1 ( x1 ) · ρ2 ( x2 ).
3.7 Teoremi o nasumičnim varijablama 167

Izračunajmo matematičko očekivanje umnoška18 x1 x2


Z +∞ Z +∞
E ( x1 x2 ) ≡ h x1 x2 i = x1 x2 ρ( x1 , x2 ) dx1 dx2
−∞ −∞
Z +∞ Z +∞
= x1 ρ1 ( x1 ) dx1 x2 ρ2 ( x2 ) dx2
−∞ −∞
= E ( x1 ) E ( x2 ) ≡ h x1 i h x2 i .

Primjetimo opet da su statistički neovisne varijable ujedno i nekorelirane, (3.68).


Iz izvoda je očito da vrijedi i popćenje na proizvoljan broj med̄usobno neovisnih varijabla

x1 , x2 , . . . , xN ,

pri čemu je

E ( x1 x2 · · · xN ) = E ( x1 ) E ( x2 ) · · · E ( xN ),

ili, u drugim oznakama

h x1 x2 · · · xN i = h x1 i h x2 i · · · h xN i . (3.70)

Gornja tvrdnja NIJE točna ako su varijable med̄usobno zavisne.

Zadatak 3.31 Neka su kontinuirane nasumične varijable x i y definirane kao

x = cos(θ ), y = sin(θ ),

pri čemu je θ kontinuirana nasumična varijabla jednoliko raspodjeljena


po intervalu (0, 2π ).
(a) Pokažite da su x i y nekorelirane.
(a) Pokažite da su x i y statistički neovisne. 

Rješenje:
dovršiti
Zadatak 3.32 Na intervalu [0, 5], kontinuirana nasumična varijabla x ima konstantnu
gustoću vjerojatnosti. Unutar istog intervala, uočena je točka 0 < a < 5
i pomoću nje je definirana nova nasumična vrijabla

y = | x − a |,

koja mjeri udaljenost x od a. Izračunajte kovarijancu

h x yi − h x i hyi

izmed̄u varijabla x i y. Kakav mora biti a, pa da x i y ne budu koreli-


rani? 

18 Izrazi ovog oblika se mogu povezati s različitim vrstama korelacijskih funkcija (odjeljak 13).
168 Poglavlje 3. Nasumične varijable

Rješenje:
Gustoća vjerojatnosti varijable x je konstantna

1
ρx (x) = ,
5
Z 5
5
hxi = x ρ x ( x ) dx = ,
0 2
a2
Z 5 Z a Z 5
1 1 5
hyi = | x − a| ρ x ( x ) dx = ( a − x ) dx + ( x − a) dx = −a+ ,
0 5 0 5 a 5 2
Z 5
1 a 1 a
Z Z
h x yi = x | x − a| ρ x ( x ) dx = x ( a − x ) dx + x ( x − a) dx
0 5 0 5 0
1 a 3 25a 125
 
= − + ,
5 3 2 3
1 a 3 25a 125 5 a2 5 4a 3 − 30a 2 + 125
   
h x Y i − h x i hyi = − + − −a+ = .
5 3 2 3 2 5 2 60

Varijable x i y su nekorelirane, (3.67), kada je


150

100
h x yi = h x i hyi ,
4 a - 30 a + 125

tj. kada je
50
2

-50 4a 3 − 30a 2 + 125 = 0.


3

-100

Jedino realno rješenje gornje jednadžbe je


a = 5/2 (slika lijevo).
-150
0 1 2 3 4 5
a

Dakle, ako je točka a na sredini intervala, x i y su nekorelirane (ali ne i statistički neovisne, jer je
y = | x − a|).
3.7 Teoremi o nasumičnim varijablama 169

Literatura korištena u ovom poglavlju:

1. J OHN B OCCIO.
Quantum mechanics. 2017. URL: http://www.johnboccio.com/TQM/QM_1.pdf
2. N EVEN E LEZOVI Ć.
Vjerojatnost i statistika 2 - slučajne varijable. Element, Zagreb, 2007
3. J OSÉ L UIS G ARCIA -PALACIOS. „
Introduction to the theory of stochastic processes and Brownian motion problems”.
(2007). URL: arxiv.org/abs/cond-mat/0701242
4. C HARLES M. G RINSTEAD I J. L AURIE S NELL.
Introduction to probability. 2019. URL: https://www.math.dartmouth.edu/~prob/
prob/prob.pdf
5. B RANISLAV I VANOVI Ć.
Teorija verovatnoće. Univerzitetski udžbenici. Naučna knjiga, Beograd, 1977, stra-
nica 328
6. Ivo PAVLI Ć.
Statistička teorija i primjena. Panorama, Zagreb, 1965
7. K EN R ILEY , M ICHAEL H OBSON I S TEPHEN B ENCE.
Mathematical Methods for Physics and Engineering. Cambridge Univ. Press, 2006
8. V LADIMIR V RANI Ć.
Vjerojatnost i statistika. Tehnička knjiga, Zagreb, 1971
9. S VETOZAR V. V UKADINOVI Ć.
Zbirka rešenih zadataka iz teorije verovatnoće. Privredni pregled, Beograd, 1990
4. Raspodjele

4.1 Raspodjele diskretnih nasumičnih varijabla

S VAKOJ DISKRETNOJ nasumičnoj varijabli X pridružuje se broj P( x ) koji predstavlja


vjerojatnost da varijabla X poprimi vrijednost X = x. Skup P( x ) za sve moguće
vrijednosti x, zove se raspodjela vjerojatnosti diskretne nasumične varijable1 .

 Primjer 4.1 Donjom je tablicom zadana raspodjela vjerojatnosti diskretne nasumične


varijable
x 2 3 4 5 6 7

2 5 8 8 5 2
P( x ) 30 30 30 30 30 30
Potrebno je
(a) prikazati grafički raspodjelu vrijednosti varijable X;
(b) izračunati vjerojatnost P( x ≤ 4);
(c) prikazati grafički kumulativnu funkciju raspodjele F ( x );
(d) izračunati očekivanje i varijancu varijable X;
(e) izračunati očekivanje i varijancu varijable Y = 2X − 3.

(a) Slika desno ... dodati ... .


(b) Prema ... je
1
P ( x ≤ 4) = P ( x = 1) + P ( x = 2) + P ( x = 3) + P ( x = 4) = .
2
(c) Prema (3.1) je
x
F(x) = ∑ P ( x ), ⇒ F ( x < 2) = 0,
x =−∞
2 3 4
2 7 15
F (2) = ∑ P( x ) = 30
, F (3) = ∑ P( x ) = 30
, F (4) = ∑ P(x) = 30 ,
x =2 x =2 x =2
1 AtlasRaspodjela.pdf DrugiAutori ?? staviti na kraj djelomičan popis (navesti gustoću, graf, entropiju,

funkc izvodnicu, karakt funkc, momente, modus, medijan, svojstva, veza s drugim raspodjelama)
172 Poglavlje 4. Raspodjele
5 6 7
23 28
F (5) = ∑ P( x ) = 30
, F (6) = ∑ P( x ) = 30
, F (7) = ∑ P(x) = 1,
x =2 x =2 x =2
7
F ( x > 7) = ∑ P(x) = 1.
x =2

? (a) i (c) staviti na istu sliku


(d) Prema (3.20) i (3.34) je
7 7
135 659
hXi = ∑ x P( x ) = = 4.5, x2 = ∑ x 2 P( x ) = = 21.96̇,


x =2 30 x =2 30
2
σX2 = x 2
− h X i = 1.716̇.


(e)

hY i = h2X − 3i = 2 h X i − 3 = 6
Y 2 = (2X − 3) 2 = 4 x 2 − 6 h X i + 9 = 42.86̇,



σY2 = Y 2 − hY i 2 = 6.86̇ = 2 2 σX2 .



dovršiti slike 

Zadatak 4.1 Dan je niz brojeva: 1, 2, 3, 4, 5, 6, 7, 8. Iz tog se niza nasumičnim izborom


uzima uzorak od tri broja. Označimo li s X najveći broj u uzorku, tada
je X nasumična varijabla.
(a) Koje vrijednosti može poprimiti varijabla X?
(b) Koje vjerojatnosti pripadaju pojedinim vrijednostima?
(c) Kako glasi raspodjela vjerojatnosti varijable X?
(d) Izračunajte očekivanje i standardnu devijaciju varijable X. 

Rješenje:
(a)
n o
X ∈ 3, 4, 5, 6, 7, 8 .

(b+c) Od 8 elemenata, ukupno je moguće napraviti

8
 
= 56
3

uzoraka od po tri elementa. Postoji samo jedan uzorak


n o
1, 2, 3

u kojemu je 3 najveći broj, pa je zato

1
P (3) = .
56
U uzorcima u kojima je najveći broj 4 se mora pojaviti 4 i dva broja iz skupa
n o
1, 2, 3
4.1 Raspodjele diskretnih nasumičnih varijabla 173

Dva od tri broja s može odabrati na


3
 
=3
2
načina i zato je
3
P (4) = .
56
U uzorcima u kojima je najveći broj 5 se mora pojaviti 5 i dva broja iz skupa
n o
1, 2, 3, 4

Dva od četiri broja s može odabrati na


4
 
=6
2
načina i zato je
6
P (5) = .
56
U uzorcima u kojima je najveći broj 6 se mora pojaviti 6 i dva broja iz skupa
n o
1, 2, 3, 4, 5

Dva od pet brojeva s može odabrati na


5
 
= 10
2
načina i zato je
10
P (6) = .
56
Iz gornjih se primjera zaključuje da je općenito raspodjela P( x ) jednaka
x−1
 

2 ( x − 1)( x − 2)
P( x ) =   = .
8 2 · 56
3
Lako je uvjeriti se da je gornja raspodjela vjerojatnosti normirana
8
∑ P( x ) = 1.
x =3

(d)
8 8
378
hXi = ∑ x P( x ) = = 6.75, x2 = ∑ x 2 P( x ) = 47.25,


x =3 56 x =3
2 2 2
σ = x − h X i = 1.6875, σ = 1.299 · · · .



174 Poglavlje 4. Raspodjele

Zadatak 4.2 Jedna posuda sadrži 4 bijele i 3 crne kuglice. Slučajnim postupkom se
uzima uzorak od 3 kuglice. Neka je X broj bijelih kuglica u uzorku.
(a) Kolike vjerojatnosti pripadaju vrijednostima x = 0, 1, 2, 3?
(b) Kako glasi raspodjela vjerojatnosti varijable X?
(c) Izračunajte očekivanje i standardnu devijaciju varijable X. 

Rješenje:
(a) Od ukupno 7 kuglica, njih tri se mogu odabrati na

7
 
= 35
3
načina. Vjerojatnost da med̄u tri odabrane kuglice nema bijelih, tj. da su sve crne je

(40) (33) 1
P ( x = 0) = = .
(73) 35

Slično se dobiju i ostale vjerojatnosti

(41) (32) 12
P ( x = 1) = = ,
(73) 35
(42) (31) 18
P ( x = 2) = = ,
(73) 35
(43) (30) 4
P ( x = 3) = = .
(73) 35

Lako je uvjeriti se da je gornja raspodjela vjerojatnosti normirana


3
∑ P( x ) = 1.
x =0

(b) Očito se gornje vjerojatnosti mogu zapisati u obliku

(4x) (3−3 x)
P( x ) = , x = 0, 1, 2, 3.
(73)
(d)
3 3
12 24
hXi = ∑ x P( x ) = , x2 = ∑ x 2 P( x ) = ,


x =0 7 x =0 7
24
σ2 = x 2
− hXi 2 = , σ = 0.699854 · · · .



49
? dodati sliku

4.1.1 Jednolika raspodjela


Ako diskretna nasumična varijabla X može poprimiti N vrijednosti xn s jednakom
vjerojatnošću, tada je zbog normiranja vjerojatnosti,
N N
∑ P( xn ) = P( xn ) ∑ 1 = 1,
n =1 n =1
4.1 Raspodjele diskretnih nasumičnih varijabla 175

tako da je
Slika 4.1: Jednolika raspodjela diskretne va-
rijable za N = 5.

P( x )

1
0.2
P( xn ) = (4.1)
N

x za sve n = 1, 2, 3, · · · , N.
x1 x2 x3 x4 x5

Takva raspodjela P( xn ) se naziva jednolika diskretna raspodjela, prikazana slikom 4.1.


Jednostavan primjer diskretne jednolike raspodjele o kojemu je već bilo riječi, jeste
raspodjela vjerojatnosti da se bacanjem savršene kocke, dobije broj xn = n = 1, 2, 3, 4, 5
ili 6. Diskretna varijabla xn može s jednakom vjerojatnošću poprimiti N = 6 vrijednosti,
pa je zato
1
P (1) = P (2) = P (3) = P (4) = P (5) = P (6) = ,
6
čime je zadovoljen uvjet normiranja

∑ P(xn ) = 1.
n

Izračunajmo nekoliko prvih momenata


N N
D E 1 x1 + x2 + · · · + xN
xk = ∑ xnk P( x ) =
N ∑ xnk , ⇒ hXi =
N
= X,
n =1 n =1
x 2 + x22 + · · · + xN2
x2 = 1 ,

N
..
..
Primjetimo da je prvi moment, h X i, jednolike raspodjele, upravo ARITMETI ČKA SRE -
DINA .

Zadatak 4.3 Za diskretnu raspodjelu koja opisuje bacanje savršene kocke, izračunajte
varijancu. 

Rješenje:

1
P( x ) = , x = 1, 2, 3, 4, 5, 6.
6

6 6
21 91
hXi = ∑ x P( x ) = , x2 = ∑ x 2 P( x ) =


x =1
6 x =1
6

σ
σ 2 = x 2 − h x i 2 = 2.91667, = ... .



hXi
176 Poglavlje 4. Raspodjele

Zadatak 4.4 Za diskretnu raspodjelu koja opisuje bacanje kocke, izračunajte:


(a) koeficijente α 3 i α 4 ,
(b) mod i sva tri kvartila. 

Rješenje:
Slično kao i u prethodnom zadatku

1
P( x ) = , x = 1, 2, 3, 4, 5, 6
6
6 6
21 91
⇒ hXi = ∑ x P( x ) = , x2 = ∑ x 2 P( x ) = ,


x =1
6 x =1
6
6 6
... D E ...
x3 = ∑ x 3 P( x ) = , x4 = ∑ x 4 P( x ) =


x =1
6 x =1
6
α 3 = ... α 4 = ...

4.1.2 Geometrijska raspodjela


Promatra se proces koji može okončati na samo dva načina: ili se dogad̄aj A ostvario ili
nije. Vjerojatnost ostvarenja je u svim pokusima konstantna i iznosi p (označimo q =
1 − p). Ovakvi se dogad̄aji nazivaju Bernoullijevi dogad̄aji (odjeljak 4.1.3). Izračunajmo
vjerojatnost P(n) da se A OSTVARI PRVI PUTA u n-tom izvod̄enju pokusa. Da bi se
A ostvario prvi puta u n-tom izvod̄enju pokusa, potrebno je da se NE ostvari u svih
prethodnih n − 1 izvod̄enja pokusa, pa je zato

P(1) = p,
P(2) = q p,
P(3) = q 2 p,
P(4) = q 3 p,
..
.
P(n) = q n−1 p, n = 1, 2, 3, · · · .

Ovako definirane P(n) su uvijek manje od jedinice i sve su pozitivne. Da bi P(n) bila
raspodjela vjerojatnosti, treba provjeriti je li zadovoljen uvjet normiranja


∑ P(n) =? = 1.
n =1

No, gornji je zbroj upravo zbroj geometrijskog reda

∞ ∞
1
p ∑ q n −1 = p ∑ qm = p
1−q
= 1, (4.2)
n =1 m =0
4.1 Raspodjele diskretnih nasumičnih varijabla 177

pa je raspodjela P(n) normirana. Ovakva se raspodjela naziva geometrijska raspodjela


Slika 4.2
vjerojatnosti (slika 4.2)

0.2 p = 0.1
p = 0.2
P ( n ) = p (1 − p ) n −1 , n = 1, 2, 3, · · ·
0.15

(4.3)
P (n)

0.1

0.05
Ova je raspodjela već izvedena pomoću na-
čela maksimuma entropije, (5.22). Geome-
0
0 10 20
n
30 40 50 trijsku raspodjelu ne treba pomiješati s ge-
ometrijskom vjerojatnošću sa strane 113.

Primjetimo da je geometrijska raspodjela monotono opadajuća budući da je

P ( n + 1) qn
= n −1 = q < 1 ⇒ P ( n + 1) < P ( n ).
P(n) q

M OMENTI
U skladu s definicijom (3.22), momenti geometrijske raspodjele se računaju kao
D E ∞ ∞
nk = ∑ n k P(n) = p ∑ n k q n −1 ,
n =1 n =1

∞ ∞
d d 1 1
 
hni = p ∑ nq n −1
=p
dq ∑ n
q =p
dq 1−q
−1 = p
(1 − q ) 2
n =1 n =1
1
= . (4.4)
p

∞ ∞ ∞
n2 = p ∑ n 2 q n −1 = p ∑ ( m + 1) 2 q m = p ∑ (m 2 + 2m + 1) q m


n =1 m =0 m =0
∞ h i
=p ∑ m(m − 1) + 3m + 1 q m
m =0
∞ ∞ ∞
=p ∑ m(m − 1) q m + 3p ∑ m qm + p ∑ qm
m =0 m =0 m =0
∞ ∞ ∞
d2 d
= p q2 2
dq ∑ q m + 3pq
dq ∑ qm + p ∑ qm
m =0 m =0 m =0
q2 q
=2 +3 +1
p2 p

q σ
σ 2 = n 2 − hni 2 = 2 , = 1 − p.

p

p hni
178 Poglavlje 4. Raspodjele

Zadatak 4.5 Za geometrijsku raspodjelu izračunajte:


(a) koeficijente α 3 i α 4 ,
(b) mod i sva tri kvartila. 

Rješenje:
dovršiti
2− p
α3 = p α 4 = ....
1− p

S VOJSTVA - IZOSTANAK PAM ĆENJA


Slučajna varijabla koja se ravna po geometrijskoj raspodjeli nema pamćenja, tj. vjerojatnost
da nasumična varijabla n ima vrijednost veću od neke zadane vrijednosti n0 , ne ovisi o
n0 (usporediti s odjeljcima ?? i ??) ili, matematičkim rječnikom

P(n = n0 + m/n > n0 ) = P(n = m), m = 1, 2, · · · . (4.5)

Prema (2.11) uvjetna vjerojatnost je dana omjerom apsolutnih vjerojatnosti

P( AB) P(n = n0 + m, n > n0 )


P( B/A) = −→ P(n = n0 + m/n > n0 ) =
P( A) P ( n > n0 )

Vjerojatnost u brojniku kaže da je n > n0 i da je n = n0 + m. No, za pozitivni m to je isti


zahtjev, pa je

P(n = n0 + m, n > n0 ) = pq n0 +m−1

U nazivniku je vjerojatnost da se promatrani dogad̄aj ostvari nakon više od n0 pokusa


- dakle, ili se dogodio u n0 + 1-vom pokusu ili u n0 + 2-vom pokusu ili u n0 + 3-em
pokusu ili · · · . Zato je
  1
P(n > n0 ) = pq n0 + pq n0 +1 + pq n0 +2 + · · · = pq n0 1 + q + q 2 + · · · = pq n0 = q n0 .
1−q

Tražena uvjetna vjerojatnost je

pq n0 +m−1
P(n = n0 + m/n > n0 ) = = pq m−1 = P(n = m),
q n0

dakle neovisno o n0 . Sustav NE ZNA da se već dogodilo n0 pokusa i ponaša se kao da


pokusi počinju upravo sada. Ako n mjeri vremenske intervale, tada je raspodjela vjero-
jatnosti INVARIJANTNA NA TRANSLACIJE U VREMENU. Gornjim je izvodom pokazano,
da ako je raspodjela vjerojatnosti diskretne nasumične varijable n dana geometrijskom
raspodjelom, tada vrijedi (4.5). Dokažimo i suprotan smjer tvrdnje: ako vrijedi (4.5),
tada je n opisana geometrijskom raspodjelom. Zbrajanjem izraza oblika (4.5), dolazi se
do

P(n > n0 + m/n > n0 ) = P(n > m) (4.6)

Pomoću (2.11), uvjetna vjerojatnost na lijevoj strani je

P(n > n0 + m, n > n0 )


P(n > n0 + m/n > n0 ) = .
P ( n > n0 )
4.1 Raspodjele diskretnih nasumičnih varijabla 179

Ponovo, vjerojatnost u brojniku kaže da je n > n0 i da je n > n0 + m. No, za pozitivni m


to je isti zahtjev, pa je

P(n > n0 + m, n > n0 ) = P(n > n0 + m)

i
P ( n > n0 + m )
P(n > n0 + m/n > n0 ) = .
P ( n > n0 )

Izjednačavanjem gornjeg izraza i (4.6), dobiva se

P ( n > n0 + m )
P(n > m) = ,
P ( n > n0 )
P ( n > n0 + m ) = P ( n > n0 ) P ( n > m ). (4.7)

Nazovimo

f ( m ) ≡ P ( n > m ).

Tada relacija (4.7) postaje

f ( n0 + m ) = f ( n0 ) f ( m ). (4.8)

Izračunajmo f (0) i f (1)

f (0) = P(n > 0) = 1,


f (1) = P(n > 1) = pq 2−1 + pq3−1 + pq4−1 + pq5−1 + pq6−1 + · · ·
  1
= pq 1 + q + q 2 + q 3 + · · · = pq = q.
1−q

Uz gornje vrijednosti iz rekurzije (4.8) slijedi

m = 0 =⇒ f (n0 ) = f (n0 ) f (0) = f (n0 ),


m = 1 =⇒ f (n0 + 1) = f (n0 ) f (1) = f (n0 ) q,
m = 2 =⇒ f (n0 + 2) = f (n0 + 1 + 1) = f (n0 + 1) f (1) = f (n0 ) q 2 ,
m = 3 =⇒ f (n0 + 3) = f (n0 + 2 + 1) = f (n0 + 2) f (1) = f (n0 ) q 3 ,
..
.
m =⇒ f (n0 + m) = f (n0 ) q m .

Ako se odabere n0 = 0, iz gornjeg izraza slijedi

P(n > m) ≡ f (m) = q m . (4.9)

Sada je lako izračunati P(n = m)

P ( n = m ) = P ( n > m − 1 ) − P ( n > m ) = q m −1 − q m = q m −1 (1 − q ) = p q m −1 ,

a to je upravo geometrijska raspodjela, (4.3), kao što je i trebalo dokazati.

Koji je smisao ovog teorema? Evo ilustracije: baca se kocka i u prvih petnaest ba-
canja se nije pojavila šestica; kolika je vjerojatnost da se šestica pojavi u slijedeća tri
180 Poglavlje 4. Raspodjele

bacanja? Odgovor: vjerojatnost je ista kao i na početku bacanja (da se pojavi u prva tri
bacanja). Kocka ne zna da je već bačena petnaest puta. Geometrijska raspodjela nema
pamćenje.

D VIJE VARIJABLE
Izvodi se niz pokusa. U svakom pokusu se prati je li se realiziralo jedno od dva neza-
visna obilježja, A1 i A2 . Pokus se izvodi sve dok se ne ostvari jedno od ta dva obilježja.
Neka nasumična varijabla n j broji koliko se puta izveo pokus do prvog ostvarenja A j za
j = 1, 2. Ta je nasumična varijabla opisana geometrijskom raspodjelom s parametrom p j .
Slučajna varijabla n koja registrira prvo pojavljivanje bilo obilježja A1 , bilo obilježja A2
je manja od varijabla n1 i n2

n = min{n1 , n2 }.

Neka su n1 > n0 i n2 > n0 . Budući da je n minimum skupa {n1 , n2 }, a oba elementa skupa
su veća od n0 , to je i n > n0

P(n > n0 ) = P(n1 > n0 , n2 > n0 ) = zbog nezavisnosti = P(n1 > n0 ) P(n2 > n0 )
= (4.9) = q1n0 q2n0 = q n0 .

gdje je s q označena veličina

q = q1 q2 .

To znači da je i n raspodjeljena po geometrijskoj raspodjeli, zato što je

P ( n > n 0 ) = q n0 ,

pa je

P ( n = m ) = P ( n > m − 1 ) − P ( n > m ) = q m −1 − q m = p q m −1 ,

a to je upravo geometrijska raspodjela. Ovo je razmatranje lako poopćiti na N varijabla

n = min{n1 , n2 , · · · , nN },
q = q1 q2 · · · , qN , p = 1 − q,
P ( n ) = p q n −1 .

Zadatak 4.6 Telefonska centrala neke tvrtke ima M izlaznih linija. U jednom tre-
nutku sve su linije zauzete. Neka je duljina razgovora, mjerena u
vremenskim jedinicama,

opisana geometrijskom raspodjelom sa sred-
njom vrijednošću n j ≡ λ (i ista je za razgovore na svim linijama).
Izračunajte očekivano vrijeme do pojave prve slobodne linije. 

Rješenje:
Neka je duljina razgovora preko svake od M raspoloživih linija diskretna nasumična varijabla

n1 , n2 , · · · , nM

(vrijeme se mjeri u spomenutim fiksnim vremenskim jedinicama). Prva slobodna linija će se
pojaviti kada se okonča najkraći razgovor, pa je stoga traženo vrijeme n

n = min {n1 , n2 , · · · , nM }
4.1 Raspodjele diskretnih nasumičnih varijabla 181

Izravnim poopćenjem razmatrana iz odlomka D VIJE VARIJABLE, zaključuje se da će i n biti


nasumična varijabla raspodjeljena po geometrijskoj raspodjeli s parametrom

q ≡ q1 q2 · · · qM . (4.10)

No, svih M razgovora je opisano geometrijskom raspodjelom s istim parametrima

q1 = q2 = · · · = qM

Prema uvjetu zadatka, n j ≡ λ, i (4.4) je



1
qj = 1 − pj = 1 − .
λ
Iz gornja tri izraza slijedi
M
1

q= 1− .
λ
Budući da je i n raspodjeljena po geometrijskoj raspodjeli

P(n) = pq n−1 ,

biti će, prema (4.4),


1 1
hni =
p
= M .
1 − 1 − λ1

To je očekivano vrijeme čekanja do prve slobodne telefonske linije. Za velike vrijednosti λ, prema
binomnom teoremu je
M
1 1

1− =1−M + ··· ,
λ λ
pa je
λ
hni ≈ .
M

Navesti primjere

4.1.3 Binomna raspodjela


Pretpostavimo da se izvodi neki pokus koji može okončati samo na dva načina: ili se
dogad̄aj A ostvario ili nije. Neostvarenje dogad̄aja A je takod̄er dogad̄aj koji se označava
s A. Neka je vjerojatnost ostvarenja dogad̄aja A KONSTANTNA tijekom cijelog izvod̄enja
pokusa, i neka je jednaka

p = const.

Vjerojatnost da se dogad̄aj A ne ostvari je jednaka

q = 1 − p = const.
182 Poglavlje 4. Raspodjele

Takav se pokus naziva B ERNOULLIJEV POKUS, a uočeni se dogad̄aj naziva Bernoullijev2


dogad̄aj.

Neka je izveden niz od N med̄usobno nezavisnih pokusa u kojima samo uočavamo je li


se u svakom pojedinom od N pokusa, dogad̄aj A ostvario ili ne. Na temelju tih opažanja,
želimo naći odgovor na pitanje kolika je vjerojatnost da se u nizu od N pokusa, dogad̄aj
A ostvari točno n = 0, 1, 2, · · · , N puta

P(n) =?

Pri tome nam nije važan redoslijed ostvarivanja ovih dogad̄aja. Opet razmišljamo kao
kod izvoda binomnog teorema u odjeljku 1.4 ili kod objašnjenja Bernoullijevih pokusa
u primjeru 2.13 na strani 60. Podsjetimo se ukratko rezultata do kojeg smo došli u tom
primjeru: vjerojatnost P(n) da se u N pokusa dogad̄aj A ostvari točno n puta je (slika 4.3)
Slika 4.3
N
 
P(n; p) = p n (1 − p ) N − n ,
n
0.25
p = 0.9
p = 0.1

0.2
p = 0.5
(4.11)
0.15
P(n)

0.1 za sve n = 0, 1, · · · , N. Ako se n shvati


0.05 kao DISKRETNA NASUMI ČNA VARIJABLA
0
koja nasumice poprima vrijednosti prirod-
-0.05
nih brojeva iz skupa {0, · · · , N }, tada ovako
uvedeni P(n; p) daje raspodjelu
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
n/ 20

vjerojatnosti nasumične varijable n i naziva se BINOMNA RASPODJELA VJEROJATNOSTI.


Zanima nas
ZA KOJU JE VRIJEDNOST n, VJEROJATNOST P (n ) NAJVE ĆA ?
Ako pretpostavimo da je P najveći za neki fiksni n, tada vjerojatnosti susjednih n ± 1

moraju biti manje (jer inače najveća vrijednost ne bi bila u n)

N N
   
n −1 N − n +1
P ( n − 1) ≤ P ( n ) ⇒ p q ≤ p n q N −n ⇒ n ≤ N p + p,
n−1 n
N N
   
n +1 N − n −1
P ( n + 1) ≤ P ( n ) ⇒ p q ≤ p n q N −n ⇒ N p − q ≤ n.
n+1 n

Slika 4.4: Položaj najvjerojatnijeg n. Shodno tome, najveću vjerojatnost ima


onaj n koji se nalazi u granicama
q+p = 1
N p − q ≤ n ≤ N p + p. (4.12)
Np
Primjetimo da je širina dobivenog in-
n − 1 Np − q n Np + p n + 1 tervala upravo jednaka jedan slika 4.4)

q p
( N p + p) − ( N p − q) = p + q = 1.
Budući da n može poprimati samo diskretne vrijednosti, to znači da se u dobivenom
2 Jacob Bernoulli (6. I 1655. – 16. VIII 1705.)
4.1 Raspodjele diskretnih nasumičnih varijabla 183

intervalu može nalaziti JEDAN n (plava točkica na slici 4.4 ) ili se na njegovim rubovima
mogu nalaziti DVA n-a koji imaju iste maksimalne vjerojatnosti (zelene točkice na istoj
slici). U svakom slučaju, vidimo da je NAJVJEROJATNIJI onaj n čija je vrijednost najbliža
vrijednosti

n m.p. ≈ N p, (4.13)

a svi ostali n imaju manju vjerojatnost. Za parametre sa slike 4.3 to znači

p = 0.1, N p = 20 · 0.1 = 2,
p = 0.5, N p = 20 · 0.5 = 10,
p = 0.9, N p = 20 · 0.9 = 18,

što se dosta jasno i vidi na slici 4.3.


Ako ( N p − q) nije prirodan broj, tada samo jedna vrijednost n zadovoljava uvjet (4.12).
Ako ( N p − q) jeste prirodan broj, onda je i ( N p − q) + 1 = N p + p, takod̄er prirodan
broj, pa postoje dvije vrijednosti n koje zadovoljavaju (4.12). Nazovimo N p − q = n1 ,
tada je N p + p = n1 + 1. Uvjerimo se da je P(n1 ) = P(n1 + 1), tj. da je njihov omjer
jednak jedinici

N
 
p n1 q N − n1
P ( n1 ) n1 n1 + 1 q Np − q + 1 q
= = = = 1.
P ( n1 + 1) N N − n1 p N − Np + q p

p n1 +1 q N − n1 −1
n1 + 1

Primjetimo da se n koji maksimizira P(n), nalazi u neposrednoj blizini (općenito necje-


lobrojne) očekivane vrijednosti (4.17)

hni = N p.

Budući da je

N N
   
= ,
n N−n

to je i raspodjela, P, da se A ostvari n puta (tj. da se A ne ostvari n puta), jednaka

N
 
P(n) = q n p N −n .
n

Potpuno istim postupkom koji je doveo do (4.13), dolazi se do

n m.p. ≈ Nq.

Raspodjela P ima najveću vrijednost za prirodni broj n m.p. koji je najbliži (realnom) broju
Nq. Primjetimo da je

n m.p. ≈ Nq = N − N p ≈ N − n m.p. ⇒ n m.p. + n m.p. = N.

R EKURZIJA
Ponekad, u numeričkim računima, izračunavanje faktorijela može biti dugotrajan pro-
ces i u tim je slučajevima zgodno više faktorijele računati pomoću nižih, koristeći
184 Poglavlje 4. Raspodjele

jednostavnu rekurzijsku relaciju koja povezuje P(n) sa P(n − 1)


N! N!
P(n) = p n q N −n , P ( n − 1) = p n −1 q N − n +1 ,
n!( N − n)! ( n − 1) ! ( N − n + 1) !
P(n) ( n − 1) ! ( N − n + 1) ! p n q N − n N−n+1 p
= n 1 N n 1
=
P ( n − 1) n!( N − n)! p − q − + n q
N−n+1 p
P(n) = P ( n − 1). (4.14)
n q
M ONOTONOST
Pogledajmo sada, postoje li uvjeti pod kojima binomna raspodjela čini monotono opa-
dajući niz

P (0) ≥ P (1) ≥ P (2) ≥ · · · ≥ P ( N ).

Ako u rekurziju (4.14), uvrstimo gornji zahtjev P(n) ≤ P(n − 1), slijedi
P(n) N−n+1 p
= ≤1 n = 1, 2, · · · , N
P ( n − 1) n q
n
⇒ p≤ .
N+1
Dakle, P(n) tvori opadajući niz ako je, za svaki n, zadovoljena gornja nejednakost.
Najjači uvjet dolazi od najmanjeg n, a to je n = 1 (jer rekurzija vrijedi za 1 ≤ n ≤ N),
1
p≤ .
N+1
Uz gornji uvjet, binomna raspodjela monotono opada. Potražimo sada, uvjet pod kojima
binomna raspodjela čini monotono rastući niz

P (0) ≤ P (1) ≤ P (2) ≤ · · · ≤ P ( N ).

Ako u rekurziju (4.14), uvrstimo gornji zahtjev P(n) ≥ P(n − 1), slijedi
P(n) N−n+1 p
= ≥1 n = 1, 2, · · · , N
P ( n − 1) n q
n
⇒ p≥ .
N+1
Vidimo da P(n) monotono raste,ako je, za svaki n, zadovoljena gornja nejednakost.
Najjači uvjet dolazi od najvećeg n = N,
N
p≥ .
N+1
Tako smo dobili granice na p da bi binomna raspodjela bila ili monotono opadajuća
ili monotono rastuća funkcija od n. Izvan tih granica, raspodjela nije monotona, već
postiže najveću vrijednost, za neki odred̄eni n, odred̄en relacijom (4.12).

NORMIRANJE I MOMENTI
Ukupna vjerojatnost svih mogućih dogad̄aja je, prema binomnom teoremu (1.8), jednaka

N
∑ P(n) = 1, (4.15)
n =0
4.1 Raspodjele diskretnih nasumičnih varijabla 185

čime je pokazano da je binomna raspodjela normirana.


Označimo s
h(n) = n − N p ≷ 0
ODSTUPANJE n-a od njegove najvjerojatnije vrijednosti N p. Sada ćemo odgovoriti na
slijedeće pitanje:
KOLIKA JE VRIJEDNOST SREDNJEG ODSTUPANJA OD NAJVJEROJATNIJE VRIJEDNOSTI ?
Prosječna vrijednost bilo koje funkcije se računa iz (3.21) ,
E[ f (n)] ≡ h f (n)i = ∑ f ( n ) P ( n ),
n

pa se tako i prosječno odstupanje računa kao


N N N
hhi = hn − N pi = ∑ (n − N p) P(n) = ∑ n P(n) − N p ∑ P(n) = hni − N p. (4.16)
n =0 n =0 n =0

Drugi član desne strane je normiranje (4.15). Izračunajmo hni uz eksplicitno uvrštavanje
P(n) iz relacije (4.11).
N N
N N!
 
hni = ∑ n p n q N −n = ∑ n p n q N −n
n =0 n n =1
n! ( N − n ) !
N
( N − 1) !
= Np ∑ ( n − 1) ! ( N − n ) !
p n −1 q N − n .
n =1

Gornji se zbroj računa tako što se umjesto n uvodi nova varijabla m = n − 1. Tada je
N −1
( N − 1) !
hni = N p ∑ m!( N − 1 − m)!
p m q N −1−m = N p( p + q) N −1 = N p. (4.17)
m =0

Dakle, N p ne samo da je NAJVJEROJATNIJA vrijednost n, nego je to ujedno i njegova


PROSJE ČNA vrijednost3 .

n m.p. = hni .
Iz (4.17) zaključujemo da je prosječna vrijednost odstupanja od N p jednaka nuli
hhi = hni − h N pi = 0.
Ako je prosječno odstupanje jednako nuli, to znači da u zbroju (4.16) ima i pozitivnih i
negativnih članova, koji se na kraju svi zbroje u nulu. Kako bismo ipak dobili informa-
ciju o nekakvom prosječnom odstupanju n od N p, bez obzira na predznak, moramo naći
način da eliminiramo predznak odstupanja i da promatramo samo IZNOS odstupanja.
Budući da funkcija kvadriranja4 eliminira predznak, to je najjednostavnije odstupanje
mjeriti pomoću prosječne vrijednosti od h 2
N N N N
h2 = ∑ (n − N p) 2 P(n) = ∑ n 2 P(n) − 2 N p ∑ n P(n) + ∑ ( N p) 2 P(n)


n =0 n =0 n =0 n =0

2 2
= n − 2N p hni + ( N p)

= (4.17) = n 2 − 2N pN p + ( N p) 2 = n 2 − ( N p) 2 = n 2 − hni 2 .



3U nastavku izlaganja će se vidjeti da nije za sve raspodjele istina da su prosječna i najvjerojatnija
vrijednost jednake.
4 Funkcija apsolutne vrijednosti takod̄er eliminira predznak, ali nije tako zgodna za analitičke račune

kao funkcija kvadriranja.


186 Poglavlje 4. Raspodjele

Gornji izraz prepoznajemo kao kvadrat standardne devijacije, σ 2 . Izračunajmo n 2



N N
n2 = ∑ n 2 P(n) = ∑ [ n ( n − 1) + n ] P ( n )


n =0 n =0
N N
N!
= ∑ n ( n − 1)
n!( N − n)!
p n q N −n + ∑ n P ( n )
n =2 n =1
N
( N − 2) !
= N ( N − 1) p 2 ∑ ( n − 2) ! ( N − n ) !
p n −2 q N − n + h n i
n =2
= N ( N − 1) p ( p + q) N −2 + N p = N 2 p 2 + N pq.
2
(4.18)

Uvrstimo to u izraz za h 2


2
h = N 2 p 2 + N pq − ( N p) 2 = N pq. (4.19)

Kao što je već spomenuto u (3.34), srednje kvadratno odstupanje se naziva VARIJANCA

Var (n) ≡ σ 2 = (n − hni) 2 = n 2 − hni 2 ⇒ σ = N pq. (4.20)




p

R ELATIVNO STANDARDNO ODSTUPANJE je omjer standardnog odstupanja i broja N

N pq
r
pq 1
p r
= ∼
N N N
i ono iščezava s porastom N.

K OEFICIJENTOM VARIJACIJE se naziva omjer standardne devijacije i prosječne (srednje)


vrijednosti (naravno, uz pretpostavku da je hni 6= 0)
σ
.
hni
Ako je hni = 0, tada se koeficijent varijacije odred̄uje u odnosu na red veličine5 ulaznih
n-ova. U gornjem primjeru je

N pq q
p
σ
r
= = .
hni Np Np
F UNKCIJA IZVODNICA :
Pokažimo još jedan način računanja momenata.
Uvedimo pomoćnu funkciju g(t), sa svojstvom da je g(1) = 1

g(t) = (tp + q) N . (4.21)

Izračunavanjem desne strane po binomnom poučku, dobivamo g(t) u obliku polinoma


u varijabli t
N N N N
       
N N −1 2 N −2 2
g(t) = q + pq t+ p q t + ··· + pN tN
0 1 2 N
N   N
N
=∑ p n q N −n t n = ∑ P ( n ) t n .
n =0 n n =0
5 Trimatematičara idu u lov. Ubrzo opaze zeca. Prvi puca i pogodi metar desno od zeca. Drugi puca i
pogodi metar lijevo od zeca. Na to treći uzvikne: Odlično, pogodili smo ga! To je zaključak matematičara.
No, fizičari znaju da je zec preživio tu matematiku. Kako biste to objasnili u terminima n, hni , σ, · · · ?
4.1 Raspodjele diskretnih nasumičnih varijabla 187

Koeficijente gornjeg polinoma prepoznajemo kao vjerojatnosti (4.11), pa možemo pisati

N
g(t) = (q + tp) N = ∑ P(n) t n . (4.22)
n =0

Izračunajmo sada momente binomne raspodjele


D E N
nk = ∑ n k P ( n ), k = 0, 1, 2, · · · .
n =0

Gornji ćemo zbroj izračunati pomoću funkcije g(t).


Nulti moment je normiranje

N
g ( t = 1) = 1 = ∑ P ( n ).
n =0

Prvi moment se dobiva derivacijom (4.22) po t

N
dg
= N (q + tp) N −1 p = ∑ P(n) nt n−1 (4.23)
dt n =0

i zatim stavimo t = 1
N
dg

dt t=1
= pN = ∑ n P ( n ), ⇒ hni = N p. (4.24)
n =0

To je rezultat koji smo već ranije, relacijom (4.17), dobili na drukčiji način.
Na sličan ćemo način izračunati i varijancu (3.34)

N
σ 2 = n 2 − hni 2 = ∑ n 2 P(n) − ( N p) 2 .


n =0

Pomnožimo (4.23) s t
N
N pt(q + tp) N −1 = ∑ P(n) nt n
n =0

i derivirajmo po t

N
N p(q + tp) N −1 + N p 2 t( N − 1)(q + tp) N −2 = ∑ P ( n ) n 2 t n −1 . (4.25)
n =0

Za t = 1 gornja relacija postaje

N
n2 = ∑ n 2 P ( n ) = N p + N ( N − 1) p 2 . (4.26)


n =0

Sada možemo izračunati varijancu

σ 2 = n 2 − hni 2 = N p + N p 2 ( N − 1) − N 2 p 2 = N pq. (4.27)




188 Poglavlje 4. Raspodjele

I ovo je rezultat koji smo već ranije dobili u (4.19).

Za izračunavanje koeficijenata α 3 i α 4 , trebat će nam i n 3 i n 4 . Pomnožimo (4.25) s t




N
∑ P(n) n 2 t n = N pt(q + tp) N −1 + N p 2 t 2 ( N − 1)(q + tp) N −2 (4.28)
n =0

i derivirajmo po t

N
∑ P(n) n 3 t n−1 = N p(q + tp) N −1 + 3N ( N − 1) p 2 t(q + tp) N −2 + N ( N − 1)( N − 2) p 3 t 2 (q + tp) N −3 .
n =0
(4.29)

Za t = 1, gornja relacija daje treći moment

N
n3 = ∑ n 3 P(n) = N p + 3N ( N − 1) p 2 + N ( N − 1)( N − 2) p 3 .


n =0

Za račun n 4 , treba najprije pomnožiti (4.29) s t



N
∑ P(n) n 3 t n = N pt(q + tp) N −1 + 3N ( N − 1) p 2 t 2 (q + tp) N −2 + N ( N − 1)( N − 2) p 3 t 3 (q + tp) N −3 ,
n =0

a zatim derivirati po t

N
∑ P(n) n 4 t n−1 = N p(q + tp) N −1 + 7N ( N − 1) p 2 t(q + tp) N −2
n =0
+6N ( N − 1)( N − 2) p 3 t 2 (q + tp) N −3 + N ( N − 1)( N − 2)( N − 3) p 4 t 3 (q + tp) N −4 .

Četvrti moment se dobije uvrštavanjem t = 1 u gornju relaciju

D E N
n4 = ∑ n 4 P(n) = N p + 7N ( N − 1) p 2 + 6N ( N − 1)( N − 2) p 3 + N ( N − 1)( N − 2)( N − 3) p 4 .
n =0

Izravnim uvrštavanjem gornjih izraza za n 3 i n 4 , dobivaju se koeficijenti asimetrije




n − 3 n 2 hni + 2 hni 3

3
M3 q−p


α3 = 3 = 3
= ··· = p , (4.30)
σ σ N pq

i spljoštenosti

n − 4 n 3 hni + 6 n 2 hni 2 − 3 hni 4



4
M4 1 − 6qp



α4 = 4 = 4
= ··· = 3 + . (4.31)
σ σ N pq

Vidimo da je koeficijent asimetrije jednak nuli ako je q = p = 0.5 (slika 4.3), pozitivan
ako je q > p, tj. q > 0.5, a raspodjela je negativno asimetrična ako je q < p tj. q < 0.5.
4.1 Raspodjele diskretnih nasumičnih varijabla 189

S TIRLINGOVI I B ELLOVI BROJEVI


Primjetimo da se u računu momenata binomne raspodjele pojavljuju koeficijenti
hni = N p
h i
n 2 = N p 1 + ( N − 1) p


3 h i
n = N p 1 + 3( N − 1) p + ( N − 1)( N − 2) p 2
D E h i
n 4 = N p 1 + 7( N − 1) p + 6( N − 1)( N − 2) p 2 + ( N − 1)( N − 2)( N − 3) p 3
..
.

k
 
koje prepoznajemo kao Stirlingove brojeve druge vrste za l = 1, 2, · · · , k.
l

1
 
= (1)
l
2
 
= (1, 1)
l
3
 
= (1, 3, 1)
l
4
 
= (1, 7, 6, 1)
l
5
 
= (1, 15, 25, 10, 1)
l
..
.
Sada se k-ti moment binomne raspodjele može napisati kao
hni = N p,
k
!
D E
n k = N p 1 + ∑ s2 (k, l ) ( N − 1) · · · ( N − l + 1) p l −1 , (4.32)
l =2 k ≥2

gdje je s2 (k, l ) Stirlingov broj druge vrste, čiji je opći oblik

1 l l−j l


l ! j∑
s2 (k, l ) = (−1) j k. (4.33)
=0
j

Tako je, npr.


4 1
 
= (0 − 2 + 2 4 ) = 7.
2 2
Stirlingovi brojevi druge vrste su s Bellovim brojevima, Bn , povezani na slijedeći način
n  
n
Bn = ∑ .
k =0
k

Takod̄er, med̄u Stirlingovim brojevima druge vrste vrijede rekurzije


n+1 n n
     
=k + .
k k k−1
190 Poglavlje 4. Raspodjele

Uvrštavanjem (4.33) u (4.32), dolazi se do izraza za opći moment binomne raspodjele u


obliku
k
1 l
"  ! #
l−j l
D E
n = Np 1 + ∑
l ! j∑
k k l −1
(−1) j ( N − 1) · · · ( N − l + 1) p . (4.34)
l =2 =0
j
k ≥2

Iz gornjeg egzaktnog izraza za momente, centralni momenti se računaju iz (3.35)

K K  
K K
 
K −k
D E D E
MK = ∑ k
(−1) K −k k
n hni =∑
k
(−1) K −k
n k ( N p ) K −k
k =0 k =0

KUMULIRANE BINOMNE RASPODJELE


S P(n) je označena vjerojatnost da se u N pokusa dogad̄aj A ostvari točno n puta.
Označimo s P(0, K ) vjerojatnost da se u N pokusa dogad̄aj A ostvario najviše 0 ≤ K ≤ N
puta. To znači da se A ostvario ili nula puta ili jednom ili dva puta ili · · · ili K puta i
zato je ta vjerojatnost jednaka

K K
N
 
P(0, K ) = P(0) + P(1) + · · · + P(K ) = ∑ P(k) = ∑ k
p k (1 − p ) N − k .
k =0 k =0

Gornja raspodjela vjerojatnosti se naziva DONJA KUMULIRANA BINOMNA raspodjela


vjerojatnosti. Slično se definira i P( L, N ) kao vjerojatnost da se u N pokusa dogad̄aj A
ostvario bar 0 ≤ L ≤ N puta. To znači da se A ostvario ili L puta ili L + 1 puta ili L + 2
puta ili · · · ili N puta i zato je ta vjerojatnost jednaka

N N
N
 
P( L, N ) = P( L) + P( L + 1) + · · · + P( N ) = ∑ P(l ) = ∑ l
p l (1 − p) N −l . (4.35)
l=L l=L

Gornja raspodjela vjerojatnosti se naziva GORNJA KUMULIRANA BINOMNA raspodjela


vjerojatnosti. Primjetimo da je, u skladu s binommnim teoremom,

K N
N N
   
P(0, K ) + P(K + 1, N ) = ∑ k
p (1 − p ) N −k
+ ∑ p l (1 − p) N −l = 1. (4.36)
k =0
k l = K +1
l

Uvedimo i raspodjelu P( L, K ) koja opisuje vjerojatnost da se u N pokusa A ostvario


najmanje L, a najviše K puta

K K
N
 
P( L, K ) = P( L) + P( L + 1) + · · · + P(K ) = ∑ P(n) = ∑ n
p n (1 − p) N −n , (4.37)
n= L n= L

pri čemu je 0 ≤ L ≤ K ≤ N. Gornja raspodjela vjerojatnosti se naziva BINOMNI NIZ.


Relacijom ... je pokazano da je najvjerojatnija vrijednost nasumične varijable n u N
ponovljenih pokusa približno jednaka N p.
(1) Ako je L < K ≤ N p, binomni niz je praktično računati iz donjih kumuliranih vjerojat-
nosti

P( L, K ) = P(0, K ) − P(0, L − 1).


4.1 Raspodjele diskretnih nasumičnih varijabla 191

(2) Ako je L ≤ N p ≤ K, tada će P(0, K ) imati velik broj članova i bit će ga praktičnije
izraziti preko (4.36)

P( L, K ) = 1 − P(K + 1, N ) − P(0, L − 1).

(1) Ako je N p ≤ L < K, binomni niz je praktično računati iz gornjih kumuliranih vjero-
jatnosti

P( L, K ) = P( L, N ) − P(K + 1, N ).

I same binomne vjerojatnosti se mogu računati preko kumuliranih vjerojatnosti. Npr.


ako je n ≤ N p, praktično je koristiti donje kumulirane vjerojatnosti

P(n) = P(0, n) − P(0, n − 1).

Ako je N p ≤ n, praktično je koristiti gornje kumulirane vjerojatnosti

P(n) = P(n, N ) − P(n + 1, N ).

 Primjer 4.2 dovršiti 

 Primjer 4.3 dovršiti 

IZRA ČUNAVANJE BINOMNE RASPODJELE POMO ĆU BETA - FUNKCIJE


Vratimo se gornjoj kumuliranoj binomnoj raspodjeli (4.35)
N
N
 
P( L, N ) = ∑ l
p l (1 − p ) N − l , L ≤ N, p ∈ [0, 1],
l=L

i promatrajmo ju kao funkciju kontinuirane varijable p. Tada je njezina parcijalna


derivacija po p jednaka
N N −1  
∂P( L, N ) N N
 
=∑ lp l −1
(1 − p ) N −l
− ∑ ( N − l ) p l (1 − p ) N − l −1 .
∂p l=L
l l=L
l

Kada se u drugom članu desne strane izvede zamjena varijable l + 1 = m, on postaje


jednak
N
N! m
− ∑ ( m − 1) ! ( N − m + 1) !
( N − m + 1 ) p m −1 (1 − p ) N −1− m +1 ·
m
m = L +1
N
N!
=− ∑ l! ( N − l )!
l p l −1 (1 − p ) N − l ,
l = L +1

i cijeli izraz za derivaciju je


N N
" #
∂P( L, N ) N! N!
= ∑− ∑ l p l −1 (1 − p ) N − l = p L −1 (1 − p ) N − L .
∂p l = L l = L +1
l! ( N − l ) ! ( L − 1 ) ! ( N − l ) !

Integracija gornjeg izraza od p = 0 do p, dobiva se


Z p
N!
P( L, N ) − P( L, N ) = p L−1 (1 − p) N − L dp .

p p =0 ( L − 1) ! ( N − l ) ! 0
192 Poglavlje 4. Raspodjele

Iz definicije (4.35) se vidi da je za svaki L > 0 gornja kumulirana raspodjela P( L, N ) =

p =0
0. Time je
Z p
N!
P( L, N ) = p L−1 (1 − p) N − L dp .

p ( L − 1) ! ( N − L ) ! 0

Prisjetimo li se izraza za beta-funkciju6 (naziva se i Eulerov integral prve vrste)


Z 1
( m − 1) ! ( n − 1) !
β(m, n) = x m−1 (1 − x ) n−1 dx = (4.38)
0 ( m + n − 1) !
i nepotpunu beta-funkciju
Z p
β( p; m, n) = x m−1 (1 − x ) n−1 dx . (4.39)
0

Neke vrijednosti nepotpune beta-funkcije se nalaze u tablicama (npr. tablica 1 sa str.


309 iz I VANOVI Ć, Teorija verovatnoće). Vidimo da se izraz za P( L, N ) može napisati kao
β( p; L, N − L + 1)
P( L, N ) = ≡ I p ( L, N − L + 1).

p β( L, N − L + 1)
Relacijom (4.36)

P(0, L) + P( L + 1, N ) = 1,

i donja kumulirana raspodjela se može napisati preko beta-funkcije

P(0, L) = 1 − P( L + 1, N ) = 1 − I p ( L + 1, N − L). (4.40)

Dokažimo i relaciju

I p ( a, b) + I1− p (b, a) = 1, (4.41)

koja je korisna kod korištenja tablica za beta-funkciju.


Z p
1
I p ( a, b) = x a−1 (1 − x ) b−1 dx ,
β( a, b) 0
Z 1− p
1
I1− p ( a, b) = x a−1 (1 − x ) b−1 dx , 1−x=u
β( a, b) 0
Z 1
1
= u b−1 (1 − u) a−1 du ,
β( a, b) p
Z 1
1
I1− p (b, a) = x a−1 (1 − x ) b−1 dx ,
β( a, b) p
Z p Z 1 
1
I p ( a, b) + I1− p (b, a) = + x a−1 (1 − x ) b−1 dx = 1.
β( a, b) 0 p

Pokažimo i kako se vrijednosti (obične) binomne raspodjele mogu izraziti preko inte-
grala I p

P(n) = P(0, n) − P(0, n − 1)


= (4.40) = 1 − I p (n + 1, N − n) − 1 + I p (n, N − n + 1)
= (4.41) = I1− p ( N − n, n + 1) − I1− p ( N − n + 1, n).
6 Vidjeti npr. odjeljak o specijalnim funkcijama u G LUMAC, Matematičke metode fizike.
4.1 Raspodjele diskretnih nasumičnih varijabla 193

 Primjer 4.4 K AKO ( POKUŠATI ) crack- IRATI LOZINKU


dovršiti 

 Primjer 4.5 P ROBLEM SAKUPLJA ČA KUPONA


dovršiti 

P RILAGODBA BINOMNE RASPODJELE ISKUSTVENIM PODACIMA

 Primjer 4.6 Izvodi se slijedeći pokus: baci se N = 12 kocaka i registrira se koji su se

brojevi pojavili. Pokus se izvodi N = 26 306 puta. Dogad̄aj koji se prati jeste koliko
se puta pojavio broj 5 ili broj 6. Taj se broj označava s n = 0, 1, · · · , 12. Treba izračunati
vjerojatnost, p, pojavljivanja brojeva 5 ili 6.
Tablica 4.1 sadrži eksperimentalno dobivenu težinu n pojavljivanja, označenu s t(n).
Stupac označen s N · P(n) sadrži teorijsku vjerojatnost (4.11) prema binomnoj raspodjeli,
da se dogodi navedeni dogad̄aj (radi usporedbe s težinom, ovu smo vjerojatnost još
pomnožili s N ). Drugi, treći i četvrti stupac imaju isti zbroj jednak N = 26 306. Teorijske

Tablica 4.1: Eksperimentalno dobivene težine ...

n t(n) N · P(n) N · Pexpr (n)

0 185 203 187


1 1 149 1 216 1 146
2 3 265 3 345 3 215
3 5 475 5 576 5 465
4 6 114 6 273 6 269
5 5 194 5 018 5 115
6 3 067 2 927 3 043
7 1 331 1 255 1 330
8 403 392 424
9 105 87 96
10 i više 18 14 16

∑ = 26 306 ∑ = 26 306 ∑ = 26 306

vrijednosti u trećem stupcu su dobivene iz


    n  12−n
N 12 1 2
 
n N −n
N · P(n) = N · p q = 26 306 ,
n n 3 3

gdje smo pretpostavili da se bacaju idelane kocke, tako da je vjerojatnost p da se okrene


broj 5 ili broj 6 jednaka

1 1 1
p= + = .
6 6 3
194 Poglavlje 4. Raspodjele

Slika 4.5: Uz primjer 4.6 .

0.25

| N P(x) - t(x) | / t(x)


expr
| N P (x) - t(x) | / t(x)
0.2

0.15

0.1

0.05

0
0 1 2 3 4 5 6 7 8 9 10
x

Tako se npr. pomoću gornjih izraza dobiva


 12
12 2
n = 026 306 q = 26 306 = 202.749 · · ·
3
 11
12 11 2 2 1
 
n = 126 306 q p = 26 306 · 12 = 1216.5 · · · .
1 3 3
Broj bacanja N je vrlo velik, tako da bi prema zakonu velikih brojeva, drugi i treći
stupac trebali imati slične vrijednosti (u tablici odstupanja dosežu i 10%). Ovu razliku
objašnjavamo neidealnošću kocaka: one nisu savršene i zato naš teorijski p = 1/3 ne
odgovara stvarnom p za kocke kojima je izvod̄en pokus. Kako izračunati taj stvarni p?
Jedan od mogućih načina je slijedeći: iz (4.24) znamo da je prvi moment jednak
N
1 N
pN = ∑ n P ( n ), ⇒ p=
N n∑
. n P ( n ). (4.42)
n =0 =0

Ako u gornjoj relaciji ostavimo P(n), dobit ćemo teorijsku vrijednost p = 1/3 za idealne
kocke. Ono što mi hoćemo jeste da pomoću gornje relacije izračunamo vjerojatnost
za stvarne kocke kojima je izvod̄en pokus. Da bismo to postigli, umjesto P(n) ćemo
uvrstiti relativne frekvencije t(n)/N i dobiti
N
1
p= . ∑ n t(n) = · · · = 0.3377 .
N N n =0

Ova vrijednost p se jasno razlikuje od teorijske 1/3 = 0.333333 · · · . Ako sada u izraz za
raspodjelu vjerojatnosti binomne raspodjele uvrstimo p = 0.3377 i q = 0.6623

N 12
   
enpr
N · P (n) = N · n N −n
p q = 26 306 (0.3377) n (0.6623)12−n ,
n n
4.1 Raspodjele diskretnih nasumičnih varijabla 195

dobit ćemo vrijednosti označene u četvrtom stupcu i koje su puno bliže eksperimentalno
dobivenim vrijednostima (ovaj je rezultat u skladu sa zakonom velikih brojeva). Na
slici 4.5 je prikazana apsolutna razlika drugog i trećeg (plavo) i drugog i četvrtog stupca
(crveno), podjeljena s drugim stupcem (zato da se dobiju relativne vrijednosti). Osim
za n = 8, sve ostale crvene točke su ispod plavih, što znači da je četvrti stupac bolje
aproksimira drugi stupac, nego što to radi treći stupac. 

Navesti primjere

Slika 4.6: Veza binomne i nekih drugih raspodjela.

N→ 8 < Hipergeometrijska

Binomna
N→
8
p→ 0
N→ Np → const.
8

n >> 1
Gaußova
Poissonova
 >> 1

Zadatak 4.7 Za binomnu raspodjelu izračunajte:


(a) koeficijente α 3 i α 4 ,
(b) mod i sva tri kvartila. 

Rješenje:

Zadatak 4.8 U kutiji se nalaze tri bijele i dvije crne kuglice. Jedna se kuglica izvlači
400 puta i nakon svakog izvlačenja, izvučena kuglica se vraća u kutiju.
Koliko puta će se izvuči bijela kuglica? 

Rješenje:
Najkraći i najprecizniji odgovor na gornje pitanje je da iz navedenih uvjeta ne možemo znati
koliko će se puta izvući bijela kuglica.
Kao odgovor se može pojaviti bilo koji broj izmed̄u 0 i 400. No, treba primjetiti da, iako postoji
401 mogući odgovor, točnost tih odgovora nije jednako vjerojatna. Iz argumentacije koja je
dovela do relacije (4.12)
Np − q ≤ n ≤ Np + p
znamo da će najvjerojatniji broj pojave bijele kuglice biti
2 3
240 − ≤ n ≤ 240 + ,
5 5
196 Poglavlje 4. Raspodjele

tj. najvjerojatnije je da će se bijela kuglica pojaviti 240 puta.

Zadatak 4.9 U kutiji se nalaze dvije bijele i tri crne kuglice. Izvlače se odjednom
dvije kuglice. Izračunajte srednju vrijednost i varijancu broja bijelih
kuglica. 

Rješenje:
dovršiti
Zadatak 4.10 Strijelac ima 4 metka i gad̄a u metu sve do prvog pogotka ili dok ne
ispuca sve metke. Izračunajte prosječnu vrijednost i varijancu broja is-
pucanih metaka, ako je vjerojatnost pogotka u svakom gad̄anju jednaka
0.25 . 

Rješenje:
Neka je

n = 1, 2, 3, 4

broj ispucanih metaka, pri čemu je

p = 0.25, q = 1 − p = 0.75.

Vjerojatnost pogad̄anja mete iz prvog hica je

P(n = 1) = p.

Vjerojatnost pogad̄anja mete iz drugog hica (pri čemu je prvi bio promašaj) je

P(n = 2) = q p.

Vjerojatnost pogad̄anja mete iz trećeg hica (pri čemu su prva dva bili promašaji) je

P(n = 3) = q q p.

Četvrti ispucani metak može biti pogodak ili promašaj

P(n = 4) = q q q p + q q q q = q q q ( p + q) = q q q.

To su sve mogućnosti. Provjerimo normiranje


4
∑ P(n) = p + q p + q q p + q q q = 1.
n =1

Izračunajmo momente
4
hxi = ∑ n P(n) = ... = 2.73438 · · · ,
n =1
4
x2 = ∑ n 2 P(n) = ... = 9.01563 · · · ,


n =1
σ 2 = x 2 − h x i 2 = 1.5388 · · · .


4.1 Raspodjele diskretnih nasumičnih varijabla 197

Zadatak 4.11 Izvodi se gad̄anje u metu do prvog pogotka. Izračunajte srednju


vrijednost i varijancu broja hitaca. Vjerojatnost pogotka kod svakog
hica je konstantna i jednaka p. 

Rješenje:
Ovo je izravno poopćenje prethodnog zadatka ..
dovršiti

Zadatak 4.12 Nacrtajte drugi, treći i četvrti stupac iz tablice 4.1 kao funkciju x. 

Rješenje:
dovršiti
Zadatak 4.13 Slučajna varijabla X je opisana binomnom raspodjelom. Izračunajte
srednju vrijednost i varijancu varijable Y = e 2X +1 . 

Rješenje:
dovršiti

4.1.4 Negativna binomna raspodjela


Nadovezuje se na geometrijsku raspodjelu. Vjerojatnost da se r-to ostvarenje dogad̄aja
dogodi u k-tom pokusu, ako je vjerojatnost ostvarenja u svakom pojedinom pokusu je p

k−1
 
P(k) = p r (1 − p ) k −r , k = r, r + 1, · · ·
r−1

dovršiti
Navesti primjere

4.1.5 Polinomna raspodjela


Promatra se pokus (proces) koji može rezultirati ne samo na dva načina kao u pret-
hodnom odjeljku, nego na Q različitih načina koje ćemo označiti s A1 , A2 , . . . , AQ , a koji
se med̄usobno isključuju (ako nastupi jedan, ne može nijedan drugi). Vjerojatnost da
proces rezultira s Aq , ćemo označiti s pq . Budući da se kao rezultat procesa, sigurno
mora pojaviti jedan i samo jedan od Aq -ova, to za vjerojatnosti pq mora vrijediti

Q
∑ pq = 1.
q =1

Sad se postavlja slijedeće pitanje: ako se spomenuti pokus (proces) dogodi N puta,
kolika je vjerojatnost da će se rezultat A1 pojaviti N1 puta, da će se A2 pojaviti N2 puta
itd. Naravno da pri tome brojevi Nq moraju zadovoljavati jednakost

Q
∑ Nq = N.
q =1
198 Poglavlje 4. Raspodjele

Jedan ishod niza od N pokusa se može prikazati ovako

A , . . . , A , A , . . . , A , · · · , AQ , . . . , AQ .
| 1 {z 1} | 2 {z 2} | {z }
N1 N2 NQ

Budući da je ishod svakog procesa neovisan o ishodu bilo kojeg drugog procesa (i
N
vjerojatnost), to je gornjem nizu pridružena vjerojatnost jednaka p1N1 · p2N2 · . . . · pQ Q .
Budući da nas ne zanima redoslijed kojim se pojedini od N dogad̄aja ostvaruje, ista
će vjerojatnost biti pridružena i svakom nizu dobivenom svim mogućim različitim
poretcima gornjeg niza. Broj ovih različitih poredaka se dobije na slijedeći način: N
elemenata se može poslagati na N! različitih načina. No, ako je od tih N elemenata njih
N1 istih, onda med̄usobne permutacije tih istih elemenata (a kojih ima N1 !) neće dati
novi poredak. Ove permutacije istih elemenata treba odračunati, pa će sada ukupni broj
različitih poredak biti jednak N!/N1 !. Ako osim grupe od N1 istih elemenata postoje još
i grupe od N2 , N3 , itd. istih elemenata, ni njihove permutacije neće dati različit poredak,
pa je zato zaključak da postoji
N!
N1 ! N1 ! · · · NQ !

različitih načina na koji može rezultirati N procesa sa istom vjerojatnošću p1N1 · p2N2 · . . . ·
N
pQ Q . Prema pravilu o zbrajanju vjerojatnosti, vjerojatnost da se dogodi bilo koji od njih
je dana sa
N! N
P( N1 , N2 , . . . , NQ ) = p N1 · p2N2 · . . . · pQ Q .
N1 ! N1 ! · · · NQ ! 1

Gornji je izraz upravo koeficijent u razvoju N-te potencije polinoma

( p1 + p2 + · · · + p Q ) N ,

odakle i potječe naziv raspodjele. Očito, za Q = 2, gornja se raspodjela svodi na bi-


nomnu.

Navesti primjere

4.1.6 Poissonova raspodjela


IZVOD
Poissonova raspodjela je tipična za opis pojava koje se dogad̄aju
(1) s KONSTANTNOM vjerojatnošću
(2) i SAMIM SVOJIM DOGAÐANJEM SMANJUJU UKUPNU PO ČETNU POPULACIJU.
Tu spada npr. slučaj radioaktivnog raspada (čestica koja se jednom raspala, više se ne
raspada) ili u društvenim istraživanjima praćeni dogad̄aji mogu biti smrtni slučajevi
unutar odred̄ene društvene skupine ili nešto slično.
O Poissonovu procesu kao primjeru Markovljevog procesa, biti će riječi u odjeljku
??. Zadržimo se na primjeru radioaktivnog raspada (npr. α raspad He 4 ili β raspad
elektrona). Neka je vrijeme promatranja dt toliko kratko da je vjerojatnost dvostrukog
ili višestrukog raspada u tako kratkom intervalu, potpuno zanemariva

P(0, dt) + P(1, dt) = 1. (4.43)


4.1 Raspodjele diskretnih nasumičnih varijabla 199

Neka je vjerojatnost raspada jedne čestice jednaka

P(1, dt) = µ dt , (4.44)

gdje je µ konstanta i µ dt  1. Na temelju gornje dvije pretpostavke, treba postaviti


rekurzijsku relaciju za

P(n, t),

vjerojatnost da se do trenutka t dogodi n raspada. Shodno ovoj definiciji, vjerojatnost


da se do trenutka t + dt dogodilo n raspada, P(n, t + dt), se može prikazati kao rezultat
dva med̄usobno isključiva dogad̄aja (slika 4.7):
Slika 4.7: Uz izvod Poissonove raspodjele

1. do trenutka t se dogodilo n raspada,


t
tako da se u intervalu (t, t + dt) nije
t dt dogodio nijedan raspad, ili
n 0 2. do trenutka t se dogodilo n − 1
raspada, a u intervalu (t, t + dt) se
n -1 1
dogodio točno jedan raspad.

Ove se dvije mogućnosti mogu napisati, koristeći i i ili vjerojatnost, kao

P(n, t + dt) = P(n, t) P(0, dt) + P(n − 1, t) P(1, dt). (4.45)

Iz početnih pretpostavaka (4.43) i (4.44) je

P(1, dt) = µ dt ⇒ P(0, dt) = 1 − µ dt .

Uvrštavanje gornjih izraza u rekurziju (4.45), dobiva se


 
P(n, t + dt) = P(n, t) 1 − µ dt + P(n − 1, t)µ dt .

Sred̄ivanjem gornje jednadžbe dolazi se do

P(n, t + dt) − P(n, t) h i


= µ P(n − 1, t) − P(n, t) ,
dt
što opet u granici dt → 0 konačno daje

dP(n, t)
+ µ P(n, t) = µ P(n − 1, t), (4.46)
dt
što je tražena rekurzijska relacija. Za n = 0, (4.46) je obična homogena diferencijalna
jednadžba prvog reda koja se rješava razdvajanjem varijabla

dP(0, t) dP(0, t)
= −µ P(0, t) ⇒ = −µ dt ,
dt P(0, t)
P(0, t) = P(0, 0) e−µ t .

Rješenje jednadžbe je potpuno odred̄eno tek poznavanjem početnog uvjeta: do trenutka


t = 0 sigurno se nije raspala nijedna čestica, pa je zato

P(0, 0) = 1, P(1, 0) = P(2, 0) = P(3, 0) = · · · = 0.


200 Poglavlje 4. Raspodjele

Uz ovakav početni uvjet je

P(0, t) = e−µ t .

Vratimo se sada jednadžbi (4.46), ali neka je sada n = 1

dP(1, t)
+ µ P(1, t) = µ e−µ t .
dt
To je nehomogena diferencijalna jednadžba prvog reda, s početnim uvjetom (do trenutka
t = 0 sigurno nije emitirana nijedna čestica)

P(1, 0) = 0.

Rješenje ove jednadžbe je poznato7

dψ 1 t
Z Rt

p1 (u) du
+ p1 ( t ) ψ = S ( t ) ⇒ ψ(t) = Rt e S(t) dt + C0 , (4.47)
dt e p1 (u) du

pri čemu se konstanta C0 odred̄uje iz početnog uvjeta P(1, 0) = 0, a

p1 (t) = µ, S ( t ) = µ e− µ t .

Izravnim uvrštavanjem gornjih vrijednosti u (4.47) i rješavanjem integrala, dobiva se

P(1, t) = µ t e−µ t .

Sada se iz poznatog P(1, t) i rekurzije (4.46) dobiva jednadžba za P(2, t) s početnim


uvjetom

dP(2, t)
+ µ P(2, t) = µ 2 t e−µ t , P(2, 0) = 0.
dt
Ponovo, primjenom općeg rješenja (4.47), uz

p1 (t) = µ, S ( t ) = µ 2 t e− µ t ,

dobiva se

( µ t ) 2 −µ t
P(2, t) = e
2
Sličnim postupkom se i za ostale n dobiva

( µ t ) n −µ t
P(n, t) = e , n = 0, 1, 2, · · · .
n!
Gornja vjerojatnost je oblika Poissonove raspodjele vjerojatnosti. U literaturi je uobiča-
jeno uvesti oznaku

λ ≡ µ t,
7 Vidjeti npr. odjeljak o diferencijalnim jednadžbama u G LUMAC, Matematičke metode fizike.
4.1 Raspodjele diskretnih nasumičnih varijabla 201

pa Poissonova8 raspodjela glasi


Slika 4.8: S. D. Poisson.

λ n −λ
P(n, λ) = e , (4.48)
n!

za n = 0, 1, 2, · · · .

Slika 4.9: Poissonova raspodjela (4.48) za nekoliko vrijednosti λ.

P OISSONOVA KAO GRANI ČNA VRIJEDNOST BINOMNE RASPODJELE


Poissonova se raspodjela može dobiti i kao granična vrijednost binomne raspodjele.
Krenimo od binomne raspodjele (4.11)

N
 
P(n) = p n q N −n , n = 0, 1, 2, · · · , N .
n

u kojoj ćemo pretpostaviti da se radi o vrlo rijetkim dogad̄ajima, tako da je VJEROJAT-


NOST p VRLO MALA . Istovremeno ćemo promatrati VRLO VELIK BROJ pokusa, N, uz
uvjet da je umnožak male veličine p i velike N, konstantan

N → ∞, p → 0, N p ≡ λ = const. (4.49)

Sada se binomna raspodjela dobiva u obliku


   n 
N λ N −n

λ
P(n) = 1− .
n N N
8 Godine 1837. otkrio ju je Siméon Denis Poisson (21 VI 1781. – 25. IV 1840.), francuski fizičar i
matematičar. Neovisno o njemu, do istog je otkrića 1898. došao i njemački matematičar poljskog podrijetla
Bortkiewicz (njem. Bortkewitsch).
202 Poglavlje 4. Raspodjele

Slika 4.10: Usporedba binomne (N = 50, p = 3/50) i Poissonove raspodjele (λ = 3).

0.25

Binomna
Poissonova
0.2

0.15

0.1

0.05

0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
n

Prema pretpostavci je λ  N (rijetki dogad̄aji). Pogledajmo čemu je jednak gornji izraz


u toj granici.
 n 
N! λ N −n λ n λ N N!
  
λ
P(n) = 1− = 1− n .
n!( N − n)! N N n! N ( N − n)!N n 1 − Nλ
Uvrštavanjem Stirlingove formule (4.67):

M! ≈ 2πM M M e− M ,
za N! i ( N − n)!, dobiva se

λn λ N 2πNN N e− N
 
P(n) = 1− λ n
n! N 2π ( N − n)( N − n) N −n e− N +n N n 1 −
p 
N
λn λ N 1
 
= 1− .
n! N 1 − Nn
 N −n+ 12
1− Nλ n n

e
Prema definiciji eksponencijalne funkcije, je

λ N
 
lim 1 − = e− λ . (4.50)
N →∞ N
Imajući to u vidu, možemo izvesti granični prijelaz N → ∞ u gornjem razlomku
λ n n N n −n+ 12
   
lim 1 − = 1, lim 1 − = e− n , lim 1 − = 1.
N →∞ N N →∞ N N →∞ N
Uvrštavanjem u izraz za P(n), dobiva se

λ n e− λ λ n −λ
P(n) = = e .
n! e−n e n n!
Time je ponovo dobivena Poissonova raspodjela (4.48)
λ n −λ
P(n, λ) = e , n = 0, 1, 2, · · · .
n!
4.1 Raspodjele diskretnih nasumičnih varijabla 203

Kada očekujemo da ćemo naći takvu raspodjelu? Uvjet (4.49) iščezavanja p-a znači da
se radi o jako rijetkim dogad̄ajima (u svakom slučaju, broj dogad̄aja od interesa je puno
manji od ukupnog broja dogad̄aja) kao što su, pored već spomenutog radioaktivnog
raspada, samoubojstva, višestruki porodi, itd., pa se ponekad naziva i ZAKON MALIH
BROJEVA .

K UMULATIVNA FUNKCIJA
Poissonove raspodjele se računa prema (3.1)
m
λn
F (m) = P(n ≤ m) = ∑ P ( n ) = e− λ ∑ n!
.
n≤m n =0

N ORMIRANJE I MOMENTI
Lako je vidjeti da je Poissonova raspodjela normirana
∞ ∞
λn
∑ P(n, λ) = e−λ ∑ n!
= e−λ eλ = 1.
n =0 n =0

Izračunajmo očekivanje i varijancu Poissonove raspodjele.


∞ ∞ ∞
λn λn λn
h n i = e− λ ∑ n
n!
= e− λ ∑ n
n!
= e− λ ∑ ( n − 1) !
,
n =0 n =1 n =1

zato jer je član s n = 0, jednak nuli. Uvodimo novu varijablu


∞ ∞
m =n −1

0 1

u kojoj je
∞ ∞
λ m +1 λn
h n i = e− λ ∑ m!
= λ e− λ ∑ n!
= λ e−λ eλ = λ, (4.51)
m =0 n =0

kao što se to i vidi sa slike 4.9. Slično računamo i drugi moment


∞ ∞
λn λn
n 2 = e− λ ∑ n2 = e− λ ∑ n .


n =0 n! n =1
( n − 1) !

Ponovo uvodimo varijablu m = n − 1


∞ ∞ ∞
λ m +1 λn λn
n 2 = e− λ ∑ ( m + 1) = λ e− λ ∑ n + λ e− λ ∑ = λ hni + λ


m =0 m! n =0 n! n =0 n!
= λ2 + λ
σ 1
⇒ σ 2 = n 2 − hni 2 = λ, =√ .


hni λ
Primjećujemo da su i varijanca i očekivanje jednaki λ. Ove vrijednosti za očekivanje i va-
rijancu Poissonove raspodjele se mogu dobiti i kao granični prijelaz (4.49) odgovarajućih
vrijednosti binomne raspodjele (4.24) i (4.27)

hni P = lim hni B = lim N p = λ,


N →∞,p→0 N →∞,p→0
N p→λ N p→λ

σP2 = lim σB2 = lim N pq = N p(1 − p) = λ.


N →∞,p→0 N →∞,p→0
N p→λ N p→λ
204 Poglavlje 4. Raspodjele

Izračunajmo još i n 3 i n 4 , a zatim i koeficijenete asimetrije i spljoštenosti.




∞ ∞ ∞
λn λn λ m +1
n 3 = e− λ ∑ n3 = e− λ ∑ n2 = e− λ ∑ ( m + 1) 2


n =0 n! n =1
( n − 1) ! m =0 m!

λn
=λe −λ
∑ (n 2 + 2n + 1) = λ ( n 2 + 2 h n i + 1)


n =0 n!
= λ (λ 2 + 3λ + 1),

∞ ∞ ∞
D E λn λn λ m +1
n 4 = e− λ ∑ n4
n!
= e− λ ∑ n3
( n − 1) !
= e− λ ∑ ( m + 1) 3
m!
n =0 n =1 m =0

λn
=λe −λ
∑ n 3
3n 2
3n 1 = λ n 3 + 3 n 2 + 3 hni + 1



( + + + )
n =0 n!
= λ (λ 3 + 6λ 2 + 7λ + 1).

Lako je vidjeti da je općenito k-ti moment dan T OUCHARDOVIM POLINOMOM u λ

k
k
D E  
n k
=∑ λj,
j =1
j

k
 
gdje su s označeni Stirlingovi brojevi druge vrste, (4.33).
j
Sami koeficijenti asimetrije i spljoštenosti su

n − 3 n 2 hni + 2 hni 3

3
M3 λ 3 + 3λ 2 + λ − 3λ 3 − 3λ 2 + 2λ 3


asimetrija α3 = 3 = 3
= √
σ σ λ λ
1
=√ ,
λ

n − 4 n 3 hni + 6 n 2 hni 2 − 3 hni 4



4
M4



spljoštenost α4 = 4 =
σ σ4
λ + 6λ + 7λ + λ − 4λ 4 − 12λ 3 − 4λ 2 + 6λ 4 + 6λ 3 − 3λ 4
4 3 2
=
λ2
1
=3+ .
λ
Asimetrija je uvijek pozitivna, a spljoštenost teži normalnoj spljoštenosti, α4 = 3, kada λ
raste.

P RILAGODBA EMPIRIJSKIM PODACIMA


 Primjer 4.7 B ORTKIEWICZ
Navedimo primjer koji potječe od Bortkiewicza (njem. Bortkewitscha), a koji se odnosi
na statistiku o vojnicima koji su, u razdoblju od 1875. do 1894. godine, poginuli uslijed
udarca konja. Ovo je razdoblje podijeljeno na 200 intervala, pri čemu je u 109 intervala
uočeno 0 smrtnih slučajeva, u 65 intervala je uočen 1 slučaj, u 22 intervala su uočena
2 slučaja, u 3 intervala su uočena 3 slučaja i u 1 intervalu su uočena 4 smrtna slučaja.
Treba provjeriti radi li se tu o Poissonovoj raspodjeli?
4.1 Raspodjele diskretnih nasumičnih varijabla 205

Slučajna varijabla n je broj smrtnih slučajeva, a njezine vrijednosti su n = 0, 1, 2, 3, 4.


Težine pojedinih vrijednosti su t0 = 109, t1 = 65, t2 = 22, t3 = 3, t4 = 1. Zbroj težina daje
ukupan broj dogad̄aja N = 200. Poissonova je raspodjela odred̄ena konstantom λ, pa
ćemo zato najprije, pomoću (4.51), izračunati λ
4
tn 0 · 109 + 1 · 65 + 2 · 22 + 3 · 3 + 4 · 1 122
λ = hni = ∑ n
N
=
200
=
200
= 0.61 .
n =0

Pomoću gornjega λ i (4.48 ) možemo izračunati teorijsku težinu N · Pn

0.61 n
N · Pn = 200 e−0.61 , n = 0, 1, 2, 3, 4, 5,
n!
i usporediti ju s empirijski dobivenim težinama tn (donja tablica):

n tn N · Pn

0 109 108.7 → 109


1 65 66, 2 → 66
2 22 20.2 → 20
3 3 4.1 → 4
4 1 0.6 → 1
5 0 0.1 → 0

∑ = 202 ∑ = 202 ∑ = 202

Opaža se vrlo dobro slaganja eksperimentalnih i teorijskih rezultata, što potvrd̄uje


pretpostavku da se radi o Poissonovoj raspodjeli. 

 Primjer 4.8 dovršiti 

Navesti primjere

B ELLOVI BROJEVI
... dovršiti ...

Zadatak 4.14 Koristeći relaciju (4.47), izvedite izraze za P1 (t), P2 (t) i P3 (t). 

Rješenje:
.. dovršiti ...
206 Poglavlje 4. Raspodjele

Zadatak 4.15 Za Poissonovu raspodjelu izračunajte:


(a) koeficijente α 3 i α 4 ,
(b) mod i sva tri kvartila. 

Rješenje:
dovršiti
Zadatak 4.16 Slučajna varijabla X je opisana Poissonovom raspodjelom. Ako je

P ( X = 1) = P ( X = 2),

izračunajte srednju vrijednost X i vjerojatnost dogad̄aja X ≥ 4. 

Rješenje:
dovršiti
Zadatak 4.17 Slučajna varijabla X je opisana Poissonovom raspodjelom s parame-
trom λ. Izračunajte srednju vrijednost varijable

1
Y= .
X+1


Rješenje:
dovršiti
Zadatak 4.18 Slučajna varijabla X

je opisana Poissonovom raspodjelom s parame-
trom λ. Izračunajte x 3 . 

Rješenje:
dovršiti

4.1.7 Hipergeometrijska raspodjela

Promatrajmo sada niz pokusa kod kojih rezultat jednog pokusa utječe na rezultat
drugog. Neka Bn,N −n bude složeni dogad̄aj čije se ostvarenje sastoji u tome da se u nizu
od N pokusa dogad̄aj A ostvario n puta i da se A ostvario N − n puta. Iz binomne
raspodjele, ..., je poznato da takvih dogad̄aja sve skupa ima

N N!
 
= ,
n n! ( N − n)!

a u svakome je redoslijed A i A različit.

 Primjer 4.9 Neka se u posudi nalazi N kuglica, od kojih je M kuglica bijele boje, a
N − M kuglica je crne boje. Nasumice se N puta izvlači po jedna kuglica, pri čemu
se izvučene kuglice ne vraćaju u posudu. Treba odrediti vjerojatnost P( Bn,N −n ), da se
od N izvlačenja prvh n puta izvuče bijela, a preostalih N − n puta crna kuglica. Ta je
4.1 Raspodjele diskretnih nasumičnih varijabla 207

vjerojatnost očito jednaka umnošku slijedećih uvjetnih vjerojatnosti

= P( A) · P( A/A) · . . . · P( A/A n−1 )·


N − n −1
· P( A/A n ) · P( A/A n A) · . . . · P( A/A n A )
M M−1 M−n+1
= ...
N N −1 N −n+1
N −M N −M−1 N − M − ( N − n) + 1
... .
N −n N −n−1 N − n − ( N − n) + 1
No, taj isti izraz za vjerojatnost bi se dobio i za bilo koji drugi poredak izvlačenja n
bijelih kuglica iz N izvlačenja. Takvih poredaka sve skupa ima ( Nn ), pa je zato

N M M−1 M−n+1 N −M N −M−1 N − M − ( N − n) + 1


 
P( Bn,N −n ) = ... ...
n N N −1 N −n+1 N −n N −n−1 N − n − ( N − n) + 1

M N −M
  

n N−n
= .
N
 

N


Primjer 4.10 Promatra se skup od N elemenata (npr. atoma ili molekula nekog plina),
od kojih njih M ≤ N ima odred̄eno svojstvo (npr. spin ili brzinu odred̄enog iznosa),
dok ostalih N − M elemenata nema to svojstvo. Označimo s
M
p=
N
vjerojatnost da odabrani element ima to svojstvo. Ako iz ovog skupa nasumice oda-
beremo N elemenata, zanima nas kolika je vjerojatnost P(n) da se med̄u njima nad̄e
n ≤ N elemenata sa navedenim svojstvom9 ?
Kao što znamo, postoji (N
N ) različitih načina da se od N elemenata odabere uzorak od
N elemenata. Ukupan broj elemenata koji ima navedeno svojstvo je M = pN . Odabrati
n od pN elemenata je moguće izvesti na ( pnN )načina. Preostalih N − n elemenata uzorka,
treba odabrati iz onog dijela N − pN , početnog skupa koji nema navedeno svojstvo.
Taj je odabir moguće izvesti na (NN−−pnN ) načina. Svaki odabir elemenata sa navedenim
svojstvom se može kombinirati sa svakim odabirom elemenata bez navedenog svojstva,
što vodi na tražnu vjerojatnost u obliku
broj uzoraka s n elemenata koji imaju navedeno svojstvo
P(n) =
ukupan broj uzoraka od N elemenata
(M N −M
n ) ( N −n ) ( pnN ) (NN−−pnN )
= = , n = 0, 1, 2, · · · , min{ N, pN }
(N
N) (NN)
( pN )! (N − pN )! N! (N − N )!
=
n! ( pN − n)! ( N − n)! (N − pN − N + n)! N !
( pN )! (qN )! N! (N − N )!
=
n! ( pN − n)! ( N − n)! (qN − N + n)! N !


9 Usporediti ovo pitanje s primjerom sa strane 30.


208 Poglavlje 4. Raspodjele

Izraz

( pN )! (qN )! N! (N − N )!
P(n) = . (4.52)
N !n! ( pN − n)! ( N − n)! (qN − N + n)!

se naziva HIPERGEOMETRIJSKA RASPODJELA. Ona je jednoznačno odred̄ena brojevima


N , p i N, pa se zato ponekad označava i kao Pn (N , p, N ).

REKURZIJA :
Slično kao i kod binomne raspodjele, koja je zadana faktorijelima, i ovdje možemo lako
naći rekurziju izmed̄u P(n) i P(n − 1)

P(n) ( n − 1) ! ( p N − n + 1) ! ( N − n + 1) ! ( q N − N + n − 1) !
=
P ( n − 1) n!( pN − n)!( N − n)!(qN − N + n)!
( pN − n + 1)( N − n + 1)
=
n (qN − N + n)
( pN − n + 1)( N − n + 1)
P(n) = P ( n − 1).
n(qN − N + n)

VEZA S HIPERGEOMETRIJSKOM FUNKCIJOM :


Označimo s

(qN )!(N − N )!
A= .
(qN − N )!N !

Tada je

N!( pN )!(qN − N )!
P(n) = A .
n!( N − n)!( pN − n)!(qN − N + n)!

U gornjem obliku P(n) se može usporediti s HIPERGEOMETRIJSKOM FUNKCIJOM pozna-


tom iz više analize10 , koja je definirana redom

αβ α(α + 1) β( β + 1) 2 α(α + 1)(α + 2) β( β + 1)( β + 2) 3


F (α, β, γ; u) = 1 + u+ u + u +··· .
1γ 1 2 γ ( γ + 1) 1 2 3 γ(γ + 1)(γ + 2)

Uz slijedeće preslikavanje,

α = − N, β = − pN , γ = qN − N + 1,

omjer P(n)/A daje koeficijente razvoja F (α, βγ; u)

P(n) n
F (α, βγ; u) = ∑ A
u .
n =0

10 Vidjeti npr. ˜. M ARKOVI Ć , Uvod u višu analizu, str. 557, ili odjeljak o hipergeometrijskoj diferencijalnoj

jednadžbi u G LUMAC, Matematičke metode fizike.


4.1 Raspodjele diskretnih nasumičnih varijabla 209

Evo nekoliko prvih članova:


P ( n = 0) N!( pN )!(qN − N )!
= = 1,
A 0!N!( pN )!(qN − N )!

P ( n = 1) N!( pN )!(qN − N )!
=
A 1!( N − 1)!( pN − 1)!(qN − N + 1)!
N ( pN ) −α (− β) α β
= → = ,
qN − N + 1 γ γ

P ( n = 2) N!( pN )!(qN − N )!
=
A 2!( N − 2)!( pN − 2)!(qN − N + 2)!
N ( N − 1)( pN )( pN − 1) −α(−α − 1) (− β)(− β − 1)
= →
2(qN − N + 1)(qN − N + 2) 2γ(γ + 1)
α ( α + 1) β ( β + 1)
= ,
2γ(γ + 1)
itd.

NORMIRANJE I MOMENTI :
Da bismo pokazali normiranost hipergeometrijske raspodjele i izračunali njezine mo-
mente, trebat će nam MyBlueTextE ULEROVA FORMULA
  min { D,s}   
S D S−D

= ∑ . (4.53)
s d =0
d s−d
Pomoću gornjeg izraza vidimo da je
min { N, pN } min { N, pN }
1 pN N − pN 1 N
    
∑ P(n) =
(N
∑ n N−n
=
(N N
= 1,
n =0 N) n =0 N)
i raspodjela je normirana. Izračunajmo još i očekivanje i varijancu:
min { N, pN } min { N, pN }
1 pN N − pN
  
hni = ∑ n P(n) = (N ) ∑ n n N−n
n =0 N n =0
min { N, pN }
1 ( pN )! N − pN
 
= N
(N)
∑ n n!( pN − n)! N − n
n =1
min { N, pN }
1 p N ( p N − 1) ! N − pN
 
= N
(N)
∑ ( n − 1) ! ( p N − n ) ! N − n .
n =1
Sada se uvodi nova varijabla zbrajanja m = n − 1
min { N −1,pN −1} 
pN pN − 1 N − pN
 
hni = N
(N)
∑ m N − ( m + 1)
m =0
min { N −1,pN −1} 
pN pN − 1 N − 1 − ( p N − 1)
 
= N
(N)
∑ m N−1−m
m =0
pN N − 1
 
= ( A.80) = N = pN.
( ) N−1
N
210 Poglavlje 4. Raspodjele

Za račun varijance, počnimo sa

min { N, pN } min { N, pN }
1 pN N − pN
  
hn(n − 1)i = ∑ n ( n − 1) P ( n ) =
(N
∑ n ( n − 1)
n N−n
n =0 N) n =2
min { N, pN }
1 ( pN )! N − pN
 
= N
(N)
∑ n ( n − 1)
n!( pN − n)! N−n
n =2
min { N, pN }
1 p N ( p N − 1) ( p N − 2) ! N − p N
 
= N
(N)
∑ ( n − 2) ! ( p N − n ) ! N−n
n =2
min { N −2, pN −2} 
p N ( p N − 1) pN − 2 N − pN
 
=
(N
∑ m N−m−2
N) m =0
min { N −2, pN −2}
p N ( p N − 1) pN − 2 N − 2 − ( p N − 2)
   
=
(N
∑ m N−2−m
N) m =0
p N ( p N − 1) N − 2
 
= ( A.80) =
(N N−2
N)

pN ( pN − 1) ( N − 1)
n 2 − hni = .


N −1

Iz prethodnog računa znamo da je hni = pN, pa sada možemo lako izračunati

N −N
σ 2 = n 2 − hni 2 = pqN .


N −1

Kao što je pokazano u nastavku teksta, iz hipergeometrijske se raspodjele dobije bi-


nomna u granici N → ∞; i zaista, ako u gornjem izrazu za varijancu izvedemo taj limes,
dobit ćemo varijancu binomne raspodjele: σ 2 = pqN.
Slično se računaju i viši momenti potrebni za dobivanje koeficijenata asimetrije i spljo-
štenosti.

VEZA S BINOMNOM RASPODJELOM :


Pokažimo da u granici kada

N → ∞,

hipergeometrijska raspodjela prelazi u binomnu. Primjenom Stirlingove formule


N! ≈ 2π N N N e−N ,
4.1 Raspodjele diskretnih nasumičnih varijabla 211

na P(n) dobivamo
( pN )!(qN )!N!(N − N )!
lim P(n) = lim
N →∞ N →∞ n! ( p N − n ) ! ( N − n ) ! ( q N − N + n ) ! N !
N! ( pN )!(qN )!(N − N )!
= lim
n!( N − n)! N →∞ ( pN − n)!(qN − N + n)!N !
N 2π pN ( pN ) pN e− pN
  p
= lim p
n N →∞ 2π ( pN − n)( pN − n) pN −n e− pN +n
2πqN (qN )qN e−qN
p
·
2π (qN − N + n)(qN − N + n)qN − N +n e−qN + N −n
p

2π (N − N )(N − N )N − N e−N + N
p
· √ .
2π N N N e−N
Nakon skraćivanja, dobije se
N
 
lim P(n) = p n q N −n
N →∞ n
1
N N N −N+ 2
1− N 1− N
 
· lim   pN −n+ 12  qN  − N +n+ 12 .
N →∞ n

n
1− pN 1 − pN 1 − Nq−
N
n
1− N −n
qN

Gornji su limesi redom jednaki


1
N −N+ 2 n pN
N
N
    
−N
lim 1− =e , lim 1 − = 1, lim 1 − = e− n ,
N →∞ N N →∞ N N →∞ p N
−n+ 12 qN 1
n N−n N − n − N +n+ 2
   
− N +n
lim 1 − = 1, lim 1 − =e , lim 1 − = 1.
N →∞ pN N →∞ qN N →∞ qN
Nihovo uvrštavanje vodi na
N
 
lim P(n) = p n q N −n .
N →∞ n
Dakle, binomna raspodjela se dobiva kao granični slučaj N → ∞, hipergeometrijske
raspodjele.

 Primjer 4.11 dovršiti 

Zadatak 4.19 Osnovni se skup sastoji od tri bijele i pet crnih kuglica. Treba naći
hipergeometrijsku raspodjelu bijelih kuglica za uzorak od četiri člana. 

Rješenje:
Osnovni skup ima N = 8 elemenata (kuglica). Uočeno obilježje (bijelu boju) imaju M = 3
elementa. Vjerojatnost p = M/N = 3/8. Veličina uzorka je N = 4. Hipergeometrijska
raspodjela je dana sa (4.52)
( pN )!(qN )!N!(N − N )! 3! 5! 4! 4!
P(n) = =
n!( pN − n)!( N − n)!(qN − N + n)!N ! n! (3 − n)! (4 − n)! (1 + n)! 8!
212 Poglavlje 4. Raspodjele

za n = 0, 1, 2, 3 = M.

3! 5! 4! 4! 1
P ( n = 0) = =
3! 4! 8! 14
3! 5! 4! 4! 6
P ( n = 1) = =
2! 3! 2! 8! 14
3! 5! 4! 4! 6
P ( n = 2) = =
2! 2! 3! 8! 14
3! 5! 4! 4! 1
P ( n = 3) = =
3! 4! 8! 14

Očito je vjerojatnost normirana

3
∑ P(n) = 1.
n =0

Srednja vrijednost i varijanca su

3
0 · 1 + 1 · 6 + 2 · 6 + 3 · 1 21
hni = ∑ n P(n) =
14
=
14
= 1.5 = pN
n =0
#2
3 3
"
σ 2 = n 2 − hni 2 = ∑ n 2 P(n) − ∑ n P(n)


n =0 n =0
 2
39 3 15 N −N
= − = = pqN .
14 2 28 N −1

Zadatak 4.20 Za hipergeometrijsku raspodjelu izračunajte:


(a) koeficijente α 3 i α 4 ,
(b) mod i sva tri kvartila. 

Rješenje:

Navesti primjere

4.1.8 Paretova raspodjela

DEFINICIJA :
Vjerojatnost da je X veće od neke zadane vrijednosti x, što se često naziva funkcija
preživljavanja ili funkcija repa (raspodjele) je dana sa
4.1 Raspodjele diskretnih nasumičnih varijabla 213

Slika 4.11: Vilifredo Pareto

  x α
m
 , x ≥ xm ,
x

P( X > x ) =

1, x < xm ,

i naziva se Paretova raspodjela11 U gornjem izrazu je xm > 0 najmanja moguća vrijed-


nost za X, a α je pozitivan parametar (tail index, Pareto index). dodati sliku
Prema definiciji kumulativne funkcije, (3.1), za Pareto raspodjelu je ona jednaka (dodati
sliku)
 x α
m

 1 − , x ≥ xm ,
x

FX ( x ) =

0, x < xm .

Derivacijom kumulativne funkcije, (3.7), dobiva se raspodjela gustoće vjerojatnosti


α xα

 α+m1 , x ≥ xm ,

ρX (x) = x

0, x < xm .

Srednja vrijednost i varijanca su

∞, α ∈ (1, 2],

∞, α ≤ 1,

 

 
hxi = σ2 = 2
 α xm , xm

α
α > 1. , α > 2.
 

α−1 α−1 α−2

Ako je α ≤ 1, varijanca ne postoji.


Funkcija izvodnica je definirana samo za ne-pozitivne vrijednosti t ≤ 0

Z (t) = α(− xm t) α Γ(−α, − xm t),

a karakteristična funkcija je
e (t) = α(−ıxm t) α Γ(−α, −ıxm t),
Z

Za obje funkcije je Γ( a, b) je nepotpuna gama funkcija.


Geometrijska i harmonijska sredina su

1 1
   
G = xm exp , H = xm 1 + .
α α
11 Wilfried Fritz Pareto ili Vilfredo Federico Damaso (15. VII 1848. – 19. VIII 1923.), italijanski inženjer,

sociolog, ekonomist, politolog i filozof.


214 Poglavlje 4. Raspodjele

Pored ostaloga, Pareto je prvi uočio omjer 80/20 na primjeru raspodjele materijalnog
bogatstva u tadašnjoj Italiji, gdje je 80% materijalnih dobara bilo u rukama (samo) 20%
stanovništva. Nekoliko primjera 80/20 pravila je dano donjom tablicom
• 80% prometnih udesa izazove 20% najmlad̄ih vozača;
• 80% prometnih udesa dogodi se unutar prvih 20% predvid̄ene duljine putovanja;
• 80% srećki kupuje 20% ukupnog stanovništva;
• 80% onečišćenja zraka izazove 20% ukupnog stanovništva;
• 80% svog vatrenog oružja posjeduje 20% ukupnog stanovništva;
• 80% ukupne aktivnosti na webu povezano je s 20% web stranica;
• 80% poziva na mobitele dolazi od 20% ukupnog stanovništva;
dovršiti

4.1.9 Zipf - Mandelbrotova raspodjela


DEFINICIJA :
Zipfov12 zakon (1949. god.) tvrdi da je vjerojatnost pojavljivanja r-te najvjerojatnije
riječi u nekom, u statističkom smislu, malo dužem tekstu nekog standardnog jezika,
približno dana normiranom raspodjelom vjerojatnosti13
1 1
P (r ) = , α ≈ 1, r = 1, 2, . . . , N, . (4.54)
ζ N (α) r α
Kao konstanta normiranja se pojavljuje zbroj prvih N članova Riemannove ζ funkcije14
N
1
ζ N (α) = ∑ nα
.
n =1

U svojim pokušajima da Zipfovu raspodjelu izvede iz informacijske teorije, Mandel-


brot15 . je došao (1982. god.) do malo modificiranog Zipfovog izraza. Modifikacija se
sastoji u tome da se pojavio još jedan parametar, v, tako da je prethodna raspodjela
vjerojatnosti dana sa
1 1
P (r ) = . (4.55)
ζ N (α, v) (r + v) α
Kao konstanta normiranja, pojavljuje se prvih N članova Hurwitz–Lerchove ζ-funkcije16

N
1
ζ N (α, v) = ∑ (n + v) α
, ζ N (α, 1) = ζ (α).
n =0

Gornji se izraz naziva Zipf-Mandelbrotova ili Pareto-Zipfova raspodjela. U oba gornja


izraza konstante normiranja se mogu shvatiti kao poopćenja harmonijske sredine (3.18).

Kumulativna funkcija raspodjele (3.1)


r r
1 1 ζ r (α, v)
F (r ) = ∑ P (r 0 ) =
ζ N (α, v) ∑ (r 0 + v) α
=
ζ N (α, v)
.
r =0
0 r =0
0

12 George Kingsley Zipf (7. I 1902 – 25. IX 1950.), američki lingvist i filolog.
13 „Emma” Jane Austen je navedena kao primjer u knjizi „Information Theory, Inference and Learning
Algorithms” autora David J. C. MacKaya.
14 Vidjeti npr. odjeljak Riemannova zeta-funkcija u G LUMAC , Matematičke metode fizike.
15 Benoit B. Mandelbrot (20. IX 1924. - 14. X 2010.), poljsko-francusko-američki matematičar
16 Adolf Hurwitz (26. III 1859. – 18. IX 1919.), njemački matematičar. Matyáš Lerch (20. II 1860. – 3. VIII

1922.), češki matematičar.


4.1 Raspodjele diskretnih nasumičnih varijabla 215

Srednja vrijednost
N
ζ N (α − 1, v)
hr i = ∑ r P (r ) =
ζ N (α, v)
− v.
r =1

Mod je (odjeljak 3.4.2) ona vrijednost statističkog obilježja koja je u skupu zastupljena
najvećim brojem članova,

Mod = 1.

momenti
funkcija izvodnica

4.1.10 Benfordova raspodjela


P(n) = log10 (n + 1) − log10 (n), n = 1, 2, 3, 4, 5, 6, 7, 8, 9.

dovršiti
Navesti primjere

4.1.11 Raspodjele statističke fizike


Promatraju se tri različite fizičke situacije u kojima se N čestica raspored̄uje u g stanja. S
Nk , za k = 1, 2, 3, · · · , g, se označava broj čestica u k-tom stanju
g
N1 + N2 + · · · + Ng = ∑ Nk = N.
k =1

Maxwell-Boltzmann klasična raspodjela čestice se med̄usobno razlikuju;


u svakom stanju se može nalaziti
proizvoljan broj čestica,

Bose-Einstein kvantna raspodjela čestice se med̄usobno ne razlikuju;


u svakom stanju se može nalaziti
proizvoljan broj čestica,

Fermi-Dirac kvantna raspodjela čestice se med̄usobno ne razlikuju;


u svakom stanju se može nalaziti
najviše jedna čestica.

M AXWELL -B OLTZMANNOVA ( KLASI ČNA ) RASPODJELA


Rezultate ovog odjeljka u sporedite s rezultatima odjeljka 4.2.4.
Promatra se spremnik u kojemu se nalaze čestice iste mase, električnog naboja itd.
Ove se čestice gibaju nasumično u svim smjerovima različitim brzinama, tako da
su im kinetičke energije različite. Takod̄er ćemo prihvatiti i pretpostavku klasične
fizike da se čestice mogu med̄usobno razlikovati. U klasičnoj fizici postoje trajektorije
(putanje) čestica, pa prateći te putanje, možemo razlikovati pojedine čestice. Maxwell-
Boltzmannova raspodjela je veličina koja pokazuje kako se može odrediti broj, Nk , koji
216 Poglavlje 4. Raspodjele

kaže koliko čestica ima energiju jednaku Ek . No, reći da Nk čestica ima energiju Ek ,
ne odred̄uje u cjelosti mikroskopsku konfiguraciju sustava čestica. Zašto? Zato jer se
čestice med̄usobno razlikuju i postoji velik broj odabira čestica tako da njih točno Nk
ima energiju Ek . Npr. neka je, za neki k, broj Nk = 2, tj. dvije čestice (od njih N) imaju
energiju Ek . No, te dvije čestice mogu biti prva i druga, prva i treća, ..., druga i treća,
druga i četvrta, ..., treća i četvrta itd. Drugim riječima, premještanje dvaju čestica koje
se nalaze u različitim energijskom stanjima daje novi razmještaj ili kako se to još kaže
- novu mikroskopsku konfiguraciju. Takod̄er se u jednom energijskom stanju može
nalaziti proizvoljan broj čestica. To su svojstva koja imaju čestice klasičnog idealnog
plina. Pretpostavlja se da je svaki pojedini mogući raspored čestica po energijskom
stanjima, jednako vjerojatan, pa će najvjerojatnija energija biti ona koja se realizira kroz
najviše konfiguracija.
Izračunajmo kolika je vjerojatnost da se u prvom energijskom stanju nad̄e N1 čestica,
u drugom N2 čestica itd. sve do Ng čestica u g-tom stanju. Vjerojatnost je jednaka
omjeru broja konfiguracija koje zadovoljavaju navedeni uvjet, Nuv , i ukupnog broja
konfiguracija Nuk

Nuv
PMB = .
Nuk

Brojnik: poznato je17 da se N čestica može rasporediti na N ! načina. Ako je od tih N


čestica njih Nk u k-tom stanju, onda njihove permutacije ne mjenjaju broj čestica u tom
k-tom stanju. Zato je brojnik gornjeg izraza za vjerojatnost jednak
g
N! 1
Nuv =
N1 ! N2 ! · · · Ng !
= N! ∏ Nk !
.
k =1

To su jednostavno permutacije s ponavljanjem.


Pretpostavimo sada da su energije stanja Ek degenirane. To znači da je Ek samo za-
jednički naziv za gk različitih energija koje imaju vrijednosti vrlo bliske vrijednosti Ek
(slika 4.12). Svaka od Nk čestica se može nalaziti u bilo kojem od tih gk energijskih

Slika 4.12: Primjer uz objašnjenje degeneracije energija.

17 Vidjeti odjeljak 1.1 o permutacijama s ponavljanjem.


4.1 Raspodjele diskretnih nasumičnih varijabla 217

(pod)stanja, tako da je tada ukupan broj mikroskopskih konfiguracija jednak gornjem


izrazu pomnoženom s gk · gk · . . . gk = gkNk
g
gkNk
Nuv = N ! ∏ Nk !
.
k =1

Nazivnik: u nazivnik izraza za vjerojatnost dod̄u svi mogući razmještaju čestica. No,
svaka od N čestica se može nalaziti u svakom od g stanja, pa je nazivnik jednak

Nuk = g · · · g = g N

i tražena je vjerojatnost jednaka

N!
g
gkNk
PMB = N
g ∏ Nk !
. (4.56)
k =1

Maxwell-Boltzmannova raspodjela je prikladna za opis idealnog plina, dakle plina


male gustoće i na relativno visokim temperaturama. Uz ove uvjete će biti degeneracija
energijskih stanja uvijek znatno veća od broja čestica koje se nalaze u tom stanju

gk  1,
gk  Nk ,

što će omogućiti primjenu Stirlingove formule za računanje faktorijela velikih brojeva

M! ≈ M M e− M , M  1.

Izraz (4.56) daje vjerojatnost mikroskopske konfiguracije kao funkciju brojeva zaposjed-
nuća Nk , pojedinih (energijskih) stanja. Naravno, da će na različitim temperaturama i
vjerojatnosti zaposjednuća biti različite: na niskim temperaturama će biti zaposjednuta
mahom stanja niskih energija, dok će na visokim temperaturama vjerojatnije biti kon-
figuracije sa zaposjednutim stanjima visokih energija. Pitanje koje se sada postavlja jeste:

KAKVI MORAJU BITI BROJEVI Nk , PA DA , UZ FIKSNE VANJSKE UVJETE ,


VJEROJATNOST PMB BUDE NAJVE ĆA ?

Kao što je poznato iz matematičke analize, najveća vrijednost neke funkcije, tj. njezin
maksimum, se dobiva tako da se derivacija te funkcije po odgovarajućoj varijabli,
izjednači s nulom. U ovom slučaju to znači da treba riješiti jednadžbu

∂PMB
= 0.
∂Nk

Primjetimo da budući je logaritam monotona funkcija, to će ln( PMB ) imati maksimum
za istu vrijednost argumenta kao i sam PMB

∂ ln( PMB )
= 0.
∂Nk

Ako imaju maksimum na istom mjestu, zašto uopće uvoditi ln( PMB ) umjesto PMB ? Razlog
za uvod̄enje ln( PMB ) umjesto PMB je vrlo praktične naravi: u računu preko PMB , relacija
(4.56), treba derivirati umnožak funkcija, a u računu s ln( PMB ) treba derivirati zbroj
218 Poglavlje 4. Raspodjele

funkcija. Budući da je ovo drugo lakše nego ono prvo, radi se s ln( PMB ), a ne s PMB .
Prema (4.56) je

g
gkNk
ln( PMB ) = ln( N !) − N ln g + ∑ ln
Nk !
.
k =1

No, u planirani račun ekstrema treba još ugraditi dva uvjeta: broj čestica, N, je konstan-
tan

N1 + N2 + · · · + Ng = const. = N (4.57)

i ukupna energija sustava je konstantna

N1 E1 + N2 E2 + · · · + Ng E g = const. = E . (4.58)

Ponovo, iz matematičke analize18 je poznato da se ekstrem funkcije koji mora zadovo-


ljavati odred̄ene uvjete, nalazi koristeći Lagrangeove množitelje. Time funkcija f čiji se
ekstrem traži, postaje

 g   g 
f ( N1 , N2 , · · · , Ng ) = ln( PMB ) + α N − ∑ Nk + β E − ∑ Nk Ek ,
k =1 k =1
g g
= ln( N !) − N ln g + ∑ Nk ln( gk ) − ∑ ln( Nk !)
k =1 k =1
 g   g 
+α N− ∑ Nk + β E − ∑ Nk Ek .
k =1 k =1

gdje su α i β, za sada neodred̄eni, Lagrangeovi množitelji. Koristeći već spomenuti


Stirlingov izraz za faktorijele velikih brojeva

ln M! ≈ M ln( M ) − M, (4.59)

za f se dobiva

f ( N1 , N2 , · · · , Ng ) = ln( N !) − N ln g + α N + β E
g  
+ ∑ Nk ln( gk ) − Nk ln( Nk ) + Nk − α Nk − β Nk Ek .
k =1

Sada je lako odrediti položaj ekstrema

∂f
= 0 = ln gl − ln Nl + 1 − 1 − α − β El .
∂Nl

Iz gornjeg izraza je

Nk = gk e−α− β Ek . (4.60)

To je broj čestica u k-tom energijskom stanju Ek u okviru Maxwell-Boltzmannove kine-


tičke teorije idealnog plina. Konstanta α dolazi od sačuvanja broja čestica, a konstanta β
18 Vidjeti npr. u ˜. M ARKOVI Ć, Uvod u višu analizu.
4.1 Raspodjele diskretnih nasumičnih varijabla 219

od sačuvanja energije. Odredimo značenje te dvije konstante.


Iz sačuvanja broja čestica je
g g
N= ∑ Nk = e −α
∑ gk e− β E k ,
k =1 k =1

iz čega slijedi da je
g
1
α
e =
N ∑ gk e− β E k , (4.61)
k =1

pa je

gk e− β E k
Nk = N g .
∑ l =1 g l e− β E l

Zbroj u nazivniku se obično označava sa Z i naziva se PARTICIJSKA FUNKCIJA ili statis-


tički zbroj
g
gk e− β E k
Z= ∑ gk e− β E k , Nk = N
Z
.
k =1

Iz izvoda (4.60) znamo da PMB ima maksimalnu vrijednost upravo za gornju vrijednost
Nk , no kolika je ta maksimalna vrijednost, doznat ćemo kada (4.60) uvrstimo u izraz za
PMB tj. ln( PMB )
g g
ln( PMB ) = ln( N !) − N ln( g) + ∑ Nk ln( gk ) − ∑ ln( Nk !) .
k =1 k =1

Uz pretpostavku da su svi Nk  1, na ln( Nk !) se može primjeniti Stirlingov izraz (4.59),


nakon čega gornji izraz postaje
g 
ln( PMB ) ≈ ln( N !) − N ln g + ∑ Nk ln( gk ) − Nk ln Nk + Nk )
k =1
g h   i
≈ N ln N − N − N ln g + ∑ Nk ln( gk ) − Nk ln( gk ) − α − βEk + Nk
k =1
≈ N ln N − N − N ln g + α N + βE + N
≈ N ln N − N ln g + α N + βE .

Diferencijal gornjeg izraza je

d ln( PMB ) = α d N + β dE ,

ili
1 α
dE = d ln( PMB ) − d N.
β β

Boltzmann je shvatio da gornji izraz nije ništa drugo do zapis drugog zakona termodi-
namike

dE = T dS + µ dN ,
220 Poglavlje 4. Raspodjele

(gdje je T apsolutna temperatura, a µ kemijski potencijal) iz čega je očitao vrijednosti


konstanata α i β

1 µ
β= α=− ,
kB T kB T

kao i veza entropije S i logaritma funkcije raspodjele (slavna Boltzmannova relacija19 )

S = k B ln( P).

Uz ova pojašnjenja, konačni izraz za broj čestica s energijom Ek u okviru Maxwell-


Boltzmannove teorije je

Nk = gk e−(Ek −µ)/(k B T ) . (4.62)

veličina

z = eµ/(k B T )

se obično naziva activity.


Takod̄er, u skladu s (4.61) je
g
1 Z
e−µ/(k B T ) =
N ∑ gk e−Ek /(k B T ) =
N
.
k =1

Poisson (dovršiti)
Izračunajmo sada vjerojatnost pk da se k-tom stanju nalazi nk čestica. Od ukupno n
čestica, njih nk se može odabrati na

n
 

nk

načina. Preostalih n − nk čestica se može rasporediti u preostalih N − 1 stanja na


potpuno proizvoljan način, tj. na

( N − 1) n − nk

načina. Zato je tražena vjerojatnost jednaka

(nnk ) ( N − 1)n−nk
pk = .
Nn
U granici kada omjer n/N teži konstantnoj vrijednosti
n

N
gornji izraz prepoznajemo kao Poissonovu raspodjelu (4.48)

λ nk
e−λ ,
nk !
pri čemu smo koristili definiciju (4.50).

19 koja je urezana na njegov nadgrobni spomenik


4.1 Raspodjele diskretnih nasumičnih varijabla 221

B OSE -E INSTEINOVA ( KVANTNA ) RASPODJELA


Rezultate ovog odjeljka usporedite s rezultatima iz odjeljka 4.2.7.
U Bose20 -Einsteinovoj statistici, čestice se shvaćaju kao kvantni objekti i stoga je nemo-
guće razlikovati pojedine čestice. To znači da premještanje dvaju čestica koje se nalaze u
različitim kvantnim stanjima ne daje novi razmještaj; takod̄er se u jednom stanju može
nalaziti proizvoljan broj čestica

Nk ≤ N.

Čestice s ovim svojstvima imaju cjelobrojan spin i nazivaju se BOZONI. Foton - kvant
elektromagnetskog polja ima spin iznosa 1 i primjer je jednog bozona.
Uz gornje uvjete izračunajmo kolika je vjerojatnost PBE da se u prvom stanju nad̄e N1
čestica, u drugom N2 čestica itd. sve do Ng čestica u g-tom stanju uz uvjet

N1 + N2 + · · · + Ng = N.

Kao i u primjeru Maxwell-Boltzmannove raspodjele, tražena vjerojatnost je jednaka


omjeru broja konfiguracija koje zadovoljavaju navedeni uvjet, Nuv , i ukupnog broja
konfiguracija Nuk

Nuv
PBE = .
Nuk

Brojnik: budući da se čestice med̄usobno ne razlikuju, postoji samo jedan povoljan


razmještaj čestica

Nuv = 1.

Nazivnik: koliko ima sve skupa mogućih razmještaja? Sjetimo se da svako od g stanja
može biti ili prazno ili imati jednu česticu ili dvije čestice, itd sve do mogućnosti da
jedno stanje sadrži svih N čestica.
Slika 4.13 sadrži primjer kako se N = 10 čestica može rasporediti u g = 5 stanja. Susjedna
stanja su razdvojena okomitim crtama. Gornji dio slike prikazuje raspodjelu u kojoj su

Slika 4.13: Primjer raspodjele čestica prema Bose-Einsteinovoj raspodjeli.

20 Satyendra Nath Bose (1. I 1894. – 4. II 1974.), teorijski fizičar, rod̄en u Zapadnom Bengalu u Indiji.
222 Poglavlje 4. Raspodjele

prvom stanju tri čestice, drugo stanje je prazno (bez čestica), u trećem stanju su četiri
čestice, u četvrtom jedna i u petom dvije čestice. Donji dio slike prikazuje raspodjelu
(2, 1, 3, 2, 2).
Malo općenitije se problemu označavanja stanja i čestica u njima, može pristupiti i
ovako: označimo kvantna stanja slovima

a, b, c, d, · · ·,
| {z }
g

a čestice brojevima

1, 2, 3, · · · , N.

Jedan primjer rasporeda čestica po stanjima se tada može prikazati na slijedeći način

a 1 b c 2 3 4 5 6 d 7 8 e f 9 10 g · · ·

Značenje gornjeg zapisa je slijedeće: u prvom stanju a je jedna čestica, u drugom b


nema čestica, u trećem c je pet čestica, u četvrtom d su dvije čestice, u petom e nema
čestica, u šestom f su dvije čestice itd. (čestice su brojevi desno od slova koje označava
stanje). Koliko ima ovakvih rasporeda? Na prvo mjesto može doći bilo koje slovo
koje označava jedno od g stanja. Desno od tog početnog slova može doći bilo koja
permutacija preostalih N + g − 1 simbola (N čestica i preostalih g − 1 stanja). Zato je
ukupan broj takvih konfiguracija jednak

g ( N + g − 1) !

No, permutacije oznaka stanja i oznaka čestica ne mjenjaju konfiguraciju (permutacije s


ponavljanjem), tako da je ukupan broj različitih konfiguracija jednak

g ( N + g − 1) ! ( N + g − 1) ! N+g−1
 
Nuk = = = (4.63)
g! N! ( g − 1) ! N ! N

i tražena vjerojatnost je

Nuv ( g − 1) ! N !
PBE = = .
Nuk ( N + g − 1) !
Iskoristimo sada izraz (4.63) da bismo odredili koliko ima konfiguracija u kojima se
N1 čestica nalazi u energijskom stanju E1 s degeneracijom g1 i N2 čestica u energijskom
stanju E2 s degeneracijom g2 i N3 čestica u energijskom stanju E3 s degeneracijom g3 itd.
Prema (4.63) se N1 može rasporediti po g1 stanja na

( N1 + g1 − 1) !
( g1 − 1) ! N1 !
načina i slično za rasporede N2 , N3 itd. čestica. Svaki se raspored čestica N1 može
kombinirati sa svakim rasporedom čestica N2 , a ovi opet sa svakim rasporedom čestica
N3 itd. Zato je ukupan broj mogućih rasporeda čestica po zadanim stanjima jednak
umnošku izraza gornjeg oblika. Taj ukupan broj konfiguracija ćemo označiti s W
g
( Nk + gk − 1) !
W=∏ .
k =1
( gk − 1) ! Nk !
4.1 Raspodjele diskretnih nasumičnih varijabla 223

Zapitajmo se sada kakvi moraju biti Nk , pa da gornji umnožak bude najveći, tj. kojih
će konfiguracija biti najviše ili, rečeno jezikom vjerojatnosti, koje su konfiguracije naj-
vjerojatnije? Postupit ćemo kao kod izvoda Maxwell-Boltzmannove raspodjele: tražit
ćemo maksimum W (zapravo ln(W ), ali to vodi na isti rezultat) opet uz uvjete da su
broj čestica i ukupna energija sustava konstantni (što će uvesti Lagrangeove množitelje),
relacije (4.57) i (4.58). Funkcija f čiji se maksimum traži je
 g   g 
f ( N1 , N2 , · · · , Ng ) = ln(W ) + α N − ∑ Nk + β E − ∑ Nk Ek
k =1 k =1
g g g
= ∑ ln ( Nk + gk − 1) ! − ∑ ln ( gk − 1) ! − ∑ ln( Nk ) !
k =1 k =1 k =1
 g   g 
+α N− ∑ Nk + β E − ∑ Nk Ek .
k =1 k =1

Za velike vrijednosti Nk i gk , faktorijeli se mogu izraziti preko Stirlingove formule (4.59)


g h
f ( N1 , N2 , · · · , Ng ) ≈ ∑ ( Nk + gk ) ln ( Nk + gk ) − ( Nk + gk )
k =1
i
− gk ln( gk ) + gk − Nk ln Nk + Nk
 g   g 
+α N− ∑ Nk + β E − ∑ Nk Ek .
k =1 k =1

Uvjet ekstrema f
∂f
=0
∂Nl
vodi na jednadžbu
1 1
ln ( Nk + gk ) + ( Nk + gk ) − 1 − ln( Nk ) − Nk + 1 − α − β Ek = 0,
Nk + gk Nk

Nk + gk
ln = α + β Ek ,
Nk
s rješenjem
gk
Nk = .
eα + β E k − 1
Najvjerojatnija je ona konfiguracija sa gornjim brojem čestica Nk s energijom Ek . Da bi
se dobila ta najveća vjerojatnost, treba, slično kao kod uzvoda Maxwell-Boltzmannove
raspodjele, gornji izraz za Nk uvrstiti u ln(W ) (uz primjenu Stirlingove formule)
g h i
ln(W ) ≈ ∑ ( Nk + gk ) ln ( Nk + gk ) − ( Nk + gk ) − gk ln( gk ) + gk − Nk ln( Nk ) + Nk
k =1
g n o
≈ ∑ ( Nk + gk ) [ln( Nk ) + α + βEk ] − Nk − gk − gk ln( gk ) + gk − Nk ln( Nk ) + Nk
k =1
≈ αN + βE + f 1 ( gk ),
224 Poglavlje 4. Raspodjele

gdje je f 1 ( gk ) funkcija od gk -ova. Diferenciranjem gornjeg izraza, dobiva se

d ln(W ) = α dN + β dE .

Koristeći Boltzmanovu vezu izmed̄u entropije S i maksimalnog raspoloživog broja


konfiguracija W

S = k B ln(W ),

gornji izraz se čita kao drugi zakon termodinamike

dE = T dS + µ dN ,

(gdje je T apsolutna temperatura, a µ kemijski potencijal) iz čega su konstanate α i β


jednake
1 µ
β= α=− .
kB T kB T
Time je izraz za Bose-Einsteinovu raspodjelu broja kvantnih objekata (čestica) po ener-
gijskim stanjima, konačno jednak
gk
Nk = / (k B T )
. (4.64)
e k
(E − µ ) −1
Zapitajmo se sada kolika je vjerojatnost pk da k-to stanje sadrži Nk čestica? Ukupan
broj konfiguracija je isti kao i u prethodnom problemu i dan je gornjim izrazom Nuk ,
no broj konfiguracija koje zadovoljavaju ovaj novi uvjet je drukčiji i lako se dobiva
upravo iz izraza za Nuk . Nakon što smo Nk čestica smjestili u jedno zadano stanje,
preostalih N − Nk čestica možemo rasporediti u preostalih g − 1 stanja. Primjenom
gornjeg razmatranja, tj. gornjeg izraza za Nuk u kojemu su izvedene zamjene

N → N − Nk , g → g − 1,

zaključujemo da je broj konfiguracija koje zadovoljavaju uvjet da se Nk čestica nalazi u


jednom, k-tom stanju, jednak

( g − 1) ( N − Nk + g − 1 − 1) ! ( N − Nk + g − 2) !
Nuv = = .
( g − 1) ! ( N − Nk ) ! ( g − 2) ! ( N − Nk ) !
Sada je tražena vjerojatnost pk jednaka

( N − Nk + g − 2) !
Nuv ( g − 2) ! ( N − Nk ) ! ( N − Nk + 1)( N − Nk + 2) · · · ( N − 1) N
pk = = = ( g − 1) .
Nuk ( N + g − 1) ! ( N − Nk + g − 1)( N − Nk + g) · · · ( N + g − 2)( N + g − 1)
( g − 1) ! N !
U granici kada N i g rastu uz uvjet da je njihov omjer konstantan
N
= λ = const.
g

gornja vjerojatnost (djeljenjem brojnika i nazivnika s g Nk +1 ) prelazi u

λ Nk
pk → .
(λ + 1) Nk +1
4.1 Raspodjele diskretnih nasumičnih varijabla 225

F ERMI -D IRACOVA ( KVANTNA ) RASPODJELA


Rezultate ovog odjeljka usporedite s rezultatima iz odjeljka 4.2.8.
I u Fermi-Diracovoj statistici takod̄er nema razlike med̄u pojedinim česticama, ali se
kao posljedica Paulijevog načela isključivosti, u svakom stanju može nalaziti najviše
jedna čestica (dakle, ili nijedna ili jedna). Stoga broj čestica N ne može biti veći od broja
stanja g

N ≤ g.

To je statistika koja vrijedi za čestice polucjelobrojnog spina kao što je npr. elektron.
Donji primjer pokazuje jednu moguću raspodjelu čestica (brojevi) po stanjima (slova)

a 1 b c 2 d 3 f g 9 h ···

Ukupno je na raspolaganju g stanja koja se na razne načine mogu rasporediti na g !


načina. No, zbog nerazlikovanja identičnih čestica, permutacije N punih stanja (onih u
kojima se nalazi jedna čestica) i ( g − N ) praznih stanja (onih u kojima nema čestice), ne
vode na novu permutaciju. Zato je ukupan broj mogućih različitih konfiguracija jednak

g! g
 
= .
N ! (g − N) ! N

To je rezultat za ukupan broj čestica i ukupan broj stanja. Promotrimo sada energijsko
stanje Ek s degeneracijom energije gk : na koliko se načina može Nk = 0 ili 1, rasporediti
preko tih gk raspoloživih stanja? Sličnim razmišljanjem koje je dovelo do gornjeg izraza,
dolazi se i do
gk ! gk
 
W ( Nk , gk ) = = .
Nk ! ( gk − Nk ) ! Nk

I zaista, ako je Nk = 0, tada je


gk !
W (0, gk ) = = 1,
0 ! gk !

ako nema čestice, postoji samo jedna moguća (prazna) konfiguracija. Naprotiv, ako je
Nk = 1, tada je
gk !
W (1, gk ) = = gk .
1 ! ( gk − 1) !

jedna čestica može biti u bilo kojem od gk raspoloživih stanja, i zato je ukupan broj
konfiguracija jednak gk . Ovakvo razmatranje vrijedi za svako stanje k = 1, 2, · · · , g, pa je
zato ukupan broj konfiguracija jednak
g g
gk !
W = ∏ W ( Nk , gk ) = ∏ .
k =1 k =1
Nk ! ( gk − Nk ) !

Sada slijedi isti postupak kao i kod izvoda Maxwell-Boltzmannove i Bose-Einsteinove


raspodjele: traži se kada će gornji izraz (točnije, logaritam gornjeg izraza) biti maksi-
malan uz uvjete konstantnog broja čestica (4.57) i konstantne energije (4.58). Koristeći
226 Poglavlje 4. Raspodjele

Stirlingov izraz za faktorijele (4.59), dobiva se


 g   g 
f ( N1 , N2 , · · · , Ng ) = ln(W ) + α N − ∑ Nk + β E − ∑ Nk Ek
k =1 k =1
g h i
≈ ∑ gk ln( gk ) − gk − Nk ln( Nk ) + Nk − ( gk − Nk ) ln ( gk − Nk ) + gk − Nk
k =1
 g   g 
+α N− ∑ Nk + β E − ∑ Nk Ek .
k =1 k =1

Uvjet ekstrema f
∂f
=0
∂Nl
vodi na jednadžbu
1 1
− ln( Nk ) − Nk + ln( gk − Nk ) + ( gk − Nk ) − α − β Ek = 0
Nk ( gk − Nk )

g − Nk
 
ln k = α + β Ek
Nk
i konačno
gk
Nk = .
eα + β E k + 1
Sličnim postupkom kao kod Maxwell-Boltzmannove i Bose-Einsteinove raspodjele,
dobiva se
1 µ
β= α=− .
kB T kB T
Time je izraz za Fermi-Diracovu raspodjelu broja kvantnih objekata (čestica) Nk po
energijskim stanjima Ek , konačno jednak
gk
Nk = / (k B T )
. (4.65)
e (E k − µ ) +1

S AŽETAK

Maxwell-Boltzmannova statistika (klasična fizika) (4.62)


Nk = gk e−(Ek −µ)/(k B T ) .
Bose-Einstein (kvantna fizika - bozoni) (4.64)
g
Nk = (E −µ)/(kk T ) .
e k B −1
Fermi-Dirac (kvantna fizika - fermioni) (4.65)
g
Nk = (E −µ)/(kk T ) .
e k B +1
U odgovarajućoj granici Bose-Einsteinova i Fermi-Diracova raspodjela prijelaze u
Maxwell-Boltzmannovu.
... dovršiti...
4.2 Raspodjele kontinuiranih nasumičnih varijabla 227

4.2 Raspodjele kontinuiranih nasumičnih varijabla


Svakoj kontinuiranoj nasumičnoj varijabli X pridružuje se broj

dP( x ) = ρ( x ) dx ,

koji predstavlja vjerojatnost da varijabla X poprimi vrijednost iz intervala ( x, x + dx ).


Funkcija ρ( x ) za sve moguće vrijednosti x, zove se raspodjela gustoće vjerojatnosti
kontinuirane nasumične varijable.

4.2.1 Jednolika raspodjela


Posebno jednostavan oblik raspodjele jeste jednolika raspodjela, slika 4.14, koja ima istu
vrijednost u cijelom području vrijednosti kontinuirane nasumične varijable X, tj. sve
vrijednosti X su jednako vjerojatne. Neka X poprima vrijednosti u intervalu x ∈ ( a, b)
uz −∞ < a < b < +∞. Iz uvjeta normiranja vjerojatnosti,
Z b b
1= ρ dx = ρ x = ρ (b − a),

a a

lako se dobiva gustoća vjerojatnosti jednoliko raspodjeljene nasumične varijable



 0, x < a,



1


ρ (x) = , a ≤ x ≤ b, (4.66)

 b−a



0, x > b.

Slika 4.14: Gustoća vjerojatnosti. Slika 4.15: Kumulativna funkcija.

ρ( x ) F(x)

1
b− a 1

x x
a b a b
Izračunajmo kumulativnu funkciju raspodjele, (3.6)

0, x < a,





1 x x−a

 Z
Z x 
dη = , a ≤ x ≤ b, ,

F(x) = ρ(η ) dη = b−a a b−a
−∞ 


Z b
1


dη = 1,

x > b.


b−a a
kao što je to prikazano na slici 4.15. Izračunajmo momente

1 b k +1 − a k +1
Z b
D
k
E 1
x = xk dx = , k = 0, 1, 2, · · · .
a b−a k+1 b−a
228 Poglavlje 4. Raspodjele

Nulti moment je normiranje, a prva dva momenta i varijanca su

b+a b 2 + ab + a 2 (b − a) 2
hxi = , x2 = σ 2 = x 2 − hxi 2 = .




2 3 12
Slično se računaju i

1 b4 − a4 D E 1 b5 − a5
x3 = , x4 = , itd.

4 b−a 5 b−a

U slučaju simetričnih granica, a = −| a| i b = +| a|, raspodjela je simetrična, i zato je


koeficijent asimetrije nula u što je lako i uvjeriti se izravnim računom

x − 3 x 2 hxi + 2 hxi 3

3
M3


α3 = 3 = = 0.
σ σ3
Koeficijent spljoštenosti je

x − 4 x 3 hxi + 6 x 2 hxi 2 − 3 hxi 4



4
M4



α4 = 4 =
σ σ4
= dovriti.

Navesti primjere

Zadatak 4.21 Za jednoliku raspodjelu izračunajte mod i sva tri kvartila. 

Rješenje:

4.2.2 Gaußova ili normalna raspodjela


IZVOD IZ BINOMNE RASPODJELE :
Krenimo od binomne raspodjele iz odjeljka 4.1.3, pri čemu ćemo tamošnju diskretnu
variablu sada zvati x umjesto n. Kod binomne raspodjele, (4.13), je pokazano da je
vrijednost

x m.p. ≈ N p,

najvjerojatnija21 vrijednost x u odnosu na sve ostale njegove vrijednosti. Sve te ostale


vrijednosti x-a mogu se računati u odnosu na N p. Uvedimo veličinu h kao mjeru
otklona x od njegove najvjerojatnije vrijednosti.

x = N p + h, h Q 0.

Tu je h neki pozitivan ili negativan broj. Odstupanje h ne mora biti cijeli broj i ne mora
nužno biti manjeg iznosa od N p. Pitanje koje postavljamo je:
KOLIKA JE VJEROJATNOST DA SE POJAVI ODSTUPANJE h
od najvjerojatnije vrijednosti N p? Odgovor ćemo potražiti u dva koraka: najprije ćemo
naći vjerojatnost za odstupanje h = 0, a zatim za odstupanje h 6= 0.

(h=0)
21 Za binomnu raspodjelu je to ujedno i prosječna vrijednost.
4.2 Raspodjele kontinuiranih nasumičnih varijabla 229

Ako je h = 0, tada x ima upravo svoju najvjerojatniju vrijednost x m.p. = N p. Prema (4.11),
vjerojatnost za ovaj x je
N N
   
x N −x
P( x = x m.p. ) = p q p N p q N−N p

=
x
x= N p N p
N! N!
= p N p q Nq = p N p q Nq .
( N p)! ( N − N p)! ( N p)! ( Nq)!
Budući da se N smatra velikim brojem, za izračunavanje faktorijela u kojima se pojav-
ljuje N, može se koristiti S TIRLINGOVA22 formula
 M 
√ M 1 1
M! = 2πM 1+ 1 + 3 (4.67)
e (2 )(6M) 1 (2 )(6M) 2
139 571

− 3 − + ··· .
(2 )(2 · 3 · 5)(6M) 3 (2 6 )(2 · 3 · 5)(6M) 4
prema kojoj je i

N! ≈ e− N N N 2Nπ,
( N p ) ! ≈ e− N p ( N p ) Np
2N pπ,
p

− Nq Nq
( Nq)! ≈ e ( Nq) 2Nqπ.
p

Uvrštavanjem ovih vrijednosti u izraz za P( N p), dobiva se



e− N N N 2Nπ 1
P( x = N p) = − N p N p Nq Nq
p N p q Nq = p .
e ( N p) 2N pπ e − ( Nq) 2Nqπ 2π N pq
p p

U gornjem se izrazu prepoznaje standardna devijacija iz binomne raspodjele, (4.20),


1
σ= N pq P( N p) = √ .
p

σ 2π
To je vjerojatnost da će se dogad̄aj, čija je vjerojatnost p, u N pokusa ostvariti x = N p
puta (tj. da se neće ostvariti N − x = N · q puta). Iz gornjeg izraza vidimo da je ova
vjerojatnost jako mala, ako je N jako velik (što je pretpostavljeno od početka). Za
parametre sa slike 4.3 to znači
1 1
p = 0.1 =√ = 0.297354,
2π N pq 2 π 20 · 0.1 0.9
p

1 1
p = 0.5 =√ = 0.178412,
2π N pq 2 π 20 · 0.5 0.5
p

1 1
p = 0.9 =√ = 0.297354,
2π N pq 2 π 20 · 0.9 0.1
p

što se dosta jasno i vidi na slici.

( h 6= 0 )
Provedimo sada sličan postupak uz h 6= 0.
N N! p N p+h q Nq−h
 
P( x = N p + h) = p N p+h q N − N p−h =
Np + h ( N p + h)! ( N − N p − h)!
N!
= p N p+h q Nq−h .
( N p + h)! ( Nq − h)!
22 James Stirling, Methodus differentialis, 1730.
230 Poglavlje 4. Raspodjele

Izraze li se faktorijeli pomoću Stirlingove formule (4.67),

q
( N p + h ) ! ≈ e− N p − h ( N p + h ) N p + h 2( N p + h)π,
q
( Nq − h)! ≈ e− Nq+h ( Nq − h) Nq−h 2( Nq − h)π.

dobiva se

e− N N N 2Nπ p N p+h q Nq−h
P( N p + h) =
e− N p−h ( N p + h) N p+h 2( N p + h)π e− Nq+h ( Nq − h) Nq−h 2( Nq − h)π
p p


e− N + N p+h+ Nq−h N N N p N p+h q Nq−h
=p q   N p+h p q   Nq−h
N p 1 + Nhp ( N p) N p+h 1 + Nhp 2πNq 1 − Nqh h
( Nq) Nq−h 1 − Nq

N N − N p−h− Nq+h p N p+h− N p−h q Nq−h− Nq+h


=  N p+h p  Nq−h
√ q  q 
p 1 + Nhp 1 + Nhp 2πNq 1 − Nq h h
1 − Nq

1 1 1
=p
2π N pq   N p+h+ 12   Nq−h+ 12 ≡ p2 π N p q A,
h h
1+ Np 1− Nq

gdje je, radi kratkoće, uvedena oznaka

 N p+h+ 12   Nq−h+ 12
h h

−1
A = 1+ 1−
Np Nq

Izračunajmo A kada je N vrlo velik

1 h 1 h
       
− ln(A) = Np + h + ln 1 + + Nq − h + ln 1 − .
2 Np 2 Nq

Za N koji je velik u odnosu na h, logaritmi na desnoj strani se mogu razviti u Taylorov


red:

α2 α3 α4
ln(1 + α) = α − + − + ··· , −1 < α ≤ 1,
2 3 4
α2 α3 α4
 
ln(1 − α) = − α + + + + ··· , −1 ≤ α < 1, (4.68)
2 3 4

čime se, za α ≡ h/( N p), dobiva

h h h2 h3
 
ln 1 + = − + + ··· ,
Np N p 2N 2 p 2 3N 3 p 3

h h h2 h3
 
ln 1 − =− − − − ··· .
Nq Nq 2N 2 q 2 3N 3 q 3
4.2 Raspodjele kontinuiranih nasumičnih varijabla 231

Ovi razvoji dalje daju za ln(A)

1 h h2 h3
  
− ln(A) = N p + h + − + + ···
2 N p 2N 2 p 2 3N 3 p 3
1 h h2 h3
  
− Nq − h + + + + ···
2 Nq 2N 2 q 2 3N 3 q 3
h2 h3 h2 h3 h4 h h2 h3
=h− + 2 2
+ ··· + − 2 2
+ 3 3
+ ··· + − 2 2
+ + ···
2N p 3N p N p 2N p 3N p 2N p 4N p 6N 3 p 3
h2 h3 h2 h3 h4 h h2 h3
−h−
− − · · · + + + · · · − − − + ···
2Nq 3N 2 q 2 Nq 2N 2 q 2 3N 3 q 3 2Nq 4N 2 q 2 6N 3 q 3
h2 1
 2
h q−p h
= + +O . (4.69)
2N pq 2N pq N2

S O h 2 /N 2 su označeni zanemareni članovi reda h 2 /N 2 , h 3 /N 3 , . . . koji su, za veliki




N, puno manji od članova reda 1/N koji su zadržani. Samo odstupanje h nije mala
veličina23 nego je neki broj ne veći od N.

h = e · N, 0 < e < 1.

Uz gornju pretpostavku, prvi član iz (4.69) je veći od svih ostalih24 i zato se, za veliki N,
mogu zanemariti

h2 2 / (2N pq )
ln(A) = − + ··· ⇒ A = e− h + ··· ,
2N pq
iz čega slijedi (približno)
1 2 2
P( N p + h) ≈ p e−h /(2N pq) = P( N p) e−h /(2N pq) . (4.70)
2πN pq

Iz gornjeg izraza se vidi da sve vjerojatnosti s h 6= 0 EKSPONENCIJALNO OPADAJU u


odnosu na h = 0 vjerojatnost. Prema svim pretpostavkama koje su korištene u izvodu,
ova je tvrdnja utoliko točnija ukoliko je N veći. Uobičajeno je gornje rezultate izraziti
funkcijom
Slika 4.16: Gaußova (normalna) raspodjela
dana izrazom (4.71).

1 2
e−t /2 .
ρG (t)

ρ G (t) = √ (4.71)
0.5 2π
-H +H

0
-4 -2 0 2 4
t

23 Sjetimo se da se h definira sa x = N p + h. Vjerojatnost p je veličina reda jedinice, pa je N p veličina reda

N. Da bi zbrajanje N p sa h imalo smisla mora i h po redu veličine biti sličan redu veličine N.
24 Npr. za e = 1, prvi član je reda N, dok je drugi član reda jedinice, a zanemareni ćlanovi trnu kao 1/N.
232 Poglavlje 4. Raspodjele

Novouvedena funkcija ρ G (t) se zove gustoća vjerojatnosti Gaußove ili normalne raspo-
djele (slika 4.16) i predstavlja jednu od najvažnijih funkcija raspodjele u cijeloj teoriji
vjerojatnosti. Na slici 4.17 je prikazana usporedba binomne i Gaußove raspodjele za vri-

Slika 4.17: Usporedba binomne (N = 100, p = 0.35) i Gaußove (h x i = 0.35, σ = 4.769696)


raspodjele.

0.09

0.08 Binomna raspodjela


Gaussova raspodjela
0.07

0.06

0.05

0.04

0.03

0.02

0.01

0
20 30 40 50
n, x

jednosti N = 100 i p = 0.35 u binomnoj raspodjeli i h x i = 0.35 i σ = 4.769696 u Gaußovoj


raspodjeli [vidjeti (4.79)]. Pomoću ρ G (t) je
1  p 
P( N p + h) = p ρ G h/ N pq . (4.72)
N pq
Pitanje koje se najčešće postavlja u praksi i nije ono koje smo mi postavili (koja je
vjerojatnost odstupanja h u odnosu na N p), nego
KOLIKA JE VJEROJATNOST DA SE DANO ODSTUPANJE
NALAZI UNUTAR ILI IZVAN , ODREÐENIH GRANICA ?
Konkretno, kolika je vjerojatnost da odstupanje h bude, po iznosu, manje ili jednako
nekoj zadanoj vrijednosti H
|h| ≤ H ⇒ N p − H ≤ x ≤ N p + H.
Vjerojatnost P(|h| ≤ H ) je jednaka vjerojatnosti da je25 x = N p − H ili vjerojatnosti da
je x = N p − H + 1 ili · · · ili vjerojatnosti da je x = N p + H, pa je prema pravilu za
zbrajanje vjerojatnosti (2.5), tražena vjerojatnost dana ZBROJEM vjerojatnosti svih x-eva
iz intervala ( N p − H, N p + H )
N p+ H
P(|h| ≤ H ) = ∑ P( x )
x = N p− H

= P ( N p − H ) + P ( N p − H + 1) + P ( N p − H + 2) + · · · P ( N p − 1)
+ P( N p)
+ P ( N p + 1) + P ( N p + 2) + · · · + P ( N p + H − 1) + P ( N p + H ).
25 Broj x je cijeli broj, dok N p − H ne mora nužno biti cijeli broj, tako da izraz x = N p − H treba čitati

kao " cijeli broj najbliži broju " N p − H. Ova se primjedba odnosi i na ostatak teksta.
4.2 Raspodjele kontinuiranih nasumičnih varijabla 233

Spoje li se ordinate svih navedenih P( N p − H + n), dobiva se poligon čiji je jedan dio

Slika 4.18: Zbroj vjerojatnosti koje daju P(|h| ≤ H ).

P(Np + h)

P(n + 1)

P(n)

n n+1 -1
0 1 2 3 h

prikazan na slici 4.18. Da bismo izračunali gornji zbroj, zapitajmo se čemu je jednaka
ploština, S, površine ispod tog poligona? Sa slike 4.18 se vidi da je ta ploština jednaka
zbroju ploština trapeza prikazanih na toj istoj slici. Ploština površine n-tog trapeza, Sn ,
jednaka je zbroju ploštine pravokutnika i ploštine trokuta
1 1
Sn = P(n)[(n + 1) − n] + [(n + 1) − n][ P(n + 1) − P(n)] = [ P(n) + P(n + 1)],
2 2
pa je ukupna ploština površine ispod poligona jednaka zbroju ploština svih trapeza
N p+ H
P ( N p − H ) + P ( N p − H + 1) P ( N p − H + 1) + P ( N p − H + 2)
S= ∑ Sn =
2
+
2
+ ···
n= N p− H
P ( N p + H − 1) + P ( N p + H )
··· +
2
P( N p − H ) P( N p + H )
= + P ( N p − H + 1) + P ( N p − H + 2) + · · · + P ( N p + H − 1) +
2 2
Pomoću gornjih izraza povezujemo ploštinu S i traženi zbroj vjerojatnosti za ukupnu
vjerojatnost P(|h| ≤ H )
P( N p − H ) P( N p + H )
P(|h| ≤ H ) = P( N p − H ) + P( N p − H + 1) + · · · + P( N p + H ) = S + + .
2 2
Za sve veće i veće vrijednosti N, razmaci susjednih točaka na apscisi slike 4.18 postaju
sve manji i poligon postaje glatka funkcija, trapezi postaju sve uži i zbroj, S, njihovih
ploština postaje jednak integralu funkcije (4.72). Iz toga slijedi
2 2
1 e−(− H ) /(2N pq) 1 e−(+ H ) /(2N pq)
Z +H
1 η
− 2N
2
P(|h| ≤ H ) = p e dη + pq +
2πN pq 2 2πN pq 2 2πN pq
p p
−H
Z +H 2
2 η2 e− H /(2N pq)
 
=p exp − dη + p . (4.73)
2πN pq 0 2N pq 2πN pq
234 Poglavlje 4. Raspodjele

Do gornjeg rezultata je prvi došao Pierre-Simon Laplace godine 1812.


Slika 4.19: P.-S. Laplace
Za veliki N, drugi član desne strane (4.73) je
puno manji od prvoga i može se zanemariti. Po-
moću Gaußove raspodjele ρ G iz (4.71), definira
se integral Φ( x )
Z x
Φ( x ) = ρ G (η ) dη
0
Z x
1 2 /2
=√ e− η dη . (4.74)
2π 0

Funkcija Φ se naziva Gaußov integral. Za ko-


načne vrijednosti x, taj integral nije analitički
rješiv, a njegove numeričke vrijednosti se
nalaze u TABLICAMA26 4.2 - 4.4. Pomoću Φ, vjerojatnost P(|h| ≤ H ) je
 
P(|h| ≤ H ) = 2Φ H/ N pq . (4.75)
p

Gornji izraz, pomoću funkcije Φ, daje vjerojatnost da odstupanje varijable x od najvje-


rojatnije vrijednosti, nije iznosa većeg od H. U granici H → ∞, gornji izrazi vode na

Z ∞
1 2 /2
P(|h| ≤ ∞ i = 2 √ e− η dη = 1,
2π 0

što je u skladu s normiranjem vjerojatnosti.

Gaußov integral Φ( x ) i integral erf( x ) (error function integral) definiran kao


Z x
2 2
erf( x ) = √ e−t dt ,
π 0

su povezani jednostavnom relacijom



erf( x ) = 2 Φ( x 2).

Zapitajmo se nadalje,
U KOJIM SE GRANICAMA (− H, + H ) SMIJE NALAZITI ODSTUPANJE h,
PA DA VJEROJATNOST ODSTUPANJA OD NAJVJEROJATNIJE VRIJEDNOSTI BUDE 21 ?
Ili, pomoću simbola
1
P(|h| ≤ H ) = −→ H =?
2
Pomoću (4.75), gornji uvjet pišemo kao
!
H
Φ p = 0.25 .
N pq

Prema tablici 4.2, očitava se

Φ(0.67) = 0.24857, Φ(0.68) = 0.25175,


26 Vidjeti npr. u V RANI Ć, Vjerojatnost i statistika na str. 349.
4.2 Raspodjele kontinuiranih nasumičnih varijabla 235

što znači da se vrijednost Φ = 0.25 na-


lazi negdje izmed̄u vrijednosti argume-
nata 0.67 i 0.68. Linearnom interpola-
cijom (kao na slici) izmed̄u ove dvije
vrijednosti

Φ(t) = a 0 + a 1 t = 0.03551 + 0.318 t,


dobiva se da je Φ = 0.25, kada je
H
0.25 = 0.03551 + 0.318 t ⇒ t = 0.67449685 . . . = p ,
N pq

odakle je traženi h jednak

H = 0.6745 N pq = 0.6745 σ. (4.76)


p

Prisjetimo li se pojma standardne devijacije, (3.34), moguće je postaviti i slijedeće pitanje


KOLIKA JE VJEROJATNOST DA ODSTUPANJE BUDE U GRANICAMA (− σ, + σ ) ?
Za H iz (4.75) uvrštavamo H = σ i dobivamo (prema tablici 4.2)
!
σ σ
P(|h| ≤ σ) = 2Φ p = 2Φ = 2Φ(1) = 0.68268 ≈ 68.3%. (4.77)
N pq σ

Slično se računa i vjerojatnost da je odstupanje u granicama (− H, + H ) = (−2 σ, +2 σ )


(prema tablici 4.3)


 
P(|h| ≤ 2 σ) = 2Φ = 2Φ(2) = 0.9545 ≈ 95.5%.
σ
Vjerojatnost odstupanja unutar granica ±2 σ je vrlo blizu jedinici, tj. skoro sva će se
odstupanja nalaziti unutar ovih granica. Ukoliko bi se promatrala odstupanja za ± 3σ,
dobila bi se (tablica 4.4) vjerojatnost jednaka

P(|h| ≤ 3 σ) = 2 · 0.49865 = 0.9973 ≈ 99.73%. (4.78)

Gornje tri vjerojatnosti su prikazane na slici 4.20.

Prisjetimo se da je Gaußova raspodjela uvedena (str. 231), kao granična vrijednost


binomne raspodjele (dakle, raspodjele za diskretnu nasumičnu varijablu x), u granici
N → ∞, relacija (4.70)

N 1 ( x − N p) 2
   
x N −x
lim p q =p exp − .
N →∞ x 2πN pq 2N pq

Prema (4.24) i (4.27) za binomnu raspodjelu je

h x i = N p, σ 2 = N pq,

to se gornji limes može napisati i kao

N 1 ( x − h x i) 2
   
x N −x
lim p q = √ exp − .
N →∞ x σ 2π 2 σ2
236 Poglavlje 4. Raspodjele

Slika 4.20: Vjerojatnost da se odstupanje nalazi unutar prikazanih granica.

Shvati li se sada X kao kontinuirana varijabla (a ne diskretna, kao u binomnoj raspodjeli)


s vrijednostima x, koje se mijenjaju od −∞ do +∞, tada je

( x − h x i) 2
1 −
dP ( x ) = √ e 2 σ2 dx
σ 2π

vjerojatnost da nasumična varijabla X poprimi vrijednost iz intervala ( x, x + dx ). Gus-


toća vjerojatnosti

( x − h x i) 2
dP( x ) 1 −
ρ( x ) = = √ e 2 σ2 (4.79)
dx σ 2π

se zove Gaußova ili normalna raspodjela gustoće vjerojatnosti (slika 4.21). Ova je
raspodjela izvedena i iz načela maksimuma entropije u odjeljku o entropiji, relacija
(5.46). Kao što se vidi iz (4.79), ta je raspodjela u cjelosti odred̄ena zadavanjam vrijednosti
h x i i σ. Ona je jedna od raspodjela koje se najčešće pojavlju u primjenama27 . Veličina σ
opisuje širinu raspodjele

ρ( x = h x i) √
= e ≈ 1.64872 · · · .
ρ( x = h x i ± σ)

Maksimum gustoće raspdjele se postiže za

dρ( x )

=0 ⇒ xmax = h x i .
dx x= xmax

Lako je uvjeriti se u slijedeće relacije

27 Otkrili su ju Moivre, Laplace i Gauß, neovisno jedan o drugome, na prijelazu iz XV I I I − XIX stoljeće.
4.2 Raspodjele kontinuiranih nasumičnih varijabla 237

Slika 4.21: Gaußova raspodjela ρ G ( x ) za h x i = 1 i nekoliko vrijednosti σ.

0.9 σ = 0.5
σ = 1.0
0.8 σ = 1.5
σ = 2.0
0.7

0.6
ρG (x)

0.5

0.4

0.3

0.2

0.1

0
-3 -2 -1 0 1 2 3 4 5
x

Z +∞
1= ρ( x ) dx ,
−∞
Z +∞
hxi = x ρ( x ) dx = h x i ,
−∞
Z +∞
x2 = x 2 ρ( x ) dx = h x i 2 + σ 2 , (4.80)


−∞
Z +∞
x3 = x 3 ρ( x ) dx = h x i 3 + 3 h x i σ 2 ,


−∞
Z +∞
x 4 ρ( x ) dx = h x i 4 + 6 h x i 2 σ 2 + 3σ 4 ,
D E
x4 =
−∞
Z +∞
x 5
x 5 ρ( x ) dx = h x i 5 + 10 h x i 3 σ 2 + 15 h x i σ 4 ,


=
−∞
Z +∞
x6 = x 6 ρ( x ) dx = h x i 6 + 15 h x i 4 σ 2 + 45 h x i 2 σ 4 + 15σ 6 ,


−∞
Z +∞
x7 = x 7 ρ( x ) dx = h x i 7 + 21 h x i 5 σ 2 + 105 h x i 3 σ 4 + 105 h x i σ 6 itd.


−∞
Kao koeficijenti gornjih momenata, pojavljuju se B ESSELOVI brojevi, b(n, k ), općenito
dani izrazom
(2n − k − 1) !
b(n, k ) = (−1) n−k n−k , 1 ≤ k ≤ n.
2 ( k − 1) ! ( n − k ) !
Tako je npr. b(7, 3) = 105.

Zbog parnosti gustoće vjerojatnosti u odnosu na točku x = h x i,


ρ ( x = h x i + h ) = ρ ( x = h x i − h ),
svi su NEPARNI centralni momenti jednaki nuli:
M1 = M3 = M5 = · · · = 0,
a prvi netrivijalan paran
Z +∞  2
M2 = x − h x i ρ( x ) dx = σ 2 ,
−∞
238 Poglavlje 4. Raspodjele

i ostali parni
Z +∞ ( x − h x i) 2
1   2k −
M2k = √ x − hxi e 2 σ2 dx (4.81)
σ 2π −∞

su povezani slijedećom rekurzijom. Uvedimo novu varijablu

σ 2k
Z +∞
x − hxi 2 /2
t= ⇒ M2k = √ t 2k e−t dt .
σ 2π −∞

Parcijalnom integracijom

d  2k−1 −t 2 /2  2 2
t e = (2k − 1)t 2k−2 e−t /2 + t 2k−1 (−t) e−t /2
dt
2 d  2k−1 −t 2 /2  2
⇒ t 2k e−t /2 = − t e + (2k − 1)t 2k−2 e−t /2 ,
dt
dolazi se do
σ 2k σ 2k
Z +∞ Z +∞
−t 2 /2 2 /2
 
2k−1
M2k = − √ d t e + (2k − 1) √ t 2k−2 e−t dt
2π −∞ 2π −∞

σ 2k h 2k−1 −t 2 /2 i+∞ σ 2k−2 +∞ 2k−2 −t 2 /2


Z
2
= −√ t e +(2k − 1)σ · √ t e dt .
2π | {z −∞
} 2π −∞
=0
| {z }
= M2(k−1)

Prvi član desne strane je jednak nuli, a drugi je srazmjeran s M2k−2 , što daje rekurziju

M2k = (2k − 1)σ 2 M2(k−1)


= (2k − 1) (2k − 3) σ 4 M2(k−2)
(2k)! 2k
= (2k − 1) (2k − 3) (2k − 5) σ 6 M2(k−3) = . . . = σ .
2 k k!
s očitom početnom vrijednošću (normiranjem) M0 = 1

k=0 M0 = 1,
k=1 M2 = σ 2 · M0 = σ 2 ,
k=2 M4 = 3σ 2 · M2 = 3σ 4 ,

itd. Uvrštavanjem (4.80) u (3.40) za koeficijent asimetrije se dobije

α 3 = 0,

tj. raspodjela nije asimetrična, nego je uvijek simetrična. Za koeficijent spljoštenosti se


dobije

α 4 = 3,

Budući da se Gaußova raspodjela naziva i normalna, to se njoj pridružena spljoštenost


naziva NORMALNA SPLJOŠTENOST.

VJEROJATNOST
4.2 Raspodjele kontinuiranih nasumičnih varijabla 239

Slika 4.22: Vjerojatnost se geometrijski prikazuje kao površina ispod krivulje gustoće
vjerojatnosti.

ρ (x )
4
 
1.7 − hX i 1.8 − hX i
Pr <t<
σ σ
hX i = 1.7, σ 2 = 0.1 2
2

0
1.2 1.4 1.6 1.8 2 2.2 x
x − hX i
t=
−6 −4 −2 0 2 4 6 σ

da nasumična varijabla poprimi vrijednost iz odred̄enog intervala, odgovara površini


ispod krivulje gustoće vjerojatnosti ρ tog istog intervala kao što je to prikazano na slici
4.22.

K UMULATIVNA FUNKCIJA RASPODJELE


Prema definiciji (3.6) je

Z x
Z x ( x − h x i) 2
1 −
F(x) = ρ( x ) dx = √ e 2 σ2 dx
−∞ σ 2π −∞
Uvod̄enjem nove varijable
x − hxi
t= √ ,
σ 2
dolazi se do
1 0 Z t( x )
1 x − hxi
Z    
−t 2 −t 2
F(x) = √ e dt + e dt = 1 + erf √
π −∞ 0 2 σ 2
1 x − hxi
 
= 1 − erfc √ . (4.82)
2 σ 2
gdje je erfc(η ) = 1 − erf(η ). Tako je konačno dobivena funkcija raspodjele (slika 4.23).

ADICIJSKI TEOREM ZA G AUSSOVE RASPODJELE


Neka su zadane dvije kontinuirane nasumične i med̄usobno statistički NEOVISNE varija-
ble X1 i X2 , obje opisane Gaußovim raspodjelama. Zbog njihove med̄usobne neovisnosti,
raspodjela vjerojatnosti za X1 i X2 je dana umnoškom raspodjela svake pojedine varija-
ble
( x1 − h X1 i) 2 ( x2 − h X2 i) 2
− −
1 2 σ12 1 2 σ22
ρ ( x1 , x2 ) = ρ1 ( x1 ) ρ2 ( x2 ) = √ e √ e .
σ1 2π σ2 2π
240 Poglavlje 4. Raspodjele

Slika 4.23: Kumulativna funkcija raspodjele Gaußove nasumične varijable za h x i = 1.

Uvede li se nova nasumična varijabla Y izrazom


Y = X1 + X2 , (4.83)
tada treba pokazati da je i Y raspodjeljena Gaußovom raspodjelom s gustoćom vjerojat-
nosti
(y − hY i) 2

1 2 σy2
φ(y) = √ e , (4.84)
σy 2π
pri čemu prosječna vrijednost Y jednaka zbroju prosječnih vrijednosti X1 i X2 , a varijanca
Y je jednaka zbroju varijanca X1 i X2
h Y i = h X1 i + h X2 i , σy2 = σ12 + σ22 . (4.85)
Evo i dokaza.
Postupa se kao u odjeljku 3.6.4 i izvodu relacije (3.59). S varijabla x1 , x2 opisanih gusto-
ćom vjerojatnosti ρ( x1 , x2 ), prelazi se na novu varijablu y, opisanu gustoćom vjerojatnosti
φ(y)
Z +∞
∂g2 ( x1 , y)

φ(y) = dx1 ρ[ x1 , g2 ( x1 , y)] , (4.86)
−∞ ∂y

gdje je, prema (4.83),


x 2 = g2 ( x 1 , y ) = y − x 1
pa je i
Z +∞ ( x1 − h X1 i) 2 (y − x1 − h X2 i) 2
Z +∞ − −
1 2σ12 2σ22
φ(y) = dx1 ρ1 ( x1 ) ρ2 (y − x1 ) = e e dx1 .
−∞ σ1 σ2 2π
−∞
4.2 Raspodjele kontinuiranih nasumičnih varijabla 241

Gornji se izraz dalje sred̄uje svod̄enjem na potpuni kvadrat, (A.45)

h X1 i 2 (y − h X2 i) 2 +∞ σ12 + σ22 2 h X1 i σ22 + (y − h X2 i)σ12


x + x
Z
− − −
1 2σ 2 2σ22 2σ 2 σ2 σ 2 σ2
φ(y) = e 1 e 1 2 1 2 dx
σ1 σ2 2π
−∞
2
h X1 i (y − h X2 i) 2 [h X1 i σ22 + (y − h X2 i)σ12 ] 2
− − +
1 2 2σ22 2σ12 σ22 (σ12 + σ22 )
= e 2σ1
σ1 σ2 2π
2
σ12 + σ22 h X1 i σ22 + (y − h X2 i)σ12

+∞ x−
Z

2 2 σ12 + σ22
· e 2σ1 σ2 dx
| −∞ √
{z }
2πσ1 σ2
= (4.94) = q
σ12 + σ22
(y − h X1 i − h X2 i) 2

1 2(σ12 + σ22 )
=q e ,
2π (σ12 + σ22 )

(usporedite gornji izraz sa (3.60)). Gornji je izraz oblika Gaußove raspodjele s već
navedenim vrijednostima, (4.85), za hY i i σy .

VIŠEDIMENZIJSKA G AUSSOVA RASPODJELA


Očito je da se gornji postupak može poopćiti na proizvoljan broj neovisnih varijabala
X1 , · · · , XD raspodjeljenih po Gaußovoj raspodjeli, koje primaju vrijednosti iz intervala
h −∞, +∞ i. Zbog neovisnosti je

ρ ( x1 , · · · , xD ) = ρ1 ( x1 ) · · · ρ D ( xD ),

pri čemu je

Y = X1 + · · · + X D

takod̄er raspodjeljena po Gaußovoj raspodjeli (4.84), uz

h Y i = h X1 i + · · · + h X D i , σy2 = σ12 + · · · + σD2 . (4.87)

U nešto općenitijoj notaciji, gornji se izrazi mogu zapisati i kao Gaußova raspodjela D
komponenata nasumičnog vektora
s
Det (A) 1
 
~ = ( X1 , X2 , · · · , X D ) ,
X ρ G (~x ) = D
exp − (~x − ~x 0 ) A (~x − ~x 0 ) .
(2π ) 2
(4.88)

U gornjim izrazima su korištene oznake za srednju vrijednost


D E
~
~x 0 ≡ X

dovršiti
242 Poglavlje 4. Raspodjele

Navesti primjere

VEZA S P OISSONOVOM RASPODJELOM :


Pokažimo i kako se Gaußova raspodjela može dobiti kao granična vrijednost Poissonove
raspodjele (4.48)
λ n −λ
P(n, λ) = e , n = 0, 1, 2, · · ·
n!
kada su n i λ vrlo veliki. Neka je

n = λ (1 + δ ), λ  1, dok je δ  1.

Budući da je hni = λ, gornji uvjet znači da će nas zanimati vrijednosti n iz neposredne
okoline hni. Za velike vrijednosti n, faktorijeli s mogu računati Stirlingovom formulom
(4.67)
√  n n
n ! = 2πn + ··· ,
e
Izravnim uvrštavanjem gornjeg izraza u izraz za P(n), dobiva se

λ n en − λ eλδ (1 + δ)−λ(1+δ)−1/2
P(n, λ) = √ = √ .
nn 2πn 2πλ
Promotrimo detaljnije logaritam dijela izraza koji se pojavljuje u brojniku

[−λ(1 + δ) − 1/2] ln(1 + δ)


Taylorovim razvojem logaritma po malom δ

δ2 δ3 δ4
ln(1 + δ) = δ − + − + ··· , −1 < δ ≤ 1,
2 3 4
dobiva se
δ2 δ3 δ4 1 1 1 2
     
[−λ(1 + δ) − 1/2] δ− + − + ··· =− λ+ δ+ − λ+ δ + ··· .
2 3 4 2 2 4
U granici λ  1 je
1 1 1 2 1
   
− λ+ δ+ − λ+ δ ≈ −λδ − λδ 2 .
2 2 4 2
Za velike vrijednosti n je razlika izmed̄u n i n + 1 vrlo malena u odnosu na n, pa n
možemo smatrati približno kontinuiranom varijablom i uvesti oznaku x ≡ n = λ(1 + δ)
Vratimo li se izrazu za vjerojatnost
2 2
e−λδ /2 e−(x−λ) /(2λ)
P(n, λ) → P( x ) ≈ √ = √ .
2πλ 2πλ
U skladu sa središnjim graničnim teoremom, odjeljak ..., u granici velikog n (velikog
broja dogad̄aja), Poissonova raspodjela prelazi u Gaußovu, sa srednjom vrijednošću
h x i = λ i varijancom takod̄er jednakom σ 2 = λ.
4.2 Raspodjele kontinuiranih nasumičnih varijabla 243

 Primjer 4.12 PRILAGODBA EMPIRIJSKIH PODATAKA


Zadana je iskustvena raspodjela:

x t( x )

1375 - 1400 1
1400 - 1425 11
1425 - 1450 25
1450 - 1475 36
1475 - 1500 30
1500 - 1525 14
1525 - 1550 3
Iz gornjih podataka treba izračunati h x i i σ, a zatim, uz pretpostavku da se radi o Gaußo-
voj raspodjeli, treba izračunati teorijske težine. Pri tome treba postupiti tako da se svaki
interval uzme kao jedan razred: npr. 1375 do 1400 je razred 1387.5 sa širinom dx = 25 itd.

x t( x )

1387.5 1
1412.5 11
1437.5 25
1462.5 36
1487.5 30
1512.5 14
1537.5 3

D E tx
xk = ∑ xk ,
x 120

2
h x i = 1466.03 , x = 2.15021 · 10 6 ,
σ 2 = x 2 − h x i 2 = 984.899 , ⇒ σ = 31.3831 .

dP G = ρ G dx ,

gdje je dx = 25 širina u varijabli x unutar koje je ρ G ≈ const.

tG 1 1 ( x − h x i) 2
 
dP G = ≈ ρ G dx ⇒ t G ( x ) = N dx √ exp −
N σ 2π 2 σ2

x t( x ) t G (x)

1387.5 1 1.418 → 1
1412.5 11 8.904 → 9
1437.5 25 25.228 → 25
1462.5 36 37.900 → 38
1487.5 30 30.179 → 30
1512.5 14 12.742 → 13
1537.5 3 2.852 → 3
244 Poglavlje 4. Raspodjele

... dovršiti (nacrtati)... 

 Primjer 4.13 F OURIEROVA PREOBRAZBA

Izračunajmo Fourierovu preobrazbu Gaußove raspodjele


1 ( x − h x i) 2
 
ρ G (x) = √ exp − ,
σ 2π 2 σx2
gdje je σx standardna devijacija nasumične varijable x. Fourierova preobrazba28 je
definirana kao
p2
Z +∞
1
 
−ı p x/h̄
ρ G ( p) = √ ρ G (x) e dx = ... = const. exp − ,
2π −∞ 2 (h̄/σx ) 2
iz čega se očitava da je nasumična varijabla p takod̄er raspored̄ena po Gaußovoj raspo-
djeli sa standardnom devijacijom

σp = ⇒ σp · σx = h̄,
σx
što je u skladu s Heisenbergovom relacijom neodred̄enosti. 

Zadatak 4.22 Kovanica se baca deset puta. Pitanje je kolika je vjerojatnost da se


glava pojavi 5 + h puta? 

Rješenje:
U skladu s (4.13), a uz N = 10 i p = q = 0.5, najvjerojatnije je da će se glava pojaviti
N p = 10 · 0.5 = 5
puta. Zato se za vjerojatnost pojave 5 + h glava može koristiti Gaußov izraz (4.70)
h2 h2

e 2N pq e− 2 10·0.5·0.5 1 h2
PGau ( N p + h) ≈ p =√ n= √ e− 5 ,
2πN pq 2 π 10 · 0.5 · 0.5 5π
ali isto tako se može koristiti i izraz preko binomne raspodjele (4.11)
N N
   
Pbinom ( x ) = p qx N −x
⇒ Pbinom (5 + h) = p5+h q10−5−h .
x 5+h
Za h = −5, −4, −3, −2, −1, 0, 1, 2, 3, 4, 5 dobivaju se slijedeće vrijednosti

h PGau Pbinom ∆

−5 0. 0.
−4 0. 0.
−3 0. 0.
−2 0. 0.
−1 0. 0.
0 0.2523 0.2461 0.0248796
1 0.2066 0.2051 0.00728686
2 0.1134 0.1172 0.0329575
3 0.0417 0.0439 0.0514019
4 0.0103 0.0098 0.0497512
5 0.0017 0.0010 0.518519
28 Vidjeti npr. odjeljak o integralnim preobrazbama u G LUMAC, Matematičke metode fizike.
4.2 Raspodjele kontinuiranih nasumičnih varijabla 245

gdje je s ∆ označena relativna razlika


| PGauss − Pbinom |
∆= .
( Gauss + Pbinom )/2
P
dovršiti (nacrtati gornju tablicu)
Za još veći N, npr. N = 100 i x = 50 + h, slaganje izmed̄u binomne i Gaussove raspodjele je još
bolje

h PGau Pbinom ∆

0 0.0798 0.0796 0.00250941


5 0.0484 0.0485 0.00206398
10 0.01082 0.01084 0.00184672
15 0.000888 0.000864 0.0273973

Zadatak 4.23 Kocka se baca 36 puta. Pitanje je kolika je vjerojatnost da se šestica


pojavi 6 + h puta? 

Rješenje:
U skladu s (4.13), a uz N = 36 i p = 1/6, najvjerojatnije je da će se šestica pojaviti
1
N p = 36 =6
6
puta. Zato se za vjerojatnost pojave 6 + h šestica može koristiti Gaußov izraz (4.70)
2 h2
h − h2
− 2N 2 36 1 5
e e pq 6 6 e− 10
PGau ( N p + h) ≈ p =q =√ ,
2πN pq 2 π 36 16 5 10 π
6

ali isto tako se može koristiti i izraz preko binomne raspodjele (4.11)
N N
   
Pbinom ( x ) = p qx N −x
⇒ Pbinom (5 + h) = p 6+h q 36−6−h .
x 6+h
Za h = −6, −5, · · · , 0, 1, 2, · · · 30 dobivaju se slijedeće vrijednosti

h PGau Pbinom ∆

−6 0. 0.
−5 0. 0.
0 0. 0.
1 0. 0.
2 0. 0.
3 0. 0.
4 0. 0.
30 0. 0.
gdje je s ∆ označena relativna razlika
| PGau − Pbinom |
∆= .
( PGau + Pbinom )/2
dovršiti (nacrtati gornju tablicu)
Provedite (na računalu) gornji postupak za N = 600 i razne vrijednosti x = 100 + h.
246 Poglavlje 4. Raspodjele

Zadatak 4.24 Promatrajući spol novorod̄enčadi u nekoj zemlji, ustanovljeno je da


je u odred̄enom razdoblju od 3 232 novorod̄enčeta, bilo 1 705 dječaka i
1 527 djevojčica. Pitanje na koje treba odgovoriti jeste: jesu li ovi podaci
u skladu s pretpostavkom da je vjerojatnost rod̄enja dječak ili djevojčica
jednaka p = 21 ? 

Rješenje:
Ako je vjerojatnost rod̄enja dječaka ili djevojčice jednaka 12 , tada bismo očekivali da se od 3 232
novorod̄enčadi rodi 1 616 dječaka i isto toliko djevojčica. Odstupanje broja rod̄enih dječaka je

H = 1705 − 1616 = 89.

Pitamo se kolika je vjerojatnost da se pojavi ovoliko odstupanje uz pretpostavku p = 12 ? Odgovor


daje relacija (4.75). U našem je slučaju


r
11
N pq = 3232 = 808 = 28.425,
p
22
pa je tražena vjerojatnost, prema (4.75),

89
 
P(|h| ≤ 89) = 2Φ = 2Φ(3.13) = 0.99826. (4.89)
28.425

Dakle uz pretpostavku da je p = 21 , vjerojatnost odstupanja manjeg ili jednakog 89 je 99.826%.


Budući da je ta vrijednost vrlo blizu granične vrijednosti od 99.7% koja se primjenjuje u ovakvim
analizama (sjetimo se da je P(|h| ≤ 3 σ) = 99.73%), smatramo da je gornji rezultat malo
vjerojatan, tj. da je odstupanje preveliko. Tj. možemo samo zaključiti da se vjerojatnost poroda
dječaka nalazi blizu vrijednosti 12 ili da su podaci bili netočni.

Zadatak 4.25 U različita vremena, botaničari Mendel (1865), Correns (1900), Tsc-
hermak (1900), Hurst (1904), Bateson (1905), Darbshire (1909) i Tavčar
(1924) su križali žuti hibridni grašak sa zelenim graškom i dobili sve
skupa 138 685 žutih i 46 042 zelene sjemenke. Pitanje je: slaže li se
ovaj rezultat s Mendelovom pretpostavkom da je vjerojatnost pojave
sjemenke zelenog graška 14 ? 

Rješenje:
Ukupan broj sjemenaka je 138 685 + 46 042 = 184 727. Jedna četvrtina od toga je 46 181.75 →
46 182. Razlika u odnosu na dobiveni broj sjemenaka zelenog graška je 46 182 − 46 042 = 140.
Prema (4.75), vjerojatnost da odstupanja od najvjerojatnije vrijednosti bude manje ili jednako
140 je
 
140
P(|h| ≤ 140) = 2Φ  q  = 2Φ(0.75) = 2 · 0.27337 = 0.54674.
13
184 727 4 4

Ova je vrijednost vrlo blizu 12 , što znači da je pretpostavka vjerojatno točna. Postavimo još i ovo
pitanje: koliko smije biti odstupanje, pa da mu vjerojatnost bude 95%?

P = 2Φ(t) = 0.95 ⇒ Φ(t) = 0.475.


4.2 Raspodjele kontinuiranih nasumičnih varijabla 247

Prema tablici na str. 350 u V RANI Ć, Vjerojatnost i statistika je t = 1.96, tj.

H 1.96 √
1.96 = p ⇒ H= 184 727 · 3 = 364.77233 . . . .
N pq 4

Očito je odstupanje od 140 unutar dopuštene granice, čime smatramo Mendelovu pretpostavku
potvrd̄enom.

Zadatak 4.26 U igri lutrije se od 90 brojeva izvlači pet brojeva. Igrač igra na jedan
broj i dobiva ako se njegov broj nalazi med̄u pet izvučenih.
(a) Izračunajte vjerojatnost dobitka u jednom izvlačenju.
(b) Ako se obavi 2 854 izvlačenja, koliko će najvjerojatnije biti dobitaka?
(c) Kolika mogu biti odstupanja od ovog najvjerojatnijeg broja dobitaka,
pa da njihova vjerojatnost ne premašuje 12 ? 

Rješenje:
(a) Vjerojatnost da će njegov broj biti izvučen jeste (povoljno kroz moguće)

(11) (89
4) 1
p= = ··· = .
(90
5)
18

(b) Ako se obavi 2 854 izvlačenja, prema (4.17), najvjerojatnije će biti izvučeno N p = 2 854/18 =
158.5̇ → 159 dobitaka.
(c) Prema (4.76), vjerojatnost je 12 da će odstupanje od najvjerojatnije vrijednosti N p biti manje
ili jednako H, kada je
r
1 17
H = 0.6745 N pq = 0.6745 2 854 = 8.2539 . . . → 8 . (4.90)
p
18 18
1
Dakle, s vjerojatnošću 2 možemo očekivati da će se broj izvučenih dobitaka nalaziti izmed̄u 151 i
167.

Zadatak 4.27 Za Gaußovu raspodjelu izračunajte mod i sva tri kvartila. 

Rješenje:

Zadatak 4.28 dovršiti 

Rješenje:
dovršiti
Zadatak 4.29 Ako su X1 i X2 nasumične varijable zadane Gaußovim raspodjelama,
izračunajte raspodjelu varijable

Y = a 0 + a 1 X1 + a 2 X2 ,

gdje su ai konstante. 

Rješenje:
dovršiti
248 Poglavlje 4. Raspodjele

Zadatak 4.30 Za nasumičnu varijablu X raspodjeljenu po Gaußovoj raspodjeli s


parametrima h x i = 0 i σ = 1, izračunajte slijedeće vjerojatnosti:
(a) P(0 < X < 1), (b) P(−2 < X < 0), (c) P(−1 < X < 2), (d) P(1 < X < 2),
(e) P( X < 1), (f) P( X > 1). 

Rješenje:
Prema uvjetima zadatka i relacijama (4.74) i (4.79)
Z x
1 2 /2 1 2
Φ( x ) = √ e− η dη , ρ( x ) = √ e− x /2
2π 0 2π
rješenja su:
Z 1
1 2 /2
( a) P (0 < X < 1) = √ dη e−η = Φ (1).
2π 0

Iz tablice sa str. 350 u V RANI Ć, Vjerojatnost i statistika, se očitava Φ(1) = 0.34134, pa je i

P(0 < X < 1) = 0.34134.

Z 0 Z 2
1 −η 2 /2 1 2 /2
(b) P(−2 < X < 0) = √ dη e =√ dη e−η = Φ(2) = 0.47725.
2π −2 2π 0

1 2 2
Z
(c) P(−1 < X < 2) = √ dη e−η /2
2π −1
Z 0 Z 2
1 −η 2 /2 1 2
=√ dη e +√ dη e−η /2
2π −1 2π 0
Z 1 Z 2
1 2 1 2
=√ dη e−η /2 + √ dη e−η /2 = Φ(1) + Φ(2) = 0.81859.
2π 0 2π 0

1 2 2
Z
(d) P (1 < X < 2) = √ dη e−η /2
2π 1
Z 2 Z 1
1 2 1 2
=√ dη e−η /2 − √ dη e−η /2 = Φ(2) − Φ(1) = 0.13591.
2π 0 2π 0

1 1 Z
2
(e) P ( X < 1) = √ dη e−η /2
2π −∞
Z 0 Z 1
1 2 1 2
=√ dη e−η /2 + √ dη e−η /2
2π −∞ 2π 0
Z +∞ Z 1
1 1 1
r
2
−η /2 −η 2 /2 π
=√ dη e +√ dη e =√ + Φ(1) = 0.84134.
2π 0 2π 0 2π 2

P( X > 1) = 1 − P( X < 1) = 0.15866.


4.2 Raspodjele kontinuiranih nasumičnih varijabla 249

Zadatak 4.31 Za nasumičnu varijablu X raspodjeljenu po Gaußovoj raspodjeli s


parametrima h x i = 2 i σ = 2, izračunajte slijedeće vjerojatnosti:
(a) P(0 < X < 4), (b) P(2 < X < 6), (c) P( X > 4). 

Rješenje:
Prema uvjetima zadatka i relacijama (4.74) i (4.79)

Z x ( x − 2) 2
1 −η 2 /2 1 −
Φ( x ) = √ e dη , ρ( x ) = √ e 8
2π 0 2 2π

rješenja su:

Z 4 ( x − 2) 2
1 −
( a) P (0 < X < 4) = √ dx e 8
2 2π 0
Z 1
1 1 2
= 4√ e−η /2 dη = 2Φ(1) = 2 · 0.34134 = 0.68268,
2 2π 0

pri čemu smo opet koristili tablicu sa str. 350 u V RANI Ć, Vjerojatnost i statistika.

Z 6 ( x − 2) 2
1 −
(b) P (2 < X < 6) = √ dx e 8
2 2π 2
Z 2
1 1 2
= 2√ e−η /2 dη = Φ(2) = 0.47725,
2 2π 0

Z ∞ ( x − 2) 2 Z ∞
1 − 1 1 2
(c) P ( X > 4) = √ dx e 8 = 2√ e−η /2 dη
2 2π 4 2 2π 1
Z ∞ Z 1
1 2 1 2
=√ e−η /2 dη − √ e−η /2 dη
2π 0 2π 0
1
r
π
=√ − Φ(1) = 0.15866,
2π 2

Zadatak 4.32 Sustavna pogreška ured̄aja za održavanje zrakoplova na stalnoj visini


je 100 m, a vjerojatnost nasumične greške je dana Gaußovom raspodje-
lom sa standardnom devijacijom od 200 m. Izračunajte vjerojatnost da:
(a) zrakoplov leti koridorom širine 500 m;
(b) zrakoplov leti iznad tog koridora,
uz uvjet da je zrakoplov usmjeren da leti sredinom koridora. 

Rješenje:
Prema uvjetima zadatka i relacijama (4.74) i (4.79)

Z x ( x − h x i) 2
1 −η 2 /2 1 −
Φ( x ) = √ e dη , ρ( x ) = √ e 2σ 2
2π 0 σ 2π
250 Poglavlje 4. Raspodjele

rješenja su:

Z 250 ( x − 100) 2 Z 3/4


1 − 1 2 /2
( a) P(−250 < X < +250) = √ dx e 2 · 200 2 = √ e− η dη · 200
200 2π −250 200 2π −7/4
Z 0 Z 3/4
1 2 1 2
=√ e−η /2 dη + √ e−η /2 dη
2π −7/4 2π 0
Z 7/4 Z 3/4
1 2 1 2
=√ e−η /2 dη + √ e−η /2 dη
2π 0 2π 0
= Φ(7/4) + Φ(3/4) = 0.45994 + 0.27337 = 0.73331.

Z ∞ ( x − 100) 2 Z ∞
1 − 1 2 /2
( a) P( X > 250) = √ dx e 2 · 200 2 = √ e− η dη · 200
200 2π 250 200 2π 3/4
Z ∞ Z 3/4
1 2 1 2
=√ e−η /2 dη − √ e−η /2 dη
2π 0 2π 0
1
r
π
=√ − Φ(3/4) = 0.5 − 0.27337 = 0.22669.
2π 2

Zadatak 4.33 Nasumična varijabla Y ∈ (0, +∞i je zadana izrazom Y = | X |. Ako je


p

raspodjela vjerojatnosti nasumične varijable X ∈ h−∞, +∞i dana Ga-


ußovom raspodjelom sa srednjom vrijednošću h x i = 0 i standardnom
devijacijom σ = 1. Izračunajte gustoću vjerojatnosti varijable Y. 

Rješenje:
Prema (3.53) je gustoća vjerojatnosti varijable Y jednaka
dx

φ(y) = ρ( x )
dy

Iz Y = | X |, izravnom derivacijom slijedi


p

√ dx

x > 0, y= x ⇒ = 2y,
dy
√ dx

x < 0, y = −x ⇒ = |−2y| = 2y.
dy

Budući da se Gaußova varijabla nalazi u intevalu h−∞, +∞i, a varijabla Y je ograničena na


pozitivne vrijednosti, to se doprinosi pozitivnih i negativnih X preslikavaju u pozitivni Y i vode
na dodatni množitelj 2 (čime se ujedno i zadovoljava uvjet normiranja)

4 4
φ(y) = √ y e−y /2 .

4.2 Raspodjele kontinuiranih nasumičnih varijabla 251

Tablica 4.2: Tablica Gaußovih integrala (4.74).


252 Poglavlje 4. Raspodjele

Tablica 4.3: Tablica Gaußovih integrala (4.74).


4.2 Raspodjele kontinuiranih nasumičnih varijabla 253

Tablica 4.4: Tablica Gaußovih integrala (4.74).


254 Poglavlje 4. Raspodjele

4.2.3 Logaritamsko - Gaußova raspodjela


x ∈ (0, ∞ >, a y = ln( x ) je raspored̄eno po Gaußovoj raspodjeli
1 2 /2σ 2 1 2 /2σ 2
dP = ρ( x ) dx = √ e (y−hyi) y dy = √ e (ln(x)−hyi) y dx .
σy 2π xσy 2π

Navesti primjere
nacrtati raspodjelu i kumulativnu funkciju
dovršiti
Zadatak 4.34 Za logaritamsko - Gaußovu raspodjelu izračunajte:
(a) koeficijente α 3 i α 4 ,
(b) mod i sva tri kvartila. 

Rješenje:

4.2.4 Maxwell-Boltzmannova ili gama raspodjela


G AMA FUNKCIJA
Da bi se uvela gama raspodjela, potrebno je najprije se upoznati s gama funkcijom29
Γ(z), koja je definirana30 integralom
Z +∞
Γ(z) = x z−1 e− x dx , z ∈ C, Re z > 0. (4.91)
0

Primjetimo odmah da je, prema gornjoj definiciji,

Γ(1) = 1.

R EKURZIJA
Parcijalnom integracijom (4.91), dolazi se do rekurzije
d  z −1 − x 
x e = ( z − 1 ) x z −2 e− x − x z −1 e− x ,
dx
Z +∞ Z +∞
z −2 −x d  z −1 − x 
Γ ( z ) = ( z − 1) x e dx − x e dx
0 0 dx
 +∞
z −1 −x
= ( z − 1) Γ ( z − 1) − x e
0
= ( z − 1) Γ ( z − 1). (4.92)

Za prirodni broj n, uz Γ(1) = 1, i uzastopnu primjenu (4.92), dolazi se do veze izmed̄u


gama funkcije i funkcije faktorijela

Γ (2) = 1 · Γ (1) = 1 !
Γ (3) = 2 · Γ (2) = 2 !
Γ (4) = 3 · Γ (3) = 3 !
Γ (5) = 4 · Γ (4) = 4 !
Γ (6) = 5 · Γ (5) = 5 ! ⇒ Γ ( n ) = ( n − 1) · ( n − 2) · · · 3 · 2 · 1 = ( n − 1) ! .
29 Gama funkcija se naziva i Eulerov integral druge vrste.
30 Vidjeti npr. G LUMAC, Matematičke metode fizike.
4.2 Raspodjele kontinuiranih nasumičnih varijabla 255

Gama funkcija, definirana preko (4.91) predstavlja poopćenje pojma faktorijela sa pri-
rodnih na realne i kompleksne brojeve.

N ECJELOBROJNI ARGUMENT
Prijelazom s varijable x na varijablu η, iz (4.91) se dobiva gama funkcija u ekvivalentnom
obliku
∞ ∞
x = η 2 , ⇒ dx = 2η dη ,

0 0

što vodi na
Z +∞
2
Γ(z) = 2 η 2z−1 e−η dη , (4.93)
0
Z +∞ √
2
Γ (1/2) = 2 e−η dη = π. (4.94)
0

Gornji rezultat i rekurzija (4.92), daju

1 1√
Γ (3/2) = Γ (1/2) = π,
2 2
3 3√
Γ (5/2) = Γ (3/2) = π,
2 4
5 15 √
Γ (7/2) = Γ (5/2) = π,
2 8
..
.

N EPOTPUNA GAMA FUNKCIJA


Pored gama funkcije definirane izrazom (4.91) (koja se zove još i potpuna gama funkcija),
definira se i nepotpuna gama funkcija, slijedećim integralom
Z x
1
Γ(n, x ) = η n−1 e−η dη . (4.95)
Γ(n) 0

Osim u predintegralnom množitelju, razlika u odnosu na (4.91) je u gornjoj granici


integracije: ovdje je ona konačna. Takod̄er je očito

lim Γ(n, x ) = 1.
x →∞

D EFINICIJA GAMA RASPODJELE


Sada se može uvesti gama raspodjela. Ako se promatra kontinuirana nasumična varija-
bla X čije se vrijednosti x nalaze u intervalu (0, +∞ i i čija je gustoća vjerojatnosti dana
sa

dP Γ 1
ρ gama (n, x ) = = x n −1 e − x , (4.96)
dx Γ(n)

za sve vrijednosti nasumične varijable X iz intervala (0, +∞ i, kaže se da je X opisana


Maxwell-Boltzmannovom ili gama raspodjelom. Prirodan broj n u gornjoj raspodjeli
se zove STUPANJ SLOBODE RASPODJELE. Na slici 4.24 je prikazana gama raspodjela za
nekoliko vrijednosti n. Za male vrijednosti argumenta, funkcija raste kao potencija, dok
256 Poglavlje 4. Raspodjele

Slika 4.24: Gama raspodjela za nekoliko vrijednosti n.

0.4

n=2
n=4
n=6
0.3
< X > +- σ
ρΓ (n, x)

<X>+
- σ
0.2
< X > +- σ

0.1

0
0 1 2 3 4 5 6 7 8 9 10
x

za veće vrijednosti eksponencijalno opada. Označen je položaj srednje vrijednosti, h X i,


i iznos standardne devijacije σ (crtkana dužina).

K UMULATIVNA FUNKCIJA RASPODJELE


je upravo dana nepotpunom gama funkcijom, slika 4.25,

Z x
1
F(x) = η n−1 e−η dη = Γ(n, x ).
Γ(n) 0

NORMIRANJE I MOMENTI :

Slika 4.25: Kumulativna funkcija gama raspodjele.


4.2 Raspodjele kontinuiranih nasumičnih varijabla 257

Nulti moment je normiranje


Z ∞ Z ∞
0 1
x ρ gama (n, x ) dx = x n−1 e− x dx = (4.93) = 1.


=
0 Γ(n) 0

Ovime je pokazano da je gustoća vjerojatnosti (4.96) normirana. Izračunajmo prva dva


momenta koji daju očekivanje i varijancu:
Z ∞ Z ∞
1 Γ ( n + 1) n Γ ( n )
hxi = x ρ gama (n, x ) dx = x x n−1 e− x dx = = = n. (4.97)
0 Γ(n) 0 Γ(n) Γ(n)

Primjetimo da srednja vrijednost X nije ujedno i vrijednost X za koju raspodjela ima


maksimum (srednja vrijednost nije i najvjerojatnija vrijednost varijable). Položaj maksi-
muma (najvjerojatnije vrijednosti varijable) se lako nalazi (usporedite sa slikom 4.24)

∂ρ gama (n, x )

=0 ⇒ xmax = n − 1 6= h x i .
∂x
x = xmax

Račun drugog momenta se odvija na sličan način:


Z ∞ ∞
1
Z
2 2
x x ρ gama (n, x ) dx = x n+1 e− x dx


=
0 Γ(n) 0
Γ ( n + 2) ( n + 1) Γ ( n + 1) ( n + 1) n Γ ( n )
= = = = n ( n + 1). (4.98)
Γ(n) Γ(n) Γ(n)

Sada se vidi da je, za gama raspodjelu, varijanca

Var ( X ) ≡ σ 2 = x 2 − h x i 2 = n

jednaka srednjoj vrijednosti



σ 2 = hxi ⇒ σ = n.

Momenti x 3 i x 4 su potrebni za račun koeficijente asimetrije i spljoštenosti, a




jednostavno ih je izračunati gornjim postupkom


Z ∞ ∞
1 Γ ( n + 3)
Z
3 3
x x ρ gama (n, x ) dx = x n+2 e− x dx = = n ( n + 1) ( n + 2)


=
0 Γ(n) 0 Γ(n)
Z ∞ Z ∞
D E 1 Γ ( n + 4)
x4 = x 4 ρ gama (n, x ) dx = x n+3 e− x dx = = n ( n + 1) ( n + 2) ( n + 3),
0 Γ(n) 0 Γ(n)

ili, općenito,
D E
x k = n(n + 1)(n + 2) . . . [n + (k − 1)].

Sada su, prema (3.40) , koeficijenti asimetrije α 3 i spljoštenosti α 4 jednaki

x − 3 x 2 hxi + 2 hxi 3

3
M3 2


α3 = 3 = 3
= ··· = √ (4.99)
σ σ n
x − 4 x hxi + 6 x hxi − 3 hxi 4
2

4
3
2
M4 6
α4 = 4 = = ··· = 3 + . (4.100)
σ σ4 n
258 Poglavlje 4. Raspodjele

Za velike vrijednosti n, asimetrija iščezava, a spljoštenost teži normalnoj spljoštenosti.

V EZA SA STATISTI ČKOM FIZIKOM


Ako se u definiciji gama raspodjele, (4.96), varijable x samo preimenuje u E/(k B T ) i
odabere se n = 3/2
E 1 3
x→ , dx = dE n= ,
kB T kB T 2
gama raspodjela se naziva M AXWELL -B OLTZMANNOVA RASPODJELA poznata iz kine-
tičke teorije plinova
1
ρ gama (n, x ) dx → E1/2 e−E/k B T dE = ρ MB ( E) dE .
Γ(3/2) (k B T )3/2
Gore je E kinetička energija molekula klasičnog idealnog plina, k B Boltzmannova kons-
tanta, a T apsolutna temperatura
√ −E/k T
Ee

B
E > 0,


(k B T )3/2 Γ(3/2)

ρ MB ( E) =


0, E≤0.

Rezultate ovog odjeljka usporedite s rezultatima odjeljka (4.1.11) VEZA S P OISSONOVOM


RASPODJELOM :
Pokažimo vezu izmed̄u gama (kontinuirana varijabla) i Poissonove (diskretna varijabla)
raspodjele, (4.48),
1 λ x −λ
ρ gama (y; n) = y n −1 e− y , PPoiss ( x; λ) = e .
Γ(n) x!

Prisjetimo li se da, za prirodan broj n, vrijedi Γ(n) = (n − 1)!, tada je posve očito da je

ρ gama (λ; x + 1) = PPoiss ( x, λ).

VEZA S G AUSSOVOM RASPODJELOM :


Pokažimo sada vezu izmed̄u Gaußove (normalne) i gama raspodjele na način da tu
vezu shvatimo kao preobrazbu varijable (3.53) iz odjeljka 3.6.3
dx

ρ gama (y) = ρ G ( x ) . (4.101)
dy
Ako je varijabla x raspodjeljena prema Gaußovoj raspodjeli, tada je, prema (4.79),
2
1 x − hxi

− 
1 2

σ
ρ G (x) = √ e , x ∈ h −∞, +∞ i
σ 2π
vjerojatnost da varijabla x poprimi vrijednost iz intervala ( x, x + dx ) za bilo koji x iz
intervala h −∞, +∞ i. Isto tako je i vjerojatnost da varijabla y koja se ravna po gama
raspodjeli (4.96) poprimi vrijednost iz intervala (y, y + dy) za bilo koji y ∈ (0, ∞ i, jednaka

1
ρ gama (n, y) = y n −1 e− y , y ∈ (0, +∞ i.
Γ(n)
4.2 Raspodjele kontinuiranih nasumičnih varijabla 259

Povežimo sada sa x i y relacijom

1 x − hxi 2 dy x − h x i
 
y= ⇒ dx σ 2 .
=
2 σ
Budući da je x ∈ h −∞, +∞ i, a y ∈ (0, +∞ i, to relaciji (4.101) treba rukom dopisati faktor
2 jer (zbog apsolutne vrijednosti u gornjem izrazu) isti doprinosi u ρ gama dolaze od
x ∈ h −∞, 0 i kao i od x ∈ h 0, +∞ i
σ2
= 2 √1 1

σ
ρ gama (y) = 2 · ρ G ( x ) ·
e− y · p = y−1/2 e−y .
x − hxi σ 2π 2y Γ ( 1/2 )
Time je pokazano da vrijedi jednakost

ρ G ( x ) = ρ gama (y) .

h x i,σ n=1/2,y=( x −h x i) 2 /(2σ 2 )

Ovime je dokazan i slijedeći

Teorem 4.2.1 Ako je x nasumična varijabla raspodjeljena po Gaußovoj raspodjeli sa


srednjom vrijednošću h x i i standardnom devijacijom σ, tada je varijabla

 2
1 x − hxi
2 σ2
raspodjeljeno po gama raspodjeli sa stupnjem slobode

1
n= .
2
Navesti primjere

Zadatak 4.35 Koristeći definiciju (4.91), uvjerite se u točnost Γ(1) = 1. 

Zadatak 4.36 Za gama raspodjelu izračunajte mod i sva tri kvartila. 

Rješenje:
... dovršiti ...

4.2.5 Beta raspodjela


Uvod o beta funkciji iz MMF ... dovršiti ...
Vrlo je slična binomnoj, s time da sada p nije parametar, nego varijabla, p → x
Γ ( α + β ) α −1
ρ( x; α, β) = x (1 − x ) β −1 0<x<1
Γ(α)Γ( β)
Beta raspodjela za nekoliko vrijednosti α i β je prikazna na slici 4.26.

2( β − α ) α + β + 1
p
α3 = .
( α + β + 2) α β
p

nacrtati raspodjelu i kumulativnu funkciju


dovršiti
260 Poglavlje 4. Raspodjele

Slika 4.26: Beta raspodjela za nekoliko vrijednosti α i β.

4.2.6 χ 2 raspodjela
nacrtati raspodjelu i kumulativnu funkciju
dovršiti

4.2.7 Bose-Einsteinova raspodjela


Rezultate ovog odjeljka usporedite s rezultatima odjeljka (4.1.11)
DEFINICIJA :
Kontinuirana nasumična varijabla x ∈ [ 0, +∞ i je raspodjeljena po Bose - Einsteinovoj
raspodjeli, kada je njezina (nenormirana) gustoća vjerojatnosti dana sa

xs
ρ( x ) = ,
ex −µ −1

gdje parametar µ ima značenje kemijskog potencijala31 . Normiranje je dano integralom

+∞
xs
Z
dx = e µ Γ(s + 1) Φ(e µ , s + 1, 1) = Γ(s + 1) Lis+1 (e µ ), Re (s) > −1,
0 e x −µ − 1

pri čemu je

zn
Φ(z, s, a) = ∑ ( a + n) s
, kzk < 1, a 6= 0, −1, −2, · · · .
n =0

Lerchova transcedentna funkcija, a



zn
Lis (z) = ∑ ns
,
n =1

31 Vidjeti npr. u G LUMAC, Statistička fizika


4.2 Raspodjele kontinuiranih nasumičnih varijabla 261

je polilogaritamska funkcija definirana na otvorenom jediničnom disku u kompleksnoj


ravnini. Za posebnu vrijednost z = 1, polilogaritamska funkcija se svodi na Riemannovu
zeta-funkciju32

1
Lis (1) = ∑ ns
= ζ ( s ).
n =1

Normirana Bose - Einsteinova raspodjela je

1 xs
ρ( x ) = . (4.102)
e µ Γ(s + 1) Φ(e µ , s + 1, 1) ex−µ − 1

Ova se raspodjela pojavljuje u opisu raspodjele broja kvantnomehaničkih objekata


cjelobrojnog spina.
dovršiti: nacrtati raspodjelu i kumulativnu funkciju
momenti
funkcija izvodnica

4.2.8 Fermi-Diracova raspodjela


Rezultate ovog odjeljka usporedite s rezultatima odjeljka (4.1.11)
DEFINICIJA :
Kontinuirana nasumična varijabla x ∈ [ 0, +∞ i je raspodjeljena po Fermi - Diracovoj
raspodjeli, kada je njezina (nenormirana) gustoća vjerojatnosti dana sa
xs
ρ( x ) = ,
ex −µ + 1
gdje parametar µ ima značenje kemijskog potencijala31 . Normiranje je dano integralom

+∞
xs
Z
dx = e µ Γ(s + 1) Φ(−e µ , s + 1, 1) = −Γ(s + 1) Lis+1 (−e µ ),
0 e x −µ − 1

pri čemu je

zn
Φ(z, s, a) = ∑ ( a + n) s
, kzk < 1, a 6= 0, −1, −2, . . .
n =0

Lerchova transcedentna funkcija, a



zn
Lis (z) = ∑ ns
,
n =1

je polilogaritamska funkcija definirana na otvorenom jediničnom disku u kompleksnoj


ravnini. Za posebnu vrijednost z = 1, polilogaritamska funkcija se svodi na Riemannovu
zeta-funkciju33

1
Lis (1) = ∑ ns
= ζ ( s ).
n =1
32 Vidjeti npr. u G LUMAC, Matematičke metode fizike.
33 Vidjeti npr. u G LUMAC, Matematičke metode fizike.
262 Poglavlje 4. Raspodjele

Normirana Fermi - Diracova raspodjela je

1 xs
ρ( x ) = . (4.103)
e µ Γ(s + 1) Φ(−e µ , s + 1, 1) ex−µ + 1

Ova se raspodjela pojavljuje u opisu raspodjele broja kvantnomehaničkih objekata


polucjelobrojnog spina.
dovršiti: nacrtati raspodjelu i kumulativnu funkciju
momenti
funkcija izvodnica

4.2.9 t raspodjela
DEFINICIJA :
Kontinuirana nasumična varijabla t ∈ h −∞, +∞ i je raspodjeljena po t-raspodjeli, kada
je njezina gustoća vjerojatnosti dana sa

−(1+k)/2
t2

ρ(t) = C0 (k ) 1+ , k = 1, 2, 3, · · · . (4.104)
k

gdje je parametar k prirodan broj (koji se naziva i stupanj slobode), a


 
Γ 1+2 k
C0 (k) =   √ .
Γ 2k kπ

Iz gornjeg izraza za gustoću vjerojatnosti se vidi da je ona simetrična u odnosu na


pravac t = 0

ρ(t) = ρ(−t).

Na slici 4.27 je prikazana t-raspodjela uspored̄ena s Gaußovom raspodjelom (hti =


0, σt2 = 1). Budući da je ρ(t) parna funkcija od t, to je t 2n+1 ρ(t), neparna funkcija i zato
su svi neparni momenti jednak nuli
D E Z +∞
t 2n+1 = t 2n+1 ρ(t) dt = 0.
−∞

Za račun parnih momenata raspodjele, koristit ćemo relaciju (A.56)



Z
x µ−1 dx
 µ/ν
1 p Γ(µ/ν) Γ(n + 1 − µ/ν)
1
= , 0 < µ/ν < n + 1.
( p + qx )
ν n + ν p n +1 q Γ ( n + 1)
0

što vodi na izraz za parne momente

1 · 3 · 5 . . . (2n − 1)
t 2n = k n , k > 2n.


(k − 2)(k − 4) . . . (k − 2n)
4.2 Raspodjele kontinuiranih nasumičnih varijabla 263

Slika 4.27: Usporedba t-raspodjele za k = 3 i Gaußove raspodjele za hti = 0, σt2 = 1.

Zadatak 4.37 Za t raspodjelu izračunajte:


(a) koeficijente α 3 i α 4 ,
(b) mod i sva tri kvartila. 

Rješenje:

nacrtati kumulativnu funkciju


Navesti primjere

4.2.10 Eksponencijalna raspodjela


Eksponencijalna raspodjela se pojavljuje u problemima u kojima je vjerojatnost ostva-
renja uočenog dogad̄aja ista unutar jednako kratkih vremenskih intervala (vrijeme
ispravnog rada ured̄aja čije se karakteristike ne mjenjaju s vremenom, vrijeme do prvog
poziva u telefonskoj centrali, vrijeme do pojave neke nesreće i sl.).

D EFINICIJA
Kontinuirana pozitivna nasumična varijabla t je raspodjeljena po eksponencijalnoj ras-
podjeli, ako je njezina gustoća vjerojatnosti dana sa (vidjeti (5.45) iz odjeljka o entropiji)

 ω e− ω t 0 ≤ t < ∞,

ρ(t) = (4.105)
0, t<0.

gdje je ω pozitivna konstanata (slika 4.28). Za ω = 1, može se shvatiti i kao poseban


slučaj gama raspodjele (4.91), u kojoj je z = 1.
264 Poglavlje 4. Raspodjele

Prema (3.1), kumulativna funkcija (funkcija raspodjele) je jednaka


Z t Z t
F (t) ≡ P(t 0 < t) = ρ(η ) dη = ω e−ω η dη = 1 − e−ω t (4.106)
0 0

i prikazna je na slici 4.28.

Slika 4.28: Lijevo: gustoća vjerojatnosti eksponencijalne raspodjele ρ(t), (4.105). Desno:
kumulativna funkcija eksponencijalne raspodjele, F (t), (4.106).

ω = 0.5 1
ω = 1.0
ω = 2.0
1.5

1
0.5

0.5
ω = 0.5
ω = 1.0
ω = 2.0

0 0
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10
t t

V EZA S FIZIKOM
Neka se prati vrijeme ispravnog rada nekog ured̄aja, tako što se mjeri vrijeme izmed̄u
dva kvara. Označimo s
 . 
P T < t + dt T > t

uvjetnu vjerojatnost da se uočeni dogad̄aj (kvar) ostvario u kratkom vremenskom


intervalu (t, t + dt) uz uvjet da se prije toga nije ostvario (tj. ured̄aj je radio ispravno) u
cijelom konačnom intervalu (0, t). Neka je ta uvjetna vjerojatnost srazmjerna kratkom
vremenskom intervalu dt i neovisna o t, tj. neka je oblika
 . 
P T < t + dt T > t = ω dt + O (dt) 2 , (4.107)
 

gdje član O (dt) 2 označava članove srazmjerni s (dt) 2 , (dt) 3 , (dt) 4 , · · · , koji svi imaju
 

svojstvo da u granici dt → 0, trnu brže od dt, tj.

O (dt) 2 a2 (dt) 2 + a3 (dt) 3 + a4 (dt) 4 + · · ·


 
lim = lim = 0,
dt → 0 dt dt → 0 dt

gdje su a j konstante.
Pokažimo da je nasumična varijabla T, koja ispunjava uvjet (4.107), opisana gustoćom
vjerojatnosti (4.105). Prema (2.11), vrijedi

P( T > t + dt) = P( T > t + dt /T > t) P( T > t).

No, budući da je

P( T > t + dt /T > t) = 1 − P( T < t + dt /T > t) = 1 − ω dt + O (dt) 2 ,


 
4.2 Raspodjele kontinuiranih nasumičnih varijabla 265

to je prethodna relacija jednaka


h i
P( T > t + dt) = 1 − P( T < t + dt /T > t) P( T > t)
h i
= P( T > t) 1 − ω dt + O (dt) 2


P( T > t + dt) − P( T > t) = −ω dt P( T > t) + O (dt) 2


 

P( T > t + dt) − P( T > t O (dt) 2


 
lim = −ω P( T > t) + lim
dt→0 dt dt→0 dt
dP( T > t)
= − ω P ( T > t ).
dt
Očito rješenje gornje diferencijalne jednadžbe je

P( T > t) = const. e−ω t .

Nepoznata konstanta se odred̄uje iz početnog uvjeta da je sigurno da će se kvar dogoditi


nakon početka rada stroja (stroj počinje raditi u trenutku t = 0)

P( T > 0) = 1 =⇒ P( T > t) = e−ω t .

Kumulativna funkcija je

F ( t ) = P ( T < t ) = 1 − P ( T > t ) = 1 − e− ω t ,

iz čega slijedi, prema (3.7)


dF
ρ(t) = = ω e− ω t .
dt
V EZA S P OISSONOVOM RASPODJELOM
dovršiti

S REDNJA VRIJEDNOST I STANDARDNA DEVIJACIJA


dovršiti

I ZOSTANAK PAM ĆENJA


dovršiti

K ARAKTERIZACIJA
dovršiti

M ODELIRANJE RASPODJELE
dovršiti

 Primjer 4.14 A LFA ZRAKE

Aktivnost alfa zraka pojedine tvari se mjeri nakon jednakih vremenskih intervala
(u satima) u odnosu na početnu aktivnost koja se uzima za jedinicu mjere, i iznosi:
0.835, 0.695, 0.580, 0.485, 0.405 i 0.335. Iz pretpostavke da aktivnost opada eksponenci-
jalno, izvedite jednadžbu koja najbolje opisuje aktivnost i izračunajte konstantu raspada
i vrijeme poluživota.
... dovršiti .. 
266 Poglavlje 4. Raspodjele

 Primjer 4.15 R ADIOAKTIVNI RASPAD


Izvedite intervalnu raspodjelu i pomoću nje izvedite eksponencijalni zakon radioaktiv-
nog raspada.
... dovršiti .. 

 Primjer 4.16 R ADIOAKTIVNI RASPAD : 14 C


U pokusu datiranja pomoću radioaktivnog raspada ugljika 14 C....
... dovršiti .. 

 Primjer 4.17 P ROJEKCIJA VEKTORA


Nasumična varijabla t može imati i geometrijsku interpretaciju, npr. kao projekcija
vektora duljine l na zadani pravac. Ovu projekciju shvaćamo kao nasumičnu varijablu
koja može poprimati vrijednosti iz intervala [−l, +l ]. Pridružena eksponencijalna
raspodjela je

ρ(t) = C0 e −ω |t| , t ∈ [−l, +l ].

Konstantna C0 se odred̄uje iz uvjeta normiranja,


Z l/2
1 = C0 e −ω |t| dt ,
−l/2

što konačno vodi na

ω e −ω |t|
ρ(t) = .
2 1 − e −ω l


Zadatak 4.38 Gustoća nasumične varijable x je dana sa

ρ( x ) = N x e− x/λ , 0 < x < ∞.

Odredite konstantu normiranja, N. Izračunajte srednju vrijednost i


standardnu devijaciju varijable x. 

Rješenje:

Z ∞
N x e− x/λ dx = 1.
0

Integral se rješava parcijalnom integracijom

d  − x/λ  −1 −x/λ
xe = e−x/λ + x e ,
dx λ
što vodi na
Z ∞ 
d  − x/λ 

− x/λ
N −λ xe + λe dx = 1.
0 dx

Prvi član na lijevoj strani j jednak nuli, a drugi član je elementarni integral, koji u konačnici
daje vrijednost konstante normiranja

1 x − x/λ
N= ⇒ ρ( x ) = e .
λ2 λ2
4.2 Raspodjele kontinuiranih nasumičnih varijabla 267

Momenti se računaju prema (3.29)


Z ∞ Z ∞ 2
x − x/λ
hxi = x ρ( x ) dx = 2
e dx .
0 0 λ
Parcijalnom integracijom

d  2 − x/λ  −1 −x/λ
x e = 2xe−x/λ + x 2 e ,
dx λ
dolazi se do
Z ∞ Z ∞
1 d  2 − x/λ 
 
− x/λ
h x i = 2 −λ x e dx + 2λ xe dx = 2 λ.
λ 0 dx 0

Prvi integral na desnoj strani je jednak nuli, a drugi integral je riješen u prethodnom koraku kod
normiranja. Drugi moment se takod̄er računa iz (3.29)
∞ Z ∞ 3
Z x − x/λ
x2 = x 2 ρ( x ) dx = e dx .

2 λ
0 0

Parcijalnom integracijom

d  3 − x/λ  −1 −x/λ
x e = 3x 2 e−x/λ + x 3 e ,
dx λ
dolazi se do
Z ∞ Z ∞
1 d  3 − x/λ 
 
2 2 − x/λ
x x e dx + 3λ x e dx = 6 λ 2 .


= 2 −λ
λ 0 dx 0

Prvi integral na desnoj strani je jednak nuli, a drugi integral je riješen u prethodnom koraku kod
računa h x i. Standardna devijacija je
q √
σ = h x 2 i − h x i 2 = λ 2.

Zadatak 4.39 Za eksponencijalnu raspodjelu izračunajte:


(a) koeficijente α 3 i α 4 ,
(b) mod i sva tri kvartila. 

Rješenje:

Zadatak 4.40 text 

Rješenje:
rješenje

Zadatak 4.41 text 

Rješenje:
rješenje
268 Poglavlje 4. Raspodjele

Zadatak 4.42 text 

Rješenje:
rješenje dovršiti
Navesti primjere

4.2.11 Cauchyjeva i Breit-Wignerova raspodjela


...kao u primjeru 3.6 ...
nacrtati raspodjelu i kumulativnu funkciju
dovršiti

4.2.12 Fisherova raspodjela


nacrtati raspodjelu i kumulativnu funkciju
dovršiti

4.2.13 Opća krivulja raspodjele


Pitanjem općih krivulja raspodjele bavio se osobito K ARL P EARSON sa suradnicima. U
svojim radovimo (poglavito u razdoblju od 1895. do 1916.godine), postavio je homogenu
linearnu običnu diferencijalnu jednadžbu za gustoću vjerojatnosti ρ( x )

dρ( x ) m−x
− ρ( x ) = 0, (4.108)
dx a + bx + cx 2
koja ovisi o četiri parametra (m, a, b i c), a čija rješenja, ovisno o vrijednostima para-
metara, daju različite raspodjele gustoća vjerojatnosti. Raspodjele vjerojatnosti koje se
pojavljuju u prirodi, najčešće imaju po jedan maksimum. Prema gornjoj diferencijalnoj
jednadžbi, položaj maksimuma je odred̄en sa

dρ( x ) m−x
= ρ( x ) = 0.
dx a + bx + cx 2
Dakle maksimum je ili u točki

xmax = m

ili u točki xmax koja je rješenje jednadžbe

ρ( xmax ) = 0.

Za primjer navodimo Gaußovu raspodjelu kao posebni slučaj rješenja jednadžbe (4.108):
stavimo li a = 1, b = c = 0, dobivamo


 Z
= (m − x ) dx ,
ρ
1 2
ln(ρ) = − (m − x ) 2 + const., ⇒ ρ( x ) = c0 e−(x−m) /2 ,
2
a to je upravo gustoća vjerojatnosti (4.79) Gaußove raspodjele (konstanta c0 se odred̄uje
iz uvjeta normiranja).
4.2 Raspodjele kontinuiranih nasumičnih varijabla 269

Zadatak 4.43 Vjerojatnost rod̄enja dječaka je približno jednaka 0.515. Kolika je


vjerojatnost da med̄u 10 000 beba, bude više djevojčica? 

Rješenje:
rješenje

Zadatak 4.44 Kocka se baci 80 puta. Koliki je najvjerojatniji broj pojavljivanja šestice?
S kojom vjerojatnošću? 

Rješenje:
rješenje

Zadatak 4.45 Razredbeni ispit se sastoji od 40 zadataka. Za svaki je zadatak ponu-


d̄eno pet odgovora od kojih je samo jedan točan. Točan odgovor donosi
+15 bodova, a netočan −4 boda. Uz pretpostavku da pristupnik(ica)
nasumično odabire odgovore, izračunajte kolika je vjerojatnost da taj
pristupnik(ica) pred̄e razredbeni prag od 135 bodova. 

Rješenje:
rješenje

Zadatak 4.46 Pokus se izvodi N puta. U svakom je pokusu vjerojatnost ostvarenja


dogad̄aja A jednaka 0.2. Koliki treba biti N, pa da vjerojatnost da se A
ostvari bar 15 puta bude 0.8? 

Rješenje:
rješenje

Zadatak 4.47 Izvodi se niz od 100 Bernoullijevih pokusa. Ako je poznato da je


P( x ≥ 20) = 0.841, izračunajte vjerojatnost ostvarenja Bernoullijevog
dogad̄aja u pojedinom pokusu. 

Rješenje:
rješenje
270 Poglavlje 4. Raspodjele

Preporučena literatura za ovo poglavlje je:

1. G. B. A RFKEN I H. J. W EBER.
Mathematical Methods for Physicists. Academic Press, San Diego, 1995
2. N EVEN E LEZOVI Ć.
Vjerojatnost i statistika 1 - diskretna vjerojatnost. Element, Zagreb, 2008
3. J OSÉ L UIS G ARCIA -PALACIOS. „
Introduction to the theory of stochastic processes and Brownian motion problems”.
(2007). URL: arxiv.org/abs/cond-mat/0701242
4. R OMAN G RIGORIEV.
Mathematical Methods of Physics. 2019. URL: http : / / www . cns . gatech . edu /
~predrag/courses/PHYS-6124-12/roman07/
5. C HARLES M. G RINSTEAD I J. L AURIE S NELL.
Introduction to probability. 2019. URL: https://www.math.dartmouth.edu/~prob/
prob/prob.pdf
6. P. H SU H WEI.
Theory and problems of probability, random variables and random processes. McGraw -
Hill, 1997
7. B RANISLAV I VANOVI Ć.
Teorija verovatnoće. Univerzitetski udžbenici. Naučna knjiga, Beograd, 1977, stra-
nica 328
8. A HMAD A. K AMAL.
1 000 Solved Problems in Modern Physics. Springer Verlag, Berlin Heidelberg, 2010
9. D AVID J. M AC K AY.
Zipf - Mandelbrot distribution. 2019. URL: www.inference.phy.cam.ac.uk%20%E2%
80%BA%20donut%20%E2%80%BA%20infinite%20%E2%80%BA%20zipfMacKay
10. Ivo PAVLI Ć.
Statistička teorija i primjena. Panorama, Zagreb, 1965
11. K EN R ILEY , M ICHAEL H OBSON I S TEPHEN B ENCE.
Mathematical Methods for Physics and Engineering. Cambridge Univ. Press, 2006
12. Z. K. S ILAGADZE.
Citations and the Zipf-Mandelbrot’s law. 2019. URL: http://cds.cern.ch/record/
377204/files/9901035.pdf
13. M URRAY R ALPH S PIEGEL I L ARRY J. S TEPHENS.
Theory and problems of Statistics. Schaum’s outline series. McGraw-Hill, 1999
14. H UGO T OUCHETTE. „The large deviation approach to statistical mechanics”.
Physics Reports 478 (2009), stranice 1–69. URL: http://people.math.umass.edu/
~rsellis/pdf-files/Touchette-review.pdf
15. V LADIMIR V RANI Ć.
Vjerojatnost i statistika. Tehnička knjiga, Zagreb, 1971
16. S VETOZAR V. V UKADINOVI Ć.
Zbirka rešenih zadataka iz teorije verovatnoće. Privredni pregled, Beograd, 1990
17. M ATH W ORLD W OLFRAM.
Bose-Einstein Distribution. http://mathworld.wolfram.com/Bose-EinsteinDistribution.html,
2019
18. M ATH W ORLD W OLFRAM.
Fermi-Dirac Distribution. http://mathworld.wolfram.com/Fermi-DiracDistribution.html,
4.2 Raspodjele kontinuiranih nasumičnih varijabla 271

2019
5. Entropija, vjerojatnost, informacija

You should call it entropy, for two reasons. In the first place your uncertainty function
has been used in statistical mechanics under that name, so it already has a name.
In the second place, and more important, no one really knows what entropy really is,
so in a debate you will always have the advantage.

J. Von Neumann, suggesting to Claude Shannon


a name for his new uncertainty function, as quoted in
Scientific American 225, 3, p180 (1971).

5.1 Entropija
Iz prethodnih izlaganja u ovom tekstu, kao i iz nekih drugih izvora1 , vidljivo je da se
vjerojatnost može shvatiti kao broj (funkcija) koji mjeri (ne)sigurnost ostvarenja nekog
dogad̄aja: ako je vjerojatnost jednaka nuli, sigurno je da se dogad̄aj neće ostvariti, a
ako je vjerojatnost jednaka jedan, sigurno je da će se dogad̄aj ostvariti. Svi brojevi
izmed̄u 0 i 1 opisuju stupanj (ne)sigurnosti ostvarenja dogad̄aja. Ako se ne promatra
samo jedan dogad̄aj, nego cijeli jedan (veliki) skup od N dogad̄aja, A, B, C, · · · , tada se
konfiguracijom, C , naziva jedno moguće ostvarenje cijelog skupa. Npr. jedna moguća
konfiguracija je
C = ( A, B, C, · · · ),
(potezom iznad slova, označeno je neostvarenje dogad̄aja) u kojoj su se dogad̄aji A i
B ostvarili, C se nije ostvario itd. Budući da se svaki od N dogad̄aja može ili ostvariti
ili ne ostvariti (treća mogućnost ne postoji), to je ukupan broj konfiguracija jednak
Ωtot = 2 N . U odnosu na promatarni SKUP dogad̄aja, moguće je definirati jedan broj
tj. funkciju koja MJERI STUPANJ ( NE ) SIGURNOSTI OSTVARENJA TJ . NEPOZNAVANJA
KONFIGURACIJE U KOJOJ SE NALAZI CIJELI TAJ SKUP DOGAÐAJA . Takva se funkcija
naziva ENTROPIJA2 . U ovom odjeljku će se govoriti o jednoj veličini, H, koja je do na
1 Npr. G LUMAC, Matematičke metode fizike, G LUMAC, Statistička fizika.
2 Riječ
entropija potječe od grčke riječi entrepo, što u prijevodu znači – okretati, obrtati. Pojam entropije
je 1865. god. uveo Rudolph Clausius i preveo ga kao „obrt ka unutra”.
274 Poglavlje 5. Entropija, vjerojatnost, informacija

množenje konstantom jednaka SREDNJOJ VRIJEDNOSTI entropije (vidjeti pojašnjenje kod


dokaza Hinčinova teorema (5.1.2)). Sukladno zamisli ovog teksta, analiza usrednjene
entropije će se provoditi sa stanovišta teorije vjerojatnosti. Osim u teoriji vjerojatnosti,
pojam entropije se koristi i u teoriji informacija (odjeljak 5.4), a jedan je od svakako
središnjih pojmova cijele statističke fizike3 .

Takod̄er, umjesto da se govori o vjerojatnosti da nasumična varijabla poprimi odred̄enu


vrijednost, može se isto tako tako govoriti o vjerojatnosti ishoda nekog nasumičnog
procesa ili o vjerojatnosti da se čestica nalazi u odred̄enom (energijskom ili kakvom
drugom) stanju.

Započet ćemo s računom srednje vrijednosti entropije (samo) jedne nasumične va-
rijable/pocesa/stanja čestice.
 Primjer 5.1 Q = 2
Promatra se (samo) jedna nasumična varijabla ili jedan nasumičan proces A, koja
može poprimiti (samo) dvije različite vrijednosti ili dva različita ishoda A1 (ostvarenje,
+1, ↑, · · · ) i A2 (neostvarenje, −1, ↓, · · · ). Koristeći rječnik statističke fizike, može se reći
da se promatra sustav koji se sastoji od samo jedne čestice koja se može nalaziti u
jednom od dva stanja4 : stanju ↑ ili stanju ↓

C1 = (+1), C2 = (−1),
C1 = ( A ), C2 = ( A ),
C1 = (↑), C2 = (↓).

S obzirom da se promatra samo jedna nasumična varijabla, to je ukupan broj elementar-


nih dogad̄aja Ωtot jednak broju vrijednosti Q koje može poprimiti ta nasumična varijabla
(broj stanja u kojima se može nalaziti čestica)

Ωtot = Q.

Kada bismo razmatrali sustav od npr. tri varijable, A, B i C (ili tri čestice) od kojih se
svaka može nalaziti u Q stanja, ukupan broj elementarnih dogad̄aja bi bio

Ωtot = Q 3 .

Vratimo se primjeru sa (samo) jednom nasumičnom varijablom A koja s vjerojatnošću


P(1) poprima vrijednost A1 , a s vjerojatnošću P(2) vrijednost A2 . Raspodjela vjerojat-
nosti P(n) je normirana
Q
∑ P(n) = P(1) + P(2) = 1.
n =1

Zbog uvjeta normiranja, raspodjela vjerojatnosti se može parametrizirati samo jednim


parametrom, nazovimo ga e, tako da su

P(1) = 1 − e, P(2) = e.

Ako je e jako mali, npr. e = 10−6 , skoro je sigurno da će se sustav nalaziti u konfiguraciji
C1 i zato je usrednjena bezdimenzijska entropija, koja mjeri nepoznavanje sustava, malog
3 Vidjeti npr. u G LUMAC, Statistička fizika
4 To je poznati Isingov model, vidjeti npr. u G LUMAC, Statistička fizika.
5.1 Entropija 275

iznosa. U graničnom slučaju kada je e = 0, sustav se sigurno nalazi u konfiguraciji C1 i


neodred̄enost u poznavanju konfiguracije sustava je nula, tj. srednja vrijednost entropije
je jednaka nuli (to je maksimalno ured̄eni, zamrznuti sustav - niske temperature)

H[ Q = 2; P(1) = 1, P(2) = 0] = 0.

Slična je situacija i kada je e = 1. Sustav je sigurno u konfiguraciji C2 i usrednjena


bezdimenzijska entropija je opet jednaka nuli

H[ Q = 2; P(1) = 0, P(2) = 1] = 0.

Druga granična situacija je da su obje vrijednosti jednako vjerojatne, e = 0.5,

P(1) = 0.5, P(2) = 0.5.

Sada je nepoznavanje konfiguracije u kojoj se nalazi sustav najveće (najveći je nered u


sustavu - visoke temperature), jer je realizacija obje konfiguracije jednako vjerojatna

H[ Q = 2; P(1) = 0.5, P(2) = 0.5] = Hmax .

Osim ove tri nabrojane, sve ostale moguće vrijednosti za P(1) i P(2) dat će vrijednosti
usrednjena entropije koje leže izmed̄u 0 i Hmax .
Zaključci iz ovog primjera sažeti su u slijedeće tri relacije

H[2; P(1), P(2)] je pozitivan realan broj,


H[2; 1, 0] = H[2; 0, 1] = 0,
H[2; 0.5, 0.5] ≥ H[2; P(1), P(2)], ∀ P (1), P (2).

Poslije ovog jednostavnog primjera, nastavimo izlaganje tako što ćemo ga poopćiti
na način da i dalje promatramo jednu nasumičnu varijablu, ali sada ona može popri-
miti ne samo dvije vrijednosti, nego proizvoljan5 broj Q ≥ 2 vrijednosti (stanja) An s
pridruženim vjerojatnostima P(n)

{ A1 , A2 , · · · , A Q } P (1), P (2), · · · , P ( Q ).

Očito, tri svojstva iz gornjeg primjera, poopćavaju se na

H( Q; P(1), P(2), · · · , P( Q)) je pozitivan realan broj,


H( Q; 1, 0, · · · , 0) = H( Q; 0, 1, 0, · · · , 0) = · · · = H( Q; 0, 0, 0, · · · , 0, 1) = 0,
H( Q; 1/Q, 1/Q, · · · , 1/Q) ≥ H[ Q; P(1), P(2), · · · , P( Q)], ∀ P ( n ).

Ako se sada gornji skup vrijednosti poveća za jednu vrijednost koju nasumična varijabla
nikada ne može poprimiti, očito je da se poznavanje stanja u kojemu se nalazi nasumična
varijabla, time neće ni povećati ni smanjiti

H[ Q; P(1), P(2), · · · , P( Q)] = H[ Q + 1; P(1), P(2), · · · , P( Q), 0].


5 To je kao poopćenje s Isingovog na Pottsov model.
276 Poglavlje 5. Entropija, vjerojatnost, informacija

Kada je

1
P(n) = , n = 1, 2, · · · , Q,
Q

prethodna jednakost med̄u srednjim vrijednostima entropije prelazi u

1 1 1 1 1 1
   
H Q; , , · · · , = H Q + 1; , , · · · , , 0 .
Q Q Q Q Q Q

Ako sada uklonimo zahtjev da se Q + 1-va vrijednost ne može ostvariti i dozvolimo


da se ostvari s istom vjerojatnošću kao i prethodnih Q vrijednosti, time će se očito
povećati nesigurnost u odred̄ivanju u kojem se stanju nalazi nasumična varijabla, i zato
će usrednjena entropija biti veća

1 1 1 1 1 1 1 1 1 1
     
H Q; , , · · · , = H Q + 1; , , · · · , , 0 ≤ H Q + 1; , ,··· , , .
Q Q Q Q Q Q Q+1 Q+1 Q+1 Q+1

Uočimo sada jedno NOVO SVOJSTVO usrednjene entropije. Krenimo od skupa Q vrijed-
nosti nasumične varijable i njemu pridružene usrednjene entropije

{ A1 , A2 , · · · , A Q } → H[ Q; P(1), P(2), · · · , P( Q)].

Neka se sada vrijednost AQ može ostvariti 6 na R različitih načina označenih s AQ,r

AQ = { AQ,1 , AQ,2 , · · · , AQ,R },

s vjerojatnostima koje osiguravaju sačuvanje normiranja raspodjele vjerojatnosti

P( Q) = P( Q, 1) + P( Q, 2) + · · · + P( Q, R).

Proširenom skupu vrijednosti nasumične varijable A

{ A1 , A2 , · · · , AQ−1 , AQ,1 , AQ,2 , · · · , AQ,R }

je pridružena usrednjena entropija

H[ Q − 1 + R; P(1), P(2), · · · , P( Q − 1), P( Q, 1), P( Q, 2), · · · , P( Q, R)].

I sam podskup { AQ,1 , AQ,2 , · · · , AQ,R } ima dobro definiranu pridruženu usrednjenu
entropiju

H[ R; p( AQ,1 ), p( AQ,2 ), · · · , p( AQ,R )].

Uvjetne vjerojatnosti u gornjem izrazu označene s p( AQ,r ) jesu vjerojatnosti da se


ostvarla vrijednost AQ,r , s time da se naravno, uz odred̄enu vjerojatnost, ostvarila i
sama vrijednost AQ . U skladu s relacijom (2.11) o uvjetnoj vjerojatnosti, vrijedi da je

P( Q, r )
p( AQ,r ) = , P( Q) 6= 0.
P( Q)
6U čestičnoj slici to znači da je npr. AQ energijsko stanje čestice koje je R puta degenerirano (Zeemanpv
ili Starkov učinak u kvantnoj mehanici. U slici nasumične varijable to može značiti da čitav jedan interval
vrijednosti shvaća kao jedna vrijednost. U slici nasumičnih procesa to znači da je jedan skup ishoda
shvaćen kao jedan jedini ishod.), a H( R) je pridružena usrednjena entropija tog stanja.
5.1 Entropija 277

Time i usrednjena entropija podskupa { AQ,1 , AQ,2 , · · · , AQ,R } postaje jednaka


P( Q, 1) P( Q, 2) P( Q, R)
 
H R; , ,··· , , P( Q) 6= 0. (5.1)
P( Q) P( Q) P( Q)
Porastom broja elemenata skupa, povećava se i nesigurnost u odred̄ivanju konfiguracije
u kojoj se nalazi, pa će zato biti
H[ Q − 1 + R; P(1), P(2), · · · , P( Q − 1), P( Q, 1), P( Q, 2), · · · , P( Q, R)]
≥ H[ Q; P(1), P(2), · · · , P( Q − 1), P( Q)].
Rožemo li zaključiti KOLIKOG JE IZNOSA to povećanje nesigurnosti? Budući da ono
potječe od porasta nesigurnosti uslijed rastava ishoda AQ na niz ishoda AQ,r , jasno
je da taj porast nesigurnosti mora biti srazmjeran usrednjenoj entropiji podskupa
{ AQ,1 , AQ,2 , · · · , AQ,R } danoj izrazom (5.1), a koeficijent srazmjernosti je upravo vje-
rojatnost da se ishod7 AQ uopće i dogodio, tj. P( Q)
H[ Q − 1 + R; P(1), P(2), · · · , P( Q − 1), P( Q, 1), P( Q, 2), · · · , P( Q, R)] (5.2)
P( Q, 1) P( Q, 2) P( Q, R)
 
= H[ Q; P(1), P(2), · · · , P( Q − 1), P( Q)] + P( Q) · H R; , ,··· , .
P( Q) P( Q) P( Q)
Kao što smo ishod AQ shvatili kao složeni ishod koji se ostvaruje kroz R elementarnih
ishoda, isto tako možemo i sve ostale ishode An shvatiti kao složene ishode koji se
ostvaruju kroz Rn elementarnih ishoda
An = { An,1 , An,2 , · · · , An,Rn }, ∀ n = 1, 2, ....., Q
P(n) = P(n, 1) + P(n, 2) + · · · + P(n, Rn ).
Ovakvi rastavi vode na poopćenje prethodne relacije med̄u usrednjenim entropijama,
tako da vrijedi
H[ R1 + R2 + · · · + RQ ; P(1, 1), P(1, 2), · · · , P( Q, RQ )] (5.3)
Q
P(n, 1) P(n, 2) P(n, Rn )
 
= H[ Q; P(1), P(2), · · · , P( Q − 1), P( Q)] + ∑ P(n) H Rn ; ,
P(n) P(n)
,··· ,
P(n)
.
n =1

Razumno je očekivati da će malim promjenama vjerojatnosti P(n), odgovarati i male


promjene usrednjene entropije, tj. usrednjenu entropiju sustava od Q elemenata ćemo
smatrati neprekidnom funkcijom Q varijabla P(1), P(2), · · · , P( Q − 1), P( Q). Pri tome
treba naglasiti da, prema samom svojem značenju8 , usrednjena entropija ne ovisi o
redoslijedu varijabla, već samo o njihovim iznosima
H[ Q; P(1), P(2), · · · , P( Q − 1), P( Q)] = H[ Q; Π( P(1), P(2), · · · , P( Q − 1), P( Q))],
pri čemu
Π[ P(1), P(2), · · · , P( Q − 1), P( Q)]
označava bilo koju od Q ! permutaciju skupa { P(1), P(2), · · · , P( Q − 1), P( Q)}.

Osnovna tvrdnja koja odred̄uje analitički izraz za usrednjenu entropiju, jeste Hinčinov
teorem, 5.1.2, ili teorem o jedinstvenosti. Jedan od koraka u dokazu Hinčinova teorema
jeste i Feinsteinov teorem, pa ćemo dokazati najprije taj teorem.

7 Izrazi: vrijednost nasumične varijable, ishod nasumičnog procesa ili stanje čestice su sinonimi.
8 Poredak ishoda An je potpuno proizvoljan, pa je i poredak vjerojatnosti P(n) u izrazu za usrednjenu
entropiju takod̄er proizvoljan.
278 Poglavlje 5. Entropija, vjerojatnost, informacija

Teorem 5.1.1 A. Feinstein, 1954.


Neka je L neopadajuća realna funkcija čiju domenu čine svi realni brojevi x > 1 i za
koju vrijedi da je

L ( x m ) = m L ( x ), ∀ m ∈ N. (5.4)

Tada, za svaki x > 1 vrijedi da je

L( x ) = c0 log( x ),

gdje je c0 pozitivna konstanta.

Dokaz:
Odaberimo proizvoljno realne brojeve x i y i prirodan broj n. Sada, za zadane x, y i n biramo
prirodan broj m tako da vrijedi

x m ≤ y n ≤ x m +1 .

Budući da je logaritamska funkcija monotona, logaritmiranjem gornjih nejednakosti, dobiva se

m log(y) m+1
m log( x ) ≤ n log(y) ≤ (m + 1) log( x ) ⇒ ≤ ≤ . (5.5)
n log( x ) n

Kako je i funkcija L neopadajuća funkcija, to za x > 1 mora biti i

L ( x m ) ≤ L ( y n ) ≤ L ( x m +1 ),

što, zbog pretpostavke teorema (5.4), vodi na

m L(y) m+1
m L ( x ) ≤ n L ( y ) ≤ ( m + 1) L ( x ) ⇒ ≤ ≤ . (5.6)
n L( x ) n

Iz (5.5) i (5.6) se vidi da omjeri log(y)/ log( x ) i L(y)/L( x ), označeni plavim točkama na
Slika 5.1: Uz dokaz Feinsteinova teorema.
slici 5.1 moraju ležati negdje unutar inter-
1
vala širine 1/n. Budući da ne znamo koji je
n od ta dva omjera veći, a koji manji, možemo
samo napisati da je
log(y) L y 1

( ) < ,
m m
+ 1 − ∀ n ∈ N.
n n n log( x ) L( x ) n

Gornja relacija vrijedi za svaki n, pa i za n → ∞, kada je

L(y) L( x )
= .
log(y) log( x )

Ako se za x upravo odabere baza logaritma, x ≡ b, tada gornja relacija vodi na

L(y) = c0 logb (y), c0 ≡ L(b) = const. > 0, (5.7)

što je i trebalo dokazati. Q. E. D.


5.1 Entropija 279

Slika 5.2: A. Feinstein


(jedina dostupna fotografija). Slika 5.3: A. J. Hinčin.

Dokažimo sada i Hinčinov teorem.

Teorem 5.1.2 Aleksandar Jakovljevič Hinčin (1957.), teorem jedinstvenosti.


Ako funkcija H ima slijedeća svojstva:

( a ) H( Q) je neprekidna funkcija za svaku Q-torku brojeva


[ P(1), P(2), . . . , P( Q − 1), P( Q)], pri čemu za svaki pozitivan realan P(n) vrijedi

P(n) ∈ [0, 1];

(b)

H[ Q; P(1), P(2), · · · , P( Q)] = H[ Q + 1; P(1), P(2), · · · , P( Q), 0]


1 1 1
 
H[ Q; P(1), P(2), · · · , P( Q)] ≤ H Q; , , · · · , ;
Q Q Q

( c ) Funkcija H zadovoljava relaciju (5.2)

H[( Q − 1 + R; P(1), P(2), · · · , P( Q − 1), P( Q, 1), P( Q, 2), · · · , P( Q, R)]


P( Q, 1) P( Q, 2) P( Q, R)
 
= H[( Q; P(1), P(2), · · · , P( Q − 1), P( Q)] + P( Q) · H R; , ,··· , ,
P( Q) P( Q) P( Q)

pri čemu je
R
∑ P( Q, r ) = P( Q);
r =1
280 Poglavlje 5. Entropija, vjerojatnost, informacija

tj. njezino poopćenje (5.3)

H[ R1 + R2 + · · · + RQ ; P(1, 1), P(1, 2), · · · , P( Q, RQ )]


Q
P(n, 1) P(n, 2) P(n, Rn )
 
= H[ Q; P(1), P(2), · · · , P( Q − 1), P( Q)] + ∑ P(n) · H Rn ; ,
P(n) P(n)
,··· ,
P(n)
.
n =1

( d ) rang H je podskup od R+ ,

tada je
Q
H[ Q; P(1), P(2), · · · , P( Q − 1), P( Q)] = −c0 ∑ P(n) log [ P(n)] = −c0 hlog [ P(n)]i ,
n =1

pri čemu je c0 pozitivna konstanta.

Dokaz:
Prije samog dokaza, precizirajmo rječnik vezan uz pojam entropije. Riječ entropija s oznakom S,
koristit ćemo za veličinu koju je Boltzmann definirao kao

S(m) = kB ln [Ω(m)],

gdje Ω(m) označava broj konfiguracija sustava s fiksnom vrijednošću odred̄ene opservable, m
(npr. magnetizacije, energije ili nečeg sličnog), a kB je konstanta koja ima dimenziju omjera
energije i temperature (Boltzmannova konstanta). Vjerojatnost da se sustav nad̄e u nekoj od
konfiguracija s danom fiksnom vrijednošću opservable m je (povoljno / moguće)

Ω(m)
P(m) = ,
Ωtot

gdje Ωtot označava ukupan broj konfiguracija dostupnih sustavu (za sve moguće vrijednosti m).
Izražena preko vjerojatnosti, Boltzmannova entropija je jednaka

S(m) = kB ln [ P(m)] + kB ln (Ωtot ),

tj. do na aditivnu konstantu je srazmjerna logaritmu vjerojatnosti nalaženja sustava u nekoj od


konfiguracija s fiksnom vrijednošću odabrane opservable m. Veličina koja je u gornjem iskazu
teorema označen s H, srazmjerna je srednjoj vrijednosti bezdimenzijske entropije, S ≡ S/kB ,
(to je tvrdnja (d) iz teorema), pri čemu se usrednjavanje izvodi pomoću raspodjele vjerojatnosti
P ( m ).

Vratimo se sada dokazu teorema: nazovimo

1 1 1
 
L( Q) ≡ H Q; , , · · · , , Q ∈ N.
Q Q Q

Zbog svojstva (b) je

1 1 1 1 1 1 1
   
L( Q) = H Q + 1; , , · · · , , 0 ≤ H Q + 1; , ,··· , , = L ( Q + 1)
Q Q Q Q+1 Q+1 Q+1 Q+1
⇒ L ( Q ) ≤ L ( Q + 1) Q ∈ N.
5.1 Entropija 281

Zbog gornjeg svojstva i svojstva9 (d) zaključujemo da je L pozitivna i neopadajuća funkcija.


Neka su vjerojatnosti iz (c) odabrane tako da je

Rn Q
1 Rn
P(n, j) = Q
, P(n) = ∑ P(n, j) = Q
, ∑ P(n) = 1.
∑ k =1 R k j =1 ∑ k =1 R k n =1

uvrstimo gornje vrijednosti u (c)


!
1 1 1
H R1 + R2 + · · · + R Q ; Q
, Q ,··· , Q
∑ k =1 R k ∑ k =1 R k ∑ k =1 R k
!
R1 R2 RQ
= H Q; Q , Q ,··· , Q
∑ k =1 R k ∑ k =1 R k ∑ k =1 R k
Q
Rn 1 1 1
 
+∑ Q · H Rn ; , , · · · , ,
n =1 ∑ k =1 R k
Rn Rn Rn
Q
!
R1 R2 RQ Rn
L( R1 + R2 + · · · + RQ ) = H Q; Q
,
Rk ∑kQ=1 Rk
,··· , Q
Rk
+ ∑ Q
L ( R n ).
∑ k =1 ∑ k =1 n =1 ∑ k =1 R k

Odaberimo Rn tako da su svi med̄usobno jednaki

R1 = R2 = · · · = RQ ≡ R.

Prethodna relacija tada postaje

L ( Q · R ) = L ( Q ) + L ( R ).

Iz gornje relacije zaključujemo

Q=R ⇒ L ( R 2 ) = 2 L ( R ),
Q = R2 ⇒ L ( R 3 ) = 3 L ( R ),
Q = R3 ⇒ L( R 4 ) = 4 L( R) ⇒ L ( R m ) = m · L ( R ).

Prema Feinsteinovu teoremu (5.7), za L vrijedi

L( R) = c0 log( R), ∀ R > 1.

Promotrimo sada nasumičnu varijablu/proces sa Q = 2 vrijednosti/ishoda { A1 , A2 }. Pridružena


usrednjena entropija je

H[2; P(1), P(2)] = H(2; p, 1 − p),

jer je, zbog normiranja, P(1) + P(2) = 1, pa postoji samo jedna varijabla P(1) ≡ p i P(2) =
1 − p, za p ∈ [0, 1]. Zapišimo p u obliku racionalnog broja

k1
p= , k1 < k2 , k1 , k2 ∈ Q.
k2
9 Sjetimo se da je rang funkcije f skup svih izlaznih vrijednosti f ; to je skup { f ( x ) : x ∈ X }, gdje X
domena. Rang f može biti isti skup kao i kodomena ili može biti njezin odgovarajući podskup. Općenito,
on je manji od kodomene osim akoje funkcija f surjektivna funkcija.
282 Poglavlje 5. Entropija, vjerojatnost, informacija

Svojstvo (c) u obliku (5.2) uz Q = 2, R = k2 − k1 i

1 − p = P(2) = P(2, 1) + P(2, 2) + · · · + P(2, k2 − k1 )

glasi

H[1 + k2 − k1 ; p, P(2, 1), P(2, 2), · · · , P(2, k2 − k1 )]


P(2, 1) P(2, 2) P(2, k2 − k1 )
 
= H(2; p, 1 − p) + (1 − p) · H k2 − k1 ; , ,··· , .
1− p 1− p 1− p

Na lijevoj strani gornje jednadžbe, neka je

P(2, 1) = P(2, 2) = · · · = P(2, k2 − k1 ) ⇒ P(2, 1) · (k2 − k1 ) = 1 − p


1− p
⇒ P(2, 1) = P(2, 2) = · · · = P(2, k2 − k1 ) = .
k2 − k1
Tada je na desnoj strani

P(2, 1) P(2, 2) P(2, k2 − k1 ) 1


= = ··· = = .
1− p 1− p 1− p k2 − k1

Uvrštavanjem ovih vrijednosti u prethodnu vezu med̄u usrednjenim entropijama, dolazi se do

1 1 1 1
   
H 1 + k2 − k1 ; p, , · · · , = H(2; p, 1 − p) + (1 − p) · H k2 − k1 ; ,··· , .
k2 k2 k2 − k1 k2 − k1
(5.8)

Ponovo se vraćamo svojstvu (c) u obliku (5.2), ali sada uz odabir Q = k2 − k1 + 1 i R = k1 .


Vrijednost Ak2 −k1 +1 shvaćamo kao pokratu za k1 vrijednosti, tako da je

P(k2 − k1 + 1) = P(k2 − k1 + 1, 1) + P(k2 − k1 + 1, 2) + · · · + P(k2 − k1 + 1, k1 ).

Veza med̄u usrednjenim entropijama je

H(k2 ;P(1), P(2), · · · , P(k2 − k1 ), P(k2 − k1 + 1, 1), P(k2 − k1 + 1, 2), · · · , P(k2 − k1 + 1, k1 ))


= H(k2 − k1 + 1; P(1), P(2), · · · , P(k2 − k1 ), P(k2 − k1 + 1))
P(k2 − k1 + 1, 1) P(k2 − k1 + 1, 2) P(k2 − k1 + 1, k1 )
 
+ P ( k 2 − k 1 + 1) · H k 1 ; , ,..., .
P ( k 2 − k 1 + 1) P ( k 2 − k 1 + 1) P ( k 2 − k 1 + 1)

Odaberimo sada vjerojatnosti tako da bude

1
P(1) = P(2) = · · · = P(k2 − k1 ) = P(k2 − k1 + 1, 1) = P(k2 − k1 + 1, 2) = · · · = P(k2 − k1 + 1, k1 ) = .
k2
Ovakvim izborom je i

k1
P(k2 − k1 + 1) = P(k2 − k1 + 1, 1) + P(k2 − k1 + 1, 2) + · · · + P(k2 − k1 + 1, k1 ) = = p.
k2
Prethodna jednakost med̄u usrednjenim entropijam prelazi u
1 1 1
!
1 1 1 1 1
   
k2 k2 k2
H k2 ; , · · · , = H k2 − k1 + 1; , , · · · , , p + p · H k1 ; , ,··· , .
k2 k2 k2 k2 k2 p p p
5.1 Entropija 283

Budući da poredak argumenata u funkciji entropije nije važan (prvi član desne strane), gornja
jednadžba postaje

1 1 1 1 1 1 1 1
     
H k2 ; , · · · , = H k2 − k1 + 1; p, , , · · · , + p · H k1 ; , , · · · , .
k2 k2 k2 k2 k2 k1 k1 k1

Kombiniranjem gornjeg izraza s (5.8), dolazi se do

1 1 1 1
   
H k2 ; , · · · , = H(2; p, 1 − p) + (1 − p) · H k2 − k1 ; ,··· ,
k2 k2 k2 − k1 k2 − k1
1 1 1
 
+ p · H k1 ; , , · · · ,
k1 k1 k1
L(k2 ) = H(2; p, 1 − p) + (1 − p) · L(k2 − k1 ) + p · L(k1 ).

Uvrsti li se u gornju jednadžbu rezultat (5.7) Feinsteinova teorema, dobiva se

H(2; p, 1 − p) = H[2; P(1), P(2)] = −c0 p log( p) + (1 − p) log(1 − p)


 

2
= −c0 P(1) log( P(1)) + P(2) log( P(2)) = −c0 ∑ P(n) log [ P(n)]
 
n =1

Uvrstimo sada u (c) Q = 2, R = 2 i neka je P(2) = P(2, 1) + P(2, 2)

P(2, 1) P(2, 2)
 
H[2 − 1 + 2; P(1), P(2, 1), P(2, 2)] = H[2; P(1), P(2)] + P(2) H 2; ,
P (2) P (2)
H[3; P(1), P(2, 1), P(2, 2)] = −c0 P(1) log( P(1)) + P(2) log( P(2))
 

P(2, 1) P(2, 1) P(2, 2) P(2, 2)


    
− c0 P (2) log + log
P (2) P (2) P (2) P (2)
= −c0 P(1) log( P(1)) + P(2, 1) log( P(2, 1)) + P(2, 2) log( P(2, 2)) .
 

Redefinicijom oznaka P(2, 1) ≡ P(2) i P(2, 2) ≡ P(3), gornja relacija kaže da je


3
H[3; P(1), P(2), P(3)] = −c0 ∑ P(n) log [ P(n)].
n =1

Gornje je rezultate lako popćiti s Q = 2 i Q = 3 na opći Q, s rezultatom

Q
H[ Q; P(1), P(2), · · · , P( Q − 1), P( Q)] = −c0 ∑ P(n) log [ P(n)] = −c0 hlog( P)i .
n =1

(5.9)

Budući da je H[ Q; P(1), P(2), · · · , P( Q − 1), P( Q)] dana zbrojem (5.9), redoslijed P(n)-ova
nije važan. Takod̄er, iako je dokaz izveden kada je p racionalan broj, on vrijedi i za bilo koju realnu
vrijednost p, jer je pretpostavljeno da je entropija kontinuirana funkcija svojih argumenata.
. Q. E. D.
 Primjer 5.2 Q = 3 OBROKA
Restoran brze hrane ima u ponudi tri obroka: junetinu, piletinu i ribu. Za sva tri obroka
su nam poznate cijene, kalorijska vrijednost i vjerojatnosti da će obrok biti topao ili
hladan kada ga nasumični kupac poželi kupiti (tablica 5.1). Sada se nasumična varijabla
284 Poglavlje 5. Entropija, vjerojatnost, informacija

Tablica 5.1: Restoran brze hrane - detalji.

oznaka vrsta cijena (kn) kalorije toplo hladno

A1 junetina 10 1 000 0.5 0.5


A2 piletina 20 600 0.8 0.2
A3 riba 30 400 0.9 0.1

A zove obrok i može poprimiti tri različite vrijednosti, Q = 3, svaku s odred̄enom


vjerojatnošću. Potrebno je odrediti funkciju raspodjele te vjerojatnosti,

P(n) =? n = 1, 2, 3,

tj. vjerojatnost da nasumični kupac kupi odred̄eni obrok An . O raspodjeli vjerojatnosti


znamo da je normirana

P(1) + P(2) + P(3) = 1. (5.10)

Gornja relacija može biti zadovoljena za jako puno različitih izbora vrijednosti P(n) i
zato smatramo da je naše nepoznavanje raspodjele vjerojatnosti veliko. To nepoznavanje
ćemo izraziti usrednjenom entropijom
3
H[3; P(1), P(2), P(3)] ≡ H = − ∑ P(n) log2 [ P(n)]. (5.11)
n =1

Uobičajeno je u binarnoj bazi odabrati c0 = 1 u relaciji (5.9). Usrednjena entropija je


sada izražena u bitima. Zadani problem se rješava primjenom NA ČELA MAKSIMALNE
ENTROPIJE koje kaže da će se SUSTAV NAJVJEROJATNIJE NALAZITI U STANJU U KOJEMU
JE NJEGOVA USREDNJENA ENTROPIJA NAJVE ĆA. Time se osiguravamo da nismo nehotice
sustavu pripisali neku informaciju (naše poznavanje sustava) koju o njemu ne znamo.
Ako je jedna od vjerojatnosti jednaka 1, sve ostale su jednake 0 i usrednjena entropija
je jednaka nuli - stanje sustava (raspodjela vjerojatnosti) je potpuno poznata. Stanje
najvećeg nepoznavanja sustava odgovara raspodjeli P(1) = P(2) = P(3) = 1/3, kada
je svaki dogad̄aj jednako vjerojatan. Ukoliko nemamo dodatnih informacija o sustavu,
upravo takva raspodjela vjerojatnosti je ono što moramo (nepristrano) pretpostaviti.
U skladu s (5.11), ovakvoj raspodjeli vjerojatnosti je pridružena usrednjena entropija
jednaka

H0 = log2 (3) = 1.58496 bita.

U jeziku teorije informacija, ova vrijednost entropije opisuje sustav o kojemu ništa ne
znamo, dok bi se jezikom statističke fizike reklo da je to potpuno neured̄eni sustav. Ova
vrijednost usrednjene entropije je najveća moguća za dani sustav.
No, ukoliko imamo neke dodatne informacije o sustavu, tada možemo naći bolju
raspodjelu vjerojatnosti od navedene, u smislu da ćemo u nju ugraditi tu dodatnu
informaciju i tako smanjiti naše nepoznavanje sustava (raspodjele). Tako ćemo sada
pretpostaviti da imamo jednu informaciju (jedan uvjet), a to je da znamo kolika je
prosječna cijena kupljenog obroka - neka je ona 17.5 kn
3
hC i = 17.5 = ∑ Cn P(n) = 10 · P(1) + 20 · P(2) + 30 · P(3). (5.12)
n =1
5.1 Entropija 285

Jednadžbe (5.10) i (5.12) jesu dvije jednadžbe za tri nepoznanice P(1), P(2) i P(3), pa ne
možemo doći do rješenja. Jednadžbu koja nedostaje, nadomjestit ćemo zahtjevom da
usrednjena entropija (5.11) bude maksimalna. Najprije ćemo iz jednadžba (5.10) i (5.12)
vjerojatnosti P(1) i P(2) izraziti kao funkciju P(3)
P(1) = 0.25 + P(3), P(1) = 0.75 − 2P(3),
a zatim to uvrstiti u izraz za usrednjenu entropiju (5.11)
H = −[0.25 + P(3)] log2 [0.25 + P(3)] − [0.75 − 2P(3)] log2 [0.75 − 2P(3)] − P(3) log2 [ P(3)].
Uvjet maksimuma usrednjene entropije

[0.75 − 2P(3)] 2
" #
∂H
= log2 = 0,
∂P(3) [0.25 + P(3)] P(3)

vodi na kvadratnu jednadžbu za P(3) s dva rješenja


P+ (3) = 0.86709, P− (3) = 0.21624
H[ P+ (3)] = −0.2269 + i 4.4602, H[ P− (3)] = 1.51652 bita.
Očito, P− (3) = 0.21624 prihvaćamo kao rješenje. Raspodjela vjerojatnosti je tada dana
sa
P(1) = 0.46624, P(2) = 0.31752, P(3) = 0.21624.
U skladu s (5.11), ovakvoj raspodjeli vjerojatnosti je pridružena usrednjena entropija
jednaka
H1 = 1.51652 bita.
Ova je vrijednost manja od H0 , jer sada nešto znamo o sustavu (sa stanovišta teorije
informacija), tj. sustav je ured̄eniji (sa stanovišta fizike). Raspodjela je normirana,
zadovoljava uvjet (5.12) i čini usrednjena entropiju maksimalnom mogućom (uz zadani
uvjet). Preostale srednje vrijednosti su
hkalorijei = 1 000 P(1) + 600 P(2) + 400 P(3) = 743.248 cal,
htoplo i = 0.5 P(1) + 0.8 P(2) + 0.9 P(3) = 0.681752,
hhladno i = 0.5 P(1) + 0.2 P(2) + 0.1 P(3) = 0.318248 = 1 − htoplo i .
Primjetimo, da smo umjesto (5.12) krenuli od jedne druge informacije o sustavu, npr.
od informacije da je prosječna kalorijska vrijednost kupljenog obroka jednaka 500 cal,
3
hkalorijei = 500 = ∑ Kn P(n) = 1 000 · P(1) + 600 · P(2) + 400 · P(3), (5.13)
n =1

prethodno opisani postupak bi nas doveo do jedne druge raspodjele vjerojatnosti.


P(1) = −0.25 + 0.5 P(3), P(2) = 1.25 − 1.5 P(3),
H = −[−0.25 + 0.5 P(3)] log2 [−0.25 + 0.5 P(3)] − [1.25 − 1.5 P(3)] log2 [1.25 − 1.5 P(3)] − P(3) log2 [ P(3)]
∂H (1.25 − 1.5 P(3)) 3/2
 
= log2 = 0 ⇒ −248P(3) 3 + 556P(3) 2 − 450P(3) + 125 = 0
∂P(3) (−0.25 + 0.5 P(3)) 1/2 P(3)

P(3) = 0.633709, P(3) = 0.804123 ± i 0.385708

1 2,3
⇒ P(1) = 0.0668545, P(2) = 0.299437, H2 = 1.19889 bita.
286 Poglavlje 5. Entropija, vjerojatnost, informacija

Sada je sustav još ured̄eniji (još više znamo o njemu) i zato je usrednjena entropija još
manja, H2 < H1 < H0 .

hcijenai = 10 P(1) + 20 P(2) + 30 P(3) = 25.6685,


htoplo i = 0.5 P(1) + 0.8 P(2) + 0.9 P(3) = 0.843315,
hhladno i = 0.5 P(1) + 0.2 P(2) + 0.1 P(3) = 0.156685 = 1 − htoplo i .

 Primjer 5.3 Q = 4 OBROKA


Uprava restorana iz prethodnog primjera je odlučila proširiti svoju ponudu jednim
vegetarijanskim obrokom. Za sva četiri obroka su nam poznate cijene, kalorijska vrijed-
nost i vjerojatnosti da će jelo biti toplo ili hladno kada ga nasumični kupac poželi kupiti
(tablica 5.2). Ponovo je ZADATAK ODREDITI FUNKCIJU RASPODJELE VJERJATNOSTI, tj.

Tablica 5.2: Restoran brze hrane - prošireni jelovnik.

oznaka vrsta cijena (kn) kalorije toplo hladno

A1 junetina 10 1 000 0.5 0.5


A2 piletina 20 600 0.8 0.2
A3 riba 30 400 0.9 0.1
A4 tofu 80 200 0.6 0.4

vjerojatnost da nasumični kupac kupi odred̄eni obrok

P(n) =? n = 1, 2, 3, 4.

Ukoliko nemamo nikakvih informacija o sustavu, osim normiranja, moramo (nepris-


trano) pretpostaviti da su sve vjerojatnosti jednake, P(n) = 1/4. U skladu s (5.11),
ovakvoj raspodjeli vjerojatnosti je pridružena usrednjena entropija jednaka

H0 = log2 (4) = 2 bita.

Ako nam je osim normiranja, poznato i da je prosječna cijena obroka jednaka 25 kn

4
hC i = 25 = ∑ Cn P(n) = 10 · P(1) + 20 · P(2) + 30 · P(3) + 80 · P(4), (5.14)
n =1

tada imamo dva uvjeta na raspodjelu

1 = P (1) + P (2) + P (3) + P (4), (5.15)


25 = 10 · P(1) + 20 · P(2) + 30 · P(3) + 80 · P(4),

za četiri nepoznanice P(n). Postupak iz prethodnog primjera bi doveo do entropije koja


bi bila funkcija dvije varijable i njezin (globalni) ekstrem ne bi bilo tako lako naći, kao u
prošlom primjeru. Zato se ovaj (i slični) problem rješava uvod̄enjem L AGRANGEOVIH
5.1 Entropija 287

MNOŽITELJA 10 . Nazovimo ih λ 0 i λ1 . Dva uvjeta pišemo u obliku


4
R1 = ∑ P(n) − 1 = 0,
n =1
4
R2 = ∑ P(n) Cn − 25 = 0.
n =1

Pomoću gornjih uvjeta, Lagrangeovih množitelja i usrednjene entropije, formira se


funkcija H L , tako da se od usrednjene entropije oduzmu dvije nule u obliku gornja dva
uvjeta
4
H L = − ∑ P(n) log2 [ P(n)] − λ 0 R1 − λ1 R2
n =1
4 4 4
" # " #
= − ∑ P(n) log2 [ P(n)] − λ 0 ∑ P ( n ) − 1 − λ1 ∑ P(n) Cn − 25 .
n =1 n =1 n =1

Sada, umjesto maksimuma usrednjene entropije, zahtjevamo da funkcija H L bude


maksimalna u odnosu na sve četiri vjerojatnosti
∂H L 1
=0 ⇒ − log2 [ P(m)] − − λ 0 − λ1 Cm = 0
∂P(m) ln(2)
P(m) = 2− log2 (e)−λ 0 −λ1 Cm
P(1) = 2− log2 (e)−λ 0 −10 λ1 ,
P(2) = 2− log2 (e)−λ 0 −20 λ1 ,
P(3) = 2− log2 (e)−λ 0 −30 λ1 ,
P(4) = 2− log2 (e)−λ 0 −80 λ1 .
Iz uvjeta normiranja je11
4
Z ≡ 2 log2 (e)+λ 0 = ∑ 2−λ1 Cn = 2−10 λ1 + 2−20 λ1 + 2−30 λ1 + 2−80 λ1 .
n =1

Time je konstanta λ 0 izražena preko λ1 . Preostala konstanta λ1 , odred̄uju se iz uvjeta na


srednju vrijednost (5.15)
10 · 2−10 λ1 + 20 · 2−20 λ1 + 30 · 2−30 λ1 + 80 · 2−80 λ1
25 = .
2−10 λ1 + 2−20 λ1 + 2−30 λ1 + 2−80 λ1
Numeričko rješenje gornje jednadžba daje (u odgovarajućim mjernim jedinicama) osam
rješenja za λ1 , od kojih je samo jedno konačno i realno
bit
λ1 = 0.0258568 .
kn
10 Opširnije o Lagrangeovim množiteljima može se naći u odjeljku Lagrangeovi množitelji u G LUMAC ,

Matematičke metode fizike.


11 Prisjetimo se:

ln( x ) 1
f ( x ) = logb ( x ) = ⇒ f 0 (x) = ,
ln(b) x ln(b)
1
logb (e) = .
ln(b)
288 Poglavlje 5. Entropija, vjerojatnost, informacija

Znajući λ1 , iz prve od gornjih jednadžba je

log2 (e) + λ 0 = 1.23706 bit.

Iz ovih λ 0 i λ1 slijedi i raspodjela vjerojatnosti

P(1) = 2log2 (e)−λ 0 −10 λ1 = 0.354626,


P(2) = 2log2 (e)−λ 0 −20 λ1 = 0.296438,
P(3) = 2log2 (e)−λ 0 −30 λ1 = 0.247798,
P(4) = 2log2 (e)−λ 0 −80 λ1 = 0.101138.

Maksimalna vrijednost usrednjene entropije je

Hmax = 1.88348 bit < H0 .

5.2 Maksimum usrednjene entropije - diskretno


Nadovežimo se sada (malo općenitije) na primjere iz prethodnog odjeljka. Do sada je (u
odjeljku 4 za diskretnu i kontinuiranu nasumičnu varijablu) pokazano kako se iz poznate
raspodjele vjerojatnosti, računaju momenti i općenito srednje vrijednosti raznih funkcija
nasumične varijable. U ovom će se odjeljku pokazati da je moguće ići i u suprotnom
smjeru - iz samo nekoliko poznatih srednjih vrijednosti, mogu se dobiti raspodjele
vjerojatnosti12 . Ponovo je zadatak IZRA ČUNATI RASPODJELU VJEROJATNOSTI13 . To će se
izvesti u nekoliko koraka koji će sadržavati sve što unaprijed znamo o raspodjeli koju
želimo izračunati:
( a ) funkcija raspodjele mora bit normirana

∑ P(n) = 1, (5.16)
n

što zapisujemo u obliku uvjeta

R0 = ∑ P(n) − 1 = 0,
n

( b ) funkcija raspodjele mora zadovoljavati K uvjeta oblika

Rk = ∑ f k (n) P(n) − h f k i = 0, k = 1, 2, · · · , K, (5.17)


n

gdje su h f k i unaprijed poznate (zadane) konstante,


( c ) funkcija raspodjele mora biti takva da čini usrednjenu entropiju maksimalnom
(ovom prigodom ćemo koristiti prirodne logaritme u definiciji usrednjene entropije i
radi jednostavnosti, odbarat14 ćemo da je c0 = 1)

H = − ∑ P(n) ln [ P(n)] = max. (5.18)


n
12 Usporeditis postupkom sa strane 128.
13 Osim iz uvjeta ekstrema usrednjene entropije, raspodjela vjerojatnosti se može računati i iz master
jednadžbe (vidjeti npr. u poglavlju o master jednadžbi u G LUMAC, Statistička fizika).
14 Time usrednjena usrednjena entropija postaje bezdimenzijska veličina. Prava, fizička entropija ima

dimenziju Boltzmannove konstante, tj. dimenziju energije podjeljene s temperaturom.


5.2 Maksimum usrednjene entropije - diskretno 289

( d ) nepoznata raspodjela vjerojatnosti će se računati iz zahtjeva da je usrednjena en-


tropija maksimalna, nadopunjenog uvjetom normiranja (5.16) i dodatnim15 uvjetima
oblika (5.17) kojima se fiksiraju srednje vrijednosti odred̄enih funkcija (opservabla);
pomoću usrednjene entropije i Lagrangeovih množitelja λk , definira se Lagrangeova
funkcija16 , H L ,
K
HL = H − ∑ λk Rk
k =0
K
" # " #
= − ∑ P(n) ln [ P(n)] − λ 0 ∑ P(n) − 1 − ∑ λk ∑ f k (n) P(n) − h f k i
n n k =1 n

i računa se njezin ekstrem (na H L nema nikakvih dodatnih uvjeta) u odnosu na P(m).

∂H L
= 0.
∂P(m)

Započnimo s (d)
K
∂H L
= 0 = − ln [ P(m)] − 1 − λ 0 − ∑ λk f k (m)
∂P(m) k =1
K
" #
P(m) = exp −1 − λ 0 − ∑ λk f k (m) .
k =1

Gornji izraz se uvrsti u uvjet normiranja (5.16) i dobiva se

K K
" # " #
1 = ∑ exp −1 − λ 0 − ∑ λk f k (m) ⇒ Z≡e 1+ λ 0
= ∑ exp − ∑ λk f k (m) ,
m k =1 m k =1
(5.19)

gdje se Z naziva PARTICIJSKA FUNKCIJA. Sada se izraz17 za P(n)


h i
K exp − ∑kK=1 λk f k (n)
" #
P(n) = Z −1 exp − ∑ λk f k (n) = h i (5.20)
k =1 ∑m exp − ∑kK=1 λk f k (m)

uvrštava u jednadžbe uvjeta (5.17)


h i
K
f
∑n k ( n ) exp − λ f
∑ k =1 k k ( n ) K
" #
h fk i = h i ⇒ ∑ [h f k i − f k (n)] exp − ∑ λk f k (n) = 0.
∑m exp − ∑kK=1 λk f k (m) n k =1

15 Svi uvjeti o kojima je ovdje riječ jesu holonomni (ne sadrže derivacije, tj. radi se o algebarskim, a ne
diferencijalnim jednadžbama) i skleronomni (ne sadrže vrijeme u eksplicitnom obliku).
16 Iako se jednako zovu, to NIJE Lagrangeova funkcija koja se pojavljuje u kontekstu analitičke mehanike.
17 Usporedba (5.20) s kanonskom raspodjelom statističkog ansambla

1 −β E
P( E) = e ,
Z
ukazuje da se temperatura, β = 1/(kB T ), matematički pojavljuje kao Lagrangeov množitelj pridružen
energiji.
290 Poglavlje 5. Entropija, vjerojatnost, informacija

(5.21)
To je nelinerani K × K sustav jednadžba kojim se nepoznanice λ1 , · · · , λK izraze preko
poznatih veličina h f 1 i , . . . , h f K i. Kada su na takav način odred̄ene λ1 , · · · , λK , one se
uvrste u (5.20) i time je okončan postupak računa raspodjele vjerojatnosti P(n). Do-
bivena raspodjela je normirana, zadovoljava uvjete (5.17) i čini usrednjenu entropiju
maksimalnom. Evo nekoliko primjera.

 Primjer 5.4 G EOMETRIJSKA RASPODJELA


U ovom promjeru je zadatak naći raspodjelu P(n) diskretne nasumične varijable n koja
može poprimiti Q → ∞ vrijednosti n = 1, 2, 3, . . .. Osim normiranja, jedini uvjet koji
se nameće na raspodjelu jeste da je srednja vrijednost varijable jednaka 1/p, gdje je
p ∈ [0, 1] konstanta

1 (5.17)
hni = = ∑ n P(n) −−−−−−−−→ f 1 (n) ≡ n.
p n =1 K=1
Prema (5.19) i (5.20), particijska funkcija i vjerojatnost su dane sa

e −λ 1 − e −λ −λ n
Z= ∑ e −λ n =
1 − e −λ
, P(n) =
e −λ
e ,
n =1

pri čemu smo za račun zbroja koristili relaciju (A.16). Vrijednost kostante λ se odred̄uje
iz sustava (5.21), koji se sada sastoji od samo jedne jednadžbe za jednu nepoznanicu
∞ ∞
1 1 1 − e −λ
p
=
Z ∑ n e −λ n =
e −λ ∑ n e −λ n .
n =1 n =1

Rješenje gornjeg zbroja je dano relacijom (A.17),



r
∑ n · rn =
(1 − r ) 2
|r | < 1,
n =1

što daje Lagrangeovu konstantu λ izraženu preko konstante p iz uvjeta.


e −λ = 1 − p.
Poznavajući konstantu λ, raspodjela vjerojatnosti je dana relacijom (5.20)
P(n) = (1 − p) n−1 p, (5.22)
što prepoznajemo kao geometrijsku raspodjelu iz odjeljka 4.1.2.
Provjerite je li raspodjela normirana.
Izračunajmo i maksimalnu vrijednost usrednjene entropije (5.18) pridružene geometrij-
skoj raspodjeli
∞ h i
Hmax = − ∑ (1 − p) n−1 p ln (1 − p) n−1 p .
n =1

Koristeći (A.15) i (A.16), lako se dolazi do


1− p
Hmax = − ln(1 − p) − ln( p).
p

5.2 Maksimum usrednjene entropije - diskretno 291

 Primjer 5.5 B INOMNA RASPODJELA


U ovom promjeru je zadatak naći raspodjelu P(n) diskretne nasumične varijable n koja
može imati slijedeće vrijednosti n = 0, 1, 2, 3, · · · , N. Osim normiranja, nameće se još
jedan uvjet na raspodjelu u obliku fiksiranja srednje vrijednosti raspodjele
N
(5.17)
hni = N p = ∑ n P(n) −−−−−−−−→ f (n) ≡ n.
K=1

gdje je p ∈ [0, 1] konstanta


dovršiti
Koristeći ..., lako se dolazi do
1
Hmax = ln [2πeN p(1 − p)] + O(1/N )
2
dovršiti 

VIŠE DISKRETNIH VARIJABLA


Slično gornjem izlaganju, može se provesti i postupak računa raspodjele vjerojatnosti
više od jedne diskretne nasumične varijable. Sada je potrebno odrediti funkciju raspo-
djele N diskretnih nasumičnih varijabla n1 , n2 , · · · , nN

P ( n1 , n2 , · · · , nN ).

Ako npr. svaka od N nasumičnih varijabla može imati jednu od Q = 5 vrijednosti (ili
u čestičnoj slici, ako se svaka od N čestica može naći u jednom od pet stanja), tada
postoji Ωtot = Q N = 5 N mogućih med̄usobno različitih N-torki brojeva (n1 , n2 , · · · , nN ).
Te N-torke brojeva se nazivaju konfiguracije i označavaju slovom C . U tom smislu ćemo
umjesto vjerojatnosti N-torke nasumičnih brojeva, govoriti o vjerojatnosti konfiguracije

P(n1 , n2 , · · · , nN ) ≡ P(C).

Zbroj po svim mogućim vrijednostima nasumičnih varijabla n1 , n2 , · · · , nN jednak je


zbroju po svim mogućim konfiguracijama C i označen je brojem Ωtot
Ωtot
∑ ∑ · · · ∑ ·1 = ∑ ·1 = Ωtot .
n1 n2 nN C=1

Raspodjela je normirana na način da je


Ωtot
∑∑ · · · ∑ P ( n1 , n2 , · · · , nN ) ≡ ∑ P(C) = 1. (5.23)
n1 n2 nN C=1

Problem odred̄enja raspodjele P(C) je sličan jednom mehaničkom18 problemu, a to je


problem odred̄ivanja optimalne putanje sustava čestica: definira se jedna funkcija koja
se zove AKCIJA ILI DJELOVANJE i onda se putanja sustava čestica odredi iz zahtjeva da
funkcija djelovanja bude ekstremna što dalje vodi na Euler-Lagrangeove jednadžbe itd.
Sada će se postupiti na sličan način i tražit će se takva raspodjela vjerojatnosti koja
18 Vidjeti npr. poglavlje ... u G LUMAC, Klasična mehanika
292 Poglavlje 5. Entropija, vjerojatnost, informacija

će učiniti da jedna druga funkcija, u ovom slučaju USREDNJENA ENTROPIJA , BUDE
MAKSIMALNA . U skladu s (5.18) usrednjena entropija

Ωtot
H = − ∑ P(C) ln [ P(C)]
C=1

se shvaća kao funkcija koja ovisi o raspodjeli P(C) kao varijabli. Sada ćemo tražiti
ekstrem (maksimum) usrednjene entropije, ali uz jedan dodatni uvjet - da je raspodjela
P(C) normirana, (5.23). Kao što je poznato iz matematičke analize, traženje ekstrema
funkcije uz istovremeno zadovoljavanje nekih uvjeta, se izvodi metodom Lagrangeovih
množitelja. Tako će se postupiti i sada. Definira se Lagrangeova funkcija, H L

Ωtot Ωtot Ωtot


" # " #
HL = H − λ ∑ P(C) − 1 = − ∑ P(C) ln [ P(C)] − λ ∑ P(C) − 1
C=1 C=1 C=1

i traži se ekstrem H L u odnosu na P(C). Na ekstreme funkcije H L nema nikakvih uvjeta


i zato se njezin ekstrem računa na ubičajen način izjednačavanjem derivacije funkcije s
nulom
∂H L
=0 − ln P(C 0 ) − 1 − λ = 0 P(C 0 ) = e−1−λ .
 
⇒ ⇒
∂P(C 0 )

Dakle, P(C) je konstantno tj. neovisno u kojoj se konfiguraciji sustav nalazi, tj. neovisno
o vrijednostima nasumičnih varijabla n1 , n2 , · · · , nN . Iz uvjeta normiranja (5.23) se lako
vidi da je ta konstanta jednaka

1
e−1− λ = ⇒ λ = −1 + ln(Ωtot )
Ωtot

gdje je Ωtot ukupan broj konfiguracija koje se mogu formirati od N nasumičnih varijabla.
No, zbog ekstremne jednostavnosti ovog problema, time je ujedno odred̄ena i sama
raspodjela

1
P(C) = const. = .
Ωtot

Sve su konfiguracije (mikroskopska stanja) jednako vjerojatne. U tom slučaju najveća


vrijednost usrednjene entropije je jednaka (za konstantu c0 ćemo odabrati Boltzmannovu
konstantu)

Ωtot
1 1
 
Hmax = −kB ∑ P(C) ln [ P(C)] = −kB Ωtot
Ωtot
ln
Ωtot
= kB ln(Ωtot ),
C=1

što je Boltzmannov izraz za maksimalnu entropiju.


Pretpostavimo sada da osim uvjeta normiranja (5.16), raspodjela mora biti takva da
zadovoljava još K uvjeta analognih višedimenzijskom poopćenju uvjeta (5.17), a to je
da srednja vrijednost proizvoljne funkcije f k (C) ima neku fiksnu, unaprijed zadanu
vrijednost koja će se označavati s h f k i

Ωtot
Rk = ∑ f k (C) P(C) − h f k i = 0, k = 1, 2, · · · , K. (5.24)
C=1
5.2 Maksimum usrednjene entropije - diskretno 293

Sada se opet traži ekstrem entropije, ali ovoga puta uz zahtjeve da P(C) zadovoljava
uvjete (5.23) i (5.24). Ponovo se definira Lagrangeova funkcija koja je sada oblika
Ωtot K
H L ( P, λk ) = − ∑ P(C) ln [ P(C)] − ∑ λk Rk
C=1 k =0
Ωtot Ωtot K Ωtot
" # " #
= − ∑ P(C) ln [ P(C)] − λ 0 ∑ P(C) − 1 − ∑ λk ∑ f k (C) P(C) − h f k i .
C=1 C=1 k =1 C=1

Uvjet ekstrema Lagrangeove funkcije daje jednadžbu


K
∂H L
0 ln P 0
1 ∑ λk f k (C 0 ),
 
= − (C ) − − λ 0 −
∂P(C 0 ) k =1
K
ln P(C 0 ) = −1 − λ 0 − ∑ λk f k (C 0 ). (5.25)
 
k =1

Gornji izraz za raspodjelu vjerojatnosti se uvrsti u uvjet normiranja (5.23) i dobiva se


Ωtot K Ωtot K
" # " #
1= ∑ exp −1 − λ 0 − ∑ λk f k (C) ⇒ Z ≡ e 1+ λ 0 = ∑ exp − ∑ λk f k (C) ,
C=1 k =1 C=1 k =1
(5.26)
gdje je sa Z označena particijska funkcija. Sada se izraz za P(C)
h i
K exp − ∑kK=1 λk f k (C)
" #
P(C) = Z −1 exp − ∑ λk f k (C) = (5.27)

h i
K
=1 exp − ∑l =1 λl f l (C )
k =1 ∑C 0tot 0

uvrštava u jednadžbe uvjeta (5.24)


h i
∑C=tot1 f k (C) exp − ∑lK=1 λl f l (C) Ωtot K
" #
h fk i = ∑ h f k i − f k (C) exp − ∑ λl f l (C) = 0,
 


h i
K
∑C 0tot
=1 exp − ∑ r = 1 λ r f r (C 0) C=1 l =1

(5.28)
za k = 1, 2, · · · , K. To je nelinerani K × K sustav jednadžba kojim se nepoznanice
λ1 , · · · , λK izraze preko poznatih veličina h f 1 i , . . . , h f K i. Kada su na takav način odre-
d̄ene λ1 , · · · , λK , one se uvrste u (5.27) i time je okončan postupak računa raspodjele
vjerojatnosti P(C). Dobivena raspodjela je normirana, zadovoljava uvjete (5.24) i čini
usrednjena entropiju maksimalnom.

 Primjer 5.6 N ASUMI ČAN HOD : MAGNETIZACIJA


Potrebno je naći raspodjelu vjerojatnosti, P, nasumičnog hoda u jednoj dimenziji za
N izvedenih koraka (s početkom u ishodištu). Svaki korak, σn , je nasumična varijabla
koja s vjerojatnošću p = const. ima vrijednost σn = +1 i označava korak u desno, a s
vjerojatnošću q = 1 − p ima vrijednost σn = −1 i označava korak u lijevo. Raspodjela
vjerojatnosti P je funkcija N diskretnih varijabla σn .
N   N
P(σ1 , σ2 , · · · , σN ) = ∏ p δσn ,+1 + q δσn ,−1 = ∏ p(1+σn )/2 q(1−σn )/2 . (5.29)
n =1 n =1
294 Poglavlje 5. Entropija, vjerojatnost, informacija

Pogledajmo sada, hoće li se ista raspodjela dobiti i primjenom postupka maksimizacije


usrednjene entropije izloženog u ovom odjeljku. Svaki (nasumični) odabir vrijednosti
σn jeste jedna konfiguracija C
C ≡ (σ1 , σ2 , · · · , σN ).
Postoji Ωtot = 2 N raznih konfiguracija19 nasumičnog hoda od N koraka, tj. raspodjela
vjerojatnosti P(C) ima 2 N vrijednosti. Da bismo odredili P moramo zahtjevati da
ona udovoljava nekim uvjetima. Najopćenitiji uvjeti koji se postavljaju na raspodjelu
vjerojatnosti jesu pozitivnost i normiranost.
Ωtot
∑ P(C) = 1. (5.30)
C=1

Neka je osim normiranja (5.30), zadan i još jedan uvjet (K = 1 u (5.24)). Neka taj uvjet
odred̄uje srednju vrijednost položaja, Msr , čestice nakon N izvedenih koraka
N
* +
h f 1 i ≡ Msr = ∑ σn = ∑ ∑ ··· ∑ (σ1 + σ2 + · · · + σN ) P(σ1 , σ2 , · · · , σN ),
n =1 σ1 =±1 σ2 =±1 σN =±1

(5.31)
f 1 (σ1 , σ2 , · · · , σN ) ≡ σ1 + σ2 + · · · + σN .
Ova se veličina interpretira u terminima magnetizma kao srednja magnetizacija: korak
u desnu stranu se shvaća kao vrijednost spina čestice +1 ≡↑, a korak u lijevu stranu
kao vrijednost spina čestice −1 ≡↓.
Prema (5.25) je
N
P(σ1 , σ2 , · · · , σN ) = e−1−λ 0 −λ1 (σ1 +σ2 +···+σN ) = e−1−λ 0 ∏ e− λ 1 σn
.
n =1

Iz uvjeta normiranja se dobiva λ 0 izražen preko λ1

e1+λ 0 = ∑ ∑ ··· ∑ e−λ1 (σ1 +σ2 +···+σN )


σ1 =±1 σ2 =±1 σN =±1
! ! !
 N
= ∑ e−λ1 σ1 ∑ e−λ1 σ2 ··· ∑ e−λ1 σN = e λ1 + e − λ1 ,
σ1 =±1 σ2 =±1 σN =±1

∏nN=1 e−λ1 σn N
e−λ1 σn
 
⇒ P(σ1 , σ2 , · · · , σN ) = N
= ∏ e λ1 + e − λ1
. (5.32)
(e λ1 + e − λ1 ) n =1

Gornja raspodjela vjerojatnosti se sada uvrsti u jednadžbu uvjeta (5.31)


1
Msr =
(e− λ1 + e λ1 ) N ∑ ∑ ··· ∑ (σ1 + σ2 + · · · + σN ) e−λ1 (σ1 +σ2 +···+σN ) .
σ1 =±1 σ2 =±1 σN =±1

Pogledajmo samo prvi član desne strane gornjeg izraza


! ! !
1
(e−λ1 + e λ1 ) N σ1∑ ∑ e−λ1 σ2 · · · ∑
σ1 e−λ1 σ1 e−λ1 σN
=±1 σ2 =±1 σN =±1

1 λ1 − λ1 − λ1 λ1 N −1 + e− λ1 − e λ1
= (− e + e ) ( e + e ) = .
(e− λ1 + e λ1 ) N e− λ1 + e λ1
19 Ove se konfiguracije lako povezuju s binarnim zapisom brojeva 0, 1, 2, · · · , 2 N − 1.
5.2 Maksimum usrednjene entropije - diskretno 295

Nije teško zaključiti da će i svi ostali članovi desne strane istog izraza dati iste doprinose
i zato je

e λ1 − e− λ1
Msr = − N = − N tanh(λ1 ).
e λ1 + e − λ1
Rješavanjem gornje jednadžbe po λ1 dobiva se Lagrangeov množitelj izražen preko
konstante Msr iz jednadžbe uvjeta
s
1 + msr Msr
e λ1 = , msr ≡ . (5.33)
1 − msr N

Ovime je problem u biti riješen, jer uvrštavanje gornjeg izraza u (5.32) daje traženu
raspodjelu vjerojatnosti

2
 N/2
1 − msr 1 1 − msr
   
P(σ1 , σ2 , · · · , σN ) = exp − ln σ1 + σ2 + · · · + σN .

2N 2 1 + msr

Primjetimo još i da se konstanta iz uvjeta, Msr , može izraziti preko p, vjerojatnosti skoka
u desnu stranu. Slučajnim hodom, nakon N koraka, čestica će prosječno napraviti

h ND i = N · p

koraka na desnu stranu (pozitivan smjer osi) i prosječno

h NL i = N · q = N · (1 − p)

koraka na lijevu stranu (negativan smjer osi). To znači da će se nakon N koraka čestica
u prosjeku naći u točki

Msr = h ND i − h NL i = (2p − 1) N ⇒ msr = 2p − 1.

Sada se i upravo dobivena raspodjela vjerojatnosti može izraziti preko p i q = 1 − p, na


vrlo simetričan način
1 p
   
P(σ1 , σ2 , · · · , σN ) = ( pq) N/2 exp ln

· σ1 + σ2 + · · · + σN
2 q
 
N/2 σ1 +σ2 +···+σN /2 − σ1 +σ2 +···+σN /2
= ( pq) p q
N  
= ∏ p 1+σn /2 q 1−σn /2 ,
n =1

a to je upravo raspodjela (5.29). Takod̄er primjetimo da je ukupna vjerojatnost za N


koraka jednaka umnošku vjerojatnosti za svaki pojedini korak
 
1+σn /2 1−σn /2
P(σ1 , σ2 , · · · , σN ) = P(σ1 ) · P(σ2 ) · · · P(σN ), P(σn ) = p q .

To znači da su σn nezavisne nasumične varijable. 

 Primjer 5.7 N ASUMI ČAN HOD : MAGNETIZACIJA + ENERGIJA


Pogledajmo sada kakva će se raspodjela dobiti ako pored uvjeta (5.31), tražimo mak-
simum usrednjene entropije zahtjevajući da srednja vrijednost potencijalne energije
296 Poglavlje 5. Entropija, vjerojatnost, informacija

med̄udjelovanja čestica ima konstantnu zadanu vrijednost E p,sr . Ovaj zahtjev shvaćamo
kao dodatni uvjet u odnosu na uvjet srednje magnetizacije iz prethodnog primjera

N
* +
h f 2 i ≡ E p,sr = ∑ σn σn+1 = ∑ ∑ ··· ∑ (σ1 σ2 + σ2 σ3 + . . . + σN σ1 ) P(σ1 , σ2 , · · · , σN ),
n =1 σ1 =±1 σ2 =±1 σN =±1
N
f 2 (σ1 , σ2 , · · · , σN ) ≡ ∑ σn σn+1 = σ1 σ2 + σ2 σ3 + . . . + σN σ1 .
n =1

Rubni uvjet je periodički σN + 1 ≡ σ1 . Prema (5.26) i (5.27) je

Z = e1+λ 0 = ∑ ··· ∑ exp [ −λ1 (σ1 + σ2 + · · · + σN ) − λ2 (σ1 σ2 + σ2 σ3 + · · · + σN σ1 )],


σ1 =±1 σN =±1
1
P(σ1 , σ2 , · · · , σN ) = exp [ −λ1 (σ1 + σ2 + · · · + σN ) − λ2 (σ1 σ2 + σ2 σ3 + · · · + σN σ1 )].
Z
(5.34)

Particijska funkcija se računa tako da se uvede matrica transfera T, čiji su matrični


elementi jednaki

e − λ1 − λ2 e λ2
 
0 −λ1 (σ+σ0 )/2−λ2 σσ0
T (σ, σ ) = e ⇒ T= .
e λ2 e λ1 − λ2

Tada je
 
Z = Tr T N = t+N + t−N ,

gdje su t± svojstvene vrijednosti matrice transfera


s
2
cosh(λ1 ) sinh(λ1 )
 q  
− λ2 2
t± = e cosh(λ1 ) ± sinh (λ1 ) + e 4λ2 = ± + e 2λ2 .
e λ2 e λ2

Za veliki N je t+N  t−N , pa je


 q N
Z ≈ t+N = e −λ2 N cosh(λ1 ) + sinh2 (λ1 ) + e 4λ2 .

derivacijom izraza (5.34) po λ1 , dobiva se


!
∂Z
∂λ1 σ1∑ ∑ · · · ∑ −(σ1 + σ2 + · · · + σN ) exp
= −λ1 ∑ σn − λ2 ∑ σn σn+1
=±1 σ2 =±1 σN =±1 n n
N
* +
−1 ∂Z
= ∑ σn = Msr .
Z ∂λ1 n =1

S druge strane, derivacija particijske funkcije daje

−1 ∂Z − N ∂t+ sinh(λ1 )
Msr = ≈ = −N q . (5.35)
Z ∂λ1 t+ ∂λ1
sinh2 (λ1 ) + e 4λ2
5.2 Maksimum usrednjene entropije - diskretno 297

Slično se, derivacijom po λ2 , dobiva


!
∂Z
∂λ2 σ1∑ ∑ · · · ∑ −(σ1 σ2 + σ2 σ3 + · · · + σN σ1 ) exp
= −λ1 ∑ σn − λ2 ∑ σn σn+1
=±1 σ2 =±1 σN =±1 n n
N
* +
−1 ∂Z
= ∑ σn σn+1 = E p,sr .
Z ∂λ2 n =1

Ponovo, derivacija particijske funkcije daje


q
−1 ∂Z − N ∂t+ cosh ( λ 1 ) sinh2 (λ1 ) + e 4λ2 + sinh2 (λ1 ) + 3e 4λ2
E p,sr = ≈ = −N . (5.36)
Z ∂λ2 t+ ∂λ2
q
cosh(λ1 ) sinh2 (λ1 ) + e 4λ2 + sinh2 (λ1 ) + e 4λ2

Jednadžbe (5.35) i (5.36) čitamo kao sustav dvije nelinearne jednadžbe za dva nepoznata
Lagrangeova množitelja λ1 i λ2 iz kojih se, lakim računom, dobiva
2 (1 + e ) 2
msr 2
msr
sinh2 (λ1 ) = e 4λ2 ,
sr
=
(1 − msr2 )[(3 + esr ) 2 − 4msr2 ] (1 − msr2 )
(1 + esr ) 2 Msr E p,sr
e 4λ2 = 2 2
, msr ≡ , esr ≡ .
(3 + esr ) − 4msr N N
U granici λ2 → 0, Lagrangeov množitelj λ1 se svodi na vrijednost (5.33) iz prethodnog
primjera. Poznavajući vrijednosti oba Lagrangeova množitelja, raspodjela vjerojatnosti
se dobiva iz (5.34)
exp [ −λ1 (σ1 + σ2 + · · · + σN ) − λ2 (σ1 σ2 + σ2 σ3 + · · · + σN σ1 )]
P(σ1 , σ2 , · · · , σN ) =  q N .
2
e −λ2 N cosh(λ1 ) + sinh (λ1 ) + e 4λ2

Primjer 5.8 T EORIJA VELIKIH ODSTUPANJA


Ilustrirajmo20 račun entropije (a ne usrednjene entropije) jednim fizikalnim primjerom
koji predstavlja sustav od slobodnih (dakle, bez med̄udjelovanja) čestice spina iznosa
1/2. Promatra se N spinova σ1 , σ2 , · · · , σN od kojih svaki može poprimiti vrijednost ±1.
Magnetizacija po čestici m se prirodno definira kao
N
1 N+ − N−
m=
N ∑ σn =
N
, m ∈ [−1, 1], (5.37)
n =1

gdje je N± broj čestica sa spinom jednakim ± 1. Ukupan broj konfiguracija je 2 N , a


zadatak je izračunati u koliko od tih konfiguracija, magnetizacija ima vrijednost m. S
obzirom na očiti uvjet
N+ + N− = N, (5.38)
cijela je konfiguracija odred̄ena samo brojem N+ (ili, simetrično, samo brojem N− ).
Neka je Ω broj konfiguracija koje sadrže točno N+ čestica spina +1. Taj je broj jednak
broju razmještaja N+ elemenata na N mjesta, a to su kombinacije bez ponavljanja, (1.6)
N N!
 
Ω= =
N+ N+ ! ( N − N+ ) !
20 Opširnije u T OUCHETTE , „The large deviation approach” ili u odjeljku Teorija velikih odstupanja u

G LUMAC, Statistička fizika.


298 Poglavlje 5. Entropija, vjerojatnost, informacija

Iz (5.37) i (5.38) slijedi

1+m 1−m N!
N+ = N N− = N ⇒ Ω (m) =   .
2 2 1+m 1−m
 
N ! N !
2 2

Za velike vrijednosti N, faktorijeli s mogu računati Stirlingovom formulom (4.67)


√  n n
n! = 2πn + ··· ,
e

Što vodi na približni izraz za Ω (m)

Ω ( m ) ≈ e N s(m) ,

gdje je

1+m 1+m 1−m 1−m


   
s(m) = − ln − ln , m ∈ [−1, 1],
2 2 2 2

entropija po čestici (S = N s) pridružena magnetizaciji m.


Gornji se izraz može napisati i preko relativnog broja čestica N± /N

1+m N+ 1−m N−
= ≡ n+ , = ≡ n− ,
2 N 2 N
kao

s(n) = −n+ ln(n+ ) − n− ln(n− ),

gdje je u gornjem izrazu n shvaćen kao dvokomponentni vektor n = (n+ , n− ).


Naglasimo još jednom da gornji izvod vrijedi uz pretpostavku da je N  1. Takod̄er,
gornji izraz vrijedi za sve vrijednosti m ∈ [−1, 1], a ne samo za vrijednosti m koje su blizu
hmi = 0, tj. vrijedi i za velike otklone magnetizacije (parametra reda) od ravnotežne
vrijednosti hmi = 0. 

5.3 Maksimum usrednjene entropije - kontinuirano


U ovom odjeljku ćemo postupke iz prethodnog odjeljka primjeniti na raspodjele vjero-
jatnosti kontinuiranih nasumičnih varijabla. Promatra se D-dimenzijska kontinuirana
realna nasumična varijabla

~ = ( X1 , X2 , · · · , X D ) ,
X

opisana normiranom gustoćom vjerojatnosti ρ(~x ). Zadatak je IZRA ČUNATI GUSTO ĆU
VJEROJATNOSTI tako da budu zadovoljeni odred̄eni uvjeti. Ti uvjeti predstavljaju naše
poznavanje sustava, to su infornacije koje znamo o nasumičnim varijablama. Sam račun
se izvodi u nekoliko koraka koji su kontinuirani analog postupka opisanog za diskretne
nasumične varijable u odjeljku 5.2:
( a ) funkcija gustoće vjerojatnosti mora biti normirana (nulti uvjet)
Z
R0 = ρ(~x ) dx1 dx2 . . . dxD − 1 = 0, (5.39)
5.3 Maksimum usrednjene entropije - kontinuirano 299

( b ) osim normiranja, funkcija gustoće mora zadovoljiti i nekoliko dodatnih uvjeta,


Rk , u obliku zahtjeva da srednje vrijednosti opservabla f k imaju zadane vrijednosti
h fk i
Z
Rk = f k (~x ) ρ(~x ) dx1 dx2 . . . dxD − h f k i = 0, k = 1, · · · , K. (5.40)

( c ) funkcija raspodjele mora biti takva da čini usrednjenu entropiju maksimalnom


(ovom prigodom ćemo koristiti prirodne logaritme u definiciji usrednjene entropije i
radi jednostavnosti, odbarat ćemo da je c0 = 1); izravnim poopćenjem (5.51), dobiva
se izraz za usrednjenu entropiju pridruženu gustoći raspodjele vjerojatnosti ρ(~x )
Z
H=− ln [ρ(~x )] ρ(~x ) dx1 dx2 . . . dxD = max.

( d ) kao i u prethodnom odjeljku, nepoznata raspodjela vjerojatnosti će se računati iz


zahtjeva da je usrednjena entropija maksimalna, nadopunjenog uvjetom normiranja
(5.39) i dodatnim uvjetima oblika (5.40) kojima se fiksiraju srednje vrijednosti odre-
d̄enih funkcija (opservabla). Neka postoji K uvjeta oblika (5.40). Kao i za diskretnu
varijablu, pomoću usrednjene entropije i Lagrangeovih množitelja λk , definira se
Lagrangeova funkcija, H L

K
H L (ρ; λk ) = H(ρ) − ∑ λk Rk
k =0
Z
=− dx1 dx2 . . . dxD ln [ρ(~x )] ρ(~x )
Z 
− λ0 dx1 dx2 . . . dxD ρ(~x ) − 1
K Z 
− ∑ λk dx1 dx2 . . . dxD f k (~x ) ρ(~x ) − h f k i ,
k =1

i računa se njezin ekstrem (na H L nema nikakvih dodatnih uvjeta) u odnosu na ρ.

∂H L
= 0.
∂ρ(~x 0 )

Započnimo s (d)

K
∂H L
0 ln 0
1 ∑ λk f k (~x 0 ).
 
= = − ρ (~
x ) − − λ 0 −
∂ρ(~x 0 ) k =1

Iz gornje jednadžba je

K
" #
ρ(~x ) = exp −1 − λ 0 − ∑ λk f k (~x ) .
k =1
300 Poglavlje 5. Entropija, vjerojatnost, informacija

Kada se gornja ρ(~x ) uvrsti u uvjet normiranja (5.39), dolazi se do


K
Z
" #
e−1− λ 0 exp − ∑ λk f k (~x ) dx1 dx2 . . . dxD = 1,
k =1
K
Z
" #
Z ≡ e 1+ λ 0 = exp − ∑ λk f k (~x ) dx1 dx2 . . . dxD , (5.41)
k =1
h i
K exp − ∑kK=1 λk f k (~x )
" #
1
ρ(~x ) = exp − ∑ λk f k (~x ) = .
Z
R h i
K
k =1 exp − ∑l =1 λl f l (~x ) dx1 dx2 . . . dxD
(5.42)
Uvrštavanje gornje gustoće vjerojatnosti u K jednadžba uvjeta (5.40), vodi do K × K
nelinearnog sustava jednadžba iz kojih se računaju konstante λ1 , · · · , λK
K
" #
1
Z
h fk i = f k (~x ) · exp − ∑ λl f l (~x ) dx1 dx2 . . . dxD (5.43)
Z l =1
K
Z 
" #
h f k i − f k (~x ) · exp − ∑ λl f l (~x ) dx1 dx2 . . . dxD = 0, k = 1, · · · , K.

l =1

To je nelinerani K × K sustav jednadžba kojim se nepoznanice λ1 , · · · , λK izraze preko


poznatih veličina h f 1 i , · · · , h f K i. Kada su na takav način odred̄ene λ1 , · · · , λK , one se
uvrste u (5.42) i time je okončan postupak računa gustoće vjerojatnosti ρ(~x ). Dobivena
raspodjela je normirana, zadovoljava uvjete (5.40) i čini usrednjenu entropiju maksimal-
nom.

Na web stranici
https://en.wikipedia.org/wiki/Maximum_entropy_probability_distribution
se nalazi popis uvjeta koje treba postaviti u odnosu na maksimum entropije, pa da se
dobije odred̄ena raspodjela vjerojatnosti (diskretna i/ili kontinuirana). Evo i nekoliko
od tih primjera.

Primjer 5.9 E KSPONENCIJALNA RASPODJELA


Potrebno je odrediti D = 1-dimenzijsku raspodjelu ρ( x ) realne kontinuirane nasumične
varijable x ∈ [0, +∞i, koja će osim normiranja
Z +∞
ρ( x ) dx = 1,
−∞

zadovoljavati i samo jedan uvjet oblika (5.40). U ovom primjeru to je fiksna vrijednost
prvog momenta raspodjele
Z +∞
1 (5.43)
hxi ≡ = x ρ( x ) dx , −−−−−−−−→ f 1 ( x ) ≡ x,
µ 0 K=1
za fiksnu vrijednost µ. Budući da je K = 1, nema potrebe indeksirati ni uvjete ni
Lagrangeove množitelje. Particijska funkcija se računa iz (5.41) i jednaka je
Z +∞
1
Z= e−λ x dx = .
0 λ
5.3 Maksimum usrednjene entropije - kontinuirano 301

Prema (5.42), gustoća vjerojatnosti je

ρ ( x ) = λ e −λ x (5.44)

Sustav (5.43) se svodi na samo jednu jednadžbu, koja se riješi tabličnim integralom
(A.44),
Z +∞
1 1
=λ x e −λ x = ,
µ 0 λ
čime je i odred̄ena vrijednost Lagrangeova množitelja. Uvrštavanje λ = µ u (5.44) za
gustoću vjerojatnosti, dobiva se

ρ ( x ) = µ e −µ x , (5.45)

što prepoznajemo kao gustoću vjerojatnosti eksponencijalne raspodjele (4.105) iz odjeljka


4.2.10. Kada je poznata gustoća koja maksimizira usrednjenu entropiju, moguće je i
izračunati i koliki je taj maksimalni iznos (uz dani uvjet na prvi moment raspodjele)
Z
Hmax = − ln [ρ( x )] ρ( x ) dx = 1 − ln(µ).

 Primjer 5.10 G AUSSOVA RASPODJELA


Potrebno je odrediti D = 1-dimenzijsku raspodjelu ρ( x ) realne kontinuirane nasumične
varijable x ∈ h−∞, +∞i, koja će osim normiranja
Z +∞
ρ( x ) dx = 1,
−∞

zadovoljavati i dva uvjeta oblika (5.40); u ovom primjeru su to fiksne vrijednosti prva
dva momenta raspodjele
Z +∞
hxi ≡ µ = x ρ( x ) dx , f 1 ( x ) = x,
−∞
Z +∞
x2 ≡ µ2 + σ2 = x 2 ρ( x ) dx , f2 (x) = x 2 ,


−∞

za fiksne vrijednosti µ i σ. Prema (5.41) particijska funkcija Z je dana tabličnim integra-


lom (A.45)
Z +∞ r
− λ1 x − λ2 x 2 π λ21 /(4λ2 )
Z= dx e = e ,
−∞ λ2
a prema (5.42) gustoća vjerojatnosti je
K
λ1 2
" # r "  #
1

λ2
ρ( x ) = exp − ∑ λk f k ( x ) = exp −λ2 x + .
Z k =1
π 2λ2

Vraćamo se uvjetu na fiksnu vrijednost prvog momenta koji je takod̄er tablični integral
(A.46)

λ2 + ∞
r
λ1
Z
2
µ= dx x e−λ2 [ x+λ1 /(2λ2 )] = − .
π −∞ 2λ2
302 Poglavlje 5. Entropija, vjerojatnost, informacija

I uvjet na fiksnu vrijednost drugog momenta je tablični integral (A.47)

λ2 + ∞ λ2
r
1
Z
2 2 2
µ +σ = dx x 2 e−λ2 [ x+λ1 /(2λ2 )] = 12 + .
π −∞ 4λ2 2λ2

Iz gornje dvije relacije se sada lako dobiva

1 π λ21 /(4λ2 ) √
r
µ 2 2
λ1 = − 2 , λ2 = , Z= e = 2π σ e µ /(2 σ ) .
σ 2σ2 λ2

Iz poznavanja particijske funkcije i Lagrangeovih množitelja, dobiva se i konačan izraz


za gustoću vjerojatnosti (5.42)

1 ( x − µ) 2
 
ρ( x ) = √ exp − , (5.46)
σ 2π 2σ2

koji, naravno, prepoznajemo kao Gaußovu raspodjelu (4.79) iz odjeljka 4.2.2. Kada je
poznata gustoća koja maksimizira usrednjenu entropiju, moguće je i izračunati i koliki
je taj maksimalni iznos (uz dane uvjete na prvi i drugi moment raspodjele)
 √ 
Z +∞ ln σ 2π Z +∞ 2 1
Z +∞
2
Hmax = − ln [ρ( x )] ρ( x ) dx = √ e −η dη + √ η 2 e −η dη .
−∞ π −∞ π −∞

Oba integrala su tablični integrali (A.45) i (A.47), koji vode na

1  √ 
Hmax = + ln σ 2π .
2


5.3.1 Entropija prepletenosti


Najprije kratak uvod21 .
Postupak kojim se zadana pravokutna matrica A zapisuje u obliku umnoška tri matrice,
naziva se rastav pomoću singularnih vrijednosti (singular value decomposition, SVD).
Matematička osnova SVD jeste teorem linearne algebre koji kaže da se svaka realna
pravokutna matrica A može napisati kao umnožak tri matrice

A = U · D · V| , (5.47)

pri čemu su matrice U i V ortogonalne

U · U| = U| · U = 1, V · V| = V| · V = 1,

a D je dijagonalna. Na dijagonali matrice D su kvadratni korjeni svojstvenih vrijed-


nosti matrica
√ A · A| , tj. A| · A u opadajućem poretku od najveće prema najmanjoj,
Dnn = λn . Odavde dolazi i riječ singularno u nazivu ovog postupka. Naime, za raz-
liku od kvadratnih matrica iz kojih se uobičajenim postupkom računaju svojstvene
vrijednosti (ili ih se svodi na Jordanov oblik), pravokutne matrice nemaju svojstvene vri-
jednosti. Umjesto toga one imaju singularne vrijednosti koje se definiraju kao kvadratni
korjen iz svojstvenih vrijednosti kvadratnih matrica A · A| i A| · A, čije se svojstvene
vrijednosti računaju uobičajenim postupkom. Ukupan broj ovih svojstvenih vrijednosti
21 Za više detalja vidjeti npr. u G LUMAC, Računalne metode fizike.
5.3 Maksimum usrednjene entropije - kontinuirano 303

koje su različite od nula, označava se s R. Stupci matrice U su normirani svojstveni


vektori matrice A · A| , a stupci matrice V su normirani svojstveni vektori matrice
A| · A. Poredak svojstvenih vektora odgovara poretku svojstvenih vrijednosti - od
najveće prema najmanjoj.

Promatra se kvantni sustav sastavljen od dva podsustava, A i B, opisan valnom funkci-


jom

R

p
|ψi = λr | Ar i | Br i .
r =1

U kvantnoj teoriji informacija PREPLETENOST (entanglement) se smatra kvantnom verzi-


jom KORELACIJA u klasičnoj fizici. Uobičajeno je definirati i koristiti srednju vrijednost
entropije prepletenosti (entanglement entropy) kao mjeru jakosti prepletenosti

R
H = − ∑ λr ln(λr ),
r =1

pri čemu iz normiranja kvantnih stanja |ψi slijedi da je

R
∑ λr = 1.
r =1

Primjetimo da je gornja definicija usrednjene entropije prepletenosti, vrlo slična uobiča-


jenoj (bezdimenzijskoj) definiciji usrednjene entropije, ...,

− ∑ P(n) ln [ P(n)] = − hln( P)i ,


n

gdje je P(n) normirana raspodjela vjerojatnosti diskretne nasumične varijable. Dakle,


singularne vrijednosti iz problema kvantne prepletenosti se pojavljuju u istoj ulozi kao i
klasična raspodjela vjerojatnosti.
Očito, ako je R = 1, tada je stanje sustava potpuno poznato i usrednjena entropija je
najmanja

|ψi = 1 · | A1 i | B1 i ⇒ H = Hmin = 0,

dok se najveća vrijednost usrednjene entropije postiže kada je informacija o stanju u


kojemu se nalazi sustav najmanja, tj. kada je

1
λ1 = λ2 = . . . = λR = .
R

Tada je

R
1
|ψi = √
R
∑ | Ar i | Br i ⇒ H = Hmax = ln( R).
r =1

Sve ostale vrijednosti entropije leže izmed̄u ove dvije ekstremne vrijednosti.
304 Poglavlje 5. Entropija, vjerojatnost, informacija

5.3.2 Tsallisova entropija


Podsjetimo se da je Boltzmann-Gibbs-Shannonova (BGS) negativna srednja vrijednost
entropije, H BGS , do na množenje konstantom kB , jednaka

H BGS = − ∑ P(n) ln [ P(n)] ≡ − hln ( P)i .


n

Indeks n označava sve moguće vrijednosti diskretne nasumične varijable. Negativan


predznak dolazi zato da bi H BGS bila pozitivna. Pored BGS srednje vrijednosti entropije,
postoje i druge definicije srednje vrijednosti entropije. Tako se npr. za danu normirani
diskretnu raspodjelu vjerojatnosti P(n), i proizvoljan realan broj q (entropijski indeks),
Tsallisova22 srednja vrijednost entropije definira kao
1 − ∑n [ P(n)] q
Hq = k B
q−1
, ∑ P(n) = 1. (5.48)
n

Pokažimo da se u granici q → 1, Tsallisova se usrednjena entropija svodi na uobičajenu


BGS usrednjenu entropiju. Neka je q = 1 + δ i izvedimo limes

1 − ∑ n P 1+ δ ( n ) 1 − ∑n P(n) · P δ (n)
Hq=1 = kB lim = kB lim
δ →0 1+δ−1 δ →0 δ
1 − ∑n P(n) · e ln [ P ( n )] 1 − ∑n P(n) · 1 + δ ln[ P(n)] + O(δ 2 )
 
δ
= kB lim = kB lim
δ →0 δ δ →0 δ
1 − ∑n P(n) + δ ∑n P(n) ln[ P(n)] + O(δ 2 )]
= kB lim
δ →0 δ
= −kB ∑ P(n) ln[ P(n)] + lim O(δ).
n δ →0

Gornji izraz prepoznajemo kao BGS srednju vrijednost entropije

H BGS = Hq=1 .
Osobitost Tsallisove entropije je to što je NEADITIVNA za q 6= 1 čak i ako se sustav sastoji
od statistički nezavisnih podsustava. Neka su dva statistički nezavisna (pod)sustava A
i B opisna vjerojatnošću oblika

PA,B = PA · PB ,

pri čemu su PA i PB općenito različite raspodjele vjerojatnosti. Prema (5.48), srednja


entropija sustava sastavljenog od (pod)sustava A i B je
q q q
1 − ∑n PA,B (n) 1 − ∑n A ∈ A PA (n A ) ∑nB ∈ B PB (n B )
Hq ( A + B) = k B = kB .
q−1 q−1
Isto tako, prema (5.48) je

∑ P q (n) = 1 − (q − 1)Hq ,
n

pa se kombiniranjem gornja dva izraza dolazi do


1 − 1 − (q − 1)Hq ( A) · 1 − (q − 1)Hq ( B)
   
Hq ( A + B) = k B
q−1
= H q ( A ) + H q ( B ) − ( q − 1) H q ( A ) · H q ( B ).
22 Constantino Tsallis (1943), grčko-brazilski fizičar.
5.4 Informacija 305

Usrednjena entropija je aditivna samo za q = 1, dok je neaditivna za sve ostale vrijed-


nosti q.
U nekim procesima relaksacije hamiltonijanskih sustava s dugim dosegom med̄udje-
lovanja, opaženi su učinci koji se mogu pripisati Tsallisovoj poopćenoj usrednjenoj
entropiji.

Za kontinuiranu nasumičnu varijablu x opisanu gustoćom vjerojatnosti ρ( x ), Tsallisova


srednja vrijednost entropije se definira kao

1 − ρ q ( x ) dx
R
Hq = .
q−1

Načelo maksimuma usrednjene entropije primjenjeno na Tsallisovu entropiju, zajedno s


odgovarajućim uvjetima oblika ..., vodi na Tsallisove raspodjele vjerojatnosti.
Npr. q - Gaußova raspodjela
p
β 1
ρ( x ) = eq (− βx2 ), e q ( x ) = [ 1 + ( 1 − q ) x ] 1− q ,
Cq

gdje je
√  
2 πΓ 1−1 q

√ , −∞ < q < 1


(3−q) 1−qΓ 2(31−−qq)
 








Cq = π, q = 1,




 √ 
3− q

 πΓ 2( q −1)
√ , 1<q<3.


 
1
q−1Γ

q −1

5.3.3 von Neumannova entropija


Von Neumannova usrednjena entropija je poopćenje klasičnog pojma usrednjene entro-
pije za potrebe kvantne statističke fizike. Za kvantnomehanički sustav opisan MATRI -
COM GUSTO ĆE ρ (oznaku QM matrice gustoće ne treba pomiješati s oznakom gustoće
vjerojatnosti), von Neumannova usrednjena entropija se definira kao

H = − Tr [ρ ln(ρ)].

Neka su | ji svojstveni vektori, a η j svojstvene vrijednosti matrice gustoće. Tada je

ρ = ∑ η j | jih j| ,
j

a usrednjna entropija je

H = − ∑ η j ln η j .

j

5.4 Informacija
Iako se u svakodnevnom životu često koriste izrazi kao što su: zasut sam sa puno
informacija ili imam premalo informacija da bih mogao/mogla napraviti to i to, najčešće
306 Poglavlje 5. Entropija, vjerojatnost, informacija

nitko i ne pomišlja da se to puno informacija ili malo informacija izrazi kvantitativno, bro-
jem. U ovom će se odjeljku pokazati upravo to: kako brojem izraziti količinu informacije.

Razmislimo najprije, na temelju jednog jednostavnog primjera, koji su to dogad̄aji


koji sadrže puno, a koji dogad̄aji sadrže malo informacija. Zamislite da se nalazite
usred kalendarske zime i da na vijestima čujete vremensku prognozu da će sutra biti
jako hladno i da će sniježiti. To će biti vijest koja sadrži malo informacija, jer vi i bez
meteorologa očekujete hladnoću i snijeg usred zime. No, ako na vijestima jave da će

sutra biti sunčano sa temperaturom zraka od +14 C, onda ta vijest sadrži puno infor-
macija. Ako želimo poopćiti ovaj jednostavan primjer, reći ćemo da vijest o dogad̄aju
čija je vjerojatnost vrlo velika, sadrži jako malo informacija. I obratno, vijest o dogad̄aju
koji je malo vjerojatan, sadrži puno informacija. Ovime se ukazuje na vezu izmed̄u
vjerojatnosti ostvarenja nekog dogad̄aja i informacije o tom istom dogad̄aju.

D EFINICIJA INFORMACIJE :
Claude Shannon23 je 1948-1949 objavio radove u kojima je ukazao na vezu izmed̄u
vjerojatnosi, informacije i entropije. Neka se promatra dogad̄aj koji se ostvaruje s vje-
rojatnošću p. Tom se opažanju pridružuje količina informacija I ( p). Ta veličina mora
zadovoljavati slijedeće uvjete:

1. Nenegativna je

I ( p) ≥ 0.

2. Ako su dva dogad̄aja med̄usobno neovisna, tako da je vjerojatnost njihova ostva-


renja jednaka p1 p2 , tada je informacija aditivna

I ( p1 p2 ) = I ( p1 ) + I ( p2 ).

3. I ( p) je kontinuirana funkcija p.
4. Dogad̄aj čije je ostvarenje sigurno, p = 1, ne sadrži nikakvu informaciju

I (1) = 0.

Svi su gornji uvjeti zadovoljeni, ako je

I ( p) = −C0 logb ( p), (5.49)

gdje je C0 pozitivna konstanta koja može biti apsorbirana u bazu logaritma, budući da
je

ln( p)
logb ( p) = .
ln(b)

U skladu s ovom definicijom, manje vjerojatan dogad̄aj sadrži više informacija nego
više vjerojatan dogad̄aj. Dva su izbora baze logaritma najčešća:
C0 = 1 u bazi prirodnog logaritma

I ( p) = − ln( p).
23 Claude Elwood Shannon (30. IV 1916. – 24. II 2001.), američki matematičar, elektroničar i kriptograf.
5.4 Informacija 307

Iz praktičnih razloga (vezanih za uporabu elektroničkih računala) uobičajeno je proma-


trati logaritme u bazi 2, pa odabir C0 = 1 u toj bazi vodi na
I ( p) = − log2 ( p).
Mjerna jedinica za informaciju se u ovom slučaju zove BIT, što dolazi od skraćenja
engleskog izraza BINARY DIGIT. Izračunajmo koliko informacija, u ovoj bazi, sadrži
vijest o dogad̄aju koji može imati samo dva ishoda (Bernoullijev dogad̄aj, strana 60):
nekome od vaše rodbine ili prijatelja, rodilo se dijete i vas zanima spol djeteta. Što znate
o spolu djeteta, prije nego se informirate kod sretnih roditelja? Razumno je pretpostaviti
da je rod̄enje ženskog i muškog djeteta jednako vjerojatno: pž = pm = 12 , pa je
I = log2 (2) = 1.
Kada vam netko od roditelja kaže spol djeteta, Vi ćete dobiti količinu informacija u
iznosu od jedne jedinice. Općenito, informacija ima iznos od jednog bita, ako nam kaže
koji se od DVA jednako vjerojatna dogad̄aja zaista i ostvario.
Primjetimo i da je, u skladu s (5.49)
I (0) = +∞,
što znači da opažanje iznimno rijetkog (malo vjerojatnog) dogad̄aja sadrži veliku koli-
činu informacija.

Zadatak 5.1 Na šahovskoj ploči se nalazi samo jedna figura. Koliko bita sadrži
informacija o položaju te figure? 

Rješenje:
Na šahovskoj ploči postoje 64 polja. Figura može biti na bilo kojem polju, pa je zato vjerojatnost
njezinog nalaženja na bilo kojem polju jednaka
1
p= .
64
Prema definiciji (5.49), informacija o položaju sadrži
1
 
I = − log2 = log2 2 6 = 6 bita.

64

Zadatak 5.2 Svaka se vijest sastoji od odred̄enog broja slova, slogova, brojeva ili ne-
kih drugih simbola. Neka se promatra vijest sastavljena od N različitih
slova. Izračunajte količinu informacija sadržanih u toj vijesti. 

Rješenje:
Kao što je poznato24 , od N različitih elemenata se može napraviti
P(n) = N !
različitih permutacija. Vjerojatnost svake pojedine permutacije je
1
p= ,
P(n)
24 Vidjeti npr. odjeljak 1.1 ove knjige.
308 Poglavlje 5. Entropija, vjerojatnost, informacija

pa zato informacija o tome koja se od tih permutacija pojavila kao vijest, ima

I = log2 [ P(n)] = log2 ( N !) bita.

Ako se unutar skupa od N slova, pojavljuju grupe od po M1 , M2 , · · · istih elemenata, tada je


ukupan broj permutacija jednak, (1.3)

N!
P(n) M1 ,M2 ,··· = ,
M1 ! · M2 ! · . . .
a količina informacija je
h i
I = log2 P(n) M1 ,M2 ,··· = log2 ( N !) − ∑ log2 ( M j !) bita.
j

5.5 Entropija izvora informacije


Zamislimo sada cijeli SKUP nasumičnih dogad̄aja označenih indeksom n (to mogu biti
npr. vrijednosti diskretne nasumične varijable) koji se ostvaruju s vjerojatnostima P(n).
Pitamo se koliki je očekivani (srednji) iznos informacija u N opažanja?
Kolika je vjerojatnost ostvarenja n-tog dogad̄aja u N opažanja? Taj se dogad̄aj može
ostvariti s vjerojatnošću P(n) u prvom opažanju ili s vjerojatnošću P(n) u drugom
opažanju ili ... itd.

P ( n ) + P ( n ) + · · · + P ( n ) = N P ( n ).

U N opažanja će se n-ti dogad̄aj pojaviti približno N P(n) puta i svaki puta će njegovo
ostvarenje pridonijeti informaciju u iznosu I [ P(n)] = − ln [ P(n)], tako da će srednja
vrijednost informacije u N opažanja biti jednaka25

= − N ∑ P(n) · ln [ P(n)] = − N hln( P)i .


n

Srednja količina informacija po jednom opažanju

h IN i
H= = − ∑ P(n) · ln [ P(n)] = − hln( P)i . (5.50)
N n

se naziva bezdimenzijska USREDNJENA ENTROPIJA26 pridružena raspodjeli vjerojatnosti


P(n). Umjesto prirodnog logaritma, može se koristiti i logaritam baze 2 ili koje druge
baze. Maksimum usrednjene entropije odgovara maksimumu količine informacija po
jednom opažanju.
Ako je X kontinuirana nasumična varijabla opisana gustoćom vjerojatnosti ρ( x ), tada je
usrednjena entropija kontinuirane nasumične varijable X definirana u skladu s (5.50)
kao
Z
H = − hln(ρ)i = − dx ln [ρ( x )] ρ( x ). (5.51)

25 U skladu s definicijom srednje vrijednosti, ..., h f i = ∑n f (n) P(n).


26 O definiciji entropije u okviru statističke fizike, napose o njezinoj dimenziji, vidjeti npr. u G LUMAC,
Statistička fizika
5.5 Entropija izvora informacije 309

Pokažimo da je ovako definirana usrednjena entropija aditivna. Neka su zadane dvije


statistički nezavisne normirane diskretne raspodjele vjerojatnosti

PA (n), PB (m).

Zbog nezavisnosti je vjerojatnost ostvarenja A = n i B = m jednaka

Pn,m = PA (n) · PB (m).

Usrednejna entropija ove vjerojatnosti je

H = −∑ ∑ Pn,m ln( Pn,m ) = − ∑ ∑ PA (n) · PB (m) ln [ PA (n) · PB (m)]


n m n m
= −∑ ∑ PA (n) · PB (m) {ln [ PA (n)] + ln [ PB (m)]}
n m
= − ∑ PA (n) ln [ PA (n)] ∑ PB (m) − ∑ PA (n) ∑ PB (m) ln [ PB (m)]
n m n m
A B
=H +H ,

iz čega se vidi da je usrednjena entropija statistički nezavisnih dogad̄aja, aditivna


veličina.

Zadatak 5.3 Kolika je usrednjena entropija izvora informacija koji se sastoji od četiri
različita slova? 

Rješenje:
Od četiri različita slova se mogu napraviti

4 ! = 24

razne permutacije, pa je zato vjerojatnost svake te permutacije jednaka


1
p= .
24
Prema definiciji (5.50), usrednjena entropija je

I log2 (24) 4.58496


H= = = = 1.14624 bita.
N 4 4

Zadatak 5.4 Izračunajte sadržaj informacija u ocjenama iz kolegija Osnove fizičkih


mjerenja i statističke analize. 

Rješenje:
Ako postoji N različitih ocjena i nemamo nikakve dodatne informacije osim da vjerojatnost mora
biti normirana

P(1) + P(2) + · · · + P( N ) = 1,

tada samo možemo pretpostaviti da su sve vjerojatnosti jednake


1
P(n) =
N
310 Poglavlje 5. Entropija, vjerojatnost, informacija

i (binarna) usrednjena entropija je tada jednaka


N N
1 1
 
H = − ∑ P(n) log2 [ P(n)] = − ∑ log2 = log2 ( N ).
n =1 n =1
N N

Ako ostoje samo dvije ocjene (prolaz i pad), N = 2 i

H = log2 (2) = 1 bit.

Ako postoji pet različitih ocjena (nedovoljan, dovoljan, ...), tada je

H = log2 5 = 2.32 · · · bita.


5.5 Entropija izvora informacije 311

Literatura korištena u ovom poglavlju:

1. D ANIEL A ROVAS.
Lecture Notes on Nonequilibrium Statistical Physics. 2014. URL: https : / / www .
academia.edu/11101928/Lecture_Notes_on_Nonequilibrium_%20Statistical_
Physics
2. A LEKSANDAR D AMJANOVI Ć I G EORGIJE L UKATELA.
Teorija telekomunikacija 1. 1959
3. T HIERRY D AUXOIS I DRUGI. „
Dynamics and Thermodynamics of Systems with Long Range Interactions: an
Introduction”. (2002). URL: https://arxiv.org/abs/cond-mat/0208455
4. B RANISLAV I VANOVI Ć.
Teorija verovatnoće. Univerzitetski udžbenici. Naučna knjiga, Beograd, 1977, stra-
nica 328
5. M ARKO P OPOVI Ć.
Entropija. 2017
6. S VETOZAR V. V UKADINOVI Ć.
Zbirka rešenih zadataka iz teorije verovatnoće. Privredni pregled, Beograd, 1990
6. Funkcija izvodnica

P OSTOJI NEKOLIKO vrsta funkcija izvodnica povezanih s teorijom vjerojatnosti. U


ovom odjeljku će se govoriti o njih četiri:

1. funkcija izvodnica rapodjele vjerojatnosti


2. funkcija izvodnica momenata
3. karakteristična funkcija
4. kumulantna funkcija

Pomoću ovih funkcija se mogu računati momenti i kumulanti nasumičnih varijabla na


sličan način kao što se momenti i kumulanti mogu računati iz raspodjela vjerojatnosti.
Razlika je u tome što se momenti i kumulanti iz raspodjela vjerojatnosti računaju
postupkom INTEGRIRANJA, dok se iz funkcija izvodnica momenti i kumulanti računaju
postupkom DERIVIRANJA.

6.1 Funkcija izvodnica raspodjele vjerojatnosti


S PECIJALNE FUNKCIJE
U teoriji specijanih funkcija1 pojavljuje se funkcija izvodnica, g, definirana kao red
potencija čiji su koeficijenti upravo promatrane specijalne funkcije. Tako je npr. funkcija
izvodnica Legendreovih polinoma jednaka

g(z, t) = (1 − 2zt + t 2 ) −1/2 = ∑ Pn (z) · t n ,
n =0

gdje su Pn (z) Legendreovi polinomi n-tog reda. Sličan je i primjer funkcije izvodnice
Besselovih funkcija prve vrste, koje su zadane izrazom

+∞
g( x, t) = e(x/2)(t−1/t) = ∑ Jn ( x ) t n ,
n=−∞

1 Vidjeti npr. u G LUMAC, Matematičke metode fizike, odjeljak o specijalnim funkcijama.


314 Poglavlje 6. Funkcija izvodnica

gdje su Jn ( x ) Besselove funkcije prve vrste i n-tog reda.


V JEROJATNOST
U kontekstu teorije vjerojatnosti, a samo za diskretne nasumične varijable, definira se
funkcija izvodnica raspodjele vjerojatnosti

+∞
g( xn , t) = ∑ P( xn ) t n = ht n i , (6.1)
n =0

gdje je P( xn ) raspodjela vjerojatnosti diskretne nasumične varijable. O jednoj primjeni


funkcije izvodnice vjerojatnosti, više govora će biti u odjeljku ?? o procesima grananja u
kontekstu Markovljevih lanaca. Uvjet normiranja vjerojatnosti je

+∞
g ( x n , t = 1) = ∑ P( xn ) = 1. (6.2)
n =0

Povežimo derivacije funkcije izvodnice s momentima raspodjele.



dg( xn , t) dg( xn , t)

= ∑ n P ( x n ) t n −1 ⇒ = hni ,
dt n =0 dt
t =1

d2 g( xn , t) d2 g( xn , t)

= ∑ n ( n − 1) P ( x n ) t n −2
= n 2 − hni ,


2
⇒ 2
dt n =0 dt
t =1
2
2
d g( xn , t) dg( xn , t) dg( xn , t)

2
⇒ σ = + − .
dt2
t =1 dt
t =1 dt
t =1

 Primjer 6.1 B INARNA VARIJABLA


Promatra se nasumična varijabla x koja poprima samo dvije vrijednosti: nula i jedan.
Vjerojatnost da je x1 = 0 je q = 1 − p, a s vjerojatnost da je x2 = 1 je p. Prema (6.2),
funkcija izvodnica g( xn , t) je

1
g(n, t) = ∑ P ( x n ) t n = P (0) t 0 + P (1) t 1 = q · 1 + p · t = 1 + p ( t − 1).
n =0

Nadalje se momenti računaju kao

dg(n, t)
= ...,
dt
d2 g(n, t)
= ...
dt2


 Primjer 6.2 P OISSONOVA RASPODJELA


Prema (4.48) je

λn
P ( n ) = e −λ ,
n!
što se uvrsti u funkciju izvodnicu i daje (sada je xn = n)
∞ ∞
λn n
g(n, t) = ∑ P ( n ) t n = e −λ ∑ n!
t = e λ ( t −1) .
n =0 n =0
6.2 Funkcija izvodnica momenata - Laplaceova preobrazba 315

Nadalje se momenti računaju kao


dg(n, t)
= ...,
dt
d2 g(n, t)
= ...
dt2


Primjer 6.3 G EOMETRIJSKA RASPODJELA


Prema (4.3) je
P(n) = pq n−1 ,
što se uvrsti u funkciju izvodnicu i daje
∞ ∞
pt
g(n, t) = ∑ P( xn ) t n = ∑ q n −1 p t n =
1 − qt
,
n =1 n =1
dg(n, t) p dg(n, t) 1

= ⇒ = ,
dt (1 − qt) 2 dt
t =1 p
2
d g(n, t) 2pq 2
d g(n, t) 2q

2
= 3
⇒ 2
= 2,
dt (1 − qt) dt
t =1 p
2
2
d g(n, t) dg(n, t) dg( xn , t) 1− p

2
⇒ σ = 2
+ − = .
dt
t =1 dt
t =1 dt
t =1 p2


... dovršiti ...

6.2 Funkcija izvodnica momenata - Laplaceova preobrazba


6.2.1 Definicija i svojstva
M ATEMATIKA - INTEGRALNE PREOBRAZBE
Definicija i račun funkcije izvodnice počiva na matematičkom pojmu Laplaceove pre-
obrazbe2
Z +∞ Z xk
f (k ) ≡ L [ρ( x )] = e−kx ρ( x ) dx ⇔ Zx ( k ) = e k x ρ( x ) dx .
0 xp

M ATEMATIKA - TEORIJA VJEROJATNOSTI


Funkcija izvodnica Zx (k ) jedne nasumične varijable x se definira kao

D E
Zx ( k ) = e k x . (6.3)

Ovisno o tome je li varijabla diskretna ili kontinuirana, srednja vrijednost je


xk

∑ e k x P ( x ), x je diskretan,




D E  x=x p

Zx ( k ) = e k x = (6.4)
 Z xk
e k x ρ( x ) dx.

x je kontinuiran.



xp

2 Vidjeti npr. odjeljak Laplaceova preobrazba u G LUMAC, Matematičke metode fizike.


316 Poglavlje 6. Funkcija izvodnica

Granice zbrajanja ili integriranja, x p i xk , idu po području vrijednosti varijable x. Ukoliko


varijabla x ima fizičku dimenziju (nije broj), tada je dimenzija varijable k inverzna
dimenziji varijable x. Npr. ako se x mjeri u metrima, k se mjeri u m −1 .
V IŠE VARIJABLA
Za više nasumičnih varijabla ~x i njima pridruženih parametara ~k

~x ≡ ( x1 , x2 , · · · , xD ), ~k ≡ (k1 , k2 , · · · , k D ),

je
D E D E
Z~x (~k ) = e (k1 x1 +k2 x2 +···+k D xD ) = e k ·~x .
~

x1,k x D,k

∑ ··· ∑ e (k1 x1 +k2 x2 +···+k D xD ) P( x1 , x2 , · · · , xD ), xd je diskr.




x1 = x1,p xD = x D,p


Z~x (~k ) =
x1,k Z xD,k

 Z
dx1 · · · dxD e (k1 x1 +k2 x2 +···+k D xD ) ρ( x1 , x2 , · · · , xD ), xd je kontin.




x1,p x D,p

= razvojem eksponencijalnih funkcija



∞ ∞ ∞
k m1 k m2 · · · k m D

= ∑ ∑ ... ∑ 1 2 D
x1m1 x2m2 . . . xDm D ,

m1 =0 m2 =0 m D =0 m 1 ! m 2 ! . . . m D !

pri čemu su momenti x1m1 x2m2 . . . xDm D dani izrazom (3.30).



Ako su svi parametri isti

k1 = k2 = · · · = k D ≡ k,

tada je i
x1,k x D,k

∑ ··· ∑ e k( x1 + x2 +···+ xD ) P( x1 , x2 , · · · , xD ), xd je diskr.




x1 = x1,p xD = x D,p


Z~x (k ) =
x1,k Z xD,k

 Z
dx1 · · · dxD e k( x1 + x2 +···+ xD ) ρ( x1 , x2 , · · · , xD ), xd je kontin.




x1,p x D,p

V EZA SA STATISTI ČKOM FIZIKOM - PARTICIJSKA FUNKCIJA


Particijske funkcije, s oznakom Z, široke klase spinskih modela, mogu se napisati u
obliku polinoma (za konačni sustav) ili u obliku reda potencija (u termodinamičkoj
granici) u pogodno odabranoj varijabli. Npr. preko energije E
1
Z = ∑ NE e− β E , β= ,
E
kB T

ili preko temperaturne varijable K


 n
Z = ∑ an e K , e K ≡ e J0 /(k B T ) , (6.5)
n

ili preko varijable vanjskog magnetskog polja h


 n
Z = ∑ bn e h , e h ≡ e m0 H/(k B T ) . (6.6)
n
6.2 Funkcija izvodnica momenata - Laplaceova preobrazba 317

Gornji se izrazi za particijske funkcije mogu shvatiti kao funkcije izvodnice diskretnih
nasumičnih varijabla E i n, pri čemu je NE srazmjerna raspodjeli vjerojatnosti nasumične
varijable E, a an i bn su srazmjerne različitim raspodjelama varijable n. Zadržimo se
na particijskoj funkciji (6.5). Neka je n diskretna nasumična varijabla koja poprima
vrijednosti

n = 0, 1, 2, 3, · · · , Nt

s vjerojatnošću (veza s entropijom iz odjeljka 5)

Nt Nt
an
P(n) =
Z0
, Z0 = ∑ an , ∑ P(n) = 1.
n =0 n =0

Sada se particijska funkcija (6.5) može shvatiti kao


D E
Z (K ) = Z 0 ∑ e nK P(n) = Z 0 e K n ,
n

Tj. omjer


l
Z (K ) D K n E n
= e = Zn (K ) = ∑ Kl (6.7)
Z0 l =0
l !

je funkcija izvodnica, pri čemu je korišten Taylorov razvoj eksponencijalne funkcije oko
nule

η2 η3 η4
eη = 1 + η + + + + ···
2 3! 4!

V EZA S MOMENTIMA
Razvojem eksponencijalne funkcije e k x iz (6.4) u Taylorov red oko nule (kao gore),
dobiva se (npr. za kontinuiranu varijablu)

k2 kn
Z xk xk xk Z xk
k
Z Z
Zx ( k ) = ρ( x ) dx + x ρ( x ) dx + x 2 ρ( x ) dx + . . . + x n ρ( x ) dx + . . .
xp 1! x p 2! x p n! xp
2 ∞ n
k k
2 hx i n
=1+ hxi + x + ··· = ∑ k . (6.8)
1! 2! n=0 n!

S druge strane, Taylorov razvoj u red oko k = 0 same funkcije izvodnice je



k dZx (k ) k 2 d2 Zx (k ) k n dn Zx (k )

Zx ( k ) = Zx (0 ) + ∑ .

+ + ··· =
dk2

1! dk k=0 2 !
k =0 n =0 n! dkn k=0

Budući da potencije čine linearno nezavisan skup funkcija3 , to usporedbom članova uz


iste potencije k u gornja dva razvoja, lako se zaključuje da je vrijednost n-te derivacije
funkcije izvodnice u točki k = 0, upravo jednaka n-tom momentu raspodjele

dn Zx (k )

= hx n i . (6.9)
dkn k=0
3 Vidjeti npr. u G LUMAC, Matematičke metode fizike
318 Poglavlje 6. Funkcija izvodnica

To je razmjerno jednostavan način da se iz funkcije izvodnice dobiju momenti (odatle i


potječe naziv - izvodnica4 ).

Moguće je da za neke vjerojatnosti P( x ) ili gustoće vjerojatnosti ρ( x ), gornji zbroj


ili integral, DIVERGIRA. Tada se kaže da te raspodjele NEMAJU funkciju izvodnicu.

 Primjer 6.4 C AUCHYJEVA RASPODJELA


Ilustrirajmo to na primjeru Cauchyjeve raspodjele ρC za kontinuiranu varijablu x

1
ρC ( x ) = .
π (1 + x 2 )

Funkcija izvodnica je
+∞
ek x
Z
1
ZC (k ) = dx .
π −∞ 1 + x2

Razvojem eksponencijalne funkcije u red, dobiva se


+∞ +∞ +∞
k2 x2
Z Z Z
1 1 k x
ZC (k ) = 2
dx + dx + dx
π −∞ 1+x π −∞ 1 + x2 2! π −∞ 1 + x2
+∞ +∞
k3 x3 k4 x4
Z Z
+ dx + dx + · · ·
3! π −∞ 1 + x2 4! π −∞ 1 + x2

Zbog toga što je podintegralna funkcija neparana, svi integrali oblika


+∞
x 2k+1
Z
dx , k = 0, 1, 2, · · · ,
−∞ 1 + x2

su jednaki nuli. Budući da su integrali


+∞ +∞
x2 x4
Z Z
dx , dx , · · ·
−∞ 1 + x2 −∞ 1 + x2

divergentni5 , to je i cijela funkcija izvodnica takod̄er divergentna. Zaključak je da


Cauchyjeva raspodjela nema momenata, pa time nema ni funkciju izvodnicu. 

SVOJSTVA FUNKCIJE IZVODNICE :

(1) Neka je Zx (k ) funkcija izvodnica varijable x. Izračunajmo Za0 +a1 x (k ), za pro-


izvoljne konstante a0 i a1 . Prema definiciji (6.3) je
Z xk Z xk
Za0 + a1 x ( k ) = e k(a0 +a1 x) ρ( x ) dx = e a0 k e ka1 x ρ( x ) dx = e a0 k Zx ( a1 k ). (6.10)
xp xp
4 engl.
moment generating function
5 Za
veliki x je podintegralna funkcija prvog integrala jednaka 1, a drugog x 2 . Za navedene granice
integracije, obje ove funkcije imaju divergentan integral.
6.2 Funkcija izvodnica momenata - Laplaceova preobrazba 319

(2) Neka su sada x1 i x2 , dvije statistički NEZAVISNE nasumične varijable, tako da je


prema (3.11),
ρ ( x1 , x2 ) = ρ1 ( x1 ) ρ2 ( x2 ),
i neka je a1 x1 + a2 x2 njihova linearna kombinacija (za konstantne a1 i a2 ). Izraču-
najmo umnožak njihovih funkcija izvodnica
Z xk,1 Z xk,2
a1 x1 k
Za1 x1 ( k ) Za2 x2 ( k ) = dx1 e ρ1 ( x1 ) · dx2 e a2 x2 k ρ2 ( x2 )
x p,1 x p,2
Z xk,1 Z xk,2
= dx1 dx2 e(a1 x1 +a2 x2 ) k ρ1 ( x1 ) ρ2 ( x2 )
x p,1 x p,2
Z xk,1 Z xk,2
= dx1 dx2 e(a1 x1 +a2 x2 ) k ρ( x1 , x2 )
x p,1 x p,2

= Za1 x1 + a2 x2 ( k ) . (6.11)
Slično se dokazuje i za proizvoljan zbroj od D nezavisnih nasumičnih varijabla
Za1 x1 +a2 x2 + ··· +a D xD (k ) = Za1 x1 (k ) Za2 x2 (k ) · · · Za D xD (k ) (6.12)
= (6.10) = Zx1 ( a1 k) Zx2 ( a2 k) · · · ZxD ( a D k).

6.2.2 Diskretne varijable


FUNKCIJA IZVODNICA MOMENATA JEDNOLIKE DISKRETNE RASPODJELE

N N
1
Zx ( k ) = ∑ e xn k P ( x ) =
N ∑ e xn k .
n =1 n =1

Ako je diskretna varijabla ekvidistantna xn = n · x 0 , tada je


N
1  n e x0 k e N x0 k − 1
Zx ( k ) =
N ∑ e x0 k =
N e x0 k − 1
.
n =1

Momenti, (6.9), se računaju kao dovršiti... nacrtati

FUNKCIJA IZVODNICA MOMENATA GEOMETRIJSKE RASPODJELE :


dovršiti

FUNKCIJA IZVODNICA MOMENATA BINOMNE RASPODJELE :


U skladu s definicijom (6.4), funkcija izvodnica binomne raspodjele, (4.11),
N
 
P( x ) = p x q N −x , x = 0, 1, 2, · · · , N,
x
je dana sa
N N
N
 
Zx ( k ) = ∑ e kx
P( x ) = ∑ e kx
x
p x q N −x
x =0 x =0
N
N
 
= ∑ x
( pe k ) x q N −x = (q + p e k ) N ,
x =0

Zx ( k ) = ( q + p e k ) N , (6.13)
320 Poglavlje 6. Funkcija izvodnica

a to je funkcija s kojom smo se upoznali6 još relacijom (4.21). (nacrtati) Pokažimo kako
se funkcijom izvodnicom računaju očekivanje i varijanaca binomne raspodjele. Prema
(6.9) je

dn Zx (k )

n
hx i = ,
dkn k=0

0
⇒ x = (q + p e k ) N = 1, normiranje

k =0

h x i = N p e k ( q + p e k ) N −1 = N p,

k =0

2 h i
x = N p e k ( q + p e k ) N −2 ( N − 1 ) p e k + ( q + p e k ) = ( N 2 − N ) p + N p,

k =0
⇒ σ 2 = x 2 − h x i 2 = N p q.

FUNKCIJA IZVODNICA MOMENATA P OISSONOVE RASPODJELE :


Sjetimo se da se Poissonova raspodjela dobije kao granična vrijednost binomne, kada

p → 0, N → ∞ uz pN ≡ λ = const.

Dakle, i funkciju izvodnicu Poissonove raspodjele ćemo dobiti kao opisanu graničnu
vrijednost iz funkcije izvodnice binomne raspodjele
N
λ N λ (e k − 1)
  
λ
Zx ( k ) = ( q + e k p ) N = 1 − + ek = 1+ .
N N N
Prema definiciji eksponencijalne funkcije, (4.50), u granici N → ∞ uz konstantni λ,
gornji je izraz daje funkciju izvodnicu Poissonove raspodjele

k −1)
Zx ( k ) = e λ (e . (6.14)

(nacrtati) Do istog se rezultata dolazi i izravno iz definicije Poissonove raspodjele (4.48)


i definicije funkcije izvodnice (6.3)
n

kn λ
n ∞ ek λ k k
Zx ( k ) = ∑ e −λ
e =e −λ
∑ = e− λ e λ e = e λ (e −1) .
n =0 n! n =0 n!

Prema (6.9), momenti su



0
x = Zx ( k ) = 1,

k =0
dZx (k ) k λ (e k −1)

hxi = = λe e = λ,
dk k=0 k =0

d2 Zx (k )

k k +λe k

2
x = = λe −λ
( 1 + λe ) e = λ + λ 2,
dk2 k=0 k =0

d3 Zx (k )


3
x = = ··· .
dk3 k=0

6 Uz zamjenu t → e k .
6.2 Funkcija izvodnica momenata - Laplaceova preobrazba 321

Zadatak 6.1 Neka je funkcija izvodnica diskretne nasumične varijable x dana sa

Zx (k ) = 0.25 e k + 0.35 e3k + 0.40 e5k .

Izračunajte P( x = 3). Izračunajte srednju vrijednost i varijancu varija-


ble x. 

Rješenje:
Usporedbom gornjeg izraza sa (6.8), izravno se očitava

P( x = 3) = 0.35.

dovršiti
Zadatak 6.2 Vrijednosti diskretne nasumične varijable x su 0, 1, 2, 3, · · · . Neka su
momenti x zadani sa

h x n i = 0.618033989, n = 1, 2, · · ·

(a) Izračunajte funkciju izvodnicu varijable x.


(b) Izračunajte P( x = 0) i P( x = 1). 

Rješenje:
Prema (6.3) i (6.8), funkcija izvodnica diskretne nasumične varijable se računa kao



2
hxi x
Zx ( k ) = ∑ e kx
P( x ) = 1 +
1!
k+
2!
k2 + · · ·
x =0

(a) Prema uvjetu zadatka je

Zx (k ) = 1 + 0.618033989 1!1 k + 2!1 k 2 + · · · = 1 + 0.8 e k − 1


 

= 0.381966011 + 0.618033989 e k .

(b) No, istovremeno je, prema definiciji (6.3),



Zx ( k ) = ∑ e k x P ( x ) = P (0) + e k P (1) + e 2 k P (2) + e 3 k P (3) + · · · ,
x =0

pa se usporedbom gornja dva izraza očitava

P(0) = 0.381966011, P(1) = 0.618033989, P( x > 1) = 0.

Zadatak 6.3 Neka nasumična varijabla x može imati samo vrijednosti 0 ili 1.
(a) Izračunajte funkciju izvodnicu x.
(b) Izračunajte srednju vrijednost i varijancu x. 

Rješenje:
Prema (6.3), funkcija izvodnica diskretne nasumične varijable se računa kao

1
Zx ( k ) = ∑ e k x P ( x ) = P (0) + e k P (1).
x =0
322 Poglavlje 6. Funkcija izvodnica

Iz normiranja vjerojatnosti je

P(0) + P(1) = 1.

Nazovimo

P(1) = p, P(0) = 1 − p.

Tada je

k2 k3
 
k
Zx ( k ) = 1 − p + p e = 1 − p + p 1+k+ + + ··· .
2 3!

Usporedbom gornjeg izraza sa (6.8)



2
hxi x
Zx ( k ) = 1 + k+ k2 + · · ·
1! 2!
se očitava

h x i = p, x 2 = p,

pa je varijanca

σ 2 = x 2 − h x i 2 = p (1 − p ).

6.2.3 Kontinuirane varijable


FUNKCIJA IZVODNICA MOMENATA JEDNOLIKE RASPODJELE :
Jednolika raspodjela je definirana gustoćom (4.66), pa je prema (6.4), njezina funkcija
izvodnica

1 e bk − e ak
Z b
1
Zx ( k ) = e k x dx = .
b−a a k b−a
Momenti, (6.9), se računaju kao ... dovršiti... nacrtati

FUNKCIJA IZVODNICA MOMENATA G AUSSOVE ( NORMALNE ) RASPODJELE :


U definiciju funkcije izvodnice (6.3), za gustoću vjerojatnosti treba uvrstiti Gaußovu
gustoću (4.79)
+∞
Z
1 ( x − h x i) 2
 
Zx ( k ) = √ exp( k x ) exp − dx
σ 2π 2σ 2
−∞
Z +∞ (  2 )
1 1 2 2 x − (σ 2 k + h x i)
 
= √ exp k h x i + σ k exp − dx .
σ 2π 2 2σ 2
−∞

Uvod̄enjem nove varijable

x − (σ 2 k + h x i)
η= √ ,
σ 2
6.2 Funkcija izvodnica momenata - Laplaceova preobrazba 323

konačno se dobiva
Z +∞
1 1 2 2 1 2 2
   
−η 2
Zx (k ) = √ exp k h x i + σ k e dη = exp k h x i + σ k .
π 2 −∞ 2
| √
{z }
= π

1 2 2
 
Zx (k ) = exp k h x i + σ k , (6.15)
2

(nacrtati) ili, svod̄enjem na potpuni kvadrat,

hxi 2 hxi 2
! "  #
σ2

Zx (k ) = exp − 2 exp k+ 2 .
2σ 2 σ

Ako se (6.15) razvije u red, dobiva se


2 3 4
σ 2k 2 1 σ 2k 2 1 σ 2k 2 1 σ 2k 2
    
Zx ( k ) = 1 + + k hxi + + k hxi + + k hxi + + k hxi + · · ·
2 2! 2 3! 2 4! 2
2
k
2 k 3 k 4
2
hxi 3 x 2 − 2 hxi 2 + 3 x 2 − 2 hxi 4 + · · ·
   
= 1 + k hxi + x +


2! 3! 4!
iz čega je lako pročitati pojedine momente raspodjele

x 3 = hxi 3 x 2 − 2 hxi 2 ,





2
x 4 = 3 x 2 − 2 hxi 4 ,
D E

..
.

Do istih se rezultata dolazi i primjenom relacije (6.9)



Zx ( k ) = 1,

k =0
dZx (k ) 1 2 2 dZx (k )
 
2
= h x i + kσ exp h x i k + σ k , = hxi ,

dk 2 dk k=0
2
d Zx ( k ) 1 2 2 1 2 2
   
2 2 2
exp x k k x k exp h x i k + σ k

= σ h i + σ + h i + σ
dk2 2 2
d2 Zx (k)

= σ 2 + hxi 2 = x 2 .


dk2 k=0
..
.

Uočimo još jedno svojstvo Gaußove raspodjele. Ako je gustoća vjerojatnosti varijable
x, karakterizirana s (h x i , σ 2 ), pitanje je koliki su očekivanje i varijanca varijable a x?
Prema (6.10), za b ≡ 0, je

σ 2a 2k 2
 
Zax (k ) = Zx ( ak) = exp a h x i k + , (6.16)
2
324 Poglavlje 6. Funkcija izvodnica

a to je upravo funkcija izvodnica Gaußove raspodjele opisane očekivanjem a h x i i


varijancom a 2 σ 2 .
A DICIJSKI TEOREM ZA G AUSSOVE RASPODJELE :
Ovaj je teorem, nešto drukčijim putem, već dokazan na strani 239. Zadane su dvije
statistički nezavisne nasumične varijable, x1 i x2 , opisane Gaußovim raspodjelama (4.79)
karakteriziranim s (h x1 i , σ12 ) i (h x2 i , σ22 ). Pitanje je:
KOJOM JE RASPODJELOM OPISANA NASUMI ČNA VARIJABLA a 1 x 1 + a 2 x 2
za konstantne a1 i a2 ? Krenimo od funkcija izvodnica, (6.15), za obje varijable

1 1
   
Za1 x1 (k) = exp a1 k h x1 i + a12 σ12 k 2 , Za2 x2 (k ) = exp a2 k h x2 i + a22 σ22 k 2 .
2 2

Prema (6.10) i (6.11) je funkcija izvodnica varijable a1 x1 + a2 x2 jednaka

Za1 x1 +a2 x2 (k ) = (6.11) = Za1 x1 (k ) Za2 x2 (k )


1 2 2 2 1 2 2 2
   
= exp a1 k h x1 i + a1 σ1 k · exp a1 k h x2 i + a2 σ2 k
2 2
1 2 2 2
 
= exp k( a1 h x1 i + a2 h x2 i) + k ( a1 σ1 + a22 σ22 ) ,
2

a to je upravo funkcija izvodnica Gaußove raspodjele karakterizirane očekivanjem


a1 h x1 i + a2 h x2 i i varijancom a12 σ12 + a22 σ22 . Gornja se razmatranja lako mogu protegnuti
i na proizvoljnu linearnu kombinaciju od D nasumičnih Gaußovih varijabla. Linearna
kombinacija D nasumičnih varijabla xn je opet jedna nova nasumična varijabla, koju
ćemo nazvati

y = a1 x1 + a2 x2 + · · · + a D xD .

Prema gore izloženom, gustoća vjerojatnosti y je dana Gaußovom raspodjelom s očeki-


vanjem hyi i varijancom σy2

h y i = a1 h x1 i + a2 h x2 i + · · · + a D h xD i , (6.17)
σy2 2 2 2 2
= a1 σ1 + a2 σ2 + · · · + a D σD . 2 2

F UNKCIJA IZVODNICA VIŠEDIMENZIJSKE G AUSSOVE RASPODJELE


Promotrimo sada Gaußovu raspodjelu više varijabla, (4.88),

x1 , x2 , · · · , xD ,

koje NISU sve med̄usobno statistički neovisne. Neka je normirana raspodjela gustoće
vjerojatnosti dana sa
s
Det (A) 1
 
ρ ( x1 , x2 , · · · , xD ) = exp − h x |A| x i
(2 π ) D 2
D D
h x |A| x i = ∑ ∑ xi Ai,j x j .
i =1 j =1

S Ai,j su označeni matrični elementi realne simetrične

Ai,j = A j,i
6.2 Funkcija izvodnica momenata - Laplaceova preobrazba 325

matrice A (matrica med̄udjelovanja). Funkcija izvodnica gornje raspodjele je


Z +∞ Z +∞
Z~x (~k ) = dx1 · · · dxD e hx|ki ρ( x1 , x2 , · · · , xD )
−∞ −∞
s 1 
Det (A)
Z +∞ Z +∞
− h x |A| x i − 2 h x | k i
= dx1 · · · dxD e 2 ,
(2 π ) D −∞ −∞

gdje je skalarni umnožak označen s


D
h x |ki = hk| x i = ∑ xd k d .
d =1

Postupak koji sada treba provesti je poopćenje svod̄enja na potpuni kvadrat. U ovom
nasumiču to znači da je potrebno naći konstantni vektor |ci i konstantni skalar s sa
svojstvom da je
   
h x |A| x i − 2 h x | k i = h x | − h c | A | x i − | c i + s
= h x |A| x i − h x | A |ci − hc| A | x i + hc| A |ci + s.

Gornji je zahtjev očito ispunjen ako je

h x |ki = h x | A |ci ⇒ |ki = A |ci ⇒ | c i = A−1 | k i ,


h x |ki = hk| x i = hc| A | x i ⇒ hk| = hc| A ⇒ h c | = h k | A−1 ,
s = − h c | A | c i = − h k | A−1 A A−1 | k i = − h k | A−1 | k i .

Uvrštavanjem gornjeg rezultata u funkciju izvodnicu, dobiva se


1 1
hk|A−1 |ki Det (A) Z +∞
s
Z +∞
− h y |A| y i
Z~x (~k ) = e 2 dx1 · · · dxD e 2 ,
(2 π ) D −∞ −∞

gdje je s |yi označen vektor

| y i = | x i − | c i = | x i − A−1 | k i .
Neka su λ d svojstvene vrijednosti, a |λ d i svojstveni vektori matrice A

A |λ d i = λ d |λ d i .

Svojstveni vektori čine ortonormiran i potpun skup


D
hλ d |λd0 i = δd,d0 , ∑ |λ d ihλ d | = 1,
d =1

tako da je
D D  2
h y |A| y i = h y | A ∑ |λ d i hλ d |yi = ∑ λ d hλ d |yi .
d =1 d =1

Umjesto D varijabla yd , uvodi se novih D varijabla zd . Tko se umjesto y1 = x1 − c1 uvodi

z1 = hλ1 |yi = λ1,1 y1 + λ1,2 y2 + · · · + λ1,D y D


326 Poglavlje 6. Funkcija izvodnica

i općenito, umjesto yd = xd − cd uvodi se

zd = hλ d |yi = λd,1 y1 + λd,2 y2 + · · · + λd,D y D .

Pisano preko varijabli zd , izraz za funkciju izvodnicu postaje


+∞ +∞
s
Z Z
D
!
1 Det (A) 1

Z~x (~k ) = exp
2
h k | A−1 | k i
(2 π ) D
dz1 · · · dzD · J · exp −
2 ∑ λ d zd2 .
−∞ −∞ d =1

Jakobijan prijelaza J je apsolutna vrijednost determinante donje matrice čiji su redovi


jednaki elementima svojstvenih vektora.
 
λ1,1 λ1,2 · · · λ1,D
 λ2,1 λ2,2 · · · λ2,D 
S= . .
 
 . . 
λ D,1 λ D,2 · · · λ D,D

Njoj transponirana matrica S| ima redove jednake svojstvenim vektorima matrice A.


Zbog ortonormiranosti svojstvenih vektora, očito vrijedi da je

S · S| = 1 ⇒ Det (S) · Det (S| ) = 1.

Budući da S i S| imaju iste determinante, zaključujemo da je

Det (S) = ±1.

Kako je jakobijan jednak apsolutnoj vrijednosti determinante S, to je

J = 1,

pa je funkcija izvodnica jednaka

1 1
hk|A−1 |ki Det (A) − λ d zd2
s
D Z +∞
Z~x (~k ) = e 2
(2 π ) D ∏ −∞
dzd e 2 .
d =1

Gornji integrali su tabličnog7 tipa i jednaki su

1
− λ d zd2
s
D Z +∞ D

∏ −∞
dzd e 2 =∏
λd
,
d =1 d =1

U umnošku svojstvenih vrijednosti u nazivniku gornjeg izraza, prepoznajemo determi-


nantu matrice A
D
Det (A) = ∏ λ d ,
d =1

tako da je cijela funkcija izvodnica jednaka

1
 
1
Z~x (~k ) = exp h k |A | k i ,

2
7 Vidjeti npr. Bronxtein i Semendyev, Matematički priručnik ... str. 475.
6.2 Funkcija izvodnica momenata - Laplaceova preobrazba 327

ili, napisano kao rješenje jednog višestrukog integrala


s Z +∞ Z +∞
Det (A) 1 1
   
−1
dx 1 · · · dx D exp − x A x
h | | i − 2 x k
h | i = exp k
h | A | i .
k
(2 π ) D 2 2
−∞ −∞

FUNKCIJA IZVODNICA MOMENATA GAMA RASPODJELE :


Gama raspodjela je opisana gustoćom vjerojatnosti (4.96), pa je njezina funkcija izvod-
nica jednaka
Z +∞ Z +∞
1 n −1 1
Zx ( k ) = e kx
x e −x
dx = x n−1 e− x(1−k) dx .
Γ(n) 0 Γ(n) 0

Prijelazom na novu varijablu


η = x (1 − k ), |k| ≤ 1, [zbog konvergencije Taylorovog reda za Zx (k)],
dobiva se
n Z +∞
1 1

Zx ( k ) = η n−1 e−η dη = (1 − k )−n . (6.18)
Γ(n) 1−k 0
| {z }
= (4.91) = Γ(n)

Zx ( k ) = (1 − k ) − n . (6.19)

Sada je lako izračunati momente:



0
x = Zx ( k ) = 1,

k =0
dZx (k)
D E
x1 = = n, (6.20)
dk k=0
d2 Zx (k )


2
x = = n ( n + 1),
dk2 k=0
d3 Zx (k )


3
x = = n(n + 1)(n + 2),
dk3 k=0
d4 Zx (k )
D E
4
x = = n(n + 1)(n + 2)(n + 3),
dk4 k=0
i općenito,
D E h i ( n + l − 1) !
x l = n(n + 1)(n + 2) . . . n + (l − 1) = .
( n − 1) !

A DICIJSKI TEOREM ZA GAMA RASPODJELE :


Funkcija izvodnica gama raspodjele stupnja slobode n nasumične varijable x, je dana sa
(6.18). Prema (6.11) je funkcija izvodnica zbroja od dvije NEZAVISNE nasumične varijable
x1 + x2 , od kojih je prva stupnja n1 , a druga stupnja n2 , dana sa

Zx1 (k ) Zx2 (k ) = (1 − k )−n1 (1 − k )−n2 = (1 − k )−(n1 +n2 ) = Zx1 + x2 (k ), (6.21)


a to je opet gama raspodjela stupnja slobode n1 + n2 . Time je dokazan slijedeći
328 Poglavlje 6. Funkcija izvodnica

Teorem 6.2.1 Zbroj dvije nezavisne nasumične varijable x1 i x2 raspodjeljene po gama


raspodjelama sa stupnjevima slobode n1 i n2 , je nova nasumična va-
rijabla x1 + x2 raspodjeljena po gama raspodjeli sa stupnjem slobode
n1 + n2 .

Gornja se argumentacija lagano proteže i na zbroj od D nasumičnih varijabla

x1 + x2 + · · · + xD

sa stupnjevima slobode n1 , n2 , · · · , n D , koje će biti raspodjeljene po gama raspodjeli sa


stupnjem slobode jednakim

n1 + n2 + · · · + n D

Izravnim poopćenjem (6.21), dobiva se

Zx1 + x2 + ··· + xD (k ) = Zx1 (k ) Zx2 (k ) · · · ZxD (k), (6.22)


ρ Γ ( n1 + n2 + · · · + n D , x1 + x2 + · · · + xD ) = ρ Γ ( n1 , x1 ) ρ Γ ( n2 , x2 ) · · · ρ Γ ( n D , xD ).

Gornji se izrazi mogu sažeti u

Teorem 6.2.2 Zbroj od D nezavisnih nasumičnih varijabli x1 , x2 , · · · , xD raspodjeljenih


po gama raspodjelama sa stupnjevima slobode n1 , n2 , · · · , n D , je nova
nasumična varijabla raspodjeljena po gama raspodjeli sa stupnjem
slobode n1 + n2 + · · · + n D .

VEZA S G AUSSOVOM RASPODJELOM : χ 2


Neka je sada zadano N statistički NEOVISNIH nasumičnih varijabla xm raspodjeljenih
po G AUSSOVIM raspodjelama s prosječnim vrijednostima i standardnim devijacijama
jednakim

h xm i , σm .

Sukladno s teoremom (4.2.1), vrijednosti nasumičnih varijabla


 2
xm − h xm i
ym =
2σm2

raspodjeljene su po gama raspodjelama, (4.96), sa istim stupnjem slobode nm = 1/2

ρ Γ (1/2, ym ) .

Prema (6.22), je

ρ Γ ( n1 , y1 ) · ρ Γ ( n2 , y2 ) · . . . · ρ Γ ( nN , yN ) = ρ Γ ( n1 + n2 + · · · + nN , y1 + y2 + · · · + yN ).

Prema gore rečenom, nasumična varijabla χ 2 /2, definirana sa


 2
χ2 1 N x − h xm i
2
≡ y1 + y2 + · · · + yN =
2 ∑ σm2
(6.23)
m =1
6.2 Funkcija izvodnica momenata - Laplaceova preobrazba 329

raspodjeljena po gama raspodjeli sa stupnjem slobode


N
n = n1 + n2 + · · · + nN = .
2
Vjerojatnost da χ 2 /2 poprimi vrijednost iz intervala (χ 2 /2, χ 2 /2 + d χ 2 /2) je, prema
(4.96), jednaka
1
dP (n, x ) = x n−1 e− x dx ,
Γ(n)
1  N/2−1 − 1 χ 2
dP ( N/2, χ 2 /2) = χ 2 /2 e 2 d(χ 2 /2) . (6.24)
Γ( N/2)
To je rezultat koji će se koristiti u odjeljku 8.4 o prilagodbi u smislu najmanjih kvadrata,
kao i u odjeljku 10.2.1 o testovima.

C RAMEROV TEOREM
dovršiti

6.2.4 Granični teorem


dovršiti
RECIPRO ČNI TEOREM
dovršiti

Zadatak 6.4 Neka je gustoća vjerojatnosti kontinuirane nasumične varijable x ∈


(0, ∞) dana sa c0 e−λ x , gdje je λ pozitivna konstanta. Izračunajte:
(a) vrijednost konstante c0 ;
(b) funkciju izvodnicu x;
(c) srednju vrijednost i varijancu x. 

Rješenje:
Vrijednost konstante c0 se odred̄uje iz uvjeta normiranja
Z ∞
1= c0 e−λ x dx ⇒ c0 = λ.
0

Prema (6.4), funkcija izvodnica kontinuirane nasumične varijable se računa kao


Z ∞
λ
Zx ( k ) = e k x λ e−λ x dx = · · · =
0 λ−k
1 k k2 k3
= = 1 + + 2 + 3 + ··· .
1 − k/λ λ λ λ
Usporedbom gornjeg izraza sa (6.8)

2
hxi x
Zx ( k ) = 1 + k+ k2 + · · ·
1! 2!
se očitava
1 2
hxi = , x2 = 2 ,


λ λ
330 Poglavlje 6. Funkcija izvodnica

pa je varijanca

1
σ 2 = x 2 − hxi 2 = 2 .


λ

Zadatak 6.5 Gustoća vjerojatnosti kontinuirane nasumične varijable x je dana sa

1 2 /32
ρ( x ) = √ e−(x+7)
32π
za −∞ < x < +∞. Izračunajte funkciju izvodnicu. 

Rješenje:
U skladu s (6.3), funkcija izvodnica se računa kao
Z xk Z +∞
1 2 /32
Zx ( k ) = e k x ρ( x ) dx = √ e k x e−(x+7) dx
xp 32π −∞

0.4

0.3 gX (k)

0.2
Nakon svod̄enja argumenta eksponencijalne
funkcije na potpuni kvadrat, dobiva se
ρ (x)
0.1

0
-20 -10 0 10
x, k

Z +∞
1 2 2 /32 2 2 −49/32
Zx ( k ) = √ e−7k+8k e−(x+7−16k) dx = e−7k+8k = e8(k−7/16) .
32π −∞

Zadatak 6.6 Neka je x kontinuirana nasumična varijabla na intervalu [0, 2]. Gustoća
vjerojatnosti je

1
( a) ρ( x ) = ,
2
x
(b) ρ( x ) = ,
2
x
(c) ρ( x ) = 1 − ,
2
( d ) ρ ( x ) = |1 − x |,
3
(e) ρ( x ) = x 2 .
8
Provjerite


je li gustoća normirana. Izračunajte funkciju izvodnicu i
hxi , x 2 i x 3 . 
6.3 Karakteristična funkcija - Fourierova preobrazba 331

Rješenje:
dovršiti

Zadatak 6.7 Neka je x kontinuirana nasumična varijabla na intervalu (0, ∞). Gustoća
vjerojatnosti je

( a) ρ( x ) = 2e−2x ,
1
(b) ρ( x ) = e−2x + e−x ,
2
(c) ρ( x ) = 4xe−2x ,
λ
(d) ρ( x ) = (λx ) n−1 e−λx .
( n − 1) !
Provjerite

2
je li gustoća normirana. Izračunajte funkciju izvodnicu i
3
hxi , x i x . 

Rješenje:
... dovršiti ...

6.3 Karakteristična funkcija - Fourierova preobrazba


6.3.1 Definicija i svojstva
MATEMATIKA - INTEGRALNE PREOBRAZBE
U literaturi matematičke fizike, Fourierova preobrazba8 funkcije F (t) se naziva f (ω ) i
definira se na slijedeći način
Z +∞
1
f (ω ) = √ F (t) e ı ω t dt , (6.25)
2π −∞

dok se njoj inverzna preobrazba definira kao


Z +∞
1
F (t) = √ f (ω ) e−ı ω t dω . (6.26)
2π −∞

MATEMATIKA - TEORIJA VJEROJATNOSTI


Osim funkcija izvodnica, u teoriji vjerojatnosti se koriste i karakteristične funkcije, Z
e x ( k ),
definirane slično kao i funkcije izvodnice (6.3), s tom razlikom da se sada u eksponentu
nalazi IMAGINARNA JEDINICA ı
D E
ex ( k ) = e ı k x .
Z (6.27)

Ovisno o tome je li nasumična varijabla x diskretna ili kontinuirana, karakteristična


funkcija se računa kao
xk

∑ e ı k x P ( x ), x je diskretan,




D E  x=x p

ex ( k ) = e ı k x =
Z (6.28)
 Z xk
e ı k x ρ( x ) dx.

x je kontinuiran.



xp

8 Vidjeti npr. odjeljak o integralnim preobrazbama u G LUMAC, Matematičke metode fizike.


332 Poglavlje 6. Funkcija izvodnica

Za diskretne varijable, P( x ) je raspodjela vjerojatnosti, a za kontinuirane varijable,


ρ( x ) raspodjela gustoće vjerojatnosti. U skladu s definicijom Fourierove preobrazbe (s
početka ovog odjeljka) i definicije karakteristične funkcije (6.28), zaključujemo da su ka-
rakterisitična funkcija i funkcija gustoće vjerojatnosti uzajamne Fourierove preobrazbe,

VEZA S KVANTNOM MEHANIKOM


Uočena veza izmed̄u karakteristične funkcije i funkcije gustoće vjerojatnosti je ista kao i
kvantnomehanička veza izmed̄u valne funkcije u ~r i valne funkcije u ~p reprezentaciji -
one su uzajamne Fourierove preobrazbe8
Z +∞
1
ψ( x ) = √ Ψ( p) e ı p x/h̄ dp ,
2 π h̄ −∞
Z +∞
1
Ψ( p) = √ ψ( x ) e−ı p x/h̄ dx .
2 π h̄ −∞

K ARAKTERISTI ČNA FUNKCIJA VIŠE NASUMI ČNIH VARIJABLA


Neka je zadano D nasumičnih varijabla

x1 , x2 , · · · , xD ,

opisanih raspodjelom vjerojatnosti

P ( x1 , x2 , · · · , xD ),

ako se radi o diskretnim varjablama, ili normiranom gustoćom vjerojatnosti

ρ ( x1 , x2 , · · · , xD ),

ako se radi o kontinuiranim varjablama.


Karakteristična funkcija koja ovisi o D pomoćnih varijabla

~k = (k1 , k2 , . . . , k D )

se definira kao D-dimenzijska F OURIEROVA PREOBRAZBA8 funkcija P ili ρ


D E
ex ,x ,··· ,x (~k ) = e ı (k1 x1 +k2 x2 +...+k D xD )
Z 1 2 D

∑ ∑ · · · ∑ e ı (k1 x1 +k2 x2 +...+k D xD ) P(x1 , x2 , · · · , xD ),




x1 x2 xD

= Z
e ı (k1 x1 +k2 x2 +...+k D xD ) ρ( x1 , x2 , · · · , xD ) dx1 dx2 . . . dxD .

∞ ∞ ∞
( ı k 1 ) m1 ( ı k 2 ) m2 . . . ( ı k D ) m D
m1 m2
∑ ∑ ... ∑ x1 x2 · · · xDm D ,

=
m1 =0 m2 =0 m D =0 m1 ! m2 ! . . . m D !

pri čemu su momenti x1m1 x2m2 . . . xDm D dani izrazom (3.30).



Radi jednostavnosti, vratimo se karakterističnoj funkciji jedne nasumične varijable.


Razvojem eksponencijalne funkcije u red

ı k x (ı k ) 2 x 2 (ı k ) n x n
eı k x = 1 + + + ··· + + ...,
1! 2! n!
6.3 Karakteristična funkcija - Fourierova preobrazba 333

karakteristična funkcija postaje (za npr. kontinuiranu varijablu)


xk
Z
ı k x (ı k ) 2 x 2 (ı k ) n x n
 
Z
ex ( k ) = 1+ + + ... + + ··· ρ( x ) dx
1! 2! n!
xp

ık (ı k ) 2
2 (ı k ) 3
3 (ı k ) 4 D 4 E
=1+ hxi + x + x + x + ···
1! 2! 3! 4!
i slično za diskretnu varijablu.
Kao što se vidi i karakteristična funkcija je funkcija izvodnica, jer se izvodi iz momenata
raspodjele. Budući da se karakteristična funkcija može razviti u Taylorov red oko k = 0

k d Z
ex (k ) k 2 d2 Z
ex (k ) k 3 d3 Z
ex (k )
Z e x (0) +
ex ( k ) = Z + + + ··· ,
1! dk 2! dk2 3! dk3

k =0 k =0 k =0

to se usporedbom koeficijenata uz iste potencije kn iz gornja dva reda, očitava



Z
ex (k ) = 1,
k =0
dZex (k )
= ı hxi ,
dk

k =0

d2 Z
ex (k )
= ı2 x2 = − x2 ,



dk 2
k =0

3
d Zx (k ) 3

3
3
ı x ı x ,
e
= = −
dk3

k =0

d4 Z
ex (k ) D E
= x4 ,
dk4

k =0
..
.

dn Z
ex ( k )
= ı n hx n i (6.29)

dkn

k =0

P REDNOST karakteristične pred funkcijom izvodnicom je u tome što je integral kojim je


zadana karakteristična funkcija, UVIJEK KONVERGENTAN9 . Budući da je

ı k x
e = kcos(k x ) + ı sin(k x )k = 1

to je i
xk
Z x Z xk
k
Z
ıkx ıkx
Zx ( k ) = e ρ( x ) dx ≤ e ρ( x ) dx = ρ( x ) dx = 1,
e


xp xp xp

=⇒ Zx (k ) ≤ 1.
e

Za funkciju izvodnicu gornji izraz ne vrijedi, jer integral kojim je zadana funkcija
izvodnica (6.3),
Z xk
Zx ( k ) = e k x ρ( x ) dx
xp

9 Tako se na primjeru funkcije izvodnice gama raspodjele se vidi da ona nije definirana za sve vrijednosti

k, nego tek za |k | < 1.


334 Poglavlje 6. Funkcija izvodnica

ne mora uvijek biti konvergentan (kao što se to vidi iz primjera 6.4). To je i razlog zašto
se u praksi funkcije izvodnice zamjenjuju karakterističnim funkcijama.

Primjer 6.5 C AUCHYEVA RASPODJELA


Na primjeru 6.4 je pokazano da Cauchyeva raspodjela ρC nema funkciju izvodnicu.
Pogledajmo što je s karakterističnom funkcijom.

eı k x
Z +∞ Z +∞ Z +∞
ex ( k ) = 1
Z dx =
1 cos(k x )
dx +
ı sin(k x )
dx .
π 1+x 2 π 1 + x2 π 1 + x2
−∞ −∞ −∞

Drugi integral (sa sinusom) je jednak nuli jer je podintegralna funkcija neparna,
Z +∞
sin(k x )
dx = 0,
−∞ 1 + x2

pa preostaje
Z +∞
ex ( k ) = 1
Z
cos(k x )
dx .
π −∞ 1 + x2

Integracijom u kompleksnom području10 se pokazuje da je

ex (k ) = e−|k| ≤ 1.
Z

Razvoj u red daje

|k| k 2 |k| 3 k 4
Zx ( k ) = 1 −
e + − + ··· .
1! 2! 3! 4!
Usporedbom gornjeg izraza sa (6.29), zaključujemo da je

ı h x i = −1, − x 2 = 1, −ı x 3 = 1, . . .


Budući da momenti ne mogu biti imaginarni, a parni momenti ne mogu biti ni negativni,
to opet zaključujemo da Cauchyjeva raspodjela nema momente (ali karakteristična
funkcija postoji i nije divergentna). 

Dokažimo i slijedeću tvrdnju poznatu kao TEOREM INVERZIJE:

Teorem 6.3.1 Svaka raspodjela vjerojatnosti ima svoju karakterističnu funkciju, a tu


istu karakterističnu funkciju ne može imati nijedna druga raspodjela
vjerojatnosti.

Neka kontinuirana nasumična varijabla x poprima vrijednosti u intervalu h −∞, +∞ i.


Njezinoj raspodjeli gustoće vjerojatnosti ρ( x ), je relacijom
Z +∞
Z
ex ( k ) = e ı k x ρ( x ) dx
−∞

10 Vidjeti npr. odjeljak o kompleksnoj analizi u G LUMAC, Matematičke metode fizike.


6.3 Karakteristična funkcija - Fourierova preobrazba 335

pridružena karakteristična funkcija Z


ex (k ). Izračunajmo slijedeći integral
Z +K Z +K Z +∞
−ı k y −ı k y
e ex (k ) dk =
Z e dk e ı k x ρ( x ) dx
−K −K −∞
" #+K
e ı k ( x −y)
Z +∞ Z +K Z +∞
ı k ( x −y)
= dx ρ( x ) e dk = dx ρ( x )
−∞ −K −∞ ı ( x − y)
−K
Z +∞
sin[K ( x − y)]
=2 ρ( x ) dx .
−∞ x−y

Umjesto varijable integracije x, uvodimo novu varijablu

z = K ( x − y ), dz = K dx ,

u kojoj je
Z +K Z +∞
,
sin(z)
e− ı k y Z
ex (k ) dk = 2 ρ(z/K + y) dz lim
−K −∞ z K →∞
Z +∞ Z +∞ Z +∞
sin(z) sin(z)
e− ı k y Z
ex (k ) dk = 2 ρ(y) dz = ρ(y) 2 dz .
−∞ −∞ z −∞ z

No, ovaj posljednji integral se opet rješava integracijom u kompleksnoj z-ravnini11 i


daje
Z +∞
sin(z)
dz = π,
−∞ z
pa je tako dobiveno da je
Z +∞
e− ı k y Z
ex (k ) dk = 2 π ρ(y),
−∞

tj.

Z +∞
1
ρ( x ) = e− ı k x Z
ex (k ) dk (6.30)
2π −∞

Gornjim se izrazom iz dane karakteristične funkcije, Z ex (k), jednoznačno dobiva gustoća


vjerojatnosti, ρ( x ). U tom smislu je gornja relacije inverz relacije (6.28) kojom se iz
poznate gustoće vjerojatnosti, računa karakteristična funkcija.
Sada su poznate obje relacije koje omogućavaju račun karakteristične funkcije iz poznate
gustoće vjerojatnosti i račun gustoće vjerojatnosti iz poznate karakteristične funkcije
Z +∞ Z +∞
ıkx 1
Z
ex ( k ) = e ρ( x ) dx , ←→ ρ( x ) = e− ı k x Z
ex (k ) dk .
−∞ 2π −∞

Primjer 6.6 C AUCHYJEVA RASPODJELA


Karakteristična funkcija Cauchyjeve raspodjele je

ex (k ) = e−|k| .
Z
11 Vidjeti npr. G LUMAC, Matematičke metode fizike.
336 Poglavlje 6. Funkcija izvodnica

Izračunajmo funkciju raspodjele gustoće vjerojatnosti.


Prema (6.30) je
1 +∞
Z
1 0 Z
1
Z +∞
ρ( x ) = e−ı k x e−|k| dk = e−ı k x+k dk + e−ı k x−k dk
2π −∞ 2π −∞ 2π 0
Z +∞ Z +∞
1 1
= e ı k x−k dk + e−ı k x−k dk
2π 0 2π 0
 ıkx k=∞
1 e −k e− ı k x − k 1 1
= e + e = .
2π ı x − 1 −ı x − 1 k =0 π 1 + x2
nacrtati 

 Primjer 6.7 Zadana je karakteristična funkcija


h  i
ex (k ) = exp − x 1 − e ı k ,
Z x = 0, 1, 2, . . . .

Potrebno je odrediti raspodjelu vjerojatnosti diskretne neasumične varijable x.


dovršiti 

 Primjer 6.8 Zadana se dvije nezavisne nasumične varijable ....


dovršiti 

 Primjer 6.9 Zadana je omjer dvije nezavisne nasumične varijable ....


dovršiti 

 Primjer 6.10 Zadane su raspodjele dvije nezavisne nasumične varijable ....


dovršiti 

 Primjer 6.11 Neka su nezavisne nasumične varijable .... opisane istom raspodjelom
vjerojatnosti ....
dovršiti 

Zadatak 6.8 Zadana je karakteristična funkcija


2 /2
e− k .

Izračunajte pridruženu gustoću vjerojatnosti. 

Rješenje:
Prema (6.30) je
1 +∞ +∞
ex (k ) dk = 1
Z Z
2
ρ( x ) = e− ı k x Z e−ı k x e−k /2 dk
2π −∞ 2π −∞
1 − x 2 /2 √
Z +∞
1 − x 2 /2 2
= e e−(k+ı x) /2 dk = e 2π
2π −∞ 2π
1 2
=√ e− x /2

Zadatak 6.9 Zadana je karakteristična funkcija

 1 − | k |, |k| ≤ 1,

Z
ex ( k ) =
0, |k| > 1 .

6.3 Karakteristična funkcija - Fourierova preobrazba 337

Izračunajte i nacrtajte gustoću vjerojatnosti. 

Rješenje:
Prema (6.30) je
Z +∞ 0 Z 1
1 ex (k ) dk = 1
Z 
−ı k x −ı k x −ı k x
ρ( x ) = e Z e (1 + k) dk + e (1 − k) dk
2π −∞ 2π −1 0
2
1 sin( x/2)

= ··· = .
2π x/2

K ARAKTERISTI ČNA FUNKCIJA TRANSFORMIRANE VARIJABLE


U odjeljku 3.6.3 je pomoću nasumične varijable x i funkcije f ( x ), uvedena nova nasu-
mična varijabla

y = f (x)

i izračunata je njezina raspodjela gustoće vjerojatnosti φ(y). Pokažimo kako se računa


karakteristična funkcija varijable y.

U skladu s definicijom (3.50), može se izračunati i karakteristična funkcija pridružena


varijabli y
Z Z Z
Z
ey ( k ) =e ı k y φ(y) dy = (3.49) = e ı k y dy δ[y − f ( x )] ρ( x ) dx
Z D E
= e ı k f (x) ρ( x ) dx = e ı k f (x) . (6.31)

Jedan jednostavan primjer funkcije y = f ( x ) je linearno preslikavanje

y = a x.

Prema (6.31) i definiciji karakteristične funkcije (6.27), je


D E
Zey ( k ) = e ı k a x = Z
ex ( a k )

Neka je Zex (k ) karakteristična funkcija varijable x. Izračunajmo karakterističnu funkciju


varijable

y = a0 + a1 x,

gdje su a0 i a1 konstante. Prema (6.27)


Z xk Z xk
Z
ey ( k ) = e ık(a0 +a1 x) ρ( x ) dx = e ıka0 e ıka1 x ρ( x ) dx
xp xp

= e ıka0 Z
ea x (k ) = e ıka0 Z
1
e x ( a1 k ). (6.32)

U gornja dva primjera y je bila funkcija jedne varijable x. Pogledajmo čemu je jednaka
karakteristična funkcija Z
ey varijable y, ako je y zadana kao linearna kombinacija varijabla
x1 i x2

y = f ( x1 , x2 ) = a1 x1 + a2 x2 ,
338 Poglavlje 6. Funkcija izvodnica

gdje su a1 i a2 konstante. Prema (6.31) je


D E Z Z
ey (k ) = e ı k (a1 x1 +a2 x2 ) = dx1
Z dx2 e ı k (a1 x1 +a2 x2 ) ρ( x1 , x2 )
ex ,x ( a1 k, a2 k ).
=Z 1 2

Gornji izraz vrijedi bez obzira jesu li x1 i x2 ovisne ili neovisne. Ako su neovisne, tada je
ρ( x1 , x2 ) = ρ1 ( x1 ) ρ2 ( x2 ), pa se gornji izraz pojednostavljuje
D E Z Z
ı k ( a1 x1 + a2 x2 )
Zy (k ) = e
e = dx1 dx2 e ı k (a1 x1 +a2 x2 ) ρ1 ( x1 ) ρ2 ( x2 )
Z Z
= dx1 e ı k a1 x1 ρ1 ( x1 ) dx2 e ı k a2 x2 ρ2 ( x2 ) = Z e x ( a2 k ),
e x ( a1 k ) Z
1 2

tj. za neovisne varijable je

Z
ea x + a x ( k ) = Z e x ( a2 k ).
e x ( a1 k ) Z
1 1 2 2 1 2

Gornji je izraz lako poopćiti na D neovisnih varijabla

Z
ea x +a x +···+a x (k ) = Z
e x ( a1 k ) Z e x ( a D k ).
e x ( a2 k ) · · · Z (6.33)
1 1 2 2 D D 1 2 D

Posebno, ako su sve varijable xn raspodjeljene po istoj raspodjeli, biti će i


h iD
Z
ex + x +···+ x (k ) = Zex ( k ) .
1 2 D 1

6.3.2 Diskretne varijable


K ARAKTERISTI ČNA FUNKCIJA JEDNOLIKE RASPODJELE :
... dovršiti ...

K ARAKTERISTI ČNA FUNKCIJA GEOMETRIJSKE RASPODJELE :


... dovršiti ...

K ARAKTERISTI ČNA FUNKCIJA BINOMNE RASPODJELE :


Binomna raspodjela vjerojatnosti je dana sa (4.11)

N
 
P( x ) = p x q N −x , x = 0, 1, 2, · · · , N.
x

Prema definiciji12 (6.28), je


N N
N
 
Z
ex ( k ) = ∑ e ıkx
P( x ) = ∑ e ıkx
x
p x q N −x
x =0 x =0
N
N
 
= ∑ x
( pe ık ) x q N −x = (q + pe ık ) N .
x =0

ex ( k ) = ( q + p e ı k ) N .
Z (6.34)

12 Sada je varijabla x diskretna, pa umjesto integrala dolazi zbroj.


6.3 Karakteristična funkcija - Fourierova preobrazba 339

Pokažimo još kako se karakterističnom funkcijom računaju očekivanje i varijanaca


binomne raspodjele. Prema (6.29) je

ı h x i = N p ı e ı k ( q + p e ı k ) N −1 = ı N p,

k =0
h i
− x 2 = ı N p e ı k (q + pe ı k ) N −2 ( N − 1) ı p e ı k + ı (q + pe ı k ) = −( pN ) 2 − N pq


k =0
Var ( x ) = x 2 − h x i 2 = N p q.



Uvjerimo se da je Z x (k) ≤ 1
e

2
x = (q + p e ı k ) (q + p e −ı k ) = · · · = 1 − 2qp[1 − cos(k )] ≤ 1.
Z ( k )
e

Desna strana je manja ili jednaka jedan zato što je |cos(k )| ≤ 1, a na strani 373. je poka-
zano da je umnožak pq najviše jednak 1/4.

K ARAKTERISTI ČNA FUNKCIJA P OISSONOVE RASPODJELE :


Sjetimo se da se Poissonova raspodjela dobije kao granična vrijednost binomne, kada
p → 0, N → ∞, pN ≡ λ = const.
Dakle, karakterističnu funkciju Poissonove raspodjele ćemo dobiti kao opisanu graničnu
vrijednost
N  N
λ (e ı k − 1)

ık N λ ık λ
Zx ( k ) = ( q + e p ) = 1 −
e +e = 1+ .
N N N
U skladu s definicijom eksponencijalne funkcije, (4.50), u granici N → ∞ uz konstantni
λ, gornji je izraz jednak

e x ( k ) = e λ (e ı k −1)
Z (6.35)

karakterističnoj funkciji Poissonove raspodjele. Prema (6.29) računamo momente



Z
ex (k ) = 1,
k =0
dZex (k ) ı k λ (e ı k −1)

= λ ı e e = ı λ = ı hxi ,
dk k =0

k =0
2
d Zx (k ) ı k λ (e ı k −1)

e 1 ık
= −λ − λ 2 = − x 2 ,
e

2
= − λe ( + λe )
dk k =0

k =0

σ 2 = x 2 − h x i 2 = λ.



Uvjerimo se da je Z x (k) ≤ 1
e

2 ık −ı k
x = e λ(e −1) e λ(e −1) = e −2λ(1−cos(k))
Z ( k )
e

Budući da je

0 ≤ 1 − cos(k ) ≤ 2 ⇒ Zx (k ) ≤ 1.
e
340 Poglavlje 6. Funkcija izvodnica

Zadatak 6.10 Diskretna nasumična varijabla x, s jednakim vjerojatnostima poprima


vrijednosti iz skupa {−2, −1, 0, 1, 2} Izračunajte njezinu karakterističnu
funkciju. 

Rješenje:
dovršiti

Zadatak 6.11 Diskretna nasumična varijabla x je definirana vjerojatnostima

P( x ) = 0.5| x| , {· · · , −4, −2, 1, 3, 5, · · · }.

Koristeći karakterističnu funkciju, izračunajte očekivanje x. 

Rješenje:
dovršiti
Zadatak 6.12 Izračunajte karakterističnu funkciju geometrijske raspodjele

P ( x ) = p (1 − p ) x , x = 0, 1, 2, · · ·

i na temelju toga, izračunajte očekivanje x. 

Rješenje:
dovršiti
Zadatak 6.13 Nasumična varijabla x poprima vrijednosti iz skupa {0, 1, 2, · · · } s
vjerojatnostima

ax
P( x ) = , a > 0,
(1 + a ) x +1
(Pascalova raspodjela). Pomoću karakteristične funkcije izračunajte
očekivanje i varijancu x. 

Rješenje:
dovršiti

6.3.3 Kontinuirane varijable

K ARAKTERISTI ČNA FUNKCIJA JEDNOLIKE RASPODJELE :


U definiciju karakteristične funkcije (6.27), za gustoću vjerojatnosti treba uvrstiti gustoću
jednolike raspodjele (4.66)

1 eıkb −eıka
Z b
1
Z
ex ( k ) = eıkx dx =
a b−a b−a ık

Ako su granice a i b simetrične,

a → − a, b → + a,
6.3 Karakteristična funkcija - Fourierova preobrazba 341

tada je i

ex (k ) = sin(k a) .
sin ( ka ) / ( k a )

0.5

Z (6.36)
ka
0

-100 -50 0 50 100


ka


Iz (6.36) i gornje slike se vidi da je karakteristična funkcija realna i da je Z ( k ) ≤ 1.
e
x

K ARAKTERISTI ČNA FUNKCIJA G AUSSOVE ( NORMALNE ) RASPODJELE :


Na desnu stranu izraza kojim se definira karakteristična funkcija (6.27), za gustoću
vjerojatnosti treba uvrstiti Gaußovu gustoću (4.79)

+∞
Z "  2#
ex (k ) = √1 1 x − hxi

Z exp( ı k x ) exp − dx = · · ·
σ 2π 2 σ
−∞
+∞
Z
1 1 [ x − ( ı k σ 2 + h x i)] 2
   
= √ exp ı k h x i − σ 2 k 2 exp − dx .
σ 2π 2 2 σ2
−∞

Uvod̄enjem nove varijable

x − ( ı k σ 2 + h x i)
η= √ ,
σ 2

konačno se dobiva
Z +∞
1 1 2 2 1
   
−η 2
Zx (k ) = √ exp ı k h x i − σ k
e e dη = exp ı k h x i − σ 2 k 2
π 2 2
| −∞ {z
√ }
= π

1
 
2 2
ex (k ) = exp ı k h x i − σ k .
Z (6.37)
2

nacrtati
Iz gornjeg je izraza je očito da je

1
k2 σ2

Zx ( k ) = e− 2 ≤ 1.
e

Takod̄er je iz (6.37) lako razdvojiti realni i maginarni dio

ex (k ) = e− 12
Z σ 2k 2
[cos(k h x i) + ı sin(k h x i)].
342 Poglavlje 6. Funkcija izvodnica

Nacrtajte realni imaginarni dio gornje karakteristične funkcije.


Ako se karakteristična funkcija, (6.37), razvije u red, dobiva se
1 2 2 1 1 2 2 2
   
Zx ( k ) = 1 + ı k h x i − k σ +
e ı k hxi − k σ
2 2! 2
3
1 1 2 2 1 1 2 2 4
  
+ ı k hxi − k σ + ı k hxi − k σ + ···
3! 2 4! 2
1 1
2 2 1
x k − ı hxi 3 x 2 − 2 hxi 2 k 3


=1+ı hxi k −
1! 2! 3!
1 
2 2
− 2 hxi 4 k 4 + · · ·

+ 3 x
4!
iz čega je, usporedbom sa (6.29), lako pročitati pojedine momente raspodjele

x = hxi 3 x 2 − 2 hxi 2 ,

3 



2
x 4 = 3 x 2 − 2 hxi 4 ,
D E

..
.

K ARAKTERISTI ČNA FUNKCIJA GAMA RASPODJELE :


U definiciju karakteristične funkcije (6.27), za gustoću vjerojatnosti treba uvrstiti gustoću
gama raspodjele (4.96)
Z +∞
1
Z
ex ( k ) = e ı k x x n−1 e− x dx .
Γ(n) 0

Uvod̄enjem nove varijable


u = (1 − ı k ) x, du = (1 − ı k ) dx ,
dobiva se
Z +∞   n −1 Z +∞
1 1 u 1
Z
ex ( k ) = e −u
du = (1 − ı k ) − n u n−1 e−u du
Γ(n) 1 − ı k 0 1−ık Γ(n) 0

e x ( k ) = (1 − ı k ) − n .
Z (6.38)

Iz gornjeg je izraza lako dobiti da je


1
Zx ( k ) = ≤ 1.
e
(1 + k 2 ) n/2
Polazeći od (6.38), izračunajmo realni imaginarni dio karakteristične funkcije
1 (1 + ı k ) n (1 + ı k ) n
Z
ex ( k ) = =
(1 − ı k ) n (1 + ı k ) n (1 + k 2 ) n
n
1 n l l
 
= 2 n ∑
(1 + k ) l =0 l
ı k

1 n(n − 1) 2 n(n − 1)(n − 2)(n − 3) 4


 
= 1− k + k − ···
(1 + k 2 ) n 2! 4!
n(n − 1)(n − 2) 3 n(n − 1)(n − 2)(n − 3)(n − 4) 5
 
+ ı nk − k + k − ··· .
3! 5!
6.3 Karakteristična funkcija - Fourierova preobrazba 343

Nacrtajte realni i maginarni dio gornje karakteristične funkcije.

Pretpostavimo da su dvije nezavisne kontinuirana nasumične varijable, x1 i x2 , ras-


podjeljene po gama raspodjelama sa stupnjevima slobode n i m
1 1
ρ1 ( x1 ) = x n −1 e− x1 , ρ2 ( x2 ) = x m −1 e− x2 ,
Γ(n) 1 Γ(m) 2
i pripadnim karakterističnim funkcijama
e1 (k ) = (1 − ı k )−n ,
Z e2 (k ) = (1 − ı k )−m .
Z
U skladu s (6.33), karakteristična funkcija nasumične varijable
y = x1 + x2
je

Z
ey ( k ) = Z e2 (k ) = (1 − ı k )−(n+m) .
e1 (k ) · Z

No, gornja funkcija je upravo karakteristična funkcija gama raspodjele sa stupnjem


slobode n + m
1
ρy (y) = y n + m −1 e− y .
Γ(n + m)
Time je pokazano da je zbroj dvije nezavisne nasumične varijable x1 i x2 raspodjeljene
po gama raspodjelama, nova nasumična varijabla y raspodjeljena takod̄er po gama
raspodjeli (kao što smo to pokazali i kod funkcije izvodnice).

Zadatak 6.14 Neka je x kontinuirana nasumična varijabla na intervalu [0, 2]. Gustoća
vjerojatnosti je

( a) ρ( x ) = 1/2,
(b) ρ( x ) = x/2,
x
(c) ρ( x ) = 1 − ,
2
( d ) ρ ( x ) = |1 − x |,
3
(e) ρ( x ) = x 2 .
8
Provjerite je li gustoća normirana. Izračunajte
i nacrtajte karakteris-
tičnu funkciju i pomoću nje izračunajte h x i , x 2 i x 3 .




Rješenje:
(d)
Uvrštavanjem zadane gustoće vjerojatnosti u definiciju funkcije izvodnice (6.27), izravnim se
računom dobiva
ık 
ex ( k ) = 1 e ı k − 1 1 + 1 + e ı k − e
 
Z ,
ık ık ık

2 3 1
h x i = 1, x = , σ2 = .
2 2
dovršiti i nacrtati
344 Poglavlje 6. Funkcija izvodnica

Zadatak 6.15 Neka je x kontinuirana nasumična varijabla na intervalu (0, ∞ i. Gus-


toća vjerojatnosti je

( a) ρ( x ) = 2e−2x ,
1
(b) ρ( x ) = e−2x + e−x ,
2
(c) ρ( x ) = 4xe−2x ,
λ
(d) ρ( x ) = (λx ) n−1 e−λx .
( n − 1) !
Provjerite je li gustoća
normirana, izračunajte i nacrtajte karakteris-
tičnu funkciju i h x i , x 2 i x 3 .




Rješenje:
(c)
Z ∞
4
Z
ex ( k ) = e ıkx 4xe−2x dx = · · · =
0 (2 − ık) 2
ex (k = 0) = 1,
Z

dZex (k )
= · · · = 1 = hxi ,
dk

k =0
d2 Z
ex (k ) 3
1
= · · · = = x2 , σ 2 = x 2 − hxi 2 = .


2

dk 2 2

k =0

Zadatak 6.16 Neka je x kontinuirana nasumična varijabla zadana gustoćom vjerojat-


nosti

1 − | x |, | x | < 1.

Izračunajte i nacrtajte karakterističnu funkciju. 

Rješenje:
dovršiti
Zadatak 6.17 Izračunajte i nacrtajte karakterističnu funkciju i momente kontinuirane
nasumične varijable x čija je gustoća vjerojatnosti dana sa
 −x
 e , x ≥ 0,
ρ( x ) =
0, x<0.

Rješenje:
Z +∞ Z +∞
ıkx
Z
ex ( k ) = e ρ( x ) dx = e ıkx− x dx .
−∞ 0
Uvod̄enjem nove varijable u = (ık − 1) x, lako se dolazi do
1 ∞
ıkx − x 1
Zx ( k ) =
e e = .
ık − 1 0 1 − ık
6.4 Kumulantna funkcija 345

ex (k = 0) = 1.
Primjetimo da je normiranje zadovoljeno Z
Prema ... momenti se računaju kao

dn Z
ex (k )
= ı n hx n i ,
dkn

k =0

iz čega slijedi

dZex ( k ) ı
= ⇒ h x i = 1 = 1 !,
dk (1 − ık) 2
d2 Z
ex ( k ) −2
⇒ x 2 = 2 = 2 !,


2
= 3
dk (1 − ık)
3
d Zex ( k ) −6ı
⇒ x 3 = 6 = 3 !.


3
= 4
dk (1 − ık)

Iz gornjeg računa je lako zaključiti čemu jednak n-ti moment

hx n i = n ! .

Zadatak 6.18 Gustoća vjerojatnosti kontinuirane nasumične varijable x prikazana



2 / (b - a) je na desnoj slici. Uvjerite se da
je gustoća vjerojatnosti normirana.
Izračunajte karakterističnu funk-
x ciju i pomoću nje srednju vrijed-
a b nost i varijancu varijable x.

Rješenje:
dovršiti

6.4 Kumulantna funkcija


Kumulantna13 funkcija nasumične varijable x, se definira u odnosu na funkciju izvod-
nicu, 6.3, kao njezin logaritam14 i tada se označava kao

D E
Fx (k) = ln [ Zx (k )] = ln ekx (6.39)

ili u odnosu na karakterističnu funkciju, (6.27), takod̄er kao njezin logaritam i tada se
označava kao
h i D E
e x (k) = ln Z
F ex (k) = ln e ı k x . (6.40)

13 Ponegdjeu literaturi se kumulantna funkcija naziva i karakteristična funkcija druge vrste.


14 Fizičko
značenje funkcije izvodnice je particjska funkcija kanonskog ansambla, pa iz toga slijedi da
kumulantna funkcija ima fizičko značenje (do na množenje s −kB T) slobodne energije. Iz toga slijedi i izbor
oznake za kumulantnu funkciju.
346 Poglavlje 6. Funkcija izvodnica

Osim na gornji način, kumulanti, hh x n ii , se mogu definirati preko funkcije izvodnice


kumulanata, g


kn
gx (k) = ∑ hh x n ii
n
.
n =1

K UMULANTNA FUNKCIJA F
Derivacije kumulantne funkcije F su

dFx (k ) 1
= Z 0 ( k ),
dk Zx ( k ) x
d2 Fx (k ) 1 h 00 0 2
i
= Z x ( k ) Z x ( k ) − ( Z x ( k )) ,
dk2 Zx2 (k )
d3 Fx (k ) 1 h 3 000 2 0 00 0 3
i
= Z x ( k ) Z x ( k ) − 3Z x ( k ) Z x ( k ) Z x ( k ) + 2Z x ( k )( Z x ( k )) ,
dk3 Zx4 (k )
..
.

Uvrštavanjem (6.29) u gornje izraze, slijedi

dFx (k )

= hxi ,
dk k=0
d2 Fx (k )

x − hxi 2 = σ 2

2
= = M2
dk2
k =0
d3 Fx (k)

x + 2 h x i 3 = M3

3
2
= x − 3 h x i
dk3
k =0

4
d Fx (k)
= ... 6= M4
dk4 k=0
..
.

Samo su drugi i treći kumulanti srazmjerni centralnim momentima, dok se ostali


kumulanti razlikuju od njih.
Razvojem Fx (k) u Taylorov red oko k = 0 i uvrštavanjem gornjih derivacija, dobiva se

k dFx (k ) k 2 d2 Fx (k ) k 3 d3 Fx (k )

F x ( k ) = F x (0) + + + + ···
1! dk k=0 2! dk2 k=0 3! dk3 k=0

Uvedu li se, nove veličine, KUMULANTI reda l, s oznakom x l , a definirani relacijom


dl Fx (k )
DD EE
l
x = , (6.41)
dkl k=0

tada se gornji Taylorov red može zapisati u obliku



k k 2

2 k 3

3 k l DD l EE
Fx (k ) = 0 +
1!
x
hh ii +
2!
x +
3!
x + · · · = ∑ l! x , (6.42)
l =1
6.4 Kumulantna funkcija 347

i, istim postupkom, za funkciju izvodnicu momenata


k l DD l EE
Fx (k ) = ∑ l!
x . (6.43)
l =1

Nekoliko prvih kumulanata, izraženih preko momenata, su

x 0 = 0,


DD EE
x 1 = hxi ,

x = x − hxi 2 ,

2
2

x = x − 3 x 2 hxi + 2 hxi 3 ,

3
3


2
x 4 = x 4 − 4 x 3 h x i + 12 x 2 h x i 2 − 3 x 2 − 6 h x i 4
DD EE D E
(6.44)


x = x − 5 x 4 h x i − 10 x 3 x 2 + 20 x 3 h x i 2

5
5 D E



2
+ 30 x 2 h x i − 60 x 2 h x i 3 + 24 h x i 5 ,



2
x = x − 6 x 5 h x i − 15 x 4 x 2 + 30 x 4 h x i 2 − 10 x 3

6
6
D E
D E


3
2
+ 120 x 3 x 2 h x i − 120 x 3 h x i 3 + 30 x 2 − 270 x 2 h x i 2



+ 360 x 2 h x i 4 − 120 h x i 6 ,

..
.

Drukčiji način da se dod̄e do gornjih eksplicitnih izraza za kumulante, jeste da se krene


od definicije (6.40) i izvede razvoj eksponencijalne funkcije

k 2
2 k 3
3
D E  
kx
Fx (k ) = ln [ Zx (k)] = ln e = ln 1 + k h x i + x + x + ··· ,
2! 3!

a zatim i razvoj logaritma

η2 η3 η4 k 2
2 k 3
3
ln(1 + η ) = η − + − + ··· , η ≡ k hxi + x + x + ··· ,
2 3 4 2! 3!

što vodi na red potencija u k n .

k2 k3
Fx (k ) = k h x i + x2 + x3 + · · ·



2! 3!
1 h k 2 k 3
3 i2
− k hxi + x2 + x + ···


2 2! 3!
1h k 2
2 k 3
3 i3
+ k hxi + x + x + ···
3 2! 3!

1h k 2
2 k 3
3 i4 k l DD l EE
− k hxi + x + x + ··· + ··· ≡ ∑ x .
4 2! 3! l =0
l!

Ako se koeficijenti tog reda izjednače s odgovarajućim koeficijentima iz (6.46), dobivaju


se (ponovo) navedene veze izmed̄u kumulanata i momenata.
348 Poglavlje 6. Funkcija izvodnica

K UMULANTNA FUNKCIJA F e
Derivacije kumulantne funkcije F
e su

dFe x (k) 1 e0
= Zx ( k ),
dk Zx ( k )
e
d2 F
e x (k) 1 he ex0 (k )) 2 ,
ex0 0 (k ) − ( Z
i
= Z x ( k ) Z
dk2 ex2 (k )
Z
d3 F
e x (k) 1 he3 000 2 0 00 0 3
i
= Z x ( k ) Z x ( k ) − 3 Z x ( k ) Z x ( k ) Z x ( k ) + 2 Z x ( k )( Z x ( k )) ,
dk3
e e e e e e
ex4 (k )
Z
..
.

Uvrštavanjem (6.29) u gornje izraze, slijedi



dF e x (k )
= ı hxi ,
dk

k =0
2
d Fx (k )
= − x 2 + h x i 2 = −σ 2 = ı 2 M2
e

dk 2
k =0

3
d F e x (k)
= −ı x 3 + 3ı h x i x 2 − 2ı h x i 3 = ı 3 M3



dk 3
k =0

4
d Fx (k )
= ... 6= ı 4 M4
e
dk4

k =0
..
.

Ponovo, samo su drugi i treći kumulanti srazmjerni centralnim momentima, dok se


ostali kumulanti razlikuju od njih.
Razvojem F e x (k) u Taylorov red oko k = 0 i uvrštavanjem gornjih derivacija, dobiva se

k dFe x (k ) k 2 d2 F
e x (k ) k 3 d3 F
e x (k )
Fe x (k) = Fe x (0) + + + + ···
1! dk 2! dk2 3! dk3

k =0 k =0 k =0

Uvedu li se, nove veličine, KUMULANTI reda l, s oznakom x l , a definirani relacijom



DD EE 1 dl F ( k )
x

xl = l , (6.45)
e
ı dkl
k =0

tada se gornji Taylorov red može zapisati u obliku


2

∞ l DD EE
e x (k ) = 0 + ık hh x ii + (ık) x 2 + (ık) x 3 + · · · = ∑ (ı k )
F xl . (6.46)
1! 2! 3! l =1
l !

Nekoliko prvih kumulanata, izraženih preko momenata, su ponovo dani relacijama


(6.44). Drukčiji način da se dod̄e do gornjih eksplicitnih izraza za kumulante, jeste da se
krene od definicije (6.40) i izvede razvoj eksponencijalne funkcije

( ık ) 2
( ık ) 3

h i D E  
e x (k ) = ln Zex (k ) = ln e ı k x 2 3
F = ln 1 + ık h x i + x + x + ··· ,
2! 3!
6.4 Kumulantna funkcija 349

a zatim i razvoj logaritma

η2 η3 η4 (ık) 2
2 (ık) 3
3
ln(1 + η ) = η − + − + ··· , η ≡ ık h x i + x + x + ··· ,
2 3 4 2! 3!

što vodi na red potencija u (ık ) n .

2
3

e x (k ) = ık h x i + (ık) x 2 + (ık ) x 3 + · · ·
F
2! 3!
1 h (ık) 2 (ık) 3
3 i2
− ık h x i + x2 + x + ···


2 2! 3!
1h (ık) 2
2 (ık) 3
3 i3
+ ık h x i + x + x + ···
3 2! 3!

1h (ık) 2
2 (ık) 3
3 i4 (ı k) l DD l EE
− ık h x i + x + x + ··· + ··· ≡ ∑ x .
4 2! 3! l =0
l!

Ako se koeficijenti tog reda izjednače s odgovarajućim koeficijentima iz (6.46), dobivaju


se (ponovo) navedene veze izmed̄u kumulanata i momenata.

K UMULANTNA FUNKCIJA gx (k)


korelacije
veza s momentima preko Moebiusove inverzije
dokaz središnjeg graničnog teorema
povezanost

O P ĆI IZRAZ
za l-ti kumulant izražen preko momenata raspodjele, zgodno je prikazati i determinan-
tom

hxi 1 0 0 0 . . .



2
x hxi 1 0 0 ...

2

3
2
x


x (1)
h x i 1 0 . . .

DD EE
x l = (−1) l −1 4 3 3 2 3
x x () x ( ) hxi 1 ...


5
4 14
3 42
2 4
x x (1) x (2) x (3) h x i . . .

.. .. .. .. .. . .

. . . . . .
l×l

Kumulanti se mogu napisati preko (običnih) momenata (ref) kao

DD EE l
xl = ∑ (−1)k−1 (k − 1) ! Bl,k (m),
k =1

gdje je m = (h x i , x 2 , x 3 , · · · ), a Bl,k (m) je eksponencijalni Bellov polinom.




K UMULANTI PREKO CENTRALNIH MOMENATA


Samo su drugi i treći kumulant jednaki drugom i trećem centralnom momentu, (3.36),
dok se ostali kumulanti razlikuju od centralnih momenata, ali se mogu izraziti preko
350 Poglavlje 6. Funkcija izvodnica

njih. Npr.

0
x = 0,
DD EE
x 1 = hxi ,

2
x = M2 ,

3
x = M3 ,
DD EE
x 4 = M4 − 3M22 ,

5
x = M5 − 10M2 M3 ,

6
x = M6 − 15M4 M2 − 10M32 + 30M23 ,

7
x = M7 − 21M5 M2 − 35M4 M3 + 210M3 M22 ,

8
x = M8 − 28M6 M2 − 56M5 M3 − 35M42 + 420M4 M22 + 560M32 M2 − 630M24 ,

9
x = M9 − 36 M7 M2 − 84 M6 M3 − 126 M5 M4 + 756 M5 M22 + 2520 M4 M3 M2
+ 560 M33 − 7560 M3 M23 ,
..
.

Općenito se kumulanti računaju iz centralnih momenata kao

h xi = hxi ,
DD EE [l/2] l!
x l = ∑ (−1)k−1 (k − 1) ! B ( y ), l > 1.
k =1
(l − k) ! l −k,k

U gornjem je izrazu s Bi,k (y) označen eksponencijalni Bellov polinom u varijabli y ≡


y1 y2 · · · yi−k+1 , pri čemu je

Ml + 1
yl = ,
l+1
a Ml su centralni momenti, (ref). Bellovi polinomi se računaju iz rekurzije

i −k  
" # 
i . l + k
Bi,l +k = ∑ Ba,l Bi−a,k ,
a=l
a l
i i −2
 
i
Bi,0 = δi,0 , Bi,1 = yi , Bi,i = y1 , Bi,i−1 = y y2 .
2 1

Tako se npr. peti kumulant računa kao

2
5!
x5 = ∑ (−1)k−1 (k − 1) ! (5 − k) ! B5−k,k


k =1
= 5B4,1 − 20 B3,2 = 5y 4 − 60y1 y2 = M5 − 10M2 M3 .

M OMENTI IZRAŽENI PREKO KUMULANATA


Teorem: grafički se n-ti kumulant predstavlja kao povezni grozd (cluster) n točaka. Mo-
ment reda l se tada dobiva zbrajanjem svih mogućih podjela l točaka u skupine manjih,
6.4 Kumulantna funkcija 351

povezanih ili nepovezanih, grozdova. Doprinos svake od ovih podjela ukupnom zbroju
je jednak umnošku povezani kumulanata koje on predstavlja. Tako je npr.
hxi = h xi ,
x 2 = x 2 + hh x ii 2 ,

x = x + 3 x 2 hh x ii + hh x ii 3 ,

3

2
x 4 = x 4 + 4 x 3 hh x ii + 3 x 2 + 6 x 2 hh x ii 2 + hh x ii 4 ,
D E DD EE

x + 10 x 3 hh x ii 2

5

5 DD EE
x = x + 5 x 4 hh x ii + 10 x 3

2
+ 15 x 2 hh x ii + 10 x 2 hh x ii 3 + hh x ii 5 ,

(dodati sliku za ovaj gornji raspis) i općenito


D E l
xl = ∑ Bl,k (κ ),
k =0

pri čemu je κ = ( x 1 , x 2 , · · · ). Ovaj teorem je polazište za različite dijagramatske


pristupe računima u okviru statističke fizike i teorije polja.

Ili, za centralne momenate


[l/2]
l! x l +1


Ml = ∑ B
(l − k) ! l −k,k
( y ), yl =
l+1
, l ≥ 1.
k =1

Tako je npr.
M6 = 6B5,1 + 30B4,2 + 120B3,3 = 6y 5 + 30(4y1 y 3 + 3y22 ) + 120y13

DD 4 EE

3
= x 6 + 15 x 2 x + 10 x 3 + 15 x 2 .

Primjetimo da se kumulante može napisati i preko članova oblika


hx n x m i − hx n i hx m i . (6.47)
Tako je npr.

x = x − 3 x 2 h x i + 2 h x i 3 ≡ M3 ,

3
3

x 2 − hxi 2


 

= x 3 − x 2 hxi − 2 hxi


2
= x 4 − 4 x 3 h x i + 12 x 2 h x i 2 − 3 x 2 − 6 h x i 4 ,
DD EE D E
x4



D E
 


= x 4 − x 3 hxi − 3 hxi x 3 − x 2 hxi
2
+ 3 hxi 2 x 2 − hxi 2 − 3 x 2 − hxi 2 ,

 

..
.
352 Poglavlje 6. Funkcija izvodnica

F UNKCIJA IZVODNICA MOMENATA I KUMULANTI


Iz definicije funkcije izvodnice (6.3) i ekvivalentne relacije (6.8), znamo da je

kn
Zx ( k ) = ∑ n!
hx n i .
n =0

Isto tako iz (6.39) i (6.43) znamo da je



k l DD l EE
Fx (k ) = ln [ Zx (k)] = ∑ l!
x . (6.48)
l =1

Izjednačavanjem gornja dva izraza, dobiva se funkcija izvodnica momenata izražena


preko kumulanata

∞ ∞
!
kn k l DD l EE
Zx ( k ) = ∑ n!
h x n i = exp ∑ l!
x . (6.49)
n =0 l =1

U statističkoj fizici se koristi nešto drukčija notacija

−1
k → , x → E.
kB T
Nasumična varijabla x se shvaća kao ekstenzivna veličina, energija, a k je intenzivna
veličina, polje konjugirano ekstenzivnoj varijabli. U toj notaciji, prethodna relacija glasi

∞ ∞
" #
(−1) n (−1) l DD l EE
Zx ( k ) = ∑ n
h E i = exp ∑
n
E . (6.50)
n=0 n! ( k B T ) l =1
l ! (kB T ) l

R EKURZIJSKE RELACIJE
Izmed̄u kumulanata, momenata (oko ishodišta) i centralnih momenata (momenata oko
h x i), vrijede slijedeće rekurzijske relacije15
DD EE D E l −1 l − 1 DD EE D E
xl = xl − ∑ xi x l −i ,
i =1
i−1
l −1
l − 1 DD l −i EE
DD EE  
x l
= Ml − ∑ x Mi .
i =1
i

K UMULANTNE FUNKCIJE NEKOLIKO RASPODJELA


B INOMNA raspodjela - prema (6.34), je
 N  
Fx (k ) = ln [ Zx (k)] = ln q + p e k = N ln q + p e k ,
h i  N  
e x (k ) = ln Z
F ex (k ) = ln q + p e ı k = N ln q + p e ı k .
15 R. Willink (2003) Relationships Between Central Moments and Cumulants, with Formulae for the Central
Moments of Gamma Distributions, Communications in Statistics - Theory and Methods, Volume 32:4, 701 -
704.
6.4 Kumulantna funkcija 353

nacrtati realni i imaginarni dio ... dovršiti

P OISSONOVA raspodjela - prema (6.35), je

ex (k ) = ln e λ(e ı k −1) = λ(e ı k − 1) = λ(cos(k ) − 1) + ı λ sin(k ).


h i h i
e x (k ) = ln Z
F

nacrtati realni i imaginarni dio ... dovršiti

G AUSSOVA raspodjela - prema (6.37), je

ex (k ) = ln e ı k hxi− 21 k 2 σ 2 = ı k h x i − 1 k 2 σ 2 .
h i h i
e x (k ) = ln Z
F
2
nacrtati realni i imaginarni dio ... dovršiti

G AMA raspodjela - prema (6.38), je

ex (k ) = ln(1 − ı k )−n = −n ln(1 − ı k ) = −n ln


h i p 
e x (k ) = ln Z
F 1 + k 2 − ın arctan(−k ).

nacrtati realni i imaginarni dio ... dovršiti

... dovršiti ...

K UMULANTI NEKIH RASPODJELA


J EDNOLIKA raspodjela diskretne nasumične varijable (ref)
DD EE DD EE
x 1 = c0 , x l = 0, l > 1.

J EDNOLIKA raspodjela kontinuirane nasumične varijable (ref) na intervalu [−1, 0]


DD EE B
xl = l ,
l
gdje su Bl Bernoullijevi brojevi16
−1 1 −1
B0 = 1, B1 = , B2 = , B4 = ,
2 6 30
1 −1 5 −691
B6 = , B8 = , B10 = , B12 = ,
42 30 66 2 730
7 −3 617 43 867
B14 = , B16 = , B18 =
6 510 798
−174 611 854 513
B20 = , B22 = ,···
330 138
i B2n+1 = 0 za n = 1, 2, 3, · · · .

B INOMNA RASPODJELA, 4.1.3


Prema (6.13), funkcija izvodnica binomne raspodjele je

Z ( k ) = (1 − p + p e k ) N ,
16 http : //oeis.org/wiki/Bernoulli_numbers
https : //oeis.org/A027642,
http : //www.luschny.de/math/primes/bernincl.html,
http : //mathworld.wol f ram.com/BernoulliNumber.html .
354 Poglavlje 6. Funkcija izvodnica

pa je kumulantna funkcija binomne raspodjele


 
F(k ) = N ln 1 − p + p e k ,

a njezine su derivacije jednake

p ek

DD EE
1 ∂F
x =N = N p,

≡ k

∂k k=0
1 − p + p e k =0
∂2 F (1 − p) e k

2
x ≡ = Np = Nc, c ≡ p (1 − p ),
∂k2 k=0 (1 − p + p e k ) 2 k =0
∂3 F (1 − p) e k − pe 2k

3
x ≡ = N p (1 − p ) = Ng c, g ≡ 1 − 2p
∂k3 k=0 (1 − p + p e k ) 3 k =0
∂4 F (1 − p) 2 e k − 4p(1 − p)e 2k + p 2 e 3k
DD EE
4
x ≡ 4 = N p (1 − p ) = Nc( 1 − 6 c)
∂k k =0 (1 − p + p e k ) 4
k =0

itd. na sličan način se dobiva


5
x = Ngc( 1 − 12 c)

6
x = Nc( 1 − 30 c + 120 c 2 )

7
x = Ng( c − 60 c 2 + 360 c 3 )

8
x = N ( c − 126 c 2 + 1680 c 3 − 5040 c 4 )

9
x = Ng( c − 252 c 2 + 5040 c 3 − 20160 c 4 )
DD EE
x 10 = N ( c − 510 c 2 + 17640 c 3 − 151200 c 4 + 362880 c 5 )
DD EE
x 11 = Ng( c − 1020 c 2 + 52920 c 3 − 604800 c 4 + 1814400 c 5 )
DD EE
x 12 = N ( c − 2046 c 2 + 168960 c 3 − 3160080 c 4 + 19958400 c 5 − 39916800 c 6 )
..
.

Ako se kumulanti izraze u varijabli p (umjesto u c i g), dolazi se do


DD EE
x 1 = N p,

2
x = N p (1 − p ),

3
x = N p(1 − p)(1 − 2p) ≡ N p(1 − p) P1 ( p),
DD EE
x 4 = N p(1 − p)(1 − 6p + 6p 2 ) ≡ N p(1 − p) P2 ( p),

5
x = N p(1 − p)(1 − 14p + 36p 2 − 24p 3 ) ≡ N p(1 − p) P3 ( p),

6
x = N p(1 − p)(1 − 30p + 150p 2 − 240p 3 + 120p 4 ) ≡ N p(1 − p) P4 ( p),

7
x = N p(1 − p)(1 − 62p + 540p 2 − 1560p 3 + 1800p 4 − 720p 5 ) ≡ N p(1 − p) P5 ( p).

Primjetimo da se u izrazima za kumulante pojavljuju polinomi čije koeficijenete pre-


poznajemo17 kao T (n, m), broj načina na koje se n objekata može rasporediti u m kutija.
Ovi su koeficijenti povezani rekurzijom

T (n, m) = m[ T (n − 1, m − 1) + T (n − 1, m)], n ≥ 1, 1 ≤ m ≤ n,
17 http://oeis.org/A019538
6.4 Kumulantna funkcija 355

uz početni uvjet T (0, 0) = 1. Nekoliko prvih nizova su

n=1 T (1, 1) = 1,
n=2 T (2, m) = 1, 2 → P1 → q3 ,

DD EE
n=3 T (3, m) = 1, 6, 6 → P2 → q4 ,
n=4 T (4, m) = 1, 14, 36, 24 → P3 → q 5 ,

n=5 T (5, m) = 1, 30, 150, 240, 120 → P4 → q6 ,


n=6 T (6, m) = 1, 62, 540, 1560, 1800, 720 → P5 → q7 ,


n=7 T (7, m) = 1, 126, 1806, 8400, 16800, 15120, 5040,


n=8 T (8, m) = 1, 254, 5796, 40824, 126000, 191520, 141120, 40320,
n=9 T (9, m) = 1, 510, 18150, 186480, 834120, 1905120, 2328480, 1451520, 362880,
n = 10 T (10, m) = 1, 1022, 55980, 818520, 5103000, 16435440, 29635200, 30240000, 16329600, 3628800.

Prvi koeficijent je uvijek jednak 1, a posljednji je jednak n !. Ako se članovi zbroje s


alternirajućim predznakom, npr. za n = 9 i 10

1 − 510 + 18150 − 186480 + 834120 − 1905120 + 2328480 − 1451520 + 362880 = 1,


1 − 1022 + 55980 − 818520 + 5103000 − 16435440 + 29635200 − 30240000 + 16329600 − 3628800 = −1,

rezultat je (−1) n+1 .


Općenito je n-ti kumulant oblika

hh x n ( p)ii = (−1) n N p (1 − p) Pn−2 ( p),


Pri čemu su

P1 ( p) = 1 − 2 p,
P2 ( p ) = 1 − 6 p + 6 p 2 ,
P3 ( p) = 1 − 14 p + 36 p 2 − 24 p 3 ,
P4 ( p) = 1 − 30 p + 150 p 2 − 240 p 3 + 120 p 4 ,
P5 ( p) = 1 − 62 p + 540 p 2 − 1560 p 3 + 1800 p 4 − 720 p 5 ,
..
.
Pn (0) = 1,
P1 (0.5) = 0, P3 (0.5) = 0, P5 (0.5) = 0, P7 (0.5) = 0 P9 (0.5) = 0
1 17
P2 (0.5) = − , P4 (0.5) = 1, P6 (0.5) = − , P8 (0.5) = 31.
2 4
Uočimo i simetriju polinoma

Pn ( p) = (−1) n Pn (1 − p) ⇒ Pn (1) = (−1) n Pn (0) = (−1) n ,


iz čega tada slijedi

h x n ( p)ii = (−1) n h x n (1 − p)ii .


Susjedni kumulanti binomne raspodjele su povezani jednostavnom rekurzijom

∂ x n −1


n
h x i = p (1 − p ) .
∂p
356 Poglavlje 6. Funkcija izvodnica

G AUSSOVA RASPODJELA, (ref)


DD EE
hh x ii = h x i , x 2 = σ 2, x l = 0, l > 2.

E KSPONENCIJALNA RASPODJELA, (ref) s parametrom λ


DD EE (l − 1) !
xl = .
λl
P OISSONOVA RASPODJELA, (ref)
DD EE
x l = λ, ∀ l.

G EOMETRIJSKA RASPODJELA, (ref)


DD EE 1

2 DD 1 EE 1
1
x = − 1, x = x .
p p

K UMULANTNA FUNKCIJA DVIJE VARIJABLE


Prema definiciji kumulantne funkcije je
D E Z 
e x ,x (k1 , k2 ) = ln
F 1 2
e ı ( k 1 x1 + k 2 x2 ) = ln dx1 dx2 ρ( x1 , x2 ) e ık1 x1 e ık2 x2 (6.51)
∞ ∞
" #
(ık1 ) m1 (ık2 ) m2
m1 m2
= ln ∑ ∑ m1 ! m2 !
x1 x2
m1 =0 m2 =0
h 1
1
(ık1 ) 2 x12 + (ık2 ) 2 x22
= ln 1 + ık1 h x1 i + ık2 h x2 i + (ık1 )(ık2 ) h x1 x2 i +


2 2
1 1 i
+ (ık1 ) 2 (ık2 ) x12 x2 + (ık1 ) (ık2 ) 2 x1 x22 + · · · .



2 2
Razvojem gornjeg logaritma u red

η2 η3 η4
ln(1 + η ) = η − + − + ··· ,
2 3 4
dolazi se do
e x ,x (k1 , k2 ) = ık1 h x1 i + ık2 h x2 i
F 1 2

1 h
(ık1 ) 2 x12 − h x1 i 2


+
2!  
+ 2 (ık1 )(ık2 ) h x1 x2 i − h x1 i h x2 i

+ (ık2 ) 2 x22 − h x2 i 2

i

1 h
(ık1 ) 3 x13 − 3 x12 h x1 i + 2 h x1 i 3



+
3! 

+ 3 (ık1 ) 2 (ık2 ) x12 x2 − x12 h x2 i − 2 h x1 i (h x1 x2 i − h x1 i h x2 i)




+ 3 (ık1 )(ık2 ) 2 x1 x22 − h x1 i x22 − 2 h x2 i (h x1 x2 i − h x1 i h x2 i)

+ (ık2 ) 3 x23 − 3 x22 h x2 i + 2 h x2 i 3




i

+ ···
6.4 Kumulantna funkcija 357

Gornji se razvoj kumulantne funkcije dvije varijable može preglednije izraziti koristeći
poopćenje (6.47)
DD EE D E D E
xim x jn = xim x jn − h xim i x jn , i, j = 1, 2 (6.52)
Z   D E
= xim − h xim i x jn − x jn ρ( x1 , x2 ) dx1 dx2 .

e x ,x (k1 , k2 ) = ık1 h x1 i + ık2 h x2 i


F 1 2

1 h i
+ (ık1 ) 2 h x1 x1 i + 2 (ık1 )(ık2 ) h x1 x2 i + (ık2 ) 2 h x2 x2 i
2!
1 h 


(ık1 ) 3 x12 x1 − 2 h x1 i h x1 x1 i

+
3! 


+ 3 (ık1 ) 2 (ık2 ) x12 x2 − 2 h x1 i h x1 x2 i




+ 3 (ık1 )(ık2 ) 2 x1 x22 − 2 h x2 i h x1 x2 i



 i
+ (ık2 ) 3 x22 x2 − 2 h x2 i h x2 x2 i

1 h 


(ık1 ) 4 x12 x12 − 2 x12 h x1 x1 i − 4 h x1 i x1 x12

+
4!

2
+ 4 (ık1 ) 3 (ık2 ) x13 x2 + 6 h x1 i 2 h x1 x2 i − 3 x12 h x1 x2 i − 3 h x1 i 2 x12 x2





+ 6 (ık1 ) 2 (ık2 ) 2 x12 x22 + 6 h x1 i h x2 i h x1 x2 i − 2 h x1 x2 i h x1 x2 i



− 2 h x1 i x1 x22 − 2 h x2 i x12 x2


2
x1 x23 + 6 h x2 i 2 h x1 x2 i − 3 x22 h x1 x2 i − 3 h x2 i 2 x1 x22



+ 4 (ık1 )(ık2 ) 3

 i
+ (ık2 ) 4 x22 x22 − 2 x22 h x2 x2 i − 4 h x2 i x2 x22

..
.

Slično kao u (6.51), definira se i kumulantna funkcija više nasumičnih varijabla


h i
e~x (~k ) = ln Z
F e~x (~k )
)0
∞ ∞ ∞
(
(ı k1 ) m1 (ı k2 ) m2 . . . (ı k D ) m D

m1 m2
∑ ∑ ... ∑ x1 x2 . . . xDm D .

=
m1 =0 m2 =0 m D =0 m1 ! m2 ! . . . m D !

Crtica kod oznaka zbrajanja u gornjem izrazu znači da se izostavlja član

m1 = m2 = . . . = m D = 0,

koji je zbog normiranja gustoće vjerojatnosti, jednak nuli. Dvostrukom oštrom zagradom
su označeni kumulanti višedimenzijske nasumične varijable (6.52). Momenti drugog
reda (m1 , m2 6= 0, a svi ostali mk = 0) iz gornjeg razvoja, čine (simetričnu) KOVARIJANTNU
MATRICU

x12 − h x1 i 2
" #
h x1 x2 i − h x1 i h x2 i


.
x2 − h x2 i 2

2
h x2 x1 i − h x2 i h x1 i
358 Poglavlje 6. Funkcija izvodnica

Općenito se dobiva D × D matrica

x12 − h x1 i 2


h x1 x2 i − h x1 i h x2 i h x1 x3 i − h x1 i h x3 i ···
x2 − h x2 i 2

2
 h x2 x1 i − h x2 i h x1 i h x2 x3 i − h x2 i h x3 i ···
 

x3 − h x3 i 2

2
 h x3 x1 i − h x3 i h x1 i h x3 x2 i − h x3 i h x2 i ···
 

..
 
.
 
 
h x D x1 i − h x D i h x1 i xD2 − h xD i 2


··· ··· D×D

Dijagonalni elementi gornje matrice se zovu VARIJANCE dane varijable,

xi2 = xi2 − h xi i 2 ,

dok se elementi izvan dijagonale zovu KOVARIJANCE odgovarujećg

para varijabla
(usporediti s (3.67)). Primjetimo da je po samoj konstrukciji, matrica xi x j simetrična

xi x j = x j xi .

S TATISTI ČKA NEOVISNOST


Ako su dvije kontinuirane nasumične varijable, xi , x j , statističke neovisne, (3.12),

ρ ( x i , x j ) = ρ i ( x i ) ρ j ( x j ),

tada KUMULANTI IŠ ČEZAVAJU


m m D mj E
ximi x j j = ximi x j j − ximi
DD EE D E

xj
m D mj E
= ximi x j j − ximi
D E
xj = 0, (6.53)

kada su mi 6= 0 i m j 6= 0.
 Primjer 6.12 K UMULANTI ZBROJA DVIJE NASUMI ČNE VARIJABLE

Ako dvije nasumične varijable imaju zajednički dio

x1 = x0 + δx1 , x2 = x0 + δx2 ,

pa su time djelomice statistički zavisne, potrebno je izračunati prva tri kumulanta


nasumične varijable definirane kao njihova linearna kombinacija

E = x1 J1 + x2 J2 , J1 , J2 = const.

Pri tome će se pretpostaviti da obje varijable fluktuiraju na isti način, tj. da njihovi
momenti imaju iste vrijednosti
D E D E D E
δx1k = δx2k ≡ δx k ,

Prvi kumulant je jednostavno jednak prvom momentu

h Ei = h Ei = h x0 i ( J1 + J2 ) + hδx1 i J1 + hδx2 i J2 . = h x0 i ( J1 + J2 ) + hδx i ( J1 + J2 ).

Drugi kumulant je jednak varijanci

E 2 = E 2 − h Ei 2 .



6.4 Kumulantna funkcija 359

Srednja vrijednost energije je upravo izračunata, a srednja vrijednost kvadrata energije


je

E = [ x0 ( J1 + J2 ) + (δx1 J1 + δx2 J2 )] 2

2 D E

= x02 ( J1 + J2 ) 2 + 2J1 ( J1 + J2 ) h x0 δx1 i + 2J2 ( J1 + J2 ) h x0 δx2 i



+ δx 2 ( J12 + J22 ) + 2J1 J2 hδx1 δx2 i ,



dok je drugi kumulant jednak


2
E = 2J1 ( J1 + J2 ) h x0 δx1 i + 2J2 ( J1 + J2 ) h x0 δx2 i
− 2( J1 + J2 ) 2 h x0 i hδx i + 2J1 J2 hδx1 δx2 i
− hδx i 2 ( J1 + J2 ) 2 + δx 2 ( J12 + J22 ).

Primjetimo da u drugom kumulantu nema člana koji bi ovisio samo o zavisnoj kom-
ponenti x0 , tj. on je jednak nuli ako su δx1,2 = 0, tj. ako su varijable potpuno statistički
zavisne. Drugi kumulant se može simetričnije zapisati i kao

2
E = 2J1 ( J1 + J2 )(h x0 δx1 i − h x0 i hδx i) + 2J2 ( J1 + J2 )(h x0 δx2 i − h x0 i hδx i)
2 2
  

2 2
+ 2J1 J2 hδx1 δx2 i − hδx i + ( J1 + J2 ) δx − hδx i .

Iz gornjeg izraza se mogu izlučiti dva granična slučaja: (1) kada su varijable x1 i x2
potpuno nezavisne, tj. kada je x0 ≡ 0; (2) kada su varijable x1 i x2 potpuno zavisne,
tj. kada je δx j ≡ 0. Sve ostale vrijednosti x0 6= 0 i δx j 6= 0 opisuju situacije kada x1 i
x2 nisu niti nezavisne niti strogo (funkcijski) zavisne, nego su u većoj ili manjoj mjeri
korelirane18 nasumične varijable.
(1) Ako nema zavisne komponente, x0 = 0, δx1,2 = x1,2 , tada su x1 i x2 nezavisni i

E = +2J1 J2 h x1 x2 i − h x i 2 + ( J1 + J2 ) 2 x 2 − h x i 2

2   


= +2J1 J2 h x i h x i − h x i 2 + ( J1 + J2 ) 2 x 2 − h x i 2
  


= ( J1 + J2 ) 2 x 2 − h x i 2 .



(2) Ako su varijable potpuno zavisne, δx1,2 = 0, tada je i


2
E = 0.

Treći kumulant ... dovršiti ... 

NEKORELIRANOST
Dvije se varijable nazivaju nekorelirane kada je njihova kovarijanca jednaka nuli
m m D mj E
ximi x j j = 0 ximi x j j = ximi
DD EE D E

⇒ xj .

Primjetimo da je gornji uvjet slabiji od uvjeta statističke neovisnosti: čim su neovisne,


odmah su i nekorelirane, no ako su nekorelirane nije nužno da su i neovisne.

K UMULANTNA FUNKCIJA LINEARNE KOMBINACIJE


18 O korelacijama vidjeti više u poglavlju 9.
360 Poglavlje 6. Funkcija izvodnica

Primjerom 6.12 i relacijom (6.33) je pokazano da za karakteristične funkcije D NEOVIS -


NIH nasumičnih varijabla xd vrijedi

Z
ea x +a x ,··· ,+a x (k ) = Z
e x ( a1 k ) Z e x ( a D k ).
e x ( a2 k ) · · · Z
1 1 2 2 D D 1 2 D

Logaritmiranjem gornjeg izraza dobiva se ekvivalentna relacija za karakteristične funk-


cije

e a x +a x +···+a x (k ) = F
F e x ( a1 k ) + F e x ( a D k ).
e x ( a2 k ) + · · · + F
1 1 2 2 D D 1 2 D

VARIJANCA LINEARNE KOMBINACIJE


Neka je

y = a1 x1 + a2 x2 .

Zadatak je izračunati varijancu od y (drugi kumulant)

σy2 ≡ y 2 = y 2 − hyi 2

Iz (3.65) je poznato da je

h y i = a1 h x1 i + a2 h x2 i ,
⇒ hyi 2 = a12 h x1 i 2 + a22 h x2 i 2 + 2 a1 a2 h x1 i h x2 i .

Dakle, treba još izračunati

Z 2 Z Z 
y2 = y φ(y) dy = y 2 dy δ y − ( a1 x1 + a2 x2 ) ρ( x1 , x2 ) dx1 dx2


Z
( a1 x1 + a2 x2 ) 2 ρ( x1 , x2 ) dx1 dx2 = a12 x12 + a22 x22 + 2 a1 a2 h x1 x2 i .



=

Iz gornjih izraza izravno slijedi

x12 − h x1 i 2 + a22 x22 − h x2 i 2 + 2 a1 a2 h x1 x2 i − h x1 i h x2 i



 
  
y 2 = a12

= a12 x12 + a22 x22 + 2 a1 a2 h x1 x2 i .


Kao što je gore spomenuto, za nekorelirane varijable je h x1 x2 i = 0, pa iz gornjeg izraza


preostaje

y 2 = a12 x12 + a22 x22 , (6.54)


što je zatim lako poopćiti i na proizvoljan broj nekoreliranih varijabla.

6.4.1 Wickov teorem i Feynmanovi dijagrami


dovršiti
6.4 Kumulantna funkcija 361

6.4.2 Kumulantna funkcija - veza sa statističkom fizikom


KUMULANTNA FUNKCIJA - SLOBODNA ENERGIJA
Logaritam particijske funkcije, Z, srazmjeran je slobodnoj energiji F

F = −k B T ln( Z ).

Izrazi li se Z preko funkcije izvodnice, (6.7),


Z
= Zn (K ),
Z0
za slobodnu energiju se dobiva

F = −k B T ln( Z 0 ) − k B T ln [ Zn (K )].

U drugom se članu prepoznaje kumulantna funkcija, (6.40), definirana u odnosu na


funkciju izvodnicu (a ne u odnosu na karakterističnu funkciju)

Fn (K ) = ln [ Zn (K )].

O PSERVABLE
Unutarnja energija termodinamičkog sustava, U , se definira kao

∂ ln( Z ) 1
U =− , K = J0 β, β= .
∂β kB T
Izostavljajući trivijalni konstantni član koji dolazi od Z 0 , koristeći (6.7), za U se dobiva


l ∞

l
1 n 1 n
Zn (K ) l∑ Zn (K ) l∑
l −1 l −1
U = − J0 l K = − J0 l K = − J0 hni = − J0 h ni .
l! l!

=0 =1 K =0

Sličnim se putem i za specifičnu toplinu dobiva

∂U J2 h
J 2


= 0 2 n 2 − hni 2 = 0 2 n 2 .
i
C=
∂T kB T kB T
U gornjem izrazu se prepoznaje drugi kumulant n 2 ≡ M2 ≡ σn2 .

Slični se izrazi dobivaju i za magnetske varijable

Z = ∑ P ( n ) e −m(n) h , m(n) = m0 n, h ≡ β H.
n

Umjesto unutarnje energije se računa magnetizacija, a umjesto specifične topline, mag-


netska susceptibilnost. Tako se npr. polazeći od izraza (6.6), dobivaju magnetizacija M i
magnetska susceptibilnost χ

∂ ln( Z ) 1

Z∑
−nm0 h
M=− = − P ( n ) (− nm 0 ) e = h n i m0 = h n i m0 ,
∂h h=0

n
h =0

∂ 1

∂M
∂h Z ∑
−nm0 h
χ=− = − m 0 P ( n ) n e
∂h h=0

n
h =0
2 2
 
2 2

2
= m0 h n i − h n i = m0 n .
362 Poglavlje 6. Funkcija izvodnica

6.4.3 Faktorijelni momenti i faktorijelni kumulanti


Funkcijom izvodnicom, Z, i njezinim derivacijama se definiraju momenti raspodjele
hq n i
n
n ∂ Z ( Q, t )

Z ( Q, t) ≡ ∑ P(q, t) e −q Q
, n
hq i = (−1) .

q ∂Qn Q=0

Slično se i kumulantnom funkcijom F i njezinim derivacijama, definiraju kumulanti


h q n (t)ii
n
n ∂ F ( Q, t )

n
F ( Q, t) ≡ ln [ Z ( Q, t)], h q (t)ii = (−1) .

∂Q n
Q =0

Pored ovih veličina definiraju se i faktorijelni momenti i faktorijelni kumulanti na


slijedeći način. Faktorijelni moment n-tog reda se označava i definira kao

hq n i f = hq (q − 1) (q − 2) · · · (q − n + 1)i .

Lako se vidi da se ovi momenti dobivaju iz faktorijelne funkcije izvodnice oblika

Z f ( Q, t) ≡ ∑ P(q, t) ( Q + 1) q .
q

Račun derivacija Z f u Q = 0, daje

∂Z f Q→0
= ∑ q P(q, t) ( Q + 1) q−1 −−−−−−−−→ hqi = hqi f ,
∂Q q

∂2 Z f Q→0
= ∑ q (q − 1) P(q, t) ( Q + 1) q−2 −−−−−−−−→ hq (q − 1)i = q 2 f ,


∂Q 2
q
..
.
∂n Z f Q→0
n
= ∑ q (q − 1) · · · (q − n + 1) P(q, t) ( Q + 1) q−n −−−−−−→ hq (q − 1) · · · (q − n + 1)i = hq n i f .
∂Q q

Tako je npr. za binomnu raspodjelu ...

N
N
 
N N
Zf = ∑ p q (1 − p ) N − q ( Q + 1) q = 1 − p + p ( Q + 1) = 1 + p Q ,

q =0 q

što vodi na faktorijelne momente

∂Z f  N −1 Q→0
= N 1+ pQ p −−−−−−−−→ N p = hqi f ,
∂Q
2
∂ Zf  N −2 Q→0
= N ( N − 1) p 2 1 + p Q −−−−−−−−→ N ( N − 1) p 2 = q 2 f ,


∂Q 2

∂3 Z f  N −2 Q→0
= N ( N − 1) ( N − 2) p 3 1 + p Q −−−−−−−−→ N ( N − 1) ( N − 2) p 3 = q 3 f ,


∂Q 3

..
.
6.4 Kumulantna funkcija 363

i općenito

N!
hq n i f = p n.
( N − n)!

Logaritam faktorijelne funkcije izvodnice, Z f , definira faktorijelnu kumulantnu funkciju,


K f , čija n-ta derivacija u Q = 0

∂n K f ( Q, t)
" #
K f ( Q, t) ≡ ln Z f ( Q, t) = ln ∑ P(q, t) (Q + 1) q
, n
h q (t)ii f = ,
 
∂Qn

q Q =0

definira n-ti faktorijelni kumulant, h q n (t)ii f . Račun derivacija K f u Q = 0, daje

∂K f ∑q q P(q, t) ( Q + 1) q−1 Q→0


= q
−−−−−−−−→ hqi = h qi f ,
∂Q ∑q P(q, t) ( Q + 1)
h ih i h i2
∂2 K f ∑q q (q − 1) P(q, t) ( Q + 1) q−2 ∑q P(q, t) ( Q + 1) q − ∑q q P(q, t) ( Q + 1) q−1
= i2
∂Q2
h
∑q P(q, t) ( Q + 1) q
Q→0
−−−−−−−−→ hq (q − 1)i − hqi 2 = q 2 − hqi 2 − hqi = q 2 f ,

..
.
∂n K f

= h q ni f .
∂Qn Q=0

Tako je npr. za binomnu raspodjelu ...

K f ( Q, t) ≡ ln Z f ( Q, t) = N ln(1 + p Q),
 

što vodi na faktorijelne kumulante

∂K f p Q→0
=N p −−−−−−−−→ N p = h qi f ,
∂Q 1+ pQ
∂2 K f 1 Q→0
= −N p 2 2

2
2  2 −−−−−−−−→ − N p = q f ,
∂Q 1+ pQ
∂3 K f 1 Q→0
= 2N p 3 3

3
3  3 −−−−−−−−→ 2N p = q f ,
∂Q 1+ pQ
∂4 K f 4 1 Q→0 4
DD EE
= − 2 · 3 N p −−−−−−−−→ − 2 · 3 N p = q4 · · · itd.
∂Q4 1+ pQ
4 f


i općenito

h q n i f = (−1) n−1 (n − 1)! N p n .

Za Poissonovu raspodjelu je samo prvi faktorijelni kumulant različit od nule, dok su svi
ostali jednaki nula. (dovršiti ?).
364 Poglavlje 6. Funkcija izvodnica

Tablica 6.1: Nekoliko prvih Stirlingovih brojeva prve vrste.

n\j 0 1 2 3 4 5 6 7 8 9

0 1
1 0 1
2 0 -1 1
3 0 2 -3 1
4 0 -6 11 -6 1
5 0 24 -50 35 -10 1
6 0 -120 274 - 225 85 -15 1
7 0 720 -1 764 1 624 -735 175 -21 1
8 0 -5 040 13 068 - 13 132 6 769 -1 960 322 -28 1
9 0 40 320 -109 584 118 124 -67 284 22 449 -4 536 546 -36 1

Za općenitu raspodjelu vjerojatnosti se dobiva

h q n i f = h q (q − 1) (q − 2) · · · (q − n + 1)ii ,

h qi f = h qi = hqi ,
q2 f = h q (q − 1)ii = q 2 − h qi = q 2 − hqi 2 − hqi ,

3
q f = h q (q − 1) (q − 2)ii = q 3 − 3 q 2 + 2 h qi ,


DD EE DD EE
q4 = h q (q − 1) (q − 2) (q − 3)ii = q 4 − 6 q 3 + 11 q 2 − 6 h qi ,


f
..
.
n DD EE
hq i f = ∑
n
s1 (n, j) q j , (6.55)
j =1

gdje su s1 (n, j) Stirlingovi brojevi prve vrste koji se pojavljuju u razvoju u red funkcije


h ij xn
ln(1 + x ) = j! ∑ s1 (n, j)
n!
,
n= j

a povezani su rekurzijskom relacijom

s1 (n, j) = s1 (n − 1, j − 1) − (n − 1) · s1 (n − 1, j).

Nekoliko prvih Stirlingovih brojeva prve vrste je prikazano tablicom 6.1. Iz tablice 6.1 je
lako vidjeti da je zadovoljeno nekoliko prvih relacija (6.55).
6.4 Kumulantna funkcija 365

Usporedimo kumulante i faktorijelne kumulante binomne raspodjele, ref ...

n h q ni h q ni f

1 Np Np
2 N p (1 − p ), −N p 2
3 N p(1 − p)(1 − 2p) 2N p 3
4 N p(1 − p)[ 1 − 6 p(1 − p)] −6N p 4

Da bismo stekli osjećaj koja vrsta kumulanata je veća, a koja manja, usporedimo vrijed-
nosti trećih i četvrtih kumulanta u točki p = 1/2
DD EE N
q 3 = 0, q4 ,


=
f 22
DD
4
EE N DD
4
EE N
q = − 3, q = −3 .
2 f 23

Dakle, po iznosu je faktorijelni kumulant veći.

S TIRLINGOVI BROJEVI DRUGE VRSTE


Pored Stirlingovih brojeva prve vrste, u kombinatoričkim problemima se pojavljuju i
Stirlingovi brojevi druge vrste19 ili Stirlingovi particijski brojevi. Njihovo značenje je
broj načina na koji se skup od n objekata može rastaviti na j nepraznih podskupova.
Računaju se relacijom

j −1
n 1 j
  
s2 (n, j) ≡
j
=
j! ∑ (−1) i ( j − i)n ,
i

i =0

ili rekurzijom

n+1 n n
     
=j + ,
j j j−1

s početnim vrijednostima

0 n 0
     
= 1, = = 0.
0 0 n

Takod̄er, relacijom
n
n
 
Bn = ∑ j
j =0

19 Vidjeti relaciju (4.32) i dalje.


366 Poglavlje 6. Funkcija izvodnica

Tablica 6.2: Nekoliko prvih Stirlingovih brojeva druge vrste.

n\j 0 1 2 3 4 5 6 7 8 9

0 1
1 0 1
2 0 1 1
3 0 1 3 1
4 0 1 7 6 1
5 0 1 15 25 10 1
6 0 1 31 90 65 15 1
7 0 1 63 301 350 140 21 1
8 0 1 127 966 1 701 1 050 266 28 1
9 0 1 255 3 025 7 770 6 951 2 646 462 36 1

su povezani s Bellovim20 brojevima. Oni daju broj mogućih podjela skupa od n eleme-
nata. Nekoliko prvih Bellovih brojeva su

Bn =1, 1, 2, 5, 15, 52, 203, 877, 4 140, 21 147, 115 975, 678 570, 4 213 597, 27 644 437, 190 899 322,
1 382 958 545, 10 480 142 147, 82 864 869 804, 682 076 806 159, 5 832 742 205 057, · · ·

Nekoliko prvih Stirlingovih brojeva druge vrste je prikazano tablicom 6.2.

20 Eric Temple Bell (7. II 1883. – 21. XII 1960.), škotski matematičar.
6.4 Kumulantna funkcija 367

Literatura korištena u ovom poglavlju:

1. G. B. A RFKEN I H. J. W EBER.
Mathematical Methods for Physicists. Academic Press, San Diego, 1995
2. N EVEN E LEZOVI Ć.
Vjerojatnost i statistika 2 - slučajne varijable. Element, Zagreb, 2007
3. J OSÉ L UIS G ARCIA -PALACIOS. „
Introduction to the theory of stochastic processes and Brownian motion problems”.
(2007). URL: arxiv.org/abs/cond-mat/0701242
4. Z VONKO G LUMAC.
Matematičke metode fizike - kratak uvod. Odjel za fiziku, Osijek, 2019. URL: http:
//www.fizika.unios.hr/~zglumac/ummf.pdf
5. R ONALD L. G RAHAM , D ONALD E. K NUTH I O REN PATASHNIK.
Concrete Mathematics. McGraw - Hill, 1997
6. B RANISLAV I VANOVI Ć.
Teorija verovatnoće. Univerzitetski udžbenici. Naučna knjiga, Beograd, 1977, stra-
nica 328
7. D ANIA K AMBLY , C HRISTIAN F LINDT I M ARKUS B ÜTTIKER. „
Factorial cumulants reveal interactions in counting statistics”. Phys. Rev. B 83
(2011), stranica 075432. URL: arXiv:1012.0750v2
8. Ivo PAVLI Ć.
Statistička teorija i primjena. Panorama, Zagreb, 1965
9. K EN R ILEY , M ICHAEL H OBSON I S TEPHEN B ENCE.
Mathematical Methods for Physics and Engineering. Cambridge Univ. Press, 2006
10. V LADIMIR V RANI Ć.
Vjerojatnost i statistika. Tehnička knjiga, Zagreb, 1971
7. Središnji granični teorem

U OVOM POGLAVLJU se dokazuju tri važna teorema teorije vjerojatnosti: Čebiševljev,


Bernoullijev i središnji granični teorem. Njihovi dokazi koji se ovdje navode, nisu
najopćenitiji mogući, ali su dovoljni da čitatelju daju dojam o važnosti i smislu ovih
teorema. Za općenite dokaze, čitatelj se upućuje na literaturu navedenu na kraju ovog
poglavlja.

7.1 Čebiševljev teorem


Ovaj, kao i Bernoullijev teorem, vrijedi i za diskretne i za kontinuirane nasumične
varijable, a radi nešto jednostavnije notacije, koristit ćemo diskretni formalizam.
Slika 7.1: P. LJ. Čebišev

Promatra se diskretna nasumična varijabla


X, koja s vjerojatnošću P( X ) poprima niz
vrijednosti

xn , n = 1, 2, · · · , N.

Neka su očekivanje i varijanca redom jed-


naki

hXi , σ 2.

Uočimo interval h X i − e, h X i + e prikazan na slici 7.2. Treba dokazati teorem P. L.




Čebiševa1 :

1 Pafnutij Ljvovič Čebišev, 16. V 1821. - 9. XII 1894. , ruski matematičar


370 Poglavlje 7. Središnji granični teorem

Teorem 7.1.1 Vjerojatnost da nasumična varijabla X poprimi vrijednost IZVAN inter-


vala

h X i − e, h X i + e ,


za proizvoljni e > 0, je manja ili jednaka σ 2 /e 2 ,

σ2
P(| X − h X i| ≥ e) ≤ . (7.1)
e2

Slika 7.2
U skladu s ili vjerojatnošću, tražena vjerojatnost
P(| X − h X i| ≥ e), napisana preko vjerojatnosti
P( x ), je jednaka
<X>
x P(| X − h X i| ≥ e) = ∑ x
P ( x ). (7.2)
<X> - e <X>+ e | X −h X i|≥e

Na slici 7.2, to znači da je vjerojatnost da X poprimi vrijednost u osjenčenom dijelu,


manja od σ 2 /e 2 . U dokazu teorema, krenimo od definicije varijance dane relacijom
(3.34)
 2
σ 2 = ∑ x − h X i P ( x ).
x

U gornjem se zbroju zbraja po SVIM mogućim vrijednostima x. Ako se ograničimo


samo na one x iz osjenčenog dijela slike 7.2, sigurno ćemo dobiti zbroj koji je manji ili
jednak sa σ 2 (zato jer smo ispustili pozitivne doprinose gornjem zbroju iz područja
x ∈ [h X i − e, h X i + e])
 2  2
σ 2 = ∑ x − h X i P( x ) ≥ ∑ x − h X i P ( x ).
x x
| X −h X i|≥e

No, u posljednjem zbroju je svaki | x − h X i| veći ili jednak s e, pa će zamjena | x − h X i| s


e, rezultirati još manjim zbrojem
 2
σ2 ≥ ∑ x − h X i P ( x ) ≥ e 2 ∑ P ( x ).
x x
| X −h X i|≥e | X −h X i|≥e

Zbroj na desnoj strani gornjeg izraza je upravo vjerojatnost da X ima vrijednost izvan
intervala h X i − e, h X i + e , relacija (7.2).

∑ x
P( x ) = P(| X − h X i| ≥ e),
| X −h X i|≥e

pa kombinacija dva gornja izraza upravo dokazuje Čebiševljev teorem


σ2
σ 2 ≥ e 2 P(| X − h X i| ≥ e) ⇒ P(| X − h X i| ≥ e) ≤ .
e2
Q.E.D.
7.1 Čebiševljev teorem 371

Budući da je zbroj svih vjerojatnosti jednak jedinici, to je vjerojatnost P(| X − h X i| < e)


da X bude unutar intervala h X i − e, h X i + e jednaka


σ2
1 = P(| X − h X i| ≥ e) + P(| X − h X i| < e) ⇒ P(| X − h X i| < e) ≥ 1 − . (7.3)
e2

Zadatak 7.1 Promatrajmo nasumičnu varijablu X sa srednjom vrijednošću h X i i


standardnom devijacijom σ. Treba odrediti kolika je gornja granica na
vjerojatnost da će odstupanje X od h X i biti veće ili jednako 3 σ? 

Rješenje:
Prema Čebiševljevu teoremu (7.1) uz identifikaciju e ≡ 3 σ

σ2 1
P(| X − h X i| ≥ 3σ) ≤ 2
= ≤ 0.1̇.
(3σ) 9

Dakle, za bilo koju raspodjelu P( x ), je vjerojatnost odstupanja X od h X i ± 3σ manja ili jednaka


0.1111 . . .. Ovo možemo provjeriti na primjeru Gaußove (normalne) raspodjele. Ako je X
raspodjeljen po Gaußovoj raspodjeli, tada iz (4.78) znamo da je vjerojatnost odstupanja X od
h X i ± 3σ jednaka

P(| X − h X i| ≤ 3 σ) = 2 · 0.49865 = 0.9973


P(| X − h X i| ≥ 3 σ) = 1 − 0.9973 = 0.0027,

što je u potpunom skladu s Čebiševljevim teoremom, jer je P = 0.1̇ gornja granica na vjerojatnost,
tj. prava vjerojatnost, 0.0027, mora biti manja od ove gornje granice, kao što i jeste:

0.0027 < 0.1111 .

7.1.1 Općenitija formulacija

dovršiti

7.1.2 Konvergencija u teoriji vjerojatnosti

dovršiti

7.1.3 Slabi zakon velikih brojeva

dovršiti
 Primjer 7.1 Neka je xn niz Bernoullijevih nasumičnih varijabla ....
dovršiti 
372 Poglavlje 7. Središnji granični teorem

7.2 Bernoullijev teorem ili zakon velikih brojeva


Dokažimo sada teorem Jacoba Bernoullija2 iz 1713. godine, koji se često naziva i zakon
Slika 7.3: J. Bernoulli
velikih brojeva. Promatra se dogad̄aj A koji
se u N pokusa ostvari NA puta. Teorem
povezuje relativnu frekvenciju (2.3),

NA
f rel ( A) = ,
N
ostvarivanja dogad̄aja A s apriornom vjero-
jatnošću ostvarenja tog dogad̄aja, koju ćemo
označiti s p. Budući da je broj NA nasumična
varijabla, označavat ćemo ju s X, pa je tako

X
f rel ( A) = .
N

Teorem 7.2.1 Za vrlo veliki broj pokusa N i za proizvoljni δ > 0, vjerojatnost da


razlika
X

− p

N

bude veća od δ, je iščezavajuće mala:


X
 
lim P − p ≥ δ = 0. (7.4)


N →∞ N

S porastom N, vjerojatnost da se relativna frekvencija X/N razlikuje


od apriorne vjerojatnosti p, opada prema nuli. Bernoullijev teorem se
može napisati i ovako
X
 
lim P − p < δ = 1. (7.5)


N →∞ N

Ili riječima: u granici N → ∞, skoro je sigurno da će razlika X/N i p


biti proizvoljno mala. Za velike N, je X/N jako dobra aproksimacija
prave (apriorne) vjerojatnosti p.

Primjetimo da relacija (7.4) nije standardan limes kakav se uči u matematičkoj analizi.
X
Matematičko značenje konvergencije N → p je slijedeće: za svaki proizvoljni δ > 0 pos-
X
toji N0 (δ), sa svojstvom da za svaki N > N0 (δ) vrijedi da je N − p < δ. Tu se ne govori

ni o kakvim vjerojatnostima, dok je Bernoullijev teorem jedna tvrdnja o vjerojatnostima.

Ovaj se teorem može dokazati i pomoću Čebiševljeva teorema. Radi jednostavnosti,


zadržimo se na primjeru binomne raspodjele (Bernoullijevi dogad̄aji) s konstantnom
vjerojatnošću p (odjeljak 4.1.3). Prisjetimo se: broj ostvarenja dogad̄aja A je označen s X,
a za prosječnu vrijednost (4.17), i varijancu (4.19), je dobiveno

h X i = N p, σ 2 = N pq.
2 Jacob Bernoulli, 27. XII 1654.-16. VIII 1705. švicarski matematičar (stariji brat Johanna Bernoullija).
7.3 Središnji granični teorem 373

Uvrstimo to u Čebiševljev teorem

σ2 N pq
P(| X − h X i| ≥ e) ≤ ⇒ P(| X − N p| ≥ e) ≤ .
e2 e2
Promatrajmo umnožak pq na desnoj strani kao funkciju od p

f ( p) = pq = p(1 − p) = p − p 2 ,
1
f 0 ( p) = 1 − 2p = 0 ⇒ p= ,
2
f 0 0 ( p) = −2.

Iz gornjih rezultata zaključujemo da f ( p) ima maksimum u p = q = 12 . Drugim riječima,


umnožak pq je uvijek manji ili jednak 14 . Uvrstimo to u Čebiševljev teorem

N pq N
P(| X − N p| ≥ e) ≤ 2
≤ 2,
e 4e
X N
 
e e
P − p ≥ , nazovemo li ≡ δ = const.

≤ 2
N N 4e N
X 1
 
P − p ≥ δ ≤ .


4Nδ 2

N

Za fiksni δ i u granici kada N neograničeno raste


X 1
 
lim P − p ≥ δ ≤ lim =0

N →∞ 4Nδ 2

N →∞ N

ili, ako uzmemo u obzir (7.3),


X
 
lim P − p < δ = 1,

N →∞ N

a to je upravo (slabi) zakon velikih brojeva.


Q.E.D.

7.3 Središnji granični teorem


P OSTAVLJANJE PROBLEMA
Zadan je skup velikog broja od N  1 med̄usobno statistički NEOVISNIH diskretnih ili
kontinuiranih nasumičnih varijabla. Svaka pojedina od tih N nasumičnih varijabla ima
svoju raspodjelu vjerojatnosti (binomna, Gaußova, gama, eksponencijalna, Poissonova,
...). Pitanje na koje želimo naći odgovor u ovom odjeljku je slijedeće: ako se od svih tih
N općenito različitih nasumičnih varijabla izračuna njihova aritmetička sredina

1
xN = ( x1 + x2 + · · · + xN ),
N
koja je, kao linearna kombinacija nasumičnih varijabla, i sama nasumična varijabla,
KOJOM ĆE RASPODJELOM BITI OPISANA NASUMI ČNA VARIJABLA x N ?
Odgovor na to pitanje ćemo naći postupno u dva koraka. Najprije ćemo promotriti
jednostavan slučaj kada su sve nasumične varijable promatranog skupa, opisane Ga-
ußovom raspodjelom, a zatim ćemo u drugom koraku analizirati skup u kojemu nisu
sve varijable Gaußove varijable. Rezultat analize u ovom drugom koraku je sadržaj
374 Poglavlje 7. Središnji granični teorem

onoga što se naziva SREDIŠNJI GRANI ČNI TEOREM.

G AUSSOVE NASUMI ČNE VARIJABLE


Neka su

x1 , x2 , · · · , xN

med̄usobno statistički NEOVISNE kontinuirane nasumične varijable, raspodjeljene po


Gaußovoj raspodjeli s prosječnim vrijednostima i standardnim devijacijama

h x1 i , h x2 i , · · · , h xN i σ1 , σ2 , · · · , σN .

Linearna kombinacija3 svih xn je jedna nova nasumična varijabla koju ćemo označiti s
xN
1
Y = a1 x1 + a2 x2 + · · · + aN xN ≡ x N = ( x1 + x2 + · · · + xN ), (7.6)
N
S hY i i σY ćemo označiti prosječnu vrijednost i standardnu devijaciju Y. Prema (3.65) i
(6.54) je
1  
hY i = a 1 h x 1 i + a 2 h x 2 i + · · · + a N h x N i ≡ h x N i = h x1 i + h x2 i + · · · + h xN i
N
1  2 
σY = a1 σ1 + a2 σ2 + · · · + aN σN ≡ σ ( x N ) = 2 σ1 + σ22 + · · · + σN2 .
2 2 2 2 2 2 2 2
N
Pitanje koje se sada postavlja je:
K OJOM JE RASPODJELOM OPISANA NASUMI ČNA VARIJABLA x N ?
Do odgovora na to pitanje ćemo doći pomoću karakteristične funkcije. Neka je Ze(x + x +···+ x )/N (k )
1 2 N

karakteristična funkcija od x N , a Z
exn (k ) karakteristična funkcija svakog pojedinog xn .
Prema (6.33), vrijedi

Z
e(x + x +···+ x )/N (k ) = Z
ex (k/N ) Z ex (k/N ).
ex (k/N ) · · · Z
1 2 N 1 2 N

Karakteristična funkcija Gaußove raspodjele varijable xn je, (6.37)


1 2 2
 
Zxn (k ) = exp ık h xn i − σn k ,
e
2
1 2 2
 
2
Zxn /N (k ) = Zxn (k/N ) = exp ık h xn i /N − σn k /N ,
e e
2
h  
⇒ Z e(x + x +···+ x )/N (k) = exp ık h x1 i /N + h x2 i /N + · · · + h xN i /N
1 2 N

1 2  
− σ1 /N + σ2 /N + · · · + σN /N k 2
2 2 2 2 2
2
1 2
 
2
= exp ı k h x N i − σ ( x N ) k .
2

Time je Ze(x + x +···+ x )/N (k ) dobivena u obliku karakteristične funkcije Gaußove raspo-
1 2 N
djele sa prosječnom vrijednošću h x N i i varijancom σ 2 ( x N ). Gornje razmatranje se može
sažeti u slijedeću tvrdnju:

3 U posebnom slučaju kada su svi koeficijenti a = 1/N funkcija Y je aritmetička sredina. Navedeni
j
oblik Y je dakle općenitiji od aritmetičke sredine.
7.3 Središnji granični teorem 375

Teorem 7.3.1 Zbroj od proizvoljnog broja statistički neovisnih nasumičnih varija-


bli raspodjeljenih po Gaußovoj raspodjeli, takod̄er je raspodjeljen po
Gaußovoj raspodjeli.

U gornjem izvodu nije bilo potrebno zahtjevati da bude N  1.

P ROIZVOLJNE NASUMI ČNE VARIJABLE


Rezultat iz prethodnog odjeljka se mogao i očekivati: Gaußove raspodjele vode na
Gaußovu raspodjelu. No, sada se postavlja slijedeće pitanje: Š TO AKO N MEÐUSOBNO
STATISTI ČKI NEOVISNIH NASUMI ČNIH VARIJABLI xn NISU SVE RASPODJELJENE PO G A -
USSOVOJ RASPODJELI ? K AKO ĆE TADA BITI RASPODJELJENA NJIHOVA ARITMETI ČKA
SREDINA ? Označimo opet med̄usobno statistički neovisne nasumične varijable

x1 , x2 , · · · , xN ,

ali su one sada raspodjeljene prema med̄usobno različitim raspodjelama (ne nužno
Gaußovim), čiji su momenti jednaki

h xn i , xn2 , xn3 , · · · n = 1, 2, · · · , N.


Umjesto općenite linearne kombinacije varijabla kao u (7.6), promatrat ćemo aritmetičku
sredinu, x N , svih xn -ova

1
y = f ( x1 , x2 , · · · , xN ) ≡ x N = ( x1 + x2 + · · · + xN ). (7.7)
N
To je ponovo izraz oblika (7.6), samo što su sada

1
an = , n = 1, 2, · · · , N.
N
Budući da su xn med̄usobno neovisne varijable to, prema (3.66) i (6.54), i dalje vrijedi

1 1
hx N i = (h x1 i + h x2 i + · · · + h xN i), σ 2 (x N ) = σ12 + σ22 + · · · + σN2 . (7.8)

N N 2

Nadalje ćemo pretpostaviti da je N vrlo velik broj

N  1.

Prema definiciji (6.27), karakteristična funkcija varijable x N (tj. Fourierova preobrazba


njezine gustoće vjerojatnosti) je dana sa4
Z +∞
e x (k) =
Z N
e ı k x N ρ( x N ) ; dx N .
−∞

No, xn su med̄usobno neovisne varijable, pa je zato

ρ( x N ) dx N = ρ1 ( x1 ) ρ2 ( x2 ) · · · ρN ( xN ) dx1 dx2 · · · dxN .


4 Ove granice na integralu nisu nikakvo ograničenje: ako je npr. varijabla xn definirana na intervalu
(0, ∞ i, tada je njoj pridružena gustoća vjerojatnosti jednaka nuli za h −∞, 0) i slično za neke druge varijable.
Uzevši granice integracije od −∞ do +∞, obuhvatili smo sve moguće vrijednosti nasumičnih varijabli.
376 Poglavlje 7. Središnji granični teorem

Vratimo li se izrazu za karakterističnu funkciju, dobivamo


Z +∞
e x (k) =
Z N
e ı k (x1 + x2 +···+ xN )/N ρ1 ( x1 ) ρ2 ( x2 ) · · · ρN ( xN ) dx1 dx2 · · · dxN
−∞
Z +∞ Z +∞ Z +∞
ı k x1 /N ı k x2 /N
= e ρ1 ( x1 ) dx1 e ρ2 ( x2 ) dx2 · · · e ı k xN /N ρN ( xN ) dxN
−∞ −∞ −∞
N Z +∞
= ∏ −∞
e ı k xn /N ρn ( xn ) dxn .
n =1

Uz pretpostavku da je N VRLO VELIK BROJ, argumenti eksponencijalnih funkcija su jako


MALI brojevi, i zato možemo u razvoju u red eksponencijalnih funkcija zadržati samo
vodeće članove
Z +∞ " 2
N
#
ı k x 1 ı k x

e x (k) = ∏ n n − 3
Z 1+ +O N ρn ( xn ) dxn

+
N
n =1 − ∞
N 2 N
N 
ık 1 k 2
2

= ∏ 1+ h xn i − xn + O N −3

n =1
N 2 N2
N
ık 1 k 2
2
  
= ∏ exp ln 1 + h xn i − x N −3
.

n + O
n =1
N 2 N2

U gornjim smo izrazima s O N −3 označili članove koji opadaju s N kao N −3 ili brže.


Za veliki N ti su članovi MANJI od članova koje smo eksplicitno ispisali. Logaritam u


eksponentu se može razviti u red
1 2 1 3
ln (1 + η ) = η − η + η − ··· ,
2 3
po maloj veličini η, koja u ovom slučaju iznosi

ık 1 k 2
2
h xn i − x n + O N −3 ,

η≡ 2
N 2 N
k 2
η 2 = − 2 h x n i 2 + O N −3 ,

N
η = O N −3 .
3


Vratimo se izrazu za karakterističnu funkciju


N
ık 1 k 2 
2
 
2

Z
e x (k) = ∏ exp h xn i − xn − h xn i + O N −3

N
n =1
N 2 N2
N N 
" #
ık 1 k2 2 ık 1 k2 2
 
' ∏ exp
N
h xn i −
2 N2 n
σ = exp ∑
N
h xn i − σ
2 N2 n
.
n =1 n =1

Dakle, uz zanemarivanje članova reda O N −3 u eksponentu, za karakterističnu funk-




ciju smo dobili

ı
 
k  1 k2  
e x (k ) = exp 2 2 2
Z h x1 i + h x2 i + · · · + h xN i − σ1 + σ2 + . . . + σN
N
N 2 N2
1 2 2
 
= exp ı k h x N i − k σ ( x N ) ,
2
7.3 Središnji granični teorem 377

što opet prepoznajemo kao (6.37), karakterističnu funkciju Gaußove raspodjele za


varijablu x N . Kada znamo karakterističnu funkciju, tada funkciju raspodjele gustoće
vjerojatnosti računamo teoremom inverzije (6.30)
+∞
Z
Z +∞
1 e x (k) dk = 1 1 2 2
 
ρ( x N ) = e− ı k x N Z exp ı k h x N i − x N − k σ ( x N ) dk .

2π −∞
N
2π 2
−∞

Ovo gore je tablični integral, (A.45),

a2
Z +∞ 2
r  
ı a k − b k π
e dk = exp − .
−∞ b 4b

Uvrštavanje ovog rješenja, izravno daje

1 ( x N − h x N i) 2
 
ρ( x N ) = √ exp − , (7.9)
σ( x N ) 2π 2 σ 2 (x N )

što prepoznajemo kao Gaußovu raspodjelu. Zaključujemo da je u granici velikog


N, gustoća vjerojatnosti nasumične varijable x N (tj. obične aritmetičke sredine) dana
G AUSSOVOM raspodjelom bez obzira kojom su raspodjelom opisane pojedine varijable
xn . Gornja razmatranja možemo sažeti u slijedeći

Teorem 7.3.2 Zadano je N med̄usobno neovisnih nasumičnih varijabla, opisanih


PROIZVOLJNIM gustoćama vjerojatnosti. Ako od tih varijabli napravimo
novu nasumičnu varijablu oblika zbroja (7.7), tada je raspodjela gustoće
vjerojatnosti te nove varijable približno dana G AUSSOVOM raspodjelom.
Ova je tvrdnja utoliko točnija ukoliko je N veći.

Ovaj se teorem naziva S REDIŠNJI GRANI ČNI TEOREM. Njime Gaußova raspodjela dobiva
iznimno važno mjesto u teoriji vjerojatnosti. Prvi ga je postavio Laplace 1812. godine, a
strogi je dokaz dao Ljapunov 1901. godine.
378 Poglavlje 7. Središnji granični teorem

Preporučena literatura za ovo poglavlje je:

1. G. B. A RFKEN I H. J. W EBER.
Mathematical Methods for Physicists. Academic Press, San Diego, 1995
2. N EVEN E LEZOVI Ć.
Vjerojatnost i statistika 2 - slučajne varijable. Element, Zagreb, 2007
3. P. H SU H WEI.
Theory and problems of probability, random variables and random processes. McGraw -
Hill, 1997
4. B RANISLAV I VANOVI Ć.
Teorija verovatnoće. Univerzitetski udžbenici. Naučna knjiga, Beograd, 1977, stra-
nica 328
5. Ivo PAVLI Ć.
Statistička teorija i primjena. Panorama, Zagreb, 1965
6. K EN R ILEY , M ICHAEL H OBSON I S TEPHEN B ENCE.
Mathematical Methods for Physics and Engineering. Cambridge Univ. Press, 2006
7. V LADIMIR V RANI Ć.
Vjerojatnost i statistika. Tehnička knjiga, Zagreb, 1971
8. S VETOZAR V. V UKADINOVI Ć.
Zbirka rešenih zadataka iz teorije verovatnoće. Privredni pregled, Beograd, 1990
8. Teorija grešaka

8.1 Metoda najmanjih kvadrata


Pretpostavimo da je postavljen pokus kojim se želi mjeriti neka fizikalna veličina koju
ćemo označiti s X. Izvodi se N pokusa koji daju niz eksperimentalnih vrijednosti

x1 , x2 , · · · , xN .

Uslijed grešaka pri mjerenju (koje mogu biti grube, sustavne i nasumične), rezultati
mjerenja se razlikuju med̄usobno i razlikuju se od točne, ali NEPOZNATE vrijednosti X

X =?

Budući da svako mjerenje uvijek sadrži i odred̄enu pogrešku,


PRIMJETIMO DA SE NIKAKVIM POKUSOM NE MOŽE USTANOVITI
TO ČNA VRIJEDNOST MJERENE VELI ČINE .
Pretpostavimo da smo pažljivim postavljanjem i izvedbom pokusa, eliminirali grube
greške. Sustavne su greške dio samog pokusa i one se mogu eliminirati (ili bar smanjiti)
tako da se ista veličina mjeri kroz više različitih pokusa kod kojih očekujemo da će te
sustavne greške biti različitih predznaka. Ako konačnu vrijednost za X računamo kao
prikladnu srednju vrijednost rezultata dobivenih ovim raznim pokusima, očekujemo
da će sustavna greška biti manja nego da smo izveli samo jednu vrstu pokusa. Nakon
ovoga nam ostaju samo NASUMI ČNE greške i njihovom analizom ćemo se baviti u
ostatku ovog poglavlja. Glavno pitanje na koje ćemo odgovoriti u ovom odjeljku jeste:
KAKO ODREDITI ŠTO TO ČNIJU PRIBLIŽNU VRIJEDNOST X
VODE ĆI RA ČUNA O NASUMI ČNIM GREŠKAMA ?
Čitatelj će zacijelo pomisliti kako je odgovor na ovo pitanje vrlo jednostavan: X ćemo
odrediti tako što ćemo pomoću xn izračunati običnu aritmetičku sredinu

1
hxi = ( x1 + x2 + · · · + xN )
N

i ta aritmetička sredina je naša aproksimacija za traženi X. To je, naravno, i točan


odgovor, ali u ovom odjeljku želimo i nešto više: želimo objasniti ZAŠTO je to točan
380 Poglavlje 8. Teorija grešaka

odgovor. Od xn smo mogli izračunati harmonijsku srednju vrijednost, Xh , geometrijsku


srednju vrijednost, Xg , kvadratnu srednju vrijednost, X kv

1 1 1 1 1
 
= + + ··· + ,
Xh N x1 x2 xN
Xg = ( x1 · x2 · . . . · xN )1/N ,
1
q
X kv = x12 + x22 + · · · + xN2 ,
N
ili neku četvrtu, manje-više proizvoljnu, srednju vrijednost koja ima odgovarajuću
dimenziju. Kako znamo da je baš aritmetička sredina pravi odgovor? Kada bismo
znali točnu vrijednost X, mogli bismo izračunati sve navedene srednje vrijednosti
(h x i , X H , Xg , X kv ) i naprosto pogledati koja je od njih najbliža X

h x i − X =?
Xh − X = ?
Xg − X =?
X kv − X =?

Budući da mi ne znamo točnu vrijednost X, NIKADA nećemo ni znati koliko je neka


od gornjih srednjih vrijednosti ili mjerena vrijednost xn blizu toj pravoj nepoznatoj
vrijednosti X. Zato moramo poći drugim putem. Kada kažemo da nikada nećemo znati
koliko je vrijednost dobivena mjerenjem xn blizu pravoj X, to znači da nećemo znati sa
sto postotnom sigurnošću. Umjesto toga, najviše što se može postići jeste da se, uz dane
uvjete, nad̄e vrijednost koja je VJEROJATNO NAJBLIŽA pravoj vrijednosti X. Ključno je
da se ovdje radi o vjerojatnosti. Veličina X nam je nepoznata i najviše što nam pokus
može dati jeste da ocjenimo kolika je njezina najvjerojatnija vrijednost. Ovaj je problem
riješio Gauß1 godine 1809.
Slika 8.1: J. C. F. Gauß Osnovna pretpostavka od koje je krenuo (i
koja će se na kraju pokazati opravdanom)
jeste da je ARITMETI ČKA SREDINA h x i dobi-
vena iz svih N mjerenja

1
hxi = ( x1 + x2 + · · · + xN ). (8.1)
N
NAJVJEROJATNIJE NAJBLIŽA pravoj vrijed-
nosti X. Započnimo ovu analizu tako što
ćemo uočiti dvije vrste grešaka:
PRAVE greške e n

X = xn + e n , n = 1, 2, 3, · · · , N, (8.2)

koje su nepoznate (ali ipak korisne), jer nam je nepoznat X, pa ne možemo izračunati
e n, i
PRIVIDNE greške vn

h x i = xn + vn , n = 1, 2, 3, · · · , N, (8.3)
1 Johann Carl Friedrich Gauß, 1777. - 1855. njemački matematičar
8.1 Metoda najmanjih kvadrata 381

koje su nam poznate, jer znamo h x i i xn , pa možemo izračunati vn . Zbrajanjem gornjih


jednadžba vidimo da je zbroj svih prividnih grešaka jednak nuli
v1 + v2 + · · · + vN = N h x i − ( x1 + x2 + · · · + xN ) = (8.1) = 0. (8.4)
Rezultati xn svih N ponovljenih pokusa su med̄usobno neovisni i sadrže NASUMI ČNE
pogreške, pa se zato mogu smatrati kontinuiranim neovisnim nasumičnim varijablama.
U tom se slučaju postavlja pitanje: kolika je vjerojatnost da se pojavi prividna greška vn
ili, malo preciznije,

KOLIKA JE VJEROJATNOST DA vn POPRIMI VRIJEDNOST


IZ INTERVALA ŠIRINE |dvn | = |dxn | OKO vn ?

Primjetimo da je, prema (8.3), dvn = − dxn . Uvede li se raspodjela gustoće vjerojatnosti
prividnih grešaka ρn , ta se vjerojatnost može napisati kao
dPn = ρn (vn ) dxn . (8.5)
Nadalje, pitamo se kolika je vjerojatnost da u prvom pokusu prividna greška bude v1 , u
drugom v2 itd. sve do N-tog mjerenja s greškom vN . Prema pravilu o množenju vjero-
jatnosti koje vrijedi za med̄usobno neovisne dogad̄aje, ta je vjerojatnost dPuk jednaka
umnošku pojedinih vjerojatnosti
dPuk ≡ ρuk dx1 dx2 . . . dxN
dP1 · dP2 · . . . dPN = ρ1 (v1 ) dx1 ρ2 (v2 ) dx2 . . . ρN (vN ) dxN .
Budući da su svi xn dobiveni istim pokusom i njihove će gustoće vjerojatnosti biti
med̄usobno iste funkcije
ρ1 = ρ2 = . . . = ρN ≡ ρ.
Usporedbom gornjih izraza zaključujemo da je ukupna gustoća vjerojatnosti
ρuk = ρ(v1 ) · ρ(v2 ) · . . . · ρ(vN ) = ρ(h x i − x1 ) · ρ(h x i − x2 ) · . . . · ρ(h x i − xN ). (8.6)
Gornji izraz možemo shvatiti kao vrijednost funkcije
ρuk ( x ) ≡ ρ( x − x1 ) · ρ( x − x2 ) · . . . · ρ( x − xN )
u točki x = h x i. Tada, prema polaznoj pretpostavci da je h x i najvjerojatnija vrijednost X,
mora ρuk ( x ) imati maksimum u toj istoj točki, tj. mora biti
dρuk ( x )

= 0.
dx x=hxi

Da bismo si pojednostavili račun i umjesto derivacije gornjeg umnoška za ρuk , dobili


derivaciju zbroja, umjesto ρuk promatrat ćemo2 ln ρuk . To smijemo napraviti jer, zbog
monotonosti logaritamske funkcije i ρuk i ln(ρuk ) imaju ekstreme za ISTU vrijednost x
. d
ln [ρuk ( x )] = ln [ρ( x − x1 )] + ln [ρ( x − x2 )] + · · · + ln [ρ( x − xN )]
dx
0 (x)
ρ 0 (h x i − x1 ) ρ 0 (h x i − x2 ) ρ 0 (h x i − xN )

ρuk
⇒ = + + · · · + = 0.
ρuk ( x ) x=hxi ρ(h x i − x1 ) ρ(h x i − x2 ) ρ(h x i − xN )
2 Primjetimo da je logaritam funkcije vjerojatnosti srazmjeran entropiji (odjeljak 5), tako da se ovdje

računa ekstrem entropije.


382 Poglavlje 8. Teorija grešaka

Vratimo li se zapisu preko prividnih pogrešaka, uvjet maksimuma je

ρ 0 ( v1 ) ρ 0 ( v2 ) ρ 0 ( vN )
+ + ··· + =0
ρ ( v1 ) ρ ( v2 ) ρ ( vN )
Cijeli gornji izraz je izgrad̄en od članova istog oblika koji ćemo označiti s f

ρ 0 (v)
f (v) ≡ ,
ρ(v)
pa je uvjet ekstrema

f (v1 ) + f (v2 ) + · · · + f (vN ) = 0.

Da bismo našli f treba krenuti od najjednostavnijeg slučaja N = 2. Tada gornji uvjet,


zajedno sa (8.4) glasi

f (v1 ) + f (v2 ) = 0, v1 + v2 = 0.

Ako pomoću druge od gornjih jednadžba eliminiramo v2 , dobivamo

f (v1 ) + f (−v1 ) = 0 ⇒ f (v1 ) = − f (−v1 ),

tj. f je NEPARNA funkcija. Za opći N je

f (v1 ) + f (v2 ) + · · · + f (vN ) = 0, v1 + v2 + · · · + vN = 0.

Iz ove dvije jednadžbe slijedi

f ( v N ) = − f ( v 1 ) − f ( v 2 ) − · · · − f ( v N −1 ),
f (−v1 − v2 − · · · − v N −1 ) = − f (v1 ) − f (v2 ) − · · · − f (v N −1 )

Primjenom svojstva neparnosti f na lijevu stranu gornje jednadžbe

− f ( v 1 + v 2 + · · · + v N −1 ) = − f ( v 1 ) − f ( v 2 ) − · · · − f ( v N −1 ),
f ( v 1 + v 2 + · · · + v N −1 ) = f ( v 1 ) + f ( v 2 ) + · · · + f ( v N −1 ).

Ovo gore je jedna FUNKCIONALNA JEDNADŽBA za nepoznatu funkciju f . Lako je uvjeriti


se da je njezino rješenje jednostavna linearna funkcija

f (vn ) = c vn , c = const.

Sjetimo se sada što f zapravo označava

ρ 0 (vn )
 Z
f (vn ) ≡ = c vn . dvn
ρ(vn )
Izravnom integracijom gornje diferencijalne jednadžbe slijedi

vn2 2
ln [ρ(vn )] = c + const. ⇒ ρ(vn ) = C e c vn /2 , c, C = const.
2
Budući da vjerojatnost velikih grešaka mora biti manja od vjerojatnosti malih grešaka,
to konstanta c/2 mora biti negativna. Nazovimo ju −1/(2σ 2 ) (za realni σ)
2 2
ρ(vn ) = C e −vn /(2σ ) .
8.2 Prilagodba direktnih opažanja jednake točnosti 383

Preostala konstanta C odred̄uje se iz uvjeta normiranja gustoće vjerojatnosti, (A.41),


Z +∞ Z +∞
2 2) √
1= ρ(vn ) dvn = C e −vn /(2σ dvn = C 2π σ
−∞ −∞

iz čega se zaključuje da je C = 1/( 2π σ ) i normirana gustoća vjerojatnosti je
1 2 2
ρ(vn ) = √ e −vn /(2σ ) , (8.7)
σ 2π
što prepoznajemo kao Gaußovu raspodjelu, (4.79). Veličina σ ovisi o točnosti mjerenja
i naziva se MJERA PRECIZNOSTI ili širina raspodjele. Vjerojatnost da se u N mjerenja
naprave greške v1 , v2 , · · · , vN je, prema (8.6) i (8.7), jednaka
N
1 v 2 + v22 + · · · + vN2
  
ρuk = ρ(v1 ) · ρ(v2 ) · . . . · ρ(vN ) = √ exp − 1 .
σ 2π 2σ 2
Iz gornjeg izraza vidimo da najveću vjerojatnost imaju one pogreške za koje je

v12 + v22 + · · · + vN2

NAJMANJI . To je činjenica od koje i potječe naziv ove metode. Nazovimo

g ( x ) = ( x − x1 ) 2 + ( x − x2 ) 2 + · · · + ( x − xN ) 2

i potražimo za koji x je funkcija g( x ) najmanja


∂g
= 0 = 2( x − x1 ) + 2( x − x2 ) + · · · + 2( x − xN )
∂x
x1 + x2 + · · · + xN
0 = Nx − ( x1 + x2 + · · · + xN ) ⇒ xmin = = hxi ,
N
⇒ g( x = h x i) = v12 + v22 + · · · + vN2 = min. ,

a to je upravo ono što je pretpostavljeno na početku. Time je pokazano da je obična


ARITMETI ČKA SREDINA NAJVJEROJATNIJE ( U SMISLU NAJMANJEG KVADRATNOG OD -
STUPANJA ) NAJBLIŽA PRAVOJ I NEPOZNATOJ VRIJEDNOSTI X.

8.2 Prilagodba direktnih opažanja jednake točnosti


U ovom odjeljku nastavljamo analizu rezultata mjerenja iz prethodnog odjeljka. Prisje-
timo se: izvodi se pokus kojim se mjeri veličina X, pokus se izvodi N puta i za vrijednost
veličine X se dobije niz brojeva

x1 , x2 , · · · , xN .

U prethodnom je odjeljku pokazano da je


1
hxi = ( x1 + x2 + · · · + xN ).
N
vrijednost koja je najvjerojatnije najbliža pravoj vrijednosti X. Ovo najvjerojatnije znači
da je to vrijednost za koju je zbroj kvadrata odstupanja h x i od xn minimalan
N
vn = h x i − xn , ∑ vn2 = min.
n =1
384 Poglavlje 8. Teorija grešaka

Relacijom (8.2) smo uveli prave greške kao razliku točne (ali nepoznate) veličine X i
izmjerenih vrijednosti xn

e n = X − xn , n = 1, 2, · · · , N. (8.8)

Budući da ne znamo točnu vrijednost X, nepoznate su nam i vrijednosti za e n . Znamo


jedino to da e n mogu biti i pozitivne i negativne realne vrijednosti. Budući da nas ne
zanima je li greška pozitivna ili negativna, nego nas zanima samo njezin iznos, želimo
eliminirati predznak greške. To je najjednostavnije napraviti tako da da se promatra
kvadrat greške
N
∑ e n2 .
n =1

Gornji izraz mjeri ukupnu pravu grešku svih N mjerenja. Da bismo dobili veličinu koja
se odnosi na pojedino mjerenje, gornji ćemo izraz podijeliti s ukupnim brojem mjerenja
N.

N
1
m2 =
N ∑ e n2 . (8.9)
n =1

Tako smo dobili veličinu (koju takod̄er ne znamo izračunati) koja se naziva SREDNJA
GREŠKA pojedinog mjerenja. Ovu je veličinu uveo Gauß kao osnovnu veličinu za ocjenu
greške jednog niza mjerenja. Ona karakterizira točnost kojom je izvršeno svako pojedino
od N mjerenja. Gornjom je jednadžbom srednja greška, m, definirana kroz svoj kvadrat,
kako bi bila iste dimenzije kao i sama mjerena veličina X. Primjetimo još i da pomoću
gornjeg izraza ne možemo računati m jer nam je nepoznata desna strana, ali ćemo od
ovog izraza imati koristi kasnije kod računa (8.20).

8.2.1 Greška funkcije


Sada je pred nama slijedeći zadatak: neka se, radi općenitosti, izravno mjeri nekoliko
veličina X1 , X2 , X3 , · · · , koje čak i ne moraju biti mjerene u istom pokusu, tako da se
njihov ukupan broj izvršenih mjerenja N1 , N2 , N3 , · · · , može razlikovati, kao što se mogu
razlikovati i njihove točnosti m1 , m2 , m3 , · · ·

X1 m1 x1,n1 n1 = 1, 2, · · · , N1 ,

X2 m2 x2,n2 n2 = 1, 2, · · · , N2 ,

X3 m3 x3,n3 n3 = 1, 2, · · · , N3 ,

.. .. .. ..
. . . .

Ako od ovih veličina napravimo funkciju Y = f ( X1 , X2 , X3 , · · · ), vrijednosti te funkcije


će sadržavati grešku koja potječe od grešaka x1,n1 , x2,n2 , x3,n3 , · · · .

Y = f ( X1 , X2 , X3 , · · · ) −→ f ( x1,n1 , x2,n2 , x3,n3 , · · · )

Sada se postavlja pitanje:


KAKO IZRA ČUNATI GREŠKU OD Y
8.2 Prilagodba direktnih opažanja jednake točnosti 385

ako pretpostavimo da znamo greške od x1,n1 , x2,n2 , x3,n3 , · · · i funkcijsku ovisnost f ?


Odgovor ćemo naći postupno, razmatrajući dvije jednostavne funkcije sa jednom ili
dvije varijable:

( a) Y = f ( X ) = a0 + a1 X, a j = const.,
(b) Y = f ( X1 , X2 ) = a 0 + a 1 X1 + a 2 X2 , a j = const.

Sve konstante smatramo poznatim (zadanim)3 .

(a) Neka se X mjeri N puta i time se dobije niz xn za n = 1, 2, 3, · · · , N. Prava vrijednost


funkcije je

Y = f ( X ) = a0 + a1 X,

a umjesto toga, mjerenjem se dobiva niz vrijednosti koje sadrže pogrešku

f ( x n ) = a0 + a1 x n .

U skladu s definicijom (8.8), prava greška funkcije, ∆ f n , je

∆ f n = f ( X ) − f ( x n ) = a1 ( X − x n ) = a1 e n .

Označimo s M 2f kvadrat pogreške funkcije. Slično definiciji (8.9) i ona će se definirati
kao zbroj kvadrata pravih grešaka podijeljena s brojem mjerenja
N N N
1 1 1
M 2f =
N ∑ (∆ f n ) 2 =
N ∑ ( a1 e n ) 2 = a12
N ∑ e n2 = a12 m 2
n =1 n =1 n =1
M f = a1 m.

To je tražena veza izmed̄u greške funkcije, M f i greške same mjerene veličine, m.

(b) Sada promatramo funkciju dvije varijable f ( X1 , X2 ). Neka je X1 izmjeren N1 puta, a


X2 neka je izmjeren N2 puta. Treba izračunati pogrešku funkcije

Y = f ( X1 , X2 ) = a 0 + a 1 X1 + a 2 X2 . (8.10)

Za izračun funkcije f možemo koristiti bilo koji par mjerenih vrijednosti x1,n1 i x2,n2 (za
n1 = 1, 2, 3, · · · , N1 i n2 = 1, 2, 3, · · · , N2 ) i tako dobiti za grešku funkcije

∆ f n1 ,n2 = f ( X1 , X2 ) − f ( x1,n1 , x2,n2 ) = a0 + a1 X1 + a2 X2 − ( a0 + a1 x1,n1 + a2 x2,n2 )


= a1 e1,n1 + a2 e2,n2 , (8.11)

za sve moguće kombinacije n1 i n2 . Takvih kombinacija ima sve skupa N1 · N2 i prikazane


su donjom tablicom

e1, 1 ; e2, 1 e1, 1 ; e2, 2 ··· e1, 1 ; e2, N2


e1, 2 ; e2, 1 e1, 2 ; e2, 2 ··· e1, 2 ; e1,N2

.. .. .. ..
. . . .
e1, N1 ; e2, 1 e1, N1 ; e2, 2 ··· e1, N1 ; e2, N2
3 Primjetimo takod̄er i da a j može biti negativno, pa primjer (b) opisuje i zbroj i razliku svoja dva člana.
386 Poglavlje 8. Teorija grešaka

Označimo opet s M 2f kvadrat pogreške funkcije po jednom mjerenju

N1 N2 N1 N2
1 1
M 2f = ∑ ∑ (∆ f n1 ,n2 ) 2 = ∑ ∑ ( a1 e1,n1 + a2 e2,n2 ) 2
N1 · N2 n1 =1 n2 =1
N1 · N2 n1 =1 n2 =1
N1 N2 N1 N2
" ! !#
1
=
N1 · N2
N2 a1 2
∑ e12,n1 + N1 a2 2
∑ e22,n2 + 2 a1 a2 ∑ e1,n1 ∑ e2,n2 .
n1 =1 n2 =1 n1 =1 n2 =1

Zbrojevi
N1 N2
∑ e12,n1 i ∑ e22,n2
n1 =1 n2 =1

sadrže samo pozitivne pribrojnike, pa su zato puno veći od umnoška zbrojeva


N1 N2
! !
∑ e1,n1 · ∑ e2,n2
n1 =1 n2 =1

od kojih svaki sadrži i pozitivne i negativne pribrojnike. Zato ćemo ovaj posljednji
umnožak dva zbroja smatrati puno manjima od zbroja čistih kvadrata i zanemarit ćemo
ga u daljem računu
N1 N2
!
1
2
Mf ≈ N2 a1 ∑ e1,n1 + N1 a2 ∑ e2,n2
2 2 2 2
N1 · N2 n1 =1 n2 =1
N1 N2
1 1
= a12
N1 ∑ e12,n1 + a22
N2 ∑ e22,n2 = a12 m12 + a22 m22 . (8.12)
n1 =1 n2 =1

Poopćenje gornjeg postupka na funkciju više varijabli očito vodi na

Y = f ( X1 , X2 , · · · , X D ) = a 0 + a 1 X1 + a 2 X2 + · · · + a D X D
D
M 2f = a12 m12 + a22 m22 + · · · + aD2 mD2 = ∑ ad2 md2 . (8.13)
d =1

Nakon analize jednostavnih funkcija iz (a) i (b), možemo prijeći i na analizu grešaka
bilo koje OP ĆE FUNKCIJE

Y = f ( X1 , X2 , · · · , XD ) = f ( x1,n1 + e1,n1 , x2,n2 + e2,n2 , · · · , xD,nD + eD,nD ). (8.14)

Očekujemo da su pogreške male, pa zato gornju funkciju možemo razviti u Taylorov


red4 po malim veličinama e i zadržati se na linearnim članovima razvoja

∂ f ∂ f

f ( X1 , X2 , · · · , XD ) = f ( x1,n1 , x2,n2 , · · · , xD,nD ) + e1,n1 + e2,n2 + · · · + O(e 2 )
∂X1 X1 = x1,n ∂X2 X2 = x2,n
1 2
D
∂f

= f ( x1,n1 , x2,n2 , · · · , xD,nD ) + ∑ ed,nd + O(e 2 ).

d =1
∂X d

X d = x d,n d

Pretpostavlja se da su svi xd,nd približno sličnih vrijednosti, pa je svejedno koji ćemo od


njih uvrstiti u gornje izraze za parcijalne derivacije. S O(e 2 ) su označeni svi oni članovi
4 Vrijednosti derivacija se računaju ili u x
1,n1 , x2,n2 , · · · ili u nekoj drugoj karakterističnoj vrijednosti -
ovaj izbor ne utječe puno na konačni rezultat.
8.2 Prilagodba direktnih opažanja jednake točnosti 387

Taylorovog razvoja koji su srazmjerni drugoj i ostalim višim potencijama ed,nd . Ovi su
epsiloni po pretpostavci male veličine pa su njihovi kvadrati i ostale više potencije još
manje veličine od samih epsilona i zato ih zanemarujemo u daljem računu. No, gornji
je izraz istog oblika kao i (8.11), pri čemu su konstante a1 , a2 , · · · dane odgovarajućim
parcijalnim derivacijama

∂ f ∂ f ∂ f

a1 = , a2 = , a3 = , ··· .
∂X1 X1 = x1,n ∂X2 X2 = x2,n ∂X3 X3 = x3,n
1 2 3

∆ f n1 ,n2 ,n3 ,··· = f ( X1 , X2 , X3 , · · · ) − f ( x1,n1 , x2,n2 , x3,n3 , · · · ) = a1 e1,n1 + a2 e2,n2 + a3 e3,n3 + · · ·


N N N 2
∑n11=1 ∑n22=1 ∑n33=1 · · · (∆ f n1 ,n2 ,n3 ,··· )
M 2f =
N1 · N2 · N3 · · ·
N N N
∑n11=1 ∑n22=1 ∑n33=1 · · · ( a1 e1,n1 + a2 e2,n2 + a3 e3,n3 + · · · ) 2
=
N1 N2 N3 · · ·
!2 !2 !2
∂ f ∂ f ∂ f

≈ m1 + m2 + m3 + ···
∂X1 X1 = x1,n ∂X2 X2 = x2,n ∂X3 X3 = x3,n
1 2 3

v !2 !2
u
∂ f ∂ f
u
Mf = t m1 + m2 + · · ·. (8.15)
∂X1 X1 = x1,n ∂X2 X2 = x2,n
1 2

Gornji izraz se zove ZAKON RASPROSTIRANJA GREŠAKA. Pomoću ovog izraza može
se odrediti maksimalna dozvoljena veličina greške mjerenih veličina. Ovo je važno
kod planiranja pokusa jer tako možemo unaprijed zaključiti kojom metodom treba
vršiti mjerenja. Pretpostavit ćemo da su greške svih mjerenih veličina približno jednake
(načelo jednakog djelovanja grešaka)
∂f ∂f

m m ≈ ··· .


∂X 1

∂X2 2
1

Iz gornjeg izraza slijedi zaključak da je mjerenje potrebno izvesti tako da se greške


mjerenja pojedinih veličina odnose jedna prema drugoj na isti način kako se odnose i
recipročne vrijednosti derivacija funkcija po tim istim veličinama
∂f


m1 ∂X2
= · · · = = ··· . (8.16)
m2 ∂f

∂X
1

Primjena gornje relacije je pokazana primjerom 8.1.


 Primjer 8.1 F RESNELOVE PRUGE INTERFERENCIJE
Valna duljina svjetlosti, λ, se može izračunati i pomoću Fresnelovih pruga interferencije,

ad
λ= ,
D
388 Poglavlje 8. Teorija grešaka

gdje su: a je razmak med̄u koherentnim izvorima svjetlosti, d razmak med̄u susjednim
interferentnim prugama, D je razmak od izvora do zaslona na kome se promatraju
pruge. Razmak d se mjeri s točnošću od 10−3 cm. Potrebno je odrediti s kojom najmanjom
točnošću treba mjeriti a i D, ako je početnim mjerenjem a, d i D dobiven njihov red
veličina

a = 0.5 cm, d = 0.02 cm, D = 160 cm.

Povežimo rješenje ovog zadatka s prethodnim izlaganjem: relaciju

ad
λ= ,
D

čitamo kao
X1 X2
Y = F ( X1 , X2 , X3 ) = .
X3

i prema (8.15), pogreška funkcije λ se računa kao


s
 2  2  2
∂λ ∂λ ∂λ
Mλ = m a2 + md2 + 2,
mD
∂a ∂d ∂D

gdje se derivacije računaju za vrijednosti a, d i D zadane u zadatku. Gornja tri člana pod
korjenom opisuju doprinos pogrešci λ koji potječe, redom, od a, d i D. Pokus je dobro
postavljen ako su svi ovi doprinosi približno istog iznosa

∂λ
md = ∂λ m a ,
∂λ ∂λ
∂D m D . (8.17)
md =


∂d ∂a ∂d

U zadatku je zadano

md = 10−3 cm,

pa se pomoću te vrijednosti i gornje dvije jednadžbe, mogu naći m a i m D . Izračunajmo


najprije odgovarajuće derivacije

d 0.02 a 0.5 ad 0.5 · 0.02



∂λ ∂λ ∂λ
= = , = = , ∂D = D 2 = 160 2 .

∂a D 160 ∂d D 160

Prema prvoj od jednadžba (8.17) slijedi

0.5
m a = 10−3 cm = 0.025 cm.
0.02

Iz druge od jednadžba (8.17) slijedi

160
m D = 10−3 cm = 8 cm.
0.02

Dakle, razmak izmed̄u izvora i zaslona je dovoljno mjeriti s točnošću od desetak centi-
metara, a razmak med̄u izvorima s točnošću od trećine milimetra. 
8.2 Prilagodba direktnih opažanja jednake točnosti 389

8.2.2 Standardna devijacija aritmetičke sredine


U prošlom smo odjeljku pokazali da je aritmetička sredina najvjerojatnije najbliža
nepoznatoj pravoj vrijednosti mjerene veličine X. Sada si možemo postaviti pitanje o
točnosti te procjene:
K AKO OCIJENITI TO ČNOST ARITMETI ČKE SREDINE h x i ?
Uvedimo grešku aritmetičke sredine M hxi kao razliku izmed̄u (pravog ali nepoznatog)
X i aritmetičke sredine h x i koja je dobivena iz niza od N mjerenja xn i povežimo ju s
pravom, e n i prividnom, vn , pogreškom n-tog mjerenja
X = xn + e n e n = X − xn
h x i = xn + vn vn = h x i − xn ⇒ en = v n + M h x i
X = h x i + M hxi M hxi = X − h x i
Kvadriranjem gornjeg izraza, a zatim zbrajanjem po n = 1, 2, · · · , N, slijedi
N N N . 1
∑ e n2 = ∑ vn2 + 2M hxi ∑ vn + N M h2xi ,
N
n =1 n =1 n =1
| {z }
= (8.4) = 0
N N
1 1
m2 ≡
N ∑ e n2 =
N ∑ vn2 + M h2xi . (8.18)
n =1 n =1

Relacijom (8.9), m je uvedena kao prosječna srednja greška svakoga xn . Pogledajmo


sada što možemo reći o drugom članu desne strane gornjeg izraza. Aritmetička sredina
h x i je definirana kao prvi moment konstantne raspodjele vjerojatnosti, P(n) = 1/N,
1
hxi = ( x1 + x2 + · · · + xN ),
N
što znači da greška od h x i, ovisi o greškama mjerenih vrijednosti xn . Shvatimo li h x i
kao funkciju f ( x1 , x2 , · · · , xN )
1
h x i ≡ f ( x1 , x2 , · · · , xN ) = ( x1 + x2 + · · · + xN ),
N
tada je pogreška funkcije f ≡ h x i dana zakonom o rasprostiranju grešaka (8.15),
2  2 2 2
∂ hxi ∂ hxi ∂ hxi 1 m2
  
M h2xi = m + m + ··· + m =N· m = . (8.19)
∂x1 ∂x2 ∂xN N N
Uvrsti li se gornji izraz u (8.18), slijedi jednadžba za odred̄ivanje m 2
N N
1 1 m2
m2 =
N ∑ vn2 + M h2xi =
N ∑ vn2 +
N
n =1 n =1
N
1
⇒ m2 =
N−1 ∑ vn2 . (8.20)
n =1

Za razliku od (8.9), desna strana gornjeg izraza se može izračunati i tako dobiti ocjena
srednje greške pojedinog mjerenja. Pomoću gornjeg izraza i (8.19) dobiva se i

N
1
Mh2xi =
N ( N − 1) ∑ vn2 . (8.21)
n =1
390 Poglavlje 8. Teorija grešaka

Gornji izraz nam daje granice unutar kojih se nalazi prava vrijednost veličine X u obliku

h x i − M hxi < X < h x i + M hxi


s s
∑nN=1 vn2 ∑nN=1 vn2
hxi − < X < hxi + .
N ( N − 1) N ( N − 1)
Kako je M hxi zadano preko kvadrata grešaka, ono je po svom značenju slično standard-
noj devijaciji, (3.39). U skladu sa središnjim graničnim teoremom, odjeljak 7.3, za veliki
N, aritmetička sredina h x i je raspodjelčjena po Gaußovoj raspodjeli, što znači da se,
prema (4.77), može reći da je vjerojatnost da se X zaista i nalazi unutar gornjih granica,
jednaka oko 68% i slično za granice dane sa 2 M hxi i 3 M hxi

h x i − M hxi < X < h x i + M hxi 68 %,

h x i − 2 M hxi < X < h x i + 2 M hxi 95 %,

h x i − 3 M hxi < X < h x i + 3 M hxi 99 %.

Budući da izvod nije egzaktan, gornji rezultati su samo približni. Veličina M 2 se može
povezati i s analizom iz prethodnog odjeljka, gdje smo dobili da je vjerojatnost pogreške
srazmjerna Gaußovoj funkciji (8.7). Prema tome slijedi
Z +∞
2v2 1 2v2 2 / (2M 2 )
M2 = v 2 e− a dv = · · · ( A.41) · · · = ⇒ e− a = e− v .
−∞ 2 a2
Ovime je konstanta a iz Gaußove raspodjele, povezana sa srednjom greškom.
Slika 8.2 Vratimo se izrazu (8.19)
m
1 M hxi = √
0.9 N
0.8

0.7 iz kojega se vidi da standardna devijacija


0.6
aritmetičke sredine ovisi o broju mjerenja
/m

tako da se ona SMANJUJE ( TJ . REZULTAT


0.5
x
M

0.4

0.3 POSTAJE TO ČNIJI ) S PORASTOM BROJA MJE -


0.2
RENJA N. Želimo vidjeti koliko mjerenja
treba obaviti, pa da dobitak u točnosti bude
0.1

srazmjeran uloženom trudu za izvod̄enje


10 20 30 40 50 60 70 80
N

velikog broja mjerenja. Na slici 8.2 vidimo ovisnost M hxi o broju mjerenja N. Primjeću-
jemo da je funkcija prilično strma do nekih N = 10, dok poslije toga srazmjerno sporo
opada. To znači da ćemo s nekih desetak mjerenja znatno utjecati na porast točnosti
rezultata, dok će dalje povećanje broja mjerenja tek malo povećati točnost (za dalji porast
točnosti, treba smanjivati m, tj. povećati točnost samog postupka mjerenja - metode i
opreme.).

Zadatak 8.1 Kut je mjeren šest puta i dobivene su slijedeće vrijednosti:

ϕ1 = 340 450 5200 , ϕ4 = 340 450 3900 ,


ϕ2 = 340 450 4700 , ϕ5 = 340 450 4100 ,
ϕ3 = 340 450 2300 , ϕ6 = 340 450 5300 .
8.3 Prilagodba direktnih opažanja različite točnosti 391

Treba naći najvjerojatniju vrijednost kuta i pridruženu ocjenu greške. 

Rješenje:
Aritmetička sredina je

ϕ1 + ϕ2 + ϕ3 + ϕ4 + ϕ5 + ϕ6
h ϕi = = · · · = 340 450 42.500 .
6
Prividne greške su

v1 = h ϕi − ϕ1 = − 9.500 ,


v2 = h ϕi − ϕ2 = − 4.500 ,



 s
6
∑nN=1 vn2
r
v3 = h ϕi − ϕ3 = +19.500 , 615.500


v4 = h ϕi − ϕ4 = + 3.500 ,
⇒ ∑ vn2 00
= 615.5 ⇒ m =
N−1
=
5
= 11.100 ,
n =1

v5 = h ϕi − ϕ5 = + 1.500 ,





v6 = h ϕi − ϕ6 = −10.500 ,

s
∑nN=1 vn2
r
615.500
Mh ϕ i = = = 4.500 .
N ( N − 1) 30

Dakle, s vjerojatnošću od 68%, možemo tvrditi da se prava vrijednost kuta ϕ nalazi u slijedećim
granicama

ϕ = h ϕi ± Mh ϕi = 340 450 42.500 ± 4.500 .

Prosječna pogreška svakog pojedinog mjerenja je 11.100 .

8.3 Prilagodba direktnih opažanja različite točnosti


U prethodnom smo odjeljku prešutno pretpostavili da su sve vrijednosti xn mjerene
jednakom točnošću. To ne mora biti točno, jedno mjerenje može biti izvršeno s većom
ili manjom greškom neko neko drugo mjerenje (npr. istu veličinu mjere različite osobe
ili ista osoba izvodi mjerenja u različito doba dana ili godine i slično). Da bismo to
uzeli u obzir pri računu greške, svakoj se mjerenoj vrijednosti pridružuje njezina težina
tn . Npr. ako smo istu vrijednost mjerili tn puta, tada je to težina toga mjerenja. S h xn i
označavamo aritmetičku sredinu svih tn mjerenja,

tn
xn,1 + xn,2 + · · · + xn,tn 1
h xn i =
tn
=
tn ∑ xn,j .
j =1

Veličine xn,j se nazivaju elementarna mjeranja. Pretpostavlja se da su sva elementarna


mjerenja, za neki fiksni n, obavljana s ISTOM točnošću, pa se na njih može primjeniti
analiza iz prethodnog odjeljka. Ukupan broj svih izvršenih elementarnih mjerenja je
t1 + t2 + · · · + tN , pa je ukupna aritmetička sredina h x i jednaka

( x1, 1 + x1, 2 + · · · + x1, t1 ) + ( x2, 1 + x2, 2 + · · · + x2, t2 ) + · · · + ( xN, 1 + xN, 2 + · · · + xN, tN )


hxi =
t1 + t2 + · · · + tN
t1 h x1 i + t2 h x2 i + · · · + tN h xN i
=
t1 + t2 + · · · + tN
392 Poglavlje 8. Teorija grešaka

Pogledajmo sada što je s greškama. Neka je µ srednja greška svakog elementarnog


mjerenja (opažanja). Pitanje je: kolika je srednja greška mn pridružena h xn i? Prema
(8.19) iz prethodnog odjeljka, znamo da je

µ2
mn2 = .
tn
Grešku od h x i računamo tako da h x i napišemo u obliku
x1, 1 x1, 2 xN,tN
hxi = + + ··· +
t1 + t2 + · · · + tN t1 + t2 + · · · + tN t1 + t2 + · · · + tN

Greška svakog pojedinog čana u gornjem zbroju je jednaka µ/ ∑nN=1 tn , pa je prema


(8.15), greška od h x i
N
! 2
µ µ2
mh xi = ∑ tn
2
= . (8.22)
n =1 ∑nN=1 tn ∑nN=1 tn

U gornjem izlaganju smo pretpostavili da različite točnosti pridružene pojedinim mjere-


njima dolaze od različitog broja izvršenih elementarnih mjerenja. Uz tu pretpostavku
smo došli do izraza za mn i mhxi . Postavimo sada problem malo općenitije: neka osim
greške koja dolazi od ponovljenih mjerenja elementarnih dogad̄aja, postoje i greške
od drugih uzroka (npr. ista je veličina mjerena u različito doba godine ili je mjerena
različitim instrumentima ili različitim postupcima ili što slično). Dano je N mjere-
nja h x1 i , h x2 i , · · · , h xN i i svakome je pridružena srednja greška m1 , m2 , · · · , m N . Pomoću
mn2 = µ 2 /tn , mogu se težine napisati kao tn = µ 2 /mn2 i pomoću toga računati aritmetičku
sredinu
t1 h x1 i + t2 h x2 i + · · · + tN h xN i h x1 i µ 2 /m12 + h x2 i µ 2 /m22 + · · · + h xN i µ 2 /m N
2
hxi = =
t1 + t2 + · · · + tN µ 2 /m12 + µ 2 /m22 + · · · + µ 2 /m N 2

h x1 i /m12 + h x2 i /m22 + · · · + h xN i /m N
2
= .
1/m12 + 1/m22 + · · · + 1/m N 2

Vidimo da je (nepoznata) točnost elementarnog mjerenja iščezla iz računa. Vratimo se


relaciji

µ = mn tn (8.23)

u kojoj je mn srednja greška opažanja izmjerenog s težinom tn , a µ je srednja greška


opažanja izmjerenog težinom 1. Označimo s

vn = h x i − h xn i

razliku izmed̄u aritmetičke sredine i mjerenja izvršenog s težinom tn . Razliku izmed̄u


aritmetičke sredine i elementarnog mjerenja xn,j izvršenog s težinom 1, ćemo označiti s

vn,j = h x i − xn,j n = 1, 2, · · · , N
j = 1, 2, · · · , tn .

Pretpostavimo sada da med̄u POJEDINA ČNIM greškama koje se odnose na mjerenja


težine tn i težine 1, vrijedi isti odnos (8.23) kao i med̄u SREDNJIM greškama mjerenja s
težinama tn i 1

vn,j = vn tn (8.24)
8.3 Prilagodba direktnih opažanja različite točnosti 393

(neovisno o j). Uz tu pretpostavku, za račun grešaka s različitom točnošću možemo


koristiti izraze za greške mjerenja s jednakom točnošću i vezu (preslikavanje) dano sa
(8.24). Tako npr. iz (8.20) slijedi
N N
1 1
m2 =
N−1 ∑ vn2 −→ µ 2 =
N−1 ∑ 2
vn,j
n =1 n =1

zato jer se sada vn,j odnose na pojedinačna mjerenja (mjerenje težine 1) baš kao što
se na pojedinačna mjerenja odnose i vn u (8.20). Sada relacijom (8.24) prelazimo s
(pojedinačnih) mjerenja težinom jedan, na mjerenja težinom tn
N N
1 1
µ2 =
N−1 ∑ 2
vn,j =
N−1 ∑ vn2 tn .
n =1 n =1

Kada znamo µ, pomoću (8.22) možemo izračunati i mhxi

µ2 ∑nN=1 vn2 tn
mh2xi = =
∑nN=1 tn ( N − 1) ∑nN=1 tn

s
∑nN=1 vn2 tn
mh xi = . (8.25)
( N − 1) ∑nN=1 tn

Zadatak 8.2 navesti primjer 

Rješenje:
dovršiti
Zadatak 8.3 Mjerenjem su dobiveni slijedeći rezultati za vrijednosti x varijable X i
pridružene težine t( x ):

x t( x )

4.92 - 4.94 2
4.95 - 4.97 7
4.98 - 5.00 14
5.01 - 5.03 10
5.04 - 5.06 6
5.07 - 5.09 3

Izračunajte aritmetičku sredinu i standardnu devijaciju. 

Rješenje:
dovršiti
Zadatak 8.4 Donjim je tablicom zadana diskretna slučajna varijabla
394 Poglavlje 8. Teorija grešaka

x P( x )

2 2/30
3 5/30
4 8/30
5 8/30
6 5/30
7 2/30

(a) Prikažite grafički raspodjelu vrijednosti varijable X. (b) Izračunajte vjerojatnost


P( x ≤ 4). (c) Izračunajte očekivanje varijable X. (d) Izračunajte očeki-
vanje i varijancu varijable Y = 2X − 3. 

Rješenje:
dovršiti
Zadatak 8.5 Dan je niz brojeva: 1, 2, 3, 4, 5, 6, 7, 8. Iz tog se niza slučajnim izborom
uzima uzorak od tri broja. Označimo li s X najveći broj u uzorku, tada
je X slučajna varijabla. (a) Koje vrijednosti može poprimiti varijabla
X? (b) Koje vjerojatnosti pripadaju pojedinim vrijednostima? (c) Kako
glasi raspodjela vjerojatnosti varijable X? (d) Izračunajte očekivanje i
standardnu devijaciju varijable X. 

Rješenje:
dovršiti
Zadatak 8.6 Jedna posuda sadrži 4 bijele i 3 crne kuglice. Slučajnim postupkom se
uzima uzorak od 3 kuglice. Neka je X broj bijelih kuglica u uzorku.
(a) Kolike vjerojatnosti pripadaju vrijednostima x = 0, 1, 2, 3? (b) Kako
glasi raspodjela vjerojatnosti varijable X? (c) Izračunajte očekivanje i
standardnu devijaciju varijable X. 

Rješenje:
dovršiti

8.4 Prilagodba posrednih opažanja - LSA


Problem koji ćemo rješavati u ovom odjeljku se može formulirati na slijedeći način:
analizirat će se četiri fizičke veličine, X, Y, a0 i a1 , med̄usobno povezane relacijom oblika

Y = a0 + a1 X, (8.26)

tj. jednadžbom pravca u ravnini ( X, Y ). Mjerenjem se dobivaju približne vrijednosti


X i Y, a potrebno je odrediti vrijednosti koeficijenata a0 i a1 . Primjetimo najprije da se
mnoge nelinearne relacije mogu svesti na gornji oblik. Npr. u laboratorijskoj vježbi s
polarizacijom svjetlosti, treba provjeriti točnost Malusova zakona

I = I0 cos2 (α).

Mjerenjem se dobiju vrijednosti I i α, pa uz identifikaciju Y = I i X = cos2 (α), Malusov


zakon ima oblik (8.28), gdje su parametri a1 ≡ I0 , i a0 = 0. Ili, ako se npr. iz teorije zna
8.4 Prilagodba posrednih opažanja - LSA 395

da su U i V vezani relacijom oblika


c1
U = c0 + , (8.27)

tada se prikladnim logaritmiranjem gornjeg izraza dolazi do

ln |U − c0 | = ln |c1 | − α ln(V ).

Uz definiciju

Y ≡ ln |U − c0 |, a0 ≡ ln |c1 |, a1 ≡ −α, X ≡ ln(V ),

izraz (8.27) postaje oblika (8.26).

Neka su nizom od N pokusa izmjerene veličine X i Y čije su vrijednosti dane pa-


rovima
Slika 8.3
120
( x1 , y1 ), ( x2 , y2 ), · · · , ( xN , yN ).
110

100 ? kao što je to prikazano plavim točkicama na


90
? slici 8.3. Uslijed grešaka pri mjerenju, neće
80
? biti a0 + a1 xn = yn za sve n = 1, 2, · · · , N, tj.
točke ( xn , yn ) neće ležati na pravcu, nego će
70
y

60
biti
50

40
?
30
? a0 + a1 x n = y n + w n , (8.28)
20

10
gdje je wn greška n-tog mjerenja.
0
-0.1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1.1
x
Drugim riječima, ako se u xn uvrsti u gornju jednadžbu pravca, bez obzira na vrijednosti
a1 i a0 , NE ĆE se za sve n dobiti yn , već će se dobiti yn + wn , gdje je wn greška. Budući da
smo mi svjesni postojanja greške, a iz teorije znamo da točke moraju ležati na pravcu,
pokušat ćemo naći jednadžbu pravca tako da ta greška u odnosu na mjerene vrijednosti
bude što manja. Dva zadatka koji se postavljaju u ovom odjeljku su
(1) IZRA ČUNATI VELI ČINE a0 I a1
iz relacije (8.26), tako da dobiveni pravac prolazi najbliže mjerenim točkama i
(2) PROCJENITI NJIHOVE GREŠKE , M0 I M1 .
Koeficijenti a1 i a0 su slobodni parametri (varijable) koje ćemo mijenjati sve dok ne
dobijemo one vrijednosti a1 i a0 za koje je zbroj kvadrata5 svih grešaka minimalan6 (engl.
least squares approximation, LSA)

N
χ2 ≡ ∑ wn2 = min, (8.29)
n =1

ili, preciznije,
N
χ 2 ( a0 , a1 ) ≡ ∑ (yn − a0 − a1 xn ) 2 = min.
n =1
5 Opet radimo s kvadratima grešaka, kako bismo eliminirali utjecaj predznaka greške.
6 Sličan se postupak kasnije primjenjuje u odjeljku 9.2.
396 Poglavlje 8. Teorija grešaka

Na taj način će se dobiti pravac koji, u smislu najmanjih kvadrata, prolazi NAJBLIŽE
izmjerenim točkama. Gornji zbroj kvadrata odstupanja (pogrešaka), označen sa χ 2 , je
funkcija koeficijenata a0 i a1 . Kao što je poznato iz matematičke analize, nužan uvjet
ekstrema funkcije više varijabla je da su parcijalne derivacije funkcije po tim varijablama
jednake nuli. U ovom primjeru to znači da mora biti

N
∂χ 2
∂a0
=0 ⇒ ∑ (yn − a 0 − a1 xn ) = 0,
n =1
N
∂χ 2
∂a1
=0 ⇒ ∑ xn (yn − a0 − a1 xn ) = 0.
n =1

To je 2 × 2 linearni algebarski sustav za nepoznanice a0 i a1

N N
a0 N + a1 ∑ xn = ∑ yn , (8.30)
n =1 n =1
N N N
a0 ∑ x n + a1 ∑ xn2 = ∑ xn yn .
n =1 n =1 n =1

koji se može napisati u obliku matrične jednadžbe

H0,0 H0,1 a0 b
    
H ~a = ~b ⇐⇒ = 0 , (8.31)
H1,0 H1,1 a1 b1

pri čemu su

N N
i+ j
D E D E
Hi,j = Hj,i = ∑ xn = N x i+ j , bi = ∑ xni yn = N x i y , i, j = 0, 1. (8.32)
n =1 n =1

Primjetimo da je matrica H simetrična

H = H> ⇐⇒ Hi,j = Hj,i ,

i da su joj svi elementi realni. Matrice ovog tipa se nazivaju Hesseove7 matrice ili
hesijani. Rješenje jednadžbe (8.31) je

~a = H−1 ~b ,

gdje je s H−1 označena inverzna matrica. Lako je uvjeriti se da je

1 H1,1 − H1,0
 
H−1 = , 2
Det (H) = H0,0 H1,1 − H0,1 H1,0 = H0,0 H1,1 − H0,1 ,
Det (H) − H0,1 H0,0

tako da je rješenje

a0 1 H1,1 − H1,0 b 0
    
= , (8.33)
a1 Det (H) − H0,1 H0,0 b1

7 Ludwig Otto Hesse, (22. IV 1811. – 4. VIII 1874.), njemački matematičar.


8.4 Prilagodba posrednih opažanja - LSA 397

ili, po komponentama
H1,1 b 0 − H1,0 b1 − H0,1 b 0 + H0,0 b1
a0 = 2
, a1 = 2
,
H0,0 H1,1 − H0,1 H0,0 H1,1 − H0,1
N N N N
! ! ! !
∑ xn2 ∑ yn − ∑ xn ∑ xn yn
n =1 n =1 n =1 n =1
a0 = !2
N N
N ∑ xn2 − ∑ xn
n =1 n =1

N N N
! !
N ∑ xn yn − ∑ xn ∑ yn
n =1 n =1 n =1
a1 = !2 .
N N
N ∑ xn2 − ∑ xn
n =1 n =1

U gornjim zbrojevima je lako prepoznati srednje vrijednosti


N N
1 1
x 2 − hxi 2 ,
D E
xi = ∑ xni , σX2 = ∑ (xn − hxi) 2 =


N n =1
N n =1
N N
1 1
hyi = ∑ yn , σY2 = ∑ (yn − hyi) 2 = y 2 − hyi 2 , (8.34)


N n =1
N n =1
N
1
h xyi =
N ∑ xn yn ,
n =1

preko kojih se zatim koeficijenti a0 i a1 mogu prikazati puno preglednije

x 2 hyi − h x i h x yi h x yi − h x i hyi


a0 = , a1 = . (8.35)
hx 2 i − hxi 2 hx 2 i − hxi 2

Uvod̄enjem još i mješovite varijance (kovarijance, (3.67))


N N
1 1
σX2 Y =
N ∑ (xn − hxi)(yn − hyi) = N ∑ ( xn yn − h x i yn − xn hyi + h x i hyi)
n =1 n =1
= h x yi − h x i hyi − h x i hyi + h x i hyi = h x yi − h x i hyi . (8.36)
Primjetimo da se pomoću ovih oznaka, koeficijenti a0 i a1 iz (8.35) mogu napisati i kao8

σX2 Y
a0 = h y i − a1 h x i , a1 = . (8.37)
σX2

Sada, kada znamo vrijednosti koeficijenata a0 i a1 , možemo napisati pravac (8.26)


σX2 Y
Y = a0 + a1 X = hyi − a1 h x i + a1 X = hyi + a1 ( X − h x i) =⇒ Y − hyi = ( X − h x i).
σX2
Uočimo da ovaj pravac prolazi točkom (h x i , hyi).

8 Usporediti s (??).
398 Poglavlje 8. Teorija grešaka

 Primjer 8.2 Pokažimo još jedan način kako se može doći do jednadžbe (8.31).
Neka je zadano N = 5 pari mjerenih vrijednosti ( xn , yn ), za n = 1, 2, 3, 4, 5. Pet jednadžba
oblika (8.26)

a0 + x1 a1 = y1 ,
a0 + x2 a1 = y2 ,
a0 + x3 a1 = y3 ,
a0 + x4 a1 = y4 ,
a0 + x5 a1 = y5 ,

se može napisati u obliku matrične jednadžbe

1 x1 y1
   
   
 1 x2    y2 
   
 
a
 
0
   
 1 x3  =  y3 
   
   
a1
 
   
   
 1 x4   y4 
   
   
1 x5 y5

To su pet jednadžba za dvije nepoznanice. Pomnožimo gornju jednadžbu s lijeva


transponiranom matricom

1 x1
 
 
 1 x2 
 

1 1 1 1 1 a0
     
 
· 1 x3 
 
·
  
x1 x2 x3 x4 x5  a1

 

 1 x 4

 
 
1 x5

y1
 
 
  y2
 
 
1 1 1 1 1
 
 
 ·  y3
 
= 
x1 x2 x3 x4 x5 
 

 
 y4 
 
 
y5

N ∑nN=1 xn a0 ∑nN=1 yn
    
  = ,
∑nN=1 xn ∑nN=1 xn2 a1 ∑nN=1 xn yn

a to je upravo jednadžba (8.31). Poopćenje s N = 5 na opći N je očito. 


8.4 Prilagodba posrednih opažanja - LSA 399

P ROCJENE POGREŠAKA M0 I M1
Nakon što smo, relacijama (8.35), tj. (8.37), izračunali a0 i a1 , treba izračunati i procjene
njihovih grešaka M0 i M1 . Da bismo to izveli, provest ćemo nekoliko pripremnih računa.
Pomoću jednadžbe ekstrema (8.30)
N N
a0 N + a1 ∑ xn = ∑ yn
n =1 n =1

i definicije pogreške wn sa početka ovog odjeljka, vrijedi da je

N N N
,
a0 + a1 x n = y n + w n ∑ ⇒ a0 N + a1 ∑ xn = ∑ ( y n + w n ).
n =1 n =1 n =1

Kombiniranjem gornjih izraza se dolazi do


N N N
∑ ( yn + wn ) = ∑ yn ⇒ ∑ wn = 0.
n =1 n =1 n =1

To znači da nisu sve greške med̄usobno nezavisne, već da se jedna od njih može izraziti
preko N − 1 preostalih. Prema (8.20), srednju grešku od N − 1 nezavisnih mjerenja
računamo kao
v
u 1 N
u
m=t ∑ w 2.
N − 2 n =1 n
(8.38)

Krene li se od definicije (8.28) za grešku wn

w n = ( a0 + a1 x n ) − y n ,

nakon kvadriranja i kraćeg računa, dolazi se do

N
,
wn2 = ( a0 + a1 xn ) 2 − 2 ( a0 + a1 xn ) yn + yn2 , ∑
n =1
N
∑ wn2 = · · · = N ( a12 σX2 − 2a1 σX2 Y + σY2 )
n =1
N
∑ wn2 = (8.37) = N σY2 − a12 σX2 ,

n =1
N σY2 − a12 σX2

2
m = (8.38) = . (8.39)
N−2
Sada imamo sve što nam je potrebno za RA ČUN M1 . Vratimo se izrazu (8.35) za koefici-
jent a1 . Napiše li se a1 u obliku

1 N
!
σX2 Y 1
a1 = (8.36), (8.37) = 2 = 2
σX
∑ xn yn − h x i hyi
σ X N n =1
1 N 1 N N
!
1 1
= 2
σ X N n =1
∑ xn yn − h x i ∑
N n =1
yn = ∑
N σX2 n=1
( xn − h x i) yn ,
400 Poglavlje 8. Teorija grešaka

tada koeficijent a1 možemo shvatiti kao funkciju N nasumičnih varijabla Yn


x1 − h x i x2 − h x i xN − h x i
a1 ≡ f (Y1 , Y2 , · · · , YN ) = 2
Y1 + 2
Y2 + · · · + YN
N σX N σX N σX2
i grešku od f ≡ a1 računati9 pomoću (8.15)

x1 − h x i 2 2 x2 − h x i 2 2 xN − h x i 2 2
     
2
M1 = mY1 + mY2 + · · · + mYN .
N σX2 N σX2 N σX2
No, sve su greške od Yn med̄usobno jednake
mY21 = mY22 = · · · = mY2N = m 2 ,
pa je zato
N
m2 m2 m2
M12 =
N 2 σ4X
∑ (xn − hxi) 2 = (8.34) = N 2 σ4 NσX2 =
N σX2
. (8.40)
n =1 X

Ako sada za m uvrstimo (8.39), dobit ćemo konačan izraz za ocjenu greške koeficijenta
a1
 2
1

2 σY 2
M1 = − a1 . (8.41)
N − 2 σX2
Na sličan ćemo način izračunati i PROCJENU GREŠKE KOEFICIJENTA a0 . Prema (8.37),
koeficijent a0 možemo shvatiti kao funkciju N + 1 nasumične varijable: Y1 , Y2 , · · · , YN i
a1
1
a0 = hyi − h x i a1 ≡ f (Y1 , Y2 , · · · , YN , a1 ) = (Y1 + Y2 + · · · + YN ) − h x i a1 .
N
i grešku od f ≡ a0 računati pomoću (8.15)
1
M02 = (m 2 + mY22 + · · · + mY2N ) + h x i 2 M12 .
N 2 Y1
Svi su mY2n = m 2 med̄usobno jednaki, pa je
N
1 1
M02 = 2
N m 2 + h x i 2 M12 = (8.40) = M12 (h x i 2 + σX2 ) = (8.34) = M12 ∑ xn2 .
N N n =1

Tako smo dobili i konačan izraz za ocjenu pogreške koeficijenta a0


N
1
σX2 + h x i 2 .
 
M02 = M12
N ∑ xn2 = M12
n =1

Sumarno se može napisati:

Y = a0 + a1 X,
σX2 Y
a0 = h y i − a1 h x i , a1 =, (8.42)
σX2
s  2
1

σY
q
M0 = M1 σX2 + h x i 2 , M1 = − a 2 .
1
N − 2 σX2

9 Na sličan način, koeficijent a1 smo mogli shvatiti i kao funkciju nasumične varijable X.
8.4 Prilagodba posrednih opažanja - LSA 401

Procjene pogrešaka M0 i M1 mogu se napisati i preko Hesseove matrice


v s
N 2
x
∑ n =1 n H1,1
u q
M0 = m u  2 = m ( H −1 )0,0 = m ,
u
N 2

N Det (H)
N ∑ n =1 x n − ∑ n =1 x n
t

v s
N H0,0
u q
M1 = m u 2 = m ( H −1 )1,1 = m ,
t 
Det (H)
N ∑nN=1 2 N
x n − ∑ n =1 x n

gdje je m (common uncertainty) dano s (8.38)


v
u 1 N
u
m=t ∑ w 2.
N − 2 n =1 n

Zapis pogrešaka preko elemenata Hesseove matrice je pogodniji zato jer sadrži i općeni-
tiji slučaj prilagodbi od gore opisane linearne prilagodbe

Ma2j =m 2 · ( H −1 ) j,j ,
1 N 
yn − f (~a, xn ) 2


N − 2 n∑
2
m = . (8.43)
=1 σn

Primjetimo i da je m 2 srazmjeran sa χ 2 , relacija (10.21)


χ2
m2 = .
N−2
NELINEARNA PRILAGODBA POSREDNIH OPAŽANJA
Općenita veza izmed̄u mjerenih veličina xn i yn , može biti i složenija od linearne. Tako
je prvi prirodan korak prema poopćenju linearne veze, uračunavanje slijedeće potencije,
tj. pretpostavka veze oblika kvadratne funkcije
y ≡ f (~a, x ) = a0 + a1 x + a2 x 2 .
Zadatak je izračunati koeficijente ~a ≡ ( a0 , a1 , a2 ) iz gornjeg izraza uz uvjet
N
χ 2 (~a) ≡ ∑ [ yn − f (~a, xn ) ] 2 = min. (8.44)
n =1

Cijeli gornji zbroj, χ 2 , shvaćamo kao funkciju koeficijenata a0 , a1 i a2 , pa zato nužni uvjet
minimuma glase
∂χ 2 ∂χ 2 ∂χ 2
= 0, = 0, = 0.
∂a0 ∂a1 ∂a2
Ova tri uvjeta vode na sustav od tri jednadžbe za tri nepoznanice: a0 , a1 i a2
N N N
∑ y n − a0 N − a1 ∑ x n − a2 ∑ xn2 = 0,
n =1 n =1 n =1
N N N N
∑ x n y n − a0 ∑ x n − a1 ∑ xn2 − a2 ∑ xn3 = 0,
n =1 n =1 n =1 n =1
N N N N
∑ xn2 yn − a0 ∑ xn2 − a1 ∑ xn3 − a2 ∑ xn4 = 0.
n =1 n =1 n =1 n =1
402 Poglavlje 8. Teorija grešaka

Pomoću oznaka (8.32) definiraju se elementi simetrične matrice H

N N
i+ j
Hi,j = Hj,i = ∑ xn , bi = ∑ xni yn , i, j = 0, 1, 2.
n =1 n =1

gornji se sustav može napisati u obliku matrične jednadžbe

H0,0 H0,1 H0,2 a0 b0


    

H ~a = ~b ⇔  H1,0 H1,1 H1,2 a1 = b1 ,


    (8.45)
H2,0 H2,1 H2,2 a2 b2

u kojoj su

N N
H0,0 = N, H0,1 = H1,0 = ∑ xn , H0,2 = H1,1 = H2,0 = ∑ xn2 ,
n =1 n =1
N N
H2,1 = H1,2 = ∑ xn3 , H2,2 = ∑ xn4 .
n =1 n =1

Rješavanjem gornje jednadžbe po a0 , a1 i a2 , dobiva se


 −1  
a0 H0,0 H0,1 H0,2 b0
  
 a1  =  H1,0 H1,1 H1,2   b1 . (8.46)
a2 H2,0 H2,1 H2,2 b2

ili, po komponentama
2 ) · b + (H H
( H1,1 H2,2 − H2,1 0 2,0 2,1 − H1,0 H2,2 ) · b1 + ( H1,0 H2,1 − H1,1 H2,0 ) · b2
a0 = 3 − H H2 − H2 H
,
H0,0 H2,0 H2,2 + 2H1,0 H2,0 H2,1 − H2,0 0,0 2,1 1,0 2,2

2 ) · b + (H H
( H2,0 H2,1 − H1,0 H2,2 ) · b 0 + ( H0,0 H2,2 − H2,0 1 1,0 2,0 − H0,0 H2,1 ) · b2
a1 = 3 2 2 H
,
H0,0 H2,0 H2,2 + 2H1,0 H2,0 H2,1 − H2,0 − H0,0 H2,1 − H1,0 2,2
(8.47)
2 )·b
( H1,0 H2,1 − H1,1 H2,0 ) · b 0 + ( H1,0 H2,0 − H0,0 H2,1 ) · b1 + ( H0,0 H2,0 − H1,0 2
a2 = 3 2 2
.
H0,0 H2,0 H2,2 + 2H1,0 H2,0 H2,1 − H2,0 − H0,0 H2,1 − H1,0 H2,2

Slično se rade i prilagodbe na polinome višeg stupnja, pri čemu je potrebno invertirati
matrice reda za jedan većeg od reda korištenog polinoma. Procjena pogrešaka se izvodi
kao i za linearni slučaj i vodi na

Ma2j = m 2 · ( H −1 ) j,j , j = 0, 1, 2, · · ·
1 N 
yn − f (~a, xn ) 2


N − 2 n∑
2
m = . (8.48)
=1 σn

Primjetimo ponovo da je m 2 srazmjeran sa χ 2 , relacija (10.21)

χ2
m2 = .
N−2
8.4 Prilagodba posrednih opažanja - LSA 403

 Primjer 8.3 P OTENCIJA


Zadana su dva skupa od po šest točaka ( x, y1 ) i ( x, y2 )

x y1 ( x ) y2 ( x )
−3
800 − 4.3909469780044914 · 10 3.0237140525868115 · 10 −3
900 − 1.4165846690981127 · 10 −3 1.0769170524360849 · 10 −3
1000 − 3.2427449959638872 · 10 −4 9.5424150902332554 · 10 −4
1200 5.2915091475935273 · 10 −4 7.9250123903960477 · 10 −4
1400 1.0878183539202498 · 10 −3 7.1276498909749299 · 10 −4
1600 1.4624656129747242 · 10 −3 6.5713860863624691 · 10 −4 .

Gornje točke su prikazane na slikama 8.4. Potrebno je naći parametre a, b i α, takve da

Slika 8.4: Lijevo: točke ( x, y1 ) su označene trokutićima. Desno: točke ( x, y2 ) su označene


trokutićima. Iscrtkane linije su ekstrapolacije (8.49).

funkcija
1
y( x ) = a + b ·

prolazi najbliže (u smislu najmanjih kvadrata) gornjim točkama. Ovakav oblik funkcije
služi za dobivanje procjene granične vrijednosti y kada x → ∞

a = lim y( x ).
x →∞

U novoj varijabli
1
X (α) ≡ ,

prethodna funkcijska ovisnost ima standardan LSA oblik

y = a + b · X ( α ).

Sada fiksiramo vrijednost α i relacijama .... izračunamo parametre a, b, Ma , Mb i χ 2 . To


napravimo za niz vrijednosti α i nacrtamo ovisnost χ 2 = χ 2 (α). Ta je ovisnost prikazana
na slici 8.5. Sa slike se očita vrijednost α koja minimizira χ 2 i zatim se ispišu vrijednosti
a, b, Ma , Mb pridružene toj α. Tako se dobiju slijedeće dvije funkcijske ovisnosti

y1 ( x ) = 1.2904 · 10 −3 − 1.1058 · 10 15 · x −5.9556 , (8.49)


−4 46 −16.8066
y2 ( x ) = 7.6438 · 10 + 1.3985 · 10 ·x .
404 Poglavlje 8. Teorija grešaka

Slika 8.5: Plava linija prikazuje odstupanje χ 2 kao funkciju α za točke ( x, y1 ). Crvena
linija prikazuje odstupanje χ 2 kao funkciju α za točke ( x, y2 ).

Obje funkcije (8.49) su prikazane crtkanim linijama na slikama 8.4. Vidi se da ekstrapo-
lacijska krivulja lijepo prati zadane točke. Ekstrapolirane vrijednosti su bliske onima iz
(8.51). 

Primjer 8.4 E KSPONENCIJALNA FUNKCIJA


Kao i u primjeru 8.3, zadana su dva skupa od po šest točaka ( x, y1 ) i ( x, y2 )

x y1 ( x ) y2 ( x )
800 − 4.3909469780044914 · 10 −3 3.0237140525868115 · 10 −3
900 − 1.4165846690981127 · 10 −3 1.0769170524360849 · 10 −3
1000 − 3.2427449959638872 · 10 −4 9.5424150902332554 · 10 −4
1200 5.2915091475935273 · 10 −4 7.9250123903960477 · 10 −4
1400 1.0878183539202498 · 10 −3 7.1276498909749299 · 10 −4
1600 1.4624656129747242 · 10 −3 6.5713860863624691 · 10 −4 .

Gornje točke su prikazane na slikama 8.7. Potrebno je naći parametre a0 , a1 i α, takve da


funkcija

y ( x ) = a0 + a1 · e − α x , α > 0, (8.50)

prolazi najbliže (u smislu najmanjih kvadrata) gornjim točkama. Ovakav oblik funkcije
služi za dobivanje procjene granične vrijednosti y kada x → ∞

a0 = lim y( x ).
x →∞

Za x-eve reda veličine tisuću, e− x je vrlo mali broj, (npr. e−800 = 3.66 · 10 −348 ). Zato se
ekstrapolacijska funkcija (8.50) prevodi u oblik

ln |y − a0 | = ln( a1 ) − α x.

Uvod̄enjem novih/starih varijabla

Y ( a0 ) ≡ ln |y − a0 |, X ≡ x,
8.4 Prilagodba posrednih opažanja - LSA 405

prethodna funkcijska ovisnost ima standardni LSA oblik

Y = A + B · X, A ≡ ln( a1 ), B = −α.

Sada fiksiramo vrijednost a0 i relacijama .... izračunamo parametre A, B, Ma , Mb i χ 2 .


To napravimo za niz vrijednosti a0 i nacrtamo ovisnost χ 2 = χ 2 ( a0 ). Ta je ovisnost
prikazana na slici 8.6. Sa slike se očita vrijednost a0 koja minimizira χ 2 i zatim se ispišu

Slika 8.6: Plava linija prikazuje odstupanje χ 2 kao funkciju a0 za točke ( x, y1 ). Crvena
linija prikazuje odstupanje χ 2 kao funkciju a0 za točke ( x, y2 ).

vrijednosti a0 , a1 , M0 , M1 pridružene odabranom a0 . U odabranom minimumu mora biti


α > 0. Tako se dobiju slijedeće dvije funkcijske ovisnosti

Slika 8.7: Lijevo: točke ( x, y1 ) su označene trokutićima. Desno: točke ( x, y2 ) su označene


trokutićima. Iscrtkane linije su ekstrapolacije (8.50).

y1 ( x ) = 1.8 · 10 −3 − 0.074572682 · e −0.00338 x , (8.51)


−4 −0.00576 x
y2 ( x ) = 6.7 · 10 + 0.122929484 · e .

Obje funkcije (8.51) su prikazane crtkanim linijama na slikama 8.7. Vidi se da ekstrapo-
lacijska krivulja lijepo prati zadane točke. Ekstrapolirane vrijednosti su bliske onima iz
(8.49).
S obzirom da x ima značenje duljine, to α ima značenje inverzne duljine (valni vektor,
406 Poglavlje 8. Teorija grešaka

α ≡ k = 2π/λ)


y1 → λ1 = = 1858.93,
0.00338

y2 → λ2 = = 1090.83.
0.00576

Obje karakteristične valne duljine su istog reda veličine kao i x-evi korišteni u ekstrapo-
lacijama. 

 Primjer 8.5 K RUŽNICA


Zadan je skup od N = 21 točake ( xn , yn )

−0.011192121900844 −1.36522729793271
−1.43313682440581 −0.965462829395738
−0.407331033330689 1.40724858888753
−1.14016536777290 1.19413618101188
0.943005523342006 0.533886848495410
0.701368029560726 0.938473033260355
0.369216706961920 1.21137161426431
−1.79213258197845 −0.348924977441798
−0.791570667806508 −1.34629232253308
0.701367978334408 −0.938473063024943
0.943005534905101 −0.533886878726904
−1.79213260006929 0.348924987022810
−1.65442236286842 0.677412258171552
−1.43313675541534 0.965462909334867
−0.791570658662658 1.34629220625940
−0.01119216977491 1.36522734249119
0.369216674809621 −1.21137155981197
−0.407330948588808 −1.40724862037250
−1.14016548134779 −1.19413621958332
−1.65442233858238 −0.677412211626980
−1.83887671453875 0.00000000000000.

Točke su prikazane plavim kružićima na slici 8.8. Potrebno je izračunati parametre x0 i


R kružnice

( x − x0 ) 2 + y 2 = R 2

tako da gornja kružnica, u smislu najmanjeg kvadratnog odstupanja, prolazi najbliže


zadanim točkama. Nužni uvjeti da

N 2 N 2
χ2 ≡ ∑ yn2 − f 2 ( xn ) ∑ yn2 − R 2 + ( xn − x0 ) 2
 
=
n =1 n =1

bude minimalno, su

∂χ 2 ∂χ 2
= 0, = 0.
∂R 2 ∂x0
8.4 Prilagodba posrednih opažanja - LSA 407

Gornja dva uvjeta vode na 2 × 2 sustav jednadžba za nepoznanice x0 i R


N
∑ yn2 − R 2 + ( xn − x0 ) 2 = 0,
 
n =1
N
∑ xn yn2 − R 2 + ( xn − x0 ) 2 = 0.
 
n =1

Izravnim rješavanjem gornjeg sustava, dobiva se


 
N N 2+ N 2 /N − N
x x
1 ∑ n =1 n ∑ n =1 n ∑ n =1 ny ∑n=1 xn yn2 − ∑nN=1 xn3
x0 = 2
2

∑nN=1 xn /N − ∑nN=1 xn2
= −0.390301152428497,

N N N
!
1
R 2 = x02 +
N ∑ xn2 + ∑ yn2 − 2x0 ∑ xn = 2.032578032164837,
n =1 n =1 n =1
R = 1.42568510975069.

Točke ( xn , yn ) i kružnica su prikazani na slici 8.8. 

Slika 8.8: Točke (plavi kružići) i kružnica iz primjera 8.5.

P RILAGODBA POSREDNIH OPAŽANJA VIŠE VARIJABLA


Općenito, varijabla Y može funkcijski ovisiti o više nezavisnih varijabla X1 , X2 , X3 , · · · .
Ta veza može biti linearna ili složenija od linearne. Radi jednostavnosti, pretpostavimo
postojanje linearne veze oblika

Y ≡ f (~a, x ) = a0 + a1 X1 + a2 X2 + a3 X3 + · · · .

Za svaku varijablu Xm i za varijablu Y poznato je N rezultata mjerenja xm,n i yn . Zadatak


408 Poglavlje 8. Teorija grešaka

je izračunati koeficijente ~a ≡ ( a0 , a1 , a2 , a3 , · · · ) iz gornjeg izraza uz uvjet


N
χ 2 (~a) ≡ ∑ [ yn − f (~a, xn ) ] 2 = min. (8.52)
n =1

... dovršiti ...


? usporediti s kovarijantnom matricom iz poglavlja o kumulantima

X1 − h X1 i 2

2 
h X1 X2 i − h X1 i h X2 i h X1 X3 i − h X1 i h X3 i ···
X2 − h X2 i 2

2
 h X2 X1 i − h X2 i h X1 i h X2 X3 i − h X2 i h X3 i ···
 


2 2
 h X3 X1 i − h X3 i h X1 i h X3 X2 i − h X3 i h X2 i X3 − h X3 i ···
 

..
 
.
 
 
X D − hX D i 2 D × D

2
h X D X1 i − h X D i h X1 i ··· ···

Zadatak 8.7 Zadane su tri točke: (1, 1), (2, 2), (3, 4). Zadatak je povući pravac koji
prolazi najbliže (u smislu najmanjih kvadrata) ovim točkama. Označite
na grafu točku (h x i , hyi). 

Rješenje:
U ovom je primjeru N = 3, a za gornje parove vrijednosti ( xn , yn ), sustav (8.30) glasi
5

4.5

3.5
7 − 6a1 − 3a0 = 0,
3 17 − 14a1 − 6a0 = 0.
2.5
y

2
Rješavanjem gornjeg sustava, dobije se
1.5
2 3
1 a0 = − , a1 = .
3 2
0.5

0
0 0.5 1 1.5 2 2.5 3 3.5 4
Pogreške wn se računaju kao
x

3 2 1
w1 = y 1 − x 1 + = ,
2 3 6
3 2 1
w2 = y 2 − x 2 + =− ,
2 3 3
3 2 1
w3 = y 3 − x 3 + = .
2 3 6
Srednju grešku svakog mjerenja (tj. svake pojedine točke) računamo kao
s
∑nN=1 wn2 1
m= =√ .
N−2 6
Crvena linija na gornjoj slici je pravac f ( x ) = −0.66667 + 1.5 x koji nabolje priliježe uz zadane
točke (plavi kružići). Izračunajmo još i pogreške a1 i a0

M0 = ...dovriti... M1 = ...dovriti...
8.4 Prilagodba posrednih opažanja - LSA 409

Zadatak 8.8 Izračunajte parametre pravca koji je, u smislu najmanjih kvadrata,
najbliži točkama

(1, 1.42), (2, 1.67), (3, 2.01), (4, 2.92), (5, 3.47), (6, 3.61).

Nacrtajte točke i pravac. Označite na grafu točku (h x i , hyi). 

Rješenje:
Zadano je 6 točaka, dakle N = 6.

21
5

∑ xn = 21 ⇒ hxi =
6
= 3.5
4 n

∑ xn2 = 91,
3
n
15.1
∑ yn = 15.1 ⇒ hyi = ≈ 2.517
y

2 n 6
∑ xn yn = 61.48.
1 n

Koeficijenti pravca se računaju iz (8.35)


0
0 1 2 3 4 5 6 7 8
x

a0 = 0.790666 · · · , a1 = 0.493142 · · · ⇒ y = 0.790666 + 0.493142 x.


Izračunajmo još i pogreške a1 i a0
M0 = ...dovriti... M1 = ...dovriti...

Zadatak 8.9 Zadane su točke: (0, 0), (1, 10), (2, 25), (3, 20), (4, 30), (5, 15), (6, 40), (7, 30).
Nad̄ite polinom drugog reda koji prolazi najbliže danim točkama. 

Rješenje:
Zadane točke ( xn , yn ) su prikazane plavim točkama na donjoj slici.
50
Ovaj ćemo zadatak riješiti primjenom izraza
40
(8.47) na ovaj poseban slučaj. Uvrštavanjem
koordinata zadanih točaka, dobiva se (crvena li-
30 nija na slici desno)

f ( x ) = 2.5 + 8.631 x − 0.65476 x 2 ,


y

20

10
koja nabolje (u smislu najmanjih kvadrata) prili-
0
ježe uz zadane točke (plavi kružići). Izračunajmo
još i pogreške koeficijenata a j ... dovršiti ..(8.43)
-10
-1 0 1 2 3 4 5 6 7 8
x

M02 = m 2 · ( H −1 )0,0 = ...,


M12 = m 2 · ( H −1 )1,1 = ...,
Ma22 = m 2 · ( H −1 )2,2 = ....
410 Poglavlje 8. Teorija grešaka

8.5 Prilagodba vezanih opažanja


U dosadašnjim razmatranjima u ovom poglavlju, pretpostavljeno je da su X i Y po-
vezana JEDNADŽBOM poznatog ili pretpostavljenog oblika. U ovom će se odjeljku
razmatrati jedna malo drukčija situacija, gdje su mjerene veličine povezane jednim
UVJETOM koji moraju zadovoljavati. Objasnimo postupak slijedećim primjerom.

 Primjer 8.6 T ROKUT


Mjere se kutovi α, β i γ trokuta u ravnini. Mjerenje se izvodi N puta i dobivaju se tri
niza vrijednosti

α1 , α2 , · · · , αN , β1 , β2 , · · · , βN , γ1 , γ2 , · · · , γN .

Za rezultantne vrijednosti α, β i γ uzimaju se one vrijednosti koje čine zbroj

N N N
χ 2 (α, β, γ) ≡ ∑ (αn − α) 2 + ∑ ( β n − β) 2 + ∑ (γn − γ) 2 = min.
n =1 n =1 n =1

minimalnim. No, minimum mora biti takav da bude zadovoljen uvjet

α + β + γ = π. (8.53)

Kao što je poznato10 , ekstrem funkcije više varijabla uz zahtjev da mora biti zadovoljen
jedan ili više uvjeta med̄u varijablama, se nalazi pomoću Lagrangeovih množitelja. Tako
će se postupiti i sada: umjesto minimuma funkcije χ 2 s uvjetom, tražit će se minimum
funkcije χ L2 bez uvjeta

χ L2 (α, β, γ) ≡ χ 2 (α, β, γ) + λ · (α + β + γ − π )
N N N
= ∑ (αn − α) 2 + ∑ ( β n − β) 2 + ∑ ( γn − γ ) 2 + λ · ( α + β + γ − π ) ,
n =1 n =1 n =1

gdje je Lagrangeov množitelj označen s λ. Uvjeti ekstrema su

N
∂χ L2 1 N λ
= −2 ∑ (αn − α) + λ = 0 =⇒ α = ∑ αn − ,
∂α n =1
N n =1 2N
N
∂χ L2 1 N λ
= −2 ∑ ( β n − β) + λ = 0 =⇒ β = ∑ βn − 2N , (8.54)
∂β n =1
N n =1
N
∂χ L2 1 N λ
= −2 ∑ (γn − γ) + λ = 0 =⇒ γ = ∑ γn − 2N .
∂γ n =1
N n =1

Iz gornjih izraza za kutove i jednadžbe uvjeta, (8.53), slijedi

1 N λ 1 N λ 1 N λ

N n =1
α n −
2N
+ ∑
N n =1
β n −
2N
+ ∑
N n =1
γn −
2N

λ 1 N π
=⇒
2N
= ∑
3N n=1
( α n + β n + γn ) − .
3

10 Vidjeti npr. u G LUMAC, Matematičke metode fizike.


8.6 Kriging 411

Iz gornjeg izraza za λ i uvjeta ekstrema, (8.54), konačno se kutovi dobiju u obliku π/3
plus još jedan član koji opisuje odstupanje od jednakostraničnog trokuta

π 1 N
3N n∑
α= + (2αn − β n − γn ),
3 =1
π 1 N
3N n∑
β= + (−αn + 2β n − γn ),
3 =1
π 1 N
3N n∑
γ= + (−αn − β n + 2γn ).
3 =1


Zadatak 8.10 dovršiti 

Rješenje:
dovršiti

Zadatak 8.11 dovršiti 

Rješenje:
dovršiti

8.6 Kriging
U odjeljku 8.4 je postavljen i rješen problem nalaženja krivulje f ( x ) koja, u smislu
najmanjih kvadrata, prolazi najbliže skupu zadanih točaka (točaka u kojima je izmjerena
vrijednost promatrane varijable). Sada ćemo definirati jedan sličan postupak koji je
primjenjiv i na jednodimenzijski problem (kao u navedenom odjeljku), ali je isto tako
primjenjiv i na višedimenzijske probleme. Neka se promatra točka u D-dimenzijskom
prostoru

~r = x1~e1 + x2~e2 + · · · + xD~eD .


U toj se točki mjere vrijednosti l veličina (npr. tlak zraka, njegova vlažnost i temperatura
- tada je l = 3)

φ1 , φ2 , · · · , φl .

Ove se veličine shvaćaju kao komponente l-dimenzijskog vektorskog polja ~φ ≡ (φ1 , φ2 , · · · , φl ).


Time je u D-dimenzijskom prostoru definirano l-dimenzijsko vektorsko polje ~φ (~r ).
Točke u kojima je izmjerena vrijednost polja će se označavati s
~φ (~r n ), n = 1, 2, · · · , N.

Gdje je N ukupan broj točaka u kojima je izvedeno mjerenje. Radi jednostavnosti,


u nastavku ćemo promatrati samo skalarno polje, l = 1, a točke u kojima se izvode
mjeranja će se nalaziti na dvodimenzijskoj11 plohi, D = 2

~r n = xn~ex + yn~ey .
11 Obično je to površina Zemlje, tako da izloženi postupak spada u područje geostatistike.
412 Poglavlje 8. Teorija grešaka

Vrijednost polja u točki ~r n je φ(~r n ).

Z ADATAK JE PROCJENITI VRIJEDNOSTI POLJA U TO ČKAMA ZA KOJE NISU IZVRŠENA


MJERENJA , A KOJE SE NALAZE RELATIVNO BLIZU MJERENIM TO ČKAMA .

Ova se procjena izvodi uz uvjet da je varijanca razlike izmed̄u stvarnih i procjenjenih


vrijednosti φ U MJERENIM TO ČKAMA, minimalna. Ovaj se interpolacijski postupak na-
ziva KRIGING (prema južnoafričkom rudarskom inženjeru Danie Gerhardus Krigeu koji
je prvi koristio ovu metodu za procjenu količine rude u nalazištima zlata) ili W IENER -
K OLMOGOROVLJEV postupak. Teorijsku bazu ovog postupka formulirao je francuski
matematičar G EORGES M ATHERON.

Osnovna je ideja da se vrijednost polja u točki ~r u kojoj nije izvršeno mjerenje, napiše
kao linearna kombinacija vrijednosti polja u susjednim točkama (u kojima je izvršeno
mjerenje)
N
φ(~r ) = ∑ wn (~r ) φ(~r n ).
n =1

Koeficijenti razvoja wn (~r ) predstavljaju težinu kojom n-ta mjerena točka utječe na pro-
cjenu vrijednosti polja u točki ~r i obično se nazivaju TEŽINSKA FUNKCIJA12 . Glavni se
zadatak cijelog ovog računa i sastoji upravo u tome da se težinska funkcija odabere na
optimalan način. Naravno da se očekuje da će to biti funkcija koja opada s porastom
udaljenosti |~r −~r n |. Takod̄er je očito da će težinske funkcije ovisiti i o izboru točke ~r,
jer se promjenom ~r mijenja i raspored susjednih mjerenih točaka ~r n .
Označimo s M (~r ) aritmetičku sredinu mjerenih točaka unutar kružnice polumjera h sa
središtem u odabranoj točki ~r
N (h)
1
hφ(~r )i ≡ M(~r ) =
N (h) ∑ φ(~r n ). (8.55)
n =1

Gornja granica zbrajanja, N (h), je broj izmjerenih točaka s vrijednostima φ(~r n ) koje se
nalaze unutar kružnice polumjera h sa središtem u zadanoj točki ~r. Aritmetičku sredinu
preko SVIH mjerenih točaka, označit ćemo s
N
1
hφi ≡ M =
N ∑ φ(~r n ).
n =1

Vrijednost polja u bilo kojoj točki u kojoj nije izvedeno mjerenje, shvaća se kao nasumična
varijabla. Tu varijablu zamišljamo kao zbroj dvije varijable - jedne koja se sporo mijenja
s promjenom ~r i druge, koja se mijenja znatno brže s promjenom ~r. Za ovu sporu
varijablu (trend varijablu) se obično odabire srednja vrijednost polja u toj točki M(~r ), s
brza varijabla, R(~r ), je jednostavno razlika od srednje vrijednosti do cijelog φ

φ(~r ) = M (~r ) + R(~r ).

Usrednjavanjem gornje relacije i koristeći (8.55), slijedi da je R nasumična varijabla sa


srednjom vrijednošću jednakom nuli

h R(~r )i = 0. (8.56)
12 ? prijeći na simetričniju oznaku w(~r,~r n )
8.6 Kriging 413

Označimo s φ ? (~r ) vrijednost polja φ u točki ~r dobivenu postupkom kriginga (a koja


je različita od točne i nepoznate vrijednosti φ(~r )). Polazište za račun težinske funkcije
wn (~r ) jeste slijedeći izraz (za brzu varijablu R)
N (~r )
φ ? (~r ) − M (~r ) = ∑ wn (~r ) [φ(~r n ) − M(~r n )] (8.57)
n =1
N (~r )
?
R (~r ) = ∑ wn (~r ) R(~r n ).
n =1

S N (~r ) je označen broj točaka u okolici točke ~r koji se uzima u obzir pri računu težinske
funkcije - to mogu biti sve mjerene točke (tada je N (~r ) = N) ili samo jedan njihov dio
(tada je N (~r ) < N). Težinska funkcija wn (~r ) se računa iz dva uvjeta:
prvi je uvjet nepristranosti i izražava se relacijom

hφ ? (~r )i = hφ(~r )i , (8.58)

dok drugi uvjet traži da varijanca definirana kao

σ 2 = [φ ? (~r ) − φ(~r )] 2 − hφ ? (~r ) − φ(~r )i 2


D E
(8.59)

bude minimalna

σ 2 = min.

To je uobičajeni uvjet ekstrema, korišten i u prethodnom odjeljku o LSA.


Prema prvom uvjetu, (8.58), je

hφ ? (~r ) − φ(~r )i = hφ ? (~r )i − hφ(~r )i = 0,

pa se drugi uvjet, (8.59), svodi na

σ 2 = [φ ? (~r ) − φ(~r )] 2 = min.


D E

Ovisno o tretmanu spore ili trend komponete M(~r ) polja φ, razlikovat će se tri varijante
kriging postupka:
(1) jednostavni (simple) kriging,
(2) uobičajeni (ordinary) kriging i
(3) kriging s trendom.

8.6.1 Jednostavni kriging


Osnovna postavka jednostavnog kriginga13 jeste da je srednja vrijednost (trend kompo-
nenta polja) konstantna (dakle, neovisna o ~r) i poznata

M(~r ) ≡ M = const.

Uz ovu postavku, procjena polja φ ? u aproksimaciji jednostavnog kriginga se računa iz


(8.57) kao
N (~r )
?
φ SK (~r ) = M + ∑ wnSK (~r ) [φ(~r n ) − M].
n =1
13 simple kriging, SK
414 Poglavlje 8. Teorija grešaka

Procjena pogreške je
N (~r )
?
φ SK ?
(~r ) − φ(~r ) = [φ SK (~r ) − M] − [φ(~r ) − M] = ∑ wnSK (~r ) R(~r n ) − R(~r )
n =1
= R SK (~r ) − R(~r ),
gdje je
N (~r )
R SK (~r ) = ∑ wnSK (~r ) R(~r n ). (8.60)
n =1

Rječima - procjena pogreške je linearna kombinacija nasumične varijable R u mjerenim


točkama i R u odabranoj točki.
Izračunajmo varijancu gornje procjene pogreške
2
(~r ) − φ(~r )i 2
D E
2 ? ?
σSK = [φ SK (~r ) − φ(~r )] − hφ SK

= [ R SK (~r ) − R(~r )] 2 − 0
D E

= [ R SK (~r )] 2 + [ R(~r )] 2 − 2 h[ R SK (~r ) · R(~r )]i .


D E D E

Uvrštavanjem (8.60), dobiva se varijanca izražena preko korelacijskih funkcija


N (~r ) N (~r )
2
σSK = ∑ wnSK (~r ) ∑ wmSK (~r ) h R(~r n ) R(~r m )i + h R(~r ) R(~r )i
n =1 m =1
N (~r )
−2 ∑ wnSK (~r ) h R(~r n ) R(~r )i .
n =1

Označi li se korelacijska funkcija varijabla R kao


h R(~r n ) R(~r m )i ≡ C R (~r n −~r m ) = C R (~r m −~r n ),
tada se gornja varijanca piše kao
N (~r ) N (~r ) N (~r )
2
σSK = ∑ wn (~r )
SK
∑ wm (~r ) C R (~r n −~r m ) + C R (0) − 2
SK
∑ wnSK (~r ) C R (~r n −~r ). (8.61)
n =1 m =1 n =1

Zadatak da se pronad̄u kriging težine w koje će učiniti gornju varijancu minimalnom,
iskazuje se izrazom
2 N (~r ) N (~r )
∂σSK
∂wkSK (~r ) m∑ ∑
0= = wmSK (~r ) C R (~r k −~r m ) + wnSK (~r ) C R (~r n −~r k ) + 0 − 2 C R (~r k −~r ).
=1 n =1

Gornja dva zbroja na desnoj strani su med̄usobno jednaki, pa uvjet minimuma glasi
N (~r )
∑ wmSK (~r ) C R (~r n −~r m ) = C R (~r n −~r ), n = 1, 2, · · · , N (~r ). (8.62)
m =1

Primjetimo da se gornja jednadžba može raspisati u obliku matrične jednadžbe


w1 (~r )
  SK
C R (~r 1 −~r 1 ) C R (~r 1 −~r 2 ) C R (~r 1 −~r 3 ) ··· C R (~r 1 −~r )
   
 C R (~r 2 −~r 1 ) C R (~r 2 −~r 2 ) C R (~r 2 −~r 3 ) · · · w
  2
  SK
(~
r )   C R (~r 2 −~r )
  
.. · .. = .. .
 
. . .

     
C R (~r N (~r ) −~r 1 ) C R (~r N (~r ) −~r 2 ) C R (~r N (~r ) −~r 3 ) · · · wN
SK
(~r ) (~
r) C R (~r N (~r ) −~r )
8.6 Kriging 415

Uvedu li se matrica K i vektori w


~ i ~k relacijama

C R (~r 1 −~r 1 ) C R (~r 1 −~r 2 ) C R (~r 1 −~r 3 ) ···


 
 C R (~r 2 −~r 1 ) C R (~r 2 −~r 2 ) C R (~r 2 −~r 3 ) · · ·
K= .. ,
 
 . 
C R (~r N (~r ) −~r 1 ) C R (~r N (~r ) −~r 2 ) C R (~r N (~r ) −~r 3 ) · · ·

w1SK (~r ) C R (~r 1 −~r )


   
 w2SK (~r )   C R (~r 2 −~r ) 
~ =
w .. , ~k =  .. ,
  
. .

   
wN
SK
(~r ) (~
r) C R (~r N (~r ) −~r )

tada se gornja jednadžba kraće zapisuje kao

K·w
~ = ~k .

Nepoznanica u gornjoj jednadžbi je težinska funkcija wnSK (~r ), koja se lako dobiva mno-
ženjem gornje jednadžbe s lijeva s K −1

~ = K −1 · ~k .
w

Kada je dobivena težinska funkcija, tada se procjena vrijednosti polja u nepoznatoj točki
~r dobiva kao
N (~r )
φ(~r ) = M + R SK (~r ) = (8.60) = M + ∑ wnSK (~r ) R(~r n ).
n =1

Takod̄er, iz izraza za težinsku funkciju se dobiva i izraz (8.61) za varijancu14

N (~r ) N (~r ) N (~r )


" #
2
σSK = C R (0) + ∑ wnSK (~r ) ∑ wmSK (~r ) C R (~r n −~r m ) − 2 ∑ wnSK (~r ) C R (~r n −~r )
n =1 m =1 n =1
N (~r ) N (~r )
= (8.62) = C R (0) + ∑ wnSK (~r ) C R (~r n −~r ) − 2 ∑ wnSK (~r ) C R (~r n −~r )
n =1 n =1
N (~r )
= C R (0) − ∑ wnSK (~r ) C R (~r n −~r ) = min.
n =1

 Primjer 8.7 Kao ilustraciju teorije izložene u ovom odjeljku, navedimo i jedan nu-
merički primjer. Poznati su rezultati stotinjak mjerenja, prikazani na slici ... . Radi
jednostavnosti, procjenu vrijednosti polja u točki u kojoj nije izvedeno mjerenje (križić
na slici ...), računat ćemo koristeći samo šest najbližih točaka (crne točke na slici ).
Elementi matrice K ovise samo o med̄usobnoj udaljenosti točaka u kojima je izvedeno
mjerenje

C R (~r n −~r m ) ≡ C R (~h ),

gdje je ~h = ~r n −~r m . Primjetimo da model sadrži u sebi i mogućnost anizotropije, pa


korelacijska funkcija ovisi o vektoru ~h , a ne samo o njegovom iznosu (što je poseban
14 To je njezina minimalna vrijednost
416 Poglavlje 8. Teorija grešaka

slučaj kada je model izotropan). Radi jednostavnosti, model će se tretirati kao izotropan,
pa je C R = C R (h). Glavni dio posla se sastoji upravo u računu C R = C R (h). Za statistički
veliki broj mjerenih točaka, izračuna se C R (h) za niz raznih vrijednosti h i to se nacrta na
dijagram (slika ...) koji se naziva variogram ili semivariogram. Sada se C R (h) interpolira
jedno glatkom funkcijom. Odabir te funkcije (citirati wikipediu ?) ovisi i konkretnom
obliku variograma, a u ovom primjeru, koristit će se sferična aproksimacija
" 3/2 #
3 h 1 h

C R (h) = C R (0) − γ(h) = 0.78 − 078 − .
2 4141 2 4141

Udaljenosti med̄u mjerenim točkama su dane tablicom ..., a udaljenosti od mjernih točke
do odabrane točke, navedene su na slici .... . Iz svih ovih podataka, lako je izračunati
matricu K (pa time i njezin inverz) i vektor ~k . 

 Primjer 8.8 Kao ilustraciju teorije izložene u ovom odjeljku, riješimo detaljno jedan
jednodimenzijski problem. 

 Primjer 8.9 Kao ilustraciju teorije izložene u ovom odjeljku, riješimo detaljno jedan
dvodimenzijski problem. 

8.6.2 Uobičajeni kriging


8.6.3 Kriging s trendom
8.6 Kriging 417

Literatura korištena u ovom poglavlju:

1. N ICHOLAS J. G IORDANO I H ISAO N AKANISHI.


Computational Physics. Pearson Prentice Hall, New York, 2006. URL: http://www.
physics.purdue.edu/~hisao/book/
2. B. M ARKOVI Ć I DRUGI.
Odabrana poglavlja fizike, III dio. PMF, Sveučilište u Zagrebu, 1963
3. Ivo PAVLI Ć.
Statistička teorija i primjena. Panorama, Zagreb, 1965
4. M IROSLAV P OŽEK.
Osnove teorije vjerojatnosti i matematičke statistike. 2003. URL: https://www.scribd.
com / document / 56377048 / Osnove - teorije - vjerojatnosti - i - matematicke -
statistike
5. K EN R ILEY , M ICHAEL H OBSON I S TEPHEN B ENCE.
Mathematical Methods for Physics and Engineering. Cambridge Univ. Press, 2006
6. A SHTON S HORTRIDGE.
Spatial Data Analysis. 2019. URL: https://msu.edu/~ashton/classes/866/
7. V LADIMIR V RANI Ć.
Vjerojatnost i statistika. Tehnička knjiga, Zagreb, 1971
8. P ETER Y OUNG. „
Everything you wanted to know about Data Analysis and Fitting but were afraid
to ask”. (2012). URL: https://arxiv.org/abs/1210.3781
9. Teorija korelacija

I ZLAGANJE O KORELACIJAMA ćemo započeti tako što ćemo prvo reći što korelacije
nisu: ako izmed̄u dvije varijable x i y postoji stroga funkcijska ovisnost (kao npr. na
slici 9.1.A) ili ako izmed̄u x i y ne postoji nikakva veza (kao npr. na slici 9.1.B), tada x i y
NISU korelirane varijable. Svaka druga veza x i y JESTE korelacijska veza. Ili, detaljnije,

Slika 9.1: (A) izmed̄u x i y postoji funkcijska veza y = 22.09 x 3 e−3x ; (B) izmed̄u x i y ne
postoji nikakva veza.

(A)
1 y2 (B)
y

y1 y
0

x1 x2
-1 x
-0.5 0 0.5 1 1.5 2
x

ako za svaki zadani x postoji algoritam kojim se jednoznačno izračunava pripadni y,

y = f ( x ),

ili obratno, za svaki zadani y se može naći x

x = f −1 ( y ),

tada se kaže da su x i y povezani FUNKCIJSKOM VEZOM. Jedan primjer funkcijske veze


je relacija

y( x ) = 22.09 · x 3 · e−3x ,
420 Poglavlje 9. Teorija korelacija

prikazana na slici 9.1.A. Naprotiv, ako za neki fiksni x, varijabla y može poprimiti bilo
koju vrijednost, potpuno neovisno o x, tada se kaže da y NE OVISI o x, tj. za zadani x,
varijabla y može imati bilo koju vrijednost. Isto tako, za svaki fiksni y, varijabla x može
poprimiti bilo koju vrijednost. Ova vrsta (ne)ovisnosti je prikazana na slici 9.1.B: točke
su približno homogeno raspodjeljene po dijelu ( x, y) ravnine.
Izmed̄u ova dva ekstremna primjera se nalazi široko područje pojava koje se nazivaju
KORELACIJE . To su sve one pojave koje nisu vezane strogom funkcijskom vezom, ali
koje nisu niti potpuno nepovezane. U tom smislu može se reći da funkcijska veza
predstavlja savršenu (potpunu) korelaciju, dok nasumična raspodjela točaka odgovara
potpunom izostanku korelacije1 .
Jedan tipičan primjer ovakve vrste veze jeste veza izmed̄u tjelesne visine i tjelesne
mase odabrane dobne skupine ljudi. Jedna ilustracija takve veze je dana tablicom 9.1 i

Tablica 9.1: Visine x u cm i mase y u kg, jedne dobne skupine ljudi. Brojevi unutar tablice
označavaju koliko ljudi iz promatrane skupine ima dane vrijednosti x i y.

y\ x 157.5 161.5 165.5 169.5 173.5 177.5 181.5 185.5 t(y) xy



89 - - - - - - 1 - 1 181.50
84 - - - - 3 1 2 2 8 179.00
79 - - - 1 8 5 3 2 19 176.87
74 - 2 4 10 21 18 12 1 68 174.74
69 - 3 17 42 55 37 11 3 168 173.10
64 3 12 51 72 44 9 3 - 194 169.23
59 10 31 51 40 7 1 - - 140 165.67
54 9 23 13 4 1 - - - 50 162.70

t( x ) 22 71 136 169 139 71 32 8 648


hy x i 57.64 59.07 62.09 64.50 68.46 70.41 72.91 75.88

slikom 9.2. Ljudi se med̄usobno razlikuju i ne postoji matematička formula koja bi nam
omogućila da na temelju visine izračunamo masu osobe ili obratno, da na temelju mase
izračunamo visinu. Za danu visinu, moguće su različite mase (ali ne i previše različite)
i obratno, za danu tjelesnu masu, moguće su različite visine (ali opet, ne previše raz-
ličite). Ako promatranu skupinu ljudi shvatimo kao jedan fizički sustav u kontaktu s
okolinom2 , tada je upravo utjecaj okoline taj koji čini da x nema samo jednu vrijednost,
nego više njih koje fluktuiraju oko nekakve srednje ili najvjerojatnije vrijednosti. Pod
utjecajem okoline u ovom se slučaju misli na lokalne prehrambene navike, socijalni
status, genetske predispozicije i slično.
Slika slična 9.2 bi se dobila i ako se, tijekom odred̄enog vremena od par mjeseci, pro-
matra dolazak autobusa na autobusno stajalište za jednu odred̄enu gradsku liniju. Na
osi x se nanose redni brojevi stajališta (diskretna varijabla), a na os y se nanosi vrijeme
dolaska na stajalište (kontinuirana varijabla). Opet zbog utjecaja okoline (semafori,
rampe, broj putnika na ulazu/izlazu, vremenski uvjeti, ....), autobus neće svaki dan
dolaziti na stanicu u isto vrijeme, nego će postojati odred̄ena raspodjela oko srednjeg ili
najvjerojatnijeg vremena dolaska na stajalište.
1 Vidjeti odjeljak 9.4 o mjerama korelacije: funkcijska veza se dobije kada mjera korelacije ima vrijednost

1, a nasumična raspodjela točaka, kada mjera korelacije ima vrijednost 0


2 engl. thermal bath
421

Slika 9.2: Veza visine x (u cm) i mase y (u kg) jedne skupine ljudi. Brojevi na slici kažu
koliki broj osoba iz promatrane skupine ima dane vrijednosti visine i mase. Slični se
brojevi mogu pridružiti svakoj točki sa slike, ali su radi preglednosti slike izostavljeni.

90

Y = masa u kg
80 1

10
70 42

72

60 40

50

150 160 170 180 190


X = visina u cm

Dakle, u oba ova primjera, a i općenito kod korelacijskih procesa, okolina je ta koja
unosi odred̄enu količinu nereda ili neodred̄enosti u sustav. Primjetimo dvije važne
karakteristike slike 9.2:

• kao što smo već spomenuli, za danu visinu, moguće su različite mase, ali te mase
ne mogu biti proizvoljne - ne postoje osobe visoke 54 cm s tjelesnom masom 300 kg,
kao ni osobe visoke 185.5 cm s tjelesnom masom 40 kg; dakle, za danu visinu, masa
se može mijenjati, ali ne baš posve proizvoljno;
• druga važna osobina korelacijskih pojava se vidi iz brojeva sa slike 9.2 - ti brojevi
kažu koliki broj osoba iz promatrane skupine ima dane vrijednosti visine i mase.
Primjećujemo da je najveći broj osoba koncentriran oko sredine intervala, dok su
jako male i jako velike mase, zastupljene manjim brojem individua, ili drugim
rječima, ako bismo iz promatrane skupine nasumice birali jednu osobu visine
169.5 cm veća je vjerojatnost da bi to bila osoba mase 64 kg, nego osoba mase 79 kg.
422 Poglavlje 9. Teorija korelacija

Ukoliko se broj osoba dane visine i tjelesne mase prikaže na osi z, dobije se slika
9.2. S te slike zaključujemo da za svaku fiksnu visinu (ili fiksnu masu) postoji masa
(ili visina) koja je najzastupljenija i time najvjerojatnija, a sve se druge mase (ili visine)
javljaju u manjem broju, i to utoliko manjem, ukoliko su dalje od ove najveće vrijednosti.

 Primjer 9.1 1D L = 2 P OTTSOV MODEL


Na još jedan primjer koreliranih nasumičnih varijabla se nailazi kada se studira energij-
ski spektar 1D Pottsovog modela s dosegom med̄udjelovanja jednakim L = 2. Model
se sastoji od N čestica, s oznakom Si , od kojih se svaka može nalaziti u jednom od q
mogućih stanja. Potencijalna energija njihovog med̄udjelovanja je dana izrazom (uz
periodičan rubni uvjet)

E p = J1 (δ1,2 + δ2,3 + . . . + δN −1,N + δN,1 )


+ J2 (δ1,3 + δ2,4 + . . . + δN −1,1 + δN,2 ), Ji > 0,
≡ J1 n1 + J2 n2 = E p (n1 , n2 ), (9.1)

gdje su n1 ∈ {0, 1, 2, . . . , N − 1, N } i n2 ∈ {0, 1, 2, . . . , N − 1, N } nasumične varjable koje


označavaju

n1 ≡ δ1,2 + δ2,3 + . . . + δN −1,N + δN,1 ,


n2 ≡ δ1,3 + δ2,4 + . . . + δN −1,1 + δN,2 ,

koliko čestica med̄udjeluje jakošću J1 , a koliko jakošću J2 . Budući da se svaka od N


čestica može nalaziti u jednom od q stanja, ukupan broj konfiguracija je
q q q q
∑ ∑ ... ∑ ∑ = q N.
S1 = 1 S1 = 1 S N −1 = 1 S N = 1

Neke od q N konfiguracija imaju istu energiju E p (n1 , n2 ) iz (9.1). Broj konfiguracija iste
energije se naziva degeneracija energije, N . Tablica 9.2 i srednja od slika 9.3 prikazuju
vrijednosti n1 , n2 i njihovu degeneraciju N za model s N = 10 čestica i q = 3 stanja.
Sve različite vrijednosti energije se nazivaju spektar energije, a ukupan broj različitih
vrijednosti energije se označava s Ns . Primjećuje se da varijable n1 i n2 pokazuju svojstva
koreliranih varijabla: nisu potpuno neovisne jedna o drugoj, ali ne postoji ni stroga funk-
cijska ovisnost koja bi svakoj vrijednosti n1 pridružila jednu točno odred̄enu vrijednost
n2 , nego se jednoj vrijednosti n1 može pridružiti više (ali ne i sve moguće) vrijednosti n2 .
Gornja tablica je prikazana slikom 9.3. Na slici (9.4) se vidi usporedba korelacija n1 i n2

Slika 9.3: Veza n1 i n2 N = 10 i (redom) q = 2, 3, 5, pri čemu su Ns (q = 2) = 14, Ns (q =


3) = 57, Ns (q = 5) = 62 vrijednosti energije.

1 1 1

0.9 0.9 0.9

0.8 0.8 0.8

0.7 0.7 0.7

0.6 0.6 0.6


n 2/ N

n 2/ N

n 2/ N

0.5 0.5 0.5

0.4 0.4 0.4

0.3 0.3 0.3

0.2 0.2 0.2

0.1 0.1 0.1

0 0 0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
n1 / N n1 / N n1 / N

za model s N = 30 čestica i (redom) q = 2, 3 i 5. 


423

Tablica 9.2: Tablica uz primjer 9.1. Vrijednosti u tablici se odnose na model s N = 10


čestica, od kojih se svaka može nalaziti u jednom od q = 3 stanja. Ukupan broj različitih
vrijednosti energije je Ns = 57.

n1 n2 N n1 n2 N n1 n2 N

0 2 30 3 0 100 6 2 150
0 4 150 3 1 600 6 3 200
0 6 120 3 2 1320 6 4 450
0 8 400 3 3 1400 6 5 200
0 10 2 3 4 1100 6 6 220
1 0 20 3 5 400 6 7 20
1 1 40 3 6 120 6 8 20
1 2 140 4 0 130 7 4 100
1 3 400 4 1 560 7 5 120
1 4 500 4 2 960 7 6 20
1 5 400 4 3 1100 8 6 70
1 6 200 4 4 1000 8 8 20
2 0 30 4 5 520 10 10 1
2 1 360 4 6 290
2 2 780 4 7 40
2 3 900 4 8 20
2 4 900 5 0 20
2 5 540 5 1 240
2 6 280 5 2 520
2 7 60 5 3 800
2 8 20 5 4 600
5 5 280
5 6 60

 Primjer 9.2 1D L = 3 P OTTSOV MODEL


Ovaj je primjer sličan prethodnom, s tom razlikom što je sada doseg med̄udjelovanja jed-
nak L = 3. Potencijalna energija med̄udjelovanja je dana izrazom (ponovo uz periodičan
rubni uvjet)

E p = J1 (δ1,2 + δ2,3 + . . . + δN −1,N + δN,1 )


+ J2 (δ1,3 + δ2,4 + . . . + δN −1,1 + δN,2 ),
+ J3 (δ1,4 + δ2,5 + . . . + δN −1,2 + δN,3 ), Ji > 0,
≡ J1 n1 + J2 n2 + J3 n3 = E p (n1 , n2 , n3 ), (9.2)

gdje su n1 , n2 , n3 ∈ {0, 1, 2, . . . , N − 1, N } nasumične varjable koje označavaju

n1 ≡ δ1,2 + δ2,3 + . . . + δN −1,N + δN,1 ,


n2 ≡ δ1,3 + δ2,4 + . . . + δN −1,1 + δN,2 ,
n2 ≡ δ1,4 + δ2,5 + . . . + δN −1,2 + δN,3 ,
424 Poglavlje 9. Teorija korelacija

Slika 9.4: Veza n1 i n2 N = 30 i (redom) q = 2, 3, 5, pri čemu su Ns (q = 2) = 114, Ns (q =


3) =, Ns (q = 5) = vrijednosti energije.

0.9

0.8

0.7

0.6

n 2/ N
0.5

0.4

0.3

0.2

0.1

0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
n1 / N

koliko čestica med̄udjeluje jakošću J1 , J2 ili J3 . Za razliku od prethodnog primjera, sada


se mogu promatrati korelacije izmed̄u n1 i n2 , n2 i n3 kao i izmed̄u n2 i n3 , što je prikazano
na slikama 9.5. 

Slika 9.5: Veza n1 i n2 za model (9.2) i N = 30, L = 3 i q = 2. U modelu se pojavljuju


Ns = 692 različite energije.

1 1 1

0.9 0.9 0.9

0.8 0.8 0.8

0.7 0.7 0.7

0.6 0.6 0.6


n 2/ N

n 3/ N

n 3/ N

0.5 0.5 0.5

0.4 0.4 0.4

0.3 0.3 0.3

0.2 0.2 0.2

0.1 0.1 0.1

0 0 0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
n 1/ N n 1/ N n 2/ N

Naš zadatak u slijedećem odjeljku jeste kvantitativno izraziti kvalitativna opažanja iz


ovog odjeljka.

Zadatak 9.1 Koristeći programski jezik koji želite, generirajte 50 slučajnih točaka
unutar jediničnog kvadrata i nacrtajte sliku sličnu onoj na desnoj strani
slike 9.1. 

Zadatak 9.2 Koristeći programski jezik koji želite, izračunajte vrijednosti koje se
pojavljuju tablici 9.2. 

9.1 Krivulja korelacije i momenti


Promatramo jedan skup dogad̄aja (osnovni skup). Na svakom dogad̄aju uočavamo
nekoliko obilježja. Npr. kod svih stanovnika jedne države i jedne dobne skupine uočimo
dva obilježja: njihovu tjelesnu masu x i visinu y; s t( x, y) se označava broj osoba s danim
vrijednostima x i y.
Ili, kod neke skupine industrijskih proizvoda uočimo tri obilježja: njihovu cijenu x,
zemlju podrijetla y i godinu proizvodnje Z; s t( x, y, z) se označava broj proizvoda s
danim vrijednostima x, y i Z.
Radi jednostavnosti, zadržati ćemo se na primjerima s dva obilježja. Vrijednosti obilježja
x označimo s x, a vrijednosti obilježja y za fiksnu vrijednost x-a ćemo označiti s y x .
9.1 Krivulja korelacije i momenti 425

Težinama (apsolutnim frekvencijama)

t( x, y)

nazivamo broj elemenata osnovnog skupa koji imaju istu vrijednost i obilježja x i
obilježja y (u primjeru iz tablice 9.1 to je broj osoba visine x i mase y). Zbroj težina po
svim mogućim vrijednostima oba obilježja

∑ ∑ t(x, y) = N, (9.3)
x y

daje N, ukupan broj elemenata promatranog osnovnog skupa. Jednostruki zbroj

∑ t ( x y , y ) = t ( y ),
xy

je broj elemenata s fiksnim obilježjem y za sve moguće vrijednosti x, a

∑ t(x, yx ) = t(x)
yx

je broj elemenata s fiksnim obilježjem x za sve moguće vrijednosti y, pri čemu je

∑ t(y) = ∑ t(x) = ∑ ∑ t(x, y) = N.


y x x y

Nanesemo li u pravokutnom koordinatnom sustavu obilježje x na apscisu, a obilježje y


na ordinatu i težine t( x, y) na aplikatu, dobit ćemo skup točaka u TRODIMENZIJSKOM
prostoru koji nam predočava raspodjelu ta dva obilježja skupa (kao npr. slika 9.2). Da
bismo umjesto trodimenzijskog, dobili pregledniji, DVODIMENZIJSKI prikaz oba obilježja
skupa, postupamo ovako: budući da je svakom pojedinom x-u općenito pridruženo
nekoliko y x -eva, mi ćemo ZA FIKSNI x izračunati prosječnu vrijednost (tj. običnu
aritmetičku sredinu) svih y x i označiti ju s hy x i

1
hy x i =
t( x ) ∑ yx t(x, yx ). (9.4)
yx

Vrijednost za npr. hy x=169.5 i za podatke iz tablice 9.1 je

1
hy x=169.5 i = (1 · 79 + 10 · 74 + 42 · 69 + 72 · 64 + 40 · 59 + 4 · 54) = 64.50.
169
Provede li se ovaj postupak za sve x-eve, dobiva se skup točaka

( x, hy x i), (9.5)

čijim se povezivanjem dobiva ravninska krivulju koja se zove KRIVULJA KORELACIJE


(plave točkice na slici 9.6).
Simetrično, i svakom pojedinom y-u općenito je pridruženo nekoliko xy -ova. Za FIKSNI
y
se računa prosječna vrijednost (tj. obična aritmetička sredina) svih xy i označava se s
xy

1
xy = ∑ x y t ( x y , y ). (9.6)


t(y) xy
426 Poglavlje 9. Teorija korelacija

Vrijednost za npr. xy=54 za podatke iz tablice 9.1 je



1
xy=54 = (9 · 157.5 + 23 · 161.5 + 13 · 165.5 + 4 · 169.5 + 1 · 173.5) = 162.7.


50

Provede li se ovaj postupak za sve y, dobiva se skup točaka

xy , y ,



čijim povezivanjem se dobiva dvodimenzijska krivulju koja se takod̄er zove KRIVULJA


KORELACIJE (crvene točkice na slici 9.6).
Proučavanje krivulja korelacije, GLAVNI je zadatak teorije korelacije.
Na slici 9.6 su plavom

bojom označeni parovi vrijednosti ( x, hy x i), a crvenom su bojom
označeni parovi ( xy , y). Proučavanje krivulja korelacije se izvodi momentima. Mo-

Slika 9.6: Plave točke označavaju parove ( x, hy x i), a crvene označavaju parove ( xy , y),

a crtkanim linijama su označeni pravci (9.15) i (9.17).

90
( < X >, < Y > )

80
y

70

60

50
150 160 170 180 190
x

menti se definiraju na isti način kao i ranije, relacijama (3.22) i (3.32), s tom razlikom da
sada umjesto jedne, imamo dvije slučajne varijable i umjesto teorijskih vjerojatnosti ili
gustoća vjerojatnosti, dolaze empirijske frekvencije

t( x, y)
P( x, y) −→
N
1
∑ ∑ P(x, y) −→ N ∑ ∑ t(x, y) = (9.3) = 1.
x y x y
9.2 Linearna korelacija 427

Navodimo modificirane3 definicije momenata x k y l i centralnih momenata M k,l koji



će se kasnije4 koristiti :


D E 1
xk yl =
N ∑ ∑ x k y l t(x, y), (9.7)
x y
1
M k,l =
N ∑ ∑ (x − hxi) k (y − hyi) l t(x, y), (9.8)
x y

pri čemu su
D E 1 1
(9.7) l = 0, xk =
N ∑ ∑ x k t(x, y) = N ∑ x k t(x) ,
x y x
D E 1 1
(9.7) k = 0, yl =
N ∑ ∑ y l t(x, y) = N ∑ y l t(y) .
x y y

Uočimo i varijance

1
(9.8) k = 2, l = 0, M 2,0 ≡ σx2 =
N ∑ ∑ (x − hxi) 2 t(x, y)
x y
1
x 2 − 2x h x i + h x i 2 t( x, y)
 

=
N x y ∑
= x 2 − hxi 2 , (9.9)

(9.8) k = 0, l = 2, M 0,2 ≡ σy2 = y 2 − hyi 2 .



Centralni moment
1
2
(9.8) k = 1, l = 1M1,1 ≡ σxy =
N ∑ ∑ (x − hxi) (y − hyi) t(x, y)
x y

= h xyi − h x i hyi , (9.10)

se naziva KOVARIJANCA (usporediti s (3.67) i (6.52)).


U primjeru iz tablice 9.1 je

1 1
hxi = ∑ x t(x) = 169.901, x2 = ∑ x 2 t(x) = 28 902.2,


648 x 648 x
1 1
∑ y t(y) = 65.2191, ∑ y 2 t(y) = 4 294.64,

2
hyi = y =
648 y 648 y
1
h xyi =
648 ∑ ∑ x y txy = 11 106.00
x y

σx = 5.9875, σy = 6.41163, σxy = 5.02093.

9.2 Linearna korelacija


Pokušajmo naći neku jednostavnu funkciju koja bi opisivala statistička svojstva proma-
tranog skupa. Poslije konstante, najjednostavnija analitička krivulja je svakako pravac
s koeficijentom smjera različitim od nule (primjetimo da je konstanta poseban slučaj
3 Pogledati odjeljak o kumulantima, 6.4.
4 Npr. u relacijama (9.14).
428 Poglavlje 9. Teorija korelacija

Slika 9.7: Ilustracija relacija (9.12), (9.16) i (9.19). Za svaki x postoji više vrijednosti y
(crne točke). Radi preglednosti slike, oznake udaljenosti su navedene za samo dvije
točke.

y
c
r av a
ijs ki p
lac
dx kore

dy d d dy

dx

pravca paralelnog s osi x, tj. s koeficijentom smjera jednakim nuli). Pravac želimo
povući tako da
ZBROJ IZNOSA ODSTUPANJA PRAVCA OD TO ČAKA ( x, y ) BUDE ŠTO MANJI .
Iznose odstupanja ćemo promatrati kroz kvadrate odstupanja, jer se kvadriranjem
eliminira predznak odstupanja. Taj uvjet matematički pišemo tako što tražimo da zbroj
kvadrata udaljenosti d( x, y) od svake točke ( x, y) do zadanog pravca bude minimalan

1
χ2 ≡
N ∑ ∑ d 2 (x, y) t(x, y) = min.
x y

Član t( x, y) na desnoj strani gornjeg izraza daje težinu (težinska funkcija), tj. broji koliko
se točaka iz osnovnog skupa nalazi na udaljenosti d( x, y) od pravca.
Ovaj se postupak može provesti na tri načina ilustrirana na slici 9.7:

d(x, y) ≡ dy može se promatrati udaljenost točke ( x, y) od pravca u smjeru osi y


(to je dy na slici 9.7),

d(x, y) ≡ dx može se promatrati udaljenost točke ( x, y) od pravca u smjeru osi x


(to je d x na slici 9.7),

d(x, y) ≡ d⊥ može se promatrati okomita udaljenost točke ( x, y) od pravca (to je


d⊥ na slici 9.7).

U nastavku će se redom izložiti sva tri ova postupka.

[ dy ]
Mi ćemo, dakle, pokušati svakoj vrijednosti x pridružiti jednu vrijednost y = f ( x ), tako
da x i f ( x ) budu povezane jednadžbom pravca

y ≡ f ( x ) = a0 + a1 x, & dy ≡ y x − y, (9.11)
9.2 Linearna korelacija 429

i da
ZBROJ IZNOSA ODSTUPANJA ORDINATA PRAVCA
OD NIZA VRIJEDNOSTI y x BUDE ŠTO MANJI .
U računu je važna samo udaljenost točke od pravca, a ne i predznak te udaljenosti
(iznad ili ispod pravca). Eliminacija predznaka se može izvesti bilo kvadriranjem,
bilo apsolutnom vrijednošću. Mi ćemo iznose promatrati kroz kvadrate odstupanja,
jer je deriviranje (što će uskoro biti potrebno) kvadratne funkcije je jednostavnije od
deriviranja apsolutne vrijednosti. Uvjet minimalnog iznosa odstupanja matematički se
zapisuje kao

1 1 h i2
χy2 ≡
N ∑ ∑ dy2 t(x, yx ) = N ∑ ∑ yx − f (x) t( x, y x ) = min.
x yx x yx

bude minimalan5 . Ovaj uvjet znači da se traži da zbroj kvadrata udaljenosti označenih s
dy na slici 9.7 bude što manji. Ako se za f ( x ) uvrsti jednadžbu pravca, uvjet minimuma
glasi

1  2
χy2 =
N ∑∑ y x − a0 − a1 x t( x, y x ) = min. (9.12)
x yx

U gornjem su uvjetu koeficijenti a0 i a1 slobodni parametri čije ćemo vrijednosti odabrati


upravo tako da zadovoljimo gornji uvjet. Iz matematičke analize je poznato da je nužan
uvjet ekstrema funkcije više varijabli iščezavanje prvih parcijalnih derivacija. Ali, prve
derivacije po čemu? Čitatelji su vjerojatno navikli da se funkcija zove f i da su njezine
varijable x i y i da se onda po njima derivira. Sada je situacija malo drukčija. Funkcija
čiji ekstrem tražimo se zove χy2 i ona ne ovisi niti o x niti o y x (to su nijeme varijable, po
njima se zbraja i zato nakon izvedenog zbrajanja, χy2 ne može ovisiti o njima). Jedino o
čemu ovisi χy2 jesu koeficijenti a0 i a1 koji odred̄uju pravac

χy2 = χy2 ( a0 , a1 ).

Dakle, nužni uvjeti ekstrema se pišu kao

∂χy2 ∂χy2
χy2 = χy2 ( a0 , a1 ) ⇒ = 0, = 0.
∂a0 ∂a1
To su jednadžbe koje odred̄uju ekstrem. U našem slučaju, iz načina kako je postavljen
problem, znamo da to mora biti minimum (maksimum je nemoguć).

∂χy2 1
∂a0
=0 ⇒
N ∑ ∑ (y x − a 0 − a1 x ) t( x, y x ) = 0,
x yx

∂χy2 1
∂a1
=0 ⇒
N ∑ ∑ x (y x − a 0 − a1 x ) t( x, y x ) = 0.
x yx

Ovo gore je 2 × 2 algebarski sustav za nepoznanice a0 i a1 , koji u oznakama sa strane


427, glasi

hyi − a0 − a1 h x i = 0, h xyi − a0 h x i − a1 x 2 = 0. (9.13)



5 Sličan je postupak već primjenjen u odjeljku 8.4


430 Poglavlje 9. Teorija korelacija

Lako je vidjeti da su rješenja gornjeg sustava dana sa


2
σxy 2
σxy
a0 = h y i − h x i 2
, a1 = (9.14)
σx σx2

(usporediti s (8.37), gdje je svakom x-u bio pridružen samo po jedan y). Time tražena
jednadžba pravca (9.11) glasi

2
σxy
y − hyi = ( x − h x i). (9.15)
σx2

To je pravac koji je najbliži točkama y x u smislu da ima najmanji χy2 . Primjetimo još i da
gornji pravac prolazi točkom

(h x i , hyi).

Za podatke iz tablice 9.1, se dobiva


2
σxy
y − hyi = ( x − h x i), ⇒ y − 65.2191 = 0.703197 ( x − 169.901).
σx2

Ovaj je pravac prikazan na slici 9.6 u plavoj boji.


Pokažimo da je to ujedno i pravac najbliži krivulji korelacije, tj. pokažimo da je

1  2
χ2 =
N ∑ h y x i − a0 − a1 x t( x ) = min.
x

Parcijalnim derivacijama po a0 i a1 slijedi,

∂χ 2 1  
∂a0
=0 ⇒
∑ x t( x )
∑ hy x i − a0 − a1 x t( x ) = hyi − a0 − a1 h x i = 0,
x
∂χ 2 1  
=0 ∑ x hy x i − a0 − a1 x t( x ) = h xyi − a0 h x i − a1 x 2 = 0,



∂a1 ∑ x t( x ) x

a to je opet 2 × 2 sustav kao i (9.13), pa smo time pokazali da je pravac (9.15) najbliži i
krivulji korelacije.

[ dx ]
Gore opisanim postupkom, krenuli smo od fiksnih x i njima pridruženih y x , da bismo
na kraju dobili pravac (9.15). Naravno da u x-evima i y-ima nema ničeg posebnog, tj.
mogli smo krenuti i od nekog fiksnog y i potražiti njemu pridružene xy s odgovarajućim
težinama t( xy , y), a zatim konstruirati pravac

x ≡ g(y) = b0 + b1 y, & d x ≡ xy − x,

sa svojstvom da

ZBROJ IZNOSA ODSTUPANJA APSCISA PRAVCA


OD NIZA VRIJEDNOSTI xy BUDE ŠTO MANJI .
9.2 Linearna korelacija 431

Parametri pravca, b0 i b1 , odred̄uju iz uvjeta da zbroj

1 1  2
χ x2 =
N ∑ ∑ dx2 t(xy , y) = N ∑ ∑ xy − b0 − b1 y t( xy , y) = min. (9.16)
y xy y xy

bude minimalan. Ovaj uvjet znači da se traži da zbroj kvadrata udaljenosti označenih s
d x na slici 9.7 bude što manji. Nužni uvjeti minimuma (tj. ekstrema) jesu iščezavanje
prvih parcijalnih derivacija

∂χ x2 1
∂b0
=0 ⇒
N ∑ ∑ ( xy − b 0 − b1 y) t( xy , y) = 0,
y xy

∂χ x2 1
∂b1
=0 ⇒
N ∑ ∑ y ( xy − b 0 − b1 y) t( xy , y) = 0.
y xy

Ovo gore je 2 × 2 algebarski sustav za nepoznanice b0 i b1 , koji u oznakama sa strane


427, glasi

h x i − b0 − b1 hyi = 0, h xyi − b0 hyi − b1 y 2 = 0.



Rješenja gornjeg sustava su


2
σxy 2
σxy 2 
σxy 
b0 = h x i − hyi 2
, b1 = ⇒ x − hxi = y − hyi ,
σy σy2 σy2

ili, zapisano poput (9.15),

σy2  
y − hyi = 2
x − hxi . (9.17)
σxy

Primjetimo da i ovaj pravac, kao i pravac (9.15), prolazi točkom

(h x i , hyi),

tj. to je točka u kojoj se pravci (9.15) i (9.17) presjecaju.


Za podatke iz tablice 9.1, se dobiva

σy2
y − hyi = 2
( x − h x i), ⇒ y − 65.2191 = 1.63068 ( x − 169.901).
σxy

Ovaj je pravac prikazan na slici 9.6, u crvenoj boji.

[ d⊥ ]
Primjetimo još i da je moguće povući pravac

y = c0 + c1 x, & d⊥ ≡ (y x − y) cos(α), (9.18)

tako da

ZBROJ IZNOSA OKOMITIH ODSTUPANJA PRAVCA


OD NIZA TO ČAKA ( x, y) BUDE ŠTO MANJI .
432 Poglavlje 9. Teorija korelacija

Slika 9.8: Ilustracija relacija (9.12) i (9.16).

 + c1 x
d y = c0
dy

Te su udaljenosti označene s d⊥ na slikama 9.7 i 9.8.


1
2
χ⊥ =
N ∑ ∑ d⊥2 (x, yx ) t(xy , y) = min. (9.19)
y xy

Iz jednadžbe pravca (9.18) i trigonometrije sa slike 9.8, se dobiva


d⊥ d⊥
tan(α) = c1 , cos(α) = = ,
dy y x − c0 − c1 x
što vodi na
( y x − c0 − c1 x ) 2 1 ( y x − c0 − c1 x ) 2
2
d⊥ =
1 + c12
, ⇒ 2
χ⊥ =
N ∑∑ 1 + c12
t( xy , y) = min.
y xy

Nužni uvjeti minimuma (tj. ekstrema) jesu iščezavanje prvih parcijalnih derivacija

∂χ⊥2 ∂χ⊥2
= 0, = 0.
∂c0 ∂c1
To je nelinearni 2 × 2 algebarski sustav za nepoznanice c0 i c1 , koji u oznakama sa strane
427, glasi

hyi − c0 − c1 h x i = 0,
(c12 − 1) h x yi − c0 (c12 − 1) h x i + 2c0 c1 hyi + c1 x 2 − y 2 = c02 c1 .




Rješenja gornjeg sustava su


v
2 − σ2 u σx2 − σy2 2
u !
σx y
c1± = − 2
± t
2
+ 1, c0± = hyi − c1± h x i .
2σxy 2σxy

Time jednadžba dva pravca sa najmanjom okomitom udaljenošću od zadanih točaka


postaje

 
y − hyi = c1± x − h x i . (9.20)
9.2 Linearna korelacija 433

Primjetimo da ako je
 
σx = σy ⇒ c1± = ±1 ⇒ y − hyi = ± x − h x i .

dovršiti... nacrtati dva gornja pravca na sliku 9.6

Zadatak 9.3 Za podatke iz tablice 9.1, treba izračunati korelacijske pravce i koeficijent
korelacije, (9.26). Usporedite koeficijenate korelacije dobivene trima
gornjim postupcima i ustanovite koji je od njih iznosa najbližeg jedinici,
tj. koja je korelacija najbolja. 

Rješenje:
dovršiti
Zadatak 9.4 Osobni dohoci i ukupan prihod neke tvrtke (u milijunima kuna), dani
su tablicom 9.3.
(a) Nacrtajte dijagram (osobni dohoci) - (ukupan prihod),
(b) Izračunajte i nacrtajte (na posebnom dijagramu) obje krivulje korela-
cije,
(c) Izračunajte i nacrtajte (na posebnom dijagramu) pravce korelacije u
odnosu na udaljenosti u smjerovima osi x i y. 

Rješenje:
dovršiti
Zadatak 9.5 Za podatke iz donje tablice, izračunajte pravce korelacije u odnosu na
udaljenosti u smjerovima osi x i y.

x=1 x=2 x=3

y=5 119 6 0
y=6 103 51 1
y=7 10 16 2
y=8 1 5 5
y=9 0 0 2


Rješenje:
dovršiti

y − 5.785 = 0.88 ( x − 1.305),

y − 5.785 = 2.58 ( x − 1.305).

Zadatak 9.6 Donja tablica prikazuje visine očeva x i njihovih najstarijh sinova y
434 Poglavlje 9. Teorija korelacija

Tablica 9.3: Tablica uz zadatak 9.4

godina osobni dohoci ukupan prihod

1956 1.0 4.0


1957 1.3 2.4
1958 1.3 4.7
1959 1.8 3.7
1960 1.5 5.0
1961 1.9 4.7
1962 1.6 5.1
1963 2.7 7.4
1964 2.0 6.1
1965 3.8 8.5
1966 4.5 8.2
1967 4.2 14.9
1968 6.2 12.4
1969 3.8 15.1
1970 4.9 12.2

(izraženih u inčima) u 12 promatranih obitelji.

x = 65 63 67 64 68 62 70 66 68 67 69 71
y = 68 66 68 65 69 66 68 65 71 67 68 70.

(a) Prikažite tablicu u obliku dijagrama.


(b) Izračunajte regresijski pravac y = y( x ).
(c) Izračunajte regresijski pravac x = x (y). 

Rješenje:
dovršiti
Zadatak 9.7 Tablica prikazuje postotak rješenosti na prvom x i drugom y kolokviju
iz Osnova fizičkih mjerenja i statističke analize za destero polaznika/ica.

x = 60 50 80 80 70 60 100 40 90 70
y = 80 70 70 100 50 80 100 60 80 60.

(a) Prikažite tablicu u obliku dijagrama.


(b) Izračunajte regresijski pravac y = y( x ).
(c) Izračunajte regresijski pravac x = x (y). 

Rješenje:
dovršiti
9.3 Nelinearna korelacija 435

Slika 9.9: Uz krivulju nelinearne korelacije (9.21) za K = 2.

Slika 9.10: Različiti primjeri nelinearne ovisnosti y( x ).

9.3 Nelinearna korelacija


Ako se, prema (9.4), nacrta krivulja korelacije ( x, hy x i) i ako ona NE LI ČI na pravac (kao
npr. na slici 9.9), potrebno je potražiti korelacijsku krivulju u obliku općenitijem od
pravca. U pravilu se to radi pomoću polinoma reda K ≥ 2

y = f ( x ) = a0 + a1 x + a2 x 2 + · · · + a K x K , (9.21)

ali se mogu koristiti i drukčije funkcijske ovisnosti, posebice ako fizička pozadina
problema to sugerira. Npr. često se koriste i slijedeće funkcije (za konstantne A i B)

y1 = f 1 ( x ) = A · x B , y3 = f 3 ( x ) = A + B ln( x ),
1
y2 = f 2 ( x ) = A · e B x , y4 = f 4 ( x ) = ,
A + Bx

prikazane na slici 9.10.


Postupak računanja koeficijenata a j iz (9.21) je poopćenje postupka računa koeficijenata
kod linearne korelacije: koeficijenti a j su slobodni parametri i oni se odred̄uju iz zahtjeva
436 Poglavlje 9. Teorija korelacija

da χy2 , zbroj kvadrata odstupanja ordinata korelacijskog polinoma f ( x ) od y x , bude


minimalan6
1 h i2
χy2 ≡ = ∑ ∑
N x yx
y x − f ( x ) t( x, y x ) = min., (9.22)

1  2
N ∑ ∑ 2 K
= y x − a 0 − a 1 x − a 2 x − · · · − a K x t( x, y x ) = min.
x yx

Nužan uvjet minimuma jeste iščezavanje parcijalnih derivacija χy2 po ak :

∂χy2 1  
∂a0
= 0, ⇒
N ∑∑ y x − a0 − a1 x − a2 x 2 − · · · − a K x K t( x, y x ) = 0,
x yx

∂χy2 1  
∂a1
= 0, ⇒
N ∑∑ y x − a0 − a1 x − a2 x 2 − · · · − a K x K x · t( x, y x ) = 0,
x yx
..
. (9.23)
∂χy2 1  
∂a K
= 0, ⇒
N ∑∑ y x − a0 − a1 x − a2 x 2 − · · · − a K x K x K · t( x, y x ) = 0.
x yx

Gornje jednadžbe se mogu preglednije napisati i kao


D E
hyi − a0 − a1 h x i − a2 x 2 − · · · − a K x K = 0,


D E
h xyi − a0 h x i − a1 x 2 − a2 x 3 − · · · − a K x K+1 = 0,


..
. (9.24)
D E D E D E D E D E
x K y − a0 x K − a1 x K +1 − a 2 x K +2 − · · · − a K x K+K = 0.

To je sustav linearnih algebarskih jednadžba, reda (K + 1) × (K + 1), čijim se rješavanjem


dobivaju konstante a0 , a1 , · · · , a K , a time i korelacijski polinom f ( x ) najbliži točkama y x .
Do rješenja se može doći i tako da se gornji sustav napiše u matričnom obliku,

2
K    
1 x x x a y
 
h

2 i
3 · · · 0 h i
 hxi x x · · · x K +1    a1   h x y i 


   
 .. .. .. .. ..   ..   .. ,
=

 . . . . .   .  
. 
xK y

K
K +1
K +2
2K
x x x ··· x aK

a zatim ga se pomnoži s lijeva inverznom matricom



2
K  −1 
a0 1 x x
xK+1 hyi
   
h

2 i
3 · · ·
 a1   hxi x x ··· x   h x yi 
 ..  =  .. .. .. .. ..   .. .
     
. 

.K
K.+1
K.+2 . .
K.
  

2K
aK x x x ··· x x y

Gornji račun omogućava račun svih koeficijenata a0 , a1 , · · · , a K koji minimiziraju zbroj


(9.22).

6I ovdje postoje tri mogućnosti, naveden na stranici 428, od kojih ćemo ovdje obraditi prve dvije.
9.4 Stupanj koreliranosti 437

Pokažimo da je ova krivulja ujedno i najbliža krivulji korelacije hy x i. To ćemo na-


praviti tako što ćemo potražiti uvjet da je ukupno kvadratno odstupanje f ( x ) od hy x i
minimalno
1 h i2
N ∑
2 K
h y x i − a 0 − a 1 x − a 2 x − · · · − a K x t( x ) = min.
x

Isto kao i ranije, gornji izraz parcijalno deriviramo po a j i te derivacije izjednačimo s


nulom
1 h i
N∑
2 K
h y x i − a 0 − a 1 x − a 2 x − · · · − a K x t( x ) = 0,
x
1 h i
N x ∑ hy x i − a0 − a1 x − a2 x 2 − · · · − a K x K x t( x ) = 0,

..
.
1 h i
N∑
2 K
h y x i − a 0 − a 1 x − a 2 x − · · · − a K x x K t( x ) = 0.
x

Nakon zbrajanja, dobijemo isti sustav (9.24) kao i kada smo računali odstupanja f ( x )
od y x ,
D E
h y i − a0 − a1 h x i − a2 x 2 − · · · − a K x K = 0,


D E
h xyi − a0 h x i − a1 x 2 − a2 x 3 − · · · − a K x K+1 = 0,


..
. (9.25)
D E D E D E D E D E
x K y − a0 x K − a1 x K +1 − a 2 x K +2 − · · · − a K x K+K = 0.

Time je pokazano da je korelacijska krivulja f ( x ) = a0 + a1 x + a2 x 2 + · · · + a K x K ujedno


i najbliža korelacijskoj krivulji hy x i.

9.4 Stupanj koreliranosti


Ako su zadana dva ili više osnovnih skupova, poput onih na slici 9.11, može se postaviti
pitanje USPOREDBE stupnja koreliranosti u tim skupovima:
KOJI JE SKUP VIŠE ILI MANJE KORELIRAN U ODNOSU NA NEKI DRUGU SKUP ?
Na primjerima sa slike 9.11 se prostim okom vidi da je lijevi skup koreliraniji od desnog,
no skupovi mogu biti i takvi da se prostim okom ne može odrediti koji je više, a koji
manje koreliran. Zato je potrebno naći i obrazložiti kvantitativnu mjeru stupnja koreli-
ranosti. U nastavku ćemo izložiti tri veličine koje mjere stupanj koreliranosti pojedinog
skupa:

• za linearnu korelaciju, mjera će se zvati KOEFICIJENT korelacije,


• za nelinearnu korelaciju, mjera će se zvati INDEKS korelacije, a za
• usporedbu s krivuljom korelacije, mjera će se zvati OMJER korelacije.

9.4.1 Linearna korelacija - koeficijent korelacije


Ukoliko se korelirani skup uspored̄uje s pravcem, mjera stupnja koreliranosti, naziva
se KOEFICIJENT KORELACIJE ili Pearsonov korelacijski koeficijent, r, koji ćemo sada
438 Poglavlje 9. Teorija korelacija

Slika 9.11: Skupovi s različitim stupnjem korelacije.

y y

x x

definirati i izračunati. U odjeljku 9.2 smo, relacija (9.14), našli koeficijente a0 i a1 koji
zbroj (9.12) čine minimalnim. Vrijednost tog minimalnog zbroja ćemo dobiti tako da a0 i
a1 uvrstimo u zbroj χy2 .
!2
2 2
1  2 1 σxy σxy
χy2 =
N ∑∑ y x − a0 − a1 x t( x, y x ) = (9.14) =
N ∑ ∑ x y − h y i + h x i
σx2

σx2
x t( x, y x )
x yx x yx

 σ2 2 σ2 σ4
" #
1   
xy 2 xy 2 xy
=
N ∑∑ y x − hyi − x − h x i
σx2
t ( x, y x ) = σy
2
− 2σxy 2
σx
+ σ x
σx4
x yx
4
σxy
= σy2 − ≡ σy2 (1 − r 2 ).
σx2
Gornjim izrazom je definiran koeficijent korelacije r

2
σxy
r≡ . (9.26)
σx σy

Budući da je χy2 zbroj pozitivnih brojeva, to je i on sam pozitivan broj, pa mora biti

(1 − r 2 ) ≥ 0 ⇒ −1 ≤ r ≤ +1.
Ako je r = ±1, tada je χy2 = 0 i nema odstupanja pravca korelacije od pravca: svakome
x odgovara jedan y x , tj. POSTOJI STROGA FUNKCIJSKA VEZA (pravac) izmed̄u x i y
r = ±1 ⇒ χy2 = 0 ⇒ y = y ( x ).
U praksi to nikada nije slučaj, nego je uvijek
−1 < r < +1.
Iz gornjeg razmatranja zaključujemo da ŠTO JE r BLIŽI GRANI ČNIM VRIJEDNOSTIMA +1
ILI −1, TO JE KORELACIJA BOLJA. Što je r po svojem iznosu bliži nuli, korelacija je lošija.
Ako je
r=0 ⇒ χy2 = σy2
9.4 Stupanj koreliranosti 439

tj. χy2 je neovisno o x, i NEMA NIKAKVE KORELACIJE izmed̄u x i y. Obično se dobrom


korelacijom smatra ona za koju je |r | ≥ 0.5, a loša je korelacija za koju je |r | < 0.5.
Tako npr. za podatke iz tablice 9.1, koeficijent korelacije iznosi
2
σxy
r= ' 0.656681.
σx σy

K UTEVI :
Proanalizirajmo još i ZNA ČENJE KUTEVA koje pravci korelacije zatvaraju med̄usobno i
sa osima x i y. Iz (9.15) i (9.17) su poznate jednadžbe tih pravaca (iz jedne jednadžbe se
dobije druga, jednostavnom zamjenom x  y)
2 
σxy  σy2  
y − hyi = x − hxi , y − hyi = x − hxi .
σx2 2
σxy
Kao što znamo, koeficijenti smjera pravca su jednaki tangensima kutova koje pravci
zatvaraju s osi x. Neka prvi pravac zatvara kut α, a drugi β
2
σxy σy2
tan(α) = 2
, tan( β) = 2
. (9.27)
σx σxy
Izračunajmo tangens kuta γ = β − α koji MEÐUSOBNO zatvaraju ta dva pravca
tan( β) − tan(α) 1 − r2 σx σy
tan(γ) = tan( β − α) = = (9.27) = · 2 .
1 + tan(α) tan( β) r σx + σy2
Ako je r = 1 (što znači egzaktnu funkcijsku ovisnost), tada je kut
γ = β − α = 0,
tj. oba pravca se poklapaju, IDENTI ČKI SU JEDNAKI. Ako je r = 0 (što znači da nema
korelacije izmed̄u x i y), tada je tan(γ) = ∞, što znači da je kut med̄u pravcima
γ = π/2
i pravci su med̄usobno OKOMITI kada izmed̄u x i y nema korelacije. Budući da je
2
σxy
r= ,
σx σy
2 = 0, što opet prema (9.27) povlači da je i
iz r = 0 i slijedi da je i σxy
π
tan(α) = 0, tan( β) = ∞ ⇒ α = 0, β= .
2
Jedan je pravac paralelan s osi x, a drugi s osi y.
Primjetimo na kraju još i da sam kut γ ne mora biti MJERA za korelaciju, jer on osim o r
ovisi i o σx i σy . Jedino ako su x i y iste dimenzije (ili su bezdimenzijski), kut γ može
poslužiti kao mjera korelacije. Izračunajmo tangense kutova α i β koji pravci zatvaraju s
osi x, kao i tangens kuta γ koji pravci zatvaraju med̄usobno za podatke iz tablice 9.1
2
σxy σy2
tan(α) = = 0.703197, tan( β) = = 1.63068,
σx2 2
σxy
1 − r2 σx σy
tan(γ) = · 2 = 0.432052 ⇒ γ = 23.36680 .
r σx + σy2
440 Poglavlje 9. Teorija korelacija

Zadatak 9.8 Ovaj primjer potječe od botaničara Charliera koji je 1913. godine proma-
trao biljku Trientalis europea, na kojoj je uočio dva obilježja: broj cvjetnih
stapki x i broj latica y. Brojeći navedena obilježja na 321. biljci, došao je
do rezultata prikazanih u tablici (to su težine t( x, y)).

x=1 x=2 x=3 t(y)

y=5 119 6 0 125


y=6 103 51 1 155
y=7 10 16 2 28
y=8 1 5 5 11
y=9 0 0 2 2

t( x ) 233 78 10 N = 321

Treba izračunati korelacijske pravce i koeficijent korelacije. 

Rješenje:
Podaci iz tablice su prikazni slikom 9.12. Gore opisanim postupkom, dobivaju se redom sve
moguće vrijednosti za hy x i
5 · 119 + 6 · 103 + 7 · 10 + 8 · 1
h y x =1 i = = 5.54077,
233
5 · 6 + 6 · 51 + 7 · 16 + 8 · 5
h y x =2 i = = 6.25641,
78
6·1+7·2+8·5+9·2
h y x =3 i = = 7.8,
10
i simetrično za xy

1 · 119 + 2 · 6
x y =5 = = 1.048,

125
1 · 103 + 2 · 51 + 3 · 1
x y =6 = = 1.34194,

155
1 · 10 + 2 · 16 + 3 · 2
x y =7 = = 1.71429,

28
1·1+2·5+3·5
x y =8 = = 2.36364,

11
3·2
x y =9 = =3 .

2
Na slici 9.12 su točke ( x, hy x i) prikazane crvenim kvadratićima, a krivulja korelacije je prikazana
punom crvenom linijom. Varijable
x i y su potpuno ravnopravne, pa se sličnim postupkom
dobiva i druga krivulja korelacije ( xy , y), prikazana ljubičastim na istoj slici.

2
h x i = 1.3053, x = 1.97819, σx = 0.523815,

2
hyi = 5.78505, y = 34.0903, σy = 0.789669,
h xyi = 7.79128, σxy = 0.489953.
Iz gornjih izraza računamo i koeficijent korelacije
r = 0.580345.
9.4 Stupanj koreliranosti 441

(1) U primjeru iz gornje tablice, jednadžba pravca korelacije glasi

y = 4.64306 + 0.87489 x (9.28)

(isprekidana crta boje magenta na slici 9.12).


(2) U primjeru iz gornje tablice, pravac korelacije glasi

y = 2.39433 + 2.59765 x, (9.29)

(isprekidana plava crta na slici 9.12).

Slika 9.12: Primjer računanja krivulje korelacije: crveno je ( x, hy x i), ljubičasto je ( xy , y).

Magenta je pravac (9.28), plavo je pravac (9.29).

10
( < x >, < y > )

9 2

8 1 5 5
yx

7 10 16 2

6 103 51 1

5 119 6

4
0 1 2 3 4
x

Zadatak 9.9 Trideset i šest mjerenja na dvodimenzijskom skupu su dala podatke iz


donje tablice:
(a) Nacrtajte dijagram.
(b) Izračunajte i nacrtajte (na posebnom dijagramu) oba korelacijska
pravca i koeficijent regresije.
(c) Izračunajte i nacrtajte (na posebnom dijagramu) obje korelacijske
parabole.
(c) Izračunajte oba indeksa korelacije.
(d) Koja je korelacija najbolja i zašto? 

Rješenje:
dovršiti
442 Poglavlje 9. Teorija korelacija

y/x 3 4 5 6 7

1 2 1 1 2 3

2 4 2 2 2 2

3 1 3 3 1

4 1 1 2 1

5 1 1

9.4.2 Nelinearna korelacija - indeks korelacije

Potražimo sada veličinu koja će nam opisivati stupanj koreliranosti izmed̄u x i y, kada
su oni povezani nelinearnom vezom, kao u odjeljku 9.3 . Ta se veličina treba svesti
na koeficijent korelacije r (koji smo upoznali kod linearne korelacije), kada su a2 =
a3 = · · · = a K = 0. Pomnožimo jednadžbe (9.23), koje daju uvjete minimuma, redom sa
a0 , a1 , · · · , a K i zbrojimo ih. Dobit ćemo

1
N ∑ ∑ (yx |−a 0 − a1 x − a2 x 2 − · · · − a K x K )( a0 + a1 x + a2 x 2 + · · · + a K x K ) t( x, y x ) = 0,
x yx
{z } | {z }
= − f (x) = f (x)

a to nije ništa drugo nego

1 h i
N ∑∑ y x − f ( x ) f ( x ) t( x, y x ) = 0
x yx
1 1

N ∑ ∑ yx N ∑
f ( x ) t( x, y x ) = ∑ f 2 ( x ) t( x, y x )
x yx x yx

2
hy f i = f . (9.30)

Iz prve od jednadžba minimuma, (9.23), slijedi da je

1
N ∑ ∑ [yx − f (x)] t(x, yx ) = 0
x yx
1 1

N ∑ ∑ yx t(x, yx ) = N ∑ ∑ f ( x ) t( x, y x )
x yx x yx

hyi = h f i . (9.31)
9.4 Stupanj koreliranosti 443

Vidimo da y i f imaju istu prosječnu vrijednost jednaku hyi. Označimo sa


1   
N ∑ ∑ x
σy,2 f = y − h y i f ( x ) − h f i t( x, y x )
x yx
1  
N ∑ ∑ x
= y f ( x ) − y x h f i − f ( x ) h y i + h y i h f i t( x, y x )
x yx

= hy f i − 2 hyi h f i + hyi h f i = hy f i − hyi h f i


= (9.30), (9.31) = f 2 − h f i 2 = σ f2 . (9.32)

Sada provodimo račun posve analogan računu sa str. 438 koji je doveo do izraza za
koeficijent korelacije r: kreće se od zbroja odstupanja točaka y x od funkcije na koju se
radi prilagodba (na str. 438 je to bio pravac, a sada je to polinom)
1 h i2 1 h   i 2
N ∑ ∑ yx − f (x) t(x, yx ) = N ∑ ∑ yx − hyi − f (x) − hyi t(x, yx )
2
χy =
x yx x yx
1 h   i 2
= (9.31) = ∑
N x yx ∑ y x − hyi − f ( x ) − h f i t( x, y x ) = σy2 − 2σy2f + σ f2

σ f2
!
 
= (9.32) = σy − σ f = σy 1 − 2 = σy2 1 − Ryx
2 2 2 2
. (9.33)
σy

σf
Ryx ≡ , (9.34)
σy

je INDEKS KORELACIJE koji mjeri koliko je polinom (9.21) blizu točkama y x . Iz gornjeg
izraza vidimo da je zbroj kvadrata odstupanja y x − f ( x ) utoliko manji ukoliko je Ryx 2

bliži jedinici. Ako je Ryx 2 = 1, tada je χ 2 = 0 i sve točke y leže na polinomu f ( x ) i on


y x
predstavlja EGZAKTNU funkcijsku vezu x i y. Ako je Ryx = 0, zbroj χy2 ovisi samo o vari-
jabli y, tj. izmed̄u x i y nema nikakve korelacije. Sve ostale vrijednosti −1 < Ryx < +1
opisuju veći ili manji stupanj koreliranosti osnovnog skupa.

Umjesto (9.21), na potpuno isti način mogli smo krenuti i od polinoma

x ≡ g(y) = b0 + b1 y + b 2 y 2 + · · · + b K y K

i zbroja
1 h i2
χ x2 =
N ∑∑ xy − g(y) t( xy , y)
y xy

za koji bismo, analognim postupkom kao gore, dobili da je jednak


 
χ x2 = σx2 1 − R xy
2
.

Sada je

σg
R xy ≡ . (9.35)
σx
444 Poglavlje 9. Teorija korelacija

indeks korelacije koji opisuje povezanost x prema y. Općenito je

R xy 6= Ryx .

Primjetimo da za razliku od dva indeksa korelacije, postoji samo jedan koeficijent


korelacije i da je on invarijantanna zamjenu x i y: inverzijom pravca se opet dobije
pravac, ali inverzijom npr. kvadratne funkcije se ne dobije opet kvadratna funkcija.

y = a0 + a1 x ⇒ x = b0 + b1 y,
y = a0 + a1 x + a2 x 2 ; x = b0 + b1 y + b 2 y 2 .

Pokažimo da ako je polinom (9.21), pravac, da je tada Ryx = r. Krenimo od izraza za


2
Ryx

σ f2 1 1 h i2
2
Ryx =
σy2
=
σy2 N ∑∑ f (x) − h f i t( x, y x )
x yx

u koji ćemo uvrstiti (9.21) ograničen na linearnu vezu

f = a0 + a1 x h f i = h a0 + a1 x i = a0 + a1 h x i

i dobiti
1 1 h i2 a12 1  2
2
Ryx =
σy2 N ∑∑ a0 + a1 x − a0 − a1 h x i t( x, y x ) =
σy2 N ∑∑ x − hxi t( x, y x )
x yx x yx
4 4
σx2 σxy σx2 σxy
= a12 = ( 9.14 ) = = = r 2.
σy2 σx4 σy2 σx2 σy2

Zadatak 9.10 Za ilustraciju nelinearne korelacije, navodimo jedan jednostavan pri-


mjer ovisnosti izmed̄u x i y. Donja tablica sadrži težine t( x, y). Zadatak
je izvesti linearnu i kvadratnu korelaciju i izračunati koeficijente i in-
dekse korelacije. Zaključite koja je korelacijska funkcija bolja. 

Rješenje:

y\ x 0 1 2 3

2 0 0 0 2
1 0 1 1 2
0 1 1 0 0

Izračunajmo najprije

∑ ∑ t(x, y) = N = 8, ∑ t(x, y) = t(y), ∑ t(x, y) = t(x),


x y x y
1 1
∑ yx t(x, yx ) = hyx i , ∑ xy t( xy , y) = xy .


t( x ) yx t(y) xy
9.4 Stupanj koreliranosti 445

Npr.

t y =1 = 1 + 1 + 2 = 4
1
hy x=3 i = (2 · 2 + 1 · 2) = 1.5
4
1
xy=1 = (0 · 0 + 1 · 1 + 2 · 1 + 3 · 2) = 2.25.

4
Unesimo gornje vrijednosti u tablicu.

y\ x 0 1 2 3 t(y) xy

2 0 0 0 2 2 3
1 0 1 1 2 4 2.25
0 1 1 0 0 2 0.5

t( x ) 1 2 1 4 8
hy x i 0 0.5 1 1.5

Sada se računaju srednje vrijednosti:


1 1 1
hxi =
N ∑ ∑ x t(x, y) = N ∑ x t(x) = 8 (0 · 1 + 1 · 2 + 2 · 1 + 3 · 4) = 2,
x y x
1 1 1
x2 = ∑ ∑ x 2 t(x, y) = N ∑ x 2 t(x) = 8 (0 2 · 1 + 1 2 · 2 + 2 2 · 1 + 3 2 · 4) = 5.25,


N x y x

1 1 1
hyi =
N ∑ ∑ y t(x, y) = N ∑ y t(y) = 8 (0 · 2 + 1 · 4 + 2 · 2) = 1,
x y y
1 1 1
y2 = ∑ ∑ y 2 t(x, y) = N ∑ y 2 t(y) = 8 (0 2 · 2 + 1 2 · 4 + 2 2 · 2) = 1.5,


N x y y

1
h x yi =
N ∑ ∑ x y t(x, y)
x y

=(0 · 0 · 1 + 0 · 1 · 0 + 0 · 2 · 0
+1·0·1+1·1·1+1·2·0
+2·0·0+2·1·1+2·2·0
1 + 2 + 6 + 12
+ 3 · 0 · 0 + 3 · 1 · 2 + 3 · 2 · 2)/8 = = 2.625.
8

Pomoću gornjih srednjih vrijednosti se računaju standardne devijacije:

σx2 = x 2 − h x i 2 = 5.25 − 4 = 1.25,



σy2 = y 2 − hyi 2 = 1.5 − 1 = 0.5,



2
σxy = h x yi − h x i hyi = 2.625 − 2 = 0.625.
446 Poglavlje 9. Teorija korelacija

Prema (9.15) i (9.17), korelacijski pravci su

2 
σxy 
y − hyi = x − hxi y = 0.5 x,
σx2
σy2  
y − hyi = 2
x − hxi y = 0.8 x − 0.6.
σxy

a prema (9.26), koeficijent korelacije je

2
σxy
r= = 0.790569.
σx σy

Za račun kvadratne korelacije oblika

y = f ( x ) = a0 + a1 x + a2 x 2 ,

potrebno je izračunati i slijedeće srednje vrijednosti

1 1
x3 = ∑ ∑ x 3 t(x, y) = N ∑ x 3 tx = 14.75,


N x y x
D E 1 1
x4 =
N ∑∑ x 4 t( x, y) =
N ∑ x 4 tx = 42.75,
x y x
1
x2 y = ∑ ∑ x 2 y t(x, y) = 7.375.


N x y

Ove srednje vrijednosti vode na slijedeće vrijednosti koeficijenata a j

a0 = 0, a1 = 0.5, a2 = 0,

tako da se kvadratna korelacija svodi na linearnu

y = 0.5 x.

Za račun indeksa korelacije, potrebno je izračunati i



2
1 0.25 x
f = 2
∑ ∑ 2
f ( x ) t( x, y) = ∑ ∑ 2
x t( x, y) = = 1.3125,


N x y N x y 4
σ f2 = f 2 − hyi 2 = 1.3125 − 1 = 0.3125,

što zatim omogućava i račun indeksa korelacije (9.34) koji je u ovom slučaju jednak koeficijentu
korelacije
r
σf 0.3125
Ryx = = = r = 0.790569.
σy 0.5

Za račun one druge korelacijske parabole

x = g(y) = b0 + b1 y + b 2 y 2 ,
9.4 Stupanj koreliranosti 447

potrebno je izračunati i slijedeće srednje vrijednosti

1 1
y3 = ∑ ∑ y 3 t(x, y) = N ∑ y 3 ty = 2.5,


N x y y
D E 1 1
y4 =
N ∑∑ y 4 t( x, y) =
N ∑ y 4 ty = 4.5,
x y y
1
xy 2
∑ ∑ x y 2 t(x, y) = 4.125.


=
N x y

Ove srednje vrijednosti vode na slijedeće vrijednosti koeficijenata a j

b0 = 0.5, b1 = 2.25, b 2 = −0.5,

tako da kvadratna korelacija glasi

x = 0.5 + 2.25 y − 0.5 y 2 .

Za račun indeksa korelacije, potrebno je izračunati i

1
N ∑ ∑ g 2 (x) t(x, y) = ...dovriti,
g2 =


x y

σg = f − h x i 2 = · · · − 4 = ...dovriti,
2

2

što zatim omogućava i račun indeksa korelacije

σg
R xy = = 0.82.
σx

Budući da je ovaj indeks korelacije bliže jedinici nego što su to Ryx i r, zaključak je da je ova
kvadratna korelacija bolja od one prve kvadratane i obje linearne korelacije.

dovršiti dodati crtež(e)

9.4.3 Krivulja korelacije - omjer korelacije


Do sada smo se upoznali s dvije veličine koje mjere stupanj koreliranosti (ili stohas-
tičnosti) nekog skupa: to su koeficijent korelacije r i indeks korelacije Rα,β . U ovom
će odjeljku biti riječi i o trećoj takvoj veličini - omjeru korelacije. Omjer korelacije je
naziv za jednu veličinu koja nam omogućava OCJENU STUPNJA KORELIRANOSTI (ili
stohastičnosti) med̄u veličinama x i y, samo pomoću krivulje korelacije,

( x, hy x i),

a BEZ uvod̄enja korelacijskog pravca, polinoma ili koje druge korelacijske funkcije.
Ideja je u tome da se naprosto računa zbroj kvadrata ODSTUPANJA y x OD KRIVULJE
KORELACIJE hy x i, a ne od polinoma kao u prethodonom odjeljku. Označimo taj zbroj sa
χy0 2 ,

1 h i2
χy0 2 =
N ∑∑ y x − hy x i t( x, y x ). (9.36)
x yx
448 Poglavlje 9. Teorija korelacija

što je ovaj zbroj manji, to su točke y x bliže krivulji korelacije hy x i i korelacija je veća.
Uvedimo jednu pomoćnu veličinu

1 h i2
2
σm,y =
N ∑∑ hy x i − hyi t( x, y x ).
x yx

koja mjeri odstupanja pojedinih hy x i od srednje vrijednosti cijelog skupa hyi. Od ranije
nam je poznata varijanca y

1 h i2
σy2 =
N ∑∑ y x − hyi t( x, y x ).
x yx

Sada možemo kombinirati ove izraze


1 h   i 2
N ∑ ∑
σy2 = y x − h y x i + h y x i − h y i t( x, y x )
x yx
1 h i2 1  2
N ∑ ∑ x N ∑ ∑ x
= y − h y x i t ( x, y x ) + h y i − h y i t( x, y x )
x yx x yx
| {z } | {z }
= χy0 2 = σm,y2

1 h ih i
+ 2 ∑
N x yx ∑ y x − hy x i hy x i − hyi t( x, y x ).

Pokažimo da je ovaj posljednji, mješoviti član, jednak nuli

1 h ih i
N∑ ∑ y x − hy x i hy x i − hyi t( x, y x ) =
x yx
1
y x hy x i − y x hyi − hy x i 2 + hy x i hyi t( x, y x )
h i
N∑x

yx
1 1
∑ ∑ yx hyx i t(x, yx ) −  i2 − hy x i 2 t( x, y x ) +  i2
N ∑∑
= hy hy
N x yx x yx
1 h i 1 h i
=
N ∑ hy x i ∑ y x − hy x i t( x, y x ) =
N ∑ hy x i hy x i − hy x i t( x ) = 0.
x yx x

Vratimo se sada izrazu za σy2 koji postaje

σy2 = χy0 2 + σm,y


2
.

Riješimo li gornju jednakost po χy0 2

2
!
σm,y  
χy0 2 = σy2 1− = σy2 1 − ηyx
2
, (9.37)
σy2

gdje je uvedena oznaka

σm,y
ηyx ≡ . (9.38)
σy
9.4 Stupanj koreliranosti 449

Budući da je χy0 2 zbroj kvadrata, ono je pozitivna veličina, pa mora biti

−1 ≤ ηyx ≤ +1.

Veličina ηyx se naziva OMJER KORELACIJE i, slično kao i koeficijent i indeks korelacije,
mjeri korelaciju izmed̄u y x i x. Korelacija je bolja ako je χy0 2 manje, tj. ako je ηyx po
2 = 1, tada je χ 0 2 = 0 i postoji egzaktna funkcijska veza
iznosu bliži jedinici. Ako je ηyx y
izmed̄u x i y.
Pokažimo da je

χy0 2 ≤ χy2 .

Prema definicijama (9.22) i (9.36) je

1 h i2 1 h i2
χy0 2 =
N ∑∑ y x − hy x i t( x, y x ), χy2 =
N ∑∑ yx − f (x) t( x, y x ).
x yx x yx

Oba gornja izraza su oblika

1 h i2
N ∑∑ yx − ax t( x, y x ) ≡ F ( a x ),
x yx

što shvaćamo kao neku funkciju od a x , koju smo nazvali F ( a x ). Pitamo se: kada je F ( a x )
najmanje (po definiciji, najveće je za a x → ∞)? Iz matematičke analize je poznato da se
uvjet ekstrema funkcije odred̄uje iz

dF ( a x ) 1
da x
=0 = (−2)
N ∑ ∑ (yx − ax ) t(x, yx )
x yx

⇒ hy x i = a x i/ili hyi = h ai .

Dakle, zbroj je najmanji kada je a x = hy x i. U zbroju χy2 je a x = f ( x ) 6= hy x i, pa je zato


χy0 2 ≤ χy2 . Iz ove nejednakosti i relacija (9.33), (9.37)

2
χy2 2
χy0 2
Ry,x =1− , ηyx =1−
σy2 σy2

zaključujemo da je
2 2
ηyx ≥ Ry,x .

To znači da omjer korelacije ne može biti manji od indeksa korelacija (pa time i koefici-
jenta korelacije). Ako je krivulja korelacije pravac, tada je hy x i = f ( x ) i oba zbroja su
isti: χy2 = χy0 2 , pa je i

σy2 (1 − ηyx
2
) = σy2 (1 − r 2 ), ⇒ ηyx = r.
2 − r 2 mjeri koliko korelacijska krivulja odstupa
Spomenimo još na kraju, da razlika ηyx
od pravca.

Zadatak 9.11 

Rješenje:
dovršiti
450 Poglavlje 9. Teorija korelacija

9.5 Višestruka i djelomična korelacija


U prethodnim smo odjeljcima pokazali kako se može tražiti korelacija jedne slučajne
varijable o drugoj. Sada ćemo to proširiti na mogućnost da je jedna slučajna varijabla
korelirana sa dvije ili više drugih slučajnih varijabli. Ovakav tip korelacije se naziva
VIŠESTRUKA KORELACIJA . Npr. može se tražiti korelacija izmed̄u visine jedne osobe
i visine njezinih roditelja (dvostruka korelacija) ili korelacija izmed̄u prinosa neke
poljoprivredne kulture i korištenja gnojiva, sredstava za zaštitu od korova i kukaca,
količine padalina itd. (višestruka korelacija).
Ako znamo da je jedna varijabla korelirana s više drugih varijabla, ali nas iz nekog
razloga zanima ovisnost o samo jednoj od tih nekoliko varijabla (uz eliminaciju utjecaja
ostalih), tada se takva korelacija naziva DJELOMI ČNA KORELACIJA.

Slika 9.13: Korelacija tri nasumične varijable - elipsoid.

9.5.1 Višestruka korelacija


Radi jednostavnosti promatrajmo problem sa tri slučajne varijable

y, x1 , x2 ,

pri čemu ćemo pretpostaviti da je y korelirano sa x1 i x2 . Svakom paru vrijednosti


( x1 , x2 ) pripada nekoliko vrijednosti y. Broj tih različitih vrijednosti, nazivamo težinom
(apsolutnom frekvencijom) i označavamo s

t(y, x1 , x2 ), ∑ ∑ ∑ t(y, x , x ) = N, 1 2
y x1 x2

gdje je N ukupan broj elemenata višestruko koreliranog skupa.


Budući da svakom paru vrijednosti ( x1 , x2 ) pripada nekoliko vrijednosti y, moguće je za
svaki fiksni par ( x1 , x2 ) usrednjiti pripadne y-e i dobiti srednju vrijednost y za dani par
( x1 , x2 )

1
hy x1 ,x2 i =
t ( x1 , x2 ) ∑ y x1 ,x2 · t(y, x1 , x2 ), t ( x1 , x2 ) = ∑ t(y, x1 , x2 ).
y x1 ,x2 y x1 ,x2
9.5 Višestruka i djelomična korelacija 451

Nakon ovog usrednjavanja, svakom paru točaka ( x1 , x2 ) pridružujemo samo jednu točku
hy x1 ,x2 i. Poveže li se skup točaka
 
hy x1 ,x2 i , x1 , x2

ravnim plohama, dobiva se ploha koja se naziva PLOHA KORELACIJE, slika 9.14.
Slika 9.14: Primjer plohe kore- Slika 9.15: Primjer ravnine korelacije.
lacije.

Ova ploha korelacije je izravno poopćenje krivulje korelacije, (9.5) kada se govori o
jednostrukoj korelaciji.

I kao što smo u slučaju jednostruke korelacije umjesto krivulje korelacije, računali
pravac korelacije, tako ćemo sada u slučaju dvostruke korelacije, umjesto plohe korela-
cije računati RAVNINU KORELACIJE, slika 9.15,
y x1 ,x2 = f ( x1 , x2 ) = a0 + a1 x1 + a2 x2 , (9.39)
a koeficijente ravnine a j ćemo odrediti iz uvjeta da odstupanje ravnine od točaka y x1 ,x2
bude minimalno.
1 h i2
N ∑ ∑ ∑ x1 ,x2
χy2 ≡ y − f ( x 1 , x 2 ) t(y, x1 , x2 ) (9.40)
x1 x2 y x1 ,x2

1 h i2
N ∑ ∑ ∑ x1 ,x2 0 1 1 2 2 t(y, x1 , x2 ) = min.
= y − a − a x − a x
x1 x2 y x ,x 1 2

Nužni uvjeti ekstrema su odred̄eni iščezavanjem prvih derivacija χy2 po a j

∂χy2 ∂χy2 ∂χy2


= 0, = 0, = 0.
∂a0 ∂a1 ∂a2
Raspisano
∂χy2 2 h i
∂a0
=
N ∑∑ ∑ y x1 ,x2 − a0 − a1 x1 − a2 x2 (−1) t(y, x1 , x2 ) = 0,
x1 x2 y x1 ,x2

∂χy2 2 h i
∂a1
=
N ∑∑ ∑ y x1 ,x2 − a0 − a1 x1 − a2 x2 (− x1 ) t(y, x1 , x2 ) = 0,
x1 x2 y x1 ,x2

∂χy2 2 h i
∂a2
=
N ∑∑ ∑ y x1 ,x2 − a0 − a1 x1 − a2 x2 (− x2 ) t(y, x1 , x2 ) = 0.
x1 x2 y x1 ,x2
452 Poglavlje 9. Teorija korelacija

Nakon zbrajanja

hyi − a0 − a1 h x1 i − a2 h x2 i = 0,
hy x1 i − a0 h x1 i − a1 x12 − a2 h x1 x2 i = 0, (9.41)

hy x2 i − a0 h x2 i − a1 h x1 x2 i − a2 x22 = 0.

To je sustav linearnih algebarskih jednadžba trećeg reda, čijim se rješavanjem dobivaju


konstante a0 , a1 , a2 , a time i ravnina korelacije najbliža točkama y x1 ,x2 . Do rješenja se
može doći i tako da se gornji sustav napiše u matričnom obliku,

1
h x12i h x2 i a0 hyi
    
 h x1 i x1 h
x1 x 2 i  a1  = hy x1 i,
h x2 i h x1 x2 i x22 a2 h y x2 i

(primjetimo da je matrica realna i simetrična), a zatim ga se pomnoži s lijeva inverznom


matricom i dobiva se
 −1 
a0 1
h x12i h x2 i hyi
   
 a1  =  h x1 i x1 h
x1 x 2 i hy x1 i.
a2 h x2 i h x1 x2 i x22 h y x2 i

Gornji izraz omogućava račun svih koeficijenata a j koji minimiziraju zbroj (9.40). Inver-
tiranjem matrice, dobivaju se koeficijenti a j
   
2 σ2 − σ2 σ2 2 σ2 − σ2 σ2
h x1 i σyx 1 x 2 yx 2 x x
1 2
+ h x 2 i σyx 2 x 1 yx 1 x x
1 2
a0 = h y i − 2 2 4
σx1 σx2 − σx1 x2
2 σ2 − σ2 σ2
σyx 2 σ2 − σ2 σ2
σyx
1 x2 yx2 x1 x2 2 x1 yx1 x1 x2
a1 = a2 = . (9.42)
σx21 σx22 − σx41 x2 σx21 σx22 − σx41 x2

Primjetimo simetrije:
- zamjenom x1  x2 , dolazi do zamjene a1  a2 ;
- zamjenom x1  x2 , koeficijent a0 se ne mijenja.
Ove simetrije znače da je i cijela jednadžba ravnine (9.39) invarijantna na zamjenu
x1  x2 . U gornjim su izrazima korištene (samorazumljive) oznake za varijance
2
σy2 = y 2 − hyi 2 ,
D E

σx2j = x j2 − x j ,

i kovarijance
2
y x y xj , σx21 x2 = h x1 x2 i − h x1 i h x2 i .



σyx j
= j − h i

Izrazi za koeficijente a j se mogu nešto jednostavnije napisati, ako se uvedu koeficijenti


korelacije r ( a, b)
2
σa,b
r ( a, b) = .
σa σb
Tako su npr.
2 2
σyx 1
σyx 2
σx21 x2
r (y, x1 ) = , r (y, x2 ) = , r ( x1 , x2 ) = .
σy σx1 σy σx2 σx1 σx2
9.5 Višestruka i djelomična korelacija 453

Sada su koeficijenti a j jednaki

σy r (y, x2 ) − r (y, x1 ) r ( x1 , x2 )
a2 = ,
σx2 1 − r 2 ( x1 , x2 )
σy r (y, x1 ) − r (y, x2 ) r ( x1 , x2 )
a1 = ,
σx1 1 − r 2 ( x1 , x2 )
a0 = h y i + a1 h x1 i + a2 h x2 i .

Izračunajmo veličinu koja će mjeriti stupanj koreliranosti promatranog skupa. Ta


će veličina biti analogna koeficijentu korelacije koji smo računali u odjeljku 9.2 kod
jednostruke korelacije. U izvodu ćemo slijediti postupak sa strane 438. Uvedimo najprije
pomaknute koordinate

y 0 = y − hyi , x10 = x1 − h x1 i , x20 = x2 − h x2 i ,

I izrazimo ukupno kvadratno odstupanje točaka y x1 ,x2 od ravnine u tim novim koordi-
natama
1 h i2
N ∑ ∑ ∑ x1 ,x2
χy2 ≡ y − f ( x 1 , x 2 ) t(y, x1 , x2 )
x1 x2 y x1 ,x2

1 h i2
N ∑ ∑ ∑
= y x ,x
1 2
− a 0 − a 1 x 1 − a 2 x 2 t(y, x1 , x2 )
x1 x2 y x1 ,x2

1 h i2
= ∑ ∑ ∑
N x1 x2 yx ,x
y x0 1 ,x2 + hyi − a0 − a1 x10 − a1 h x1 i − a2 x20 − a2 h x2 i t(y, x1 , x2 ).
1 2

No, prema prvoj od jednadžba ekstrema (9.41) je

hyi − a0 − a1 h x1 i − a2 h x2 i = 0,

pa u izrazu za χy2 preostaje

1 h i2
χy2 =
N ∑∑ ∑ y x0 1 ,x2 − a1 x10 − a2 x20 t(y, x1 , x2 )
x1 x2 y x1 ,x2

1 h i
=
N ∑∑ ∑ y x0 12,x2 + a12 x10 2 + a22 x20 2 − 2 a1 y x0 1 ,x2 x10 − 2 a2 y x0 1 ,x2 x20 + 2 a1 a2 x10 x20 t(y, x1 , x2 ).
x1 x2 y x1 ,x2

Nakon provedenog zbrajanja, dobiva se

χy2 = σy2 + a12 σx21 + a22 σx22 − 2 a1 x2 σyx


2
1
2
− 2 a2 x2 σyx 2
+ 2 a1 a2 x2 σx21 x2 .

Nakon uvrštavanja realacija (9.42) za a j i sred̄ivanja, gornji izraz postaje

4 σ2 − 2 x σ2 x σ2 x σ2 4 2
σy,x 1 x2 2 yx1 2 yx2 2 x1 x2 + σy,x2 σx1
χy2 = σy2 − .
σx21 σx22 − x2 σx41 x2

Prijelazom s varijabla σi,j na varijable r ( a, b), gornji izraz postaje

r 2 (y, x1 ) − 2r (y, x1 ) r (y, x2 ) r ( x1 , x2 ) + r 2 (y, x2 )


 
χy2 = σy2 1− ≡ σy2 1 − R 2 (y, x1 , x2 ) .
 
2
1 − r ( x1 , x2 )
454 Poglavlje 9. Teorija korelacija

Budući da je χy2 kao zbroj pozitivnih članova i sam pozitivan, to izraz

r 2 (y, x1 ) − 2r (y, x1 ) r (y, x2 ) r ( x1 , x2 ) + r 2 (y, x2 )


R 2 (y, x1 , x2 ) ≡
1 − r 2 ( x1 , x2 )

ne može biti iznosa većeg od 1. Ako je

R(y, x1 , x2 ) = 0,

tada zbroj χy2 ne ovisi o x1 , x2 , tj. nema korelacije izmed̄u y i x1 , x2 . Naprotiv, kada je

R(y, x1 , x2 ) = ± 1,

zbroj kvadratnih odstupanja je nula i sve vrijednosti y leže točno na ravnini i korelacija
je maksimalna (postoji linearna funkcijska veza izmed̄u y i x1 , x2 ).

Zadatak 9.12 dovršiti 

Rješenje:
dovršiti

9.5.2 Djelomična korelacija


... dovršiti ...

9.5.3 Korelacije nenumeričkih osobina


U kontekstu teorije korelacije, nenumeričke osobine (spol, boja kose, boja očiju i sl.) se
tretiraju tako da im se pridruži (manje-više proizvoljna) numerička vrijednost i zatim se
korelacije med̄u njima traže kao korelacije med̄u numeričkim vrijednostima.

primjeri:
spol: ženski (+1), muški (-1) (Isingov model ?);
boja očiju: crna (1), smed̄a (2), plava (3), zelena (4), ostalo (5) (Pottsov model ?):
filmski žanr: drama (1), akcija (2), western (3), romantična komedija (4), ...
književno razdoblje: renesansa (1), prosvjetiteljstvo (2), romantizam (3), realizam (4),
moderna (5), postmoderna (6), ... (Pottsov model ?)

... dovršiti ...


9.5 Višestruka i djelomična korelacija 455

Literatura korištena u ovom poglavlju:

1. Ivo PAVLI Ć.


Statistička teorija i primjena. Panorama, Zagreb, 1965
2. K EN R ILEY , M ICHAEL H OBSON I S TEPHEN B ENCE.
Mathematical Methods for Physics and Engineering. Cambridge Univ. Press, 2006
3. M URRAY R ALPH S PIEGEL I L ARRY J. S TEPHENS.
Theory and problems of Statistics. Schaum’s outline series. McGraw-Hill, 1999
4. V LADIMIR V RANI Ć.
Vjerojatnost i statistika. Tehnička knjiga, Zagreb, 1971
10. Teorija uzoraka

10.1 Osnovni pojmovi


U praksi se pojavljuju problemi slijedećeg tipa:

• Stigla je velika pošiljka robe (brod pun kontejnera) i potrebno je procjeniti udovo-
ljava li pristigla roba odred̄enim standardima. Naravno da je neizvedivo otvarati
svaki pojedini kontejner i pregledati svaki pojedini proizvod. Umjesto toga na-
sumice se odabere nekoliko kontejnera iz kojih se izvadi nekoliko primjeraka
proizvoda i provjerava se samo njihova kakvoća i na temelju toga se zaključuje o
kakvoći cijele pošiljke.

• Treba procjeniti sigurnost automobila u slučaju sudara. To se izvodi tako da se u


automobil stave lutke koje oponašaju putnike, a zatim se simulira sudar i potom
analizira oštećenje na automobilu i ozljede putnika. Ako bi se ovakav test proveo
na svim automobilima iz serije, ništa ne bi ostalo za prodaju. Zato se test izvodi
na manjem broju vozila, a za rezultate se pretpostavlja da vrijede za cijelu seriju.

Na temelju dva gornja primjera, vidimo da će se ovo poglavlje razlikovati od prethodnih
po tome što sada NE ĆEMO ANALIZIRATI SVE elemente osnovnog skupa, nego samo jedan
MANJI DIO elemenata. Razlog je taj što broj elemenata tog polaznog skupa može biti vrlo
velik ili nam nisu dostupni svi elementi tog skupa ili nemamo vremena proanalizirati
svojstva svakog pojedinog elementa ili nešto slično. U tom slučaju se odabiru, relativno
mali dijelovi skupa koji se nazivaju UZORCI. Teorija koja ispituje računske postupke nad
uzorcima, se zove teorija uzoraka ili teorija reprezentativne metode1 . Teoriji uzoraka je
cilj:
• PROCIJENITI SVOJSTVA OSNOVNOG SKUPA , NA TEMELJU SVOJSTVA UZORAKA ,
• PROCIJENITI KOLIKO DOBIVENI REZULTATI ODSTUPAJU OD TO ČNIH VRIJEDNOSTI
OSNOVNOG SKUPA .
Postignuće ovih ciljeva ovisi opet o tome kojim su se postupkom stvarale procjene iz
uzoraka, kao i načinu na koji je dobiven uzorak. Uobičajeno je elemente uzorka odabirati

1 engl: sampling
458 Poglavlje 10. Teorija uzoraka

metodom NASUMI ČNOG ODABIRA, što znači da svaki element osnovnog skupa ima istu
vjerojatnost da bude odabran. Uvedimo nekoliko oznaka:

N je ukupan broj elemenata osnovnog skupa, N  1,


N je broj elemenata u pojedinom uzorku (svi uzorci imaju isti broj elemenata),
Nuz je broj uzoraka.

Krenimo od osnovnog skupa koji ima N elemenata. Na tom skupu se proučava (samo)
jedno diskretno obilježje elementa koje će se označavati s x, a njegove su vrijednosti

x1 , x2 , · · · , x N . (10.1)

Svojstvo obilježja x koje želimo proučiti jeste njegova aritmetička sredina. Sjetimo se
(odjeljak ...) aritmetička sredina je srednja vrijednost nasumične varijable (u ovom
kontekstu ju nazivamo „obilježje”) čija je svaka vrijednost jednako vjerojatna. Ona je
jednaka

x1 + x2 + · · · + x N
hxi = x = . (10.2)
N

To je veličina koju je, u ovom slučaju, vrlo teško ili nemoguće izračunati. Da bi se
ipak došlo do procjene vrijednosti x , postupa se na slijedeći način. Iz osnovnog skupa
se izdvajaju uzorci od po N elemenata. Najveći broj uzoraka koje je uopće moguće
napraviti na opisani način2 je (to su kombinacije bez ponavljanja)

N
 
.
N

Ti će se uzorci označiti kao

(1) x1, 1 , x1, 2 , · · · , x1, N −→ x1 ,


(2) x2, 1 , x2, 2 , · · · , x2, N −→ x2 ,
(3) x3, 1 , x3, 2 , · · · , x3, N −→ x3 ,
..
.
(k) xk, 1 , xk, 2 , · · · , xk, N −→ x k,
..
.

Svaki od gornjih xk, j je neki od elementa (10.1). Aritmetička sredina k-tog uzorka, x k , je
jednaka

xk, 1 + xk, 2 + · · · + xk, N


xk = . (10.3)
N

Naš je zadatak da iz poznavanja x k (koje možemo izračunati), zaključimo ili procjenimo


kolika je vrijednost x (koji ne možemo izračunati).
Kao što je spomenuto, od N elemenata osnovnog skupa (10.1), moguće je napraviti (N N)

2 Najčešće se ne radi sa svim mogućim uzorcima, nego je Nuz << (N


N)
10.1 Osnovni pojmovi 459

uzoraka s N elemenata. Stoga i svih mogućih gornjih aritmetičkih sredina ima točno
(N
N ). Njihova aritmetička sredina (označimo ju s m) jednaka je

x1 + x2 + x3 + ··· N
 
m= ,  N  1. (10.4)
(N N
N)

Prema (10.3), je m jednako

( x1, 1 + x1, 2 + · · · + x1, N ) + ( x2, 1 + x2, 2 + · · · + x2, N ) + · · ·


m=
N (NN)

Pogledajmo sada brojnik gornjeg izraza. Koliko se puta svaki element osnovnog skupa
xi , pojavljuje u brojniku? Ako fiksiramo jedan xi , onda se preostalih N − 1 elemenata
uzorka (koji se nalaze u istoj okrugloj zagradi kao i xi , u brojniku gornjeg izraza) biraju
−1
izmed̄u N − 1 preostalih elemenata osnovnog skupa, može odabrati na (N N −1 ) načina.
Ovakvo razmišljanje vrijedi za svaki xi iz osnovnog skupa i zato je brojnik jednak

N −1
 
( x1 + x2 + · · · + x N ) .
N−1

Uvrstimo to u izraz za aritmetičku sredinu m


−1
(N
N −1 )( x1 + x2 + · · · + xN ) (N − 1)! N!(N − N )! ( x1 + x2 + · · · + xN )
m= =
N (N N ( N − 1)! (N − N )!N !
N)
x1 + x2 + · · · + x N
= ≡ x.
N
To je vrlo važan egzaktan rezultat

m = x. (10.5)

Aritmetička sredina m napravljena od aritmetičkih sredina svih mogućih uzoraka s N


elemenata, egzaktno je jednaka aritmetičkoj sredini x , cijelog (velikog) osnovnog skupa.
Naravno da u praksi nikada neće biti moguće napraviti SVE moguće uzorke od jednog
ogromnog skupa, ali, na osnovi rezultata (10.5), očekujemo (nadamo se, nagad̄amo) da
će i za srazmjerno MALI broj uzoraka,

N
 
Nuz  ,
N

takod̄er aritmetička sredina


x 1 + x 2 + x 3 + · · · + x Nuz
,
Nuz
izračunata od aritmetičkih sredina promatranih uzoraka biti bliska pravoj aritmetičkoj
sredini i da će to biti utoliko točnije, ukoliko je broj uzoraka, Nuz , veći. Koliko će, tako
dobivena vrijednost, biti blizu pravoj aritmetičkoj sredini x , procjenit ćemo pomoću
varijance (prosječnog kvadratanog odstupanja).

VARIJANCA - VIŠE UZORAKA :


460 Poglavlje 10. Teorija uzoraka

Ako za svaki od (N N ) mogućih uzoraka izračunamo njegovu aritmetičku sredinu, mo-


guće je da će neke od tih aritmetičkih sredina biti med̄usobno jednake. Poredamo li
aritmetičke sredine uzoraka po veličini i svakoj od njih pridružimo kao težinu, broj ko-
liko se puta pojavila u svim uzorcima, dobit ćemo RASPODJELU ARITMETI ČKIH SREDINA
UZORAKA . Za tu raspodjelu smo upravo pokazali da ima aritmetičku sredinu jednaku
aritmetičkoj sredini cijelog osnovnog skupa (uzeli smo u račun sve moguće uzorke).
Izračunajmo varijancu σm2 ove raspodjele aritmetičkih sredina svih mogućih uzoraka

(N
N) (N
N)
2
1 1 xk, 1 + xk, 2 + · · · + xk, N

σm2 =
(N
∑ (x k − x ) 2
=
(N
∑ N
−x , (10.6)
N) k =1 N) k =1
(N
N)
11 h i2
= N
(N) N2
∑ ( xk, 1 − x ) + ( xk, 2 − x ) + · · · + ( xk, N − x ) . (10.7)
k =1

Pogledajmo izraz u uglatoj zagradi. Primjetimo opet da su xk,n elementi osnovnog


skupa xi , tako će se kvadriranjem uglate zagrade dobiti dvije vrste članova: nazovimo
ih čisti i miješani

( xi − x ) 2 , 2 ( xi − x )( x j − x ), i 6= j.

Izračunajmo koliko ima čistih članova: u uglatoj zagradi u (10.7), fiksiramo okruglu
zagradu s xi i pitamo se na koliko načina iz N − 1 preostalih elemenata osnovnog skupa
možemo odabrati N − 1 članova u preostalim okruglim zagradama; to je moguće na
−1
(N
N −1 ) načina.
Koliko ima mješanih ( xi − x )( x j − x ) članova? Sada fiksiramo dva različita xi i x j iz
osnovnog skupa i pitamo se na koliko načina iz preostalih N − 2 elemenata osnovnog
skupa, možemo odabrati N − 2 člana u preostalim okruglim zagradama; to je moguće
−2
na (N
N −2 ) načina. Ovim smo razmatranjem zaključili da je

(N
N) h i2
∑ ( xk, 1 − x ) + ( xk, 2 − x ) + · · · + ( xk, N − x ) =
k =1
N  N −1 N
N −1 N −2
  

N−1 ∑ ( xi − x ) 2 + 2 N−2 ∑ ∑ ( x i − x ) ( x j − x ).
i =1 i =1 j = i +1

Time varijanca σm2 raspodjele aritmetičkih sredina uzoraka postaje jednaka

N − 2 N −1 N
" #
1 N −1 N
  

N − 1 i∑ N − 2 i∑ ∑ ( xi − x ) ( x j − x ) .
2 2
σm = ( xi − x ) + 2
N 2 (N ) N =1 =1 j = i +1

Sada dalje analiziramo mješoviti član gornjeg izraza: prema samoj definiciji (10.2),
aritmetičke sredine cijelog osnovnog skupa, je

( x1 − x ) + ( x2 − x ) + · · · + ( xN − x ) = 0.

Kvadriranjem gornje relacije slijedi

( x1 − x ) 2 + ( x2 − x ) 2 + · · · + ( x N − x ) 2
h i
+ 2 ( x1 − x )( x2 − x ) + ( x1 − x )( x3 − x ) + · · · + ( x2 − x )( x3 − x ) + · · · = 0
10.1 Osnovni pojmovi 461

ili, kraće napisano,


N N −1 N
∑ ( xi − x ) 2 + 2 ∑ ∑ ( xi − x )( x j − x ) = 0.
i =1 i =1 j = i +1

Ako mješoviti član iz gornje jednadžbe uvrstimo u izraz za σm2 , dobit ćemo
N N
1 N −1 1 N −2
   
σm2 =
N 2 (N N−1 ∑ ( xi − x ) 2

N 2 (N N−2 ∑ ( xi − x ) 2
N) i =1 N) i =1
N
1 N −2 N −N
 
=
N 2 (N N−2 N−1 ∑ ( xi − x ) 2
N) i =1
N
1 1 N −N
=
N N N −1 ∑ ( xi − x ) 2 .
i =1

U gornjem izrazu se lako uočava prava varijanca (kvadrat standardne devijacije) cijelog
osnovnog skupa
N
1
σ2 =
N ∑ ( xi − x ) 2 . (10.8)
i =1

Tada je, iz gornja dva izraza, varijanca raspodjele aritmetičkih sredina svih mogućih
uzoraka od N članova, jednaka

N −N 1 2
σm2 = σ .
N −1 N
Ako pretpostavimo da je broj elemenata osnovnog skupa N , vrlo velik (svakako puno
veći od N), tada je

N −N σ2
≈1 ⇒ σm2 ≈ ,
N −1 N

σ
σm ≈ √ (10.9)
N

Važnost gornje relacije je u tome što povezuje standardnu devijaciju σm , raspodjele


aritmetičkih sredina UZORAKA sa PRAVOM standardnom devijacijom σ, cijelog velikog
osnovnog skupa. Vidimo da je standardna devijacija dobivena iz uzoraka MANJA od
prave standardne devijacije, i to smanjene je srazmjerno korjenu iz veličine uzorka.
Kasnije, u odjeljku 10.2, ćemo vidjeti da su aritmetičke sredine uzoraka raspodjeljene
po G AUSSOVOJ RASPODJELI. Prema našim ranijim analizama sa str. 235, to znači da sa
95.5% sigurnosti možemo reći da vrijedi3

x k − 2 σm <x < x k + 2 σm ,
σ σ
xk − 2 √ <x < xk + 2 √ . (10.10)
N N
3 Ukoliko imamo više uzoraka, tada u (10.10) umjesto x k dolazi m.
462 Poglavlje 10. Teorija uzoraka

VARIJANCA - JEDAN UZORAK :


Gornji je izraz ipak nedovoljan za praktičnu primjenu, jer zbog nepoznavanja osnovnog
skupa, mi ne znamo ni koliki je σ, definiran kroz (10.8). Zato se postupa na slijedeći
način: uvodi se VARIJANCA k- TOG UZORKA
N
1
σk2 =
N ∑ (xk,n − x k ) 2 . (10.11)
n =1

Primjetimo razliku prema σm : gornji se izraz odnosi na jedan odred̄eni uzorak, dok se
(10.6) odnosi na sve moguće uzorke. Desnu stranu gornjeg izraza znamo izračunati, a
desnu stranu (10.6) ne znamo izračunati budući da ne znamo koliki je x . Osim toga
se uvodi jedna slična veličina sk2 koja se takod̄er odnosi na jedan odred̄eni uzorak, s
tom razlikom u odnosu na σk2 , što se sada promatra odstupanje elemenata uzorka u
odnosu na (nepoznatu) aritmetičku sredinu cijelog osnovnog skupa x (a ne u odnosu
na aritmetičku sredinu uzorka, x k , kao kod σk2 )

N
1
sk2 =
N ∑ (xk,n − x ) 2 .
n =1

Ova veličina sk je definirana tako da u odred̄enom smislu daje PROCJENU varijance


osnovnog skupa σ 2 . Povežimo sada sk i σk

N
1 h i2
sk2 =
N ∑ ( xk,n − x k ) + ( x k − x )
n =1
N N N
1 2 1
=
N ∑ (xk,n − x k ) 2 + N (x k − x ) ∑ (xk,n − x k ) + N (x k − x ) 2 ∑ 1
n =1 n =1 n =1
N
!
1 1 1
= σk2 + 2 (x k − x )
N ∑ xk,n −
N
N xk + (x − x ) 2 N
N k
n =1

= σk2 + 2 ( x k − x ) ( x k − x k ) +( x k − x ) 2 = σk2 + ( x k − x ) 2 . (10.12)


| {z }
=0
Sada se gornji izraz povezuje sa σm . Prema definiciji (10.7) za σm ,

(N
N)
1
σm2 =
(N
∑ (x k − x ) 2 ≈ (x k − x ) 2 za bilo koji indeks k.
N ) k =1

Ova posljednja približna jednakost samo znači da su aritmetičke sredine svih uzoraka
približno jednako različite od prave aritmetičke sredine cijelog uzorka. Stoga se može
reći da je ( x k − x ) 2 u prosjeku jednako σm2 , pa zato relacija (10.12) postaje

σ2
sk2 = σk2 + σm2 = (10.9) = σk2 + . (10.13)
N
Prema polaznoj zamisli, sk je definiran preko x , aritmetičke sredine cijelog skupa, pa bi
zato trebao biti nešto poput imitacije prave σ (one koja se odnosi na cijeli veliki skup).
Zato se izjednačava

σ ←→ sk . (10.14)
10.1 Osnovni pojmovi 463

Kombiniranjem (10.13) i (10.14), dobiva se

sk2 N 1 N
sk2 = σk2 +
N
⇒ sk2 = σ2 =
N−1 k N−1 ∑ (xk,n − x k ) 2 .
n =1

Prepoznamo li u gornjem izrazu


N
1
N ∑ (xk,n − x k ) 2 = xk2 − x k2 ,
n =1

tada se sk može napisati u obliku

N  2
r 
sk = xk − x k2 (10.15)
N−1

(usporedite gornji izraz sa (8.20)). Ovaj sk je procjena standardne devijacije osnovnog


skupa i naziva se još i STANDARDNA GREŠKA. Ona je operativna jer se u cjelosti računa
iz podataka pojedinog uzorka. To je veličina koju se koristi umjesto σ u (10.10).
s s
x k − 2 √k <x < x k + 2 √k . (10.16)
N N
 Primjer 10.1 B ACANJE KOCKE
Evo jednog primjera u kojemu poznajemo egzaktno vrijednosti koje se odnose na
beskonačni skup, tako da ćemo moći usporediti rezultate dobivene pomoću uzorka sa
pravim rezultatima.
Ako se prigodom bacanja jedne kocke okrene ili broj 4 ili broj 5 ili broj 6, onda to
nazivamo dogad̄ajem A. Izvodi se slijedeći pokus: baci se odjednom 12 kocaka i broji
se koliko se puta dogodio A. Taj broj označimo s x. Očito je da x može biti bilo koji
prirodni broj 0 ≤ x ≤ 12. Ovaj pokus se izvede N = 4 096 puta i svaki se puta utvrdi
koliki je x. Rezultat ovakvog prebrojavanja je dan donjom tablicom

x 0 1 2 3 4 5 6 7 8 9 10 11 12
tx 0 7 60 198 430 731 948 847 536 257 71 11 0.

Tako npr. iz gornje tablice očitavamo da se A ostvario 6 puta u 948 od 4 096 bacanja.
Zadatak je pomoću ovih podataka naći ocjenu za x .
Povežimo zadane veličine s oznakama uvedenim u prethodnom izlaganju: broj eleme-
nata osnovnog skupa je beskonačan, pa je N = ∞; veličina uzorka je N = 4 096; varijabla
x je diskretna i ima vrijednosti 0 ≤ x ≤ 12. Zbog relativno jednostavne formulacije
problema, x možemo izračunati egzaktno (bez potrebe posezanja za uzorcima). Kolika
je vjerojatnost da se na jednoj kocki ostvari dogad̄aj A?

1 1 1 1 1
pA = + + = ⇒ qA = 1 − pA = .
6 6 6 2 2

Iz binomne raspodjele, (4.27), znamo da je standardna devijacija σ = 12 p A q A = 3 =
p

1.73205 . . . Kolika je vjerojatnost da se na 12 kocaka A ostvari x puta

12 1 12
   
x 12− x
P( x ) = pA qA = 12 .
x 2 x
464 Poglavlje 10. Teorija uzoraka

Pomoću gornjeg izraza računamo

12 12 12
1 12
 
x= ∑ x P( x ) = ∑ x P( x ) = 12
2 ∑ x
x
x =0 x =1 x =1
12 12
1 12 ! 1 12 · 11 !
=
2 12 ∑ x
x ! (12 − x ) !
= 12
2 ∑ ( x − 1) ! (11 − ( x − 1)) !
x =1 x =1
11
12 11 ! 12
=
2 12 ∑ n ! (11 − n) !
= 12 2 11 = 6.
2
n =0

Dakle, egzaktna srednja vrijednost x je 6. Pogledajmo što dobijemo iz uzorka. Prema


(10.3) je

1 0 · 0 + 1 · 7 + 2 · 60 + . . . + 11 · 11 + 12 · 0
xk =
N ∑ x tx = 4 096
= 6.138916015625000.
x

Slično računamo i

1 0 2 · 0 + 1 2 · 7 + 2 2 · 60 + . . . + 11 2 · 11 + 12 2 · 0
xk2 =
N ∑ x 2 tx =
4 096
= 40.61694335937500,
x

iz čega slijedi

σk2 = xk2 − x k2 = 40.61694335937500 − 6.138916015625000 2 = 2.93065


s
s xk2 − x k2
√k = = 0.0267487.
N N−1

Pomoću gornjih rezultata i (10.16), zaključujemo da se pravi x nalazi u intervalu

6.139 − 2 · 0.0267487 < x < 6.139 − 2 · 0.0267487,


6.08542 < x < 6.19241.

Vidimo da nam rezultat za interval dobiven pomoću uzorka leži izvan egzaktnog
rezultata, x = 6. To je, naravno, posljedica neidealnosti kocaka kojima je izveden pokus.
Uzorak nije uzet iz skupa idealnih kocaka (koji i ne postoji) i zato ne može reproducirati
rezultat koji vrijedi za idealne kocke, ali mu je blizak. 

Zadatak 10.1 Izvršena su 32 mjerenja i dobiveni su slijedeći podaci u sekundama:

0.15, 0.18, 0.14, 0.23, 0.17, 0.11, 0.16, 0.25, 0.10, 0.15, 0.17, 0.16, 0.11, 0.13, 0.16, 0.15
0.21, 0.14, 0.22, 0.15, 0.15, 0.21, 0.12, 0.13, 0.17, 0.20, 0.18, 0.12, 0.16, 0.19, 0.19, 0.18.

- izradite raspodjelu težina,


- izračunajte srednju vrijednost uzorka,
- procjenite srednju vrijednost osnovnog skupa. 

Rješenje:
10.2 Testovi 465

interval težina
0.10 − 0.11 3
0.12 − 0.13 4
0.14 − 0.15 7
0.16 − 0.17 7
0.18 − 0.19 5
0.20 − 0.21 3
0.22 − 0.23 2
0.24 − 0.25 1

Prema (10.3) je

1 0.105 · 3 + 0.125 · 4 + · · · + 0.245 · 1


xk =
N ∑ x tx = 32
= 0.163125.
x

Slično računamo i
1 0.105 2 · 3 + 0.125 2 · 4 + · · · + 0.245 2 · 1
xk2 =
N ∑ x 2 tx = 32
= 0.0278688,
x

iz čega slijedi

σk2 = xk2 − x k2 = 0.00125903,


N s
r
sk = σ 2 = 0.0360506, 2 √k = 0.0127458,
N−1 k N
s s
x k − 2 √k ≤ x ≤ x k + 2 √k
N N
0.150379 ≤ x ≤ 0.175871.

Zadatak 10.2 Na jednoj streljani je gad̄ano u 100 meta. U svaku je ispaljeno 10


metaka. Zabilježen je broj pogodaka u svaku metu:

j = 0 1 2 3 4 5 6 7 8 9 10
t j = 0 2 4 10 22 26 18 12 4 2 0.

S kojom se vjerojatnošću može tvrditi da se broj pogodaka ravna po


binomnoj raspodjeli? 

Rješenje:
dovršiti

10.2 Testovi
Kao što je spomenuto u prethodnom odjeljku, ako se za svaki od (N N ) mogućih uzo-
raka izračuna njegova aritmetička sredina, moguće je da će neke od tih sredina biti
med̄usobno jednake. Poredamo li aritmetičke sredine uzoraka po veličini i svakoj od
njih pridružimo kao težinu, broj koliko se puta pojavila u svim uzorcima, dobit ćemo
RASPODJELU ARITMETI ČKIH SREDINA UZORAKA . Pri tome ćemo opaziti da najveću
466 Poglavlje 10. Teorija uzoraka

težinu imaju oni uzorci čija je artimetička sredina najbliže procjenjenoj aritmetičkoj
sredini cijelog osnovnog skupa. Što je veće odstupanje (bilo ono pozitivno ili negativno)
od aritmetičke sredine cijelog osnovnog skupa, težine su manje. Iz centralnog graničnog
teorema (odjeljak 7.3) slijedi da ova raspodjela aritmetičkih sredina uzoraka, u granici
kada broj uzoraka4 Nuz raste, teži prema G AUSSOVOJ (normalnoj) raspodjeli5 , (4.79),

dP( x ) 1 ( x − h x i) 2
 
ρG ( x ) = = √ exp − .
dx σ 2π 2 σ2

Zaista, ako prema (7.7) nazovemo

x 1 + x 2 + · · · + x Nuz
x uz =
Nuz

(sada su aritmetičke sredine pojedinih uzoraka, x k , med̄usobno nezavisne nasumične


varijable xk iz odjeljka 7.3), tada je varijabla x uz opisana Gaußovom raspodjelom. Pod-
sjetimo još jednom da ovaj rezultat ne ovisi o tome po kojoj su raspodjeli raspodjeljeni
elementi osnovnog skupa.

Pretpostavimo da smo pomoću uzoraka dobili odred̄ene procjene nekih parametara


(obilježja) osnovnog skupa. Sada se pitamo koliko su te procjene pouzdane, tj. kolika
je vjerojatnost da na temelju rezultata dobivenih iz uzoraka, dod̄emo do pogrešnog
zaključka o osobinama cijelog skupa? U tu su svrhu razvijeni postupci koji se opće-
nito nazivaju testovi i od kojih su ovdje obrad̄eni χ 2 test i t test. Oni se zasnivaju
na usporedbi empirijskih sa odgovarajućim teorijskim raspodjelama. Ako se uspije
empirijska raspodjela povezati s odgovarajućom teorijskom raspodjelom, onda je lako
dobiti momente koji su već poznati za teorijske raspodjele.

10.2.1 χ 2 test
U postupku obrade eksperimentalnih ili kakvih sličnih empirijskih podataka, često se
postavlja pitanje

DA LI I KOJOJ TEORIJSKOJ RASPODJELI NAJBOLJE ODGOVARA


NEKA EMPIRIJSKI DOBIVENA RASPODJELA ?

Kako se sličnost izmed̄u empirijske i teorijskih raspodjela ne bi odred̄ivala odoka, razvi-


jene su posebne metode kojima se radi ta usporedba. Te se metode zovu testiranja ili
statistički testovi. Vrlo je koristan χ 2 test koji je postavio Karl Pearson, 1900. godine.
Test se zasniva na nekim svojstvima gama raspodjele (4.96)

dP Γ x n −1 e − x
ρ Γ (n, x ) = = ,
dx Γ(n)

o kojoj je bilo riječi u odjeljku 4.2.4. Pretpostavka da su empirijski podaci raspodjeljeni


po nekoj teorijskoj raspodjeli se zove HIPOTEZA. Naš zadatak u ovom poglavlju jeste
PROVJERITI KOLIKO JE HIPOTEZA ISPRAVNA . Ova se provjera izvodi pomoću empirij-
skih i teorijskih težina.

E MPIRIJSKI :
4a isto tako i broj N elemenata svakog pojedinog uzorka
5 Odjeljak 4.2.2
10.2 Testovi 467

Neka uzorak ima N elemenata koji predstavljaju vrijednosti varijable x. Njihovih N


vrijednosti razvrstamo u M RAZREDA i prebrojimo koliko se elemenata nalazi u pojedi-
emp
nom razredu. Broj elemenata m-tog razreda, tm , nazivamo EMPIRIJSKOM TEŽINOM ili
empirijskom apsolutnom frekvencijom m-tog razreda
emp
tm , m = 1, 2, · · · , M.

Zbroj svih težina mora dati ukupan broj elemenata uzorka, N,

M
emp
∑ tm = N. (10.17)
m =1

To je jedan uvjet koji mora biti uvijek zadovoljen.


T EORIJSKI :
S druge strane, iz pretpostavljene teorijske raspodjele, možemo izračunati koliko ele-
menata iz uzorka od N elemenata se nalazi u m-tom razredu. Taj broj, tmteor , zovemo
TEORIJSKOM TEŽINOM ili teorijskom apsolutnom frekvencijom m-tog razreda. Za konti-
nuirane raspodjele opisane gustoćom ρ( x ), težine tmteor se računaju kao

tmteor
= ρ( xm ) dxm dxm je širina m-tog razreda.
N
Za diskretne raspodjele opisane vjerojatnošću P( x ), težine tmteor se računaju kao

tmteor
= P( xm ) .
N
I za teorijske, kao i za empirijske težine, mora vrijediti da je zbroj svih težina jednak
ukupnom broju svih elemenata uzorka, N,

M
∑ tmteor = N.
m =1

Prilagodba se ne mora nužo izvoditi samo u odnosu na neke već poznate raspodjele,
nego i u odnosu na bilo koju funkciju, f ,

f = f ( x, a0 , a1 , · · · , a L - 1 ),

gdje je x nezavisna varijabla, a a j su parametri prilagodbe (npr. prilagodba na pravac,


f ( x, a0 , a1 ) = a0 + a1 x, jeste prilagodba s L = 2 parametra). Pojedini element uzorka se
može ili nalaziti ili ne nalaziti u m-tom razredu. Teorijska vjerojatnost da se jedan od N
elementa iz uzorka nalazi u m-tom razredu je (broj povoljnih kroz broj svih mogućnosti)

tmteor
pm = ,
N
a vjerojatnost da se ne nalazi u m-tomu razredu je

tmteor
qm = 1 − pm = 1 − .
N
Sada se postavlja slijedeće pitanje:
468 Poglavlje 10. Teorija uzoraka

KOLIKA JE VJEROJATNOST DA SE U m- TOM RAZREDU


emp
NALAZI UPRAVO tm ELEMENATA

kao što je ustanovljeno empirijski?


N
 
emp
Od N elemenata cijelog uzorka, njih tm se može odabrati na
emp različitih načina.
tm
emp emp emp
Vjerojatnost da ih se pojavi tm je ptm , a da ih se istovremeno ne pojavi N − tm je
emp
q N −tm ; sve zajedno to vodi na traženu vjerojatnost oblika binomne raspodjele
tmemp   N −tmemp
N tmteor t teor
 
P(m) = emp 1− m .
tm N N
Na strani 231 je pokazano da će, za veliki N, binomna raspodjela prijeći u G AUSSOVU
raspodjelu oblika (4.71), sa prosječnom vrijednošću (4.24)
h x i = N pm = tmteor .
To će biti i prosječna vrijednost granične Gaußove raspodjele.
emp emp
Težine tm su nasumične varijable, pa je i R AZLIKA tmteor − tm , ZA SVAKI m = 1, 2, · · · , M,
TAKOÐER JEDNA NASUMI ČNA VARIJABLA RASPODJELJENA PO G AUSSOVOJ RASPODJELI
s prosječnom vrijednošću jednakom nuli.
Neka je standardna devijacija svakog pojedinog m-tog razreda jednaka σ(m). Tada zbroj

2
emp

M tm − tmteor
χ2 = ∑ σ 2 (m)
, (10.18)
m =1

mjeri razliku izmed̄u teorijske i empirijske raspodjele, izraženu u standardnoj devijaciji


pojedinog razreda kao jedinici mjere. Izraz
1
σ(m)
se pojavljuje kao težinska funkcija, što je točnost mjerenja veća, manji je σ(m), i težina
pridružena tom članu je veća. Uz vrlo malu pogrešku6 , može se umjesto σ 2 (m) pisati
tmteor , pa je tako
M emp M emp
(tm − tmteor ) 2 (tm ) 2
χ2 ≈ ∑ tmteor
= ∑ tmteor
− N. (10.19)
m =1 m =1

Veličinu označenu zbrojem (10.18) smo već upoznali kod GAMA raspodjele na strani 328.
emp
Teorem 4.2.1 tvrdi da, iako su razlike tmteor − tm raspored̄ene po Gaußovoj raspodjeli,
ZBROJ NJIHOVIH KVADRATA , χ 2 , JE NASUMI ČNA VARIJABLA RASPOREÐENA PO GAMA
emp
RASPODJELI . S obzirom na uvijet (10.17), samo je M − 1 težina tm nezavisno. Ukoliko
funkcija (raspodjela) kojoj se prilagod̄avaju empirijski podaci ovisi o L parametara,
može se pokazati (K. Pearson) da broj stupnjeva slobode k pridružene gama raspodjele
ovisi o broju razreda M i vrsti raspodjele kojoj se prilagod̄avaju empirijski podaci na
način da je
k = ( M − 1) − L. (10.20)
Tako je npr.
6 Fisher, Contributions to Mathematical Statistics, New York, 1950.
10.2 Testovi 469

Slika 10.1: Uz χ 2 test.

Gaußova raspodjela (2 parametra: h x i , σ) k = M − 3,


binomna raspodjela (1 parametar: p) k = M − 2,
Poissonova raspodjela (1 parametar: λ) k = M − 2.

S obzirom na VEZU IZMEÐU χ 2 I GAMA RASPODJELE, relacijom (6.24) je pokazano da je


vjerojatnost da varijabla χ 2 poprimi vrijednost iz intervala (χ 2 , χ 2 + d χ 2 ) dana sa
k/2−1 1 2
2 χ2 e − 2 χ d(χ 2 )
dP (k/2, χ ) = .
2 k/2 Γ(k/2)

Pomoću gornje formule, možemo odgovoriti na pitanje kolika je vjerojatnost da će


χ 2 biti veće od neke zadane vrijednosti, nazovimo ju χα2 . Prema gornjem izrazu za
raspodjelu vjerojatnosti χ 2 , odgovor na gornje pitanje je
Z ∞ Z ∞
1 1
α ≡ P(χ 2 ≥ χα2 ) = dP (k/2, χ 2 ) = k/2
u k/2−1 e − 2 u d u
χα2 2 Γ(k/2) χα2
Z χ2
1 α 1
=1− k/2
u k/2−1 e − 2 u d u .
2 Γ(k/2) 0

To je uvjet da χ 2 bude velik. Ali velik u odnosu na što? Moramo odrediti referentni χα2
s kojim ćemo uspored̄ivati χ 2 iz (10.19). Uobičajeno je referentnu vrijednost χα2 odabrati
tako da vjerojatnost α = P(χ 2 ≥ χα2 ) bude 5 % ili manja (slika 10.1). Dakle, za fiksnu
vrijednost α i definirani broj stupnjeva slobode k, iz tablica 10.1 i 10.2 (na kraju ovog
odjeljka) se očita referentna vrijednost χα2 . Ako je χ 2 < χα2 , tj. ako leži unutar intervala
(0, χα2 ) postavljena hipoteza se prihvaća, teorijska raspodjela dobro opisuje empirijsku.
Ako je χ 2 > χα2 , tj. ako leži u intervalu (χα2 , +∞), postavljena hipoteza se odbacuje.
Hipoteza će biti pogrešno odbačena u 5% slučajeva.
Evo i nekoliko manje ili više jednostavnih primjera.
470 Poglavlje 10. Teorija uzoraka

Slika 10.2: Uz primjer 10.2.

 Primjer 10.2 K OVANICE


Četiri kovanice su bačene N = 160 puta. U svakom bacanju se glava može pojaviti x
puta. Broj pojavljivanja glave x je diskretna nasumična varijabla koja može poprimiti
pet vrijednosti x = 0, 1, 2, 3, 4. Svaki od navedenih x se pojavio redom 17, 52, 54, 31, 6
puta. Ako su kovanice simetrične, postavljamo hipotezu da se pojavljivanje glave kao
i pisma pojavljuje u skladu s binomnom raspodjelom. Binomna raspodjela je dana
jednim parametrom, p koji je za simetrične kovanice jednak 1/2, pa ga ne smatramo
dodatnim uvjetom u smislu relacije (10.20). Broj razreda M = 5, pa je broj stupnjeva
slobode k = M − 1 = 4. Ovaj −1 dolazi zbog uvjeta na težine, (10.17). Odaberimo za
kritičnu vjerojatnost vrijednost α = 0.05. Prema tablici 10.2 je
2 2 2
P(χα,k )=α ⇒ P(χ0.05,4 ) = 0.05 ⇒ χ0.05,4 = 9.488.

Da bismo, prema (10.19) izračunali χ 2 potrebne su nam teorijske težine, t xteor. za x =


0, 1, 2, 3, 4, koje su (radi se o binomnoj raspodjeli s p = q = 0.5) jednake

4 −4 4
   
teor. x 4− x
t x = N · P( x ) = 160 · p q = 160 · 2 = (10, 40, 60, 40, 10)
x x

4 emp
(tm − tmteor ) 2
2
χ ≈ ∑ tmteor
= 12.725
x =0

Dobiveni χ 2 = 12.725 > χ0.05,4


2 = 9.488 (slika 10.2) i zato hipotezu da se radi o binomnoj
raspodjeli moramo odbaciti kao netočnu (s točnošću od 5 % kovanice nisu simetrične). 
 Primjer 10.3 K OCKA
Kocka je bačena 60 puta, pri čemu su se brojevi 1, 2, 3, 4, 5, 6 pojavili (redom) 9, 15, 9, 8, 6, 13
puta. Potrebno je provjeriti hipotezu da je vjerojatnost pojave odred̄enog broja ista za
sve brojeve, tj. da je kocka simetrična. To znači da su teorijske težine jednake 10 za svih
šest brojeva (konstantna raspodjela vjerojatnosti). Broj razreda je M = 6, a budući da
postoji samo jedan uvjet na težine, (10.17), broj stupnjeva slobode k = M − 1 = 5. Za
10.2 Testovi 471

Slika 10.3: Uz primjer 10.3.

kritičnu vjerojatnost odabiremo α = 0.10. Iz tablice 10.2 očitavamo


2 2 2
P(χα,k )=α ⇒ P(χ0.1,5 ) = 0.1 ⇒ χ0.1,5 = 9.236.

Da bismo, prema (10.19) izračunali χ 2 potrebne su nam teorijske težine, koje su kons-
tantne i sve su jednake 10

6 emp
(tm − tmteor ) 2
t xteor. = 10 ⇒ χ2 ≈ ∑ tmteor
= 5.6 .
x =1

Dobiveni χ 2 = 5.6 < χ0.1,5


2 = 9.236 (slika 10.3) i zato hipotezu da se radi o simetričnoj
kocki prihvaćamo (uz pogrešku od 10 %). 

 Primjer 10.4 E TNI ČKE SKUPINE


dovršiti 

 Primjer 10.5 N ASUMI ČNI BROJEVI


dovršiti 

 Primjer 10.6 π
Jesu li znamenke broja pi nasumične? .... dovršiti 

 Primjer 10.7 K ONSTANTNA RASPODJELA


dovršiti 

 Primjer 10.8 E KSPONENCIJALNA RASPODJELA


dovršiti 

 Primjer 10.9 P OISSONOVA RASPODJELA


dovršiti 

 Primjer 10.10 P OISSONOVA RASPODJELA


dovršiti 

Primjer 10.11 G AUSSOVA RASPODJELA


Mjerenjem kapaciteta 485 kondenzatora dobiveni su podaci (izraženi u µF) iz donje
472 Poglavlje 10. Teorija uzoraka
emp
tablice. S Cm su označene vrijednosti kapaciteta, a s tm njihove empirijske težine

Cm 19.60 19.65 19.70 19.75 19.80 19.85 19.90


emp
tm 3 5 5 20 35 74 92

Cm 19.95 20.00 20.05 20.10 20.15 20.20 20.25


emp
tm 83 70 54 27 12 2 3

Koristeći χ 2 test treba provjeriti pretpostavku da su elementi uzorka raspodjeljeni po


Gaußovoj raspodjeli.
Za testiranje će nam trebati teorijske Gaußove težine tG,m pojedinih mjerenja. Njih
računamo pomoću
tG,m
= ρ G (Cm ) d Cm ,
N
gdje je ρ G (Cm ) Gaußova raspodjela

1 1
 
2
ρ G (Cm ) = √ exp − [(Cm − hCm i)/σ] , d Cm = 0.05,
σ 2π 2

(d Cm je širina pojedinog razreda). Sama teorijska težina je tada jednaka

1 1
 
2
tG,m = N d Cm √ exp − [(Cm − hCm i)/σ] .
σ 2π 2

Potrebni momenti se računaju iz empirijskih podatka kao


E 1 N
emp
σ 2 = Cm2 − hCm i 2 = 0.108817 .
D
Cmk = ∑ Cmk tm , hCm i = 19.9329,



N n =1

Gornjom formulom se dobiju rezultati iz trećeg stupca donje tablice i slike.


emp
Cm tm tG,m

19.60 3 0.82534
19.65 5 3.02878 12.8535
19.70 5 8.99938
19.75 20 21.6504 21.6504
19.80 35 42.1723 42.1723
19.85 74 66.5115 66.5115
19.90 92 84.9328 84.9328
19.95 83 87.8138 87.8138
20.00 70 73.5121 73.5121
20.05 54 49.8268 49.8268
20.10 27 27.3449 27.3449
20.15 12 12.1506 12.1506
20.20 2 4.37147 5.64488
20.25 3 1.27341

485 484.414 484.414


10.2 Testovi 473

Za nekoliko najmanjih i najvećih vrijednosti Cm su pripadne težine malene (loša statis-


tika, tj. mali broj dogad̄aja), pa ćemo ih zato sažeti u jednu, kao što je to napravljeno
četvrtom stupcu gornje tablice: prve tri i posljednje dvije vrijednosti smo zbrojili u jednu
emp
tm : 3 + 5 + 5 = 13, tG,m : 0.82534 + 3.02878 + 8.99938 = 12.8535,
emp
tm : 2 + 3 = 5, tG,m : 4.37147 + 1.27341 = 5.64488.

Na slici 10.4 se vidi usporedba empirijskih podataka (plavi kružići) s teorijskim vrijed-
nostima Gaußove raspodjele (crvena crta). Time smo dobili

Slika 10.4 M = 11

razreda iz kojih možemo, prema (10.19) iz-


računati χ 2
M emp
(tG,m − tm ) 2
χ2 = ∑ tG,m
= 5.33193.
m =1

Broj stupnjeva slobode pridružene gama ras-


podjele je

k = M − 3 = 8,

Za kritičnu vjerojatnost odabiremo α = 0.05.


Iz tablice 10.2 očitavamo
2 2 2
P(χα,k )=α ⇒ P(χ0.05,8 ) = 0.05 ⇒ χ0.05,8 = 15.507.

Vrijednost χ 2 = 5.33193 je manja od χ0.05,8


2 = 15.507 i zato (s točnošću od 5 %) prihvaćamo
pretpostavku da je raspodjela Gaußova.
dodati sliku
Provedite prilagodbu istih ovih empirijskih podataka na Poissonovu raspodjelu. Je li ta
prilagodba prihvatljiva? Je li bolja prilagodba na Gaußovu ili Poissonovu raspodjelu?
Zašto? 

 Primjer 10.12 G AUSSOVA RASPODJELA


dovršiti 

 Primjer 10.13 K ONTROLA KVALITETE PROIZVODA


dovršiti 

10.2.2 χ 2 i procjena točnosti prilagodbe


Za ilustraciju prilagodbe ulaznih podataka na neku odabranu funkciju, a ne na neku
već od ranije raspodjelu raspodjelu (npr. one navedene u odjeljku 4), navodimo primjer
prilagodbe na pravac iz odjeljka 8.4.

Ne moraju svi ulazni podaci ( xn , yn ) biti izmjereni s jednakom točnošću. tj. moguće
je da različiti parovi vrijednosti ( xn , yn ) imaju različitu točnost7 opisanu standardnom
devijacijom σn . Naravno da točnijim parovima ( xn , yn ) (onima s manjom vrijednošću σn )
želimo pridati veću važnost (težinu) nego onim parovima s malom točnošću (velikim
7 engl. error bar
474 Poglavlje 10. Teorija uzoraka

σn ). To se postiže tako da se ne traži minimum zbroja kvadratnih odstupanja oblika


(8.29), ili (8.44), nego se, slično relaciji (10.19), traži minimum zbroja

N 2
yn − f ( xn ,~a)

2
χ ≡ ∑ σn
= min. (10.21)
n =1

gdje je f ( xn ,~a) funkcija zadana parametrima ~a. Na taj način je povećan doprinos zbroju
od elemenata s malim σn . Uobičajeno je gornji zbroj zvati8 χ 2 . Uz optimalan odabir
parametara ~a, vrijednosti funkcije f ( xn ,~a) će biti približno jednake yn ± σn , tako da će
χ 2 biti približno jednako N.
Ako se za funkciju f iz gornjeg izraza odabere polinom stupnja M, istim postupkom
koji je doveo do relacija (8.31) i (8.45) dobiva se i

H ~a = ~v,

pri čemu su sada


N i+ j N
xn xni yn
Hi,j = Hj,i = ∑ σn2
, vi = ∑ σn2
, i, j = 0, 1, 2, · · · , M.
n =1 n =1

Rješenja, tj. elementi vektora ~a se opet dobivaju kao (8.33) ili (8.46) i slično za polinome
višeg stupnja

~a = H−1 ~v.

Pretpostavimo da su vrijednosti yn doista, egzaktno (do na gausijanski šum) dane


polinomom f ( xn ,~aexact ). Kao što je pokazano u odjeljku 6.2.3 relacijama (6.23) i (6.24),
vjerojatnost da varijabla χ 2 ima vrijednost iz intervala (χ 2 , χ 2 + dχ 2 ) je jednaka
1  N/2−1 − 1 χ 2
dP ( N/2, χ 2 ) = χ2 e 2 dχ 2 .
2 N/2 Γ( N/2)
Usporedbom gornje raspodjele s gama raspodjelom (4.96)
1
dPΓ (n, x ) = x n−1 e− x dx ,
Γ(n)

vidimo da je χ 2 raspodjeljen po gama raspodjeli stupnja slobode n = N/2, pri čemu je

χ2
x≡ .
2
Relacijom (4.97) je pokazano da je

h x i = n,

što, prevedeno u termine χ 2 , znači da je


 2
χ N
2
= =⇒ χ = N, (10.22)
2 2
8 Izgovara se hi kvadrat.
10.2 Testovi 475

kao što je već pogod̄eno ranije u tekstu. Slično se, pomoću (4.98), računa i varijanca
*  2 +
χ2 N N
 

2
x = n ( n + 1) =⇒ = +1 ,
2 2 2
D  2E
=⇒ χ2 = N ( N + 2),
D  2E
2 2
=⇒ σχ22 = χ 2 − χ = 2N. (10.23)

Gustoća vjerojatnosti je

dP( N/2, χ 2 ) 1 1 2
 
2 2 N/2−1
ρ( N/2, χ ) ≡ exp − χ .

= N/2 χ
dχ 2 2 Γ( N/2) 2

Na slici 10.5 je prikazana raspodjela gustoće vjerojatnosti varijable t ≡ χ 2 /N

Slika 10.5: Gama raspodjela ρ(χ 2 /N ) za nekoliko karakterističnih vrijednosti N.

N N/2 Nt
 
N/2−1
ρ(t) = N/2 t exp − ,
2 Γ( N/2) 2

za nekoliko karakterističnih vrijednosti N. Za N = 2 se dobiva eksponencijalna raspo-


djela iz odjeljka 4.2.10

 λ e−λ t 0 ≤ t < ∞, λ = const. > 0,


ρ(t) =
0, t≤0.

Za N > 2, gornja gustoća iščezava u ishodištu, dok za velike vrijednosti N, u skladu sa


središnjim graničnim teoremom - odjeljak 7.3, prelazi u Gaußovu raspodjelu.

Gornji su rezultati dobiveni uz pretpostavku da su vrijednosti yn doista, egzaktno


(do na gausijanski šum) dane polinomom f ( xn ,~aexact ). Zapravo, to nije slučaj (nego se
radi samo o aproksimaciji), i umjesto pravih, egzaktnih parametara ~aexact , pojavljuju
476 Poglavlje 10. Teorija uzoraka

se parametri ~a dobiveni postupkom minimizacije zbroja (10.21). Pokazuje se da ova


činjenica smanjuje broj stupnjeva slobode raspodjele ρ Γ (χ 2 ) sa N na N − M, gdje je M
broj parametara kojim je zadana funkcija na koju se radi prilagodba (ako je ta funkcija
polinom, onda je M broj za jedan veći od stupnja polinoma).
Ilustrirajmo to na jednostavnom primjeru prilagodbe na pravac

y n = a0 + a1 x n .

Ako svim yn dodamo jednu konstantu, C0 , što se dogad̄a s (10.21)?


N 2
yn + C0 − a0 − a1 xn

χ2 → ∑ σn
.
n =1

Očito se minimum gornjeg izraza neće promjeniti, jer je C0 − a0 ≡ − A0 , neka nova kons-
tanata koju odred̄ujemo iz uvjeta minimuma po A0 (kao što smo to radili minimizirajući
ranije po a0 )
N 2
y n − A0 − a1 x n

2
χ = ∑ σn
.
n =1

Slično, ako se yn promjeni za iznos srazmjeran s xn ,


N 2
yn + C1 xn − a0 − a1 xn

2
χ → ∑ σn
,
n =1

opet se uvjet minimima neće promjeniti, zato jer je C1 − a1 ≡ − A1 , neka nova konstanata
koju odred̄ujemo iz uvjeta minimuma po A1 (kao što smo to radili minimizirajući ranije
po a1 )
N 2
y n − a0 − A1 x n

2
χ = ∑ σn
.
n =1

Dakle, svaka promjena u yn koja je OKOMITA na promjene oblika

δ yn = C0 , δ yn = Cn xn ,

će izazvati promjenu vrijednosti χ 2 u postupku minimizacije. Takvih okomitih promjena


očito ima

N − 2 = ( N − M ) M =2 .

Poopći li se gornji jednostavan primjer na opći slučaj, može se reći da minimizacija


zbroja χ 2 eliminira samo dio gausijanskog šuma (ovisno o tome koliko ima parametara
funkcija na koju se izvodi prilagodba), dok ostali stupnjevi slobode ostaju slobodni.
Zato je nasumična varijabla χ 2 opisana gama raspodjelom sa

k=N−M

stupnjeva slobode

1 1 2
 
2
k
2 2 −1
ρ(k, χ ) = k/2 χ exp − χ .
2 Γ(k/2) 2
10.2 Testovi 477

Prema (10.22) i (10.23) je



χ 2 = k, 2k.


σχ 2 =

Na kraju, kada su izračunati parametri prilagodbe i kada su procjenjene njihove po-


greške, ostaje još procjeniti koliko primjenjena krivulja (funkcija) dobro ili loše opisuje
ulazne vrijednosti ( xn , yn ). To se izvodi na isti način kao i u odjeljku 10.2.1. Uvodi se
veličina nazvana DOBROTA PARAMETARA PRILAGODBE, α, koja se definira kao vjero-
jatnost da nasumično odabrana vrijednost varijable χ 2 ima vrijednost jednaku ili veću
od vrijednosti dobivene iz uvjeta (10.21). Geometrijski, to je površina ispod krivulje
ρ Γ (k, χ 2 ) DESNO od vrijednosti χ 2 dobivene iz uvjeta (10.21).
Z +∞ Z +∞
1 k 1 1 k
α= z 2 −1 e− 2 z dz = t 2 −1 e−t dt .
2k/2 Γ(k/2) χ2 Γ(k/2) χ 2 /2

Gornji se izraz može izraziti preko gama funkcije Γ(n), (4.91), i nepotpune gama funkcije,
Γ( x, n), (4.95),
Z +∞ Z x
k 1 k
Γ(k/2) = t 2 −1 e −t
dt , Γ(k/2, x ) = t 2 −1 e−t dt ,
0 Γ(k/2) 0

tako da je

α = 1 − Γ(k/2, χ 2 /2).

Očekuje se da će χ 2 biti negdje u intervalu

χ 2 − σχ 2 < χ 2 < χ 2 + σχ 2 .


Ako je

χ 2 < χ 2 − σχ 2 = k − 2k,

α će biti blizu jedinice i funkcija f je jako dobra prilagodba mjerenim podacima. Ako je

χ 2  χ 2 + σχ 2 = k + 2k,

α će biti blizu nule i mala je vjerojatnost da su mjerene točke opisane funkcijom f .

O raspodjeli χ 2 se govori i u odjeljku 10.2.1.

Zadatak 10.3 dovršiti 

Rješenje:
dovršiti

Zadatak 10.4 dovršiti 

Rješenje:
dovršiti
478 Poglavlje 10. Teorija uzoraka

10.2.3 Studentova t-raspodjela i t-test


Do ovoga je testa došao 1908. godine William Sealy Gosset u radu kojega je objavio pod
pseudonimom Student. Po tome je i test dobio naziv Studentov test. Kao što je χ 2 test
baziran na gama raspodjeli, tako je i t-test baziran na t-raspodjeli, koja je izložena u
odjeljku 4.2.9.

Krenimo od (velikog) osnovnog skupa čiji su elementi raspodjeljeni po Gaußovoj raspo-


djeli sa aritmetičkom sredinom x i standardnom devijacijom σ i iz tog osnovnog skupa
izvadimo sve moguće uzorke od N elemenata, s aritmetičkim sredinama x n . Kao što
smo pokazali u odjeljku 10.2, x n je raspodjeljeno po Gaußovoj raspodjeli oko prosječne
vrijednosti x . Iz toga zaključujemo da je i varijabla x n − x raspodjeljeno po Gaußovoj

raspodjeli sa prosječnom vrijednošću nula i standardnom devijacijom jednakom σ/ N.
Stoga, ako se napravi varijabla

xn − x
√ ,
σ/ N

ona će biti raspodjeljena po Gaußovoj raspodjeli sa prosječnom vrijednošću nula i


jediničnom standardnom devijacijom. U gornjoj relaciji se x i σ odnose na cijeli skup, i
stoga su nam nepoznati. Ako umjesto te varijable, napravimo novu varijablu t koja će
oponašati gornju varijablu
√ xn − x 1
t= N
sn
, sn2 =
N−1 ∑ (xn,k − x n ) 2 , (10.24)
k

gdje se sn iz (10.15) u cjelosti računa pomoću veličina iz uzorka, tada će varijabla t biti
raspodjeljena po t-raspodjeli (4.104). Dokažimo slijedeći

Teorem 10.2.1 Ako je varijabla z opisana Gaußovom raspodjelom (hzi = 0, σz2 = 1), a
varijabla v gama raspodjelom sa stupnjem slobode k, tada je varijabla
z
t= √ (10.25)
v/k
raspodjeljena po Studentovoj t-raspodjeli sa stupnjem slobode k.

Od ranije su nam poznate Gaußova i gama raspodjele

1 1 2 1 k −2 1
ρ G (z) = √ e− 2 z , ρ Γ (k/2, v) = k
  v 2 e− 2 v ,
2π 2 Γ 2k
2

pa je prema tome

1 k −2 1 2
ρ(z, v) ≡ ρ G (z)ρ Γ (k/2, v) = √ k
 v 2 e− 2 ( v + z ) .
k
2π 2 Γ 2
2

Radi kraćeg pisanja uvedimo pokratu

1
c= √ k
 ,
k
2π2 2 Γ 2
10.2 Testovi 479

i prijed̄imo s varijable z na varijablu t, držeći pri tome v = const.


z
t= √ .
v/k

Prema (3.53) možemo pisati

dz c h v
i
ρ(t, v) = ρ(z, v) ⇒ ρ(t, v) = √ v (k−1)/2 exp − (k + t 2 ) .
dt k 2k

Samu raspodjelu po t dobijemo tako što ćemo ρ(t, v) prointegrirati po svim dozvoljenim
vrijednostima v
Z ∞ Z ∞
c h v i
ρt (t) = ρ(t, v) dv = √ v (k−1)/2 exp − (k + t 2 ) dv .
0 k 0 2k

Integral računamo u novoj varijabli


v
x= (k + t 2 )
2k
u kojoj je
 (k+1)/2 Z ∞  (k+1)/2 
c 2k c 2k k+1
  
(k−1)/2 − x
ρ(t) = √ x e dv = √ Γ
k k + t2 0 k k + t2 2
 
Γ k+2 1  t2
−(k+1)/2
=√   1+ ,
kπ Γ 2k k

što na koncu prepoznajemo kao t-raspodjelu, čime je teorem i dokazan.

Pomoću funkcije ρ(t) računa se vjerojatnost P da t bude veći od neke zadane vrijednosti

Z ∞
P= ρ(t) dt .
t

 Primjer 10.14 S VRDLA


Standardom je propisano da svrdlo ima tvrdoću 60 RC (60 jedinica na Rockwelovoj skali
C). Na uzorku od osam svrdala, dobivena je srednja vrijednost 59.2 RC i standardna
devijacija 0.5 RC . Ima li serija svrdala iz koje je uzet ovaj uzorak prosječnu tvrdoću
60 RC ? Pretpostavlja se da tvrdoća svrdala slijedi Gaußovu raspodjelu.
Označimo tvrdoću svrdla s x. Uzorak se sastoji od N = 8 elemenata, a srednja vrijednost
x u uzorku je x k = 59.2 RC i standardna devijacija σk = 0.5 RC . Prema (10.11) i (10.15) je

N 8
1 1
σk2 =
N ∑ ( xk,n − x k ) 2 =
8 ∑ (xk,n − 59.2 RC ) 2 = 0.25 RC2 ,
n =1 n =1
N
1 N
sk2 =
N−1 ∑ (xk,n − x k ) 2 = N − 1 σk2 = 0.28571 RC2 .
n =1
480 Poglavlje 10. Teorija uzoraka

Prema pretpostavci zadatka, srednja vrijednost cijelog skupa je x = 60, pa varijabla t iz


(10.24) ima vrijednost
√ xk − x

|t| = N = 4.233202 · · · .
sk

Za uzorak od N elemenata, stupanj slobode t raspodjele je N − 1, pa zato iz tablice 6 na


str 383. u PAVLI Ć, Statistička teorija i primjena, čitamo da je P(t = 3.499) = 0.01, a da je
P(t = 5.405) = 0.001. Iz toga zaključujemo da je

0.001 < P(t = 4.23 · · · ) < 0.01,

što je manje od granice od 5 % i zato zaključujemo da prosječna tvrdoća svrdala nije


60 RC . 

 Primjer 10.15 Č OKOLADE

Mjerenjem mase 20 čokoladnih tabli, dobiveni su slijedeći rezultati (u gramima)

97 99 98 96 98 101 98 95 97 99

98 96 97 98 98 100 99 97 101 98

Pretpostavimo da su mase raspodjeljene po Gaußovoj raspodjeli. Smije li se na temelju


gornjeg uzorka tvrditi da je prosječna masa čokoladnih tabli osnovnog skupa iz kojeg je
uzet uzorak, manja od 100 g?
Procjenu ćemo izvesti t testom. Izračunajmo potrebne veličine: broj elementa uzorka
je N = 20, pretpostavljena vrijednost aritmetičke sredine cijelog skupa je x = 100 (sve
računamo u gramima, pa ćemo zato tu oznaku dalje izostavljati), aritmetička sredina
uzorka je

1
x= (97 + 99 + 98 + · · · + 98) = 98,
20
N
1 1
sk2 = ∑
N − 1 n =1
( xk,n − x k ) 2 =
19
[(−1) 2 + 1 2 + 0 2 + · · · ] = 2.421.

Pomoću ovih veličina računamo t


√ x k − x √
= 20 2 = 5.770.

|t| = N
sk 1.55

Za uzorak od N = 20 elemenata, stupanj slobode t raspodjele je N − 1 = 19, pa zato iz


tablice 6 na str 383. u PAVLI Ć, Statistička teorija i primjena, čitamo da je P(t = 5.770) <
0.001. Iz toga zaključujemo da je pretpostavka x = 100 pogrešna. Dakle, x nije 100.
Kada znamo koliki x nije, pokušajmo procijeniti koliki jeste. Da bi vjerojatnost P imala
graničnu vrijednost od 5 %, prema tablici 6 na str 383. u PAVLI Ć, Statistička teorija i
primjena, mora biti t = 2.093, što vodi na x = 99. 

10.2.4 Fisherov i F-test


dovršiti

10.2.5 Točnost LSA


dovršiti
10.2 Testovi 481

Tablica 10.1: Uz χ 2 test.


482 Poglavlje 10. Teorija uzoraka

Tablica 10.2: Uz χ 2 test.


10.2 Testovi 483

Literatura korištena u ovom poglavlju:

1. G. B. A RFKEN I H. J. W EBER.
Mathematical Methods for Physicists. Academic Press, San Diego, 1995
2. V ERA Č ULJAK.
Vjerojatnost i statistika. 2011. URL: www.grad.hr/vera/webnastava/vjerojatnostistatistika/
vis-pdf.pdf
3. N EVEN E LEZOVI Ć.
Vjerojatnost i statistika 3 - matematička statistika i stohastički procesi. Element, Zagreb,
2007
4. B ORIVOJ M ATI Ć.
Praktikum iz statistike. Ekonomski fakultet, Osijek, 1974
5. Ivo PAVLI Ć.
Statistička teorija i primjena. Panorama, Zagreb, 1965
6. M IROSLAV P OŽEK.
Osnove teorije vjerojatnosti i matematičke statistike. 2003. URL: https://www.scribd.
com / document / 56377048 / Osnove - teorije - vjerojatnosti - i - matematicke -
statistike
7. K EN R ILEY , M ICHAEL H OBSON I S TEPHEN B ENCE.
Mathematical Methods for Physics and Engineering. Cambridge Univ. Press, 2006
8. M URRAY R ALPH S PIEGEL I L ARRY J. S TEPHENS.
Theory and problems of Statistics. Schaum’s outline series. McGraw-Hill, 1999
9. V LADIMIR V RANI Ć.
Vjerojatnost i statistika. Tehnička knjiga, Zagreb, 1971
10. P ETER Y OUNG. „
Everything you wanted to know about Data Analysis and Fitting but were afraid
to ask”. (2012). URL: https://arxiv.org/abs/1210.3781
11. Procjene

11.1 Nepristrane procjene


treba dovršiti

Neka je vjerojatnost pojave kontinuirane nasumične varijable X dana gustoćom vje-


rojatnosti ρ( x ). U izrazu za gustoću vjerojatnosti se, osim same varijable x, pojavlju i
parametri, koje ćemo općenito označiti s θ j . Tako npr. u Poissonovoj raspodjeli (odjeljak
4.1.6) postoji samo jedna parametar θ ≡ λ jednak srednjoj vrijednosti; u Gaussovoj ras-
podjeli (odjeljak 4.2.2) postoje dva parametra: srednja vrijednost θ1 ≡ h x i i standardna
devijacija θ2 ≡ σ, itd. U praksi najčešće NISU POZNATE točne vrijednosti parametra koji
opisuju raspodjelu i zato je potrebno naći zgodan način da se PROCIJENI vrijednost tih
parametara. Ovu procjenu (pravih, ali nepoznatih) parametra θ j ćemo izvoditi jednom
nasumičnom varijablom koju ćemo označiti s Θ j
Θ j = Θ j ( x1 , x2 , . . . , xN ), j = 1, 2, · · ·
definiranom na uzorku xn duljine N. Za Θ se kaže da NEPRISTRANO procjenjuje pravi
parametar θ, ako je očekivanje od Θ upravo jednako pravom parametru θ

hΘi = θ. (11.1)

Ako je Θ nepristrani procjenjitelj, tada je i

σΘ2 = Θ 2 − hΘi 2 .

Evo jednog jednostavnog primjera: promatra se osnovni skup sa (nepoznatom) sred-


njom vrijednošću h x i; treba pokazati da je srednja vrijednost k-tog uzorka ( x1 , x2 , · · · , xN )k
nepristarni procjenitelj vrijednosti h x i
N
1
Θ ≡ xk =
N ∑ xn,k ,
n =1
N N N
* +
1 1 1
hx k i =
N ∑ xn,k =
N ∑ h xn,k i =
N ∑ hxi = hxi .
n =1 n =1 n =1
486 Poglavlje 11. Procjene

Time je pokazano da je aritmetička sredina uzorka, nepristrani procjenitelj od h x i.


Potražimo varijablu Θ koja nepristrano procjenjuje varijancu σ 2 . k-tom uzorku duljine
N pridružuje se varijanca izrazom
N
1
σk2 =
N ∑ (xn,k − x k ) 2 ,
n =1

koja je takod̄er jedna nasumična varijabla definira na uzorku duljine N. Pogledajmo


je li σk2 nepristrana procjena prave varijance σ 2 , tj. vrijedi li (11.1) uz θ 2 ≡ σ 2 i Θ 2 ≡ σk2 .
Raspišimo σk2 na slijedeći način
N N
1 1
σ2 =
N ∑ ( xn − x + µ − µ) 2 =
N ∑ [(xn − µ) − (x − µ)] 2
n =1 n =1
N N
" #
1
=
N ∑ ( x n − µ ) 2 − 2( x − µ ) ∑ ( x n − µ ) + N ( x − µ ) 2
n =1 n =1
N
1
=
N ∑ ( xn − µ) 2 − ( x − µ) 2 .
n =1

Izračunajmo očekivanje gornje jednadžbe, tako što ćemo koristiti svojstvo linearnosti
operatora očekivanja (ref)
N
D E 1
σ2 ∑ ( xn − µ) 2 − ( x − µ) 2 .



=
N n =1

Prema (ref) je ( xn − µ) 2 = σ 2 , a ( x − µ) 2 = σ 2 /N, pa je zato




N
D E 1 N−1 2
σ2 =
N ∑ σ 2 − σ 2 /N =
N
σ 6= σ 2 .
n =1

Dakle, zaključujemo da σ2 NIJE nepristrana procjena za varijancu. No, gornji račun ipak
nije posve uzaludan. Uvedemo novu nasumičnu varijablu Θ relacijom

N
Θ2 ≡ σ2 .
N−1
Opet, zbog linearnosti operatora očekivanja (ref), vrijedi

N N D 2E N N−1 2
 

2
Θ = σ 2 = σ = σ = σ 2.
N−1 N−1 N−1 N

Dakle Θ 2 JESTE nepristrana procjena varijance cijelog skupa (a ne samo uzorka!). Napi-
šimo još i Θ 2 pomoću xn -ova iz uzorka
N
1
Θ2 =
N−1 ∑ ( xn − x ) 2 .
n =1

11.1.1 Najbolja nepristrana procjena


Moguće je zamisliti situaciju u kojoj postoji više nasumičnih varijabla Θ, koje sve nepris-
trano procjenjuju parametar θ. U tom slučaju je važno naći onu nepristranu procjenu
koja NAJBOLJE procjenjuje θ. U ovom slučaju riječ najbolje znači da je odstupanje Θ od
11.1 Nepristrane procjene 487

θ najmanje. Kako bismo eliminirali utjecaj predznaka (budući da su negativni brojevi


manji od pozitivnih, to bi i negativna odstupanja uvijek bila manja od pozitivnih),
računat ćemo kvadrate odstupanja. No, kvadratno odstupanje je upravo ono što smo
već ranije, (ref), definirali kao varijancu. Prema tome, da bi Θ bila nepristrana procjena
od θ, mora biti hΘi = θ, a da bi Θ bila još i najbolja nepristrana procjena, mora biti
zadovoljen i dodatni uvjet minimalne varijance

(Θ − θ ) 2 = min.

Pokažimo sada da od svih linearnih funkcija varijabli x1 , x2 , . . . , xN , upravo aritmetička


sredina x ima svojstvo da najbolje procjenjuje očekivanje µ cijelog osnovnog skupa
dogad̄aja (a ne samo uzorka). Neka je, dakle, Θ najopćenitija linearna kombinacija
nasumičnih varijabla x1 , x2 , . . . , xN

Θ = c1 x1 + c2 x2 + · · · + cN xN , (11.2)

gdje su cn konstante. Kako su sve varijable xn opisane ISTOM funkcijom raspodjele


gustoće vjerojatnosti, to će biti i

h x1 i = h x2 i = · · · = h xN i = µ,
V ( x1 ) = V ( x2 ) = · · · = V ( xN ) = σ 2 .

Naš je zadatak naći vrijednosti konstanata



cn , tako da budu zadovoljeni uvjeti nepristra-
nosti hΘi = µ i najbolje nepristranosti (Θ − µ) 2 = min. Prema linearnosti operatora
očekivanja, (ref), prvi uvjet vodi na

h Θ i = h c1 x1 + c2 x2 + · · · + cN xN i = c1 h x1 i + c2 h x2 i + · · · + cN h xN i
= c1 µ + c2 µ + · · · + cN µ = (c1 + c2 + · · · + cN ) µ.

No, prema definiciji (ref) nepristrane procjene, gornji izraz treba biti jednak µ, a to je
moguće samo ako je

c1 + c2 + · · · + cN = 1.

Gornji će uvjet očito biti zadovoljen ako umjesto koeficijenata cn iz (11.2), koristimo
normirane koeficijente
cn
cn → N
,
∑ j =1 cj

čime Θ postaje

c1 x1 + c2 x2 + · · · + cN xN
Θ= . (11.3)
∑nN=1 cn

Ovako definiran Θ zadovoljava uvjet nepristranosti. Pogledajmo sada što donosi


uvjet najbolje nepristrane procjene. Iz matematičke analize je poznato da se ekstremi
(minimumi ili maksimumi) funkcije u odnosu na neku varijablu, odred̄uju zahtjevom
da je derivacija funkcije po toj varijabli jednaka nuli. Mi sada želimo da varijanca bude
488 Poglavlje 11. Procjene

ekstremna (minimalna) u odnosu na Θ. No, Θ je odred̄ena vrijednostima N konstanata


cn i zato postoji ne jedan, nego N uvjeta minimuma koje pišemo kao

∂V (Θ)
= 0, n = 1, 2, · · · , N.
∂cn
Da bismo mogli provesti gornju derivaciju, moramo znati kako V ovisi o cn -ovima. Po
uzoru na (...), sada računamo
c1 c2 cN
 
V (Θ) = V x1 + N x2 + · · · + N xN
∑nN=1 cn ∑ n =1 c n ∑ n =1 c N
*  2+
c1 c2 cN
= ( x1 − µ ) + N ( x2 − µ ) + · · · N ( xN − µ )
∑nN=1 cn ∑ n =1 c n ∑ n =1 c N
D c12 2 c22 2 cN2
= ( x 1 − µ ) + ( x 2 − µ ) + · · · ( xN − µ ) 2
(∑nN=1 cn ) 2 (∑nN=1 cn ) 2 (∑nN=1 cn ) 2
c1 c2 2
E
+2 N ( x 1 − µ )( x 2 − µ ) + · · ·
∑ n =1 c n ∑ N
j =1 c j
= (lin < ... >)
c12 2 c22 2 cN2
x x ( xN − µ ) 2




= N
( 1 − µ ) + N
( 2 − µ ) + · · · + N
( ∑ n =1 c n ) 2 ( ∑ n =1 c n ) 2 ( ∑ n =1 c n ) 2
c1 c2
+2 N N
h( x1 − µ)( x2 − µ)i + · · ·
∑ n =1 c n ∑ n =1 c n
Budući da su xn med̄usobno neovisne varijable, to je prema (), očekivanje mješovitih
članova jednako nuli E[( xn − µ)( xm − µ)] = 0, pa preostaje

c12 c22 cN2


V (Θ) = ( x1 − µ ) 2 + ( x2 − µ ) 2 + · · · ( xN − µ ) 2




(∑nN=1 cn ) 2 (∑nN=1 cn ) 2 (∑nN=1 cn ) 2
c2 1 c22 c2
N
= V ( x1 ) + V ( x2 ) + · · · , V ( xN )
(∑nN=1 cn ) 2 (∑nN=1 cn )2 (∑nN=1 cn ) 2
c2 c2 cN2
= 1
σ2 + 2
σ2 + · · · σ2
(∑nN=1 cn ) 2 (∑nN=1 cn )2 (∑nN=1 cn )2
c2 + c2 + · · ·
1 2 + cN2 2
=  2 σ .
∑nN=1 cn

Sada, kada vidimo eksplicitnu ovisnost varijance o cn -ovima, možemo provesti deriva-
ciju i izjednačiti ju s nulom

c12 + c22 + · · · + cN2 2


V (Θ) =  2 σ ,
∑nN=1 cn
∂V (Θ) 2cm (∑nN=1 cn ) 2 − (c12 + c22 + · · · + cN2 )2(∑nN=1 cn )
0= = .
∂cm (∑nN=1 cn )4
Očito je gornji uvjet ispunjen, ako je

∑nN=1 cn2
cm = .
∑nN=1 cn
11.1 Nepristrane procjene 489

Primjećujemo da desna strana gornjeg izraza ne ovisi o indeksu m, što znači da su svi
cm -ovi med̄usobno jednaki i označit ćemo ih s C

∑nN=1 cn2
C≡ = c1 = c2 = · · · = cN .
∑nN=1 cn

Uvrstimo ove vrijednosti za cn , natrag u izraz za Θ

c1 x1 + c2 x2 + · · · + cN xN C ( x1 + x2 + · · · + xN ) x1 + x2 + · · · + xN
Θ= N
= = = x.
∑ n =1 c n NC N

Opet smo dobili aritmetičku sredinu. Time je pokazano da je aritmetička sredina


nepristrana i najbolja nepristrana procjena očekivanja.

11.1.2 Intervalne procjene


... dovršiti ...

11.1.3 Monte Carlo


Neka je q diskretna nasumična varijabla opisana raspodjelom vjerojatnosti P(q). Pret-
postavimo da smo u stanju računalnom simulacijom generirati N nezavisnih kopija qn
varijable q. Zadatak je procjeniti vrijednost parametra θ ≡ hqi.

Postavljeni problem ćemo riješiti primjenom zakona velikih brojeva (odjeljak ....). Iz
niza vrijednosti qn generiranog računalom, izračunajmo aritmetičku sredinu

N
1
ΘN ≡
N ∑ qn , N > 1.
n =1

Ova veličina je, kao linearna kombinacija nasumičnih varijabla, i sama nasumična
varijabla. Veličinu ΘN nazivamo procjeniteljem ili, točnije, nepristranim procjeniteljem zato
jer je njezina srednja vrijednost (izračunata pomoću P, a ne računalnom simulacijom)
jednaka

1 N 1 N
* +
1
h ΘN i = ∑
N n =1
qn = ∑
N n =1
hqn i = N hqi = θ.
N

U skladu s (jakim) zakonom velikih brojeva, ...., znamo da je


 
P lim ΘN = θ = 1.
N →∞

To što znamo da u granici N → ∞ aritmetička sredina hΘN i teži prema pravoj srednjoj
vrijednosti θ, još uvijek ne govori ništa o tome koliko velik treba biti N u konkretnoj
simulaciji, pa da imamo željenu točnost za ocjenu vrijednosti θ. Za odgovor na to pitanje,
moramo se pozvati na središnji granični teorem iz odjeljka 7. Iz tog odjeljka znamo da
je zbroj od N nasumičnih varijabla jedna nova nasumična varijabla raspodjeljena po
Gaußovoj raspodjeli s gustoćom vjerojatnosti
" #
1 ( ΘN − θ ) 2
ρ ( ΘN ) = √ exp − ,
σΘ 2π 2 σΘ2
490 Poglavlje 11. Procjene

bez obzira po kojoj su raspodjeli raspored̄ene same nasumične varijable iz zbroja. Ova
je tvrdnja utoliko točnija što je N veći. Standardna devijacija varijable ΘN je označena sa
σΘ . Prema (7.8) je
1 1 2
σΘ2 = 2 σ12 + σ22 + · · · + σN2 = σ ,

N N
pri čemu je
σ1 = σ2 = · · · = σN = σ
standardna devijacija nasumične varijable q. Time raspodjela vjerojatnosti za ΘN prelazi
u

N N ( ΘN − θ ) 2
 
ρ ( ΘN ) = √ exp − .
σ 2π 2σ2
Sada se možemo zapitati (kao kod relacije (4.75)) kolika mora biti vrijednost parametra
Gaußove raspodjele, pa da s 90 % vjerojatnosti možemo reći da je |ΘN − θ | ≤ H
√ !
NH
P(|ΘN − θ | ≤ H ) = 2Φ = 0.9 .
σ
Gornja vjerojatnost (u ovom primjeru je to 90 %) se naziva POUZDANOST, a H se naziva
INTERVAL POUZDANOSTI. Iz tablica sa strane 302 i 303 iz V RANI Ć, Vjerojatnost i statistika
očitavamo

NH
Φ(t1 = 1.64) = 0.449 50, Φ(t2 = 1.65) = 0.450 53, ⇒ t= ≈ 1.645.
σ
Ako želimo veću pouzdanost, npr. 95 %, tada istim postupkom dolazimo do

NH
Φ(t = 1.96) = 0.475, ⇒ t= ≈ 1.96.
σ
Očito, da bismo odredili interval pouzdanosti H, potrebno je, na temelju nezavisnih
simulacija, procjeniti vrijednost σ.

Teorem 11.1.1 Neka su q1 , · · · , qN nezavisne simulacije nasumične varijable q, koje sve


imaju istu srednji vrijednost θ = hqi i standardnu devijaciju σ. Neka je
N
1
σN2 =
N−1 ∑ (qn − Θ N ) 2.
n =1

Tada je

2
σN = σ 2 .

Dokažimo teorem tako što ćemo usrednjiti relaciju iz iskaza teorema1


N N
N
* + * +
( N − 1) σN = ∑ (qn − ΘN ) = ∑ qn − 2 ΘN ∑ qn + N ΘN2

2 2 2


n =1 n =1 n =1
N N
∑ qn2 − 2N ΘN2 + N ΘN2 = ∑ qn2 − N ΘN2






=
n =1 n =1
2 2
=N q − N ΘN


1 Primjetimo da σΘ2 6= σN2 .


11.1 Nepristrane procjene 491

No, prema definiciji standardne devijacije je

σ2
ΘN2 = σΘ2 + hΘN i 2 = + θ 2.


N
Uvrštavanjem ovog rezultata u prethodni izraz za σN2 , dolazi se do

N − 1
2 σ2 N−1 2
 
σN = σ 2 + θ 2 − + θ2 σ .

=
N N N

Q.E.D.

Prema tome, srednja vrijednost veličine σN2 je točno jednaka σ 2 , što nam onda omogu-
ćava da (neusrednjenu) σN koristimo kao procjena vrijednosti standardne devijacije σ u
izrazu za interval pouzdanosti ΘN = θ ± H

tσN tσN
 
θ− √ , θ+ √ .
N N

A LGORITAM 1
... dovršiti ...

A LGORITAM 2
... dovršiti ...

Zadaci
... dovršiti ...
492 Poglavlje 11. Procjene

Literatura korištena u ovom poglavlju:

1. D AVID F. A NDERSON.
Lecture notes on stochastic processes with application in biology. 2017
2. P. H SU H WEI.
Theory and problems of probability, random variables and random processes. McGraw -
Hill, 1997
3. Ivo PAVLI Ć.
Statistička teorija i primjena. Panorama, Zagreb, 1965
4. K EN R ILEY , M ICHAEL H OBSON I S TEPHEN B ENCE.
Mathematical Methods for Physics and Engineering. Cambridge Univ. Press, 2006
5. V LADIMIR V RANI Ć.
Vjerojatnost i statistika. Tehnička knjiga, Zagreb, 1971
12. Statistički testovi

12.1 Pogreške
Problem koji se riješava u ovom odjeljku je slijedeći: zadana je kontinuirana nasumična
varijabla x čija je vjerojatnost opisana funkcijom gustoće vjerojatnosti ρ( x, θ ), gdje je θ
parametar koji definira raspodjelu. Oblik funkcije ρ je poznat, ali je nepoznata vrijednost
parametra θ. Za tu nepoznatu vrijednost θ se pretpostavljaju dvije vrijednosti ili, kako
se to još kaže, postavljaju se dvije hipoteze

H1 : θ = θ1 ,
H2 : θ = θ2 .

Pri čemu je SIGURNO jedna od njih točna, a ona druga netočna. U nastavku ćemo
pokazati kako se, na temelju analize UZORAKA, odlučiti za jednu ili drugu hipotezu i
kako izračunati vjerojatnost da je odabrana pogrešna hipoteza.

Neka su nam poznati uzorci od N vrijednosti nasumične varijable x

x1 , x2 , · · · , xN .

Svakom takvom uzorku se može pridružiti točka u N-dimenzijskom prostoru (svaki xn


predstavlja jednu koordinatu ili jedan smjer u takvom prostoru) T ( x1 , x2 , · · · , xN ). Zatim
se cijeli taj prostor podijeli na dva dijela koji se med̄usobno ne preklapaju, a zajedno čine
cijeli prostor (ili, kako matematičari kažu, podijelimo prostor na dva disjunktna dijela).
Nazovimo te dijelove A i B kao što je to skicirano na slici 12.1. Testiranje hipoteze H1
prema hipotezi H2 se provodi na slijedeći način: ako se točka T odred̄ena uzorkom
x1 , x2 , · · · , xN nalazi u dijelu prostora A,

T ∈ A,

tada se hipoteza A prihvaća kao istinita. Naprotiv, ako se točka T nalazi u B dijelu
prostora, hipoteza H1 se odbacuje, a kao istinita se prihvaća H2 . Shodno tome, dio
prostora označen s A se naziva PODRU ČJE PRIHVA ĆANJA hipoteze H1 , a B dio prostora
se naziva kritična domena ili PODRU ČJE SIGNIFIKANTNOSTI.
Često je moguće, sa analize N varijabli xn , prijeći na jednu novu, pogodno definiranu
494 Poglavlje 12. Statistički testovi

Slika 12.1: Na slici je cijeli N-dimenzijski prostor uzoraka prikazan kao dvodimenzijski
lik, podijeljen na dva disjunktna dijela A i B.

A
područje prihvaćanja H1

B
područje odbacivanja H1

nasumičnu varijablu u = u( x1 , x2 , · · · , xN ), i pomoću nje testirati hipoteze. Prednost ovog


koraka jeste u tome što smo sa N varijabli xn prešli na samo jednu varijablu u. Drugim
riječima, umjesto ispitivanja N dimenzijskog prostora, treba ispitivati pravac; područje
prihvaćanja i područje signifikantnosti su naprosto dijelovi u-pravca. Kod ovakvog
načina testiranja hipoteza, moguće su dvije vrste pogrešaka:
POGREŠKOM PRVE VRSTE se naziva pogreška nastala uslijed prihvaćanja hipoteze H2 u
slučaju kada je zapravo istinita H1 . Vjerojatnost ove pogreške ćemo označiti s α

α = ρ{ T ∈ B / H1 }. (12.1)

Gornjim zapisom se kaže da je točka T (odred̄ena uzorkom) pala u područje B, a da je


pri tome zapravo istinita hipoteza H1 . Ovo je, dakle, pogreška koja nastaje odbacivanjem
točne hipoteze H1 .
P OGREŠKA DRUGE VRSTE nastaje prihvaćanjem hipoteze H1 u slučaju kada je ona
zapravo pogrešna (točna je H2 ). Vjerojatnost ove pogreške ćemo označiti s β

β = ρ{ T ∈ A / H2 }. (12.2)

Gornjim zapisom se kaže da je točka T (odred̄ena uzorkom) pala u područje A, a da je


pri tome zapravo istinita hipoteza H2 . Ovo je, dakle, pogreška koja nastaje prihvaćajem
netočne hipoteze H1 .
Gornje su pogreške pregledno prikazane tablicom 12.1. Pored vjerojatnosti α i β koje

Tablica 12.1: Tablica prihvaćanja / odbacivanja hipoteze H1 .

hipoteza H1 točna netočna

odbacuje se α, pogreška 1. vrste pravilan zaključak

prihvaća se pravilan zaključak β, pogreška 2. vrste

opisuju POGREŠNE odluke, uvodi se i vjerojatnost, s oznakom p, odbacivanja hipoteze


12.1 Pogreške 495

H1 u situaciji kada je ona uistinu netočna

p = ρ{ T ∈ B / H2 }. (12.3)

Ova se vjerojatnost naziva i JAKOST ili moć testa. U skladu s definicijom vjerojatnosti β,
zaključujemo da mora biti

p + β = 1,

tj. uz istinitu (ili točnu) hipotezu H2 , točka T uzorka će sa sigurnošću pasti ili u dio
prostora A ili u dio prostora B. Iz p = 1 − β, se izvodi zaključak da je jakost testa utoliko
veća , što je vjerojatnost pogreške druge vrste manja.
 Primjer 12.1 D VIJE NEJEDNAKE KOVANICE
Imamo dvije nejednake kovanice, koje ćemo označiti K1 i K2 . Kovanica K1 je potpuno
simetrična i vjerojatnost pojave grba ili pisma su jednake p = 1/2. Kovanica K2 je
nesimetrična i vjerojatnosti pojave grba na njoj je jednaka p = 2/3. Uzimamo jednu
od tih kovanica (ali ne znamo koju) i bacamo ju u zrak tri puta i bilježimo broj koliko
se puta okrenuo grb. Taj broj je nasumična varijabla koju označimo s n. Pomoću n
trebamo odlučiti koju smo kovanicu bacali. Koristeći terminologiju iz ovog odjeljka, naš
je zadatak da pomoći nasumične varijable n testiramo hipotezu H1 : p = 1/2 u odnosu
na hipotezu H2 : p = 2/3.
U slučaju tri bacanja, varijabla n može poprimiti četiri vrijednosti n = 0, 1, 2 i 3, a budući
da bacanje kovanice ima samo dva moguća ishoda, gustoća vjerojatnosti n je dana
binomnom raspodjelom

3
 
ρ(n) = p n q 3− n .
n

Ovisno o točnosti hipoteza H1 i H2 , raspodjela varijable n je prikazana tablicom 12.2.


Prostor uzoraka sa slike 12.1, je jednodimenzijski i sastoji se od četiri diskretne točke n =

Tablica 12.2: Pregledni prikaz gustoće vjerojatnosti varijable n za hipoteze H1 i H2 .

n 0 1 2 3

1 3 3 1
H1 ρ(n) 8 8 8 8

1 6 12 8
H2 ρ(n) 27 27 27 27

0, 1, 2, 3. Testirajmo sada hipotezu H1 tako što ćemo POTPUNO PROIZVOLJNO odabrati


područje B sa slike 12.1 da bude n = 0. Time je ujedno odred̄eno i područje A, područje
prihvaćanja hipoteze H1 , kao n = 1, 2, 3, tj. ako bar jednom padne grb, prihvaćamo
da se radi o kovanici K1 . Prema(12.1) i (12.2) računamo pogreške prve i druge vrste
(sada je nasumična varijabla diskretna, pa umjesto ρ koristimo oznaku za raspodjelu
vjerojatnosti diskretne nasumične varijable P)
1
α = P{n ∈ B / H1 } = ρ{n = 0 / H1 } = = 0.125,
8
6 12 8 26
β = P{n ∈ A / H2 } = ρ{n = 1, 2, 3 / H2 } = + + = = 0.96.
27 27 27 27
496 Poglavlje 12. Statistički testovi

Prvi nam rezultat kaže da bismo u 12.5 % slučajeva tvrdili da je bacana kovanica K2 ,
kada je zapravo bacana K1 . Drugi nam rezultat kaže da bismo u 96 % slučajeva tvrdili
da je bacana kovanica K1 , dok je zapravo bacana K2 .
Budući da smo područje B (pa time i A) odabrali potpuno proizvoljno, ne možemo
biti sigurni je li ovo i NAJBOLJI test. Pokažimo da postoji i bolji test, tako što ćemo
odabrati drukčije područje B 0 (područje odbacivanja hipoteze H1 ). Neka je sada B 0 =
{n = 3}, A 0 = {n = 0, 1, 2}. Uz ovaj izbor područja A 0 i B 0 slijede vrijednosti za pogreške
prve i druge vrste
1
α 0 = P{n ∈ B 0 / H1 } = ρ{n = 3 / H1 } = = 0.125,
8
1 6 12 19
β0 = P{n ∈ A 0 / H2 } = ρ{n = 0, 1, 2 / H2 } = + + = = 0.70.
27 27 27 27
Vidimo da su pogreške prve vrste iste u oba slučaja, α = α 0 , ali da je sada pogreška druge
vrste manja, β 0 < β, što ovaj drugi test čini boljim od prvoga: vjerojatnost pogreške je
manja ako ustvrdimo da je bacana kovanica K2 , ako je n = 3, nego ako to isto ustvrdimo
za n = 0. 

 Primjer 12.2 G EIGER –M ÜLLER


Slijedeći primjer se odnosi na mjerenje vremena izmed̄u dva uzastopna očitanja Ge-
iger–Müllerovog brojača koji registrira kozmičko zračenje. Navedeni vremenski interval
je kontinuirana nasumična varijabla, koju ćemo označiti s t (mjereno u pogodno oda-
branim vremenskim jedinicama). Poznatom se smatra raspodjela gustoće vjerojatnosti
aktivacije brojača, koja je oblika

ρ(t, c) = c e−c t , 0 ≤ t ≤ ∞,

gdje je c nepoznata konstanta čija vrijednost ovisi o uvjetima pod kojima se obavlja
mjerenje. Zadatak je odrediti vrijednost te konstante c, na temelju samo jednog mjerenja
vremenskog intervala izmed̄u dva aktiviranja brojača. Za prvu hipotezu uzimamo
vrijednost H1 = {c = 2}, a za drugu, vrijednost H2 = {c = 1}. Treba izračunati vjero-
jatnosti pogrešaka prve i druge vrste, ako za područje A (prihvaćanje prve hipoteze),
odaberemo vremenski interval t = [0, 1] (primjetimo da je i ovdje prostor uzoraka jed-
nodimenzijski, ali za razliku od prethodnog primjera, nije diskretan, već kontinuiran).
Uz ovakav odabir područja A, područje B je t = (1, ∞). Ako je istinita prva hipoteza,
gustoća vjerojatnosti je

ρ1 (t, 2) = 2 e−2 t ,

a ako je istinita druga hipoteza, gustoća vjerojatnosti je

ρ2 (t, 1) = e−t .

Računamo pogrešku prve vrste


Z ∞ Z ∞
α = ρ{t ∈ B / H1 } = ρ{1h t < ∞ / H1 } = ρ1 (t, 2) dt = 2 e−2 t dt = 0.135,
1 1

a zatim i pogrešku druge vrste


Z 1 Z 1
β = ρ{t ∈ A / H2 } = ρ{0 ≤ t ≤ 1 / H2 } = ρ2 (t, 1) dt = e−t dt = 0.632.
0 0

12.2 Neyman - Pearsonova lema 497

12.2 Neyman - Pearsonova lema


dovršiti

12.3 U-test signifikantnosti


Krećemo od pretpostavke da je kontinuirana nasumična varijabla x (cijelog osnovnog
skupa) raspodjeljena po Gaußovoj raspodjeli s poznatom varijancom V ( x ) = σ 2 i ne-
poznatom srednjom vrijednošću (očekivanjem) h x i. Zadatak je testirati hipotezu da
očekivanje ima vrijednost µ0 za koju pretpostavljamo da ju mora imati iz nekih drugih
računa ili pretpostavki

H0 : h x i = µ0 .

Ovu ćemo hipotezu usporediti s dvije druge hipoteze kojima se pretpostavljaju manja

H1 : h x i = µ1 < µ0

i veća

H2 : h x i = µ1 > µ0

vrijednost očekivanja. Testiranje provodimo pomoću uzorka duljine N

x1 , x2 , · · · , xN .

Prema definiciji, aritmetička sredina ovog uzorka je


N
1
x=
N ∑ xn .
n =1

Ukoliko je hipoteza H1 istinita, nasumična varijabla x je raspodjeljena po Gaußovoj ras-


podjeli (µ, σ 2 /N ), kao što je to pokazano u odjeljku .... U istom je odjeljku i pokazanao
da je tada nasumična varijabla

N
u= ( x − < µ0 )
σ
raspodjeljena po Gaußovoj raspodjeli sa srenjom vrijednošću jednakom nula i varijan-
com jednakom jedan.
Testirajmo najprije hipotezu H0 u odnosu na hipotezu H1 . Testiranje ćemo provesti
varijablom u, tako da je prostor uzoraka opet kontinuirano jednodimenzijski. Zadajmo
si unaprijed vrijednost α za pogrešku prve vrste. Pomoću α se može definirati granična
vrijednost uα sa svojstvom da je

P(u < uα ) = α,

gdje P(u < uα ) označava integral jedinične Gaußove raspodjele od −∞ do uα (lijevi rep
sa slike 12.2). Uzme li se da je vjerojatnost pogreške prve vrste 5%, tj. da je α = 0.05,
tada je prema PAVLI Ć, Statistička teorija i primjena (tablica na str. 382), uα ' −1.64. To
znači da je kritična domena za hipotezu H0 odred̄ena sa u < uα , tj.

N
( x − µ0 ) < −1.64.
σ
498 Poglavlje 12. Statistički testovi

Slika 12.2: Uz testiranje hipoteze µ1 < µ0 .

Samo se testiranje svodi na slijedeće: iz uzorka se izračuna x i uvrsti u izraz za u; ako je


N
( x − µ0 ) ≥ −1.64,
σ
hipoteza H1 se prihvaća kao istinita. Ako je

N
( x − µ0 ) < −1.64,
σ
H0 se odbacuje, a prihvaća se H1 . S obzirom na početni odabir α = 0.05, hipoteza H0 će
biti pogrešno odbačena u oko 5% slučajeva.
 Primjer 12.3 Z ADANI UZORAK
Neka uzorak sadrži N = 16 elemenata i neka je varijanca jednaka σ02 = 4. Aritmetička
sredina izračunata iz uzorka neka je jednaka x = 19.5. Treba testirati hipotezu H0 :
h x i = µ0 ≡ 20 u odnosu na hipotezu H1 : h x i = µ1 < 20.
Iz zadanih podataka računamo
σ0 1
σx = = ,
N
√ 2
N
u= ( x − µ0 ) = −1.
σ0
Pretpostavimo li ponovo da je α = 0.05, kako bismo mogli koristiti rezultate gornje
analize, vidimo da gornja vrijednost za u = −1 > −1.64 nije signifikantna i zato prihva-
ćamo hipotezu H0 , a odstupanje x od µ0 = 20 smatramo nasumičnim. U dosadašnjoj
analizi od hipoteze H1 smo koristili samo zahtjev µ1 < µ0 . Pokažimo sada vezu izmed̄u
µ1 i pogrešaka druge vrste tj. jakosti testa. Prema definiciji jakosti (12.3)
(√ )
N
p 0 = ρ{ T ∈ B / H1 } = ρ ( x − µ0 ) < uα / H1
σ
(√ )
N
=ρ ( x − µ1 ) < uα + λ / H1 ,
σ
12.4 Usporedba varijance uzorka i hipotetične varijance osnovnog skupa 499

pri čemu je s λ označeno



N
λ= ( µ0 − µ1 ).
σ
dovršiti 

 Primjer 12.4 P OGREŠKA DRUGE VRSTE


dovršiti 

Sad ćemo testirati hipotezu H0 u odnosu na hipotezu H2 ,

H0 : h x i = µ0 , H2 : h x i = µ1 > µ0 .

Sličnim postupkom kao i kod usporedbe H0 sa H1 , dolazi se do nejednakosti za odred̄e-


nje najbolje kritične domene

N
( x − µ 0 ) > u 1− α .
σ
Vrijednost u1−α je odred̄ena iz tablica u PAVLI Ć, Statistička teorija i primjena (str. 382),
kao vrijednost gornje granice u integralu jedinične Gaußove raspodjele (takve za koju je
h x i = 0, a σ 2 = 1), tako da bude
Z +∞
ρG du = 1 − α,
u 1− α

(to je desni rep Gaußove raspodjele). Zbog simetrije Gaußove raspodjele, vrijedi

u 1− α = − u α .

dovršiti

12.4 Usporedba varijance uzorka i hipotetične varijance osnovnog skupa


Opet pretpostavljamo da je nasumična varijabla x raspodjeljena po Gaußovoj raspodjeli.
Za razliku od prethodnog odjeljka, sada je varijanca σ 2 ( x ) nepoznata. Uzorkom duljine
N

x1 , x2 , · · · , xN ,

definiramo varijancu uzorka


N
1
2
σuz =
N ∑ ( xn − x ) 2 .
n =1

koja je takod̄er jedna nasumična varijabla. Ovom varijancom uzorka, želimo testirati
hipotezu

H0 : σ 2 ( x ) = σ02 ,
500 Poglavlje 12. Statistički testovi

u odnosu na neke druge hipoteze (σ02 je vrijednost koju pretpostavljamo na osnovu


nekih drugih računa, mjerenja, iskustva ili sličnog).

Razmotrimo najprije hipotezu H0 u odnosu na

H1 : σ 2 ( x ) = σ12 > σ02 .

I ovdje vjerojatnost pogreške prve vrste, α, smatramo zadanom.


dovršiti

12.5 Studentova t-raspodjela i t-test


Iz odjeljka 4.2.9 znamo da je nasumična varijabla t ∈ (−∞, +∞) raspodjeljena po
t-raspodjeli, kada je njezina gustoća vjerojatnosti dana sa
−(1+k)/2
t2

ρ(t; k ) = C0 (k ) 1+ ,
k
gdje je parametar k prirodan broj (koji se naziva i stupanj slobode), a
 
1+ k
Γ 2
C0 (k ) =   √ , k = 1, 2, 3, · · · .
Γ 2k kπ

Iz gornjeg izraza za gustoću vjerojatnosti se vidi da je ona simetrična u odnosu na


pravac t = 0

ρ(t) = ρ(−t).

Na slici 12.3 je prikazana t-raspodjela uspored̄ena s Gaußovom raspodjelom (h x i =


0, σ 2 = 1). Za račun momenata raspodjele, koristit ćemo tablični integral (A.56)

Slika 12.3: Usporedba t-raspodjele za k = 3 i Gaußove raspodjele za h t i = 0, σt2 = 1.


Z
x µ−1 dx
 µ/ν
1 p Γ(µ/ν) Γ(n + 1 − µ/ν)
1
= , 0 < µ/ν < n + 1
( p + qx )
ν n + ν p n +1 q Γ ( n + 1)
0
12.5 Studentova t-raspodjela i t-test 501

Budući da je ρ(t) parna funkcija od t, to je t ρ(t), neparna funkcija i zato je prvi moment
jednak nuli
Z +∞
hti = t ρ(t) dt = 0.
−∞

Koristeći gornji tablični integral, za drugi moment se dobije


Z +∞
k
h t2 i = t 2 ρ(t) dt = ,
−∞ k−2

što je ujedno i vrijednost varijance σ 2 (t) = h t 2 i − h t i 2 .


Dokažimo slijedeći teorem

Teorem 12.5.1 Ako je varijabla z opisana Gausovom raspodjelom s (µ = 0, σ 2 = 1), a


varijabla v gama raspodjelom sa stupnjem slobode k, tada je varijabla
z
t= √ (12.4)
v/k
raspodjeljena po Studentovoj t-raspodjeli sa stupnjem slobode k.

Od ranije su nam poznate (jedinična) Gaußova i gama raspodjele


1 1 2
ρG (z) = √ e− 2 z ,

1 k −2 1
ρΓ (v) =   v 2 e− 2 v ,
2 k/2 Γ 2k

pa je prema tome

1 k −2 1 2
ρ(z, v) = ρG (z)ρΓ (v) = √  v 2 e− 2 ( v + z ) .
k
2π2 k/2 Γ 2

Radi kraćeg pisanja uvedimo pokratu

1
c= √  ,
k
2π2 k/2 Γ 2

i prijed̄imo s varijable z na varijablu t, držeći pri tome v = const.


z
t= √ .
v/k
Prema (3.53) možemo pisati
dz

ρ(t, v) = ρ(z, v)
dt

iz čega izravno slijedi


c k −1 h v i
ρ(t, v) = √ v 2 exp − (k + t 2 ) .
k 2k
502 Poglavlje 12. Statistički testovi

Samu raspodjelu po t dobijemo tako što ćemo ρ(t, v) prointegrirati po svim dozvoljenim
vrijednostima v
Z ∞ Z ∞
c k −1
h v i
ρ(t) = ρ(t, v) dv = √ v 2 exp − (k + t 2 ) .
0 k 0 2k

Integral računamo u novoj varijabli


v
x= (k + t 2 )
2k
u kojoj je
 k+2 1 Z ∞  k+2 1 
c 2k c 2k k+1
  
k −1
−x
ρ(t) = √ x 2 e =√ Γ
k k + t2 0 k k + t2 2
 
k +1 k 1
Γ 2 − 2+
t2

=√   1+ ,
kπΓ 2k k

što na koncu prepoznajemo kao t-raspodjelu.

Teorem koji potječe od W. Gosseta (pod pseudonimom „Student”) 1908. godine.

Teorem 12.5.2 Varijabla

x − hxi √
t= N (12.5)
Θ
je raspodjeljena po t-raspodjeli sa stupnjem slobode k = n − 1, pri
čemu je
x - aritmetička sredina nasumičnog uzorka,
N - broj elemenata u uzorku,
Θ 2 - nepristrana procjena varijance σ 2 osnovnog skupa,
h x i - očekivanje varijable x osnovnog skupa za koju pretpostavljamo
da je raspodjeljena po Gaußovoj raspodjeli.

Za dokaz je dovoljno pokazati da se gornja varijabla t može prevesti u oblik z/ v/k
iz prethodnog teorema. Započnimo s transformacijom izraza za nepristranu procjenu
varijance
N N 2
1 σ2 xn − x

2
Θ =
N−1 ∑ ( x n − x2
) =
N−1 ∑ σ
.
n =1 n =1

Označimo sa
N 2
xn − x

2
χ = ∑ σ
,
n =1

pa je tada

σ2 2
Θ2 = χ , k = N − 1. (12.6)
k
12.6 Studentov t-test 503

Od ranije, (), znamo da je χ 2 raspodjeljen po gama raspodjeli sa stupnjem slobode


k = N − 1. Uvrštavanjem gornjeg Θ u (12.5), dolazimo do
x −µ √ x −µ √
t= N= p Nk.
Θ σ χ2

Budući da smo pretpostavili kako je x raspodjeljen po Gaußovoj raspodjeli, to je varijabla

x −µ √
z= N.
σ
raspodjeljena po jediničnoj Gaußovoj raspodjeli (onoj s h x i = 0 i σ 2 = 1). Time postaje
z √
t= p k,
χ2

oblika (12.4) uz v ≡ χ 2 , čime je teorem dokazan.


p

Q.E.D.
 Primjer 12.5 PRIMJER
dovršiti 

12.6 Studentov t-test


U ZORAK - OSNOVNI SKUP
Polazimo od nasumične varijable x osnovnog skupa, koja je raspodjeljena prema Gaußo-
voj raspodjeli s nepoznatima očekivanjem h x i i varijancom σ 2 ( x ). Zadatak je testirati
hipotezu

H0 : h x i = µ0 ,

u odnosu na nekoliko drugih hipoteza. Najprije ćemo H1 testirati prema

H1 : h x i = µ1 > µ0 .

Ukoliko je hipoteza H0 istinita, varijabla t iz (12.5) je opisana t-raspodjelom sa stupnjem


slobode k = N − 1. Za unaprijed zadanu vjerojatnost pogreške prve vrste α (obično se
uzima 0.001 ≤ α ≤ 0.005 ), područje odbacivanja H0 je definirano relacijom
x − µ0 √
N > t 1− α , (12.7)
Θ
gdje je t1−α , ona vrijednost varijable t iz pripadne t-raspodjele, za koju vrijedi

Pt (t > t1−α ) = α,

a što se očitava iz tablice PAVLI Ć, Statistička teorija i primjena str. 383. Područja pri-
hvaćanja i odbacivanja hipoteze H0 su prikazan na slici 12.4. Razjasnimo područje
odbacivanja H0 na slici 12.4: Ako je istinita hipoteza H1 , tada je i aritmetička sredina
uzorka x nepristrana procjena očekivanja µ1 . Budući da je µ1 > µ0 , treba očekivati i veće
vrijednosti aritmetičke sredine x (veće nego da je točna hipoteza H0 ). Veća vrijednost x ,
znači da će i
x − µ0 √
t1 = N (12.8)
Θ
504 Poglavlje 12. Statistički testovi

Slika 12.4: t-raspodjela: područje prihvaćanja i odbacivanja hipoteze H0 .

biti veće. Ukoliko je razlika izned̄u µ0 i µ1 dovoljno velika, može se očekivati da će i
t biti toliko veliko (signifikantno veliko) da padne u desni rep t-raspodjele. Shodno
tomu, iz signifikantno velike vrijednosti t, razumno je zaključiti da je istinita hipoteza
H1 , kao što i piše u relaciji (12.7). Prema svemu ovome, testiranje H0 prema H1 sastoji
se u slijedećem: iz uzorka od N elemenata, izračunamo x , Θ 2 i t1 pomoću (12.8). Ako
je t1 ≤ t1−α , prihvaćamo hipotezu H0 kao istinitu. Ako je t1 > t1−α , odbacujemo H0 i
prihvaćamo H1 jer je razlika x − µ0 signifikantna (tj. vrlo je mala vjerojatnost da će se
pri istinitoj H0 dobiti tako veliki t1 ).
Slično se postupa i pri testiranju H0 prema H2

H2 : h x i = µ < µ0 .

Područje odbacivanja H0 je sada odred̄eno nejednakošću

x − µ0 √
N < tα , (12.9)
Θ
pri čemu je tα tako odabrano da vrijedi

Pt (th tα ) = α,

što se ponovo očitava iz tablice PAVLI Ć, Statistička teorija i primjena str. 383. Zbog
simetrije t-raspodjele, u odnosu na t = 0, vrijedi jednakost

t α = − t 1− α .

Promotrimo još i testiranje H1 u odnosu na H4

H4 : h x i = µ4 6= µ1 .
12.6 Studentov t-test 505

Prema gore iznesenim argumentacijama, u ovom je slučaju područje odbacivanja hipo-


teze H1 dano dvama nejednakostima

x − µ1 √ x − µ1 √
N h tα/2 , N > t1−α/2 .
Θ Θ
Zbog spomenute simetrije tα/2 = −t1−α/2 , obje gornje nejednakosti možemo napisati
kao
| x − µ1 | √
N > t1−α/2 .
Θ
Gornja je nejednakost skicirana na slici 12.5.

Slika 12.5: Uz testiranje hipoteze H1 prema H4 .

Cijeli se postpak testiranja svodi na slijedeće:


iz uzorka od N elemenata izračunamo t1 koristeći (12.8), a zatim iz tablice u PAVLI Ć,
Statistička teorija i primjena (str. 383.) očitamo vjerojatnosti P(|t| > |t1 |); ako dobijemo da
je

P(|t| > |t1 |) ≥ α,

prihvaćamo hipotezu H1 . Ako pak dobijemo da je

P(|t| > |t1 |) < α,

prihvaćamo hipotezu H4 .
Navedene tablice su primjenjive do k = 30. Za veće k-ove t-raspodjela se dobro
aproksimira Gaußovom raspodjelom, što znači da nećemo napraviti veliku pogrešku
ako na t1 primjenimo u-test signifikantnosti.
Naglasimo na kraju još jednom da se t-test temaljina pretpostavci da je nasumična
varijabla x raspodjeljena po Gaußovoj raspodjeli, što je pretpostavka koju takod̄er treba
provjeriti. Nasuprot tome u-test ne ovisi o tome kako je rasodjeljena varijabal x, samo
ako je broj elemenata u uzorku dovoljno velik (jer je tada, prema centralnom graničnom
teoremu, x raspodjeljeno po Gaußovoj raspodjeli).
506 Poglavlje 12. Statistički testovi

P RIMJER: Imamo dvij

U ZORAK - UZORAK:
Sada promatramo dva uzorka. Prvi uzorak ima N1 elemenata i izvad̄en je iz osnovnog
skupa koji ima elemente raspodjeljene po Gaußovoj raspodjeli sa očekivanjem µ1 i
varijancom σ 2 . Karakteristične veličine tog uzorka su
N1
µ1 , σ12 , Θ12 = σ 2.
N1 − 1 1
Drugi je uzorak uzet iz osnovnog skupa čiji su elementi takod̄er raspodjeljeni po Ga-
ußovoj raspodjeli, ali s očekivanjem µ2 i istom varijancom kao i prvi skup, σ 2 . Karakte-
ristične veličine ovog uzorka su
N2
x 2, σ22 , Θ22 = σ 2.
N2 − 1 2
Ako su osim varijanci, jednaka i očekivanja, vrijedi slijedeći

Teorem 12.6.1 Slučajna varijabla

x1 − x2
t= ,
Θd

gdje je

( N1 − 1)Θ12 + ( N2 − 1)Θ22 N1 + N2
Θd = ,
N1 + N2 − 2 N1 N2
raspodjeljena je po t-raspodjeli sa stupnjem slobode k = N1 + N2 − 2.

Dokaz:
Uz gornje uvjete teorema, prema (...), x j je nasumična varijabla Gaußove raspodjele s
očekivanjem µ j i varijancom σj2 /Nj . Prema adicijskom teoremu za Gaußove raspodjele
, (...), nasumična varijabla v = x 1 − x 2 je opet raspodjeljena po Gaußovoj raspodjeli s
očekivanjem

E ( v ) = µ1 − µ2
i varijancom
σ12 σ2
V (v) = σv2 = + 2.
N1 N2
Ako pretpostavimo da polazne Gaußove raspodjele imaju iste varijance σ12 = σ22 ≡ σ 2 ,
tada je i
σ2 σ2 N + N2
σv2 = + = σ2 1 .
N1 N2 N1 N2
Nadalje, prema (12.6), procjene varijanci Θ12 i Θ22 oba uzorka, možemo napisati kao
σ 2 χ12 σ 2 χ22
Θ12 = , Θ22 =
N1 − 1 N2 − 1
2
Θ ( N1 − 1) Θ 2 ( N2 − 1)
χ12 = 1 , χ22 = 2 ,
σ2 σ2
12.6 Studentov t-test 507

pri čemu su χ j2 nasumične varijable rasodjeljene po gama raspodjeli sa stupnjem slobode


k j = Nj − 1. Prema adicijskom teoremu za gama raspodjele, (...), slijedi da je i varijabla

Θ12 ( N1 − 1) + Θ22 ( N2 − 1)
χ 2 = χ12 + χ22 =
σ2
takod̄er raspodjeljena po gama raspodjeli sa stupnjem slobode k = ( N1 − 1) + ( N2 − 1) =
N1 + N2 − 2. Budući da je varijabla v = x 1 − x 2 raspodjeljena po Gaußovoj raspodjeli s
očekivanjem µ1 − µ2 i varijancom σv2 , to je, prema (...), varijabla

( x 1 − x 2 ) − ( µ1 − µ2 )
z=
σv
raspodjeljena po jediničnoj Gaußovoj raspodjeli (onoj kojoj je očekivanje nula, a varijanca
jednaka jedan). Sad je, prema teoremu (12.4), varijabla
z p
t= p N1 + N2 − 2
χ2

raspodjeljena po t-raspodjeli sa stupnjem slobode N1 + N2 − 2.


Ako su oba uzorka uzeta iz osnovnog skupa koji, osim istih varijanci, ima i ista očekiva-
nja µ1 = µ2 , tada je

z p x 1 − x 2 N1 + N2 − 2
t= p N1 + N2 − 2 =
χ2 χ2
p
σv

N N2 N1 + N2 − 2 x1 − x2
= (x 1 − x 2 ) √ 1 = ,
σ N1 + N2 Θd
q
Θ12 ( N1 − 1) + Θ22 ( N2 − 1) /σ 2


gdje je

( N1 − 1)Θ12 + ( N2 − 1)Θ22 N1 + N2
Θd2 = ,
N1 + N2 − 2 ( N1 N2 ) 2
kao što je i trebalo dokazati. Q.E.D.

 Primjer 12.6 P RIMJER


dovršiti 
508 Poglavlje 12. Statistički testovi

Literatura korištena u ovom poglavlju:

1. Ivo PAVLI Ć.


Statistička teorija i primjena. Panorama, Zagreb, 1965
13. Korelacijske funkcije

13.1 Uvod

K AO ŠTO JE POKAZANO u odjeljku 3.6.3, pomoću poznate kontinuirane slučajne va-


rijable x i preslikavanja f , moguće je definirati novu slučajnu varijablu

y x (t) = f ( x, t),

gdje je t parametar (najčešće je to vrijeme). Tako definirana veličina y x (t) se naziva


STOHASTI ČKI PROCES . Uvrštavanjem konkretnih vrijednosti x, dobiva se REALIZACIJA
procesa. Momeni se računaju kao
Z
h y ( t1 ) y ( t2 ) · · · y ( t n ) i = y x (t1 ) y x (t2 ) · · · y x (tn ) ρ( x ) dx ,

gdje je ρ( x ) raspodjela gustoće vjerojatnosti varijable x.

A UTOKORELACIJSKA FUNKCIJA se definira kao

κ ( t1 , t2 ) ≡ h y ( t1 ) y ( t2 ) i = h y ( t1 ) y ( t2 ) i − h y ( t1 ) i h y ( t2 ) i (13.1)
= h [y(t1 ) − h y(t1 ) i] [y(t2 ) − h y(t2 ) i] i .
Autokorelacijska funkcija u istom trenutku se svodi na vremenski ovisnu varijancu

κ (t, t) = y 2 (t) = σ 2 (t).


Stohastički se proces naziva STACIONARNIM, ako su momenti invarijantni na translacije


u vremenu

h y ( t1 + τ ) y ( t2 + τ ) · · · y ( t n + τ ) i = h y ( t1 ) y ( t2 ) · · · y ( t n ) i , ∀τ ≷ 0.
Kao posebni slučaj gornjeg izraza stacionarnosti procesa je i

h y(t + τ ) i = h y(t)i ,
tj. h y(t)i ima istu vrijednost u svakom trenutku, pa je dakle vremenski neovisan

h y(t) i = h yi .
510 Poglavlje 13. Korelacijske funkcije

Lako je vidjeti da u tom slučaju autokorelacijska funkcija


κ ( t1 , t2 ) = h y ( t1 ) y ( t2 ) i − h y i 2
ovisi samo o razlici vremena t1 − t2 : stacionarni su procesi invarijantni na translacije u
vremenu, pa zato translacija za τ ≡ −t2 , neće promjeniti gornju korelacijsku funkciju
κ ( t1 , t2 ) = h y ( t1 − t2 ) y ( t2 − t2 ) i − h y i 2 = h y ( t1 − t2 ) y (0) i − h y i 2
= κ ( t1 − t2 ).
Ukoliko postoji konstanta τc s osobinom da za |t1 − t2 | > τc , autokorelacija iščezava
κ (t1 − t2 ) ' 0, |t1 − t2 | > τc ,
tada se τc naziva autokorelacijsko vrijeme stacionarnog stohastičkog procesa.
 Primjer 13.1 F OURIEROVA PREOBRAZBA
Nasumična varijabla y se mijenja s vremenom t kao y(t). Autokorelacijska funkcija
stacionarnih procesa, tj. onih za koje je
h y(t) i = h yi ,
neovisno o vremenu, se definira kao

= h y(t) y(t + τ ) i − h y i 2 ,
Dh ih iE
κ (τ ) = y(t) − h y i y(t + τ ) − h y i (13.2)
t
pri čemu se oznaka usrednjavanja odnosi na usrednjavanje po vremenu. Račun ove
funkcije se sastoji od N 2 operacija. Označimo s d(t) ≡ y(t) − h y i trenutan otklon
varijable od srednje vrijednosti. Tada je
Z T
1 1
Z
κ (τ ) = d(t)d(t + τ ) dt = d(t − τ )d∗ (t) dt .
T 0 T
Svako odstupanje d(t) izrazimo preko Fourierove preobrazbe D(ω ), relacijom (6.25)
Z +∞
1
d( t ) = √ D(ω ) e−ı ω t dω (13.3)
2π −∞

i za autokorelacijsku funkciju se dobije


1 1 T
Z +∞ Z +∞ 0
Z
κ (τ ) = dt D(ω ) e−ı ω (t−τ ) dω D∗ (ω 0 ) eı ω t dω 0
2π T 0 −∞ −∞
1 +∞ +∞
Z T
1
Z Z
0 ıωτ 0
= 0 ∗
dω dω D(ω )D (ω )e dt e−ı (ω −ω ) t .
2π T −∞ −∞ 0

U gornjem izrazu prepoznajemo Diracovu delta funkciju (??),


Z +∞
1 0
dt e−ı (ω −ω ) t = δ(ω − ω 0 ),
2π −∞
što vodi na
Z +∞
1
κ (τ ) = dω kD(ω )k 2 eı ω τ .
T −∞
Autokorelacijska funkcija je realna, pa se zadržava samo realan dio desne strane gornjeg
izraza
2 +∞
Z
κ (τ ) = dω kD(ω )k 2 cos(ω τ ).
T 0
Procjena potrebnih računskih operacija
13.1 Uvod 511

1. učitavanje ulaznog signala y(t) ∼ N


2. oduzimanje srednje vrijednosti y(t) → d(t) ∼ N
3. izračun Fourierive preobrazbe (FFT) D(ω ) ∼ N ln( N )
4. izračun inverzne Fourierive preobrazbe kD(ω )k 2 → κ (τ ) ∼ N ln( N )
Sveukupno, po redu veličina, potrebno je provesti N ln( N ) računskih operacija, što je
(za veliki N) znatno manje od N 2 . .... dovršiti


Zadatak 13.1 Neka je slučajna varijabla y zadana sa

y(t) = x1 + x2 t,

gdje su xi slučajne varijable s konstantnim prosječnim vrijednostima i


varijancama

h xi i = ai , h xi xi i = σi2 .

Izračunajte autokorelacijsku funkciju ako su xi statistički med̄usobno


ovisne i ako su med̄usobno neovisne. 

Rješenje:
Prema (13.1) je

κ ( t1 , t2 ) = h y ( t1 ) y ( t2 ) i − h y ( t1 ) i h y ( t2 ) i .

Prema uvjetima zadatka je

hy(t)i = h x1 + x2 t i = h x1 i + h x2 i t = a1 + a2 t
h y ( t1 ) y ( t2 ) i = h ( x1 + x2 t1 ) ( x1 + x2 t2 ) i
= σ12 + a12 + (σ22 + a22 ) t1 t2 + h x1 x2 i (t1 + t2 ).
Uvrštavanjem gornjih izraza u definiciju autokorelacijske funkcije, dobiva se

κ (t1 , t2 ) = σ12 + σ22 t1 t2 + (h x1 x2 i − a1 a2 ) (t1 + t2 ).

To je izraz koji vrijedi kada su x1 x2 statistički med̄usobno ovisne. Kada su x1 i x2 statistički


med̄usobno neovisne, tada je

h x1 x2 i = h x1 i h x2 i = a1 a2
i izraz za autokorelacijsku funkciju se pojednostavljuje na

κ (t1 , t2 ) = σ12 + σ22 t1 t2 .

Primjetimo da proces opisan s y(t) nije stacionaran, budući da je

κ ( t1 , t2 ) 6 = κ ( t1 − t2 ).

Ukoliko su različitim funkcija (preslikavanjima) f i definirane različite varijable yi (t),


tada se osim autokorelacijske funkcije definira općenitija kvadratna KORELACIJSKA
MATRICA

Ki,j (t1 , t2 ) = y i ( t1 ) y j ( t2 ) ,


512 Poglavlje 13. Korelacijske funkcije

čiji su dijagonalini elementi upravo autokorelacijske funkcije i-te varijable yi

Ki,i (t1 , t2 ) ≡ κi,i (t1 , t2 ) = h yi (t1 ) yi (t2 ) i .

Za stacionarne procese (neovisne o translacijama u vremenu) za koje je još i h yi (t) i = 0,


je

Ki,j (τ ) = yi (0) y j (τ ) .

13.2 Ergodičnost
Neka je y(t) slučajan proces. S [ y ] se označava slijedeće vremensko usrednjenje
Z T/2
1
[ y ] = lim y(t) dt .
T →∞ T − T/2

Slično se definira i vremenska srednja vrijednost autokorelacijske funkcije


Z T/2
1
[ R(τ ) ] = lim y(t) y(t + τ ) dt .
T →∞ T − T/2

Za nasumični proces se kaže da je ergodičan, ako ima svojstvo da su gornja VREMENSKA


usrednjenja navedenih funkcija, jednaka STATISTI ČKIM srednjim vrijednostima (srednja
vrijednost preko ansambla)
Z
h y(t) i = y(t) ρ(y) dy ,
y
Z
h y(t) y(t + τ ) i = y(t) y(t + τ ) ρ(y) dy ,
y

tj. ako je

[ y ] = h y(t) i , [ R(τ ) ] = h y(t) y(t + τ ) i .

U većini fizičkih procesa, pretpostavlja se da su stacionarni procesi ergodični. Pojednos-


tavljeno: ISTO JE PROMATRATI JEDAN SUSTAV TIJEKOM DUGOG VREMENSKOG PERIODA
ILI JAKO PUNO ( ISTIH ) SUSTAVA ( ANSAMBL ) U JEDNOM VREMENSKOM TRENUTKU .
13.2 Ergodičnost 513

Literatura korištena u ovom poglavlju:

1. N EVEN E LEZOVI Ć.


Vjerojatnost i statistika 2 - slučajne varijable. Element, Zagreb, 2007
2. N EVEN E LEZOVI Ć.
Vjerojatnost i statistika 3 - matematička statistika i stohastički procesi. Element, Zagreb,
2007
3. J OSÉ L UIS G ARCIA -PALACIOS. „
Introduction to the theory of stochastic processes and Brownian motion problems”.
(2007). URL: arxiv.org/abs/cond-mat/0701242
4. R OMAN G RIGORIEV.
Mathematical Methods of Physics. 2019. URL: http : / / www . cns . gatech . edu /
~predrag/courses/PHYS-6124-12/roman07/
5. P. H SU H WEI.
Theory and problems of probability, random variables and random processes. McGraw -
Hill, 1997
6. Ivo PAVLI Ć.
Statistička teorija i primjena. Panorama, Zagreb, 1965
7. K EN R ILEY , M ICHAEL H OBSON I S TEPHEN B ENCE.
Mathematical Methods for Physics and Engineering. Cambridge Univ. Press, 2006
8. S VETOZAR V. V UKADINOVI Ć.
Zbirka rešenih zadataka iz teorije verovatnoće. Privredni pregled, Beograd, 1990
14. Nasumičan hod

A KO SE IZVODI NIZ pokusa, pri čemu rezultat svakog pojedinog pokusa ovisi o slu-
čaju, tada se takav niz pokusa naziva stohastički proces.
Jedan tipičan primjer stohastičkog procesa je proučavanje gibanja čestica fluida (plina
ili tekućine). Broj čestica koje sudjeluju u tom gibanju je toliko velik da je praktički
nemoguće pratiti gibanje svake pojedine čestice na temelju njezine jednadžbe gibanja.
Stoga se ovom problemu pristupa statistički, tako što se sudari promatrane čestice s
ostalim česticama smatraju potpuno slučajnima. Npr. u slučaju DIFUZIJE, promatra se
proces miješanja dva fluida: u početnom su trenutku oni bili razdvojeni pregradom,
zatim se pregrada uklanja i fluidi se počinju miješati. Karakteristična pitanja koja se pri
tome postavljaju su: koliko vremena treba da se odred̄en broj čestica pomakne za odre-
d̄enu dužinu, kolika je brzina odvijanja difuzije, koliko vremena treba da se uspostavi
ravnoteža i slična pitanja. Jedan drugi primjer stohastičkog procesa je RADIOAKTIVNI
RASPAD , gdje je potrebno odrediti vjerojatnost da se u odred̄enom vremenskom inter-
valu odred̄eni broj čestica radioaktivno raspadne. Osim toga, stohastički su i procesi kao
Brownovo gibanje, umnožavanje kulture bakterija, broj elektrona i fotona u kozmičkim
zrakama i mnogi drugi.
Osnove teorije stohastičkih procesa su posatavili 1931. god. ruski matematičari A LEK -
SANDAR J AKOVLJEVI Č H IN ČIN 1 i A NDREJ N IKOLAJEVI Č K OLMOGOROV 2 . Kao što je
gore već spomenuto, klasični opis gibanja mnoštva čestica je neprovediv zbog velikog
broja čestica koje sudjeluju u procesu. Gledano sa stanovišta kvantne mehanike, opis
gibanja je još složeniji. Naime, pokazalo se da čak niti za jednu jedinu (a pogotovo ne
za mnoštvo) česticu nije moguće točno odrediti trajektoriju njezinog gibanja. Ono što je
moguće izračunati kvantnomehaničkim računom jeste vjerojatnost prijelaza iz nekog
poznatog kvantnog stanja ψ0 u kome se sustav nalazi u trenutku t0 , u jedno od niza
kvantnih stanja ψt u kojima se sustav može naći u trenutku t > t0 . Ta se vjerojatnost
označava kao

P(t0 , ψ0 ; t, ψt ), t > t0 .
1 Aleksandar Jakovljevič Hinčin, ruski matematičar. Rod̄en je 19. VII 1894. u Carskoj Rusiji, a umro je 18.
IX 1959. u SSSRu.
2 Andrej Nikolajevič Kolmogorov, ruski matematičar. Rod̄en je 25. IV 1903. u Tambovu u Carskoj Rusiji,

a umro je 20. X 1987. u SSSRu.


516 Poglavlje 14. Nasumičan hod

Slika 14.1: Aleksandar Jakovljevič Hinčin Slika 14.2: Andrej Nikolajevič Kolmogorov

Ako vjerojatnost stanja sustava u vremenu t ovisi samo o t0 , ALI NE I O RANIJIM VRE -
MENSKIM TRENUCIMA t < t 0 , onda se takvi procesi nazivaju M ARKOVLJEVI 3 procesi.

Ukoliko je slučajna varijabla diskretna, govori se o Markovljevim lancima (odjeljci 14 i


??). Ako je slučajna varijabla kontinuirana, koristi se izraz Markovljev proces (odjeljak
??).

14.1 Nasumičan hod u jednoj dimenziji


Nasumični hod4 je proces5 koji se pojavljuje u različitim područjima ljudske djelatnosti.
Ponekad se naziva i pijančev hod, što sugerira jednu moguću primjenu teme izložene u
ovom odjeljku.

Jedna jednostavna definicija ovog problema u jednoj dimenzji je slijedeća: čestica se


giba u jednoj dimenziji (npr. po segmentu osi x ∈ [0, X ]) tako da se tijekom vremena
nasumično sudara s drugim česticama (čije gibanje ne pratimo) i uslijed tih sudara,
izvodi skokove lijevo ili desno za jediničnu dužinu6 . Vjerojatnost skoka na lijevu stranu
je q, a na desnu p = 1 − q. Skokovi iste dužine ∆ x se izvode u jednakim, vremenskim
intervalima ∆ t, kao što je prikazano na slici 14.8. S

p( x, t)

će se označavati vjerojatnost da se u trenutku t = m ∆ t, promatrana čestica nalazi u


točki x = n ∆ x, pri čemu je n = 0, 1, 2, · · · , N, tako da je

X = N ∆ x.

Za vremensku varijablu je m = 0, 1, 2, · · · . Dakle, i prostorna varijabla x, kao i vremenska


varijabla t su diskretne varijable. Neke od veličina koje opisuju nasumični hod, i koje će
3 Andrej Andrejevič Markov, ruski matematičar. Rod̄en je 14. VI 1856. u Carskoj Rusiji, a umro je 20. VII
1922. u SSSRu.
4 engl. random walk.
5 Vidjeti npr. u G LUMAC , Računalne metode fizike; G LUMAC , Statistička fizika.
6 Jedna općenitija formulacija nasumičnog hoda je izložena u odjeljku 14.3
14.1 Nasumičan hod u jednoj dimenziji 517

Slika 14.3: Mogući pomaci čestice, ili vjerojatnost: čestica koja se u trenutku t nalazila u
točki x, u slijedećem trenutku, t + ∆ t, može biti u točki x − ∆ x s vjerojatnošću q, ili u
točki x + ∆ x s vjerojatnošću p.

x ­  x x x +  x

q p

t + t
x ­  x x x +  x

se izračunati u nastavku ovog odjeljka, su:

(A) vjerojatnost da čestica okonča svoj put u rubnim točkama x = 0 ili x = X;

(B) koliko vremena (ili koraka) treba čestici da okonča svoj put u jednoj od rubnih točaka;

(C) gdje će se čestica naći nakon vremena t (N koraka);

(D) vjerojatnost da se čestica nakon vremena 2t (ili 2 N koraka) ponovo nad̄e u ishodištu.

Ekvivalentan ovome je i problem koji se pojavljuje u teoriji igara7 , a definira se na


slijedeći način: dva igrača. A i B, igraju igru kod koje je vjerojatnost dobitka za igrača A
jednaka p, a vjerojatnost gubitka je q (za B je, naravno, obratno); na početku igre, igrač
A ima x novaca, a B ima X − x novaca. Igra se igra tako dugo dok ili A ne dobije sav
novac (iznosa X) ili ne izgubi sav novac (i komplementarno za igrača B). Postavlja se
pitanje: kolika je vjerojatnost da A izgubi sav svoj novac.
U nastavku će se koristiti slika gibanja čestice, a ne primjer iz teorije igara. Promatrat će
se, dakle, jednodimenzijsko gibanje po osi x u intervalu [0, X ]. Vjerojatnost pomaka u
desno označava se s p, a vjerojatnost pomaka u lijevo s q = 1 − p. Neka se u početnom
trenutku čestica nalazi u točki s koordinatom 0 ≤ x ≤ X. Unutar vremenskog intervala
∆ t čestica izvede jedan nasumičan pomak lijevo ili desno za ∆ x. Smjer pomaka se
odred̄uje nekim pokusom čiji je ishod slučajan. Npr. ako želimo da vjerojatnost pomaka
lijevo i desno bude jednaka (kao u slučaju difuzije), smjer pomaka se može odrediti
bacanjem kovanice: pismo - lijevo, a glava - desno ili bacanjem kocke: parni broj - lijevo,
7 engl. gambler’s ruin problem
518 Poglavlje 14. Nasumičan hod

neparni broj - desno ili nešto slično. No, nije nužno promatrati ovako simetrične procese.
Od interesa mogu biti i procesi u kojima je npr. vjerojatnost pomaka lijevo i desno nije
ista8 (npr. brojevi 1 i 2 na kocki znače pomak lijevo, a svi ostali desno).
U terminima teorije igara: položaj čestice nakon m pomaka, odgovara količini novca
u posjedu igrača A nakon m odigranih igara. Nasumični hod završava kada čestica ili
stigne u ishodište x = 0 ili u x = X.

(A) V JEROJATNOST DOLASKA DO RUBA :


Označimo s P( x, 0) vjerojatnost da čestica u nekom trenutku T okonča hod u točki x = 0,
ako je u početku, tj. u trenutku t = 0 bila u točki x. To je dakle jedna uvjetna vjerojatnost
koja se preciznije može zapisati i kao

P( x, 0) ≡ P( x, t = 0 | x = 0, t = T ).

Druga je mogućnost da čestica u nekom trenutku T svoj hod okonča u točki X, uz uvjet
da je u početku, tj. u trenutku t = 0 bila u točki x. Ta će se vjerojatnost označiti s P( x, X ).
Ovo je takod̄er jedna uvjetna vjerojatnost koja se preciznije može zapisati i kao

P( x, X ) ≡ P( x, t = 0 | x = X, t = T ).

Prva varijabla je početni položaj, a druga varijabla je konačni položaj. Iz definicije je


očito da je

P( x, 0) + P( x, X ) = 1,

jer čestica mora svoj hod okončati ili u x = 0 ili u x = X. Treća mogućnost ne postoji.

Diskutirajmo situaciju kada se u trenutku t čestica nalazi u točki s koordinatom x


i kada je njezina vjerojatnost da stigne u ishodište jednaka P( x, 0). U slijedećem koraku,
u trenutku t + ∆ t, čestica ima dvije mogućnosti: ili će se, s vjerojatnošću p, pomaknuti
desno u točku x + ∆ x ili će se, s vjerojatnošću q, pomaknuti lijevo u točku x − ∆ x. Ako
se našla u točki x + ∆ x, tada je njezina vjerojatnost da stigne u točku x = 0 jednaka
p · P( x + ∆ x, 0). Naprotiv, ako se našla u točki x − ∆ x, tada je njezina vjerojatnost da
stigne u točku x = 0 jednaka q · P( x − ∆ x, 0). Budući da u jednoj dimenziji postoje samo
dvije mogućnosti: pomak ili lijevo ili desno, to mora biti

P( x, 0)t = q · P( x − ∆ x, 0)t+∆ t + p · P( x + ∆ x, 0)t+∆ t


⇒ 0 = q · P( x − ∆ x, 0)t+∆ t − P( x, 0)t + p · P( x + ∆ x, 0)t+∆ t . (14.1)

Jednadžbe gornjeg tipa se nazivaju JEDNADŽBE DIFERENCIJA. Naravno da za gornje tri


vjerojatnosti vrijedi

P( x − ∆ x, 0) > P( x, 0) > P( x + ∆ x, 0),

jer što je čestica bliže ishodištu, veća je i vjerojatnost da će doći do tog istog ishodišta.
Isto tako, prema definiciji P( x, 0) vjerojatnosti, je

P(0, 0) = 1, (14.2)
8 Npr. sustav Isingovih spinova iznosa h̄/2 u vanjskom magnetskom polju: vjerojatnost prijelaza u
stanje paralelno vanjskom polju (što snižava energiju) će biti veća nego vjerojatnost prijelaza u stanje
antiparalelno polju. Drugi primjer je pijanac koji se nalazi na strmoj ulici: vjerojatnije je da će napraviti
korak niz nego uz strminu.
14.1 Nasumičan hod u jednoj dimenziji 519

jer ako čestica jeste u ishodištu, onda je vjerojatnost toga jednaka jedinici, a

P( X, 0) = 0, (14.3)

jer ako je čestica stigla u krajnju desnu točku, onda sigurno nije u ishodištu, a nasumični
hod je okončan. Ove dvije jednadžbe jesu RUBNI UVJETI za jednadžbu diferencija (14.1).
Potražimo rješenja te jednadžbe uz pretpostavku da je

p 6= q.

Uz ovu pretpostavku, rješenja ćemo potražiti u obliku potencije (ovisnost o vremenu


nas u ovom trenutku ne zanima)

P( x, 0) = R n ,

za n = x/∆ x i nepoznatu bezdimenzijsku veličinu R, koji treba odrediti. Na taj su način


sve veličine u gornjem izrazu bezdimenzijske. Uvrštavanjem gornjeg pretpostavljenog
oblika rješenja u jednadžbu (14.1), dolazi se do
h i
R n−1 R − q − p R 2 = 0.

Uz pretpostavku da je R 6= 0 (što je trivijalno rješenje koje odbacujemo), gornja je


jednadžba zadovoljena ako je

1 q
R2 − R + = 0.
p p

Dva rješenja gornje jednadžbe su

R =1,

1 h i  +

R± = 1 ± (1 − 2q) = q
2p  R− = .

p

Tako su se, za q 6= p, dobila dva različita rješenja


 n
q
P+ ( x, 0) = 1, P− ( x, 0) = .
p

Budući da je polazna jednadžba diferencija, (14.1), LINEARNA I HOMOGENA, to je i


linearna kombinacija rješenja P+ i P− , takod̄er rješenje. Zato je opći oblik rješenja dan sa

 n
q
P( x, 0) = A+ · P+ ( x, 0) + A− · P− ( x, 0) = A+ · 1 + A− · , (14.4)
p

gdje se konstante A+ i A− odred̄uju iz rubnih uvjeta (14.2) i (14.3):

n = 0, P(0, 0) = 1 = A+ + A− ,
 N
q
n = N, P( N, 0) = 0 = A+ + A− .
p
520 Poglavlje 14. Nasumičan hod

Rješavanjem gornjeg 2 × 2 linearnog sustava, dobiju se konstante A+ i A−


 N
q
p −1
A+ =   N , A− =   N ,
q q
p − 1 p − 1

i konačno rješenje za P( x, 0) (slika 14.4)

 N  n
q q
p − p
P( x, 0) =  N , q 6= p. (14.5)
q
p −1

To je vjerojatnost da će čestica koja se u početnom trenutku nalazi u točki x = n ∆ x,


okončati svoj nasumični hod u točki x = 0.

Zadatak 14.1 Proverite točnost rješenja (14.5), njegovim izravnim uvrštavanjem u


(14.1). 

Slika 14.4: Ilustracija izraza (14.5) za X = 100 ∆ x, q = 0.4 i p = 0.6 (plava linija) i izraza
(14.7) za X = 100 ∆ x, q = p = 0.5 (crvena linija).

0.9

0.8

0.7

0.6
P (x, 0)

0.5

0.4 X = 100
p = 0.6 X = 100
0.3 q = 0.4 q = p = 0.5

0.2

0.1

0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
x/X

Za ilustraciju, na slici 14.4, plavom linijom je prikazana relacija (14.5) za X = 100 ∆ x, q =


0.4 i p = 0.6.
Budući da je

P( x, 0) + P( x, X ) = 1,
14.1 Nasumičan hod u jednoj dimenziji 521

(čestica mora okončati svoj nasumični hod ili u x = 0 ili u x = X) to je vjerojatnost da će
čestica koja se u danom trenutku nalazi u točki x, okončati svoj nasumični hod u točki
x = X, jednaka
 N   N −n
p
q − qp
P( x, X ) = 1 − P( x, 0) =  N , q 6= p. (14.6)
p
q − 1

U slučaju kada je p = q = 12 , izrazi (14.5) za P( x, 0) i (14.6) za P( x, X ) se svode na


neodred̄eni oblik
0
,
0
i rješavaju se ili razvojem u red ili primjenom L’Hospitalovog pravila (što je u biti isti
postupak). Uvede li se varijabla
q
u= ,
p

tada je, primjenom L’Hospitalovog pravila,

Nu N −1 − nun−1 n 1
P( x, 0) = lim N 1
=1− , q=p= .
u→1 Nu − −0 N 2
n 1
P( x, 0) = 1 − , q=p= , (14.7)
N 2
(crvena linija na slici 14.4). Vjerojatnost da čestica okonča hod u x = X je
n 1
P( x, X ) = 1 − P( x, 0) = , q=p= .
N 2
Sve zajedno
  N  n
q

 p − qp
, p 6= q



  N
q
1

P( x, 0) = p −


n



1− p = q = 0.5.


N

   N   N −n
p

 q − qp
p 6= q



  N
p
−1

P( x, X ) = q


n



p = q = 0.5.


N
Primjetimo da gornja rješenja zadovoljavaju rubne uvjete (14.2) i (14.2).

Zadatak 14.2 Proverite točnost rješenja (14.7), njegovim izravnim uvrštavanjem u


(14.1). 
522 Poglavlje 14. Nasumičan hod

Zadatak 14.3 Zadan je interval na x osi [0, 1000 ∆ x ]. Čestica se nalazi u točki x =
999 ∆ x. Izračunajte vjerojatnost da čestica okonča svoj hod u točki x = 0,
ako je
(a) p = q = 1/2,
(b) p = 2/5, q = 3/5 . 

Rješenje:
(a) Kada je q = p = 1/2, vjerojatnost P( x, 0) se računa iz (14.7)

n 999
P( x, 0) = 1 − =1− = 1 − 0.999 = 0.001 = 0.1 %.
N 1000
(b) Kada je q 6= p, vjerojatnost P( x, 0) se računa iz (14.5)
 N  n
q q
− 3 1000 3 999 3 999 3
1
   
p p 2 − 2 2 2 −
P( x, 0) =  N = =
q 3 1000 3 1000
1 −1
 
−1 2 − 2
p
3 999 1 1
= 1 000 1 000
=
3 −2 3 1 − (2/3) 1 000
1
' ' 33 %.
3

Zadatak 14.4 Čestica se nalazi u točki x = n ∆ x, a interval po kojemu se može gibati


je 0 ≤ x < ∞. Kolika je vjerojatnost da čestica dod̄e u ishodište ako je
a) q > p,
b) q = p,
c) q < p? 

Rješenje:
Kada je q 6= p, vjerojatnost dolaska u ishodište se računa iz (14.5)
 N  n
q q
p − p
P( x, 0) =  N .
q
p −1

Kada je q > p, tada je


 N
q
p − ···
lim P( x, 0) =   N = 1,
N→∞ q
p − ···

tj. čestica će sigurno okončati svoj hod u ishodištu. Ako je q = p, tada se P( x, 0) računa pomoću
(14.7),
 n
P( x, 0) = lim 1 − = 1,
N→∞ N
i opet će čestica sa sigurnošću okončati svoj hod u ishodištu. Ako je q < p, tada je
 N
q
lim = 0,
N→∞ p
14.1 Nasumičan hod u jednoj dimenziji 523

pa je, prema (14.5), vjerojatnost dolaska u ishodište dana sa


 n
q
P( x = n ∆ x, 0) = .
p

(B) V RIJEME DO DOLASKA U RUBNU TO ČKU :


U prethodnom izlaganju je izračunata vjerojatnost da čestica okonča svoj put u točki
x = 0 (lijevi rub) ili točki x = X (desni rub), ali nije ništa rečeno o tome koliko koraka
(skokova) će pri tome čestica izvesti. Ovaj dio izlaganja je posvećen upravo tome.
U jednoj jedinici vremena, čestica napravi jedan skok. Zato je mjerenje vremena ekviva-
lentno brojanju izvedenih skokova. Promotrimo opet česticu koja započinje svoj hod iz
točke x, ali sada treba izračunati PROSJE ČAN broj koraka (ili prosječno vrijeme)

T (x)

koji napravi čestica, prije nego okonča svoj hod u x = 0 ili u x = X. Taj će se broj
izračunati tako što će se postaviti jednadžba koja povezuje broj koraka koji se razlikuju
za jedan: ako čestica skoči za jedno mjesto lijevo ili desno

T ( x ) = q T ( x − ∆ x ) + p T ( x + ∆ x ) + 1. (14.8)

Prvi član desne strane opisuje jedan korak čestice na lijevu stranu, a drugi član opisuje
jedan korak na desnu stranu. Treći član kaže da je broj koraka iz točaka x ± ∆ x za
jedan veći nego broj koraka iz točke x (računam broj koraka u odnosu na točku x: dakle,
čestica se iz x ± ∆ x treba vratiti u x i to vraćanje je taj +1 korak). Gornju jednadžbu
treba upotpuniti i s početnim uvjetima

T ( x = 0) = T ( x = X ) = 0, (14.9)

koji naprosto kažu da ako je čestica u početnom trenutku bila u jednoj od rubnih točaka,
proces slučajnog hoda je odmah okončan.
Jednadžba (14.8) je istog oblika kao i jednadžba (14.1), s tom razlikom da je ova jed-
nadžba NEHOMOGENA

q T ( x − ∆ x ) − T ( x ) + p T ( x + ∆ x ) = −1. (14.10)

To znači da je ukupno rješenje jednadžbe dano zbrojem rješenja homogene jednadžbe i


partikularnog rješenja nehomogene jednadžbe

T ( x ) = T ( x )hom. + T ( x ) part. .

Rješenje homogene jednadžbe je poznato iz odjeljka (A) i ono je oblika (14.4),


 n
q
T ( x )hom. = A+ · 1 + A− · , x = n ∆ x,
p

konstante A+ i A− se sada odred̄uju iz početnih uvjeta na cijelo rješenje (a ne samo na


homogeni dio rješenja). Partikularno rješenje treba pogoditi. Budući da je jednadžba
čije se rješenje traži, linearna, pogad̄anje ćemo započeti s jednostavnom linearnom
funkcijom

T ( x = n ∆ x ) part. = a0 + a1 · n.
524 Poglavlje 14. Nasumičan hod

Uvrštavanjem gornjeg izraza u jednadžbu (14.10), dobiva se


1
0 = a1 ( p − q ) + 1 ⇒ a1 = .
q−p
Na a0 nema nikakvih uvjeta, što znači da je a0 proizvoljan, pa je najjednostavnije odabrati

a0 = 0.
Time cijelo rješenje za T ( x ) postaje
 n
q n
T ( x ) = A+ · 1 + A− · + .
p q−p
Konstante A+ i A− se odred̄uju iz početnih uvjeta na cijelo rješenje (14.9)
x = 0, T (0) = 0 = A + + A − ,
 N
q N
x = X, T ( X = N ∆ x ) = 0 = A+ + A− · + .
p q−p
Rješavanjem gornjeg 2 × 2 sustava po A+ i A− , dobiva se
N N
q− p q− p
A+ =  N , A− = −  N = − A+ .
q q
p −1 p −1

Konačno rješenje je

 n
q
n N p −1
T (x) = −  N , q 6= p. (14.11)
q−p q−p q
p − 1

Da je konstanta a0 odabrana tako da bude a0 6= 0 i konstante A± bi bile drukčije, ali bi


gornje rješenje ostalo nepromjenjeno.
Ako je q > p, onda je ovo gore broj koraka potrebnih da čestica iz x ode u ishodište, a
ako je p > q, onda je ovo gore broj koraka potrebnih da čestica iz x ode u X. Na slici
14.5, plavom linijom je prikazan gornji izraz za X = 100 ∆ x, q = 0.4 i p = 0.6.
Što ako je q = p = 12 ? Uvrštavanjem q = p = 12 u gornji izraz, opet će se dobiti neodre-
d̄enost. Zato treba pažljivo izvesti granični prijelaz q → 12 i p → 12 . Uvedimo ponovo
varijablu
q
u≡ ,
p
i promatrajmo gornji izraz u granici kada je
u = 1 − δ, δ → ± 0.
Binomnim razvojem je
n ( n − 1) 2
u n = (1 − δ ) n = 1 − n δ + δ + ··· ,
2
N ( N − 1) 2
u N = (1 − δ ) N = 1− Nδ + δ + ··· .
2
14.1 Nasumičan hod u jednoj dimenziji 525

Slika 14.5: Ilustracija izraza (14.11) za X = 100 ∆ x, q = 0.4 i p = 0.6 (plava linija) i izraza
(14.12) za X = 100 ∆ x, q = p = 0.5 (crvena linija).

3000

2500
X = 100
q = p = 0.5
2000
T (x)

1500

1000 X = 100
q = 0.4
p = 0.6
500

0
0 10 20 30 40 50 60 70 80 90 100
x

Uvrštavanjem gornjih razvoja u (14.11), dolazi se do


1
2n 2n 1 − n−
!
2 δ + · · ·
T ( x ) = lim − +
δ→0 δ δ 1 − N2−1 δ + · · ·
2n 2n  n−1 N−1
   
= lim − + 1− δ + ··· · 1 + δ + ···
δ→0 δ δ 2 2
2n 2n  N−1 n−1
 
2
= lim − + 1+ δ− δ + O(δ )
δ→0 δ δ 2 2
= lim [n ( N − n) + O(δ) ] .
δ→0

U granici kada u → 1 je δ = 0 i konačno je


1
T ( x ) = n ( N − n ), q=p= . (14.12)
2
Na slici 14.5, crvenom linijom je prikazan gornji izraz za X = 100 ∆ x, q = 0.4 i p = 0.6.
 n
q

−1


n N p


− , p 6= q


q−p q−p q N

  
T (x) = −1


 p



n ( N − n) p = q = 0.5.

Položaji ekstrema T ( x ) su rješenja jednadžbe


∂T ( x )

= 0,
∂x x= x0
526 Poglavlje 14. Nasumičan hod

a iznos ekstrema (maksimuma) je

Tmax = T ( x0 ).

Jednostavnim se računom dobiva, x0 = n0 ∆ x,

(q/p) N − 1
  
 ln


 N ln(q/p)
, p 6= q



x0 = ln (q/p)


N


p = q = 0.5.


2

q n0
 !
−1

n0 N p


, p 6= q



q N

 q−p q−p

 !
−1
Tmax = p



N2



p = q = 0.5.


4

Na primjeru sa slike ... , to iznosi ... dovršiti

Zadatak 14.5 (a) Čestica se nalazi u točki x = 500 ∆ x i giba po intervalu [0, 1 000 ∆ x ].
Vjerojatnosti koraka lijevo i desno su iste (difuzija). Koliki je očekivani
broj koraka čestice, prije nego završi u jednom od rubova?
(b) Čestica se nalazi u točki X = 1 000 ∆ x, intervala [0, 1 001 ∆ x ]. Vjero-
jatnosti koraka lijevo i desno su iste (difuzija). Koliki je očekivani broj
koraka čestice, prije nego završi u jednom od rubova? 

Rješenje:
(a) Ako je q = p, broj koraka se računa iz 14.12

T ( x ) = n ( N − n) = 500 (1 000 − 500) = 250 000.

(b) Opet prema 14.12 slijedi

T ( x ) = n ( N − n) = 1 000 (1 001 − 1 000) = 1 000.

Dakle, iako se čestica nalazi sasvim uz desni rub, još uvijek se očekuje da će napraviti 1 000
koraka, prije nego dospije do samog ruba.

Zadatak 14.6 Čestica se nalazi u točki x, a interval po kojemu se može gibati je


0 ≤ x < ∞. Kolika je vjerojatni broj koraka koje čestica treba napraviti
prije nego što stigne do jednog ruba, ako je
a) q > p,
b) q = p,
c) q < p? 
14.1 Nasumičan hod u jednoj dimenziji 527

Rješenje:
Kada je q 6= p, broj koraka se računa iz (14.11)
 n
q
n N p −1
T (x) = −  N , q 6= p.
q−p q−p q
p − 1

a) Kada je q > p, tada je

n N
lim T ( x ) = − lim   N .
N→∞ q− p N→∞ q
p

Drugi član desne strane sadrži neodred̄eni izraz ∞/∞, pa se rješava


L’Hospitalovim pravilom (derivacijom po X)

N 1
lim   N =    N = 0
N→∞ q q q
p ln ·
p p

i broj koraka potreban za dolazak čestice u ishodište9 je


n
T (x) = , x = n ∆ x.
q−p

tj. čestica će, nakon T ( x ) koraka, sigurno okončati svoj hod u ishodištu.
b) Ako je q = p, tada se T ( x ) računa pomoću (14.12),

T ( x ) = lim n ( N − n) = ∞.
N→∞

c) Ako je q < p, tada je opet T ( x ) dan sa (14.11), ali je sada


 N
q
lim = 0,
N→∞ p

pa je opet

T ( x ) = ∞.

Ovaj beskonačan broj koraka koji se dobiva za q ≤ p je posve razumljiv: čestica se giba po
beskonačno velikom intervalu, a vjerojatnost skokova ne preferira smjer prema ishodištu.

(C) S REDNJA UDALJENOST OD PO ČETNE TO ČKE :


Riješimo sada ovaj zadatak: čestica se nalazi u ishodištu, x = 0, jednodimenzijskog
koordinatnog sustava i pomiče se za jedno mjesto na desnu stranu s vjerojatnošću p, a
s vjerojatnošću q = 1 − p se pomiče za jedno mjesto na lijevo. Zadatak je naći vjerojat-
nost da se nakon N koraka10 , čestica nad̄e na udaljenosti x od ishodišta? Očito će, za
x = n ∆ x, broj n biti cijeli broj iz intervala

− N ≤ n ≤ + N.
9U ishodište zato jer je q > p i vjerojatnije je gibanje čestice na lijevo prema ishodištu, nego desno.
10 Primjetimo da je broj k oraka vremenska varijabla.
528 Poglavlje 14. Nasumičan hod

Budući da kod odabira smjera pomaka postoje samo DVIJE mogućnosti, vjerojatnost da
je u N pomaka čestica napravila m pomaka na desnu i N − m koraka na lijevu stranu je
dana binomnom raspodjelom (4.11)

N
 
P(m) = p m q N −m .
m

Pomak na desno povećava koordinatu čestice za jedan, a pomak na lijevo smanjuje


koordinatu za jedan. Zato je nakon N koraka položaj čestice, n, dan sa

n = m · (+1) + ( N − m) · (−1) = 2m − N. (14.13)

Iz gornjeg izraza je

N+n N−n
m= ⇒ N−m= ,
2 2
pa je sada moguće sa P(m) prijeći na P(n) (pri čemu je x = n ∆ x)

N
 
P(m) → P(n) = N +n p( N +n)/2 q( N −n)/2
2
   n/2
N p

N/2
P(n) = ( p q) N +n . (14.14)
2 q

To je vjerojatnost da se čestica koja je u početku bila u ishodištu, nakon N slučajnih


koraka nad̄e u točki s koordinatom x = n ∆ x. Srednja vrijednost koordinate x je

h x i = hni ∆ x
hni = (14.13) = 2 hmi − N = 2N p − N = N (2p − 1) = N ( p − q),

gdje je uvrštena relacija (4.17) za binomnu raspodjelu


N
hmi = ∑ m P(m) = N p.
m =0

Iz gornje se relacije vidi da ako je p = q = 12 , tada je h x i = 0, što je u skladu sa zdravo-


razumskim očekivanjem. Ako je p > 12 biti će i h x i > 0, tj. srednji pomak je na desnu
stranu i simetrično, ako je p < 21 . Slično se može izračunati i x 2 i dobiti

x2 = n2 ∆ x


n 2 = (14.13) = 4m 2 − 4mN + N 2 ,

2
n = 4 m 2 − 4 hmi N + N 2 .

Ponovno, iz binomne raspodjele je poznato, (4.18),


N
m2 = ∑ m 2 P ( m ) = N p + N ( N − 1) p 2 ,


m =0

što vodi na

2 h i
n = 4 N p + N ( N − 1) p 2 − 4N pN + N 2 = N 2 − 4N ( N − 1) pq (14.15)
14.1 Nasumičan hod u jednoj dimenziji 529

Slika 14.6: Ilustracija nasumičnog hoda u jednoj dimenziji za N = 1000 koraka i p = 0.6
(plavo) i p = 0.5 (crveno).

<x> < x > + σx


200

< x > - σx

100
p = 0.6, q = 0.4
x

< x > + σx
0
<x>

p = q = 0.5 < x > - σx

-100
0 100 200 300 400 500 600 700 800 900 1000
t

Konačno, za standardnu devijaciju se dobije


q
σn = hn 2 i − hni 2 = 2 N pq.
p

Izraz (14.15) za n 2 sadrži dva granična ponašanja: ako sudara uopće nema i ako su

sudari potpuno nasumični.


Ako uopće NEMA nasumičnih sudara s okolnim česticama, čestica je potpuno slobodna i
ona će stalno skakati samo na jednu stranu (ili je p = 1 i q = 0 ili je p = 0 i q = 1) i njezin
srednji kvadratni otklon je dan sa

2
2
n = n = N 2. (14.16)
p =0 q =0

Naprotiv, ako su sudari POTPUNO nasumični p = q = 0.5 (slučaj p = q = 0.5, opisuje


difuziju11 ), srednja vrijednost kvadrata otklona, prema (14.15) nije više kvadratna u N,
nego je linearna u N

2
n = N. (14.17)
p=q=0.5

Slika 14.6 prikazuje nekoliko jednostavnih simulacija nasumičnog hoda. Za parametre


sa slike je:
plave linije ( N = 1 000, p = 0.6)

hni = N ( p − q) = 1 000 (0.6 − 0.4) = 200,



σn = 2 N pq = 2 1 000 · 0.6 · 0.4 = 30.9839,
p

11 Vidjeti npr. u G LUMAC, Računalne metode fizike


530 Poglavlje 14. Nasumičan hod

crvene linije ( N = 1 000, p = 0.5)


hni = N ( p − q) = 1 000 (0.5 − 0.5) = 0,

σn = 2 N pq = 2 1 000 · 0.5 · 0.5 = 31.6228,
p

Vidimo da se krajnje točke svih nasumičnih putova, nakon 1 000 koraka nalaze približno
(s vjerojatnošću od oko 66 %) unutar intervala
 
hni − σn , hni + σn ,

kao što je i predvid̄eno gornjim računima.

Zadatak 14.7 Simulirajte nasumični hod čestice po osi x. Bacite kovanicu 50 puta
i odaberite koja će strana kovanice voditi na pomak u desnu, a koja u
lijevu stranu. Početni položaj čestice neka bude u x0 = 5. Prikažite hod
čestice na dijagramu, gdje ćete na apscisu nanositi redni broj bacanja
kovanice, a na ordinatu položaj čestice. Izračunajte x i σx . 

Rješenje:
dovršiti
Zadatak 14.8 dovršiti 

Rješenje:
dovršiti

(D) V JEROJATNOST DA SE ČESTICA NAKON 2 N KORAKA PONOVO NAÐE U ISHODIŠTU :


Čestica se slučajno pomiče po osi x s vjerojatnošću p pomaka na desnu i vjerojatnošću
q = 1 − p pomaka na lijevu stranu.
Ako je čestica u početku bila u ishodištu i zatim je napravila 2 N koraka, koliko postoji
različitih mogućih putanja te čestice?
Za svaki korak postoje dvije mogućnosti (lijevo i desno), pa je zato ukupan broj mogućih
putanja jednak
2 2N ,
a vjerojatnost realizacije jedne odred̄ne putanje je tada (povoljno kroz moguće) jednaka
1
.
2 2N
Koliki broj tih putanja završava u ishodištu?
Da bi putanja završila u polaznoj točki, mora biti ukupan broj koraka na desnu stranu,
ND , jednak broju koraka na lijevu stranu, NL
ND = NL , ND + NL = 2N ⇒ ND = NL = N.
Unutar ukupnog broja od 2N koraka, njih ND = NL = N se može odabrati na
2N
 

N
načina. To je broj putanja (od ukupno 2 2N putanja) koje vode na povratak čestice u
polaznu točku. Zato je vjerojatnost da se to dogodi jednaka (povoljno kroz moguće)
(2N
N) (2N )!
2N
= 2 −2N .
2 ( N!)( N!)
14.2 Nasumični hod u dvije i tri dimenzije 531

Gornji izraz vrijedi za svaki N (a ne samo za velike N).


No, gornji rezultat vrijedi samo kada je vjerojatnost koraka na desnu stranu, p, jednaka
vjerojatnosti koraka na lijevu stranu, q = 1 − p, i jednaka je 1/2. Do općenitijeg rezultata,
koji dopušta i da bude p 6= q, dolazi se koristeći binomnu raspodjelu: vjerojatnost da od
2N koraka njih n bude u desnom, a 2N − n u lijevom smjeru je

2N
 
P(n) = p n q 2N −n .
n

Ako je čestica napravila ukupno n = N koraka u desnom i 2N − n = N koraka u lijevom


smjeru (bez obzira na redoslijed tih koraka), ona će se nakon 2N koraka naći u polaznoj
točki. To znači da je

2N (2N )!
 
P( N ) = pN qN = ( pq) N
N ( N!)( N!)
vjerojatnost da se nakon 2N koraka čestica nad̄e u polaznoj točki. Gornji izraz vrijedi za
svaki N (a ne samo za velike N) i za p = q = 1/2, kao i za p 6= q.

14.2 Nasumični hod u dvije i tri dimenzije


Nekoliko jednostavnih simulaciju nasumičnog hoda u dvije dimenzije za dva odabira
vjerojatnosti skokova u x i y smjeru, prikazane se na slici 14.7. S p x je označena vjerojat-
nost skoka u pozitivnom smjeru osi x, a s q x = 1 − p x vjerojatnost skoka u negativnom
smjeru osi x. Slično vrijedi i za py , qy i y os.

Slika 14.7: Ilustracija dvodimenzijskog nasumičnog hoda sa 10 000 koraka i jednakim


vjerojatnostima skokova u x i y smjeru p x = py = 0.5 (lijevo), a različitim vjerojatnostima
p x = 0.6, py = 0.4 (desno). Na svakoj su slici prikazana po četiri nasumična hoda.

2500
N = 10 000
2000
px = py = 0.5
1500 N = 10 000
50
1000 px = 0.6, py = 0.4

500

0 0
y

-500

-1000
-50
-1500

-2000

-2500
-200 -150 -100 -50 0 50 -2500 -2000 -1500 -1000 -500 0 500 1000 1500 2000 2500
x x

Zadatak 14.9 U nekom od programskih jezika kojima vladate, sastavite program


kojim ćete napraviti slike poput 14.7. 

Poopćenje na više dimenzije se može izvesti na više načina. Npr.


(1) u svakom trenutku čestica izvodi skok i u x i u y i u z smjeru ili
(2) u svakom trenutku se najprije slučajno odredi os u kojem smjeru se izvodi skok, a
zatim se izvodi skok samo po toj osi, ili
(3) neki treći način.
532 Poglavlje 14. Nasumičan hod

Slika 14.8: Ilustracija vjerojatnosti pojedinog nasumičnog hoda.

Neka su vjerojatnosti skokova u smjerovima osi x, y i z med̄usobno nezavisne i neka


iznose
p x , py , pz .
(1) Ako je u početnom trenutku čestica bila u ishodištu, tada je, u dvije dimenzije, uz
isti broj skokova u smjeru obje osi, Nx = Ny = N
   x/2    y/2
N px N py
 
P( x, y) = P( x ) P(y) = ( p x q x ) N/2 N + x ( py qy ) N/2 N +y .
2 qx 2 qy
i u tri dimenzije, uz isti broj skokova u smjeru sve tri osi, Nx = Ny = Nz = N
   x/2    y/2
N px N py
 
N/2 N/2
P( x, y) = P( x ) P(y) P(z) = ( p x q x ) N +x ( py qy ) N +y
2 qx 2 qy
   z/2
N pz

( pz qz ) N/2 N +z .
2 q z

(2) Neka sada jedini uvjet na broj skokova u smjeru pojedine osi dan sa Nx + Ny = N

 x/2  y/2
Nx px Ny py
   
Nx /2 Ny /2
P( x, y) = P( x ) P(y) = ( p x q x ) Nx + x ( py qy ) Ny +y .
2 qx qy
2

Za velike vrijednosti N će biti


N N
Nx ' , Ny ' .
2 2
I u tri dimenzije Nx + Ny + Nz = N

p x x/2
   y/2
Nx Ny py
   
Nx /2 Ny /2
P( x, y) = P( x ) P(y) P(z) = ( p x q x ) Nx + x ( py qy ) Ny +y
2 q x q y
2
   z/2
Nz pz

( pz qz ) Nz /2 Nz +z .
2 q z
14.3 Lévyeva raspodjela 533

Za velike vrijednosti N će biti

N N N
Nx ' , Ny ' , Nz ' .
3 3 3
dovršiti

Gornji se model (i njegova poopćenja na više dimenzija) može primjeniti u:

Teoriji magnetizma, gdje se umjesto N koraka jedne čestice, promatra skup od N


nepomičnih čestica, a umjesto pomaka lijevo ili desno, svaka od N čestica može imati
dvije različite vrijednosti atomskog magnetskog momenta: +1 ili −1 (u prikladnim
jedinicama). U tom slučaju srednji položaj čestice, odgovara srednjoj magnetizaciji
sustava.

Računu intenziteta N nekoherentnih svjetlosnih izvora. Amplituda svakog izvora


se može prikazati dvodimenzijskim vektorom nasumičnog smjera. Ukupni intenzitet
svjetlosti svih N izvora je rezultat zbrajanja ovih nasumičnih vektora.

14.3 Lévyeva raspodjela


U ovom odjeljku ćemo pratiti nasumično gibanje čestice u homogenom sredstvu. To je
takod̄er jedna vrsta nasumičnog hoda kao i onog obrad̄enog u odjeljku 14.1 kod kojega
čestica nakon jediničnog vremenskog intervala čini nasumični korak (ili skok) jedinične
duljine u nasumice odabranom smjeru. Novost je u tome što sada ni dužina koraka, a
ni vrijeme izmed̄u dva koraka nije stalno isto, nego se kontinuirano mijenja u skladu s
danim raspodjelama vjerojatnosti. Radi jednostavnosti, ograničit ćemo se na gibanje u
jednoj dimenziji, po osi x.

Neka čestica s istom vjerojatnošću korača u jednu ili drugu stranu. Gustoća vjero-
jatnosti da čestica izvede korak duljine x se označava s ρ( x ). Odabiremo da je to
simetrična funkcija

ρ( x ) = ρ(− x ),

kao npr.
ρ0
ρ( x ) = , ρ0 = const.
| x |d+σ
Vrijeme čekanja izmed̄u dva koraka, τ, se takod̄er mjenja u skladu s vjerojatnošću
opisanu gustoćom vjerojatnosti

ψ ( τ ).

Obje ove gustoće, ρ i ψ, su normirane


Z +∞
ρ( x ) dx = 1,
−∞
Z +∞
ψ(τ ) dτ = 1.
0
534 Poglavlje 14. Nasumičan hod

Nasumične varijable x i τ su med̄usobno neovisne kontinuirane slučajne varijable.


Gornje dvije funkcije, ρ i ψ, u cjelosti odred̄uju svojstva transportnog procesa u ovom
sustavu.
Od središnjeg zanimanja će biti makroskopsko ponašanje gustoće čestica

n( x, t)

u točki x u trenutku t. Vjerojatnost da čestica izvede skok u vremenskom intervalu


izmed̄u 0 i t je12
Z t
ψ(τ ) dτ . (14.18)
0

S ovime u vezi, uvodi se i pojam VJEROJATNOST PREŽIVLJAVANJA Ψ(t) kao vjerojatnost


da čestica ne izvede skok prije isteka vremena t
Z t
Ψ(t) = 1 − ψ(τ ) dτ . (14.19)
0

Prva transportna jednadžba opisuje IZLAZNI tok čestica Nizl ( x, t) - koliko je čestica
napustilo točku x u jedinici vremena. Jednadžba povezuje tok iz odabrane točke u
prostoru i u odabranom vremenskom trenutku, s tokom iz svih susjednih točaka u
ranijim vremenskim trenucima
Z +∞ Z t
Nizl ( x, t) = ρ(y) ψ(τ ) Nizl ( x − y, t − τ ) dy dτ + n( x, 0) ψ(t). (14.20)
−∞ 0

Pojasnimo pojedine članove gornje jednadžbe.


Iz točke x u trenutku t mogu izaći čestice koje su već bile u x od trenutka t = 0 i sve do t
nisu izvele skok (to je drugi član desne strane). Isto tako iz x u trenutku t mogu izaći
i sve one čestice koje su u vremenskom intervalu (0, t) došle u točku x iz neke druge
točke (prvi član desne strane). Ove čestice koje su u intervalu (0, t) došle u točku x jesu
izlazne čestice za neke druge točke x − y iz kojih su izvele skok dužine y s vjerojatnošću
ρ(y). U skladu s (14.18), u prvom članu desne strane dio sa ψ(τ ) dτ osigurava da će
čestica iz točke x − y izvesti skok unutar vremenskog intervala (0, t).
Kada ne bi bilo prvog člana desne strane, sav tok iz točke x bi dolazio od čestica koje se
već od početka (od t = 0) nalaze u točki x i napuštaju ju tijekom vremena s vjerojatnošću
ψ ( t ).
Slijedeći korak u izvodu se sastoji u tome da se izlazni tok čestica u prethodnom
vremenu i u drugim točkama, poveže s gustoćom čestica u točki x i u trenutku t.
Z +∞ Z t
n( x, t) = ρ(y) Ψ(τ ) Nizl ( x − y, t − τ ) dy dτ + n( x, 0) Ψ(t). (14.21)
−∞ 0

U skladu s (14.19), drugi član desne strane je vjerojatnost da čestica koja bila u točki x u
t = 0, ostane u toj točki i u trenutku t (nije izvela skok).
Prvi član desne strane opisuje sve čestice koje su u intervalu od (0, t) došle iz točke x − y
u točku x izvodeći, s vjerojatnošću ρ(y), skok duljine y (dio sa ρ(y) Nizl ( x − y, t − τ )) i
ostale su u x (dakle nisu izvele skok, što opisuje član Ψ(τ )).
Sustav dvije integralne jednadžbe (14.20) i (14.21) rješava se kombiniranjem Fourierove
12 Ili u trenutku 0 ili u trenutku d τ ili u trenutku 2 d τ ili ....
14.3 Lévyeva raspodjela 535

(u prostornoj varijabli) i Laplaceove (u vremenskoj varijabli) preobrazbe13 . Varijabla


Fourierove prebrazbe neka je k, a Laplaceove neka je ω
Z +∞
1
F (k) = √ f ( x ) eı k x d x, Fourier
2π −∞
Z +∞
F (ω ) = f ( t ) e− ω t d t Laplace.
0

14.3.1 Karakteristična funkcija


problemu Lévyeve raspodjele može se pristupiti i nešto općenitije, preko karakteristične
funkcije. Definira se karakteristična funkcija ovisna o dva parametra a i α
α
e (k; a, α) = e −a|k| .
Z (14.22)

Ova je funkcija dobro definirana samo za 0 < α ≤ 2, jer je, kao što će se kasnije vidjeti,

2
x = 0, α > 2,

i varijanca σ 2 = x 2 − h x i 2 je imaginarna. U odjeljku 6.3 je, relacijama (6.28) i (6.30)



dana veza izmed̄u karakteristične funkcije i raspodjele gustoće vjerojatnosti kontinu-


irane slučajne varijable x
Z +∞ Z +∞
1
Z
e (k) = e ı k x ρ( x ) dx , ⇔ ρ( x ) = e− ı k x Z
eX (k ) dk .
−∞ 2π −∞

Pomoću gornjih veza, iz poznate karakteristične funkcije, računa se raspodjela gustoće


vjerojatnosti. Zapravo, s dvije karakteristične funkcije oblika (14.22) smo se već sreli.
Za α = 1, to je karakteristična funkcija Cauchyeve raspodjele (čija je varijanca besko-
načna, relacija ...), zadatak ??,

e ( k ) = e − a|k| , 1 a
Z ⇔ ρ( x ) = ,
π a + x2
2

a za α = 2, to je karakteristična funkcija Gaußove raspodjele, (6.37),

( x − h X i) 2
1 2 2 1
 

Z (k ) = exp ı k h X i − σ k ,
e ⇔ ρ( x ) = √ e 2 σ2 .
2 σ 2π
Pogledajmo kako izgleda raspodjela gustoće vjerojatnosti kada α nije niti jedan niti dva.
Ono što će se dobiti jeste da parametar α kontrolira repove raspodjele, tj. vrlo male,
x → 0 i vrlo velike, x → ∞ vrijednosti slučajne varijable.
Izračunajmo, relacijom (6.30), raspodjelu gustoće vjerojatnosti pridruženu karakteristič-
noj funkciji (14.22)
Z +∞ Z +∞
1 −ı k x − a|k| α 1
cos(k x ) e −ak dk = ρ(− x ).
α
ρ( x ) = e e dk =
2π −∞ π 0

Zbog parnosti ρ( x ) = ρ(− x ), ograničit ćemo se na pozitivne x = | x |.


RAZVOJ ZA VELIKI | x |
Uvedimo novu varijablu integracije t relacijom

k | x | = t.
13 Vidjeti npr. u G LUMAC, Matematičke metode fizike
536 Poglavlje 14. Nasumičan hod

U toj varijabli je
Z +∞ ∞ n Z +∞
1 − at α dt 1 −a 1
  
ρ( x ) =
π 0
cos(t) exp
|x| α
=
|x| π |x| ∑ |x| α n! 0
t nα cos(t) dt.
n =0
Gornji integral je tablični (A.53)
Z +∞  πa 
x a−1 cos( x ) dx = cos
Γ ( a ), 0 < Re( a) < 1.
0 2
Njegovim uvrštavanjem u prethodni izraz se za raspodjelu gustoće vjerojatnosti dobiva


1 (−1) n+1 a n  nπα 
ρ( x ) =
π ∑ n! | x | nα+1
sin
2
Γ(nα + 1).
n =1

To je egzaktan izraz. Za velike vrijednosti | x |, dominantan doprinos dolazi od prvog


člana
1 a  πα  1
ρ( x ) ' 1
sin Γ ( α + 1) + . . . ∼ .
π |x| α + 2 | x | α +1
RAZVOJ ZA MALI | x |
U suprotnoj granici, u granici malih vrijednosti | x |, račun ρ se započinje razvojem
kosinusa u red oko x = 0

| x | 2n (−1) n
Z +∞ Z +∞
1 1
− ak α
∑ k 2n e −ak dk .
α
ρ( x ) = cos(k | x |) e dk =
π 0 π n =0 (2n)! 0

Sada se uvodi nova varijabla integracije, t, relacijom


t = ak α .
U toj je varijabli

| x | 2n (−1) n −(2n+1)/α
Z +∞
1
ρ( x ) =
πα ∑ (2n)!
a
0
t (2n+1)/α−1 e −t dt.
n =0
U gornjem integralu se prepoznaje gama-funkcija (4.91)
Z +∞
Γ(z) = x z−1 e− x d x, z ∈ C, Re z > 0,
0
što vodi na egzaktni izraza za raspodjelu gustoće vjerojatnosti
1 ∞
| x | 2n (−1) n −(2n+1)/α
ρ( x ) =
πα ∑ (2n)!
a Γ[(2n + 1)/α].
n =0
Gornji izraz divergira za α < 1 i konvergira za 1 < α < 2 (dakle, po vrijednosti α,
raspodjela je pozicionirana izmed̄u Cauchyeve i Gaußove) i | x | α < a. Za male vrijednosti
| x |, dominantan doprinos za ρ dolazi od člana s n = 0, koji je konstantan u x
Γ(1/α)
ρ( x ) ' + ....
πα a 1/α
slika Randall Fig 1
U granici kada i | x | → 0 i α → 0 (dovršiti) je
Γ(1/α) x2
  r
π
ρ( x ) ' exp − 2 , σ= (1 − e −1 )α 3/2 .
πα 2σ 2
Iz gornjeg izraza se vidi da središnji dio (mali | x |) Lévyeve raspodjele, u granici malog
α, ima oblik Gaußove raspodjele sa širinom srazmjernom s α 3/2 .
14.3 Lévyeva raspodjela 537

14.3.2 Lévyev let


Postoji razlika izmed̄u Lévyevog hoda (Lévy walk) i Lévyevog leta (Lévy flight). Kod
Lévyevog hoda je vrijeme izmed̄u pojedinih koraka varijabilno i ovisi o duljini koraka.
S druge strane, kod Lévyevog leta je vrijeme izmed̄u koraka neovisno o duljini koraka
(isto je i za velike i za male korake). U nastavku odjeljka govorit će se o Lévyevom letu
s namjerom da se time modelira jedna vrsta difuzije.
dovršiti

—— —— ———– —– ——– ——- ——– ———- ——— ——— ——— ———–


dovršiti Klafter et al. 1987

Ψ(ω )
G (k, ω ) = .
1 − ψ(ω )ρ(k)

Z +∞
n( x, t) = G ( x − y) n(y, 0) dy .
−∞

Za nastavak računa treba specificirati oblik gustoća ρ i ψ. Neka su


1 1 Γ( β + 1/2)
ρ( x ) = h i1/2+ β · √ , β > 0,
x0 π Γ( β)
1 + ( x/x0 )2
1 γ
ψ(τ ) = h i 1+ γ · τ , γ>0
0
1 + τ/τ0

Provjeriti normiranje.
Točni detalji ovih raspodjela nisu kvalitativno važni u asimptotskoj granici. Presudni su
njihovi repovi u obliku potencije koji odred̄uju ponašanje momenata ovih raspodjela
(svi ostali detalji će biti apsorbirani u konstantne prefaktore).
Dva su važna momenta: srednja vrijednost kvadrata dužine skoka
Z +∞
x2 = x 2 ρ( x ) dx ,

−∞
i srednje vrijeme čekanja izmed̄u dva uzastopna skoka
Z +∞
hτ i = τ ψ(τ ) dτ .
0
Kada su obje ove veličine konačne, rezultantna transportna jednadžba se svodi na
standardnu difuzijsku jednadžbu
∂n
= D 4 n( x, t),
∂t
538 Poglavlje 14. Nasumičan hod

s difuzijskim koeficijentom

2
x
D= .
2 hτ i
14.3 Lévyeva raspodjela 539

Literatura korištena u ovom poglavlju:

1. M ARTIN Z. B AZANT.
Random walks and diffusion. 2006. URL: https : / / ocw . mit . edu / courses /
mathematics / 18 - 366 - random - walks - and - diffusion - fall - 2006 / lecture -
notes/
2. N EVEN E LEZOVI Ć.
Vjerojatnost i statistika 3 - matematička statistika i stohastički procesi. Element, Zagreb,
2007
3. J OSÉ L UIS G ARCIA -PALACIOS. „
Introduction to the theory of stochastic processes and Brownian motion problems”.
(2007). URL: arxiv.org/abs/cond-mat/0701242
4. C HARLES M. G RINSTEAD I J. L AURIE S NELL.
Introduction to probability. 2019. URL: https://www.math.dartmouth.edu/~prob/
prob/prob.pdf
5. P. H SU H WEI.
Theory and problems of probability, random variables and random processes. McGraw -
Hill, 1997
6. F REDERICK R EIF.
Fundamentals of Statistical and Thermal Physics. McGraw-Hill, 1967
7. S HELDON M. R OSS.
Introduction to Probability Models. 2019. URL: https://fac.ksu.edu.sa/sites/
default/files/introduction-to-probability-model-s.ross-math-cs.blog_
.ir_.pdf
8. V LADIMIR V RANI Ć.
Vjerojatnost i statistika. Tehnička knjiga, Zagreb, 1971
9. S VETOZAR V. V UKADINOVI Ć.
Zbirka rešenih zadataka iz teorije verovatnoće. Privredni pregled, Beograd, 1990
Dodatak
A. Matematički dodatak

A.1 Taylorov razvoj

∞ n
1

∂ ∂ ∂
f ( x, y, z) = f ( x0 , y0 , z0 ) + ∑ ( x − x0 ) + ( y − y0 ) + ( z − z0 ) f ( x, y, z)

n =1
n! ∂x ∂y ∂z x0 ,y0 ,z0
(A.1)
Iz razvoja eksponencijalne funkcije

x2 x3 xn
ex = 1 + x + + + ··· = ∑ , (A.2)
2 6 n =0 n !

posredstvom Eulerove formule


ei α = cos α + i sin α, i 2 = −1 (A.3)
dolazi se do razvoja trigonometrijskih funkcija

x3 x 2n−1
sin( x ) = x − + ··· = ∑ (A.4)
6 n =1
(2n − 1) !

x2 x 2n
cos( x ) = 1 − + ··· = ∑ . (A.5)
2 n=0 (2n ) !

x2 x3 xn
ln (1 + x ) = x − + + · · · + (−1)n+1 + ··· − 1 < x ≤ 1, (A.6)
2 3 n
x2 x3 xn
 
ln (1 − x ) = − x + + + ··· + + ··· − 1 ≤ x < 1, (A.7)
2 3 n
1+x x3 x5 x 2n+1
   
ln =2 x+ + + ··· + + ··· − 1 < x < 1, (A.8)
1−x 3 5 2n + 1
1 1 4 1 6
ln [cosh( x )] = x 2 − x + x + ··· x → 0, (A.9)
2 12 45
544 Poglavlje A. Matematički dodatak

1 1 1·3 2 1·3·5 3
√ =1∓ x+ x ∓ x + ··· |x| < 1 (A.10)
1±x 2 2·4 2·4·6

1
= 1 ∓ x + x2 ∓ x3 + x4 ∓ · · · |x| < 1 (A.11)
1±x

1 3 3·5 2 3·5·7 3
=1∓ x+ x ∓ x ··· |x| < 1 (A.12)
(1 ± x )3/2 2 2·4 2·4·6

1 1·3 2 1·3·5 3
(1 + α)−1/2 = 1 − α+ α − α + ... − 1 < x ≤ +1
2 2·4 2·4·6
N N
   
2
(1 ± α ) N = 1± Nα + α ± α3 + · · ·
2 3

x3 x5  
sinh x = x + + + O x7 , −∞ < x < +∞
6 120

x2 x4  
cosh( x ) = 1 + + + O x6 , −∞ < x < +∞
2 24

x3 2 x5  
tanh( x ) = x − + + O x7 ,
3 15

A.2 Redovi

N
qN − 1
∑ q n −1 =
q−1
, (A.13)
n =1
N
q N +1 − 1
∑ qn =
q−1
, (A.14)
n =0
N −1
a − [ a + ( N − 1)r ] q N 1 − q N −1
∑ ( a + nr ) q n =
1−q
+ qr
(1 − q ) 2
, (A.15)
n =0

1
∑ qn =
1−q
|q| < 1, (A.16)
n =0
∞ ∞
q
∑ n · qn = ∑ n · qn =
(1 − q ) 2
|q| < 1, (A.17)
n =0 n =1
N
1
∑ [a 1 + ( n − 1) d ] =
2
N ( a1 + aN ) (A.18)
n =1
A.2 Redovi 545
546 Poglavlje A. Matematički dodatak

A.3 Neodred̄eni integrali


 3/2 1 p
Z   
1 − x 2/3 dx = 1 − x 2/3 −8x 5/3 + 14x − 3x 1/3
16
 
+ 3 arcsin x 1/3 (A.19)
Z
x dx x b
= − 2 ln | ax + b|, (A.20)
ax + b a a
Z
dx 2 b + 2cx
 
=√ arctan √ , (A.21)
a + bx + cx 2 4ac − b 2 4ac − b 2
Z
dx 1 a + x 1 −1 x
 
= ln = tanh , | x | < a, (A.22)
a2 − x2 2a a − x a a
Z
dx 1 x
= arctan , (A.23)
a2 + x2 a a
Z
x dx 1
= ± ln a 2 ± x 2 , (A.24)

a2±x 2 2
Z
dx 1 (a ± x) 2 1 2x ∓ a
   
√ = ± 2 ln 2 + √ atan √ , (A.25)
a3 ± x3 6a a ∓ ax + x 2 a2 3 a 3
Z
x dx 1 a 2 ∓ ax + x 2 1 2x ∓ a
3 3
= ln 2
± √ arctan √ , (A.26)
a ±x 6a (a ± x) a 3 a 3
Z
dx 1 a + x
+ 1 arctan x ,
 
= ln (A.27)
4a 3 a − x 2a 3

a4 − x4 a
Z
dx x
√ = arcsin , (A.28)
a2 − x2 a
Z
x 2 dx 1 p a x
 
√ 2
= − x a − x + arcsin √ , (A.29)
a − x2 2 2 a
1
Z p h  i
x x 2 + a 2 + a 2 ln x + x 2 + a 2 + cons.
p p
x 2 + a 2 dx = (A.30)
Z 2
dx  p 
√ = ln x + a 2 + x 2 + c, (A.31)
a2 + x2
Z
dx x
= 2 2 , (A.32)
(a 2 2
+x ) 3/2 a ( x + a 2 ) 1/2
√1 ..., α>0


 α
√1 ...,
Z
α > 0, ∆ > 0

dx


α
= √1 ..., (A.33)
2 α > 0, ∆ = 0
p
αx + βx + γ   α 
 √−1 arcsin 2αx



, α < 0, ∆ < 0


−α −∆
Z √ Z
x dx a x2 + b x + c b dx
√ = − √ (A.34)
2
ax + bx + c a 2a 2
ax + bx + c
Z
dx 1 βx + 2γ
 
=√ arcsin √ , ∆ = 4αγ − β 2 , (A.35)
2
x αx + βx + γ − x −∆
p
γ
Z
e ax
e ax sin(bx ) dx = 2 [ a sin(bx ) − b cos(bx )]. (A.36)
a + b2
A.4 Odred̄eni integrali 547


p tan( ax
 
2 )+q

 √2 arctan √ , p2 > q2
a p 2 −q 2 p 2 −q 2
Z 
dx


= √ 2 2 (A.37)
p + q sin( ax )  p tan( ax
2 )+q− q −p
√ 12 ln √ 2 2, p 2 < q 2.



a q −p2 p tan( ax
2 )+q+ q −p

(b−c) tan( ax

√2 2 )
 arctan √ , b2 > c2
a b 2 −c 2 b 2 −c 2

dx
Z 

= √ (A.38)
b + c cos ax  (c−b) tan( ax 2 2
√1 2 )+√c −b
ln , b2 < c 2.


ax
a c 2 −b 2 (c−b) tan( 2 )− c −b 2
2

x n ax n
Z Z
x n e ax dx = e − x n−1 e ax dx (A.39)
a a
(A.40)

A.4 Odred̄eni integrali

1
Γ n+
Z +∞ 
n − ax 2 2
x e dx = (n+1)/2 , a > 0, n > −1
0 2a

1 · 3 · . . . · (2k − 1) √

 π n = 2k
2k+1 ak+1/2



= (A.41)
k!
n = 2k + 1.



2ak+1
Z +∞
x a − 1 π
dx = , 0 < a < b, (A.42)
0 1+x b b sin aπb
(A.43)

Z ∞
Γ ( n + 1)
x n e−ax dx = . (A.44)
0 a n +1
548 Poglavlje A. Matematički dodatak

Z +∞ r
π b 2 /(4a)
− ax 2 +bx
e e dx =, a > 0, (A.45)
−∞ a
Z +∞ √  2
2 b π b
x exp − ax + bx dx = exp , Re ( a) > 0, (A.46)
 
−∞ 2a 3/2 4a

(b 2 + 2a) π b 2 /(4a)
Z +∞
2 − ax 2 +bx
x e dx = e , Re ( a) > 0,
−∞ 4 a 5/2
(A.47)

b(b 2 + 6a) π b 2 /(4a)
Z +∞
2 + bx
x 3 e−ax dx = e , Re ( a) > 0,
−∞ 8 a 7/2
(A.48)
Z +∞ [n/2]
n
r  
− ax 2 +bx π b 2 /(4a)
−∞
n
x e dx =
a
e ∑ 2k
(2k − 1)!! (2a) k−n b n−2k , a > 0,
k =0

(A.49)
 
k +1
1 Γ 4
Z +∞
k −a x 4
x e dx = , a>0 (A.50)
−∞ 2 a(k+1)/4
Z +∞
b Γ(1/b)
e−ax dx = , (A.51)
0 b a1/b
Z +∞  πa 
x a−1 sin( x ) dx = sin Γ ( a ), −1 < Re( a) < 1 (A.52)
0 2
Z +∞  πa 
a −1
x cos( x ) dx = cos Γ ( a ), 0 < Re( a) < 1 (A.53)
0 2
Z +∞
1 π −ω 2 /(4λ)
r
2
e−λx cos(ωx ) dx = e , λ>0 (A.54)
0 2 λ
Z +∞
2 sin( kx ) k
 
π
e−λx dx = er f √ (A.55)
0 x 2 2 λ
Z ∞
1
−  µ/ν
x µ dx 1 p Γ(µ/ν) Γ(n + 1 − µ/ν)
n 1
= n 1
,
( p + qx ) ν + νp + q Γ ( n + 1)
0

0 < µ/ν < n + 1 (A.56)

+∞
Z
n n
! r
1 (2π ) n 1 ~ T −1 ~
 
exp −
2 ∑ xi Ai,j x j + ∑ Bi xi n
d x=
Det A
exp
2
B A B .
−∞ i,j=1 i =1

1 · 3 · 5 · · · (2n − 1) π (2n − 1) !! π
Z π/2
sin2n ( x ) dx = = , (A.57)
0 2 · 4 · 6 · · · (2n) 2 (2n) !! 2
2 · 4 · 6 · · · (2n) (2n) !!
Z π
sin2n+1 ( x ) dx = 2 =2 , (A.58)
0 3 · 5 · · · (2n − 1)(2n + 1) (2n + 1) !!
sin2 ( ax )
Z +∞
π
dx = | a |. (A.59)
0 x2 2
A.4 Odred̄eni integrali 549

♣ Integrali trigonometrijskih funkcija - najčešće zamjene


sinm ( x ) cosn ( x ) dx
R

(1) cos( x ) = t, m > 0, neparan,


(2) sin( x ) = t, n > 0, neparan,
(3) tan x = t, m + n < 0, parno.
Univerzalna trigonometrijska zamjena
2t
sin( x ) = ,
1 + t2
1 − t2
cos( x ) = ,
1 + t2
2 dt
dx = .
1 + t2

1h i
cosh(α + β) · cosh(α − β) = cosh(2 α) + cosh(2 β) (A.60)
2

sin(α) = cos(π/2 − α) (A.61)


Neka je
N = 2M + 1,
l = 1, 2, · · · , M,
tada je
M
2π · m · l 1
 
∑ cos
N
=−
2
(A.62)
m =1

Neka je
N = 2M + 1,
k = 1, 2, · · · , M,
l = 1, 2, · · · , M,
tada je
N−2

 k = l,
4

M
2π · m · k 2π · m · l
    

∑ cos
N
cos
N
= (A.63)
m =1
 1
k 6= l .

 −
2

Neka je
N = 2M + 1,
l = 1, 2, · · · , M,
k = M + 1, M + 2, · · · , 2M,
tada je
N

M 
2π · m · k
 
2π · m · l
  −
 k + l = N,
4
∑ sin
N
sin
N
= (A.64)
m =1

0 k + l 6= N .

550 Poglavlje A. Matematički dodatak

A.5 Gaußian or Stratonovich-Hubbard transformation


r Z +∞ √
a2 N 2 2N
e = e− x N/2+ a x
dx . (A.65)
2π −∞

http://en.wikipedia.org/wiki/Hubbard-Stratonovich_transformation

- Canning, JPA, 25, 1992, 4723-35, Canning, JPA, 26, 1993, 3029-36.
- A. Campa, T. Dauxois, S. Ruffo Statistical mechanics and dynamics of solvable models with
long-range interactions Phys. Rev. 480 (2009) 57-159
- A. Campa, A Giansanti, d Moroni Canonical solution of classical magnetic models with
long-range couplings J. Phys. A 36 (2003) 6897 - Nishimori, Ch 2

Z +∞
c y 2 /2 1 2 / (2 c )+ xy
e =√ e −x dx , (A.66)
2π c −∞

a +∞
r Z
b 2 /(4a) 2
e = e−aφ +b φ d φ, (A.67)
π −∞
Z +∞ √
2 1 2
ea = √ e−φ /2+a φ 2 d φ, (A.68)
2 π −∞
r Z +∞ √
a2 N 2
e = e− x N/2+a x 2 N dx (A.69)
2 π −∞
r Z +∞
2 1 2
e −a x /2 = e−y /(2 a)−ı y x d y, (A.70)
2 π a −∞
r Z +∞
a S2 1 2
e = e−z /(4 a)+S z d z, Re a > 0, (A.71)
4 π a −∞
+∞
r Z
b m2 b 2
e = e−b x +2 m b x dx , (A.72)
π −∞
aN +∞ −aNm 2 /2+amx√ N
r Z
2
e a x /2 = e d m, (A.73)
2π −∞
r Z +∞
1
Ks 2 K 1 2
e 2 = e− 2 Kφ +Ksφ dφ, (A.74)
2π −∞
s
Det K +∞
Z
1 1
e 2 ∑i,j Ki,j si s j = N
dφ1 · · · dφN e− 2 ∑i,j φi Ki,j φj +∑i,j si Ki,j φj . (A.75)
(2π ) −∞
s
Z +∞
1
∑i,j Ki,j si s j 1 −1
− 12 ∑i,j φi Ki,j φj +∑i,j si φj
e 2 = dφ 1 · · · dφ N e . (A.76)
Det K(2π ) N −∞

♣ B.-S., 474, (2)


1
Γ n+
Z +∞ 
n − ax 2 2
x e dx = , a > 0, n > −1
0 2 a(n+1)/2
1 · 3 · . . . · (2k − 1) √

 π n = 2k
2k+1 ak+1/2



=
 k!

n = 2k + 1.


2ak+1
A.5 Gaußian or Stratonovich-Hubbard transformation 551


1 · 3 · 5 · · · (2n − 1) π
Z π/2
sin2n ( x ) dx = .
0 2 · 4 · 6 · · · (2n) 2
♣ Luijten-Bloete, Int. J. Mod. Phys. C 6 (1995) 359-370, p. 8
 
k +1
Z +∞
4 1 Γ 4
dx x k e −a x = , a > 0.
−∞ 2 a ( k + 1 )/4

♣ B. - S., 477, (19)


sin2 ( ax )
Z +∞
π
dx = | a |.
0 x2 2

dx
Z
√ = arcsin( x ) + c0
1 − x2


p tan( ax
 
2 )+q

 √ 22 arctan √ , p2 > q2
a p −q 2 p 2 −q 2

dx
Z 

= √ 2 2
p + q sin( ax )  
p tan( ax
2 )+q− q −p
√ 12 ln √ 2 2 , p 2 < q 2.



a q −p2 p tan( ax
2 )+q+ q −p


h √ i
√2 ax
b2 − c2 , b2 > c2

arctan f rac(b − c) tan 2
a b 2 −c 2

dx
Z 

= √
b + c cos ax  (c−b) tan( ax 2
2 )+√c −b
2
√1 ln , b 2 < c 2.

 ax
a c 2 −b 2 (c−b) tan( 2 )− c −b 2
2

♣ Integrali trigonometrijskih funkcija - najčešće zamjene


sinm ( x ) cosn ( x ) dx
R

(1) cos( x ) = t, m > 0, neparan,


(2) sin( x ) = t, n > 0, neparan,
(3) tan x = t, m + n < 0, parno.
Univerzalna trigonometrijska zamjena
2t
sin( x ) = ,
1 + t2
1 − t2
cos( x ) = ,
1 + t2
2 dt
dx = .
1 + t2
♣ Jakobijan prijelaza iz jednog u drugi koordinatni sustav
∂ x1 ∂ x1
 
···
 ∂ x10 ∂ xN 0 
.. .. ..
 
dx1 dx2 · · · dx N = Det  . . .  d x10 d x20 · · · d x N
0
.
 
∂ xN ∂ xN 
 
···

∂ x1 0 ∂ xN 0
552 Poglavlje A. Matematički dodatak

♣ Hesse-ova matrica
In mathematics, the Hessian matrix (or simply the Hessian) is the square matrix of
second-order partial derivatives of a function; that is, it describes the local curvature of
a function of many variables. The Hessian matrix was developed in the 19th century
by the German mathematician Ludwig Otto Hesse and later named after him. Hesse
himself had used the term "functional determinants". Given the real-valued function
f ( x1 , x2 , . . . , xn ), if all second partial derivatives of f exist, then the Hessian matrix of f is
the matrix

H ( f )ij ( x ) = di d j f ( x ),

where x = ( x1 , x2 , ..., xn ) and di is the differentiation operator with respect to the ith
argument and the Hessian becomes
 2
∂ f ∂2 f ∂2 f

2 ∂x1 ∂x2 · · · ∂x1 ∂xn 
 ∂x1
 
 2 2 2

 ∂ f ∂ f ∂ f 
 ∂x2 ∂x1 ∂x2 2 · · · ∂x2 ∂xn 
H( f ) = 
 
 
 . .. .. .. 

 .. . . . 
 
 
 2 2 2

∂ f ∂ f ∂ f
∂xn ∂x1 ∂xn ∂x2 · · · ∂x 2
.
n

Some mathematicians [1] define the Hessian as the determinant of the above matrix.
Hessian matrices are used in large-scale optimization problems within Newton-type
methods because they are the coefficient of the quadratic term of a local Taylor expansion
of a function. That is,
1
y = f (x + δx) ≈ f (x) + J (x)δx + δxT H (x)δx
2
where J is the Jacobian matrix, which is a vector (the gradient) for scalar-valued functi-
ons. The full Hessian matrix can be difficult to compute in practice; in such situations,
quasi-Newton algorithms have been developed that use approximations to the Hessian.
The most well-known quasi-Newton algorithm is the BFGS algorithm.

♣ Leibnitzova formula za derivaciju odred̄enog integrala (Arfken-Weber, p. 507, pr.


8.6.13)
Z h(α) Z h(α)
d ∂ f ( x, α) dh(α) dg(α)
f ( x, α) dx = dx + f [h(α), α] − f [ g ( α ), α ] . (A.77)
dα g(α) g(α) ∂α dα dα

♣ Leibtnitz: n-ta derivacija umnoška


n   m
dn n d f ( x ) dn − m g ( x )
dx n
[ f ( x ) · g ( x )] = ∑ m dx m dx n−m
.
m =0

A.6 Razvoji u red



A.7 Koordinatni sustavi 553

A.7 Koordinatni sustavi


Cilindrični koordinatni sustavi (Arfken-Weber, p. 408. pr. 6.7.2)
(a) kružni cilindar

x = ρ cos( ϕ),
y = ρ sin( ϕ).

(b) eliptički cilindar

x = a cosh(u) cos(v),
y = a sinh(u) sin(v).

(c) parabolički cilindar

x = ξ η,
1 2 
y = η − ξ2 .
2

(d) bipolarni

a sinh(η )
x = ,
cosh(η ) − cos(ξ )
a sin(η )
y = .
cosh(η ) − cos(ξ )

Poopćeni sferni koordinatni sustav:


Sferni koordinatni sustav se može i poopćiti s tri dimenzije na proizvoljan broj dimenzija
d. Neka su, umjesto s x, y, z, pravokutne koordinate označene s

x1 , x2 , · · · , x d ,

R, θ1 , θ2 , · · · , θd−1

neka su sferne koordinate u d-dimenzijskom prostoru. Veza med̄u njima je dana relaci-
jama

x1 = R cos(θ1 ),
x2 = R sin(θ1 ) cos(θ2 ),
x3 = R sin(θ1 ) sin(θ2 ) cos(θ3 ),
..
.
xd−1 = R sin(θ1 ) sin(θ2 ) · · · sin(θd−2 )cos(θd−1 ),
xd = R sin(θ1 ) sin(θ2 ) · · · sin(θd−2 ) sin(θd−1 ).
554 Poglavlje A. Matematički dodatak

Odgovarajući integrali se računaju kao


Z Z Z ∞ Z Z ∞
dd x = dΩd R d −1 d R = dΩd−1 [sin(θd−1 )] d−2 dθd−1 R d−1 d R,
0 0
2 π d/2
Z Z 2π Z π Z π
dΩd = d θ1 sin(θ2 ) dθ2 · · · [sin(θd−1 )] d−2 dθd−1 =
0 0 0 Γ(d/2)
Z π
= Ω d −1 [sin(θd−1 )] d−2 dθd−1
0

Ω1 = 2,
Ω2 = 2 π,
Ω3 = 4 π,
Ω4 = 2 π 2 ,
8 2
Ω5 = π ,
3
Ω6 = π 3 ,
16 3
Ω7 = π ,
15
1 4
Ω8 = π ,
3
32 4
Ω9 = π ,
105
1 5
Ω10 = π .
12

A.8 Specijalne funkcije


Riemannova ζ funkcija (Arfken-Weber, Fourierovi redovi, 7.18)


(−1)n−1   1 1 1
η (s) = ∑ ns
= 1 − 21− s
ζ (s) = 1 − s + s − s + · · ·
2 3 4
n =1

Lerch


1
ζ ( a, s) = ∑ (n + a)s
, ζ (1, s) = ζ (s)
n =0

p
1 n
 

ps ∑ ζ
p
,s = ζ (s)
n =1

Besselova funkcija reda 0


Z 2π Z 2π q
ı z1 cos θ +ı z2 sin θ ı z cos θ
J0 (z) = dθ e = dθ e , z= z12 + z22 .
0 0
A.9 Linearna algebra 555

Modificirana Besselova funkcija reda 0


Z 2π Z 2π q
I0 (z) = d θ ez1 cos θ +z2 sin θ = d θ ez cos θ , z= z12 + z22 .
0 0

DIRACOVA δ- FUNKCIJA
- Multidimensional delta functions: Cd-1 /Methematics/MathematicalPhysics/Kelly/note4.pdf
- Arfken-Weber, p. 81
- Poissonova jednadžba za gravitacijsko polje, A-W, p. 80

δ( x − a) = 0, x 6= a,
Z
f ( x ) δ( x − a) dx = f ( a ),

g( xn ) = 0, g 0 ( xn ) 6= 0 n = 1, 2, · · · , N.

Z ∞ N
1
−∞
f ( x ) δ[ g( x )] dx = ∑ |g 0 (x n )|
f ( x n ).
n =1

N
δ( x − xn )
δ[ g( x )] = ∑ | g 0 ( xn )|
g( xn ) = 0, g 0 ( xn ) 6= 0.
n =1

Z +∞
1
δ(t − x ) = eı ω ( t − x ) d ω
2π −∞

Gama funkcija

Γ ( n ) = ( n − 1) !

Aproksimativna Stirlingova formula

1 1 1
ln (n !) = n ln n − n + ln (2 π n) + − + ··· . (A.78)
2 12 n 360 n 3

1 √ 3 1√ 5 3√
     
Γ = π, Γ = π, Γ = π,
2 2 2 2 4

A.9 Linearna algebra


R ANG matrice je broj njezinih svojstvenih vrijednosti različitih od nule.
556 Poglavlje A. Matematički dodatak

A.10 Redovi
Neka je

N = 2M + 1,
l = 1, 2, · · · , M,

tada je

M
2π · m · l 1
∑ cos
N
=−
2
(A.79)
m =1

Neka je

N = 2M + 1,
k = 1, 2, · · · , M,
l = 1, 2, · · · , M,

tada je

N−2

 k = l,
4

M
2π · m · k 2π · m · l


∑ cos
N
cos
N
=
m =1
 1
k 6= l .

 −
2

Neka je

N = 2M + 1,
l = 1, 2, · · · , M,
k = M + 1, M + 2, · · · , 2M,

tada je

N

M
2π · m · k 2π · m · l
 − k + l = N,
4

∑ sin
N
sin
N
=
m =1

0 k + l 6= N .

A.11 Trigonometrija

x cosh( x ) − 1
sinh2 =
2 2
x cosh( x ) + 1
cosh2 =
2 2


A.12 Mali trikovi 557

2π 4π 1
cos+ cos = − ,
5 5 2

2π 2 4π 2 3
   
cos + cos = ,
5 5 4
2π 4π 1
cos · cos = − .
5 5 4

1h i
cosh(α + β) · cosh(α − β) = cosh(2 α) + cosh(2 β)
2

sin(α) = cos(π/2 − α)

tanh( x ) ± tanh y
tanh( x ± y) =
1 ± tanh( x ) tanh y

A.12 Mali trikovi


♠ Journal of Statistical Physics, Vol 45, Nos. 3/4, Nov 1986, p. 481
Glasser, Privman, Schulman
!2
1 N
N i∑
Si S j → Si ,
=1

a zatim na kvadrat primjeniti Gaußovu (Stratonovich-Hubbard) transformaciju

♠ cm-0204424, Ghulghazaryan et al
 
C N + d N = ∏ C + e 2 π ı n/N d ,
n

where
n = 1, 2, · · · , N, N odd,
1 3 N−1
n = , ,··· , , N even.????
2 2 2

♠ cm-9707072, Alves, de Felicio, Hansmann, Int. J. Mod. Phys. C, 1997, p. 4


 
ln( a + b) = ln b + ln 1 + eln a−ln b
558 Poglavlje A. Matematički dodatak

♠ Diep & Giacomini, p. 24-5


K1 σ1 + K2 σ2
cosh = A eK σ1 σ2 , σj = ±1,
2
r
K1 + K2 K1 − K2
A = cosh cosh ,
2 2
K1 + K2
1 cosh
K = ln 2 .
2 K1 − K2
cosh
2
♠ Kronecker δ function

 1, Si = S j

δSi ,Sj = , Si , S j = 0, 1, 2, · · · , q − 1.
0, Si 6 = S j

ω = de f . = e 2 π ı/q .

q −1
1
δSi ,Sj =
q ∑ Sik · S− k
j , Si = ω n , n = 0, 1, 2, · · · , q − 1.
k =0

Note: Si ∈ C.
q −1
1
δSi ,Sj =
q ∑ ω k·(Si −Sj ) , Si = 0, 1, 2, · · · , q − 1.
k =0

Note: Si ∈ R.
♠ Eulerova formula
min { D,s}
D S−D S
    
∑ d s−d
=
s
. (A.80)
d =0

... where we have used the following theorem involving binomial coefficients:
n
( k + a ) ! ( n + a + 1) !
∑ k!a!
=
n!( a + 1)!
. (A.81)
k =0


m −1
a m − 1 = ( a − 1) ∑ aj. (A.82)
j =0
Rječnik osnovnih pojmova

A
A DITIVNOST VS . E KSTENZIVNOST
Additivity plays a central role in the formulation of thermodynamics. If a system is
divided into different parts, each part possessing a certain energy, the system is said
to be additive if the energy due to the interactions between these parts is negligible
in comparison with the total energy. Due to additivity, the extensive quantities are
linear functions of the system size and the thermodynamic potentials present always
the same concavity. Macroscopic systems with short-range interactions are additive. In
contrast, the energy due to interactions between different parts of the system cannot be
neglected if these interactions are long-ranged, causing the system to be intrinsically
nonadditive. This lack of additivity has been identified as the source of the unusual
thermodynamic properties of systems with longrange interactions, typically associated
with a curvature anomaly of the relevant thermodynamic potential. The same happens
in small systems with short-range interactions, where the range of the interaction is of
the order of system size. A peculiar thermodynamic property such as negative heat
capacity is seen as unusual if one takes the thermodynamics of additive systems as a
paradigm. In practice, properties of this kind are found in a large variety of systems
in nature, ranging from atomic to stellar clusters, so that they have become just other
common properties to be considered.

Opservabla Q( x1 , x2 , · · · , xn ) je aditivna u odnosu na dva podsustava koji se sastoje


od m i n − m čestica, ako je Q(n) = Q(m) + Q(n − m).
Opservabla Q( x1 , x2 , · · · , xn ) je ekstenzivna, ako postoji limes limn→∞ ( Q/n).
O razlici izmed̄u editivnih i ekstenzivnih varijabla, vidjeti opširnije u .../Drugi-
Autori/AdditiveVSExtensive.pdf

A FINI PROSTOR
je poopćenje euklidskoga prostora u algebarskoj geometriji pri kojemu koordinate to-
čaka nisu nužno realni ili kompleksni brojevi, već elementi zadanoga polja.
560 Poglavlje A. Matematički dodatak

ANNEALED VS . QUENCHED DISORDER


Promatra se primjer sustava sa N = 6 čestica, od čega su dvije čestice tipa A, dvije tipa
B i dvije tipa C. Ovih šest čestica je moguće rasporediti na

6!
= 90
2! 2! 2!
načina koje nazivamo konfiguracijama i označavamo s

|C1 i = A A B B C C, ... , |C90 i = A B C A B C.

Trag po svakoj od ovih konfiguracija se označava s

Zi = Tr |Ci i , i = 1, 2, · · · , 90.

ANNEALED DISORDER

Fa = −kB T ln ( Z1 + Z2 + · · · + Z90 )

Dozvoljava se gibanje čestica kroz sustav.


QUENCHED DISORDER
Za svaku fiksnu konfiguraciju čestica (nereda) izračuna se pripadna slobodna energija

Fi = −kB T ln ( Zi ) ,

a zatim se konačna slobodna energija dobije usrednjavanjem po svim mogućim konfi-


guracijama rasporeda čestica (nereda)
90 90
1 1
Fq =
90 ∑ Fi = −kB T
90 ∑ ln (Zi ) .
i =1 i =1

ARPES
(Angle-resolved photoemission spectroscopy)
also known as ARUPS (angle-resolved ultraviolet photoemission spectroscopy), is a
direct experimental technique to observe the distribution of the electrons (more precisely,
the density of single-particle electronic excitations) in the reciprocal space of solids.
ARPES is one of the most direct methods of studying the electronic structure of the
surface of solids. ARPES gives information on the direction, speed and scattering
process of valence electrons in the sample being studied (usually a solid). This means
that information can be gained on both the energy and momentum of an electron,
resulting in detailed information on band dispersion and Fermi surface. This technique
is a refinement of ordinary photoemission spectroscopy.

B
B AZA VEKTORSKOG PROSTORA
Skup vektora {~e1 ,~e2 , · · · ,~eD } je ortonormirana baza u R D , ako i samo ako vrijedi da se
svaki vektor ~x ∈ R D može jednoznačno prikazati kao ~x = a1~e1 + a2~e2 + · · · + aD~eD , pri
čemu su

 1, i=j

~ei ·~e j =
0, i 6= j.

A.12 Mali trikovi 561

D
D IRAC SEMIMETAL
In crystals that are symmetric under inversion and time reversal, electronic energy
bands are two-fold degenerate. This degeneracy is referred to as Kramers degeneracy.
Therefore, semimetals with linear crossings of two energy bands (two-fold degeneracy)
at the Fermi energy exhibit a four-fold degeneracy at the crossing point. The effective
Hamiltonian for these states can be written as
!
~k ·~σ 0
H = h̄v D .
0 −~k ·~σ

This has exactly the matrix structure of Dirac matter. Examples of experimentally reali-
sed Dirac semimetals are sodium bismuthide, Na3 Bi and cadmium arsenide, Cd3 As2 .

E
E KSTENZIVNA VS . A DITIVNA
Ekstenzivna opservabla nekog sustava je ona čiji je iznos jednak zbroju iznosa svih
podsustava (masa, volumen). Omjer dvije ekstenzivne opservable je intenzivna opser-
vabla (omjer mase i gustoće homogenog tijela je konstantna gustoća, energija, entalpija,
entropija).
Opsrevabla Q( x1 , x2 , · · · , xn ) je aditivna u odnosu na dva podsustava koji se sastoje
od m i n − m čestica, ako je Q(n) = Q(m) + Q(n − m).
Opsrevabla Q( x1 , x2 , · · · , xn ) je ekstenzivna, ako postoji limes limn→∞ ( Q/n). O raz-
lici izmed̄u editivnih i ekstenzivnih varijabla, vidjeti opširnije u .../DrugiAutori/AdditiveVSExtensive.pdf

E NERGIJA je sposobnost sustava da obavi rad.

E NTROPIJA je termodinamička funkcija stanja sustava koja se može shvatiti kao mjera
vezane energije sustava, tj. onog dijela energije kojim se ne može vršiti rad (za raz-
liku od slobodne energije kojom se može obavljati rad). U statističkoj fizici je entropija
srazmjerna logaritmu broja mikroskopskih konfiguracija koje odgovaruju jednom ma-
kroskopskom stanju sustava.
U kontekstu promjene unutrašnje energije sustava, značenje entropija se može vidjeti iz
prvog načela termodinamike zapisanog u obliku

dU = T dS − p dV + µ dN .

Član s entropijom čitamo kao

dS
T dS = kB T ,
kB
tj. promjena entropije za ±1 · kB povećava/smanjuje unutrašnju energiju sustava za
±kB T (vidjeti natuknicu T EMPERATURA).
Entropija je funkcija slična funkciji djelovanja u mehanici (ili optici, Fermatovo načelo):
gibanje mehaničkog sustava je odred̄eno zahtjevom da funkcija djelovanja ima eks-
tremnu vrijednost; raspodjela vjerojatnosti zauzeća odred̄ene konfiguracije odred̄uje se
iz zahtjeva da je entropija maksimalna. (povezati to s temperaturom)
"You should call it entropy, for two reasons. In the first place your uncertainty function
has been used in statistical mechanics under that name, so it already has a name. In the
562 Poglavlje A. Matematički dodatak

second place, and more important, no one really knows what entropy really is, so in a
debate you will always have the advantage." J. Von Neumann, suggesting to Claude
Shannon a name for his new uncertainty function, as quoted in Scientific American 225,
3, p180 (1971).
Boltzmannova definicija entropije

Ω( E)
SB = kB ln [Ω( E)] = kB ln( PE ) + const., PE = ,
Ωtot

gdje je Ω( E) broj konfiguracija koje sve imaju istu energiju E, a Ωtot je broj svih mogućih
konfiguracija sustava. Dakle, ova definicija entropije se odnosi na mikrokanonski
ansambl u kojemu je energija sustava, E, konstantna. U svim ostalim ansamblima
u kojima energija nije konstantna, entropija se računa kao (Gibbs, Shannon) srednja
vrijednost Boltzmannove entropije

SG/S = kB ∑ Pn ln( Pn ) = hSB i .


n

S Pn je označena vjerojatnost da se sustav nalazi u nekoj od konfiguracija čija je energija


jednaka En . U sustavima koji nisu mikrokanonski, energija fluktuira, tako da je ukupna
unutrašnja energija jednaka

U = ∑ Pn En .
n

U termodinamičkoj granici, daleko od točke faznog prijelaza, sustav će se s velikom


vjerojatnošću nalaziti u konfiguracijama s najvjerojatnijom vrijednošću energije U ≈ E ?
(raspodjela vjerojatnosti je oblika delta-funkcije) i Boltzmannova i Gibbs-Shannonova
definicija entropije se približno poklapaju.
E RGODI ČNOST
Kod ergodičkih sustava, vremensko usrednjenje po intervalu [0, τ ] kada τ → ∞,

1
Z τ
h f (~q,~p)iτ ≡ lim f (~q,~p) dt , (A.83)
τ →∞ τ 0

može se zamjeniti usrednjavanjem po faznom prostoru. Za hamiltonijanske sustave,


usrednjenje po faznom prostoru se računa kao
Z
h f (~q,~p)i E ≡ f (~q,~p) δ( E − H (~q,~p)) d~q d~p . (A.84)

Oznakom E je označena hiperploha konstantne energije u faznom prostoru (sačuvanje


energije). Dakle, sustav se naziva ergodičnim, ako i samo ako su usrednjenja (A.83) i
(A.84) jednaka

h f (~q,~p)iτ = h f (~q,~p)i E

za sve glatke funkcije f za koje gornje srednje vrijednosti postoje.


Ergodičnost znači da će se skoro sve točke faznog prostora, (~q,~p), tijekom hamiltoni-
janske evolucije gibati tako da će u konačnici (nakon dovoljno dugo vremena) proći
svakom konačnom okolinom na energijskoj hiperplohi i provest će jednako vremena u
jednakim područjima faznog prostora.
O ergodičnosti u kontekstu Markovljevih lanaca, vidjeti u skripti o vjerojatnosti.
A.12 Mali trikovi 563

F
FAZA je fizički i kemijski homogeni dio heterogenog sustava koji je svojom graničnom
površinom odvojen od ostalih djelova sustava. Svaka se faza može sastojati od više
komponenata.

FAZNI PROSTOR
je 2s - dimenzijski prostor razapet položajima i brzinama (ili položajima i poopćenim
količinama gibanja) svih čestica sustava. Ako se sustav sastoji od samo jedne čestice
koja se giba po jednodimnzijskoj krivulji, fazni prostor je dvodimenzijski s jednom koor-
dinatom položaja x, i jednom koordinatom brzine ẋ. Fazni prostor sustava od N čestica
koje se gibaju u trodimenzijskom prostoru, ima 6 N dimenzija. Općenito, dimenzija
faznog prostora je dvostruko veća od broja stupnjeva slobode sustava. (Usporediti s -
konfiguracijski prostor)

F ERMIJEVA TEKU ĆINA


Fermi liquid theory (also known as Landau–Fermi liquid theory) is a theoretical model
of interacting fermions that describes the normal state of most metals at sufficiently
low temperatures. The interaction between the particles of the many-body system does
not need to be small. The phenomenological theory of Fermi liquids was introduced
by the Soviet physicist Lev Davidovich Landau in 1956, and later developed by Alexei
Abrikosov and Isaak Khalatnikov using diagrammatic perturbation theory. The theory
explains why some of the properties of an interacting fermion system are very similar to
those of the Fermi gas (i.e. non-interacting fermions), and why other properties differ.

F UNKCIJE PROCESA
su termodinamički parametri (poput rada, količine topline,...) čije vrijednosti ovise o
procesima koji su sustav doveli iz početnog u konačno stanje. S matematičkog stanovi-
šta, funkcije procesa nisu pravi (totalni) diferencijali.

F UNKCIJE STANJA
su termodinamički parametri (poput tlaka, temperature, volumena, unutrašnje energije,
...) čije vrijednosti ovise o stanju sustava, ali ne i procesima koji su sustav doveli u
to stanje. S matematičkog stanovišta, funkcije stanja su pravi (totalni) diferencijali.
Posebno važna funkcija stanja je unutrašnja energija, U. To je ukupna energija (kinetička
+ potencijalna + oscilatorna + vrtnja + elektronska pobud̄enja + ...) svih čestica sustava.
Sustavi u istom termodinamičkom stanju imaju istu vrijednost unutrašnje energije. Unu-
trašnja energija ovisi o drugim parametrima sustava, najčešće o temperaturi i volumenu.

F RUSTRACIJA
Geometrijske frustracije su u fenomen u fizici kondenzirane tvari u kome geometrijske
osobine kristalne rešetke ili prisustvo atomskih sila mogu „zabraniti“ spontano opadanje
energije, što može dovesti do poremećenog osnovnog stanja, odnosno entropije koja je
veća od nule na nula stupnjeva Kelvina.
In condensed matter physics, the term geometrical frustration (or in short: frustration)
refers to a phenomenon, where atoms tend to stick to non-trivial positions or where,
on a regular crystal lattice, conflicting inter-atomic forces (each one favoring rather
simple, but different structures) lead to quite complex structures. As a consequence of
the frustration in the geometry or in the forces, a plenitude of distinct ground states may
564 Poglavlje A. Matematički dodatak

result at zero temperature, and usual thermal ordering may be suppressed at higher
temperatures. Much studied examples are amorphous materials, glasses, or dilute
magnets. The term frustration, in the context of magnetic systems, has been introduced
by Gerard Toulouse (1977). Indeed, frustrated magnetic systems had been studied even
before. Early work includes a study of the Ising model on a triangular lattice with
nearest-neighbor spins coupled antiferromagnetically, by G. H. Wannier, published in
1950. Related features occur in magnets with competing interactions, where both ferro-
as well as antiferromagnetic couplings between pairs of spins or magnetic moments
are present, with the type of interaction depending on the separation distance of the
spins. In that case commensurability, such as helical spin arrangements may result, as
had been discussed originally, especially, by A. Yoshimori, T. A. Kaplan, R. J. Elliott,
and others, starting in 1959, to describe experimental findings on rare-earth metals. A
renewed interest in such spin systems with frustrated or competing interactions arose
about two decades later, beginning in the 70s of the 20th century, in the context of spin
glasses and spatially modulated magnetic superstructures. In spin glasses, frustration
is augmented by stochastic disorder in the interactions, as may occur, experimentally, in
non-stoichiometric magnetic alloys. Carefully analyzed spin models with frustration
include the Sherrington-Kirkpatrick model,[9] describing spin glasses, and the ANNNI
model, describing commensurability magnetic superstructures. Parametar reda koji
razlikuje visoko- od nisko-temperaturne faze je Edwards - Andersonov parametar reda

N
1
q(t) =
N ∑ hSn (t)i 2 .
n =1

G
G OLDSTONEOV BOZON
In particle and condensed matter physics, Goldstone bosons or Nambu–Goldstone
bosons (NGBs) are bosons that appear necessarily in models exhibiting spontaneous
breakdown of continuous symmetries. They were discovered by Yoichiro Nambu in
the context of the BCS superconductivity mechanism, and subsequently elucidated by
Jeffrey Goldstone, and systematically generalized in the context of quantum field theory.
These spinless bosons correspond to the spontaneously broken internal symmetry
generators, and are characterized by the quantum numbers of these. They transform
nonlinearly (shift) under the action of these generators, and can thus be excited out of the
asymmetric vacuum by these generators. Thus, they can be thought of as the excitations
of the field in the broken symmetry directions in group space—and are massless if the
spontaneously broken symmetry is not also broken explicitly. If, instead, the symmetry
is not exact, i.e. if it is explicitly broken as well as spontaneously broken, then the
Nambu–Goldstone bosons are not massless, though they typically remain relatively
light; they are then called pseudo-Goldstone bosons or pseudo-Nambu–Goldstone
bosons (abbreviated PNGBs).

I
I NTENZIVNA
veličina nekog sustava je ona čiji iznos ne ovisi o veličini sustava ili o količini tvari u
sustavu (temperatura, tlak, indeks loma, gustoća homogenih tijela).
A.12 Mali trikovi 565

K
K EMIJSKI POTENCIJAL
U kontekstu promjene unutrašnje energije sustava, značenje kemijskog potencijala se
može vidjeti iz prvog postulata termodinamike zapisanog u obliku
dU = T dS − p dV + µ dN .
Član s kemijskim potencijalom iščitavamo tako da on predstavlja povećavanje/smanjenje
unutrašnje energije sustava kada se broj čestica sustava poveća/smanji za dN = 1.
K IRALNOST
je svojstvo koje imaju likovi i tijela koje se očituje u tome da se zbog nesimetričnosti
prostornog rasporeda atoma ili molekula izvornik ne može poklopiti sa svojom zrcal-
nom slikom odnosno zrcalnim prostornim oblikom, bez obzira na to kakve pomake ili
zakrete napravili s njima. Primjer akiralnih molekula su molekule vode, kisika, dušika,
metana, ugljikovog dioksida, ugljikovog monoksida i dr. Primjeri kiralnih molekula su
molekule većine aminokiselina, šećera, nukleinskih kiselina i dr.

K OMPONENTA
je element ili spoj koje se u čistom stanju može izolirati.

K ONFIGURACIJSKI PROSTOR
Prostro dimenzije s (broj stupnjeva slobode sustava), čije su osi poopćene koordinate
q1 , q2 , · · · , qs . (Usporediti s - fazni prostor.)

K ONTAKT,
tj. termodinamički kontakt je veza izmed̄u dva sustava koja omogućava njihovo med̄u-
djelovanje, a može biti
mehanički, ako jedan sustav nad drugim obavlja mehanički rad;
čestični, ako dolazi do preraspodjela čestica izmed̄u raznih sustava;
toplinski, ako dolazi do izmjene energija med̄u sustavima;
adijabatski, ako granica med̄u sustavima ne omogućava izmjenu topline.

K ORELACIJSKA DUŽINA
se definira kao druga derivacija potencijalne energije po parametru reda , M,
d2 E p
ξ −2 = .
dM2
K VANTNI FAZNI PRIJELAZ
In physics, a quantum phase transition (QPT) is a phase transition between different
quantum phases (phases of matter at zero temperature). Contrary to classical phase
transitions, quantum phase transitions can only be accessed by varying a physical
parameter—such as magnetic field or pressure—at absolute zero temperature. The
transition describes an abrupt change in the ground state of a many-body system due
to its quantum fluctuations. Such a quantum phase transition can be a second-order
phase transition.

M
M IKROSKOPSKO STANJE
sustava je stanje definirano položajem i brzinama svih čestica sustava (dakle, nije defini-
566 Poglavlje A. Matematički dodatak

rano termodinamičkim parametrima). Velik broj mikroskopskih stanja rezultiram istim


termodinamičkim stanjem. U odjeljku ... će se pokazati kako je broj različitih mikro-
skopskih stanja koja rezultiraju istim termodinamičkim stanjem, povezan s definicijom
entropije u okviru statističke fizike.

P
PARAMETAR REDA
feromagneti - magnetizacija,
antiferomagneti - Staggered magnetization, npr. Mst = ∑i (−1) i Si .

PARAMETRI,
tj. termodinamički parametri su opservable - makroskopske veličine koje se mogu
mjeriti i koje su nam (barem dio njih - tlak, temperatura, volumen, sastav,....) poznate iz
svakodnevice. Mogu biti:
Ekstenzivni parametri ili faktori kapaciteta, ovise o količini tvari. To su masa, volumen,
entropija, entalpija, ... ). Aditivnog su karaktera pa je npr. V = ∑n Vn .
Intenzivni parametri ili faktori intenziteta, ne ovise o količini tvari u sustavu. To su npr.
gustoća, tlak, temperatura, indeks loma, površinska napetost, molarni volumen, ...
Ekstenzivni parametri mogu postati intenzivni svod̄enjem na jediničnu vrijednost, jer
je omjer dvije ekstenzivne veličine intenzivna veličina. Tako su npr. masa i volumen
ekstenzivni parametri, ali je gustoća (omjer mase i volumena) intenzivan parametar.

P ERKOLACIJA
se definira kao formiranje i/ili korištenje već postojećih putanja kroz porozni materijal.
Site perkolacija na pravilnoj rešetki ..
Bond perkolacija na pravilnoj rešetki..
Continuum perkolacija se dogad̄a u sustavima u kojima perkolacijski elementi mogu
zauzeti proizvoljan položaj u prostoru (nisu ograničeni na čvorove rešetke ili veze med̄u
čvorovima).

Vjerojatnost perkolacije, pc , je ona vjerojatnost pojave čvorova ili veza za koju je vjerojat-
nost pojave beskonačnog klastera, veća od nule. Od nje se razlikuje vjerojatnost pojave
spanning klastera koji povezuje suprotne stranice sustava:
At percolation theshhold pc , there may or may not exist a spanning cluster. The spanning
probability depends on many factors like the kind of percolation (site, bond, continuous,...), type
of lattice, boundary conditions, etc.
P ROCESI,
tj. termodinamički procesi su načini na koje se može mijenjati termodinamičko stanje
nekog sustava. Ne mjenja se sam sustav, nego se mjenjaju njegovi parametri. Ovi su
procesi opisani promjenama makroskopskih veličina (termodinamičkih parametara)
kao što su tlak, temperatura,volumen, ... Termodinamički procesi mogu bit spontani
(odvijaju se sami od sebe) ili inducirani (odvijaju se pod djelovanjem vanjske sile).
Reverzibilni (povratni) procesi su oni kod kojih sustav od početnog do konačnog
stanja sporo prolazi (kontinuiranim) nizom ravnotežnih stanja koja se med̄usobno
infinitezimalno razlikuju. Njime su povezana dva ravnotežna stanja. Reverzibilni proces
je rezultat djelovanja vanjskih sila na sustav i zato se (promjenom smjera djelovanja
vanjskih sila) proces može odvijati i u suprotnom smjeru.
Ireverzibilni (nepovratni) procesi su oni kod kojih sustav od početnog do konačnog
A.12 Mali trikovi 567

stanja brzo prolazi (kontinuiranim) nizom neravnotežnih stanja koja se med̄usobno


infinitezimalno razlikuju. Ovaj se proces ne može odvijati u suprotnom smjeru. Rad
termodinamičkog sustava izravno ovisi o (i)reverzibilnosti procesa kojim je sustav
prešao iz početnog u konačno stanje. Strogo gledano svi su procesi u prirodi ireverzibilni,
a reverzibilni procesi su aproksimacija.
Kružni termodinamički proces je onaj kod kojega je konačno stanje jednako početnom
(Carnotov, Dieselov, ...)
Izobarni proces je onaj proces koji se odvija uz konstantan tlak, dok su ostali parametri
promjenjivi.
Izohorni proces je onaj proces koji se odvija uz konstantan volumen, dok su ostali
parametri promjenjivi.
Izotermni proces je onaj proces koji se odvija uz konstantnu temperaturu, dok su ostali
parametri promjenjivi (Boyle-Mariotteov zakon).
Izoentropijski proces je onaj proces koji se odvija uz konstantnu entropiju, dok su ostali
parametri promjenjivi (adijabatski proces).

Q
Q UANTUM ENTANGLEMENT
(kvantno preplitanje) is a physical phenomenon that occurs when pairs or groups
of particles are generated, interact, or share spatial proximity in ways such that the
quantum state of each particle cannot be described independently of the state of the
other(s), even when the particles are separated by a large distance.
ρ(~r 1 ,~r 2 ) 6= ρ(~r 1 ) · ρ(~r 2 ).
DrugiAutori/SchmidtDecomp.pd f (p.21) In quantum information sciences, entangle-
ment is regarded as a quantum version of correlation. Gustoća vjerojatnosti dvije
varijable se ne može napisati kao umnožak dvije gustoće od po jedne varijable.

QUENCHED DISORDER
Vidjeti pod: annealed vs. quenched disorder.

S
S EMIMETAL
A semimetal is a material with a very small overlap between the bottom of the conduc-
tion band and the top of the valence band. According to electronic band theory, solids
can be classified as insulators, semiconductors, semimetals, or metals. In insulators and
semiconductors the filled valence band is separated from an empty conduction band
by a band gap. For insulators, the magnitude of the band gap is larger (e.g. > 4 eV)
than that of a semiconductor (e.g. < 4 eV). Because of the slight overlap between the
conduction and valence bands, semimetal has no band gap and a negligible density of
states at the Fermi level. A metal, by contrast, has an appreciable density of states at the
Fermi level because the conduction band is partially filled.

S INTETI ČKI ISKAZ


je iskaz čija negacija nije samoproturječna, već je logički moguća.
568 Poglavlje A. Matematički dodatak

S PANNING CLUSTER
se definira kao putanja koja povezuje suprotne stranice sustava. Kritična gustoća nc je
gustoća elementa za koju je vjerojatnost nalaženja bar jednog spanning clustra jednaka
50 %.
S PARS MATRICES
broj matričnih elemenata u svakom redu/stupcu ostaje konačan čak i u granici kada
red matrice postaje beskonačan.

S PINSKO STAKLO
spinsko staklo, magnetski materijal u kojem »zamrznuti« smjerovi slučajno orijentiranih
magnetskih momenata atoma ne podliježu dugodosežnomu magnetskom ured̄enju
(stanje koje podsjeća na strukturnu neured̄enost stakla). Iznad kritične temperature T f
opaža se paramagnetizam slobodnih, neinteragirajućih atomskih momenata, gdje se
paramagnetna susceptibilnost χ ponaša po Curieovu zakonu: χ 1/T. Na temperaturi
T f , za razliku od normalnih paramagnetskih tvari, susceptibilnost se smanjuje. U stanju
spinskoga stakla nema spontane magnetizacije kao u feromagnetika, ali ima ostatka na-
kon isključivanja vanjskoga magnetskog polja i postoji petlja histereze. Stanje spinskoga
stakla opaža se uglavnom kod slitina s primjesom od nekoliko postotaka kemijskoga
elementa koji ima izražena magnetska svojstva.

S TANJE,
tj. termodinamičko stanje sustava je naziv za skup vrijednosti termodinamičkih para-
metara pridružen danom sustavu. Dva sustava s istim vrijednostima termodinamičkih
parametara, nalaze se u istom stanju.
Ravnotežno stanje termodinamičkog sustava je ono stanje u kojemu se termodinamički
parametri sustava spontano ne mjenjaju u vremenu (potrebna je vanjska sila da bi se oni
promjenili) ili u koje se sustav periodički vraća. Ne dolazi do transporta mase i energije.
Postoje tri vrste ravnotežnih stanja:
termička ravnoteža - u svim djelovima sustava, temperatura je konstantna;
mehanička ravnoteža - nema makroskopskih gibanja u sustvu ili gibanja sustava kao
cjeline u odnosu na okolinu.;
kemijska ravnoteža - kemijski sastav se ne mijenja tijekom vremena i isti je u svim
točkama sustava.
Stacionarno je ono stanje u kojemu se parametri stanja sa vremenom takod̄er ne mje-
njaju, ali dolazi do transporta mase i energije. "Steady state" in general means the
system may be dynamic but the derivatives are zero. For example, a fire burning inside
a box reaches steady state when the energy dissipated to the exterior matches the rate
of energy generated by the fire. This is not at equilibrium because energy is being
dissipated.
Neravnotežno stanje termodinamičkog sustava je ono stanje u kojemu se termodina-
mički parametri sustava spontano mjenjaju u vremenu (nije potrebna vanjska sila da
bi se oni promjenili). Non-equilibrium states can be steady states if there is a source of
energy to maintain the non-equilibrium condition. Without the source of energy, the
system would quickly settle into an equilibrium state.

S USTAV,
točnije termodinamički sustav je naziv za skup čestica (diskretna slika) ili (kontinuiranu)
nakupinu tvari koja se nalazi u zadanom volumenu i u kojem nastaju med̄usobne
pretvorbe topline i drugih oblika energije. Sve što je izvan sustava, naziva se okolina
A.12 Mali trikovi 569

(toplinska kupka; termostat; atmosfera...). Termodinamički sustav može biti:


Homogen (monofazan) sustav u svim svojim dijelovima ima iste sve osobine (fizičke i
kemijske), ili se te osobine kontinuirano mjenjaju od točke do točke tj. ne postoji točke
ili površina unutar sustava (osim same granice sustava) gdje dolazi do nagle promjene
nekog negovog svojstva. Sastoji se od jedne faze, npr. plinovi, smjese plinova, čiste
tekućine, tekuće i krute otopine)
Heterogen (polifazan) sustav je onaj sustav u kojemu postoje točke ili površine gdje se
neka ili više osobina skokovito mjenjaju. Može se sastojati iz većeg broja homogenih
djelova odnosno sastoji se od dvije ili više faza. Npr. tekućina i para iznad otopine,
dvije tekućine koje se ne mješaju, tekuća i kruta tvar ili dvije krute tvari.
Izoliran sustav je onaj u kojemu ne dolazi do izmjene niti tvari niti energije s okolinom.
Zatvoren sustav je onaj u kojemu ne dolazi do izmjene tvari s okolinom, ali se s okolinom
može izmjenjivati energija, što će izazvati promjene tlaka, volumena ili temperature
sustava.
Otvoren sustav može izmjenjivati i tvar i energiju s okolinom.
Realno, izolirani i zatvoreni sustavi su neostvarivi i o njima treba razmišljati kao o više
ili manje prihvatljivoj aproksimaciji.

T
T EMPERATURA
ili, preciznije rečeno, inverzna temperatura (to je veličina koja se prirodno pojavljuje u
teoriji), je veličina koja opisuje kako se entropija sustava mijenja s promjenom energije

1

∂S
= .
T ∂E N

Za danu energiju, sustavu je dostupan samo dio faznog prostora. Ustanovljavanjem


ukupnog broja konfiguracija sustava sadržanih u tom dijelu faznog prostora i njegovim
logaritmiranjem dobiva se (bezdimenzijska) entropija. Promjenom energije, mijenja
se i broj dostupnih konfiguracija, pa time i entropija, a omjer tih promjena se naziva
inverzna temperatura.
Po analogiji s gornji izrazom mogu se definirati i druge (intenzivne) veličine (polja
konjugirana aditivnoj opservabli) koje imaju značenje inverzne temperature. Neka je q
aditivna opservabla sustava (magnetizacija, energija, aktivnost, ....) a t neka je kontrolni
parametar koji se drži konstantnim. Tada se temperatura u odnosu na opservablu q
definira kao
1

∂S
= .
Tq ∂q t

Temperatura, tj. 1/(kB T ) je Lagrangeov množitelj.

T ERMODINAMIKA
označava znanstvenu disciplinu koja proučava pretvorbe jednog oblika energije u drugi
(napose pretvorbe topline). Početak razvoja termodinamike je u proučavanju toplinskih
strojeva (S. Carnot - O pokretačkoj sili ognja i strojevima sposobnim da razviju tu silu).

T ERMOSTAT
je okolina termodinamičkog sustava koja mu osigurava konstantnu temperaturu.
570 Poglavlje A. Matematički dodatak

T EŠKI FERMIONI
Sustavi teških fermiona su spojevi u kojima snažne elektronske i magnetske korelacije
omogućuju stvaranje egzotičnh osnovnih stanja kao što su nekonvencionalna supravod-
ljivost, magnetizam, spinske tekućine i stanja kvantne kritičnosti. Prisutnost povećanih
korelacija dovodi do anomalnog metalnog stanja koje se može opisati teorijom Fermi-
jeve tekućine, ali uz povećanje efektivne mase nosilaca naboja, i to do 1000 puta veće.
Po tom efektu su ovi materijali i dobili svoje ime.

T LAK
U kontekstu promjene unutrašnje energije sustava, značenje tlaka se može vidjeti iz
prvog postulata termodinamike zapisanog u obliku
dU = T dS − p dV + µ dN .
Član s tlakom
dV
− p dV = − pV0
V0
iščitavamo tako da pV0 predstavlja povećavanje/smanjenje unutrašnje energije sustava
kada se volumen sustava poveća/smanji za V0 .

T O ČKASTE PREOBRAZBE
konfiguracijskog prostora su one preobrazbe u konfiguracijskom prostoru kod kojih su
nove koordinate funkcije samo starih koordinata, ali ne i starih količina gibanja. Točkaste
preobrazbe faznog prostora su one preobrazbe u faznom prostoru kod kojih su nove
koordinate funkcije starih koordinata i starih količina gibanja.q̃s = q̃s (q1 , q2 , · · · , qs , t).

U
U NITARNA MATRICA
Matrica U dimenzije n × n je unitarna, ako stupci U čine ortonormiranu bazu u R n .
Matrica A dimenzije n × n je unitarno dijagonalizabilna, ako postoji n × n unitarna
matrica U, takva da je A = U · D · · · U −1 , gdje je D dijagonalna matrica. Za unitarne
matrice vrijedi da je U −1 = U | . Unitarna matrica prevodi jednu ortonormiranu bazu u
drugu ortonormiranu bazu. Drugim riječima, unitarna matrica izvodi vrtnju baze.

U NUTRAŠNJA ENERGIJA,
U, predstavlja ukupnu (kinetičku i potencijalnu) energiju sustava, odnosno energiju svih
čestica u sustavu (molekula, atoma, iona). Pojam kinetičke energije obuhvaća kinetičku
energiju translacije, vrtnje i titranja. Potencijalna energija je energija med̄udjelovanja
čestica. Unutrašnja energija sustava ne obuhvaća potencijalnu energiju sustava kao
cjeline usled njegovog položaja u prostoru niti kinetičku energiju gibanja sustava kao
cjeline. U termodinamici se promatraju sustavi koji miruju i nalaze se izvan gravitacij-
skog ili elektromagnetskog polja. Apsolutna vrijednost unutrašnje energije nije poznata
(nemoguće je znati sve njezine komponente) i zato se govori samo o promjenama unu-
trašnje energije, ∆ U. Unutrašnja energija sustava ovisi o prirodi sustava, njegovoj masi
i parametarima stanja sustava. Sa porastom mase sustava raste i energija sustava, pa se
ubraja u ekstenzivna svojstva sustava. Unutrašnja energija sustava više tjela jednaka je
zbroju unutrašnjih energija svakog od njih ponaosob i energijama njihovog med̄udjelo-
vanja (u tankom sloju na granici tjela; mala je i može se zanemariti).
A.12 Mali trikovi 571

W
W EYL FERMIONS
are massless chiral fermions that play an important role in quantum field theory and the
standard model. They are considered a building block for fermions in quantum field
theory, and were predicted from a solution to the Dirac equation derived by Hermann
Weyl called the Weyl equation.[1] For example, one-half of a charged Dirac fermion of
a definite chirality is a Weyl fermion.[2] They have not been observed as a fundamen-
tal particle in nature. Weyl fermions may be realized as emergent quasiparticles in a
low-energy condensed matter system. This prediction was first proposed by Conyers
Herring in the context of electronic band structures of solid state systems such as elec-
tronic crystals.[3][4][5] The first (non-electronic) liquid state which is suggested has
similarly emergent but neutral excitation and theoretically interpreted superfluid’s
chiral anomaly as observation of Fermi points is in Helium-3 A liquids.[6] Crystalline
tantalum arsenide (TaAs) is the first discovered topological Weyl fermion semimetal
exhibiting topological surface Fermi arcs where Weyl fermion is electrically charged
along the line of original suggestion by Herring.[7] An electronic Weyl fermion is not
only charged but stable at room temperature where there is no such superfluid or liquid
state known.

W EYL SEMIMETAL
A Weyl semimetal is a solid state crystal whose low energy excitations are Weyl fermions
that carry electrical charge even at room temperatures.[9][10] A Weyl semimetal enables
realization of Weyl fermions in electronic systems.[7] It is a topologically nontrivial
phase of matter, together with Helium-3 A superfluid phase, that broadens the topologi-
cal classification beyond topological insulators.[5] The Weyl fermions at zero energy
correspond to points of bulk band degeneracy, the Weyl nodes (or Fermi points), that
are separated in momentum space. Weyl fermions have distinct chiralities, either left
handed or right handed.
Weyl semimetals, for example strontium silicide Sr Si2 , Tantalum arsenide Ta As have a
Hamiltonian that is very similar to that of graphene, but now includes all three Pauli
matrices and the linear crossings occur in 3D:

H = h̄v D (k x σx + k y σy + k z σz ) = h̄v D ~k ·~σ.

Since all three Pauli matrices are present, there is no further Pauli matrix that could open
a gap in the spectrum and Weyl points are therefore topologically protected.[2] Tilting
of the linear cones so the Dirac velocity varies leads to type II Weyl semimetals.[19][20]
One distinct, experimentally observable feature of Weyl semimetals is that the surface
states form Fermi arcs since the Fermi surface does not form a closed loop.

Z
ZERO - RANGE PROCESESS
Skok čestice ovisi o stanju čvora sa kojega se skače (a ne o stanju čvora na koji se skače).
To omogućava kondenzaciju makroskopskog broja čestica na jednom čvoru.
B. Literatura, popis pojmova i autora

Popis literature
Knjige
A NDERSON , D AVID F.
Lecture notes on stochastic processes with application in biology. 2017 (citirano na stranci 492).
A RFKEN , G. B. I H. J. W EBER.
Mathematical Methods for Physicists. Academic Press, San Diego, 1995 (citirano na
stranicama 40, 270, 367, 378, 483).
A ROVAS , D ANIEL.
Lecture Notes on Nonequilibrium Statistical Physics. 2014. URL: https://www.academia.
edu / 11101928 / Lecture _ Notes _ on _ Nonequilibrium _ %20Statistical _ Physics
(citirano na stranci 311).
B AZANT, M ARTIN Z.
Random walks and diffusion. 2006. URL: https://ocw.mit.edu/courses/mathematics/
18-366-random-walks-and-diffusion-fall-2006/lecture-notes/ (citirano na
stranci 539).
B OCCIO , J OHN.
Quantum mechanics. 2017. URL: http : / / www . johnboccio . com / TQM / QM _ 1 . pdf
(citirano na stranci 169).
Bronxtein, Il Nikolaeviq i Konstantin Adolfovic Semendyev.
Matematički priručnik za inženjere i studente. Tehnička knjiga, Zagreb, 1975 (citirano
na stranci 326).
Č ULJAK , V ERA.
Vjerojatnost i statistika. 2011. URL: www.grad.hr/vera/webnastava/vjerojatnostistatistika/
vis-pdf.pdf (citirano na stranicama 40, 483).
D AMJANOVI Ć , A LEKSANDAR I G EORGIJE L UKATELA.
Teorija telekomunikacija 1. 1959 (citirano na stranci 311).
E LEZOVI Ć , N EVEN.
Vjerojatnost i statistika 2 - slučajne varijable. Element, Zagreb, 2007 (citirano na strani-
cama 169, 367, 378, 513).
574 Poglavlje B. Literatura, popis pojmova i autora


Vjerojatnost i statistika 3 - matematička statistika i stohastički procesi. Element, Zagreb,
2007 (citirano na stranicama 483, 513, 539).

Vjerojatnost i statistika. Element, Zagreb, 2008 (citirano na stranci 40).

Vjerojatnost i statistika 1 - diskretna vjerojatnost. Element, Zagreb, 2008 (citirano na
stranicama 100, 270).
G IORDANO , N ICHOLAS J. I H ISAO N AKANISHI.
Computational Physics. Pearson Prentice Hall, New York, 2006. URL: http://www.
physics.purdue.edu/~hisao/book/ (citirano na stranci 417).
G LUMAC , Z VONKO.
Klasična mehanika - kratak uvod. Odjel za fiziku, Osijek, 2019. URL: http : / / www .
fizika.unios.hr/~zglumac/utm.pdf (citirano na stranicama 132, 154, 156, 157,
291).

Matematičke metode fizike - kratak uvod. Odjel za fiziku, Osijek, 2019. URL: http :
//www.fizika.unios.hr/~zglumac/ummf.pdf (citirano na stranicama 62, 85, 122,
150, 151, 192, 200, 208, 214, 244, 254, 261, 273, 287, 313, 315, 317, 331, 334, 335, 367,
410, 535).

Računalne metode fizike - kratak uvod. Odjel za fiziku, Osijek, 2019. URL: http://www.
fizika.unios.hr/~zglumac/urmf.pdf (citirano na stranicama 302, 516, 529).

Statistička fizika - kratak uvod. Odjel za fiziku, Osijek, 2019. URL: http://www.fizika.
unios.hr/~zglumac/usf.pdf (citirano na stranicama 147, 260, 273, 274, 288, 297,
308, 516).
G RAHAM , R ONALD L., D ONALD E. K NUTH I O REN PATASHNIK.
Concrete Mathematics. McGraw - Hill, 1997 (citirano na stranci 367).
G RIGORIEV, R OMAN.
Mathematical Methods of Physics. 2019. URL: http://www.cns.gatech.edu/~predrag/
courses/PHYS-6124-12/roman07/ (citirano na stranicama 270, 513).
G RINSTEAD , C HARLES M. I J. L AURIE S NELL.
Introduction to probability. 2019. URL: https://www.math.dartmouth.edu/~prob/
prob/prob.pdf (citirano na stranicama 40, 169, 270, 539).
H WEI , P. H SU.
Theory and problems of probability, random variables and random processes. McGraw -
Hill, 1997 (citirano na stranicama 100, 270, 378, 492, 513, 539).
I VANOVI Ć , B RANISLAV.
Teorija verovatnoće. Univerzitetski udžbenici. Naučna knjiga, Beograd, 1977, stra-
nica 328 (citirano na stranicama 85, 100, 169, 192, 270, 311, 367, 378).
K AMAL , A HMAD A.
1 000 Solved Problems in Modern Physics. Springer Verlag, Berlin Heidelberg, 2010
(citirano na stranci 270).
M AC K AY, D AVID J.
Zipf - Mandelbrot distribution. 2019. URL: www.inference.phy.cam.ac.uk%20%E2%80%
BA%20donut%20%E2%80%BA%20infinite%20%E2%80%BA%20zipfMacKay (citirano na
stranci 270).
575

M ARKOVI Ć , B. I DRUGI.
Odabrana poglavlja fizike, III dio. PMF, Sveučilište u Zagrebu, 1963 (citirano na stranci 417).
M ARKOVI Ć , Ž ELJKO.
Uvod u višu analizu, I i II dio. Školska knjiga, Zagreb, 1952 (citirano na stranicama 208,
218).
M ATI Ć , B ORIVOJ.
Praktikum iz statistike. Ekonomski fakultet, Osijek, 1974 (citirano na stranci 483).
PAVLI Ć , I VO.
Statistička teorija i primjena. Panorama, Zagreb, 1965 (citirano na stranicama 40, 100,
169, 270, 367, 378, 417, 455, 480, 483, 492, 497, 499, 503–505, 508, 513).
P OPOVI Ć , M ARKO.
Entropija. 2017 (citirano na stranci 311).
P OŽEK , M IROSLAV.
Osnove teorije vjerojatnosti i matematičke statistike. 2003. URL: https://www.scribd.
com / document / 56377048 / Osnove - teorije - vjerojatnosti - i - matematicke -
statistike (citirano na stranicama 40, 417, 483).
R EIF, F REDERICK.
Fundamentals of Statistical and Thermal Physics. McGraw-Hill, 1967 (citirano na stranci 539).
R ILEY, K EN , M ICHAEL H OBSON I S TEPHEN B ENCE.
Mathematical Methods for Physics and Engineering. Cambridge Univ. Press, 2006 (citi-
rano na stranicama 100, 169, 270, 367, 378, 417, 455, 483, 492, 513).
R OSS , S HELDON M.
Introduction to Probability Models. 2019. URL: https://fac.ksu.edu.sa/sites/
default/files/introduction-to-probability-model-s.ross-math-cs.blog_
.ir_.pdf (citirano na stranci 539).
S HORTRIDGE , A SHTON.
Spatial Data Analysis. 2019. URL: https://msu.edu/~ashton/classes/866/ (citirano
na stranci 417).
S ILAGADZE , Z. K.
Citations and the Zipf-Mandelbrot’s law. 2019. URL: http://cds.cern.ch/record/
377204/files/9901035.pdf (citirano na stranci 270).
S PIEGEL , M URRAY R ALPH I L ARRY J. S TEPHENS.
Theory and problems of Statistics. Schaum’s outline series. McGraw-Hill, 1999 (citirano
na stranicama 270, 455, 483).
S UPEK , I VAN.
Teorijska fizika i struktura materije, 2. Školska knjiga, Zagreb, 1997 (citirano na stranci 100).
V RANI Ć , V LADIMIR.
Vjerojatnost i statistika. Tehnička knjiga, Zagreb, 1971 (citirano na stranicama 40, 100,
169, 234, 247–249, 270, 367, 378, 417, 455, 483, 490, 492, 539).
V UKADINOVI Ć , S VETOZAR V.
Zbirka rešenih zadataka iz teorije verovatnoće. Privredni pregled, Beograd, 1990 (citirano
na stranicama 169, 270, 311, 378, 513, 539).
W OLFRAM , M ATH W ORLD.
Bose-Einstein Distribution. http://mathworld.wolfram.com/Bose-EinsteinDistribution.html,
2019 (citirano na stranci 270).

Fermi-Dirac Distribution. http://mathworld.wolfram.com/Fermi-DiracDistribution.html,
2019 (citirano na stranci 270).
576 Poglavlje B. Literatura, popis pojmova i autora

Članci
D AUXOIS , T HIERRY I DRUGI. „
Dynamics and Thermodynamics of Systems with Long Range Interactions: an In-
troduction”. (2002). URL: https://arxiv.org/abs/cond-mat/0208455 (citirano na
stranci 311).
G ARCIA -PALACIOS , J OSÉ L UIS. „
Introduction to the theory of stochastic processes and Brownian motion problems”.
(2007). URL: arxiv.org/abs/cond-mat/0701242 (citirano na stranicama 169, 270,
367, 513, 539).
K AMBLY, D ANIA , C HRISTIAN F LINDT I M ARKUS B ÜTTIKER. „
Factorial cumulants reveal interactions in counting statistics”. Phys. Rev. B 83 (2011),
stranica 075432. URL: arXiv:1012.0750v2 (citirano na stranci 367).
T OUCHETTE , H UGO. „The large deviation approach to statistical mechanics”. Physics
Reports 478 (2009), stranice 1–69. URL: http://people.math.umass.edu/~rsellis/
pdf-files/Touchette-review.pdf (citirano na stranicama 270, 297).
Y OUNG , P ETER. „
Everything you wanted to know about Data Analysis and Fitting but were afraid to
ask”. (2012). URL: https://arxiv.org/abs/1210.3781 (citirano na stranicama 417,
483).
Popis pojmova

χ 2 , 328, 401, 402, 468, 474 diskretne slučajne varijable, 308


prepletenosti, 302
adicijski teorem, 76 Tsallisova, 304
autokorelacijska funkcija, 509 usrednjena, kontinuirane slučajne
autokorelacijsko vrijeme, 510 varijable, 308
von Neumannova, 305
Bellov polinom, 349
ergodičnost, 512
Bellovi brojevi, 189, 349, 366
error function, 234
Besselovi
brojevi, 237
Feinsteinov
beta
teorem, 278
funkcija, 85
fluktuacije, 138
binomni poučak, 34
formula
poopćenje, 37
Eulerova, 209
brojevi
Poincaréova, 76
Bellovi, 189
Stirlingova, 202, 210, 229, 230, 242,
Besselovi, 237
298
poopćeni harmonijski, 124
funkcija
Stirlingovi, 189, 204
particijska, 219
Stirlingovi, druge vrste, 365
autokorelacijska, 509
Stirlingovi, prve vrste, 364
beta, 85
dobrota prilagodbe kumulantna
α, 477 jedna varijabla, 345
dogad̄aj više varijabla, 357
elementaran, 42 nepotpuna beta, 85
isključiv, 52 particijska, 289
nasumičan, 43 pogreške, 234
potpun skup, 42 funkcija, hipergeometrijska, 208

entanglement, 303 genetika, 87


entropija, 274, 304 greške
578 POPIS POJMOVA

prave, 380 centralni, 133


prividne, 380 pomoćni, 134
gustoća vjerojatnosti tromosti, devijacijski, 133
Gaußova, 236 momenti, 127
normalna, 236 faktorijelni, 362
Monte Carlo, 489
Hinčinov Monty Hallov problem, 91
teorem, 279
hipoteza, 86 načelo
maksimalne entropije, 284
indeks korelacije, 443, 444 maksimuma usrednjene entropije,
integral 288
Čebiševljev, 85 najmanji kvadrati
pogreške koeficijenata, 401
koeficijent
nasumični hod, 293
asimetrije, 139
neekstenzivna
spljoštenosti, 139
entropija, 304
koeficijent korelacije, 437
nepotpuna beta
kombinacije
funkcija, 85
bez ponavljanja, 24
nered
s ponavljanjem, 25
annealed, 560
konvolucija, 150, 159, 161
quenched, 560
korelacija
normiranje vjerojatnosti, 53
pojam, 419
kovarijanca, 165, 427 omjer korelacije, 449
kriging, 411 osnovni teorem aritmetike, 61
jednostavni, 413
s trendom, 416 particijska funkcija, 219, 289
uobičajeni, 416 Pearsonov korelacijski koeficijent, 437
Kroneckerov simbol, 149 permutacije
kumulanti, 134, 346, 348 bez ponavljanja, 17
faktorijelni, 362 s ponavljanjem, 19
rekurzije, 352 pokus
kumulirana binomna raspodjela, 190 deterministički, 42
kvartili, 125 nasumičan, 42
kvocjent varijacije, 138 polinom
Bellov , 349
Lévyeva raspodjela, 533 Touchardov, 204
Lagrangeovi množitelji, 287, 289, 292, Pottsov model, 197
410 prepletenost, 303
large deviation, 297 proces
LDT, 297 stacionaran, 509
LSA, 394
raspodjela gustoće vjerojatnosti
magnetizacija, 293 marginalna, 141, 158, 160
matrica raspodjela vjerojatnosti
korelacijska, 511 χ 2 , 260
transfera, 296 t-raspodjela, 262
medijal, 125 Benfordova, 215
medijan, 124 beta, 259
moment, 127 binomna, 181
POPIS POJMOVA 579

Bose - Einsteinova raspodjela, 260 singular value decomposition, 302


Breit-Wignerova, 268 sredina
Cauchyjeva, 268 aritmetička, 120
diskretna, 171 geometrijska, 123
eksponencijalna, 263 harmonijska, 123
Fermi - Diracova raspodjela, 261 standardna devijacija, 138
Fisherova, 268 Stirlingovi
gama, 254 brojevi, 204
Gaußova, 228 Stirlingovi brojevi, 189
geometrijska, 176 Stirlingovi brojevi druge vrste, 365
hipergeometrijska, 206 Stirlingovi brojevi prve vrste, 364
jednolika, diskretna, 174
teorem
jednolika, kontinuirana, 227
adicijski, 76
kontinuirana, 227
Feinsteinov, 278
logaritamsko - Gaußova, 254
Hinčinov, 279
Maxwell-Boltzmannova, 258
inverzije, 334
negativna binomna, 197
teorija velikih odstupanja, 297
normalna, 228
Touchardov polinom, 204
opća krivulja, 268
transfer matrica , 296
Pareto - Zipfova raspodjela, 214
Poissonova, 198 varijacije
polinomna, 197 bez ponavljanja, 22, 23
Zipf - Mandelbrotova raspodjela, s ponavljanjem, 23, 24
214 varijanca, 138, 427
ravnina korelacije, 451 vjerojatnost
red a priori, 43
Taylorov, 230 a posteriori, 45
Riemannova zeta-funkcija, 261 definicija, 43
rizik, 86 normiranje, 53
Popis autora

Čebišev, Pafnutij Ljvovič , (1821. – Kolmogorov, Andrej Nikolajevič, (1903 -


1894.), 369 1987), 515

Laplace, Pierre-Simon, marquis de,


Bell, Eric Temple, (1883 – 1960), 189
(1749 - 1827), 315

Feinstein, Amiel (? - ? ), 277 Markov, Andrej Andrejevič, (1856 -


Fermat, Pierre de, (1601 - 1665), 41 1922), 516
Mendel, Johann Gregor, 1822. - 1884., 87
Hinčin, Aleksandar Jakovljevič, (1894 - Pascal, Blaise, (1623 - 1662), 41
1959), 515 Poincaré, 76
Hinčin, Aleksandar Jakovljevič, (1894 -
1959), 279 Stirling, James, (1692 – 1770), 189, 229

You might also like