Professional Documents
Culture Documents
Statistička Analiza Podataka
Statistička Analiza Podataka
Sve analitike procedure su podlone grekama. Zbog toga, izmerene koncentracije neke
komponente u vodi, vazduhu ili zemljistu se obino razlikuju od stvarnih vrednosti. Razni
podaci koriste u razliite svhre (inenjerstvo, forenzika, pravo, itd) gde je od velike vanosti
poznavati tane vrednosti. Iz tog razloga, potrebno je u potpunosti poznavati nesigurnosti koje se
javljaju.
Raunari i kalkulatori su u mnogo olakali statistiku analizu, jer u sebi ve poseduju
predefinisane funkcije za racunanje pojmova kao to su srednje vrednosti, ili devijacije. Treba
napomenuti da njihova lakoa korienja izuskuje potrebu za jo boljim poznavanjem osnova
statistike analize, jer se u suprotnom mogu nainiti velike greke, a da osobe koje vre analizu
nisu ni svesne toga.
2. Definicije
Zbog pojave nesigurnosti u merinjima, obino se merenja vre po nekoliko puta, uzima
se vie uzorka itd. Rezultati pojedinanih merenja se takodje razlikuju zbog nesigurnosti, tako
da je potrebno sistematizovati dobijene vrednosti. Obino se koriste metode za odrivanje
centralne tendencije rezulata, kao metode koje pokazuju koliko se pojedinana merenje razlikuju
jedna od drugih. Cenralna vredsnot rezultata (odreena nekom od metoda) obino je pouzdanija
od bilo kog od pojedinanih rezultata ponaosob. Stepen odstupanja pojedinanih rezutata jedni
od drugih pokazuju meru nesigurnosit.
Srednja vrednost ili aritmetika sredina su termini koji se koriste da bi se iskazala centralna
tendencija, koja se dobija deljenjem sume svih merenja sa brojem izvrenih merenja:
n
x =
xi
i=1
jednaina7.1.
gde svako predstavlja pojedinano merenje, a n predstavlja ukupni broj nainjenih merenja.
Medijana je srednja vrednost u seriji (niz) podataka. Ako se niz sastoji iz neparnog broja
podataka, onda je medijana onaj broj tano u sredini. U sluaju da se niz sastoji od parnog broja
podataka, medijana je aritmetika sredina dva broja u sredini.
Primer 1:
Odrediti srednju vrednost i medijalnu srednju vrednost za sledea merenja BPK za postrojenje za
tretman otpadnih voda za mesec maj: 15, 22, 10, 29, 5, 16, 19, 6, 28, 14 i 17 mg/l.
Srednja vrednost:
Ovde je vrednost zaokruena bez decimala, jer su u tom, obliku date izmerene vrednosti.
Medijalna srednja vrednost: Kada se pogleda niz dobijenih vrednosti (5, 6, 10, 14, 15, 16, 17,
19, 22, 28, 29), vidi se da je broj u sredini 16, to znai da 16 mg/l predstavlja medijalnu srednju
vrednost, to je u ovom sluaju, ista vrednost kao i za srednju vrednost, to ne mora uvek da
bude tako.
Standardna devijacija mera rasprostranjenosti srodnih vrednosti u setu podataka. Takoe moe
da pokae meru nesigurnosti u vrednosti ili njenu preciznost. Standardna devijacija s se definie
kao:
s=
( x i x )
jednaina 7.2.
n1
to je numeriki jednako:
s=
x 2i ( xi ) /n
jednaina 7.3.
n1
s2=
( xi x ) 2
jednaina 7.4.
n1
Primer 2:
Odrediti standardnu devijaciju i varijansu za izmeren BPK u efluentu datom u prethodnom
primeru.
Reenje:
Vrednost srednje vrednosti u prethodnom primeru iznosi 16,45 mg/l, to je zaokrueno na 16
mg/l. Koriene su jednaine 7.2. i 7.3. da bi se rezultati predstavili na sledei nain:
Tabela 7.1: Dobijene vrednosti primenom jednaina 7.2 i 7.3
xi
15
22
10
29
5
16
(xi
x )2
2,12
30,75
41,66
157,39
131,21
0,21
x 2i
225
484
100
841
25
256
19
6
28
14
17
6,48
109,30
133,30
6,02
0,30
618,73
= 181
x = 16,45
Iz jednaine 7.2. s =
( x ix ) 2
n1
618,73
111
361
36
784
196
289
3597
= 7,87
x 2i ( xi ) / n
n1
= 7,78
jednaina 7.5.
gde je xt referentna ili prihvaena vrednost. Pored apsolutne greke, odreuje se i relativna
greka koja je nekada i vanija od apsolutne.
Er = 100
x ix t
xt
jednaina 7.5.
Za podatke iz prethodnog paragrafa, apsolutna greka iznosi 145 155, tj -10 mg/l, a relativna
greka iznosi 100(145 155)/155, tj -6.5 %.
Postoje tri tipa greaka, neodreene (nasumine), odreene (sistematske) i grube greke.
Neoreene greke prouzrokuju da se izmerene vrednosi nalaze manje ili vie sistematski rasute
oko srednje vrednosti. Ove greke su rezultat nekontrolisanih faktora i promenljivih koje se
javljaju u svakom merenju. Odreene greke imaju taan uzrok koji moe biti identifikovan. To
mogu biti greke od instrumenata, greke u metodi ili greke osoblja. Greke od instrumenata se
javljaju jer ni jedan instrument nije savren i mogu se javiti i na najprostijim instrumentima kao
to je pipeta, a i na najkompleksnijim kao to je npr hromatograf. Greke u metodi su vezane za
fizike i hemijske aspekte odreene metode merenja, kao to su neistoe u hemikalijama koje
se koriste za pravljenje standarda, nepotpune hemijske reakcije, itd. Greke osoblja se odnose na
loe rukovanje ili prirodna ogranienja osobe koja izvodi merenje, kao to je npr nemogunost
da se uzorak ubaci u hromatograf uvek na isti nain. Grube greke obino nastaju kao posledica
loeg rukovanja osoblja, kao to je npr loe oitana vrednost sa vage, greke u raunanju,
zapisivanju rezultata, itd. Osoba koja izvodi merenje mora uvek proveravati svoje procedure da
bi bile u skladu sa standardima. Paljivom evaluacijom nastalih greaka, mogue je utvrditi
njihov izvor.
3.
Distribucija
podataka
(raspodela)
eksperimentalnih
Y=
jednaina 7.7
gde n predstavlja ukupni broj prikupljenih podataka, a i predstavlja interval u okviru koga se
proverava uestalost vrednosti.
35,0
37,9
35,2
30,7
28,8
36,6
27,0
29,1
33,2
29,0
25,5
26,4
30,6
28,9
33,7
28,1
35,2
24,0
25,6
32,8
23,3
23,2
22,5
28,0
23,7
21,9
12,9
12,6
14,7
13,3
41,8
39,1
24,7
30,0
35,1
33,9
35,7
33,3
36,0
30,5
27,3
36,4
25,5
9,0
9,4
29,5
37,3
28,9
27,5
7,7
31,8
30,0
28,7
42,2
30,9
22,1
36,8
31,4
29,0
5,9
31,4
29,9
33,6
29,9
33,3
25,8
28,3
37,1
35,9
26,1
26,4
27,9
24,6
25,4
28,8
26,0
27,0
25,2
27,7
24,6
33,4
24,4
29,3
21,0
23,5
25,2
23,3
26,9
27,5
26,1
41,6
49,5
36,0
45,7
30,2
28,5
34,8
26,7
23,8
26,8
23,3
33,3
17,9
19,5
36,6
38,8
32,1
33,7
30,5
30,9
30,6
39,3
23,3
37,0
30,9
33,2
38,1
40,6
25,7
31,9
28,3
32,6
24,8
26,9
23,1
24,9
23,2
23,3
23,3
23,5
23,6
23,7
23,8
24,0
24,0
24,4
24,6
24,6
24,7
24,8
24,9
25,2
25,2
25,4
25,5
25,5
25,6
25,7
25,8
26,0
26,1
26,1
26,4
26,4
26,7
26,8
26,9
26,9
27,0
27,0
27,3
27,5
27,5
27,7
27,7
28,0
28,1
28,3
28,3
28,5
28,7
28,8
28,8
28,9
28,9
29,0
29,0
29,1
29,3
29,3
29,5
29,9
29,9
30,0
30,0
30,2
30,5
30,5
30,6
30,6
30,7
30,9
30,9
30,9
31,4
31,4
31,8
31,9
32,1
32,6
32,8
33,0
33,1
33,2
33,2
33,2
33,2
33,3
33,3
33,3
33,4
33,6
33,7
33,7
33,9
34,8
35,5
35,1
35,2
35,2
35,7
35,9
36,0
36,0
36,3
36,4
36,6
36,8
36,9
37,0
37,1
37,3
37,5
37,8
37,9
38,1
38,3
38,8
39,1
39,3
40,6
40,6
41,6
41,8
42,2
45,7
46,2
49,5
Sledee, odabrati prikladan interval koji deli podatke u 10 do 12 grupa. Dobijene grupe podataka
od 6 do 50 predstavljaju razliku od 44. Kada se to podeli sa 12, dobija se 3,7. nakon toga se
biraju intervali od 3 do 4:
Tabela 7.4: Intervali i broj podataka
Interval
0,0-2,9
3,0-5,9
6,0-8,9
9,0-11,9
12,0-14,9
15,0-17,9
18,0-20,9
21,0-23,9
24,0-26,9
27,0-29,9
30,0-32,9
33,0-35,9
Broj podataka
0
1
1
2
4
1
1
11
25
25
18
21
36,0-38,9
39,0-41,9
42,0-44,9
45,0-47,9
48,0-50,9
16
6
1
2
1
Broj koji se nalazi unutar svakog intervala predstavlja frekvenciju. Odnos frekvencija za svaki
interval u odnosu na interval koncentracije prikazan je na slici 7.2.
primenom jednaina 7.1. i 7.3. i dolazi se do vrednosti 29,6 i 7,4, respektivno. Mogu se uporediti
srednjavrednost sa medijalnom srednjom vrednosti. Poto ima paran broj vrednosti, da bi se
dobila medijlalna vrednost mora se izraunati srednja vrednost 68. i 69. vrednosti (od ukupno
138), odakle se dobija 29,4. Ova vrednost je blizu srednje vrednosti, kao to i treba da bude kada
su vrednosti ravnomerno rasporeene.
Sada se moe frekvencija distribucije za podatke sa teorijskom frekvencijom, koja bi se
dobila kada bi = x i = s. Tada, primenom jednaine 7.8. gde je n = 136 i i = 3, dobija
se kriva frekventne distribucije, prikazana na slici 10.2. Moe se videti da je u cilju da se napravi
ovakvo poreenje, potrebno mnogo vdobijenih vrednosti.
Jo jedna komparacija koja se moe porediti je poreenje procenata koji se nalaze unutar
datih opsega definisanih standardnom devijacijom. Ove vrednosti se mogu uporediti sa
teorijskim vrednostima.
Tabela 7.5: Stvarni podaci u opsegu
Opseg oko srednje
vrednosti
Broj
Teorijski podaci
u opsegu, %
s
2s
3s
22,2 - 37,0
14,8 - 44,4
7,4 - 51,8
106
125
135
77
91,9
99,3
68,3
95,5
99,7
4. Greke
Uprkos svim naporima da se unaprede metode merenja, uvek e postojati greke nastale
usled uzorkovanja, preparacije i analize uzoraka, tako da e izmerena vrednost neke veliine
uvek odstupati od srednje vrednosti. Zbog toga, ako se odreeni uzorak analizira cie puta
sukcesivno, vrlo je verovatno da e izmerena vrednost biti drugaija svaki put. Raunanjem
srednje vrednosti (mean), dobijamo vrednost koja je verovatno blia stvarnoj vrednosti u odnosu
na izmerene rezultate pojedinano. Postavlja se pitanje koliko se moe poboljati merenje,
uzimanjem srednje vrednosti niza merenja, i koliko pojedinanih merrenja je dovoljno da bi se
dobio zadovoljavajui rezultat?
Standardna greka srednje vrednosti Standardna devijacija s pokazuje nam meru distribucije
(rasprostranjenosti) podataka oko srednje vrednosti. Ako je s odreenog merenja vee od eljene
vrednosti, moemo ga smanjiti sprovoenjem dodatnih merenja. Standardna greka srednje
vrednosti sm je funkcija broja analiza izvrenih da bi dobila srednja vrednost.
sm =
s
n
jednaina 7.9
Primer 4:
Odrediti standardnu greku medinalne sredne vrednosti sm za svaki red podataka datih u primeru
3 i uporedti i uporediti rezultate sa standardnom devijacijom s. Uraditi analizu za svaki red
posebno uzimajui redove sa 10 i 9 vrednosti. procene sm za redove ako je n 9 ili 10 su:
sm(n=9) =
s
n
7,4
9
= 2,5
sm(n=10) =
s
n
7,4
10
= 2,3
Srednje vrednosti za svaki red iz tabele u primeru 3 date su koritei jdnainu 7.9. u tabeli 7.6:
Red (n = 10)
30,9
31,4
28,8
28,4
28,8
28,2
30,1
30,4
29,2
25,7
29,2
1,6
2,3
Red (n = 9)
25,8
31,9
30,6
34,2
30,6
3,5
2,5
Broj
analiza
4
4
7
4
Ukupno
3
18
Hloridi, mg/l
2 220; 2 260; 2 230; 2 090
3 220; 3 200; 2 930; 3 100
2 460; 2 820; 2 430; 2 540; 2 550;
2 560; 2 580;
1 850; 1 810; 1 730
Ukupni zbir kvadrata
Srednja
vrednost, mg/l
2 220
3 110
2 560
Zbir kvadrata
devijacija
17 000
52 675
95 343
1 800
7 467
172 485
Odvojena standardna devijacija (pooled) koja iznosi 100 mlnalazi se izmeu standardne
devijacije individualnog uzorka, koja je u opsegu od 61 do 133 mg/l. Dok vrednost od 100 mg/l
nije daleko od prosene vrednosti standardne devijacije etiri uzorka (99 mg/l), metoda koriena
za raunanje odvojene vrednosti ima veu teinu nego prosto raunanje prosene vrednosti.
Granine sigurnosti i intervali esto nas zanima stvarna srednja vrednost seta podataka.
Meutim, nikada ne moemo znati egzaktnu srednju vrednost, jer bi to zahtevalo beskonaan
broj merenja. Korienjem statistike teorije, moemo pretpostaviti, sa odreenim stepenom
verovatnoe, opseg oko eksperimentalne srednje vrenosti u kome se moe oekivati da lei
stvarna srednja vrednost. Granice odreene ovim postupkom se nazivaju granice sigurnosti (CL
- confidence limits), a interval koji definiu se naziva interval sigurnosti (CI - confidence
interval). Za njihovo izraunavanje koristi se parametar t.
CL za =
ts
n
jednaina 7.10
Stepen
slobode
1
2
3
4
5
6
7
8
9
10
12
14
16
18
20
25
30
40
50
60
80
50 %
90 %
Nivo verovatnoe
95 %
1,000
0,816
0,765
0,741
0,727
0,718
0,711
0,706
0,703
0,700
0,695
0,692
0,690
0,688
0,687
0,684
0,683
0,681
0,679
0,679
0,678
0,674
6,314
2,920
2,353
2,132
2,015
1,943
1,895
1,860
1,833
1,812
1,782
1,761
1,746
1,734
1,725
1,708
1,697
1,684
1,676
1,671
1,664
1,645
12,71
4,303
3,182
2,776
2,571
2,447
2,365
2,306
2,262
2,228
2,179
2,145
2,120
2,101
2,086
2,060
2,042
2,021
2,009
2,000
1,990
1,960
98 %
99 %
31,821
6,965
4,541
3,747
3,365
3,143
2,998
2,896
2,821
2,764
2,681
2,624
2,583
2,552
2,528
2,485
2,457
2,423
2,403
2,390
2,347
2,326
63,66
9,925
5,841
4,604
4,032
3,707
3,499
3,355
3,250
3,169
3,055
2,977
2,921
2,878
2,845
2,787
2,750
2,704
2,678
2,660
2,639
2,576
Broj podataka u primeru 1 je 11, pa je stepen slobode 10. Srednja vrednost je izraunata i
dobijena je vrednost 16 mg/l, a standardna devijacija je bila 8 mg/l. Iz tabele 10.1 za verovatnou
od 95% verovatnoa i 10 stepen slobode, t jednak je 2,228. Iz toga seldi:
CL =
ts
n
2,228 (8)
111
jednaina 7.11.
sy =
s +s + s
2
a
2
b
2
c
jednaina 7.12.
Primer 7:
Uklanjanje BPK se posmatra kao reakcija prvog reda:
ln
Lt
L
= - k't
jednaina 7.20.
gde L/Lt predstavlja frakciju preostalog BPK nakon vremena t. Ako je konstanta prvog reda k
jednaka 0,28(0,05) dan-1, koliki bi bio stepen nesigurnosti prilikom raunanja preostale koliine
BPK nakon standardnog petodnevnog BPK testa, izraeno preko standardne devijacije?
Za poetak, potrebno je tano odrediti vreme, da bi standardna devijacija vreena bila 0. Nakon
toga, L/Lt se izrazi preko jednaine 7.20. u eksponencionalnoj formi:
Lt
L
'
k t
= e
s L /L
Lt / L
t
odakle sledi:
sL / L
Lt
L
skt
s k 2 st
+
k
t
)( )
sk
= k
Odatle je:
skt
tsk
= 5 0,05 = 0,25
Lt
L
5. Zadaci
= 0,247(0,062)
1. Odrediti srednju vrednost i medijanu izmerenih vrednosti BPK u otpadnoj vodi. Izmerene vrednosti su:
15, 22, 10, 29, 5, 16, 19, 6, 28, 14, 17 mg/l.
Srednja vrednost:
n
x =
xi
i=1
s=
s=
( x i x )
n1
2
x 2i ( xi ) / n
n1
Varijansa:
2
s=
( xi x ) 2
n1
( x ix )
15
22
10
xi
2.12
30.75
41.66
225
484
100
29
5
16
19
6
28
14
17
157.39
131.21
0.21
6.48
109.30
133.30
6.02
0.30
841
25
256
361
36
784
196
289
181
618.83
3597
( x i x )
n1
618.3
111
= 7.87 = 8 mg/l
Varijansa:
( 7,87 )2 = 62 mg/l
3. Analizirana su 4 razliita uzorka vode na prisustvo hlora. Rezultati analize su dati u tabeli.
Odrediti standardnu devijaciju objedinjenih podataka (spooled) i uporediti je sa standardnom
devijacijom svakog seta podataka zasebno.
Tabela 7.11: Rezultati dobijeni analizom hlorida
Redni broj
uzorka
1
2
3
Broj analiza
uzoraka
Hlor, mg/l
Srednja vrednost,
mg/l
( x i x )
4
4
7
2200
3110
2560
17000
52675
95343
18
1800
7467
172485
Raunanje standardne
devijacije
Standardna devijacija
Pooled
4. Odrediti granice sigurnosti sa verovatnoom od 95% za srednju vrednost BPK izraunatu u 1.
zadatku.
Broj podataka u 1. zadatku je 11, to znai da broj stepeni slobode iznosi 10. Izmerena srednjav
rednost je iznosila 16 mg/l, a standardna devijacija 8 mg/l. Za verovatnou od 95% i 10 stepeni
slobode, iz tabele (na sledeoj stani) vadimo vrednost koeficijenta t, koji iznosi 2.228.
Interval sigurnosti:
CI =
ts
n
2,228 8
111
Granice sigurnosti:
CL = 16 6 mg/l u intervalu 10 + 22 mg/l
99.5
99.8
99.9
63.66
127.3
318.3
636.6
6.965
9.925
14.09
22.33
31.60
3.182
4.541
5.841
7.453
10.21
12.92
2.132
2.776
3.747
4.604
5.598
7.173
8.610
1.476
2.015
2.571
3.365
4.032
4.773
5.893
6.869
1.134
1.440
1.943
2.447
3.143
3.707
4.317
5.208
5.959
0.896
1.119
1.415
1.895
2.365
2.998
3.499
4.029
4.785
5.408
0.706
0.889
1.108
1.397
1.860
2.306
2.896
3.355
3.833
4.501
5.041
0.703
0.883
1.100
1.383
1.833
2.262
2.821
3.250
3.690
4.297
4.781
10
0.700
0.879
1.093
1.372
1.812
2.228
2.764
3.169
3.581
4.144
4.587
11
0.697
0.876
1.088
1.363
1.796
2.201
2.718
3.106
3.497
4.025
4.437
12
0.695
0.873
1.083
1.356
1.782
2.179
2.681
3.055
3.428
3.930
4.318
13
0.694
0.870
1.079
1.350
1.771
2.160
2.650
3.012
3.372
3.852
4.221
50%
60%
70%
80%
90%
95%
98%
99%
1.000
1.376
1.963
3.078
6.314
12.71
31.82
0.816
1.061
1.386
1.886
2.920
4.303
0.765
0.978
1.250
1.638
2.353
0.741
0.941
1.190
1.533
0.727
0.920
1.156
0.718
0.906
0.711
slobod
e
14
0.692
0.868
1.076
1.345
1.761
2.145
2.624
2.977
3.326
3.787
4.140
15
0.691
0.866
1.074
1.341
1.753
2.131
2.602
2.947
3.286
3.733
4.073
16
0.690
0.865
1.071
1.337
1.746
2.120
2.583
2.921
3.252
3.686
4.015
17
0.689
0.863
1.069
1.333
1.740
2.110
2.567
2.898
3.222
3.646
3.965
18
0.688
0.862
1.067
1.330
1.734
2.101
2.552
2.878
3.197
3.610
3.922
19
0.688
0.861
1.066
1.328
1.729
2.093
2.539
2.861
3.174
3.579
3.883
20
0.687
0.860
1.064
1.325
1.725
2.086
2.528
2.845
3.153
3.552
3.850
30
0.683
0.854
1.055
1.310
1.697
2.042
2.457
2.750
3.030
3.385
3.646
40
0.681
0.851
1.050
1.303
1.684
2.021
2.423
2.704
2.971
3.307
3.551
50
0.679
0.849
1.047
1.299
1.676
2.009
2.403
2.678
2.937
3.261
3.496
60
0.679
0.848
1.045
1.296
1.671
2.000
2.390
2.660
2.915
3.232
3.460
80
0.678
0.846
1.043
1.292
1.664
1.990
2.374
2.639
2.887
3.195
3.416
0.674
0.842
1.036
1.282
1.645
1.960
2.326
2.576
2.807
3.090
3.291
Ulaz HPK u reaktor je predstavljen je kao proizvod protoka prilikom ulaza i koncentracije HPK,
kao to je HPK na izlazu predstavljen kao proizvod protoka na izlazu i koncentracije
HPK.Procenat ukljanjanja HPK predstavljen je:
HPKuklanjanje = 100 (1
Qizlaz C izlaz
Qulaz Qulaz
1,4 9
1,5 195
= 0,043
Odakle je
s 0,043
0,05 2 3 2 0,06 2 22
+
+
+
1,5
9
1,4
195
)()( )( )
= 0,36
sy
y
=x
( sa )
a
Za logoritme imamo:
y = ln a
za koju je derivat (izvod):
dy =
da
a
Na osnovu toga moemo videti da mala promena apsolutne vrednosti y odgovara maloj promeni
relativne vrednosti a, s toga standardna devijacija za y odgovara relativnoj standardnoj devijaciji
za a.
sy =
sa
a