You are on page 1of 10

Statistička analiza eksperimentalnih podataka

6401/12

Rezime:
Mjerni postupci uvode određenu količinu varijabilnosti ili slučajnosti u rezultate. Ova
slučajnost može uticati na zaključke koji se izvlače iz eksperimenata. Statistika nudi alate koji
omogućavaju identificiranje i generaliziranje karakteristika analize podataka ili određivanje
granica nesigurnih podataka. U ovom seminarskom radu detaljnije je predstavljena
statistička analiza eksperimentalnih podataka i statističkih metoda koje se mogu koristiti za
planiranje eksperimenata i interpretiranje eksperimentalnih podataka.
Ključne riječi:
- statistička analiza
- eksperiment
- podatak
- histogram
- slučajna promjenljiva
- uzorak
- centralna tendencija
- aritmetička sredina
- disperzija
Uvod
Slučajne karakteristike posmatraju se u gotovo svim mjerenjima. Čak iako se koristi isti
mjerni sistem za mjerenje fiksne veličine u više navrata, rezultati neće imati istu vrijednost.
Ova slučajnost može biti uzrokovana nekontrolisanim promjenljivima koje utiču na mjerenu
veličinu, ili nedostatakom preciznosti u mjernom postupku. U nekim slučajevima, slučajnost
podataka dominira podacima tako da je teško razlikovati traženo trend kretanje. Ovo je
zajedničko eksperimentima u društvenim naukama i ponekad se javlja u inženjerstvu. U
takvim slučajevima statistika može ponuditi alate koji mogu identificirati trendove onoga što
je predstavljeno skupom zbrkanih podataka. U inženjerstvu, opći trendovi podataka su obično
očigledni, međutim statistički alati su često potrebni za identificiranje i generaliziranje
karakteristika analize podataka ili određivanje granica nesigurnih podataka.

Tipovi grešaka u mjerenju općenito se svrstavaju u dvije skupine: sistematske i slučajne.


Sistematske greške su povezane ponovljive greške koje se mogu svesti na minimum
kalibracijom mjernog sistema. Slučajne greške su najpodložnije metodama statističke analize.
Statistički principi ne koriste se samo za interpretaciju eksperimentalnih podataka, koriste se i
za planiranje eksperimenta, posebno onih sa velikim brojem samostalnih promjenljivih.

Kao primjer slučajnog ponašanja eksperimentalnih rezultata, razmotrit ćemo mjerenje


temperature toplog gasa koji protiče kroz cijev. Usljed faktora izvan eksperimentatorove
kontrole temperatura pokazuje promjenjljivost kada se mjeri u periodu od pola sata. Ovo se
dešava bez obzira na činjenicu da su svi instrumenti kalibrisani i da se mjerenje odvija
propisno. Temperaturu gasa tada razmatramo u statističkoj nomenklaturi, kao slučajnu
promjenljivu. U tabeli 1. prikazani su rezultati 60 mjerenja temperature zraka u cijevi. Ovi
podaci temperatura su posmatrane vrijednosti slučajne promjenljive. Tipičan problem povezan
sa podacima kao što su ovi je da se utvrdi da li je vjerovatno da temperatura može prekoračiti
određene granice. Iako ovi podaci pokazuju da temperatura ne može biti manja od 1039 °C ili
veća od 1115 °C, mi možemo, na primjer, pitati da li će temperatura ikad prekoračiti 1117 °C
ili biti manja od 1085 °C ako dođe do značajne promjene (bilo koje koja može uticati na
mjerni proces). Metode opisane kasnije u ovom seminarskom radu omogućit će odgovor na
ovo pitanje.

TABELA 1. Rezultati 60 mjerenja


temperature u cijevi [1]
Broj očitavanja Temperature (°C)
1 1089
1 1092
2 1094
4 1095
8 1098
9 1100
12 1104
4 1105
5 1107
5 1108
4 1110
3 1112
2 1115

Da bi lakše predstavili podatke, korisno ih je grafički prikazati u obliku kolona grafikona kao
što je to prikazano na slici 1. Kolona grafikon koji se korisiti za statističke analize, naziva se
histogram. Da bismo kreirali ovaj grafikon prvo moramo grupisati podatke u grupe, nazvane
intervalima, kao što je prikazano u tabeli 2. Svaki interval ima istu širinu (raspon
temperaturnih vrijednosti). Na slici 1 je to prikazano tako da je visina svake kolone
proporcionalna broju očitavanja koja se javljaju u svakom intervalu (učestalost pojavljivanja).
Trebalo bi navesti neka zapažanja u vezi slike 1. Prvo, maksimum se nalazi na broju očitanja
koji je blizu centra temperaturnog opsega. Drugo, broj očitanja temperature manje ili veće od
srednje vrijednosti brzo opada. Konačno, kriva je zvonastog oblika, ne paraboličnog – broj
očitanja intervala udaljenih od centra, i dalje mali, nije jednak nuli. Ove karakteristike
podataka u tabeli 1 su zajedničke, iako ne nužno, osobine eksperimentalnih rezultata. Slika 2
pokazuje neke druge oblike raspodjele na koje možemo naići u inženjerskim primjenama.
Slika 1. Histogram podataka temperature [1]

TABELA 2. Temperature mjerenja organizovane


u intervale [1]
Interval (°C) Broj mjerenja
1085 ≤ T < 1090 1
1090 ≤ T < 1095 3
1095 ≤ T < 1100 12
1100 ≤ T < 1105 21
1105 ≤ T < 1110 14
1110 ≤ T < 1115 7
1115 ≤ T < 1120 2

Neke opće smjernice za konstrukciju histograma. Uobičajeno je da imamo od 5 do 15


intervala. Najlakše je kada svaki interval ima istu širinu (razlika između najmanje i najveće
vrijednosti u intervalu). Postoje posebna pravila za intervale sa nejednakim širinama. Intervali
mogu pokrivati cijeli raspon podataka, bez praznina, ali se obično ne preklapaju. Na slici 1
nalazi se sedam intervala i svaki interval ima širinu od 5 °C. Ovaj primjer ilustruje slučajnu
promjenljivu koja se može neprekidno mijenjati i koja može uzeti bilo koju vrijednost u
odgovarajućem području. Takve promjenjljive nazvane su neprekidnim slučajnim
promjenljivima. Neki eksperimenti daju diskretne (prekidne) rezultate koji se smatraju
vrijednostima diskretne slučajne promjenljive. Primjeri diskretne slučajne promjenljive su
ishod bacanja kockice (gdje su jedine moguće vrijednosti 1, 2, 3, 4, 5 i 6) i nije
zadovoljio/zadovoljio proizvodi u procesu kontrole kvaliteta.

Da bi primijenili statističku analizu na eksperimentalne podatke, podaci se obično karakterišu


utvrđivanjem parametara koji određuju opću namjenu i disperziju padataka. Sljedeći korak je
izbor teorijske funkcije raspodjele koja je najpovoljnija za objašnjavanje ponašanja podataka.
Teorijska funkcija se onda može koristiti za izradu pretpostavki o različitim karakteristikama
podataka.
Slika 2. Neki od oblika raspodjela: (a) simetrična, (b) iskrivljena , (c) J-oblik, (d) bimodalna,
(e) homogena [1]

Opći koncepti i definicije

Definicije

Populcija. Populacija uključuje sve objekte, mjerenja, zapažanja i sve one krakteristike koje
su uzete u razmatranje i koje su uključene u donošenje zaključaka. Primjeri populacije su
cjelokupan skup 60W električnih sijalica koje se proizvode u proizvodnoj seriji i vrijednosti
brzine vjetra u određnoj tački u definisanom vremenskom periodu.

Uzorak. Uzorak je reprezentativan podskup populacije na osnovu kojeg se izvršava


eksperiment i dobijaju numerički podaci. Na primjer, 10 električnih sijalica može biti izabrano
iz proizvodne serije od 10,000 ili brzina vjetra se može mjeriti jednom svaki sat u periodu od
24 sata. Možemo birati različite uzorke iste populacije za ispitivanje.

Raspon uzorka. Skup svih mogućih ishoda jednog eksperimenta naziva se rasponom uzorka.
Na primjer, postoji šest mogućih ishoda kod bacanja kockice. Ako se raspon uzorka sastoji od
diskretnih vrijednosti (kao što su ishodi bacanja kockice ili novčića, prihvatljivi i
neprihvatljivi proizvodi), radi se o diskretnom rasponu uzorka. Slučajna promjenljiva
diskretnog raspona uzorka je diskretna. Ako je raspon uzorka neprekidan, imamo neprekidan
raspon uzorka i naravno neprekidnu slučajnu promjenljivu. Raspon uzorka mjerenja
temperature gasa koji izlazi iz peći je neprekidan.
Slučajna promjenljiva. Inženjerski eksperimenti kao i sva povezana mjerenja su pod utjecajem
mnogih faktora koji se ne mogu biti u potpunosti kontrolisani, pa kao rezultat ishod mjerenja i
eksperimenta nije jedinstven. Dva primjera takvih eksperimenta su mjerenje temperature
vrućeg gasa koji protiče kroz cijev i vrijeme trajanja elekrtričnih sijalica. Vrijednost
temperature je funkcija više faktora, uključujući rad izvora grijanja, cijevi izolacije i okoline, i
najvažnijeg, prirode toka i uređaja za mjerenje, u slučaju električnih sijalica, promjena u
karakteristikama materijala, proces proizvodnje i mjerni proces mogu uticati na mjerenje
vremena trajanja električnih sijalica. U svakom od spomenutih eksperimenata, bez obzira
kako dobro mi kontrolisali uticajne parametre, bez obzira na dovoljno utrošenog vremena,
ukoliko ponavljamo eksperiment, imat ćemo različite vrijednosti mjerenih promjenljivih.
Promjenljive koje se mjere (temperatura i vrijeme trajanja u ovim slučajevima) nazivaju se
slučajnim promjenljivima. S matematskog aspekta, slučajna promjenljiva je numerička
vrijednost funkcije kojom je definisana populacija. To znači da za svaki mogući ishod
eksperimenta postoji odgovarajuća numerička vrijednost.

Slučajne promjenljive mogu biti neprekidne i diskretne. Promjenjljive kod eksperimenta sa


električnom sijalicom i cijevi kroz koju protiče vrući gas su primjeri neprekidne slučajne
promjenljive. U principu, one mogu zamijeniti bilo koju stvarnu vrijednost. Ostale slučajne
promjenljive, kao što su ishodi bacanja kockice i zadovoljio/nije zadovoljio proizvodi u
procesu kontrole kvalitete, su diskretne slučajne promjeljive. Diskretne slučajne promjenjljive
imaju konačan broj mogućih vrijednosti.

Funkcija raspodjele. Funkcija raspodjele je grafička ili matematička veza koja se koristi za
predstavljanje vrijednosti slučajne promjenljive.

Parametar. Parametar je numerička karakteristika cijele populacije. Na primjer, srednja


vrijednost slučajne promjenljive kod neke populacije je parametar za tu populaciju.

Događaj. Događaj je ishod slučajnog eksperimenta.

Statistik. Statistik je numerička karakteristika uzorka. Na primjer, srednja vrijednost nekog


svojstva uzorka je statistik uzorka.

Vjerovatnoća. Vjerovatnoća je promjena pojavljivanja događaja tokom eksperimenta. Može


se dobiti dijeljenjem broja uspješnih pojavljivanja sa brojem pokušaja. Na primjer, postoji
50% šanse da će ishod bacanja novčića biti glava.

Mjere centralne tendencije

Mjere centralne tendencije predstavljaju vrijednosti koje najbolje reprezentiraju određeni skup
podataka. Zajedničko obilježje mjera centralne tendencije ili središnjih mjera jest da svaka od
njih predstavlja jednu vrijednost koja bi trebala biti dobra zamjena za skup svih pojedinačnih
vrijednosti, odnosno njihov najbolji reprezentant. Dakle, težnja mjera centralne tendencije je
da ukažu na vrijednost oko koje postoji tendencija grupisanja rezultata, odnosno ukazuju na
rezultat koji ima najveću vjerojatnost pojavljivanja. Postoji nekoliko mjera centralne
tendencije koje se razlikuju prema načinu utvrđivanja i mogućnosti primjene. Tako se
najčešće razlikuju potpune i položajne mjere centralne tendencije. Potpune mjere centralne
tendencije izračunavaju se na temelju svih podataka. To su: aritmetička sredina, geometrijska
sredina i harmonijska sredina. Nasuprot njima, mod i medijan su određeni položajem u
uređenom nizu podataka. S obzirom na prirodu varijabli, najčešće u upotrebi su: aritmetička
sredina, mod i medijan.

- Aritmetička sredina

Aritmetička sredina je vrijednost na koju se obično misli kada se koriste termini srednja
vrijednost ili prosjek. Proračunava se sabiranjem vrijednosti svih podataka skupa te potom
dijeli sa ukupnim brojem članova skupa. Parametarski statistički testovi, kao što je t-test
nezavisnih uzoraka, koji su dizajnirani tako da otkriju razliku između mjera centralne
tendencije, mogu izvršiti upoređivanje aritmetičkih sredina različitih skupova podataka.
Matematski, aritmetičku sredinu definišemo kao:

gdje veličine xi predstavljaju vrijednosti podataka uzorka a n je broj mjerenja. Za populaciju


sa konačnim brojem elemenata, N, sa vrijednostima xi, aritmetička sredina se označava sa µ i
data je relacijom:

S obzirom da je aritmetička sredina potpuna mjera centralne tendencije, odnosno da na njenu


vrijednost podjednako utiču rezultati svih entiteta, podložna je promjenama pod uticajem
izrazito niskih ili visokih pojedinačnih vrijednosti, što može znatno uticati na njenu
reprezentativnost.

- Mod ili dominantna vrijednost

Mod je vrijednost varijable koja odgovara maksimalnoj vrijednosti vjerovatnoće pojavljivanja


nekog događaja. Kod diskretnog raspona uzorka, mod može biti jednostavno predstavljen kao
najčešća pojavljivana vrijednost. Kod neprekidnog raspona uzorka, mod se uzima kao središte
intervala podataka sa najvišom frekvencijom. Za neke raspodjele (na primjer, homogena
raspodjela), mod možda uopće ne postoji; dok za neke druge raspodjele (na primjer,
bimodalna raspodjela), postoji više od jedne maksimalne frekvencije a samim time i više od
jednog moda. Kada raspodjela ima više od jednog moda, frekvencije pojavljivanja svakog
moda ne moraju biti iste.

- Medijan ili centralna vrijednost

Medijan je središnja tačka ili vrijednost koja se nalazi tačno na sredini skupa rezultata,
ukoliko su oni poredani po veličini u rastućem ili opadajućem redoslijedu. Također možemo
reći da je medijan vrijednost koja uređeni niz rezultata dijeli na dva jednakobrojna dijela.
Ukoliko skup sadrži paran broj elemenata, onda je medijan aritmetička sredina dvije centralne
vrijednosti.
Uobičajeno za aritmetičku sredinu, medijan i mod je da imaju približno iste vrijednosti (iako
one općenito neće imati tačno istu vrijednost), međutim kod nekih skupova podataka njihove
vrijednosti se značajno razlikuju. Na slici 3. dati su rasporedi osnovnih mjera centralne
tendencije u zavisnosti od oblika raspodjele.

Slika 3. Mjere centralne tendencije [2]

Mjere disperzije

Mjerama disperzije mjeri se stepen homogenosti numeričkog niza odnosno stepen


promjenljivosti podataka. Sama disperzija predstavlja širenje ili promjenljivost podataka. Na
primjer, skup mjerenja u rasponu od 90 do 110 ima veću disperziju od skupa mjerenja u
rasponu od 95 do 105. Sljedeće veličine su one koje se najčešće koriste za predstavljanje
mjera disperzije:

Raspon podataka predstavlja razliku između maksimalne i minimalne vrijednosti podataka i


definiše se izrazom:
Varijancija se definiše kao:

Varijancija uzorka je vrijednost sume kvadrata odstupanja svih podataka od njihove srednje
vrijednosti podijeljene sa n-1 i definiše putem izraza:

gdje n predstavlja ukupan broj podataka u uzorku.

Varijancija populacije je vrijednost sume kvadrata odstupanja svih podataka od njihove


srednje vrijednosti podijeljene sa N i definisana je relacijom:

gdje N predstavlja ukupan broj podataka u populaciji.


Odstupanje svakog mjerenja definiše se kao:

Srednje odstupanje definišemo kao:

Standardno odstupanje uzorka je pozitivna vrijednost drugog korijena varijancije uzorka i


definisano je izrazom:

gdje n predstavlja ukupan broj podataka u uzorku. Standardno odstupanje uzorka koristi se
onda kada se uzorak podataka koristi za procjenu standardnog odstupanja populacije.

Za populaciju sa konačnim brojem elemenata, standardno odstupanje populacije se definiše


putem realcije:
gdje N predstavlja ukupan broj elemenata u populaciji.

Koeficijent varijacije uzorka predstavlja omjer vrijednosti standardnog odstupanja uzorka sa


srednjom vrijednosti podataka u uzorku:

Koeficijent varijacije populacije predstavlja omjer vrijednosti standardnog odstupanja


populacije sa srednjom vrijednosti podataka u uzorku:

Pouzdanost softvera za statističku analizu

Poznata je priča da istraživači koji rješavaju isti problem koristeći pritom dva različita
softverska paketa dobijaju različite rezultate. Naravno, istraživač ne može znati koji je od ta
dva rezultata tačan. Dalje, ne može znati ni koji softverski paket daje pouzdanije rezultate.
Drugi istraživač koji rješava problem koristeći samo jedan od ova dva paketa neće imati
dilemu o preciznosti rezultata. Međutim, oslanjanje na proizvođačevu preciznost i
recezentovu temeljitost vodi do namjernog odsustva nevjerice.

Sa poštovanjem proizvođačeve preciznosti, postojanje poznatih benchmark-ova za


jednostavne statističke procedure i neuspjeh mnogih programa da polože testove tačnosti
ukazuje na to da mnogi proizvođači ne ulažu napor da poboljšaju preciznost svojih programa.
Tako da ukoliko želimo dobiti pouzdane rezultate statističke analize i pritom koristiti neki od
softvera, moramo obratiti pažnju na preciznost koju ti softveri pružaju kao i na rezultate
testova tačnosti.

Dobro poznata kolekcija jednostavnih testova je Wilkinson-ov „Statistics Quiz“, koji


predstavlja skupinu problema dizajniranih tako da otkriju mane statističkih programa. Ove
testove možemo smatrati prijemnim testovima koji se provode prije dosta ozbiljnijih testova
za numeričku preciznost. Međutim primjena ovih testova doživjela je mnogo neuspjeha,
uključujući dosta veća odstupanja i koeficijente korelacije od uobičajenih. Iz ovog nam je
jasna potreba za benchmarking-om čija je svrha da obezbijedi kvalitetno izvšenje programskih
algoritama.

Tokom godina razvili su se mnogi benchmark-ovi i većina njih bila je za linearne procedure.
Međutim, Nacionalni institut za standarde i tehnologiju (National Institues of Standards and
Technology - NIST) otklonio je ovaj nedostatak sastavljanjem benchmark-ova za preko 20
nelinearnih problema najmanjih kvadrata. Dodavanjem postojećih benchmark-ova ovim NIST
je kreirao web stranicu Statistička preporuka skupova podataka (Statistical Reference
Datasets - StRD). Ova web stranica ima četiri područja benchmark-ova: univarijantna sažeta
statistika, analiza varijanse, linearna regresija i nelinearna regresija, sa test podacima u ASCII
formatu i „cetificiranim vrijednostima“ sa parametrima tačnosti do nekoliko decimala.

Benchmarking je dugotrajan proces, i većina korisnika ne želi trošiti vrijeme provjeravajući


svoj softver, već umjesto toga preferiraju čitati recenzije koje sadrže procjene numeričke
preciznosti. Međutim, izlaz benchmarking-a je obiman, i zahtijeva dosta više prostora nego
uobičajena softverska recenzija. Rezultati testova se moraju sažeti, možda na jednu stranicu,
sa diskusijom rezultata i primijećenih nepravilnosti od najviše 2 do 3 stranice. Takva metoda
omogućava nekoliko prednosti: prvo, to znači da procjena numeričke preciznosti može biti
dio bilo koje softverske recenzije; drugo, omogućava čitaču sažetak numeričkih prednosti i
nedostataka paketa; i treće, olakšava poređenje paketa.

Procjena je samo jedan aspekt satističkih softvera sklonih numeričkim greškama. I generator
slučajnih brojeva (RNG) i razne statističke raspodjele (na primjer: izračunavanje Pi
vrijednosti) se predstavljaju kao crne kutije (black boxes): RNG će osigurati što veći broj
zaista slučajnih brojeva kako korisnik i želi, dok je izlaz statističke raspodjele tačan za sve
prikazane decimale, bez obzira na ulazne parametre. Naravno, posljednje dvije tvrdnje nisu
tačne. Proizvođači rijetko osiguravaju algoritme koji su osnova ovih procedura, a kamoli
granice u okviru kojih se možemo sigurno osloniti na njih ili bilo koji dokaz njihove tačnosti.
Zbog toga, moramo ocjenjivati pouzdanost, ili nedostatak iste, i za RNG i za statističke
raspodjele.

Zaključak

Najjednostavniji način za postizanje preciznosti i pouzdanosti zaključaka koje izvlačimo iz


eksperimenata je korištenje alata koje nam nudi statistika. Ti alati omogućavaju nam
identificiranje i generaliziranje karakteristika analize podataka te određivanje granica
nesigurnih podataka. Mjere centralne tendencije te mjere disperzije ubrajaju se u
najpoznatije statističke metode i znatno olakšavaju planiranje eksperimenta i interpretaciju
eksperimentalnih podataka. Mjere centralne tendencije omogućavaju najbolje predstavljanje
određenog skupa podataka dok mjere disperzije omogućavaju mjerenje stepena
promjenljivosti podataka. Uporedo sa razvojem tehnologije razvijali su se i softverski paketi
namijenjeni za statističku analizu. Prilikom upotrebe ovih softvera potrebno je obratiti pažnju
na preciznost istih i u skladu s tim vršiti vrednovanje dobijenih rezultata.

Literatura
[1] Wheleer A. J. & Ganji R. A. (2010). Introduction to Engineering Experimentation. P
[2] https://www.pmf.unizg.hr/_download/repository/PREDAVANJE7.pdf
(dostupno 12.01.2017)
[3] http://www.sportexpertsystem.com/?p=303 (dostupno 11.01.2017)
[4] Clark-Carter D. (2010). Measures of Central Tendency. Staffordshire University,
Stoke-on-Trent, UK
[5] McCullough B.D. (2012). Assessing the Reliability of Statistical Software: Part I. The
American Statistican. 52:4, 358-366

You might also like