Professional Documents
Culture Documents
16 Obrada I Analiza Podataka
16 Obrada I Analiza Podataka
DOBIJENIH ISTRAIVANJEM
1/3
Svrha obrade i analize podataka je crpljenje informacija neophodnih za sticanje odgovora na pitanje zbog kojeg se istraivanje preduzima. Lat. dare = dati, datum, data = ono to je dato, podatak Podatak: upotrebljava se veoma esto u raznim kontekstima mnotvo definicija Najee se definie posredstvom izraza informacija, injenica ili pokazatelj Primeri:
injenice su dogaaji ili stanja, a podaci su njihove simbolika reprezentacija. (Kneler) Informacije su podaci koji su obraeni u oblik koji je smislen za primaoca i koji imaju stvarnu ili opaenu vrednost u sadanjim ili predstojeim akcijama i odlukama. (Dejvis) Podaci su deskripcije fenomena, tj. diskretne zabeleene injenice o fenomenima, od kojih dobijamo informacije o svetu. (Ciricis) Podaci su vrednosti pokazatelja koje odgovaraju prihvaenoj skali. (Batigin)
METODOLOGIJA NIR
2/3
injenica oznaava:
relativno istinit iskaz o nekom stvarnom stanju stvari samo to stanje stvari
Podatak oznaava:
neki iskaz (ne neophodno istinit) neki znak prirodnog ili vetakog jezika o stanju stvari (ne neophodno stvarnom) ali ne i samo stanje stvari (podatak injenica)
Informacija oznaava:
vrstu podataka (ili obratno: podatak vrstu informacije) neke vrste podataka, a neki podaci neke vrste informacija (logiko preklapanje) upotrebljivi, obraeni oblik sirove grae podataka
Relativnost odnosa: ono to za jednu osobu moe da bude informacija za drugu moe biti tek sirovi podatak
METODOLOGIJA NIR
3/3
Pokazatelj je svojstvo, promenljiva koja moe da uzima razliite vrednosti iz nekog odreenog skupa vrednosti. Podatak je iskaz ili neki znak (verbalni, brojani, ikoniki ili drugaiji) nekog jezika (prirodnog ili vetakog), o nekom stanju stvari, kojim se:
tvrdi ili porie postojanje ili prisutnost nekog objekta, dogaaja, pojave pripisuje ili odrie neko svojstvo objektu ili neka relacija objekta sa drugim objektima tvrde ili poriu ili uporeuju vrednosti tih svojstava
METODOLOGIJA NIR
Prema broju promenljivih ukljuenih u statistiki model, izabiraju se postupci univarijatne, bivarijatne ili multivarijatne analize. U grupi postupaka multivarijatne analize razlikuju se dva podskupa:
saznavanje meusobne povezanosti promenjlivih unutar jednog skupa pri emu ni jedna promenljiva nije oznaena kao zavisna od ostalih (faktorska analiza, klasterska analiza i multidimenzionalno skaliranje) saznavanje meusobne povezanosti promenjlivih unutar jednog skupa pri emu je najmanje jedna iz skupa promenljivih odreena kao zavisna od drugih
postoji samo jedna zavisna promenljiva (viestruka regresija, analiza varijanse i kovarijanse, diskriminaciona analiza i dr.) postoji vie od jedne zavisne promenljive (multivarijatna analiza varijanse i kanonika korelacija) sreda, 13. februar 2008 METODOLOGIJA NIR 5
Da bi se na osnovu podataka dobijenih na uzorku ocenila brojana vrednost parametra, potrebno je neko pravilo koje bi za svaki ishod u uzoranom prostoru kazivalo koju bi vrednost trebalo uzeti kao priblinu pravoj vrednosti parametra ocenitelj. Postoje razliite metode konstruisanja ocenitelja (metod najmanjih kvadrata, metod najvee verovatnosti i dr.) Problem izbora o ocenitelja podrazumeva prethodno odreivanje merila izbora:
nepristrasnost (aritmetika sredina uzoranog rasporeda jednaka je vrednosti parametra) doslednost (teenje pravoj vrednosti parametra kada n tei beskonanom) efikasnost (minimalnost varijanse) dovoljnost (uzorani raspored treba da sadri sve znaajne informacije o vrednosti parametra raspoloive u podacima dobijenim na uzorku)
sreda, 13. februar 2008 METODOLOGIJA NIR 7
Koraci:
1. 2. 3. 4. Nulta hipoteza (tj. pretpostavljena uzorana distribucija verovatnoe) izlae se neposrednoj proveri. Ako je proveravana hipoteza istinita, razliiti ishodi u uzoranom prostoru imaju razliite verovatnoe javljanja. Te verovatnoe mogu da budu deduktivno zakljuene iz distribucije verovatnoe koju navodi proveravana hipoteza. Kada se dobiju podaci sa uzorka (a oni predstavljaju jedan od moguih ishoda koji sainjavaju uzorani prostor) postavlja se pitanje da li taj ishod iz uzoranog prostora govori u prilog istinitosti proveravane hipoteze ili protiv nje.
Odluka o odbacivanju ili prihvatanju proveravane (nulte) hipoteze se donosi na osnovu toga da li dobijeni rezultat pripada oblasti odbacivanja ili oblasti prihvatanja.
sreda, 13. februar 2008 METODOLOGIJA NIR 8
a) Informacije koje se koriste u zakljuivanju i njihovo izraavanje (osim informacijama dobijenim na uzorku, koriste se i raspoloive prethodne informacije o vrednosti parametra, koje mogu da se izraze rasporedom verovatnoe na parametarskom prostoru, kako bi se prethodni raspored verovatnoe preinaio u naknadni raspored verovatnoe) b) Teorija verovatnoe na kojoj se zakljuivanje zasniva i osnovna naela tog zakljuivanja (Poto prethodne informacije veoma retko postoje u vidu uestalosti u dugom nizu, prethodni raspored verovatnoe retko moe da bude izraen posredstvom verovatnoe kao relativne uestalosti, pa se on izraava tzv. subjektivnom verovatnoom, tj. stepenima uverenosti u nastupanje nekog dogaaja ili u istinitost nekog iskaza.) c) Vidovi statistikog zakljuivanja
statistiko ocenjivanje hipoteza statistiko proveravanje hipoteza
METODOLOGIJA NIR
METODOLOGIJA NIR
10
Koliko je verovatan neki iskaz da prava, nepoznata vrednost parametra lei u odreenoj oblasti parametarskog prostora? Ako poemo od toga da su postavljene dve hipoteze:
H1: prava vrednost parametra lei u odreenoj oblasti parametarskog prostora H2: prava vrednost parametra lei u parametarskom prostoru izvan te oblasti
Posle prikupljanja podataka sa uzorka pomou se na osnovu tih novih informacija preinauje prethodni raspored verovatnoe u naknadni raspored verovatnoe (revidira se prethodna verovatnoa hipoteze). Na osnovu dobijenog naknadnog rasporeda verovatnoe koji o vrednosti parametra kazuje sve to je iz raspoloivih prethodnih informacija i podataka dobijenih (eksperimentom) sa uzorka poznato mogu da se odrede naknadne verovatnoe obeju hipoteza.
sreda, 13. februar 2008 METODOLOGIJA NIR 11
Mada izraz neparametrijski nije odgovarajui, ovde e tim izrazom biti oznaeni postupci statistike analize koji zadovoljavaju bar jedan od sledea dva uslova:
1. 2. da je promenljiva merena i/ili da se analizovana korienjem nivoa merenja nieg od intervalnog da se analiza ne zasniva na specifinim pretpostavkama o rasporedu osnovnog skupa iz kojeg je uzorak uzet (ve samo na optim pretpostavkama kao to su: raspored je neprekidan ili raspored je simetrian). ako je svrha zakljuivanje o jednom ili vie parametara ako je merenje promenljivih obavljeno na najmanjem intervalnom nivou ako su opravdane specifine pretpostavke o prirodi distribucije
Parametrijski statistiki testovi su: manje robusni i imaju veu statistiku snagu. Neparametrijski postupak (ocenjivanja ili proveravanja hipoteze) se primenjuje:
ako neka od pretpostavki nije odriva, a parametrijski postupak nije robusan u odnosu na nju
Poto, za odreenu istraivaku situaciju i svrhu istraivanja, postoje odgovarajui alternativni neparametrijski postupci, potrebno je obaviti izbor izmeu njih.
sreda, 13. februar 2008 METODOLOGIJA NIR 12
METODOLOGIJA NIR
13