You are on page 1of 13

OBRADA I ANALIZA PODATAKA

DOBIJENIH ISTRAIVANJEM

O znaenju izraza podatak

1/3

Svrha obrade i analize podataka je crpljenje informacija neophodnih za sticanje odgovora na pitanje zbog kojeg se istraivanje preduzima. Lat. dare = dati, datum, data = ono to je dato, podatak Podatak: upotrebljava se veoma esto u raznim kontekstima mnotvo definicija Najee se definie posredstvom izraza informacija, injenica ili pokazatelj Primeri:
injenice su dogaaji ili stanja, a podaci su njihove simbolika reprezentacija. (Kneler) Informacije su podaci koji su obraeni u oblik koji je smislen za primaoca i koji imaju stvarnu ili opaenu vrednost u sadanjim ili predstojeim akcijama i odlukama. (Dejvis) Podaci su deskripcije fenomena, tj. diskretne zabeleene injenice o fenomenima, od kojih dobijamo informacije o svetu. (Ciricis) Podaci su vrednosti pokazatelja koje odgovaraju prihvaenoj skali. (Batigin)

Neophodnost razmatranja odnosa znaenja ovih izraza

sreda, 13. februar 2008

METODOLOGIJA NIR

O znaenju izraza podatak

2/3

injenica oznaava:
relativno istinit iskaz o nekom stvarnom stanju stvari samo to stanje stvari

Podatak oznaava:
neki iskaz (ne neophodno istinit) neki znak prirodnog ili vetakog jezika o stanju stvari (ne neophodno stvarnom) ali ne i samo stanje stvari (podatak injenica)

Informacija oznaava:
vrstu podataka (ili obratno: podatak vrstu informacije) neke vrste podataka, a neki podaci neke vrste informacija (logiko preklapanje) upotrebljivi, obraeni oblik sirove grae podataka

Relativnost odnosa: ono to za jednu osobu moe da bude informacija za drugu moe biti tek sirovi podatak

sreda, 13. februar 2008

METODOLOGIJA NIR

O znaenju izraza podatak

3/3

Pokazatelj je svojstvo, promenljiva koja moe da uzima razliite vrednosti iz nekog odreenog skupa vrednosti. Podatak je iskaz ili neki znak (verbalni, brojani, ikoniki ili drugaiji) nekog jezika (prirodnog ili vetakog), o nekom stanju stvari, kojim se:
tvrdi ili porie postojanje ili prisutnost nekog objekta, dogaaja, pojave pripisuje ili odrie neko svojstvo objektu ili neka relacija objekta sa drugim objektima tvrde ili poriu ili uporeuju vrednosti tih svojstava

Kriterijumi za razvrstavanje podataka:


izvor (npr. primarni i sekundarni relativna razlika) priroda (npr. kvantitativni (razlikovanje kategorija u koje su svrstani objekti) i kvalitativni (razlikovanje kategorija i relacije ureenosti kategorija) forma u kojoj su izraeni (npr. verbalni i neverbalni)

Najznaajnija svojstva podataka: pouzdanost, verodostojnost, tanost i znaajnost Podaci:


ne nastaju iz niega, nego su oni plod intencije, oni se kreiraju ne mogu da budu sasvim nepristrasni, neutralni i nezavisni od vremenskog, kulturnog, teorijskog, metodolokog konteksta

sreda, 13. februar 2008

METODOLOGIJA NIR

Odabiranje kriterijuma za izbor procedure analize podataka


Rasprostranjenost upotrebe statistikih paketa za analizu podataka (npr., SPSS (Statistical Packages for the Social Sciences), SAS (Statistical Analysis System), CSS (Complite Statistical System), BDMP (BioMeDical Computer Programs) i dr.) Uz to, neophodno je izabrati odgovarajue postupke statistike analize Znaajni kriterijumi za izbor odgovarajue procedure analize podataka:
broj promenljivih koje se istovremeno analiziraju svrha analize ( deskripcija uzroka ili statistiko zakljuivanje o osnovnom skupu iz kojeg je uzorak uzet i nivo merenja) vrsta pretpostavki o rasporedu osnovnog skupa kojem uzorak pripada

Prema broju promenljivih ukljuenih u statistiki model, izabiraju se postupci univarijatne, bivarijatne ili multivarijatne analize. U grupi postupaka multivarijatne analize razlikuju se dva podskupa:
saznavanje meusobne povezanosti promenjlivih unutar jednog skupa pri emu ni jedna promenljiva nije oznaena kao zavisna od ostalih (faktorska analiza, klasterska analiza i multidimenzionalno skaliranje) saznavanje meusobne povezanosti promenjlivih unutar jednog skupa pri emu je najmanje jedna iz skupa promenljivih odreena kao zavisna od drugih
postoji samo jedna zavisna promenljiva (viestruka regresija, analiza varijanse i kovarijanse, diskriminaciona analiza i dr.) postoji vie od jedne zavisne promenljive (multivarijatna analiza varijanse i kanonika korelacija) sreda, 13. februar 2008 METODOLOGIJA NIR 5

Kriterijumi izbora procedure za analizu podataka


Teorije statistikog zakljuivanja se procenjuju na osnovu sledeih svojstava:
vrste informacija vrste teorije verovatnoe i vrste osnovnih naela statistikog zakljuivanja prirode reenja zadataka

Ovde e biti rei o dve teorije statistikog zakljuivanja:


klasinoj (koja filozofsku podlogu ima u usavrenom falsifikacionizmu) bejzijanskoj (koja filozofsku osnovu ima u umerenoj teoriji opravdavanja)

KLASINA TEORIJA STATISTIKOG ZAKLJUIVANJA


a) Informacije su iscrpene iz podataka dobijenih na uzorku osnovnog skupa (Prethodne informacije o parametru i informacije o vrednosti posledica moguih odluka o prihvatanju hipoteze. Informacije se predstavljaju preko statistika ili preko verovatnosti ili funkcije verovatnosti.) b) Usvojeno tumaenje verovatnoe i osnovno naelo statistikog zakljuivanja se zasniva iskljuivo na tumaenju verovatnoe kao relativne uestalosti u dugom nizu. (Dobijeni podaci predstavljaju jedan od moguih ishoda, to se naziva uzoranim prostorom.) c) Vidovi statistikog zakljuivanja
statistiko ocenjivanje hipoteza statistiko proveravanje hipoteza
sreda, 13. februar 2008 METODOLOGIJA NIR 6

Kriterijumi izbora procedure za analizu podataka KLASINA TEORIJA


A. Statistiko ocenjivanje hipoteza
Zakljuuje se na osnovu podataka dobivenih na uzorku, a da se ne polazi ni od kakve pretpostavke o pravoj vrednosti parametra. Kljuno pitanje je ta se o nepoznatoj vrednosti parametra moe zakljuiti na osnovu podataka dobijenih na uzorku, pri emu je cilj oceniti pravu vrednost parametra. Ocenjivanje se odnosi na:
brojane vrednosti parametra (na osnovu vrednosti izraunate iz podataka dobivenih na uzorku zakljuuje o pojedinanoj vrednosti parametra) interval (na osnovu vrednosti izraunate na uzorku zakljuuje da prava vrednost parametra pripada nekom intervalu)

Da bi se na osnovu podataka dobijenih na uzorku ocenila brojana vrednost parametra, potrebno je neko pravilo koje bi za svaki ishod u uzoranom prostoru kazivalo koju bi vrednost trebalo uzeti kao priblinu pravoj vrednosti parametra ocenitelj. Postoje razliite metode konstruisanja ocenitelja (metod najmanjih kvadrata, metod najvee verovatnosti i dr.) Problem izbora o ocenitelja podrazumeva prethodno odreivanje merila izbora:
nepristrasnost (aritmetika sredina uzoranog rasporeda jednaka je vrednosti parametra) doslednost (teenje pravoj vrednosti parametra kada n tei beskonanom) efikasnost (minimalnost varijanse) dovoljnost (uzorani raspored treba da sadri sve znaajne informacije o vrednosti parametra raspoloive u podacima dobijenim na uzorku)
sreda, 13. februar 2008 METODOLOGIJA NIR 7

Kriterijumi izbora procedure za analizu podataka KLASINA TEORIJA


B. Statistiko proveravanje hipoteza
Polazi se od pretpostavke o pravoj vrednosti parametra. Nulta i alternativna hipoteza dele parametarski prostor na dva komplementarna podskupa:
nulta hipoteza kazuje da prava vrednost parametra pripada nekom odreenom podskupu parametarskog prostora alternativna hipoteza kazuje da prava vrednost parametra pripada ostatku parametarskog prostora

Koraci:
1. 2. 3. 4. Nulta hipoteza (tj. pretpostavljena uzorana distribucija verovatnoe) izlae se neposrednoj proveri. Ako je proveravana hipoteza istinita, razliiti ishodi u uzoranom prostoru imaju razliite verovatnoe javljanja. Te verovatnoe mogu da budu deduktivno zakljuene iz distribucije verovatnoe koju navodi proveravana hipoteza. Kada se dobiju podaci sa uzorka (a oni predstavljaju jedan od moguih ishoda koji sainjavaju uzorani prostor) postavlja se pitanje da li taj ishod iz uzoranog prostora govori u prilog istinitosti proveravane hipoteze ili protiv nje.

Raspored verovatnoe o kojem govori proveravana hipoteza deli se na:


oblast koju sainjavaju ishodi ija je pojava vrlo neverovatna (oblast odbacivanja) oblast koju sainjavaju ishodi ija je pojava verovatnija od onih iz oblasti odbacivanja (oblast prihvatanja), pri emu su mogua dva tumaenja:
proveravana hipoteza je istinita, ali se ipak pojavio jedan vrlo neverovatni ishod ili manje je verovatno da se (pri uslovu da je proveravana hipoteza istinita) pojavi takav vrlo neverovatni ishod, nego to je verovatno da proveravana hipoteza nije istinita (tumaenje klasine teorije)

Odluka o odbacivanju ili prihvatanju proveravane (nulte) hipoteze se donosi na osnovu toga da li dobijeni rezultat pripada oblasti odbacivanja ili oblasti prihvatanja.
sreda, 13. februar 2008 METODOLOGIJA NIR 8

Kriterijumi izbora procedure za analizu podataka BEJZIJANSKA TEORIJA

a) Informacije koje se koriste u zakljuivanju i njihovo izraavanje (osim informacijama dobijenim na uzorku, koriste se i raspoloive prethodne informacije o vrednosti parametra, koje mogu da se izraze rasporedom verovatnoe na parametarskom prostoru, kako bi se prethodni raspored verovatnoe preinaio u naknadni raspored verovatnoe) b) Teorija verovatnoe na kojoj se zakljuivanje zasniva i osnovna naela tog zakljuivanja (Poto prethodne informacije veoma retko postoje u vidu uestalosti u dugom nizu, prethodni raspored verovatnoe retko moe da bude izraen posredstvom verovatnoe kao relativne uestalosti, pa se on izraava tzv. subjektivnom verovatnoom, tj. stepenima uverenosti u nastupanje nekog dogaaja ili u istinitost nekog iskaza.) c) Vidovi statistikog zakljuivanja
statistiko ocenjivanje hipoteza statistiko proveravanje hipoteza

sreda, 13. februar 2008

METODOLOGIJA NIR

Kriterijumi izbora procedure za analizu podataka BEJZIJANSKA TEORIJA


A. Statistiko ocenjivanje hipoteza
Zakljuuje se na osnovu podataka dobivenih na uzorku, a da se ne polazi ni od kakve pretpostavke o pravoj vrednosti parametra. Koriste se i prethodne informacije. Ako je odabran odgovarajui verovatnosni model, naknadni raspored verovatnoe sadri sve to se o pravoj vrednosti parametra moe doznati iz podataka dobivenih sa uzorka i raspoloivih prethodnih informacija. Poto funkcija verovatnosti prenosi sve informacije sadrane u podacima dobijenim na uzorku, nema potrebe za razmatranjem uzorane raspodele, niti za uvoenjem merila nepristrasnosti (znaajnih za klasinu teoriju statistikog ocenjivanja). Ocenjivanje brojane vrednosti parametra se obavlja s obzirom na veliinu koja ima najveu naknadnu verovatnou, a ne oekivanu ili tipinu vrednost (kao u klasinoj teoriji).

sreda, 13. februar 2008

METODOLOGIJA NIR

10

Kriterijumi izbora procedure za analizu podataka BEJZIJANSKA TEORIJA


B. Statistiko proveravanje hipoteza
Polazi se od pretpostavke o pravoj vrednosti parametra.

Koliko je verovatan neki iskaz da prava, nepoznata vrednost parametra lei u odreenoj oblasti parametarskog prostora? Ako poemo od toga da su postavljene dve hipoteze:
H1: prava vrednost parametra lei u odreenoj oblasti parametarskog prostora H2: prava vrednost parametra lei u parametarskom prostoru izvan te oblasti

Iz raspoloivih prethodnih informacija zakljuuje se prethodni raspored verovatnoe, koji:


hipotezi H1 pridaje verovatnou p(H1) hipotezi H2 pridaje verovatnou p(H2)

Posle prikupljanja podataka sa uzorka pomou se na osnovu tih novih informacija preinauje prethodni raspored verovatnoe u naknadni raspored verovatnoe (revidira se prethodna verovatnoa hipoteze). Na osnovu dobijenog naknadnog rasporeda verovatnoe koji o vrednosti parametra kazuje sve to je iz raspoloivih prethodnih informacija i podataka dobijenih (eksperimentom) sa uzorka poznato mogu da se odrede naknadne verovatnoe obeju hipoteza.
sreda, 13. februar 2008 METODOLOGIJA NIR 11

Kriterijumi izbora procedure za analizu podataka BEJZIJANSKA TEORIJA


B. Statistiko proveravanje hipoteza
Pored proveravane (nulte) hipoteze, mogue je uzeti u obzir vie alternativnih hipoteza (a ne samo 1) Obavlja se izbor izmeu:
skupine postupaka analize zavisnih od oblika distribucije (parametrijskih postupaka) skupine postupaka nezavisnih od oblika distribucije (neparametrijskih postupaka)

Izbor postupaka analize i postupaka statistikog opisivanja i zakljuivanja, zavisi od:


nivoa merenja promenljivih koje se analiziraju pretpostavki (optih ili specifinih) o rasporedu osnovnog skupa iz kojeg je uzet uzorak

Mada izraz neparametrijski nije odgovarajui, ovde e tim izrazom biti oznaeni postupci statistike analize koji zadovoljavaju bar jedan od sledea dva uslova:
1. 2. da je promenljiva merena i/ili da se analizovana korienjem nivoa merenja nieg od intervalnog da se analiza ne zasniva na specifinim pretpostavkama o rasporedu osnovnog skupa iz kojeg je uzorak uzet (ve samo na optim pretpostavkama kao to su: raspored je neprekidan ili raspored je simetrian). ako je svrha zakljuivanje o jednom ili vie parametara ako je merenje promenljivih obavljeno na najmanjem intervalnom nivou ako su opravdane specifine pretpostavke o prirodi distribucije

Parametrijski postupak (ocenjivanja ili proveravanja hipoteze) se primenjuje:

Parametrijski statistiki testovi su: manje robusni i imaju veu statistiku snagu. Neparametrijski postupak (ocenjivanja ili proveravanja hipoteze) se primenjuje:
ako neka od pretpostavki nije odriva, a parametrijski postupak nije robusan u odnosu na nju

Poto, za odreenu istraivaku situaciju i svrhu istraivanja, postoje odgovarajui alternativni neparametrijski postupci, potrebno je obaviti izbor izmeu njih.
sreda, 13. februar 2008 METODOLOGIJA NIR 12

Kriterijumi izbora procedure za analizu podataka BEJZIJANSKA TEORIJA


B. Statistiko proveravanje hipoteza
Poto je izbor odgovarajueg postupka statistike analize podataka istraivanja znaajan uslov valjanosti statistikog zakljuivanja i poto nisu svi istraivai u podruju empirijskih nauka znalci statistike, s obrazovnom svrhom je projektovan ekspertni sistem koji u interaktivnom odnosu s korisnikom-istraivaem preporuuje odgovarajue postupke statistike analize i izgraena mala baza znanja za prototip takvog ekspertnog sistema (Ekspertni sistem je raunarski program koji, koristei se znanjima i procedurama zakljuivanja, reava teke probleme u ogranienom, uzanom domenu i obavlja zadatke za koje se zahteva ekspertiza oveka.) Ekspertni sistem OSPAP (odabiranje statistikih postupaka analize podataka) odabira prikladne postupke univarijatne, bivarijatne i multivarijatne analize podataka dobijenih empirijskim istraivanjem. Da bi odabrao odgovarajui postupak, OSPAP istraivau postavlja niz pitanja:
o broju promenljivih koje se istovremeno analiziraju o svrsi statistike analize o nivou merenja promenljivih o prihvatljivosti pretpostavke normalnosti o uzorku (nezavisni ili zavisni) o meuzavisnosti ili zavisnosti promenljivih u sluaju istovremenog analizovanja veeg broja promenljivih o broju zavisnih promenljivih i dr.

sreda, 13. februar 2008

METODOLOGIJA NIR

13

You might also like