You are on page 1of 10

PITANJA za test: 1.

Statistika (definisanje i predmet prouavanja)


Statistika je nauka koja prouava varijacije obiljeja masovnih pojava primjenom kvantitativnih metoda. Danas se pod pojmom stastistike podrazumjeva nauka o prikupljanju brojanih podataka razliite vrste, o njihovom uredjenju, metodama analize i tumaenju; Sam naziv potie od novolatinskog ratio status i talijanskog ekvivalenta regione di stato dravni interes. Predmet statistike Predmet njenog istraivanja su masovne pojave bez obzira na oblast ljudskog djelovanja u kojem se javljaju, pod uslovom da su varijabilne. Njezina zadaa se sastoji u donoenju sudova brojane prirode o nepoznatim karakteristikama skupa na temelju rezultata izuavanja varijacije. Statistika kao znanstvenoanalitika metoda istraivanja pojava i procesa dijeli se na deskriptivnu i inferencijalnu (analitiku, induktivnu, matematiku) statistiku. Deskriptivna statistika obuhvata procese grupiranja (saimanja, ureenja) veeg broja podataka o jedinicama statistikih skupova (podskupova) u obliku statistikih nizova. Inferencijalna statistika odnosi se na postupke kojima se pomou dijela informacija (uzorka) donose sudovi o karakteristikama cjeline (populacije), ona je induktivna metoda i temelji se na teoriji vjerovatnosti.

2. Definisanje statistikog skupa


Statistiki skup ine jedinice koje imaju neke zajednike osobine koje elimo istraiti. Oni predstavljaju stvari, osobe, preduzea, proizvode i sl. ija su svojstva predmetom istraivanja. Prema opsegu razlikujemo konani i beskonani skup. Statistiki skup moe biti realan i hipotetian. Statistiki skup treba najprije definirati, odnosno odrediti opa svojstva koja ima svaka jedinica da bi se mogla smatrati lanom skupa. Definiranje skupa moe biti: pojmovno, prostorno i vremenski. Pojmovnom definicijom skupa utvruje se pripadnost skupu s obzirom na pojam jedinice (npr.skup studenata i sl.). Prostornom definicijom oznaava se prostor kojem pripadaju sve jedinice statistikog skupa. Vremenskom definicijom odreuje se vrijeme za koje su vezane sve jedinice skupa Statistiki skupovi iji elementi zadovoljavaju navedene definicije smatra se homogenim i samo takav moe biti predmetom statistike analize. Skup podataka o promatranom svojstvu promotren za svaku jedinicu predstavlja osnovni skup ili populaciju, a ukoliko se posmatra neko svojstvo na podskupu jedinica, podaci iz tog podskupa predstavljaju uzorak.

3. Kvalitativne mjerne skale


Pod mjerenjem se podrazumjeva pridruivanje brojeva statistikim jedinicama u skladu sa logikim pravilima.Pravila pridruivanja data su mjernim skalama. Razlikuju se 4 mjerne skale: nominalna, ordinalna, intervalna i omjerna. Statistike varijable (obiljeja) mjerene na nominalnoj i ordinalnoj skali nazivaju se kvalitativne (kategorijalne) varijable - nominalna je najnepreciznija i slui samo za klasifikaciju. Data je u obliku nenumerikog skupa, odnosno liste naziva (atributa, slovnih oznaka) po kojima se elementi statistikog skupa razlikuju, dijele se na atributivna (vrsta privredne djelatnosti, nain prevoza radnika, vrsta robe, nacionalnost, spol, vrsta djelatnosti isl.) i geografska (povezanost jedinice sa prostorom mjesto registracije preduzea, mjesto roenja). Uz nominalnu skalu veemo slijedee postupke statistike analize: analiza frekfencija, modus, hi-kvadrat test, Pearsonov koeficijent kontigencije, te kontigencijska i klaster analiza. - ordinalna skala svodi mjerenje modaliteta na njihovo rangiranje tako to pridruuje brojeve, slovne oznake ili simbole elementima skupa prema intenzitetu nekog svojstva Npr. ocjena. Nad modalitetima ordinalne varijable takoe nisu doputene brojane operacije. Osim ve navedenih postupaka , uz ordinarnu skalu veemo i slijedee postupke statistike analize statistikih postupaka: medijan, kvantile, Spearmanov koeficijent korelacije ranga, koeficijent asocijacije, te faktorsku, diskriminacionu i conjoint analizu.

4. Kvantitativne mjerne skale


Statistike varijable (obiljeja) mjerene na intervalnoj i omjernoj skali nazivaju se kvantitativnim varijablama - intervalnom skalom pridruuju se brojevi mjerenim svojstvima, pri emu jednake razlike na skali predstavljaju jednake razlike mjerenog svojstva, doputene su sve osnovne brojane operacije Pr. temperaturna skala. Osim ve navedenih postupaka, uz ordinarnu skalu veemo i slijedee postupke statistike analize statistikih postupaka: Spearmanov koeficijent korelacije ranga, koeficijent asocijacije, faktorsku, diskriminacionu i conjoint analizu, aritmetika sredina, standardna devijacija, z-vrijednost, Pearsonov koeficijent korelacije, regresiona analiza, parcijalna i multipla korelacija, te diskriminaciona i analiza varijanse.

- omjerna skala omoguava nam najvie u pogledu mjerenja i poredjenja, tako da brojano moemo
da : identifikujemo i rangiramo obiljeja, uporedjujemo intervale izmedju obiljeja i vrio apsolutna poredjenja. Ona posjeduje najveu preciznost jer koristi apsolutnu tj prirodnu nulu. Doputene su osnovne brojane operacije. Osim ve navedenih postupaka, uz omjerne skale moemo raunati: geometrijsku sredinu, harmonijsku sredinu i koeficijent varijacije. Vrijednosti koje se pomou omjerne skale dodjeljuju jedinicama nazivaju se vrijednosti numerikog obiljeja (varijable). Numerika obiljeja mogu biti prekidna (vrijednosti obiljeja su odijeljene jedne od drugih najmanje jednom utvrdjenom mjernom jedinicom. Obiljeja kod kojih postoje osnovne jedinice koje se dalje ne mogu dijeliti nazivaju se prekidnim broj zaposlenih radnika, broj lanova domainstva, broj prodatih raunara, a do njih dolazimo najee prebrojavanjem) i neprekidna (moe poprimiti bilo koju vrijednost iz nekog intervala, tj. bez obzira kako se blizu nalazile vrijednosti takve varijable, mogue je izmedju njih umetnuti druge vrijednosti cijene dionica, stopa inflacije, iznos potroakog kredita, starost radnika, iznos plate.

5. Matrica podataka
Mjerne skale pruaju mogunost manipulisanja numerikim vrijednostima, koje nee promjeniti emperijske informacije dobijene transformisanjem mjernih pojava u vrijednost skale. Prikupljeni podaci se mogu predoiti u statistikim tabelama - matrici podataka. Svaki redak sadri sve podatke za odabranu jedinicu promatranja i naziva se entitetom, stupac matrice podataka alternativno se naziva poljem. Matrica sadri NK informacija. Matrica podataka Vj oznaka za varijablu ( k- poslednja varijabla), Ii oznaka za ispitanika (n broj uzoraka), Mij vrijednost varijable (modalitet obiljeja ispitanika Ii pri odgovaranju na pitanje Vj) Podaci prikupljeni na ovakav nain pokazuju odgovore n ispitanika na k razliitih pitanja, koja se odnose na osobine ispitanika, te na njihove stavove i miljenja o pojavama koje su predmet istraivanja. V1 V2 ..... Vj ..... Vk I1 M11 M12 ..... M1j ..... M1k I2 M21 M22 ..... M2j ..... M2k ..... ..... ..... ..... ..... ..... ..... Ii Mi1 Mi2 ..... Mij ..... Mik .... ..... ..... ..... ..... ..... ..... In Mn1 Mn2 ..... Mnj ..... Mnk

6. Poslovna statistika
Poslovna statistika obuhvata statistike metode vane za praenje poslovnih dogadjaja preduzea, odnosno za poslovno odluivanje. Neophodno je dobro poznavanje makroekonomije. Vana uloga poslovne statistike razvijanje principa metoda za donoenje odluka u uslovima neizvjesnosti. Poslovna statistika prouava i zakonitosti koje vladaju u odnosima dvaju i vie ekonomskih pojava, te opisuje stepen i oblik kovarijacije medju njima Statistike metode: deskriptivne i inferencijalne. Deskriptivna (opisna) statistika obuhvata postupke uredjivanja podataka, mjere centralne tendencije, mjere disperzije i asimetrije, mjere zaobljenosti i grafiko prikazivanje. Prvi korak u istraivanju podrazumjeva uredjenje podataka prikupljenih u vlastitom preduzeu (nabavka, prodaja, cijene, trokovi, zaposleni). Inferencijalna statistika metoda temelj joj je metoda uzorka. Istraivanje uzorkom namee se kao relativno brz i jeftin metod koji vodi do upoznavanja obiljeja populacije iz koje je uzorak izabran. Uzorci se koriste kod: stalnog praenja kvalitete proizvodnje ili prijema robe pomou uzorka, pri pregledu finansijskog poslovanja, u ispitivanju javnog mnijenja i raspoloenja kupaca.

7. Etape statistikog istraivanja


Proces statistiko istraivanja svodi se u 4 etape: a) statistiko posmatranje i prikupljanje podataka mora biti planski organizovano, sistematino i masovno, to omoguuje da se odrede cilj i predmet istraivanja, osnovni skup, jedinice posmatranja i njihova obiljeja, nain grupisanja, kontrola podataka itd. Zadatak mu je da omogui efikasan nain prikupljanja podataka tako to e ukazati na mjesta kojima treba posvetiti posebnu panju tokom prikupljanja i kontrole podataka, prije njihovog grupisanja i uredjivanja. Najvanije aktivnosti u prikupljanju podataka su: odredjivanje vrste istraivanja, izvora podataka, odredjivanje naina i metoda prikupljanja podataka, primjenu odgovarajuih upitnika i obrazaca, izbor vrste i veliine uzoraka i terensko prikupljanje podataka. Obzirom na vrstu: izvidjajno (eksplorativno) primjenjuje se kada su naa saznanja relativno ograniena, te je potrebno vie informacija o promatranom problemu. U provodjenju ovog istraivanja obavlja se vie neformalnih razgovora sa osobama ija znanja i iskustva mogu da pomognu preciznijem definisanju stvarnog problema i ciljeva istraivanja. Deskriptivno njime se sluimo kada je u rjeavanju konkretnog problema potrebno razumjevanje svojstva odredjene pojave.Deskriptivna istraivanja zahtjevaju mnogo prethodnog znanja o predmetu istraivanja i pretpostavljaju da je problem jasno definisan. Analitiko (uzrono) istraivanje se primjenjuje kada elimo da dobijemo objanjnje uzroka koji su djelovali na neki poslovni dogadjaj.

Nain i metode prikupljanja podataka odredjene su vrstom istraivanja. Najvaniji kriteriji su: obuhvatnost pojave (potpuno putem popisa, evidencije i tekue registracije i djelimino posmatranjeizborom manjeg ili veeg broja jedinica iz populacije dolazimo do informacija o cijeloj posmatranoj pojavi) i vrijeme posmatranja i prikupljanja podataka. Razlikujemo jednokratno, periodino i stalno posmatranje i prikupljanje podataka. Osnovne metode za prikupljanje primarnih podataka: posmatranje, ispitivanje i eksperiment.

b) uredjivanje i grupisanje podataka nakon prikupljanja podataka vri se njihova kontrola,


evidentiranje, kodiranje i tabeliranje.Grupisanje se vri prema atributivnim, geografski, ordinalnim i numerikim obiljejima. U organizaciono-tehnikom pogledu uredjivanje i grupisanje podataka je u dananje vrijeme olakano uvodjenjem aplikativnih softvera za statistiku analizu. Statistiko grupisanje podjela osnovnog skupa na podskupove prema odredjenim obiljejima, kako bi se u jednoj grupi nali elementi skupa istog ili slinog modaliteta. Grupisanje moe biti jednostavno (prema jednom obiljeju) ili kombinovano (razvrstavanje prema dva ili vie obiljeja). Za postizanje jedinstvenosti potrebno je koristiti nomenklature i klasifikacije, koje predstavljaju jednoobrazno utvrdjene nazive grupa i podgrupa. Potrebno je voditi rauna o principu iscrpnosti ( svaki elemenat skupa mora da bude obuhvaen nekim od podskupova) i iskljuivosti ( jedan podatak moe oripadatai samo jednom podskupu)

c) obrada i analiza podataka se vri uz pomo odgovarajuih statistikih metoda , zavisno od cilja i
problema istraivanja. Mora se voditi rauna o: vrsti podataka koje smo prikupili, postupku istraivanja koji smo primjenili i pretpostavkama koje moraju biti ispunjene da bi primjenili odredjenu statistiku metodu.Razlikujemo: statiku i dinamiku analizu; analiza jedne, dvije, ili vie varijabli; i posebne analiza serija rasporeda frekfencija, analiza varijanse. d) sastavljanje izvjetaja i interpretacija rezultata

8. Izvori podataka
Statistiki podaci su ustanovljena svojstva jedinica statistikog skupa do kojih se dolazi promatranjem ili provedbom eksperimenata. Prema izvoru razlikujemo primarne (podaci prikupljeni sa datim ciljevima istraivanja) i sekundarni (vanjski izvori baza podataka vladinih ustanova, specijaliziranih agencija, organizacija isl.). Proces istraivanja poinje prikupljanjem sekundarnih podataka. Sekundarni podaci su prikupljeni unutar preduzea ili izvan njega u svrhu koja je razliita od potreba konkretnog istraivanja. Sekundarni podaci u preduzeima sadrani su u izvjetajima raunovodstva, bazi podataka za potrebe istraivanja trita, otpremnicama robe, platnim listama, cjenovnicima. U poslovnoj analizi veoma vana je primjena sekundarnih izvora opodataka izvan preduzea, a to su: statistiki zavodi, privredne komore i struna udruenja, internet, nauno istraivake institucije, baze podataka vladinih institucija, struna literatura i asopisi, katalozi sajmova i izlobi, adresari idr. Prikupljanje primarnih podataka dui je i sloeniji postupak. Podaci se prikupljaju direktno od ispitanika za potrebe konkretnog istraivakog projekta. Podaci koji se prikupljaju prvi puta od strane istraivaa nazivaju se primarni i iskljuivo su vlasnitvo preduzea koje organizuje istraivanje. Prikupljanju podataka prethodi: definiranje ciljeva istraivanja, odreivanje statistikog skupa i jedinica promatranja, izbor obiljeja i definiranje modaliteta, sastavljanje obrazaca i odreivanje naina prikupljanja podataka. Ako se prikupljaju podaci o obiljejima za sve jedinice promatranja govori se o iscrpnom promatranju ili cenzusu, a ako se obuhvati dio jedinica promatranje je reprezentativno. S obzirom na vrijeme promatranja mogu biti jednokratna (popis stanovnitva), periodina (registracija motornih vozila) i tekua (podaci o roenim).

9. Anketni upitnik
Anketa predstavlja odredjeni broj pitanja koja se postavljaju pismeno/usmeno u cilju dobijanja odgovora, koji treba da slue rjeavanju definisnog istraivakog problema. Sastavljanje anketnog upitnika je vana faza u istraivanju, jer od toga zavisi kvalitet istraivanja. Pitanja moraju biti sastavljena tako da pronadju one informacije koje su postavljene kao ciljevi odredjene studije. Pri planiranju i projektovanju upitnika treba definisati: vrstu informacije koja se trai, formalnu strukturu pitanja i odgovora i unutranju strukturu pitanja i odgovora. Pitanja mogu biti otvorenog, zatvorenog i mjeovitog tipa. Pri formulisanju pitanja vana su sledea pravila: izbjegavati dvostruka i dvosmislena pitanja, izbjegavati pitanja koja navode na odredjeni odgovor, koristiti jednostavne, razumljive rijei, postavljati pitanja tako da svojom formom i sadrajem lie na pitanja iz svakodnevnog ivota, izbjegavati rijei sa vie znaenja.

10. Sastavljanje izvjetaja i interpretacija rezultata


Zavrni izvjetaj predstavlja sredstvo komuniciranja izmedju istraivaa i donosioca poslovnih odluka. Centralni dio svakog izvjetaja predstavljaju rezultati statistikog istraivanja za iju prezentaciju stoje na raspolaganju zavrne tabele, grafikoni, razni statistiki pokazatelji i tekstualna objanjenja. Interpretacija podataka je proces pretvaranja podataka u informacije. U interpretaciji mora se uzeti u obzir procjena

oekivane greke. Istraiva treba upozoriti na: nedostatke vlastitog istraivanja, ogranienja dobijenih rezultata i potrebu daljnjih istraivanja. Prednost se daje izvjetajima koji su kratki, jasni, jednostavno napisani i koji ukazuju na mogunost prektinih akcija.

11. Raunarski podrani postupci intervjuisanja


U SAD 50% organizacija koje se bave anketnim istraivanjem koriste CATI sistem (Computer Assisted Telephone Intervieving).Ova metoda uticala je na nastajanje metode raunarski podranog linog intervjuisanja CAPI, te CSAQ postupka u kojem anketirana osoba sama unosi odgovore. Za prikupljanje podataka pomou anketnog listia PAPI, razvijen je sistem direktnog unoenja podataka. Ako se pored interaktivnog unoenja podataka primjenjuje jo i automatsko kodiranje, kontrola, i ispravljanje govori se o tkz. raunarski podranom unosu podataka. CADI (Computer Assisted Data input). Pomenute metode omoguavaju trenutno redukovanje pogrenih odgovora. A nekonzistentnost odgovora je mogue odmah otkriti pomou ugradjenih pravila u program. Mogunost primjene navedenih tehnika kod nas je ograniena: nedovoljna pokrivenost populacije telefonom, neodgovarajua hardverska oprema i softverska podrka, potreba za dodatnim obuavanjem anketara. Neophodna je i spremnost ispitanika da suradjuju, a koja moe izostati iz razliitih razloga: ekonomski, politiki idr.

12. Raunarsko podrano kodiranje


Prije unosa i razvrstavanja podataka u tabele varijable koje su unesene u upitnik moraju biti kodirane i razvrstane u razliite kategorije (modalitete). Pod kodiranjem podrazumjevamo postupak pridruivanja numerikih ili drugih oznaka modalitetima varijabli. Faze postupka kodiranja: - svaki element iz istraivakog skupa mora biti kodiran s obzirom na specifinu varijablu pomou opisa rijeima; - za tu varijablu se formira kod u kojem svaki broj oznaava posebnu kategoriju prouavane varijable, - definie se skup uputa za kodiranje koje povezuju opise rijeima i brojeve za kodiranje. Kodiranje se moe provoditi runo, pomou raunara i automatski pomou raunara. Automatsko kodiranje podrazumjeva konstrukciju rjenika. Kontrola kodiranja treba da bude sastavni dio ukupnog programa za proizvodnju podataka, a operacije kodiranja i unoenja podataka, njihove verifikacije i korekcie treba podvrgnuti standardnim statistikim postupcima kontrole kvaliteta.

13. Validnost i pouzdanost istraivanja


Poudanost se definie kao razlika izmedju reuzltata uzoraka i rezultata osnovnog skupa pod istim uslovima. Validnost funkcionie na drugaiji nain u odnosu na poudanost, jer je mogue imati potpuno pouzdana ali ne validna mjerenja. S obzirom na primjenjeni postupak utvrdjivanja, validnost se dijeli na: konstruktnu (teorijsku) validnost i praktinu (kriterijsku) validnost. Logika validnost se odredjuje na osnovu impresije o predmetu mjerenja. Praktina validnost podrazumjeva korelaciju odredjenog indikatora sa kriterijskom varijablom i izraava se koeficijentom kriterijske validnosti. Ona moe biti: dijagnostika (istovremena) i prognostika. Dijagnostika je odredjena stepenom povezanosti rezultata mjerenja sa kriterijskom varijablom, koja nije ukljuena u mjerni instrument. U ovom sluaju kriterijski podaci se prikupljaju u isto vrijeme kada se realizuje istraivanje. Prema izvoru nastajanja razlikujemo internu (istraivanje je validno ako je izmjerilo ono emu je bilo namjenjeno) i eksternu validnost (problem se odnosi na opasnost da se uslovi koje smo stvorili za provodjenje istraivanja razlikuju od uslova u realnom okruenju. Kada ponovljenim istraivakim postupcima dobijamo sline rezultate i time potvrdjujemo dosadanja znanja govorimo o pouzdanosti rezultata istraivanja. Pouzdanost omoguava ponavljanje istraivakog postupka i moe biti ocjenjena: pomou mjera konzistentnosti (ekvivalentnosti) i pomou mjera stabilnosti. U prvoj grupi mjerenja pouzdanost se ocjenjuje korelacijom izmedju varijabli koje mjere istu latentnu varijablu, pomou dva ekvivalentna instrumenta istraivanja. U ove mjerubrajamo: metodu razdvajanja, metodu unutranje konzistentnosti i metodu faktorske analize.

14. Neuzorake greke nepotpuni podaci, greke mjerenja i odgovora


Greka se moe definisati kao razlika izmedju prave vrijednosti obiljeja populacije i vrijednosti ocjene na osnovu posmatranja jedinice uzorka. Pri tome je prava vrijednost rezultat koji proizilazi iz postupka kada se mjerenje odvija u potpunoj saglasnosti sa usvojenim sistemom rada. Greke u podacima direktno utiu na analize, vode pogrenim odlukama i neadekvatnim akcijama. Razlikujemo uzorake i neuzorake greke. U neuzorake greke spadaju: nepotpuni podaci, greke mjerenja i odgovora, greke anketara i neinformisanost ispitanika i greke obrade. U istraivanjima se esto deava da su podaci nepotpuni zbog propusta istraivaa da ispitaju neku od odabranih jedinica populacije ili zbog neadekvatnog okvira izbora uzorka. Za obje greke se kae da su rezultat neobuhvaenosti, odnosno ne pokrivenosti ciljane populacije. Problem nepotpunih podataka je prisutan i kada se oni ne mogu prikupiti zbog otpora onih koji bi trebali dati podatke. U istraivanjima je est sluaj da ispitanici ne mogu dati odgovor jer ga ne znaju ili ga jednostavno ne ele dati. Kod kreiranja upitnika je zato vano odabrati prava pitanja, njihov broj, redosljed i formulaciju, koja e stimulirati ispitanika da tano odgovori.

Ako odluimo da uvrstimo upitnike koji su parcijalno nepopunjeni u daljnju obradu, onda je potrebno primjeniti neku od metoda za tretiranje nekompletnih podataka. U te metode ubrajamo: brisanje podataka, ponderisanje odgovora i metodu umetanja nedostajuih odgovora. Kod velikih uzoraka s malim brojem nedostajuih odgovora mogue je izbrisati itave upitnike ili provesti selektivno brisanje pomou smanjivanja veliine uzorka. Glavna prednost ove metode je u jednostavnosti kasnije analize. Umetanje podataka je nauni postupak primjenjen sa ciljem da smanji greku nastalu zbog ne dobijenih podataka i da sauva sve raspoloive podatke, nasuprot nenaunoj tehnici izmiljanja podataka. Kvalitet procedure umetanja zavisi od: veliine istraivane populacije, stope izbora, pristrasnosti uzorka i korelacije izmedju obiljeja koja se ispituju.

15. Neuzorake greke greke anketara, neinformisanost ispitanika i greke obrade


Najee greke do kojih dolazi u radu anketara su one koje nastaju interakcijom sa ispitanicim, greke u biljeenju rezultata i greke koje nastaju neradom anketara. Greke nastaju i kada anketar slua odgovore ispitanika a nakon toga upisuje odgovore. Greke u biljeenju odgovora se smanjuju koritenjem magnetofonske, video i druge opreme. U radu anketara postoji i greka koju anketar izaziva svojim neradom, kada izostavlja pojedina pitanja, ne posveuje dovoljno panje pitanjima koja to zahtjevaju ili uopte ne prikuplja odgovore od ispitanika nego ih izmilja. Ova greka se smanjuje kontrolom rada anketara, uporedjujui rezultate jednog anketara sa radom drugih, te motivacijom za rad i sistemom nagradjivanja. Neinformisanost ispitanika dovodi do pogrenih zakljuaka. Problem se moe rijeiti izbegavanjem osjetljivih pitanja, odnosno njihovim stavljanjem na kraj upitnika, te uvjeravanjem ispitanika da je anketno istraivanje anonimno. Ispitanik odbija da saradjuje i onda kada smatra da je istraivanje ilegalno i onda kada sumnja da e njegovi odgovori otkriti nedostatak njegove obrazovanosti, te pitanja ocjenjuje kao uoptena i nejasna, a problematiku svrstava medju teme o kojima nikada nije razmiljao. Ispitanik se u tom sluaju informie da ne postoje tani i netani odgovori, a nejasna pitanja se detaljnije objanjavaju. Prikupljeni podaci se moraju verifikovati, evidentirati, kodirati i obraditi na raunarima. Greke grupisanja, uredjivanja i obrade podataka, obuhvataju greke nastale u postupcima: editiranja podataka (itljivost, potpunost, tanost i dosljednost podataka), unoenja podataka, zaokruivanja brojeva i kodiranja, umetanja nedostajuih vrijednosti, tabeliranja, obrade, analize i interpretacije podataka.

16. Statistiki niz (pojam i vrste)


Statistiki niz objanjava i kvalitativni aspekt pojave koju prikazuje. Osnovne kriterije za podjelu nizova: broj obiljeja koje niz sadri, stepen uredjenosti i vrste obiljeja. Ako je predmet analize jedna varijabla radi se o jednodimenzijalnoj analizi, dok se metodama viedimenzijalne analize istovremeno prouava kovarijacija dviju ili vie varijabli. Statistiki niz kod kojeg se modaliteti obiljeja javljaju samo po jedanput nazivaju se jednostavnim, a niz kod kojega se modaliteti obiljeja javljaju vie puta nazivamo raspored ili distribucija frekvencija. Razlikujemo kvalitativne i kvantitativne nizove podataka. Grupisanjem podataka prema oblicima nominalnog obiljeja i nizanjem podskupova s pripadajuim frekvencijama nastaju nominalni nizovi, a grupisanjem podataka prema modalitetima varijable ranga i nizanjem podskupova s pripadajuim frekvencijama nastaju ordinalni nizovi. Formiranje nominalnog atributivnog niza je sloeno ako se ono javlja u veem broju modaliteta, u tom sluaju prilikom grupisanja neophodno je imati nomenklature sa svim potrebnim informacijama u pogledu razvrstavanja modaliteta.

17. Statistika tabela (pojam i vrste)


Praenje statistikih podataka olakava se tabelarnim prikazivanjem. Podaci su pregledniji i lake se tumae. Statistika tabela nastaje ukrtanjem horizontalnih i vertikalnih linija u koje se po odredjenom pravilu unose podaci. Svaka tabela treba da ima tekstualni i numeriki dio. Tekstualni dio sadri: naslov, zaglavlje, pretkolonu, jedinice mjere, izvor podataka i po potrebi objanjenja i napomene. Numeriki dio tabele obuhvata brojaane podatke koji se unose u tabelu, te zbirni (marginalni) red i kolonu koji se obino nalaze na krejevima tabele. Ako se veliine u koloni sabiraju, zbir se smjeta u marginalni red.Prema sadraju statistike tabele se dijele na: jednostavne (prikazuju samo jedan statistoki niz), grupne (predstavljena dva ili vie nizova prema modalitetima istog obiljeja) i kombinovane (istovremeno prikazani podaci grupisani prema modalitetima dva ili vie obiljeja). Prema cilju mogu biti: izvjetajne (pokazuju injenino stanje posmatrane pojave na osnovu brojanih podataka) i analitike (pored injeninog stanja sadre informacije o unutranjim odnosima i zakonitostima posmatrane pojave)

18. Kumulativni nizovi


Nastaju sabiranjem frekfencija od prve do poslednje. Za formiranje kumulativnog niza pored apsolutnih mogu se koristiti relativne i procentne frekvencije. Razlikujemo kumulativni niz manje od(rastua kumulanta) i vie od(opadajua kumulanta. Rastua kumulanta nastaje sabiranjem frekvencija od najniih vrijednosti obiljeja ka frekvencijama veih vrijednosti. Prva frekvencija rastue kumulante jednaka je prvoj frekvenciji izvornog niza. Druga frekvencija jednaka je zbiru prve i druge frekvencije izvornog niza..... Zadnja kumulativna frekvencija jednaka je zbiru apsolutnih frekvencija.

Opadajua kumulanta nastaje sabiranjem frekvencija od najvie vrijdnosti obiljeja ka frekvencijama niih vrijednosti obiljeja.Opte znaenje kumulativnog niza vie od - svaki lan opadajueg kumulativnog niza pokzuje koliko jedinica skupa ima vrijednost numerikog obiljeja jednaku ili veu od one vrijednosti obiljeja ija je frekvencija posledja ula u kumulativni niz.

19. Grupisanje podataka u razrede (intervale)


Kada se prekidno numeriko obiljeje pojavljuje u velikom broju modaliteta ili kada se radi o neprekidnom numerikom obiljeju uredjivanje podataka vri se pomou rasporeda frekvencija sa razredima. Kada jedinica skupa moe da poprimi relativno beskonano mnogo razliitih vrijednosti obiljeja iz odredjenog intervala kaemo da se radi o neprekidnom numerikom obiljeju. Radni sta, cijene, visine plaa, stopa inflacije, godine starosti samo su neki od primjera. Godine radnog staa predstavljaju neprekidno obiljeje ali se ono moe transformisati u prekidno ako se podaci odnose na navrene godine staa. U sluajevima kada nuemrko obiljeje moe da poprimi velki broj razliitih vrijednosti potrebno je susjedne vrijednosti obiljeja sjediniti u zajedniki razred (interval). Za uspjeno provodjenje grupisanja podataka na ovaj nain neophodno je odrediti prikladan broj razreda i njihovu veliinu. U praksi se broj razreda uglavnom kree od 5 15. Kako bi se prilikom grupisanja zadovoljili zahtjevi preglednosti i preciznosti, za odredjivanje broja razreda koristi se Sturgesovo pravilo: k 1 +3,3logN (k- broj razreda, N- obim skupa) veliina tih razreda rauna se pomou izraza: i (Xmax + Xmin) / k (i veliina razreda, Xmax najvea, Xmin najmanja vrijednost varijable. Veliina razreda predstavlja razliku izmedju donje granice tekueg razreda i donje granice prethodnog razreda. Granice razreda odredjujemo tako da se razredi medjusobno razlikuju a da unutar razreda jedinice budu homogene u kvalitativnom i kvantitativnom pogledu.. Svaki razred ima svoju donju i gornju granicu. Granice razreda se razliito odredjuju s obzirom na to da li se radi o prekidnom ili neprekidnom numerikom obiljeju.

20. Dijagram
Pruaju raznovrsne mogunosti za jednostavnije prikazivanje i poredjenje rezultata, a njihov izbor zavisi od vrste podataka.Dijelimo ih u 4 podgrupe: stigmograme (grafiki prikaz pomou taaka upotrebljava se kod dijagramskih karti), linijske (imaju jednu dimenziju, za prikazivanje koriste prave i krive linije. Slue za prikazivanje modaliteta jednog obiljeja vremenskih nizova kod pojava koje imaju svoj tok, dinamiku i razvoj), povrinske (histogrami imaju dvije dimenzije koriste se za prikazivanje obima i strukture jedne ili vie pojava, frekvencije niza predstavljene povrinama geometrijskih oblika) i prostorne dijagrame (stereogrami omoguava prikazivanje u tri dimenzije. Sastoje se od tri koordinatne ose).

21. Kartogrami i piktogrami


Posebna vrsta grafikona koja za osnovu koriste specijalne vrste geografskih karata. Imaju poseban znaaj za prouavanje teritorijalnog rasporeda pojava koje su predmet izuavanja. Prema nainu crtanja razlikujemo . dijagramske karte (crta se na geografskoj karti sa ucrtanim granicama prostora na kojem je definisan statistiki skup, koji slue za ucrtavanje dijagrama) i statistike karte (nisu prave geografske karte. Njima prikazujemo geografske nizove s mnogo grupa i frekvencijama koje su relativni brojevi. Poadtke unosimo pomo raznih boja i njihovog nijansiranja) Piktogrami posebna vrsta grafikog prikaza kod kojeg se podaci predstavljaju slikama ili simbolinim figurama. Oni nisu precizni, ali na jednostavan i popularan nain daju informaciju o obimu i strukturi posmatrane pojave.

22. Srednje vrijednosti (pojam i vrste)


Srednje vrijednosti opisuju koncetraciju (gomilanje) podataka oko neke numerike vrijednosti. Mjere disperzije pokazuju odstupanje numerikih vrijednosti obiljeja od njihove srednje vrijednosti, a mjere asimetrije i zaobljenosti pokazuju nain i oblik rasporeda podataka. Mjerama koncentracije se utvrdjuje nain rasporeda totala na njegove lanove. Pokazatelji navedenih karakteristika raunati za populaciju nazivaju se parametri skupa. Srednja vrijednost je ona vrijednost oko koje se najvie koncentriu podaci, pa se naziva i mjerom centralne tendencije. Ona na jednostavan nain omoguava da se iz varijabilnosti pojave otkrije to je vano i tipino. Srednja vrijednost je reprezentativna vrijednost, jer zamjenjuje sve vrijednosti numerikog niza i nosi njihove zajednike karakteristike. Razlikujemo potpune (aritmetika, harmonijska i geometrijska sredina) i poloajne srednje vriednosti (modus i medijan odredjeni pozicijom u statistikom nizu). Srednja vrijednost je reprezentativan i tipian pokazatelj samo ako se rauna iz skupa istovrsnih jedinica posmatranja.

23. Osobine aritmetine sredine

Aritmetika sredina je najvanija i najee koritena srednja vrijednost, oznaava se i kao prosjek ili prosjena vrijednost.. Rauna se tako to se zbir vrijednosti numerike varijable podjeli sa njihovim brojem. Zbir svih vrijednosti numerike varijable naziva se total. __ X1 + X2 + ... + Xi + ... + Xn __ Xi X = --------------------------------- tj, X = --------N N Sredina negrupisanih podataka naziva se jednostavnom aritmetikom sredinom. Aritmetika sredina je najblia onoj vrijednosti obiljeja koja ima najveu frekvenciju. Stoga se frekvencija naziva ponderom a sredina raunata na ovaj nain ponderisana (vagana) aritmetika sredina. k Aritmetika sredina aritmetikih sredina (totalna aritmetika sredina : __ iXi
k __ k i=1 k _

X = ---------i
i=1

NiXi X = ----------------- Ni
i=1

Aritmetika sredina ima osobine koje nema ni jedan drugi broj statistikog niza, razliit od aritmetike sredine: A) nalazi se izmedju najmanje i najvee vrijednosti obiljeja Xmin < X < Xmax B) proizvod zbira frekvencije i aritmetike sredinie jednak je totalu skupa C) zbir odstupanja originalnih vrijednosti numerikog obiljeja od arimetike sredine jedanak je nuli D) Zbir kvadrata odstupanja originalnih vrijednosti numerikih obiljeja od aritmetike sredine je minimalan, odnosno manji je od zbira kvadrata odstupanja podataka od bilo kojeg drugog broja a:

E) Ako su sve vrijednosti numerikog obiljeja medjusobno jednake, odnosno jednake konstatni c, onda je
aritmetika sredina jednaka toj konstanti X1 = X2 = Xn = C , X = C

24. Harmonijska sredina


Pripada grupi potpunih srednjih vrijednosti i koristi se kada su vrijednosti obiljeja za koje raunamo prosjek izraene recipronim odnosima. Koristi se kod izraunavanja prosjenog vremena povrata jedinice uloenog kapitala, produktivnosti rada, koeficijenta obrta poslovnih sredstava, koeficijenta iskoritenosti kapaciteta, srednje cijene isl. Radi se o sluajevima kod kojih se vrijednost obiljeja smanjuje kada se pojava poveava i obrnto. Harmonijska sredina se rauna kao reciprona vrijednost aritmetike sredine recipronih vrijednosti numerikog obiljeja. N N H = ----------------------- = ------------Xi 0

1 + 1 + ... + 1 X1 X2 Xn

1 ------i=1 Xi
N

Harmonijsku sredinu raunamo samo za ona obiljeja ije su vrijednosti razliite od nule. Kada podaci pokazuju reciprone odnose, anjihove frekvencije nisu jednake, izraunava se ponderisana harmonijska sredina: k

1 + 2 + ...... + k 1 + 2 + ... + k
X1 X2 Xk
k

i i
------Xi

H = -------------------------- = -------------

i=1

25. Geometrijska sredina


Predstavlja prosjek iz proizvoda numerikog obiljeja. Ina izravnava proporcionalne promjene (odnose) izmedju podataka stetistikog niza.
N

G = N X1 * X1 *.....* XN =

Xi
i=1

Xi > 0, za svaki i.

Njeno izuavanje ima smisla samo za vrijednosti obiljeja koje su vee od nule. Geometrijsku sredinu raunamo za pojave kod kojih je izraena geometrijska progresija, odnosno za raunanje prosjeka niza

relativnih pokazatelja. Ova sredina uglavnom se koristi za izraunavanje prosjenih pokazatelja razvoja u dinamikoj analizi pojava, a rjedje kao pookazatelj centralne tendencije rasporeda frekvencija. Ona se najee koristi za izraunavanje prosjene stope promjene na osnovu lananih indeksa. Geometrijska sredina je za isti niz podataka uvijek manja od aritmetike, a vea od harmonijske sredine.

26. Grafiko odredjivanje modusa


Modus je vrijednost kvantitativnog ili kvalitativnog obiljeja sa najveom frekvencijom. Modus je najtipinija vrijednost u nizu i naziva se jos dominantna vrijednost ili mod. Za razliku od potpunih srednjih vrijednosti koje se mogu izraunati samo za numerika obiljeja, modus se moe raunati i za kvalitativna obiljeja. (b-a) Mo = L1 +--------------------- * i (b-a) + (b-c) Na veliinu modusa utie nain grupisanja podataka. Njegova prednost je to na njegovo izraunavanje ne utiu otvoreni razredi i ekstremne vrijednosti obiljeja.

b-a b-c b

Grafiko odredjivanje modusa pomou histograma

a x L1 c 1-x Mo

Dijagonalnim spajanjem poetne i krajnje vrijednosti modalnog intervala sa donjom granicom postmodalnog, odnosno gornjom granicom predmodalnog razreda dobija se apscisa take presjeka koja predstavlja priblinu vrijednost modusa.

27. Korigovanje frekfencija


Kada su podaci grupisani u razrede nejednakih veliina, potrebno je izvriti korigovanje frekvencija. Modalni razred se odredjuje na osnovu najvee korigovane frekvencije koja se rauna kao omjer frekvencije i veliine razreda proporcionalne vrijednosti ili kao omjer frekvencije pripadajue veliine razreda. Modus se ne moe odrediti ako nisu zabiljeena barem dva podatka sa istim modalitetom.

28. Medijan
Medijan je srednja vrijednost koja se odredjuje na osnovu poloaja koji zauzima u nizu podataka. On uredjen niz podataka dijeli na dva jednaka dijela, tako da se u prvom dijelu nalaze elementi koji imaju vrijednost obiljeja jednaku ili manju od medijana, a drugom dijelu se nalaze elementi koji imaju vrijednost jednaku ili veu od medijana. Medijan se nalazi u sredini statistikog niza i naziva se i centralna vrijednost.Odredjivanje medijana zavisi od broja lanovau nizu a ne od njihove vrliine. Medijan se odredjuje za redosljedne i numerike nizove, pri emu treba voditi rauna da li se radi o grupisanim ili ne grupisanim podacima.Za redosljed obiljeja je karakteristino da se njihovi modaliteti mogu urediti prema stepenu intenziteta tog svojstva. Ako se radi o negrupisanim podacima i broj modaliteta je neparan, medijan je modalitet koji se nalazi u sredini uredjenog niza. Kod parnog broja modaliteta medijan se moe odrediti kao poluzbir sredinja dva modaliteta. Raspored frekfencija predstavlja uredjeni niz. Kada podaci predstavljaju oblike redosljednog ili numerikog prekidnog obiljeja, medijan se odredjuje direktno. Odredjivanje medijana pojednostavljuje se formiranjem kumulativnog nza manje od. Na njegovo izraunavanje ne utiu vrijednosti pojedinih rezultata. Kao srednaj vrijednost prikladan je ze izrazito asimetrine rasoporede, za kvalitativne podatke koji se lako rangiraju, rasporede frekfencija sa otvorenim razredom.

i /2 - k-1 Me = L1 + ---------------------- * i

me
Praktina upotreba medijana sastoji se u lociranju optimalnog poloaja (ukupan br. Kilometara od svake prodavnice do centralnog skladita je minimalan ako je centralno skladite na poziciji medijana)

29. Kvantili
Vrijednosti obiljeja koja niz podataka, uredjen po veliini, dijele na etiri jednaka dijela nazivaju se kvartilima. Za kvartile, decile i percentile koristi se zajedniki naziv kvantili. Kvantil se odredjuje za redosljedne i numerike nizove, pri emu treba voditi rauna da li se radi o grupisanim ili negrupisanim podacima. N 3N

Q1 = L1 + 4 - 1 * i

Q3 = L1 + 4 - 1 * i

Q1

Q3

(L1 gornja granica kvartilnog razreda, N zbir svih frekvencija, 1 suma frekvencija do kvartilnog razreda, Q1 i Q3 frekvencije kvartilnih razreda, i veliina kvartilnog razreda) Prvi kvartil predstavlja vrijednost obiljeja koja elemente niza dijeli u dvije grupe, tako da elemenata ima manju ili jednaku vrijednost tog obiljeja a elemenata niza ima vrijednost obiljeja veu od prvog kvartila.

30. Apsolutne mjere disperzije (nabrojati i objasniti)


Apsolutne mjere disperzije ubrajamo: raspon varijacije, interkvartil, srednje apsolutno odstupanje, varijansu i iz nje izvedenu standardnu devijaciju. Raspon varijacije = razlika izmedju najvee i najmanje vrijednosti obiljeja Rx = Xmax X min Koristi se kao prvi pokazatelj disperzije, koji grubo informie rasprenosti numerikog obiljeja. Raspon varijacije nije potpuna mjera disperzije jer se rauna na temelju ekstremnih vrijednosti niza, koje u pravilu nisu tipine. Interkvartil = razlika izmedju gornjeg i donjeg kvartila. Ako se izostave prva i zadnja etvrtina lanova uredjenog statistikog niza, ostaje sredinjih 50% podataka. Iq = Q3-Q1 Na raunanje interkvartila ne utie 25% podataka sa najviim i 25% podataka sa najniim vrijednostima. To je nepotpuna mjera disperzije jer se rauna samo na temelju dvije veliine donjeg i gornjeg kvartila Srednje apsolutno odstupanje odstupanja vrijednosti numerikog obiljeja od aritmetike sredine su razliita po predznaku i veliini, a njihov zbir je jednak nuli. Za raunanje disperzije upotrebljavaju se apsolutna odstupanja vrijednosti obiljeja od aritmetike sredine.Prosjek tih odstupanja predstavlja srednje apsolutno odstupanje.(MAD) N _ k _ Xi -X i Xi -X
i=1 i=1 k

MAD = ------------------N (negrupisani podaci)

MAD = ------------------N (grupisani podaci)

N = i
i=1

Srednje apsolutno odstupanje raunamo za aritmetikusredinu, medijan i modus. Varijansa dobiemo je ako izraunamo prosjek za zbir kvadratnih odstupanja. Oznaava se malim grkim slovom sigma na kvadrat (). Predstavlja prosjeno kvadratno odstupanje vrijednosti numerikog obiljeja od njihove aritmetike sredine N _ N ( Xi X) Xi
i=1 i=1 __

= ------------------N (negrupisani podaci)

= ----------- - X
N

Vano svojstvo varijanse je da ona predtavlja minimalno prosjeno kvadratno odstupanje, odnosno odstupanje manje od prosjenog kvadratnog odstupanja podataka od bilo kojeg drugog broja. Srednja devijacija prosjeno odstupanje vrijednosti numerikog obiljeja od njihove aritmetike sredine.Izraava se u mjernim jedinicama obiljeja i najvanija je mjera disperzije. N _ N ( Xi X) Xi
i=1 i=1 __

-------------------

----------N k i Xi
i=1

- X

(negrupisani podaci)

k i=1

N _ i ( Xi X)

__

-------------------

-----------

- X

(grupisani podaci)

N N Standardna devijacija se rauna samo uz aritmetiku sredinu i pokazuje nam da li je ona reprezentativna veliina. Srednje apsolutno odstupanje, varijansa i iz nje izvedena standardna devijacija predstavljaju potpune mjere disperzije.Ove mjere nisu podesne za poredjenje disperzije statistikih nizova u kojima se obiljeja izraavaju u razliitim mjernim jedinicama, kao i za nizove istovrsnog obiljeja ali razliitih sredina.
31. BP (box plat) dijagram
Raspon varijacije i interkvartil se grafiki prikazuju pomou B-P dijagrama (Box and Whisker Plot), koji slui za otkrivanje netipinih vrijednosti varijable. On omoguava poredjenje (centralne vrijednosti, rasprenosti i asimetrije) nekoliko skupova podataka. Za konstrukciju ovog dijagrama potrebno je izraunati kvartili, ije vrijednosti determiniu konstrukciju pravougaonika. Paralelno uz pravac s aritmetikim mjerilom za vrijednost numerike varijable konstruie se pravougaonik. Sam pravougaonik predstavlja sredinjih 50% podataka, a njegova irina oznaava vrijednost interkvartila. Za otkrivanje netipinih vrijednosti potrebno je odrediti unutranje i vanjske granice. Vanjske granice udaljene su od rube pravougaonika po tri interkvartilna razmaka

32. Relativne mjere disperzije (nabrojati i objasniti)


U najznaajnije relativne mjere disperzije ubrajamo: koeficijent varijacije, koeficijent kvartilne devijacije I standardizovano odstupanje. to su relativne mjere disperzije blie nuli, to je vea pouzdanost aritmetike sredine kao mjere centralne tendencije, a to se vie udaljavaju od nule to je aritmetika sredina manje reprezentativna.. - Koeficijent varijacije (V) predstavlja omjer standardne devijacije i aritmetike sredine pomnoen sa sto. Izraava se u procentima i pogodan je za komparativnu analizu. Koristi se kada elimo saznati koji skup ima veu disperziju kod istog posmatranog obiljeja. to je on manji (blii nuli, homogenost je vea a time i rasprenost podataka oko aritmetike sredine manja. V = ----- *100 X - Koeficijentkvartilne devijacije (VQ) predtavlja omjer razlike i zbira kvartila.izraava disperziju u odnosu na medijan i moe poprimiti vrijednosti od 0 do 100 ako je izraen u procentima. to je vrijednost blia nuli, stepen homogenosti niza je vei. Q3 - Q1 VQ = ---------- ; 0 VQ 1 Q3 + Q1 - Standardizovano odstupanje odredjuje relativni poloaj podataka u statistikom nizu. Pomou standardizovanog odstupanja odredjujemo za koliko standardnih devijacija je neki modalitet udaljen od prosjeka. _ Xi - X Zi = ---------- ; i =1,2,..., N

Standardizovano odstupanje se koristi kod normalnog rasporeda za odredjivanje povrine izmedju aritmetike sredine i odredjene vrijednosto obiljeja i kod odredjivanja intervala pouzdanosti pri procjenama karakteristika osnovnog skupa pomou uzorka. Vane osobine z -obiljeja su da je aritmetika sredina distribucije standardizovanog odstupanja jednaka nuli, a standardna devijacija jedan. Ona mogu biti pozitivna i negativna, a rijetko odstupaju od aritmetike sredine za vie od +/- 3 standardne devijacije.

You might also like