Professional Documents
Culture Documents
STATISTIKA NOVA
SK
1.Def.statistike, u stat.literaturi postoji veliki broj def.statistike. Veći br.autora
je deginiše kao dio primijenjene matematike koja se bavi sakupljenjem i
sumiranjem podataka, kao i donošenjem zaključaka.U posljednjih nekoliko
godina se javljaju autori sa drugim pristupom statistici gdje smtraju da ona nije
dio matematike, iako je matematička nauka. Možemo reći da je statistika
univerzalni kvalitativno-kvantitativni naučni metod analize var.pojava, zasnovan
na teoriji vjerovatnoće.
2.Zadatak statistike, je da u pojavama koje izučava otkrije bitne karakteristike,
povezanost sa dr.pojavama, uzroke i posljedice njihovog stanja i promjena, tj.da
otkrije zakonitosti u pojavama i objasni njihovo značenje. U skoro svim
naučnim disciplnimama postoji potreba za posebnim metodološkim aparatom
kojim će se analizirati varijacije posmatranih pojava. Takav metod bi morao da
omogući uvid u ponašanje var.pojava, da se vidi šta je u njima bitno, a šta ne
bitno i kolika su odstupanja u odnosu na normalu, da se uoče tendencije u
njihovom razvoju i da se predvide buduće vrij.takve pojave.Sve nam to
omogućuje statistika. Prof. Schmeizel i prof.Achenvall su smatrali da je zadatak
stat.u sistematizaciji podataka o stan.i privredi u cilju vođenja državne politike.
Zadatak stat.je zasnovan samo na deskripciji.
3.Varijabilna pojava, kako bi shvatili predmet stat.uvodimo pojavam
var.pojava. Varijabilitet(raznolikost) je univerzalno pristutan oko nas. Kad ne bi
postojalo varijacija, ne bi bilo potrebe ni za postojanjem statistike. Var.pojava
je ona na koju djeluje veliki br.vaktora i zbog toga uzima različite vrijednosti od
jednog do dr.slučaja svoga ispoljavanja. Te pojedinačne vrijednosti nemoguće je
sa sig.predvidjeti.
4.Značaj statistike,
5.Stat.zakonitosti, Često je na osnovu stat.analize moguće otkriti neku
pravilnost koju bi bez njene pomoći, bilo nemoguće utvrditi. Takve pravilnosti
nazivaju se stat.zakonitostima. One imaju dvije bitne karakt.: 1.)Važe samo u
masi slučajeva;2.)Pojedinačni slučajevi mogu da pokažu odstupanja od opšte
tendencije.Stat.zakonitosti možemo tumačiti strogo vodeći računa o navedena
dva ograničenja.
6.Stat.skup(osnovni skup, populacija ili skup) je skup svih el.na kojima se
izvjesna varijabilna pojava ispoljava i statistički posmatra.Pojedinačni elementi
iz tog skupa nazivaju se jedinicama skupa ili jed.posmatranja. One moraju imati
bar jednu zajedničku osobinu. Sa porastom njihovog broja osn.skup postaje
homogeniji, ali one ne smiju biti identične.
7.Određenje stat.skupa, naki skup mora ispunjavati odr.uslove da bi mogao da
se nazove stat.skupom:1.) stat.skup mora da obuhvati sve el.koji su predmet
posmatranja,2.) el.tog skupa moraju imati bar jednu zaj.osobinu na osnovu koje
se i deklarišu kao pripadnici tog skupa,3.) Na el.takvog skupa se posmatra neka
var.pojava. Iz ovoga slijedi da ti el.moraju imati bar jednu karakteristiku po
kojoj se mogu razlikovati, odnosno koja je varijabilna.
8.Stat.obilježje, osobine po kojima se jedinice stat.skupa međusobom razlikuju,
a koje su predmet stat.istraživanja, nazivamo obilježjima(promjenjivim ili
varijablama).
9.Podjela stat.obilježja, možemo da ih klasifikujemo u dvije osnovne grupe:
1.atributivna(kvalitativna, kategorijska) i 2.numerička. Atr.obilježja se
izražavaju opisno(riječima),a vartijablitet se ispoljava kroz pripadnost elemenata
različitim kategorijama datih obilježja.Num.obilježja su takve karakteristike
skupa koje se mogu iskazati brojevima. Unutar ove grupe razlikujemo:1.
Prekidna num. Obilježja ili diskretna mogu uzeti samo izolovane
vrij.)2.Neprekidna(ontinuirana)mogu uzeti bilo koje vrijednosti unutar nekog
intervala.. Osn.razlika je jer prekidna obilježja svoje vrijednosti dobijaju na
osnovu prebrojavanja( cijeli brojevi), a neprekidna na osnovu mjerenja(mjerne
jedinice).
10.Deskriptivna statistika, Prof. Schmeizel i prof.Achenvall su smatrali da je
zadatak stat.u sistematizaciji podataka o stan.i privredi u cilju vođenja državne
politike. Zadatak stat.je zasnovan samo na deskripciji, pa je ovaj koncept kasnije
nazvan deskriptivna škola ili statistika. Ako izuzmemo stat.teoriju, primijenjena
stat.se dijeli u dvije grupe: deskriptivna statistika i inferencijalna statistika.
Desk.stat.se sastoji od metoda za prikupljanje, obradu i prikazivanje podataka
korišćenjem tabela, grafikona i sumarnih mjera.
11.Inferencijalna stat., podrazumijeva one stat.metode koji koriste uzorak u
cilju donošenja zaključaka o osnovnom skupu.
12..Nominalna skala, rezultati stat.istraživanja mjere se korištenjem sl.mjernih
skala: nominalne, ordinalne, intervalne i skale odnosa. Nom.skala data je u vidu
liste naziva, kategorija ili odr.atribuda po kojima se jed.stat.skupa razlikuju. Ona
se koristi za prikupljanje pod.o pojavama koje se mogu klasifikovati samo na
odr.broj i tip modaliteta.Na nom.skali prikazuje se, npr.obilježje:pol sa
modalitetima muški i ženski, vrsta djelatnosti i sl. Mogu se prikazivati i
sl.obilježja: zanimanje, vrsta bolesti i sl. Primjenja nom.skale mjerenje svodi na
razvrstanja jed.skupa prema obilježju po odr.šemi klasifikacije.
13.Ordinalna skala se koristi ukoliko je moguće modalitete obilježja rangirati
prema značaju u odnosu na usvojene kriterijume. Ova skala jedinicama skupa
pridružuje brojeve, slovne oznake ili odr.simbole, prema stepenu odr.svojstva ili
odlike. Mjesto modaliteta predstavlja njegov rang. Mj.skala predstavlja rang
listu modaliteta obilježja, pri čemu njihov relativan značaj zavisi od broja
modaliteta. Na ovoj skali prikazuju se npr.ocjene od 1 do 5. Nad modalitetima
obilježja prikazanim na ovoj sklai nisu dozvoljne num.opereacije, jer ona ne
omogučava sagledavanje mjere razlikovanja modaliteta obilježja.
14.Intervalna skala, svakom modalitetu obilježja pridaje odr.jedinicu mjere.
Ovom skalom jedinicama skupa pridružuju se brojevi, pri čemu jednake razlike
brojeva predstavljaju jednake razlike mjerene karakteristike. Int.skala
omogućava utvrđivanje redosljeda modaliteta u skupu. Zbog toga su nad
modalitetima obilježja ove skale dozvoljene num.operacije( *,:,+;-). Za int.skalu
je karakteristično to da su položaj nule i mj.jedinica određeni dogovorima.
Veličina int.skale najčešće se odrueđuje prema odr.kriterijumu, tako da za iste
veličine možemo imati više razl.intervalnih mjera( npr.skale za mjerenje
temp.vazduha).
15.Skala odnosa prikazuje i redosljed modaliteta i mjeru njihovog razlikovanja.
Skala odnosa sadrži brojeve za koje važi pravilo da njihove jednke razlike
predstavljaju i jednake razlike mjerene karakteristike jedinica skupa. Ova mjerna
skala obezbjeđuje najviši nivo mjerenja. Nju ne karakteristiše samo upotreba
jedinice mjerenja, nego i prava nulta tačka, koja ukazuje na nepostojanje
odr.karakteristike. Zbog toga ova skala omogućava iskazivanje propocionalnih
odnosa modaliteta obilježja koja se mjere. Skala odnosa je najpreciznija mjerna
skala. Na osnovu nje se mogu mjeriti: visina, težina, prihod, jačina zemljotresa i
sl.
16.Stat.podaci, Posmtranje i prikupljanje pod.vrši se na osnovu plana
prik.podataka. Plan posmatranja i prikupljanja podataka sadrži sl.el.:def.cilja
posmatranja, odr.stat.skupa i jed.posmatranja; izbor obilježja i def.modaliteta
obilježja, sastavljanje upitnika za prikupljanje pod., odr.načina posmatranja i
prikupljanja podataka. Prema izvodu podataka koji se koriste u stat.istraživanju,
može se govoriti o primarnim i sek.stat.podacima. Prim.st.pod.prikupljaju se
postupkom stat.posmatranja i prikupljanja podataka, dok se sek.pod.obezbjeđuju
iz sek.izvora kao što su zavodi za stat. Ili institucije ovlaštene za prikupljanje
primarnih podataka(centralna banka, carinska služba, matične službe i sl.).
17.Stat.istraživanje, može se zasnivati na potpunom obuhvatu svih jedinica
skupa (potpuno posmatranje), ili samo na jednom dijelu njegovih
jedinica(djelimično posmatranje). Potpuno posmatranje može se obezbijediti
primjenom stat.popisa i stat.izvještaja( tekuće registracije). Stat.popisom
obuhvataju se sve jedinice skupa u momentu koji se naziva kritični momenat. To
su ugl.podaci o stanovništvu, domaćinstvima i sl.koji se sprovode svake desete
godine. Stat.izvještaj se koristi za prikupljanje podataka o pojavama kod kojih je
izražen veći varijabilitet tokom vremena ili prostora ( stanje zaposlenih).
18.Stat.serije, grupisanje podataka po pojedinim obilježjima može biti
jednostavno ili složeno. Jed.posmatranja se grupišu po atributivnim, numeričkim
ob.po vremenu i teritoriji. Stat.serije predstavljaju nizove sređenih stat.podataka
koji prikazuju strukturu skupa prema odr.obilježju, raspored stat.skupa u
prostoru ili promjene skupa u vremenu. St.serije, mogu da budu serije strukture(
atributivne i numeričke) i vremenske serije( momentne i intervalne). Stat.serija
ima dve kolone: obilježje i podaci. Atr.serija se formira grupisanje jedinica po
atr.obilježju. One se mogu formirati na osnovu dvojakog grupisanja:
1.grup.prema poj.modalitetima obilježja, 2. Grup.podataka po grupama srodnih
modaliteta. Num.nastaju grupisanjem jedinica vrijednosti num.obilježja.
Num.serije mogu biti intervalne i neintervalne serije distribucije
frekvencije.Specifična vrsta serija strukture po atr.obilježjima su
geografske(prostorne, teritorijalne) serije. One prikazuju teritorijalni raspored
stat.skupa, tj.njegovu strukturu u odr.trenutku ili u datom vrem.periodu. Raspon
frekvencija je num.serija strukture. Osn.nedostatak serije distr.frekv.je u tome da
se zamjenom pojedinačnih vrijednosti obilježja grupnim intervalima budi
preciznost informacije o karakt.određenih jed.skupa.
19.Serije strukture , pokazuju raspored stat.skupa prema modalitetima, odnosno
po vrijednostima obilježja. One sadrže modalitete obilježja i frekvencije,
tj.učestalost jedinica skupa po datom modalitetu obilježja. Ove serije mogu
sadržavati atr.i num.obilježja.VIŠE U PITANJU IZNAD!
20.Sturges-ovo pravilo-br.grupa, kako bi se odredila veličina intervala i
br.intervalnih modaliteta neprekidnog obilježja može se koristiti tzv.Struges-ovo
pravilo. Po tom pravilu, br.grupa( intervala, klasa) određuje se na osnovu:
K=1+3,3logN, gdje je N ukupan broj podataka.
21.Sturges-ovo pravilo-vel.intervala ,Vel.intervala i određuje se na osnovu
razlike najbeže i najmanje vrijednosti obilježja, primjenom sl.obrasca: i=Xmax-
Xmin/K . Kako bi intervali bili uporeivi, potrebno je da oni budu iste veličine.
Prilikom grupisanja podataka i formiranja intervalne serija bitno je voditi računa
o tome da se za donju granicu prvog intervala uzme vrij.manja od najmanje
vrij.obilježja, a da se za gornju uzme vrij.veća od najveće vrijednosti obilježja u
skupu. Time se obezbjeđuje da sve vrijednosti obilježja budu obuhvaćene
intervalnim modalitetima u seriji.
22.Rastuća i opadajuća kumulanta, često se u st.istraživanjima je potrebno
izvršiti kumuliranje podataka u serijama. Kum.podatak znači postebeno ih
zbrajati. Serija u kojoj se kumul.podaci zove se kumulativna. Kumuliraju se
samo frekvencije. Imamo dve vrste kum.serija:1. Kum.oblik iznad, 2.kum.oblik
ispod. Kumuliranje se vrši tako što se počevši od najniže vrij.frek.postepeno
sabiraju, tj.dodaju. Tako dobijamo rastuću kumulantu. Ona pokazuje broj jed.u
skupu čija je vrij.ispod gornje granice grupnog intervala. Opadajuća pokazuje
broj jed.skupa sa vrij.iznad donje granice int.
23.Vrem.serije, predstavljaju nizove stat.podataka koji su složeni hronološkim
redom. Zbog toga se i nazivaju hronološkim serijama. Ove serije pokazuju
varijabilitet pojava tokom vremena. Formiraju se iz dva niza podataka, od koji
se jedan odnosi na vrijeme, a drugi na nivo( veličinu) pojave. U zavisnosti od
podataka o pojavi, vrem.serije mogu biti momentne i intervalne. Momentne
pokazuju nivo pojave u tačno određenim vrem.momoentima(br.zaposlenih
krajem mjeseca). One se dobijaju kao rezultet obrade rezultata iše uzastopnih
popisa ili statističkih izještaja o stanju pojave. Intervalne pokazuju kretanje
pojave u uzastopnim vrem.intervalima. Njima se prikazuje kretanje plata,
troškova i sl. Vr.serije mogu da pokazuju uporedne podatke o dvije ili više
pojava u istom vrem.periodu. Vrij.pojava mogu da budu izražene u različitim
jedinicama mjere.
24.Desk.stat.mjere, predstavljuju pokazatelje koji se formiraju na osnovu
originalnih num.podataka ili rasporeda frekvencija, i opisuju na sintetizovan
način posmatrane podatke. Ukoliko se odnose na rasporede grekvencija nazivaju
se još pokazatelji rasporeda frekvencija. Smisao tih mjera je da: 1.jednim brojem
opišu bitne karakteristike posmatranih podataka,2.da nam omoguće poređenje
između više stat.serija. Klasifikujemo ih u 4 grupe: 1.mjere centralne tendencije
rasporeda(srednje vrijednosti)2.mjere varijabiliteta(disperzije ili
raspršenosti),3.mjere oblika rasporeda, 4. Relativno učešće(proporcija). Mjere
centralne tendencije mogu da se podijele u dvije grupe: izračunate i pozicione.
To je reprezentativna vrijednost koja zamjenjuje sve podatke posmatrane serije,
bez obzira da li se radi o skupu ili uzorku.
25.Aritmetička sredina, je najčešće korišćena mjera centralne tendencije.
Popularno se još naziva prosjek. Ar.sredina se dobija tako što se zbir vrijednosti
posmatranog obilježja podijeli sa njihovim brojem. Obilježava sesimpolom µ-
mi. µ=1/N∑Xi, gdje je sigma ili suma znak za sabiranje. Prostije ovu formulu
možemo napisati µ=∑x/N.
26.Osobine aritmetičke sredine, su:
1.Arit.sredina je srednja vrijednost, sa osobinom da je veća od najmanje i manja
od najveće vrij.obilježja. 2.Ako su sve vrijednosti obilježja međusobno jednake,
tada je i ar.sredina jednaka tim vrijednostima. 3.Zbir odstupanja svih
vrij.obilježja od njihove ar.sredine jednak je nuli tj.∑(Xi-µ)=0.
4.Zbir kvadrata odstupanja svih vrijednosti obilježja od aritmetičke sredine je
minimalan, tj.manji je od tbira kvadrata odstupanja svih vrijednosti obilježja od
bilo koje dr.vrijednosti. 5.Ako su vrij.dva obilježja povezane nekom linearnom
vezom, tada su i njihove ar.sredine povezane sa istom tom lineasrnom vezom.
27.Geometrijska sredina, predstavlja mjeru centralne tendencije koja izravnava
proporcionalne promjene između podataka posmatrane serije. Izračunava se tako
što se vrij.obilježja međusobno pomnože, a zatim se iz tog proizvoda pronađe
korijen sa izložiocem koji je jednak broju posmatranih jedinica. Pošto se u ovim
slučajevima javljaju korijeni sa velikim izložiocima za izračunavanje
geom.sredine moraju se koristiti i logaritmi. Budući da nama treba geo.sredina a
ne njezin log., vršimo antilog.G=enti-korijen iz X1*X2*...*XN. Najvažnija
osobina geo.sredine je da izravnava proporcionalne promjene podataka u seriji.
Izr.geo sredine ima značaj samo za seriju poz.vrijednosti, gdje ni jedan član nije
0, i na nju utiču sve vrijednosti serije. Za istu seriju podataka geo.sredina je
manja od ar.sredine. Ar.sredina izravnava razlike između vrij.obilježja,
geo.izravnava njihove odnose.
28.Harmonijska sredina, predstavlja recipročnu vrij.aritm.sredine iz
recipročnih vij.obilježja. Koristi se samo u sprecijalnim slučajevima gdje se
problem može postaviti u obrnuto recipročnom vidu.Ona se koriti kada su
obilježja el.iz kojih se izračunava izražena u vidu recipročnih pokazatelja. Ona
je naročito značajna u istraživanju pokazatelja produktivnosti rada, pokazatelja
brzine obrta poslovnih sredstava, srednjeg vremena izrade proizvoda i sl.
29.Modus, Za razliku od izračunatih mjera centralne tendencije, pozicione
srednje vrij.se određuju na osnovu njihovog mjesta, tj.lokacije u seriji. Modus je
vrij.obilježja koja se najčešće javlja u seriji, tj.vrij.sa najvećom frekvencijom.
Ukoliko je data negrupisana serija podataka o pojavi u kojoj svaka vrij.obilježja
ima istu frekvenciju jednaku 1, modus ne postoji. Ukoliko su frekvencije
različite, modus je utvrđuje pronalaženjem vrij.obilježja koja se najčešće javlja.
Serija koja ima dva modusa naziva se bimodalna serija, a serija sa više modusa
multimodalna serija. To je jedan od nedostataka modusa jer ne znamo za koju
od navedene dvije vrij.da se opredijelimo.Prilikom izračunavanja modusa
potrebno je voditi računa o tome da na njegovu veličinu utiče i način grupisanja
podataka- Promjenom vel.grupnih intervala mogu se dobiti različite vrij.modusa.
30.Medijana,
Je vrij.obilježja koja se nalazi u sredini seriji čiji su podaci sređeni po veličini.
Ona čitav skup dijeli na dva jednaka dijela, tj.polovina jedinica skupa ima
vrij.obilježja manju, a polovina jedinica vrij.obilježja veću od medijane. Na nju
je utiču ekstremne vrij.obilježja. Zbog toga kada su u seriji prisutne jed.skupa sa
ekstremnim malim ili velikim vrij.obilježjima, medijana realnije opisuje cijeli
skup nego ar.sredina. Prilikom izračunavanja medijane potrebno je voditi računa
da li je riječ o parnim ili neparnim brojem podataka. Mjesto mjedijane određuje
se kao N+1/2. Ako je riječ o parnim brojem podataka ona se određuje kao
prosjek dviju vrij.obilježja koje se nalaze u sredini. Ona se približno može
odrediti i grafičkim putem, koristeći kumulirane frekvencije.
31.Kvartili, dok je medijana vrij.obilježja koja polovi seriju podataka (50% su
manje,50% veće od medijane), kvartili su mjere koje dijele seriju podataka na
četiri jednaka dijela. Ako se ukupan broj članova serije podijeli na četiri jednaka
diijela vrij.obilježja koje ih dijele nazivaju se kvartilima: prvi kv.Q1, drugi Q2 i
treći Q3. Medijana je u suštini drugi kvartil. Njih koristimo za izračunavanje
interkvartilne razlike, i da se opušu svojstva serije num.podataka. Prvi kv.je
vrij.obilježja za koju je 25% jedinica manje, a 75%jed.skupa veće od date
vrijednosti. Mjesto je Q1=N+1/4. Treći je vrij.ob.za koju je 75%jed.manje, a
25%veće od date vrijednosti. Mjesto Q3=3(N+1)/4
32.Mjere varijacije mjerama varijabiliteta dopunjavaju se inf.o karakteru
stat.skupa ili uzorka. Varijailitet prestavlja raspršenost podataka u seriji.
Utvrđuje se pomoću odg.mjera varijacije koje mogu biti pozicione i izračunate u
odnosu na neku srednju vrijednost skupa ili urotka. Možemo ih klasifikovati i u
zavisnosti od toga da li su izražene u apsolutnim ili u relativnim je.mjere. Ako
su izažene u jedinicama vr.obilježja govori se o apsolutnim mjerama, za razliku
od mjera koje se izražavaju relativnim pokazateljima.. Kroz apsolutne mjere
varijabiliteta koriste se interval(razmak)varijacije i intervalna razlika, kao i
odstupanje, varijansa i stand.devijacija. Od relativnih mjera varijacije najširu
upotrebu imaju koeficijent varijacije i standardizovano odstupanje.
33.Interval varijacije
Kada govorimo o int.var.u nekoj seriji prva ideja koja nam je na pameti je da
izmjerimo odstojanje od miniuma do maksimuma. Ova mjera se utvrđuje kao
razlika između najveće i najmanje vrij.obilježja samo približnu inf.o disperziji
posmatrane serije jer na njegovu veličinu utiču samo dvije krajnje vrij.obilježja.
Ukoliko su te dvije vrij.i ekstremne u seriji ova mjera će biti nerealno velika i na
pogrešan način odslikavati varijacije svih podataka u seriji. Int.var. je jednak
razlici najveće i najmanje vrij.obilježja. Može se izračunati samo za konačne
skupove podataka.
34.Interkvartilna razlika je razlika između prvog i trećeg kvartila: IQR=Q3-Q1.
Budući da ova mjera uzima u obzir samo raspon centralnih 50% podataka u
sredini serije, jasno je da ne zavisi od ekstremnih vrijednosti. Kvartil i
interkv.razlika ne mogu biti pod uticajem ekstremnih vrijednosti, jer se jedinice
sa vrijedtima obilježja mnjim od prvoh kvartila ili većim od trećeg kvartila ne
utimaju u obzir.Stat.mjere kao što su medijana, kvartili i interkv.razlika na koje
ne utiču ekstremne vrij.nazivaju se rezistentnim ili robustnim mjerama.
35.Srednje apsolutno odstupanje Pošto je zbir odstupanja svih podataka od
njihove ar.sredine jednak nuli, sam zbir odstupanja ne možemo uzeti kao mjeru
disperzije. Zbir odstupanja podataka od ar.sredine je jednak nuli, jer se
negativna odstupanja potiru sa pozitivnim. Kako bi to prevazišli javlja se ideja
da se uzimanje apsolutnih vrij.svih odstupanja. Da bismo to prevazišli ,
jednostavno podijelimo navedenu sumu sa brojem podataka. Budući da dijelimo
sa brojem podataka, dobijena mjera će pokazivati prosjek sume apsolutnih
odstupanja podataka od ar.sredine. To se naziva srednje apsolutno odstupanje.
36.Varijansa srednje apsolutno odstupanje se rijetko koristi u stat., jer sadrži
inf.nepogodne za dalju matematičku obradu. Da bi eliminisali negativna
odstupanja uzimamo kvadrate odstupanja. Kako bi odstranili uticaj broja
podataka na našu mjeru disperzije podijelićemo sumu kvadrata sa brojem
podataka. Prosjek sume kvadrata odstupanja svih podataka od njihove ar.sredine
naziva se varijansa ili srednje kv.odstupanje. Ona se dobije kao kvadratna
sigma=1/N∑(Xi-µ) na kvadrat. Var.uzorka predstavlja prosjek zbira kvadrata
odstupanja svih vrij.obilježja jedinica u uzorku od ar.sredine uzorka.
37.Standardna dev. Iako varijansa, ima široku primjenu u stat.istraživanjima,
ona ima i jedan značajan nedostatak. Radi se o kvadriranju odstupanja podataka
od ar.sredine pa je iskazana u kvadratima mjernih jedinica. Time se povećava
veličina izračunate mjere varijabiliteta. Da bi se taj nedostatak otklonio
izračunava se kvadratni korijen iz varijanse i dobija se najčešće korišćena mjera
varijabiliteta- stand.devijacija. Ona se može izračunati iz varijanse tako što
izvlačimo korijen iz varijanse. Možemo da je izračunamo i na osnovu podataka
o odstupanjima od ar.sredine. Možemo da je definišemo kao prosječno
odstupanje svih pojedinačnih podataka od njihove aritmetičke sredine.
38.Koeficijent varijacije za razliku od mjera varijacije koje su izražene u
apsolutnim jedinicama vrijednosti obilježja, relativne mjere izražene su u
procentima ili u jedinicama standardne devijacije. One omogućavaju da se
upoređuje varijabilitet num.serija podataka koji su izraženi u različitim
jedinicama mjere, ili serija čija su obilježja izražena istim jedinicama,ali sa
razl.ar.sredinom. Najčešće korištene relativne mjere su koeficijent varijacije i
standardizovano odstupanje. Koef.var.predstavlja relativni odnos
stand.devijacije i ar.sredine. Izračunava se kao: Kv= st.devijacija/µ. Koef.var.se
često izražava u procentima i pokazuje kolikoprocentualno iznosi st.devijacija
od ar.sredine. Njegove velike vrij.ukazuju na relativno veliki stepen
varijabilnosti podataka u seriji.
39.Stand.odstupanje predstavlja mjeru odstupanja nekog pojedinačnog podatka
od ar.sredine izražena u jed.standardne devijacije. Izračunava se na sl.način:
Z=Xi-µ/st.devijacija. Stand.odstupanje kao i koef.varijacije omogućava
upoređivanje varijabiliteta individualnih podataka više pojava, zbog toga što se
odstupanja podataka od ar.sredine ne izražavaju u apsolutnim jed.mjere
obilježja. Značaj st.odstupanja proizilazi iz činjenice da se varijabilitet ne
ocjenjuje samo sa gledišta rasporeda grekvencija kao cjeline, nego i sa gledišta
pojedinačnih podataka u skupu ili uzorku.
40.Centralni stat.momenti serije distr.frekvencija imaju različite oblike u
pogledu načina rasporeda glanova serija, s obzirom na vrijednosti obilježja. Za
mjerenje oblika rasporeda frekvencija prema osi simetrije ili u pogledu
zaobljenosti najčešće se koriste centralni momenti. Cent.momenti sukcesivno
mjere prosječna odstupanja podataka, nultog, prvog, drugog ili N-tog stepena, u
odnosu na ar.sredinu. Centralni moment nultog reda uvijek je jednak 1.
Centr.moment prvog reda jednak je nuli, pa se ne može upotrijebiti za mjerenje
oblika rasporeda. Cent.moment drugog reda je u stvari varijansa. Za mjerenje
rasporeda ostaju nam momenti viših redova od drugog.
41.Mjera asimetrije za simetričnu distribuciju karakteristično je da svakom
odstupanju vrij.obilježja od ar.sredine negativnog predznaka odgovara isto
toliko odstupanje pozitivnog predznaka. Ako je raspored pozitivno asimetričan,
pozitivna i negativna odstupanja neće se izravnati nego će preovladati
odstupanja sa pozitivnim predznakom. Kod negativno asimetričnih rasporeda
preovladaće odstupanja sa negativnim predznakom. Pokazatelj asimetrije dat je
sl.izrazom: α3=M3/st.devijacija na treću. Pokazatelj asimetrije je relativna mjera
stepena i smjera asimetrije koja je za egzaktno simtrične rasporede jednaka nuli.
Što je veća apsolutna vrijednost ovog koeficijenta, veća je i asimetrija
posmatranog rasporeda.
42.Mjera spljoštenosti zaobljenost rasporeda je druga komponenta oblika
rasporeda frekvencija. Zaobljenost u okolini modalnog maksimuma krive
distribucije frekvencija mjeri se koeficijentom spljoštenosti koji se bazira na
četvrtom centralnom momentu. Stavljanjem u odnos cent.momenta i
st.devijacije na četvrti stepen dobija se relativna mjera spljoštenosti rasporeda.
Označava se sa α4=M4/st.dev.na četvrtu.Prilikom tumačenja relativne mjere
spljoštenosti dobijenu vrij.upoređujemo sa teorijskom spljoštenosti
tzv.norm.rasporeda frekvencija koja iznosi 3.Ako je koef.splj.veći od 3 tada je
raspored više izdužen.
43.Osn.pojmovi u teoriji vjerovatnoće su eksperiment, ishod i prostor uzorka,
odnosno elementarnih događaja.Pri proučavanju prirode i društva osnovu naših
saznanja čine eksperimenti, kao i potpuno precizirane operacije posmatranja ili
prikupljanja podataka, koje se u nepromijenjenim uslovima mogu ponavljati
proizvoljno mnogo puta i čiji se ishod ne može sa sigurnošću predvidjeti.
Realizacije eksperimenata su ishodi, kao skup unaprijed poznatih mogućnosti
realizacije. U svakom pojedinom izvođenju eksperimenata realizuje se samo
jedan ishod-elementarni događaj. Prostor uzorka je skup svih elementarnih
događaja. Slučajni događaj je podskup skupa elementarnih događaja, koji imaju
neku zajedničku osobinu.
44.Neke operacije sa sl.događajima Rećemo da su dati događaju A i B. Kažemo
da A implicira B ako se svaki put kada se ostvari događaj A ostvari i događaj B,
što se označava sa: A B
Događaji A i B su jednaki ako istovremeno A implicira B i B implicira A, što se
označava sa: A B B A. Unija dog.A i B je događaj koji se ostvaruje onda i
samo onda ako se ostvari bar jedan od dog.A i B. A U B. Presjek dog.Ai B je
dog.koji se ostvaruje istovremenim ostvarenjem i dog.A i dog.B. Označava se
kao A B. Za dva događaja A i B kažemo da se međusobno isključuju ako je
presjek njihov dog.prazan skup.Unija dva dog.Ai B koji su međusobno isključivi
predstavlja zbir tih događaja A U B=A+B. U slučaju kada događaji A i B
pokrivaju cjelokupan prostor elementarnih događaja S, a međusobno su
isključivi tada za te dog.kažemo da su komplementarni.
45.Vjerovatnoća događaja Vj.događaja je funkcija P definisana na slučajnim
događajima koja ih preslikava u realne brojeve, a ima sl.osobine:1.Svakom
slučajnom događaju E odgovara nenegativni broj P(E) koji predstavlja njegovu
vjerovatnoću,tako da je:P(E)≥0. 2.Vjerovatnoća sigurnog događaja S je: P(S)=1
3.Za medusobno disjunktne događaje E1,E2...En vjerovarnoća njihove unije
jednaka je zbiru njihovih vjerovatnoća. Ako je skup el.događaja nekog
eksperimenta ima n elemenata sa jednakim mogućnostima realizacije i ako
realizacija ukupno k elementarnih događaja pri čemu je 0<k<n, tada je
vjerovatnoća događaja E data izrazom: P(E)=k/n.
46)Klasična definicija vjerovatnoće Ako skup elementarnih događaja nekog
eksperimentra ima n elemenata sa jednakim mogućnostima realizacije i ako
realizacija ukupno k elementarnih doagađaja,pri čemu je 0<k<n,povlači
realizaciju događaja E,tada je vjerovatnoća događaja E data izrazom: P(E)=k/ n.
Bitno je naglasiti da rezultat ove vjerovatnoće ne mora da se javi prilikom
svakog ponavljanja eksperimenata, pa se zbog toga ova vjerovatnoća označava
kao vjerovatnoća a priori i veže se za slučaj kada je prostor elementarnih
događaja konačan, a elementarni događaji imaju jednaku vjerovatnoću
ostvarenja. Ona upućuje na očekivanj prilikom izvođenja nekog eksperimenta,
koje u praktičnim uslovima odstupa od isoda koji se realizuje
47)Statistička definicija vjerovatnoće Označimo sa N broj ponavljanja nekog
eksperimenta,a sa Ne broj javljanja E u N tih ponavljanja.Statistička
vjerovatnoća,a posteriori određuje se nakon izvršenog eksperimenta na osnovu
dobijenih empirijskih vrijednosti, kao granična vrijednost relativnog učešća
javljanja događaja E prilikom N ponavljanja datog eksperimenta :P(E)=lim
Ne/N. S obzirom da se u praksi eksperiment izvodi samo kontačan broj puta ova
vj.se ne može precizno odrediti kao granična vrijednost, nego se samo ovjenjuje
kao relativna frekvencija događaja E u N ponavljanja eksperimenta i izračunava
se kao P(E)=Ne/N. Empirijske vrijednosti pokazuju ispravnost ovog izraza jer
što se više eksperimenata izvodi to se voa vjerovatnoća više približava vj.a
priori.
48)Subjektivna vjerovatnoća
Kada se događaji javljaju samo jedanput ili kada su uslovi njihove realizacije
značajno različiti,tada se njihova vjerovatnoća može odrediti i na osnovu
mišljenja određenih lica koja su na neki način upućena u realizaciju tih
događaja.Polaznu osnovu za davanje ocjene o vjerovatnoći dešavanja nekog
događaja čini znanje,iskustvo i raspoložive informacije tih lica,koja prema svom
ubjeđenju daju ocjenu tražene vjerovatnoće.
U nekim praktičnim istraživanjima procedurama ovo je neophodna zamjena u
slučajevima kada se ne raspolaže podacima potrebnim za određivanje egzaktne
vjerovatnoće.
49)Pravilo sabiranja vjerovatnoće
Određivanje vjerovatnoće realizacije dva ili više događaja najčešće se izvodi
korišćenjem pravila sabiranja ili množenja vjerovatnoća kao i različitim
kombinacijama ovih pravila. Koje pravilo se primjenjuje zavisi od toga u
kakvom su međusobnom odnosu posmatrani događaji. Pravilo sabiranja vj. se
još naziva i aditivnim pravilom.U slučajevima kada se određuje vjerovatnoća da
se desi događaj E1 ili E2 ili događaj...En ,primjenjuje se pravilo sabiranja
vjerovatnoća.Neka su događaji E1 i E2 slučajni događaji iz prostora
elementarnih događaja 5.Tada je vjerovatnoća njihove unije jednaka zbigu
pojedinčanih vjerovatnoća tih događaja umanjena za vjerovatnoću njihovog
istovremenog ostvarenja:
P(E1UE2)=P(E1)+P(E2)-P(E1∩E2)
Što predstavlja vjerovatnoću da će se ostvariti ili događaj E1 ili događaj E2.Ako
su događaji E1 i E2 međusobno diskjuntni(isključivi=,tada je vjerovatnoća
njihove unije jednaka zbiru njihovih pojedinačnih vjerovatnoća:
P(E1UE2)=P(E1)+P(E2),P(E1∩E2)=Ø
50)Uslovna vjerovatnoća i nezavisnost događaja
Poseban aspekt posmatranja odnosa više događaja ogleda se u tome kako
realizacija jednog slučajnog dogaaja utiće na realizaciju drugog događaja,
odnosno u kojoj mjeri realizacija jednog događaja zavisi od real.dr.događaja. Tu
se radi o zavisnosti realizacija događaja.Za dva događaja E1 i E2 uslovna
vjerovatnoća označava se sa P(E2/E1) i predstavlja vjerovatnoću ostvarenja
događaja E2,pod uslovom da se ostvario događaj E1.Ova vjerovatnoća e
određuje se pomoću izraza: P(E1 presjek E2)/P(E1)
Dva događaja E1 i E2 su nezavisni ako je:
P(E1∩E2)P(E1)·P(E2),
Odnosno,dva događaja su nezavisna ako je vjerovatnoća njihovog istovremenog
ostvarenja jednaka proizvodu njihovih pojedinih vjerovatnoća.
51)Pravilo množenja vjerovatnoća
Pravilo množenja vjerovatnoća primjenjuje se za određivanje vjerovatnoće
istovremenog(zajedničkog) javljanja dva ili više događaja prilikom izvođenja
nekog eksprimenta. U praktičnom smislu ovakvu kombinaciju očekivanja
realizacije događaja prepoznajemo po formulaciji „i“, tj.kada se određuje
vjerovatnoća da se desi i jedan i drugi i...“i“n-ti događaj.
Za dva događaja E1 i E2 vjerovatnoća njihovog istovremenog ostvarenja dobije
se na osnovu izraza:
P(E1∩E2)=P(E1) P(E2/E1)
P(E1∩E2)=P(E2) P(E1/E2)
Za slučajne događaje koji su međusobno nezavisni vjerovatnoća njihoovog
istovremenog ostvarenja dobije se kao proizvod njihovih pojedinačnih
vjerovatnoća:
P(E1∩e2)=P(E1)·P(E2)
AKO JE P(E2/E1)=P(E2) odnosno P(E1/E2)=P(E1)
52)Vjerovatnoća uzorka
Često se dešava da nas zanima vjerovatnoća uzorka nekog događaja.( U slučaju
da se automobil ne može upaliti postavlja se pitanje zbog čega?) U ovakvim
slučajevima određivanje vj.uzorka jedan je od načina njihovog otkrivanja.
Vjerovatnoća uzorka se još naziva i Bajesova vjerovatnoća.Neka su dati
događaji D1,D2...Dk koji su međusobno diskjunktni,a čija unija predstavlja
siguran događaj,odnosno neki potpun prostor elementarnih događaja:
U Dτ=S,τ=1,...k.
Opšti oblik Bajesove teoreme:
P(Dτ/X)=P(Dτ)/P(x)·P(x/Dτ)=P(Dτ)·P(x/Dτ)/∑P(Dτ)·P(x/Dτ)
Pri tome se događaju D1,D2...Dk smatraju uzrocima događaja x koji
je,dakle,njihova posledica.Zato se ova vjerovatnoća označava kao vjerovatnoća
uzroka.Vjerovatnoća P(Dτ) su a priori,a vjerovatnoće P(x/Dτ),a posperiori.Ova
teorema posebnu primjenu nalazi prilikom određivanja vjerovatnoće nekih
događaja za koje je poznata vjerovatnoća uzroka njihovog nastanka.
53)Slučajna promjenljiva
U stat.često koristimo pojam obilježje kao karakteristiku na osnovu koje se
jedinice posmatranja međusobno razlikuju. Samim tim, različite vrijednosti
obilježja se nazivaju modaliteti tog obilježja. Statističari su formulisali veliki
broj modela kojima pokušavaju da opišu razne pojave u ekonomiji, medicini itd.
Svaki od tih modela opisuje ponašanje neke pojave. Npr.broj mob.tel,u
domaćinstvu je promjenljiva veličina koja uzima različite vrij.od domaćinstva
do domaćinstva. Tu promj.nazivamo sl.promjenljiva. Slučajna promjenljiva je
numerička ф-ja koja svakom ishodu statističkog eksperimenta pridružuje jedan
realan broj.Slučajne promjenljive možemo podijeliti na osnovu toga da li
uzimaju samo izolovane vrijednosti ili sve moguće vrijednosti u nekom
intervalu.Za slučajnu promjenljivu kažemo da je prekidna(ili diskretna)ako
može uzeti konačan broj izolovanih vrijednosti ili prebrojivo mnogo
vrijednosti.Slučajna promjenljiva je neprekidna ako može da uzme bilo koju
vrijednost u nekom intervalu.
54)Raspored vjerovatnoća prekidne slučajne promjenljive
Prekidna sl.promjenljiva može se opisati kao veličina koja uzima određene
izolovane vrijednosti sa odgovarajuim vjerovatnoćama. Kako bi opisali tu
promjenljivu dolazimo do rasporeda vjerovatnoća. Raspored
vjerovatnoće(raspodjela vjerovatnoće ili ф-ja vjerovatnoće ili zakon
vjerovatnoće)prekidne slučajne promjenljive x je skup parova svih vrijednosti
koje može da uzme slučajna promjenljiva x i odgovarajućih vjerovatnoća.Opšte
karakteristike svih prekidnih slučajnih promjenljivih:
1)nijedna vjerovatnoća u rasporedu vjerovatnoće ne može biti negativna,
2)suma vjerovatnoća koje odgovaraju svim vrijednostima slučajne promjenljive
x mora biti jednaka 1.
Rasp.vj.daje nam najpotpuniju inf.o karakteristikama sl.promjenljive. Kad nam
je on poznat možemo donositi raličite stavove o bilo kojim vrijednostima
sl.promjenljive.
55)Funkcija rasporeda prekidne slučajne promjenljive
Rasp.vjerov.prekidne sl.promjenljive može se predstaviti kao lista svih
pojedinačnih vrijednosti sl.promjenljive sa odg.vjerovatnoćama. Ali se postavlja
pitanje kako opisati prekidnu sl.promjenljivu koja ima beskonačno mnogo
vrijednosti. To se postiže pomoću funkcije rasporeda. Funkcija
rasporeda(naziva se još i kumulativna ф-ja rasporeda) prekidne slučajne
promjenljive pokazuje vjerovatnoću da slučajna promjenljiva x uzme vrijednost
koja je manja ili jednaka bilo kojoj proizvodnoj vrijednosti x.
Ф-ja rasporeda slučajne promjenljive x se označava sa F(x) i data je
vjerovatnoćom:F(x)=P(X≤x)
gdje x može biti bilo koji realan broj
Svaka ф-ja rasporeda mora da zadovolji sledeće matematičke karakteristike:
1)za bilo koju vrijednost a: 0≤F(a) ≤1,što je i razumljivo jer je ф-ja rasporeda
vjerovatnoća,
2)F(-∞)=0 i F(+∞) na siguran događaj
3)ako je a<b ,tada je F(a)≤F(b) ,tj. ф-ja rasporeda bilo koje slučajne promjenljive
je naopadajuća ф-ja.
56)Očekivana vrijednost prekidne slučajne promjenljive
U desk.stat.opisivali smo rasporede frekvencija pomoću deskriptivnih mjera
cent.tendencije, disperzije i oblika rasporeda. Od svih pokazatelja zadržaćemo:
očekivanu vrij.sl.promjenljive i varijansu sl.promjenljive. Očekivana vrijednost
slučajne promjenljive x označava se sa E(x) i jednaka je zbiru proizvoda
vrijednosti koje uzima slučajna promjenljiva i odgovarajućih vjerovatnoća
Očekivana vrijednost naziva se još matematičko očekivanje ili očekivanje od
x.Očekivana vrijednost jednaka je aritmetičkoj sredini populacije E(x)=μx=μ.
Očekivana vrijednost se nalazi između minimalne i maksimalne vrijednosti
slučajne promjenljive i ne mora se poklapati sa nekom vrijednošču slučajne
promjenljive.
57)Varijansa prekidne slučajne promjenljive
Vidjeli smo da očekivana vrij.predstavlja centar ili sredinu rasporeda
vjerovatnoće neke sl.promjenljive. Postavlja se pitanje u kojoj su mjeri ostale
vrijednosti raspršene u odnosu na očekivanu vrij. Tj kolika je
disperzija?Varijansa je mjera disperzije rasporeda vjerovatnoće slučajne
promjenljive.Varijansa slučajne promjenljive označava se sa VarX ili ơx (na
kvadrat) ili ơ (na kvadrat) i dobija se na osnovu obrasca:
Vor(X)= ơx (na kvadrat)=E[x-E(x)] na kvadrat =∑[xτ-E(x)]na kvadrat pτ
Može se jednostavnije izračunati pomoću radne,alternativne formule.
Vor(x)=ơx(na kvadrat=E[x-E(x)]na kvadrat=E(x na kvadrat)-[E(x)] na
kvadrat=∑xi na kvadrat pτ-μna kvadrat x,tj. Kao očekivanje kvadrata slučajne
promjenljive minus kvadrata njenog očekivanog.
Varijansa slučajne promjenljive ne može biti negativna tj Var X ≥0,Ako je Var
x=0 ne postoje nikakva odstupanja,x nije slučajna promjenljiva već neka
konstanta.
58)Standardizovana slučajna promjenljiva
Bilo koja slučajna promjenljiva x može se standardizovati kada se od nje
oduzme njena očekivana vrijednost,a zatim se podijeli sa standardnom
devijacijom.
Standardizovana slučajna promjenljiva:
Z=X-E(x)/st.dev.X ; E(Z)=0 VR.z=1
gdje su:
N-veličina populacije
min(n,N1)minimum od n i N1
65)Hipergeometrijski raspored-parametri
n-veličina uzorka
N-veličina populacije i
k-veličina intervala selekcije
Ono se može pojaviti problem ako postoji ciklično ponavljanje u podacima i ako
se uzorački interval bude takav da prati tu cikličnost.
88)Klaster uzorkovanja
Je još jedan način stat.slučajnog uzorkovanja.Klaster uzorkovanja
podrazumijeva dijeljenje populacije na dijelove koji nemaju presjeka,odnosno
koji nemaju zajedničkih elementara.Klaster predstavlja minijaturnu(ili mikro-
kosmos)populaciju,čiji je dio.Kada se klasteri ustanove,primjenjuje se slučajno
uzorkovanje elemenata u svakom pojedinom klasteru i tako se u konačnosti
dobija uzorak ovim metodom.. U odnosu na stratifikovano slučajno
uzorkovanje, gdje su stratumi homohrni fijrlobi populsvijr, klsdzrt uzorkovanje
identifikuje klastere koji su sami za sebe heterogeni. Svaki klaster sadrži širok
varijetet elemenaza, kado da klaster predstavlja minijaturnu populaciju. Primjeri
klastera su gladovi, kompanije, regije itd.
90)Uzoračka greška
Uzoračka greška javlja se kao posljedica fluktuacije uzorka i uvijek je prisutna
prilikom uzorkovanja.Ovo zbog toga što uzorak, po pravilu, a to znači u
najvećem broju uzoraka izabranih iz neke populacije, nije savršeno
reprezentativan. Kafa bi se slučajnim izborom uvijek dobijao savršeno
reprezentativan uzorak, tada bi se stat.zaključivanje svodilo na mjerenje
elemenata jednog uzorka, izračuvanje željenih vrijednosti i njihovo
proglašavanje vridnostima parametara populacije. Iskustvo i priroda
uzorkovanja uče nas da takav način zaključivanja ima vrlo ozbiljne zamjerke. Iz
neke populacije moguće je izabrati manji ili veći broj uzoraka u zavisnosti od
toga da li se izbor vrši sa ponavljanjem ili bez ponavljanja elemenata. Kod
relativno velikih populacija ,broj mogućih uzoraka je veoma veliki, tako da je i
fluktuacija velika.
91)Neuzoračke greške
Sve ostale greške koje nisu uzoračke greške označavaju se kao neuzoračke.
Mnoštvo mogućih neur.grešaka uključuje nedostajuće podatke, greške u
zapisivanju, greške prilikm unosa pod.u računar, kao i analitičke greške.
Neuz.greške se pojavljuju i kao posljedica instrumenata mjerenja, greške
nejasnog definisanja i pogrešnih pitanja u upitnicima. Lođe definisan okvir
uzrokuje nastanak grešaka. U raznim anketama u kojima ispitanici šalju
odgovore pojavljuju se neuzoračke ggreške koje se ogledaju u sl. U nekim
vrem.periodu u dr.slučaju ispitanik zaboravi prošle događaje, i konačno greška
se javlja kada ispitanik ne sjeća odr.događaja. U knjizi polazna je pretpostavka
da ove greške nisu prisutne u istraživanju- To nas ne treba čuditi.
92)Uzoračka distribucija
Ar.sredina nesumnjivo je najčešće korišćena mjera centralne tendencije. Uz to,
ar.sredina je najbolja mjera te vrste, ako se može pretpostaviti da je populacija
normalno raspoređena.Uzoračka distribucija određene statistike predstavlja
distribuciju vjerovatnoće svih mogućih vrijednosti koje ta statistika može da
uzme,a koje se dobiju izračunavanjem iz svih uzoraka iste veličine,slučajno
izabranih iz posmatrane populacije.Ar.sredina svih uzoraka iste veličine koji se
mogu dobiti iz neke populacije jednaka je ar.sredini populacije µ.
103)Interval povjerenja
Interval povjerenja je raspon(područje) vrijednosti za koje se vjeruje da
uključuje nepoznatu vrijednost parametra populacije.Uz ovaj interval ide i
informacija o mjeri povjerenja sa kojom očekujemo da ovaj interval zaista sadrži
vrijednost posmatranog parametra. Int.ocjenjivanje podrazumjeva proceduru u
kojoj se formira interval u kojem se sa određenom vjerovatnoćom očekuje
vrij..parametara osn.skupa. Int.koji se formira ima posebnu osobinu pouzdanosti
ili vjerovatnoću tačnog ocjenjivanja prave vrijednosti parametara populacije.
104)Statistika uzorka
Statistika uzorka,kao npr. X(bar),varira od uzorka do uzorka,odnosno utima
različite vrijednosti od uzorka do uzorka,s obzirom da zavisi od elemenata koji
su izabrani u uzorak.Ova varijacija mora se uzeti u obzir prilikom ocjenjivanja
karakteristika populacije.Da bi se to postiglo,vrši se intervalno ocjenjivanje
prave vrijednosti parametra populacije,uzimajući u obzir uzoračku distribuciju
posmatranog paramtera.Interval koji se formira ima posebnu osobinu
pouzdanosti ili vjerovatnoću tačnog ocjenjivanja prave vrijednosti parametra
populacije.
105)Nepristranost
Osobine ocjena. O njima je potrebno voditi računa jer že se zaključci koje
izvodimo bazirati na dobijenim ocjenama. Poželjne su osobine ovjena su:
nepristranost, efikasnost, konzistentnost i dovoljnost.Ocjena parametra
populacije je nepristrana ako je njena očekivana vrijednost(prosjek) jednaka
parametru populacije.Mada se u praksi bira samo jedna uzorak,može se pokazati
da je prosječna vrijednost aritmetičkih sredina svih mogućih uzoraka određene
veličine jednaka aritmetičkoj sredini populacije.
106)Efikasnost
Efikasnost ocjene podrazumjeva njenu karakteristiku varijabiliteta.Ocjena je
efikasnija ako ima manju varijansu,odnosno standardnu grešku za uzorke iste
veličine.Kada se porede dvije ocjene,tada je efikasnija ona čije vrijednosti u
prosjeku manje odstupaju od parametra populacije.
107)Konzistentnost
Konzistentnost,kao osobina ocjena,veže se ta tendencije ocjene u odnosu na
vrijednost parametra populacije u slučajevima kada se veličina uzorka
mijenja.Za ocjenu se može konstatovati da je konzistentna ako se povećavanjem
veličine uzorka,ona teži vrijednosti parametra populacije.
108)Dovoljnost
Ocjena je dovoljna ako uzima u obzir cjelovitu informaciju iz uzorka.Tako,npr.
X(bar) je dovoljna ocjena jer koristi cjelovitu informaciju iz uzorka.
110)Nivo pouzdanosti
Dio površine ispod standardizovane normalne krive 1-L označava se kao
koeficijent pouzdanosti.L predstavlja vjerovatnoću greške,odnosno
vjerovatnoću da interval neće obuhvatiti nepoznat parametar.Koeficijent
pouzdanosti ako se pomnoži sa 100,dobija izrat u procentima i naziva se nivo
pouzdanosti.
114)Karakteristike t distribucije
Aritmetička sredina t distribucije je 0.Za FORMULA,varijanta t distribucije
jedna je FORMULA
115)Stepeni slobode
Broj stepeni slobode predstavlja broj nezavisnih vrijednosti u uzorku,koji se
dobije kada se broj raspoloživih vrijednosti umanji za broj ograničenja koja se
nameću ovim vrijednostima.
G je granica greške
120)Statistička hipoteza
Statistička hipoteza je precizno formulisano tvrđenje ili pretpostavka o nekoj
važnoj karakteristici jednog ili više skupova.Statistički metod kojim se
empirijska evidencija uzorka koristi radi procjenjivanja njene prihvatljivosti
naziva se testiranjem hipoteze,a procedura statističkim testom. Na osnovu do
sada navedenog možemo dati sl.generalnu preporuku o tome ada se koristi
ocjenjivanje a kada testiranje: Ocjenjivanje se koristi kada je potrebno samo
doći do inf.o nepoznatom parametru osn.skupa. A testiranje se primjenjuje ako
su itsovremeno ispunjeni sl.uslovi: na istr.pitanje ili problemo postoje dva
odgovora da ili ne, i problem se rjašava korišćenjem uzoraka.
Σyi=nb0+b1Σxi
Σxiyi=b0Σxi+b1Σxi²
171.)Gade-Markovljeva teorema
Ako su ispunjene sve pretpostavke prostog linearnog regresionog modela,ocjene
dobijene metodom najmanjih kvadrata su najbolje(efikasne),nepristrsne linearne
ocjene.
172.)Razlaganje varijabiliteta,ukupan,objašnjena i neobjašnjen varijabilitet
Ukupan varijabilitet je jednak zbiru objašnjenog i neobjašnjenog varijabiliteta.
Σ(yi- i)²=Σ(ŷi- )² + Σ(yi-ŷi)²
Ukupna suma kvadrata=objašnjena suma kvadrata+ neobjašnjena suma kvadrta
Ukupna suma kvadrta razlažena je na dva dijela.Objašnjena suma kvadrate često se
i naziva regresionom sumom kvadrata,a neobjašnjena suma kvadrata rezidualnom
ili sumom kvadrata greške.
173.)174.)175.) Kako bismo razumjeli st.grešku regresije I koef.determinacije
moramo sagledati od čega zavisi varijabilitet(ponašanje)zavisne promjenljive. One
variraju iz dva razloga: jedan izvor varijabiliteta se duguje varijacijama u
vrijednostima Xi I možr dr onjsdnizi trg.modelom. Drugi dio var.posljedica je
djelovanja slučajne greške I ne može se objasniti ni reg.modelom.Poznato nam je
da je varijacija mjeri najčešće kao razlika između podaataka I ar.sredine svi
podataka. RTakvo odstupanje se naziva ukupnim odstupanjem. Vidimo da se
posmatrana tačka ne nalazi tačno na reg.liniji već iznad nje, jer posmatramo
stogastične veze I do tog odstupanja je došlo pod uticajem slučajne greške. Takvo
odstupanje zovemo neobjašnjenim varijabilitetom. Odstupanje empirijske
vrijednosti od ar.sredine je objašnjeno reg.vezom između X I Y I naziva se
objašnjenim varijabilitetom.
176.)Standardna greška regresije
Standardna greška regresije je apsolutna mjera i pokazuje odstupanje empirijskog
podatka u uzorku od regresione linije uzorka. S = ….
177.)Fakotri koji utiču na veličinu standardne greške regresije
Na veličinu standardne greške regresije utiču sljedeći faktori:
1.)Raspršenost tačaka.Što su empirisjke tačke više rapršene,S je veća,pa manje
pouzdanja možemo imati u predviđanje zasnovano na takvoj liniji regresije.
2.)Veličina uzorka.Što je uzorak veći,manja je standardna greška regresije.
3.)nivo vrijednosti promjenljive Y.Standardna greška je iskazana u istim mjernim
jedinicam kao i zavisna promjenljiva i zavisi od njenog nivoa.za viši nivo
vrijednosti promjenljive Y po pravilu je veća i standardna greška regresije.
178.)Koeficijent determinacije-pojam
Koeficijent determinacije je relativna mjera i pokazuje učešće objašnjenog
varijabiliteta u ukupnom,odnosno koliko si varijacije prmjenljive Y objašnjene
promjenljivom X.
r²=b1² · Σx²-n ²/Σy²-n ²
179.)Koeficijent determinacije-vrijednosti i tumačenje
Vrijednot koeficijenta determinacije varira od 0 do 1,tj. 0≤r²≤ 1
Kada je r²=1 objašnjen varijabilitet je ejdnak ukupnom.Približavanjem vrijednosti
koeficijenta determinacije nuli,sve je manji udio objašnjenog varijabiliteta i
regresiona linija sve slabije reprezentuje podatke.Kada je r²=0 neobjašnjeni
varijabilitet se irjednačava sa ukupnim i zaključujemo da ne postoji linerana
regresija.
180.)
181.)Predviđanje pomoću regresije-uslovi
1.)Regresiona linija dobro reprezentuje empirijske podatke (visok nivo koeficijenta
determinacije,npr. r²>0,5)
2.)Između varijacija posmatranih pojava u skupu postoji linearna veza,tj-
paramtetar nagiba se statistički značajno razlikuje od nule,tj. ß1≠0
3.)Ne koristi se prekomjerna ekspropolacija.
182.)Ekspropolacija regresije
Ekspropolacija je korišćenje regresione linije (modela) u svrhu predviđanja za one
vrijednosti X koje su izvan interval koji je dat empirijskim podacim uzorka.
183.) Interval ocjene prosj.vrijednosti zavisne promjenljive S obzirom na
stohastičku prirodu veze između X I Y za svaku pojedinačnu vrijednost Xi u skupu
postoji čitav raspored mogoćuh vrijednosti Yi. Njihova prosječna vrijednost se
nalazi na liniji regresije skupa. Razlika je u tome što prosječna vrij.prestavlja
konstantu dok je individualna vrij,Yp slučajna promjenljiva. Samim tim je
predviđanje pojedinačnih vrij.neizvjesnije, pa će I iodg.interval predvianja biti širi
od interval ocjene. Kako bi formirali interval koji bi sa odg.pouzdanošću obuhvatio
E(yp) potrebno je da poznamo mjestu odstupanjaYp odE(yp) Može se pokazati da
tu mjeru predstavlja st.greška ocjene prosječne vrij.zavisne promjeljive. Interval
ocjene prosječne vrij.zavisne promjenljive se formira na oslovu formule, gdje imam
kritičnu trij. t α/2, koju dobijamo iz tablica. Imamo st.grešku I Yp.
184.)Standardna greška ocjene prosječne vrijednosti zavisne promjenljive
Sŷp=……
S- standardna greška regresije
n-veličina uzorka
Xp-proizvoljna vrijednost objašnjavajuće promjenljive za koju ocjenjujemo
prosječnu vrijednost E(Yp)
185.)Interval predviđanja pojedinačne vrijednosti Y
Ŷp-tα/2,n-2Syp≤Yp≤ŷp+ tα/2,n-2Syp
Gdje su:
Y-zavisna promjenljiva
X1i,x2i….-vrijednosti objašnjavajućih promjenljivih
ßo,ß1….-parametri modela
i-stohastički član ili slučajna greška
k-broj objašnjavajućih promjenljivih
189.)Pretpostavke višestrukog linearnog regresionog modela
1.)Broj podataka u uzorku mora biti veći od broja ocjenjivanih paramtetara, tj.. n>k
2.)Između objašnjavajućih promjenljivih ne postoji savršena multikolinearnost.ovo
znači da između bilo koje dvije objašnjavajuće promjenljive ne smije da postoji
savršena linearna korelacija.
190.)Linearni regresioni model sa 2 objašnjavajuće promjenljive
Linearni regresioni model sa dvije objašnjavajuće promjenljive je najjednostavniji
višestruki regresioni model i s obzirom na opšti model,glasi:
Yi=ß0+ß1x1i+ß2x2i+ i
Ŷi=b0+b1x1i+b2x2i
Gdje su:
Ŷi- prilagođena vrijednost zavisne promjenljive Yi
b0,b1 i b2- ocjena nepoznatih parametara b0,b1 i b2..
193.)Sistem normalnih jedinica sa 2 objašnjavajuće promjenljive
Σy=nb0+b1Σx1+b2Σx2
Σx1y=b0Σx1+b1Σx1²+b2Σx1x2
Σx2y=boΣx2+b1Σ x1x2+b2Σx2²
194.)Mjere reprezentativnosti u višestrukoj regresiji
Da bismo utvrdili prilagođenost ocjenjene regresione ravni empirisjkim
podacima,koristimo standardnu grešku regresije,kao apsolutnu mjeru i koeficijent
višestruke determinacije,kao relativnu mjeru
195.)Standardna greška regresije S, predstavlja ocjenu standardne devijacije
slučajne greške, , pa se dobije kao kvadratni korijen rezidualne varijanse.U
modelu sa 2 promjenljive S je jednako:
S=√ ²= …
b1=Σxy/Σx²
b0= Σyi/n=
228.)
229.)Tumačenje parametara linearnog trenda
Odsječak (ß0) je prosjek vremenske serije u posmatranom period.nagib (ß1)
pokazuje srednji apsolutni porast,odnosno prosječnu promjenu vremenske serije (u
zavisnosti od znaka,rast ili opadanje) u sukcesivnim vremenskim intervalma u
obuhvaćenom period.
230.)Standarnda greška trenda
Standardna greška trenda je mjera njegove reprezentativnosti,a izračunava se na
sljedeći način: SŷE=…. Formula….
231.)Ekspropolacija trenda
Ekspropolacija trenda je produžavanje linije trenda izvan interval obuhvaćenog
vremenskom serijom,bilo u budućnosti ili u prošlosti.
232.)Izolacija cikličnih i rezidualnih uticaja
Isključivanje (eliminisanje trenda: y|ŷk
Yt= ß0·ß1x
236.)Eksponencijalni trend –ocjene parametara
log b0=Σlogy /n
bo-pokazuje vr. Trenda u ishodištu
log b1= Σxlogy /Σx²
b1-pomnožen sa 100 izražava srednji tempo rasta posmatrane pojave.
237.)Ciklična komponenta
Ciklična komponenta predstavlja naizmjenično smanjivanje višegodipnjeg
odstupanja posmatrane pojave iznad,sa višegodišnji odstupanjem istog njenog
prosječnog kretanja.Odstupanje iznad prosjeka šredstavlja ekspanziju pojave,dok
odstupanje ispod prosječnog kretanja predstavlja njenu kontrakciju.
238.) metodi izravnanja vrem.serije Prilikom razmatranja različizih načina za itbor
funk.trenda koja najbolje opisuje kretanje posm.pojave naveli smo da je moguće
koristiti I metode izravnanja vrem.serije. Oni služe kao filteri jer se pomoću njih iz
serije odstranjuju tekuća kolebanja. Vtrm.serija očišćena od takvih kolebanja
prikazuje se gradički da bi se uočilo da li pokazuje odg.stabilnost tokom
obuhvaćenoh vrem.perioda. Važno je napomenuti da oni imaju dvojaku funk.kod
vrem.serija: 1.da se uoči eventrualno postojanje trenda, 2. Radi prognote buduće
vrij.vrem serije. Najboljznatiji metodi su: metod pokretnih prosjeka I
eksponencijalno izravnanje.
239.)Metod pokretnih prosjeka
Metod pokretnih prosjeka ima trostruku f-ju u statistici:
1.)Da omogući poticanje osnovnog toka pojave odstranjujući osnovna tekuća
kolebanja u seriji.
2.)kao metod za prognozu budućih vrijednosti vremenske serije i
3.)koristi se pri konstrukciji sezonskih indeksa.
240.) i241.) Izr.pokretnih prosjeka-paran I neparan br.podataka Metod pokretnih
prosjeka ima trostruku funkciju u stat.: 1 da omohući isticanje osn.toka pojave,2.
Kao metod za prognozu budućih vrij.vrem.serije,3.pri konstrukciji sezonskih
indeksa. Pokretni prosjeci su takva transformacija ofiginalne vrem serije u kojoj se
svaki podatak zamjenjuje ar.sredinom tog podatka, određenog broja prethodnih I
isto toliko narednih podataka. On se naziva tako jer se prilikom njegove primjene
sukcesivno pomjeramo od početka serije dve do kraja. Stalno moramo da uzimamo
grupe od istog broj podataka za izračunavanje prosjeka. Postoje dva načina
izr.prosjeka, u zavisnosti od parnog ili neparnog br.sadržaja. Ako uzmemo tri člana
prosjek će biti y2 bar= y1+y2+y3/3 . Jasno je da ovaj prosjek odg.drugom podatku
u seriji pa će on zamjeniti originalni podatak y2- Vidimo da je prvi pod.ostao bez
svog pokretnog prosjeka. Sl.prosjek glasi: y3bar=y2+y3+y4/3. Izr.pokr.prosjeka na
grupama sa parnim br.pod. je komplikovanije, uzimamo recimo 4 člana. Prvi
pokretni prosjek bi bio y2/3bar= y1+y2+y3+y4/4 Dr.bi bio: y3/4bar=
y2+y3+y4+y5/4
242.)Sezonske varijacije
Sezonske varijacije predstavljaju promjene određen vremenske serije koje se
ponavljaju tokom više godina u isto doba,u istom smjeru,i približno istom
intenzitetu.
243.)Sezonski indeks
Sezonski indeks je relativan broj koji pokazuje prosjek sezonskog uticaja,odnosno
jačinu sezonskog uticaja,u određenom mjesecu ili kvartilu tokom više godina.
244.)Metod odnosa prema pokretnim prosjecima
Ovaj metod polazi od multiplikativnog modela kompoziciije vremenske serije:
Y= T·S·C·R
245.)Postupak izračunavanja sezonskih indeksa
Postupak izračunavanja sezonskih indeksta se provodi kroz tri etape.U prvoj etapi
izračunavaju se kvartilni (mjesečni) pokretni prosjeci,kao proste aritmetičke sredine
originalnih podataha svaka čeiri uzastopna kvartila.Nakon izračunavanja svih
pokretnih prosjeka,oni se centriraju.Cenrirani pokretni prosjeci predstavljaju
aritmetičke sredine svaka dva uzastopna kvartila pokreenog prosjeka.U drugoj fazi
odstranjujemo uticaj trenda i ciklične komponente dijeljenjem svakog orginalnog
podatka njegovim centriraim pokretnim prosjekom.U trećoj fazi izračunavaju se
sezonski indeksi,kao aritmetičke sredine neregularnih sezonskih količnika
odgovarajućih kvartila.Njihovim množenjem sa 100 ,iksazujemo ih u procentima.U
ovoj etapi smo eliminisali uticaj neregularne komponente.
246.)
247.)Desezoniranje
Desezoniranje je postupak kojim se iz originalnih podataka vremenske serije
odstranjuje sezonski uticaj.U multiplikativnom modelu ovo se postiže dijeljenjem
originalnih podataka sa sezonskim indeksima i množenjem sa 100.
Desezonirani podatak=originalni pod/sezonski indeks ·100
U aditivnom modelu,od originalnih podataka se oduzimajuodgovarajući sezonski
uticaji.
250.)