Professional Documents
Culture Documents
Statistika PDF
Statistika PDF
Uglavnom ne ispitujemo citav osnovni skup, vec uzimamo njegov deo koji se zove
UZORAK.
2. RAZVOJ STATISTIKE
Prvo je pocelo kao stat.praksa. Prvi oblici statisticke prakse su stari 6000 godina.
Prebrojavanje stanovnistva vrseno je u Kini 4000 pne i u Egiptu 3000 pne. Najvaznija
stat.aktivnost u starom veku je rimski Cenzus (popis stanovnistva- registrovanje pola,
starosti, mesta stanovanja, imovinskog stanja slobodnih gradjana) koji se sprovodio svake
5.godine od 550.g.pne.
1
2
3. KLASIFIKACIJA STATISTIKE
2
3
Greske u radu – prema postojanosti uzroka, mogu biri stalne i slucajne. Stalne
(sistemske) greske su opasnije, dovode u pitanje upotrebljivost podataka i rezultata.
Slucajne greske su greske bez postojanih uzroka. Najcesce nastaju omaskom, ali nisu
ozbiljan problem jer se uglavnom medjusobno potiru.
Predmet istrazivanja stat. je STAT.SKUP (osobe istog ziv.doba, oboleli, zdr.radnici istog
profila, zdr.ustanove istog tipa,...). To je celina od istovrsnih elemenata sa zajednickom
promenljivom karakteristikom (varijabilnim obelezjem). Elementi skupa su istovrsni, ne i
istovetni.
2 vrste stat.skupa: osnovni skup i uzorak. ONOSVNI SKUP je skup svih istovrsnih
elemenata. UZORAK je reprezentativni deo osnovnog skupa.
3
4
PODATAK je bilo kakav zapis (broj, rec, simbol, znak, crtez) o stat.skupu,
jed.posmatranja ili obelezjima posmatranja. Mogu biti: numericki i atributivni, empirijski
i teorijski.
Numericki (vrednost) – to je brojni zapis. Moze biti rezultat merenja, prebrojavanja ili
ocenjivanja. Svi ostali podaci su atributivnog karaktera.
6. GRUPISANJE
3. utvrdjuje se sirina grupnog intervala (grupni intervali moraju biti iste sirine)
4
5
Broj jedinica posmtranja koje odgovaraju jednoj grupi ili grupnom intervalu zove se
UCESTALOST ili FREKVENCA (f). Apsolutna frekvenca je rezultat direktnog
prebrojavanja jed.posmatranja; ceo broj. Apsolutna/uk br jed.skupa dobija se relativna
frekvenca; decimalni broj ili procenat. I aps i relat.ucestalost mogu biti pojedinacne i
kumulativne. Kumulativne frekvence su sukcesivni zbirovi frekvenci grupa ili grupnih
intervala.
Sredjeni nizovi (podaci) jed.posm. skupa zovu se STAT.SERIJE. Mogu biti atributivne i
numericke, vremenske i prostorne.
7. PRIKAZIVANJE PODATAKA
8. TABELIRANJE
Svaka tabela mora da sadrzi redni broj, naslov, semu i izvor podataka.
Zbirne rubrike – rezultati sumiranja podataka iz drca tabele (poslednji red i kolona)
oznacene: ukupno ili svega.
5
6
Tabela mora da bude: - pregledna - jasna i razumljiva- potpuna- tehnicki dobra i pravilna
Tabele se prema sadrzaju dele u 2 grupe:
U odnosu na ulogu koju im,aju u stat.istrazivanjima, tabele mogu biti obradne, analiticke
i publikacione.
9. GRAFICKO PRIKAZIVANJE
Dijagrami prema nacinu prikazivanja mogu biti: tackasti, linijski, povrsinski i prostorni.
Polarni: poluprave(radijusi) idu iz jednog centra zrakasto u sve pravce. Merna skala,
horizontalna (polarna osa). Zaklapaju ugao α.
Na brojne ose nanose se erne skale: aritmeticka (iste razlike u velicini, npr. 3-4, 5-6, 10-
15, 20-25) i logaritamska (nisu iste razlike u velicini, npr. 1-10, 10-100, 100-1000 ili 2-4,
4-8, 8-16).
6
7
Stat.koeficijentima se uporedjuju obim ili nivo 2 raznoimene pojave, gde bar 1 mora biti
masovna. (mortalitet, natalitet)
7
8
Izracunavanje:
a) za negrupisane podatke
b) za grupisane podatke
Ona moze da reprezentuje samo homogeni stat.skup (varijabilitet <30%), gde nema
velikih odstupanja vrednosti obel.posmatranja. Na nju utice svaka vrednost ob.posm.a
posebno extremne vrednosti! Zbog toga, ona nije dobar reprezent proseka ako je skup
heterogen.
13. MEDIJANA
Medijana ili centralna vrednost je srednja vrednost po polozaju. Odgovara sredini niza
jed.posm. uredjenom po velicini. ME ili MED.
Ako je niz podataka PARAN, Med se racuna kao aritmeticka sredina srednje 2
jed.posmatranja.
8
9
14. MOD
Mod ili tipicna srednja vrednost je vrednost obeležja posmatranja kojoj odgovara najveci
broj jedinica posmatranja. To je vrednost koja se najcešce javlja , tj. ima najvecu
ucestalost (f).
9
10
Dobija se kao razlika max i min vrednosti. Daje uvid SAMO o extremnim vrednostima
obelezja, dok o varijabilitetu i grupisanju oko srednje vrednosti, ne daje nikakve info. Sto
je vec broj jed.posm, veci je raspon krajnjih vrednosti.
10
11
Daje informaciju o odnosu jedinice posm.prema skupu (osnovnom ili uzorku). Koristi se
za odredjivanje polozaja rezultata u grupi.
x≠y, SDx≠SDy racuna se CV (CV↓, varij. ↓, ↑homogenost) ili z vrednost (↓z, ↓ varij.)
11
12
STEPEN SLOBODE (DF) =broj slobodno varirajucih clanova jednog niza stat.podataka.
DF=r-s (r – broj clanova niza, s – faktor koji omogucava njihovo slobodno variranje)
Upotreba DF: t i z test, x², Fisher, Medijan test, McN, jednostruka lin.povezanost,
Spirmanova korelacija.
12
13
Nulta hipoteza (Ho) cilj je da bude odbacena jer ima pretpostavku koja je pogresna.
Testira se zbog moguceg donosenja pogresnog zakljucka. (nikotin nije stetan po zdravlje)
Radna hipoteza (H1) cilj je da bude prihvacena, jer sadrzi pretpostavku koja je po
misljenju istrazivaca tacna. (nikotin je stetan po zdravlje)
1. formulisanje Ho i H1
Nivo znacajnosti (α) je max verovatnoca greske I tipa koju je istrazivac spreman da
prihvati.
13
14
Posto se zakljucci baziraju na informaciji iz uzorka, pri ispitivanju hipoteza tj. njihove
ispravnosti uvek je prisutan odredjeni stepen rizika(greske). Zbog toga, postupak procene
ispravnosti hipoteza ima 4 ishoda- 2 pravilna, 2 nepravilna.
Ispravan zakljucak: kad se prihvati tacna ili odbaci netacna Ho. Pogresan zakljucak: kad
se odbaci tacna ili prihvati pogresna Ho.
Postoje dve vrste grešaka koje se medjusobno iskljucuju, tj samo je jedna moguca:
-greška I reda-ako odbacimo tacnu H0, α
-greška II reda-ako usvojimo pogresnu H0. β
14
15
(interval poverenja)
PARAMETARSKI METODI
NEPARAMETARSKI METODI
15
16
U sastav intervala ulaze: posmatrani parametri (npr.x), faktor sigurnosti (t) i stand.greska
(SE).
28. VEROVATNOCA
Slucajan dogadjaj je dogadjaj koji se u datim uslovima i u datom momentu moze ocekivati ali
se ne mora nuzno i ostvariti.
1. Teorijska (a priori, odredjuje se unapred) odnos broja ocek.ishoda prema broju svih
mogucih ishoda. ocek/mog
Sva tri tipa predstavljaju odnos dela prema celini i izracunavaju se po istoj fromuli, kao
kolicnik dela prema celini: m/n = f/n = p
Osobine verovatnoce:
16
17
Binomna raspodela je prekidna raspodela jer slucajna promenljiva moze da uzima samo
cele brojeve. Verovatnoce u bin.rasp. su nenegativni brojevi, a suma svih verovatnoca je
1.
17
18
Osobine norm.raspodele:
Sa porastom velicine uzorka, raspodela x tezi normalnoj. Osnovni skup ne mora imati
norm.raspodelu, ako je uzorak koji se ispituje dovoljno veliki. Dovoljno velikim
uzorcima smatraju se uzorci sa n >30 ob.posm.
18
19
34. T TEST
5. za proporcije
19
20
36. χ² TEST
Fisherov test nije zamena za χ², vec pokriva ona podrucja koja χ² ne moze:
1. n<20 2. 20<n<40
20
21
21
22
1. transformacijom i 2. standardizacijom
To je najbolji oblik paralelizma koja daje jasnu sliku medjus.odnosa ob.posm. Ona
omogucava da se procene nepoznate vrednosti jedne promenljive na osnovu vrednosti
druge promenljive, u granicama brojnog intervala.
y = a+bx
- linearna regresija u kojoj je nezavisna varijabla uvek vreme (godina, mesec, dan).
Vrem.jedinice se izrazavaju numericki. Zbir novih num.vrednosti je 0 i razmaci izmedju
kodova moraju biti jednaki.
22
23
Dalje je isti postupak kao kod lin.regresije – crta se prava, koja se zove linija trenda. Ona
omogucava predvidjanje za buduce vremenske itntervale!
23