You are on page 1of 23

1

1. STATISTIKA je nauka koja se bavi kvantitativnim istrazivanjem masovnih pojava.


Ona se bavi prikupljanjem, prikazivanjem, analizom i interpretacijom podataka.

Predmet istrazivanja je STATISTICKI SKUP. On se sastoji od JEDINICA


POSMATRANJA. Jed.posmatranja su nosioci brojnih obelezja (karakteristika).Jedinice
posmatranja su istovrsni elementi skupa, npr. ljudi, zivotinje, celije... oni su nosioci
karakteristika koje ispitujemo.

Uglavnom ne ispitujemo citav osnovni skup, vec uzimamo njegov deo koji se zove
UZORAK.

Karakteristika jed.posmatranja koju istrazujemo zove se OBELEZJE POSMATRANJA.

Ob.posmatranja moze biti: numericko (kontinuirano i diskontinuirano) i atributivno.

2. RAZVOJ STATISTIKE

Prvo je pocelo kao stat.praksa. Prvi oblici statisticke prakse su stari 6000 godina.
Prebrojavanje stanovnistva vrseno je u Kini 4000 pne i u Egiptu 3000 pne. Najvaznija
stat.aktivnost u starom veku je rimski Cenzus (popis stanovnistva- registrovanje pola,
starosti, mesta stanovanja, imovinskog stanja slobodnih gradjana) koji se sprovodio svake
5.godine od 550.g.pne.

U srednjem veku je zamrla stat.aktivnost. U novom veku se aktivira stat.praksa od 16.


veka (registri rodjenih, umrlih, vencanih). Krajem 18. i poc. 19.veka javljaju se prvi
organi stat.sluzbe i prve publikacije i organizuje medjunarodni statisticki institut. Na
Balkanu je prva stat.organizacija osnovana u Srbiji 1884. Potreba da se ti evidentirani
podaci opisu i analiziraju, dovodi do razvoja stat.teorije.

Razvoju statistike doprinele su 2 stat.skole: nemacka Univerzitetska statistika i engleska


Politicka aritmetika. Po nemackoj skoli statistika je drzavopis, osnivac je Konring. Druga
je imala za cilj naucno saznanje o drustvu, osnivac je Dzon Graunt.

Adolf Ketle, belgijanac, smatra se osnivacem statisticke statistike. On je u


stat.istrazivanja uveo teoriju verovatnoce, koja je postigla uspeh tek nakon njegove smrti.
Pirson je nastavio njegovo delo i razradio teoriju distribucije i teoriju korelacije. Stat.delo
Ketlea i Pirsona nastavili su i drugi statisticari u 1.pol 20.veka i razradili metod uzorka,
metod ocenjivanja podataka iz uzorka i metod stat.experimenta .Posebno se isticu Fiser,
Goset i Jets.

U 2. pol 20.veka razvijaju se racunari i telekomunikacioni uredjaji, sto olaksava razvoj


stat.teorije.

1
2

3. KLASIFIKACIJA STATISTIKE

Statistika se moze klasifikovati u dve osnovne kategorije: evidencionu stat. i stat.metod


istrazivanja.

Evidenciona prikuplja, sredjuje i objavljuje numericke podatke . Ona obuhvata sve


jedinice posmatranja.

Stat.kao metod naucnog istrazivanja klasifikuje se u vise kategorija. 1. teorijska i


primenjena stat. 2. opsta i specijalna stat.

Teorijska stat. ima zadatak da formira, objasnjava, dokazuje i usavrsava stat.metode.


Postoji opsta terijska i specijalna terijska stat.

Primenjena stat. se koristi za istrazivanje u raznim oblastima nauke i prakse.

Medicinska statistika je posebna vrsta stat. To je teorijska stat. prilagodjena medicini.


Nastanak se vezuje za 1847,godinu kada je Semelvajs dokazao smanjenje smrtnosti
porodilja kao posledicu sprovodjenja higijenskih mera u porodilistu. Medicinskom
stat.obradjuju se medic.podaci, koji su rezultat medic.experimenta. Experiment moze biti
laboratorijski, klinicki i terenski. Jedinice posmatranja mogu biti zdravi, oboleli,
exper.zivotinje, sekreti, kulture tkiva, medic.osoblje, ustanove, itd. Obicno se posmatra
mali uzorak. Postoje i grane medic.statistike, kao sto su epidemioloska, socijalno
medicinska, itd.

4. STATISTICKI METOD I METODOLOGIJA

Statistika kao metod istrazivanja ima 2 karakteristike: masovnost i kvantitativnost.

Stat.istrazivanje je uspesno samo ako se primenjuje na masovne pojave- to su pojave koje


se desavaju u velikom broju ili se ponavljaju vise puta. Individualna promenljivost gubi
znacaj.

Kvantitativnost je utvrdjivanje frekvence tj.ucestalosti ispitivane karakteristike pojave u


masi slucajeva. Znaci, ona je uslovljena masovnoscu pojave.

Svako istraivanje prolazi kroz iste i vec usvojene etape rada.

Faze istraz. procesa: proucavanje, planiranje, prikupljanje podataka i obrada podataka.


Obrada podrazumeva: sredjivanje, opisivanje, analiziranje i donosenje zakljucka.

Rezultati su podlozni greskama. 2 vrste gresaka: greske u radu i greske u zakljucivanju.

2
3

Greske u radu – prema postojanosti uzroka, mogu biri stalne i slucajne. Stalne
(sistemske) greske su opasnije, dovode u pitanje upotrebljivost podataka i rezultata.
Slucajne greske su greske bez postojanih uzroka. Najcesce nastaju omaskom, ali nisu
ozbiljan problem jer se uglavnom medjusobno potiru.

Posebnu vrstu gresaka predstavljaju perturbacije (poremecaji) – usled iskrivljenosti


predstave o pojavi koju istrazujemo.

5. OSNOVNI STATISTICKI POJMOVI

Predmet istrazivanja stat. je STAT.SKUP (osobe istog ziv.doba, oboleli, zdr.radnici istog
profila, zdr.ustanove istog tipa,...). To je celina od istovrsnih elemenata sa zajednickom
promenljivom karakteristikom (varijabilnim obelezjem). Elementi skupa su istovrsni, ne i
istovetni.

2 vrste stat.skupa: osnovni skup i uzorak. ONOSVNI SKUP je skup svih istovrsnih
elemenata. UZORAK je reprezentativni deo osnovnog skupa.

Elementi skupa zovu se JEDINICE POSMATRANJA (1 osoba, 1 bolesnik, 1 zdr.radnik


odredjenog profila, 1 zdr.ust,..). To su karakteristike stat.skupa.

Karakteristike skupa mogu biti kvalit.i kvant.i zovu se OBELEZJA POSMATRANJA.


Mogu biti atributivna, numericka, diskontinuirana ili kontinuirana.

ATRIBUTIVNA (kvalit.karakteristike) prikazuju se samo opisno )pol, vrsta oboljenja,


ishod bolesti, tip disanja, brzina dejstva leka, intenzitet bola, vrsta terapije...).

NUMERICKA (kvant.) izrazavaju se brojevima. To su obelezja koja se mogu bojati ili


meriti (br obolelih, godine zivota, temp, kolicina lipida u serumu, nivo Alb, Er, frekv
pulsa, visina, tezina, TA, SE,...).

DISKONTINUIRANA (prekidna) obelezja mogu uzimati samo cele brojeve iz nekog


intervala (br obolelih, frekv pusla, br Er, broj dece, br porodjaja, godina rodjenja..). Ona
su rezultat prebrojavanja. NUMERICKA I ATRIBUTIVNA

KONTINUIRANA (neprekidna) obelezja koriste svaku realnu vrednost iz nekog


intervala (TA, temp, TM, visina, starost). Ona su rezultat merenja. ISKLJUCIVO
NUMERICKA

Numericka obelezja variraju svojim intenzitetom (npr. temp). Atributivna kvalitativno


variraju (temp: subfebrilna, febrilna...).

VARIJACIJA(varijabilitet) je promenljivost obelezja posmatranja.

3
4

PODATAK je bilo kakav zapis (broj, rec, simbol, znak, crtez) o stat.skupu,
jed.posmatranja ili obelezjima posmatranja. Mogu biti: numericki i atributivni, empirijski
i teorijski.

Numericki (vrednost) – to je brojni zapis. Moze biti rezultat merenja, prebrojavanja ili
ocenjivanja. Svi ostali podaci su atributivnog karaktera.

Empirijski (posmatrani) su rezultat stvarnog desavanja pojava.

Teorijski (ocekivani) podaci su rezultat teorijskih razmatranja. Oni su iskljucivo


numerickog karaktera.

Podaci se mogu klasifikovati i pomocu SKALA MERENJA (to je merna skala,


predstavlja nivo merenja ili kategoriju podataka). Postoje 4 merne skale: nominalna,
ordinalna, intervalna i skala odnosa.

6. GRUPISANJE

Da bi prikupljeni materijal mogao da se koristi treba biti pregledan. To se postize


metodom grupisanja. Pravila grupisanja: sveobuhvatnost, sistematicnost i odredjenost.
Sve jedinice skupa moraju biti obuhvacene grupisanjem.

Grupisanje je metoda razvrstavanja jed.posmatranja skupa u grupe ili grupne intervale.

Pri formiranju intervala treba se drzati osnovnih pravila i redosleda

1. utvrdjivanje min i max vrednosti epirijskih podataka

2. utvrdjivanje raspona vrednosti jed.posmatranja

3. utvrdjuje se sirina grupnog intervala (grupni intervali moraju biti iste sirine)

4. odredjivanje granica intervala (donja-min empir vrednost i gornja-max empir


vrednost)

Numericka obelezja: Grupe – mali broj (raspon) vrednosti

Grupni intervali – veliki raspon vrednosti

Atributivna obelezja: Grupe po kategorijama atrib.obelezja

4
5

Broj jedinica posmtranja koje odgovaraju jednoj grupi ili grupnom intervalu zove se
UCESTALOST ili FREKVENCA (f). Apsolutna frekvenca je rezultat direktnog
prebrojavanja jed.posmatranja; ceo broj. Apsolutna/uk br jed.skupa dobija se relativna
frekvenca; decimalni broj ili procenat. I aps i relat.ucestalost mogu biti pojedinacne i
kumulativne. Kumulativne frekvence su sukcesivni zbirovi frekvenci grupa ili grupnih
intervala.

Primer: numer.obelezje: kumulisanje pocinje sa najnizim ili najvisim vrednostima


obelezja (rastuca/opadajuca kum.frekvenca).

atrib.obelezje: kumulisanje se vrsi po logickom sistemu progresije tog obelezja. (dobro,


vrlo dobro, odlicno...).

Prikaz rasporedjivanja jed.posmatranja skupa po grupama ili intervalima zove se


DRISTRIBUCIJA FREKVENCI (RASPODELA UCESTALOSTI). Mogu biti aps, relat,
pojedinacne, parcijalne i kumulativne.

Sredjeni nizovi (podaci) jed.posm. skupa zovu se STAT.SERIJE. Mogu biti atributivne i
numericke, vremenske i prostorne.

7. PRIKAZIVANJE PODATAKA

Svrha prikazivanja stat.podataka je brz i lak uvid u rezultate prikupljanja i grupisanja u


cilju publikovanja ili dalje obrade. Ovi podaci se prikazuju u tabelarnom i grafickom
obliku. (8 i 9)

8. TABELIRANJE

Tabeliranje je pregledno prikazivanje grupisanih podataka tabelom.

Svaka tabela mora da sadrzi redni broj, naslov, semu i izvor podataka.

Naslov – opis predmeta, mesto i vreme ispitivanja.

Sema- prilagodjena sadrzaju tabele, oblika pravoug.ili kvadrata, razdeljenog horiz.i


vert.linijama na manja polja (rubrike). Vertikalne rubrike – kolone, a horizontalne –
redovi. U tabeli se nalaze pretkolone, zaglavlje, srce tabele i zbirne rubrike.

Pretkolona i zaglavlje – opis obelezja;opisni deo seme.

Srce tabele - kolone i redovi (konkretni numericki podaci)

Zbirne rubrike – rezultati sumiranja podataka iz drca tabele (poslednji red i kolona)
oznacene: ukupno ili svega.

Izvor podataka – navodi se ispod seme tabele.

5
6

Tabela mora da bude: - pregledna - jasna i razumljiva- potpuna- tehnicki dobra i pravilna
Tabele se prema sadrzaju dele u 2 grupe:

I – prosta i slozena tabela (u odnosu na broj stat.serija)

II – elementarne i kombinovane (1 ili vise rasclanjenih obelezja)

U odnosu na ulogu koju im,aju u stat.istrazivanjima, tabele mogu biti obradne, analiticke
i publikacione.

9. GRAFICKO PRIKAZIVANJE

To je metod prikazivanja grupisanih i tabeliranih podataka u vizuelnom obliku. Mnogo


lakse i brze se uocavaju rezultati grupisanja pomocu grafickog prikazivanja jer je
poredjenje velicina pomocu slika jasnije nego pomocu brojki.

Graficki prikazi se dele u 2 grupe, u zavisnosti da li se stat.podaci prikazuju 1.oznakama i


simbolima, ili 2.geometrijskim oblicima.

1. su: kartogrami i simbolicki crtezi 2. su: dijagrami.

Dijagrami prema nacinu prikazivanja mogu biti: tackasti, linijski, povrsinski i prostorni.

Linijski: poligon frekvenci, kriva frekvenci, vremenski linijski, stapicasti, kumulativni i


polarni dijagram.

Povrsinski-pruzaju sire mogucnosti prikazivanja podataka jer imaju 2 dimenzije. To su:


stubicasti dijagram, histogram frekvenci, kruzni dijagram, pravougaoni dijagram.

Prostorni dijagrami = stereogram. U 3 dimenzije, ali retko se koriste jer su komplikovani.

Dijagrami se konstruisu u pravouglom, polarnom i ugaonom sistemu.


Pravougli: apscisa (x) i ordinata (y), koordinatni pocetak (0), 4 kvadranta.

Polarni: poluprave(radijusi) idu iz jednog centra zrakasto u sve pravce. Merna skala,
horizontalna (polarna osa). Zaklapaju ugao α.

Ugaoni: ugao α zaklapaju 2 poluprecnika. Konstruise se kruzni dijagram.

Na brojne ose nanose se erne skale: aritmeticka (iste razlike u velicini, npr. 3-4, 5-6, 10-
15, 20-25) i logaritamska (nisu iste razlike u velicini, npr. 1-10, 10-100, 100-1000 ili 2-4,
4-8, 8-16).

Izbor dijagrama zavisi od vrste obelezja, prirode pojave i cilja istrazivanja.

6
7

Histogram frekvenci – za prikazivanje stanja distribucije frekvecni nekog numerickog


kontin.obelezja. Konstruise se u 90 sistemu, x, f.

Poligon frekvenci – prikazuje stanje numerickih kontin. i diskont.obelezja. Grupni


intervali tj.grupe na x; f. Dobija se izlomljena, poligonalna linija. Linijski dg.

Kriva frekvenci – prikazuju se iskljucivo kontinuirana obelezja. Dobija se kontinuirana,


glatka, kriva linija. Linijski dg u pravouglom k.s.

Kumulativni dijagram – prikazuju se sukcesivni zbirovi frkvenci nekog obelezja. Dobija


se izlomljena linija koja raste ili opada prema frekvencama. Linijski dg u pravouglom k.s.

Vremenski linijski dijagram – za prikazivanje 1+ pojava u vremenu. Znacajan je za


prognozu daljeg toka posmatrane pojave. Linijski dg u pravouglom k.s.

Stapicasti – stanje jednog diskontin.numer.obelezja. Linijski dg u pravouglom k.s.

Stubicasti – za prikaz. 1+ atribut.obelezja. Povrstinski dg u pravouglom k.s.


Pravougaonici su medjusobno razdvojeni po obelezjima.

Kruzni – odnos dela prema celini. Povrsinski dg, ugaoni sistem.

Polarni – prikazivanje kretanja nekih pojava u vremenu. To su ciklicne pojave. Linijski


dg u polarnom k.s.

10. RELATIVNI BROJEVI

To su stat.parametri koji omogucuju poredjenje pojava, bez obzira na njihov intenzitet.


Mogu se izracunati samo ako se znaju bar 2 apsolutna broja koja su u nekoj vezi. To je
kolicnik vrednosti koja se uporedjuje i vrednosti sa kojom se uporedjuje. Izrazava se %.
Na isti nacin, pomocu Rb, moze se definisati i proporcija.

Postoje 3 vrste Rb: pokazatelji strukture, indexi i stat.koeficijenti.

Pokazatelj strukture (kvota) - odnos delova prema celini.

Indexi –uporedjuje se obim ili nivo dve istoimene pojave.

Stat.koeficijentima se uporedjuju obim ili nivo 2 raznoimene pojave, gde bar 1 mora biti
masovna. (mortalitet, natalitet)

11. MERE CENTRALNE TENDENCIJE

7
8

To su prosecne ili najkarakteristicnije vrednosti jednog stat.skupa. To je jedna vrednost


koja kao reprezentativna zamenjuje sve ostale. Sve se izrazavaju u apsolutim vrednostima
(ne u %). Postoje dve grupe:

1. racunske (matematicke) –formulom. Na njih uticu extremne vrednosti.


ARITM.SRED.

2. pozicione – odredjuju se prema mestu koje zauzimaju u skupu. Na njih ne uticu


extremne vrednosti. MED, MOD.

12. ARITMETICKA SREDINA

x (x bar, x srednje) predstavlja kolicnik zbira vrednosti obeležja posmatranja svake


jedinice posmatranja i velicine statistickog skupa tj.ukupnog broja jed.posmatranja.

Izracunavanje:

a) za negrupisane podatke

b) za grupisane podatke

Aritmeticka sredina može se racunati i za proporciju i procente.

Ona moze da reprezentuje samo homogeni stat.skup (varijabilitet <30%), gde nema
velikih odstupanja vrednosti obel.posmatranja. Na nju utice svaka vrednost ob.posm.a
posebno extremne vrednosti! Zbog toga, ona nije dobar reprezent proseka ako je skup
heterogen.

13. MEDIJANA

Medijana ili centralna vrednost je srednja vrednost po polozaju. Odgovara sredini niza
jed.posm. uredjenom po velicini. ME ili MED.

Medijana ne zavisi od vrednosti, vec od broja obel.posmatranja. Ne uticu extremne


vrednosti.

Kako se odredjuje MED:

1. uredjivanje niza – rastucim ili opadajucim redosledom.


2. odredjivanje mesta medijane – odredjivanje jed.posm. koja se u tako uredjenom nizu
nalazi u sredini.
3. ocitavanje (za negrupisane ili grupisane podatke ili izracunavanje medijane)

Ako je niz podataka PARAN, Med se racuna kao aritmeticka sredina srednje 2
jed.posmatranja.

8
9

Ako je niz podataka NEPARAN, vrednost medijane se ocitava direktno nakon


odredjivanja mesta medijane (procita se srednji clan niza).

14. MOD

Mod ili tipicna srednja vrednost je vrednost obeležja posmatranja kojoj odgovara najveci
broj jedinica posmatranja. To je vrednost koja se najcešce javlja , tj. ima najvecu
ucestalost (f).

MOD zavisi iskljucivo od ucestalosti; na njega ne uticu extremne vrednosti.

15. ODNOS MERA CENTRALNE TENDENCIJE

- Kada su jed.posm. pravilno i simetricno rasporedjene, mere centr.tendencije se


poklapaju, tj.imaju iste jednake iznose.

- Kada su asimetricno rasporedjene, srednje vrednosti imaju razlicite iznose i nalaze se u


takvom odnosu gde je Med uvek izmedju Mo i x.

- Kod umereno asimetricnih raspodela, Med je na trecini puta od x ka Mo. Kada se


poznaju 2 srednje vrednosti, moze se odrediti treca: MOD = 3Med – 2x.

16. MERE VARIJABILITETA

Varijabilitet je promenljivost obeležja posmatranja od jedinice do jedinice posmatranja.


Odstupanje vrednosti od centralne tendencije naziva se disperzija , disocijacija ili
rasturanje. Parametri koji pokazuju gustinu grupisanja ili odstupanja pojedinih vrednosti
obeležja posmatranja od aritmeticke sredine su :

A. apsolutne mere varijabiliteta (interval varijacije, standardna devijacija i varijansa)

B. relativne mere varijabiliteta ( koeficijent varijacije i standardizovana z vrednost)

C. specificne (standardna greska i kovarijansa SDxy)

Interval varijacije (I) –raspon, daje informacije samo o extremnim vrednostima.


Standardna devijacija (SD) je pozitivna vrednost korena varijanse
Varijansa (SD²) je prosecno standardno odstupanje od aritmeticke sredine

Koeficijent varijacije (CV) je standardna devijacija izražena u % aritmeticke sredine.


Predstavlja meru homogenosti. Skup je homogen ako je CV < 30%. Varijabilitet je manji
sto je manji CV.

Standardizovana z vrednost je standardizovano odstupanje od aritmeticke sredine


izraženo u delovima standardne devijacije. Daje informaciju o odnosu jedinice
posmatranja prema skupu.

9
10

Standardna greska (SE) je najvažnija mera varijabiliteta u okviru analitike.


Kovarijansa je mera zajednickog varijabiliteta 2 obel.posmatranja.

17. INTERVAL VARIJACIJE

To je raspon od najmanje do najvece vrednosti ob.posm. I = max-min

Dobija se kao razlika max i min vrednosti. Daje uvid SAMO o extremnim vrednostima
obelezja, dok o varijabilitetu i grupisanju oko srednje vrednosti, ne daje nikakve info. Sto
je vec broj jed.posm, veci je raspon krajnjih vrednosti.

18. STANDARDNA DEVIJACIJA

To je mera varijabiliteta koja se najcesce upotrebljava, ima najsiru primenu. Meri se


odstupanje vrednosti ob.posm.od aritm.sredine, tj.gustina grupisanja oko aritm.sredine.

Sto je vrednost SD manja, manje je odstupanje od aritm.sred, tj.manji je varijabilitet a vec


gustina grupisanja oko aritm.sred.

SD je pozitivna vrednost korena iz varijanse!

Varijansa (SD²) je srednje kvadratno odstupanje od aritm.sredine. Za grupisane i


negrupisane podatke, za proporcije tj.procente. P je proporcija ocekivanog dogadjaja, a Q
je suprotni dogadjaj.

19. KOEFICIJENT VARIJACIJE

To je relativna mera varijabiliteta. To je kolicnik SD i X. Obicno Se izrazava u %. Znaci,


CV je SD izrazena u % aritm.sredine. CV je manji sto je SD manja u odnosu na x.
CV se koristi kao mera homogenosti! Homogenost neke pojave je veca ukoliko je CV
manji.
CV<30% homogena pojava
CV>30% heterogena
CV se koristi kada zelimo da utvrdimo u kom obelezju i koja grupa varira.

20. ZED VREDNOST

Varijabilitet se moze ocenjivati i sa gledista individualnih podataka, ne samo sa gledista


distribucije frekv.kao celine.

Zed vrednost je relat.mera varijabiliteta, izrazava se kao decimalni broj! To je odstupanje


jedne vrednosti ob.posm. od njegove aritm.sredine izrazeno u delovima SD.

10
11

Daje informaciju o odnosu jedinice posm.prema skupu (osnovnom ili uzorku). Koristi se
za odredjivanje polozaja rezultata u grupi.

21. POREDJENJE VARIJABILITETA

Procena varijabiliteta neke pojave vrsi se na osnovu odnosa x i SD.

Ako se uporedjuje varijabilitet 2 pojave, postoje sledece mogucnosti:

x=y, SDx=SDy varij.je isti

x=y, SDx ≠SDy varij.je manji tamo gde je manja SD

x≠y, SDx=SDy varij.je manji tamo gde je veca x

x≠y, SDx≠SDy racuna se CV (CV↓, varij. ↓, ↑homogenost) ili z vrednost (↓z, ↓ varij.)

22. MERE OBLIKA RASPODELA FREKVENCIJA

Raspodele frekvenci mogu biti pravilne (simetricne) i nepravilne (deformisane).

Pravilne se karakterisu nagomilavanjem jed.posm.oko sredine intervala variranja


tj.simetricna ucestalost levo i desno od x.

Deformacija moze biti u smislu asimetrije(nagnutosti) ili u smislu spljostenosti (kurtoze).

Asimetrija je nagomilavanje jed.posm.levo(-) ili desno(+) od x.

Spljostenost zavisi od stepena strmine srednjeg dela krive.


Osnovni parametri oblika rasporedele frekvenci su koeficijent asimetrije (α3) i koeficijent
spljostenosti (α4).

23. STATISTICKA ANALIZA

To je poslednja faza stat.obrade i celokupnog istrazivanja.

To je matem-logicki postupak donosenja ZAKLJUCKA o problemu istrazivanja, na


osnovu rezultata.

Primena svakog analit.metoda rezultira donosenjem stat.zakljucka. Na osnovu


stat.zakljucka donosi se strucni zakljucak.

11
12

Zakljucci o problemu istrazivanja donose se najcesce na osnovu ispitivana uzorka.


Aproslutna tacnost ne postoji, jer zakljucci uvek sa sobom nose mogucnost manje ili vece
GRESKE. Sigurnost garantuje unapred zaracunata max dozvoljena greska u
zakljucivanju.

Pojmovi bitni za razumevanje nacina zakljucivanja su: verovatnoca sigurnosti,


verovatnoca greske i nivo znacajnosti.

Verovatnoca sigurnosti govori u prilog zakljucku-ona garantuje ispravnost donetog


zakljucka.

Verovatnoca greske (rizika) je max verovatnoca dopustive greske.

Ove dve verovatnoce se dopunjuju do vrednosti ukupne verovatnoce (1 ili 100%).

Nivo znacajnosti je komplementarni odnost ove dve verovatnoce. Utvrdjena su 2 nivoa


znacajnosti:

-nivo znac. sa max. dozv.greskom (5%) i verovatnocom sigurnosti (95%). Zakljucak je


stat.ZNACAJAN.

-nivo znac. sa verov.greske (1%) i verov.sigurnosti (99%). Zakljucak je stat.VISOKO


ZNACAJAN.

STEPEN SLOBODE (DF) =broj slobodno varirajucih clanova jednog niza stat.podataka.

DF=r-s (r – broj clanova niza, s – faktor koji omogucava njihovo slobodno variranje)

Upotreba DF: t i z test, x², Fisher, Medijan test, McN, jednostruka lin.povezanost,
Spirmanova korelacija.

U odnosu na cilj i nacin zakljucivanja, razlikuju se 2 tipa stat.analize: ocenjivanje karakt.


osnovnog skupa i ispitivanje stat.hipoteza.

Ocenjivanje karakt.osnovnog skupa procenjuje se metodom INTERVALA POVERENJA.

Ispitivanje hipoteze vrsi se stat.testovima.

Stat.metodi koji se koriste u stat.analizi zovu se stat.analit.metodi. Mogu biti paramet. i


neparamet.

24. ISPITIVANJE HIPOTEZE

12
13

Hipoteza je pretpostavka koja zahteva dokazivanje th.donosenje zakljucka kojim se ona


odbacuje ili prihvata. Hipoteze se proveravaju na osnovu podataka iz uzorka a zakljucci
se generalizuju na osnovni skup.

Nulta hipoteza (Ho) cilj je da bude odbacena jer ima pretpostavku koja je pogresna.
Testira se zbog moguceg donosenja pogresnog zakljucka. (nikotin nije stetan po zdravlje)

Radna hipoteza (H1) cilj je da bude prihvacena, jer sadrzi pretpostavku koja je po
misljenju istrazivaca tacna. (nikotin je stetan po zdravlje)

Prihvatanjem Ho odbacuje se H1 i donosi zakljucak koji je uslovljen znacenjem Ho, i


obrnuto.

Hipoteze mogu biti dvosmerne (zanemaruje se smer variranja pojave) i jednosmerne


(bitan je smer variranja pojave, manje,vece).

Testiranje hipoteze ima 6 etapa:

1. formulisanje Ho i H1

2. odredjivanje nivoa znacajnosti (α)

3. izbor adekvatnog testa

4. izracunavanje empirijske vrednosti testa

5. odredjivanje oblasti odbacivanja Ho (granicne grednosti), odredjivanje teorijske


vrednosti
6. donosenje stat.zakljucka (uporedjivanje emp.i teor.vrednosti)

Nivo znacajnosti (α) je max verovatnoca greske I tipa koju je istrazivac spreman da
prihvati.

Izbor vrste metoda (parametarski cv<30% i neparametarski) uslovljen je ciljem hipoteze


(da li postoji razlika ili povezanost).

Empirijska vrednost dobija se izracunavanjem na osnovu podataka iz uzorka.

Teorijska vrednost se zasniva na Ho.

Odredjuje se oblast prihvatanja i oblast odbacivanja Ho (kriticne oblasti). Kriticne


granice su granice intervala prihvatanja Ho.

Zakljucak se donosi poredjenjem emp. i teor.vrednosti:

Ze>Zt H1ima statist. (visoko) znac.razlike Ze<Zt H0 nema znac.razlike

13
14

25. GRESKE U ZAKLJUCIVANJU

Posto se zakljucci baziraju na informaciji iz uzorka, pri ispitivanju hipoteza tj. njihove
ispravnosti uvek je prisutan odredjeni stepen rizika(greske). Zbog toga, postupak procene
ispravnosti hipoteza ima 4 ishoda- 2 pravilna, 2 nepravilna.

Ispravan zakljucak: kad se prihvati tacna ili odbaci netacna Ho. Pogresan zakljucak: kad
se odbaci tacna ili prihvati pogresna Ho.

Postoje dve vrste grešaka koje se medjusobno iskljucuju, tj samo je jedna moguca:
-greška I reda-ako odbacimo tacnu H0, α
-greška II reda-ako usvojimo pogresnu H0. β

Znacajnija je greška I tipa jer odbacujemo nešto što je u suštini tacno.

*Standardna greska = greska koja se pravi pri zakljucivanju o osn.skupu na osnovu


uzorka. Ona prikazuje razliku stvarne i hipoteticke vrednosti.

α i β su zavisn greske, ali nisu komplementarne. One se ne dopunjuju do 1. Znaci, ako se


poveca jedna, smanjice se druga. Najbolji nacin da se verovatnoca javljanja greske smanji je
povecanje velicine uzorka.

SE = sd / √n ↑uzorak, ↓greska --> ↓SE

26. JACINA, EFIKASNOST I OSETLJIVOST METODA

Jacina metoda (π) je max mogucnost metoda da garantuje ispravnost zakljucka,


tj.sposobnost metoda da otkrije pogresnu hipotezu. Meri se nivoom verovatnoce odbacivanja
pogresne Ho.

↑uzorak ↑jacine metoda

Jacina je obrnuto proporcionalna greski II tipa: β+π = 1

Efikasnost je relativna jacina metoda. Dobija se poredjenjem jacine jednog metoda sa


jacinom drugog metoda. Efikasnost se procenjuje na osnovu odnosa velicina uzoraka bilo
koja 2 uporedjena metoda: nA/nB.

metod A je efikasniji od metoda B ako je e>1

Osetljivost pokazuje ponasanje metoda u uslovima razlicitog stepena narusenosti


pretpostavki o osn.skupu iz koga poticu uzorci.

14
15

27. ANALITICKI METODI

Specificni stat.metodi koji se koriste u stat.analizi zovu se stat.analit.metodi.

Postoje 2 podele, prema cilju i prema uslovima primene metoda.

-Prema cilju primene: 1. am za procenu parametara osnovnog skupa

(interval poverenja)

2.am za procenu slicnosti oblika rasporedela

(par: deskriptivni param.teor.modela; nepar: X² test)

3.am za procenu razlike


(par: z i t test; nepar: X², Fisher, Medijan, McN, t.predznaka, t.ekvival.parova, t.sume
rangova)

4.am za procenu paralelizma tj povezanosti i zavisnosti (korelacija,regresija, Spirman)

-Prema uslovima primene: 1. paramet. 2. neparamet.

PARAMETARSKI METODI

-Podaci su numericka obelezja (ocenjivanjem, prebrojavanjem,merenjem)

-uslov: podaci paramet.homogenog karaktera (CV<30%) i normalna raspodela

-mogu se izracunati x, sd, sd², p

NEPARAMETARSKI METODI

-zahtevaju samo kontinuiranost raspodele osn.skupa

-Primenjuju se onda kada ne mogu paramet.analit.metodi.

-Emp.podaci: atributivni, numericki podeljeni na kategorije

-Podaci su heterogenog karaktera (CV>30%)

-ovim metodama, procenjuje se znacajnost ispitivane pojave na osnovu: medijane, apsolutnih


ucestalosti i rangova.

Parametarske treba primenjivati obavezno, pod uslovom da su uslovi za njihovu primenu


ispunjeni. U svim drugim situacijama koristi se odgovarajuci neparam.metod.

15
16

*Interval poverenja – je brojni interval pomocu koga se procenjuju parametri osn.skupa na


osnovu ocena istih parametara iz uzorka (za odredjeni nivo verovatnoce sigurnosti).

Pomocu njega se ocenjuju aritm.sred. x, proporcija p i broj ljudi u osn.skupu N).

U sastav intervala ulaze: posmatrani parametri (npr.x), faktor sigurnosti (t) i stand.greska
(SE).

28. VEROVATNOCA

Teorija verovatnoce bavi se verovatnim tj. slucajnim dogadjajem.

Slucajan dogadjaj je dogadjaj koji se u datim uslovima i u datom momentu moze ocekivati ali
se ne mora nuzno i ostvariti.

Mera ocekivanja dogadjaja (mera slucajnosti) naziva se verovatnoca.

Moze se definisati i izracunati na vise nacina:

1. Teorijska (a priori, odredjuje se unapred) odnos broja ocek.ishoda prema broju svih
mogucih ishoda. ocek/mog

2. Statisticka (a posteriori, odredjuje se na osnovu rezultata istraz.) odnos broja ostvarenih


ocek. ishoda prema mogucih ishoda. ostvar/mog

Zakon a priori se priblizava a posteriori verovatnoci kada br.experimenata raste!

3. Subjektivna – stepen uverenja o realizaciji ocek.dog. koji ima strucnjak. Formira se za


dogadjaje koji se javljaju samo jedanput, ili se ponavljaju.

Sva tri tipa predstavljaju odnos dela prema celini i izracunavaju se po istoj fromuli, kao
kolicnik dela prema celini: m/n = f/n = p

Osobine verovatnoce:

1. Nenegativnost. Verovatnoca svakog dogadjaja je nenegativan broj P≥0 (min vr.=0,


nece se desiti)

2. Normiranost. Max.verovatnoca slucajnog dogadjaja je 1. P≤1 (max vr.=1, 100% ce se


desiti)

3. Aditivnost. Ukupna verov.dog. jednaka je sumi verov.mogucih odnosno ostvarenih


dog.P = ∑P

Verov.dog.koji je predmet istraz. je verov.OCEKIVANOG dog. (p)

Verov.dog.koji nije pred.istraz. je verov.SUPROTNOG dog. (q)

16
17

p i q su komplementarni i dopunjuju se do 1, tj. p+q=1=100%

 prosta verov. – racunamo verov.pojedinacnih ishoda

 slozena ver. – dogadjaj je sastavljen iz nekoliko pojed.ishoda

p≥0 nenegativnost p=0 nemoguc dogadjaj

p≤1 normiranost p=1 siguran dogadjaj

29. TEORIJSKE RASPODELE (?)

-su specificni matemat.modeli raspodela verovatnoca. To su raspodele javljanja


podjednako mogucih ishoda slucaj.dogadjaja.

Teor.raspodele formiraju se primenom teorije verovatnoce na slozene sluc.dogadjaje.


Uslov za formiranje teor.raspodele je slozenost sluc.dog. (koja je posledica ili ponavljanja
postupaka ili umnozavanja predmeta).

Prema tome, jedan slozeni sluc.dog.sastoji se od min 2 do n prostih sluc.dog.

Postoji: - normalna raspodela (kontinuirane) - binomna raspodela (prekidne promenljive)

30. BINOMNA RASPODELA

-je osnovni model teorijskih rasporedela. To je raspored verovatnoca vrednosti prekidne


binomne promenljive.

Binomna raspodela moze se formirati na 2 nacina: primenom f-je verovatnoca i


primenom razvijenog Njutnovog binoma.Primenom f-je ver.raspodela se dobija
sabiranjem parcijalnih binomnih verovatnoca. Binomcine parcijalne komplementarne
verovatnoce ocek.i sluc.dogadjaja, a exponent(stepen) binoma je uvek ceo broj.

Binomna raspodela je prekidna raspodela jer slucajna promenljiva moze da uzima samo
cele brojeve. Verovatnoce u bin.rasp. su nenegativni brojevi, a suma svih verovatnoca je
1.

S povecanjem broja prostih dogadjaja komplikuje se izracunavanje bin.rasp.

Bin.rasp.je difinisana sa 2 parametra, n i p. Ako je p=0.5 raspodela je simetricna (retko),


ako je p<0.5 onda je asimtricna ulevo.

17
18

31. NORMALNA RASPODELA

-unimodalna, simetricna kriva, krajevi su na apscisi. ona je pozitivna, neprekidna

- Predstavljena je Gausovim zvonom; povrsina ispod zvona predstavlja verovatnocu od 1


(100%)

- Standardna normalna raspodela: tacno odredjen oblik norm.raspodele x=o sd = ±1.


Moze se izracunati verovatnoca 1 povrsine preko Zed vrednosti.

Norm.rasp. je model teor.rasp.; to je kontinuirana raspodela, cije ob.posm.mora biti


numericko kontinuirano, da bi moglo da se ponasa po normalnoj raspodeli. Ako je
CV<30% to je nomalna raspodela i onda se rade parametarski testovi.

Osobine norm.raspodele:

- kontinuiranost (obelezje je numericko kontinuirano)

- graficki prikaz predstavlja Gausovo zvono

Sve 3 mere centralne tendencije se poklapaju (jednake su): x=Med=Mod.

izmedju x i 1 sd --> 68% Gausovog zvona (podataka)

izmedju x i 2 sd --> 95% G.zvona

izmedju x i 3 sd --> 99%

Ukupna povrsina ispod krive iznosi 1 (100%).

32. PARAMETARSKI METODI ZA ISPITIVANJE RAZLIKE

To su Zed test i T test.


Podaci obelezja posmatranja oba testa moraju biti parametarski i kvantitativni
(numericki).

33. ZED TEST


Zed test je parametarski anal.metod za procenu znac.razl. parametarskih homogenih
vrednosti ob.posmatranja 2 grupe podataka.

Zed test je baziran na karakteristikama standardne norm.raspodele i standardne zed


vrednosti. Zed test – sd mora biti poznata.

Sa porastom velicine uzorka, raspodela x tezi normalnoj. Osnovni skup ne mora imati
norm.raspodelu, ako je uzorak koji se ispituje dovoljno veliki. Dovoljno velikim
uzorcima smatraju se uzorci sa n >30 ob.posm.

18
19

Koristi se za procenu znac.razl.2 osn.skupa, osn.skupa i uzorka i vezanih i nevezanih


uzoraka.

Empir.vrednost Zed testa iz dobija izracunavanjem,a teorijska iz tabele; uporedjuju se.

Ze<Zt Ho NSZR , Ze>Zt H1 p<0.05 SZR, p<0.01 VSZR

34. T TEST

-parametarski stat.analit.metod za procenu znac.razlike 2 grupe parametarskih homogenih


podataka.. Znaci, obelezje posm.mora biti paramet.homogeno (CV≤30%).

Moze se koristiti u vise experimentalnih situacija:

1. za testiranje znac.razlike izmedju aritm.sredina osn.skupa i uzorka

2. za testiranje zn.razl. izmedju aritm.sredina 2 mala nevezana uzorka

3. za testiranje znac.razl izmedju aritm.sredina 2 velika nevezana uzorka

4. za vezani uzorak (nezavisno od velicine)

5. za proporcije

Nevezani uzorci: kada imamo 2 grupe ispitanika

Vezani uzorak: imamo 1 grupu ispit. u 2 vremena ili 2 experiment.situacije

Empirijsku vrednost t testa poredimo sa teorijskom koju citamo iz tablice za t test za


odgovarajuci nivo sigurnosti. Poterban nam je DF (to je broj slobodno varirajucih
clanova niza). Teorijska vrednost je max.vrednost testa za koju jos uvek vazi Ho.

Postupak pri radu:


-odrediti obelezje posmatranja (sta je i kakvo je)
-odrediti test koji koristimo
- definisati Ho i H1
- ispisati formule
- preko formula se dobije empir.vrednost testa
- poredimo emp.sa teor.vrednoscu
- donosimo zakljucak.
Podaci: parametarski, dobijeni ocenjivanjem, prebrojavanjem i merenjem.

35. NEPARAMETARSKI METODI ZA ISPITIVANJE RAZLIKE χ²


test, test tacne verovatnoce (Fisher), Medijan test, McN, test ekvivalentnih parova
(Wilcoxon), test sume rangova (Mann Whitney).

19
20

36. χ² TEST

-neparametarski stat.analit.metod za procenu znacajnosti razlike UCESTALOSTI


atributivnih ili numerickih obelezja posmatranja.

Koristi se ISKLJUCIVO za nevezane uzorke!

Postoje 2 tipa χ² test:

1. testovi slaganja 2. testovi kontingencije


Testove slaganja koristimo kada ispitujemo saglasnost nasih rezultata sa nekom
hipotetickom raspodelom (npr.onim sto pise u literaturi-da li se nase ispitivanje slaze sa
onim sto je vec neko drugi uradio). Imamo 1 grupu ispitanika i 1 obelezje posmatranja.
Kod tablica kontingencije imamo 2 grupe ispitanika – procenjujemo znacajnost razlike
ucestalosti 1 obel.posmatranja u 2 ili vise nevezanih uzoraka.

Numericka ogranicenja za primenu ovog testa (kada on ne moze da se koristi,nego drugi


testovi):

1. ako je ukupna ucestalost n<20


2. ako je uk.ucest. 20<n<40, nijedna teorijska (ocekivana)frekvenca ne sme biti <5

U ova dva slucaja koristi se FISHEROV TEST TACNE VEROVATNOCE

3. ako je n>40 radi se χ² test

37. TEST TACNE VEROVATNOCE (FISHER)

-neparametarski stat.analit.metod za procenu znac.razl.ucestalosti dihotomnog obelezja


posmatranja izmedju 2 mala nevezana uzorka. Primenjuje se iskljucivo na tablice
kontingencije 2x2, i to u situacijama kada zbog numerickih ogranicenja ne mozemo da
primenimo χ² test.

Fisherov test nije zamena za χ², vec pokriva ona podrucja koja χ² ne moze:

1. n<20 2. 20<n<40

Fisher je jedini analit.metod cija empir.vred.ujedno predstavlja i tacnu vrednost


verovatnoce, pa se zato zove test tacne verovatnoce Ho.

38. MEDIJAN TEST

-neparametarski stat.anal.metod za procenu znac.razl. ucestalosti gradacija dihotomnih


heterogenih vrednosti obl.posm. 2 ili vise nezavisnih uzoraka.

20
21

Primena testa ne zavisi od simetricnosti raspodele osn.skupa. Zbog heterogenosti


empir.podataka, kao deskriptivni parametri nezav.uzoraka mogu se koristiti njihove
medijane. Prema tome, rad medijan testa zasniva se na pretpostavci o zajednickoj
medijani nezav.uzoraka!

39. McNEMAROV TEST

-neparametarski stat.analit.metod za procenu znac.razl.ucestalosti dihotomnih gradacija


obelezja posmatranja vezanog uzorka. Ovaj test testira znacajnost promene. Primenjuje
se iskljucivo na tablicu kontingencije 2x2. DF je uvek 1.

Dihotomne gradacije se obelezavaju sa + i – (dobro lose, ima nema, jeste nije,...)/


1.tretman(1.vreme)

Ob.posm.su atributivnog karaktera; na numericka ob.posm.moze se primeniti samo za


brzu informaciju.

Sastoji se iz: odredjivanju validnih empir.ucestalosti, izracunavanju teor.ucestalosti i


izrac. empir.vrednosti testa.

Ovim testom dobijaju se 4 vezane empir.frekvencije.

Za izracun.empir.vrednosti McN preporucuje se upotreba Jetsove korekcije. Ona je


obavezna ako je ukupan broj ucestalosti ≤20.

40. TEST EKVIVALENTNIH PAROVA (WILCOXON)

1 skup 1 uzorak 1 grupa ispit.

-neparametarski stat.analit.metod za procenu znac.razl. heterogenih podataka za vezani


uzorak.

1. izracuna se d (razlika pre-posle)


2. rangiranje apsolutnih vrednosti d
3. formiranje 2 sume rangova: pozitivnih i negativnih
4. suma koja je po aps.vrednosti manja, to je empir.vrednost modela (ako je
br.jed.posm.<25)

Empir.vrednost se tumaci iz tablica, za broj validnih jedinica posmatranja. (d=0, to se


izbacuje)

21
22

41. TEST SUME RANGOVA (MANN WHITNEY-EV TEST)

-neparametarski stat.anal.metod za procenu znac.razl.parametarskih heterogenih podataka


izmedju 2 nezavisna uzorka. Postupak:

1. poredjati po velicini sve jed.posm.iz oba uzorka


2. vrsimo zajednicko rangiranje – dodavanje rednog broja uredjenom nizu
3. za svaki uzorak formiramo njegovu sumu rangova
4. u zavisnosti od uk.br.jed.posm, do empir.vrednosti dolazimo na 2 nacina:

1. transformacijom i 2. standardizacijom

42. JEDNOSTRUKA LINEARNA POVEZANOST (linearna regresija)

Ovim metodom ispituje se stepen povezanosti 2 ob.posm. (nezavisno promenlj.x i


zav.prom y).

Primenjuje se samo ako su podaci paramet.karaktera (numericki i homogeni)!

Ispitivanje ovog odnosa pocinje pravljenjem dijagrama rasturanja, cime se zakljucuje da


hipoteza o linearnoj povezanosti ima osnova, dalje se pristupa odredjivanju stepena
povezanosti-koeficijenotm lin.korelacije (rxy).

SDxy je kovarijansa ili mera paralelizma; mera zajednickog varijabiliteta ove


promenljive.

Empir.vrednost metoda uporedjuje se sa teor.(cita se iz tablice na osnovu DF i


verov.rizika). Ukoliko se pokaze visoko znacajna ili znacajna povezanost promenljivih
velicina, pristupa se odredjivanju linije regresije.To je prava koja pokazuje prosecan
odnos nezavisno prom.i zavisno promenljive(x i y)

To je najbolji oblik paralelizma koja daje jasnu sliku medjus.odnosa ob.posm. Ona
omogucava da se procene nepoznate vrednosti jedne promenljive na osnovu vrednosti
druge promenljive, u granicama brojnog intervala.

y = a+bx

43. LINEARNI TREND

- linearna regresija u kojoj je nezavisna varijabla uvek vreme (godina, mesec, dan).
Vrem.jedinice se izrazavaju numericki. Zbir novih num.vrednosti je 0 i razmaci izmedju
kodova moraju biti jednaki.

22
23

Dalje je isti postupak kao kod lin.regresije – crta se prava, koja se zove linija trenda. Ona
omogucava predvidjanje za buduce vremenske itntervale!

44. KORELACIJA RANGA (SPIRMAN)

-neparametarski anal.metod za procenu povezanosti, analog je Pirsonovom testu!

- Manje je pouzdan od paramet.korelacionih metoda; koristi se samo ako ne sme biti


primenjen paramet.korel.metod.

Obavezno se koristi: - kad su podaci neparamet. (atributivni ili numer.nejasno definisani)

- parametarski heterogeni (CV>30%)

INFORMATIKA: Hardver (tehnička osnova računarskog sistema, oprema) predstavlja


fizički deo (mehanički i elektronski) računarskog sistema, koji obuhvata centralnu jedinicu,
uređaje za skladištenje, uređaje za ulaz i izlaz i sredstva za razmenu i prenos podataka na
daljinu.
Softver (programi za rad računarskog sistema)- rutine i metode koje izvršava računarski
sistem a vezane su za organizovanje, upravljanje, obrađivanje i korišćenje rezultata obrade
podataka i informacija.

23

You might also like