You are on page 1of 38

DESKRIPTIVNA STATISTIKA

TA MORAMO SAVLADATI?
Mjere centralne tendencije
Mjere varijabilnosti Procjenu i znaaj distribucije

PRIMJER: Godine ispitanika

ta su to mjere centralne tendencije?


kljuna svrha upotrebe mjera centralne tendencije u drutvenim naukama.

statistiki parametri - sve vrijednosti jednog numerikog niza (varijable) se centriraju i iskazuju posredstvom odreene (jedne) numerike vrijednosti

Redukcionizam - singularni numeriki izraz

Aritmetika sredina
prosjek Dakle, aritmetika sredina kontinuiranog niza brojeva. predstavlja prosjenu vrijednost nekog

drutvene nauke - prosjene karakteristike populacije ili uzorka. DEFINICIJA: Aritmetika sredina nekog seta kvantitativnih podataka (numerikog niza) jeste suma svih vrijednosti podijeljena sa ukupnim brojem objekata od kojih se set podataka sastoji:

Napomena: Simbol se koristi kada se oznaava aritmetika sredina uzorka, dok se simbol koristi kada je re o populaciji

Aritmetika sredina: interpretacija, pouzdanost i smisao


Npr. Ako koemo da su ispitanici u naem uzorku stari u prosjeku 44,5 godina to znai da
Dva su kljuna faktora od kojih zavisi preciznost ovog podatka (aritmetike sredine) 1. Od veliine uzorka 2. Od varijabilnosti tj. opsega (rasprostranjenosti)

MEDIJANA
Medijana, takoe, jeste neka vrsta prosjene vrijednosti Nije prosjek, ve samo jednostavno medijana DEFINICIJA: Medijana nekog kvantitativnog seta podataka jeste srednji broj u situaciji kada se sve vrijednosti poreaju od najnie do najvie ili obrnuto Ukoliko je niz brojeva neparan, onda je medijana broj u sredini. Ukoliko je broj paran, onda je medijana srednja vrijednost srednja dva broja.

Medijana primjer
Pr.1. Ako se varijabla sastoji od 7 brojeva 5,7,4,5,20,6 i 2 onda se medijana izraunava: 2,4,5,5,6,7,20 krajeva M=5 (broj u sredini posmatrano s

Pr.2. Ukoliko je pak varijabla sa parnim brojem brojeva (n=6) , npr. varijabla 4,5,5,6,7,20 onda se medijana izraunava: 4,5,5,6,7,20 M = (5+6)/2 = 5.5

Medijana: interpretacija, pouzdanost i smisao


U nekim situacijama medijana je bolja mjera centralne tendencije u odnosu na aritmetiku sredinu. Zato? Neke varijable u drutvenim istraivanjima su naroito pogodne za medijanu, npr. prihod iskazan u intervalnoj skali. Prosjek zarada aritmetika sredina ili medijana? Medijana je, takoe, pogodna kada se koriste ljestvice procjene, a i zgodnija je za interpretaciju.

Modus
Modus najea vrijednost koja se pojavljuje u jednom setu brojeva. Npr. ako je set brojeva: 3,4,6,1,8,8,9,3,4,6,8,2,3,8,8,0,9,8,4,5,6,8,3,3,4,7,8,9,8 ,0,8,5,8, Onda je modus = 8, dakle, broj koji se najvie puta pojavio u nizu.

Znaaj i upotreba modusa


U zavisnosti od prirode podataka modus moe biti manje ili vie korisna mjera centralne tendencije U naem primjeru da u uzorku ima najvie ispitanika koji imaju 21 godinu, taj podatkak nam i ne govori mnogo. Meutim, ako pogledamo grafik primijetiemo da je distribucija neravnomjerna upravo u ovom sektoru, tanije kod mlae kategorije ispitanika

Primjer upotrebe modusa


U istraivanjima se nerijetko koriste likertove ljestvice procjene koje imaju vrijednosti npr.: veome dobro, dobro, loe i veoma loe. petostepena skala: uopte se ne slaem, ne slaem se, nemam miljenje, slaem se, potpuno se slaem U ovakvim situacijama modus nam daje vredniju informaciju u poreenju sa aritmetikom sredinom i medijanom. Zato?

Varijabilnost
Mjere centralne tendencije samo parcijalno opisuju podatke, Mjere varijablinosti su nune za potpuni opis neke varijable. Varijabilnost je sastvani dio distribucije Centralna tendencija uz mjere varijabilnosti nam pomae da vizualizujemo oblik jedne distribucije.

Distribucija

Mogue distribucije sa istom aritmetikom sredinom

Distribucija 1
Primjer asimetrine distribucije nakrivljene u desno

Distribucija nakrivljena u desno


2,2,2,2,2,3,3,3,4,4,5,5,5,8,9,10,11,12,13,14 Medijana je (4+5)/2=4.5 Aritmetika sredina 119/20=5.95

Distribucija 2
Primjer asimetrine distribucije nakrivljene u lijevo

Distribucija nakrivljena u lijevo


2,2,3,4,5,5,8,8,8,8,9,9,9,9,9,10,10,11,11,11 Medijana (8+8)/2=8 Aritmetika sredina = 151/20 = 7.55

Distribucija 3

Normalna distribucija
2,2,2,3,3,3,4,4,4,5,5,5 Medijana (3+4)/2=3.5 Aritmetika sredina 42/12=3.5

Normalna distribucija
Normalna distribucija predstavlja onaj tip distribucije u kojem se vrh distribucije poklapa sa aritmetikom sredinom distribucije (grafikon 5) Ovaj tip distribucije ima oblik zvona pa se esto upravo ovaj figurativan naziv koristi za normalnu distribuciju Normalna distribucija, kao koncept, igra veoma vanu ulogu u statistici, naime, veliki broj statistikih testova poiva na pretpostavci da su vrijednosti normalno distribuirane.

Asimetrina distribucija
Asimetrina distribucija je onaj tip distribucije u kome se aritmetika sredina ne poklapa sa vrhom distribucije. Distribucija moe biti asimetrina u dva smjera: prvo, ona moe biti iskrivljena u desno (grafikon 3) i ona moe biti iskrivljena u lijevo (grafikon 4) Najgori mogui sluaj asimetrine distribucije jeste ukoliko je ona nakrivljena istovremeno i u lijevo i u desno - ona ima dva vrha Kada imamo sluaj izrazito asimetrine distribucije, onda nam to govori da mi u okviru populacije imamo dve kategorije (kohorte), koje se sutinski razlikuju po datoj karakteristici . Odvojena analiza..

Distribicije sa jednim i dva vrha (pika)

Skewness asimetrija/iskrivljenost/zakoenost/ nagib distribucije


Skewness je parametar koji pokazuje da li je distribucija asimetrina ulijevo ili udesno Trei momenat distribucije Skewness je jednak 0 ako je distribucija simetrina, a u suprotnom imae vrijednost drugaiju od 0 sa predznakom koji je identian kao i asimetrija Negativna asimetrija, to znai da je distribucija nakoena ulijevo, tj. u tom sluaju vea je frekvencija natprosjenih vrijednosti. Pozitivna asimetrija, onda je distribucija nakoena udesno, i to znai da je frekvencija vrijednosti u korist ispodprosjenih vrijednosti Po konvenciji ako je vrijednost skewness-a manja od 1, smatra se da distribucija nije asimetrina, i obrnuto, ako je vrijednost vea od jedan, onda se ona moe tumaiti kao asimetrina

Kurtosis spljotenost distribucije


Kurtosis je parametar koji prua informaciju o rasprostranjenosti distribucije po y osi. Kurtosis zapravo govori o tome u kojoj mjeri su vrijednosti koncentrisane oko aritmetike sredine. Grafikon 2 pokazuje razliite mogunosti distribucije koje su normalne, spljotene ili zaotrene. etvrti momenat distribucije i ima vrijednost 3 za normalnu distribuciju Tanije, od vrijednosti koju smo dobili oduzimamo 3 tako da idealna distribucija ima kurtosis = 0 Spljotene distribucije imaju negativnu (-) vrijednost a zailjene pozitivnu (+) vrijednost kurtosisa

xi 4 5

fi 3 5

Xi- -3.025 -2.025

(Xi-)3 -27.6807 -8.3037

fi(Xi-)3 -83.0421 -41.5185 -6.4614 0 -7.4144 46.2222 52.661 -24.7244

fi(Xi-)4 251.2018 84.0756 6.6229 0 7.2290 91.2888 156.6671 597,0845

6
7 8 9 10

6
10 8 6 2 40

-1.025
-0.025 0.975 1.975 2.975

-1.0769
-0.000 -0.9268 7.7037 26.3305

=7.025 2=2.576 =1.605


M3=-24.7244/40=-0.6181 M4=597.0845/40=14.9271

3=M3/ 3 3= -0.6181/4.134=-0.15

nakosena ulijevo

4=M4/ 4 4= 14.9271/6.636= 2.25

spljostenija od normalne

Mjere varijabilnosti
U statistici varijabilnosti postoje numerike mjere

Mjere varijablinosti imaju za cilj da numeriki precizno ukau u kojoj mjeri distribucija vrijednosti odstupa od centralne tendencije

Opseg (Range)
Apsolutna mjera disperzije Opseg(Range) je najjednostavnija mjera varijabilnosti i on odgovara razlici izmeu najvee(max) i najmanje (min) izmjerene vrijednosti u nizu. U naem gornjem primjeru u kojima smo dali prikaz dstribucije godina ispitanika Opseg = 9018= 72 NAPOMENA: Range je jedna od mjera varijabilnosti koja je sasvim nedostatna, naime, u okviru opsega (max-min) mogue su sasvim razliite distribucije vrijednosti

Varijansa i Standardna devijacija


Standardna devijacija je jedna od kljunih mjera varijabilnosti koja ukazuje u kojoj su mjeri vrijednosti udaljene od aritmetike sredine.
Da bi izraunali standardu devijaciju nuno je prvo izraunati varijansu Varijansa se izraunava po sledeoj formuli:

Kalkulacija za varijansu i SD

Na osnovu varijanse se izraunava standardna devijacija, a ona predstavlja pozitivni kvadratni korijen varijanse. Evo formule:

Prema tome u naem primjeru SD je:

Realtivna mjera disperzije


Koeficijent varijacije / Koliki je udio odstupanja u aritmetickoj sredini 1.58/3=0.5266 Ako se radi o cijenama, kakav bi bio komentar?

Interpretacija standardne devijacije


Standardna devijacija uz aritmetiku sredinu nam prua veoma korisne informacije. Kljuna uloga standardne devijacije jeste da se na osnovu nje formiraju intervali povjerenja

Upotrebljivost S na naem primeru


Dakle, aritmetika sredina starosti naih ispitanika je 44,28, a standardna devijacija je 16,82. Slijedi:

Promptni zakljuak: Distribucija je asimetrina i to udesno,


naime, sa +/-dve standardne devijacije mi smo potpuno iscrpjeli niske vrijednosti tj. mlai, dok jo uvek nismo obuhvatili visoke vrijednosti tj. stariji.

Empirijsko pravilo za interpretaciju standardne devijacije


Ukoliko je distribucija normalna: Oko 68% vrijednosti e biti obuhvaene +/-1S Oko 95% vrijednosti e biti obuhvaene +/-2S Oko 99,7% vrijednosti e biti obuhvaene +/-3S

Upotrebljivost
Ako su prosjena primanja u Crnoj Gori 300 EUR sa standardnom devijacijom 130 EUR. To znai da oko 68% populacije u Crnoj Gori ima primanja izmeu 170 i 430 EUR i oko 95% populacije ima platu od 40 do 560 EUR Ako prosjean Crnogorac provede 3 sata pored televizora dnevno sa standardnom devijacijom od 1 sat, to znai da oko 68% populacije provodi pored TV-a izmeu 2 i 4 sata i 95% populacije gleda TV izmeu 1 i 5 sati

Ako je prosjena ocjena na skali od 1-5 za X politiara 3.0 sa standardnom devijacijom 1.5, to znai da ovog politiara 68% populacije ocjenjuje ocjenom od 1.5 do 4.5

Percentili
Percentili predstavljaju sumarne kumulativne pokazatelje distribucije iskazane relativnim frekvencijama Percentili u sutini dijele ukupnu kumulativnu distribuciju u jednoj taki, te prema tome se distribucija dijeli na dva dijela Najei u upotrebi je tzv 50-ti percentil, koji ima vrijednost medijane. Kada je o njemu rije, ukupna distribucija se dijeli na nain da polovina sluajeva (objekata) ima vrijednosti ispod a polovina iznad medijane. U upotrebi su takoe i 25-ti, 75-ti percentil, a nekada se koriste i 10-ti i 90-ti percentil Upotreba je jednostavna, npr. ako je u naem primjeru sa godinama vrijednost na 25-om percentilu =30, to znai da 25% populacije jeste mlae od 30 godina. Budui da je vrijednost 75-og percentila 57,6, to znai da je 75% naih ispitanika mlae od 57,6 godina. Konsekventno, poto je vrijednost na 90-tom percentilu 68, proistie da je 90% naih ispitanika mlae od 68 godina. Budui da 25-ti, 50-ti i 75-ti percentil dijeli populaciju u etiri grupe, njih nazivamo kvartilima a razliku izmeu 75-tog i 25-tog, nazivamo interkvartilni opseg (IQR interquartile range)