Professional Documents
Culture Documents
Sem - Rad. Statistika Sladjana
Sem - Rad. Statistika Sladjana
SEMINARSKI RAD
Mentor: Student:
Prof. dr Savić Branimir Matić Slađana
Br. Indeksa: 416/13
UVOD........................................................................................................................1
ZAKLJUČAK........................................................................................................10
LITERATURA.....................................................................................................11
UVOD
Srednji statistički podaci koji su tabelarno ili grafički prikazani služe za statističku
analizu, s ciljem istraživanja pravilnosti i zakonitosti posmatranih masovnih pojava. Statistička
analiza i ima taj zadatak da primenom različitih metoda i postupaka raščlani i uporedi podatke,
otkrije i formuliše zakonitosti koje vladaju u posmatranoj masovnoj pojavi
Koristeći relativne brojeve i raspodelu frekvencija može se steći izvestan globalni utisak
o posmatranoj pojavi i posmatranom statističkom skupu. Ipak za dalju i svrsishodniju analizu
potebne su nam preciznije metode kojima ćemo masu statističkih podataka obraditi tako da
postane upotrebljiva u procesu donošenja odluka.
Srednje vrednosti ili mere centralne tendencije prezentuju sredinu statističke serije.
Najčešće se oko te srednje vrednosti grupiše najveći broj jedinica. Srednje vrednosti se nalaze
između najmanje i najveće vrednosti obeležja.
Kao reprezentativni pokazatelj serije srednja vrednost karakteriše statistički skup. Ako se
posmatra jedan statistički skup po jednom numeričkom obeležju i pođe se od individualnih
vrednosti tog obeležja, teško će se uočiti bitna i zajednička karakteristika čak i kad su
pojedinačni podaci, grupisanjem u serije, svedeni na manji broj. Zato se nastoji da se ta serija
zameni jednim brojem koji omogućava da se uoči karakteristika posmatranog skupa.
Srednje vrednosti: aritmetička, harmonijska i geometrijska sredina, zatim modus i
medijana.
Mere varijacije ili mere disperzije pokazuju kakvo je variranje podataka u seriji . Mogu
postojati statističke serije sa istom srednjom vrednošću, a različitim variranjem podataka oko te
srednje vrednosti . Apsolutne mere varijacije su iskazane u jedinicama mere obeležja . Poznatije
mere varijabiliteta su interval varijacije, srednje apsolutno odstupanje, varijansa i standardna
devijacija itd. Relativne mere varijacije su neimenovani pokazatelji varijabiliteta . Neke od
relativnih mera varijacije su koeficijent varijacije i normalizovano standardizovano odstupanje.
5
1. MERE SREDNJE VREDNOSTI - CENTRALNE TENDENCIJE
1.1.Mod - modus
Mod – modus je vrednost obeležja koja ima najveću frekvenciju. Ne izračunava se iz svih
vrednosti jedne serije, već se uzima kao vrednost obeležja koja se u statističkom skupu najčešće
javlja. Pošto vrednost modusa ima najveći broj jedinica datog skupa, smatra se da je modus
tipična vrednost koja može da okarakteriše čitavu seriju.
Modus se može odrediti pomoću sledećeg obrasca:[ Aranđelović 2012: 89]
f2
Mo = l + f + f x i, gde je
1 2
1.2.Medijana
Medijana (Me) je vrednost obeležja koja se nalazi u sredini serije čiji su svi članovi
raspoređeni po veličini vrednosti obeležja. Na taj način ona deli jedinice statističkog skupa na
dva jednaka dela, tako da se i iznad nje i ispod nje nalazi po 50% svih jedinica.[ Petrović Lj
2010: 77] Medijana kao i modus nije izračunata srednja vrednost, već vrednost obeležja po
položaju koji zauzima u nizu podataka. U slučajevima gde vrednost članova u seriji znatnije
variraju, medijana je bolja srednja vrednost od aritmetičke sredine.
4
n+1
(n+1) i podeli sa 2, tj. 2
Me = l + i ¿¿
Medijanapodatkegrupisaneuintervale
n n+ 1
− K m−1 −K m−1
Me = Lm + 2 .i Me = Lm + 2 .i
fm fm
1.3.Aritmetička sredina
5
Neophodan uslov za pravilnu primenu aritmetičke sredine jeste da podaci u seriji
pokazuju dovoljan stepen homogenosti a kriterijum za određivanje te homogenosti zavisi od
prirode i vrste pojave koja je prikazana u seriji kao i da znamo suštinu i smisao rezultata kojeg
želimo da dobijemo. Aritmetička sredina ima dva osnovna načina izračunavanja.
Prema tome da li su podaci grupisani ili ne, razlikuju se:[Petrović Lj 2010: 91]
Prvi način odnosi se na izračunavanje iz prostih serija, tj. iz onih serija u kojima se svaki
podatak javlja samo po jedanput. Ako se aritmetička sredina određuje za jedan običan statistički
niz, onda se ona naziva prosta ili jednostavna aritmetička srednja vrednost. Jednostavna
aritmetička srednja vrednost izračunava se tako što se zbir svih podataka podeli njihovim
brojem.
Drugi način izračunava aritmetičke sredine primenjuje se kod sređenih serija (serije
distribucije frekvencija), tj. kod onih serija u kojima se pojedini podaci (modaliteti) javljaju u
nejednakim frekvencijama, i tu se uzima i obzir veličina frekvencije svakog modaliteta. Svaki
modalitet se ponderiše, vaga, svojom frekvencijom pa se ova aritmetička sredina naziva
ponderisana (vagana) aritmetička sredina.
Ponderisana aritmetička srednja vrednost izračunava se tako što se zbir svih proizvoda
numeričkih podataka i odgovarajućih frekvencija podeli ukupnim zbirom frekvencija,odnosno
ukupnim brojem podataka.
Aritmetička sredina može se računati i za više skupova i to je
aritmetička sredina aritmetičkih sredina.
Najširu upotrebu u statističkoj analizi, a i šire, ima aritmetička sredina. Izračunava se tako
što se zbir svih vrednosti obeležja podeli njihovim brojem. Ako posmatrano obeležje označimo
sa X, njegove vrednosti sa x1 ,x2,.... xi,.... xn, imaćemo: [Petrović 2011: 77]
µ = x1+ x2 +...+xn = 1 ∑x i ili prostije µ = ∑ x
N N i=1 N
Znatno češće imamo posla sa grupisanim podacima u vidu rasporeda frekvencija, tj.sa
skupovima unutar kojih se svaka vrednost obeležja može javiti više puta. Ako, u opštem slučaju,
vrednosti obeležja označimo sa x1, x2,.... xi,.... xn, a odgovarajuće frekvencije sa f1, f2, ...
fi, ... fn , aritmetička sredina će biti:
µ = f1 x1 + f2 x2 + ... + fn xn , tj.
N
n
µ = 1 ∑ fi xi ili prostije
N i=1
µ = ∑ f x , gde je
4
N
n
N = f1 + f2 + ... + fn = ∑ fi = ∑ f.
=1
Ovako utvrđena prosečna vrednost poznata je kao ponderisana aritmetička sredina jer se
sve vrednosti uzimaju u zbir onoliko puta koliko se one i javljaju unutar rasporeda. Ponderacioni
faktor je, dakle, frekvencija ( f ).
Aritmetička sredina, uz osobine koje karakterišu svaku srednju vrednost, ima i izvesne
karakteristike (analitičke i matematičke prirode) značajne za njeno izračunavanje i primenu u
statističkom radu.
Aritmetička sredina, jedan broj koji reprezentuje ceo skup podataka, ima važne prednosti.
Prvo, ona je odomaćena i intuitivno jasna većini ljudi. Drugo, svi podaci imaju aritmetičku
sredinu i to samo jednu. Aritmetička sredina je pogodna za korišćenje u većini statističkih
procedura. Nedostatak aritmetičke sredine je što na njenu vrednost utiču ekstremne, jako male i
jako velike, vrednosti. Drugi problem što svaki podatak iz serije ulazi u obračun što nije pogodno
za serije sa velikim brojem podataka. Treći problem je što ne može da se izračuna za otvorene
klasne intervale tipa veće od ili manje od.
1.4.Geometrijska sredina
5
N
G = √ x1*x2 ...*xi...xn*
Izračunavanje geometrijske sredine ima smisla samo za ona obeležja čije su vrednosti
veće od nule. Polazeći od ove predpostavke, logaritmovanjem prethodnog izraza
dobijamo:
n
Antilogaritmovanjem:
n
G = √1 ∑ fi log xi
N i=1
1.5.Harmonijska sredina
1 n
H = V +V +…+V +…+V = V +V +…+V +…+V
x1 x2 xi xn x1 x2 xi xn
n
H= Ʃ1
x
4
Harmonijska sredina za grupisane podatke
Kada se radi o grupisanim podacima, izračunava se grupisana ponderisana harmonijska
sredina. Ona će tada biti recipročna vrednost aritmetičke sredine recipročnih vrednosti obeležja
pomnoženih – ponderisanih odgovarajućim frekvencijama. Obrazac za izračunavanje
ponderisane harmonijske sredine glasi:
1
f 1 + f 2 +…+ f i+ …+ f n
H = V x 1 x f 1 +V x 2 x f 2+ …+V xi x f i +…+V xn x f n = '
V x 1 f 1 +V x 2 f 2 +…+V xi f i+ …+V xn f n
f 1+ f 2 +…+ f i +…+ f n
Σf
H=
Σ f / x'
2.MERE DISPERZIJE
2.1.Pojam disperzije i njeno merenje
2.2.Mere disperzije
i = X max− X min
5
Ova mera izračunava se jednostavno i daje približnu informaciju o disperziji serije, jer na
nju utiču samo krajnje vrednosti posmatranog obeležja, koja se mogu znatno razlikovati od
ostalih vrednosti.
Varijansa je mera disperzije koja se izračunava kao prosek kvadrata odstupanja svih
vrednosti obeležja od aritmetičke sredine. Obeležava se grčim slovom – mala sigma na kvadrat-
2
σ .
Varijansa iz negrupisanih podataka izračunava se po obrascu:[Aranđelović 2012: 101]
Σ ( x−x ) 2
σ =
2
n
Σf ( x−x ) 2
σ =
2
Σf
Pošto se varijansa računa kao prosek kvadrata odstupanja, njena vrednost je suviše velika
da meri disperziju u seriji i takvo izražavanje nije praktično, može biti i nerazumljivo. Zbog toga
je kvadrate odstupanja potrebno vratiti na prvi stepen. To se postiže vađenjem drugog korena iz
varijanse. Varijansa uvek mora biti pozitivna veličina.
σ = √σ2 =
√ Σ ( x−x ) 2
n
4
σ = √σ2 =
√ Σf ( x−x ) 2
Ʃf
√
2
ƩX
σ= - x2
n
√
2
ΣX f
σ= - x2
Σf
σ
V= X
5
ZAKLJUČAK
4
LITERATURA