You are on page 1of 6

1 Statistički skup

1.1 Teorijske osnove

Statistika : prikupljanje, sistematizacija, prikazivanje i obrada podataka


koji karakterišu elemente odredjenih skupova sa ciljem da se izvedu zaključci
i donesu odluke.
Statistički skup, osnovni skup ili populacija Ω: skup svih elemenata na
kojima se prpučava neka pojava.

- Može biti konačan ili beskonačan.


- U ovoj knjizi Ω je konačan skup
· Obim populacije: broj N = |Ω|.
Ω = {ω1 , ω2 , ..., ωN }.

Statističko obeležje ili, kraće, obeležje: osobina po kojoj se elementi pop-


ulacije razlikuju, i ona su u osnovi statističke obrade.

Oznake:
· obeležje: X : Ω −→ R;
· vrednosti koje obeležje može uzeti: R = {x1 , x2 , . . . , xk }.

• Prikazivanje podataka

Načini prikazivanja:

- nabrajanje - najlakši, ali često i najnepregledniji;


- tabelarni
- grafički.

1o Tabelarno prikazivanje podataka


Neka je i ∈ {1, ..., k}.
Apsolutna frekvencija ili frekvencija fi : broj elemenata populacije Ω na
kojima obeležje X uzima vrednost xi
f1 + f2 + ... + fk = N .
fi
Relativna frekvencija pi = N : predstavlja zastupljenost odredjenih ele-
menata unutar skupa.
- Može biti data i procentualno.
Pi
Kumulativna frekvencija Fi = fj elementa xi : zbir svih frekvencija
j=1
koje prethode i odgovaraju elementu xi .

1
- Pretpostavlja sa su vrednosti {x1 , x2 , ..., xk } poredjane po veličini.
- Specijalno: F1 = f1 i Fk = N .
P i
Kumulativna relativna frekvencija Fir = pj , i ∈ {1, ..., k}.
j=1

1o 1. Diskretno obeležje

relativne
Elementi relativna kumulativne
frekvencija fi kumulativne
skupa xi frekvencija frekvencije
frekvencije
x1 f1 p1 F1 F1r
x2 f2 p2 F2 F2r
.. .. .. .. ..
. . . . .
xk fk pk Fk Fkr

1o 2. Neprekidno obeležje. Obeležje sa velikim brojem različitih vred-


nosti

Grupisanje u intervale:

- broj intervala k i širina intervala d odredjuju se korišćenjem


Strugesove formule:
xmax −xmin
k = 1 + 3, 322 log N , d= k
,
gde su xmin i xmax najmanja i najveća vrednost u populaciji;
- ne preporučuje se više od 5 · log N intervala;
- često je i sam statistički skup snabdeven nekom unutrašnjom
logičnom podelom koje se treba pridržavati pri podeli na in-
tervale.

relativne
relativna kumulativne
Intervali frekvencija kumulativne
frekvencija frekvencije
frekvencije
I1 f1 p1 F1 F1r
I2 f2 p2 F2 F2r
.. .. .. .. ..
. . . . .
Ik fk pk Fk Fkr

2o Grafičko prikazivanje podataka

2
- Poligonalna linija: spaja tačke (x1 , f1 ),...,(xk , fk );
- kriva distribucije ili ogiva: spaja tačke (x1 , F1 ),...,(xk , Fk );
- stubičasti dijagram;
- histogram.

• Numeričke karakteristike obeležja

3o Pokazatelji centralne tendencije


3o 1. Izračunati

Aritmetička sredina m
1
P
N
- za negrupisane podatke: m = N
xi ;
i=1
1
P
k
- za grupisane podatke: m = N
xi f i .
i=1

3o 2. Pozicioni
Mod M0
- za negrupisane podatke: vrednost koja ima najveću frekvenciju, tj.
vrednost koja se najčešće javlja;
- za grupisane podatke: izračunava se i to po sledećoj proceudri (ne vidi
se direktno)

· odredjuje se modalni interval (interval sa najvećom frekvenci-


jom);
· izračunava se broj
M0 = Lm0 + d1d+d 1
2
· dm0 ,
gde su
Lm0 donja granica modalnog intervala,
dm0 širina modalnog intervala,
d1 = fm0 − fm0 −1 ,
d2 = fm0 − fm0 +1 ,
fm0 frekvencija modalnog intervala,
fm0 −1 frekvencija intervala pre modalnog,
fm0 +1 frekvencija intervala posle modalnog.

Medijana Me
- za negrupisane podatke: vrednost obeležja koje u nizu {yn } podataka
poredjanih po veličini zauzima srednju poziciju:

3

y N +1 , N neparno
2
Me = y N + y N +1
 2 2
, N parno
2
- za grupisane podatke: izračunava se i to po sledećoj proceudri (ne vidi
se direktno)

· odredjuje se medijalni interval (prvi interval čija je kumulativna


frekvencija veća od N2 );
· izračunava se broj
N
−F
Me = Lme + 2 fmme −1 · dme ,
e
gde su
Lme donja granica medijalnog intervala,
dme širina medijalnog intervala,
fme frekvencija medijalnog intervala,
Fme −1 kumulativna frekvencija intervala pre medijalnog.

Kvantili
Kvantil reda p, p ∈ (0, 1), je broj koji je veći od p · 100% vrednosti
obeležja.
· Medijana je kvantil reda p = 0.
· Kvantili normalne, Studentove i χ2 raspodele se nalaze u tabelama u
Prilogu.

Kvartili Qi , i = 1, 2, 3 su kvantili reda p ∈ {0, 25; 0, 5; 0, 75}.


Kvartili dele vrednosti obeležja uredjene po veličini na četiri
jednaka dela, odnosno intervali
(−∞, Q1 ), (Q1 , Q2 ), (Q2 , Q3 ), (Q3 , +∞)
sadrže po 25% podataka populacije.
- za negrupisane podatke: prvi kvartil je medijana donje
polovine populacije, a treći kvartil je medijana gornje polovine
populacije;
- za grupisane podatke: izračunava se i to po sledećoj proceu-
dri (ne vidi se direktno)

· odredjuje se kvartilni interval za Mp (prvi interval


čija je kumulativna frekvencija veća ili jednaka
od od N p;
· izračunava se broj
Mp = Lp + Np −Ffp
p−1
· dp ,
gde su

4
Lp donja granica kvartilnog intervala,
dp širina kvartilnog intervala,
fp frekvencija kvartilnog intervala,
Fp−1 kumulativna frekvencija intervala pre kvar-
tilnog .

Momenti
Običan momenat reda r, r ∈ N:
Pk
mr = σ 2 = N1 xri fi .
i=1
m = m1
Centralni momenat reda r, r ∈ N:
Pk
µr = N1 (xi − m)r fi .
i=1

4o . Pokazatelji rasipanja, disperzije


Raspon populacije: R = xmax − xmin
Interkvartilni razmak: IQR = Q3 − Q1
Disperzija (varijansa): σ 2 = µ2

1
P
k
σ2 = N
(xi − m)2 fi
i=1
1
Pn
σ2 = N
x2i fi − m2
i=1

Standardna devijacija, standardno odstupanje: σ = σ2
σ
Koeficijent varijacije: V = m · 100%

5o . Pokazatelji oblika raspodele


Koeficijent asimetrije KA :

1
P
k
N
(xi − m)3 fi
µ3 i=1
KA = 3 = .
µ22 P
k
( N1 (xi − m)2 fi )3/2
i=1

- KA = 0 simetrična raspodela u odnosu na pravu x = m i važi


M0 = Me = m;
- KA > 0 raspodela asimetrična na desno i važi
M0 ≤ Me ≤ m;
- KA < 0 raspodela asimetrična na levo i važi
m ≤ Me ≤ M0 .

5
Koeficijent spljoštenosti, ekscesa KE :

1
P
k
N
(xi − m)4 fi
µ4 i=1
kE = 2 =
µ2 P
k
( N1 (xi − m)2 fi )2
i=1

- KE = 3 mezokurtična: distribucija ima normalnu spljoštenost;


- KE > 3 leptokurtična: distribucija je više izdužena u odnosu
na normalnu raspodelu;
- KE < 3 platikurtična: distribucija je više spljoštena u odnosu
na normalnu raspodelu.

You might also like