You are on page 1of 66

1

VISOKA KOLA STRUKOVNIH STUDIJA ZA INFORMACIONE I


KOMUNIKACIONE TEHNOLOGIJE BEOGRAD








Predmet: STATISTIKA

Materijal za studente - 2 . deo


















Predava : mr Zorica Malovi


2
4. TEORIJSKE RASPODELE
4.1. Binomni zakon raspodele
(Bernulijeva raspodela) Jakob Bernoulli (1654-1705)
U eksperimentu, koji se ponavlja n puta, posmatra se realizacija dogaaja A ili njemu suprotnog
dogaaja A.
( ) ; ( ) 1 P A p P A p q = = =
Tako se dobija sloeni eksperiment koji se moe prikazati tzv. Bernulijevom emom. Nad ishodima
ovog sloenog eksperimenta uvodi se sluajna promenljiva
n
S .

0 0 1 2 3
0 1 2 3 ...
: ; 1
...
n
n i
i n
n
S p
p p p p p
=
| |
=
|
\


Verovatnoa da e se u n nezavisnih eksperimenata dogaaj A realizovati tano k puta iznosi:
{ }
( )
!
( )
! !
k n k k n k
k n n
n
n
p P S k P k p q p q
k k n k

| |
= = = = =
|

\


Binomna rapodela se moe okarakterisati sa dva parametra n i p , gde je N n broj ponavljanja,
a ( ) 1 , 0 p verovata realizacije eksperimenta koji se ponavlja. Zbog toga se binomna raspodela
obeleava sa B( ) , n p .
Za sluajnu promenljivu
n
S vai:
Matematiko oekivanje ( )
n
E S np =
Disperzija ( varijansa) ( ) ( )
2
1
n
S np p =
Standardno odstupanje
( )
2
( ) ( ) 1
n n
S S np p = =
Koeficijent simetrije
( )
( )
3
1 2
1
n
p
S
np p


Koeficijent spljotenosti
( )
( )
4
6 1
3
1
n
S
n np p
= +




Primer 4.1 1.
Kockica se baca 7 puta. Odrediti raspodelu sluajne promenljive a zatim izraunati verovatnoe
dogaaja :
a) B- Broj manji od 3 je pao tano 4 puta.
b) C- Broj manji od 3 je pao bar 5 puta.


3
Dogaaj A iju realizaciju u svakom od 7 = n bacanju kockice posmatramo je
A- pao je broj manji od 3
Verovatnoa da e prilikom jednog bacanja pasti broj manji od 3 iznosi:
( )
3
1
6
2
= = = p A P
Verovatnoa da e prilikom jednog bacanja nee pasti broj manji od 3 iznosi:
( )
3
2
3
1
1 = = = q A P . U pitanju je binomna raspodela B
1
7,
3
| |
|
\
.

7
0 1 2 3 4 5 6 7
0 1 2 3 4 5 6 7
: S
p p p p p p p p
| |
|
\

gde je
{ }
( )
7 7
7 7
7
1 2 7! 1 2
( )
3 3 ! 7 ! 3 3
k k k k
k
p P S k P k p
k k k

| |
| | | | | | | |
= = = = =
| | | | |

\ \ \ \
\

0,1, 2, 3, 4, 5, 6, 7 k =
Napomena: Ovakva izraunavanja su dosta zamorna. Postoje specijalizovane tablice za izraunavanje
binomnih verovatnoa kao i razliiti programi koji se time bave.
U EXCELU postoji funkcija BINOMDIST pomou koje se izraunavaju traene verovatnoe.
0 1 2 3 4 5 6 7
0,0585277 0,2048468 0,3072702 0,2560585 0,1280293 0,0384088 0,0064015 0,0004572

a) B- Broj manji od 3 je pao tano 4 puta.
4 3 4 3
3
4 7
7
1 2 7! 1 2 2
( ) 35 0,128029
4 3 3 4!3! 3 3 3
P B p
| |
| | | | | | | |
= = = = =
| | | | |
\ \ \ \
\

b) C- Broj manji od 3 je pao bar 5 puta.
Da bi se realizovao dogaaj C povoljno je da broj manji od 3 padne 5 ili 6 ili 7 puta.
5 6 7
( ) 0,0384088+0,0064015+0,0004572= 0,0452675 P C p p p = + + =


Binomna raspodela B(7;1/3)
0.0000000
0.0500000
0.1000000
0.1500000
0.2000000
0.2500000
0.3000000
0.3500000
0 1 2 3 4 5 6 7 8


4
Primer 4.1 2.
Za sluajnu promenljivu
7
S iz primera 4.1 1. , kojoj odgovara binomna raspodela B
1
7,
3
| |
|
\
odrediti
matematiko oekivanje, disperziju ( varijansu), standardno odstupanje, koeficijent simetrije i
koeficijent spljotenosti.
Za ovu sluajnu promenljivu parametri su:
Matematiko oekivanje ( )
7
1
7
3
E S =
Disperzija ( varijansa) ( )
2
7
7 2 14
3 3 9
S = =
Standardno odstupanje
7
14 14
( )
9 3
S = =
Koeficijent simetrije
( )
3 7
2
1
1
3
14 14
3
S

= =
Koeficijent spljotenosti ( )
4 7
6 9 39
3 2.79
7 14 14
S = + = =

4.2. Puasonova raspodela

Ako se u binomnoj raspodeli uzme veliki broj ponavljana, izraunavanje je relativno komplikovano
pa ima potrebe aproksimirati izraze za izraunavanje verovatnoa. Aproksimacije se uvode u
sluajevima kada je 50 > n .
Najvie su u upotrebi dve vrste aproksimacija. Jedna je Puasonova (Poisson) a druga je Normalna
aproksimacija .
Puasonova se uzima kada je 10 np .
Normalna se uzima kada je 10 np > .
Ako se uvede oznaka ; 0 np = > onda je

!
k
k n k
k
n
p p q e
k k



| |
=
|
\
Puasonova aproksimacija
Primer 4.2 1.
Verovatnoa da e koarka promaiti ko prilikom izvoenja slobodnog bacanja je je
05 , 0 = p .Gaanje se izvodi 100 puta.
Izraunati verovatnoe dogaaja :
a) A- Ko je promaen tano 6 puta
b) B- Ko je promaen manje od 10 puta
5
5 ; 05 , 0 ; 100 = = = np p n
Ovde se moe primeniti Puasonova aproksimacija jer je ( 10 np ).
100 0.05 5 ; np = = =
a) 6 k = ; ( ) ( )
6
6 94 5
6 100
100
5
6 0.05 0.95 0,146222808
6 6!
P A p P S e

| |
= = = = =
|
\

Postoje tablice sa izraunatim vrednostima za razliite vrednosti i k .
U EXCELU postoji funkcija POISSON pomou koje je izraunata traena verovatnoa.
b) ( ) ( )
0 1 9 100
10 0,968171943 P B p p p P S = + + + = < = L
Postoje posebne tablice u kojima su date kumulativne verovatnoe za razliite vrednosti , k i m.
Ovde je 9 m = . Funkcija POISSON ima i tu mogunost.

Puasonova raspodela se primenjuje na veliki broj praktinih problema koji vezani za pojavu
odreenog dogaaja u vremenskom intervalu [ ) 0, t . Takvi su na primer dogaaji: registrovanje broja
telefonskih poziva, protok automobila, emisija radioaktivnih estica ...Ovakvi dogaaji imaju osobinu
da su nezavisni jedan od drugog i da su im verovatnoe proporcionalne duini vremenskog intervala.

Primer 4.2 2.
U telefonskoj centrali u toku jednog sata bilo je 360 poziva. Na osnovu Poasonovog zakona
izraunati verovatnou :
a) A- da u toku jednog minuta nee biti poziva
b) B- da e u toku jednog minuta biti 3 poziva
c) C- da e u toku jednog minuta biti 10 poziva.
d) D- da e u toku jednog minuta biti manje od 10 poziva.
360 n =
Vremenski interval od jednog sata se deli na 60 jer se rauna realizacija dogaaja u toku jednog
minuta.
1
60
p =
1
360 6
60
np = = =
a) ( ) ( )
0
6
360
6
0 0,002478752
0!
o
P A p P S e

= = = =
b) ( ) ( )
3
6
3 360
6
3 0,089235078
3!
P B p P S e

= = = =
c) ( ) ( )
10
6
10 360
6
10 0,041303093
10!
P C p P S e

= = = =
6
d) ( ) ( )
0 1 9 360
10 0,916075983 P D p p p P S = + + + = < = L
4.3. Normalna raspodela
Muavr (A.Moivrei ) i Laplas (P.S. Laplace) su aproksimirali binomnu raspodelu sledeom
formulom:

( )
2
2
1
2
k np
k n k npq
k
n
p p q e
k npq

| |
=
|
\

Normalna aproksimacija binomne raspodele se uzima kada je 10 np > .

Neprekidna sluajna promenljiva ima normalnu ili Gausovu raspodelu
( )
2
, N
ako je njena gustina raspodele verovatnoa funkcija :
( )
( )
2
2
2
1
2
x
f x e

=
gde je np = - matematiko oekivanje a
2
npq = - disperzija.
Grafici gustina raspodele su slinog zvonastog oblika , simetrini u odnosu na pravu x = . To znai
da je medijana
e
M = .
Funkcija gustine ima maksimum za x = pa je mod
o
M = .
Vai, takoe da je ( ) lim 0
x
f x

=
Promena parametra dovodi do translacije krive du x-ose. Parametar utie na rairenost
krive, odnosno, ako je vee vrh krive je manji jer je taka maksimuma
1
,
2


| |
|
\
.











Za sluajnu promenljivu koja ima normalnu raspodelu ( ) 0,1 N vai da je
koeficijent simetrije
3
0 = a koeficijent spljotenosti
4
3 = .

Me Mo = =
7















Verovatnoa ( )
( )
2
2
2
1
2
x
b
a
P a X b e dx

< < =


se moe se interpretirati kao povrina ograniena x-osom , krivom gustine raspodele i pravim x a = i
x b = ,










Verovatnoa da sluajna promenljiva
( )
2
, X N = uzme vrednosti iz intervala
- ( ) , iznosi 68.3%
- ( ) 2 , 2 iznosi 95.5%
- ( ) 3 , 3 iznosi 99.7% .

Ove injenice se formuliu i kao pravilo tri za normalnu raspodelu.


a
b
( ) P a X b < <
8















Postoje tablice koje se odnose na
( )
2
, N za vrednosti ( ) 0,1 N .
Sluajna promenljiva ( ) 0,1 N jo se obeleava sa Z i naziva se standardizovanom sluajnom
promenljivom.









Ako je
( )
2
, X N = ona se moe standardizovati. To se postie uvoenjem smene
X
Z

= .
( )
( )
{ {
( ) ( )
2
2
2
2
1
1 2
2
2
2 1
1
2
1
2
x
b
a
z
z
z
z z
Z
P a X b e dx
a X b
P e dz F z F z

< < = =
| |
|
= < < = =
|
|
\

123
.

Pravilo tri
68.3%
95.5%
99.7%


2 3
9
Funkcija koja se javlja posle izraunavanja integrala, ( ) F z je Laplasova funkcija ije vrednosti se
daju u pominjanim tablicama.
U EXCELU postoje funkcije NORMSDIST i NORMDIST koje daju vrednosti integrala
( ) ( )
x
f z dz F x

.
NORMSDIST se odnosi na standardizovanu sluajnu promenljivu ( ) 0,1 N a
NORMDIST se odnosi sluajnu promenljivu
( )
2
, N .
( ) ( ) ( ) ( ) ( )
b b a
a
f z dz f z dz f z dz F b F a

= =


Napomena Kod upotrebe funkcije NORMDIST treba paziti na granice integrala,
( ) ( ) ( )
F b F a + + , pa je zato preporuljivo standardizovati promenljivu i koristiti
NORMSDIST.

Primer 4.3. 1.
Ako je sluajna promenljiva X podlee zakonu raspodele
( )
2
20, 2 N izraunati:
a) ( ) 18 24 P X < < b)
( )
20 3 P X < c) ( ) 25 P X <

a) ( ) 18 24 P X < <
20 = - matematiko oekivanje
2 2
2 = - disperzija ; 2 = ;
20
2
X
Z

=
( ) ( )
( ) ( )
18 20 24 20
18 24 1 2
2 2
2 1 0.97725 0.15866 0.81859
P X P Z P Z
F F
| |
< < = < < = < < =
|
\
= = =

b)

( ) ( ) ( )
( ) ( )
3 20 3
20 3 3 20 3
2 2 2
20
1.5 1.5 1.5 1.5
2
0.9333193 0.066807 0.8665123
X
P X P X P
X
P F F
| |
< = < < = < < =
|
\
| |
= < < = =
|
\
= =

c) ( ) ( )
20 25 20
25 2.5 0.99379
2 2
X
P X P F
| |
< = < = =
|
\


10



Primer 4.3.2. (Pravilo tri )
Ako je sluajna promenljiva X podlee zakonu raspodele
( )
2
6, 3 N izraunati:
a)
( )
6 3 P X < ; b)
( )
6 6 P X < ; c)
( )
6 9 P X <
6 = - matematiko oekivanje

2 2
3 = - disperzija ; 3 = ;
6
3
X
Z

=
a)
( )
6 3 P X < ; 3 =
( ) ( ) ( )
( ) ( )
3 6 3
6 3 3 6 3
3 3 3
6
1 1 1 1 0.84134 0.15866
3
0.68268 68.268 %
X
P X P X P
X
P F F
| |
< = < < = < < =
|
\
| |
= < < = = =
|
\
=

b) ; 2 6 =
( ) ( ) ( )
( ) ( )
6 6 6
6 6 6 6 6
3 3 3
6
2 2 2 2 0.97725 0.02275
3
0.95450 95.5 %
X
P X P X P
X
P F F
| |
< = < < = < < =
|
\
| |
= < < = = =
|
\
=
;

c) 3 9 =
( ) ( ) ( )
( ) ( )
9 6 9
6 9 9 6 9
3 3 3
6
3 3 3 3 0.99865 0.00135
3
0.99730 99.7 %
X
P X P X P
X
P F F
| |
< = < < = < < =
|
\
| |
= < < = = =
|
\
=


Primer 4.3. 3.
Ako sluajna promenljiva X aproksimira binomnu raspodelu B( ) 100, 0.1 nai priblino verovatnou
( ) 7 16 P X < < .
100 0.1 10 np = = = - matematiko oekivanje
2
10 0.9 9 npq = = = - disperzija
11
Binomna raspodela se moe aproksimirati normalnom raspodelom sa parametrima
( )
2
10, 3 N .
( ) ( ) ( )
7 10 16 10
7 16 2 1
3 3
0.97725 0,15866 0.81859
P X P Z F F
| |
< < = < < = =
|
\
= =


Primer 4.3.4.
Anketirana je grupa motorista o broju kilometara koji preu mesemo. Proseni broj kilometara
iznosi 1200km sa srandardnom devijacijom 150km. Broj preenih kilometara se moe predstaviti
sluajnom promenljivom koja ima normalnu raspodelu
( )
2
1200,150 N . .
Izraunati procenat motorista koji:
a) Prelaze 1200-1600 km meseno.
b) Prelaze 1000-1500 km meseno.
a) 1200 ; 150 = =
( ) ( ) ( )
1200 1200 1600 1200
1200 1600 2.76 0
150 150
0.99711 0,5 0.49711 49.71%
P X P Z F F
| |
< < = < < = =
|
\
= = =

b)
( ) ( ) ( )
1000 1200 1500 1200
1000 1500 2 1.33
150 150
0.99725 0,09176 0.88549 88.55%
P X P Z F F
| |
< < = < < = =
|
\
= = =


Primer 4.3.5.
Ako je sluajna promenljiva X B( ) 50, 0.2 nai verovatnou dogaaja A da je ( ) 5 15 X .
a) Koristei binomnu raspodelu
b) Binomnu raspodelu aproksimirati Poasonovom raspodelom
c) Binomnu raspodelu aproksimirati normalnom raspodelom
a) Binomnoj raspodeli B( ) 50, 0.2 odgovara sluajna promenljiva
50
S
50
0 1 2 49 50
0 1 2 . .. 49 50
:
. . .
S
p p p p p
| |
|
\

5 6 14 15
( ) P A p p p p = + + + + L Pomou funkcije BINOMDIST izraunava se:
5 6 7 8 9 10 11 12 13 14 15
0,0295310,0553710,0870120,1169220,1364090,1398190,1271080,1032750,075470,0498640,029919

12
5 6 14 15
( ) 0,950700562 P A p p p p = + + + + = L

b) Binomna raspodela se moe aproksimirati Poasonovom raspodelom sa parametrom
50 0.2 10 ; np = = =
( ) ( ) ( ) ( )
5 6 15 50 50 50
5 6 15
10 10 10
5 6 ... 15
10 10 10
0,92201
5! 6! 15!
P A p p p P S P S P S
e e e

= + + + = = + = + + = =
= + + + =
L
L
5 6 7 8 9 10 11 12 13 14 15
0,037830,063060,090080,112600,125110,125110,113740,094780,072910,052080,03472

Navedene vraedosti su izraunate pomou funkcije POISSON.

Binomna B(50,0.2) i odgovarajua Poasonova raspodela
-0,02000
0,00000
0,02000
0,04000
0,06000
0,08000
0,10000
0,12000
0,14000
0,16000
0 10 20 30 40 50



c) Binomna raspodela se moe aproksimirati normalnom raspodelom sa parametrima ( ) 10, 8 N .
50 0.2 10 np = = = - matematiko oekivanje
2
10 0.8 8 npq = = = - disperzija
( )
( ) ( )
5 10 15 10 5 5
5 15
8 8 8 8
1.76776 1.76776 0,96145-0,03855= 0,92290
P X P Z F F
F F
| | | | | |
= < < = =
| | |
\ \ \
= =


13

14
Vebanje 4. 4:
1. Ako je sluajna promenljiva X podlee zakonu raspodele
( )
2
20,10 N izraunati verovatnou
( ) 5 28 P X < < .

2. Ako je sluajna promenljiva X B( ) 100, 0.1 , koja aproksimira binomnu raspodelu normalnom,
nai priblino verovatnou ( ) 4 22 P X < < .

3. Ako je sluajna promenljiva X B( ) 20, 0.3 nai verovatnou ( ) 3 7 P X < < .
a) Binomnu raspodelu aproksimirati Poasonovom raspodelom
b) Binomnu raspodelu aproksimirati normalnom raspodelom

4. Ako je sluajna promenljiva X podlee zakonu raspodele
( )
2
20, 2 N izraunati:
( )
20 4 P X < .

Reenja 4.4
1. Ako je sluajna promenljiva X podlee zakonu raspodele
( )
2
20,10 N izraunati verovatnou
( ) 5 28 P X < < .
20 = - matematiko oekivanje
10 = - disperzija
X
Z

=
( ) ( )
( ) ( )
5 20 28 20
5 28 1.5 0.8
10 10
0.8 1.5 0,78814 0,06681 0.72133
P X P Z P Z
F F
| |
< < = < < = < < =
|
\
= = =


2. Ako je sluajna promenljiva X B( ) 100, 0.1 , koja aproksimira binomnu raspodelu normalnom,
nai priblino verovatnou ( ) 4 22 P X < < .
100 0.1 10 np = = = - matematiko oekivanje
2
10 0.9 9 npq = = = - disperzija
Binomna raspodela se moe aproksimirati normalnom raspodelom sa parametrima
( )
2
10, 3 N .
15
( ) ( ) ( )
4 10 22 10
4 22 4 2
3 3
0.99997 0.02275 0.97722
P X P Z F F
| |
< < = < < = =
|
\
= =

3. Ako je sluajna promenljiva X B( ) 20, 0.3 nai verovatnou ( ) 3 7 P X < < .
a) Binomnu raspodelu aproksimirati Poasonovom raspodelom
b) Binomnu raspodelu aproksimirati normalnom raspodelom
a) Binomna raspodela se moe aproksimirati Poasonovom raspodelom sa parametrom
20 0.3 6 ; np = = =
( ) ( ) ( ) ( )
4 5 6 20 20 20
4 5 6
6 6 6
4 5 6
6 6 6
0,133853 0,160623 0,160623 0, 455099
4! 5! 6!
P A p p p P S P S P S
e e e

= + + = = + = + = =
+ + = + + =


b) Binomna raspodela se moe aproksimirati normalnom raspodelom sa parametrima ( ) 6, 4.2 N .
20 0.3 6 np = = = - matematiko oekivanje
2
6 0.7 4.2 npq = = = - disperzija
( )
( ) ( )
3 6 7 6 1 3
3 7
4.2 4.2 4.2 4.2
0.488 1.464 0.68723 0.07160 0.61563
P X P Z F F
F F
| | | | | |
< < = < < = =
| | |
\ \ \
= =

Napomena: U primeru je velika razlika u verovatnoama koje su dobijene primenom navedenih
aproksimacija.
Primenom funkcije BINOMDIST dobila bi se vrednost 0.500923 koja je najtanija.
4 5 6 zbir
0,133853 0,160623 0,160623 0,455099 POISSON
0,130421 0,178863 0,191639 0,500923 BINOMDIST

Aproksimacije koje su raene nisu bile umesne ,(naroito normalna ), jer je 20 n = i 6 np = .
Navedene su zbog uvebavanja odreenih prorauna.
4. Ako je sluajna promenljiva X podlee zakonu raspodele
( )
2
20, 2 N izraunati:
( )
20 4 P X <
( ) ( ) ( )
( ) ( )
4 20 4
20 4 4 20 4
2 2 2
20
2 2 2 2
2
0.97725 0.02275 0.95450 95.5 %
X
P X P X P
X
P F F
| |
< = < < = < < =
|
\
| |
= < < = =
|
\
= =

16
II STATISTIKA
5. STATISTIKI SKUP
5.1. Osnovni pojmovi
Statistika je deo matematike koji se bavi sistematizacijom, predstavljanjem i obradom podataka
koji karakteriu elemente pojedinih skupova a izraavaju se pomou brojeva. Takvi podaci se nazivaju
statistikim podacima. Statistika razvija postupke na osnovu kojih se donose odgovarajui tani
zakljuci koji su od znaaja u skoro svim naukama kako u teorijskom tako i u praktinom smislu.
Statistiki skup (populacija) je skup svih elemenata na kojima se neka pojava statistiki
obrauje.Populacija moe biti konana ili beskonana ali e se ovde razmatratni samo konane
{ }
1 2
, , ,
n
= L .
Obeleje je osobina po kojoj se elementi statistikog skupa razlikuju i koja je u osnovi statistike
obrade.
Isti statistiki skup moe imati vie obeleja. Obeleja mogu biti numerika i atributivna.
Numerika obeleja pomou brojeva izraavaju kvantitativne razlike meu elementima statistikog
skupa. Prema vrsti brojeva pomou kojih se izraavaju razlikuju se neprekidna i prekidna obeleja.
Neprekidna obeleja se izraavaju realnim vrednostima unutar nekog intervala dok se prekidna
obeleja izraavaju celim brojevima jer se dobijaju prebrojavanjem.
Atributovna obeleja izraavaju kvalitativne razlike pomou modaliteta.

Primer 5.1.1.
Statistiki skup (populacija) je skup svih studenata Visoke ICT upisanih 2008. godine.
Za svakog studenta se mogu posmatrati razna obeleja.
-Jedno neprekidno numeriko obeleje je : visina studenta (teorijski bilo koji broj iz intervala
[ ] , v V gde je v visina najnieg a V visina najvieg studenta
-Drugo neprekidno numeriko obeleje je : broj bodova za uspeh iz srednje kole (bilo koji broj iz
intervala [ ] 16, 40 )
-Primer za prekidno numeriko obeleje: broj tano uraenik zadataka na prijemnom ispitu ( ceo
broj od 0 do 10).
-Primer za atributivno obeleje je : pol studenta (koji se iraava preko dva modaliteta enski i
muki).


17
5.2. Prikazivanje podataka ; Raspodela obeleja
Najjednostavniji nain prikazivanja podataka je njihovo nabrajanje.To je esto nepregledno pa se
pribegava razliitim postupcima njihove sistematizacije.
Statistika se bavi i grafikom interpretacijom podataka. Taj deo se naziva deskriptivnom
statistikom. Podaci se, zbog jasnosti i preglednosti mogu predstaviti pomou tabela, grafikona,
dijagrama i tako dalje.
Neka je { }
1 2
, , ,
n
= L populacija, : X R obeleje i
1 2
, , ,
m
x x x K vrednosti koje
moe uzeti obeleje. Oznaimo sa ( )
i
f x broj elemenata populacije na kojima obeleje X uzima
vrednosti
i
x , za svako { } 1, 2, 3,..., i m .
DEF Frekvencija
i
f je broj pojavljivanja nekog podatka u okviru skupa podataka.
DEF Relativna frekvencija
i
f
n
je broj pojavljivanja nekog podatka podeljen brojem elemenata
skupa.

Primer 5.2.1. (prekidno numeriko obeleje)
Anketirano je 30 studenata. Jedno pitanje se odnosilo na broj poloenih ispita u toku jedne
godine. Dobijeni su sledei podaci:
3,2,2,3,5,1,6,2,3,3, 4,5,2,3,4,4,5,3,3,4 4,3,5,4,3,5,4,2,3,5 nabrajanje podataka
Prvi korak u uvoenju reda prilikom obrade nekih podataka je njihovo ureivanje po nekom
principu. U zavisnosti od vrste podataka ti postupci se razlikuju. Ako su u pitanju brojni podaci
korisno je njihovo sreivanje po veliini (sortiranje).
Sortirani podaci bi izgledali ovako:
1, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 6
Ako se u skupu podataka neki podaci pojavljuju vie puta, onda broj ponavljanja predstavlja
frekvenciju
i
f , i-tog elementa.
{ {
1 1 5 10 7 6
1 , 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 6
14243 144424443 1442443 14243

Na primer,
3
10 f = a
5
6 f = .
Da bi se pratile pozicije elemenata poreanih po veliini u okviru skupa, moe se dati i kumulativna
frekvencija.
Kumulativna frekvencija nekog elementa se dobija sabiranjem frekvencija svih elemenata koji mu
prethode. Na primer: 3 i manje poloenih ispita ima 16 sudenata a 4 i manje ima 23 studenta.
Kolika je zastupljenost pojedinih elemenata unutar posmatranog skupa podataka pokazuje relativna
frekvencija
i
f
n
. Ona moe biti iskazana i procentualno.Na primer : 2 poloena ispita ima
5
16, 67%
30
=

studenata.
18
Navedene veliine se pregledno mogu prikazati pomou tabele.

Element skupa
Broj poloenih
ispita
i
x
Frekvencija
Broj studenata
i
f
Kumulativna
frekvencija
Relativna
frekvencija
i
f
n

1 1 1
1
3, 33%
30
=

2 5 6
5
16, 67%
30
=

3 10 16
10
33, 33%
30
=

4 7 23
7
23, 33%
30
=

5 6 29
6
20%
30
=

6 1 30
1
3, 33%
30
=


6
1
30
i
i
n f
=
= =





Osnovni podaci (iz osenenog dela tabele) mogu se predstaviti pomou histograma. Histogram se
sastoji od niza pravougaonika kojima je jedna dimenzija vrednost klase (1,2,3,4,5,6) a druga,
odgovarajue vrednosti frekvencija.













Histogram: Broj poloenih ispita

1 2
2
4
6
8
10
12
3 4 5 6
f
19
Zastupljenost pojedinih elemenata se moe predstaviti pomou poligona frekvencije . Poligon
frekvencije se dobija spajanjem taaka ( , )
i
i f . U navedenom primeru spajanjem taaka:
(1,1) ; (2, 5) ; (3,10) ; (4, 7) ; (5, 6) ; (6,1) .











Poligon frekvencije: Broj poloenih ispita











Odnos histograma i poligona frekvencije
Histogram i bar dijagram su sastavljeni od istih pravougaonika koji su u drugom sluaju
razdvojeni.








Bar chart 2 D: Broj poloenih ispita
0
2
4
6
8
10
12
1 2 3 4 5 6
vrednost
f
r
e
k
v
e
n
c
i
j
a
0
2
4
6
8
10
12
1 2 3 4 5 6
vr e dnos t
f
r
e
k
v
e
n
c
i
j
a
1 2
2
4
6
8
10
12
3 4 5 6
f
20










Bar chart 3 D: Broj poloenih ispita

Brojni podaci iz navedene tabele mogu se predstavljati i na druge naine pomou razliitih oblika
dijagrama. Najee se koriste dijagrami u obliku stubova (bar chart) ili krugova- pita ( pie chart).
Moda bi za ove druge, umesto pite, bolja asocijacija u duhu naeg jezika, bio burek ili torta. Za oba
tipa postoje dvodimenzione i trodimenzione varijante.










Pie chart 2 D: Broj poloenih ispita










Pie chart 3 D: Broj poloenih ispita
Frekvencija i relativna frekvencija
1; 1; 3%
2; 5; 17%
3; 10; 34%
4; 7; 23%
5; 6; 20%
6; 1; 3%
Frekvencija i relativna frekvencija
1, 1, 3%
2, 5, 17%
3, 10, 34%
4, 7, 23%
5, 6, 20%
6, 1, 3%
1; 1
2; 5
3; 10
4; 7
5; 6
6; 1
0
2
4
6
8
10
1 2 3 4 5 6
Frekvencija i relativna frekvencija
21
U prethodnom primeru je na razliite naine prikazana raspodela za jedno prekidno numeriko
obeleje.
Kod neprekidnih obeleja vrednosti se grupiu u intervale i tako se dobijaju intervalne serije
distribucije frekvencije. Intervali odgovaraju klasama u koje je podeljen statistiki skup kod prekidnih
obeleja.
Intervali se koriste i kada je preveliki broj klasa kod prekidnih obeleja.
Intervali imaju donju i gornju granicu. Radi lakeg predstavljanja i matematike obrade intervalnih
serija uvodi se razredna sredina. Ona je aritmetika sredina krajeva intrvala
2
dgi ggi +
( dgi -donja
granica intervala ; ggi -donja granica intervala ) Geometrijski, to je srednja taka nekog intervala.
Odreivanje broja intervala ( k ) i irine intervala ( i ) nije sasvim proizvoljno . U statistikoj
literaturi esto se koristi Stuges-ova formula:
1 3, 3log k n = + ;
max min
x x
i
k

=
Ponekada, se vrednost kojom poinje donja granica prvog grupnog intervala (
0
x ) dobija po formuli :

0 min
2
i
x x =
*Napomena:
Broj intervala treba da bude, zbog preglednosti , izmeu 5 i 12.
esto je i sam skup snabdeven nekom unutranjom, loginom, podelom na disjunktne klase, pa se
toga treba pridravati.

Primer 5.2.2. (prekidno numeriko obeleje )
Anketirano je 30 studenata. Pitanje se odnosilo na broj bodova koji su osvojili na testu iz
matematike, na prijemnom ispitu.. Dobijeni su sledei podaci:

30 0 2 10 48 14 14 54 6 28
30 40 18 30 44 38 10 4 10 34
14 6 48 0 0 8 26 60 54 52

a) Grupisati podatke u obliku intervalne numerike serije
b) Dati histogram frekvencije (ili bar dijagram ako se radi u Excelu)
c) Dati poligon frekvencije.
a) U ovom sluaju je 30 n =
min max
0 ; 60 x x = =
Odreivanje broja intervala ( k ) :
1 3, 3log 1 3, 3log30 1 3, 3 1, 477 1 4, 875 6 k n = + = + = + = +
22
Odreivanje irine intervala ( i ). ;
max min
60 0
10
6
x x
i
k

= = =
Vrednost kojom poinje donja granica prvog grupnog intervala (
0
x ) dobija se :
0 min
10
0 5
2 2
i
x x = = = . Zbog prirode podataka, koji ne mogu biti negativni, u ovom sluaju e
ona biti 0.

Tabela grupisanja kandidata prema broju bodova:

Broj bodova
i
x Broj studenata
i
f Relativna frekvencija
i
f
n

0-10 11
11
36, 67%
30
=

11-20 4
4
13, 33%
30
=

21-30 5
5
16, 67%
30
=

31-40 3
3
10%
30
=

41-50 3
3
10%
30
=

51-60 4
4
13, 33%
30
=

Ako se prethodna napomena uzme u obzir, i bez ikakve (komplikovane) raunice, dolo bi se do
istog broja intervala i do njihove duine.
b) Bar dijagram :










Histogram bi izgledao slino, samo bi pravougaonici bili spojeni. Imali bi irinu 10 a visina bi im bila
ista.

Prijemni ispit
0
5
10
15
0-10 11-
20
21-
30
31-
40
41-
50
51-
60
Osvojeni bodovi
B
r
o
j

s
t
u
d
e
n
a
t
a
Broj studenata
23
c) Poligon frekvencije






Oznake na x- osi su mogle biti 5,15,25, 35, 45, 55 odnosno, umesto intervala mogle su biti navedene
razredne sredine (srednje vrednosti intervala).

5.3. P Pr ri ik ka az z r re ez zu ul lt ta at ta a S St ta ab bl lo o- -l li is st t m me et to od do om m
P Pr ri il li ik ko om m s sr re e i iv va an nj ja a p po od da at ta ak ka a i i n nj ji ih ho ov ve e k kl la as si if fi ik ka ac ci ij je e u u o od dr re e e en ne e k kl la as se e n ne ek ka ad da a j je e k ko or ri is sn no o p po os sl lu u i it ti i s se e
m me et to od do om m S St ta ab bl lo o- -l li is st t ( ( S St te ea am m- -a an nd d- -L Le ea af f ) ). .
Prikazaemo ovu metodu na primeru dvoocifrenih podataka
Prikaz podataka ovom metodom se izvodi na sledei nain:
- Formira se tabela sa dve kolone i sa onoliko vrsta koliko ima klasa u koje e biti rasporeeni podaci.
- U prvoj koloni su prve cifre brojnih podataka ( 0-9 )
- U drugoj koloni su druge cifre brojnih podataka ( 0-9 ) navedene onoliko puta u koliko podataka su
zastupljene. Ukupan broj listova je jednak broju podataka koji se predstavljaju.
Primer 5.3.1.
Anketirano je 40 potroaa. Pitanje se odnosilo na broj artikala koji su kupili u toku jedne nedelje.
Dobijeni su sledei podaci:
23 20 32 10 41 14 14 54 61 28
30 40 18 30 44 68 10 42 10 34
12 43 70 24 56 33 72 54 71 79
14 26 48 20 30 28 26 60 54 52

S St ta ab bl lo o- -l li is st t p pr ri ik ka az z o ov vi ih h p po od da at ta ak ka a s se e daje se tabelom:










Stablo List
1 0 4 4 8 0 0 2 4
2 3 0 8 4 6 0 8 6 2
3 2 0 0 4 3 0
4 1 0 4 2 3 8
5 4 6 4 4
6 1 8 0
7 0 2 1 9
Prijemni ispit
0
5
10
15
0-10 11-20 21-30 31-40 41-50 51-60
Osvojeni bodovi
B
r
o
j

s
t
u
d
e
n
a
t
a
Broj studenata
24
P Pr rv va a k ko ol lo on na a j je e s st ta ab bl lo o ( (1 1, ,2 2, ,. .. .. ., ,7 7) )
D Dr ru ug ga a k ko ol lo on na a p pr re ed ds st ta av vl lj ja a l li is st to ov ve e ( (0 0, ,1 1, ,. .. .. ., , 9 9) ). .
I Iz z o ov vo og g p pr ri ik ka az za a s se e v vi id di i d da a s se e p po od da ac ci i m mo og gu u p po od de el li it ti i u u s se ed da am m k kl la as sa a. . ] ] ]
10,19 ; 20, 29 ; 70, 79

K . .
N Na a t ta aj j n na a i in n s se e d da aj ju u d de et ta al lj jn ni ij je e i in nf fo or rm ma ac ci ij je e o o p po od da ac ci im ma a u un nu ut ta ar r s sv va ak ke e k kl la as se e. .
N Na a p pr ri im me er r, , u u s st ta ab bl lu u 1 1 s su u p po od da ac ci i i iz z i in nt te er rv va al la a ]
10,19

. .



I Im ma a i ih h u uk ku up pn no o 8 8 i i t to o s su u : : 1 10 0, ,1 14 4, , 1 14 4, ,1 18 8, , 1 10 0, ,1 10 0, , 1 12 2 i i 1 14 4. .

U U s st ta ab bl lu u 6 6 i im ma a 3 3 v vr re ed dn no os st ti i a a t to o s su u: : 6 61 1, ,6 68 8 i i 6 60 0. .



N Na a s sl li i a an n n na a i in n s se e m mo og gu u p pr ri ik ka az za at ti i i i b br ro oj jn ni i p po od da ac ci i d dr ro og ga a i ij je eg g t ti ip pa a. . L Li is st to ov vi i m mo og gu u b bi it ti i d dv vo oc ci if fr re en ni i b br ro oj je ev vi i. .
N Na a p pr ri im me er r: :


p pr re ed ds st ta av vl lj ja a p po od da at tk ke e 1,201; 1,215; 1,232; 1,210
Ako je broj podataka veliki (>100) ovakav prikaz nije pogodan ve se koriste drugi naini.

5.4 Vebanje:

1.Anketirano je 40 potroaa. Pitanje se odnosilo na broj artikala koji su kupili u toku jedne
nedelje. Dobijeni su sledei podaci:

23 20 2 10 41 14 14 54 6 28
30 40 18 30 44 68 10 4 10 34
12 43 7 24 56 33 7 54 71 79
14 6 48 0 0 8 26 60 54 52

a) Grupisati podatke u obliku intervalne numerike serije
b) Dati histogram frekvencije
c) Dati poligon frekvencije
d) Dati S St ta ab bl lo o- -l li is st t p pr ri ik ka az z p po od da at ta ak ka a. .





1 0 4 4 8 0 0 2 4
6 1 8 0
1,2 0 01 1 1 15 5 3 32 2 1 10 0
25
2.Dat je S St ta ab bl lo o- -l li is st t p pr ri ik ka az z p po od da at ta ak ka a: :








a) Grupisati podatke u obliku intervalne numerike serije
b) Dati histogram frekvencije.
c) Dati poligon frekvencije.
Stablo List
1 2 0 4 4 8 0 0 2 4
2 3 0 8 4 6 0 8 6 2
3 2 0 0 4 3 0
4 1 0 4 2 3 8
5 5 6 0 4 6 4 4
6 1 8 0
26
ANALIZA PODATAKA
Da bi se izvrila analiza statistikog skupa ili nekog obeleja izraunavaju se nove veliine,
pokazatelji odreenih osobina. Pokazatelji (parametri) koji se najee koriste su:








Pregled najee korienih parametara statistikog skupa

6. SREDNJE VREDNOSTI
Srednje vrednosti su vani pokazatelji osobina statistikog skupa. To su prosene vrednosti na
osnovu kojih se dobijaju vane informacije o celoj populaciji. Srednje vrednosti reprezentuju itav
skup pa su znaajne prilikom uporeivanja razliitih skupova.
Postoje dve osnovne grupe srednjih vrednosti :
IZRAUNATE ( aritmetika sredina, geometrijska sredina, harmonijska sredina,...)
POZICIONE (mod, medijana, kvartil...)
Postoje i drugi, slini, parametri ali su ovi najvie korieni.
















POKAZATELJI
osobina skupa

SREDNJE
VREDNOSTI
MERE
VARIJABILITETA
(POKAZATELJI
DISPERZIJE)
MERE
ASIMETRIJE I
SPLJOTENOSTI

SREDNJE
VREDNOSTI

IZRAUNATE


POZICIONE


Aritmetika
sredina

Geometrijska
sredina

Harmonijska
sredina

Mod

Medijana

Kvartili
27
6.1. Aritmetika sredina ( X )
DEF Za
1 2
, , ,
n
x x x K aritmetika sredina je

1 2
1
1
n
n
i
i
x x x
X x
n n
=
+ + +
= =

L

Prosta aritmetika sredina se dobija u onim serijama gde se svaki od n podataka
1 2
, , ,
n
x x x K ,
javlja samo po jednom.

Primer 6.1 1.
Izraunati aritmetiku sredinu za brojeve : 1,3,7,11,15,20.
1 3 7 11 15 20 57
9, 5
6 6
X
+ + + + +
= = =

Primer 6.1 2.
Izraunati proseni promet (u hiljadama dinara) u toku nedelje, na jednom alteru pote :

i
x
1. Ponedeljak 98
2. Utorak 76
3. Sreda 79
4. etvrtak 56
5. Petak 81
6. Subota 51
Proseni promet 73,5


Proseni promet:
( )
6
1 2 3 4 5 6
1
1 1
73, 5
6 6
i
i
X x x x x x x x
=
= = + + + + + =




Ponderisana aritmetika sredina (ponderatio-odmeravanje lat) se koristi ukoliko postoje vrednosti
koje se ponavljaju vie puta. Aritmetika sredina se tada dobija po formuli:

1 1 2 2 1
1 2
1
n
i i
n i
n
n
i
i
x f
x f x f x f
X
f f f
f
=
=

+ + +
= =
+ + +

L
L



28
Primer 6.1 3.
Izraunati prosenu ocenu na ispitu ako su postignuti rezultati dati tabelom:
Ocena ( )
i
x Broj studenata ( )
i
f
5 7
6 14
7 11
8 8
9 6
10 4

Prosena ocena je :
1 1 2 2
1 2
5 7 6 14 7 11 8 8 9 6 10 4
7 14 11 8 6 4
354
7, 08
50
n
n
x f x f x f
X
f f f
+ + + + + + + +
= = =
+ + + + + + + +
= =
L
L


Primer 6.1 4.
Izraunati prosean broj bodova na prijemnom ispitu ako su postignuti rezultati dati tabelom:
U sluaju intervalnih serija potrebno je izraunati srednje vrednosti intervala.
Da se podsetimo, to su aritmetike sredine krajeva intrvala
2
dgi ggi +

( dgi -donja granica intervala ; ggi -donja granica intervala ).
Prilikom izraunavanja korisno je sliiti se tabelom sa meurezultatima.

Broj bodova Broj studenata
i
f Razredna sredina
i
x i i
f x
0-10 11 5 55,00
11-20 4 15,5 62,00
21-30 5 25,5 127,50
31-40 3 35,5 106,50
41-50 3 45,5 136,50
51-60 4 55,5 222,00
30 709,50

Prosean broj bodova je:
1 1 2 2
1 2
5 11 15, 5 4 25, 5 5 35, 5 3 45, 5 3 55, 5 4
11 4 5 3 3 4
55 62 127, 5 106, 5 136, 5 222 709, 5
23, 65
30 30
n
n
x f x f x f
X
f f f
+ + + + + + + +
= = =
+ + + + + + + +
+ + + + +
= =
L
L

29



6.2. Geometrijska sredina (G)

DEF Za
1 2
, , , 0
n
x x x > K geometrijska sredina je
1 2
n
n
G x x x = L .
Geometrijska sredina se koristi u ekonomskoj statistiici u praenju dinamike odreenih procesa.
Njeno izraunavanje je vezano za logaritme. Zbog definisanosti n-tog korena i logaritma , ona se
izraunava samo ako su sve vrednosti sa kojima se radi strogo pozitivne.

Logaritmovanjem leve i desne strane ( moe za proizvoljnu osnovu ali uzeemo osnovu 10) dobija
se:

( )
( )
1 2
1
1 2
1 2
1 2
log
log log
1
log log
log log log
log
n
n
n
n
n
n
G x x x
G x x x
G x x x ili
n
x x x
G
n
=
=
=
+ + +
=
L
L
L
L

Antilogaritmovanjem se dobija geometrijska sredina.

( )
1 2
log
10
n
x x x
n
G =
L
ili
1 2
log log log
10
n
x x x
n
G
+ + +
=
L


Primer 6.2 1.
Izraunati geometrijsku sredinu za brojeve : 1,3,7,11,15,20.

6
1
6
1 3 7 11 15 20 log
1 4,84073
log log69300 log69300 0, 80679
6 6
G
G
=
= = = =

0.80679
10 6.409 G = =


Za sluaj grupisanih podataka
1 2
, , ,
k
x x x K koji imaju frekvencije
1 2
, , ,
k
f f f K formula za geometrijsku sredinu glasi:

1 2
1 2 1 2
;
k
f f f
n
k k
G x x x n f f f = = + + + L L
30



31
6.3. Harmonijska sredina (H)
DEF Za
1 2
, , ,
n
x x x K harmonijska sredina je :

1 2 1
1 1 1 1
n
n i i
n n
H
x x x x
=
= =
+ + +

L

Prosta harmonijska sredina se dobija u onim serijama gde se svaki od n podataka
1 2
, , ,
n
x x x K ,
javlja samo po jednom.

Primer 6.3 1.
Izraunati harmonijsku sredinu za brojeve : 1,3,7,11,15,20.
6 6
1 1 1 1 1 1 4620 1540 660 420 308 331
1 3 7 11 15 20 4620 4620 4620 4620 4620 4620
6 4620 27720
3, 52
7879 7879
H = = =
+ + + + + + + + + +

= = =

Da bi se pravila manja raunska greka razlomci u imeniocu su dovedeni na
(1, 3, 7,11,15, 20) 3 4 5 7 11 4620 NZS = = .
Moglo se raditi i ovako:
6 6 6
1 1 1 1 1 1
1 0, 33 0,14 0, 09 0, 07 0, 05 1, 68
1 3 7 11 15 20
3, 57
H = = = =
+ + + + +
+ + + + +
=


Harmonijska sredina se koristi u sluajevima viestruke obrnute proporcionalnosti
Primer 6.3 1. je mogao biti formulisan i na drugi nain:
est maina, razliite starosti, proizvodi isti artikal i potrebno im je vreme navedeno u tabeli:








Izraunati proseno radno vreme za izradu artikla.
Izraunata harmonijska sredina 3, 57s predstavlja traeno proseno vreme.
R.b. maine: Vreme u s (
i
x )
1. 1
2. 3
3. 7
4. 11
5. 15
6. 20
32
Ponderisana harmonijska sredina se koristi ukoliko postoje vrednosti koje se ponavljaju. Za sluaj
grupisanih podataka
1 2
, , ,
k
x x x K koji imaju frekvencije
1 2
, , ,
k
f f f K formula za harmonijsku
sredinu glasi:
1 2
1 2 1
1
n
n
n i i
n n
H
f f f
x x x x
=
= =
+ + +

L
gde je
1 2 n
n f f f = + + + L .

Uporeivanjem aritmetike , geometrijske i harmonijske sredine dobija se:
X G H
U predhodnim primerima, za brojeve 1,3,7,11,15,20 , izraunate su:

9, 5 X = 6, 409 G = 3, 57 H =


U EXCEL-u postoje statistike funkcije AVERAGE, GEOMEAN i HARMEAN pomou kojih se
izraunavaju navedene sredine . Njihovom primenim se dobija:





1
3
7
11
15
20
Aritmetika sredina (AVERAGE) 9,5

Geometrijska sredina (GEOMEAN) 6,408979

Harmonijska sredina (HARMEAN) 3,56344
33
6.4. Pozicione srednje vrednosti; Mod ( ) Mo ; Medijana( ) Me ; Kvartili ( )
i
Q
Prilikom posmatranja statistikog skupa ili nekog obeleja podaci se daju u sreenom nizu, to jest
poreani po veliini. Mogue je posmatrati srednje vrednosti koje su definisane svojim mestom,
odnosno pozicijom, u navedenoj seriji.

DEF Mod ( ) Mo je vrednost obeleja koja u navedenom nizu podataka ima najveu frekvenciju.
To je vrednost koja se najee javlja. U upotrebi su i termini modus ili modalna vrednost.
Primer 6.4.1
Meu podacima: 1,1, 3, 5,5,5,5,5,5,5, 7, 9,9, 11,11,11, 13,13, 15,15,15 postoji mod i on iznosi 5.
5 Mo =
Primer 6.4.2
U nizu podataka ne mora da postojati mod.
To je sluaj u nizu: 2,4,6,8,10,12,14,16

Primer 6.4.3
Moe se desiti da postoji vie modova.
Meu podacima: 1,1,1, 3,3, 5,5, 7, 9,9, 11,11,11, 13,13, 15,15,15, 17, 19, 21,21 postoje tri moda i to
su 1, 11 i 15.

Za neprekidne vrednosti obeleja, one koje su grupisane po intervalima, mod se ne vidi direktno
nego se izraunava. Uoavaju se intervali sa najveim frekvencijama (modalni intervali) i koristi se
formula:

( ) ( )
2 1
1
2 1 2 3
f f
Mo a d
f f f f

= +
+

1
a - donja granica modalnog intervala
d - veliina grupnog intervala
1
f ,
2
f ,
3
f - frekvencije premodalnog, modalnog i poslemodalnog intervala

Primer 6.4.4
Za 40 telefonskih razgovora merena je duina trajanja.Izraunati mod za podatke date tabelom.

Duina razgovora
u minutama
0-2 2-4 4-6 6-8 8-10 10-12 12-14
Broj razgovora 7 6 14 8 2 2 1

Napomena: Intervali su navedeni u obliku [ )
1
,
i i
a a
+

Modalni interval je [ ) 4, 6
34
1
4 a = - donja granica modalnog intervala
2 d = - veliina grupnog intervala
1
6 f = ,
2
14 f = ,
3
8 f = - frekvencije premodalnog, modalnog i poslemodalnog intervala
( ) ( )
14 6 8 4
4 2 4 2 4 2 4 1,14 5,14
14 6 14 8 8 6 7
Mo

= + = + = + = + =
+ +
!!!!!!!!!!


DEF Medijana ( Me ) je vrednost obeleja koja u navedenom nizu podataka, ureenom po
veliini, zauzima srednju poziciju.

Pri odreivanju medijane treba imati u vidu da li je broj elemenata skupa koji ine obeleje, neparan ili
paran.
U sluaju neparnog broja elemenata, medijana je srednji lan.
Primer 6.4.5
U nizu podataka 1,1, 3, 5,5,5,5,5,5,5, 7, 9,9, 11,11,11, 13,13, 15,15,15 kojih ima 21, srednji je
jedanaesti po redu a to je 7. 7 Me =

U sluaju parnog broja elemenata, postoje dva srednja lana i medijana se dobija kao aritmetika
sredina srednjih lanova..
Primer 6.4.6
U nizu: 2,4,6,8,10,12,14,16 kojih ima 8, postoje dva srednja lana a to su 8 i 10.

8 10
9
2
Me
+
= =
Za neprekidne vrednosti obeleja, one koje su grupisane po intervalima, odreuje se medijalni
interval u kome se nalazi sredinji lan . Za nalaenje pozicije medijane koriste se obrasci:
1
2
n
i
i
f
=

sa neparanim ili
1
1
2
n
i
i
f
=
+

sa paranim brojem podataka u seriji.


Za izraunavanje medijane se koristi formula :

1
1
1
2
k
i
i k
d N
Me a f
f

=
| |
= +
|
\

ako je neparan broj podataka u seriji ili


1
1
1
1
2
k
i
i k
d N
Me a f
f

=
+ | |
= +
|
\

ako je paran broj podataka u seriji


1
a - donja granica medijalnog intervala
d - veliina grupnog intervala
N - broj lanova skupa
35
1
1
k
i
i
f

-zbir svih frekvencija predmedijalnih intervala


k
f - frekvencije medijalnog intervala
Primer 6.4.7.
Za 55 telefonskih razgovora merena je duina trajanja.Izraunati medijanu za podatke date
tabelom.
Duina razgovora
u minutama
0-2 2-4 4-6 6-8 8-10 10-12 12-14
Broj razgovora 16 13 10 5 4 3 4

Pozicija srednjeg lana,
1
55
27, 5
2 2
n
i
i
f
=
= =


Medijalni interval je [ ) 2, 4
1
2 a = - donja granica medijalnog intervala
2 d = - veliina grupnog intervala
55 N = - broj lanova skupa
1
16 f = - postoji samo jedan predmedijalni interval
2
13 f = - frekvencije medijalnog intervala
1
1
1
2 55 2 23
2 16 2 3, 769
2 13 2 13 2
k
i
i k
d N
Me a f
f

=
| | | |
= + = + = + =
| |
\ \


Moe se zakljuiti da polovina razgovora traje manje od 3,769 minuta.
Primer 6.4.8.
Za 40 telefonskih razgovora merena je duina trajanja.Izraunati medijanu za podatke date
tabelom.
Duina razgovora
u minutama
0-2 2-4 4-6 6-8 8-10 10-12 12-14
Broj razgovora 7 6 14 8 2 2 1

Pozicija srednjeg lana,
1
1
40 1
20, 5
2 2
n
i
i
f
=
+
+
= =


Medijalni interval je [ ) 4, 6
1
4 a = - donja granica medijalnog intervala
2 d = - veliina grupnog intervala
36
40 N = - broj lanova skupa
3
1
7 6 13
i
i
f
=
= + =

-zbir svih frekvencija predmedijalnih intervala


3
14 f = - frekvencije medijalnog intervala
1
1
1
1 2 41 1 15
4 13 4 5, 07
2 14 2 7 2
k
i
i k
d N
Me a f
f

=
+ | | | | | |
= + = + = + =
| | |
\ \ \



DEF Kvartili ( ; 1, 2, 3
i
Q i = ) su vrednosti koje dele obeleje (navedeni niz podataka,
ureen po veliini) na etiri jednaka dela.





Prvi kvartil (
1
Q ) je vrednost obeleja od koje 25% elemenata skupa, ureenih po veliini, ima manju
ili jednaku vrednost.
Drugi kvartil (
2
Q ) je medijana Me .
Trei kvartil (
3
Q ) je vrednost obeleja od koje 75% elemenata skupa, ureenih po veliini, ima
manju ili jednaku vrednost.

Kod intervalnih serija kvartili se izraunavaju slino kao medijana:
1
1
1 1
1
4
k
i
i Q
d N
Q a f
f

=
| |
= +
|
\

;
3
1
3 1
1
3
4
k
i
i Q
d N
Q a f
f

=
| |
= +
|
\


1
a - donja granica kvartilnog intervala
d - veliina grupnog intervala
N - broj lanova skupa
1
1
k
i
i
f

-zbir svih frekvencija predkvartilnih intervala


i
Q
f - frekvencije kvartilnog intervala

Primer 6.4.9.
Dati su podatci: 1,1,1,1, 2,2,2,2,2,2,3,3,3,4,4,4,4,4,4,5,6,6,7,7!!!!!!!!!!!Dodata4
Odrediti prvi kvartil (
1
Q ), drugi kvartil (
2
Q ) i trei kvartil (
3
Q ).

1
Q
3
Q
4
Q
2
Q
37
Kvartili se najbolje vide iz tabele u kojoj se kumulativna frekvencija izrazi u procentima. Tada je jasno
koje su to vrednosti od kojih 25% (50%,75%) elemenata skupa, ureenih po veliini, ima manju ili
jednaku vrednost.

Element skupa
i
x
Frekvencija
i
f
Kumulativna
frekvencija
Kumulativna
frekvencija u %

1 4 4 16, 67%


2 6 10 41, 67%

1. kvartil
3 3 13
51,17%

2. kvartil (Me)
4 6 19
79,17%
3. kvartil
5 1 20
83, 33%

6 2 22
91, 67%


7 2 24 100%

7
1
24
i
i
n f
=
= =






Prvi kvartil (
1
Q ):
1
2 Q =
Drugi kvartil (
2
Q ) ili medijana: 3 Me = .
Trei kvartil (
3
Q ):
3
4 Q =

U EXCEL-u postoje statistike funkcije MODE, QUARTILE koje se mogu koristiti za izraunavanje
navedenih pozicionih srednjih vrednosti.














38

6.5. Vebanje
1) U trci na 2400m mereno je vreme i
dobijeni su rezultati koji su prikazani tabelom:








a) Formirati tabelu u kojoj e biti ( )
i
t -vreme u i- tom krugu i ( )
i
v brzine ostvarene u svakom krugu.
b) Izraunati proseno vreme po krugu t i prosenu brzinu po krugu v .
c) Grafiki predstaviti vremena ( )
i
t postignuta u pojedinim krugovima.
a)
( )
s
v
t
= ( )
i
t -vreme u i- tom krugu u s ;
400
i
i
v
t
= ( )
i
v - brzina u
m
s














Krug
Vreme na kraju
i. tog kruga u s
Vreme na kraju
i. tog kruga
1. 115 1' 55"
2. 222 3' 42"
3. 337 5' 37"
4. 453 7' 33"
5. 570 9' 30"
6. 685 11' 25"
Trka na 2400 metara

Krug
( )
i
t

Vreme u
i- tom krugu
( )
i
v
1 115 1' 55" 3,478261
2 107 1' 47" 3,738318
3 115 1' 55" 3,478261
4 116 1' 56" 3,448276
5 117 1' 57" 3,418803
6 115 1' 55" 3,478261
t t v
Prosek:

114,16667 1' 54" 3,506697
39
b) Proseno vreme po krugu 114,16667 t s =
Prosena brzina po krugu 3,506697 / v m s = .
c)







2) Izraunati aritmetiku, geometrijsku i harmonijsku sredinu za brojeve : 1,3,4,5,6,7,10,11.

Odgovor:
Aritmetika sredina (AVERAGE) 5.875

Geometrijska sredina (GEOMEAN) 4.79015

Harmonijska sredina (HARMEAN) 3.502985


3) Za podatke date tabelom

i
x
1 2 3 4 5 6 7
i
f
4 6 3 5 2 2 3

odrediti mod, medijanu, prvi kvartil (
1
Q ),i trei kvartil (
3
Q ).

Odgovor:
2 Mo = ;
2
3 Me Q = = ;
1
2 Q = ;
3
5 Q =



7. MERE VARIJABILITETA (POKAZATELJI DISPERZIJE)
Mere varijabiliteta za obeleje X jednog statistikog skupa vezane su za unutranji raspored
podataka u odnosu na reprezentativne podatke serije a to su razne sredine. Najee se analiziraju
odstupanja u odnosu na aritmetiku sredinu.
Postoje razliiti parametri koji mere odstupanja i rasipanje elemenata neke statistike serije.
Najznaajniji su:
- Raspon varijacije ( ) R
- Srednja devijacija ( ) SD
Trka na 2400m
100
105
110
115
120
1 2 3 4 5 6
KRUG
V
r
e
m
e

u

s
Series1
40
- Disperzija
2
( ) i standardna devijacija ( )
- Koeficijent varijacije ( )
V
K






7.1. Raspon varijacije

DEF Raspon varijacije ( ) R je razlika izmeu najvee i najmanje vrednosti obeleja nekog
statistikog skupa.

max min
R x x =
Ovaj najjednostavniji parametar pokazuje razmak izmeu maksimalne i minimalne vrednosti i
esto se koristi jer daje korisne informacije o podacima koji se obrauju. Na primer, raspon plata,
raspon temperatura u toku dana ,...

Primer 7.1.1.
U toku jedne sedmice izmerene su dnevne prosene temperature u Celzijusovim stepenima. Koliki
je raspon dnevnih temperatura u toku te nedelje ?

Nedelja
18,3 C
Ponedeljak
19,8 C
Utorak
17,6 C
Sreda
17,9 C
etvrtak
15,6 C
Petak
18,1 C
Subota
15,1 C
max min
19.8 ; 15.1 x x = =

Raspon dnevnih temperatura u toku posmatrane nedelje je:

max min
19,8 15,1 4, 7 R x x = = =


7.2. Srednja devijacija


MERE
VARIJABILITETA


Raspon varijacije
Koeficijent
varijacije

Disperzija i
stand. devijacija

Srednja devijacija
41
Za obeleje X jednog statistikog skupa ije su vrednosti
1 2
, , ,
n
x x x K i ija je aritmetika sredina
X , razlike
1 2
, , ,
n
x X x X x X K predstavljaju odstupanja (devijacije) vrednosti od njihove
atitmetike sredine.

DEF Srednja devijacija (SD) je aritmetika sredina apsolutnih vrednosti odstupanja vrednosti
obeleja od njihove aritmetike sredine..
Ako je srednje apsolutno odstupanje manje to znai da aritmatika sredina X bolje reprezentuje
podatke iz posmatranog niza.
Za prostu seriju podataka izraunava se po formuli:

1 2
1
n
i
n
i
x X
x X x X x X
SD
n n
=

+ + +
= =

L


Primer 7.2.1.
U toku jednog dana izmerene su podnevne temperature koje su date tabelom. Koliko je srednje
odstupanje (srednja devijacija) temperatura ?







prvo izraunati aritmetiku sredinu X . Potrebno je

10 11 9 12 1 13
9
6
X
+ + + +
= =

10 9 11 9 9 9 12 9 1 9 13 9
1 2 0 3 10 4 20
3.33
6 6 6
SD
+ + + + +
+ + + + +
= = = =

Srednje odstupanje temperatura iznosi 3.33 C .


Za grupisane podatke srednja devijacija se izraunava slino:

1 1 2 2
1
1 2
1
n
i i
n n
i
n
n
i
i
f x X
f x X f x X f x X
SD
f f f
f
=
=

+ + +
= =
+ + +

L
L


U EXCEL-u postoji funkcija AVEDEV koja izraunava srednju devijaciju.
Beograd
10 C
Kragujevac
11 C
Valjevo
9 C
Loznica
12 C
Kopaonik
-1 C
Novi Sad
13 C
42

Primer 7.2.2.
Izraunati srednju devijaciju ako su na ispitu postignuti rezultati dati tabelom:
Ocena ( )
i
x Broj studenata ( )
i
f
5 7
6 14
7 11
8 8
9 6
10 4

Navedena tabela je iz primera 6.1.3. u kom je izraunata prosena ocena, odnosno aritmetika sredina
:
1 1 2 2
1 2
5 7 6 14 7 11 8 8 9 6 10 4
7 14 11 8 6 4
354
7, 08
50
n
n
x f x f x f
X
f f f
+ + + + + + + +
= = =
+ + + + + + + +
= =
L
L

Da bi izraunavanje bilo preglednije i da bi se smanjila mogunost pravljenja raunskih greaka,
korisno je sve meurezultate prikazati u pomonoj tabeli.









6
1
6
1
61.12
1.22
50
i i
i
i
i
f x X
SD
f
=
=

== = =



7.3. Disperzija, standardna devijacija

Najvie je u upotrebi parametar koji predstavlja srednje kvadratno odstupanje svakog podatka iz
serije od aritmetike sredine.
DEF Disperzija (varijansa)
2
( ) je aritmetika sredina kvadrata odstupanja vrednosti obeleja od
njihove aritmetike sredine.

Ocena ( )
i
x Broj studenata ( )
i
f i
x X
i
x X
i i
f x X
5 7 -2.08 2.08 14.56
6 14 -1.08 1.08 15.12
7 11 -0.08 0.08 0.88
8 8 0.92 0.92 7.36
9 6 1.92 1.92 11.52
10 4 2.92 2.92 11.68
6 n =
6
1
50
i
i
f
=
=



6
1
61.12
i i
i
f x X
=
=

43
(1)
( ) ( )
2
2 2
1
2 1
( )
n
i
n
i
x X
x X x X
n n

+ +
= =

L


Za izraunavanje disperzije moe se koristiti i jednostavnija formula koja se izvodi na sledei
nain:
2
2
2 2 1
1 1
2 2 2 2
1 1
( )
1 1
2
1 1
2
n
i n n
i
i i
i i
X
n n
i i i
i i
x X
X
x X x n
n n n n
f x XX X x X
n n

=
= =
= =

= = + =
= + =



14243


(2)
2 2 2
1
1
n
i
i
x X
n

=
=



Prilikom korienja formule (2) nije potrebno izraunavanje odstupanja pojedinih vrednosti od
aritmetike sredine ve se disperzija rauna iz vrednosti obeleja.

Primer 7.3.1.
U toku jednog dana izmerene su podnevne temperature koje su date tabelom. Koliko je disperzija,
odnosno srednje kvardatno odstupanje temperatura ?
Beograd
10 C
Kragujevac
11 C
Valjevo
9 C
Loznica
12 C
Kopaonik
-1 C
Novi Sad
13 C


U primeru 7.2.1. gde je izraunata je srednja devijacija, prvo je izraunata aritmetika sredina

10 11 9 12 1 13
9
6
X
+ + + +
= = .

Za izraunavanje disperzije bie koriena pomona tabela i formula (1):

i
x
i
x X
( )
2
i
x X
Beograd 10 1 1
Kragujevac 11 2 4
Valjevo 9 0 0
Loznica 12 3 9
Kopaonik -1 -10 100
44
Novi Sad 13 4 16
6 n =


6
2
1
( ) 130
i
i
x X
=
=


6
2
2 1
( )
130
21.67
6 6
i
i
x X

= = =



Ako se upotrebi formula (2) pomona tabela je malo drugaija:

i
x
2
i
x
Beograd 10 100
Kragujevac 11 121
Valjevo 9 81
Loznica 12 144
Kopaonik -1 1
Novi Sad 13 169
6 n =

6
2
1
616
i
i
x
=
=



2 2 2
1
1 1
616 81 102.67 81 21.67
6
n
i
i
x X
n

=
= = = =






Za grupisane podatke disperzija se izraunava po formuli:

( ) 1
( ) ( )
2 2
2 2
1 1
2 1 1
1 2
1
( ) ( )
n n
i i i i
n n
i i
n
n
i
i
f x X f x X
f x X f x X
f f f N
f

= =
=

+ +
= = =
+ + +

L
L

gde je
1
n
i
i
f N
=
=



Za izraunavanje disperzije moe se koristiti i jednostavnija formula:
{
2
2
2 2 1
1 1 1
2 2 2 2
1 1
( )
1 1
2
1 1
2
n
i i n n n
i
i i i i i
i i i
N
X
n n
i i i i
i i
f x X
X
f x X f x f
N N N N
f x XX X f x X
N N

=
= = =
= =

= = + =
= + =



14243


( )
2 2 2
1
1
2
n
i i
i
f x X
N

=
=



Primer 7.3.2.
Na ispitu su postignuti rezultati dati tabelom. Izraunati disperziju.
45
Ocena ( )
i
x Broj studenata ( )
i
f
5 7
6 14
7 11
8 8
9 6
10 4

Navedena tabela je iz primera 6.1.3. u kome je izraunata prosena ocena, odnosno aritmetika
sredina : 7, 08 X =
Za odreivanje disperzije ako se koristi formula ( ) 1 meurezultati se mogu prikazati u pomonoj
tabeli.









2
2 1
( )
109, 68
2,1936
50
n
i i
i
f x X
N

= = =



Izraunavanje pomou formule ( ) 2 je jednostavnije.
Za odreivanje disperzije pomou formule ( ) 2 tabela sa meurezultatima je:









( )
2 2 2 2
1
1 2616
2 7, 08 52, 32 50,1264 2,1936
50
n
i i
i
f x X
N

=
= = = =


Ocena ( )
i
x Broj studenata ( )
i
f
i
x X
( )
2
i
x X
( )
2
i i
f x X
5 7 -2,08 4,3264 30,2848
6 14 -1,08 1,1664 16,3296
7 11 -0,08 0,0064 0,0704
8 8 0,92 0,8464 6,7712
9 6 1,92 3,6864 22,1184
10 4 2,92 8,5264 34,1056
6 n =
6
1
50
i
i
N f
=
= =



6
2
1
( ) 109, 68
i i
i
f x X
=
=

Ocena ( )
i
x
Broj
studenata ( )
i
f
2
i
x
2
i i
f x
5 7 25 175
6 14 36 504
7 11 49 539
8 8 64 512
9 6 81 486
10 4 100 400
6 n =
6
1
50
i
i
N f
=
= =



6
2
1
2616
i i
i
f x
=
=


46
Za procenu podataka iz posmatrane serije veoma je vaan pozitivni koren iz disperzije
2
( ) .
Ta veliina pokazuje koliko aritmetika sredina u proseku odstupa od pojedinih vrednosti obeleja.

DEF Standardna devijacija (standardno odstupanje) ( ) je pozitivna vrednost korena disperzije
2
odnosno
2
= .
U primeru 7.3.1. standardna devijacija iznosi
2
21.67 4.656 = = =
U primeru 7.3.2. standardna devijacija iznosi
2
2.1936 1.48 = = =

U EXCEL-u postoji funkcija STVEDEVP koja izraunava standardnu devijaciju. Pomou nje je
kvadriranjem mogue izraunati disperziju.


7.4. Koeficijent varijacije

DEF Koeficijent varijacije ( )
V
K je kolinik izmeu standardne devijacije i aritmetike sredine nekog
obeleja.

V
K
X

=
Ovaj koeficijent je relativna mera koja pokazuje odstupanje obeleja u odnosu na aritmetiku sredinu.
U primeru 7.3.1. standardna devijacija iznosi
2
21, 67 4, 66 = = =
a aritmetika sredina 9 X = . Koeficijent varijacije iznosi

4, 656
0, 52
9
V
K
X

= = =
U primeru 7.3.2. standardna devijacija iznosi
2
2,1936 1, 48 = = =
a aritmetika sredina 7.08 X = . Koeficijent varijacije iznosi

1, 48
0, 21
7, 08
V
K
X

= = =

7.5. Vebanje

1. U toku jednog dana izmerene su podnevne temperature koje su date tabelom.










Odrediti
varijacije ( ) R - Raspon
Beograd
21 C
Kragujevac
20 C
Valjevo
19 C
Loznica
22 C
Kopaonik
8 C
Novi Sad
18 C
Kraljevo
23 C
47
- Srednju devijaciju ( ) SD
- Disperziju
2
( ) i standardnu devijaciju ( )
- Koeficijent varijacije ( )
V
K
2. Grupi sportista merene su visine i rezultati su dati tabelom:
Visina Broj sportista
i
f
160-169 5
170-179 8
180-189 14
190-199 7
200-209 4
210-219 2

Odrediti
- Raspon varijacije ( ) R
- Srednju devijaciju ( ) SD
- Disperziju
2
( ) i standardnu devijaciju ( )
- Koeficijent varijacije ( )
V
K
Uputstvo: Prvo treba odrediti intervalne sredine
160 169
164.5
2
+
= ,
170 179
174.5
2
+
= ... pa
pomou njih izvoditi dalja izraunavanja.

8. MOMENTI I POKAZATELJI VIEG REDA
Vrednosti iz nekog obeleja mogu na razliite naine biti grupisane oko srednjih vrednosti. Za
odreivanje naina njihovog rasporeda koriste se tzv. centralni momenti.
DEF Centralni moment reda r je aritmetika sredina devijacija na r-ti stepen.

Za negrupisane podatke to je :
1
( )
n
r
i
i
r
x X
M
n
=


Za grupisane podatke to je :
1
1
( )
n
r
i i
i
r n
i
i
f x X
M
f
=
=


Centralni moment reda 2,
2
M je disperzija
2
.
Od posebnog znaaja su momenti reda 3 i 4.
Za merenje asimetrije koristi se
3
M a za merenje spljotenosti
4
M .

48
8.1. Koeficijent asimetrije
Ako se posmatra poloaj aritmetike sredine X , medijane Me i modusa Mo , moe se govoriti o
simetrinom ili asimerinom rasporedu elemenata nekog obeleja.Raspored je simetrian kad su
frekvencije vrednosti obeleja ravnomerno rasporeene sa obe strane u odnosu na aritmetiku sredinu
a asimetrian kad se elementi skupa grupiu iznad ili ispod aritmetike sredine.
DEF Koeficijent asimetrije ( )
3
je kolinik centralnog momenta reda tri i treeg stepena standardne
devijacije.

3
3 3
M

=
Ovaj parameter pokazuje asimetriju nekog obeleja. Pomou njega se mogu uporeivati asimetrije
razliitih distribucija. Ako je:









Mo je ona vrednost koja ima najveu uestanost o na krivoj raspodele predstavlja apscisu vrha
krive.
Me je ona vrednost obeleja koja deli skup na dva jednaka dela.


Interpretacijom na krivoj raspodele dobijaju se sluajevi:
a) Kod simetrinog rasporeda je X Me Mo = = .
b) Kod pozitivne asimetrije Mo Me X < < .
c) Kod negativne asimetrije X Me Mo < < .

Grafiki se to moe predstaviti na sledei nain:








3
0 = serija je simetrina
3
0 > serija ima levu (pozitivnu) asimetriju
3
0 < serija ima desnu (negativnu) asimetriju
3
0 =


X Me Mo = =

3
0 >

Mo Me X < <
49










Objedinjeno:





8.2. Koeficijent spljotenosti

DEF Koeficijent spljotenosti ( )
4
je kolinik centralnog momenta reda etiri i etvrtog stepena
standardne devijacije.

4
4 4
M

=
Ovaj parametar je uvek pozitivan. On pokazuje homogenost vrednosti u odnosu na aritmetiku
sredinu.
Ako je:







Grafiki se to moe predstaviti na sledei nain:










4
3 = serija je normalne visine
4
3 > serija je izduena
4
3 < serija je spljotena
3
0 =
3
0 <
3
0 >
4
3 =

4
3 <

4
3 >

3
0 <

X Me Mo < <
50

Primer 8.1.1. ( prosta serija)
Na zimskim olimpijskim igrama 2002. godine est zemalja koje su osvojile najvie medalja su bile:
Drava Broj medalja
Nemaka 35
USA 34
Norveka 24
Kanada 19
Rusija 18
Austrija 14

Izraunati disperziju, standardnu devijaciju, koeficijent asimetrije i koeficijent spljotenosti za broj
osvojenih medalja.

Drava
Broj medalja
i
x
i
x X
( )
2
i
x X
( )
3
i
x X
( )
4
i
x X
Nemaka 35 11 121 1331 14641
USA 34 10 100 1000 10000
Norveka 24 0 0 0 0
Kanada 19 -5 25 -125 625
Rusija 18 -6 36 -216 1296
Austrija 14 -10 100 -1000 10000
6 n = 144 382 990 36562

144
24
6
X = =
Disperzija :
2
2 1
( )
382
63, 67
6
n
i
i
x X
n

= = =


Standardna devijacija;
2
63, 67 7, 98 = = =
Koeficijent asimetrije:
3
3 3
990
165
6
0.325
507, 98 507, 98
M

= = = =
Koeficijent spljotrnosti:
4
4 4
36562
6
1, 503
4053, 44
M

= = =



Primer 8.1 2. (intervalna serija)
Na prijemnom ispitu su postignuti rezultati dati tabelom:
Broj bodova Broj studenata
i
f
0-10 11
51
11-20 4
21-30 5
31-40 3
41-50 3
51-60 4

Izraunati aritmetiku sredinu, disperziju, standardnu devijaciju, koeficijent asimetrije i koeficijent
spljotenosti
Prilikom izraunavanja traenih veliina korisno je formirati tabelu (1) sa meurezultatima.

U primeru 6.1.4. izraunata je aritmetika sredina za ovu intervalnu seriju.
Prosean broj bodova je:

1 1 2 2
1 2
5 11 15.5 4 25.5 5 35.5 3 45.5 3 55.5 4
11 4 5 3 3 4
55 62 127.5 106.5 136.5 222 709.5
23.65
30 30
n
n
x f x f x f
X
f f f
+ + + + + + + +
= = =
+ + + + + + + +
+ + + + +
= =
L
L




Pomou dobijenuh podataka popunjava se tabela (1):

Korienjem dobijenih meurezultata formira se nova tabela (2) iz koje se dobijaju vrednosti za
nalaenje traenih parametara.
Broj
bodova
i
f
Raz. sr.
i
x
i i
f x
i
x X ( )
2
i
x X

( )
3
i
x X
( )
4
i
x X
0-10 11 5 55.00 -18.65 347.82 -6486.89 120980.49
11-20 4 15.5 62.00 -8.15 66.42 -541.34 4411.95
21-30 5 25.5 127.50 1.85 3.42 6.33 11.71
31-40 3 35.5 106.50 11.85 140.42 1664.01 19718.48
41-50 3 45.5 136.50 21.85 477.42 10431.68 227932.24
51-60 4 55.5 222.00 31.85 1014.42 32309.36 1029053.01
30 709.50

Broj
i
f
( )
2
i i
f x X

( )
3
i i
f x X
( )
4
i i
f x X
52











Disperzija :
2
2 1
1
( )
10020
334
30
n
i i
i
n
i
i
f x X
f

=
=

= = =


Standardna devijacija;
2
334.33 18.28 = = =
Koeficijent asimetrije:
3
3 3
92034.99
30
0.502
6113.12
M

= = =
Koeficijent spljotrnosti:
4
4 4
6207655.97
30
1.851
111776.55
M

= = =

bodova
0-10 11
3826,05 -71355,79 1330785,41
11-20 4
265,69 -2165,37 17647,79
21-30 5
17,11 31,66 58,57
31-40 3
421,27 4992,02 59155,44
41-50 3
1432,27 31295,04 683796,73
51-60 4
4057,69 129237,43 4116212,03
30
10020,08 92034,99 6207655,97
53
8.3. Vebanje

1. Tabelom je prikazan broj nagrada koje su na nekom takmienju osvojili predstavnici gradova :

Grad Broj nagrada
Beograd 12
Ni 11
Novi Sad 10
Kragujevac 9
Valjevo 6
Subotica 5

Izraunati disperziju, standardnu devijaciju, koeficijent asimetrije i koeficijent spljotenosti za broj
osvojenih nagrada.

2. Grupi sportista merene su visine i rezultati su dati tabelom:
Visina Broj sportista
i
f
160-169 5
170-179 8
180-189 14
190-199 7
200-209 4
210-219 2

Izraunati aritmetiku sredinu, disperziju, standardnu devijaciju, koeficijent asimetrije i koeficijent
spljotenosti.









54
9. STATISTIKO OCENJIVANJE NA OSNOVU UZORKA
9.1. Osnovni skup i sluajni uzorak
Statistiki skup ima razliite parametre koji ga karakteriu. Ispitivanja se mogu izvoditi na celom
skupu ali je to esto nepodesno zbog njegove veliine.U takvim situacijama se, sa odreenom
tanou, izraunavanja parametara izvode na nekom njegovom delu koji predstavlja uzorak.





Ukratko, ako je statistiki skup veliki onda se pribegava ispitivanju uzoraka. Jedan od najvanijih
zadataka statistike je da se na osnovu uzorka utvrde zakonitosti i izvuku zakljuci koje vae u celoj
populaciji.
Postavlja se pitanje reprezentativnosti posmatranog uzorka. Sam postupak izbora sluajnog uzorka
u statistici je detaljno razraen .U nekim se koriste tablica sluajnih brojeva ali se time neemo baviti.
Jasno je, takoe i da veliina uzorka utie na verodostojnost naih zakljuaka o celoj populaciji.
Ako statistiki skup ima N elemenata, onda se pod prostim sluajnim uzorkom veliine n
( ) n N < podrazumeva svaki od uzoraka od n elemenata ije su verovatnoe izbora meusobno
jednake. Ukupan broj uzoraka veliine n koji se mogu formirati na skupu od N elemenata iznosi:
( 1) ( 1)
! !
N
N n
n
N V N N N n
C
n n n
| | +
= = =
|
\
L


Statistiki skup ima razliite parametre koji ga karakteriu a jedan od najvanijih je aritmetika
sredina.Postupak ocenjivanja nekog parametra osnovnog skupa na osnovu uzorka bie prikazan na
njoj.

9.2.Ocena aritmetike sredine osnovnog skupa

Ako bi se na nekom statistikom skupu koji ima N elemenata formirali svi mogui uzorci ( njih
N
n
| |
|
\
) i izraunale njihove aritmetike sredine
( ) i
x one bi predstavljale jedan raspored aritmetikih
sredina uzoraka. Za dovoljno veliko n ( 30 n > ) taj raspored ima priblino oblik normalne raspodele.

Statistiki skup
Uzorak
55











Ako se pogleda raspored sredina uzoraka primeuju se da se u intervalu
x
nalazi 68.3%
svih uzoraka. To znai da je verovatnoa da se aritmetika sredina uzorka nae u ovom intervalu 0,68.
Slino, verovatnoa da e se nai u intervalu 1, 96
x
iznosi 0,95 a u intervalu 2, 58
x
iznosi
0,99. Nivoi znaajnosti u tim sluajevima izmose 0,32 , 0,05 i 0,01. Najee se ocene parametara
raunaju sa nivoom znaajnosti 0,05 i 0,01.

U konkretnim situacijama postupak ocenjivanja aritmetike sredine skupa izgleda ovako:
-Odabere se dovoljno veliki uzorak ( 30 n > ) i izrauna se njegova aritmetika sredina
( )
x koja e
predstavljati ocenu aritmetike sredine celog skupa ( ) .
-Utvruje se vrednost standardne greke ocene aritmetike sredine (
x
) :

x
n

=
Standardna greka ocene pokazuje proseno odstupanje aritmetike sredine uzorka
( )
x od
aritmetike sredine skupa ( ) .
Standardna devijacija skupa ( ) se izraunava iz uzorka. Dokazano je da je standardna devijacija
izraunata na celom skupu uvek neto vea od standardne devijacije izraunate na uzorku. Zbog toga
se vri ispravka pa se za izraunavanje koristi formula:

( ) ( )
2 2
2
1 1
1 1
n n
i i i i
i i
f x x f x n x
n n

= =

= =


(1)
Ona je poznata pod nazivom Popravljena formula za standardnu devijaciju skupa na osnovu
podataka iz uzorka. Formula za za izraunavanje standardne greke uz korienje formule (1) glasi:

Raspored sredina
uzoraka
68.3%
95%
99%
x

1.96
x
2.58
x


56
( )
( )
( )
( )
( )
2
2 2
2
1
1 1
1
1 1
n
n n i i
i
i i i i
i i
x
f x x
f x x f x n x
n
n n n n n n

=
= =

= = = =


(2)

Primer 9.1.1.
Zadatak je da se odredi prosean broj bodova na prijemnom ispitu koje su imali studenti ICT na
osnovu uzorka koji ima 50 elemenata.
Bodovi
Broj kandidata
i
f
0-10 8
10-20 6
20-30 10
30-40 9
40-50 12
50-60 5
50

Vrednost prosenog broja bodova treba odrediti sa nivoom znaajnosti 0,05 i sa nivoom znaajnosti
0.01.
Meurezultati za izraunavanje x i
x
se prikazuju u tabeli:
Bodovi
Broj kandidata
i
f
sredina
intervala
i
x
i i
f x
2
i i
f x
0-10 8 5 40 200
10-20 6 15 90 1350
20-30 10 25 250 6250
30-40 9 35 315 11025
40-50 12 45 540 24300
50-60 5 55 275 15125
zbir 50 1510 58250

Prvo se izraunava aritmetika sredina uzorka
1510
30, 2
50
x = = ; 50 n = .
Standardna greka ocene iznosi:

( )
( )
2
2
1
58250 45602
5,162449 2,27
1 50 49
n
i i
i
x
f x n x
n n n

= = = = =



Sa nivoom znaajnosti 0,05 prosean broj bodova je u intervalu :
1, 96 30, 2 1, 96 2, 27 30, 2 4, 49
x
x = = =
57
Prosean broj bodova celog skupa, na osnovu ovog uzorka, sa verovatnoom 0,95 je:
[ ] 25, 71 34, 69 ; 25, 71, 34, 69
Sa nivoom znaajnosti 0.01 prosean broj bodova je u intervalu :
2, 58 30, 2 2, 58 2, 27 30, 2 5,86
x
x = = =
Prosean broj bodova celog skupa, na osnovu ovog uzorka, sa verovatnoom 0,99 je:
[ ] 24, 34 36, 06 ; 24, 34 , 36, 06
Napomena:
Primeuje se da vei koeficijent pouzdanosti, na istom uzorku, daje iri interval. to je interval ui
ocena parametra je preciznija ali je manje pouzdana. U praksi se najee radi sa koeficijentom
pouzdanosti 0,95 to jest sa sa nivoom znaajnosti 0,05. Tada je 1, 96 , 1, 96
x x
x x
(
+

.
Primer 9.1.2.
Rezultati ispitivanja na uzorku od 500 turista o dnevnoj potronji za jednu vrstu turistike usluge
dati su tabelom:
Dnevna
potronja
Broj turista
i
f
35-45 8
45-55 100
55-65 302
65-75 85
75-85 5
zbir 500

Treba oceniti prosenu dnevnu potronju celog skupa ( ) pomou navedenog uzorka sa
koeficijentom pouzdanosti 0,95.
Dnevna
potronja
Broj turista
i
f
prosena
potronja
i
x
i i
f x
2
i i
f x
35-45 8 40 320 12800
45-55 100 50 5000 250000
55-65 302 60 18120 1087200
65-75 85 70 5950 416500
75-85 5 80 400 32000
zbir 500 29790 1798500

Prvo se izraunava aritmetika sredina uzorka
29790
59, 58
500
x = = ; 500 n =
Standardna greka ocene iznosi:
( )
( )
2
2
1
1798500 1774888
0, 0946 0, 31
1 500 499
n
i i
i
x
f x n x
n n n

= = = = =


58
Sa koeficijentom pouzdanosti 0,95 ili sa nivoom znaajnosti 0,05 prosean broj bodova je u intervalu
:
1, 96 59, 58 1, 96 0, 3 59, 58 0, 61
x
x = = =
Dnevna potronja celog skupa, na osnovu ovog uzorka, sa verovatnoom 0,95 je:
58, 97 60,19

10. LINEARNA REGRESIJA I KORELACIJA

Vaan deo stastistike je regresiona analiza koja se bavi zavisnou pojedinih obeleja u nekom
statistikom skupu.Najjednostavnije je ispitivati zavisnost izmeu dva obeleja. Time se bavi prosta
regresiona analiza. Osnovne ideje regresione analize mogu se prikazati pomou linearne regresije i
korelacije.

10.1. Linearna regresija
Prilikom analize zavisnosti dva obeleja prvo je potrebno je odrediti koje je nezavisno a koje
zavisno. Nezavisno obeleje emo obeleiti sa X a zavisno sa Y .
Ako se radi sa uzorkom veliine n , dobija se n ureenih parova
( ) ( ) ( )
1 1 2 2
, , , , , ,
n n
x y x y x y K .
Predstavljanjem ovih taaka u Dekartovom pravouglom koordinatnom sistemu xOy dobija se
dijagram rasprenosti (rasturanja). Pomou dijagrama nekada je mogue uoiti oblik funkcionalne
zavisnosti izmeu posmatranih obeleja.
Prema obliku krive kojom se funkcionalna zavisnost moe aproksimirati postoje razliiti oblici
zavisnosti (linearna, kvadratna, logaritamska...)
Ako se zavisnost meu navedenim podacima iz posmatranog uzorka, sa odgovarajuom tanou,
izrazi linearnom funkcijom y ax b = + , koeficijenti a i b se dobijaju iz formula:
1 1 1
2
2
1 1
n n n
i i i i
i i i
n n
i i
i i
n x y x y
a
n x x
= = =
= =

=
| |

|
\


i
1 1
n n
i i
i i
y a x
b
n
= =

=

(*)

Koeficijenti a i b se mogu odrediti ina drugi nain, korienjem metode najmanjih kvadrata.
Vrednosti konstanti se u tom sluaju dobijaju preko formula:

2
;
xy
x
k
a b Y aX

= = (**)
gde je
1 1
;
n n
x x y y
X Y
n n
+ + + +
= =
L L

59
( )
2
2 1
n
i
i
x
x X
n



( )( )
1
n
i i
i
xy
x X y Y
k
n
=

=

uzoraki koeficijent kovarijacije ili kovarijacija.


U EXCELU postoji funkcija COVAR za njegovo izraunavanje.

Primer 10.1.1.
Za deset ljudi je tablicom dat broj godina i prihod koji su ostvarili u odreenom periodu. Potrebno
je nacrtati dijagram rasprenosti i odrediti regresionu pravu kojom se moe aproksimirati linearna
zavisnost.
























Za izraunavanje je regresione prave iz navedenih formula korisno je posluiti se radnom tabelom.

godine X prihod Y
A 19 2150
B 23 2550
C 27 3250
D 31 3150
E 36 4250
F 40 4200
G 44 4350
H 49 5000
I 52 4950
J 54 5650
Dijagram rasprenosti
0
1000
2000
3000
4000
5000
6000
0 10 20 30 40 50 60
godine
p
r
i
h
o
d
60










U ovom primeru je:
10 n =
10
1
1604800
i i
i
x y
=
=

;
10 10
1 1
375 ; 39500
i i
i i
x y
= =
= =


2
10 10
2 2
1 1
15433 ; 375 140625
i i
i i
x x
= =
| |
= = =
|
\



1 1 1
2
2
1 1
10 1604800 375 39500
90,15
10 15433 140625
n n n
i i i i
i i i
n n
i i
i i
n x y x y
a
n x x
= = =
= =


= = =

| |

|
\




1 1
39500 90,15 375
569, 4
10
n n
i i
i i
y a x
b
n
= =


= = =


Prema tome regresiona prava glasi: 90 569 y x = +
Dobijena prava nam omoguava da odredimo vrednosti i za one x -ove koji nisu sadrani u
uzorku.Na primer:
20 ; 90 20 569 2369 x y = = + =
50 ; 90 50 569 5069 x y = = + = ...









Godine
i
x Prihod
i
y
i i
x y
2
i
x
A 19 2150 40850 361
B 23 2550 58650 529
C 27 3250 87750 729
D 31 3150 97650 961
E 36 4250 153000 1296
F 40 4200 168000 1600
G 44 4350 191400 1936
H 49 5000 245000 2401
I 52 4950 257400 2704
J 54 5650 305100 2916
zbir


375 39500 1604800 15433
Dijagram rasprenosti
0
1000
2000
3000
4000
5000
6000
0 10 20 30 40 50 60
godine
p
r
i
h
o
d
90 569 y x = +
61
II nain (metoda najmanjih kvadrata)

Koeficijenti a i b se mogu odrediti ina drugi nain, korienjem metode najmanjih kvadrata.
Vrednosti konstanti se u tom sluaju dobijaju preko formula:
2
12355
90.15 ;
137.05
3950 90.15 37.5 3950 3380 570
xy
x
k
a
b Y aX

= = =
= = = =

gde je
1 1
37.5 ; 3950
n n
x x y y
X Y
n n
+ + + +
= = = =
L L

( )
2
2 1
137.05
n
i
i
x
x X
n

= =



( )( )
1
12355
n
i i
i
xy
x X y Y
k
n
=

= =


Na ovaj nain je dobijena regresiona prava : 90,15 570 y x = +

Pomona tabela koja je koriena za navedena izraunavanja:


i
x
i
y
i
x X
i
y Y
( )
2
i
x X
A 19 2150 -18,5 -1800 342,25
B 23 2550 -14,5 -1400 210,25
C 27 3250 -10,5 -700 110,25
D 31 3150 -6,5 -800 42,25
E 36 4250 -1,5 300 2,25
F 40 4200 2,5 250 6,25
G 44 4350 6,5 400 42,25
H 49 5000 11,5 1050 132,25
I 52 4950 14,5 1000 210,25
J 54 5650 16,5 1700 272,25

X =37,5 Y =3950

2
x
=137,05


xy
k =12355

COVAR

Koeficijent kovarijacije
xy
k je izraunat pomou funkcije COVAR .
62
10.2. Korelacija
Stepen povezanosti dva obeleja moe se predstaviti brojnom vrednou koja se naziva koeficijent
korelacije. Ovaj parametar pokazuje jainu i smer povezanosti posmatranih obeleja.Izraunava se po
formuli:

1 1 1
2 2
2 2
1 1 1 1
n n n
i i i i
i i i
n n n n
i i i i
i i i i
n x y x y
r
n x x n y y
= = =
= = = =

=
| | | |

| |
\ \


(*)
Koeficijent korelacije se naziva i Pirsonov koeficijent.
Koeficijent korelacije moe se izraunati i na drugi nain:

( )( )
( ) ( )
1
2 2
1 1
n
i i
i
n n
i i
i i
x X y Y
r
x X y Y
=
= =

=


(**)
, gde su odgovarajue X i Y aritmetike sredine posmatranih obeleja uzorka veliine n .
Koeficijent r moe biti pozitivan i negativan broj koji je po apsolutnoj vrednosti manji ili jednak 1.
1 1 r
Ako je 0 r > korelacija je direktna (poveanim vrednosti iz jednog obeleja odgovaraju
poveavane se vrednosti iz drugog).
Ako je 0 r < korelacija je inverzna (poveanm vrednosti iz jednog obeleja odgovaraju smanjene
se vrednosti iz drugog).
to se jaine veze tie smatra se da ako je :
0, 25 r postoji slab stepen uzajamne povezanosti koji se zanemaruje
0, 25 0, 5 r postoji stepen uzajamne povezanosti koji se ne zanemaruje
0, 5 0, 75 r postoji visok stepen uzajamne povezanosti
0, 75 1 r < postoji veoma visok stepen uzajamne povezanosti
1 r = postoji savrena povezanost i uzajamnost

U Excelu postoji funkcija CORREL pomou koje se izraunava koeficijent korelacije.






63
Primer 10.2.1.
Za deset ljudi je tablicom dat prihod koji su ostvarili u odreenom periodu i potronja mesa .
Potrebno je izraunati koeficijent korelacije.









Pomona tabela za izraunavanje koeficijenta korelacije pomou formule (*):
prihod X meso Y i i
x y
2
i
x
2
i
y
A 5 11 55 25 121
B 6 14 84 36 196
C 11 19 209 121 361
D 14 26 364 196 676
E 16 30 480 256 900
F 21 43 903 441 1849
G 25 49 1225 625 2401
H 27 50 1350 729 2500
I 32 65 2080 1024 4225
J 38 72 2736 1444 5184
zbir 195 379 9486 4897 18413

U ovom primeru je:
10 n =
10
1
9486
i i
i
x y
=
=

;
10 10
1 1
195 ; 379
i i
i i
x y
= =
= =


2
10 10
2 2
1 1
4897 ; 195 38025
i i
i i
x x
= =
| |
= = =
|
\


2
10 10
2 2
1 1
18413 ; 379 143641
i i
i i
y y
= =
| |
= = =
|
\



10 9486 195 379
10 4897 38025 10 18413 143641
20955 20955 20955
0, 99541
104, 62 201, 22 21051, 64 10945 40489
r

= =

= = = =



Korienjem funkcije CORREL iz Excela dobija se vrednost 0,995431.
prihod X meso Y
A 5 11
B 6 14
C 11 19
D 14 26
E 16 30
F 21 43
G 25 49
H 27 50
I 32 65
J 38 72
64
Koeficijent korelacije moe se izraunati i na drugi nain:

( )( )
( ) ( )
1
2 2
1 1
n
i i
i
n n
i i
i i
x X y Y
r
x X y Y
=
= =

=


(**)
, gde su odgovarajue X i Y aritmetike sredine posmatranih obeleja uzorka veliine n .


12.3. Vebanje
1) Za deset ljudi je tablicom dat broj godina i koliina mleka koju su
konzumirali u odreenom periodu. Potrebno je odrediti
a) dijagram rasprenosti
b) regresionu pravu kojom se moe aproksimirati linearna zavisnost.
c) koeficijent korelacije




a) i b)
Godine Mleko
i i
x y
2
i
x
A 4 96 384 16
B 8 93 744 64
C 11 91 1001 121
D 22 80 1760 484
E 26 74 1924 676
F 35 67 2345 1225
G 44 51 2244 1936
H 49 50 2450 2401
I 61 43 2623 3721
J 72 26 1872 5184
zbir 332 671 17347 15828

U ovom primeru je:
10 n =
10
1
17347
i i
i
x y
=
=

;
10 10
1 1
332 ; 671
i i
i i
x y
= =
= =


2
10 10
2 2
1 1
15828 ; 332 110224
i i
i i
x x
= =
| |
= = =
|
\



Godine Mleko
A 4 96
B 8 93
C 11 91
D 22 80
E 26 74
F 35 67
G 44 51
H 49 50
I 61 43
J 72 26
65
1 1 1
2
2
1 1
10 17347 332 671 49302
1, 03
10 15828 110224 48056
n n n
i i i i
i i i
n n
i i
i i
n x y x y
a
n x x
= = =
= =


= = = =

| |

|
\




( )
1 1
671 1, 03 332
671 341, 96 1012, 96
101, 3
10 10 10
n n
i i
i i
y a x
b
n
= =


+
= = = = =


Prema tome regresiona prava glasi: 101 y x = +
0
20
40
60
80
100
120
0 20 40 60 80
Godine
P
o
t
r
o

n
j
a

m
l
e
k
a

c)
Korienjem funkcije CORREL iz Excela dobija se vrednost -0,99462.
2) U tabeli su date vrednosti za dva obeleja jednog uzorka. Odrediti jednainu regresione prave.

i
x
i
y
A 0.5 2.53
B 1 2.05
C 1.5 1.67
D 2 1.37
E 2.5 0.92
F 3 0.47
G 3.5 -0.11
H 4 -0.50

Reenje: 0.86 1.05 y x = +


66
LITERATURA :

1. Z. Ivkovi, Teorija verovatnoa sa matematikom statistikom, Graevinska knjiga , Beograd, 1976
2. Z. Ivkovi, D. Banjevi Verovatnoa i matematika statistika, Nauna knjiga , Beograd, 1979
3. M. Merkle, Verovatnoa i statistika za inenjere i studente tehnike, Akademska. misao, Beograd,
2006.
4. S. Vukadinovi, J. Popovi, Matemaitka statistika, Zavod za udbenike i nastavna sredstva,
Beograd, 1982
5. S.vukadinovi, Verovatnoa i statistika, Zavod za udbenike i nastavna sredstva, Beograd, 2006.
6. McClave J.T., Sincich T., A First Course in Statistics, Pearson, Prentice-Hill, New Jersey, 2006.
7. E. Stipani, Teorija verovatnoe i matematika statistika, Nauna knjiga , Beograd, 1985
8. Pavle Mladenovi, Elemantaran uvod u verovatnou i statistiku, Drutvo matematiara Srbije ,
Beograd, 1990
9. S.Ognjanovi,.Ivanovi, Matematika 4, Krug, Beograd 1999
10. Jovan Keki, Matematika za 4 razred gimnazije, Keki, Beograd, 2004
11. M.ii,M.Lovri,D.Pavlii, Metodi statistike analize, Ekonomski fakultet, Beograd, 2000
12. Vladislav olevi, Primenjena statistika, Nauna knjiga, Beograd 1993
13.D.Hercog,J.Nedi,I.Radeka,Kroz matematiku sa Mathematica-om, Univerzitet u Novom Sadu,
2001

You might also like