P. 1
statistika_prilog_2

statistika_prilog_2

|Views: 1,001|Likes:
Published by api-19870572

More info:

Published by: api-19870572 on Dec 02, 2009
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

03/18/2014

pdf

text

original

Sections

1

VISOKA ŠKOLA STRUKOVNIH STUDIJA ZA INFORMACIONE I
KOMUNIKACIONE TEHNOLOGIJE BEOGRAD








Predmet: STATISTIKA

Materijal za studente - 2 . deo


















Predavač : mr Zorica Malović


2
4. TEORIJSKE RASPODELE
4.1. Binomni zakon raspodele
(Bernulijeva raspodela) Jakob Bernoulli (1654-1705)
U eksperimentu, koji se ponavlja n puta, posmatra se realizacija događaja A ili njemu suprotnog
događaja A.
( ) ; ( ) 1 P A p P A p q · · − ·
Tako se dobija složeni eksperiment koji se može prikazati tzv. Bernulijevom šemom. Nad ishodima
ovog složenog eksperimenta uvodi se slučajna promenljiva
n
S .

0 0 1 2 3
0 1 2 3 ...
: ; 1
...
n
n i
i n
n
S p
p p p p p
·
| `
·

. ,


Verovatnoća da će se u n nezavisnih eksperimenata događaj A realizovati tačno k puta iznosi:
{ ¦
( )
!
( )
! !
k n k k n k
k n n
n
n
p P S k P k p q p q
k k n k
− −
| `
· · · · ·


. ,


Binomna rapodela se može okarakterisati sa dva parametra n i p , gde je N n∈ broj ponavljanja,
a ( ) 1 , 0 ∈ p verovatća realizacije eksperimenta koji se ponavlja. Zbog toga se binomna raspodela
obeležava sa B ( ) , n p .
Za slučajnu promenljivu
n
S važi:
Matematičko očekivanje ( )
n
E S np ·
Disperzija ( varijansa) ( ) ( )
2
1
n
S np p σ · −
Standardno odstupanje
( )
2
( ) ( ) 1
n n
S S np p σ σ · · −
Koeficijent simetrije
( )
( )
3
1 2
1
n
p
S
np p
α

·


Koeficijent spljoštenosti
( )
( )
4
6 1
3
1
n
S
n np p
α · − +




Primer 4.1 1.
Kockica se baca 7 puta. Odrediti raspodelu slučajne promenljive a zatim izračunati verovatnoće
događaja :
a) B- Broj manji od 3 je pao tačno 4 puta.
b) C- Broj manji od 3 je pao bar 5 puta.


3
Događaj A čiju realizaciju u svakom od 7 · n bacanju kockice posmatramo je
A- pao je broj manji od 3
Verovatnoća da će prilikom jednog bacanja pasti broj manji od 3 iznosi:
( )
3
1
6
2
· · · p A P
Verovatnoća da će prilikom jednog bacanja neće pasti broj manji od 3 iznosi:
( )
3
2
3
1
1 · − · · q A P . U pitanju je binomna raspodela B
1
7,
3
| `

. ,
.

7
0 1 2 3 4 5 6 7
0 1 2 3 4 5 6 7
: S
p p p p p p p p
| `

. ,

gde je
{ ¦
( )
7 7
7 7
7
1 2 7! 1 2
( )
3 3 ! 7 ! 3 3
k k k k
k
p P S k P k p
k k k
− −
| `
| ` | ` | ` | `
· · · · ·


. , . , . , . ,
. ,

0,1, 2, 3, 4, 5, 6, 7 k ·
Napomena: Ovakva izračunavanja su dosta zamorna. Postoje specijalizovane tablice za izračunavanje
binomnih verovatnoća kao i različiti programi koji se time bave.
U EXCELU postoji funkcija BINOMDIST pomoću koje se izračunavaju tražene verovatnoće.
0 1 2 3 4 5 6 7
0,0585277 0,2048468 0,3072702 0,2560585 0,1280293 0,0384088 0,0064015 0,0004572


a) B- Broj manji od 3 je pao tačno 4 puta.
4 3 4 3
3
4 7
7
1 2 7! 1 2 2
( ) 35 0,128029
4 3 3 4!3! 3 3 3
P B p
| `
| ` | ` | ` | `
· · · · ·

. , . , . , . ,
. ,



b) C- Broj manji od 3 je pao bar 5 puta.

Da bi se realizovao događaj C povoljno je da broj manji od 3 padne 5 ili 6 ili 7 puta.
5 6 7
( ) 0,0384088+0,0064015+0,0004572= 0,0452675 P C p p p · + + ·

4

Binomna raspodela B(7;1/3)
0,0000000
0,0500000
0,1000000
0,1500000
0,2000000
0,2500000
0,3000000
0,3500000
0 1 2 3 4 5 6 7 8


Primer 4.1 2.
Za slučajnu promenljivu
7
S iz primera 4.1 1. , kojoj odgovara binomna raspodela B
1
7,
3
| `

. ,
odrediti
matematičko očekivanje, disperziju ( varijansu), standardno odstupanje, koeficijent simetrije i
koeficijent spljoštenosti.

Za ovu slučajnu promenljivu parametri su:

Matematičko očekivanje ( )
7
1
7
3
E S · ⋅
Disperzija ( varijansa) ( )
2
7
7 2 14
3 3 9
S σ · ⋅ ·
Standardno odstupanje
7
14 14
( )
9 3
S σ · ·
Koeficijent simetrije
( )
3 7
2
1
1
3
14 14
3
S α

· ·
Koeficijent spljoštenosti ( )
4 7
6 9 39
3 2.79
7 14 14
S α · − + · ·

5
4.2. Puasonova raspodela

Ako se u binomnoj raspodeli uzme veliki broj ponavljana, izračunavanje je relativno komplikovano
pa ima potrebe aproksimirati izraze za izračunavanje verovatnoća. Aproksimacije se uvode u
slučajevima kada je 50 > n .
Najviše su u upotrebi dve vrste aproksimacija. Jedna je Puasonova (Poisson) a druga je Normalna
aproksimacija .
Puasonova se uzima kada je 10 ≤ np .
Normalna se uzima kada je 10 np > .
Ako se uvede oznaka ; 0 np λ λ · > onda je

!
k
k n k
k
n
p p q e
k k
λ
λ
− −
| `
·

. ,
Puasonova aproksimacija
Primer 4.2 1.
Verovatnoća da će košarkaš promašiti koš prilikom izvođenja slobodnog bacanja je je
05 , 0 · p .Gađanje se izvodi 100 puta.
Izračunati verovatnoće događaja :
a) A- Koš je promašen tačno 6 puta
b) B- Koš je promašen manje od 10 puta
5 ; 05 , 0 ; 100 · · · np p n
Ovde se može primeniti Puasonova aproksimacija jer je ( 10 ≤ np ).
100 0.05 5 ; np λ · · ⋅ ·
a) 6 k · ; ( ) ( )
6
6 94 5
6 100
100
5
6 0.05 0.95 0,146222808
6 6!
P A p P S e

| `
· · · · ⋅ ·

. ,

Postoje tablice sa izračunatim vrednostima za različite vrednosti λ i k .
U EXCELU postoji funkcija POISSON pomoću koje je izračunata tražena verovatnoća.
b) ( ) ( )
0 1 9 100
10 0,968171943 P B p p p P S · + + + · < · L
Postoje posebne tablice u kojima su date kumulativne verovatnoće za različite vrednosti λ , k i m.
Ovde je 9 m · . Funkcija POISSON ima i tu mogućnost. ∆

Puasonova raspodela se primenjuje na veliki broj praktičnih problema koji vezani za pojavu
određenog događaja u vremenskom intervalu [ ) 0, t . Takvi su na primer događaji: registrovanje broja
telefonskih poziva, protok automobila ,emisija radioaktivnih čestica ...Ovakvi događaji imaju osobinu
da su nezavisni jedan od drugog i da su im verovatnoće proporcionalne dužini vremenskog intervala.


6
Primer 4.2 2.
U telefonskoj centrali u toku jednog sata bilo je 360 poziva. Na osnovu Poasonovog zakona
izračunati verovatnoću :
a) A- da u toku jednog minuta neće biti poziva
b) B- da će u toku jednog minuta biti 3 poziva
c) C- da će u toku jednog minuta biti 10 poziva.
d) D- da će u toku jednog minuta biti manje od 10 poziva.

360 n ·
Vremenski interval od jednog sata se deli na 60 jer se računa realizacija događaja u toku jednog
minuta.
1
60
p ·
1
360 6
60
np λ · · ⋅ ·
a) ( ) ( )
0
6
360
6
0 0,002478752
0!
o
P A p P S e

· · · ·
b) ( ) ( )
3
6
3 360
6
3 0,089235078
3!
P B p P S e

· · · ·
c) ( ) ( )
10
6
10 360
6
10 0,041303093
10!
P C p P S e

· · · ·
d) ( ) ( )
0 1 9 360
10 0,916075983 P D p p p P S · + + + · < · L ∆


7
4.3. Normalna raspodela
Muavr (A.Moivrei ) i Laplas (P.S. Laplace) su aproksimirali binomnu raspodelu sledećom
formulom:

( )
2
2
1
2
k np
k n k npq
k
n
p p q e
k npq π



| `
·

. ,

Normalna aproksimacija binomne raspodele se uzima kada je 10 np > .

Neprekidna slučajna promenljiva ima normalnu ili Gausovu raspodelu
( )
2
, N µ σ
ako je njena gustina raspodele verovatnoća funkcija :
( )
( )
2
2
2
1
2
x
f x e
µ
σ
σ π


·
gde je np µ · - matematičko očekivanje a
2
npq σ · - disperzija.
Grafici gustina raspodele su sličnog zvonastog oblika , simetrični u odnosu na pravu x µ · . To znači
da je medijana
e
M µ · .
Funkcija gustine ima maksimum za x µ · pa je mod
o
M µ · .
Važi, takođe da je ( ) lim 0
x
f x
→t∞
·
Promena parametra µ dovodi do translacije krive duž x-ose. Parametar σ utiče na raširenost
krive, odnosno, ako je σ veće vrh krive je manji jer je tačka maksimuma
1
,
2
µ
σ π
| `

. ,
.











Za slučajnu promenljivu koja ima normalnu raspodelu ( ) 0,1 N važi da je
koeficijent simetrije
3
0 α · a koeficijent spljoštenosti
4
3 α · .



Me Mo µ · ·
8













Verovatnoća ( )
( )
2
2
2
1
2
x
b
a
P a X b e dx
µ
σ
σ π


< < ·


se može se interpretirati kao površina ograničena x-osom , krivom gustine raspodele i pravim x a · i
x b · ,










Verovatnoća da slučajna promenljiva
( )
2
, X N µ σ · uzme vrednosti iz intervala
- ( ) , σ σ − iznosi 68.3%
- ( ) 2 , 2 σ σ − iznosi 95.5%
- ( ) 3 , 3 σ σ − iznosi 99.7% .

Ove činjenice se formulišu i kao “pravilo tri σ ” za normalnu raspodelu.




a
b
( ) P a X b < <
9













Postoje tablice koje se odnose na
( )
2
, N µ σ za vrednosti ( ) 0,1 N .
Slučajna promenljiva ( ) 0,1 N još se obeležava sa Z i naziva se standardizovanom slučajnom
promenljivom.









Ako je
( )
2
, X N µ σ · ona se može standardizovati. To se postiže uvođenjem smene
X
Z
µ
σ

· .
( )
( )
{ {
( ) ( )
2
2
2
2
1
1 2
2
2
2 1
1
2
1
2
x b
a
z
z
z
z z
Z
P a X b e dx
a X b
P e dz F z F z
µ
σ
σ π
µ µ µ
σ σ σ π



< < · ·
| `
− − −
· < < · · −


. ,


1 2 3
.
Funkcija koja se javlja posle izračunavanja integrala, ( ) F z je Laplasova funkcija čije vrednosti se
daju u pominjanim tablicama.

Pravilo tri σ
68.3%
95.5%
99.7%
σ

2σ 3σ
10
U EXCELU postoje funkcije NORMSDIST i NORMDIST koje daju vrednosti integrala
( ) ( )
x
f z dz F x
−∞
·

.
NORMSDIST se odnosi na standardizovanu slučajnu promenljivu ( ) 0,1 N a
NORMDIST se odnosi slučajnu promenljivu
( )
2
, N µ σ .
( ) ( ) ( ) ( ) ( )
b b a
a
f z dz f z dz f z dz F b F a
−∞ −∞
· − · −
∫ ∫ ∫

Napomena Kod upotrebe funkcije NORMDIST treba paziti na granice integrala,
( ) ( ) ( )
F b F a µ µ + − + , pa je zato preporučljivo standardizovati promenljivu i koristiti
NORMSDIST.

Primer 4.3. 1.
Ako je slučajna promenljiva X podleže zakonu raspodele
( )
2
20, 2 N izračunati:
a) ( ) 18 24 P X < < b)
( )
20 3 P X − < c) ( ) 25 P X <

a) ( ) 18 24 P X < <
20 µ · - matematičko očekivanje
2 2
2 σ · - disperzija ; 2 σ · ;
20
2
X
Z

·
( ) ( )
( ) ( )
18 20 24 20
18 24 1 2
2 2
2 1 0.97725 0.15866 0.81859
P X P Z P Z
F F
− − | `
< < · < < · − < < ·

. ,
· − − · − ·

b)

( ) ( ) ( )
( ) ( )
3 20 3
20 3 3 20 3
2 2 2
20
1.5 1.5 1.5 1.5
2
0.9333193 0.066807 0.8665123
X
P X P X P
X
P F F
− − | `
− < · − < − < · < < ·

. ,
− | `
· − < < · − − ·

. ,
· − ·

c) ( ) ( )
20 25 20
25 2.5 0.99379
2 2
X
P X P F
− − | `
< · < · ·

. ,





11
Primer 4.3.2. (Pravilo tri σ )
Ako je slučajna promenljiva X podleže zakonu raspodele
( )
2
6, 3 N izračunati:
a)
( )
6 3 P X − < ; b)
( )
6 6 P X − < ; c)
( )
6 9 P X − <
6 µ · - matematičko očekivanje

2 2
3 σ · - disperzija ; 3 σ · ;
6
3
X
Z

·
a)
( )
6 3 P X − < ; 3 σ ·
( ) ( ) ( )
( ) ( )
3 6 3
6 3 3 6 3
3 3 3
6
1 1 1 1 0.84134 0.15866
3
0.68268 68.268 %
X
P X P X P
X
P F F
− − | `
− < · − < − < · < < ·

. ,
− | `
· − < < · − − · − ·

. ,
· ≈

b) ; 2 6 σ ·
( ) ( ) ( )
( ) ( )
6 6 6
6 6 6 6 6
3 3 3
6
2 2 2 2 0.97725 0.02275
3
0.95450 95.5 %
X
P X P X P
X
P F F
− − | `
− < · − < − < · < < ·

. ,
− | `
· − < < · − − · − ·

. ,
· ≈
;

c) 3 9 σ ·
( ) ( ) ( )
( ) ( )
9 6 9
6 9 9 6 9
3 3 3
6
3 3 3 3 0.99865 0.00135
3
0.99730 99.7 %
X
P X P X P
X
P F F
− − | `
− < · − < − < · < < ·

. ,
− | `
· − < < · − − · − ·

. ,
· ≈


Primer 4.3. 3.
Ako slučajna promenljiva X aproksimira binomnu raspodelu B ( ) 100, 0.1 naći približno verovatnoću
( ) 7 16 P X < < .
100 0.1 10 np µ · · ⋅ · - matematičko očekivanje
2
10 0.9 9 npq σ · · ⋅ · - disperzija
Binomna raspodela se može aproksimirati normalnom raspodelom sa parametrima
( )
2
10, 3 N .
12
( ) ( ) ( )
7 10 16 10
7 16 2 1
3 3
0.97725 0,15866 0.81859
P X P Z F F
− − | `
< < · < < · − − ·

. ,
· − ·


Primer 4.3.4.
Anketirana je grupa motorista o broju kilometara koji pređu mesečmo. Prosečni broj kilometara
iznosi 1200km sa srandardnom devijacijom 150km. Broj pređenih kilometara se može predstaviti
slučajnom promenljivom koja ima normalnu raspodelu
( )
2
1200,150 N . .
Izračunati procenat motorista koji:
a) Prelaze 1200-1600 km mesečno.
b) Prelaze 1000-1500 km mesečno.
a) 1200 ; 150 µ σ · ·
( ) ( ) ( )
1200 1200 1600 1200
1200 1600 2.76 0
150 150
0.99711 0,5 0.49711 49.71%
P X P Z F F
− − | `
< < · < < · − ·

. ,
· − · ·

b)
( ) ( ) ( )
1000 1200 1500 1200
1000 1500 2 1.33
150 150
0.99725 0,09176 0.88549 88.55%
P X P Z F F
− − | `
< < · < < · − − ·

. ,
· − · ·


Primer 4.3.5.
Ako je slučajna promenljiva X B ( ) 50, 0.2 naći verovatnoću događaja A da je ( ) 5 15 P X ≤ ≤ .
a) Koristeći binomnu raspodelu
b) Binomnu raspodelu aproksimirati Poasonovom raspodelom
c) Binomnu raspodelu aproksimirati normalnom raspodelom
a) Binomnoj raspodeli B ( ) 50, 0.2 odgovara slučajna promenljiva
50
S
50
0 1 2 49 50
0 1 2 . .. 49 50
:
. . .
S
p p p p p
| `

. ,

5 6 14 15
( ) P A p p p p · + + + + L Pomoću funkcije BINOMDIST izračunava se:
5 6 7 8 9 10 11 12 13 14 15
0,0295310,0553710,087012 0,1169220,1364090,139819 0,1271080,1032750,07547 0,0498640,029919

5 6 14 15
( ) 0,950700562 P A p p p p · + + + + · L

13
b) Binomna raspodela se može aproksimirati Poasonovom raspodelom sa parametrom
50 0.2 10 ; np λ · · ⋅ ·
( ) ( ) ( ) ( )
5 6 15 50 50 50
5 6 15
10 10 10
5 6 ... 15
10 10 10
0,92201
5! 6! 15!
P A p p p P S P S P S
e e e
− − −
· + + + · · + · + + · ·
· + + + ·
L
L
5 6 7 8 9 10 11 12 13 14 15
0,03783 0,063060,09008 0,112600,12511 0,125110,11374 0,094780,07291 0,052080,03472

Navedene vraedosti su izračunate pomoću funkcije POISSON.

Binomna B(50,0.2) i odgovarajuća Poasonova raspodela
-0,02000
0,00000
0,02000
0,04000
0,06000
0,08000
0,10000
0,12000
0,14000
0,16000
0 10 20 30 40 50



c) Binomna raspodela se može aproksimirati normalnom raspodelom sa parametrima ( ) 10, 8 N .
50 0.2 10 np µ · · ⋅ · - matematičko očekivanje
2
10 0.8 8 npq σ · · ⋅ · - disperzija
( )
( ) ( )
5 10 15 10 5 5
5 15
8 8 8 8
1.76776 1.76776 0,96145-0,03855= 0,92290
P X P Z F F
F F
− − − | ` | ` | `
≤ ≤ · < < · − ·

. , . , . ,
· − − ·



14
Vežbanje 4. 4:
1. Ako je slučajna promenljiva X podleže zakonu raspodele
( )
2
20,10 N izračunati verovatnoću
( ) 5 28 P X < < .

2. Ako je slučajna promenljiva X B ( ) 100, 0.1 , koja aproksimira binomnu raspodelu normalnom,
naći približno verovatnoću ( ) 4 22 P X < < .

3. Ako je slučajna promenljiva X B ( ) 20, 0.3 naći verovatnoću ( ) 3 7 P X < < .
a) Binomnu raspodelu aproksimirati Poasonovom raspodelom
b) Binomnu raspodelu aproksimirati normalnom raspodelom

4. Ako je slučajna promenljiva X podleže zakonu raspodele
( )
2
20, 2 N izračunati:
( )
20 4 P X − < .

15
Rešenja 4.4
1. Ako je slučajna promenljiva X podleže zakonu raspodele
( )
2
20,10 N izračunati verovatnoću
( ) 5 28 P X < < .
20 µ · - matematičko očekivanje
10 σ · - disperzija
X
Z
µ
σ

·
( ) ( )
( ) ( )
5 20 28 20
5 28 1.5 0.8
10 10
0.8 1.5 0,78814 0,06681 0.72133
P X P Z P Z
F F
− − | `
< < · < < · − < < ·

. ,
· − − − · − ·


2. Ako je slučajna promenljiva X B ( ) 100, 0.1 , koja aproksimira binomnu raspodelu normalnom,
naći približno verovatnoću ( ) 4 22 P X < < .
100 0.1 10 np µ · · ⋅ · - matematičko očekivanje
2
10 0.9 9 npq σ · · ⋅ · - disperzija
Binomna raspodela se može aproksimirati normalnom raspodelom sa parametrima
( )
2
10, 3 N .
( ) ( ) ( )
4 10 22 10
4 22 4 2
3 3
0.99997 0.02275 0.97722
P X P Z F F
− − | `
< < · < < · − − ·

. ,
· − ·

3. Ako je slučajna promenljiva X B ( ) 20, 0.3 naći verovatnoću ( ) 3 7 P X < < .
a) Binomnu raspodelu aproksimirati Poasonovom raspodelom
b) Binomnu raspodelu aproksimirati normalnom raspodelom
a) Binomna raspodela se može aproksimirati Poasonovom raspodelom sa parametrom
20 0.3 6 ; np λ · · ⋅ ·
( ) ( ) ( ) ( )
4 5 6 20 20 20
4 5 6
6 6 6
4 5 6
6 6 6
0,133853 0,160623 0,160623 0, 455099
4! 5! 6!
P A p p p P S P S P S
e e e
− − −
· + + · · + · + · ·
+ + · + + ·


b) Binomna raspodela se može aproksimirati normalnom raspodelom sa parametrima ( ) 6, 4.2 N .
20 0.3 6 np µ · · ⋅ · - matematičko očekivanje
2
6 0.7 4.2 npq σ · · ⋅ · - disperzija
16
( )
( ) ( )
3 6 7 6 1 3
3 7
4.2 4.2 4.2 4.2
0.488 1.464 0.68723 0.07160 0.61563
P X P Z F F
F F
− − − | ` | ` | `
< < · < < · − ·

. , . , . ,
− − · − ·

Napomena: U primeru je velika razlika u verovatnoćama koje su dobijene primenom navedenih
aproksimacija.
Primenom funkcije BINOMDIST dobila bi se vrednost 0.500923 koja je najtačnija.
4 5 6 zbir
0,133853 0,160623 0,160623 0,455099 POISSON
0,130421 0,178863 0,191639 0,500923 BINOMDIST

Aproksimacije koje su rađene nisu bile umesne ,(naročito normalna ), jer je 20 n · i 6 np · .
Navedene su zbog uvežbavanja određenih proračuna.
4. Ako je slučajna promenljiva X podleže zakonu raspodele
( )
2
20, 2 N izračunati:
( )
20 4 P X − <
( ) ( ) ( )
( ) ( )
4 20 4
20 4 4 20 4
2 2 2
20
2 2 2 2
2
0.97725 0.02275 0.95450 95.5 %
X
P X P X P
X
P F F
− − | `
− < · − < − < · < < ·

. ,
− | `
· − < < · − − ·

. ,
· − · ≈

17
II STATISTIKA
5. STATISTIČKI SKUP
5.1. Osnovni pojmovi
Statistika je deo matematike koji se bavi sistematizacijom, predstavljanjem i obradom podataka
koji karakterišu elemente pojedinih skupova a izražavaju se pomoću brojeva. Takvi podaci se nazivaju
statističkim podacima. Statistika razvija postupke na osnovu kojih se donose odgovarajući tačni
zaključci koji su od značaja u skoro svim naukama kako u teorijskom tako i u praktičnom smislu.
Statistički skup (populacija) je skup svih elemenata na kojima se neka pojava statistički
obrađuje.Populacija može biti konačna ili beskonačna ali će se ovde razmatratni samo konačne
{ ¦
1 2
, , ,
n
ω ω ω Ω · L .
Obeležje je osobina po kojoj se elementi statističkog skupa razlikuju i koja je u osnovi statističke
obrade.
Isti statistički skup može imati više obeležja. Obeležja mogu biti numerička i atributivna.
Numerička obeležja pomoću brojeva izražavaju kvantitativne razlike među elementima statističkog
skupa. Prema vrsti brojeva pomoću kojih se izražavaju razlikuju se neprekidna i prekidna obeležja.
Neprekidna obeležja se izražavaju realnim vrednostima unutar nekog intervala dok se prekidna
obeležja izražavaju celim brojevima jer se dobijaju prebrojavanjem.
Atributovna obeležja izražavaju kvalitativne razlike pomoću modaliteta.

Primer 5.1.1.
Statistički skup (populacija) je skup svih studenata Visoke ICT upisanih 2008. godine.
Za svakog studenta se mogu posmatrati razna obeležja.
-Jedno neprekidno numeričko obeležje je : visina studenta (teorijski bilo koji broj iz intervala
[ ] , v V gde je v visina najnižeg a V visina najvišeg studenta
-Drugo neprekidno numeričko obeležje je : broj bodova za uspeh iz srednje škole (bilo koji broj iz
intervala [ ] 16, 40 )
-Primer za prekidno numeričko obeležje: broj tačno urađenik zadataka na prijemnom ispitu ( ceo
broj od 0 do 10).
-Primer za atributivno obeležje je : pol studenta (koji se ižražava preko dva modaliteta ženski i
muški).


18
5.2. Prikazivanje podataka ; Raspodela obeležja
Najjednostavniji način prikazivanja podataka je njihovo nabrajanje.To je često nepregledno pa se
pribegava različitim postupcima njihove sistematizacije.
Statistika se bavi i grafičkom interpretacijom podataka. Taj deo se naziva deskriptivnom
statistikom. Podaci se, zbog jasnosti i preglednosti mogu predstaviti pomoću tabela, grafikona,
dijagrama i tako dalje.
Neka je { ¦
1 2
, , ,
n
ω ω ω Ω · L populacija, : X R Ω → obeležje i
1 2
, , ,
m
x x x K vrednosti koje
može uzeti obeležje. Označimo sa ( )
i
f x broj elemenata populacije Ω na kojima obeležje X uzima
vrednosti
i
x , za svako { ¦ 1, 2, 3,..., i m ∈ .
DEF Frekvencija
i
f je broj pojavljivanja nekog podatka u okviru skupa podataka.
DEF Relativna frekvencija
i
f
n
je broj pojavljivanja nekog podatka podeljen brojem elemenata
skupa.

Primer 5.2.1. (prekidno numeričko obeležje)
∇ Anketirano je 30 studenata. Jedno pitanje se odnosilo na broj položenih ispita u toku jedne
godine. Dobijeni su sledeći podaci:
3,2,2,3,5,1,6,2,3,3, 4,5,2,3,4,4,5,3,3,4 4,3,5,4,3,5,4,2,3,5 – nabrajanje podataka
Prvi korak u uvođenju reda prilikom obrade nekih podataka je njihovo uređivanje po nekom
principu. U zavisnosti od vrste podataka ti postupci se razlikuju. Ako su u pitanju brojni podaci
korisno je njihovo sređivanje po veličini (sortiranje).
Sortirani podaci bi izgledali ovako:
1, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 6
Ako se u skupu podataka neki podaci pojavljuju više puta, onda broj ponavljanja predstavlja
frekvenciju
i
f , i-tog elementa.
{ {
1 1 5 10 7 6
1 , 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 6
1 4 2 43 1 4 44 2 4 4 43 1 44 2 4 43 1 4 2 4 3

Na primer,
3
10 f · a
5
6 f · .
Da bi se pratile pozicije elemenata poređanih po veličini u okviru skupa, može se dati i kumulativna
frekvencija.
Kumulativna frekvencija nekog elementa se dobija sabiranjem frekvencija svih elemenata koji mu
prethode. Na primer: 3 i manje položenih ispita ima 16 sudenata a 4 i manje ima 23 studenta.
Kolika je zastupljenost pojedinih elemenata unutar posmatranog skupa podataka pokazuje relativna
frekvencija
i
f
n
. Ona može biti iskazana i procentualno.Na primer : 2 položena ispita ima
5
16, 67%
30
·

studenata.
19
Navedene veličine se pregledno mogu prikazati pomoću tabele.

Element skupa
Broj položenih
ispita
i
x
Frekvencija
Broj studenata
i
f
Kumulativna
frekvencija
Relativna
frekvencija
i
f
n

1 1 1
1
3, 33%
30
·

2 5 6
5
16, 67%
30
·

3 10 16
10
33, 33%
30
·

4 7 23
7
23, 33%
30
·

5 6 29
6
20%
30
·

6 1 30
1
3, 33%
30
·


6
1
30
i
i
n f
·
· ·





Osnovni podaci (iz osenčenog dela tabele) mogu se predstaviti pomoću histograma. Histogram se
sastoji od niza pravougaonika kojima je jedna dimenzija vrednost klase (1,2,3,4,5,6) a druga,
odgovarajuće vrednosti frekvencija.













Histogram: Broj položenih ispita

1 2
2
4
6
8
10
12
3 4 5 6
f
20
Zastupljenost pojedinih elemenata se može predstaviti pomoću poligona frekvencije . Poligon
frekvencije se dobija spajanjem tačaka ( , )
i
i f . U navedenom primeru spajanjem tačaka:
(1,1) ; (2, 5) ; (3,10) ; (4, 7) ; (5, 6) ; (6,1) .











Poligon frekvencije: Broj položenih ispita











Odnos histograma i poligona frekvencije
Histogram i bar dijagram su sastavljeni od istih pravougaonika koji su u drugom slučaju
razdvojeni.








Bar chart 2 D: Broj položenih ispita
0
2
4
6
8
10
12
1 2 3 4 5 6
vrednost
f
r
e
k
v
e
n
c
i
j
a
0
2
4
6
8
10
12
1 2 3 4 5 6
vr e dnos t
f
r
e
k
v
e
n
c
i
j
a
1 2
2
4
6
8
10
12
3 4 5 6
f
21










Bar chart 3 D: Broj položenih ispita

Brojni podaci iz navedene tabele mogu se predstavljati i na druge načine pomoću različitih oblika
dijagrama. Najčešće se koriste dijagrami u obliku stubova (bar chart) ili krugova- pita ( pie chart).
Možda bi za ove druge, umesto pite, bolja asocijacija u duhu našeg jezika, bio burek ili torta. Za oba
tipa postoje dvodimenzione i trodimenzione varijante.










Pie chart 2 D: Broj položenih ispita










Pie chart 3 D: Broj položenih ispita ∆
Frekvencija i relativna frekvencija
1; 1; 3%
2; 5; 17%
3; 10; 34%
4; 7; 23%
5; 6; 20%
6; 1; 3%
Frekvencija i relativna frekvencija
1, 1, 3%
2, 5, 17%
3, 10, 34%
4, 7, 23%
5, 6, 20%
6, 1, 3%
1; 1
2; 5
3; 10
4; 7
5; 6
6; 1
0
2
4
6
8
10
1 2 3 4 5 6
Frekvencija i relativna frekvencija
22
U prethodnom primeru je na različite načine prikazana raspodela za jedno prekidno numeričko
obeležje.
Kod neprekidnih obeležja vrednosti se grupišu u intervale i tako se dobijaju intervalne serije
distribucije frekvencije. Intervali odgovaraju klasama u koje je podeljen statistički skup kod prekidnih
obeležja.
Intervali se koriste i kada je preveliki broj klasa kod prekidnih obeležja.
Intervali imaju donju i gornju granicu. Radi lakšeg predstavljanja i matematičke obrade intervalnih
serija uvodi se razredna sredina. Ona je aritmetička sredina krajeva intrvala
2
dgi ggi +
( dgi -donja
granica intervala ; ggi -donja granica intervala ) Geometrijski, to je srednja tačka nekog intervala.
Određivanje broja intervala ( k ) i širine intervala ( i ) nije sasvim proizvoljno . U statističkoj
literaturi često se koristi Stuges-ova formula:
1 3, 3log k n · + ;
max min
x x
i
k

·
Ponekada, se vrednost kojom počinje donja granica prvog grupnog intervala (
0
x ) dobija po formuli :

0 min
2
i
x x · −
*Napomena:
Broj intervala treba da bude, zbog preglednosti , između 5 i 12.
Često je i sam skup snabdeven nekom unutrašnjom, logičnom, podelom na disjunktne klase, pa se
toga treba pridržavati.

Primer 5.2.2. (prekidno numeričko obeležje )
Anketirano je 30 studenata. Pitanje se odnosilo na broj bodova koji su osvojili na testu iz
matematike, na prijemnom ispitu.. Dobijeni su sledeći podaci:

30 0 2 10 48 14 14 54 6 28
30 40 18 30 44 38 10 4 10 34
14 6 48 0 0 8 26 60 54 52

a) Grupisati podatke u obliku intervalne numeričke serije
b) Dati histogram frekvencije (ili bar dijagram ako se radi u Excelu)
c) Dati poligon frekvencije.
a) U ovom slučaju je 30 n ·
min max
0 ; 60 x x · ·
Određivanje broja intervala ( k ) :
1 3, 3log 1 3, 3log30 1 3, 3 1, 477 1 4, 875 6 k n · + · + · + ⋅ · + ≈
23
Određivanje širine intervala ( i ). ;
max min
60 0
10
6
x x
i
k
− −
· · ·
Vrednost kojom počinje donja granica prvog grupnog intervala (
0
x ) dobija se :
0 min
10
0 5
2 2
i
x x · − · − · − . Zbog prirode podataka, koji ne mogu biti negativni, u ovom slučaju će
ona biti 0.

Tabela grupisanja kandidata prema broju bodova:

Broj bodova
i
x Broj studenata
i
f Relativna frekvencija
i
f
n

0-10 11
11
36, 67%
30
·

11-20 4
4
13, 33%
30
·

21-30 5
5
16, 67%
30
·

31-40 3
3
10%
30
·

41-50 3
3
10%
30
·

51-60 4
4
13, 33%
30
·



Ako se prethodna napomena uzme u obzir, i bez ikakve (komplikovane) računice, došlo bi se do
istog broja intervala i do njihove dužine.
b) Bar dijagram :










Histogram bi izgledao slično, samo bi pravougaonici bili spojeni. Imali bi širinu 10 a visina bi im bila
ista.

Prijemni ispit
0
5
10
15
0-10 11-
20
21-
30
31-
40
41-
50
51-
60
Osvojeni bodovi
B
r
o
j

s
t
u
d
e
n
a
t
a
Broj studenata
24
c) Poligon frekvencije









Oznake na x- osi su mogle biti 5,15,25, 35, 45, 55 odnosno, umesto intervala mogle su biti navedene
razredne sredine (srednje vrednosti intervala).


Prijemni ispit
0
2
4
6
8
10
12
0-10 11-
20
21-
30
31-
40
41-
50
51-
60
Osvojeni bodovi
B
r
o
j

s
t
u
d
e
n
a
t
a
Broj studenata
25
5.3. P Pr ri ik ka az z r re ez zu ul lt ta at ta a ” ”S St ta ab bl lo o- -l li is st t” ” m me et to od do om m
P Pr ri il li ik ko om m s sr re eđ đi iv va an nj ja a p po od da at ta ak ka a i i n nj ji ih ho ov ve e k kl la as si if fi ik ka ac ci ij je e u u o od dr re eđ đe en ne e k kl la as se e n ne ek ka ad da a j je e k ko or ri is sn no o p po os sl lu už ži it ti i s se e
m me et to od do om m ” ”S St ta ab bl lo o- -l li is st t” ”( ( ” ”S St te ea am m- -a an nd d- -L Le ea af f” ”) ). .
Prikazaćemo ovu metodu na primeru dvoocifrenih podataka
Prikaz podataka ovom metodom se izvodi na sledeći način:
- Formira se tabela sa dve kolone i sa onoliko vrsta koliko ima klasa u koje će biti raspoređeni podaci.
- U prvoj koloni su prve cifre brojnih podataka ( 0-9 )
- U drugoj koloni su druge cifre brojnih podataka ( 0-9 ) navedene onoliko puta u koliko podataka su
zastupljene. Ukupan broj „listova je jednak broju podataka koji se predstavljaju.
Primer 5.3.1.
Anketirano je 40 potrošača. Pitanje se odnosilo na broj artikala koji su kupili u toku jedne nedelje.
Dobijeni su sledeći podaci:
23 20 32 10 41 14 14 54 61 28
30 40 18 30 44 68 10 42 10 34
12 43 70 24 56 33 72 54 71 79
14 26 48 20 30 28 26 60 54 52

” ”S St ta ab bl lo o- -l li is st t” ” p pr ri ik ka az z o ov vi ih h p po od da at ta ak ka a s se e daje se tabelom:










P Pr rv va a k ko ol lo on na a j je e „ „s st ta ab bl lo o“ “ ( (1 1, ,2 2, ,. .. .. ., ,7 7) )
D Dr ru ug ga a k ko ol lo on na a p pr re ed ds st ta av vl lj ja a „ „l li is st to ov ve e“ “ ( (0 0, ,1 1, ,. .. .. ., , 9 9) ). .
I Iz z o ov vo og g p pr ri ik ka az za a s se e v vi id di i d da a s se e p po od da ac ci i m mo og gu u p po od de el li it ti i u u s se ed da am m k kl la as sa a. . ] ] ] 10,19 ; 20, 29 ; 70, 79

K . .
N Na a t ta aj j n na ač či in n s se e d da aj ju u d de et ta al lj jn ni ij je e i in nf fo or rm ma ac ci ij je e o o p po od da ac ci im ma a u un nu ut ta ar r s sv va ak ke e k kl la as se e. .
N Na a p pr ri im me er r, , u u s st ta ab bl lu u 1 1 s su u p po od da ac ci i i iz z i in nt te er rv va al la a ] 10,19

. .



I Im ma a i ih h u uk ku up pn no o 8 8 i i t to o s su u : : 1 10 0, ,1 14 4, , 1 14 4, ,1 18 8, , 1 10 0, ,1 10 0, , 1 12 2 i i 1 14 4. .

U U s st ta ab bl lu u 6 6 i im ma a 3 3 v vr re ed dn no os st ti i a a t to o s su u: : 6 61 1, ,6 68 8 i i 6 60 0. .
Stablo List
1 0 4 4 8 0 0 2 4
2 3 0 8 4 6 0 8 6 2
3 2 0 0 4 3 0
4 1 0 4 2 3 8
5 4 6 4 4
6 1 8 0
7 0 2 1 9
1 0 4 4 8 0 0 2 4
26



N Na a s sl li ič ča an n n na ač či in n s se e m mo og gu u p pr ri ik ka az za at ti i i i b br ro oj jn ni i p po od da ac ci i d dr ro og ga ač či ij je eg g t ti ip pa a. . L Li is st to ov vi i m mo og gu u b bi it ti i d dv vo oc ci if fr re en ni i b br ro oj je ev vi i. .
N Na a p pr ri im me er r: :


p pr re ed ds st ta av vl lj ja a p po od da at tk ke e 1,201; 1,215; 1,232; 1,210
Ako je broj podataka veliki (>100) ovakav prikaz nije pogodan već se koriste drugi načini.


5.4 Vežbanje:
1.Anketirano je 40 potrošača. Pitanje se odnosilo na broj artikala koji su kupili u toku jedne
nedelje. Dobijeni su sledeći podaci:

23 20 2 10 41 14 14 54 6 28
30 40 18 30 44 68 10 4 10 34
12 43 7 24 56 33 7 54 71 79
14 6 48 0 0 8 26 60 54 52

a) Grupisati podatke u obliku intervalne numeričke serije
b) Dati histogram frekvencije
c) Dati poligon frekvencije
d) Dati ” ”S St ta ab bl lo o- -l li is st t” ” p pr ri ik ka az z p po od da at ta ak ka a. .

2.Dat je ” ”S St ta ab bl lo o- -l li is st t” ” p pr ri ik ka az z p po od da at ta ak ka a: :








a) Grupisati podatke u obliku intervalne numeričke serije
b) Dati histogram frekvencije.
c) Dati poligon frekvencije.
6 1 8 0
1,2 0 01 1 1 15 5 3 32 2 1 10 0
Stablo List
1 2 0 4 4 8 0 0 2 4
2 3 0 8 4 6 0 8 6 2
3 2 0 0 4 3 0
4 1 0 4 2 3 8
5 5 6 0 4 6 4 4
6 1 8 0
27
ANALIZA PODATAKA
Da bi se izvršila analiza statističkog skupa ili nekog obeležja izračunavaju se nove veličine,
pokazatelji određenih osobina. Pokazatelji (parametri) koji se najčešće koriste su:








Pregled najčešće korišćenih parametara statističkog skupa

6. SREDNJE VREDNOSTI
Srednje vrednosti su važni pokazatelji osobina statističkog skupa. To su prosečne vrednosti na
osnovu kojih se dobijaju važne informacije o celoj populaciji. Srednje vrednosti reprezentuju čitav
skup pa su značajne prilikom upoređivanja različitih skupova.
Postoje dve osnovne grupe srednjih vrednosti :
IZRAČUNATE ( aritmetička sredina, geometrijska sredina, harmonijska sredina,...)
POZICIONE (mod, medijana, kvartil...)
Postoje i drugi, slični, parametri ali su ovi najviše korišćeni.
















POKAZATELJI
osobina skupa

SREDNJE
VREDNOSTI
MERE
VARIJABILITETA
(POKAZATELJI
DISPERZIJE)
MERE
ASIMETRIJE I
SPLJOŠTENOSTI

SREDNJE
VREDNOSTI

IZRAČUNATE


POZICIONE


Aritmetička
sredina

Geometrijska
sredina

Harmonijska
sredina

Mod

Medijana

Kvartili
28
6.1. Aritmetička sredina ( X )
DEF Za
1 2
, , ,
n
x x x K aritmetička sredina je

1 2
1
1
n
n
i
i
x x x
X x
n n
·
+ + +
· ·

L

Prosta aritmetička sredina se dobija u onim serijama gde se svaki od n podataka
1 2
, , ,
n
x x x K ,
javlja samo po jednom.

Primer 6.1 1.
∇ Izračunati aritmetičku sredinu za brojeve : 1,3,7,11,15,20.
1 3 7 11 15 20 57
9, 5
6 6
X
+ + + + +
· · · ∇

Primer 6.1 2.
∇ Izračunati prosečni promet (u hiljadama dinara) u toku nedelje, na jednom šalteru pošte :

i
x
1. Ponedeljak 98
2. Utorak 76
3. Sreda 79
4. Četvrtak 56
5. Petak 81
6. Subota 51
Prosečni promet 73,5


Prosečni promet:
( )
6
1 2 3 4 5 6
1
1 1
73, 5
6 6
i
i
X x x x x x x x
·
· · + + + + + ·




Ponderisana aritmetička sredina (ponderatio-odmeravanje lat) se koristi ukoliko postoje vrednosti
koje se ponavljaju više puta. Aritmetička sredina se tada dobija po formuli:

1 1 2 2 1
1 2
1
n
i i
n i
n
n
i
i
x f
x f x f x f
X
f f f
f
·
·

⋅ + ⋅ + + ⋅
· ·
+ + +


L
L



29
Primer 6.1 3.
∇ Izračunati prosečnu ocenu na ispitu ako su postignuti rezultati dati tabelom:
Ocena ( )
i
x Broj studenata ( )
i
f
5 7
6 14
7 11
8 8
9 6
10 4

Prosečna ocena je :
1 1 2 2
1 2
5 7 6 14 7 11 8 8 9 6 10 4
7 14 11 8 6 4
354
7, 08
50
n
n
x f x f x f
X
f f f
⋅ + ⋅ + + ⋅ ⋅ + ⋅ + ⋅ + ⋅ + ⋅ + ⋅
· · ·
+ + + + + + + +
· ·
L
L

Primer 6.1 4.
∇ Izračunati prosečan broj bodova na prijemnom ispitu ako su postignuti rezultati dati tabelom:
U slučaju intervalnih serija potrebno je izračunati srednje vrednosti intervala.
Da se podsetimo, to su aritmetičke sredine krajeva intrvala
2
dgi ggi +

( dgi -donja granica intervala ; ggi -donja granica intervala ).
Prilikom izračunavanja korisno je sližiti se tabelom sa međurezultatima.

Broj bodova Broj studenata
i
f Razredna sredina
i
x i i
f x ⋅
0-10 11 5 55,00
11-20 4 15,5 62,00
21-30 5 25,5 127,50
31-40 3 35,5 106,50
41-50 3 45,5 136,50
51-60 4 55,5 222,00
30 709,50

Prosečan broj bodova je:
1 1 2 2
1 2
5 11 15,5 4 25, 5 5 35, 5 3 45, 5 3 55,5 4
11 4 5 3 3 4
55 62 127, 5 106, 5 136, 5 222 709, 5
23, 65
30 30
n
n
x f x f x f
X
f f f
⋅ + ⋅ + + ⋅ ⋅ + ⋅ + ⋅ + ⋅ + ⋅ + ⋅
· · ·
+ + + + + + + +
+ + + + +
· ·
L
L


30
6.2. Geometrijska sredina (G)

DEF Za
1 2
, , , 0
n
x x x > K geometrijska sredina je
1 2
n
n
G x x x · L .
Geometrijska sredina se koristi u ekonomskoj statistiici u praćenju dinamike određenih procesa.
Njeno izračunavanje je vezano za logaritme. Zbog definisanosti n-tog korena i logaritma , ona se
izračunava samo ako su sve vrednosti sa kojima se radi strogo pozitivne.

Logaritmovanjem leve i desne strane ( može za proizvoljnu osnovu ali uzećemo osnovu 10) dobija
se:

( )
( )
1 2
1
1 2
1 2
1 2
log
log log
1
log log
log log log
log
n
n
n
n
n
n
G x x x
G x x x
G x x x ili
n
x x x
G
n
·
·
·
+ + +
·
L
L
L
L

Antilogaritmovanjem se dobija geometrijska sredina.

( )
1 2
log
10
n
x x x
n
G ·
L
ili
1 2
log log log
10
n
x x x
n
G
+ + +
·
L


Primer 6.2 1.
∇ Izračunati geometrijsku sredinu za brojeve : 1,3,7,11,15,20.

6
1
6
1 3 7 11 15 20 log
1 4,84073
log log69300 log69300 0, 80679
6 6
G
G
· ⋅ ⋅ ⋅ ⋅ ⋅
· · · ·

0.80679
10 6.409 G · · ∆


Za slučaj grupisanih podataka
1 2
, , ,
k
x x x K koji imaju frekvencije
1 2
, , ,
k
f f f K formula za geometrijsku sredinu glasi:

1 2
1 2 1 2
;
k
f f f
n
k k
G x x x n f f f · · + + + L L



31
6.3. Harmonijska sredina (H)
DEF Za
1 2
, , ,
n
x x x K harmonijska sredina je :

1 2 1
1 1 1 1
n
n i i
n n
H
x x x x
·
· ·
+ + +

L

Prosta harmonijska sredina se dobija u onim serijama gde se svaki od n podataka
1 2
, , ,
n
x x x K ,
javlja samo po jednom.

Primer 6.3 1.
∇ Izračunati harmonijsku sredinu za brojeve : 1,3,7,11,15,20.
6 6
1 1 1 1 1 1 4620 1540 660 420 308 331
1 3 7 11 15 20 4620 4620 4620 4620 4620 4620
6 4620 27720
3, 52
7879 7879
H · · ·
+ + + + + + + + + +

· · ·

Da bi se pravila manja računska greška razlomci u imeniocu su dovedeni na
(1, 3, 7,11,15, 20) 3 4 5 7 11 4620 NZS · ⋅ ⋅ ⋅ ⋅ · .
Moglo se raditi i ovako:
6 6 6
1 1 1 1 1 1
1 0, 33 0,14 0, 09 0, 07 0, 05 1, 68
1 3 7 11 15 20
3, 57
H · · · ·
+ + + + +
+ + + + +
·


Harmonijska sredina se koristi u slučajevima višestruke obrnute proporcionalnosti
Primer 6.3 1. je mogao biti formulisan i na drugi način:
∇ Šest mašina, različite starosti, proizvodi isti artikal i potrebno im je vreme navedeno u tabeli:








Izračunati prosečno radno vreme za izradu artikla.
Izračunata harmonijska sredina 3, 57s predstavlja traženo prosečno vreme. ∆
R.b. mašine: Vreme u s (
i
x )
1. 1
2. 3
3. 7
4. 11
5. 15
6. 20
32
Ponderisana harmonijska sredina se koristi ukoliko postoje vrednosti koje se ponavljaju. Za slučaj
grupisanih podataka
1 2
, , ,
k
x x x K koji imaju frekvencije
1 2
, , ,
k
f f f K formula za harmonijsku
sredinu glasi:
1 2
1 2 1
1
n
n
n i i
n n
H
f f f
x x x x
·
· ·
+ + +

L
gde je
1 2 n
n f f f · + + + L .

Upoređivanjem aritmetičke , geometrijske i harmonijske sredine dobija se:
X G H ≥ ≥
U predhodnim primerima, za brojeve 1,3,7,11,15,20 , izračunate su:

9, 5 X · 6, 409 G · 3, 57 H ·


U EXCEL-u postoje statističke funkcije AVERAGE, GEOMEAN i HARMEAN pomoću kojih se
izračunavaju navedene sredine . Njihovom primenim se dobija:





1
3
7
11
15
20
Aritmetička sredina (AVERAGE) 9,5

Geometrijska sredina (GEOMEAN) 6,408979

Harmonijska sredina (HARMEAN) 3,56344
33
6.4. Pozicione srednje vrednosti; Mod ( ) Mo ; Medijana ( ) Me ; Kvartili ( )
i
Q
Prilikom posmatranja statističkog skupa ili nekog obeležja podaci se daju u sređenom nizu, to jest
poređani po veličini. Moguće je posmatrati srednje vrednosti koje su definisane svojim mestom,
odnosno pozicijom, u navedenoj seriji.

DEF Mod ( ) Mo je vrednost obeležja koja u navedenom nizu podataka ima najveću frekvenciju.
To je vrednost koja se najčešće javlja. U upotrebi su i termini modus ili modalna vrednost.
Primer 6.4.1
Među podacima: 1,1, 3, 5,5,5,5,5,5,5, 7, 9,9, 11,11,11, 13,13, 15,15,15 postoji mod i on iznosi 5.
5 Mo ·
Primer 6.4.2
U nizu podataka ne mora da postojati mod.
To je slučaj u nizu: 2,4,6,8,10,12,14,16

Primer 6.4.3
Može se desiti da postoji više modova.
Među podacima: 1,1,1, 3,3, 5,5, 7, 9,9, 11,11,11, 13,13, 15,15,15, 17, 19, 21,21 postoje tri moda i to
su 1, 11 i 15.

Za neprekidne vrednosti obeležja, one koje su grupisane po intervalima, mod se ne vidi direktno
nego se izračunava. Uočavaju se intervali sa najvećim frekvencijama (modalni intervali) i koristi se
formula:

( ) ( )
2 1
1
2 1 2 3
f f
Mo a d
f f f f

· +
− + −

1
a - donja granica modalnog intervala
d - veličina grupnog intervala
1
f ,
2
f ,
3
f - frekvencije premodalnog, modalnog i poslemodalnog intervala

Primer 6.4.4
Za 40 telefonskih razgovora merena je dužina trajanja.Izračunati mod za podatke date tabelom.

Dužina razgovora
u minutama
0-2 2-4 4-6 6-8 8-10 10-12 12-14
Broj razgovora 7 6 14 8 2 2 1

Napomena: Intervali su navedeni u obliku [ )
1
,
i i
a a
+

Modalni interval je [ ) 4, 6
34
1
4 a · - donja granica modalnog intervala
2 d · - veličina grupnog intervala
1
6 f · ,
2
14 f · ,
3
8 f · - frekvencije premodalnog, modalnog i poslemodalnog intervala
( ) ( )
14 6 8 4
4 2 4 4 4, 57
14 6 14 8 8 6 7
Mo

· + ⋅ · + · + ·
− + − +


DEF Medijana ( Me ) je vrednost obeležja koja u navedenom nizu podataka, uređenom po
veličini, zauzima srednju poziciju.

Pri određivanju medijane treba imati u vidu da li je broj elemenata skupa koji čine obeležje, neparan ili
paran.
U slučaju neparnog broja elemenata, medijana je srednji član.
Primer 6.4.5
U nizu podataka 1,1, 3, 5,5,5,5,5,5,5, 7, 9,9, 11,11,11, 13,13, 15,15,15 kojih ima 21, srednji je
jedanaesti po redu a to je 7. 7 Me ·

U slučaju parnog broja elemenata, postoje dva srednja člana i medijana se dobija kao aritmetička
sredina srednjih članova..
Primer 6.4.6
U nizu: 2,4,6,8,10,12,14,16 kojih ima 8, postoje dva srednja člana a to su 8 i 10.

8 10
9
2
Me
+
· ·
Za neprekidne vrednosti obeležja, one koje su grupisane po intervalima, određuje se medijalni
interval u kome se nalazi središnji član . Za nalaženje pozicije medijane koriste se obrasci:
1
2
n
i
i
f
·

sa neparanim ili
1
1
2
n
i
i
f
·
+

sa paranim brojem podataka u seriji.
Za izračunavanje medijane se koristi formula :

1
1
1
2
k
i
i k
d N
Me a f
f

·
| `
· + −

. ,

ako je neparan broj podataka u seriji ili
1
1
1
1
2
k
i
i k
d N
Me a f
f

·
+ | `
· + −

. ,

ako je paran broj podataka u seriji
1
a - donja granica medijalnog intervala
d - veličina grupnog intervala
N - broj članova skupa
35
1
1
k
i
i
f

·

-zbir svih frekvencija predmedijalnih intervala
k
f - frekvencije medijalnog intervala
Primer 6.4.7.
∇ Za 55 telefonskih razgovora merena je dužina trajanja.Izračunati medijanu za podatke date
tabelom.
Dužina razgovora
u minutama
0-2 2-4 4-6 6-8 8-10 10-12 12-14
Broj razgovora 16 13 10 5 4 3 4

Pozicija srednjeg člana,
1
55
27, 5
2 2
n
i
i
f
·
· ·


Medijalni interval je [ ) 2, 4
1
2 a · - donja granica medijalnog intervala
2 d · - veličina grupnog intervala
55 N · - broj članova skupa
1
16 f · - postoji samo jedan predmedijalni interval
2
13 f · - frekvencije medijalnog intervala
1
1
1
2 55 2 23
2 16 2 3, 769
2 13 2 13 2
k
i
i k
d N
Me a f
f

·
| ` | `
· + − · + − · + ·

. , . ,


Može se zaključiti da polovina razgovora traje manje od 3,769 minuta. ∆
Primer 6.4.8.
∇ Za 40 telefonskih razgovora merena je dužina trajanja.Izračunati medijanu za podatke date
tabelom.
Dužina razgovora
u minutama
0-2 2-4 4-6 6-8 8-10 10-12 12-14
Broj razgovora 7 6 14 8 2 2 1

Pozicija srednjeg člana,
1
1
40 1
20, 5
2 2
n
i
i
f
·
+
+
· ·


Medijalni interval je [ ) 4, 6
1
4 a · - donja granica medijalnog intervala
2 d · - veličina grupnog intervala
36
40 N · - broj članova skupa
3
1
7 6 13
i
i
f
·
· + ·

-zbir svih frekvencija predmedijalnih intervala
3
14 f · - frekvencije medijalnog intervala
1
1
1
1 2 41 1 15
4 13 4 5, 07
2 14 2 7 2
k
i
i k
d N
Me a f
f

·
+ | ` | ` | `
· + − · + − · + ·

. , . , . ,



DEF Kvartili ( ; 1, 2, 3
i
Q i · ) su vrednosti koje dele obeležje (navedeni niz podataka,
uređen po veličini) na četiri jednaka dela.





Prvi kvartil (
1
Q ) je vrednost obeležja od koje 25% elemenata skupa, uređenih po veličini, ima manju
ili jednaku vrednost.
Drugi kvartil (
2
Q ) je medijana Me .
Treći kvartil (
3
Q ) je vrednost obeležja od koje 75% elemenata skupa, uređenih po veličini, ima
manju ili jednaku vrednost.

Kod intervalnih serija kvartili se izračunavaju slično kao medijana:
1
1
1 1
1
4
k
i
i Q
d N
Q a f
f

·
| `
· + −

. ,

;
3
1
3 1
1
3
4
k
i
i Q
d N
Q a f
f

·
| `
· + −

. ,


1
a - donja granica kvartilnog intervala
d - veličina grupnog intervala
N - broj članova skupa
1
1
k
i
i
f

·

-zbir svih frekvencija predkvartilnih intervala
i
Q
f - frekvencije kvartilnog intervala

Primer 6.4.9.
Dati su podatci: 1,1,1,1, 2,2,2,2,2,2,3,3,3,4,4,4,4,4,5,6,6,7,7
Odrediti prvi kvartil (
1
Q ), drugi kvartil (
2
Q ) i treći kvartil (
3
Q ).

1
Q
3
Q
4
Q
2
Q
37
Kvartili se najbolje vide iz tabele u kojoj se kumulativna frekvencija izrazi u procentima. Tada je jasno
koje su to vrednosti od kojih 25% (50%,75%) elemenata skupa, uređenih po veličini, ima manju ili
jednaku vrednost.

Element skupa
i
x
Frekvencija
i
f
Kumulativna
frekvencija
Kumulativna
frekvencija u %

1 4 4 16, 67%


2 6 10 41, 67%

1. kvartil
3 3 13
51,17%
2. kvartil (Me)
4 6 19
79,17%
3. kvartil
5 1 20
83, 33%

6 2 22
91, 67%


7 2 24 100%

7
1
24
i
i
n f
·
· ·






Prvi kvartil (
1
Q ):
1
2 Q ·
Drugi kvartil (
2
Q ) ili medijana: 3 Me · .
Treći kvartil (
3
Q ):
3
4 Q · ∆












38
6.5. Vežbanje
1) U trci na 2400m mereno je vreme i dobijeni su rezultati koji su prikazani tabelom:








a) Formirati tabelu u kojoj će biti ( )
i
t -vreme u i- tom krugu i ( )
i
v brzine ostvarene u svakom krugu.
b) Izračunati prosečno vreme po krugu t i prosečnu brzinu po krugu v .
c) Grafički predstaviti vremena ( )
i
t postignuta u pojedinim krugovima.
a) ( )
s
v
t
· ( )
i
t -vreme u i- tom krugu u s ;
400
i
i
v
t
· ( )
i
v - brzina u
m
s














b) Prosečno vreme po krugu 114,16667 t s ·
Prosečna brzina po krugu 3,506697 / v m s · .
c)







Krug
Vreme na kraju
i. tog kruga u s
Vreme na kraju
i. tog kruga
1. 115 1' 55"
2. 222 3' 42"
3. 337 5' 37"
4. 453 7' 33"
5. 570 9' 30"
6. 685 11' 25"
Trka na 2400 metara

Krug
( )
i
t

Vreme u
i- tom krugu
( )
i
v
1 115 1' 55" 3,478261
2 107 1' 47" 3,738318
3 115 1' 55" 3,478261
4 116 1' 56" 3,448276
5 117 1' 57" 3,418803
6 115 1' 55" 3,478261
t t v
Prosek:

114,16667 1' 54" 3,506697
Trka na 2400m
100
105
110
115
120
1 2 3 4 5 6
KRUG
V
r
e
m
e

u

s
Series1
39
2) Izračunati aritmetičku, geometrijsku i harmonijsku sredinu za brojeve : 1,3,4,5,6,7,10,11.

Odgovor:
Aritmetička sredina (AVERAGE) 5.875

Geometrijska sredina (GEOMEAN) 4.79015

Harmonijska sredina (HARMEAN) 3.502985


3) Za podatke date tabelom

i
x
1 2 3 4 5 6 7
i
f
4 6 3 5 2 2 3

odrediti mod, medijanu, prvi kvartil (
1
Q ),i treći kvartil (
3
Q ).

Odgovor:
2 Mo · ;
2
3 Me Q · · ;
1
2 Q · ;
3
5 Q ·
40
7. MERE VARIJABILITETA (POKAZATELJI DISPERZIJE)
Mere varijabiliteta za obeležje X jednog statističkog skupa vezane su za unutrašnji raspored
podataka u odnosu na reprezentativne podatke serije a to su razne sredine. Najčešće se analiziraju
odstupanja u odnosu na aritmetičku sredinu.
Postoje različiti parametri koji mere odstupanja i rasipanje elemenata neke statističke serije.
Najznačajniji su:
- Raspon varijacije ( ) R
- Srednja devijacija ( ) SD
- Disperzija
2
( ) σ i standardna devijacija ( ) σ
- Koeficijent varijacije ( )
V
K


7.1. Raspon varijacije

DEF Raspon varijacije ( ) R je razlika između najveće i najmanje vrednosti obeležja nekog
statističkog skupa.

max min
R x x · −
Ovaj najjednostavniji parametar pokazuje razmak između maksimalne i minimalne vrednosti i
često se koristi jer daje korisne informacije o podacima koji se obrađuju. Na primer, raspon plata,
raspon temperatura u toku dana ,...

Primer 7.1.1.
∇ U toku jedne sedmice izmerene su dnevne prosečne temperature u Celzijusovim stepenima. Koliki
je raspon dnevnih temperatura u toku te nedelje ?

Nedelja
18,3 °C
Ponedeljak
19,8 °C
Utorak
17,6 °C
Sreda
17,9 °C
Četvrtak
15,6 °C
Petak
18,1 °C
Subota
15,1 °C

MERE
VARIJABILITETA


Raspon varijacije
Koeficijent
varijacije

Disperzija i
stand. devijacija

Srednja devijacija
41
max min
19.8 ; 15.1 x x · ·

Raspon dnevnih temperatura u toku posmatrane nedelje je:

max min
19, 8° 15,1° 4, 7° R x x · − · − · ∆


7.2. Srednja devijacija

Za obeležje X jednog statističkog skupa čije su vrednosti
1 2
, , ,
n
x x x K i čija je aritmetička sredina
X , razlike
1 2
, , ,
n
x X x X x X − − − K predstavljaju odstupanja (devijacije) vrednosti od njihove
atitmetičke sredine.

DEF Srednja devijacija (SD) je aritmetička sredina apsolutnih vrednosti odstupanja vrednosti
obeležja od njihove aritmetičke sredine..
Ako je srednje apsolutno odstupanje manje to znači da aritmatička sredina X bolje reprezentuje
podatke iz posmatranog niza.
Za prostu seriju podataka izračunava se po formuli:

1 2
1
n
i
n
i
x X
x X x X x X
SD
n n
·

− + − + + −
· ·

L

Primer 7.2.1.
∇ U toku jednog dana izmerene su podnevne temperature koje su date tabelom. Koliko je srednje
odstupanje (srednja devijacija) temperatura ?








Potrebno je prvo izračunati aritmetičku sredinu X .

10 11 9 12 1 13
9
6
X
+ + + − +
· ·

10 9 11 9 9 9 12 9 1 9 13 9 1 2 0 3 10 4 20
3.33
6 6 6
SD
− + − + − + − + − − + − + + + + +
· · · ·

Srednje odstupanje temperatura iznosi 3.33 °C . ∆

Beograd
10 °C
Kragujevac
11 °C
Valjevo
9 °C
Loznica
12 °C
Kopaonik
-1 °C
Novi Sad
13 °C
42

Za grupisane podatke srednja devijacija se izračunava slično:

1 1 2 2
1
1 2
1
n
i i
n n
i
n
n
i
i
f x X
f x X f x X f x X
SD
f f f
f
·
·

− + − + + −
· ·
+ + +


L
L


U EXCEL-u postoji funkcija AVEDEV koja izračunava srednju devijaciju.

Primer 7.2.2.
∇ Izračunati srednju devijaciju ako su na ispitu postignuti rezultati dati tabelom:
Ocena ( )
i
x Broj studenata ( )
i
f
5 7
6 14
7 11
8 8
9 6
10 4

Navedena tabela je iz primera 6.1.3. u kom je izračunata prosečna ocena, odnosno aritmetička sredina
:
1 1 2 2
1 2
5 7 6 14 7 11 8 8 9 6 10 4
7 14 11 8 6 4
354
7, 08
50
n
n
x f x f x f
X
f f f
⋅ + ⋅ + + ⋅ ⋅ + ⋅ + ⋅ + ⋅ + ⋅ + ⋅
· · ·
+ + + + + + + +
· ·
L
L

Da bi izračunavanje bilo preglednije i da bi se smanjila mogućnost pravljenja računskih grešaka,
korisno je sve međurezultate prikazati u pomoćnoj tabeli.









6
1
6
1
61.12
1.22
50
i i
i
i
i
f x X
SD
f
·
·

·· · ·



Ocena ( )
i
x Broj studenata ( )
i
f i
x X −
i
x X −
i i
f x X −
5 7 -2.08 2.08 14.56
6 14 -1.08 1.08 15.12
7 11 -0.08 0.08 0.88
8 8 0.92 0.92 7.36
9 6 1.92 1.92 11.52
10 4 2.92 2.92 11.68
6 n ·
6
1
50
i
i
f
·
·



6
1
61.12
i i
i
f x X
·
− ·

43
7.3. Disperzija, standardna devijacija

Najviše je u upotrebi parametar koji predstavlja srednje kvadratno odstupanje svakog podatka iz
serije od aritmetičke sredine.
DEF Disperzija (varijansa)
2
( ) σ je aritmetička sredina kvadrata odstupanja vrednosti obeležja od
njihove aritmetičke sredine.

(1)
( ) ( )
2
2 2
1
2 1
( )
n
i
n
i
x X
x X x X
n n
σ
·

− + + −
· ·

L


Za izračunavanje disperzije može se koristiti i jednostavnija formula koja se izvodi na sledeći
način:
2
2
2 2 1
1 1
2 2 2 2
1 1
( )
1 1
2
1 1
2
n
i n n
i
i i
i i
X
n n
i i i
i i
x X
X
x X x n
n n n n
f x XX X x X
n n
σ
·
· ·
· ·

· · − + ·
· − + · −

∑ ∑
∑ ∑
14 2 43


(2)
2 2 2
1
1
n
i
i
x X
n
σ
·
· −



Prilikom korišćenja formule (2) nije potrebno izračunavanje odstupanja pojedinih vrednosti od
aritmetičke sredine već se disperzija računa iz vrednosti obeležja.
Primer 7.3.1.
∇ U toku jednog dana izmerene su podnevne temperature koje su date tabelom. Koliko je disperzija,
odnosno srednje kvardatno odstupanje temperatura ?
Beograd
10 °C
Kragujevac
11 °C
Valjevo
9 °C
Loznica
12 °C
Kopaonik
-1 °C
Novi Sad
13 °C


U primeru 7.2.1. gde je izračunata je srednja devijacija, prvo je izračunata aritmetička sredina

10 11 9 12 1 13
9
6
X
+ + + − +
· · .



44
Za izračunavanje disperzije biće korišćena pomoćna tabela i formula (1):

i
x
i
x X −
( )
2
i
x X −
Beograd 10 1 1
Kragujevac 11 2 4
Valjevo 9 0 0
Loznica 12 3 9
Kopaonik -1 -10 100
Novi Sad 13 4 16
6 n ·


6
2
1
( ) 130
i
i
x X
·
− ·


6
2
2 1
( )
130
21.67
6 6
i
i
x X
σ
·

· · ·



Ako se upotrebi formula (2) pomoćna tabela je malo drugačija:

i
x
2
i
x
Beograd 10 100
Kragujevac 11 121
Valjevo 9 81
Loznica 12 144
Kopaonik -1 1
Novi Sad 13 169
6 n ·

6
2
1
616
i
i
x
·
·



2 2 2
1
1 1
616 81 102.67 81 21.67
6
n
i
i
x X
n
σ
·
· − · − · − ·




Za grupisane podatke disperzija se izračunava po formuli:

( ) 1′
( ) ( )
2 2
2 2
1 1
2 1 1
1 2
1
( ) ( )
n n
i i i i
n n
i i
n
n
i
i
f x X f x X
f x X f x X
f f f N
f
σ
· ·
·
− −
− + + −
· · ·
+ + +
∑ ∑

L
L

gde je
1
n
i
i
f N
·
·



Za izračunavanje disperzije može se koristiti i jednostavnija formula:
{
2
2
2 2 1
1 1 1
2 2 2 2
1 1
( )
1 1
2
1 1
2
n
i i n n n
i
i i i i i
i i i
N
X
n n
i i i i
i i
f x X
X
f x X f x f
N N N N
f x XX X f x X
N N
σ
·
· · ·
· ·

· · − + ·
· − + · −

∑ ∑ ∑
∑ ∑
1 4 2 4 3

45

( )
2 2 2
1
1
2
n
i i
i
f x X
N
σ
·
′ · −



Primer 7.3.2.
∇ Na ispitu su postignuti rezultati dati tabelom. Izračunati disperziju.
Ocena ( )
i
x Broj studenata ( )
i
f
5 7
6 14
7 11
8 8
9 6
10 4

Navedena tabela je iz primera 6.1.3. u kome je izračunata prosečna ocena, odnosno aritmetička
sredina : 7, 08 X ·

Za određivanje disperzije ako se koristi formula ( ) 1′ međurezultati se mogu prikazati u pomoćnoj
tabeli.










2
2 1
( )
109, 68
2,1936
50
n
i i
i
f x X
N
σ
·

· · ·





Izračunavanje pomoću formule ( ) 2′ je jednostavnije.
Za određivanje disperzije pomoću formule ( ) 2′ tabela sa međurezultatima je:

Ocena ( )
i
x Broj studenata ( )
i
f
i
x X −
( )
2
i
x X −
( )
2
i i
f x X −
5 7 -2,08 4,3264 30,2848
6 14 -1,08 1,1664 16,3296
7 11 -0,08 0,0064 0,0704
8 8 0,92 0,8464 6,7712
9 6 1,92 3,6864 22,1184
10 4 2,92 8,5264 34,1056
6 n ·
6
1
50
i
i
N f
·
· ·



6
2
1
( ) 109, 68
i i
i
f x X
·
− ·


46








( )
2 2 2 2
1
1 2616
2 7, 08 52, 32 50,1264 2,1936
50
n
i i
i
f x X
N
σ
·
′ · − · − · − ·


Za procenu podataka iz posmatrane serije veoma je važan pozitivni koren iz disperzije
2
( ) σ . Ta
veličina pokazuje koliko aritmetička sredina u proseku odstupa od pojedinih vrednosti obeležja.

DEF Standardna devijacija (standardno odstupanje) ( ) σ je pozitivna vrednost korena disperzije
2
σ odnosno
2
σ σ · .
U primeru 7.3.1. standardna devijacija iznosi
2
21.67 4.656 σ σ · · ·
U primeru 7.3.2. standardna devijacija iznosi
2
2.1936 1.48 σ σ · · ·

U EXCEL-u postoji funkcija STVEDEVP koja izračunava standardnu devijaciju. Pomoću nje je
kvadriranjem moguće izračunati disperziju.


7.4. Koeficijent varijacije

DEF Koeficijent varijacije ( )
V
K je količnik između standardne devijacije i aritmetičke sredine nekog
obeležja.

V
K
X
σ
·
Ovaj koeficijent je relativna mera koja pokazuje odstupanje obeležja u odnosu na aritmetičku sredinu.
U primeru 7.3.1. standardna devijacija iznosi
2
21, 67 4, 66 σ σ · · ·
a aritmetička sredina 9 X · . Koeficijent varijacije iznosi

4, 656
0, 52
9
V
K
X
σ
· · ·
U primeru 7.3.2. standardna devijacija iznosi
2
2,1936 1, 48 σ σ · · ·
a aritmetička sredina 7.08 X · . Koeficijent varijacije iznosi

1, 48
0, 21
7, 08
V
K
X
σ
· · ·
Ocena ( )
i
x
Broj
studenata ( )
i
f
2
i
x
2
i i
f x
5 7 25 175
6 14 36 504
7 11 49 539
8 8 64 512
9 6 81 486
10 4 100 400
6 n ·
6
1
50
i
i
N f
·
· ·



6
2
1
2616
i i
i
f x
·
·


47
7.5. Vežbanje

1. U toku jednog dana izmerene su podnevne temperature koje su date tabelom.












Odrediti
- Raspon varijacije ( ) R
- Srednju devijaciju ( ) SD
- Disperziju
2
( ) σ i standardnu devijaciju ( ) σ
- Koeficijent varijacije ( )
V
K

2. Grupi sportista merene su visine i rezultati su dati tabelom:
Visina Broj sportista
i
f
160-169 5
170-179 8
180-189 14
190-199 7
200-209 4
210-219 2

Odrediti
- Raspon varijacije ( ) R
- Srednju devijaciju ( ) SD
- Disperziju
2
( ) σ i standardnu devijaciju ( ) σ
- Koeficijent varijacije ( )
V
K
Uputstvo: Prvo treba odrediti intervalne sredine
160 169
164.5
2
+
· ,
170 179
174.5
2
+
· ... pa
pomoću njih izvoditi dalja izračunavanja
Beograd
21 °C
Kragujevac
20 °C
Valjevo
19 °C
Loznica
22 °C
Kopaonik
8 °C
Novi Sad
18 °C
Kraljevo
23 °C
48
8. MOMENTI I POKAZATELJI VIŠEG REDA
Vrednosti iz nekog obeležja mogu na različite načine biti grupisane oko srednjih vrednosti. Za
određivanje načina njihovog rasporeda koriste se tzv. centralni momenti.
DEF Centralni moment reda r je aritmetička sredina devijacija na r-ti stepen.

Za negrupisane podatke to je :
1
( )
n
r
i
i
r
x X
M
n
·

·


Za grupisane podatke to je :
1
1
( )
n
r
i i
i
r n
i
i
f x X
M
f
·
·

·



Centralni moment reda 2,
2
M je disperzija
2
σ .
Od posebnog značaja su momenti reda 3 i 4.
Za merenje asimetrije koristi se
3
M a za merenje spljoštenosti
4
M .

8.1. Koeficijent asimetrije
Ako se posmatra položaj aritmetičke sredine X , medijane Me i modusa Mo , može se govoriti o
simetričnom ili asimeričnom rasporedu elemenata nekog obeležja.Raspored je simetričan kad su
frekvencije vrednosti obeležja ravnomerno raspoređene sa obe strane u odnosu na aritmetičku sredinu
a asimetričan kad se elementi skupa grupišu iznad ili ispod aritmetičke sredine.
DEF Koeficijent asimetrije ( )
3
α je količnik centralnog momenta reda tri i trećeg stepena standardne
devijacije.

3
3 3
M
α
σ
·
Ovaj parameter pokazuje asimetriju nekog obeležja. Pomoću njega se mogu upoređivati asimetrije
različitih distribucija. Ako je:









Mo je ona vrednost koja ima najveću učestanost o na krivoj raspodele predstavlja apscisu vrha
krive.
Me je ona vrednost obeležja koja deli skup na dva jednaka dela.


3
0 α · serija je simetrična
3
0 α > serija ima levu (pozitivnu) asimetriju
3
0 α < serija ima desnu (negativnu) asimetriju
49
Interpretacijom na krivoj raspodele dobijaju se slučajevi:
a) Kod simetričnog rasporeda je X Me Mo · · .
b) Kod pozitivne asimetrije Mo Me X < < .
c) Kod negativne asimetrije X Me Mo < < .

Grafički se to može predstaviti na sledeći način:


















Objedinjeno:







8.2. Koeficijent spljoštenosti

DEF Koeficijent spljoštenosti ( )
4
α je količnik centralnog momenta reda četiri i četvrtog stepena
standardne devijacije.

4
4 4
M
α
σ
·
Ovaj parametar je uvek pozitivan. On pokazuje homogenost vrednosti u odnosu na aritmetičku
sredinu.
4
3 α · serija je normalne visine
3
0 α ·
3
0 α <
3
0 α >
3
0 α ·


X Me Mo · ·

3
0 α <

X Me Mo < <
3
0 α >

Mo Me X < <
50
Ako je:







Grafički se to može predstaviti na sledeći način:











Primer 8.1.1. ( prosta serija)
∇ Na zimskim olimpijskim igrama 2002. godine šest zemalja koje su osvojile najviše medalja su bile:
Država Broj medalja
Nemačka 35
USA 34
Norveška 24
Kanada 19
Rusija 18
Austrija 14

Izračunati disperziju, standardnu devijaciju, koeficijent asimetrije i koeficijent spljoštenosti za broj
osvojenih medalja.

Država
Broj medalja
i
x
i
x X −
( )
2
i
x X −
( )
3
i
x X −
( )
4
i
x X −
Nemačka 35 11 121 1331 14641
USA 34 10 100 1000 10000
Norveška 24 0 0 0 0
Kanada 19 -5 25 -125 625
Rusija 18 -6 36 -216 1296
Austrija 14 -10 100 -1000 10000
6 n · 144 382 990 36562

144
24
6
X · ·
4
3 α > serija je izdužena
4
3 α < serija je spljoštena
4
3 α ·

4
3 α <

4
3 α >

51
Disperzija :
2
2 1
( )
382
63, 67
6
n
i
i
x X
n
σ
·

· · ·


Standardna devijacija;
2
63, 67 7, 98 σ σ · · ·
Koeficijent asimetrije:
3
3 3
990
165
6
0.325
507, 98 507, 98
M
α
σ
· · · ·
Koeficijent spljoštrnosti:
4
4 4
36562
6
1, 503
4053, 44
M
α
σ
· · ·


Primer 8.1 2. (intervalna serija)
∇ Na prijemnom ispitu su postignuti rezultati dati tabelom:

Broj bodova Broj studenata
i
f
0-10 11
11-20 4
21-30 5
31-40 3
41-50 3
51-60 4

Izračunati aritmetičku sredinu, disperziju, standardnu devijaciju, koeficijent asimetrije i koeficijent
spljoštenosti
Prilikom izračunavanja traženih veličina korisno je formirati tabelu (1) sa međurezultatima.

U primeru 6.1.4. izračunata je aritmetička sredina za ovu intervalnu seriju.
Prosečan broj bodova je:
1 1 2 2
1 2
5 11 15.5 4 25.5 5 35.5 3 45.5 3 55.5 4
11 4 5 3 3 4
55 62 127.5 106.5 136.5 222 709.5
23.65
30 30
n
n
x f x f x f
X
f f f
⋅ + ⋅ + + ⋅ ⋅ + ⋅ + ⋅ + ⋅ + ⋅ + ⋅
· · ·
+ + + + + + + +
+ + + + +
· ·
L
L




Pomoću dobijenuh podataka popunjava se tabela (1):
52

Korišćenjem dobijenih međurezultata formira se niva tabela iz koje se dobijaju vrednosti za nalaženje
traženih parametara.

(2):










Disperzija :
2
2 1
1
( )
10020
334
30
n
i i
i
n
i
i
f x X
f
σ
·
·

· · ·



Standardna devijacija;
2
334.33 18.28 σ σ · · ·
Koeficijent asimetrije:
3
3 3
92034.99
30
0.502
6113.12
M
α
σ
· · ·
Koeficijent spljoštrnosti:
4
4 4
6207655.97
30
1.851
111776.55
M
α
σ
· · ·

Broj
bodova
i
f
Raz. sr.
i
x
i i
f x ⋅
i
x X − ( )
2
i
x X −

( )
3
i
x X −
( )
4
i
x X −
0-10 11 5 55.00 -18.65 347.82 -6486.89 120980.49
11-20 4 15.5 62.00 -8.15 66.42 -541.34 4411.95
21-30 5 25.5 127.50 1.85 3.42 6.33 11.71
31-40 3 35.5 106.50 11.85 140.42 1664.01 19718.48
41-50 3 45.5 136.50 21.85 477.42 10431.68 227932.24
51-60 4 55.5 222.00 31.85 1014.42 32309.36 1029053.01
30 709.50
Broj
bodova
i
f
( )
2
i i
f x X −

( )
3
i i
f x X −
( )
4
i i
f x X −
0-10 11
3826,05 -71355,79 1330785,41
11-20 4
265,69 -2165,37 17647,79
21-30 5
17,11 31,66 58,57
31-40 3
421,27 4992,02 59155,44
41-50 3
1432,27 31295,04 683796,73
51-60 4
4057,69 129237,43 4116212,03
30
10020,08 92034,99 6207655,97
53
8.3. Vežbanje

1. Tabelom je prikazan broj nagrada koje su na nekom takmičenju osvojili predstavnici gradova :

Grad Broj nagrada
Beograd 12
Niš 11
Novi Sad 10
Kragujevac 9
Valjevo 6
Subotica 5

Izračunati disperziju, standardnu devijaciju, koeficijent asimetrije i koeficijent spljoštenosti za broj
osvojenih nagrada.

2. Grupi sportista merene su visine i rezultati su dati tabelom:
Visina Broj sportista
i
f
160-169 5
170-179 8
180-189 14
190-199 7
200-209 4
210-219 2

Izračunati aritmetičku sredinu, disperziju, standardnu devijaciju, koeficijent asimetrije i koeficijent
spljoštenosti.









54
9. STATISTIČKO OCENJIVANJE NA OSNOVU UZORKA
9.1. Osnovni skup i slučajni uzorak
Statistički skup ima različite parametre koji ga karakterišu. Ispitivanja se mogu izvoditi na celom
skupu ali je to često nepodesno zbog njegove veličine.U takvim situacijama se, sa određenom
tačnošću, izračunavanja parametara izvode na nekom njegovom delu koji predstavlja uzorak.





Ukratko, ako je statistički skup veliki onda se pribegava ispitivanju uzoraka. Jedan od najvažnijih
zadataka statistike je da se na osnovu uzorka utvrde zakonitosti i izvuku zaključci koje važe u celoj
populaciji.
Postavlja se pitanje reprezentativnosti posmatranog uzorka. Sam postupak izbora slučajnog uzorka
u statistici je detaljno razrađen .U nekim se koriste tablica slučajnih brojeva ali se time nećemo baviti.
Jasno je, takođe i da veličina uzorka utiče na verodostojnost naših zaključaka o celoj populaciji.
Ako statistički skup ima N elemenata, onda se pod prostim slučajnim uzorkom veličine n
( ) n N < podrazumeva svaki od uzoraka od n elemenata čije su verovatnoće izbora međusobno
jednake. Ukupan broj uzoraka veličine n koji se mogu formirati na skupu od N elemenata iznosi:
( 1) ( 1)
! !
N
N n
n
N
V N N N n
C
n n n
| ` − − +
· · ·

. ,
L


Statistički skup ima različite parametre koji ga karakterišu a jedan od najvažnijih je aritmetička
sredina.Postupak ocenjivanja nekog parametra osnovnog skupa na osnovu uzorka biće prikazan na
njoj.
Statistički skup
Uzorak
55
9.2.Ocena aritmetičke sredine osnovnog skupa

Ako bi se na nekom statističkom skupu koji ima N elemenata formirali svi mogući uzorci ( njih
N
n
| `

. ,
) i izračunale njihove aritmetičke sredine
( ) i
x one bi predstavljale jedan raspored aritmetičkih
sredina uzoraka. Za dovoljno veliko n ( 30 n > ) taj raspored ima približno oblik normalne raspodele.












Ako se pogleda raspored sredina uzoraka primećuju se da se u intervalu
x
µ σ t nalazi 68.3%
svih uzoraka. To znači da je verovatnoća da se aritmetička sredina uzorka nađe u ovom intervalu 0,68.
Slično, verovatnoća da će se naći u intervalu 1, 96
x
µ σ t iznosi 0,95 a u intervalu 2, 58
x
µ σ t iznosi
0,99. Nivoi značajnosti u tim slučajevima izmose 0,32 , 0,05 i 0,01. Najčešće se ocene parametara
računaju sa nivoom značajnosti 0,05 i 0,01.

U konkretnim situacijama postupak ocenjivanja aritmetičke sredine skupa izgleda ovako:
-Odabere se dovoljno veliki uzorak ( 30 n > ) i izračuna se njegova aritmetička sredina
( )
x koja će
predstavljati ocenu aritmetičke sredine celog skupa ( ) µ .
-Utvrđuje se vrednost standardne greške ocene aritmetičke sredine (
x
σ ) :

x
n
σ
σ ·
Standardna greška ocene pokazuje prosečno odstupanje aritmetičke sredine uzorka
( )
x od
aritmetičke sredine skupa ( ) µ .
Raspored sredina
uzoraka
68.3%
95%
99%
x
σ
1.96
x
σ 2.58
x
σ
µ
56
Standardna devijacija skupa ( ) σ se izračunava iz uzorka. Dokazano je da je standardna devijacija
izračunata na celom skupu uvek nešto veća od standardne devijacije izračunate na uzorku. Zbog toga
se vrši ispravka pa se za izračunavanje koristi formula:

( ) ( )
2 2
2
1 1
1 1
n n
i i i i
i i
f x x f x n x
n n
σ
· ·
− −
· ·
− −
∑ ∑
(1)
Ona je poznata pod nazivom Popravljena formula za standardnu devijaciju skupa na osnovu
podataka iz uzorka. Formula za za izračunavanje standardne greške uz korišćenje formule (1) glasi:


( )
( )
( )
( )
( )
2
2 2
2
1
1 1
1
1 1
n
n n i i
i
i i i i
i i
x
f x x
f x x f x n x
n
n n n n n n
σ
σ
·
· ·

− −

· · · ·
− −

∑ ∑

(2)

Primer 9.1.1.
∇ Zadatak je da se odredi prosečan broj bodova na prijemnom ispitu koje su imali studenti ICT na
osnovu uzorka koji ima 50 elemenata.
Bodovi
Broj kandidata
i
f
0-10 8
10-20 6
20-30 10
30-40 9
40-50 12
50-60 5
50

Vrednost prosečnog broja bodova treba odrediti sa nivoom značajnosti 0,05 i sa nivoom značajnosti
0.01.
Međurezultati za izračunavanje x i
x
σ se prikazuju u tabeli:
Bodovi
Broj kandidata
i
f
sredina
intervala
i
x
i i
f x ⋅
2
i i
f x ⋅
0-10 8 5 40 200
10-20 6 15 90 1350
20-30 10 25 250 6250
30-40 9 35 315 11025
40-50 12 45 540 24300
50-60 5 55 275 15125
zbir 50 1510 58250

57
Prvo se izračunava aritmetička sredina uzorka
1510
30, 2
50
x · · ; 50 n · .
Standardna greška ocene iznosi:

( )
( )
2
2
1
58250 45602
5,162449 2,27
1 50 49
n
i i
i
x
f x n x
n n n
σ
σ
·


· · · · ·
− ⋅



Sa nivoom značajnosti 0,05 prosečan broj bodova je u intervalu :
1, 96 30, 2 1, 96 2, 27 30, 2 4, 49
x
x µ σ · t · t ⋅ · t
Prosečan broj bodova celog skupa, na osnovu ovog uzorka, sa verovatnoćom 0,95 je:
[ ] 25, 71 34, 69 ; 25, 71, 34, 69 µ µ ≤ ≤ ∈
Sa nivoom značajnosti 0.01 prosečan broj bodova je u intervalu :
2, 58 30, 2 2, 58 2, 27 30, 2 5, 86
x
x µ σ · t · t ⋅ · t
Prosečan broj bodova celog skupa, na osnovu ovog uzorka, sa verovatnoćom 0,99 je:
[ ] 24, 34 36, 06 ; 24, 34 , 36, 06 µ µ ≤ ≤ ∈ ∆
Napomena:
Primećuje se da veći koeficijent pouzdanosti, na istom uzorku, daje širi interval. Što je interval uži
ocena parametra je preciznija ali je manje pouzdana. U praksi se najčešće radi sa koeficijentom
pouzdanosti 0,95 to jest sa sa nivoom značajnosti 0,05. Tada je 1, 96 , 1, 96
x x
x x µ σ σ
]
∈ − +
]
.
Primer 9.1.2.
∇ Rezultati ispitivanja na uzorku od 500 turista o dnevnoj potrošnji za jednu vrstu turističke usluge
dati su tabelom:
Dnevna
potrošnja
Broj turista
i
f
35-45 8
45-55 100
55-65 302
65-75 85
75-85 5
zbir 500

Treba oceniti prosečnu dnevnu potrošnju celog skupa ( ) µ pomoću navedenog uzorka sa
koeficijentom pouzdanosti 0,95.



58

Dnevna
potrošnja
Broj turista
i
f
prosečna
potrošnja
i
x
i i
f x ⋅
2
i i
f x ⋅
35-45 8 40 320 12800
45-55 100 50 5000 250000
55-65 302 60 18120 1087200
65-75 85 70 5950 416500
75-85 5 80 400 32000
zbir 500 29790 1798500

Prvo se izračunava aritmetička sredina uzorka
29790
59, 58
500
x · · ; 500 n ·
Standardna greška ocene iznosi:
( )
( )
2
2
1
1798500 1774888
0, 0946 0, 31
1 500 499
n
i i
i
x
f x n x
n n n
σ
σ
·


· · · · ·
− ⋅


Sa koeficijentom pouzdanosti 0,95 ili sa nivoom značajnosti 0,05 prosečan broj bodova je u intervalu
:
1, 96 59, 58 1, 96 0, 3 59, 58 0, 61
x
x µ σ · t · t ⋅ · t
Dnevna potrošnja celog skupa, na osnovu ovog uzorka, sa verovatnoćom 0,95 je:
58, 97 60,19 µ ≤ ≤




59
12. LINEARNA REGRESIJA I KORELACIJA

Važan deo stastistike je regresiona analiza koja se bavi zavisnošću pojedinih obeležja u nekom
statističkom skupu.Najjednostavnije je ispitivati zavisnost između dva obeležja. Time se bavi prosta
regresiona analiza. Osnovne ideje regresione analize mogu se prikazati pomoću linearne regresije i
korelacije.

12.1. Linearna regresija
Prilikom analize zavisnosti dva obeležja prvo je potrebno je odrediti koje je nezavisno a koje
zavisno. Nezavisno obeležje ćemo obeležiti sa X a zavisno sa Y .
Ako se radi sa uzorkom veličine n , dobija se n uređenih parova
( ) ( ) ( )
1 1 2 2
, , , , , ,
n n
x y x y x y K .
Predstavljanjem ovih tačaka u Dekartovom pravouglom koordinatnom sistemu xOy dobija se
dijagram raspršenosti (rasturanja). Pomoću dijagrama nekada je moguće uočiti oblik funkcionalne
zavisnosti između posmatranih obeležja.
Prema obliku krive kojom se funkcionalna zavisnost može aproksimirati postoje različiti oblici
zavisnosti (linearna, kvadratna, logaritamska...)
Ako se zavisnost među navedenim podacima iz posmatranog uzorka, sa odgovarajućom tačnošću,
izrazi linearnom funkcijom y ax b · + , koeficijenti a i b se dobijaju iz formula:
1 1 1
2
2
1 1
n n n
i i i i
i i i
n n
i i
i i
n x y x y
a
n x x
· · ·
· ·
− ⋅
·
| `


. ,
∑ ∑ ∑
∑ ∑
i
1 1
n n
i i
i i
y a x
b
n
· ·

·
∑ ∑
(*)

Koeficijenti a i b se mogu odrediti ina drugi način, korišćenjem metode najmanjih kvadrata.
Vrednosti konstanti se u tom slučaju dobijaju preko formula:

2
;
xy
x
k
a b Y aX
σ
· · − (**)
gde je
1 1
;
n n
x x y y
X Y
n n
+ + + +
· ·
L L

( )
2
2 1
n
i
i
x
x X
n
σ
·

·



( )( )
1
n
i i
i
xy
x X y Y
k
n
·
− −
·

uzorački koeficijent kovarijacije ili kovarijacija.
U EXCELU postoji funkcija COVAR za njegovo izračunavanje.
60
Primer 12.1.1.
Za deset ljudi je tablicom dat broj godina i prihod koji su ostvarili u određenom periodu. Potrebno
je nacrtati dijagram raspršenosti i odrediti regresionu pravu kojom se može aproksimirati linearna
zavisnost.





















Za izračunavanje je regresione prave iz navedenih formula korisno je poslužiti se radnom tabelom.












godine X prihod Y
A 19 2150
B 23 2550
C 27 3250
D 31 3150
E 36 4250
F 40 4200
G 44 4350
H 49 5000
I 52 4950
J 54 5650
Godine
i
x Prihod
i
y
i i
x y
2
i
x
A 19 2150 40850 361
B 23 2550 58650 529
C 27 3250 87750 729
D 31 3150 97650 961
E 36 4250 153000 1296
F 40 4200 168000 1600
G 44 4350 191400 1936
H 49 5000 245000 2401
I 52 4950 257400 2704
J 54 5650 305100 2916
zbir


375 39500 1604800 15433
Dijagram raspršenosti
0
1000
2000
3000
4000
5000
6000
0 10 20 30 40 50 60
godine
p
r
i
h
o
d
61
U ovom primeru je:
10 n ·
10
1
1604800
i i
i
x y
·
·

;
10 10
1 1
375 ; 39500
i i
i i
x y
· ·
· ·
∑ ∑

2
10 10
2 2
1 1
15433 ; 375 140625
i i
i i
x x
· ·
| `
· · ·

. ,
∑ ∑


1 1 1
2
2
1 1
10 1604800 375 39500
90,15
10 15433 140625
n n n
i i i i
i i i
n n
i i
i i
n x y x y
a
n x x
· · ·
· ·
− ⋅
⋅ − ⋅
· · ·
⋅ −
| `


. ,
∑ ∑ ∑
∑ ∑


1 1
39500 90,15 375
569, 4
10
n n
i i
i i
y a x
b
n
· ·

− ⋅
· · ·
∑ ∑

Prema tome regresiona prava glasi: 90 569 y x · + ∆
Dobijena prava nam omogućava da odredimo vrednosti i za one x -ove koji nisu sadržani u
uzorku.Na primer:
20 ; 90 20 569 2369 x y · · ⋅ + ·
50 ; 90 50 569 5069 x y · · ⋅ + · ...












II način (metoda najmanjih kvadrata)
Koeficijenti a i b se mogu odrediti ina drugi način, korišćenjem metode najmanjih kvadrata.
Vrednosti konstanti se u tom slučaju dobijaju preko formula:
2
12355
90.15 ;
137.05
3950 90.15 37.5 3950 3380 570
xy
x
k
a
b Y aX
σ
· · ·
· − · − ⋅ · − ·

Dijagram raspršenosti
0
1000
2000
3000
4000
5000
6000
0 10 20 30 40 50 60
godine
p
r
i
h
o
d
90 569 y x · +
62
gde je
1 1
37.5 ; 3950
n n
x x y y
X Y
n n
+ + + +
· · · ·
L L

( )
2
2 1
137.05
n
i
i
x
x X
n
σ
·

· ·



( )( )
1
12355
n
i i
i
xy
x X y Y
k
n
·
− −
· ·


Na ovaj način je dobijena regresiona prava : 9015 570 y x · +

Pomoćna tabela koja je korišćena za navedena izračunavanja:


i
x
i
y
i
x X −
i
y Y −
( )
2
i
x X −
A 19 2150 -18,5 -1800 342,25
B 23 2550 -14,5 -1400 210,25
C 27 3250 -10,5 -700 110,25
D 31 3150 -6,5 -800 42,25
E 36 4250 -1,5 300 2,25
F 40 4200 2,5 250 6,25
G 44 4350 6,5 400 42,25
H 49 5000 11,5 1050 132,25
I 52 4950 14,5 1000 210,25
J 54 5650 16,5 1700 272,25

X ·37,5 Y ·3950

2
x
σ =137,05


xy
k =12355

COVAR

Koeficijent kovarijacije
xy
k je izračunat pomoću funkcije COVAR . ∆
63
12.2. Korelacija
Stepen povezanosti dva obeležja može se predstaviti brojnom vrednošću koja se naziva koeficijent
korelacije. Ovaj parametar pokazuje jačinu i smer povezanosti posmatranih obeležja.Izračunava se po
formuli:

1 1 1
2 2
2 2
1 1 1 1
n n n
i i i i
i i i
n n n n
i i i i
i i i i
n x y x y
r
n x x n y y
· · ·
· · · ·
− ⋅
·
| ` | `
− ⋅ −

. , . ,
∑ ∑ ∑
∑ ∑ ∑ ∑
(*)
Koeficijent korelacije se naziva i Pirsonov koeficijent.
Koeficijent korelacije može se izračunati i na drugi način:

( )( )
( ) ( )
1
2 2
1 1
n
i i
i
n n
i i
i i
x X y Y
r
x X y Y
·
· ·
− −
· t
− ⋅ −

∑ ∑
(**)
, gde su odgovarajuće X i Y aritmetičke sredine posmatranih obeležja uzorka veličine n .
Koeficijent r može biti pozitivan i negativan broj koji je po apsolutnoj vrednosti manji ili jednak 1.
1 1 r − ≤ ≤
Ako je 0 r > korelacija je direktna (povećanim vrednosti iz jednog obeležja odgovaraju
povećavane se vrednosti iz drugog).
Ako je 0 r < korelacija je inverzna (povećanm vrednosti iz jednog obeležja odgovaraju smanjene
se vrednosti iz drugog).
Što se jačine veze tiče smatra se da ako je :
0, 25 r ≤ postoji slab stepen uzajamne povezanosti koji se zanemaruje
0, 25 0, 5 r ≤ ≤ postoji stepen uzajamne povezanosti koji se ne zanemaruje
0, 5 0, 75 r ≤ ≤ postoji visok stepen uzajamne povezanosti
0, 75 1 r ≤ < postoji veoma visok stepen uzajamne povezanosti
1 r · postoji savršena povezanost i uzajamnost

U Excelu postoji funkcija CORREL pomoću koje se izračunava koeficijent korelacije.






64
Primer 12.2.1.

Za deset ljudi je tablicom dat prihod koji su ostvarili u određenom periodu i potrošnja mesa .
Potrebno je izračunati koeficijent korelacije.









Pomoćna tabela za izračunavanje koeficijenta korelacije pomoću formule (*):
prihod X meso Y i i
x y
2
i
x
2
i
y
A 5 11 55 25 121
B 6 14 84 36 196
C 11 19 209 121 361
D 14 26 364 196 676
E 16 30 480 256 900
F 21 43 903 441 1849
G 25 49 1225 625 2401
H 27 50 1350 729 2500
I 32 65 2080 1024 4225
J 38 72 2736 1444 5184
zbir 195 379 9486 4897 18413

U ovom primeru je:
10 n ·
10
1
9486
i i
i
x y
·
·

;
10 10
1 1
195 ; 379
i i
i i
x y
· ·
· ·
∑ ∑

2
10 10
2 2
1 1
4897 ; 195 38025
i i
i i
x x
· ·
| `
· · ·

. ,
∑ ∑

2
10 10
2 2
1 1
18413 ; 379 143641
i i
i i
y y
· ·
| `
· · ·

. ,
∑ ∑


10 9486 195 379
10 4897 38025 10 18413 143641
20955 20955 20955
0, 99541
104, 62 201, 22 21051, 64 10945 40489
r
⋅ − ⋅
· ·
⋅ − ⋅ ⋅ −
· · · ·



prihod X meso Y
A 5 11
B 6 14
C 11 19
D 14 26
E 16 30
F 21 43
G 25 49
H 27 50
I 32 65
J 38 72
65
Korišćenjem funkcije CORREL iz Excela dobija se vrednost 0,995431.
Koeficijent korelacije može se izračunati i na drugi način:

( )( )
( ) ( )
1
2 2
1 1
n
i i
i
n n
i i
i i
x X y Y
r
x X y Y
·
· ·
− −
· t
− ⋅ −

∑ ∑
(**)
, gde su odgovarajuće X i Y aritmetičke sredine posmatranih obeležja uzorka veličine n .


12.3. Vežbanje
1) Za deset ljudi je tablicom dat broj godina i količina mleka koju su
konzumirali u određenom periodu. Potrebno je odrediti
a) dijagram raspršenosti
b) regresionu pravu kojom se može aproksimirati linearna zavisnost.
c) koeficijent korelacije




a) i b)
Godine Mleko
i i
x y
2
i
x
A 4 96 384 16
B 8 93 744 64
C 11 91 1001 121
D 22 80 1760 484
E 26 74 1924 676
F 35 67 2345 1225
G 44 51 2244 1936
H 49 50 2450 2401
I 61 43 2623 3721
J 72 26 1872 5184
zbir 332 671 17347 15828

U ovom primeru je:
10 n ·
10
1
17347
i i
i
x y
·
·

;
10 10
1 1
332 ; 671
i i
i i
x y
· ·
· ·
∑ ∑

2
10 10
2 2
1 1
15828 ; 332 110224
i i
i i
x x
· ·
| `
· · ·

. ,
∑ ∑


Godine Mleko
A 4 96
B 8 93
C 11 91
D 22 80
E 26 74
F 35 67
G 44 51
H 49 50
I 61 43
J 72 26
66
1 1 1
2
2
1 1
10 17347 332 671 49302
1, 03
10 15828 110224 48056
n n n
i i i i
i i i
n n
i i
i i
n x y x y
a
n x x
· · ·
· ·
− ⋅
⋅ − ⋅ −
· · · · −
⋅ −
| `


. ,
∑ ∑ ∑
∑ ∑


( )
1 1
671 1, 03 332
671 341, 96 1012, 96
101, 3
10 10 10
n n
i i
i i
y a x
b
n
· ·

− − ⋅
+
· · · · ·
∑ ∑

Prema tome regresiona prava glasi: 101 y x · − +


0
20
40
60
80
100
120
0 20 40 60 80
Godine
P
o
t
r
o
š
n
j
a

m
l
e
k
a

c)
Korišćenjem funkcije CORREL iz Excela dobija se vrednost -0,99462. ∆
2) U tabeli su date vrednosti za dva obeležja jednog uzorka. Odrediti jednačinu regresione prave.

i
x
i
y
A 0.5 2.53
B 1 2.05
C 1.5 1.67
D 2 1.37
E 2.5 0.92
F 3 0.47
G 3.5 -0.11
H 4 -0.50

Rešenje: 0.86 1.05 y x · − +


67
LITERATURA :

1. Z. Ivković, Teorija verovatnoća sa matematičkom statistikom, Građevinska knjiga , Beograd,
1976
2. Z. Ivković, D. Banjević Verovatnoća i matematička statistika, Naučna knjiga , Beograd, 1979
3. M. Merkle, Verovatnoća i statistika za inženjere i studente tehnike, Akademska. misao,
Beograd, 2006.
4. S. Vukadinović, J. Popović, Matematicka statistika, Zavod za udžbenike i nastavna sredstva,
Beograd, 1982
5. S.vukadinović, Verovatnoća i statistika, Zavod za udžbenike i nastavna sredstva, Beograd,
2006.
6. McClave J.T., Sincich T., A First Course in Statistics, Pearson, Prentice-Hill, New Jersey,
2006.
7. E. Stipanić, Teorija verovatnoće i matematička statistika, Naučna knjiga , Beograd, 1985
8. Pavle Mladenović, Elemantaran uvod u verovatnoću i statistiku, Društvo matematičara Srbije
, Beograd, 1990
9. S.ognjanović,Ž.Ivanović, Matematika 4, Krug, Beograd 1999
10. Jovan Kečkić, Matematika za 4 razred gimnazije, Kečkić, Beograd, 2004
11. M.Žižić,M.Lovrić,D.Pavličić, Metodi statističke analize, Ekonomski fakultet, Beograd, 2000
12. Vladislav Đolević, Primenjena statistika, Naučna knjiga, Beograd 1993

You're Reading a Free Preview

Download
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->