You are on page 1of 17

Deskriptivna statistika

Materijali za nastavu iz Statistike


Kristina Krulic Himmelreich i Ksenija Smoljak

2012/13

1 / 18

Deskriptivna statistika

Prilikom opazanja ili eksperimentiranja, promatramo jednu ili vise velicina.


Ako se promatra samo jedna velicina, oznacimo ju s X , onda je rezultat
jednog eksperimenta jedan realan broj x.
Visestrukim ponavljanjem mjerenja (opazanja) velicine X dobiva se konacni
niz brojeva x1 , x2 , . . . , xn kao rezultat n ponovljenih mjerenja (opazanja).
Velicinu X nazivamo statisti
cko obilje
zje, a dobiveni niz brojeva
x1 , x2 , . . . , xn statisti
cki podaci o promatranom statistickom obiljezju X .

2 / 18

Deskriptivna statistika
Skup svih vrijednosti koje X moze poprimiti je RX = {a1 , a2 , a3 , . . . }.
Ako je RX diskretan skup, kazemo da je X diskretno obilje
zje, a ako je
RX kontinuiran skup, kazemo da je X neprekidno (kontinuirano)
obilje
zje.
Svakom elementu ai RX mozemo pridruziti broj fi koji nazivamo
frekvencija (u
cestalost pojavljivanja) elementa ai u nizu podataka.
Moze nas zanimati i u kojem se postotku pojavljuje koja vrijednost.
fi
Broj fri = nazivamo relativna frekvencija od ai , gdje je n broj
n
elemenata skupa RX .
Za prikazivanje statistickih podataka, uz primjenu pojma frekvencije i
relativne frekvencije, najcesce se upotrebljava tablica frekvencija.

3 / 18

Tablica frekvencija
vrijednost frekvencija relativna frekvencija
a1
f1
fr1
a2
f2
fr2
..
..
..
.
.
.
am
fm
frm

n
1
Uocimo: zbroj svih frekvencija iznosi n, tj. jednak je broju izvrsenih
mjerenja, dok je zbroj svih relativnih frekvencija jednak priblizno 1.
Zapisujemo:
m
X

fi = n,

i=1
m
X

fri = 1,

0 fri 1, i = 1, 2, ..., m.

i=1
4 / 18

Graficki prikazi
Na temelju tablicnog prikaza statistickih podataka izraduju se razliciti
graficki prikazi:
grafikon frekvencija
grafikon relativnih frekvencija
stupcasti dijagram (bar chart)
strukturni krug (pie chart)
histogram

Primjer
Ispitu iz Matematike pristupilo je 30 studenata. Dobivene su ocjene:
1, 4, 2, 3, 1, 1, 2, 4, 2, 3, 4, 5, 3, 2, 2, 2, 5, 3, 2, 2, 3, 3, 4, 2, 3, 2, 3, 3, 3, 3.
Analizirajte dane podatke.
5 / 18

Grupiranje podataka u razrede


U praksi razrede odredujemo na sljedeci nacin:
1

odredimo xmin i xmax

izracunamo raspon podataka R = xmax xmin

izaberemo odgovarajuci broj razreda (okvirno: k

odredimo zajednicku sirinu razreda:


c=

n)

R
k

(uvijek zaokruzujemo na vise!)


odredimo razrede (tj. lijevi prag razreda): I1 , ..., Ik
pritom I1 I2 ... Ik mora obuhvacati sve podatke

Napomena: Sirinu
razreda mozemo racunati i po formuli:
R
R
c=
. Tada je broj razreda jednak k = .
1 + 3.22 log n
c
5

6 / 18

Primjer
Na pismenom ispitu iz statistike dobiveni su ovi podaci:
68
73
65

84
79
80

75
88
73

82
73
57

68
60
88

90
93
78

62
71
62

88
59
76

76
85
53

93
75
74

(a) Izvrsite grupiranje podataka u razrede te napravite tablicu frekvencija


i relativnih frekvencija.
(b) Nacrtajte histogram frekvencija.
(c) Analizirajte podatke: najmanji broj bodova, najveci broj bodova,
koliko studenata ima vise od 90 bodova itd?

7 / 18

Parametri niza statistickih podataka (uzorka)

Aritmeti
cka sredina uzorka je broj
x :=

1
(x1 + x2 + . . . + xn ).
n

Ako je X = {a1 , a2 , . . . , ak } i pritom se ai u uzroku ponavlja fi puta, onda


x =

i=1

i=1

X
1X
fi ai , n =
fi .
n

- ima smisla samo za numericke podatke

8 / 18

Parametri niza statistickih podataka (uzorka)

Zadatak
U jednom privatnom poduzecu zaposleno je 7 zaposlenika. Njihove place
iznose redom: 2200kn, 2750kn, 3560kn, 2100kn, 10300kn, 3010kn,
2050kn. Izracunajte prosjecnu placu u tom poduzecu.
Svojstva aritmeticke sredine:
1. ni=1 (xi x) = 0 suma svih odstupanja od x jednaka je nuli
2. ni=1 (xi c)2 ni=1 (xi x)2 , c R zbroj kvadrata odstupanja od x
je najmanji

9 / 18

Parametri niza statistickih podataka (uzorka)

Medijan, u oznaci m, polazi od statistickog niza poredanog po velicini,


x(1) x(2) . . . x(n) i definiran je na sljedeci nacin:
ako je broj podataka neparan, tj. n = 2k 1, k N, onda je
m = x(k)
ako je broj podataka paran, tj. n = 2k, k N, onda vrijedi
m=

x(k) + x(k+1)
.
2

10 / 18

Parametri niza statistickih podataka (uzorka)


Primjer
Nadite medijan te aritmeticku sredinu niza
(a) 84, 91, 72, 68, 87, 78
(b) 3, 4, 4, 5, 6, 8, 8, 8, 10
(c) 5, 5, 7, 9, 11, 12, 15, 180
Primijetimo da na medijan utjecu samo sredisnji elementi iz statistickog
niza za razliku od x na kojega utjecu svi podaci. Lijevo i desno od
medijana nalazi se isti broj podataka, odnosno medijan dijeli niz podataka
na dva jednako brojna dijela.
Medijan uzorka je broj za koji vrijedi da je 50% svih podataka manje od
ili jednako njemu i 50% svih podataka vece od ili jednako njemu.

11 / 18

Parametri niza statistickih podataka (uzorka)

Mod je ona vrijednost statistickog obiljezja koja se u uzorku javlja s


najvecom frekvencijom.
UNIMODALNI UZORAK: uzorak u kojem postoji samo jedan mod
BIMODALNI UZORAK: uzorak u kojem postoje 2 vrijednosti s
jednakom frekvencijom
Ako svi podaci imaju istu frekvenciju pojavljivanja u uzorku, tada
uzorak nema mod
Mod je koristan kod statistickih obiljezja koja nisu numericka, pa nemaju
aritmeticku sredinu.

12 / 18

Parametri niza statistickih podataka (uzorka)

Primjer
Odredite mod sljedecih nizova
(a) 2, 2, 5, 7, 9, 9, 9, 10, 10, 12, 19
(b) 3, 5, 8, 10, 12, 15, 16
(c) 2, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9

Zadatak
Nadite aritmeticku sredinu, medijan i mod niza brojeva:
(a) 7, 4, 10, 9, 15, 12, 7, 9, 7
(b) 8, 11, 4, 3, 2, 5, 10, 6, 4, 1, 10, 8, 12, 6, 5, 7

13 / 18

Parametri niza statistickih podataka (uzorka)

Zadatak
Odredite srednju vrijednost mase (u kg) za 100 zaposlenika osiguravajuce
kuce za podatke iz tablice:
masa (kg) frekvencija
60 62
5
63 65
18
66 68
42
69 71
27
72 74
8

14 / 18

Mjere rasprsenosti (disperzije)


Uzorci s istim srednjim vrijednostima mogu biti posve razliciti, stoga nas
zanima i rasprsenost podataka.
Uzora
cka varijanca:
n

1 X
(xi x)2
s =
n1
2

i=1

Uzora
cka standardna devijacija:

s = + s2
Vrijedi:
n

1
1 X
s2 =
(xi x)2 =
n1
n1
i=1

n
X

!
xi2 n
x2

i=1

Ovaj oblik formule je puno prakticniji za racunanje.


15 / 18

Mjere rasprsenosti (disperzije)


Ako se u uzroku x1 , x2 , . . . , xn vrijednosti a1 , a2 , . . . , ak pojavljuju s
frekvencijom f1 , f2 , . . . , fk , onda vrijedi:
!
k
k
X
1 X
1
2
2
2
2
s =
fi (ai x) =
fi ai n
x
n1
n1
i=1

i=1

Koeficijent varijacije:
v=

s
x

Standardna pogreska:

(obicno se iskazuje u postotcima)


s
sx =
n

16 / 18

Mjere rasprsenosti (disperzije)

Zadatak
Mjerenjem tezina 20 cokolada dobiveni su ovi rezultati u gramima
97
98

99
96

98
97

96
98

98
98

101
100

98
99

95
97

97
101

99
98

Odredite prosjecnu tezinu cokolade, varijancu, standardnu devijaciju,


standardnu pogresku i koeficijent varijacije.

17 / 18

You might also like