Professional Documents
Culture Documents
Predmet: Statistika
Mentor: Student:
Prof. Dr Bojana Ćendić Nenad Savanović
Sadržaj:
- 1.Uvod..................................................................................................................... ..1
- 2. Sređivanje i grafičko prikazivanje podataka........................................................ ..2
- 2.1. Raspodela frekvencija..........................................................................................2
- 2.2 Grafičko prikazivanje raspodela frekvencija ........................................................4
- 3 Statistički pokazatelji i parametri za analizu............................................................5
- 3.1 .Srednje vrednosti obeležja..................................................................................5
- 3.2. Indeksi, stope promene.......................................................................................8
- 3.3. Određivanje i interpretacija modusa i medijane obeležja....................................9
- 3.4. Mera varijabiliteta obeležja..................................................................................9
- 3.5. Osobine varijanse obeležja................................................................................11
- 3.6. Momenti statističkog obeležja............................................................................11
- 3.7. Pearson-ovi koeficijenti obeležja, Koeficijent spljoštenosti obeležja..................12
- Literatura...................................................................................................................14
2
Deskriptivna statistika
1. Uvod
Reč statistika ima dva značenja. U svakodnevnom životu reč statistika se odnosi na
numeričke podatke. Primeri takvih numeričkih podataka su prihod porodice, starost studenta,
procenatdodavanja koja je ostvario kvorterbek nekog fudbalskog tima1
i početna plata pripravnika sa univerzitetskom diplomom.
Drugo značenje reči statistika odnosi se na statistiku kao naučnu disciplinu. U tom smislu,
reč statistika definiše se na sledeći način: Statistika je naučni metod koji se koristi za
prikupljanje, prikazivanje, analizu i interpretaciju podataka i donošenje statističkih zaključaka.
Svakog dana smo u prilici da donosimo odluke koje mogu biti lične, poslovne ili neke
druge. Sve te odluke se obično donose u uslovima neizvesnosti. Veoma često, za probleme
sa kojima se suočavamo u stvarnosti ne postoji dovoljno precizno ili konačno rešenje.
Statističke metode nam pomažu da u takvim situacijama donosimo stručne i ispravne odluke.
Odluke donete na osnovu statističkih metoda nazivaju se procenama i prognozama.
Odluke koje se donose bez korišćenja statističkih (ili naučnih) metoda predstavljaju
čisto nagađanje i stoga su nepouzdane.
Kao i većina naučnih disciplina, statistika ima dva aspekta: teorijski i primenjeni.
Teorijska ili matematička statistika bavi se razvojem, izvođenjem i dokazivanjem statističkih
teorema, formula, pravila i zakona.
Primenjena statistika podrazumeva primenu tih teorema, formula, pravila i zakona u
rešavanju realnih problema.
Primenjena Statistika se dijeli na deskriptivnu, bavi se sakupljanjem, obradom i
tabelarnim i grafičkim prikazivanjem podataka i induktivnu (na engleskom jeziku – inference
statistics), bavi se izvođenjem zaključaka nakon analize prikupljenih podataka. Deskriptivna
statistika je zaokružena oblast i njeno razumijevanje zahtjeva samo elementarno
matematičko znanje. Induktivna statistika je aktuelna, popularna i primjenjiva matematička
disciplina. Bavljenje induktivnom statistikom zahtjeva odlično znanje matematike, prije svega
vjerovatnoće.
3
Deskriptivna statistika
modaliteti frekvencije
Kvantitativno obeležje:
Broj članova domaćinstva:
Broj smena u preduzećima:
može se prikazati raspodelom relativnih frekvencija koja se dobija tako što se
za svaku moguću vrednost obeležja H utvrdi koliko elemenata statističkog skupa uzima tu
vrednost.
H) Apsolutne frekvencije (f)
x1 f1
xk fk
N
Gradiranje brojčanih verdnosti obeležja se razlikuje u zavisnosti od toga da li je
obeležje:
Prekidno (diskontinualno) = grupišu se po veličini (od niže ka višoj vrednosti)
Neprekidno (kontinualno) = H uzima vrednost iz konačnog ili beskonačnog
intervala (a, b); taj interval se deli na podintervale (a, a1), …, (ak, b) koji se zovu grupni
intervali (koji ne moraju biti jednaki).
Grupni Apsolutne
intervali frekvencije (f)
a a1 f1
ak b fk
4
Deskriptivna statistika
N
Određivanje grupnih intervala (broja i veličine) često se vrši uz pomoć Sturgess-ovog
pravila:
Veličina intervala: k 1 3,3 log N , gde je N broj podataka
X X min
Broj intervala: d max
k
Ako treba podeliti H na dva ili više statističkih skupova, onda apsolutne frekvencije
moraju da se pretvore u relativne brojeve i to uz pomoć raspodele relativnih frekvencija.
f
pi i ; pi 0; pi 1 .
N i 0
Procentualne Kumulativne
Apsolutne Relativne Kumulativne
relativne relativne
H) frekvencije frekvencije apsolutne
frekvencije frekvencije
(f) (r) frekvencije (S)
(r) (%) (F)
f1 C1
p1 F1
a f1a1 N p1 100 C1 f1 N
ak fk b fk p k 100 C k f1 ... f k ck
pk Fk 1
N N
N 1,00 100,00
5
Deskriptivna statistika
6
Deskriptivna statistika
7
Deskriptivna statistika
n
1
Ako su utvrđeni x1 ,..., xn x x1 ... xn 1 xi
N N i 1
k
Ako je h prekidnog tipa, x1 ,..., xk sa frekvencijama f1 ,..., f k ; f i N :
i 1
k
1
x xi f i
N i 1
k
Ako je h neprekidnog tipa, a a1 ,..., ak b sa frekvencijama f1 ,..., f k ; f i N :
i 1
a a 1 k
xi i 1 i ; i 1,2,..., k x xi f i
2 N i 1
Osim ako se prvi i poslednji grupni interval znatno razlikuju po dužini od ostalih (ili ako
je neki od njih beskonačan), tada je:
d d
xi a1 , xk ak 1 , gde je d prosečna dužina preostalih k 1 intervala.
2 2
fi 1 k
Iz raspodele relativnih frekvencija pi , i 1,..., k x xi pi .
N N i 1
Pored univerzalnih (koji se mogu pokazati) aritmetička sredina ima još neke osobine
koje omogućavaju njeno lakše određivanje:
1) Zbir odstupanja vrednosti obeležja H na posmatranom skupu od njihove
aritmetičke sredine je jednako nuli:
N k
x
i 1
i x 0, xi x f i 0
i 1
2) Zbir kvadrata odstupanja vrednosti obeležja H na elementima statističkog skupa
od bilo kog broja a je najmanji ako je a x :
N
x
i 1
i a minimum za a x
2
3) Ako između H i Y postoji linearna zavisnost, ista takva zavisnost postoji između
njihovih aritmetičkih sredina:
Y aX b y ax b; a, b , a 0
4) Pretpostavka: statistički skup 1: N1 , X 1 ; statistički skup 2: N 2 , X 2 ; tada je
aritmetička sredina za oba skupa zajedno jednaka ponderisanoj aritmetičkoj sredini:
N1 X 1 N 2 X 2
X
N1 N 2
5) Posmatra se S statističkih skupova sa N1 ,..., N S elemenata i X 1 ,..., X S
aritmetičkih sredinarespektivno. Tada je aritmetička sredina obeležja H na svim skupovima
zajedno jednaka ponderisanoj aritmetičkoj sredini:
1 S
X Ni X i
N i 1
Često se statistički skupovi sastoje iz stratuma, tj. podskupova koji se međusobno
isključuju, a zajedno čine ceo skup. Statistički podaci se prikupljaju i obrađuju po stratumima
=> analiza celog skupa, što je nekad nemoguće.
8
Deskriptivna statistika
N
1 1 fi
Kada je H dato raspodelom frekvencija:
H N
x
i 1 i
N
1 p
Preko relativnih frekvencija: i
H i 1 xi
Cauchy-jeva teorema: H G m
9
Deskriptivna statistika
Za vremensku seriju od T podataka, dobija se (T–1) lančani indeks jer se prvi podatak u seriji
ne može porediti sa prethodnim.
Ako od procentualno izraženog indeksa u trenutku t oduzmemo 100, dobićemo procentualno
izraženu promenu obeležja H od momenta (t–1), do momenta t koji nazivamo stopa
promene.
10
Deskriptivna statistika
- Medijana je ona vrednost obeležja H koja deli statistički skup na dva jednaka dela.
X n1 , N непарно
2
Ako su x1 , x2 ,..., xn ; x1 x2 ... xn e
1
X n X n1 , N парно
2 2 2
H a0 a1 a1 a2 … a k 1 a k
(f) f1 f2 … fk
S
N S 1 N
Prvo se određuje indeks S za koji će biti zadovoljeno:
i 1
fi ; fi
2 i1 2
.
Ukazuje na dve činnjenice: njihov iznos govori koliko su srednje vrednosti obeležja H
dobri predstavnici svih njihovih vrednosti na posmatranom skupu i treba da pokažu koliko se
svi elementi na posmatranom skupu međusobno razlikuju u odnosu na dato obeležje H. Tj:
što je varijansa manja to je srednja vrednost bolji predstavnik, i obrnuto.
11
Deskriptivna statistika
X 0, 75 X 0, 25
Q
2
X 0 , 75 – gornji kvartil je ona vrednost obeležja H za koju 75% elemenata stati-
stičkog skupa ima vrednost H manju od X 0, 75 (25% elemenata ima H veće od X 0, 75 )
X 0 , 25 – donji kvartil je ona vrednost obeležja H za koju 25% elemenata statističkog
skupa ima vrednost manju od X 0, 25 .
Računaju se slično kao medijana:
S
N S 1
N aS 1 a S N S
X 0, 25
i 1
fi ;
4
i 1
fi ;
4
X 0, 25 a S fi
f S 1 2 i 1
P
3N P 1
3N a a 3N P
X 0,75 fi
i 1 4
; f
i 1
i
4
; X 0, 75 a P P 1 P fi
f P 1 2 i 1
N i 1
1 N
a 0 a 1 ,..., a k 1 a f
k , 1 ,..., f k : s 2
xi x 2 f i
N i1
N
Relativne frekvencije: s xi x pi
2 2
i 1
12
Deskriptivna statistika
2 2
- Uopšteno (4); statistički skup od k podskupova N1 ,..., N k , x1 ,...xk , s1 ,..., s k , tada je:
1 K 1 K
s 2 N i si2 xi x
2
N i 1 N i 1
K
gde je: N N i veličina statističkog skupa, a x njegova aritmetička sredina.
i 1
k
Ako je H prekidno: mk xi pi
k
i 1
Ako je H neprekidno: mk x
k
f x dx
Specijalno: m0 E X E 1 1, m1 E X
0
k
Ako je H prekidno: k xi m pi
k
i 1
k x m f x dx
k
Ako je H neprekidno:
Specijalno: 0 E X m E 1 1, 1 E X m E X m m m 0
0 1
Centralni momenti se lakše određuju preko običnih momenata: ako k-ti stepen razlike
(H–m) razvijemo preko binomnog obrasca dobićemo:
k
k
( x m) k (1) k i m k i x i , pa zbog osobie očekivane vrednosti:
i 0 i
13
Deskriptivna statistika
k k
k k
E ( x m) k (1) k i m k i E x i k (1) k i m k i mi , k 0,1,2...
i 0 i i 0 i
Spacijalno: 2 m2 m ; 3 m3 3m2 m 2m ; 4 m4 4m3 m 6m2 m 3m .
2 3 2 4
3
Prvi Pearson-ov koeficijent je definisan preko količnika 1 , gde je 3 treći
s3
centralni momenat.
N
1
x1 ,..., xn ; x 3 x x
3
i
N i 1
1 N
a 0 a1 ,..., a k 1 a k , f1 ,..., f k : 3 xi x 3 f i
N i 1
N
Relativne frekvencije: 3 xi x pi
3
i 1
1 0 – raspodela H je simetrična (i obrnuto).
1 0 – raspodela H asimetrična u levu stranu.
1 0 – raspodela H asimetrična u desnu stranu.
14
Deskriptivna statistika
4
Drugi Pearson-ov koeficijent je količnik 2
s4
1 N
x1 ,..., xn ; x 4 xi x 4
N i 1
N
1
x x fi
4
a0 a1 ,..., ak 1 ak , f1 ,..., f k : 4 i
N i 1
N
Relativne frekvencije: 4 xi x pi
4
i 1
2 3 – obeležje H ima normalnu spljoštenost (i obrnuto).
2 3 – obeležje H ima spljoštenost veću od normalne.
2 3 – obeležje H ima spljoštenost manju od normalne.
Može se koristiti i koeficijent 2 3 koji ima normalnu spljoštenost u 0.
Literatura:
15
Deskriptivna statistika
16