You are on page 1of 42

Valentina Mladinov

Osnove statistike obrade

I dio
SADRAJ
I dio
to je statistika i ime se bavi?
Reprezentativni uzorak
Vjerojatnost
Srednja vrijednost

II dio
Mjere disperzije
Normalna i druge raspodjele
Statistika znaajnost
STATISTIKA

Zaeci u praktinom pitanju


vjerojatnost pogotka/dobitka u
igrama na sreu
- Girolamo Cardano (1560) Knjiga o
igrama kockom
Galileo Galilei (1620) Razmiljanja o
igrama kockom
Blaise Pascal (oko 1655)
Statistiki nain miljenja jednog e dana
za svakodnevni ivot graana postati jednako neophodan
kao znanje itanja i pisanja

H.G.Wells (1866-1946)
TEORIJA VJEROJATNOSTI
- Bavi se sluajnim dogaajima
- KONTINUUM 0 1

0 APSOLUTNA NEMOGUNOST

0.5 JEDNAKA MOGUNOST ZA


OBA ISHODA

1.0 APSOLUTNA SIGURNOST


STATISTIKA
= grana primjenjene matematike koja se
bavi prikupljanjem, obradom,
interpretacijom i prezentacijom podataka

= obrada brojanih podataka radi jasnijeg


prikazivanja
(Boris Petz)
STATISTIKA
DESKRIPTIVNA STATISTIKA:

- bavi se opisavanjem prikupljenih podataka dobivenih


prilikom ispitivanja ili mjerenja
- sreivanje i saimanje podataka kako bi bili to pregledniji
- (npr. aritmetika sredina; standardna devijacija)

? Koje je prosjeno vrijeme inkubacije gripe XYZ ?


? Koliko je veliki varijabilitet ?
? Gdje se pojedini rezultat nalazi u odnosu na sve ostale rezultate ?
? Kako se odreena pojava rasporeuje u prirodi (oblik distribucije) ?
INFERENCIJALNA STATISTIKA:

- slui analizi uzoraka i pronalaenju pravilnosti ili


razlika unutar ili meu uzorcima
- omoguuje nam stvaranje zakljuaka (smijemo li generalizirati iz
konkretnog uzorka na opu zakonitost)
- (npr. hipoteza, otkrivanje veza meu varijablama, modeliranje
odnosa ili slinih postupaka poput analize varijance, faktorske
analize... )

! REPREZENTATIVNOST UZORKA
UZORAK - POPULACIJA
Najee nismo u mogunosti ispitati/mjeriti
neku pojavu na populaciji (esto je
populacija beskonana)

ispitujemo UZORAK, koji mora biti


reprezentativan
REPREZENTATIVNI UZORAK
- Uzorak mora dobro odraavati populaciju
(u njemu moraju biti zastupljene sve
karakteristike populacije)
- Reprezentativnost uzorka ovisi o:
- veliini uzorka
- odabir uzorka (najee: sluajni)
- varijabilnost pojave
VELIINA UZORKA OVISI O:

1. ELJENOJ PRECIZNOSTI REZULTATA


(vea preciznost vei uzorak)
2. VARIJABILNOSTI POJAVE
(vei varijabilitet vei uzorak)
3. FREKVENCIJI POJAVE
(rjea pojava vei uzorak)
VJEROJATNOST
Za zakljuivanje iz
uzorka na populaciju
presudna je uloga
TEORIJE
VJEROJATNOSTI
SREDNJE VRIJEDNOSTI
1. Medijan
2. Mod
3. Aritmetika sredina
Medijan (centralna vrijednost)
(C) je vrijednost koja se u nizu rezultata
poredanih po veliini nalazi tono u sredini

Primjer: Rezultati mjerenja su:


7 9 4 7 8 7 10 6 6 9 8
Poredani po veliini:
4 6 6 7 7 7 8 8 9 9 10

Poloaj C = (N + 1) / 2
Medijan (centralna vrijednost)
C = (N + 1) / 2

- Ako je broj rezultata paran, raunamo


aritmetiku sredinu dva srednja rezultata

- Medijan se koristi kad imamo i neke ekstremne


rezlutate pa aritmetika sredina ne daje pravu
sliku
Modalna (dominantna) vrijednost
(D) je ona vrijednost koja je u nizu rezultata
najea (ima najveu frekvenciju)

- prednost: na nju utjee samo frekvencija


rezultata
- Mod se ne moe odrediti ako ne postoje
najmanje 2 jednake vrijednosti varijable.
X 1X1X2 XX23 3 ... Xn
...XXn
X
X n
n
Aritmetika sredina
- Suma svih rezultata podijeli se s brojem
rezultata

- Nema ju smisla raunati ako imamo


ekstremne rezultate
Harmonijska sredina
- Rauna se u onim situacijama kada obiljeja elemenata
jednog skupa stoje u recipronom odnosu s obiljejem
elemenata nekog drugog skupa

Primjer: prosjeni km/sat, prosjeni broj slova u minuti...


Geometrijska sredina
- Primjenjuje se u analizi vremenskih nizova
- Pomou nje izraunava se prosjena
stopa promjene pojave

Primjer: koliko je puta prosjeno populacija ljudi u nekom mjestu porasla?


MJERE DISPERZIJE
- Srednje vrijednosti nam opisuju skup koji smo
izmjerili ali nisu dovoljne
- Vrijednosti (rezultati) variraju u zavisnosti od
mnogo faktora i sluajnih utjecaja
- Npr. dva skupa mogu imati iste aritmetike
sredine ali razliite distribucije
- Da bismo mogli zakljuivati o distribuciji pojave,
a time i o populaciji, trebaju nam mjere
disperzije (rasprenja)
Mozgalice....
Zabrinjavajui podaci
Od 1970, postotak ljudi u dobi od 18 do 34
godine koji ive kod kue sa svojim
roditeljima narastao je 48%,
od 12.5 milijuna na 18.6 milijuna
(Izvor: USA Today)

?
Najopasnije zanimanje u Hrvatskoj

u Hrvatskoj je najnesigurnije raditi u


graevinarstvu. Naime, prema podacima
Inspektorata za prolu godinu, od ukupno 39
smrtnih sluajeva kao posljedica ozljeivanja
na radu, ak je 17 bilo u graevinarstvu.

Izvor:
http://www.tportal.hr/vijesti/hrvatska/80924/Gradevinar-
najopasnije-zanimanje-u-Hrvatskoj.html

?
udotvorne kreme

?
Grubi marketing

?
II dio
MJERE DISPERZIJE
- Kada raunamo neku srednju vrijednost, elimo
da nam ona predstavlja / reprezentira sve nae
rezultate
- Srednju vrijednost moemo raunati samo ako
nam se rezultati skupljaju (grupiraju) oko neke
srednje vrijednosti

Sama srednja vrijednost nam nije dovoljna,


moramo znati i kako se grupiraju rezultati
oko te srednje vrijednosti
MJERE DISPERZIJE
1. Raspon
2. Srednje odstupanje
3. Standardna devijacija
4. Koeficijent varijabilnosti
Raspon
= razlika izmeu najveeg i najmanjeg
rezultata

- vrlo nesigurna mjera: obino je to vei, to


je vei broj mjerenja
Srednje odstupanje
= prosjena veliina odstupanja
pojedinanih rezultata, bez obzira na
smjer odstupanja

srednje odstupanje = | Xi X | / N

- moe se raunati uz aritmetiku sredinu, medijan i mod


(nedovoljan za sloenija raunanja)
Varijanca /
Standardna devijacija
- Aritmetika sredina je teite rezultata, tj.
vrijednost od koje suma odstupanja iznad i ispod
nje uvijek iznosi nula

- Kada bismo raunali prosjeno odstupanje a da


vodimo rauna o predznaku, onda bismo uvijek
dobili nulu

- Predznake izbjegnemo tako da ih kvadriramo


Varijanca /
Standardna devijacija
= zbrojimo kvadrirana odstupanja i
izraunamo im aritmetiku sredinu

- Varijanca = prosjena suma kvadriranih


odstupanja
- Korijen iz varijance puno se lake definira i
prikazuje = STANDARDNA DEVIJACIJA
STANDARDNA DEVIJACIJA
= drugi korijen iz
varijance

= drugi korijen iz
prosjene sume
kvadriranih odstupanja

- govori nam koliko dobro aritmetika sredina


reprezentira uzorak
Koeficijent varijabilnosti
- pokazuje nam koliki postotak
vrijednosti aritmetike sredine
iznosi vrijednost standardne
devijacije

- Slui nam za usporeivanje


varijabilnosti razliitih pojava

- (npr. u kojem svojstvu neka grupa varira


vie, a u kojem manje, ili usporedba
izmeu 2 razliite grupe u istom svojstvu
NORMALNA DISTRIBUCIJA

Normalna distribucija
= Gaussova krivulja
= zvonasta krivulja
video
NORMALNA DISTRIBUCIJA
rezultanta istodobnog djelovanja velikog
broja faktora koji djeluju u razliitim
smjerovima po sluaju i najee se
ponitavaju
UVJETI za dobivanje normalne
distribucije
(1) Da se pojava koju mjerimo rasporeuje
po normalnoj krivulji
(2) Da imamo veliki broj rezultata (mjerenja)
(3) Da su sva mjerenja standardizirana
(4) Skupina na kojoj obavljamo mjerenja
mora biti homogena po svim svojstvima i
heterogena samo za ono svojstvo koje
mjerimo
NORMALNA DISTRIBUCIJA

Poznavanje
aritmetike sredine i
standardne devijacije
potpuno nam definira
raspodjelu rezultata

- znamo na koji dio


standardne devijacije
pada odreeni
rezultat, tj. moemo
tono odrediti poloaj
pojedinca u grupi
-(z-vrijednosti)
NORMALNA DISTRIBUCIJA
KORELACIJA

You might also like