Professional Documents
Culture Documents
Statistika je grana primijenjene matematike koja se bavi zakonitostima koje važe za slučajne događaje
- Skup numeričkih i grafičkih metoda koje koristimo zbog opisivanja, sažetog prikazivanja,
analiziranja i objašnjavanja nekih masovnih pojava
Statistička pismenost – nameće se kao obrazovni cilj zajedno s drugim oblicima građanske pismenosti
(zbog manipuliranjima statističkim rezultatima ili netočnih interpretacija medija)
Deskriptivna statistika – omogućava prikazivanje većeg broja podataka kako bsmo podatke prikazali
na sažet, razumljiv i logičan način
Varijabla – promjenjiva veličina koja može poprimiti različite vrijednosti iz nekog definiranog intervala
1. Nominalna
- Razvrstavanje slučajeva na temelju nekog atributa u grupe, klase ili kategorije
- Vrijednost nominalnog obilježja naziv, ime, kategorija
- Mora omogućiti razvrstavanje svih slučajeva, svaki slučaj se mora moći klasificirati u jednu
kategoriju
- Brojevi imaju ulogu oznake arbitrarno, nemaju pravu numeričku vrijednost
- Nisu dopuštene standardne računska operacije
- Ne označava redoslijed, ni intenzitet
3. Intervalna
- Nudi informaciju o redoslijedu i razlici brojeva na skali
- Poznat je rang i stupanj izraženosti podataka
- Primjereno je korištenje osnovnih aritmetičkih operacija (osim množenja i dijeljenja)
- Nema apsolutnu nulu nula je arbitrarna
4. Omjerna
- Informacija o redoslijedu, razlici, ima apsolutnu nulu
- Smiju se koristit sve osnovne aritmetičke operacije
Grupiranje podataka
- Statistički niz je niz različitih modaliteta neke varijable, poredanih prema odgovarajućem
pravilu, s pripadajućim frekvencijama
Vrste:
- Nominalni niz
o U istu grupu svrstavaju se elementi jednog modaliteta nominalne kategorije
o Jednostavno je ako ima mali broj kategorija
o Poredak je arbitraran
- Ordinalni niz
o Isto kao i nominalni nizovi
o Redoslijed grupa je bitan
o Nastaje na temelju rangova ordinalne varijable
- Numerički niz
o Za diskontinuirane kvantitativne varijable koje mogu poprimiti manji broj vrijednosti
svaka brojčana vrijednost je zasebna grupa
o Ako je broj različitih vrijednosti velik susjedne brojčane vrijednosti se svrstavaju u
grupe
Statističke tablice
Vrste:
- Jednostavne
o Jedan statistički niz na temelju modaliteta jedne varijable
- Kombinirane (kontingencijske)
o Jedan statistički niz promatran prema dva ili više modaliteta neke druge varijable
- Skupne
o Više statističkih nizova nastalih grupiranjem elemenata različitih statističkih skupova
prema istom obilježju
- Površinski grafikon
o Stat. Veličine prikazane geometrijskim likovima površine razmjerne frekvencijama
o Vrste:
Jednostavni stupci
Dvostruki stupci
Razdijeljeni stupci
Strukturni krug
Histogram frekvencije
- Linijski grafikon
o Prikazivanje distribucija frekvencija i dinamike pojava točke prikazuju frekvencije
- Kartogram
o Grupiranje podataka prema geografskom obilježju
o Geografski nominalni nizovi
o Vrste:
Dijagramska karta
Piktogramska karta
Statistička karta
- Srednje vrijednosti
- Numerički pokazatelj koji reprezentira niz podataka koji
tvore neki statistički skup
- Podaci se gomilaju/tendiraju oko te vrijednosti
- Potpune – računaju se na temelju vrijednosti svih podataka
- Položajne – određuju se na temelju središnjeg položaja / učestalosti pojavljivanja
a) Aritmetička sredina
X
x
N
- Omjer sume rezultata i broja rezultata
- Za kvantitativne varijable; može i za omjerne (samo ako je normalna distribucija, održiva
pretpostavka o ekvidistanci)
- Što je broj rezultata veći, manji je doprinos pojedinog rezultata
- Treba paziti na ekstremne vrijednosti tada nije dobar pokazatelj srednje vrijednosti
a) Raspon varijacija
- Razlika najvećeg i najmanjeg rezultata
b) Kvartili
- Vrijednosti koje niz podataka poredanih po veličini dijele na četiri jednaka dijela
- Q1 – donji kvartil
- Q2 – medijan
- Q3 – gornji kvartil
d) Varijanca
-
- S uzorak
- σ populacija
- prosječno kvadratno odstupanje rezultata od aritmetičke sredine
e) standardna devijacija
σ (X − 𝑋ത)2
𝜎=ඨ
𝑁
-
- S uzorak
- σ populacija
- pozitivni drugi korijen iz varijance
- prosječno odstupanje rezultata od aritmetičke sredine
Distribucije
Distribucija prikazuje frekvenciju kojom se pojavljuju pojedini rezultati nekog skupa poredani po
veličini
Normalna distribucija
- Obilježja:
o Zvonolika
o Unimodalna
o Aritmetička sredina jednaka medijanu i modu
o Bilateralno simetrična simetričnost s obzirom na aritmetičku sredinu
o Mezokurtična
- Oblik krivulje
o Asimetrična je kada se podaci gomilaju oko manje (pozitivno asimetrična) ili veće
(negativno asimetrična) vrijednosti od sredine raspona varijacija
o Jako pozitivna α3 = +2, jako negativna α3 = -2
o Simetrične distribucije je α3 = 0
Z-vrijednost
- Standardizacija – omogućuje da se rezultati različitih normalnih distribucija izraze u obliku u
kojem su usporedivi
- Oblik početne distribucije se ne mijenja, ne pretvara se u normalnu
- z = (X – μ) / σ
Vrste testova:
Uzorak
Statističke procjene
- Sampling distribucija – distribucija statistika uzorka koje bismo dobili kad bismo iz neke
populacije selektirali sve moguće uzorke određene veličine i za svaki od njih izračunali dani
statistik
- Normalno distribuirana što je veći broj uzorka to je normalnija
- Tendira normalnoj distribuciji čak i ako distribucija populacije nije normalna
Standardna pogreška aritmetičke sredine
Interval pouzdanosti
- Nezavisni uzorci – svaki slučaj pripada svojoj grupi; odabir elementa jednog uzorka nije
određen odabirom elementa drugog skupa
- Zavisni uzorci – ispitanici su prisutni u više grupa; odabir elementa jednog uzorka određen je
odabirom elementa drugog uzorka
Vrste pogrešaka
- Pogreška tipa 1
o Pogrešno odbacivanje točne nulte hipoteze
o Ako smanjimo sa 0.05 na 0.01 manja vjerojatnost da ćemo pogrešno odbaciti
nultu hipotezu
- Pogreška tipa 2
o Pogrešno prihvaćanje netočne nulte hipoteze
o Ako se smanjuje vjerojatnost prve, povećava se vjerojatnost druge pogreške
inverzno povezane
T-Test
- Parametrijski test
- Uspoređuje aritmetičke sredine dvaju grupa
- Nezavisna varijabla nominalna
- Zavisna varijabla kvantitativna
Analiza varijance
- Parametrijski test
- Usporedba aritmetičkih sredina dvaju ili više grupa
- Zavisna varijabla omjerna ljestvica
- Nezavisna varijabla nominalna ljestvica
- H0 sve grupe pripadaju istoj populaciji
Korelacijska analiza
Koeficijent korelacije
Pearsonov koeficijent r
- Parametrijski
Spearmanov p
- Neparametrijski
2
f o f t 2
χ2–test
ft
- Hi-kvadrat test
- Neparametrijski test
- Koristi se samo na frekvencijama ukazuje odstupa li naša distribucija od očekivane
- Ft očekivane/teorijske frekvencije
- Fo opažene frekvencije
- P<0.05 razlika statistički značajna χ2< χ2gr