You are on page 1of 25

STATISTIKA

1
1. Populacija, uzorci, varijable
Populacija svi lanovi neke skupine s odreenom karakteristikom koju mjerimo
Uzorak ogranieni (reprezentativni) broj sluajeva iz populacije
Glavni faktori kod biranja uzorka su reprezentativnost i veliina uzorka.
Veliina uzorka ne ovisi o veliini populacije ve o tome koliko elimo precizno
mjerenje i o varijabilnosti pojave. Ako je manja varijabilnost, manji uzorak e biti
dovoljan. Vea preciznost zahtijeva vei uzorak.
Veliina uzorka je obrnuto proporcionalna sa kvadratom re!ke i moe se raunati
pomou formule n " #z$%&p&'()d$%! gdje je n veliina uzorka! d je veliina pogre"ke! p je
stupanj tonosti ('"*+p)! z je standardna devijacija.
,tandardna devijacija je statistiki pojam koji oznaava mjeru raspr"enosti podataka u
skupu. #nterpretira se kao prosjeno odstupanje od prosjeka i to u apsolutnom iznosu.
$li kada je populacija mala onda se veliina uzorka rauna po -ormuli n."n)#*/n)0(! gdje
je 0 veliina populacije! a n veliina uzorka.
Vrste uzoraka%
1. ,luajni uzorak svaka jedinka populacije ima jednaku vjerojatnost da bude
izabrana u uzorak. &aje veliku vjerojatnost reprezentativnosti uzorka.
'. ,istematski uzorak reprezentativan je kao i sluajni uzorak. (oramo imati popis
svi) lanova koji je posloen na nain da ne unosi pristranost (npr. popis ljudi po
abecedi je dobar). *akon toga odaberemo sistem po kojem odabiremo lanove (npr.
prvog lana uzmemo sluajno! a nakon toga uzmimamo svakog desetog).
+. ,trati-icirani uzorak populaciju je podijeljena u grupe (stratume! slojeve) prema
nekim karakteristikama (npr. po starosnoj skupini) iz koji) se odabire sluajan uzorak.
,eliina sluajnog uzorka u stratumu mora odgovarati veliini stratuma u populaciji
(npr. ako ima -./ ena u populaciji! a 0./ mu"karaca! onda se i uzorak mora
sastojati od -./ ena i 0./ mu"karaca. 1vaj uzorak je reprezentativniji od
sluajnog.
0. 1laster uzorak jeftinija i lo"ija varijanta sluajnog uzorka! slian je stratificiranom
uzorku! ali je manje reprezentativan. 2opulaciju dijelimo u klastere od koji) se
sluajnim odabirom uzimaju samo neki koji se u potpunosti obrade (tj. iz tog klastera
uzimamo sve lanove u uzorak! npr. podijelimo grad u etvrti i nakon toga sluajno
odaberemo nekoliko etvrti u kojima sve stanovnike ispitamo o nji)ovom mi"ljenju o
gradskoj upravi).
3. 1votni uzorak takoer slian stratificiranom! ali je jo" manje precizan. 1vdje se
biraju nesluajni stratumi! zato jer se prema nekim pret)odnim informacijama (npr.
'
pretpostavnka da je jednako mu"karaca i ena u nekoj populaciji) unaprijed odreuje
koliko e biti velik uzorak ljudi koji se uzima iz pojedinog stratuma.
-. Priodni uzorak uzorak koji nam se nae pri ruci. moe biti izuzetno pristran! no
moe biti i nepristran ukoliko nam zavisna varijabla ne ovisi o faktorima koji se
pojavljuju u uzorku. *pr. izrazito pristrano bi bilo zakljuivati o postotku 4normalni)4
ljudi meu "tienicima psi)ijatrijske ustanove! no isti uzorak bi mogao dati nepristrane
rezultate ako bismo npr. testirali nji)ove motorike sposobnosti.
Varijabla skup podataka iste vrste vrste.
,kale mjerenja%
1. 0ominalna skala pridruivanje brojeva odreenem stvarima koje im slue kao
oznaka (npr. mu"ko 5 1! ensko 5 '! tako da odreenu pojavu moemo samo brojati.
1vakvim podatcima moemo odrediti dominantnu vrijednost.
'. 2rdinalna skala moemo poredati podatke! tj. moemo odrediti da li je odreena
pojava vea ili manja na toj skali. 6ipini primjer su "kolske ocjene (znate da je + vee
od '! ali razlike od 1 do ' i od ' do +. nisu iste).
+. 3ntervalna skala za ovakve podatke znamo slijed! ali i razliku izmeu brojeva na
skali koja je jednaka na svakom dijelu skale. 0ema neke nulte vrijednosti od koje
skala kree (tj. ono "to nemamo je aposlutna nula). *pr. takva skala je 7elzijeva
skala za temperaturu. *ula stupnjeva ne znai da nema temperature.
0. 2mjerna skala slina kao i intervalna skala. 3ma apsolutnu nulu! "to znai da
jednaki brojani odnosi znae i jednake odnose u mjernoj pojavi. 2rimjeri podataka%
teina! visina...
4ipovi podataka kvalitativni ili kvantitativni #podjela(
a) 1vantitativni #numeriki( 8 podaci mogu biti%
1. 5iskretni #diskontinuirani( numeriki podaci! samo u sluaju ako postoji
konaan broj mogui) vrijednosti ili ako postoji prostor na brojevnom pravcu izmeu
svake dvije mogue vrijednosti (npr. i"itavanje vrijednosti sa zastarjelog ivinog
termometra).
'. 1ontinuirani podaci ine ostatak numeriki) podataka koji se ne mogu smatrati
diskretnima. 6o su tipovi podataka koji se obino povezuju s nekom vrstom
naprednog mjerenja na instrumentima prema razvojnom stupnju struke.
1no "to je vanije jest da se podaci mogu mjeriti intervalnom ljestvicom ili onom
omjernom. 9a samu statistiku analizu razlika izmeu te dvije ljestvice mjerenja nije
vana. (:jestvice (skale) su i gore ve obja"njene! a i ispod jo" detaljnije;)
1. 3ntervalna mjerna ljestvica 8 podaci izraeni ovom mjernom ljestvicom nemaju
apsolutnu nulu i ne moemo rei da je dvostruko vea brojana vrijednost za ista dva
puta vea. 2rimjerice! iako vrijednosti temperature izmjerene na 7elzijusovoj ljestvici
+
imaju jednake intervale izmeu stupnjeva! .<7 nije apsolutna nula. *ula na
7elzijusovoj ljestvici oznaava toku ledi"ta vode! no ne i totalnu odsutnost
temperature. *ema smisla rei da je temperatura od 1.<7 dvostruko toplija 3<7.
'. 2mjerna mjerna ljestvica 8 podaci izraeni omjernom mjernom ljestvicom imaju
apsolutnu nulu. *a primjer! prilikom mjerenja duljine! nula predstavlja odsutnost
duljine! a 1. metara je dvostruko dulje od 3 metara.
1ba tipa podataka (i intervalni i omjerni) mogu se koristiti u parametrijskim testovima.
b) 1valitativni #kateoriki( podaci mogu biti%
1. 6inarni #loiki( podaci osnovni tip kategoriki) podataka (npr.
pozitivno=negativno> prisutno=odsutno itd.).
'. 0ominalni podaci 8 kod kompleksniji) kategoriki) podata! prvu (i najslabiju)
razinu podataka predstavljaju nominalni podaci. 2odaci nominalne razine dobiju
se iz vrijednosti koje se razlikuju samo po nazivu. *e postoji neka standardna
s)ema poretka (npr. rumunjska! maarska! )rvatska skupina ljudi itd.).
+. 2rdinalni #uredbeni( podaci 8 slini su nominalnim podacima u tome da se
podaci razlikuju prema nazivu! a od nominalni) podataka i) razlikuje s)ema
stupnjevanja (npr. povremeni pu"ai! umjereni i te"ki pu"ai).
4ipovi varijabli% (ispod je jo" jedna podjela ostavljena je zbog podataka koji se spominju u
testovima;;;)
1. 0ominalne #kateorijske ili kvalitativne( mogu imati nekoliko vrijednosti meu
kojima ne postoji prirodan redoslijed (c)i8kvadrat test). (npr. spol! krvna grupa)
'. 2rdinalne #ljestvine( imaju vrijednosti meu kojima postoji prirodan poredak! ali
nije precizno odreeno koliko je vrijednosti (neparamtrijski test)
+. 7etrike #kvantitativne( moemo im pridruiti realne brojeve te i) podvrgnuti
matematikim operacijama (t8test! paramtrijski testovi)
6ipovi varijabli (21&?@:$ #9 7A$26@B CDB#26@;;;;;;;;;;;;;;;;;;;;;;;;;)%
1. 1ateorika varijabla je varijabla koja ima kategorije vrijednosti! npr.varijabla EspolE
ima dvije vrijednosti% mu"ko i ensko.
'. 5iskretna varijabla ima konaan broj vrijednosti u istoj stavci! bez intervala ili djelia
vrijednosti! npr. 1soba ne moe imati pola bolesti ili pola ruka.
+. 1ontinuirana varijabla moe varirati u koliini! npr *ovac u banci! mjesena zarada.
2ostoje jednaki intervali i obino prava nula! npr. mogue je da nema novca u banci.
Dategorike varijable odgovaraju kategorikim podacima.
Dontinuirane varijable odgovaraju intervalnim i omjernim podacima.
9avisne i nezavisne varijable%
0
1. 0ezavisna varijabla je pret)odna varijabla koja uzrokuje! djelomino ili u cjelini!
odreeni is)od> to je poticaj koji utjee na odgovor! faktor koji moe biti modificiran
(npr. u eksperimentalnim ili drugim uvjetima) da utjeu na is)od.
'. 8avisna varijabla je is)odna varijabla koja je uzrokovana! u cijelosti ili djelomino!
ulaznim pret)odnim varijablama. 6o je uinak! posljedica ili odgovor na nezavisne
varijable.
3
2. Statistika hipoteza
Aipoteza moe biti tona #istinita( ili netona #neistinita(. 6estiranje )ipoteze je proces
traenja istine! odnosno stvarnog stanja izraeno vjerojatno"u.
2ri interpretaciji rezultata statistiki) testova valja imati na umu da se hipoteza ne dokazuje9
Bezultat statistikog testa ukazuje samo da li dostupni podaci podravaju ili ne podravaju
)ipotezu! tj. koliko bi )ipoteza mogla biti pri)vatljivom ili nepri)vatljivom! dakako uz odreenu
vjerojatnost.
*a temelju podataka prikupljeni) na uzorku ispitanika statistiko8matematikim postupkom
izraunaju se vrijednosti speci-ino statistiko testa. *a temelju vrijednosti rezultata
izraunati) statistikim testom donosi se odluka o odbacivanju ili pri)vaanju nul8)ipoteze.
Fto je vea apsolutna vrijednost statistikog testa (tj. bez obzira na njezin predznak G ili 8)!
vei je i dokaz protiv nul8)ipoteze! tj. manja je vjerojatnost da je nul8)ipoteza istinita.
1dluka o tome koje vrijednosti spadaju u podruje odbacivanja! a koje u podruje
pri)vaanja donosi se na temelju razine znaajnosti (H). Razina znaajnosti (H) predstavlja
graninu vjerojatnost uz koju jo" uvijek valja pri)vatiti eventualno istinitu nul8)ipotezu.
2rimjer% razina znaajnosti H 5 .!.3%
8 ako je 2(vjerojatnost) I .!.3 odbacuje se nul8)ipoteza! tj. rezultati su statistiki
znaajni (signifikantni) na 3/ razini znaajnosti>
8 ako je 2 J .!.3 pri)vaa se nul8)ipoteza> tj. rezultati nisu statistiki znaajni
(signifikantni) na 3/ razini znaajnosti! odnosno nema dovoljno dokaza za
odbacivanje nul8)ipoteze.
3zbor veliine razine znaajnosti statistiko testa (.!.3> .!.1> .!.1> .!..1) je proizvoljan.
,eliina razine znaajnosti govori o tome u kojem postotku si istraiva dopu"ta nainiti
gre"ku odbacivanja istinite nul8)ipoteze.
:;<=1<>
:re!ka tipa 3 nastaje kada se odbaci istinita nul8)ipoteza. Bazina znaajnosti
statistikog testa H (alp)a) predstavlja maksimalnu "ansu! odnosno vjerojatnost da se
naini gre"ka tipa #. ,eliinu razine znaajnosti valja odrediti prije prikupljanja
podataka.
:re!ka tipa 33 nastaje kada se ne odbaci neistinita nul8)ipotezu te zakljui da nema
efekta kada on stvarno postoji. Fansa da se naini gre"ka tipa ## naziva se K (beta).
Snaga testa rauna se kao #*+ ?( te predstavlja vjerojatnost odbacivanja neistinite nul+
hipoteze.
*a snagu statistikog testa utjeu%
-
8 veliina uzorka 8 snaga raste kako raste veliina uzorka>
8 varijabilitet opaanja 8 snaga pada kako raste varijablitet opaanja>
8 e-ekt od interesa #e-ekt razlike( 8 snaga je vea "to je vei efekt>
8 razina znaajnosti #@( 8 snaga je vea "to je vea razina znaajnosti.
Loljivo je da je parametar na koji je najlak"e utjecati zapravo veliina uzorka. Ctoga se tzv.
analiza snae (engl. power analysis) koristi za izraunavanje potrebne veliine uzorka za
istraivanje s visokom vjerojatno"u okrivanja stvarnog efekta zadane veliine
Cnaga MdobrogN statistikog testa trebala bi biti barem O.8P./.
2.1. Testiranje statistike hipoteze
A. postavljanje hipoteze
Q nulta )ipoteza (nulR)ipoteza! A.)
razlike nema
Q alternativna )ipoteza (A1)
razlika postoji
6. odabir statistiko testa
Q vrsta podataka
brojani
kategoriki
Q veliina uzorka
Q povezanost skupina
Q primjer% S'Rtest
A. odreBivanje razine znaajnosti
Q razina znaajnosti
Q mjera pogrje"ke tijekom zakljuivanja
Q iskazuje se vjerojatno"u P
Q P <
5. izraun statistike testa
Q specifina vrijednost testa
S'! t! )! z...
Q P vrijednost
<. zakljuak #P C @ ili P D @)
P C @
Q statistike pogrje"ke% H Mzakljuujemo da postoji razlika! a razlike nemaN
Q P je manji od graninoga! dakleT
O
Q mala je vjerojatnost da pogrje"no zakljuujemo zakljuak je ispravan
Q odbacujemo nultu ). (Mnema razlikeN)
Q pri)vaamo alternativnu% razlika postoji
P D @
Q statistike pogre"ke% H Mzakljuujemo da postoji razlika! a razlike nemaN
Q P je vei ili jednak graninome! dakleT
Q vjerojatnost pogrje"nog zakljuivanja nije dovoljno mala
Q pri)vaamo nultu )ipotezu% razlike nema
0ul+hipoteza, H0 pretpostavka je o izostanku efekta! tj. da ne postoji razlika meu uzorcima
u populaciji od interesa (npr. nema razlike u aritmetikim sredinama). 6o je )ipoteza koja se
testira! hipoteza da nema razlike ( engl. )Upot)esis of no difference). 2ostavlja se (najvema)
u svr)u odbacivanja. 1dbacuje se ili pri)vaa.
2rimjer A.% u mu"karaca i ena u populaciji jednak je postotak pu"aa.
Alternativna hipoteza, H1 vrijedi ako nul8)ipoteza nije istinita. *aje"e se direktno odnosi
na teorijsku pretpostavku koja se eli istraiti! tj. esto je alternativna )ipoteza upravo
)ipoteza istraivaa.
2rimjer A1% u mu"karaca i ena u populaciji razliit je postotak pu"aa
2.2. Pogreke pri testiranju hipoteze
2ostupak dono"enja odluke o odbacivanju ili ne odbacivanju statistike )ipoteze zove se
testiranje statistiki) )ipoteza.
Vudui da sve odluke bazirane na uzorcima iz populacije nisu 1../ pouzdane! ni zakljuak
(odluka) statistikog testa nije 1../ pouzdan. &akle! moe se dogoditi da je zakljuak testa
pogre"an. 2rema tome! imamo sljedeu situaciju%
P
2ogre"ka koju inimo kada odbacujemo H.! a ona je istinita! je pogre"ka prve vrste.
2ogre"ka koju inimo kada ne odbacujemo H.! a istinita je H1! je pogre"ka druge vrste.
Pore!ka tipa 3> @ #razina znaajnosti testa(
Pore!ka tipa 33> ? #*+ ? je snaa testa vjerojatnost odbacivanja netone nul+
hipoteze(
:re!ka tipa 3 8 nastaje kada se odbaci istinita nul8)ipotezu. Bazina znaajnosti statistikog
testa H (alp)a) predstavlja maksimalnu "ansu! odnosno vjerojatnost da se naini gre"ka tipa
#. ,eliinu razine znaajnosti valja odrediti prije prikupljanja podataka.
:re!ka tipa 33 + nastaje kada se ne odbaci neistinita nul8)ipotezu te zakljui da nema efekta
kada on stvarno postoji. Fansa da se naini gre"ka tipa ## naziva se K (beta). (ve obja"njeno
#C61 gore;)
,i"estruko testiranje )ipoteze znatno poveava uestalost pogre"ke tipa # ;
3straivako pitanje hipoteza
Q 2ostoji li razlika (u istoj varijabli) izmeu dvaju (ili vi"e) skupinaW
Q 2ostoji li povezanost dvaju varijabliW
Q (oe li se iz jedne (oe li se iz jedne (ili vi"e) varijable predvidjeti drugaW
<EE<A4 ,38< #veliina uinka(
*ain kvantificiranja razlike izmeu dvije skupine. 2okazuje koliko je velik uinak. *a primjer!
ako jedna skupina ima eksperimentalni tretman! a druga ne (kontrolna skupina)! tada je
veliina uinka mjera uinkovitosti tretmana.
Ctatistika za raunanje veliine uinka ukljuuje r
'
! prilagoeni B
'
!
'
!
'
! 7ramerXs !
DendallXs !! 7o)enXs d! @ta! @ta
'
.
Bazliite vrste statistiki) tretmana koriste razliito raunanje veliine uinka.
2sjetljivost uzima se skupina najbolji) ('O/)i skupina najlo"iji) ('O/) pa se meusobno
usporede> srednji se zanemare
Y
group control the of deviation standard
group) control of mean group al experiment of (mean
size Effect

=
squares of sum Total
groups between square of Sum
) (Eta size Effect
2
=
. Statistika deskriptivna i inerencijska
2arametrijska i neparametrijska statistika
1. 2arametrijska statistika% gdje su karakteristike ili imbenici populacije poznati
'. *eparametrijska statistika% gdje su karakteristike ili imbenici populacije nepoznati.
&eskriptivna i inferencijska statistika
1. 5eskriptivna statistika% slui nam da rezimiramo obiljeja uzorka ili jednostavne
odgovore uzorka (npr. frekvencija ili korelacije). *e nastoji zakljuiti ili predvidjeti
parametre populacije.
'. 3n-erencijska statistika% *astoji zakljuiti ili predvidjeti parametre populacije ili is)ode
iz jednostavni) mjera! npr. uzimanjem uzorka i statistikim te)nikama. 6emelji se na
vjerojatnosti.
!.1. "eskriptivna statistika
L njoj se zakljuuje od svi) pojedinani) sluajeva na cjelinu pojave. L toj grani statistike se
opisuju prouavanje pojave s obzirom na nji)ovu%
1. Credi"nju tendenciju odreivanje srednji) vrijednosti
'. Baspr"enje podataka odreivanje smjera disperzije
+. 2ostojeu povezanost izmeu ' ili vi"e varijabli odreivanjem koeficijenta
korelacije
0. 1dnos dijela prema cjelini odreivanjem postotaka i odnosa razni) logiki
povezani) pojava "to se ostvaruje odreivanjem relativni) brojeva
7jere centralne tendencije
Q aritmetika sredina
Q medijan (centralna vrijednost)
Q mod (dominantna vrijednost)
7jere varijabilnosti
Q raspon
Q standardna devijacija
Q koeficijent varijacije
ARITMETIKA SREDINA
aritmetika sredina "suma svih rezultata ) broj rezultata
Q MprosjekN! tei"te rezultata
Q zajednika aritmetika sredina ;
1.
MEDIJAN (centralna vrijednost)
Q ,rijednost koja se u nizu rezultata nalazi tono u sredini> poloajna mjera (ne raunamo ju)
Q dijeli skup podataka na dva jednaka dijela
poloaj medijana 5(* G 1) ='
ukoliko je * paran broj medijan je aritmetika sredina dva srednja rezultata
MOD (dominantna vrijednost)
Q naje"a vrijednost u nekom nizu podataka
Q ako su rezultati grupirani u razrede 8Z mod je aritmetika sredina razreda s najveom
frekvencijom
RASPON
Q razlika izmeu maksimuma i minimuma
Q najnetonija mjera varijabilnosti
STANDARDNA DEVIJACIJA (s)
Q varijanca 5 s
'
Q oznaava prosjeno odstupanje od aritmetike sredine
Q smije se raunati samo uz aritmetiku sredinu ;
KOEFICIJENT VARIJACIJE (KV)
Q oznaava koliki postotak od aritmetike sredine iznosi standardna devijacija
Q slui za meusobnu usporedbu varijabilnosti razliiti) svojstava
STANDARDNA O!RE"KA ARITMETIKE SREDINE (SE# SEM)
Q koliko je precizna procjena prave aritmetike sredine iz aritmetike sredine uzorka W
Q standardna gre"ka je to manja "to je manja standardna devijacija uzorka i vei broj
mjerenja (*)
Q oznaava odstupanje aritmetiki) sredina uzoraka od prave aritmetike sredine populacije
Q procjena; (pravu [ ne znamo)
PAZITI!!!
s F ,<
mjera varijabilnosti uzorka ne opisuje uzorak nego kvantificira
preciznost procjene aritmetike sredine
!.1.1. #oeicijenti korelacije
1orelacija povezanost izmeu dvaju pojave (varijable) \kod nominalni) varijabli nema
korelacije (npr. spol)
5vije varijable mou biti u G odnosa (;;;)%
1. Dada mala vrijednost jedne varijable odgovara maloj vrijednosti druge varijable
'. Dada mala vrijednost jedne varijable odgovara velikoj vrijednosti druge varijable
11
+. Dada vrijednost jedne var u nekim intervalima odgovara maloj vrijednost druge var! a
u drugim intervalima velikoj vrijednosti (nemotona korelacija)
0. Dada se na osnovu vrijednosti jedne varijable ne moe zakljuiti ni"ta o vrijednosti
druge vaijable.
1oe-icijenti korelacije izraavaju mjeru povezanosti izmeu dvije varijable u jedinicama
neovisnima o konkretnim jedinicama mjere u kojima su iskazane vrijednosti varijabli. 2ostoji
vi"e koeficijenata korelacije koji se koriste u razliitim sluajevima. L praksi se prilikom rada
s linearnim modelima naje"e koristi 2earsonov koeficijent korelacije (produkt moment
koeficijent korelacije). 2rilikom rada s modelima koji nisu linearni naje"e se koristi
Cpearmanov koeficijent korelacije (produkt rang koeficijent korelacije).
pokazuje stupanj ( i smjer) korelacije
neativna korelacija 81.............TT..................T........G1 -unkcionalna korelacija
nema -unkcionalna pozitivna
korelacije
0eativna korelacija #+*( " potpuno neslaanje, H " nema zavisnosti, * "
potpuno slaanje(
zakljuke o vrijednosti koeficijenta korelacije donosimo uz odreenu razinu
vjerojatnosti (pI.!.3> pI.!.1)
(G) pozitivan smjer korelacije pokazuje da porast vrijednosti varijable ] prati porast
vrijednosti varijable ^
(8) negativan smjer korelacije pokazuje da porast vrijednosti varijable ] prati opadanje
vrijednosti varijable ^
EARSONOV KOEFICIJENT KORE$ACIJE r
1'
6emeljni koeficijent korelacije iz kojeg se izvodi veina drugi) kofecijenta.
(jera stupnja linearne povezanosti dviju kvantitativni) varijabli.
,rijednost 2earsonovog koeficijenta korelacije kree se od G1 (savr"ena pozitivna korelacija)
do 1 (savr"ena negativna korelacija). 2redznak koeficijenta nas upuuje na smjer korelacije
da li je pozitivna ili negativna! ali nas ne upuuje na snagu korelacije. Pearsonov
koe-icijent korelacije bazira se na usporedbi stvarno utjecaja promatranih varijabli
jedne na druu u odnosu na maksimalni moui utjecaj dviju varijabli.
2earsonov koeficijent korelacije je parametrijski.
Potreban uzorak> nIJH, poeljno je nI*HH
6arem jedna varijabla mora biti normalno distribuirana.
:inearna povezanost varijabli.
#ntervalna ili omjerna mjerna ljestvica.
SEARMANOV KOEFICIJENT KORE$ACIJE
Cpearmanov koeficijent korelacije (produkt rang korelacije) koristi se za mjerenje
povezanosti izmeu varijabli u sluajevima kada nije moue primjeniti Pearsonov
koe-icijent korelacije.
$ko se radi o manjem br sluajeva #nIJH)! opravdano je izraunavanje ovog koeficijenta
korelacije koji pretpostavlja redanje po ranu rezultata u jednoj i druoj varijabli. Ako
ima vi!e jednakih rezultata, dodjeljuje se prosjeni ran.
1n slui za neparametrijske uzorke.
Bauna se kada je barem jedna od varijabli ] ili ^ mjerena ordinalnom skalom! kada niti ]
niti ^ ne slijede normalnu distribuciju te kada je uzorak mali i kada je povezanost varijabli
nelinearna.
Ctatistiki znaajna korelacija je kada je pCH.HK.
*e koristi se kada se jedna varijabla izraunava iz druge.
1+
KROSTA% KOEFICIJENT KORE$ACIJE
1vaj test koristimo za prebrojavanje.
!.2. $nerencijska statistika
L njoj se zakljuuje od dijela sluajeva na cjelinu svi) sluajeva.
Ctatistike metode%
1. (etode koje usporeuju metrike varijable paramterijski testovi (t8test! analiza
varijance)
'. (etode koje usporeuju nominalne varijable c)i kvadrat test
+. (etode koje usporeuju odrdinalne varijable neparametrijski testovi ((ann8_)itneU
L test! medijan test! Druskal8_allis test! Dendal C test! Domogorov8Cmirnov test)
Ctatistiki testovi%
1. Parametrijski pokazatelji ne odstupaju od normalne razdiobe i kada se obrauju
izvorna mjerenja
'. 0eparametrijski koriste se kod mali) uzoraka! kada je nemogue odrediti
distribuciju podataka ili kada je primjenjena kategorijska skala mjerenja.
1dabir statistikog testa ovisi o%
,rsti podataka
Baspodjeli
Lzorku
Vroju pokazatelja
#straivaka pitanja
1dabir testa i ovisnost o raspodjeli%
2arametrijski pokazatelji koji ne odstupaju od normalne razdiobe (distribucije)
*eparamtrijski nisu ogranieni normalno"u raspodjele
1dabir testa i ovisnost o osobini uzorka>
2arametrijski veliki uzorci
*eparamtrijski mali uzorci
10
1dabir testa i ovisnost o broju pokazatelja>
?ednosmjerna (univarijantna) analiza% trai razlike meu sluajevima unutar jedne
varijable
&vosmjerna (bivarijantna )analiza% trai vezu izmeu dvije varijable.
(ultivarijatna analiza% trai vezu izmeu dviju ili vi"e varijabli.
2$B$(@6B#?CD# 6@C61,# *@2B$(@6B#?CD#
6@C61,#
C,BA$ 6@C6$
Ctudentov ili
t8test za nezavisne uzorke
(ann8_)itneU L8test
_ald8_olfo`itz test
Lsporedba dva nezavisna
uzorka koji su uzeti iz iste
populacije
t8test diferencija ili
t8test za zavisne uzorke
_ilcoaon test sume
rangova
Lsporedba dva seta
opaanja na istom uzorku
?ednosmjerna analiza varijance
(b8test! $*1,$)
Druskall8_allis analiza
varijance rangova (A8
test)
(edijan test
Lsporedba vi"e od dva
nezavisna uzorka koji su
uzeti iz iste populacije
$naliza varijance s ponavljanim
mjerenjima
breedmanova analiza
varijance
DendallEs _8test
7oc)ranEs c8test
Lsporedba vi"e od dva
seta opaanja na istom
uzorku
2odaci ?edan
uzorak
&va uzorka ,i"e od dva uzorka
*ominalni Vinomial
7)i8kvadrat
test (test za
jedan
uzorak)
*ezavisni 9avisni *ezavisni 9avisni
bisc)er8ov
test tonosti
7)i8kvadrat
test (test za
dva uzorka)
(c*emer 7)i8kvadrat
test (test za
k uzoraka)
7oc)ran c
1rdinalni Dolmogorov
8Cmirnov
test (jedan
uzorak)
(ann8
_it)neU L
test
Dolmogorov
8Cmirnov
test
_ald8
_olfo`itz
Cpearman
_ilcoaon
matc)ed
pairs test
Cign test
Druskal8
_allis test
1rdinalna
regresijska
analiza
briedmanov
test
13
1rdinalna
regresijska
analiza
#ntervalni i
omjerni
t8test t8test
2earsonova
korelacija
proizvodnog
momenta
t8test za
parove
uzoraka
?ednosmjer
na $*1,$
&vosmjerna
$*1,$
6ukeU )sd
test
Cc)effe test
2onovljeno
mjerenje
$*1,$
*omilani 1rdinalni #ntervalni i omjerni
(jera povezanosti 6etrac)oric
korelacija
2oint biserial
korelacija
2)i koeficijent
7)ramerEs ,
Cpermanov r)o
Bank order
correlation
2artial rank
correlation
2earson product
moment correlation
(jere razlike 7)i8kvadrat
(c*emar
7oc)ran c
Vinomni test
(ann8_it)neU L
test
Druskal8_allis
_ilcoaon parovi
podudaranja
briedman
dvosmjerna analiza
varijance
_ald8_olfo`itz test
Dromogorov8
Cmirnov test
68test za dva
nezavisna uzorka
t8test za dva
zavisna uzorka
?ednosmjerna
$*1,$
&vosmjerna
$*1,$
6ukeU )sd test
Cc)effe test
(jere linearne
veze izmeu
zavisni) i
nezavisni) varijabli
1rdinalna
regresijska analiza
:inearna regresija
(nogostruka
regresija
baktorska analiza
1-
#dentifikacija
temeljni)
imbenika!
redukcija podataka
1snovna analiza
povezivanja
!.2.1. Para%etrijski testovi &testovi za provjeru hipoteza'
2oeljno je koristiti parametrijske metode ako se smije. &a bi mogli koristiti parametrijske
tesove moraju biti ispunjeni sljedei uvjeti%
1. nZ5+. (preporuka 1..)
'. 2odaci moraju biti itervalni ili omjerni
+. *ormalna (Gaussova) distribucija (provjeravamo je pomou Domogorov8Cmirnovog
testa test rauna povr"nu ispod i iznad krivulje! manje od ...3 8 znaajno odstupa!
nije normalna distribucija. )
*aje"i testovi za provjeru )ipoteza%
68test
b8test
7)i8kvadrat test
T&test (2 aritmetike sredine jesu li znaajne) studentov t-test
Doristi se kada imamo ' uvjeta. 68test procjenjuje da li postoji statistiki znaajna razlika
izmeu ta ' uvjeta.
9a t8test podaci% intervalni i omjerni
Bauna se% (aritmetika sredina prvog uzorka8aritmetika sredina drugog uzorka) = pogre"ka
u razlici aritmetiki) sredina. ,ea t8vrijednost vee odstupanje od skupina
#spituje da li se razlike izmeu dviju aritmetiki) sredina mogu smatrati statistiki znaajnima
ili su nastale sluajno. 1dabir postupka ispitivanja 68testom ovisi o veliini uzorka (nZ+.) i o
(ne)postojanju korelacije izmeu varijabli.
Cpada u metode koje opisuju metrike varijable.
6ipian nain je polazak od nulte )ipoteze koja kae da su aritmetike sredine u dva seta
podataka mjerenja jednake.
F&test
Doristi se kada elimo usporediti varijancu dva uzorka ili vi"e aritmetiki) sredina.
temelji se na usporedbi varijanci ($naliza varijance 8 $*1,$)
1O
primjenjuje se za kvantitativna svojstva kada elimo usporediti varijancu dva uzorka ili
kada elimo analizirati razlike izmeu aritmetiki) sredina vi"e uzoraka (+ i vi"e
uzoraka)
"est#statistika $ je sluajna varijabla koja ima b8distribuciju s &b1 i &b' stupnjeva slobode.
Lz razinu znaajnosti H koju istraiva sam izabire s obzirom na mogue posljedice
(naje"e .!.3 ili .!.1) interpretacija rezultata je ista kao i u sluaju interpretacije t8testa.
&rugim rijeima nul8)ipoteza aritmetike sredine svi) grupa (uzoraka) su jednake bit e
pri)vaena ako je granini b vei od izraunatog. $ko je pak granini b manji od izraunatog!
onda nul8)ipotezu treba odbaciti. &rugim rijeima! pri)vatit e se )ipoteza da se bar jedna
aritmetika razlikuje od preostali).
St'(njevi s)o*ode (ne +nam +a,to je ovo ovdje a) evo)
Vroj individualni) rezultata koji se mogu mijenjati bez mijenjanja uzorka.
*pr.% $ko se od vas zatrai da odaberete ' broja koja moraju dodati i do 1..! a prvi je PY!
drugi mora biti 11> je 1 stupanj slobode (PY G a 5 1..).
$ko se od vas zatrai da odaberete + brojeve koje mora dodati na 1..! a prvi od nji) je '.!
onda imate ' stupnjeva slobode ('. G a G U 5 1..).
Ana)i+a varijan-e
Ctatistiki postupak koji se usporeuju razliite komponente varijance. 6o je specijalni sluaj
68testa sa vi"e od ' uzorka (tj. vi"e grupa)
1. Lednosmjerna analiza varijance A02VA primjenjuje se kada usporeujemo
rezultate zavisne varijable dobivene istraivanjem sa jednom nazavisnom
varijablom koja ima vi"e razina ili kategorija. Fto je razlika meu grupama vea! a
unutar grupe manja! to je ukupna razlika vea.
'. Vi!esmjerna analiza varijance 7A02VA primjenjuje se kada usporeujemo
rezultate vi!e zavisnih varijabli s vi!e nezavisnih varijabli
Dod ($*1,@ osim utjecaja veeg broja nezavisni) varijabli na zavisnu gledamo i
interakciju izmeu veeg broja zavisni) varijabli.
:evenov test za ustanoviti jesu li varijance ujednaene da znamo odabrati t
9a analizu varijance izraunava se i E+vrijednost testa. b omjer je znaajan! to znai da se
promatrane skupine stratistiki znaajno razlikuju u istraivanoj varijabli. (b je vei! sig. je
vea 8Z za usporedbu + ili vi"e grupa po jednom kriteriju)
&a bi provjerili izmeu koji) parova postoji razlika! moramo primjeniti jedan od naknadni)
testova.
*aje"i su% ,he--eov test #izvor ovisi o statistikoj re!ci( i M,5 4ukeN test #koji elimo
izbjei( 8 utvruje se izmeu koji) grupa su razlike znaajne! a izmeu koji) ne. 9a
usporedbu vi"e grupa 8Z biti oprezan;
POSTUPNI ANA!IZE "ARIJAN#E
2ostaviti nul 8 )ipotezu
2rikupiti podatke i provjeriti nji)ovu distribuciju
1P
Ltvrditi razliku izmeu aritmetiki) sredina i analizirati i) b 8 6@C61(
2rocijeniti vjerojatnost da su ustanovljene razlike sluajne (ne odbacujemo nul8
)ipotezu i zakljuujemo da su uzorci iz iste populacije) ili statistiki znaajne
(odbacujemo nul 8 )ipotezu i zakljuujemo da su uzorci iz razliiti) populacija> 2I.!.3
ili 2I.!.1)
Ltvrditi izmeu koji) parova uzoraka su razlike statistiki znaajne i na kojoj razini
vjerojatnosti
!.2.2. (epara%etrijski testovi
Doristi se kod malih uzoraka! kada je nemoue odrediti distribuciju podataka ili kada je
primjenjena kateorijska skala (nominalna ili ordinalna) mjerenja. (oze se koristiti i kada
su primjenjene druge skale (intervalna i omjerna)! ali bi takav postopak bio neracionalan jer
na taj nain namjerno gubimo niz informacija i precizniji postupak. #maju manju snagu
otkrivanja stvarnog efekta u odnosu na ekvivalentni parametrijski test. $ko izmeu '
populacije postoji razlika to emo obino preciznije i uspje"nije ustanoviti pomou
parametrijski) nego neparametrijski) testova.
C.i /vadrat test
*astojimo izraunati postoji li statistiki znaajna povezanost u -rekvencijama dviju
nominalnih varijabli ili izmeBu dobivenih i oekivanih -rekvencija.
Doristi se%
Dada su podaci svi) varijabli nominalni (kategorini)
Bezultati izraeni u frekvencijama pojedini) odgovora
9a testiranje povezanosti izmeu dvije nominalne varijable
9a testiranje odstupanja dobiveni) frekvencija
1Y
(oe imati + razliita modaliteta%
7)i kvadrat test za nezavisne uzorke
7)i kvadrat test za zavisne uzorke
7)i kvadrat test za )ipoteze
1snova za izraunavanje 7)i kvadrat testa je kontigencijska tablica koja prikazuje sve
mogue kombinacije zajednikog pojavljivanja promatrani) obiljeja.
Ctupnjevi slobode d(b)5(redak81)\(stupac81).
#ntrepretacija znaajnosti 7)i kvadrat testa ovisi o izabranoj razini (razina Y3/ je 8...3 ako
je znaajnost manje od ...3 tada ne smijemo koristiti te podatke kod parametrijski) testova)
*aje"e upotrebljavamo )i8kvadrat test u ovim sluajevima%
1. Dad imamo frekvencije jednog uzorka pa elimo ustanoviti odstupaju li te frekvencije od
frekvencija koje oekujemo uz neku )ipotezu.
'. Dad imamo frekvencije dvaju ili vi"e nezavisni) uzoraka te elimo ustanoviti
razlikuju li se uzorci u opaenim svojstvima.
+. Dad imamo frekvenciju dvaju zavisni) uzoraka! koji imaju di)otomna svojstva! te elimo
ustanoviti razlikuju li se uzorci u mjernim svojstvima! tj. je li do"lo do promjene.
jedan od naje"i) neparametrijski) testova
primjenjujemo ga za kvalitativna svojstva
temelji se na uestalosti (frekvencijama) pojedini) kategorija rezultata koje
usporeujemo s nekom drugom uestalo"u koja bi se oekivala pod odreenom
nul8)ipotezom
na osnovi dobivenog rezultata ne odbacujemo ili odbacujemo nul8)ipotezu koja
obino glasi da nema statistiki znaajne razlike izmeu opaene i oekivane
uestalosti
u raun treba unijeti uestalost frekvenciju (nikada ne smijemo unositi mjerene
vrijednosti ni postotke) ne samo za ne"to "to se dogodilo! ve i za ono "to se nije
dogodilo
*ajlak"e 7)i 8 kvadrat izraunavamo ukoliko rezultate unosimo u tablice.
Medijan test
2rovjerava da li su dva ili vi"e nezavisna uzorka izvuena iz populacije s istim medijanom
koristei 7)i kvadrat statistiku (u biti provjerava da li je iznad ili ispod prosjeka).
Mann&0.itne1 2&test
*aje"i kori"teni neparametrijski test sa dva nezavisna uzorka% provjerava da li sa dva
uzorka iz polulacije s jednakim medijanom. (oniji je od medijan testa jer koristi
raniranost, nije osjetljiv na oblik distribucije i jednakost varijance promatranih
varijabli.
L je broj koji nam kae koliko je puta vrijednost u prvoj grupi pre"la vrijednost u drugoj grupi!
kada su vrijednosti sortirane od manje prema veoj.
'.
0i)-o3onov test
*eparametrijski test za usporedbu rezultata dvaju mjerenja iste pojave (prije i poslije
tretmana). Pokazuje da li su rezultate ostvareni u jednom mjerenju jednaki ili razliiti
od onih ostvarenih u druom mjerenju. 2ogodan za neparametrijske procjene u kojima
nemamo asimetriku sredinu.
Kr's/a)&0a)iss test
L osnovi je zamjena za analizu varijance i za razliku od nje koristi ranove.
Freedmannov test
*eparametrijski ekvivalent analizi varijance za zavisne uzorke. 9a njega nije bitan oblik
distribucije niti jednakost varijance promatrani) zavisni) mjerenja. *jegov koncept se svodi
na pretvaranje rezultata u rangove! a oni koji imaju isti rang dobivaju tzv. vezani ili zajedniki
rang. 2vaj test koristimo kada imamo vei br eksperimentalnih situacija ili ponovljenih
mjerila.
Kenda) S test
Provjerava da li neka distribucija odstupa u odnosu na eljenu distribuciju. Lsporeuje
povr"inu ispod i iznad krivulje.
M-Nemanov test
4o je test za ispitivanje % nezavisne varijable. Varijable su dihotomne, to znai da su
samo dvije vrijedonosti koje mou biti da ili ne, / ili +.
!.2.!. )()*$+,
K$ASTERSKA ANA$I4A
Dlasterska analiza omoguuje istraivau da grupira zajedno sline i )omogene
subpopulacije ljudi.
8 *ikad ne daje konaan rezultat
8 8a klasi-ikaciju podataka
8 :rupiranje srodnih podataka kada imate velik broj atributa (unaprijed zadano
ovoj grupi)
*ajupotrebljavanija metoda je hijerarhijsko klasterska (pomou dendorama oitava
nivoe i rupe)%
8 Bezultat na veem broju nivoa (nije jednoznaan)
8 Vroj nivoa sami odreujemo
8 *ivoi su tamo gdje dolazi do nagle promjene izmeu grupa
5endoram prikaz strukture u obliku stabla! moe vertikalno ili )orizontalno
2rimjer%
'1
2rincip klasterske metode
8 Ldaljenost svake jedinke od svake ostale
8 *ajmanja udaljenost oznaava koje dvije jedinke su najblie
RE!RESIJSKA ANA$I4A
znai odnos izmeu odabrani) vrijednosti jedne varijable (varijable ]) i s njima
povezani) vrijednosti druge varijable (varijable ^)
koristimo je kada elimo istraiti mogunost procjene vrijednosti jedne varijable
(varijabla ^) na temelju poznate vrijednosti druge varijable (varijable ])
vrijednosti mjerenja predstavljene su kao parovi rezultata koji se sastoje od podatka
za nezavisnu varijablu (obino varijablu ]) i od podatka za zavisnu varijablu (obino
varijablu ^)
parovi rezultata prikazani su kao toke u koordinatnom sustavu koji na osi ] ima
vrijednosti za varijablu ]! a na osi ^ vrijednosti za varijablu ^
tj. %hapter &'( )kratko* znajui vrijednosti jedne varijable moemo predvidjeti
vrijednosti drue varijable
koeficjenti% ;
%
(koliko / rezultata moemo objasniti pomou odabrani) parametara) i
?("to je vei! ta varijabla ima vei utjecaj. npr. K 5 ..- % promijeni li se rezultat u grupi
za 1 stdev! ukupni rezultat se mijenja za ..- stdev)
!INEARNA RE$RESIJA
8 ako parovi varijabli pokazuju prisustvo korelacije! funkcionalnu vezu prikazuje ?@&*$&dV$
B@GB@C#?@
B@GB@C#?$ 8 prognoza iz jedne varijable u drugu
''
JEDNAD%&A PRA"#A RE$RESIJE
u koordinatnom sustavu crta (ili krivulja) spaja toke koje su funkcija mjerenja
varijable ] i varijable ^
crta regresije pokazuje tip odnosa izmeu varijabli ] i ^%
8 ako je pravac! onda je povezanost linearna i odreena jednadbom pravca
regresije
8 ako nije pravac! tada se radi o zakrivljenoj korelaciji
kad se crta regresije! prikazana u koordinatnom sustavu! moe opravdano opisati
pravcem tada se i matematiki moe opisati jednadbom pravca%
O " a / bP
O i P5 najvjerojatniji rezultat varijable U za odreeni rezultat varijable ]
a 5 odsjeak na osi ^
b 5 koeficijent nagiba
2rimjer% pravac regresije za rezultate ostvarene na testu ] i testu ^ ( P studenata)
DVOSMJERNA ANA$I4A
(oe usporediti + ili vi"e grupa formirane na temelju ' kriterija. (oemo ispitati da li se
grupe znaajno razlikuju.
Cloenije% moemo ispitati koliko se grupe razlikuju na temelju ' kriterija i koliko tim
razlikama doprinosi jedan faktor a koliko drugi.
2rimjer. (oemo ispitati da li se grupe u startu razlikuju i da li se razlikuju u odnosu na nie
razine znanja i na vi"e razine znanja.
ETA56 KORE$ACIJA
++e,,e-t . z(roje/e k/adrata za s/e gdje je e,ekt )inko/it0
++error . z(roj k/adrata za s/e 1to ima /eze sa pogre1kom
'+
2okazuje korelaciju izmeu kontinuirane i kategorike varijable. 6o jest kako pojedine toke
kategorike varijable djeluju na kontinuiranu varijablu. F61 ?@ ,@e# @6$! ,@e# ?@
L6?@7$?.
FAKTORSKA ANA$I4A
baktorskom se analizom ispituju meuzavisnosti unutar velikog broja varijabli! te i) sa
nastoji objasniti pomou malog broja zajedniki) faktora.
koef. za poznate podatke% D(1 (Daiser (eUer 1lkin). D(1Z..- da se moe raditi faktorska
analiza.
(oe poprimiti ' forme%
1. eksploratorna pokazuje odnose izmeu razliiti) varijabli
'. konfimatorna slui za provjeru unaprijed formuliranog modela
Eaktorska analiza slui za redukciju podataka. Cvr)a redukcije podataka je uklanjanje
redudanti) varijabli iz podatkovni) dokumenata sa manjim brojem nekorelirani) varijalbli.
Driterij procjene%
8 Volje manje faktora ali uz uvjet da moemo objasniti "to faktor znai tako da i)
dovedemo u vezu sa atributima. 6o radimo komponetnom matricom. Doristi se za
utvrivanje valjanosti u testu.
D1?@ ,$B#?$V:@ LD:?Lf#6# L b$D61BW 9a svaku varijablu%
1. Lkljuiti varijable s najvi"e bodova
'. #zvostaviti varijable s malo bodova
+. 2otraiti gdje postoji bodovni razmak izmeu oni) koji su ukljueni i oni) koji su
iskljueni
0. 2regledajte odabir kako bi provjerili da nema nie boovni) varijabli koji su iskljueni a
da su konceptualno blizu onima "to su ukljueni
3. 2regledajte odabit kako bi se uvjerili da ne postoji nema visoko bodovana varijabla
koja bi trebala biti iskljuena ako nije dovoljno konceptualno bliska ovim sto su
ukljueni.
-. 2regledajte svoj konaan odabit da vidite da su konceptualno slini
2odaci su pogodni za faktorsku analizu%
8 ,eliina uzorka od namanje +. do najmanje +..
8 1mjer veliine uzorka s obzirom na br. varijabli% od 3%1 do +.%1
8 Dorelacija ne smije biti manje od ..+
8 Vartlettov test sfernosti bi trebao biti statistiki znaajan
'0
8 Daiser8(aUer81lkin mjera uzorkovanja mora biti ..- ili vi"e (maa 1)
'3

You might also like