You are on page 1of 19

Statistika: znanstvena metoda, skup metoda i postupaka za ureivanje,

analizu i grafiko prikazivanje velike koliine podataka.

Guilfford:Statistika prua nenadmana sredstva za pretvaranje kaosa u


savren red.
-Guilford (1968) navodi kako je
ovladavanje statistikim metodama i statistikim nainom miljenja vano
u znanstvenim istraivanjima jer:
1* omoguava precizan opis istraivanih pojava
2* prisiljava znanstvenika da bude egzaktan u svojim postupcima i
razmiljanjima
3* omoguava saeto izraavanje
rezultata istraivanja i njihov pregledan prikaz
4*
omoguava izvoenje opih zakljuaka, odnosno generaliziranje zakljuaka
dobivenih na uzorku populacije koje je uzorak reprezentant
5* omoguava predvianje istraivane pojave
6* omoguava ureivanje uzrono-posljedinih odnosa, odnosno inilaca
odgovornih za nastajanje neke pojave.

-Statistike metode dijelimo: opom podjelom, s obzirom na vrstu varijablimjernu skalu(ljestvicu), prema broju varijabli i s obzirom na ciljnu
usmjerenost.

Statistike metode:
a) Metode deskriptivne statistike: statistiki postupci grupiranja i
grafikog prikazivanja podataka te izraunavanja razliitih statistikih
pokazatelja kojima se opisuje promatrana pojava (mjere centralne
tendencije, mjere varijabilnosti, mjere disperzije itd) Zakljuci dobiveni
unutar ove statistike odnose se na grupu ispitanika
b) Metode inferencijalne statistike: statistiki postupci kojima se na
temelju rezultata dobivenih na uzorku proiruju zakljuci na populaciju koje
je uzorak reprezentant. (t- test, univarijantna analiza varijance,
multivarijantna analiza varijance itd)
Statistike metode s obzirom na vrstu varijable:
a) Neparametrijske metode: koriste se za obradu podataka prikupljenih
na kvalitativnim mjernim ljestvicama (nemogue je utvrditi aritmetiku
sredinu i standardnu devijaciju, npr. Wilcoxonov test, medijan test)
b) Parametrijske metode: za obradu normalno distribuiranih podataka
prikupljenih na kvantitativnim mjernim ljestvicama (mogue utvrditi
statistike parametre, npr. t-test, regresijska i faktorska analiza)
Prema broju varijabli:
a) Univarijatne metode: za analizu podataka jedne varijable te testiranje
hipoteza koje se odnose na tu varijablu
b) Multivarijatne metode: za analizu podataka dviju ili vie varijabli uz
uvaavanje njihova odnosa
S obzirom na ciljnu usmjerenost kineziolokih istraivanja:
a) Deskriptivne metode: koriste se za opis varijabli (mjere centralne
tendencije, mjere disperzije)
b) Komparativne metode:
1. metode za utvrivanje razlika: utvrivanje razlika izmeu dviju ili vie
grupa ispitanika koje su opisane jednom varijablom
2. metode za utvrivanje relacija: utvrivanje relacija izmeu jedne ili vie

nezavisnih varijabli i jedne kriterijske varijable, te za utvrivanje relacija


izmeu dvaju skupova
3. metode za klasifikaciju: grupiranje entiteta ili varijabli u manji broj
homogenih skupina ili za utvrivanje manjeg broja varijabli iz nekog skupa
meusobno povezanih manifesnih varijabli
OSNOVNI STATISTIKI POJMOVI

Podatak: kvantitativne ili kvalitativna vrijednost kojom je opisano


odreeno obiljeje nekog objekta, stvari, osobe, pojave itd. (entiteta),
podaci variraju zato i postoji statistika!
Entitet: jedinka nekog skupa osoba, objekata, stvari, pojava koja je
opisana odreenim obiljejima ili varijablama (ljudi, ekipe, elementi, zadaci
u igri)
Populacija entiteta: skup svih entiteta ija su obiljeja predmet
statistike analize (statistiki skup)
- moe biti beskonaan (ako se proces ponavlja beskonano mnogo putabacanje novia ili konaan- pojmovno, prostorno i vremensko- studenti 1.
god kifa sk god 2014/2015)
Podskup entiteta izabran iz populacije u skladu s nekim pravilom naziva se
uzorak entiteta (ako je uzorak dobar reprezentant onda se rezultati
dobiveni na uzorku proiruju na populaciju)
Uzorak: namjeran-prigodan(lako dostupan entitet) ili sluajan
- uzorak e biti dobar reprezentant ako je za svaki entitet jednaka
vjerojatnost da budu izabrani; pogreka procjene biti e manja to je
efektiv uzorka blii broju entiteta u populaciji
SLUAJNI UZORAK:
a) jednostavni sluajni uzorak: svakom entitetu osiguramo jednaku
vjerojatnost izbora (randnom, bubanj za loto)
b) intervalni uzorak: svi entiteti se poredaju te se nakon sluajnog izbora
prvog entiteta bira svaki n-ti entitet (entiteti su nesistematski poredani)
c) stratificirani uzorak: populacija se dijeli prema vanim obiljejima
(spol, dob) u slojeve iz kojih se sluajno biraju entiteti; broj entiteta iz
svakog sloja mora biti proporcionalan veliini pojedinog sloja u populaciji
d) grupni uzorak: iz neke populacije sluajno se biraju cijele grupe (npr.
srednjokolci u nekoj dravi, sluajno se bira uzorak kole)
Varijabla: odreeno svojstvo, osobina, sposobnost po kojem se entiteti
meusobno razlikuju.
- alternative: kada se varijable mogu pojaviti u vie oblika (npr. spol M/,
ocjene dovoljan/dobar); podaci mogu imati jednaka obiljeja (studenti kifa),
ali se razlikuju po drugim varijablama
Varijable:
a) KVALITATIVNE/KATEGORIJALNE: izraavaju se nenumerika obiljeja;
nominalne i ordinalne (redoslijedne)
1. Nominalne: vrsta mjerne skale koja odreuje pripadnost grupi (M/)
2. Ordinalne: nema kontinuiteta, svojstvo redoslijednosti (zlato, srebro,
bronca), ne znamo za koliko je netko bolji od drugoga, ne rauna se
aritmetika sredina

b) KVANTITATIVNE: numeriki izraavaju stupanj razvijenosti nekog


svojstva, dobivene su mjerenjem obiljeja entiteta intervalnom i omjernom
mjernom ljestvicom
- mogu biti:
1. Intervalne: ima svoj kontinuitet, svojstvo intervalnosti (vrijednosti na
skali su jednako udaljeni Temperatura), nula je dogovorena, relativna
(visina, dubina)
2. Omjerna: nema relativne nule, ve je apsolutna (brzina gibanja tijelanema nule; struja, toperica)
3. Diskretne varijable: izraavaju konaan broj vrijednosti mjernog
svojstva (prebrojavanje; broj sklekova, broj skokova)
4. Kontinuirane varijable: poprimaju bilo koju numeriku vrijednost
(mjerenjem; mjerenje vremena, koliine, udaljenosti- cjelobrojni ili
decimalni)
Populacija varijabli: skup svih moguih varijabli kojima se moe opisati
stanje entiteta
Podskup varijabli: izabran je iz populacije varijabli (uzorak varijabli)
* postoje jo i varijable u regresijskoj analizi: zavisne (kriterijske)
varijacije se objanjavaju na temelju nezavisnih varijabli; i nezavisne
(prediktorske)- na temelju njih se objanjavaju varijacije zavisne varijable
Matrica podataka
X=E(entitet)xV(skup varijabli)
-tablica podataka(redak ispitanici,stupac podaci)
- skup podataka dobivenih opisom skupa entiteta nekim skupom varijabli,
smjetenih tako da svaki redak sadri podatke kojima je pojedini entitet e
opisan s m varijabli, dok svaki stupac sadri podatke n entiteta u pojedinoj
varijabli v.

OSNOVNI POSTUPCI ZA UREIVANJE I PRIKAZIVANJE PODATAKA

Faza prikupljanja podataka: precizan opis predmeta istraivanja,


odreivanje ciljeva, definiranje populacije entiteta, izrada plana itd.
Nakon faze prikupljanja slijedi statistika obrada.
Entiteti (broj redaka), varijabla (broj stupaca)
Kodiranje podataka: koristi se u svrhu breg i tonijeg unosa podataka,
to je pridruivanje skraene oznake ili broja nekoj kategoriji. Potrebno je
izraditi kodnu listu.
Grupiranje podataka: postupak ureivanja podataka, razvrstavanje
entiteta s istim oblikom obiljeja u odreen broj disjunktnih podskupova .
Grupiraju se svi entiteti, ali svaki entitet moe biti lan samo jednog
podskupa
Podaci se ureuju grupiranjem/razvrstavanjem podataka prema oblicima
mjernog svojstva
Frekvencija: broj entiteta koji pripadaju istoj kategoriji. (zbroj frekvencija
svih grupa jednak je ukupnom broju entiteta)

Relativna frekvencija: omjer izmeu frekvencije odreene kategorije i


zbroja frekvencije svih kategorija. Izraava se u postotku ili proporciji
(ukazuje na zastupljenost odreene pojave u odnosu na cjelinu)
Jednodimenzionalno grupiranje: kada se entiteti grupiraju po jednom
obiljeju (spol)
Viedimenzionalno grupiranje: grupiranje na temelju vie obiljeja (spol
i znanje npr)
Kvalitativni podaci se grupiraju tako da se entiteti razvrstaju u odreeni
broj kategorija
Grupiranje kvalitativnih podataka se prikazuje putem grafikona stupaca,
redaka i strukturnog kruga.
a) grafikon stupaca:povrinski grafikon, na osi x (obiljeja), y (frekvencije)
visina odreena frekvencijom
b) grafikon redaka: povrinski grafikon, x (frekvencije), y (obiljeja)
duljina odreena frekvencijom
c) strukturni krug: prikaz relativnih frekvencija
Grupiranje kvantitativnih podataka:
1. Sortiranje (uzlazno ili silazno) mjerenje rezultata prema redoslijedu
ovisno o rezultatu
a) uzlazno: od najmanje do najvee vrijednosti
b) silazno: od najvee do najmanje
- omoguava uoavanje najmanje vrijednosti i najvee vrijednosti
TOTALNI RASPON (R= xmax- xmin)
2. Grupiranje: razvrstavanje entiteta u podskupove prema vrijednostima
kvantitativnog obiljeja i to da jedan podskup ine entiteti s jednom
vrijednosti kvantitativnog obiljeja
- broj entiteta s istom vrijednosti naziva se frekvencija grupe
- ureeni niz s pripadajuim frekvencijama je distribucija frekvencija
Distribucija frekvencija prikazuje se putem histograma i poligona
frekvencija
a) Histogram: grafiki prikaz u kojemu visina numerikih vrijednosti
obiljeja ovisi o veliini frekvencije
b) Poligon: linijski prikaz frekvencije koji nastaje spajanjem toaka iji je
poloaj odreen numerikom vrijednou i veliinom frekvencije (bolji je
kada elimo usporediti dvije ili vie distribucije frekvencija)
Ako varijabla ima veliki broj pojavnih oblika ili je kontinuirana onda se
podaci grupiraju u manji broj razreda.
Za uspjeno grupiranje potrebno je odrediti prikladan broj razreda i njihovu
veliinu (interval)
Ako se frekvencije svakog sljedeeg razreda zbroje sa sumom dobije se
KUMULATIVNA FREKVENCIJA
Kumulativne frekvencije: prikazuju koliko je entiteta kojima je vrijednost
jednaka ili manja od gornje granice razreda ija je frekvencija ula u
kumulativni niz

DESKRIPTIVNI POKAZATELJI (koriste se za opis varijabli) mjere centralne


tendencije (sredinje mjere), mjere varijabilnosti (disperzije), mjere asimetrije i
izduenosti distribucije
1. Mjere centralne tendencije
vrijednost statistikog obiljeja oko koje se grupiraju podaci statistikog
niza/ svaka od njih predstavlja jednu vrijednost koja je zamjena za skup
svih pojedinanih vrijednosti, odnosno ona je njihov reprezentant.
- pokazuju na vrijednost koja ima najeu vjerojatnost pojavljivanja
a) potpune: izraunavaju se na temelju svih podataka (aritmetika
sredina, geometrijska sredina i harmonijska sredina)
b) poloajne: odreeni su poloajem u ureenom nizu podataka (mod i
medijan)
Aritmetika sredina: omjer zbroja svih vrijednosti neke varijable i
ukupnog broja entiteta
- najee koritena srednja vrijednost
- rauna se za grupirane i negrupirane podatke, rauna se samo za
kvantitativne vrijednosti
zbroj odstupanja vrijednosti svih pojedinanih rezultata od aritmetike
sredine jednak je nuli
zbroj kvadriranih odstupanja svih pojedinanih vrijednosti od aritmetike
sredine jednak je nuli
aritmetika sredina uvijek se nalazi izmeu minimalne i maksimalne
vrijednosti
ako neki niz sadri ekstremno male ili velike vrijednosti tada aritmetika
sredina nije reprezentativna
Jednostavna linearna kombinacija: nova varijabla koja je nastala
zbrajanjem drugih varijabli
Diferencijalno ponderirana kombinacija: nova varijabla (vektor) nastaje
zbrajanjem produkata drugih varijabli sa skalarima
Mod ili dominantna vrijednost: vrijednost kvalitativne ili kvantitativne
varijable koja je najvee frekvencije (dijeli distribuciju na rastui i padajui
dio)
- ukoliko se radi o distribuciji frekvencija s jednakim veliinama razreda,
modalni razred je onaj s najveom frekvencijom, a ako su razredi
nejednaki, modalni razred je onaj s najveom korigiranom frekvencijom
Korigirana frekvencija: rauna se kada su razredi razliitih veliina
apsolutna frekvencija podijeljena s veliinom razreda (kae nam kolika bi
bila zastupljenost pojave u odreenom razredu da su svi razredi jednake
veliine)
Medijan ili centralna vrijednost: vrijednost koja ureen niz podataka
dijeli na dva jednaka dijela. Mogue je odreivati za grupirane i
negrupirane podatke i za ordinalne, kvalitatine i diskretne i kontinuirane
varijable
- postupak odreivanja medijana kod NEGRUPIRANIH PODATAKA:
1. poredamo ih po veliini od najmanjeg do najveeg
2. za niz s neparnim brojem podataka medijan je vrijednost sredinjeg
lana niza

za niz s parnim brojem podataka, medijan je poluzbroj dva sredinja


lana niza
(zbroj/2 ; r1=N/2 ; r2= N/2 + 1; Me= x1+x2/2)
- postupak odreivanja kod GRUPIRANIH PODATAKA:
1. napravimo kumulativni niz
2. odrediti kumulativne frekvencije tog niza u kojoj se nalazi sredinji lan
to je medijalni razred
3. uvrstiti vrijednost u formulu (suma od fi je zbroj frekvencije do
medijalnog razreda; kumulativna frekvencija ispred kumulativne
frekvencije medijalnog razreda)
Medijan i mod nisu pod utjecajem ekstremno visokih ili niskih rezultata,
pa su bolja mjera centralne tendencije za asimetrino distribuirane
varijable.
2. Mjere varijabilnosti ili disperzije (rasprenosti)
opisuju razliitost podataka unutar jednog statistikog niza, a o tome ovisi
tumaenje odreene pojave. (kad bi svi podaci bili jednaki, ne bi bilo
varijabilnosti, a tendencija grupiranja rezultata bila bi maksimalna)
- koliko se u prosjeku rezultati entiteta razlikuju / veliina meusobnog
razlikovanja rezultata u nekoj varijabli
- tako npr. bilo koja srednja vrijednost ne moe sama opisati raspored
podataka unutar jednog ili vie nizova
Stupanj varijabilnosti odreuje se razliitim mjerama rasprenosti koje
mogu biti iskazane u mjernim jedinicama (cm, kg, kn) i u relativnom broju
(%)
Mjere rasprenosti temeljene na dijelu podataka: raspon varijacija,
interkvartilni raspon i koeficijent kvartilne devijacije
Mjere temeljene na svim podacima: varijanca, standardna devijacija i
koeficijent varijacije
Totalni raspon jednak je razlici najvee i najmanje vrijednosti numerikog
obiljeja
- iskazuje se u mjernim jedinicama, a s obzirom da zavisi od maksimalnog i
minimalnog podatka ekstremni rezultati utjeu na njegovu vrijednost!
- raspon je nesigurna mjera varijabilnosti jer se poveanjem broja entiteta
poveava i totalni raspon
Kvartili su vrijednosti obiljeja koje statistiki niz dijele na 4 jednaka dijela
- donji kvartil (Q1)- lanove niza ureenog prema veliini dijeli na dva
jednaka dijela pri emu je u prvom dijelu etvrtina lanova jednaka ili
manja od Q1, a tri etvrtine ine obiljeja ije su vrijednosti jednake ili vee
od Q1
- gornji kvartil (Q3)- lanove niza ureenog prema veliini dijeli na dva
jednaka dijela pri emu je u prvom dijelu tri etvrtine lanova jednako ili
manje od Q3, a u jednoj etvrtini lanova je jednako ili vee od Q3
Raunanje kvartila negrupiranih podataka:
1. prvo poredamo lanove niza po veliini, odredimo koji je po redu lan
nositelj Q1 i Q3 vrijednosti
rQ1= n/4 (n je broj entiteta) 25% lanova niza ima vrijednost manju od
Q1, a 75% lanova niza ima vrijednost veu od Q1

rQ3=3*n/4 75% lanova niza ima vrijednost manju od Q3, a 25% lanova
niza ima vrijednost veu od Q3
- svrha raunanja kvartila je identificirati ekstremno velike i male
vrijednosti niza (i vidjeti njihov utjecaj na istraivanje)
Raunanje kvartila grupiranih podataka:
1. formiramo kumulativni niz, odredimo kvartilni razred
Interkvartili: mjera rasprenosti koja eliminira 25% najmanjih i najveih
lanova niza gdje za analizu ostaju 50% sredinjih lanova niza
- razlika izmeu treeg i prvog kvartila
Q= Q3-Q1
Koeficijent kvartilne devijacije je omjer interkvartila i zbroj kvartila, i
uvijek poprima vrijednost izmeu 0 i 1
K= Q3-Q1 (Q) / Q3+Q1
Varijanca je prosjeno kvadratno odstupanje rezultata od aritmetike
sredine
- temeljem odstupanja mogue je izraunati mjeru varijabilnosti jer vea
odstupanja ukazuju na veu rasprenost podataka
- stupanj varijabilnosti podataka mogue je iskazati putem aritmetike
sredine izraunatih odstupanja, ali takva operacija kao rezultat daje 0 jer
zbog odstupanja od aritmetike sredine jednak je 0
- kako je varijanca prosjeno kvadratno odstupanje oteano je
interpretiranje, pa raunamo standardnu devijaciju (potrebno je iz
varijance izraunati korijen)
Standardna devijacija je prosjeno odstupanje vrijednosti numerikog
obiljeja od aritmetike sredine, koje je iskazano u istim mjernim
jedinicama kao i obiljeje.
- izraunamo aritmetiu sredinu, izraunamo razliku izmeu vrijednosti
svakog elementa kupa i aritmetike sredine, to kvadriramo i zbrojimo
Ako elimo raunati standardnu devijaciju za neki uzorak entiteta onda se
rauna s nazivnikom n; a ako govorimo o populaciji onda je nazivnik n-1
Koeficijent varijacije je omjer standardne devijacije i aritmetike sredine
pomnoen sa 100 (koliki % vrijednosti aritmetike sredine iznosi
standardna devijacija)
postotno prosjeno odstupanje obiljeja od aritmetike sredine
Mjere asimetrije distribucije (Skewness)
-koeficijent asimetrije distribucije, rauna se kao omjer treeg
momenta oko sredine i standardne devijacije podignute na treu potenciju
-ako je koeficijent asimetrije a3>0 distribucija je pozitivno asimetrina, a
ako je koeficijent asimetrije a3<0 onda je negativno asimetrina
- ako je a3=0 distribucija je simetrina
- ako su frekvencije rezultata u nekoj varijabli ravnomjerno raspodijeljene
lijevo i desno od prosjene vrijednosti = Simetrina distribucija
podataka (medijan, mod i aritmetika sredina jednake su vrijednosti,
imaju samo jednu modalnu vrijednost) Gausova distribucija
- Standardnom devijacijom ponitava se utjecaj mjerne jedinice, tj
izraunati koeficijent asimetrije kree se u intervalu od -2 do +2

- kod asimetrinih podataka aritmetika sredina nee biti najbolja mjera


centralne tendencije jer ne predstavlja najvei broj entiteta (najvjerojatniji
rezultat)
- ako frekvencije rezultata nisu ravnomjerno rasporeene od prosjene
vrijednosti tada se govori o pozitivno ili negativno asimetrinoj
distribuciji podataka
- ako se veina entiteta grupirala u zoni niih vrijednosti s nekolicinom
ekstremno visokih vrijednosti, takva se distribucija zove pozitivno
asimetrina (mjere centralne tendencije nisu jednake, najveu vrijednost
ima aritmetika sredina, pa medijan, pa mod)
- kod negativno asimetrine grupiranje entiteta je u zoni viih
vrijednosti, a manjim brojem entiteta u niskim vrijednostima (aritmetika
sredina je najmanja, pa medijan, pa mod)
Mjere izduenosti distribucije (Kurtosis)
-stupanj spljotenosti, odnosno izduenosti distribucije, a rauna se kao
omjer etvrtog momenta oko sredine (m4) i standardne devijacije
podignute na etvrtu potenciju
- ove mjere ukazuju na veu homogenost i heterogenost podataka
- ako je koncentracija frekvencija oko odgovarajue sredinje vrijednosti
vea od teoretske distribucije tada je vrh distribucije vii od vrha normalne
distribucije.
- to je koncentracija frekvencija oko sredite vrijednosti manja, to je vrh
distribucije nii od normalne distribucije.
- ako je a4=3 distribucija je mezokurtina- normalna
a4>3 distribucija je leptokurtina- izduena (visoka, a uska
mala stand. dev)
a4<3 distribucija je platikurtina spljotena (niska, a iroka
visoka heterogenost)
3. Empirijske i teoretske distribucije
Distribucija frekvencije je ureen niz kumulativnih vrijednosti s
pripadajuim frekvencijama
Empirijske distribucije su dobivene na stvarnim entitetima
Teoretske distribucije opisane su matematikom!
Teoretske distribucije zadane su matematikom formulom (predstavljaju
matematike funkcije) te omoguavaju utvrivanje vjerojatnosti nekog
sluajno dogaaja u zadanim uvjetima.
- kako podaci mogu imati diskretna (konaan broj i cijeli broj) i kontinuirana
(bilo koja vrijednost) mogue je razlikovati diskretne (uniformna
distribucije, binomna distribucija, Poissonova distribucija) i kontinuirane
(normalna, t-distribucija, F-distribucija) teoretske distribucije.
Poissonova distribucija: /distribucija rijetkih dogaaja
ona aproksimira binomnu distribuciju za velike vrijednosti (npr. n>50) i
male vrijednosti (p<0,05) i predstavlja njen ekstreman sluaj
* binomna distribucija: neka varijabla ima ovu distribuciju s parametrima n
i p gdje je f(x) vjerojatnost za uspjene ishode od n svih moguih ishoda
koje moe imati sluajna varijabla, a p je vjerojatnost uspjenog ishoda, a q
je vjerojatnost neuspjenog ishoda

Ime je dobila po francuskom matematiaru Simeonu Poissonu


- oblik poissonove distribucije ovisit e od veliine parametra poissonove
distribucije (n-ukupan broj opaanja, p je vjerojatnost ishoda)
- kako sluajna varijabla ne moe imati vrijednost manje od nule,
poveanjem parametra distribucija tei simetrinosti
Normalna ili Gausova distribucija:
- kontinuirana teoretska distribucija koja je najee koritena
- definirao ju je Carl Friedrich Gauss
- zvonastog je oblika, unimodalna je i zrcalno simetrina u odnosu na
aritmetiku sredinu
- izgled joj ovisi o standardnoj devijaciji i aritmetikoj sredini (njih ne
znamo, moramo ih izraunati)
- najvia toka je najvea frekvencija; Medijan, Mod i Aritmetika sredina
su u istoj toki, krajevi se proteu od beskonano do + beskonano;
povrinu ispod krivulje nazivamo vjerojatnosti pojavljivanja nekih dogaaja
- rezultati koji se nalaze van -3 i +3 su ekstremno loi ili dobri
- vjerojatnost pojavljivanja rezultata unutar Gausove krivulje iznosi 100%
(od do + beskonano)
- u intervalu od 1 +,- (standardne devijacije) oko aritmetike sredine
uzorka nalazi se 68,27% svih rezultata
- u intervalu od +,- 2 (stan. dev) oko aritmetike sredine vjerojatnost
pojave rezultata je 95,45%
- u intervalu od +,- 3 oko aritm. sredine vjerojatnost pojave rezultata je
99,73%
- +,- 3 i vie je 0,27% ili 0,135% (ako gledamo samo jednu stranu)
- krajevi krivulje nikada ne dodiruju x os, ali se sputaju prema njoj
- ako je netko bolji od 0 ili loiji od 0 (prosjeka) iznosi 50% (SVE SKUPA JE
100%)
- oblik empirijske distribucije opisuje se mjerama aismetrije i izduenosti
distribucije
- veliina odstupanja empirijske distribucije od normalne moe se testirati
KS tesom i W testom.
Studentova t distribucija
- definirao ju je William Gosset i objavio u asopisu Biometrika pod
pseudonimom Student 1908.
- ima oblik slian normalnoj distribuciji
- to je vie stupnjeva slobode, t distribucija pribliava se standardiziranoj
normalnoj distribuciji, sa smanjenjem stupnjeva slobode poprima iri oblik
* broj stupnjeva slobode: broj entiteta umanjen za broj parametara (n-k)
- 5 stupnja slobode: + - 2,57 st. dev
- 10 stupnja slobode: + - 2,23 st dev
- 100 stupnja: + - 1,97 st dev
Snedercova f distribucija
- definirao ju je George W Snedecor na temelju radova R. A. Fishera (simbol
F)
- kontinuirana funkcija vjerojatnosti sluajne varijable definirana u intervalu
(0, + beskonano)

- funkcija zavisi o parametrima df1 i df2 (stupnjevi slobode)


- distribucija je unimodalna i pozitivno asimetrina
- s malim brojem stupnjeva lobode ima izraenu pozitivnu asimetriju, a s
poveanjem broja stupnjeva slobode asimetrinost se smanjuje
Hi distribucija (kvadrat distribucija)
- funkcija ovisi o parametrima stupnjeva slobode. Za mali broj stupnjeva
slobode distribucija ima jako izraenu pozitivnu asimetriju, a s poveanjem
broja stupnjeva slobode tei simetrinosti

KS TEST

U svakom istraivanju se utvruje da li empirijske distribucije statistiki


znaajno odstupaju od normalne distribucije
-ako su odstupanja mala onda su ona proizvod sluajno variranja entiteta u
uzorcima i ne smatraju se znaajnima, ali ako su odstupanja neke
empirijske distribucije toliko velika tada se smatraju znaajnima.
Kolmogorov Smirnovljev test je postupak za utvrivanje normaliteta neke
empirijske distribucije (KS test)
- temelji se na usporedbi empirijskih relativnih frekvencija i teoretskih
kumulativnih frekvencija
- potrebno je:
a) odrediti prikladan broj razreda i njihovu veliinu, te grupirati entitete
b) na temelju grupiranih podataka izraunati empirijske kumulativne i
relativne kum. fr
c) na temelju AS i ST DEV standardizirati gornje granice svakog razreda
d) uz pomo tablice povrine ispod normalne distribucije, izraunati
povrinu od lijevog kraja do odreene z vrijednosti
e) izraunati odstupanja izmeu empirijske i teoretske relativne
kumulativne fr.
f) odrediti odstupanja i usporediti ih sa tablinom vrijednou (ako je
najvee odstupanje izmeu empirijske i teoretske relativne kumulativne
frekvencije manje od kritine vrijednosti, onda odstupanje nije statistiki
znaajno uz pogreku p)

TRANSFORMACIJE PODATAKA
- kvalitativne podatke tee je mijenjati od kvantitativnih
1. Rangiranje: transformacija kvantitativne varijable u ordinalnu, odnosno
zamjena rezultata odgovarajuim rangovima
Rang: redni broj entiteta utvren sortiranjem prema nekoj kvantitaivnoj
varijabli. Uobiajeno je da se najbolji rezultat zamjenjuje rangom 1.
Sukladno tome rang se entiteta u normalno skaliranim varijablama
utvruje silaznim sortiranjem, a u obrnuto skaliranim uzlaznim sortiranjem.
Normalno skalirana varijabla: je varijabla u kojoj najvea nurmerika
vrijednost predstavlja najbolji rezultat (skok u vis)
Obrnuto skalirana varijabla: varijabla u kojoj najmanja numerika

vrijednost predstavlja najbolji rezultat (sprint 100 metara, plivanje 100 m


itd) primjenjuje se toperica
2. Centili: relativni rang, a izraunava se kao postotni udio ranga nekog
entiteta u ukupnom broju entiteta u uzorku. Centil nekog rezultata
pokazuje koliko % entiteta u uzorku ima jednak ili loiji rezultat
( CENTIL=n+1 RANG entiteta / n *100)
3. Standardizacija podataka (z vrijednosti)
- za prikupljanje podataka na nekom uzorku entiteta koriste se razliiti
mjerni instrumenti, pa su i rezultati izraeni u razliitim mjernim
jedinicama.
- to je zapravo transformacija originalnih rezultata u z vrijednost.
Standardizirani rezultat ili z vrijednost je odstupanje rezultata entiteta od
aritmetike sredine izraeno u dijelovima standardne devijacije.
- znai rezultat koji dobijemo formulom znai za toliko standardnih
devijacija je neto vee ili manje od prosjeka
- z vrijednost = 0 kada je netko prosjean STANDARDIZIRANI REZULTAT
- to je z vrijednost vea, to je on bolji od prosjeka i obrnuto
- ko netko ima od -1 do 1 on se nalazi u 60% prosjeka
- ako je od 2 do 3 vii je od prosjeka
- izmeu -3 i + 3 (sve iznad i ispod je nadprosjeno dobro ili loe)
Formula:
zij = standardizirani rezultat entiteta i u varijabli j
xij= originalna vrijednost ispitanika i u varijabli j
xj= aritmetika sredina varijable j
oj= standardna devijacija varijable j
1. Izraunati aritmetiku sredinu i standardnu devijaciju za svaku varijablu
2. Transformirati originalne podatke u z vrijednosti
3. Varijable koje su obrnuto skalirane pomnoimo s (-1), tj. promijenimo im
predznak
4. Kondenzirati standardizirane vrijednosti aritmetikom sredinom, tj.
izraunamo prosjenu z vrijednost za svaki entitet
5. Poredati entitete po izraunatoj prosjenoj z vrijednosti.
korist od standardizacije rezultata je i mogunost grafikog prikazivanja
rezultata entiteta u veem broju varijabli koje opisuju njegov antropoloki
profil (stanje treniranosti)

PROCJENA ARITMETIKE SREDINE POPULACIJE

znanstvena istraivanja provode se na uzorcima, a doneseni zakljuci se


proiruju na populaciju koju odabrani uzorak reprezentira. Rezultati mogu
biti manje ili vie razliiti od rezultata koje bismo dobili na cijeloj populaciji.
Bolja reprezentativnost = sigurniji zakljuci.
Uzorci mogu biti namjerni (oni iji su entiteti birani prema subjektivnom
stavu istraivaa/ prigodni uzorak) i sluajni (svi imaju istu mogunost biti
odabrani)

- pogreka procjene za cijelu populaciju biti e manja, to je broj entiteta


uzorka blii populaciji i u kome svi imaju jednaku vjerojatnost izbora
Izraunati parametri dobiveni na velikom broju uzoraka ne moraju biti
jednaki parametru populacije jer su izraunati na podskupu populacije.
(neki parametar populacije procjenjuje se na temelju istog parametra na
nekom sluajnom uzorku)
Ako iz neke populacije odaberemo sve mogue uzorke veliine n te za
svaki uzorak izraunamo parametar dobit emo distribuciju po kojoj e
parametri varirati. Uzorci su birani sluajno pa i vrijednost parametara
sluajno variraju.
Distribucija vjerojatnosti prema kojoj sluajna varijabla varira naziva se
sampling distribucija koja odgovara nekim distribucijama vjerojatnosti
(Gausova, T, F) i mogue je odrediti interval u kome se nalazi parametar
populacije
Ako nekoj populaciji izraunamo aritmetiku sredinu i standardnu devijaciju
i iz te populacije odaberemo uzorak od nekoliko entiteta aritmetika
sredina tog uzorka biti e slina, ali ne i ista aritmetikoj sredini populacije.
- aritmetike sredine sluajnih uzoraka variraju, aritmetika sredina
aritmetikih sredina sluajno odabranih uzoraka jednake veliine tendirat
e aritmetikoj sredini populacije, distribucija aritmetikih sredina sluajno
odabranih uzoraka iste veliine biti e normalna, tj Gausova)
Ako nastavimo s uzimanjem sluajnih uzoraka no sada uzmemo neto vie
entiteta u jedan uzorak aritmetika sredina uzoraka varirat e manje jer je
uzorak reprezentativniji, tj blii je populaciji.
- to znai da e krivulja biti ua (dolazi do Gausove krivulje), tj imati e
manju standardnu devijaciju. s poveanjem uzorka, smanjuje se
vjerojatnost sluajnog odstupanja od AS populacije
Standardna devijacija aritmetikih sredina sluajnih uzoraka biti
e manja to je broj entiteta vei.
Standardna devijacija aritmetikih sredina sluajnih uzoraka osim o
entitetu ovisi i o varijabilnosti mjernog obiljeja (varijable) u populaciji. to
je varijabilnost obiljeja u populaciji vea, to e i aritmetike
sredine sluajnih uzoraka varirati.
*** populacijsku aritmetiku sredinu dobivamo tako da zbrojimo sve
aritmetike sredine i podijelimo s populacijom
- kada bi raunali aritmetiku sredinu aritmetikih sredina sluajno
odabranih uzoraka dobili bi aritmetiku sredinu populacije, a distribucija bi
bila normalna
- distribucija dovoljno velikih uzoraka (vie od 30) jednake veliine teit e
normalnoj i u sluajevima kada distribucija populacije nije normalna
Centralni granini teorem
Standardna devijacija aritmetikih sredina sluajno odabranih uzoraka
naziva se standardna pogreka aritmetike sredine i kljuna je za
procjenu aritmetike sredine populacije putem standardne devijacije
uzorka
- govori nam koliko variraju aritmetike sredine sluajnih uzoraka

oko populacijske aritmetike sredine


- aritmetika sredina populacije nalazit e se u intervalu od + - 3 od bilo
koje aritmetike sredine uzorka s priblinom vjerojatnou od 99%, i u
intervalu od + - 2 s priblinom vjerojatnou od 95%
- ako odstupanja aritmetikih sredina uzorka podijelimo sa
standardnom pogrekom aritmetike sredine dobijemo
standardizirana odstupanja AS uzorka od AS populacije
- pogreke su 1 ili 5 %, pa e z biti u intervalu od + - 1,96 u 95% sluajeva,
odnosno u + - 2,58 u 99% sluajeva
- to je standardna devijacija uzorka vea, to e pogreka biti vea
- to je broj entiteta u uzorku vei to e pogreka biti manja
Interval u kojemu se nalazi aritmetika sredina populacije:
x= aritm. sredina uzorka
sx= standardna pogreka aritm. sredine
tp= vrijednost koja se za pogreku p i odreeni broj stupnjeva slobode
odredi na temelju Studentove t distribucije.
- pogreka je najee 0,01 ili 1% i 0,05 ili 5%
- stupnjevi slobode su broj nezavisnih informacija sa kojima ulazimo u
analizu (broj entiteta)
- rezultat intervala su 2 vrijednosti gornja i donja granica intervala u kojoj
oekujemo populacijsku aritmetiku sredinu
- izgled T distribucije ovisi o stupnjevima slobode
- na variranje ovisi broj entiteta i varijabilnosti
- kako broj stupnjeva slobode (df) raste, tako i izgled T distribucije eli
dosei Gausovu krivulju (raste i suzuje se)
- interval je ui to je pogreka vea, a iri to je pogreka manja
- kako smanjujemo interval, pogreka raste

STUDENTOV T TEST (infrenecijalna statistika)


- u okviru infenrecijalne statistike statistikim testom se testiraju statistike
hipoteze o veliini odreenog statistikog parametra populacije na temelju
sluajnog uzorka
-hipoteze proizlaze iz znanstvenog problema koji elimo istraivati
svrhovitost: hipoteza treba biti u funkciji postizanja odreenog cilja istraivanja
provjerljivost: hipotezu treba postaviti tako da ju je mogue provjeriti
plodotvronost: hipoteza treba omoguiti donoenje plodotvornih zakljuaka u
odnosu na istraivani problem
jednostavnost i suglasnost: hipoteza treba biti u skladu s postojeim znanjima i
trebaju biti jasno i precizno formulirane
- testiranje hipoteza temelji se na odgovarajuoj teoretskoj distribuciji (sampling
distribuciji)

Osmislio ga je Wiliam Sealy Gosset- Student, njime se utvruje statistika


znaajnost razlike izmeu dviju aritmetikih sredina
- slui za utvrivanje statistikih znaajnih razlika izmeu grupa entiteta na
osnovi jedne varijable

** statistiki znaajna razlika: nije se dogodilo sluajno tu razliku


utvrujemo sa stupnjem sigurnosti (95 ili 99% , odnosno mogue su
pogreke od 1 ili 5%)
- razlika koja je posljedica stvarnih razlika izmeu populacija kojima uzorci
pripadaju, a ne sluajnog variranja uzoraka; ona je vea od razlike koja se
moe dobiti sluajnim variranjem
T- test za nezavisne uzorke: postupak kojim se utvruje statistika
znaajnost razlike izmeu aritmetikih sredina dvaju uzoraka (dva
nezavisna skupova entiteta)
- hipoteze su dvije: nulta i alternativna
nulta hipoteza H0: x1=x2 ( uz pogreku p ne moemo tvrditi da je
razlika izmeu aritmetikih sredina analiziranih uzoraka statistiki
znaajna)
alternativna hipoteza H1: x1=x2 (razlika izmeu aritmetikih sredina
analiziranih uzoraka je statistiki znaajna uz pogreku p)
T-test za zavisne uzorke: postupak kojim se utvruje statistika
znaajnost razlike izmeu aritmetikih sredina jednog uzorka mjerenog u
dvije vremenske toke (tj. jedna grupa mjerena dva puta) inicijalno i
finalno stanje npr. u teini
- nulta hipoteza H0: x1=x2 (uz pogreku p ne moemo tvrditi da je
razlika izmeu aritmetikih sredina PRVOG I DRUGOG mjerenja statistiki
znaajna
- alternativna hipoteza H1: x1=x2 (razlika izmeu aritmetikih sredina
prvog i drugog mjerenja je znaajna uz pogreku p)
Kada iz neke populacije uzimamo sluajne uzorke (5) i formiramo parove ,
najvea je vjerojatnost da emo ih uzeti oko prosjeka (jer ih je najvie)
- ako razlika izmeu aritmetikih sredina populacije ne postoji, razlika
izmeu aritmetikih sredina sluajnih uzoraka nije jednaka 0, razlike
izmeu aritmetikih sredina sluajnih uzoraka variraju
- tendencija grupiranja razlika aritmetikih sredina uzoraka biti e oko nule
prema normalnoj distribuciji
- sluajne razlike izmeu aritmetikih sredina distribuirane su u skladu s
Gausovom distribucijom
Ako iz iste populacije formiramo vie parova sluajnih uzoraka (npr 50)
- razlike izmeu aritmetikih sredina uzoraka veliine 50 entiteta variraju
manje od razlika aritmetikih sredina 5 entiteta (vie entiteta, manje
variraju Gausova) uzorak postaje reprezentativniji
- poveanje veliine uzorka smanjuje vjerojatnost razlika izmeu njihovih
aritmetikih sredina
- usporedbom varijabli razlika izmeu 5 i 50 entiteta, standardna devijacija
sluajnih razlika je manja to je broj entiteta u uzorku vei
- osim o broju entiteta u uzorku, standardna devijacija sluajnih razlika
ovisi i o varijabilnosti istraivane varijable u populaciji (to je varijabilnost
varijable u populaciji vea, to e i sluajne razlike vie varirati)
- distribucija razlika aritmetikih sredina sluajno odabranih uzoraka (50) u
odnosu na distribuciju razlika aritmetikih sredina sluajno odabranih
uzoraka (5) biti e ua, imati e manju standardnu devijaciju

Standardna devijacija sluajnih razlika naziva se standardna pogreka


razlika aritmetikih sredina
- od -3 do +3 nalazi se 99% svih razlika izmeu aritmetikih sredina
sluajno odabranih uzoraka
- od -2 do +2 nalazi se 95% svih razlika izmeu aritmetikih sredina
- da li e neka razlika izmeu dviju aritmetikih sredina biti statistiki
znaajna ovisi o tome koliko je puta vea od standardne pogreke razlika
aritmetikih sredina
Standardna pogreka razlika aritmetikih sredina za nezavisne uzorke
- s1: standardna devijacija prvog uzorka
- s2: stan. devijacija drugog uzorka
-n1: broj entiteta u prvom uzorku
- n2: broj entiteta u drugom uzorku
Standardna pogreka razlika aritmetikih sredina za zavisne uzorke
-s1: stand. dev prvog mjerenja
-s2: stand. dev drugog mjerenja
- n: broj entiteta u uzorku
- r: korelacija izmeu varijabli prvog i drugog mjerenja (povezanost izmeu
inicijalnog i fin. stanja)
Ako je razlika izmeu dviju aritmetikih sredina dfTp puta vea od
standardne pogreke razlika aritmetikih sredina, onda je vjerojatnost da
razlika ne postoji u populaciji manja od p (pogreke)
Omjer razlike izmeu dviju aritmetikih sredina i standardne pogreke
razlika, naziva se t-omjer ili t- vrijednost, testira se putem t- distribucije, a
oznaava se slovom t
- t omjer: izraunava se jednako u t-testu za nezavisne i zavisne uzorke
pomou formule:
x1: aritmetika sredina prvog uzorka/mjerenja
x2: aritmetika sredina drugog uzroka/mjerenja
sx1-x2: standardna pogreka razlika aritmetikih sredina
**interval u kojemu se nalazi 95% sluajnih razlika
od -2 do +2 je interval sluajnog variranja aritmetikih sredina (sluajna
razlika)
- ako je na t velik da izlazi van tog intervala, onda je razlika statistiki
znaajna

** to je vei stupanj slobode, interval je ui, to je uzorak reprezentativniji,


interval je ui!
Kada broj stupnjeva slobode tei beskonanom onda su i t- vrijednosti za
velike uzorke vrlo sline vrijednostima normalne distribucije
Testiranje hipoteza:
- u testu za NEZAVISNE uzorke kritina t vrijednost (dfTp) odreuje se na
temelju broja stupnjeva slobode d=n1-1 + n2-1 i pogreke statistikog
zakljuka (pogreke 1 ili 5%)
ako je izraunata t vrijednost manja od kritine, prihvaamo nultu

hipotezu (uz pogreku p ne moemo tvrditi da je razlika izmeu


aritmetikih sredina analiziranih uzoraka statistiki znaajna)
- ako je t vrijednost manja od kritine t vrijednosti nije mogue tvrditi da je
razlika izmeu aritmetikih sredina analiziranih uzoraka statistiki
znaajna, tj da uzorci ne pripadaju istoj populaciji jer se takva razlika u vie
od 1 ili 5 % sluajeva ne moe dogoditi (prihvaamo nultu)
ako je izraunata t vrijednost vea od kritine, prihvaamo alternativnu
(razlika izmeu aritmetikih sredina analiziranih uzoraka statistiki je
znaajna uz pogreku p)
- ako je t vrijednost vea od kritine t vrijednosti, mogue je zakljuiti uz
odreenu pogreku da je razlika izmeu aritmetikih sredina analiziranih
uzoraka statistiki znaajna, tj da uzorci ne pripadaju istoj populaciji jer je
vjerojatnost da se tako velika razlika dobije sluajno manje je od p (dakle
odbacujemo nultu i prihvaamo alternativnu)
- u testu za ZAVISNE UZORKE kritina t vrijednost (dfTp) odreuje se na
temelju broja stupnjeva slobode df=n-1 i pogreke statistikog zakljuka p.
ako je izraunata t vrijednost manja od kritine, prihvaamo nultu (uz
pogreku p ne moemo tvrditi da je razlika izmeu aritmetikih sredina
prvog i drugog mjerenja statistiki znaajna)
ako je izraunata t vrijednost vea od kritine, prihvaamo alternativnu
(razlika izmeu aritmetikih sredina prvog i drugog mjerenja statistiki je
znaajna uz pogreku p)
** kada su dvije grupe npr. razredi (1a i 1b) nezavisan t test!
** Dali im se varijance statistiki znaajno razlikuju provjeravamo pomou ftesta dobijemo f-vrijednost i onda ju distribuiramo po f-distribuciji
kritika f-vrijednost do koje se smatra da nema statistikih znaajnih razlika
izmeu varijanci uitava se na krianju stupaca i redaka u tablici; ako je
izraunata f-vrijednost manja od tabline zakljuujemo da razlika izmeu varijanci
nije statistiki znaajna=a ako se i nae greka zanemariva je jer biramo uzorke
sline veliine
UNIVARIJATNA ANALIZA VARIJANCE

Koristi se za utvrivanje statistike znaajnosti razlika izmeu aritmetikih


sredina dviju ili vie grupa u odreenoj varijabli
Analizu varijance (ANOVA) razvio je Ronald Fisher u 20. st.
Ako je varijabilitet izmeu grupa statistiki znaajno veiod varijabiliteta
unutar grupa, onda se grupe meusobno statistiki znaajno razlikuju,
odnosno, ne pripadaju istoj populaciji.
-Dakle, da bismo utvrdili je li razlika izmeu aritmetikih sredina grupa
statistiki znaajna, varijabilitet izmeu grupa mora biti vei od
varijabiliteta unutar grupa.
-Ako je
varijabilitet izmeu grupa manji od varijabiliteta unutar grupa, onda se
aritmetike sredine grupa ne razlikuju statistiki znaajno.
Zajednika suma kvadrata:ako se odstupanja rezultata ispitanika od
zajednike a.s kvadriraju i zbroje
Suma kvadrata izmeu grupa:predstavlja sumu kvadrata odstupanja
a.s.grupa od zajednike a.s

suma kvadrata unutar grupa:suma kvadriranih odstupanja rezultata


entiteta od a.s grupa kojima pripadaju
zajednika suma sastoji se od sume kvadrata unutar i izmeu grupa
-preko F-vrijednosti mogue je utvrdit statistiku znaajnost razlika a.s
sredina grupa ispitanika,jer izraunata F vrijednost predstavlja omjer
varijance izmeu i unutar grupa,te ima F distribuciju koja je pozitivno
asimetrina i ima F vrijednosti koje ne mogu biti manje od nule
ako je F vrijednost manja od 1,t.ako je varijanca unutar grupa vea od
varijance izmeu grupa nema statistike znaajnosti
ako je F vrijednost vea od 1,statistika znaajnost ovisi o broju stupnjeva
slobode
kritina vrijednost oitava se iz tablice,a F vrijednost na krianju stupca i
redka
ako je izraunata f vrijednost vea
od tabline,zakljuujemo da razlika izmeu a.s nije sluajna,neg da se
gruppe statistiki znaajno razlikuju tj.da ne pripadaju istoj populaciji
ako uzorci budu sline veliine ni varijance im nee varirat

KORELACIJA

Francis Galton je istraivao utjecaj nasljea na razvoj inteligencije, duinu


ivota itd.
- on je zaetnik korelacijske i regresijske analize
Karl Pearson je razvio raunski postupak za utvrivanje povezanost
izmeu dviju varijabli i nazvao ga produkt-moment koeficijent
korelacije
- on predstavlja mjeru meusobne LINEARNE povezanosti dviju
STANDARDIZIRANIH varijabli
** linearno: identino ili obrnuto proporcionalno (kako se mijenja jedna, tako
se mijenja druga)
Korelacijska analiza: koliko rezultati u jednoj varijabli objanjavaju
rezultate u drugoj varijabli
Koeficijent determinacije: predstavlja proporciju zajednikog varijabliteta
2 varijabli
- on pomnoen sa 100 daje postotke kojima se moe predvidjeti rezultat u
drugoj varijabli
Indeks korelacije: predstavlja stupanj nelinarne povezanosti izmeu dvije
varijable
Pearsonov koeficijent korelacije uvijek se nalazi u intervalu od -1 do +1
(kada crtamo interval standardnih vrijednosti crtamo samo do 3 i + 3 jer
se tu pojavljuje 99%)
Dvodimenzionalni korelacijski dijagram: grafiki nain prikazivanja
povezanosti rezultata dviju varijabli (ispitanici ispitani na 2 varijable)
- iscrtava se na nain da se za svakog ispitanika odredi poloaj u
koordinatnom sustavu pri emu se poloaj na apcisi odreuje sukladno
rezultatu ispitanika u jednoj varijabli, a poloaj na ordinati sukladno
rezultatu ispitanika u drugoj varijabli.
- rezultat moe biti od -1 do +1 (tj. jednak ili vei od -1 i manji ili jednak od

+1)
a) Dijagram nulte korelacije:
- kada nema povezanosti, jednaka je 0 (r=0) odnos izmeu dviju varijabli
u kojem svakom rezultatu u jednoj varijabli moe odgovarati bilo koji
rezultat u drugoj varijabli
b) Dijagram potpuno pozitivne korelacije:
- povezanost izmeu dvije varijable = 1
- rezultati izmeu dviju varijabli meusobno su proporcionalni (na kojem
broju je u x, na tom broju je i na y rezultat jedne varijable odgovara rez
druge varijable)
- u kineziologiji nema potpuno pozitivne povezanosti
- svakom iznadprosjenom u jednoj, odgovara iznadprosjean u drugoj i
obrnuto
c) Dijagram potpuno negativne korelacije:
- povezanost izmeu dvije varijable = -1
- to je netko bolji na jednoj varijabli, toliko je lo u drugoj varijabli
- nekom visokom rezultatu jedne varijable, odgovara niski rezultat druge
varijable
- odnos je OBRNUTO PROPORCIONALAN

d) Dijagram NEPOTPUNO pozitivne korelacije:


- 0<r<+1 oznaava takav odnos izmeu dvije varijable u kojem svakom
iznadprosjenom rezultatu u jednoj varijabli NAJVJEROJATNIJE odgovara
iznadprosjean rezultat u drugoj varijabli i obrnuto (odreenom rezultatu ne
odgovara samo jedan rezultat u drugoj varijabli, rezultati se kreu u
intervalu)
- to su toke vie zbijene, korelacija je vea, kada bi bile rasprene,
korelacija bi bila 0
e) Dijagram NEPOTPUNO negativne korelacije:
-1<r<0 odnos izmeu dviju varijabli u kojem svakom iznadprosjenom
rezultatu u jednoj varijabli NAJVJEROJATNIJE odgovara ispodprosjean
rezultat u drugoj varijabli i obrnuto
Koeficijent korelacije jednak je kosinusu kuta izmeu dvaju centriranih
vektora
Kosinus kuta koji zatvaraju dva vektora istog reda (x i y) izraunava se kao
omjer skalarnog produkta dvaju vektora i umnoka njihovih normi
Ako je korelacija izmeu varijabli jednaka 0 (rxy=0) onda su dva normirana
i centrirana vektora pod kutem od 90 stupnjeva
Ako je korelacija izmeu varijabli potpuno pozitivna(rxy=1) onda je kut
izmeu dva normirana i centrirana vektora 0 stupnjeva
Ako je korelacija izmeu varijabli potpuno negativna (rxy=-1) onda je kut
izmeu dva vektora jednak 180 stupnjeva
** kad proe kut od 90 stupnjeva, poinje nepotpuna korelacija
Ako je korelacija nepotpuno pozitivna onda je kud izmeu dva vektora
vei od 0 a manji od 90
Ako je korelacija nepotpuno negativna onda je kut izmeu dva vektora
vei od 90 stupnjeva, a manji od 180

Ako se povezanost dviju varijabli utvruje na uzorku ispitanika, potrebno je


testirati statistiku znaajnost dali se korelacija dogodila sluajno.
a) Nulta hipoteza H0: r=0 (korelacija nije statistiki znaajna na razini
pogreke p)
b) Alternativna H1=r=0 (korelacija je statistiki znaajna, postoji
povezanost, nije se dogodila sluajno na razini pogreke p)
Statistika znaajnost koeficijenta korelacije testira se putem t distribucije
pri emu se KRITINA T VRIJEDNOST odreuje na temelju pogreke
statistikog zakljuka (p) i broja stupnjeva slobode (df=n-2)
** to je vei koeficijent korelacije, to se nije dogodilo sluajno!
- vjerojatnost da se korelacija u uzorku dogodila sluajno iako u populaciji
ne postoji, manje je to je broj entiteta u uzorku vei i to je apsolutna
vrijednost izraunate korelacije vea
Korelacijska matrica: isti broj redaka i stupaca (kvadratna)
- u glavnoj dijagonali su jedinice (predstavljaju varijance standardiziranih
varijabli)
- izvan dijagonale su korelacije svake varijable sa svakom
- korelacijska matrica je simetrina, to znai da se koeficijent svake
korelacije izmeu svake dvije varijable nalazi i s gornje i s donje strane
dijagonale

You might also like