Professional Documents
Culture Documents
1. Što je korelacija?
Za razliku od ostalih korelacija ona zahtijeva da imamo varijabilitet među rezultatima, dakle
da nešto varira, poput visine i težine, inteligencije, a poanta je u tome da to mora varirati. Da
nije kao spol, da ima stroge kategorije, već da ima najrazličitije moguće rezultate. Rezultati
su izraženi na intervalnoj i omjernoj skali.
-Dijagram raspršenja, korelacijski oblak ili šuma točkica tablični ili grafički prikaz korelacije u
koordinatnom sustavu. Prikaz vezanog raspršenja u dvije varijable x i y.
-Svaka statistička jedinica (tj. ispitanik) prikazana je jednom točkom s dvije koordinate:
rezultat u X varijabli, povezani rezultat u Y varijabli.
-Imali smo primjer gdje vidimo na grafu rezultate studenata logopedije koju su postigli na I. i
na II. Kolokviju iz statistike. Svaka točkica na grafu predstavlja jednog studenta. Više
studenata, veća je šansa da iznesemo neki zaključak. Rezultati se generalno grupiraju oko
sredine na obje varijable. Kada povučemo pravac između te 2 varijable dobivamo jednu crtu
koja se naziva PRAVAC REGRESIJE.
Pozitivna povezanost je ako je student imao dobre rezultate na I. kolokviju, a vrlo vjerojatno
će ih imati i na II. kolokviju.
Rezultati na kolokviju koji su izraženi u postotcima pripadaju intervalnoj skali jer nema
apsolutne nule.
4. Koja mjerna skala se najčešće koristi u psihologiji ?
Većinom što psiholozi mjere je na intervalnoj skali jer se psiholozi većinom bave
testovima, mjernim instrumentima, testovima inteligencije, upitnicima, testovima
znanja i to sve nema apsolutnu 0.
A kada psiholozi traže fiziološku mjeru gdje imaju apsolutnu nulu, za mjerenje krvnog
tlaka, ubrzavanje srčanog pulsa, koriste omjernu skalu.
-Potpuna korelacija postoji kad u svakoj vrijednosti u jednoj varijabli X odgovara samo
jedna vrijednost u drugoj varijabli Y.
-Ako linearnom porastu prve varijable odgovara linearni porast druge varijable, i to tako da je
jedna određena vrijednost prve varijable uvijek povezana s korespondentnom vrijednošću
druge varijable, korelacija je POTPUNA i POZITIVNA: r=+1
-Ako linearnom porastu prve varijable odgovara linearni pad druge varijable, i to tako da je
jedna određena vrijednost prve varijable povezana s jednom korespondentnom ( podudarati ,
poklapati ) vrijednošću druge varijable, korelacija je POTPUNA I NEGATIVNA: r=-1
-Ako linearnom porastu prve varijable uglavnom odgovara linearni pad druge varijable, i to
tako da je jedna određena vrijednost prve varijable povezana s više vrijednosti druge
varijable, korelacija je DJELOMIČNA i NEGATIVNA: -1<r<0
-Ako je korelacija potpuna, sve točke prianjaju na crtu regresije pa je rezidualni varijabilitet =
0.
-Ako nema korelacije, točke će maksimalno odstupati od crte regresije pa će rezidualni
varijabilitet biti maksimalan, tj. jednak standardnoj devijaciji vrijednosti u Y varijabli.
-Što točke više odstupaju od crte regresije, to je rezidualni varijabilitet veći.
13. Što određuje jednu Pearsonovu korelaciju ? Što sve možemo saznati na osnovu
iznosa koeficijenta korelacije?
-Za početak možemo saznati njegovu visinu i smjer, da li taj koeficijent ukazuje da je riječ o
visokoj povezanosti, znači te varijable su u snažnoj korelaciji i nešto na njih djeluje da
zajedno rastu ili padaju ili da zajednu 1 raste, 1 pada u istom intenzitetu ili su neke slabije
povezanosti.
5. uvjet= rezultati u obje varijable moraju biti prave numeričke vrijednosti, tj. moraju biti
izraženi barem na intervalnoj skali
Matematički to je r na kvadrat, mi kvadriramo r koji smo dobili, recimo korelacija -0,80 znači
postoji visoka negativna korelacija, kad to kvadriramo i dobijemo 0,64, termin 64 predstavlja
64%, odnosno statistički izraženo da ove 2 varijable koje koreliraju -0,80 dijele tvz. 64%
zajedničkih faktora.
Važne napomene:
- Interpretacija koeficijenata korelacije ovisi o vrsti varijabli, broju ispitanika, ali kao gruba
orijentacija, nekada se navodi da je:
-Postoje različiti koeficijenti korelacije, ali svi oni samo pokazuju stupanj sukladnosti u
variranju varijabli, a ne ukazuju na uzročno-posljedičnu vezu među varijablama. To znači da
ako se utvrdi da je neki koeficijent korelacije značajan, ne može se zaključiti da porast jedne
varijable uzrokuje porast druge već da one sukladno variraju, tj. da su značajno povezane.
29. T-test ?
T-odnos se općenito odnosi na razlomak kod kojeg se u brojniku nalazi neka vrijednost, a u
nazivniku pogreška te vrijednosti.
T-odnos je najpoznatiji kod testiranja značajnosti razlika između dvije aritmetičke sredine i u
tom slučaju on pokazuje koliko je puta neka razlika veća od svoje pogreške.
-Određivanje dva pravca regresije za jednu korelaciju ima svoj smisao samo ako obje
varijable mogu biti i prediktorske i kriterijske (npr. korelacija između godina školovanja i
verbalnih sposobnosti).
-Povezanost koja nije linearna (npr. korelacija između intenziteta rasvjete i radnog učinka u
nekom preciznom poslu).
-Može biti dvojaka:
1. zakrivljena povezanost u kojoj crta regresije ne mijenja svoj smjer
2. zakrivljena povezanost u kojoj crta regresije mijenja svoj smjer › nije dopušteno
izračunavati Pearsonov r!
-Spearmanov koeficijent korelacije je jedna ili obje varijable mjerene ordinalnom mjernom
ljestvicom. Ne postavlja uvjet linearnosti, simetričnosti niti veličine uzorka.
Nazvan po Charles Spearman.
-Procjenjuje koliko se dobro može opisati odnos između dvije varijable pomoću
a monotono funkcija.
-Spearmanova korelacija ocjenjuje monotone odnose (bili oni linearni ili ne).
-Ako nema ponovljenih vrijednosti podataka, javlja se savršena Spearmanova korelacija +1 ili
-1 kada je svaka od varijabli savršena monotona funkcija druge.
- Nisu poznate stvarne razlike među rezultatima, samo razlike među rangovima rezultata.
-Za razliku od r, Ro ne zahtjeva linearan odnos među varijablama, niti zadovoljenje uvjeta
normalne distribucije i izostanka ekstremnih rezultata
-Rang korelacija daje samo približnu indikaciju asocijacije između dvije varijable i opravdano
ju je upotrijebiti samo onda ako se ne može izračunati r korelacija!
Regresijska analiza bavi se određivanjem funkcionalne zavisnosti između dviju ili više
varijabli. Analitički izraz te zavisnosti zove se regresijski model.
Ako model izražava vezu između zavisne i jedne nezavisne varijable, riječ je o jednostavnom
regresijskom modelu.
Ako model izražava vezu između zavisne i dviju ili više nezavisnih varijabli, riječ je o modelu
višestruke regresije.
-Uz Spearmanov koeficijent rang korelacije veoma često se koristi i Kendallov koeficijent
rang korelacije.
-S se računa tako da se u Y varijabli svaki rang usporedi s ostalima, koji su desno od njega.
Ako je rang s kojim se uspoređuje veći, upiše se +1, ako je manji upiše se –1, a ako su
jednaki upiše se 0.
-Kendallov koeficijent rang-korelacije τ (tau), obje varijable su ordinalne, ili jedna varijabla je
nominalna dihotomna (ima samo dvije klase), a druga je metrička ili Likertova ljestvica.
Parcijalna korelacija predstavlja korelaciju između dvije varijable kod kojih je isključen utjecaj
treće varijable.
-Nekada se između dvije varijable može dobiti visoka korelacija zato što na obje varijable
istovremeno, na isti način djeluje na neka treća varijabla.
-Ako imamo više od dva ocjenjivača koji rangiraju neke ispitanike prema njihovom uspjehu i
ako želimo izračunati koliko se ti ispitivači međusobno slažu u svojim ocjenama, to ćemo
postići računanjem koeficijenta konkordancije W.
• Nekoliko ocjenjivača daje rangove za neke kandidate; nas zanima koliko se ocjenjivači
slažu.
• Traže se razlike između svake sume rangova i očekivane sume rangova pod nul
hipotezom: (m(N+1)/2 )
Uz broj stupnjeva slobode df=N-1 očita se iz tablica teorijski Hi-kvadrat za razinu značajnosti
5%. Ako je izračunati Hi-kvadrat veći od tabličnog Hi-kvadrata, može se zaključiti da je
koeficijent konkordancije W statistički značajan, tj. procjenjivači se slažu u svojim ocjenama.
Može se zaključiti da se ispitivači statistički značajno slažu u ocjenjivanju učenika, uz
pogrešku od 5%.
-Odnose prediktorskih varijabli i kriterija obično grafički prikazujemo preko „Venn dijagrama”.
.optimalno ponderirana - svaka prediktorska varijabla se ponderira (pomnoži) vrijednošću
kojom joj se pridaje određena važnost
-Što je korelacija prediktora s kriterijem veća, on bi trebao imati veći udio (težinu ili ponder) u
multiploj korelaciji R
- Za optimalan regresijski model (R), poželjna je što veća korelacija prediktora s kriterijem, a
što manja korelacija između prediktora (odsustvo multikolinearnosti)
-Višestruka korelacija je analitička procedura kojom se utvrđuje na koji način više nezavisnih
varijabli utječe na jednu zavisnu varijablu. Koeficijent višestruke korelacije označava se
velikim latiničnim slovom R.
44. B-koeficijenti ?
-b koeficijenti nisu međusobno usporedivi jer njihova veličina ovisi o (standardnoj devijaciji)
pripadajućeg prediktora.
49. Ograničenost R?
OGRANIČENJA:
3. Omjer N i k (preporuke N=15 ili 30 x k, no to ovisi o fenomenu koji se ispituje – veći uzorak
za “slabije” fenomene)
'Najpošteniji' pravac - onaj koji ima najmanju sumu kvadrata odstupanja pojedinačnih Y
rezultata od tog pravca.
Standardna pogreška prognoze = mjera variranja konkretnih rezultata oko pravca regresije
(oko najvjerojatnijeg, prognoziranog rezultata).
-Prognoza pomoću pravca regresije će biti manje točna što je niža korelacija između dvije
varijable, jer su u tom slučaju individualni rezultati jako raspršeni oko pravca regresije.
-Pri tome moramo pretpostaviti, a što ne mora biti tako tzv. homoscedascitet = raspršenje
oko pravca regresije je manje-više podjednako uz čitavu duljinu pravca.
Standardna pogreška aritmetičke sredine = mjera variranja aritm. sredina uzoraka oko prave
aritm. Sredine.
Napomena:
-Prognoziranje rezultata iz X u Y ima smisla ako: -su varijable u linearnom odnosu -ako
postoji približan homoscedascitet (a on ne postoji ako nemamo približnu normalnu
distribuciju svake varijable) .
Zbog:
4. Uzimajući u obzir samo usporedbu dvije M, gubimo na preciznosti, jer varijabilitet rezultata
ovisi o svim grupama, a ne samo o dvije grupe
59. ANOVA ?
*Kod ANOVE varijabilitet svih rezultata se rastavlja na dijelove od kojih je sastavljen , a to
su:
-INTERNI VARIJABILITET ( varijabilitet unutar unutar svake pojedine grupe ) –within groups
(WG)
*Iz odnosa tih dvaju varijabiliteta može se zaključiti da li se radi o grupama koje se
međusobno razlikuju ( ne pripadaju istoj populaciji ) ili se ne razlikuju značajno , odnosno sve
grupe potječu iz iste populacije ( a njihove razlike su slučajne )
Preduvjeti:
1. Podaci populacije iz kojih su uzorci uzimani normalno distribuirani
2. Varijance populacija približno jednake
-Ukoliko F nije statistički značajan, ne zanimaju nas razlike među pojedinačnim skupinama.
-Međutim, ukoliko F jeste značajan, to nam govori samo da sve grupe ne pripadaju istoj
populaciji, pa nas zanima nas među kojim je skupinama razlika značajna.
-Nezavisni uzorci (Factorial between subjects two-way design ANOVA) → Kod ovakve
analize u svakoj od kategorija nalaze se drugi ispitanici!
-Interakcija je učinak ili rezultat istovremenog uzajamnog djelovanja dvije ili više
varijabli na Zavisnu varijablu.
-Interakcija je prisutna kada efekt jedne nezavisne varijable na zavisnu ovisi o razini druge (ili
drugih) nezavisnih varijabli.
-Dakle, efekt jedne nezavisne varijable na zavisnu nije isti na svim razinama neke druge
nezavisne varijable.
1. Jedan uzorak
• 2x2 tablica
• Tablica kontigencije
VAŽNO:
-Kad ne bi bilo nikakvih razlika između opaženih i očekivanih frekvencija, hi-kvadrat bi bio
nula. Što su razlike veće, veći je i izraz hi kvadrata
Tablica graničnih vrijednosti (H) pokazuje uz određeni df koliko najmanje mora iznositi hi
kvadrat da odbacimo nul hipotezu, na određenoj razini sigurnosti (0,05 ili 0,01)
Navest ćemo praktičnu stranu hi kvadrata to je tzv aditivno svojstvo znači da imamo pravo
zbrojiti nekoliko hi kvadrata iz istih istraživanja i na značajnost dobivenog rezultata
3. Kada radimo sa svojstvom pojavilo se/nije se pojavilo trebamo staviti u račun i frekv u
kojima se nije pojavilo (npr. bez nesreće)
6. Yatesova korekcija se primjenjuje kad je df= 1 (2x2 tbl), naročito kod malih frekvencija, te
kod tablica kontingencije ako u bilo kojoj ćeliji mamo ft manju od 5
› Mogu se i primjenjivati na podatke koji su izraženi na intervalnim ili omjernim skale, ali to
nije uobičajeno.
Medijan test je postupak koji se koristi kada želimo znati da li se dvije nezavisne grupe
ispitanika razlikuju s obzirom na centralnu tendenciju.
› Nastoji se utvrditi dolaze li dvije nezavisne grupe rezultata (ne moraju nužno biti uzorci iste
veličine) iz iste populacije s istim medijanom,
- test se može koristiti kad god su rezultati izraženi na najmanje ordinalnoj skali..
Koristi se kada:
-Iz tog razloga je prikladan postupak, vremenski ekonomičan, kad postoje velike razlike, te
samo aproksimativno želimo odrediti smjer razlika.
NAPISANO:
– zbog razumijevanja smisla nekog statistički značajnog rezultata koji nije važan u
praktičnom smislu
3. softverski paketi (istraživač unosi vrijednosti različitih aspekata svog istraživanja kao što
su poznata populacijska M, predviđena populacijska M, SD populacije, veličina uzorka,
razina rizika i jednosmjerno vs. dvosmjerno testiranje)
› veličina učinka
› broj ispitanika
PREDZNAK U POINT BIS. KOEF. – predznak govori kojoj smo kategoriji u nominalnoj varijabli
dali veću oznaku i to utjece na to je li pozitivna ili negativna korelacija; u kakvom su odnosu
vrijednosti u kontinuiranoj varijabli i dihotomnoj; ako je poz vece vrijednosti u kont var se
odnose na visi kod u dihotomnoj, da je negativan predznak bilo bi obrnuto