You are on page 1of 11

Osnovni pojmovi 2

Interakcija
• Pojava da efekat združenog
dejstva više nezavisnih var
na jednu zavisnu nije
jednak zbiru njihovih
pojedinačnih efekata
• H0 kod testiranja interakcije
glasi da interakcije nema tj.
Da je efekat interakcije 0.
Kad rezultat testa nije
statistički značajan
prihvatamo nultu hipotezu i
zaključujemo da interakcije
u populaciji nema. Kad
jeste statistički značajan,
nultu hipotezu odbacujemo
i zaključujemo da
interakcije u populaciji ima.
Sferičnost
• Pojava da skup varijabli nije u korelaciji (u celom
skupu nema niti jednog para varijabli koji je u
nenultoj korelaciji.
• Tako se zove zato što je u toj situaciji raspored
tačaka u statističkom prostoru sferičnog oblika.
Inflacija verovatnoća
• Pojava da usled velikog broja poređenja, rezultati nekih
poređenja postaju stat. značajni samo na osnovu
slučaja.
• Npr. ako kao kritični nivo značajnosti uzmemo npr. 0,05,
to znači da će svaki 20i test biti statistički značajan samo
na osnovu slučaja.
Korekcije za inflaciju verovatnoća

• Da ustrožnjavamo kriterijum:
– Čime smanjujemo verovatnoću greške tipa I, povećavamo
verovatnoću greške tipa II, povećavamo minimalnu veličinu
efekta koji se može detektovati (ili zahtevanu veličinu uzorka).
Povećava broj lažno negativnih nalaza.
– Bonferonni korekcija
– Šidak korekcija
• Da poredimo procenat statistički značajnih poređenja sa
onim koji bi dobili samo na osnovu slučaja
– Omogućava da procenimo koliki deo statistički značajnih
rezultata je “stvaran”, tj. Nije posledica slučaja, ali nam ne
omogućava da razaznamo koji od tih dobijenih rezultata nisu
posledica slučaja
– Veći rizik od činjenja greške tipa I.
Korekcije za inflaciju verovatnoća
• Bonferonni – kritični nivo značajnosti koji smo
usvojili se podeli sa brojem poređenja i taj
rezultat se onda uzima kao kritična vrednost.
Npr. Ako nam je kritični nivo značajnosti 0,05, a
imamo 10 poređenja, onda 0,05/10 = 0,005,
dakle novi kritični nivo značajnosti nam je 0,005.
• Šidak – 1-(1-a)**(1/n). Gde je a kritični nivo
značajnosti koji smo usvojili, a n je broj
poređenja.
• Druge korekcije – Dunett, Holm-Bonferonni itd.
Kovarijansa
• Nestandardizovana mera zajedničkog
variranja dve varijable
• cov(x,y) = (Σ((x-Mx)*(y-My)))/N).
• Korelacija je zapravo standardizovana
kovarijansa – r= (Σ(zx*zy)/N).
Sabiranje varijansi
• Ako su varijable nezavisne (korelacija=0) onda je:
– var(x+y)=var(x)+var(y)
• Ako varijable nisu nezavisne (korelacija nije nula) onda je:
– Var(x+y)=var(x)+var(y)+2*cov(x,y) odnosno:
– Var(x+y)=var(x)+var(y)+2*SD(x)*SD(y)*r
• Gde su:
– var(x) i var(y) – varijanse varijabli x i y
– Var(x+y) – varijansa zbira varijabli x i y
– SD(x) i SD(y) – standardne devijacije varijabli x i y
– r – koeficijent korelacije varijabli x i y
• Edit: Odgovor na pitanje sa predavanja - ovo važi za situacije kada se dve varijable
sabiraju. Ali i kada se dve varijable oduzimaju jedna od druge (kad se računa njihova
razlika), varijanse im se i dalje sabiraju po ovoj formuli kada su varijable nezavisne.
Međutim kada su varijable u korelaciji, onda je oduzimanje jedne varijable zapravo isto
kao dodavanje te varijable pomnožene sa -1. To onda dovodi do toga da korelacija na
kraju promeni predznak, pa ako su varijable bile pozitivno povezane onda predznak
postaje negativan, pa je varijansa razlike manja od zbira varijansi te dve varijable, a ako
je bio negativan, onda predznak poslednjeg sabirka postaje pozitivan pa je varijansa
razlike veća od zbira varijansi dve izvorne varijable. Formule i dalje izgledaju isto, samo
treba se menjaju predznaci. Dakle i:
– Var(x-y)=var(x)+var(y)+2*cov(x,y) odnosno:
– Var(x-y)=var(x)+var(y)+2*SD(x)*SD(y)*r
Zašto je to tako?
• Pitagorina teorema
– c**2=a**2+b**2
• Zakon kosinusa (kada trougao nije
pravougli):
– c**2=a**2+b**2+a*b*cos(α)
– Gde su a, b i c dužine stranica trougla, α
je ugao između a i b.

• Ekvivalencija:
– a i b su kao standardne devijacije x i y;
– Korelacija = kosinus
– Formule: c**2=a**2+b**2+a*b*cos(α) i
Var(x+y)=var(x)+var(y)+2*SD(x)*SD(y)*r
su ekvivalentne.
Vrste udaljenosti
• Euklidska udaljenost – udaljenost između dve tačke je dužina prave linije koja
ih spaja – računa se po pitagorinoj teoremi:
– d=((x1-y1)**2+(x2-y2)**2+(x3-y3)**2+...+(xn-yn)**2)**0,5
• Kvadrirana euklidska udaljenost – ista kao euklidska samo nema korena na
kraju
• Menhetn udaljenost – zbir razlika između koordinata tačaka na dimenzijama:
– d=((x1-y1)+(x2-y2)+(x3-y3)+...+(xn-yn))**0,5
• Udaljenost Chebysheva – udaljenost između dve tačke je njihova udaljenost
na onoj dimenziji na kojoj se te dve tačke najviše razlikuju odnosno na kojoj su
najudaljenije:
– d=MAX((x1-y1),(x2-y2),(x3-y3),...,(xn-yn))
• Udaljenost Minkowskog – svaka vrsta udaljenosti koja se računa tako što se
koordinate na dve tačke na svakoj od dimenzija oduzmu, dignu na određeni
stepen, saberu, a potom se izvadi koren koji odgovara stepenu na koji su
razlike podizane – Euklidska je tako specijalan slučaj udaljenosti Minkowskog
sa 2 stepenom, Menhetn je sa 1 stepenom itd.
• Mahalonbisova udaljenost – euklidska udaljenost korigovana za korelaciju
između dimenzija. Kada je korelacija nula, ekvivalentna je euklidskoj distanci.
• Još brojne druge mere se mogu koristiti kao mere udaljenosti – npr.
Korelacije, Hi kvadrat itd.
Hvala

You might also like