Analiza bivariata a datelor

Analiza bivariata a datelor ! Presupune masurarea gradului de asociere a doua variabile sub aspectul: Directiei (naturii) Intensitatii Semnificatiei statistice .

McNemar sau Fisher.Variabilele nominale Tabele de frecvente (contingenta) considerata simultan pentru doua sau mai multe variabile caracteristice aceluiasi esantion. Coeficientul de corelatie (valori intre -1 si +1) rphi = ad − bc [(a + b)(c + d )(a + c )(b + d )]1 / 2 Directia asocierii este data de valoarea lui (rphi)2 Gradul de semnificatie al asocierii dintre opiniile subiectilor constituiti in cele doua esantioane independente este determinat cu ajutorul testului χ2. .

2 r k χ = ∑∑ ( 2 c i =1 j =1 Oij − Aij ) Aij ! Valoarea calculata χc2 a testului se compara cu valoarea tabelata χt2 a acestuia. obtinuta in functie de probabilitatea de garantare a rezultatului si gradele de libertate asociate: (r-1)(k-1). χc2 ≤ χt2 : se accepta ipoteza nula χc2 > χt2 : se respinge ipoteza nula .Testul neparametric χ2 ! Bazat pe ipoteza nula: H0: nu exista diferente semnificative intre cele doua variabile.

Masurarea gradului de asociere se poate realiza cu ajutorul coeficientului de contingenta: C= χ 2 c N + χ c2 .Testul neparametric χ2 ! ! Pentru mai mult de doua subesantioane independente trebuie ca frecventele Oij > 1 si Oij < 5 sa nu depaseasca 20%.

: 95%).05 : se respinge ipoteza nula p > 0. ! ( A + B )!(C + D )!( A + C )!( B + D )! N ! A! B!C! D! Valoarea calculata p a testului se compara cu probabilitatea de garantare a rezultatului (ex. p= p ≤ 0.Testul Fisher ! ! Inlocuieste testul χ2 atunci cand dimensiunea esantionului N<40 si k=r=2 Testul probabilitatii exacte (Fisher) are aceiasi ipoteza nula: H0: nu exista diferente semnificative intre cele doua variabile.05 : se accepta ipoteza nula .

! ! a+d a si d reprezinta frecventele subesantioanelor independente.Testul McNemar ! ! Inlocuieste testul χ2 atunci cand cele doua esantioane investigate nu sunt independente Testul McNemar are aceiasi ipoteza nula: H0: nu exista diferente semnificative intre cele doua variabile. Interpretarea este aceiasi ca si in cazul testului χ2 : χc2 ≤ χt2 : se accepta ipoteza nula χc2 > χt2 : se respinge ipoteza nula χ c2 = ( a − d − 1) 2 .

Gradul de semnificatie al asocierii dintre opiniile subiectilor constituiti in cele doua esantioane independente este determinat cu testului semnificatiei coeficientului Spearman.Variabilele ordinale Tabele de frecvente (contingenta) considerata simultan pentru doua sau mai multe variabile caracteristice aceluiasi esantion. Masurarea gradului de asociere se poate utiliza coeficientul Spearman de corelatie a rangurilor ρ = 1− 6∑ Di2 n(n − 1) i =1 2 n Directia asocierii este data de valoarea lui ρ sau γ. .

Zc = ! ρ 1 n −1 Valoarea calculata Zc a testului se compara cu valoarea tabelata Zt a acestuia. -Zt ≤ Zc ≤ Zt : se accepta ipoteza nula altfel : se respinge ipoteza nula . obtinuta in functie de probabilitatea de garantare a rezultatului.Coeficientul de corelatie Spearman ! Bazat pe ipoteza nula: H0: nu exista o corelatie intre variabilele investigate.

insa din nou fara valoarea aflata imediat sub ea. si cu celelalte valori ale tabelului. P−Q γ = P+Q .Coeficientul de corelatie γ al lui Goodman si Kruskall ! ! Se poate utiliza atunci cand coeficientul Spearman nu ofera valori concludente. poate lua valori in intervalul -1 si +1. fara cea care se afla imediat sub ea. Q se calculeaza dupa aceleasi reguli. ! P se obtine inmultind valoarea frecventei din coltul din stanga sus a tabelului de frecvente asociat cu valorile de pe randul urmator. dupa care se insumeaza cu produsul dintre prima valoare a randului urmator si suma frecventelor incepand de pe randul urmator. iterativ. la fel ca si ρ. insa incepand din dreapta sus. Valoarea lui γ.

Gradul de semnificatie al asocierii dintre opiniile subiectilor constituiti in cele doua esantioane este determinat prin testarea semnificatiei statistice a coeficientului r. . Masurarea gradului de asociere se poate utiliza coeficientul Pearson de corelatie a rangurilor r= n ∑ x i y i − ∑ xi ∑ y i i =1 i =1 i =1 n n n n ∑ ( xi ) − ( ∑ xi ) 2 i =1 i =1 n n 2 n ∑ ( y i ) − (∑ y i ) 2 2 i =1 i =1 n n Directia asocierii este data de valoarea lui r.Variabilele metrice Tabele de frecvente (contingenta) considerata simultan pentru doua sau mai multe variabile caracteristice aceluiasi esantion.

obtinuta in functie de probabilitatea de garantare a rezultatului. 1+ r 1.1513 + log10 ( ) 1− r Zc = 1 n−3 ! Valoarea calculata Zc a testului se compara cu valoarea tabelata Zt a acestuia. normale. -Zt2 ≤ Zc2 ≤ Zt2 : se accepta ipoteza nula altfel : se respinge ipoteza nula . cu dispersii asemanatoare Bazat pe ipoteza nula: H0: nu exista o corelatie intre variabilele investigate (r nu este in mod semnificativ diferit de zero).Coeficientul de corelatie Pearson ! ! Utilizat pentru variabile continue.