M.

Popa – Teste statistice neparametrice pentru date ordinale

TESTE STATISTICE PE TRU DATE ORDI ALE
Conf. dr. M. Popa
Testele statistice pentru date ordinale se utilizează în următoarele situaţii: a) Atunci când variabila dependentă este exprimată pe scală de tip ordinal. În acest caz valorile nu au proprietăţi de interval, dar exprimă poziţia fiecăreia în raport cu cealaltă. b) Atunci când variabila dependentă este măsurată pe scală de interval/raport, dar distribuţia ei nu respectă condiţiile impuse de testele parametrice. În această situaţie se efectuează transformare de rang, adică înlocuieşte fiecare valoare a distribuţiei cu poziţia pe care o are în cadrul distribuţiei, sub aspectul ordinii de mărime. Noua distribuţie rezultată poate fi supusă analizei statistice cu teste neparametrice ordinale. Având în vedere modelele de cercetare la care ne-am raportat până acum, vom regăsi, pentru fiecare dintre ele, teste statistice pentru date ordinale, după cum urmează:

Testul Mann-Whitney (U) 1 pentru două eşantioane independente
Să luăm în considerare următoarea problemă: un psiholog care lucrează într-o mare bancă doreşte să vadă dacă există o diferenţă între premiile băneşti anuale primite de femeile şi bărbaţii angajaţi ai băncii. În tabelele de mai jos se află nivelurile primelor şi rangurile acestora în raport cu întreaga distribuţie a primelor, indiferent de sex. Problema este una tipică pentru a fi rezolvată cu testul t al diferenţei dintre mediile a două eşantioane independente. Avem o variabilă independentă de tip nominal-dihotomic şi una dependentă, de tip interval/raport. Din păcate, analiza preliminară a variabilei dependente („primă”) relevă abateri mari de la condiţiile de normalitate (un indice de boltire, kurtosys, de peste 7) precum şi o slabă reprezentativitate a mediei, ambele datorate, mai ales, prezenţei unei valori extreme (o primă de 200 mil. lei). După ce verificăm corectitudinea valorii respective, ajungem la concluzia că ea nu poate fi eliminată şi, ca urmare, nu este recomandabilă utilizarea unui test parametric. Într-o situaţie de acest gen este aplicabil testul „Mann-Whitney U” pentru date ordinale. Pe ultima coloană a fiecărui tabel găsim transformarea în ranguri a valorilor variabilei dependente. Rangul reprezintă poziția pe care o are o anumită valoare după ordonarea variabilei descrescător sau descrescător. Atribuirea rangului cel mai mare valorii celei mai mari, sau valorii celei mai mici, nu este nerelevantă. Oricare dintre variante conduce la acelaşi rezultat, dar trebuie reflectată corespunzător în interpretarea finală. Dacă toate valorile sunt distincte, fiecare valoare primeşte un rang propriu. Atunci când există valori identice, vom avea aşa numitele ranguri exaequo, care pot fi calculate, opţional, în două moduri: a) Atribuirea rangului mediu. Toarte valorile identice primesc un rang egal cu media aritmetică a rangurilor cuvenite valorilor identice. De exemplu, dacă avem două valori identice, iar primei valori i-ar corespunde rangul 8, celei de-a doua i-ar reveni rangul 9, putem atribui ambelor valori rangul 8.5. Apoi, următoarea valoare distinctă va primi rangul 10, şi aşa mai departe. b) Atribuirea rangului cel mai mic sau a celui mai mare. Toate valorile identice primesc, fie primul rang, fie ultimul, din cele corepsunzătoare valorilor identice. În exemplul de
1

Desemnat uneori şi sub numele „Wilcoxon-Mann-Withney”, sau „testul U”

1
Actualizat la: 1/2/2007 9:10 PM

M. Popa - Teste neparametrice pentru date ordinale
la punctul a), atât prima cât şi a doua valoare pot primi rangul 8 sau rangul 9. Mai departe, urmatoarea valoare distinctă va primi rangul 10, şi aşa mai departe. c) Atribuirea secvenţială. Valorile identice primesc primul rang disponibil, iar urmatoarea valoare distinctă primeşte rangul următor. În acest fel, rezultă mai puţine ranguri decât numărul valorilor distribuţiei. Exemplificarea modului de obţinere a rangurilor ex-aequo:
Valoare (a) (b) (b) (c) Medie Rang mic Rang mare Secvenţial 10 1 1 1 1 15 3 2 4 2 15 3 2 4 2 15 3 2 4 2 16 5 5 5 3 20 6 6 6 4

Alegerea unuia sau altuia din aceste moduri de atribuire a rangurilor ex-aequo este la latitudinea analistului. Programul SPSS oferă opţiunea alegerii oricăreia dintre ele. În cazul datelor de mai jos am optat pentru ranguri ex-aequo calculate pe baza mediei rangurilor: „Premiu” „Premiu” Rang Rang Masculin2 Feminin (mil. lei) (mil. lei) „premiu” „premiu” 1 9 26 2 3 27 1 34 22 2 17 25 1 35 21 2 26 24 1 43 18.5 2 32 23 1 56 14 2 36 20 1 61 12 2 43 18.5 1 62 11 2 44 17 1 64 10 2 47 16 1 67 9 2 51 15 1 67 9 2 59 13 1 70 7 nB=10 ΣRB=198.5 1 75 6 1 80 5 1 87 4 1 88 3 1 110 2 1 200 1 nA=17 ΣRA=180.5 Atenţie, premiile celor două grupuri sunt aranjate aici în două tabele diferite, doar pentru a favoriza obţinerea valorilor de calcul. În realitate, valorile premiului anual trebuie văzute ca

Valoarea “1” este un cod numeric convenţional asociat genului masculin, iar “2” un cod convenţional pentru genul feminin. Utilizarea lor aici are doar scopul de a sugera că “genul” este variabila independentă a cercetării şi primeşte două valori. Atunci când se va utiliza un program statistic pentru calcularea testului, variabila independentă va trebui să fie creată, cu valorile aferente, ca în acest exemplu.

2

2

M. Popa - Teste neparametrice pentru date ordinale
fiind plasate pe o singură distribuţie, iar rangurile stabilite în raport cu toate valorile, indiferent de apartenenţa lor la un grup sau altul. Procedura de calcul: Se calculează două valori U, corespunzătoare grupurilor A (masculin) şi B (feminin), astfel:

U A = n A * nB +
respectiv,

n A * (n A + 1) − ΣR A 2

(formula 5.1)

U B = n A * nB +
unde:

n B * (n B + 1) − ΣR B 2

(formula 5.2)

nA şi nB reprezintă volumul celor două grupuri independente care compun eşantionul ΣRA şi ΣRB reprezintă suma rangurilor pentru fiecare din cele două grupuri Vom observa că expresia din mijlocul formulei exprimă chiar suma rangurilor de la 1 la nA, respectiv, de la 1 la nB. Dacă, de exemplu, toate rangurile grupului A ar fi mai mici decât ale grupului B (fără nici o suprapunere între valorile celor două grupuri), atunci acest termen al formulei ar fi egal cu ΣRA, iar UA ar fi egal cu nA*nB. În acest caz UB ar fi egal cu 0, deoarece UA+UB=nA*nB. Dacă însă rangurile unui grup tind să se grupeze spre zona superioară (sau inferioară), atunci valoarea U a acelui grup va fi cu atât mai mare (sau mai mică) decât nA*nB. Pe această particularitate se bazează evaluarea semnificaţiei diferenţei dintre rangurile celor două grupuri. Pentru exemplu nostru:

U A = 17 *10 +
respectiv,

17 * 18 − 180.5 = 170 + 153 − 180.5 = 142.5 2

U B = 17 * 10 +

10 *11 − 198.5 = 170 + 55 − 198.5 = 26.5 2

Valoarea testului Mann-Whitney este dată de valoarea U cea mai mică, în cazul nostru UB (26.5). Decizia statistică se ia prin compararea valorii U celei mai mici cu valoarea citită în tabelul valorilor critice pentru testul Mann-Whitney U, în funcţie de nivelul alfa, nA şi nB (Anexa 7). Practic, în cazul testului U decizia statistică se ia astfel: • Se respinge ipoteza de nul dacă valoarea U calculată este mai mică sau egală cu valoarea critică tabelară.

3

M. Popa - Teste neparametrice pentru date ordinale
• Se acceptă ipoteza de nul dacă valoarea U calculată este mai mare decât valoarea critică tabelară.

Logica acestei decizii pare să fie contrară raţionamentului aplicat în cazul altor teste statistice, unde, pentru a respinge ipoteza de nul, trebuie să avem o valoare calculată mai mare decât cea critică. Să ne gândim însă că în cazul testului Mann-Whitney considerăm drept valoare calculată una dintre cele dintre două valori U, şi anume pe aceea care este mai mică. Ipoteza de nul afirmă că cele două sume ar trebui să fie egale, dacă diferenţa dintre suma rangurilor celor două eşantioane comparate ar fi nesemnificativă. Cu cât una dintre valorile U calculate, este mai mică, cu atât cealaltă sumă este mai mare. În consecinţă, o valoare U calculată mai mică sau egală cu U critic, justifică respingerea ipotezei de nul. În general, tabelele de decizie pentru testul Mann-Whitney nu acoperă decât parţial situaţiile posibile şi nu trec de valori ale lui nA şi nB mai mari de 20. Pentru exemplul nostru valoarea critică corespunzătoare pentru U0.05;17:10=48 (dacă preferăm aproximarea, mai conservatoare, nA=18). Deoarece UB<U0.05;17:10 ipoteza de nul se respinge şi se acceptă ipoteza cercetării. Ca urmare, concluzia cercetării este aceea că nivelul primelor anuale este semnificativ diferit pentru bărbaţi faţă de femei3. Afirmam mai sus că tabelele statistice pentru testul Mann-Whitney U nu se referă la grupuri mai mari de 20. Aceasta deoarece, de la acest volum în sus, distribuţia valorilor testului poate fi aproximată de curba normală z, iar testul poate fi calculat cu formula următoare:

z=

ΣR A − 0.5 * n A * ( n A * nB * (

+ 1)
(formula 5.3)

+ 1) / 12

unde N=nA+nB Valoarea lui z astfel obţinută este comparată cu valorile critice tabelare de pe curba normală, corespunzătoare nivelului alfa ales, unilateral sau bilateral. Publicarea rezultatului La publicarea rezultatului pentru testul Mann-Whitney U se vor indica: volumul grupurilor comparate (nA şi nB) valoarea testului (U) pragul de semnificaţie (p). ***

Desigur, nu se poate invoca neapărat o discriminare de sex în acordarea primelor dacă poziţiile profesionale ocupate de subiecţii cercetării sunt diferite. Rezultatul poate sugera, însă, că bărbaţii ocupă poziţii profesionale mai înalte decât femeile.

3

4

M. Popa - Teste neparametrice pentru date ordinale
TEMA PENTRU ACASĂ Un cercetător doreşte să verifice dacă băieţii crescuţi de către mame singure manifestă un nivel mai ridicat al trăsăturii „feminitate” decât băieţii crescuţi în familii bi-parentale. Primul grup (A) cuprinde 10 subiecţi, al doilea, (B) este format din 8 subiecţi. Evaluarea „feminităţii” s-a făcut pe baza unui chestionar specializat, cotat cu un scor numeric. Numărul subiecţilor nu permite aplicarea unui test t pentru eşantioane independente, motiv pentru care se decide utilizarea testului Mann-Whitney (U). Datele cercetării: (valorile exprimă scorul la trăsătura "feminitate") Provenienţa A A A A A A A A A A B B B B B B B B Scor „feminitate” 14 12 15 9 10 13 15 11 14 12 10 7 12 8 6 4 3 5 Care este valoarea testului Mann-Whitney (U)? Care este decizia statistică şi ce concluzie trage cercetătorul?

5

M. Popa - Teste neparametrice pentru date ordinale

Testul Kruskal-Wallis pentru mai mult de două eşantioane independente
Pentru evaluarea diferenţei la nivel de ranguri între mai mult de două eşantioane independente se utilizează testul Kruskal-Wallis. Acesta poate fi asimilat unei analize de varianţă pentru date ordinale. Să presupunem că dorim să vedem dacă există diferenţe în abilitatea de a rezolva o sarcină de reprezentare spaţială la trei categorii profesionale aeronautice, piloţi (grup 1), controlori de trafic aerian (grup 2) şi navigatori de bord (grup 3). În acest scop a fost aplicat un test de reprezentare spaţială unui număr de şase piloţi, trei controlori de trafic şi patru navigatori de bord. Rezultatul este unul numeric (scorul la test), dar, dat fiind numărul foarte mic al subiecţilor, aplicarea testului ANOVA este nepotrivită. Ca urmare, alegem soluţia conversiei rezultatelor în valori de rang (pentru toate grupurile luate împreună) şi utilizăm un test pentru date ordinale. Datele pentru acest exemplu sunt prezentate în tabelul următor: Scor Grup reprez. rang profesional spaţială 1 23 2 1 16 6 1 15 7 1 10 11 1 9 12 1 21 3 2 18 5 2 14 8 2 11 10 3 25 1 3 19 4 3 13 9 3 7 13 Tabelul prezintă datele cercetării. Variabila „grup” este una de tip nominal, fiecare din cele trei grupuri fiind codificat cu o valoare convenţională (1=pilot, 2=controlor de trafic, 3=navigator de bord). Variabila „scor reprez.spaţială”, este de tip numeric şi reprezintă scorul la test. Variabila „rang” conţine poziţia a fiecărui subiect sub aspectul reprezentării spaţiale, în raport cu toate valorile înregistrate. Formula de calcul pentru testul Kruskal-Wallis (notat cu H) este următoarea:

H=

*(

12

 Ti 2  * ∑   − 3 * ( + 1) + 1) i =1  ni   
k

(formula 5.4)

unde: H este valoarea calculată a testului K-W N este volumul total al eşantionului n este volumul grupurilor (N=n1+n2+n3+...+nk) K este numărul grupurilor independente T este suma rangurilor care va fi calculată pentru fiecare grup

6

M. Popa - Teste neparametrice pentru date ordinale
Înlocuind valorile corespunzătoare exemplului, obţinem:

H=

 412 23 2 27 2  12  − 3 * 14 = 0.06593 * 638,74 − 42 = 0,1121 * + + 13 * 14  6 3 4   

Valorile distribuţiei de nul ale lui H urmează forma distribuţiei chi-pătrat care, ne amintim, are originea în valoarea 0. Cu cât sumele rangurilor pentru cele k grupuri sunt mai diferite între ele, cu atât valoarea testului este mai mare şi, potenţial, mai aproape de o variaţie semnificativă. Diferenţele mici dintre rangurile grupurilor conduc spre valori ale testului care tind spre 0 şi, implicit, nesemnificative. Valoarea critică a testului se citeşte din tabelul distribuţiei chipătrat pentru df=k-1. Există totuşi o excepţie, atunci când nici unul din grupurile comparate nu este mai mare de 6, situaţie în care decizia se ia cu ajutorul unei tabele speciale. În cazul nostru există un grup cu mai mult de cinci subiecţi. Ca urmare, scorul critic pentru alfa=0.05 şi 2 grade de libertate este 5.99. Deoarece H calculat este mai mic decât H critic, suntem nevoiţi să acceptăm ipoteza de nul şi să concluzionăm că cele trei categorii de subiecţi nu sunt diferite sub aspectul capacităţii de reprezentare spaţială. *** TEMA PENTRU ACASĂ Având în vedere faptul că volumul foarte redus al eşantionului (N=6), analizaţi prin intermediul testului Kruskal-Wallis datele temei pe care aţi avut-o la testul ANOVA. Un psiholog trebuie să recomande unui patiser culoarea glazurii pentru un nou tip de prăjitură, având de ales între verde, roşu şi galben. În acest scop alege 18 subiecţi, cărora le cere să efectueze o sarcină plictisitoare având la îndemână platouri cu prăjituri glazurate. Subiecţii sunt împărţiţi în trei grupe, fiecare primind prăjituri de o singură culoare. După un timp, numără câte prăjituri a mâncat fiecare subiect din cele trei grupuri şi construieşte tabelul următor. Verde 3 7 1 0 9 2 Roşu 3 4 5 6 4 6 Galben 2 0 4 6 4 1

Care este valoarea testului şi ce decizie ia cercetătorul?

7

M. Popa - Teste neparametrice pentru date ordinale

Testul Wilcoxon pentru două eşantioane perechi
Dacă avem subiecţi evaluaţi de două ori, pe o scală de interval, iar variabilele nu întrunesc condiţiile pentru utilizarea testului t al diferenţelor pentru eşantioane dependente, se poate apela la testul Wilcoxon. Acesta este un test care, deşi se aplică pe scale de interval/raport, utilizează proceduri de tip neparametric, apelând la diferenţele dintre valorile perechi şi la ordonarea lor. Este, din acest punct de vedere, un test de date ordinale. Exemplu Un psiholog evaluează frecvenţa conduitelor agresive după prezentarea unui film care are incluşi stimuli subliminali cu semnificaţie agresivă. Frecvenţa conduitelor agresive este măsurată înainte şi după vizionarea filmului. Rezultatele sunt sintetizate în tabelul următor. Cod „Înainte” „După” Subiect 9 8 1 14 17 2 10 17 3 11 12 4 12 15 5 9 13 6 10 14 7 14 2 8 „după”-„înainte” -1 3 7 1 3 4 4 -12 Modulul diferenţei 1 3 7 1 3 4 4 12 Rangul diferenţei 7.5 5.5 2.0 7.5 5.5 3.5 3.5 1.0 Semnul Diferenţei + + + + + + -

Coloanele tabelului prezintă etapele procedurii de calcul: • se calculează diferenţa dintre variabilele supuse testării • dacă sunt diferenţe nule, se elimină • se iau în considerare diferenţele în valoare absolută • se construiesc rangurile pentru diferenţele în valoare absolută • se marchează semnul diferenţelor pentru fiecare pereche de valori Din acest punct calcularea valorilor testului este simplă. Se calculează două valori T, astfel: T(-), prin însumarea rangurilor diferenţelor negative, şi T(+), prin însumarea rangurilor diferenţelor pozitive. Valoarea cea mai mică dintre ele este rezultatul testului Wilcoxon, al cărui nivel de semnificaţie se află prin compararea cu valorile critice dintr-o tabelă specială (Anexa 8), în funcţie de nivelul alfa ales şi de volumul eşantionului (N). Testul se fundamentează pe ideea că atunci când ipoteza nulă este adevărată, ar trebui ca suma rangurilor pentru diferenţele pozitive să fie egală cu suma rangurilor pentru diferenţele negative. Pe măsură ce diferenţa dintre cele două sume este mai mare, ne îndepărtăm de condiţia ipotezei de nul. Decizia statistică pentru acest test se ia în felul următor: • atunci când valoarea calculată este mai mică sau egală decât valoarea critică tabelară, ipoteza de nul se respinge, iar ipoteza cercetării se confirmă; • atunci când valoarea calculată este mai mare decât valoarea critică tabelară, ipoteza de nul se acceptă, iar ipoteza cercetării nu se confirmă. Logica acestei decizii este similară celei aplicate în cazul testului Mann-Whitney. Valoarea calculată a testului este valoarea T cea mai mică, fie cea pozitivă, fie cea negativă. Ipoteza de nul afirmă că cele două sume ar trebui să fie egale, dacă diferenţa dintre prima şi a doua măsurare ar fi nesemnificativă. Cu cât una dintre valorile T calculate, fie cea cu plus, fie cea

8

M. Popa - Teste neparametrice pentru date ordinale
cu minus, este mai mică, cu atât cealaltă sumă este mai mare. În consecinţă, un T calculat mai mic sau egal cu T critic justifică respingerea ipotezei de nul. Pentru exemplul nostru, T(+)=28.5 iar T(-)=8.5. Acesta din urmă devine rezultatul testului. Valoarea calculată (8.5) este mai mare decât valoarea critică (4) pentru N=8 şi alfa=0.5 bilateral. Ca urmare, suntem nevoiţi să acceptăm ipoteza de nul, considerând neconfirmată ipoteza cercetării. Concluzia cercetării, pentru exemplul dat, este aceea că datele studiului nu confirmă existenţa unei relaţii între prezenţa stimulilor subliminali şi frecvenţa conduitelor agresive, după vizionarea filmului. Aproximarea normală a distribuţiei testului Mann-Whitney Ca şi în cazul testului Mann-Whitney, pentru eşantioane mai mari de 20 distribuţia de nul a testului Wilcoxon poate fi aproximată prin distribuţia normală. Formula de calcul pentru acest caz este următoarea:

Z=

n * (n + 1) * (2n + 1) / 24

T − [n * (n + 1)] / 4

(formula 5.5)

Exceptând situaţiile în care se operează pe eşantioane mici, ca în exemplul de mai sus, calculele sunt destul de laborioase. Din fericire, toate programele avansate de statistică oferă proceduri pentru calcularea automată a acestor teste statistice. Consideraţii finale Atunci când rezultatul testului este semnificativ, enunţarea concluziei şi interpretarea rezultatului vor ţine cont de modul de atribuire a rangurilor, cu alte cuvinte, dacă rangul 1 a fost atribuit valorii celei mai mari, sau celei mai mici. O problemă apare atunci când există diferenţe egale cu zero între rangurile perechi (valori de rang egal). Unii statisticieni recomandă eliminarea cazurilor care dau diferenţe egale cu zero şi, implicit, reducerea volumului eşantionului cu aceste cazuri. O abordare mai riguroasă este aceea de a păstra valorile zero, dar atribuind arbitrar semnul + la jumătate dintre ele şi semnul – la cealaltă jumătate. În situaţia în care există un număr impar de diferenţe egale cu zero între rangurile celor două evaluări, se va elimina una dintre ele (reducând N cu 1), după care se aplică regula enunţată anterior. **** TEMA PENTRU ACASĂ Având în vedere numărul mic al subiecţilor cercetării din tema pentru acasă de la testul t pentru eşantioane dependente, refaceţi calculele utilizând testul Wilcoxon: Ne propunem să scoatem în evidenţă efectul stresului temporal (criza de timp) asupra performanţei de operare numerică. În acest scop, selectăm un eşantion de subiecţi cărora le cerem să efectueze un test de calcule aritmetice în două condiţii experimentale diferite: prima, în condiţii de timp nelimitat, cu recomandarea de a lucra cât mai corect; a doua, în condiţii de timp limitat, cu condiţia de a lucra cât mai repede şi mai corect în acelaşi timp. Rezultatele celor două reprize sunt cele din tabelul alăturat. Să se rezolve următoarele sarcini:

9

M. Popa - Teste neparametrice pentru date ordinale

Fără criză de timp 67 79 83 80 99 95 80 100

Cu criză de timp 65 73 70 85 93 88 72 69

Care sunt valoarea testului, decizia statistică şi concluzia cercetării în acest caz?

Testul Friedman pentru măsurări repetate
Să presupunem că un psiholog doreşte să studieze relaţia dintre stilurile de conducere (laissez-faire, democratic şi autoritar) asupra nivelului de satisfacţie profesională. În acest scop el poate constitui un grup de cercetare pe care să îl supună, în momente succesive, celor trei tipuri de conducere. Un alt model ar putea fi constituirea a trei eşantioane perechi, astfel constituite încât fiecărui subiect dintr-un eşantion să îi corespundă câte un subiect „echivalent” din fiecare dintre celelalte două eşantioane (criteriile de echivalenţă pot fi: sexul, vârsta, nivelul de inteligenţă, gardul de motivare, etc.). Dar, oricare dintre variantele pe care l-ar alege cercetătorul, din punct de vedere statistic el ar obţine o structură de date identică: trei serii de evaluări ale satisfacţiei (variabila dependentă), pentru aceiaşi subiecţi (sau perechi de subiecţi) corespunzătoare celor trei stiluri de conducere. Dacă variabila dependentă ar fi măsurată pe o scală de interval/raport, testul parametric adecvat este unul pe care nu l-am tratat până acum, „ANOVA pentru măsurări repetate”. În lipsa lui, şi presupunând că variabila dependentă nu întruneşte condiţiile unui test parametric, soluţia problemei este testul Friedman pentru date ordinale. Pentru aplicarea lui este suficient ca valorile variabilei dependente să fie ordonate după rang, ca în tabelul alăturat. Facem precizarea că, în acest caz, ordonarea după rang se face la nivelul fiecărui set de evaluări perechi: Democratic 1 2 1 1 1 2 T1=8 Laissez-faire 2 1 2 2 2 1 T2=10 Autocratic 3 3 3 3 3 3 T3=18

1 2 3 4 5 6 =6

Testul Friedman (Fr) pune în evidenţă în ce măsură rangurile evaluărilor repetate diferă cu adevărat (statistic semnificativ) unele de altele, după formula:

10

M. Popa - Teste neparametrice pentru date ordinale
c 12 2 * ∑ Ti − 3 * * c * (c + 1) i =1

Fr =
unde:

* (c + 1)
(formula 5.6)

c este numărul măsurărilor repetate N este volumul seturilor de evaluări perechi Ti este suma rangurilor corespunzătoare fiecărui moment de măsurare La fel ca şi în cazul testului H (Kruskal-Wallis), distribuţia de nul a testului Friedman urmează forma distribuţiei chi-pătrat pentru df=c-1. Introducem valorile cercetării în formulă:

Fr =

12 * 8 2 + 10 2 + 18 2 − 3 * 6 * 4 = 0,1666 * 488 - 72 = 9.3 6 *3* 4

(

)

Valoarea critică tabelară (vezi tabela chi-pătrat) pentru df=3-1=2, este 5.99. Valoarea calculată fiind mai mare, se respinge ipoteza de nul şi se consideră confirmată ipoteza cercetării: nivelul satisfacţiei profesionale variază semnificativ în funcţie de stilul de conducere. Testul Friedman poate fi aplicat şi în cazul a doar două măsurări, situaţie în care devine similar testului semnului. La fel ca şi celelalte teste pentru date ordinale, el este afectat de existenţa rangurilor atribuite ex-aequo, pentru valori identice. În astfel de cazuri este recomandabilă aplicarea unei corecţii în formula de calcul, pe care nu o vom prezenta aici, în speranţa că utilizarea programelor specializate va face, oricum, corecţiile necesare. *** TEMA PENTRU ACASĂ Un neurofiziolog doreşte să verifice dacă există o relaţie între leziunea cerebrală stângă şi tipul de deficit de memorie de scurtă durată, în trei tipuri de sarcină diferite: cifre, litere, litere şi cifre amestecate. Un număr de cinci subiecţi cu leziune cerebrală stângă au efectuat teste de memorie distincte, pe şiruri de cifre, litere şi combinaţii de cifre şi litere. Performanţa înregistrată marchează şirul cel mai lung memorat pentru fiecare test în parte. Datele cercetării: (valorile semnifică lungimea şirului memorat) Subiectul Cifre Litere Cifre/Litere A 6 5 6 B 8 7 5 C 7 7 4 D 8 5 8 E 6 4 7 F 7 6 5 Care este valoarea testului Friedman? Care este decizia statistică şi ce concluzie trage cercetătorul?

11

M. Popa - Teste neparametrice pentru date ordinale

Coeficientul de corelaţie pentru date ordinale (Spearman)
Testele Wilcoxon şi Friedman sunt utilizate pentru a pune în evidenţă diferenţele dintre două sau mai multe eşantioane perechi (situaţie care, de regulă, se referă la măsurări repetate pe aceiaşi subiecţi). Atunci când avem două variabile ordinale şi suntem interesaţi în evaluarea gradului de asociere între ele, vom utiliza un test similar coeficientului de corelaţie pentru date de interval care este coeficientul de corelaţie a rangurilor (Spearman). Aşa cum ne amintim, coeficientul de corelaţie Pearson (r) ne dă măsura intensităţii legăturii dintre două variabile exprimate pe scale de tip interval/raport. Mecanismul de calcul se bazează pe transformarea valorilor ambelor variabile în scoruri z, adică pe convertirea acestora în „distanţă standard” faţă de medie. Pentru datele de tip ordinal, modalitatea de calcul a coeficientului de corelaţie se bazează pe poziţia relativă a unei valori faţă de celelalte. Coeficientul de corelaţie a rangurilor Spearman (rS) are acelaşi domeniu de variaţie (-1/+1) şi se interpretează în acelaşi mod ca şi coeficientul de corelaţie pentru date parametrice Pearson. Exemplu: Problema cercetării. Într-un studiu cu privire la ameliorarea sistemului de evaluare a personalului, doi instructori urmează un program special de armonizare a evaluării. La sfârşitul programului ei sunt puşi să ierarhizeze personalul unui compartiment de muncă (N=10) din punctul de vedere al performanţei profesionale. Ipoteza cercetării. (pentru test bilateral) Evaluările celor doi instructori vor fi concordante. Ipoteza de nul. Între evaluările celor doi instructori nu există nici o legătură Criteriile deciziei statistice: • alfa= 0.05 • rS critic se citeşte într-un tabel special pentru coeficientul Spearman (Anexa 9). Valoarea se citeşte la intersecţia dintre linia corespunzătoare lui N (în acest caz nu se folosesc gradele de libertate) cu coloana corespunzătoare tipului de test (unilateral, bilateral) şi a nivelului α. Înregistrăm rS critic =0.648 Datele cercetării: RA G RA G Angajaţi Instructor Instructor I II A 3 2 B 1 3 C 7 5 D 6 4 E 10 10 F 5 8 G 9 7 H 8 9 I 4 6 J 2 1 Diferenţa (D) (R1-R2) 1 -2 2 2 0 -3 2 -1 -2 1 D2 1 4 4 4 0 9 4 1 4 1 ΣD2=32

12

M. Popa - Teste neparametrice pentru date ordinale
Formula de calcul pentru coeficientul de corelaţie a rangurilor Spearman este:

rS = 1 −

6 * ∑ D2 * ( 2 − 1)

(formula 5.7)

În care, prin înlocuirea cu valorile cercetării, obţinem:

rS = 1 −

6 * 32 192 =1− = 1 − 0.19 = 0.81 10 * (100 − 1) 990

Decizia statistică: rS calculat (0.81)≥ rS critic (0.684). Ipoteza de nul se respinge. Concluzia cercetării: Evaluările celor doi instructori sunt semnificativ concordante. Programul de instruire a avut efectul scontat. Interpretarea coeficientului de corelaţie Spearman În principiu, acesta se interpretează la fel ca şi coeficientul Pearson. rS= 0 0 > rS > 1 rS = 1.0 -1 > rS > 0 rS = -1.0 Cele două variabile nu variază concomitent, deloc Cele două variabile tind să crească sau să scadă concomitent, într-o anumită măsură Corelaţie pozitivă perfectă În timp ce o variabilă tinde să crească, cealaltă tinde să descrească Corelaţie negativă perfectă

Dacă probabilitatea aferentă valorii calculate a testului este mai mare decât 0.05, coeficientul de corelaţie va fi considerat nesemnificativ (are şanse prea mari să rezulte din întâmplare). Aceasta nu înseamnă că nu există o corelaţie între cele două variabile, ci doar că datele noastre nu au putut să o pună în evidenţă. Calcularea coeficientului de determinare (rS2) în cazul corelaţiei Spearman nu este uzuală, deşi există autori care o acceptă. Când se utilizează coeficientul de corelaţie Spearman: • • • Atunci când ambele variabile sunt de tip ordinal Atunci când una dintre variabile este de tip ordinal şi cealaltă este de tip interval/raport. În acest caz, variabila interval/raport se transformă mai întâi în valori de ordine de rang Atunci când ambele variabile sunt de tip interval/raport dar una sau ambele, prezintă valori extreme. În acest caz, prin transformarea în ordine de rang a celor două distribuţii, valorile extreme sunt anihilate, ele urmând să participe la corelaţie prin simpla poziţie în distribuţie şi nu prin nivelul lor absolut.

Formula 5.7 nu este considerată adecvată pentru situaţiile în care variabilele supuse corelaţiei prezintă multe ranguri ex-aequo. De aceea, un test alternativ pentru asocierea variabilelor ordinale este coeficientul de corelaţie a rangurilor Kendall tau. La fel ca şi coeficientul Spearman, Kendal tau ia valori între -1 şi +1. Similarităţile se opresc însă aici, deoarece coeficientul Kendall se calculează pe o cale diferită şi se fundamentează pe o estimare a parametrului populaţiei. Aceasta estimare se calculează ca probabilitatea concordanţei minus probabilitatea discordanţei dintre

13

M. Popa - Teste neparametrice pentru date ordinale
rangurile perechi. Nu vom analiza în amănunt procedura de calcul, dar vom prezenta modul de obţinere a coeficientului Kendall cu ajutorul programului SPSS în secţiunea următoare. Ambii coeficienţi sunt larg utilizaţi în studiile statistice, făcând, în acelaşi timp, şi obiectul unor dispute între statisticieni. Adesea, coeficientul Kendall este considerat mai adecvat datorită faptului că distribuţia acestuia se apropie de forma normală începând de la volume mai mici ale eşantioanelor. Chiar dacă, în calcule, pe aceleaşi date, cu cei doi coeficienţi se obţin valori uşor diferite, decizia statistică nu este, de obicei, diferită. *** TEMA PENTRU ACASĂ Într-o şcoală de pilotaj a fost organizat un curs de optimizare a evaluării elevilor de către instructori, cu scopul de a se uniformiza criteriile de evaluare. După terminarea cursului, doi instructori sunt puşi să efectueze, fiecare, un număr de ore de zbor cu aceiaşi 10 elevi, după care li se cere să facă o ierarhie a lor. Datele cercetării: (valorile din tabel exprimă poziţia de rang atribuită de instructori fiecărui elev) Elev A B C D E F G H I J Instructor 1 3 1 7 6 10 5 9 8 4 2 Instructor 2 3 2 6 7 10 4 8 9 5 1

Care este valoarea corelaţiei dintre evaluările celor doi instructori? Care este decizia statistică şi concluzia cercetării în acest caz?

14

M. Popa - Teste neparametrice pentru date ordinale
A EXE Anexa 7. Tabelul valorilor critice pentru testul Mann-Whitney U
nA/nB α 5 6 8 10 12 14 0 1 2 3 4 5 0.05 3 0 1 1 0.01 0.05 1 2 4 5 7 9 4 0 1 2 3 4 0.01 0.05 2 3 6 8 11 13 5 0 1 2 4 6 7 0.01 3 5 8 11 14 17 0.05 6 1 2 4 6 9 11 0.01 6 8 13 17 22 26 0.05 8 2 4 7 11 15 18 0.01 8 11 17 23 29 36 0.05 10 4 6 11 16 21 26 0.01 11 14 22 29 37 45 0.05 12 6 9 15 21 27 34 0.01 13 17 26 36 45 55 0.05 14 7 11 18 26 34 42 0.01 15 21 31 42 53 64 0.05 16 9 13 22 31 41 50 0.01 18 24 36 48 61 74 0.05 18 11 16 26 37 47 58 0.01 20 27 41 55 69 83 0.05 20 13 18 30 42 54 67 0.01 (sursa: Clocotici V., Stan A., 2000, Statistică aplicată în psihologie, Polirom) 16 6 2 11 5 15 9 21 13 31 22 42 31 53 41 64 50 75 60 86 70 98 79 18 7 2 12 6 18 11 24 16 36 26 48 37 61 47 74 58 86 70 99 81 112 92 20 8 3 14 8 20 13 27 18 41 30 55 42 69 54 83 67 98 79 112 92 127 105

15

M. Popa - Teste neparametrice pentru date ordinale
Anexa 8. Valorile critice pentru testul Wilcoxon
ivel de semnificaţie pentru test unilateral 0.01 0.005 ivel de semnificaţie pentru test bilateral 0.05 0.02 0.01 0 6 2 0 7 4 2 0 8 6 3 2 9 8 5 3 10 11 7 5 11 14 10 7 12 17 13 10 13 21 16 13 14 25 20 16 15 30 24 20 16 35 28 23 17 40 33 28 18 46 38 32 19 52 43 38 20 59 49 43 21 66 56 49 22 73 62 55 23 81 69 61 24 89 77 68 25 (sursa : Clocotici V., Stan A., 2000, Statistică aplicată în psihologie, Polirom) 0.025

16

M. Popa - Teste neparametrice pentru date ordinale
Anexa 9. Valorile critice pentru testul de corelaţie a rangurilor (Spearman)
test unilateral alfa=0.025 alfa=0.01 test bilateral alfa=0.05 alfa=0.02 0,886 0,943 0,786 0,893 0,738 0,833 0,683 0,783 0,648 0,745 0,623 0,736 0,591 0,703 0,566 0,673 0,545 0,646 0,525 0,623 0,507 0,601 0,490 0,582 0,476 0,564 0,462 0,549 0,450 0,534 0,438 0,521 0,428 0,508 0,418 0,496 0,409 0,485 0,400 0,475 0,392 0,465 0,385 0,456 0,377 0,448 0,370 0,440 0,364 0,432

N

alfa=0.05 alfa=0.10 0,900 0,829 0,714 0,643 0,600 0,564 0,523 0,497 0,475 0,457 0,441 0,425 0,412 0,399 0,388 0,377 0,368 0,359 0,351 0,343 0,336 0,329 0,323 0,317 0,311 0,305

Alfa=0.005 alfa=0.01 0,881 0,833 0,794 0,818 0,780 0,745 0,716 0,689 0,666 0,645 0,625 0,608 0,591 0,576 0,562 0,549 0,537 0,526 0,515 0,505 0,496 0,487 0,478

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

(sursa: http://www.netnam.vn/unescocourse/index.htm)

17