Professional Documents
Culture Documents
Pe lânga studiul asocierii dintre variabile, tehnicile statistice pot fi utilizate si pentru
determinarea diferentelor dintre grupuri. Aceste medode se utilizeaza frecvent în analiza
datelor în cercetarile experimentale.
În acest capitol vom prezenta acele tehnici parametrice care ne permit sa evaluam
efectele unei variabile independente (manipulate de cercetator) sau categoriale (vârsta,
sex, etc) asupra unei variabile dependente în situatia în care se va lucra cu una sau doua
grupe de subiecti.
Cu ajutorul acestor teste statistice se ridica problema daca diferentele constatate între
grupele de subiecti sunt datorate interventiei cercetatorului (variabilei independente),
caracteristicilor variabilei categoriale sau dimpotriva, întâmplarii.
Exista trei tipuri de tehnici principale care vor fi discutate în acest capitol:
1. Tehnici care privesc diferenta dintre un esantion si media populatiei din care
acesta face parte - "the one simple t Test";
2. Tehnici care privesc diferenta dintre doua grupe independente de subiecti – "the t
test for independent samples";
3. Tehnici care privesc diferenta dintre doua grupe dependente de subiecti – "the t
test for correlated samples".
În acest caz dorim sa aflam daca un esntion de subiecti difera de o populatie mai mare. Sa
presupunem ca un test de empatie a fost administrat pe o populatie mare de subiecti elevi
abia intrati la liceu (N= 1000), iar media obtinuta pe întreaga populatie testata a fost de
76. Când s-a efectuat acelasi test pe o clasa de elevi de n=32 subiecti, s-a obtinut media
de 81 si o estimare a abaterii standard de 9(s). Se pune problema daca elevii din aceasta
clasa au un nivel de empatie diferit de media specifica pentru clasa a IX-a.
Pentru solutionarea acestei probleme exista doua teste statistice adecvate, si anume testele
z si t.
Vom utiliza testul z daca:
se cunoaste abaterea standard a variabilei dependente la nivelul populatiei;
daca numarul de subiecti cuprinsi în esantionul comparativ este suficient de mare
(de regula peste 30 de subiecti).
În situatia în care una din cele doua conditii nu sunt îndeplinite, utilizam testul t pentru un
esantion.
Ca urmare, calculam testul t care valideaza sau infirma ipoteza nula potrivit careia, nu
exista nici o diferenta între media (m) obtinuta pe esantion de subiecti (n= 32) si media
(m ) obtinuta pe populatia din care a fost extras esantionul.
Ho: M = m
În cazul H1a ipoteza alternativa specifica ca exista o diferenta între cele doua medii fara a
arata directia acestei diferente. În acest caz avem de a face cu un test t bilateral (two-
tailed test).
În cazul H1b ipoteza alternativa specifica directia diferentei între cele doua medii - o
medie este mai mica (mare) decât cealalta datorita unor considerente teoretice. Aceasta
situatie necesita un test t unilateral (one-tailed).
Cele doua tipuri de test t utilizeaza aceeasi formula, specificul unilateral vs. bilateral
influentând doar valorile comparative prezente în tabelul lui t.
Înlocuind datele problemei prezentate în formula lui t data mai sus obtinem:
Urmatorul pas care trebuie facut dupa calcularea lui t este de a compara valoarea obtinuta
cu cea corespunzatoare în tabelul lui t. Daca valoarea calculata este mai mare decât cea
din tabel ipoteza nula este respinsa. Pentru aceasta sunt necesari trei pasi:
Revenind la problema data, urmeaza sa consultam tabelul lui t pentru a compara valoarea
obtinuta de noi t=3,14 cu valoarea prezentata în tabel pentru 31 df (grade de libertate)
pentru t bilateral la un prag de semnificatie de p£ .05.
Deoarece în tabel nu sunt prezentate valorile lui t pentru 31 df, ne uitam la valoarea cea
mai apropiata, dar anterioara acestor grade de libertate. Astfel, la 30 df, valoarea lui t
bilateral pentru un p < .05 este 2,042.
Se poate observa ca valoarea obtinuta de noi t=3,14 este mai mare decât valoarea din
tabel t=2,042, situatie care se interpreteaza astfel: ipoteza nula este respinsa, ca urmare
rezultatele obtinute nu pot fi puse în totalitate pe seama întâmplarii, deci exista o
diferenta semnificativa din punct de vedere statistic în ce priveste diferenta dintre cele
doua medii. Rezultatul obtinut se noteaza matematic astfel:
Marimea efectului
Indexul marimii efectului pentru testul t în cazul de fata este dependent de datele oferite
în problema:
a) Daca se cunoaste abaterea standard a populatiei, iar esantionul comparativ este sub 30
de subiecti (testul t), vom utiliza urmatoarea formula:
Daca nu se cunoaste abaterea standard a populatiei, iar esantionul de comparatie are sub
30 de subiecti (testul t) -cazul problemei data exemplu- avem o formula apropiata de
calcul a marimii efectului:
Marimea efectului obtinuta de noi a fost de .55 ceea ce înseamna ca am obtinut o valoare
medie. Revenind la întrebare: Cât de mare este aceasta diferenta? Putem afirma ca
diferenta statistica are o valoare medie.
În acest caz, se aplica testul z pentru ca stim valoarea abaterii standard a populatiei , iar
volumul esantionului de comparatie n era peste 30 subiecti (n=32).
Interpretarea valorii lui z obtinute se face raportând aceasta valoare la valorile
standardizate ale lui z. Spre deosebire de testul t, care necesita consultarea tabelului t în
vederea admiterii sau respingerii ipotezei nule, în cazul testului z, valoarea obtinuta se
confrunta cu patru valori standardizate:
În cazul de fata am obtinut un z = 3,53, valoare superioara celor prezentate mai sus. Acest
fapt înseamna ca ipoteza nula este respinsa, existând o diferenta semnificativa între
mediile celor doua grupe de subiecti care nu poate fi datorata în întregime întâmplarii.
Si în acest caz poate fi calculata marimea efectului, formula fiind asemanatoare cu prima
cu exceptia înlocuirii abaterii standard a esantionului comparat (s) cu abaterea standard a
populatiei (σ ).
Interpretarea lui d se face asemanator cu modelul explicat anterior. Putem trage concluzia
ca rezultatul obtinut, d=0,62, înseamna un efect de valoare medie.
Doua probleme trebuie clarificate de la început. Când aplicam testul t si când aplicam
testul z? Cum diferentiem esantioanele independente de cele dependente?
La prima întrebare, utilizam aceleasi criterii prezentate în cazul unui singur esantion
comparat cu o populatie anume. Se iau în considerare cunoasterea abaterii standard a
celor doua esantioane si a volumului acestora. În cazul esantioanelor dependente sau
independente, prima conditie este atinsa mult mai usor, de aceea criteriul hotarâtor în
alegerea tipului de test (t sau z) este volumul esantionului. Exista conform teoremei limita
centrala o evolutie a distributiei datelor în functie de numarul de subiecti. Se considera si
se accepta de majoritatea cercetatorilor, ca un esantion de 30 de subiecti sau mai mult are
o distributie normala a datelor z. Un numar mai mic de 30 de subiecti determina o
distributie asimetrica a datelor de tip t. Chiar daca se utilizeaza o împartire grosiera, s-a
stabilit de catre cercetatori urmatoarea clauza pentru cazul a doua esantioane:
a. Daca cele doua esantioane sunt alese la întâmplare pe baza situatiei lor naturale
(ex. Doua clase paralele, doua grupe de vârsta etc) se utilizeaza testele
independente.
b. Daca cele doua esantioane sunt în relatie unul cu celalalt prin interventia
experimentatorului se utilizeaza testele dependente. Uzual, exista doua situatii în
care avem de a face cu esantioane dependente:
• doua grupe de subiecti sunt formate dupa una sau mai multe caracteristic
prealabile. Spre exemplu, aplicam un test preliminar în functie de care împartim
subiectii pe grupe astfel încât grupele sunt echilibrate, fiecarui subiect din grupa A
corespunzându-i un participant din grupa B;
• o grupa de subiecti este testata de doua ori asupra aceleiasi variabile (pre-test si
post-test), experimentatorul fiind interesat de modificarile aparute între cele doua
testari.
Testul t independent
Primul grup de elevi a fost învatat sa citeasca analitic (începând cu litera si terminând cu
cuvântul) a obtinut o medie de 12,4 cuvinte/minut si o abatere standard de 1,5. Cel de-al
doilea grup a fost învatat sa citeasca într-o maniera sintetica (pornind de la asocierea
cuvântului cu o imagine pentru fiecare litera). S-a obtinut o medie de 10 cuvinte pe minut
si o abatere standard de 0,9. Se pune problema daca exista o diferenta semnificativa între
cele doua medii, implicit între cele doua strategii de învatare a citirii.
Pentru a rezolva aceasta problema trebuie sa identificam mai întâi metoda statistica care
trebuie utilizata. Observam ca grupele sunt independente, ca numarul subiectilor din
fiecare grupa este mai mic decât 30, ca urmare putem utiliza testul t independent.
Unde: M1 si M2 reprezinta mediile celor doua esantioane; EEM1-M2 reprezinta eroarea
standard a diferentei dintre cele doua medii.
Unde: s1² reprezinta dispersia primului grup (abaterea standard la patrat); s2² reprezinta
dispersia celui de-al doilea grup; n1 - numarul de subiecti din primul grup; n2 - numarul
de subiecti din al doilea grup.
Daca n1 este egal n2 avem o formula (a), aplicabila si în exemplul oferit, daca n1 este
diferit de n2 vom utiliza o alta formula (b).
a)
În cazul problemei date referitoare la deprinderea de a citi în clasa I dupa cele doua
metode, numarul de elevi din cele doua esantioane este egal (n1=n2=15), de aceea vom
aplica una din cele doua formule de calcul a erorii standard a diferentelor dintre medii (nu
si formula prezentata la punctul b). Deoarece se cunosc dispersiile (patratul abeterii
standard) si mediile esntioanelor la proba de performanta vom aplica prima formula, pe
care o vom integra în formula de calcul al testului t independent.
Dupa calcularea lui t independent va trebui sa comparam valoarea obtinuta cu valoarea
data în tabelul lui t. Pentru aceasta sunt necesari pasii intermediari descrisi în cazul lui t
pentru un esantion:
a. Stabilirea gradelor de libertate (pentru a cunoaste valoarea din tabel a lui t care va
fi comparata cu valoarea obtinuta de noi). Calcularea gradelor de libertate pentru
testul t independent se face astfel: df = (n1 + n2) - 2. În cazul de fata avem 28 df
(15 + 15 - 2) grade de libertate.
b. Al doilea pas intermediar este alegerea tipului de situatie a lui t, adica avem un
test t unilateral sau bilateral. În acest caz se utilizeaza testul t independent
bilateral. Daca cercetatorul dorea sa demonstreze ca strategia analitica este mai
eficienta decât cea sintetica (sau invers), adica M1 > M2 sau M1 < M2 s-ar fi
aplicat testul t independent unilateral.
c. Stabilirea valorii lui t conform pragului de semnificatie ales. Practica statistica
considera necesara stabilirea unui nivel de încredere de maximum 0,05(.05).
Urmarind în tabel valoarea lui t bilateral pentru 28 df si p de .05, gasim valoarea 2,048.
Deoarece valoarea gasita de noi t= 5,314 este mult mai mare decât cea din tabel
respingem ipoteza nula Ho: M1 = M2 si concluzionam ca exista o diferenta semnificativa
statistic în ce priveste performantele elevilor în citire în functie de strategia adoptata în
învatarea citirii de catre copii. Matematic vom scrie:
Deoarece rezultatul obtinut (5,314) este mai mare decât valorile tabelare a lui t pentru p
=.02 (2,467); p=.01 (2,763); sau p=.001 (3,674) putem prezenta rezultatul obtinut ca fiind
semnificativ si la acesta din urma valoare (exista 1 la 1000 sanse ca rezultatul obtinut sa
se datoreze întâmplarii). În acest caz notam: t(28) = 5,314, p< .001 test bilateral.
În cazul în care numarul de subiecti din cele doua grupe nu era egal (n1 ≠ n2) am fi
aplicat o alta formula pentru calculul lui t (formula ce includea dispersiile celor doua
grupe sau formula prezentata la punctul b). Dupa aflarea valorii lui t, se urmareste acelasi
algoritm prezentat mai sus.
Marimea efectului
Ea ofera informatii importante pe care testul t nu le ofera. Acesta din urma arata doar
daca ipoteza nula este respinsa si daca exista sau nu o diferenta semnificativa între
mediile celor doua grupe de subiecti. Marimea efectului arata care este efectul variabilei
independente în determinarea diferentei dintre medii. În cazul testului t independent avem
mai multe formule de calcul ale marimii efectului (d):
Unde : M1 si M2 sunt mediile celor doua grupe de subiecti; s înseamna estimarea abaterii
standard (la numnaratorul lui s vom avea N-1).
Întrebarea care se pune este care abatere standard trebuie aplicata. Exista o mare
controversa între statisticieni. Unii cred ca trebuie utilizata abaterea standard a grupului
de control daca acesta exista.
Unde: M1 si M2 sunt mediile celor doua grupe; n1 este numarul de subiecti dintr-o grupa
(n1 egal cu n2); s1² si s2² sunt dispersiile celor doua grupe (abaterile standard la patrat).
În cazul problemei oferite drept model se observa ca cele doua esantioane sunt egale (n1
= n2) si nu exista un grup de control (strategii analitice vs. strategii sintetice). Astfel vom
obtine:
Interpretarea lui d se face identic cu cea prezentata în cazul lui t pentru un esantion. Se
observa în acest sens ca valoarea obtinuta înseamna un efect mare al variabilei
independente (strategii analitice vs. sintetice) în determinarea rezultatelor la proba
performantiala de citire.
Dupa cum se observa formula de calcul a lui z în aceasta situatie este identica cu cea a lui
t independent pentru n1 = n2. Spre deosebire de testul t independent, testul z are aceeasi
formula si în cazul în care n1 ≠ n2.
Rezultatul obtinut este comparat cu cele doua valori standardizate z (1,96 pentru p < .05,
respectiv 2,58 pentru p < .01 pentru testul bilateral, respectiv cu 1,65 pentru p < .05,
respectiv 2,33 pentru p < .01 pentru testul unilateral). Algoritmul rezolvarii problemelor
care necesita testul z este asemanator cu cel prezentat în cazul lui z pentru un esantion.
Testul t poate fi utilizat prin formulele prezentate mai sus si în cazul esantioanelor mai
mari decât 30 de subiecti fiecare.
Testul t dependent
Dupa o perioada de 2 luni subiectii sunt retestati (post-test) utilizând aceeasi proba pentru
a observa daca nivelul lor de agresivitate a scazut în urma practicarii metodelor de
relaxare.
Unde: d este diferenta dintre pre-test si post-test, între pozitia unu în prima grupa si
pozitia unu din a doua grua s.a.m.d.;
sau
Dupa calcularea lui t dependent va trebui sa comparam valoarea obtinuta cu valoarea data
în tabelul lui t. Pentru aceasta vom utiliza acelasi algoritm descris în cazul lui t pentru un
esantion si t independent:
a. Stabilirea gradelor de libertate (pentru a cunoaste valoarea din tabel a lui t care va
fi comparata cu valoarea obtinuta de noi). Calcularea gradelor de libertate pentru
testul t dependent se face astfel: df = n-1. În cazul de fata avem 11 df (12 perechi
de date - 1) grade de libertate.
b. Al doilea pas intermediar este alegerea tipului de situatie a lui t, adica avem un
test t unilateral sau bilateral. Observam ca cercetatorul a presupus ca metodele de
relaxare vor conduce la scaderea nivelului agresivitatii. Ipoteza de lucru
(alternativa) este: H1: M1 > M2, în timp ce ipoteza nula este M1 = M2. În acest
caz se utilizeaza testul t independent unilateral. Daca cercetatorul dorea sa
demonstreze ca nivelul agresivitatii înainte de utilizarea relaxarii este diferit de
nivelul agresivitatii post-test adica M1 ≠ M2 ca ipoteza de lucru, atunci s-ar fi
aplicat testul t independent bilateral.
c. Urmarirea valorii lui t conform pragului de semnificatie ales. Practica statistica
considera necesara stabilirea unui nivel de încredere de maxim 0,05(.05).
Marimea efectului.
În cazul problemei date anterior nu putem calcula marimea efectului deoarece rezultatul
obtinut de noi nu a fost semnificativ statistic.
Testul z dependent
Asumptiile distributiei t
Pentru ca testele t studiate în acest capitol sa fie aplicate trebuie îndeplinite mai multe
conditii:
PROBLEME
2. Daca un cercetator alege sa utilizeze un nivel alfa de .01 ¾n locul unui alfa de .05
¾nseamna ca el stabileste un criteriu:
3. Valoarea medie pentru populatia pe care s-a etalonat o proba de extraversie este de 50,
iar abaterea standard este 10,2. Sa presupunem ca 16 persoane care lucreaza în comert cu
succes au obtinut o medie de 56,10 si o abatere standard de 10 la acelasi test. Calculati
testul t si scrieti concluziile.
9. Decideti daca în urmatoarele cazuri avem nevoie de un test t independent sau de un test
t dependent:
10. Stabiliti daca valoarea t sau z este semnificativa statistic în conditiile a doua
esantioane independente si în cazul testului bilateral:
d)
A 7 8 6 8 9 7 8 6 8 6
B 6 7 5 6 7 6 7 6 6 5
e)
A 7 8 6 8 9 7 8 6 8 6
B 6 7 5 6 7 6 7 6
11. Stabiliti daca valoarea t sau z este semnificativa statistic în conditiile a doua
esantioane corelate (dependente) în care:
a) n1 = 28; n2 = 28; s1 = 6; s2 = 5; m1 = 20,1; m2 = 23,5; r = -.61;
b)
A 34 22 25 31 27 32 29 26
B 38 19 36 40 36 31 36 37