You are on page 1of 13

BIOSTATISTICA

CURS

Compararea mediilor testul t (student)
Compararea varianelor - testul F (Fisher)

Conf.dr. Lucian V. Boiculese
Teste de Ipotez
Se tie c n statistic obiectul fundamental const n luarea unei decizii chiar n
cazul existenei unei incertitudini. Decizia luat trebuie s fie corect i
independent (pe ct posibil) de lipsa de cunotin materializat prin
incertitudine. Variabilitatea datelor definete incertitudinea.
n cazul testelor de ipotez problema de baz const n elaborarea regulilor de
decizie n aa fel nct dintre variantele posibile s se aleag concluzia corect
cu o probabilitate acceptat ca satisfctoare mcar.
Se emit mai multe ipoteze i prin decizie se accept doar o ipotez ce se ncadreaz
n probabilitatea stabilit.
Ipoteza statistic reprezint o presupunere asupra parametrilor uneia sau unor
repartiii sau chiar asupra repartiiei n sine (spre exemplu verificarea normalitii
unei repartiii).
Testele statistice reprezint metode matematice de verificare a ipotezelor statistice.
Prin acestea se dorete a se verifica o ipotez care apoi se aplic populaiei de
date (dac este adevrat). Testarea se face pe baza eantionului de date. Astfel
orice decizie comport un anumit risc.
n enunarea unei ipoteze exist dou posibiliti:
Ipoteza nul notat H0 n care parametrii de comparat se consider egali. Spre
exemplu media populaiei 1 avnd date n eantionului 1 este egal cu media
populaiei 2 caracterizat de eantionul 2.

Ipoteza alternativ n care se consider cei doi parametri diferii.
2 1 0
: = H
2 1 1
: = H
Posibile erori

Statistica are ca scop luarea unei decizii o concluzie asupra analizei fcute.
Se pot comite n aceast situaie dou erori :
Eroare de tip I s se accepte n mod greit ipoteza alternativ H1, cnd n
realitate H0 este adevrat.
Eroare de tip II s se accepte n mod greit ipoteza nul H0, cnd n realitate
H1 este adevrat.
Situaiile posibile sunt prezentate n tabelul de mai jos.

Sistem decizional cu prag.
Situaie adevrat
Ipoteza H
0
este
adevrat
Ipoteza H
1
este
adevrat
D
e
c
i
z
i
e

p
r
i
n

t
e
s
t

Acceptare ipotez H
0
Nu exist eroare
Eroare tip II

Falsi negativi
Acceptare ipotez H
1

Eroare tip I

Falsi pozitivi
Nu exist eroare
Este de dorit ca aceste erori s fie ct mai mici posibil. Se cunoate c
exist o legtur invers proporional ntre ele. Putem micora eroarea dar
drept consecin, eroarea de tip II se va mri ntr-o anumit msur. ncercnd
s scdem valoarea obinem o cretere a erorii de tip I. Este clar c efectele
sunt contradictorii i un compromis trebuie acceptat, funcie de scopul urmrit.
Pentru luarea unei decizii se creeaz funcia discriminant statistic (forma matematic
a testului), a crei valoare calculat se compar cu valori tabelate ale tipului de
repartiie n care se ncadreaz.
Pe scurt paii de urmat n verificarea prin test statistic:
1. Enunarea ipotezei.
2. Alegerea parametrului de studiu (poate s fie coninut implicit n enunarea ipotezei).
3. Deducerea i calculul statisticii discriminante dorite prin regula de decizie.
4. Acceptarea sau respingerea ipotezei.

Testul Ipotezei Simple (o singur variabil aleatoare)
Acest test const n verificarea unei afirmaii asupra valorilor parametrilor
necunoscui ai unei repartiii.
Se poate verifica egalitatea dintre media unei populaii repartizate normal, cu o
anumit valoare cunoscut ca normal (sau un punct extrem, min sau max).
Testul Ipotezei Duble (dou variabile aleatoare)
Foarte frecvent n aplicaiile de tip medical (i nu numai) apare problema comparrii
unor parametri dintr-un eantion cu parametrii altui eantion (pot fi chiar din aceeai
populaie dar la momente diferite).
Presupunem c avem dou eantioane notate cu X cu valorile x
1
, x
2
, , x
n
respectiv
Y cu valorile y
1
, y
2
, , y
n
. Considerm c cele dou populaii sunt repartizate
normal.
Dorim s testm ipoteza H0:
x
=
y
, mediile sunt egale cu alternativa H1:
x
=
y
,
mediile sunt diferite.
Populaia 1
Populaia 2
Comparm !!!
Media1
M1
Media 2
M2

Difer
semnificativ
statistic ???!!!
P<0,05
Dispersiile
2 2
,
y x
o o se cunosc
n aceast situaie variabila V urmeaz o distribuie normal i va
avea dispersia echivalent
y
y
x
x
V
n n
2
2
2
o
o
o + = .
Funcia discriminant se va calcula cu formula:

( ) ( )
y
y
x
x
y x
V
V
n n
Y X
V
Z
2
2
o
o

o

+

=

=
Variabila Z este repartizat normal N(0,1).
Pentru specificaie bilateral simetric regiunea de acceptare va fi:
( ) o
o o
= < < 1
2 2
Z Zc Z P , cu o nivelul de semnificaie.
Pentru medii egale se calculeaz:
y
y
x
x
n n
Y X
Zc
2
2
o
o
+

=
Dac calculnd Zc se respect realia
2 o
Z Zc < , atunci acceptm
ipoteya H0 cu ncredere | = 1 - o. Astfel putem considera c mediile sunt
egale.
Dac relaia:
2 o
Z Zc > este respectat atunci nu putem accepta
ipoteza H0 i vom considera mediile ca fiind diferite.
Exemplu de calcul

Testul ipotezei duble
Compararea mediilor a
doua esantioane

Se creeaza variabila V
egala cu diferenta celor
doua variabile.





Decizia se ia functie de
valoarea calculata Zc
sau functie de valoarea
p corespunzatoare.
INTERPRETAREA GRAFICA IN CADRUL DECIZIEI MEDICALE
Prin calculul statisticii se deduce valoarea Zcalculat si corespunzator acesteia se poate
determina valoarea semnificatiei p calculate.
DECIZIA
Daca Zc>Zacceptat (tabelat) sau daca pcalculat < 0,05 decucem existenta dif. semn. stat.

Daca Zc<Zacceptat (tabelat) sau daca pcalculat> 0,05 nu exista dif. semn. stat.
COMPARAREA MEDIILOR A DOUA ESANTIOANE


SE POT APLICA TESTELE:

1 TESTUL Z IN SITUATIA IN CARE DATELE SUNT REPARTIZATE
NORMAL SI SE CUNOSC DISPERSIILE (CU VOLUM MARE DE DATE /
CEL PUTIN 30).

2 TESTUL T PENTRU DATE REPARTIZATE NORMAL DAR NU SE
CUNOSC DISPERSIILE (DACA VOLUMUL DE DATE ESTE MARE, PESTE
30 TESTUL T CONVERGE CATRE Z).

3 TESTUL ANOVA(analiza variantei) PENTRU VOLUM MARE DE DATE,
REPARTITIE NORMALA, VARIANTE EGALE (HOMOSCEDASTICITATE)


Testul t (doar pt. compararea a dou populaii prin eantioane)
Prezint variane diferite funcie de:

1 Datele sunt perechi (nainte / dup tratament)
2 Se cunoate c dispersiile sunt egale.
3 Dispersiile nu sunt egale (exista teste specifice de verificare a egalitii
dispersiilor).
Exista astfel 3 teste t cu formule dedicate. Informaia suplimentar aduce un
plus de cunotin ce poate ajuta determinarea semnificaiei statistice.



Testul ANOVA (analysis of variance / se compara mai multe eantioane)
Pentru dou sau mai multe populaii.
nainte de a aplica acest test trebuie sa ne asiguram c:

1 Eantioanele de lucru trebuie s fie independente.
2 Datele sa fie extrase din populaii repartizate normal.
3 Homoscetasticitate dispersiile sa fie egale


Verificarea egalitii varianelor (dispersiilor) TESTUL F (Fisher)

O variant a testului student se bazeaz pe ipoteza c datele au variane egale.
Cunoscnd aceasta putem aplica pentru compararea datelor testul t dedicat
astfel vom avea un rezultat mai precis calculat, ducnd n concluzie la o decizie
corect.

Verificarea egalitii varianelor se face cu testul F (Fisher).
Tehnica de lucru este standard, aadar vom calcula un nivel de semnificaie notat
p. Dac valoarea p este mai mic ca 0.05 atunci vom avea semnificaie statistic
deci diferen mare ntre dispersiile datelor. Dac valoarea p este peste 0.05 atunci
putem aproxima ca egale dispersiile celor dou populaii.

Excel testul F verificarea egalitii varianelor

1. Din grupul DATA se alege F-Test Two-sample for Varinces .
2. Se selecteaz seturile i se definete destinaia unde vor fi prezentate rezultatele.
3. Se lanseaz n execuie (clic pe OK).
4. Se citesc i se interpreteaz rezultatele.
Alegerea testului F din grupul de
analiz a datelor
Definirea seturilor de date i a
opiunilor de calcul
F-Test Two-Sample for Variances
SET2 SET1
Mean 6.718868 6.367376
Variance 10.75793 8.336785
Observations 106 141
df 105 140
F 1.290417
P(F<=f) one-tail 0.079424
F Critical one-tail 1.346838
Rezultatele calculate.
Nivelul de probabilitate p determin
semnificaia statistic.
Pentru acest caz p=0.079 ce este mai
mare ca 0.05 aadar putem aproxima ca
egale varianele.
F-Test Two-Sample for Variances
SET1 SET2
Mean 6.367376 6.718868
Variance 8.336785 10.75793
Observations 141 106
df 140 105
F 0.774944
P(F<=f) one-tail 0.079424
F Critical one-tail 0.74248
F-Test Two-Sample for Variances
SET2 SET1
Mean 6.718868 6.367376
Variance 10.75793 8.336785
Observations 106 141
df 105 140
F 1.290417
P(F<=f) one-tail 0.079424
F Critical one-tail 1.346838
Observaie ! F=sigma1^2/sigma2^2
Pentru a interpreta corect se selecteaz mai nti setul cu variana mai
mare. Valoarea statisticii F este raportul dintre cele dou dispersii. Astfel
comparaia se face cu valoarea 1, dac considerm raportul subunitar
(prima dispersie mai mic supra a doua) atunci valoarea calculat a lui F se
va apropia de 1(pentru lips diferen) deci va fi mai mare ca F critic ceea
ce va nsemna lipsa diferenei semnificative statistice ceea ce este invers
fa de regula general Fcalculat mai mare ca Fcritic.
CORECT !

You might also like