You are on page 1of 10

TESTUL HI-PTRAT

compararea a dou distribuii observate n scopul


stabilirii fie a independenei dintre dou criterii
sau omogenitatea dintr-un tabel de contingen

Frecvenele sunt date de numrul de cazuri i nu


reprezint procente sau ranguri
Categoriile sunt exhaustive i mutual exclusive:
orice subiect poate aparine unei categorii dar
numai uneia

Variabila
calitativa

Tabel de
contingenta

Variabila
calitativa

Test Chi2

SEMNE DIAGNOSTICE
Esantion
reprezentativ

Se i Sp, VPP i VPN, LR


Prevalenta
Se i Sp, LR

Cazmartor
Expus nonexpus

sensibilit ate prevalenta


sensibilit ate prevalenta (1 specificit ate ) (1 prevalenta )
specificit ate (1 prevalenta )
VPN
specificit ate (1 prevalenta ) (1 sensibilit ate ) prevalenta
VPP

VPP i VPN, LR

FACTORI DE RISC
Esantion
reprezentativ

Cazmartor
Expus nonexpus

RIE, RIN, RR, RA


Prevalenta

OR

RIE, RIN, RR, RA

EXEMPLU
Astfel vom presupune c se caut efectul
fumatului asupra mbolnvirii de o maladie dat
(M). Pentru aceasta se observ un eantion de
400 de subieci dintre care:
160 au boala M prezent ( i 240 nu au boala
prezent )
130 sunt fumtori T ( i 270 nu sunt fumtori ).

TABEL DE CONTINGEN
Maladia M
Fumtor T
T

T
Total

Total

80
80

M
50
190

160

240

400

130
270

DECI
Se caut s se stabileasc dac fumatul
influeneaz apariia maladiei M sau dac
apariia acesteia este independent de fumat.
Tabelul de contingen prezentat anterior este
obinut prin observarea unui eantion de 400 de
indivizi. Acesta se numete tabel de contingen
observat, iar frecvenele pe care le conine se
numesc frecvene observate.

PRINCIPIUL TESTULUI

Astfel dac se face ipoteza de independen ntre cele dou


caractere M i T (adic ipoteza nul H0 , n acest caz)
atunci se poate calcula un tabel de contingen teoretic care
satisface aceast ipotez de independen. Se determin
apoi abaterea (ecartul ) dintre cele dou tabele de
contingen observat i teoretic.
Dac aceast abatere este mic atunci ea este explicat
doar prin ntmplare (hazard) i ipoteza de independen
este acceptat. Dac aceast abatere este foarte important
pentru ca doar ntmplarea s o explice atunci ipoteza de
independen trebuie s fie respins.
Pentru efectuarea testului este deci necesar s se tie:

calcula tabelul de contingen teoretic


determina ecartul dintre cele dou tabele de contingen.

CALCULUL

TABELULUI DE
CONTINGEN TEORETIC
Maladia M
Fumtor T
T

T
Total

Total

80
80

M
50
190

160

240

400

130
270

130 160
400

130 240
400

Total
130

270 160
400

270 240
400

270

Total

160

240

400

TABELUL DE CONTINGEN TEORETIC


M

T
Total

Total

52
160-52

M
130-52
270-(160-52)

160

240

400

M
T

T
Total

130
270

Total

52
108

M
78
162

160

240

400

130
270

OBSERVAIE
Se poate astfel constata c pentru un tabel de
contingen teoretic 2 x 2 este suficient s
calculeze o frecven teoretic pentru a putea
determina tabelul n ntregime.
Aceast proprietate se regsete i n cazul
general a unui tabel cu L linii i C coloane, unde
este uor de constatat c este suficient s se
calculeze primele (L-1) x (C-1) frecvene teoretice
celelalte obinndu-se prin diferene. Se va vedea
c produsul (L-1) x (C-1) definete numrul de
grade de libertate al lui 2

ECARTUL DINTRE CELE DOU TABELE DE


CONTINGEN

Fie fio i fit frecvenele observate i teoretice (i=1,2,..,n)


situate n aceleai poziii n cele dou tablouri (de
exemplu, f10=80 i f1t=52). Ecartul ntre cele dou
tabele notat cu X2 se calculeaz prin formula:

( fi0 fit )2
X
fit
i 1
2

LC

DISTRIBUIA

Se poate arta c dac ipoteza de independen este satisfcut atunci X2


determinat prin formula de mai sus se supune unei legi de probabilitate 2 (Hi-ptrat) cu
(L-1) x (C-1) grade de libertate.
Pentru aceast lege 2 se poate determina valoarea 2 ce corespunde pragului
de semnificaie i care verific condiia:
Pr( 2 2 ) = .
Cu ajutorul acestei valori se definete regiunea critic a testului [ 2 ,), unde sub
ipoteza nul, X2 are o probabilitate de a se gsi.

ETAPELE TESTULUI

Problema

Cazul general
Se ncearc s se determine, cu
ajutorul unui eantion de n
subieci, dac dou caractere A i
B avnd L i respectiv C
modaliti de realizare sunt sau nu
independente.

Ilustrarea printr-un exemplu


Fumatul (T) i o maladie (M) sunt
independente? In acest caz,
L=C=2, iar eantionul observat are
n=400 subieci repartizai n tabelul
de contingen prezentat mai sus.

ETAPA 1

Etapa 1.
Definirea
ipotezei nule H0

H0: caracterele A i B sunt


independente.
H0: fumatul nu are influen asupra
apariiei maladiei M.

ETAPA 2

LC
LC
Etapa 2.
( fi0 fit )2
( f 0 f t )2
2
urmeaz o X2 i t i
urmeaz o lege
t
Definirea unui X
fi
fi
i 1
i 1
parametru
lege 2 cu (L-1) x (C-1) grade de 2 cu 1 grad de libertate.
libertate

ETAPA 3

Etapa 3.
Pragul
semnificaie

Fie pragul de semnificaie al S-a ales pragul de semnificaie =


0.05
de testului.

ETAPA 4
Etapa 4.
Definirea
regiunii critice

innd seama de faptul c X2


urmeaz legea 2 cu (L-1) x (C1) grade de libertate se determin
valoarea 2 nct
P( 2 2 ) = . Regiunea
critic este [ 2 ,).

Pentru pragul =0.05 i 2 cu 1


grad de libertate valoarea 2 =
3.84, astfel c n acest caz regiunea
critic este intervalul [3.84 , ).

ETAPA 5

Etapa 5.
- Se calculeaz frecvenele
Calcularea valorii teoretice
observate
a t total linietotal coloana
fi =
parametrului
n
- Se calculeaz
( f 0 f t )2
X i t i
fi
i 1
2

LC

(80 52) 2
+
52
(50 78) 2 (80 108) 2
+
+
78
108

Se calculeaz X2=

(190 162) 2
=37.2
162

ETAPA 6
Etapa 6.
Decizia

Dac X2[3.84, ) se
respinge H0 cu un risc de
eroare de prima spe .
Dac X2[3.84, ) atunci H0
nu se respinge, acceptndu-se
H0 cu un risc de eroare de
spea a doua

X2 >> 3.84 aa c ipoteza nul H0


se respinge cu un risc inferior lui
5%.
In concluzie, fumatul se asociaz cu
maladia M favoriznd-o.