You are on page 1of 51

TABLAS DE CONTINGENCIA

INDICE
TABLAS DE CONTINGENCIA..................................................................................................... 3
CONCEPTOS GENERALES.......................................................................................................3
TABLAS DE ASOCIACIN: EXPOSICINENFERMEDAD............................................... 5
TABLAS 2X2 SIMPLES......................................................................................................... 5
Estudio t!"s#$s!%................................................................................................................&
Estudio d$ 'o(ot$s...............................................................................................................)
Estudio d$ '!sos * 'o"to%$s............................................................................................... +,
TABLAS 2X2 ESTRATIFICADAS...................................................................................... +-
TABLAS 2XN SIMPLES...................................................................................................... 2.
TABLAS 2XN ESTRATIFICADAS..................................................................................... 2,
BIBLIOGRAF/A.................................................................................................................... 25
TABLAS GENERALES............................................................................................................ 2&
TABLAS MXN...................................................................................................................... 2&
REGRESIN LOG/STICA....................................................................................................32
Co"'$0tos 1$"$!%$s........................................................................................................... 32
R$'o2$"d!'io"$s............................................................................................................... 5.
BIBLIOGRAF/A.................................................................................................................... 5+
TABLAS DE CONTINGENCIA
CONCEPTOS GENERALES
Analizar la distribucin de una variable con relacin a otra u otras es una tarea corriente en
Salud Pblica, vinculada, la mayora de las veces, a la bsqueda de un patrn que indique la
relacin, (o la falta de ella) entre las variables estudiadas. ste es un proceso clave en la
identificacin de las posibles causas de los problemas de salud, y tambi!n de factores que, aun
cuando no puedan ser finalmente considerados causales, resulten estar asociados a estos da"os
y constituyan importantes elementos pr#cticos para la identificacin de $rupos con mayores
ries$os de padecer determinado da"o.
l estudio de la influencia de una variable (variable independiente) sobre la forma en que se
modifica otra (variable dependiente) es conocido como an#lisis bivariado% y ser# multivariado
cuando el estudio evale de forma simult#nea el efecto sobre una variable dependiente de dos o
m#s variables independientes.
&as tablas de contin$encia (tablas de doble entrada) son una 'erramienta fundamental para este
tipo de an#lisis. st#n compuestas por filas ('orizontales), para la informacin de una variable y
columnas (verticales) para la informacin de otra variable. stas filas y columnas delimitan
celdas donde se vuelcan las frecuencias de cada combinacin de las variables analizadas. n su
e(presin m#s elemental, las tablas tienen solo ) filas y ) columnas (tablas de )())% en pidat *.+
estas tablas presentan la si$uiente estructura tipo,
Enfermedad
Factor de riesgo S No Total
Expuestos ... ... ...
No expuestos ... ... ...
Total ... ... ...
donde las filas identifican el nivel de e(posicin a la variable en estudio y las columnas la
cate$ora en relacin a la enfermedad (y las personas-tiempo en el caso de utilizar tasas de
incidencia).
n $eneral, las tablas pueden abarcar varias filas (.) y columnas (/). l an#lisis puede
ocasionalmente involucrar m#s variables% por e0emplo, puede considerarse una tercera variable,
cada una de cuyas clases d! lu$ar a una tabla de .(/.
n muc'os an#lisis subyacen dos 'iptesis. 1n e0emplo tpico es el caso en que se tiene una que
afirma la e(istencia de cierta asociacin entre las variables estudiadas. 2casionalmente, por su
estructura terica, el problema encarado permite 'ablar de una variable dependiente y de
variables independientes. 2tras veces, sin embar$o, el e(amen de la asociacin no est#
previamente direccionado. n cualquier caso, la otra 'iptesis afirma que no e(iste tal relacin y
que ambas variables tienen completa independencia ('iptesis nula). Salvo en situaciones muy
especiales, la simple inspeccin de la informacin contenida en las tablas de contin$encia no
permite ser concluyente sobre cu#l de las dos 'iptesis es la que 'a de ele$irse como v#lida.
*
Para e(aminar este problema, un primer paso puede ser calcular la frecuencia relativa de cada
celda (las medidas de frecuencia pueden ser diversas, prevalencia, incidencia acumulada,
densidad de incidencia, odds, etc.).
Sin embar$o, el an#lisis de la relacin entre las variables estudiadas es m#s directo cuando se
computan medidas de asociacin. stas medidas, basadas en la comparacin entre las
frecuencias del da"o en diferentes $rupos, pueden realizarse a trav!s de razones (razn de
prevalencias, ries$o relativo, odds ratio) o de sus diferencias (ries$o atribuible y fraccin
atribuible). 3inalmente, para evaluar la posibilidad de que los resultados observados sean solo
producto del azar, la estadstica cl#sica aporta una serie de m!todos y pruebas que permiten
pronunciarse al respecto. 4ic'as pruebas computan la probabilidad de 'aber obtenido los datos
empricamente observados, calculada ba0o el supuesto de que la 'iptesis de nulidad es correcta
(la cual se denota como 5p6). n $eneral, la mayora de los investi$adores traba0an con un nivel
de significacin del 78 (equivalentemente, con un nivel de confianza del 978), por lo que aceptan
que e(iste asociacin entre las variables estudiadas cuando el valor de p es menor que :,:7.
;anto las medidas de efecto como las pruebas estadsticas a utilizar, depender#n del dise"o del
estudio del que proceden los datos, del tipo de variables y cate$oras consideradas y de que se
'aya considerado o no m#s de un estrato (una tercera variable).
&as pruebas de si$nificacin estadstica que acompa"an el an#lisis basan su e(amen en
comparar los resultados observados con los esperados (ba0o el supuesto de que no 'ay
asociacin). <uanto mayor sea la diferencia entre la distribucin observada y la esperada, menos
razonable es suponer que la distribucin observada sea solo producto del azar.
l c#lculo de los valores esperados se realiza usando los valores mar$inales de la tabla,
asumiendo que la probabilidad para cada cate$ora es la misma que la de todo el $rupo y que no
e(iste asociacin entre las variables estudiadas.
Por e0emplo, en una situacin en la que se conoce que 'ay *:: individuos y que los valores
mar$inales son, por una parte, que +:: est#n enfermos y ):: sanos y, por otra parte, que =: de
los *:: estuvieron e(puestos a cierto factor de ries$o y )>: no, entonces los valores esperados
para cada celda pueden calcularse obteniendo el producto de los dos valores mar$inales de la
celda y dividi!ndolo por el $ran total. Por e0emplo, el nmero esperado de enfermos entre los
e(puestos ser# de =:(+::?*:: @ ):, y el de no enfermos no e(puestos, )>:()::?*:: @ +=:. l
resultado de ese cmputo de valores esperados para las celdas se muestra en la tabla si$uiente.
Enfermedad
Factor de riesgo S No Total
Expuestos ): >: 60
No expuestos A: +=: 240
Total 100 200 300
n la pr#ctica, en las tablas de )() solo sera necesario calcular el valor esperado de una celda,
porque los valores de las restantes se podr#n deducir del que !sta asuma y de los valores
mar$inales. n el e0emplo, si se espera que 'aya ): enfermos e(puestos, los A: enfermos
restantes ser#n no e(puestos. B como de los =: e(puestos solo ): est#n enfermos, los restantes >:
>
ser#n sanos. As, el valor de la celda correspondiente a los no enfermos no e(puestos no puede
ser otro que +=: para completar los ):: no enfermos.
sta dependencia e independencia de las celdas se conoce como grados de libertad y, como se vio,
en las tablas )() solo 'ay un $rado de libertad. l c#lculo de los $rados de libertad resulta de
multiplicar el nmero de columnas menos + por el nmero de filas menos +,
Crados de libertad @ (nD de columnasE+) ( (nD de filasE+)
&as pruebas de independencia basadas en las discrepancias entre frecuencias observadas y
esperadas slo son v#lidas en el caso de muestras $randes. Si la muestra es peque"a, se
recomienda utilizar m!todos e(actos, como la prueba de 3is'er, que calcula la probabilidad
e(acta de obtener los resultados observados si las dos variables son independientes y los totales
mar$inales son fi0os.
3inalmente, es importante considerar que para poder realizar estos c#lculos, las cate$oras de las
variables deber#n ser e(cluyentes y e('austivas. s decir, deber# evitarse que su definicin
permita que al$unas observaciones puedan pertenecer a ) m#s cate$oras as como que, por el
contrario, al$unas observaciones no sean incluibles en cate$ora al$una.
ste mdulo est# inte$rado por > submdulos,
;ablas de asociacin, e(posicinEenfermedad
;ablas de )() (simples y estratificadas)
;ablas de )(/ (simples y estratificadas)
;ablas $enerales
;ablas de .(/
Fe$resin lo$stica
pidat *.+ permite una entrada manual de los datos en las tablas )(), )(/ y .(/, y calcular# las
medidas de frecuencia, de asociacin o efecto y las pruebas especficas para cada dise"o de
estudio, tipo de variables y estructura de la tabla.
n el caso de tablas )(), pidat *.+ permite, de forma opcional, sumar :,7 a todas las frecuencias
de la tabla en el caso de que al$una de ellas sea i$ual a cero. Si no se activa esta opcin, el
pro$rama slo presentar# aquellos resultados susceptibles de ser computados.
Para el c#lculo de la re$resin lo$stica, los datos podr#n ser in$resados en forma manual o
desde un arc'ivo.
TABLAS DE ASOCIACIN: EXPOSICINENFERMEDAD
TABLAS 2X2 SIMPLES
&as tablas )() simples (de un nico estrato) permiten el an#lisis de ) variables dicotmicas,
tpicamente, una variable independiente (e(posicin) y una variable dependiente (enfermedad).
4ebe advertirse que esta es la situacin m#s comn y que es por ello que se usan las
denominaciones e(posicin y enfermedad, pero podra tratarse de otra situacin como la de un
7
ensayo clnico, por e0emplo, en la cual, en lu$ar de dos niveles de e(posicin tuvi!ramos dos
tratamientos y en lu$ar de enfermedad tuvi!ramos dos posibles desenlaces.
Gay cuatro opciones de tablas )() destinadas a cuatro dise"os de estudios epidemiol$icos,
studio transversal
studio de co'ortes
Para tasas de incidencia
Para incidencia acumulada
studio de casos y controles
studio de casos y controles empare0ados
Estudio transvrsa!
&os estudios transversales e(aminan la prevalencia de enfermedades y problemas de salud y
tambi!n de conocidos o potenciales factores de ries$o y?o proteccin. Se tratan b#sicamente de
una ima$en 5foto$r#fica6 de la poblacin, o de una muestra de ella, en la que se e(plora, a nivel
individual y en forma simult#nea, la presencia o ausencia (o niveles) de una o m#s variables
independientes y de una o m#s variables potencialmente dependientes de las primeras. Si bien
la ima$en de una foto$rafa da la sensacin de que en un estudio de este tipo la informacin se
recolecta en un 5instante6 (un da o pocos das), la recoleccin de datos puede ser m#s
prolon$ada (semanas o meses). Sin embar$o, la informacin de cada individuo se$uir# siendo
5una foto6.
ntre sus mayores venta0as est#n, en $eneral, su ba0o costo, su relativa facilidad de e0ecucin y la
posibilidad de obtener estimaciones puntuales de las prevalencias de varias enfermedades e
informacin de varios factores potencialmente determinantes en un mismo momento. ntre sus
mayores limitaciones est#n la dificultad (y con frecuencia, imposibilidad) para establecer la
relacin temporal entre lo que seran las e(posiciones y los da"os, la limitacin para obtener
incidencias y la vulnerabilidad a diferentes tipos de ses$os.
l formato que se usar# de la tabla para el an#lisis bivariado de variables dicotmicas de los
estudios transversales presentar# a la variable independiente (e(posicin) en las filas y la
variable dependiente (enfermedad o da"o) en las columnas,
Factor de riesgo o factor de
proteccin
Enfermedad o da!o
S No Total
Expuestos a b a H b
No expuestos c d c H d
Total a H c b H d a H b H c H d
&as salidas previstas en pidat *.+ son,
M$did!s d$ 3$'u$"'i!
Prevalencia de enfermedad en e(puestos y no e(puestos.
=
Prevalencia de e(posicin en enfermos y no enfermos.
M$did!s d$ !so'i!'i4"
Fazn de prevalencias de e(posicin e intervalo de confianza (Iatz).
Fazn de prevalencias de enfermedad e intervalo de confianza (Iatz).
2dds ratio e intervalo de confianza (Joolf y <ornfield).
.edidas de si$nificacin estadstica
;est Ki-cuadrado de asociacin, con y sin correccin.
Prueba e(acto de 3is'er y valor de p unilateral y bilateral.
E"emplo
1n estudio transversal para conocer la prevalencia de osteoporosis y su relacin con al$unos
factores de ries$o potenciales incluy a >:: mu0eres con edades entre 7: y 7> a"os. A cada una se
le realiz una densitometra de columna y en cada caso se complet un cuestionario de
antecedentes.
Para el e0emplo se consideran solo las variables dicotmicas osteoporosis y antecedentes de dieta
pobre en calcio. 4e las A: pacientes que presentaban osteoporosis 7A presentaban antecedentes
de dieta pobre en calcio, en tanto que entre las *): que no tenan osteoporosis, el nmero de
mu0eres con este antecedente era de =).
1na vez in$resados estos datos, la tabla se presentar# de la si$uiente manera,
#ntecedente de dieta po$re
en calcio
%steoporosis
S No Total
Expuestos 7A =) +):
No expuestos )) )7A )A:
Total A: *): >::
B los resultados que proporciona pidat *.+ ser#n,
Tablas de contingencia : Tablas 2x2 simples
Tipo de estudio : Transversal
Nivel de confianza: 95,0%
Tabla
Enfermos anos Total
!!!!!!!!!!!! !!!!!!!! !!!!!!!! !!!!!!!!
Expuestos 5" #2 $20
No expuestos 22 25" 2"0
!!!!!!!!!!!! !!!!!!!! !!!!!!!! !!!!!!!!
Total "0 %20 &00
'revalencia de la enfermedad Estimaci(n )*+95,0%,
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!! !!!!!!!!! !!!!!!!!!
L
En expuestos 0,&"%%%% ! !
En no expuestos 0,0-"5-$ ! !
.az(n de prevalencias #,$5$5$5 %,9550$$ 9,5#-"9- +/atz,
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!! !!!!!!!!! !!!!!!!!!
'revalencia de exposici(n Estimaci(n )*+95,0%,
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!! !!!!!!!!! !!!!!!!!!
En enfermos 0,-25000 ! !
En no enfermos 0,$9%-50 ! !
.az(n de prevalencias %,-&$9%5 2,""20"$ &,"5"%2& +/atz,
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!! !!!!!!!!! !!!!!!!!!
0. )*+95,0%,
!!!!!!!!! !!!!!!!!! !!!!!!!!!
$0,9-0#-& #,2&%-#" $9,2-#$%% +1oolf,
#,2#&%00 $9,20&"$5 +*ornfield,
'rueba 2i!cuadrado de asociaci(n Estad3stico 4alor p
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!! !!!!!!!!!
in correcci(n "#,0$$9 0,0000
*orrecci(n de 5ates "%,500- 0,0000
'rueba exacta de 6is7er 4alor p
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!
8nilateral 0,0000
9ilateral 0,0000
Prevalencia en expuestos y no expuestos. Por tratarse de estudios transversales, las frecuencias del
da"o se presentan como tasas de prevalencia puntualmente estimadas. stas tasas miden el
nmero de personas que presentaban el da"o en el momento del estudio en cada $rupo
(e(puestos y no e(puestos) en comparacin con el total de la poblacin en ambos $rupos.
Si la informacin recolectada en el estudio transversal re$istrase la ocurrencia de una
determinada enfermedad o da"o durante un perodo determinado (por e0emplo, se 'a inda$ado,
MGa presentado al menos un episodio convulsivo en los ltimos = mesesN), los datos obtenidos
'an de interpretarse como incidencias o ries$os. /tese que en tal caso el estudio es transversal
porque la pre$unta se formula en el momento actual, pero de 'ec'o es una pre$unta que, por su
naturaleza, contempla la precedencia temporal de los acontecimientos.
n el e0emplo, la prevalencia en los e(puestos fue de >A,*8 (7A de las +): mu0eres con
antecedentes de dieta pobre en calcio tenan osteoporosis), en tanto entre los no e(puestos la
prevalencia fue de L,98 ()) de )A:).
Razn de prevalencias. sta razn permite comparar la prevalencia de e(puestos con la de los no
e(puestos. <uando la prevalencia en e(puestos es m#s alta, la razn es superior a + y esto estara
indicando que la e(posicin aumenta el ries$o de tener ese da"o. Si la razn es menor que +,
estara indicando lo opuesto (sera un factor de proteccin). Si fuera i$ual a +, entonces la
prevalencia en ambos es similar, lo que su$erira que la e(posicin no est# relacionada con el
da"o.
A
l intervalo de confianza de la razn de prevalencias representa un recorrido de valores dentro
del cual 'ay una determinada confianza ($eneralmente 978) de que se encuentre el verdadero
valor de la razn.
l resultado del e0emplo muestra que la razn de las prevalencias fue de =,+7 (O< 978,
P*,9= % 9,7LQ), indicando que e(istira una asociacin entre el antecedente y el da"o. l O< 978
su$iere que el verdadero valor estara dentro de ese recorrido. 1n enfoque a veces empleado
su$iere e(aminar si el valor + se 'alla dentro del intervalo o no y 'acer de 'ec'o por esa va una
prueba de si$nificacin. n este caso, como el e(tremo inferior del intervalo est# por arriba de +,
se rec'azara la 'iptesis de que no 'ay asociacin y de que la que se 'a observado sea solo
producto del azar.
Medidas de significacin estadstica. 3inalmente, los resultados presentan las medidas de
si$nificacin estadstica que se resumen en el valor de p, la probabilidad de 'aber 'allado estos
resultados en el supuesto que no 'ay asociacin. Ralores de p menores a :,:7 implican que tal
probabilidad es menor al 78. ste valor est# relacionado con la amplitud y posicin del
intervalo de confianza. <uando ambos e(tremos del intervalo de confianza est!n a uno u otro
lado de +, el valor de p ser# menor que :,:7, en tanto que si un e(tremo est# por deba0o de + y el
otro por arriba, p ser# superior a :,:7. Pese a esta estrec'a relacin entre ambos enfoques, para
una me0or representacin del fenmeno estudiado es recomendable considerar el intervalo de
confianza, que resulta m#s informativo.
Estudio d "o#orts
&os estudios de co'ortes sustentan su estrate$ia de an#lisis en el se$uimiento en el tiempo de
dos o m#s $rupos de individuos que 'an sido divididos se$n el $rado de e(posicin a un
determinado factor (corrientemente en ) $rupos, e(puestos y no e(puestos).
Al inicio, nin$uno de los individuos incluidos en ambos $rupos tiene la enfermedad o da"o en
estudio y para responder a la pre$unta acerca de si la e(posicin influye en el desenlace 'abr#
de compararse la incidencia de 5nuevos casos6 entre ambos $rupos. stas incidencias pueden
ser calculadas de dos formas,
<omo nmero de casos nuevos en relacin a la poblacin que inte$ra la co'orte
(incidencia acumulada)%
<onsiderando el perodo que cada individuo permaneci en el $rupo (tasa de incidencia
o densidad de incidencia).
&a incidencia acumulada es m#s sencilla de calcular porque como denominador solo se requiere
el nmero de individuos que se incluy en cada $rupo. Sin embar$o, la tasa de incidencia es una
medida m#s precisa, ya que considera el momento en que se producen los casos y los perodos
de se$uimiento de los individuos, que tipcamente no son i$uales para todos los su0etos. Por
e0emplo, si el da"o en un $rupo aparece m#s tempranamente que en otro, aunque al final del
perodo ambos $rupos 'ayan acumulado i$ual nmero de casos, la incidencia acumulada en
ambos $rupos ser# la misma, pero la tasa de incidencia en el $rupo donde los casos fueron m#s
prematuros ser# m#s elevada. 4e forma similar, si se decide se$uir a un $rupo durante > a"os y
al$unos individuos abandonan el estudio al finalizar el a"o ), el 5peso6 de estos individuos en el
denominador debera ser la mitad del de aquellos individuos que s permanecieron ba0o
observacin los > a"os, ya que los restantes pudieron adquirir la enfermedad en los a"os * y >.
9
&a mayor venta0a de este tipo de estudios es su capacidad analtica para aceptar o rec'azar
'iptesis. Permiten estudiar incidencias y est#n poco e(puestos a los ses$os de seleccin. Su
mayor eficiencia se lo$ra cuando se valoran e(posiciones raras, que no podran ser estudiadas
con otro tipo de estudios, y para dolencias de cortos perodos entre el comienzo de la e(posicin
y la aparicin de la enfermedad. Su mayor limitacin viene dada por sus costos, en $eneral muy
elevados, en especial para el estudio de da"os poco frecuentes o de lar$os perodos de latencia.
l formato de la tabla para el an#lisis de los estudios de co'orte es similar a las otras tablas de
contin$encia, solo que para el c#lculo de las tasas de incidencia se considerar# el perodo,
(personasEtiempo),
Factor de riesgo
o factor de proteccin
Enfermedad o da!o &ersonas'tiempo
Expuestos A ;
+
No expuestos < ;
:
Total AH< ;@;
+
H;
:
&os resultados que pidat *.+ brinda son,
M$did!s d$ 3$'u$"'i!
Fies$o en e(puestos y no e(puestos (incidencia acumulada) o,
;asa de incidencia en e(puestos y no e(puestos (densidad de incidencia).
M$did!s d$ !so'i!'i4"
Fies$o relativo o razn de las tasas de incidencia e intervalo de confianza (Iatz).
4iferencia de ries$os o diferencia de tasas de incidencia e intervalo de confianza.
3raccin atribuible o prevenible para la poblacin e(puesta e intervalo de confianza.
2dds ratio e intervalo de confianza (Joolf y <ornfield), para incidencia acumulada.
M$did!s d$ i20!'to
3raccin atribuible o prevenible para la poblacin.
.edidas de si$nificacin estadstica
Para incidencia acumulada,
Prueba Ki-cuadrado de asociacin, con y sin correccin.
Prueba e(acta de 3is'er y valor de p, unilateral y bilateral.
Para tasa de incidencia,
Prueba de asociacin.
+:
E"emplo
Para evaluar el efecto de la e(posicin a asbesto sobre el ries$o de fallecer por c#ncer de pulmn,
un estudio compar un $rupo de =.)>7 traba0adores e(puestos a este a$ente con otro $rupo de
L.A97 traba0adores sin e(posicin a este factor.
A lo lar$o de )) a"os de se$uimiento, en el primer $rupo se presentaron L= defunciones por
c#ncer en el aparato respiratorio, en tanto que en el $rupo no e(puesto el nmero de
defunciones por esta causa fue )A. l tiempo total de se$uimiento del $rupo e(puesto fue de
++=.+7L personas-a"o, mientras que en el se$undo $rupo fue de +LL.=*=.
On$resados estos datos en las tablas se tendr#,
Ta$la para incidencia acumulada
(efuncin por c)ncer
Exposicin a as$esto S No Total
Expuestos L= =.+=9 =.)>7
No expuestos )A L.A=L L.A97
Total +:> +>.:*= +>.+>:
Ta$la para tasas de incidencia
Exposicin a as$esto (efunciones &ersonas*a!o
Expuestos L= ++=.+7L
No expuestos )A +LL.=*=
Total +:>
)9*.L9*
B los resultados para incidencia acumulada ser#n,
Tablas de contingencia : Tablas 2x2 simples
Tipo de estudio : *o7ortes
Tipo de datos : )ncidencia acumulada
Nivel de confianza: 95,0%
Tabla
Enfermos anos Total
!!!!!!!!!!!! !!!!!!!! !!!!!!!! !!!!!!!!
Expuestos -# #$#9 #2&5
No expuestos 2" -"#- -"95
!!!!!!!!!!!! !!!!!!!! !!!!!!!! !!!!!!!!
Total $0& $&0%# $&$&0
Estimaci(n )*+95,0%,
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!! !!!!!!!!! !!!!!!!!!
.iesgo en expuestos 0,0$2$-0 ! !
.iesgo en no expuestos 0,00%5&- ! !
.iesgo relativo %,&%$&%$ 2,22-#-9 5,2"5#&& +/atz,
:iferencia de riesgos 0,00"#2% 0,005#0& 0,0$$#&2
0dds ratio %,&#$%"5 2,2&$%95 5,%&5&$#
+1oolf,
2,2&"-92 5,%2--&&
+*ornfield,
++
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!! !!!!!!!!! !!!!!!!!!
6racci(n atribuible en expuestos 0,-0"5-# 0,55$$02 0,"$0"0"
6racci(n atribuible poblacional 0,5$-"0# 0,%%"&$2 0,#&"55#
'rueba 2i!cuadrado de asociaci(n Estad3stico 4alor p
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!! !!!!!!!!!
in correcci(n %5,5$%5 0,0000
*orrecci(n de 5ates %&,%&22 0,0000
Para tasas de incidencia se tiene lo si$uiente,
Tablas de contingencia : Tablas 2x2 simples
Tipo de estudio : *o7ortes
Tipo de datos : Tasa de incidencia
Nivel de confianza: 95,0%
Tabla
*asos 'ersonas!Tiempo
!!!!!!!!!!!! !!!!!!!! !!!!!!!!!!!!!!!
Expuestos -# $$#$5-
No expuestos 2" $--#%#
!!!!!!!!!!!! !!!!!!!! !!!!!!!!!!!!!!!
Total $0& 29%-9%
Estimaci(n )*+95,0%,
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!! !!!!!!!!! !!!!!!!!!
Tasa de incidencia en expuestos 0,000#5& ! !
Tasa de incidencia en no expuestos 0,000$5" ! !
.az(n de tasas de incidencia &,$50""9 2,#9$%2$ #,&020$#
:iferencia de tasas de incidencia 0,000&9- 0,000%%" 0,000#55
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!! !!!!!!!!! !!!!!!!!!
6racci(n atribuible en expuestos 0,-590"" 0,#2"&%5 0,"&%-99
6racci(n atribuible poblacional 0,55&-$" 0,%"""50 0,#-55#9
'rueba de asociaci(n
Estad3stico ; 4alor p
!!!!!!!!!!!!!!!!!!!! !!!!!!!!!
#,"95& 0,0000
Riesgo en expuestos y no expuestos. l ries$o se cuantifica mediante la incidencia acumulada y se
presenta como ries$o absoluto para el total del perodo estudiado. l ries$o de :,:+)+L de los
e(puestos puede entenderse como una incidencia de +,)8 +),+L por mil (durante todo el
perodo). ste ries$o, considerablemente m#s alto que el de los no e(puestos (*,77 por mil),
se"ala que la e(posicin al asbesto s estara causando un mayor ries$o de enfermar y morir por
c#ncer del aparato respiratorio.
Tasa de incidencia en expuestos y no expuestos. &as tasas de incidencia, al considerar el tiempo real
de se$uimiento, corri$en los errores que se pueden introducir por diferencias en el tiempo de
se$uimiento entre los $rupos. 4e 'ec'o, en el e0emplo presentado el tiempo promedio de
se$uimiento de los e(puestos (+A,= a"os) fue menor que el de los no e(puestos ()),7 a"os).
+)
&a tasa de incidencia en e(puestos de :,:::=7> se"ala que la incidencia anual en este $rupo fue
de :,=7> por mil.
Riesgo relativo y razn de tasas de incidencia. ;ienen una interpretacin similar a la razn de
prevalencias. Se"alan la relacin entre las incidencias de ambos $rupos. l ries$o relativo de *,>*
indica que en los e(puestos la incidencia es *,>* veces la de los no e(puestos, lo que tambi!n
puede leerse como que en los e(puestos 'ay ),>* veces m#s ries$o que en los no e(puestos. l
valor obtenido para el odds ratio (*,>=) es muy pr(imo al del ries$o relativo por tratarse de una
enfermedad rara.
&a razn de las tasas de incidencia result mayor (>,+7). sta diferencia es consecuencia del
diferente tiempo en promedio de se$uimiento en uno y otro $rupo, y pone de manifiesto la
conveniencia de considerar esta medida y no solo el ries$o relativo.
Fraccin atribuible o prevenible entre los expuestos. Fepresenta la fraccin del da"o que podra ser
evitada entre los e(puestos si se eliminara enteramente esa e(posicin. ste tipo de an#lisis
asume causalidad. sto si$nifica que, efectivamente, la e(posicin es un factor responsable del
e(ceso de da"o en el $rupo de e(puestos y que, por lo tanto, si no 'ubiera e(istido tal
e(posicin, esa fraccin de su0etos que padecen el da"o no 'ubiera ocurrido.
&a fraccin atribuible es aplicable a un an#lisis de tipo prospectivo. Fesponde a la pre$unta
Mcu#nto da"o se podr# evitar si esta poblacin no se e(pusiera en absoluto a tal factorN Pero
cuando la e(posicin de 'ec'o e(iste y se pretende estimar la reduccin del da"o al eliminar la
e(posicin, esto es solo aplicable en caso de que la e(posicin sea totalmente reversible.
Por e0emplo, si un $rupo de personas tiene un e(ceso de ries$o por no usar cinturn de
se$uridad al conducir, y se elimina la e(posicin (todos comienzan a usar cinturn), mediante la
fraccin atribuible se podr# estimar el monto relativo del da"o que se evitar#. Sin embar$o, esto
no podr# aplicarse al '#bito de fumar porque se trata de una e(posicin no reversible en un
+::8 (el ries$o de los nunca fumadores no es similar al de los e(fumadores). n cualquier caso,
este indicador puede tener una virtualidad terica en la medida que cuantifica, supuestamente,
el peso etiol$ico de determinado factor en t!rminos de la salud pblica.
n el caso del e0emplo, un L:,A8 (O< 978, P77,+8 % A+,+8Q) de los casos de c#ncer de pulmn
entre los traba0adores e(puestos, podra ser atribuido al asbesto.
Fraccin atribuible o prevenible en la poblacin. sta es una medida del impacto potencial que
tendra la eliminacin de una e(posicin en toda la poblacin. Fepresenta la fraccin del da"o
total de enfermos que podra ser evitada y, como en el caso anterior, se asume causalidad y solo
es aplicable para e(posiciones totalmente reversibles, o para la construccin de escenarios
prospectivos.
Si$uiendo con el e0emplo, una fraccin atribuible poblacional de :,7+A si$nifica que un 7+,A8 de
los casos de c#ncer respiratorio en la poblacin de traba0adores, podra atribuirse a la e(posicin
a asbestos y por ende evitarse si tal e(posicin fuera enteramente suprimida.
&as medidas de si$nificacin estadstica tienen una interpretacin similar a la de las tablas para
estudios transversales.
+*
Estudio d "asos $ "ontro!s
n los estudios de casos y controles los su0etos incluidos proceden tpicamente de dos $rupos,
se$n sean casos (con la enfermedad o da"o en estudio) o controles (sin el da"o en cuestin).
ste tipo de dise"o 'izo su aparicin a mediados del si$lo SS cuando, en los pases
desarrollados, el inter!s de la Salud Pblica comenz a centrarse en las enfermedades crnicas.
&a idea b#sica es comparar los antecedentes de los 5enfermos6 de una poblacin con los de los
5sanos6 de la misma poblacin. Se trata de poner de manifiesto posibles diferencias en las
e(posiciones que e(pliquen, al menos parcialmente, la razn por la que unos enfermaron y otros
no.
n el an#lisis se comparan las e(posiciones de los casos con las de los controles, y los resultados
son presentados usando los llamados odds (cociente entre la probabilidad de enfermar y la
probabilidad de no enfermar) y la razn de odds de adquirir una enfermedad entre e(puestos y
entre no e(puestos (odds ratio, 2F).
+asos +ontroles Total
Expuestos a b a H b
No expuestos c d c H d
Total a H c b H d a H b H c H d
l odds ratio estimado (2F @ (a(d)?(c(b)) ser# mayor cuanto mayor sea el nmero de casos
e(puestos y el de controles no e(puestos, y menor cuanto mayor sea el nmero de casos no
e(puestos y el de controles e(puestos.
l nmero de controles por cada caso puede diferir entre un estudio y otro, pero en $eneral
oscila entre uno y tres% a lo sumo, se toman cuatro controles por cada caso. /o tiene mayor
inter!s tomar m#s de cuatro controles por caso, ya que la potencia de la prueba no crece de
manera apreciable, mientras que s lo 'acen los costos. Por esta razn, e(cepto que se cuente con
los datos a un ba0o costo, superar los > controles por caso no es recomendable. Por otro lado,
cuando e(iste un $ran nmero de casos, y quiz#s dificultades para obtener controles, es posible
tambi!n dise"ar un estudio donde la relacin caso?control sea ) a + * a +.
ntre las principales venta0as de este tipo de dise"o comparado con los estudios de se$uimiento
est# su eficiencia en t!rminos de costo y tiempo, en especial para enfermedades poco comunes
y?o de lar$os perodos de incubacin. sta eficiencia deriva del 'ec'o de que, una vez
dia$nosticada la enfermedad o el evento, solo es necesario incluir en el estudio un nmero
relativamente peque"o de casos, y en especial de controles. sto lo diferencia si$nificativamente
de los estudios de se$uimiento donde, por e0emplo en las enfermedades raras, deber# seguirse la
evolucin de una enorme cantidad de individuos para obtener unos pocos casos.
2tra venta0a de los estudios de casos y controles, comparados con los de se$uimiento, es la
posibilidad de estudiar varias e(posiciones en forma simult#nea.
&a mayores desventa0as de los estudios de casos y controles son, por un lado, el sesgo de seleccin
que pueda introducirse al ele$ir los controles y, por otro, el 'ec'o de que a la 'ora de la
inclusin de los individuos en el estudio, tanto las e(posiciones como el da"o ya 'an ocurrido.
sto dificulta establecer la precisin y la similitud de criterio con que e(posiciones y da"os 'an
sido medidos en los participantes. (iste incluso el potencial problema que se presenta en los
estudios transversales, donde la secuencia e(posicin-da"o podra no conocerse adecuadamente
+>
e incluso estar invertida en al$unos casos (esto es, que la e(posicin se 'aya modificado como
consecuencia del da"o, o de estadios subclnicos de la dolencia) sin que el investi$ador ten$a la
posibilidad siquiera de enterarse.
sto 'ace que este tipo de estudios est! particularmente e(puesto a errores de clasificacin, tanto
en la evaluacin de las e(posiciones como en la de los resultados.
ntre estos errores es importante destacar el sesgo del recuerdo, que sur$e de un recuerdo
5modificado6 en los casos respecto de los controles y el ses$o en la recoleccin de los datos
(sesgo del observador) inducido por el 'ec'o de que el observador realiza un esfuerzo diferente a
la 'ora de evaluar cada su0eto en dependencia de que sea un caso o un control.
&os estudios de casos y controles no permiten estimar directamente las medidas de ries$o
dentro de cada $rupo, ya que la proporcin de enfermos en el $rupo de e(puestos y en el de no
e(puestos depender# de la decisin del investi$ador en cuanto al nmero de casos y de
controles involucrados en el estudio. 4ic'o de otra manera, la muestra tpicamente no es
representativa de la poblacin en cuanto a la proporcin enfermos?no enfermos y ello cancela la
posibilidad de estimar adecuadamente las tasas de enfermos entre e(puestos y de enfermos
entre los que est#n libres de la e(posicin.
<on el ob0etivo de 5controlar6 diferentes factores de confusin posibles, tales como edad,
$!nero, consumo de tabaco, etc., es corriente que los casos y los controles sean empare0ados
se$n estas caractersticas. <uando esto se realiza durante el an#lisis, los datos pueden ser
procesados como si este empare0amiento no se 'ubiera realizado o, por el contrario, a trav!s de
una tabla especial que busca comparar las diferencias entre estos 5pares6.
n un estudio de casos y controles, pidat *.+ presenta los si$uientes resultados,
.edidas de frecuencia
Proporcin de casos e(puestos.
Proporcin de controles e(puestos.
.edidas de asociacin
2dds ratio e intervalo de confianza (Joolf y <ornfield), para incidencia acumulada.
3raccin atribuible o prevenible para la poblacin e(puesta e intervalo de confianza.
.edidas de impacto
3raccin atribuible o prevenible para la poblacin.
.edidas de si$nificacin estadstica
Para datos no empare0ados,
Prueba Ki-cuadrado de asociacin, con y sin correccin.
Prueba e(acta de 3is'er y valor de p, unilateral y bilateral.
Para datos empare0ados,
Prueba de asociacin de .c/emar.
+7
E"emplo
<on el ob0etivo de investi$ar si la lactancia materna constituye un factor de proteccin para el
c#ncer de mama, un estudio incluy a L77 mu0eres menores de *= a"os de ++ re$iones sanitarias
del Feino 1nido, a las que se les dia$nostic c#ncer de mama durante el perodo +9A) a +9A7.
Para cada caso se eli$i un control al azar de la lista de pacientes del mismo m!dico $eneral que
asista al caso. stos controles deban tener una diferencia de edad con los casos menor a =
meses. <ada caso y su correspondiente control fueron entrevistados por el mismo encuestador.
&os resultaron mostraron que en el $rupo de casos, )77 mu0eres realizaron una lactancia plena
de al menos * meses, mientras que entre los controles este antecedente estaba presente en >AL
mu0eres (de los )77 controles de los casos que tuvieron una lactancia plena, +=: lactaron y 97 no,
en tanto de los 7:: controles de los casos que no lactaron, *)L si lo 'aban 'ec'o y +L* no).
On$resados estos datos en las tablas, los datos quedan resumidos del modo si$uiente,
+asos , controles
+asos , controles empare"ados
+ontroles
+asos +ontroles Total +asos Exp. No exp. Total
Exp. )77 >AL L>) Exp. +=: 97 )77
No exp. 7:: )=A L=A No exp. *)L +L* 7::
Total L77 L77 +.7+: Total >AL )=A L77
Nota, advi!rtase de que se est# llamando 5e(posicin6 a la pr#ctica de lactancia materna%
obviamente, esto constituye cierto abuso de len$ua0e, pero no dar# lu$ar a confusin siempre
que el usuario comprenda que en este caso la persona 'a estado 5e(puesta6 (o no) a un factor
presuntamente protector.
&os resultados de la tabla de contin$encia para casos y controles ser#n,
Tablas de contingencia : Tablas 2x2 simples
Tipo de estudio : *aso!control
Nivel de confianza: 95,0%
Tabla
*asos *ontroles Total
!!!!!!!!!!!! !!!!!!!! !!!!!!!! !!!!!!!!
Expuestos 255 &"- -&2
No expuestos 500 2#" -#"
!!!!!!!!!!!! !!!!!!!! !!!!!!!! !!!!!!!!
Total -55 -55 $5$0
Estimaci(n )*+95,0%,
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!! !!!!!!!!! !!!!!!!!!
'roporci(n de casos expuestos 0,%%--&" ! !
'roporci(n de controles expuestos 0,#&50%% ! !
0dds ratio 0,2"0#5- 0,22-02" 0,%&#95&
+1oolf,
0,22-05$ 0,%&#920
+*ornfield,
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!! !!!!!!!!! !!!!!!!!!
+=
6racci(n prevenida en expuestos 0,-$9%&% 0,#5%0&# 0,--29-2
6racci(n prevenida poblacional 0,%92"-# 0,%2%0"& 0,&55&-%
'rueba 2i!cuadrado de asociaci(n Estad3stico 4alor p
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!! !!!!!!!!!
in correcci(n $&2,#22& 0,0000
*orrecci(n de 5ates $&$,%95# 0,0000
'rueba exacta de 6is7er 4alor p
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!
8nilateral 0,0000
9ilateral 0,0000
n el an#lisis empare0ado los resultados que se presentan son,
Tablas de contingencia : Tablas 2x2 simples
Tipo de estudio : *aso!control empare<ado
N= de controles por caso : $
Nivel de confianza : 95,0%
Tabla
*ontroles
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
*asos Expuestos No expuestos Total
!!!!!!!!!!!! !!!!!!!!!!!! !!!!!!!!!!!! !!!!!!!!!!!!
Expuestos $#0 95 255
No expuestos %2- $-% 500
!!!!!!!!!!!! !!!!!!!!!!!! !!!!!!!!!!!! !!!!!!!!!!!!
Total &"- 2#" -55
Estimaci(n )*+95,0%,
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!! !!!!!!!!! !!!!!!!!!
'roporci(n de casos expuestos 0,%%--&" ! !
'roporci(n de controles expuestos 0,#&50%% ! !
0dds ratio 0,290520 0,220#&5 0,%"$-&&
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!! !!!!!!!!! !!!!!!!!!
'rueba de asociaci(n de >cNemar
2i!cuadrado 4alor p
!!!!!!!!!!!!!!!!!!!! !!!!!!!!!
$2#,&&-9 0,0000
stos resultados presentan la proporcin de casos y controles con antecedentes de e(posicin y
el odds ratio. n este caso, una proporcin de e(puestos mayor entre los controles estara
indicando un efecto de proteccin atribuible a la lactancia, al$o que se evidencia en un odds ratio
menor que +, con un intervalo de confianza cuyos dos e(tremos est#n por deba0o de +. &a
interpretacin del odds ratio es un poco m#s complicada que la del ries$o relativo. .ientras que
un ries$o relativo i$ual a ) indicara que en los e(puestos la tasa de incidencia es el doble que en
los no e(puestos (+ vez m#s frecuente o un +::8 mayor), un odds ratio de ) indica que el odds de
+L
enfermar es el doble para e(puestos que para quienes no lo est#n, lo que constituye otra medida
del ries$o de padecer la enfermedad. <uanto menos frecuente es la enfermedad o da"o, m#s
cercanos estar#n entre s el odds ratio y el ries$o relativo.
&as fracciones prevenidas en e(puestos y en la poblacin tienen la misma interpretacin que la
fraccin atribuible, en tanto que las pruebas estadsticas con valores de p peque"os (en
particular, menores a :,:7) indican que se puede descartar el azar como e(plicacin de la
asociacin observada con una reducida probabilidad de cometer el error de primer tipo ('acer
un rec'azo indebido). 4e 'ec'o, en el e0emplo, el valor de p fue muy inferior a :,:7%
concretamente, inferior al + por +:.:::.
&os resultados del an#lisis empare0ado presentan, adem#s, el c#lculo de un odds ratio a partir de
los pares desi$uales. ;ras e(cluir a los pares donde casos y controles son los dos e(puestos o
ambos no e(puestos, el odds ratio se calcula a trav!s de un cociente entre los casos e(puestos con
controles no e(puestos (a favor de que la e(posicin aumenta la incidencia) y los casos no
e(puestos con controles e(puestos (situacin que indicara lo contrario).
TABLAS 2X2 ESTRATIFICADAS
&a relacin entre un factor de ries$o (supuesto o real) y un da"o es en ocasiones 5modificada6
por la presencia de un tercer factor. sta situacin, conocida como efecto de confusin, podra
definirse como la que producen aquellos factores que, estando relacionados con el factor de
ries$o en estudio, condicionan la aparicin del da"o (siempre que no se trate de un factor que se
'alle en el trayecto causal que va del factor de ries$o al da"o). As, por e0emplo, la relacin
directa del consumo diario de comprimidos de -carotenos y la prevencin de las enfermedades
coronarias ser# usualmente distorsionada por la presencia de otros factores que se encuentran
vinculados a la 5actitud6 preventiva de quien toma suplementos. Se$uramente, entre quienes
toman esta medicacin, 'abr# una menor proporcin de fumadores y desarrollar#n mayor
actividad fsica que los que no la toman. <omo estos factores tienen un efecto protector sobre la
enfermedad coronaria, el efecto en la reduccin del da"o ser# resultado de la accin combinada
de estos factores. 4e no repararse en esto, se estara atribuyendo solo al consumo de -carotenos
una accin protectora mayor a la real.
(isten diferentes estrate$ias para 5controlar6 este efecto y una de ellas es la estratificacin. Por
e0emplo, supon$amos que un estudio de casos y controles arro0 una asociacin positiva entre
consumo de caf! y c#ncer de p#ncreas con los si$uientes datos,
+af- +asos +ontroles
S +9= +:>
No A9 +:=
%. / 2024
Sin embar$o, al considerar un tercer factor como el tabaco y dividir los individuos del estudio en
dos estratos (fumadores y no fumadores) no parece e(istir relacin entre caf! y c#ncer de
p#ncreas en los no fumadores y tampoco en los fumadores (2F @ + en ambos $rupos).
+A
No fumadores Fumadores
+af- +asos +ontroles +asos +ontroles
S *) => +=> >:
No >A 9= >+ +:
%. / 100 %. / 100
l an#lisis por estratos 'ace evidente que el consumo de tabaco 'a distorsionado la relacin
entre el consumo de caf! y el c#ncer de p#ncreas. n esta relacin es el tabaco el que estara
incrementando el ries$o de c#ncer de p#ncreas, y como entre los fumadores el consumo de caf!
es m#s frecuente, la tabla simple mostraba una asociacin entre caf! y c#ncer de p#ncreas.
l an#lisis individual de cada estrato debe ser complementado con un an#lisis que estime el
efecto $eneral considerando los valores de cada estrato. l m!todo de .antel-Gaenszel es uno
de los m#s tiles para este an#lisis. &a e(istencia de diferencias entre los resultados de un
an#lisis no estratificado y uno estratificado estar# mostrando que el factor por el que se
estratific e0erce un efecto de confusin en la relacin que e('iben los factores estudiados.
Si bien es posible la estratificacin con0unta de varios factores con el ob0etivo de controlarlos o
a0ustarlos simult#neamente (por e0emplo,varones fumadores, varones no fumadores, mu0eres
fumadoras, mu0eres no fumadoras), la $eneracin de varios estratos disminuye notablemente el
tama"o muestral de cada estrato, lo que 'ace en e(tremo inestables las estimaciones realizadas
al interior de cada estrato.
pidat *.+ permite la realizacin de tablas )() estratificadas para estudios transversales, de
co'ortes (con incidencia acumulada o con tasas de incidencia), y de casos y controles.
E"emplo
n el an#lisis estratificado arriba descrito, donde un estudio de casos y controles busca analizar
el efecto del consumo de caf! en la incidencia de c#ncer de p#ncreas, pero considerando el
posible efecto de confusin del consumo de tabaco, los resultados del an#lisis de las tablas )(),
previa estratificacin, seran los si$uientes,
Tablas de contingencia : Tablas 2x2 estratificadas
Tipo de estudio : *aso!control
N?mero de estratos: 2
Nivel de confianza: 95,0%
Tabla global
*asos *ontroles Total
!!!!!!!!!!!!!!! !!!!!!!!!! !!!!!!!!!! !!!!!!!!!!
Expuestos $9# $0& %00
No expuestos "9 $0# $95
!!!!!!!!!!!!!!! !!!!!!!!!! !!!!!!!!!! !!!!!!!!!!
Total 2"5 2$0 &95
+9
0:: .@T)0 +0.,
Estrato 0. )*+95,0%,
!!!!!!!!!!!!!!! !!!!!!!!!! !!!!!!!!!! !!!!!!!!!!
$ $,000000 0,5-"205 $,-29&90 +1oolf,
2 $,000000 0,&#$#9& 2,$#59%& +1oolf,
!!!!!!!!!!!!!!! !!!!!!!!!! !!!!!!!!!! !!!!!!!!!!
*ruda 2,2&&59" $,552&%9 %,2&5%5" +1oolf,
*ombinada +>!A, $,000000 0,#%95"# $,5#%5$0
'onderada $,000000 0,#%95"# $,5#%5$0
'rueba de 7omogeneidad
2i!cuadrado gl 4alor p
!!!!!!!!!!!!!!! !!!!!!!!!! !!!!!!!!!! !!!!!!!!!!
*ombinada +>!A, 0,0000 $ $,0000
'onderada 0,0000 $ $,0000
'.8E9@ :E @0*)@*)BN :E >@NTEC!A@EN;EC
2i!cuadrado gl 4alor p
!!!!!!!!!!!!!!! !!!!!!!!!! !!!!!!!!!!
0,0000 $ $,0000
stos resultados incluyen una tabla $lobal (suma de los estratos), el odds ratio e intervalo de
confianza (calculado se$n el m!todo de Joolf) para cada estrato, el odds ratio de la tabla $lobal
(odds ratio crudo) y el odds ratio combinado (m!todo de .antel-Gaenszel) y ponderado por el
m!todo del inverso de la varianza. Adem#s, se presentan las pruebas de 'omo$eneidad entre
estratos y de asociacin de .antel-Gaenszel.
&a diferencia entre el odds ratio crudo (),)>) y el combinado de .antel-Gaenszel (+,::) confirma
el efecto de confusin que e0erce la variable por la que se estratifica.
&a prueba de 'omo$eneidad permite e(aminar las diferencias entre los odds ratio de los estratos.
n el caso presentado, el Ki-cuadrado es ba0o y el valor de p, superior a un 78 (pT:,:7),lo que
'ace pensar que no 'ay diferencias apreciables entre los 2F en los estratos y que, por ende, los
resultados a0ustados pueden considerarse para el con0unto. 1n resultado que indique lo
contrario marcar# la necesidad de presentar por separado los resultados de cada estrato.
3inalmente, la Prueba de asociacin de .antel-Gaenszel, con un valor de p por arriba de :,:7,
se"ala la falta de asociacin entre la e(posicin y el da"o (caf! y c#ncer de p#ncreas), una vez
controlado el efecto del tabaco.
TABLAS 2XN SIMPLES
&as tablas )(/ simples (de un nico estrato) permiten el an#lisis de una variable cate$rica
(variable independiente que mide los niveles de e(posicin) y una variable dicotmica (variable
dependiente que se"ala la presencia o no del da"o).
<omo en el caso de las tablas )(), se podr# optar por tres formatos de tablas se$n se est!
analizando un estudio transversal, de co'orte, o de casos y controles.
):
studio transversal
studio de co'ortes
Para tasas de incidencia
Para incidencia acumulada
studio de casos y controles
ste tipo de tablas permite calcular las prevalencias, incidencia u odds (se$n el tipo de estudio)
para cada nivel de e(posicin y calcula la razn de las prevalencias, tasas de incidencia u odds
ratio, utilizando por defecto como valor de referencia el nivel + de e(posicin.
l nivel de referencia puede ser seleccionado y, si bien en $eneral la eleccin es 5natural6, se
deber# considerar que es m#s f#cil analizar las razones y las tasas cuando se utiliza como nivel
de referencia al nivel con menor prevalencia o incidencia.
3inalmente, se deber# considerar que ciertas e(posiciones presentan una asociacin con un da"o
determinado en forma de 5K6 o de 516, como por e0emplo el peso al nacer, el consumo de
alco'ol y el ndice de masa corporal, todos con relacin a la mortalidad. 1na asociacin en
forma de 516 si$nifica que ambos e(tremos en los niveles de e(posicin presentan mayor
mortalidad que al$uno de los valores intermedios. &os ni"os de ba0o peso al nacer, y tambi!n los
de alto peso, tienen mayor mortalidad que los de peso adecuado. n estos casos se buscar# usar
como referencia aquel nivel que represente la situacin de menor ries$o.
n forma adicional, se podr# dar un peso a cada cate$ora de e(posicin para el c#lculo de la
prueba de tendencia lineal, que permite valorar la 'iptesis de ausencia de tendencia lineal en el
crecimiento del ries$o a medida que aumenta la e(posicin. l m!todo usual para definir las
puntuaciones consiste en asi$nar los valores +, ), ..., /, respectivamente, a los / niveles% si la
e(posicin est# medida en escala continua, otra posibilidad es asi$nar a cada cate$ora de
e(posicin el punto medio del intervalo. .#s que de las puntuaciones asi$nadas a cada nivel, la
prueba de tendencia depende de la distancia entre los valores num!ricos definidos. Por e0emplo,
en el caso de * niveles de e(posicin, la prueba produce el mismo resultado con puntuaciones +,
) y * que con +:, ): y *:, porque en ambos casos la distancia entre valores es constante% sin
embar$o, se obtendra un valor diferente si se asi$naran los valores +, +: y +::.
<uando el resultado de esta prueba $enera una p con un valor peque"o (tpicamente menor que
:,:7) se considera que 'ay una alta posibilidad de que e(ista una tendencia lineal en la que a
mayor e(posicin aumenta el ries$o. &a modificacin de la puntuacin de cada cate$ora
permite cambiar el peso relativo de los diferentes niveles de e(posicin.
E"emplo
n un an#lisis del ries$o de morir en el primer a"o de vida con relacin al peso al nacer, un
estudio de co'orte realizado en dos 'ospitales permiti establecer lo si$uiente,
&eso al nacer
N1mero de
nacidos 2i2os
(efunciones
antesdel 1
er
a!o
.enos de +.7:: $ =7 >7
)+
+.7:: a ).>99 $ *L: *>
).7:: a >.+99 $ =.>:: 7L
>.):: $ o m#s A9 A
;otal =.9)> +>>
l an#lisis en pidat *.+ de estos mismos datos en una tabla de contin$encia )(/ para estudios
de co'orte (incidencia acumulada) muestra los si$uientes resultados,
Tablas de contingencia : Tablas 2xN simples
Tipo de estudio : *o7ortes
Tipo de datos : )ncidencia acumulada
Niveles de exposici(n: &
Nivel de confianza : 95,0%
Tabla
Nivel $ Nivel 2 Nivel % Nivel & Total
!!!!!!!!!!!!!!! !!!!!!!! !!!!!!!! !!!!!!!! !!!!!!!! !!!!!!!!
Enfermos &5 %& 5- " $&&
anos 20 %%# #%&% "$ #-"0
!!!!!!!!!!!!!!! !!!!!!!! !!!!!!!! !!!!!!!! !!!!!!!! !!!!!!!!
Total #5 %-0 #&00 "9 #92&
.)ED0 .EC@T)40 +..,
Nivel de exposici(n .iesgo
!!!!!!!!!!!!!!!!!!! !!!!!!!
Nivel $ 0,#92%
Nivel 2 0,09$9
Nivel % 0,00"9
Nivel & 0,0"99
Nivel de exposici(n .. )*+95,0%,
!!!!!!!!!!!!!!!!!!! !!!!!!!! !!!!!!!!!!!!!!!!!!!!
Nivel $ --,-%2" 5-,295& $05,&#0% +/atz,
Nivel 2 $0,%$-- #,"%#5 $5,5-$& +/atz,
.efE!F Nivel % $,0000 ! !
Nivel & $0,092# &,9#%0 20,52&2 +/atz,
'.8E9@ :E A0>0DENE):@: ENT.E N)4ECE
2i!cuadrado gl 4alor p
!!!!!!!!!!!! !!!!!!!! !!!!!!!!
$59#,$#5% % 0,0000
'.8E9@ :E TEN:EN*)@ C)NE@C
2i!cuadrado gl 4alor p
!!!!!!!!!!!! !!!!!!!! !!!!!!!!
))
"$#,$$99 $ 0,0000
n la tabla con los datos se 'an in$resado como enfermos a las defunciones y como sanos a los
nacidos en cada nivel de peso que sobrevivieron el primer a"o. l nivel + representa a los que
pesaron menos de +.7:: $ramos, el nivel ) a los que pesaron de +.7:: a ).>99, el nivel * de ).7:: a
>.+99 y el nivel > a los que pesaron >.):: m#s.
&ue$o de la tabla se presentan los ries$os (que equivalen a las tasas de la tabla anterior), y lue$o
el ries$o relativo y sus intervalos de confianza (O< 978). Puesto que se se"al como nivel de
referencia al nivel * (peso adecuado), el FF del nivel * es +, en tanto los restantes FF se deben
interpretar como e(ceso de ries$o en relacin a los ni"os que nacieron con peso adecuado.
&a prueba de 'omo$eneidad con un Ki-cuadrado muy elevado y un valor de pU:,:::+, se"ala
que e(iste un ries$o distinto en los diferentes niveles de e(posicin, comparados con el de
referencia.
3inalmente, la prueba de tendencia lineal 'ar# pensar que e(iste una relacin lineal en la que, a
menor peso, mayor es el ries$o de morir antes del a"o. Sin embar$o, como el patrn de los
ries$os muestra una curva en forma de 5K6, al eliminar el nivel de e(posicin > (ni"os de alto
peso al nacer), la prueba de tendencia lineal arro0a resultados an m#s si$nificativos,
Tablas de contingencia : Tablas 2xN simples
Tipo de estudio : *o7ortes
Tipo de datos : )ncidencia acumulada
Niveles de exposici(n: %
Nivel de confianza : 95,0%
Tabla
Nivel $ Nivel 2 Nivel % Total
!!!!!!!!!!!!!!! !!!!!!!! !!!!!!!! !!!!!!!! !!!!!!!!
Enfermos &5 %& 5- $%#
anos 20 %%# #%&% ##99
!!!!!!!!!!!!!!! !!!!!!!! !!!!!!!! !!!!!!!! !!!!!!!!
Total #5 %-0 #&00 #"%5
.)ED0 .EC@T)40 +..,
Nivel de exposici(n .iesgo
!!!!!!!!!!!!!!!!!!! !!!!!!!
Nivel $ 0,#92%
Nivel 2 0,09$9
Nivel % 0,00"9
Nivel de exposici(n .. )*+95,0%,
!!!!!!!!!!!!!!!!!!! !!!!!!!! !!!!!!!!!!!!!!!!!!!!
Nivel $ --,-%2" 5-,295& $05,&#0% +/atz,
Nivel 2 $0,%$-- #,"%#5 $5,5-$& +/atz,
.efE!F Nivel % $,0000 ! !
'.8E9@ :E A0>0DENE):@: ENT.E N)4ECE
2i!cuadrado gl 4alor p
)*
!!!!!!!!!!!! !!!!!!!! !!!!!!!!
$#&&,-%%9 2 0,0000
'.8E9@ :E TEN:EN*)@ C)NE@C
2i!cuadrado gl 4alor p
!!!!!!!!!!!! !!!!!!!! !!!!!!!!
$$2%,"2-& $ 0,0000
TABLAS 2XN ESTRATIFICADAS
&a estratificacin de las tablas )(/ permite incorporar otra variable o factor para analizar si la
relacin entre la e(posicin y el da"o cambia se$n las diferentes cate$oras de la variable por la
que se est# estratificando.
;ambi!n aqu se podr# optar por tres formatos de tablas se$n se est! analizando un estudio
transversal, de co'ortes, o de casos y controles, y deber# definirse un nivel de referencia para el
c#lculo de las razones de prevalencia, ries$os relativos u odds ratio, respectivamente.
E"emplo
Si en el estudio del ep$rafe precedente se quisiera considerar por separado los datos de uno y
otro 'ospital, se podran presentar los datos en una tabla como la que si$ue,
N1mero de nacidos
2i2os
(efunciones antes del
1
er
a!o
&eso al nacer Total 3osp # 3osp 4 Total 3osp # 3osp 4
.enos de +.7:: $ =7 >: )7 >7 )+ )>
+.7:: a ).>99 $ *L: )): +7: *> +A +=
).7:: a >.+99 $ =.>:: *.*9: *.:+: 7L )7 *)
>.):: $ o m#s A9 =: )9 A 7 *
Total 6.524 3.610 3.214 144 65 67
l an#lisis en pidat *.+ de estos mismos datos muestra estos resultados,
Tablas de contingencia : Tablas 2xN estratificadas
Tipo de estudio : *o7ortes
Tipo de datos : )ncidencia acumulada
Nivel de confianza : 95,0%
Niveles de exposici(n: &
N?mero de estratos : 2
Tabla global
Nivel $ Nivel 2 Nivel % Nivel & Total
!!!!!!!!!!!!!!! !!!!!!!!! !!!!!!!!! !!!!!!!!! !!!!!!!!! !!!!!!!!!
Enfermos &5 %& 5- " $&&
anos 20 %%# #%&% "$ #-"0
!!!!!!!!!!!!!!! !!!!!!!!! !!!!!!!!! !!!!!!!!! !!!!!!!!! !!!!!!!!!
)>
Total #5 %-0 #&00 "9 #92&
.E8CT@:0 *.8:0
Nivel de exposici(n .. )*+95,0%,
!!!!!!!!!!!!!!!!!!! !!!!!!!! !!!!!!!!!!!!!!!!!!!!
Nivel $ --,-%2" 5-,295& $05,&#0% +/atz,
Nivel 2 $0,%$-- #,"%#5 $5,5-$& +/atz,
.efE!F Nivel % $,0000 ! !
Nivel & $0,092# &,9#%0 20,52&2 +/atz,
..: .iesgo relativo
.E8CT@:0 @28T@:0
Nivel de exposici(n .. )*+95,0%,
!!!!!!!!!!!!!!!!!!! !!!!!!!! !!!!!!!!!!!!!!!!!!!!
Nivel $ "0,2#%9 59,&295 $0",&022 +>antel!Aaenszel,
Nivel 2 $0,5#&- #,9"9# $5,9#"5 +>antel!Aaenszel,
.efE!F Nivel % $,0000 ! !
Nivel & $0,#525 5,2$%& 2$,-##$ +>antel!Aaenszel,
'.8E9@ :E TEN:EN*)@ C)NE@C
2i!cuadrado gl 4alor p
!!!!!!!!!!!! !!!!!!!! !!!!!!!!
"%$,9$## $ 0,0000
&os FF crudos son i$uales a los del an#lisis simple, ya que de 'ec'o se calculan sin considerar
los estratos% en cambio, los FF a0ustados consideran el efecto de la variable 'ospital (lu$ar de
realizacin del parto). A pesar de que los ries$os para los diferentes $rupos de peso difieren
entre un 'ospital y otro (en el 'ospital V las tasas de mortalidad resultaron m#s elevadas en cada
$rupo), la escasa diferencia entre los FF crudos y a0ustados de los niveles ) y > se"ala que el
ries$o que implica nacer con un peso de +.7:: $ a ).>99 $, o de >.):: $ o m#s no est#
si$nificativamente influenciado por el 'ospital donde se produ0eron los nacimientos. Sin
embar$o, en el caso de los ni"os nacidos con menos de +.7:: $ (nivel +) la diferencia entre los FF
(crudo y a0ustado) estara indicando que el lu$ar del parto modifica el efecto del ries$o del ba0o
peso. n otras palabras, las tasas de mortalidad en el 'ospital 5V6 son mayores, pero en el caso
particular de los ni"os con muy ba0o peso el ries$o de morir es mayor en el 'ospital 5V6.
l resto de los resultados deben interpretarse como en el an#lisis simple.
BIBLIOGRAFA
+. VresloW /, 4ay /. Statistical methods in cancer research ! The analysis of case"control studies.
&yon, OAF<% +9A:.
2. veritt VS. The analysis of contingency tables. &ondon, <'apman and Gall% +9LL.
)7
3. 3leiss K&. Statistical methods for rates and proportions. /eW BorX, Ko'n Jiley Y Sons% +9A+.
,. Fot'man IK, Creelnland S. Modern epidemiology! )nd ed. P'iladelp'ia, &ippincott-Faven%
+99A.
5. Sc'lesselman KK. #ases"control studies! $esign% conduct% analysis. /eW BorX, 2(ford 1niversity
Press% +9A).
TABLAS GENERALES
TABLAS MXN
1na tabla de contin$encia .(/ se obtiene cuando se clasifican los individuos de una muestra
con respecto a dos variables cualitativas con . y / cate$oras respectivamente. sta
clasificacin debe ser e('austiva y mutuamente e(clusiva, lo que si$nifica que cada individuo
'a de poder asi$narse a una de estas .(/ cate$oras, y solo a una. l submdulo de ;ablas
.(/ permite analizar ) variables nominales u ordinales en tablas de 'asta ): columnas por ):
filas.
n $eneral, la cuestin m#s importante que se plantea ante una tabla de contin$encia es si las
variables son independientes o no. Para resolver esta cuestin se 'an propuesto diversas
pruebas de 'iptesis% las incluidas en pidat *.+ son,
&a prueba Ki-cuadrado de Pearson
&a prueba de razn de verosimilitudes
&a prueba Ki-cuadrado con correccin de Bates (para tablas )())
&a prueba e(acta de 3is'er (para tablas )())
&a prueba Ki-cuadrado de Pearson se basa en la 'iptesis de que no 'ay discrepancias entre las
frecuencias observadas en la tabla y las esperadas en caso de independencia o no asociacin
entre las variables. l estadstico de esta prueba si$ue, apro(imadamente, una distribucin
Ki-cuadrado con (.-+)((/-+) $rados de libertad. <oc'ran 'a estudiado la validez de la
apro(imacin y recomienda que slo se utilice esta prueba cuando se cumplan las si$uientes
condiciones, menos de un ):8 de las celdas de la tabla tienen frecuencia esperada menor que 7 y
nin$una celda tiene frecuencia esperada menor que +.
Para tablas )(), e(iste una versin del estadstico Ki-cuadrado de Pearson que, para me0orar la
apro(imacin, incorpora la llamada correccin de Bates% pero 'ay $ran discrepancia en la
literatura en cuanto a la validez de este procedimiento, que muc'os autores cuestionan. Para
tablas basadas en tama"os de muestra $randes, se obtienen resultados similares con y sin
correccin% y en el caso de muestras peque"as, la recomendacin es utilizar m!todos e(actos,
como es el caso de la prueba e(acta de 3is'er. sta prueba calcula la probabilidad e(acta de
obtener los resultados observados si las dos variables son independientes y los totales
mar$inales son fi0os.
&a prueba de razn de verosimilitudes es una alternativa a la prueba Ki-cuadrado para contrastar
la 'iptesis nula de que las dos variables son independientes, y est# basado en la teora de la
m#(ima verosimilitud. l estadstico de esta prueba, que si$ue tambi!n una distribucin
)=
Ki-cuadrado con (.-+)((/-+) $rados de libertad, se basa en comparar la probabilidad de los
datos observados con la probabilidad de los datos esperados en caso de ser cierta la 'iptesis de
independencia. Por tanto, valores altos del estadstico son indicativos de asociacin entre las
variables. &a distribucin del estadstico es tambi!n apro(imada, por lo que puede no ser
apropiado si el tama"o de la muestra es peque"o.
Por otra parte, pidat *.+ calcula varias medidas que cuantifican la intensidad de la asociacin
entre las dos variables de la tabla de contin$encia. Al$unas de estas medidas son v#lidas en
$eneral para variables nominales% otras son especficas de variables ordinales. n el primer caso,
se incluyen,
#oeficiente de contingencia #. ;oma valores entre : y +. Rale : en caso de independencia completa%
sin embar$o, no siempre toma el valor m#(imo de +, porque incluso en el caso de asociacin
completa, el valor de < depende del nmero de filas y columnas de la tabla.
#oeficiente & de #ramer. <orri$e el problema de la dependencia que tiene el coeficiente de
contin$encia del nmero de filas y columnas. Para tablas )) toma valores entre -+ y + y, en otro
caso, vara entre : y +, alcanzando el E+ :, respectivamente, en caso de independencia
completa, y el + en caso de asociacin completa.
stas dos medidas de asociacin est#n basadas en el estadstico Ki-cuadrado de la prueba de
Pearson y son sim!tricas, es decir, no dependen de cual es la variable de filas y cual la de
columnas% si se intercambian las variables se obtiene el mismo resultado para estos coeficientes.
Tau de 'oodman y (rus)al. s una medida de asociacin asim!trica, que permite considerar a una
de las variables como independiente y a la otra como dependiente, y ocasionalmente valorar en
qu! medida la primera predice a la se$unda. pidat *.+ presenta el coeficiente ;au de Coodman
y IrusXal en dos situaciones, tomando las filas como cate$oras de la variable dependiente
(3ilas?<olumnas) o considerando las columnas como tales (<olumnas?3ilas). Ambos
coeficientes toman valores entre : y +, y ser#n m#s cercanos a + cuanto mayor sea la capacidad
de predecir sin error la variable dependiente, mientras que un valor de : si$nifica que la variable
independiente no tiene capacidad para predecir la dependiente
<uando las variables son ambas ordinales, e(isten medidas de asociacin especficas que tienen
en cuenta la ordenacin, y toman valores positivos cuando una de las variables tiende a
aumentar a medida que lo 'ace la otra, y valores ne$ativos en la situacin inversa, es decir,
cuando los valores altos de una variable se asocian con valores ba0os de la otra. &as incluidas en
pidat *.+ son,
Tau"b de (endall. st# basado en el nmero de concordancias, discordancias y empates entre
pares de casos. 1n par es concordante si los valores de ambas variables para un caso son
menores?mayores que los valores correspondientes para el otro caso, y discordante si ocurre lo
contrario. <onsid!rese, por e0emplo, la relacin entre las variables clase social (<S, * cate$oras
en orden creciente) y dia$nstico (4, > cate$oras de menor a mayor $ravedad) en una muestra
de pacientes psiqui#tricos% un par de pacientes con valores <S@), 4@) y <S@*, 4@> es
concordante, mientras que un par discordante sera por e0emplo el formado por dos pacientes
con valores <S@), 4@) y <S@*, 4@+.
l coeficiente ;au-b de Iendall puede tomar valores entre -+ y +, aunque solo alcanza estos
e(tremos en el caso de tablas cuadradas. Si el predominio de los pares es concordante, el valor es
pr(imo a + y se dice que la asociacin es positiva% si la mayora de los pares es discordante, la
)L
asociacin ser# ne$ativa y el valor se acercar# a E+. l valor : indica que no 'ay relacin entre las
dos variables y ocurre cuando los pares concordantes y discordantes son i$ualmente probables.
Tau"c de Stuart. s una variante del coeficiente anterior, y se diferencia de !l en que puede
alcanzar los valores mnimo y m#(imo, -+ y +, en tablas de cualquier dimensin, salvo peque"as
discrepancias cuando el tama"o de la muestra no es un mltiplo del mnimo entre . y /
(nmero de filas y columnas, respectivamente).
'amma de 'oodman y (rus)al. ;ambi!n basada en pares concordantes y discordantes, toma
valores entre -+ y +% el valor : se alcanza en caso de que las variables sean independientes y la
asociacin es tanto mayor cuanto m#s se apro(ima $amma a E+ a +.
$ de Somers. s una medida asim!trica que, por tanto, permite realizar un an#lisis de relacin
entre dos variables tomando una de ellas como dependiente, por lo que se obtendr#n dos
ndices, i$ual que en el caso de la ;au de Coodman y IrusXal, uno cuando la variable
independiente es la situada en las filas y otro en el caso de que dic'a variable sea la de
columnas. &os dos coeficientes de Somers tambi!n toman valores entre -+ y +.
Para estas medidas de asociacin con datos ordinales pidat *.+ presenta el error est#ndar y una
prueba de si$nificacin.
#oeficiente de correlacin por rangos de Spearman. s una medida de correlacin utilizada
'abitualmente para variables ordinales. &os valores de cada una de las variables se clasifican de
menor a mayor y se calcula el coeficiente de correlacin de Pearson en base a los ran$os. &os
valores del coeficiente de correlacin por ran$os de Spearman varan entre E+ y +, y un valor :
indica que no e(iste nin$una relacin lineal entre las variables.
Por ltimo, en el caso de tablas )(/ con variables ordinales, pidat *.+ realiza una prueba de
tendencia lineal, que contrasta la 'iptesis de que los porcenta0es, calculados para cada columna,
tienden a aumentar o disminuir a lo lar$o de la primera fila o, equivalentemente, de la se$unda
fila.
E"emplo 1
Para analizar si la distribucin de los motivos de consulta en > centros de atencin ambulatoria
pedi#trica eran similares, se clasificaron las consultas en = $rupos, (+) .edicina preventiva% ())
Onfecciones respiratorias altas% (*) 2tras enfermedades a$udas% (>) nfermedades crnicas% (7)
;raumatismos e into(icaciones% y (=) Problemas sociales.
&a tabla resultante fue la si$uiente,
+entro de Salud
8rupo de moti2os de consulta
1 2 3 4 7 6 Total
<entro A *7: AL =7 +) )* )* 760
<entro V +): >* *A = +: +) 225
)A
<entro < >)= =L *> L >7 =L 646
<entro 4 )=L >9 *7 7 +A +A 352
Total 1.163 246 162 30 56 120 1.926
l an#lisis en pidat *.+ de estos datos mostrara estos resultados,
Tablas de contingencia : Tablas >xN
N?mero de filas : &
N?mero de columnas: #
6ilas G columnas : Nominales
6recuencias observadas
$ 2 % & 5 # Total
!!!!! !!!!!!! !!!!!!! !!!!!!! !!!!!!! !!!!!!! !!!!!!! !!!!!!!
$ %50 "- #5 $2 2% 2% 5#0
2 $20 &% %" # $0 $2 229
% &2# #- %& - &5 #- #&#
& 2#- &9 %5 5 $" $" %92
!!!!! !!!!!!! !!!!!!! !!!!!!! !!!!!!! !!!!!!! !!!!!!! !!!!!!!
Total $$#% 2&# $-2 %0 9# $20 $"2-
'orcenta<es +'or filas,
$ 2 % & 5 # Total
!!!!!!! !!!!!!! !!!!!!! !!!!!!! !!!!!!! !!!!!!! !!!!!!! !!!!!!!!!!
$ #2,50 $5,5& $$,#$ 2,$& &,$$ &,$$ $00,00
2 52,&0 $",-" $#,59 2,#2 &,%- 5,2& $00,00
% #5,9& $0,%- 5,2# $,0" #,9- $0,%- $00,00
& #",$$ $2,50 ",9% $,2" &,59 &,59 $00,00
!!!!!!! !!!!!!! !!!!!!! !!!!!!! !!!!!!! !!!!!!! !!!!!!! !!!!!!!!!!
Total #%,## $%,&# 9,&$ $,#& 5,25 #,5- $00,00
% de celdas con frecuencia esperada H5: &,2%
'rueba 2i!cuadrado de 'earson
2i!cuadrado gl 4alor p
!!!!!!!!!!! !!!!!!!! !!!!!!!!
-#,9&&2 $5 0,0000
'rueba de raz(n de verosimilitudes
2i!cuadrado gl 4alor p
!!!!!!!! !!!!!!!! !!!!!!!!
-5,&22& $5 0,0000
>edidas de asociaci(n para variables nominales
Estimaci(n
!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!
*oeficiente de contingencia 0,20$0
*oeficiente 4 de *ramer 0,$$"5
)9
Tau de Doodman G /rusIal
6ilasJ*olumnas 0,009"
*olumnasJ6ilas 0,0$5#
l porcenta0e de celdas con frecuencia esperada menor que 7, que se informa inmediatamente
deba0o de la tabla, est# vinculado a las e(i$encias para la utilizacin de la prueba Ki-cuadrado de
Pearson. stas e(i$encias son,
.enos de un ):8 de celdas con frecuencia esperada menor que 7.
/in$una celda con frecuencia esperada menor que +.
<omo ambas condiciones est#n presentes, puede considerarse v#lido el uso de la Ki-cuadrado de
Pearson. sta, por otra parte, indica que se puede descartar enf#ticamente que la distribucin
observada diste de la uniformidad entre centros solo por producto del azar. &o que, en otras
palabras, indica que e(iste un patrn de distribucin de los motivos de consulta que no es el
mismo en todos los centros. 4e 'ec'o, el porcenta0e de motivos en la cate$ora = (Problemas
sociales), por e0emplo, result muc'o mayor en el centro < que en los restantes centros.
Por su parte, los valores de los coeficientes de contin$encia y de <ramer obtenidos indican una
asociacin ba0a entre el centro de salud y el motivo de consulta.
l valor :,:+7= del coeficiente ;au de Coodman y IrusXal calculado considerando la variable
5<entro de salud6 (filas) como independiente tiene la si$uiente interpretacin, conociendo el
centro donde se 'izo la consulta, se reduce en un +,7=8 la probabilidad de cometer un error al
predecir el motivo de la consulta (columnas). sto si$nifica que el centro de salud no tiene
capacidad predictiva sobre el motivo de la consulta.
E"emplo 2
Se quiere estudiar la relacin entre la edad de las mu0eres y su aceptacin de una ley sobre
interrupcin del embarazo. Para ello se 'a llevado a cabo una encuesta sobre >:: mu0eres cuyos
resultados se reco$en en la si$uiente tabla,
#ceptacin
Edad 4a"a :edia #lta
:-+A )+ *> )7
+A-*7 )> *+ )7
*=-7: *: *: ):
7+-=7 *L *: +*
T =7 >: *: +:
4ada la naturaleza ordinal de las dos variables, debe seleccionarse la opcin de 54atos
ordinales6 en la pantalla de entrada de pidat *.+ &os resultados que muestra el pro$rama son
los si$uientes,
Tablas de contingencia : Tablas >xN
N?mero de filas : 5
N?mero de columnas: %
*:
6ilas G columnas : 0rdinales
6recuencias observadas
$ 2 % Total
!!!!!!!!!! !!!!!!!!!! !!!!!!!!!! !!!!!!!!!! !!!!!!!!!!
$ 2$ %& 25 "0
2 2& %$ 25 "0
% %0 %0 20 "0
& %- %0 $% "0
5 &0 %0 $0 "0
!!!!!!!!!! !!!!!!!!!! !!!!!!!!!! !!!!!!!!!! !!!!!!!!!!
Total $52 $55 9% &00
'orcenta<es +Total,
$ 2 % Total
!!!!!!!!!! !!!!!!!!!! !!!!!!!!!! !!!!!!!!!! !!!!!!!!!!
$ 5,25 ",50 #,25 20,00
2 #,00 -,-5 #,25 20,00
% -,50 -,50 5,00 20,00
& 9,25 -,50 %,25 20,00
5 $0,00 -,50 2,50 20,00
!!!!!!!!!! !!!!!!!!!! !!!!!!!!!! !!!!!!!!!! !!!!!!!!!!
Total %",00 %",-5 2%,25 $00,00
% de celdas con frecuencia esperada H5: 0,0%
'rueba 2i!cuadrado de 'earson
2i!cuadrado gl 4alor p
!!!!!!!!!!! !!!!!!!! !!!!!!!!
$9,2"2" " 0,0$%&
'rueba de raz(n de verosimilitudes
2i!cuadrado gl 4alor p
!!!!!!!! !!!!!!!! !!!!!!!!
$9,9&&5 " 0,0$05
>edidas de asociaci(n para variables nominales
Estimaci(n
!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!
*oeficiente de contingencia 0,2$&5
*oeficiente 4 de *ramer 0,$55%

Tau de Doodman G /rusIal

6ilasJ*olumnas 0,022&
*olumnasJ6ilas 0,0$2$
>edidas de asociaci(n para variables ordinales
Estimaci(n EE Estad3stico ; 4alor p
!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!! !!!!!!! !!!!!!!!!!!!! !!!!!!!
*+
Tau!b de /endall !0,$-99 0,0&00 !&,&"52 0,0000
Tau!c de tuart !0,$9&" 0,0&%& !&,&"52 0,0000
Damma de Doodman G /rusIal !0,2&-" 0,05&5 !&,&"52 0,0000
: de ommers
6ilasJ*olumnas !0,$99& 0,0&&% !&,&"52 0,0000
*olumnasJ6ilas !0,$#2% 0,0%#2 !&,&"52 0,0000
*oeficiente de correlaci(n por rangos de pearman
. Estad3stico t gl 4alor p
!!!!!!! !!!!!!!!!!!!!!!!!!!!! !!!!!!!!
!0,2$%& !&,%5"5 %9" 0,0000
<uando las dos variables son ordinales, como en este e0emplo, pidat *.+ muestra todos los
resultados que se presentan para variables nominales, v#lidos tambi!n en este caso y, adem#s,
las medidas de asociacin especficas para variables ordinales.
&as medidas nominales cuantifican el $rado de asociacin, mientras que las ordinales indican
adem#s si la asociacin es montona en el sentido de que la clasificacin en una variable tiende a
aumentar cuando lo 'ace la otra (asociacin positiva) o a disminuir (asociacin ne$ativa).
n el e0emplo, la prueba Ki-cuadrado de Pearson y la prueba de razn de verosimilitudes indican
que 'ay evidencia de asociacin entre el $rado de aceptacin del aborto y la edad de las mu0eres,
en tanto que las medidas de asociacin informan que !sta es ne$ativa, es decir, que el $rado de
aceptacin disminuye al aumentar la edad.
REGRESIN LOGSTICA
Con"%tos &nra!s
ntre los propsitos de muc'as investi$aciones epidemiol$icas se 'alla el establecimiento de
las leyes que ri$en los fenmenos que se e(aminan. l e(amen se realiza tpicamente en un
marco comple0o, donde la coe(istencia de factores mutuamente relacionados determina el
comportamiento de otros. Para sondear o incluso desentra"ar la naturaleza de tales relaciones, el
investi$ador puede au(iliarse, entre otras alternativas, del an#lisis de re$resin. &a re$resin
lo$stica (F&) forma parte del con0unto de m!todos estadsticos que caen ba0o tal denominacin
y es la variante que corresponde al caso en que se valora la contribucin de diferentes factores
en la ocurrencia de un evento simple.
n $eneral, la F& es adecuada cuando la variable de respuesta B es politmica (admite varias
cate$oras de respuesta, tales como .K2FA .1<G2, .K2FA, S .A/;O/ OC1A&,
.P2FA, .P2FA .1<G2), pero es especialmente til en particular cuando solo 'ay dos
posibles respuestas (cuando la variable de respuesta es dicotmica), que es el caso m#s comn.
;al es el caso, por e0emplo, de las si$uientes situaciones, el paciente muere o sobrevive en las
primeras >A 'oras de su in$reso, el or$anismo acepta o no un trasplante, se produ0o o no un
intento suicida antes de los =: a"os, etc.) y lo que se quiere es construir un modelo que e(prese
la probabilidad de ocurrencia del evento de que se trate en funcin de un con0unto de variables
independientes. B se codifica como + (si se produce cierto desenlace) y como : en caso opuesto,
*)
de modo que la F& e(presa P(B@+) en funcin de ciertas variables relevantes a los efectos del
problema que se 'aya planteado. &a finalidad con que se construye ese modelo no es nica,
b#sicamente, puede tratarse de un mero esfuerzo descriptivo de cierto proceso, puede 'acerse
en el conte(to de la bsqueda de e(plicaciones causales o puede desearse la construccin de un
modelo para la prediccin.
&a F& es una de las t!cnicas estadstico-inferenciales m#s empleadas en la produccin cientfica
contempor#nea. Sur$e en la d!cada del =: con la aparicin del traba0o de <ornfield, Cordon y
Smit'
+
sobre el ries$o de padecer una enfermedad coronaria que constituye su primera aplicacin
pr#ctica trascendente. Su $eneralizacin dependa de la solucin que se diera al problema de la
estimacin de los coeficientes. l al$oritmo de JalXer-4uncan
)
para la obtencin de los
estimadores de m#(ima verosimilitud vino a solucionar en parte este problema, pero era de
naturaleza tal que el uso de computadoras era imprescindible.
4e su amplio y creciente empleo 'an dado cuenta varias revisiones. Silva, P!rez y <uellar
*
consi$nan que !sta fue la t!cnica estadstica m#s usada entre los +.:>7 artculos publicados por
*merican +ournal of ,pidemiology entre +9A= y +99: (casi * de cada +: traba0os all publicados). &evy y
Stolte
>
llevaron a cabo un estudio para caracterizar la tendencia en el uso de m!todos estadsticos
sur$idos recientemente (entre los =: y los L:) y que, adem#s, 'ubieran tenido un impacto
considerable en el an#lisis de datos biom!dicos% entre ellos fi$ura la re$resin lo$stica. &as propias
*merican +ournal of Public -ealth y *merican +ournal of ,pidemiology 'an puesto de manifiesto que la
tendencia en el uso de la F& fue creciente en los artculos de ambas revistas. l porcenta0e de
artculos publicados en la d!cada de los L: que 'icieron uso de este recurso fue :,L8% ya en los A:,
ascendi espectacularmente a +L,:8 y a lo lar$o de la d!cada de los 9: alcanz )A,+8.
n .4&O/, base de datos que contiene referencias biblio$r#ficas y resmenes de >.7:: revistas
biom!dicas de la literatura de 'abla in$lesa, usando P1V.4 se encontr que el crecimiento en los
ltimos cinco a"os 'a sido sostenido, los resmenes publicados que 'acen mencin del t!rmino
logistic regression son para +99L, +99A, +999, )::: y )::+, respectivamente, los si$uientes, *.*9>, *.=7>,
*.9L), >.*9L y 7.)+A.
El modelo logstico. l problema que resuelve la re$resin lo$stica es el de e(presar la
probabilidad de cierto desenlace (B@+) en funcin de r variables S
+
,S
)
,...,S
r
. <oncretamente, lo que
'ace el pro$rama es 'allar los coeficientes
:
,
+
, ...,
r
que me0or se a0ustan a la si$uiente
representacin funcional,
5 ... $607 +
+
5 + 7
+ + . r r
X X
Y P
+
= =
donde e(p(.) representa la funcin e(ponencial (antilo$aritmo neperiano).
.egresin logstica para datos ta$ulados. pidat *.+ se ocupa del an#lisis de datos tabulados% la
re$resin lo$stica es el nico m!todo de re$resin que puede emplearse le$timamente con datos
reco$idos en tablas de contin$encia (v!ase Silva
7
). ste 'ec'o, unido al intenso empleo
contempor#neo de este recurso, determin que la presente versin de pidat incluyera la t!cnica de
F&, para lo cual se emple el al$oritmo su$erido por Kones
=
.
4ebe enfatizarse, sin embar$o, que con frecuencia los datos disponibles no son susceptibles de ser
reco$idos en una tabla de contin$encia por involucrar variables continuas, en cuyo caso 'a de
emplearse un pro$rama que contemple esta posibilidad. Por otra parte, al emplear la F&, como
ocurre en ri$or con cualquier otra t!cnica estadstica, se debe ser cauteloso. Si bien el modelo no
**
tiene restricciones en cuanto a la distribucin de las variables independientes (eso es lo que 'ace
posible, precisamente, que se pueda emplear con datos tabulados), para que el an#lisis ten$a
sentido pleno, debe aplicarse con fines predictivos solo en los estudios prospectivos, cuando se
ten$a certeza de que los acontecimientos re$istrados por las variables independientes ocurrieron
antes que los desenlaces. Por otra parte, si se emplea para el tratamiento de estudios retrospectivos
(estudios de casos y controles), entonces debe tenerse en cuenta que no se puede emplear el modelo
para 'acer predicciones.
&a variable de respuesta se codificar# siempre como + si el evento se produce, y como : en caso
opuesto. <ada variable independiente se codificar# como +, ), ZZZ, X, donde X es el nmero de
cate$oras que contiene. Si 'ay r variables independientes con )
+
, )
)
, ..., )
r
cate$oras respectiva-
mente, se tendr#n en total ))
+
)
)
...)
r
confi$uraciones posibles% para cada una de ellas 'ay que
consi$nar el nmero de su0etos de la muestra que se encuadran en dic'a confi$uracin (la
frecuencia). n pidat *.+, el nmero m#(imo de variables independientes es +:.
;aria$les dumm,. &as variables e(plicativas de tipo nominal con m#s de dos cate$oras deben
ser incluidas en el modelo definiendo variables dummy. pidat *.+ permite indicar que una
variable independiente sea tratada de este modo y, en tal caso, construye autom#ticamente las
dummy correspondientes.
Vrevemente dic'o, el sentido de las variables dummy es el si$uiente, supn$ase que cierta
variable es nominal (raza, reli$in profesada, $rupo san$uneo, etc.) y consta de X cate$oras% deben
crearse entonces X-+ variables dicotmicas que son las llamadas variables dummy asociadas a esta
variable nominal. Se denotar#n por .
+
, .
)
, ..., .
X-+
. A cada cate$ora o clase de la variable nominal le
corresponde un con0unto de valores de los .
i
con el cual se identifica dic'a clase.
&a manera m#s usual de definir estas X-+ variables es la si$uiente, si el su0eto pertenece a la primera
cate$ora, entonces las X-+ variables dummy valen :, se tiene .
+
@ .
)
@ ...@ .
X-+
@:% si el su0eto se 'alla
en la se$unda cate$ora, entonces .
+
@+ y las restantes valen :% .
)
vale + solo para aquellos
individuos que est#n en la tercera cate$ora, en cuyo caso las otras variables asumen el valor :, y as
sucesivamente 'asta lle$ar a ltima cate$ora, para la cual .
X-+
es la nica que vale +.
Por e0emplo, si la variable nominal de inter!s es el $rupo san$uneo, la cual tiene X@> cate$oras
(san$re tipo 2, tipo A, tipo V y tipo AV)% entonces se tendran los si$uientes valores de las variables
dummy para cada $rupo san$uneo,
;aria$le nominal
<grupo sanguneo=
>
1
>
2
>
3
2 : : :
A + : :
V : + :
AV : : +
n cualquier caso, si se a0usta un modelo que incluya una variable nominal con ? clases, !sta
debe ser sustituida por las ?*1 variables dummy, y a cada una de ellas corresponder# su
respectivo coeficiente.
<omo se ilustra m#s adelante, una de las razones que confiere especial inter!s a la re$resin
lo$stica consiste en que suple en buena medida al an#lisis basado en la estratificacin. Al i$ual
que el an#lisis estratificado, la F& permite la evaluacin y control del efecto de confusin, as
como evaluar y describir el de interaccin.
*>
4ondad de a"uste del modelo. Siempre que se a0usta un modelo de re$resin, de cualquier tipo,
una precaucin importante a los efectos de sacar conclusiones es la de corroborar que este
modelo se a0usta efectivamente a los datos usados. &a F& no es una e(cepcin. pidat *.+
permite evaluar la calidad del a0uste del modelo estimado mediante el test de bondad de a0uste
de Gosmer y &emes'oW
L
. l estadstico que ellos proponen se calcula definiendo +: $rupos
mediante los deciles de las probabilidades predic'as por el modelo, y comparando las
frecuencias observadas en dic'os $rupos con las esperadas.
s bien conocido que, en el conte(to de la re$resin lineal mltiple, se suele emplear el llamado
coeficiente de determinacin (F
)
) para cuantificar mediante una nica medida, con cotas
interpretables, el $rado de 5e(plicacin de la variabilidad de la variable de respuesta6
conse$uido con el modelo por parte de las variables independientes. Rarias su$erencias se 'an
'ec'o para obtener al$o similar en el marco de la F&. Sin embar$o, no 'ay una opinin un#nime
sobre cu#l podra ser la me0or. pidat *.+ 'a incorporado una, preferida por .ittlb[cX y
Sc'emper
A
(quienes e(aminan +) posibles mediciones) a la que se denomina aqu, an#lo$amente,
coeficiente de determinacin. F
)
es un nmero que se 'alla necesariamente entre : y +. Alcanza el
valor + cuando el vaticinio es perfecto (esto quiere decir, que F
)
alcanzara el valor m#(imo solo
si el modelo atribuyera probabilidad + a aquellos su0etos de la muestra que efectivamente
tuvieron el evento, y valores i$uales a : a quienes no lo tuvieron) y F
)
se apro(ima a : en la
medida que las probabilidades atribuidas por el modelo disten m#s, respectivamente, de + y :.
<abe advertir, no obstante, que este coeficiente no mide la bondad del a0uste (un concepto
diferente al de 5variabilidad e(plicada por el modelo6), la cual debe valorarse a trav!s de las
pruebas especficamente dise"adas con ese fin (en particular, la prueba de Gosmer y
&emes'oW).
+ociente de 2erosimilitud. Para que un modelo sea considerado adecuado, !ste debe atribuir una
alta probabilidad de enfermar a aquellos su0etos para los cuales B@+ (o sea, a los que padecen la
enfermedad) y una ba0a probabilidad de enfermar (o una alta probabilidad de no padecerla) a
quienes no manifiestan la enfermedad. Por tanto, una medida razonable para valorar el $rado en
que el modelo arro0a resultados co'erentes con los datos usados para su construccin sera el
producto de todas las probabilidades (predic'as por el modelo) de que los n su0etos de la
muestra ten$an la condicin que realmente tienen. Si se llama
i
P
8
a la probabilidad estimada por
el modelo de que el i-!simo su0eto ten$a la condicin, se puede computar la e(presin si$uiente,
)
\
+ ( )
\
+ ( )
\
+ (
\ \ \
) + ) + n d d d
P P P P P P & =
+ +

conocida como la verosimilitud del modelo. 1n modelo completamente e(itoso, el cual atribuya una
probabilidad de enfermar i$ual a + a cada su0eto enfermo y de : a cada su0eto libre de la
enfermedad, tendra una verosimilitud m#(ima de +% por el contrario, un modelo relativamente no
e(itoso tendra una verosimilitud peque"a. n consecuencia, la pro(imidad de la verosimilitud a +
e(presa cu#n eficiente 'a sido este recurso para modelar la realidad.
*7
d su0etos con la
condicin
d n su0etos sin la
condicin
4ebido a que la funcin de verosimilitud mide la plausibilidad de un modelo de re$resin
lo$stica, no debe sorprender que para valorar su capacidad predictiva sea central la consideracin
de la verosimilitud% es decir, de la ma$nitud & antes introducida. <oncretamente, se suele emplear
la e(presin,
/@-)ln &
A esta transformacin se le conoce como le0ana del modelo (deviance en in$l!s). /tese que, siendo
&U+, su lo$aritmo siempre ser# ne$ativo% de modo que la le0ana / siempre ser# un nmero
positivo. l $rado de a0uste de un modelo es me0or cuanto m#s pr(ima a + es la verosimilitud y, en
consecuencia, cuanto m#s se apro(ima a cero la le0ana.
Siempre que se a0usta un modelo, el al$oritmo de la re$resin lo$stica computa dos le0anas, la que
corresponde propiamente al modelo que se 'a a0ustado (/), y la que corresponde al 5modelo nulo6
(/
:
) que es aquel en que no se 'a incorporado nin$una variable independiente.
&a le0ana del modelo nulo es m#s $rande que la de cualquier modelo ampliado. sto es razonable
debido a que se trata de un modelo muc'o menos sofisticado y debe necesariamente tener una falta
de a0uste mayor. &a diferencia entre estas le0anas mide 5el aporte6 que 'acen las variables
incorporadas al modelo. s decir, para valorar dic'o aporte se puede calcular el cociente o razn de
verosimilitudes,

= = + = =
&
&
& & & & / / R&
:
: : :
ln ) ) ln (ln ) ln ) ln )
que se distribuye Ki-cuadrado con X $rados de libertad, donde X es el nmero de variables presentes
en el modelo ampliado.
n $eneral, esta razn de verosimilitudes es til, en fin, para determinar si 'ay una diferencia
si$nificativa entre incluir en el modelo todas las variables y no incluir nin$una% o, dic'o de otro
modo, R& sirve para evaluar si las variables S
+
, S
)
, ..., S
r
tomadas en con0unto, contribuyen
efectivamente a ]e(plicar] las modificaciones que se producen en P(B@+).
+ur2a .%+. n un conte(to predictivo debe seleccionarse el me0or modelo entre todos los
posibles. l #rea ba0o la curva F2< es una forma de comparar diferentes modelos, ya que da una
medida de la capacidad predictiva de los mismos. <uanto mayor sea esa #rea, m#s eficiente es el
modelo. Para un modelo concreto, la curva F2< se construye del modo si$uiente,
&as probabilidades predic'as por el modelo permiten, definiendo un punto de corte, clasificar a
los su0etos en dos $rupos, los que presentan el evento (respuesta +) y los que no lo presentan
(respuesta :). 4esde esta perspectiva, puede considerarse el modelo de re$resin lo$stica como
un medio para definir una prueba dia$nstica cuantitativa. 3i0ando un umbral para 'acer el
dia$nstico (por e0, dia$nosticar enfermedad si P(B@+)T:,A y declarar sano en caso contrario) en
una situacin en que se conozcan los verdaderos desenlaces, para la que es posible calcular la
sensibilidad (porcenta0e de su0etos con el evento que son clasificados correctamente por el
modelo) y la especificidad (porcenta0e de su0etos sin el evento que son clasificados correctamente
por el modelo). Si se toman varios puntos de corte o umbrales sucesivamente, se tendr#n
sucesivas pare0as de sensibilidad-especificidad. &a curva F2< se obtiene representando, en un
cuadrado de lado +, los valores de +-especificidad frente a sensibilidad para todos los posibles
puntos de corte en las probabilidades predic'as.
*=
&a curva empieza en el punto (:,:), que corresponde al punto de corte +, y termina en (+,+) que
se obtiene al considerar el : como punto de corte. Si el modelo tiene capacidad predictiva nula,
la curva coincide con la dia$onal principal del cuadrado, y el #rea ba0o la curva toma su valor
mnimo de :,7. Por el contrario, un modelo perfecto tiene una curva F2< con #rea +.
Nota@ n los modelos mltiples puede ser interesante incorporar la interaccin
entre dos variables e(plicativas% esto si$nifica que la influencia de una
variable sobre la respuesta puede ser diferente en funcin de los valores
que tome otra variable incluida en el modelo. pidat *.+ no contempla
la posibilidad de definir interacciones de forma autom#tica, pero esta
posibilidad se puede encarar por parte del usuario definiendo
previamente el producto de las dos variables cuya interaccin se desea
evaluar, e incluy!ndola en el modelo como una e(plicativa m#s. n tal
caso, el usuario debe emplear la lectura autom#tica de datos, tras 'aber
construido un arc'ivo (por e0emplo, en formato (cel) que incluya esta
informacin. Por otra parte, si al menos una de las variables cuya
interaccin se quiere valorar se fuera a tratar como dummy, entonces no
se debe emplear para dic'a variable la construccin autom#tica de
variables dummy que realiza pidat *.+ (ya que producira un resultado
errneo). n tal caso, las variables dummy 'an de ser construidas por el
usuario y !ste 'a de incorporar a la tabla de contin$encia incluida en el
arc'ivo antes mencionado X-+ productos (los de dic'as variables
dummy por la otra variable considerada en la interaccin). R!ase el
e0emplo + para comprender me0or este problema. /aturalmente, esta
idea puede e(tenderse a m#s variables. Podran incorporarse t!rminos
que involucren a tres o m#s de ellas. 1na re$la $eneral que se 'a dado
es que, si en un a0uste se incluye un t!rmino de cierto orden, se incluyan
entonces todos los de orden inferior.
E"emplo 1
Supn$ase que se quiere modelar a trav!s de la F& la relacin entre el 'ec'o de tener
anticuerpos a cierto ROF1S (variable de respuesta, +-SO, :-/2) y dos variables independientes,
^2/A 4 FSO4/<OA (con > cate$oras, +-/2F;, )-S1F, *-S; y >-2S;) y 3A<;2F
FG (con dos cate$oras, +-P2SO;OR2 y )-/CA;OR2). l arc'ivo ROF1S.(ls, que se incluye en
el paquete de pidat *.+, contiene una tabla de contin$encia con los datos de los =.*:7 su0etos
que constituyen la muestra, y que tiene la si$uiente estructura,
;A.BS >%N# .3 F.E+BEN+A#
: + + >>7
: ) + L)9
: * + *)
: > + )>)
: + ) >=>
*L
: ) ) L7L
: * ) =L
: > ) )A>
+ + + >=*
+ ) + LL)
+ * + A)
+ > + )9:
+ + ) >A*
+ ) ) LA9
+ * ) 9:
+ > ) *+=
Al realizar el a0uste con ROF1S en funcin de ^2/A y FG, se declara ^2/A como dummy, y se
obtiene lo si$uiente,
Tablas de contingencia : .egresi(n log3stica
@rc7ivo de traba<o: *:K@rc7ivos de programa KEpidat %E$ KE<emplos KTablas de
contingenciaK4).8Exls
*ampo Lue identifica:
4ariable respuesta: 4).8
6recuencias: 6.E*8EN*)@
4ariables explicativas: ;0N@ .A
Nivel de confianza: 95,0%
4ariable respuesta:
4alor N= su<etos
!!!!! !!!!!!!!!!
0 %020
$ %2"5
!!!!! !!!!!!!!!!
Total #%05
4ariables :ummG:
;0N@
*ategor3a;0N@!$ ;0N@!2 ;0N@!%
!!!!!!!!!!!!!!! !!!!!! !!!!!!
$ 0 0 0
2 $ 0 0
% 0 $ 0
& 0 0 $
Ca sucesi(n de estimadores 7a convergido
N= iteraciones necesarias: %
!2 ln 4erosimilitud inicial: "-29,&&&#"0
!2 ln 4erosimilitud final : "-$$,#2%$22
*ociente de verosimilitud
Estad3stico gElE 4alor p
*A
!!!!!!!!!!! !!!! !!!!!!!
$-,"2$# 2 0,000$
*oeficiente de determinaci(n: 0,002"
4ariable *oeficiente EEE 4alor de ; 4alor p
!!!!!!!!!!!! !!!!!!!!!!! !!!!!!!!! !!!!!!!!!! !!!!!!!
*onstante 0,$0"#&5
;0N@!$ 0,009200 0,05"9$- 0,$5#$5% 0,"-59
;0N@!2 0,5$5#50 0,$%&&"9 %,"%&$&5 0,000$
;0N@!% 0,$025"% 0,0-55## $,%5-522 0,$-&#
.A !0,0&5509 0,0505&$ !0,900&%" 0,%#-9
4ariable 0dds ratio )*+95,0%,
!!!!!!!!!!!! !!!!!!!!!! !!!!!!!!!!!!!!!!!!!!
;0N@!$ $,0092&% 0,"99$-- $,$%2-"$
;0N@!2 $,#-&-2- $,2"###9 2,$-9"2&
;0N@!% $,$0"029 0,955&9# $,2"&9$2
.A 0,9555$$ 0,"#5%95 $,0550$0
'.8E9@ :E 90N:@: :E @28TE :E A0>E. 5 CE>EA01
Drupos basados en los deciles
Drupo de .espuesta M 0 .espuesta M $
probabilidad 4alor observado 4alor esperado 4alor observado 4alor esperado
!!!!!!!!!!!! !!!!!!!!!!!!!!! !!!!!!!!!!!!!! !!!!!!!!!!!!!!! !!!!!!!!!!!!!!
$ &#& &#9,%% &"% &--,#-
2 -5- -#2,#% -"9 -"%,%-
% &&5 &%9,#- &#% &#",%%
& -29 -2%,%- --2 ---,#%
5 2"& 2"$,99 %$# %$",0$
# 2&2 2&&,0$ 290 2"-,99
- 99 99,00 $-2 $-2,00
2i!cuadrado gElE 4alor p
!!!!!!!!!!! !!!! !!!!!!!
0,&#9% 5 0,99%2
*8.4@ .0*
*9
@rea .0* EE )*+95%,
!!!!!!!!!! !!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!!!!
0,5$"0 0,00-$ 0,50&0 0,5%$9 :elong
0,00-% 0,50%- 0,5%22 AanleG N >cNeil
l modelo a0ustado result ser el si$uiente,
5 .,& 9 . +.3 9 . 5+& 9 . ..) 9 . +.- 9 . $607 +
+
5 7
3 2 +
RH Z Z Z
s anticuerpo p
+ +
=
&a bondad del a0uste fue e(celente% ntese la similitud entre valores esperados y observados en
el procedimiento de Gosmer y &emes'oW.
Si quisi!ramos estimar a trav!s del modelo la tasa de anticuerpos entre su0etos del S; que
tienen FG ne$ativo, usaramos la ecuacin precedente con ^
+
@:, ^
)
@+, ^
*
@:, FG@). sto arro0a,
5 532 9 . $607 +
+
5 7
+
= s anticuerpo p
@:,=*
Si se computara la tasa de su0etos con anticuerpos en esta subpoblacin usando la informacin
de la tabla inicial, tendramos que computar, simplemente, la razn,
:2 9 .
32 -2
-2
=
+
A'ora bien, si 1d. quiere que el modelo contemple la interaccin (O/;F) entre ^2/A y FG,
debe incluir como una variable m#s el producto de estas dos ltimas. Si ^2/A pudiera tratarse
como si fuera una variable cuantitativa (tal como nmero de 'i0os) u ordinal (tal como una
escala de satisfaccin) la tabla que 'abra que crear sera la si$uiente,
>:
;A.BS >%N# .3 ANTE. F.E+BEN+A#
: + + + >>7
: ) + ) L)9
: * + * *)
: > + > )>)
: + ) ) >=>
: ) ) > L7L
: * ) = =L
: > ) A )A>
+ + + + >=*
+ ) + ) LL)
+ * + * A)
+ > + > )9:
+ + ) ) >A*
+ ) ) > LA9
+ * ) = 9:
+ > ) A *+=
Nota, Advi!rtase que, en este caso, la variable O/;F no se codifica con valores
+, ), *, ..., sino que es simplemente el producto de las otras dos.
Sin embar$o, puesto que ^2/A 'a de tratarse a trav!s de las variables dummy, esto sera
incorrecto en este caso. Pero para 'acer el a0uste incorporando la interaccin de ^2/A y FG, no
se debe indicar a pidat que mane0e la ^2/A a trav!s de variables dummy, sino que deben
construirse las * variables dummy previamente y lue$o los tres productos procedentes de !stas
con FG. &a tabla de contin$encia sera como si$ue,
;A.BS >1 >2 >3 .3 >1*.3 >2*.3 >3*.3 F.E+BEN+A#
: : : : + : : : >>7
: + : : + + : : L)9
: : + : + : + : *)
: : : + + : : + )>)
: : : : ) : : : >=>
: + : : ) ) : : L7L
: : + : ) : ) : =L
: : : + ) : : ) )A>
+ : : : + : : : >=*
+ + : : + + : : LL)
+ : + : + : + : A)
+ : : + + : : + )9:
+ : : : ) : : : >A*
+ + : : ) ) : : LA9
+ : + : ) : ) : 9:
+ : : + ) : : ) *+=
l arc'ivo ROF1S+.(ls, que se incluye en el paquete de pidat *.+, contiene esta tabla de
contin$encia.
Al realizar el a0uste se obtiene lo si$uiente,
>+
Tablas de contingencia : .egresi(n log3stica
@rc7ivo de traba<o: *:K@rc7ivos de programa KEpidat %E$ KE<emplos KTablas de
contingenciaK4).8$Exls
*ampo Lue identifica:
4ariable respuesta: 4).8
6recuencias: 6.E*8EN*)@
4ariables explicativas: ;$ ;2 ;% .A ;$!.A ;2!.A ;%!.A
Nivel de confianza: 95,0%
4ariable respuesta:
4alor N= su<etos
!!!!! !!!!!!!!!!
0 %020
$ %2"5
!!!!! !!!!!!!!!!
Total #%05
Ca sucesi(n de estimadores 7a convergido
N= iteraciones necesarias: %
!2 ln 4erosimilitud inicial: "-29,&&&#"0
!2 ln 4erosimilitud final : "-05,"%&%$"
*ociente de verosimilitud
Estad3stico gElE 4alor p
!!!!!!!!!!! !!!! !!!!!!!
2%,#$0& - 0,00$%
*oeficiente de determinaci(n: 0,00%#
4ariable *oeficiente EEE 4alor de ; 4alor p
!!!!!!!!!!!! !!!!!!!!!!! !!!!!!!!! !!!!!!!!!! !!!!!!!
*onstante 0,0%9$-%
;$ 0,0%&0&5 0,$"-%-" 0,$"$#9% 0,"55"
;2 $,5&#052 0,&-0-5% %,2"&20" 0,00$0
;% 0,2$59&5 0,2&2#$& 0,"900-" 0,%-%&
.A 0,000&-9 0,0929$2 0,005$59 0,9959
;$!.A !0,0$#%"- 0,$$-"&" !0,$%905% 0,""9&
;2!.A !0,#&55%& 0,2-9&#$ !2,%09920 0,0209
;%!.A !0,0-&#55 0,$5$%2% !0,&9%%&& 0,#2$"
4ariable 0dds ratio )*+95,0%,
!!!!!!!!!!!! !!!!!!!!!! !!!!!!!!!!!!!!!!!!!!
;$ $,0%&#%$ 0,-$##2$ $,&9%-#%
;2 &,#9290- $,"#52&5 $$,"0-229
;% $,2&$0%& 0,--$%"& $,99##2#
.A $,000&-9 0,"%%9$5 $,200%$&
;$!.A 0,9"%-&# 0,-"0"5# $,2%9%5&
;2!.A 0,52&%"% 0,%0%229 0,90#"%$
;%!.A 0,92"0#& 0,#"9"-# $,2&"&"9
'.8E9@ :E 90N:@: :E @28TE :E A0>E. 5 CE>EA01
Drupos basados en los deciles
>)
Drupo de .espuesta M 0 .espuesta M $
probabilidad 4alor observado 4alor esperado 4alor observado 4alor esperado
!!!!!!!!!!!! !!!!!!!!!!!!!!! !!!!!!!!!!!!!! !!!!!!!!!!!!!!! !!!!!!!!!!!!!!
$ &&5 &&5,00 &#% &#%,00
2 &#& &#&,00 &"% &"%,00
% -5- -5-,00 -"9 -"9,00
& -29 -29,00 --2 --2,00
5 2"& 2"&,00 %$# %$#,00
# 2&2 2&2,00 290 290,00
- 99 99,02 $-2 $-$,9"
2i!cuadrado gElE 4alor p
!!!!!!!!!!! !!!! !!!!!!!
0,0000 5 $,0000
E"emplo 2
Supn$ase que se evala la satisfaccin con la atencin primaria de +.:)L personas mediante la
variable SA;OS3 (:- Satisfec'o, +- Onsatisfec'o) y que la probabilidad de estar insatisfec'o se
quiere poner en funcin de r@* variables, a saber,
FA^A, con 3
+
= k cate$oras, +- /e$ro, )- Vlanco, *- .estizo
C_/F2, con 2
2
= k cate$oras, +- Gombre, )- .u0er
4A4, con 2
3
= k cate$oras, +- Adulto, )- Anciano
ntonces, se tendr#n )*))@)> confi$uraciones y 'ay que informar, por tanto, las respectivas
frecuencias. sto quiere decir que 'ay que teclear los datos de una tabla de contin$encia de >
entradas, o prepararla de antemano en S<&, 4base o A<<SS para que el pro$rama la lea
autom#ticamente,
S#TASF .#># 8ENE.% E(#( F.EC
: + + + +:9
: + + ) +9
: + ) + 7>
: + ) ) +>
: ) + + 9:
: ) + ) A
: ) ) + >>
: ) ) ) +*
: * + + A>
: * + ) =
: * ) + >)
: * ) ) +*
S#TASF .#># 8ENE.% E(#( F.EC
+ + + + 7>
>*
+ + + ) 9
+ + ) + )L
+ + ) ) L
+ ) + + >7
+ ) + ) )
+ ) ) + ):
+ ) ) ) 7
+ * + + )++
+ * + ) **
+ * ) + 9L
+ * ) ) )+
l arc'ivo SA;OS3.(ls que se incluye en este paquete de pro$ramas contiene la tabla con los datos
de este e0emplo. Puesto que la variable FA^A no es ordinal, es razonable plantear que sea
mane0ada como una variable dummy. Sin embar$o, no es menester 'acerlo en la tabla de entrada
sino que ello se menciona entre las entradas manuales cualquiera sea la va de comunicar los
datos.
Al aplicar el pro$rama a los datos precedentes se obtiene,
Tablas de contingencia : .egresi(n log3stica
@rc7ivo de traba<o: *:K@rc7ivos de programa KEpidat %E$ KE<emplos KTablas de
contingencia K@T)6Exls
*ampo Lue identifica:
4ariable respuesta: @T)6
6recuencias: 6.EO
4ariables explicativas: .@;@ DENE.0 E:@:
Nivel de confianza: 95,0%
4ariable respuesta:
4alor N= su<etos
!!!!! !!!!!!!!!!
0 &9#
$ 5%$
!!!!! !!!!!!!!!!
Total $02-
4ariables :ummG:
.@;@
*ategor3a.@;@!$ .@;@!2
!!!!!!!!!!!!!!! !!!!!!
$ 0 0
2 $ 0
% 0 $
Ca sucesi(n de estimadores 7a convergido
N= iteraciones necesarias: %
!2 ln 4erosimilitud inicial: $&22,5%$2"%
>>
!2 ln 4erosimilitud final : $2#$,-90&&"
*ociente de verosimilitud
Estad3stico gElE 4alor p
!!!!!!!!!!! !!!! !!!!!!!
$#0,-&0" % 0,0000
*oeficiente de determinaci(n: 0,$522
4ariable *oeficiente EEE 4alor de ; 4alor p
!!!!!!!!!!!! !!!!!!!!!!! !!!!!!!!! !!!!!!!!!! !!!!!!!
*onstante !0,5&5#&0
.@;@!$ !0,0#$0#% 0,$"9%#9 !0,%22&5% 0,-&-$
.@;@!2 $,#$"2-$ 0,$5"&-2 $0,2$$-%2 0,0000
DENE.0 !0,$2"&20 0,$&%&2# !0,"95%-" 0,%-0#
E:@: 0,0$2-%" 0,$9%#05 0,0#5-95 0,9&-5
4ariable 0dds ratio )*+95,0%,
!!!!!!!!!!!! !!!!!!!!!! !!!!!!!!!!!!!!!!!!!!
.@;@!$ 0,9&0-#& 0,#&90## $,%#%55&
.@;@!2 5,0&&%#0 %,#9-55# #,""$-2"
DENE.0 0,"-9&"& 0,##%9#% $,$#&9#%
E:@: $,0$2"20 0,#9%00% $,&"02%$
'.8E9@ :E 90N:@: :E @28TE :E A0>E. 5 CE>EA01
Drupos basados en los deciles
Drupo de .espuesta M 0 .espuesta M $
probabilidad 4alor observado 4alor esperado 4alor observado 4alor esperado
!!!!!!!!!!!! !!!!!!!!!!!!!!! !!!!!!!!!!!!!! !!!!!!!!!!!!!!! !!!!!!!!!!!!!!
$ $$$ $$%,$2 52 &9,""
2 $0& $05,2# 52 50,-&
% $$- $$&,2$ 5# 5",-9
& $9 $",%9 9 9,#$
5 &2 &2,25 9- 9#,-5
# 9- 92,$0 2%2 2%#,90
- # $0,-2 %% 2",2"
2i!cuadrado gElE 4alor p
!!!!!!!!!!! !!!! !!!!!!!
%,##"9 5 0,59"0
*8.4@ .0*
>7
@rea .0* EE )*+95%,
!!!!!!!!!! !!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!!!!
0,-0%2 0,0$#$ 0,#-$- 0,-%&- :elong
0,0$#$ 0,#-$- 0,-%&- AanleG N >cNeil
n este e0emplo, el a0uste es francamente bueno, lo cual se aprecia comparando frecuencias
observadas y esperadas y se confirma al obtener una P muy superior a los niveles admitidos
convencionalmente para declarar si$nificacin. l #rea ba0o la curva F2< en este e0emplo es
considerablemente alta, 'ec'o co'erente con que las * variables incorporadas consi$uen una
reduccin si$nificativa de la le0ana.
E"emplo 3
Se estudia la infeccin 'ospitalaria posquirr$ica en pacientes operados de la cadera. l resultado se
mide a trav!s de la variable O/3< (O/3<@+ cuando el paciente se infecta a lo lar$o de la primera
semana, O/3<@: si no se infecta). Se desea evaluar un nuevo r!$imen t!cnico-or$anizativo de la
atencin de enfermera que se dispensa a estos pacientes. Se define la variable FCO./, de
naturaleza dicotmica, que vale + si el su0eto estuvo in$resado ba0o el nuevo r!$imen y : en caso de
que 'aya estado atendido ba0o el r!$imen convencional.
Oma$nese que se 'an estudiado A: pacientes de diferentes edades, *= de los cuales se 'an ubicado
en el r!$imen convencional y >> en el r!$imen en estudio, y que los resultados son los que se
reco$en en la ;abla +.
>=
Ta$la 1. (istri$ucin de pacientes seg1n r-gimen de atencin enfermera , condicin respecto de
la infeccin.
Anfeccin
.-gimen S <1= No <0=
Nue2o <1= L *L
+on2encional <0= +> ))
%./0030
Si a partir de los datos brutos se estima el efecto del r!$imen de atencin de enfermera sobre el
'ec'o de desarrollar una infeccin, el odds ratio resultante es de :,*: (procedente de computar la
llamada razn de productos cruzados (L)))?(+>*L).
<onsid!rese, adem#s, que se quiere evaluar si la edad del paciente (se nombrar# 4A4 a esta
variable) constituye una variable de confusin en la relacin que pudiera e(istir entre el r!$imen
or$anizativo y el 'ec'o de desarrollar una infeccin.
st# claro que la variable 4A4 cumple con los tres criterios convencionalmente admitidos (4e
Orala, .artnez y Cuill!n
9
) para ser considerada como variable de confusin. Primero, el ries$o de
infeccin aumenta con la edad. Se$undo la proporcin de pacientes mayores de >: a"os es mayor
en el $rupo que recibi el r!$imen de atencin convencional. Por ltimo, es inverosmil creer que el
efecto protector del r!$imen de intervencin sobre el 'ec'o de desarrollar una infeccin se
produzca a trav!s de la edad.
Para valorarlo, los datos se dividen en dos cate$oras de edad (menores e i$uales o mayores de >:
a"os). n este caso, se codifica la variable del modo si$uiente, 4A4@+ si el su0eto es menor de >:
a"os y 4A4@) si no lo es, lo que produce la confi$uracin que reco$e la ;abla ). &os estimados
del odds ratio en las dos cate$oras son de :,>+ y :,*= respectivamente.
1n m!todo usual para valorar una confusin consiste en comparar de forma directa el estimado
bruto del efecto y el estimado de !ste una vez controlado el presunto factor de confusin. Para ello
se debe obtener una estimacin del efecto $lobal a partir de los datos estratificados, mediante una
media ponderada de las estimaciones de los efectos por estrato.
Ta$la 2. (istri$ucin de pacientes seg1n r-gimen de atencin enfermera0 condicin respecto de
la infeccin , grupo de edad.
Anfeccin
S <1= No <0=
EdadD40 <1=
.-gimen nue2o <1= ) ))
.-gimen con2encional <0= ) 9
%.
1
/0041
Edad40 <2=
.-gimen nue2o <1= 7 +7
.-gimen con2encional <0= +) +*
%.
2
/0036
>L
Fetomando nuevamente el e0emplo, Mser# posible que el odds ratio total de :,*: refle0e, en al$una
dimensin, el efecto confusor que pudiera tener la edad en la relacin entre el r!$imen de atencin
de enfermera y la infeccinN
4entro de cada cate$ora o estrato formado por los dos $rupos de edad (menores de >: y no
menores de >:) se puede calcular el odds ratio como nica medida de la asociacin entre el r!$imen
y la infeccin. 1na medida nica $lobal se obtiene como un promedio ponderado de los odds ratio
dentro de los estratos. sto es e(actamente lo que provee el odds ratio de .antel Gaenszel que, en
este caso, como puede corroborarse a trav!s del an#lisis de tablas )() estratificadas en este mismo
mdulo, arro0a el valor :,*L.
Al usar el submdulo de re$resin lo$stica 'ay que teclear los datos de una tabla de contin$encia
de * entradas con A celdas, o prepararla en S<&, 4base o A<<SS para que el pro$rama la lea
autom#ticamente se$n la si$uiente estructura,
ANFE+ .E8A:EN E(#( F.EC
: : + 9
: : ) +*
: + + ))
: + ) +7
+ : + )
+ : ) +)
+ + + )
+ + ) 7
l arc'ivo <A4FA.(ls que se incluye en pidat *.+ contiene la tabla arriba e(puesta. Al
emplear el pro$rama, el usuario puede ele$ir cu#ntas y cu#les variables independientes
incorporar al modelo. A continuacin se e(ponen los resultados que se obtienen cuando se pone
una sola variable (FCO./), y lue$o los que se producen cuando se adiciona la variable
4A4.
+aso en Eue solo se inclu,e la 2aria$le r-gimen como independiente@
Tablas de contingencia : .egresi(n log3stica
@rc7ivo de traba<o: 6:KPestion e *alidadeK)nformacion aude
'ublicaKEpidatKEpidat %E$K@GudaKE<emplosKTablasK*@:E.@Exls
*ampo Lue identifica:
4ariable respuesta: )N6E*
6recuencias: 6.EO
4ariables explicativas: .ED)>EN
4ariable *oeficiente EEE 4alor de ; 4alor p
!!!!!!!!!!!! !!!!!!!!!!! !!!!!!!! !!!!!!!!!! !!!!!!!
*onstante !0,&5$&-%
.ED)>EN !$,2$0&25 0,5%5$5" !2,2#$"0- 0,02%-
>A

4ariable 0dds ratio )*+95,0%,
!!!!!!!!!!! !!!!!!!!!! !!!!!!!!!!!!!!!!!!!!
.ED)>EN 0,29"0-$ 0,$0&&22 0,"50"%"
+aso en Eue se inclu,en r-gimen , edad como 2aria$les independientes@
Tablas de contingencia : .egresi(n log3stica
@rc7ivo de traba<o: *:K@rc7ivos de programa KEpidat %E$ KE<emplos KTablas de
contingencia K*@:E.@Exls
*ampo Lue identifica:
4ariable respuesta: )N6E*
6recuencias: 6.EO
4ariables explicativas: .ED)>EN E:@:
Nivel de confianza: 95,0%
4ariable *oeficiente EEE 4alor de ; 4alor p
!!!!!!!!!!!! !!!!!!!!!!! !!!!!!!! !!!!!!!!!! !!!!!!!
*onstante !2,-59&9%
.ED)>EN !0,9-&-5" 0,55&90$ !$,-5##%5 0,0-90
E:@: $,%%2$"& 0,#225%% 2,$%99&$ 0,0%2&
4ariable 0dds ratio )*+95,0%,
!!!!!!!!!!!! !!!!!!!!!! !!!!!!!!!!!!!!!!!!!!
.ED)>EN 0,%--2"& 0,$2-$5# $,$$9&%"
E:@: %,-"9%$0 $,$$"5#0 $2,"%#9%$
Rarias cosas procede subrayar a partir de los e0emplos desarrollados. Sucintamente, cabe llamar
la atencin sobre las si$uientes,
a= El an)lisis de la .F suple al an)lisis estratificado. /tese que, en el caso de los
pacientes operados de la cadera, el odds ratio (:,)9A) coincide con la razn de productos
cruzados correspondiente a la ;abla +. l intervalo de confianza que produce la F&
P:,+: % :,A7Q es tambi!n coincidente con el que se obtiene mediante el an#lisis no
param!trico que arro0a el an#lisis 'ec'o a trav!s de tablas de )() incluido en otro
submdulo del presente mdulo. Por otra parte, el 2F@:,*LL que se obtiene a trav!s del
e(ponencial del coeficiente que corresponde a FCO./ en el modelo que incluye las
dos variables independientes, no es otra cosa que la estimacin de .antel Gaenszel (lo
mismo ocurre con el intervalo de confianza).
b) Fa 2aloracin so$re el posi$le papel confusor de un factor se desarrolla de manera
)gil. Vasta correr el modelo con y sin el factor y comparar los coeficientes de la variable
independiente. n el e0emplo de los operados de la cadera, se compara :,)9A con :,*LL lo
cual permite pensar que s 'ay efecto confusor. l 2F correspondiente a FCO./ tiene,
en el primer caso, un intervalo de confianza que no contiene al + (si$nificativo al nivel
:,:7) mientras que el que se obtiene cuando se controla la edad s lo contiene (pierde la
si$nificacin).
>9
c) El a"uste suele ser $ueno. l resultado que se 'a obtenido en estos e0emplos, donde los
valores esperados y observados son muy parecidos, es tpico.
d) Si el contexto del pro$lema es predicti2o0 la pro$a$ilidad del suceso para un perfil de
entrada dado Ga de computarse independientemente empleando los coeficientes
estimados. Por e0emplo, en el 0emplo ), si se quiere saber cu#l es la probabilidad de que
un su0eto est! insatisfec'o, 'ay que aplicar la frmula si$uiente,
5 $607 +
+
5 + 7
, 3 2 2 + + .
EDAD GENERO RAZA RAZA
SATISF P
+
= =
donde,
=
.
-:,7>7= =
+
-:,:=++ =
2
+,=+A* =
3
-:,+)A> =
,
:,:+)L
Si se trata de una mu0er mestiza y mayor de >: a"os, los valores de las variables son,
.
+
= RAZA , +
2
= RAZA , 2 = GENERO y 2 = EDAD , lo cual arro0a,
= = 5 + 7SATISF P :,=99
Para un 'ombre blanco de menos de >: a"os, el perfil de entrada sera, +
+
= RAZA ,
.
2
= RAZA , + = GENERO y + = EDAD y, al aplicar la frmula, se tendra,
= = 5 + 7SATISF P :,*)L
Nota, l e0emplo que se acaba de desarrollar (y varios m#s de este ep$rafe) 'a sido
tomado del libro 5Fe$resin &o$stica6 de Silva y Varroso
+:
, donde el usuario de pidat
'allar# muc'os m#s detalles conceptuales y pr#cticos.
R"o'nda"ions
&as variables e(plicativas deben tener una relacin montona con la probabilidad del
evento que se estudia.
&as variables independientes involucradas en el modelo no deben estar correlacionadas
entre s. Si la correlacin entre dos variables es alta, entonces los resultados de la F& son
poco confiables. <oncretamente, los errores est#ndares se incrementan apreciablemente y
suele ocurrir que los coeficientes no son si$nificativamente diferentes de cero, aunque la
aportacin $lobal de las variables s lo sea.
4ebe recordarse que el con0unto de variables dummy constituye un todo indisoluble con
el cual se suple a una variable nominal. <ualquier decisin que se adopte o valoracin
que se 'a$a concierne al con0unto nte$ro.
s muy importante distin$uir entre un conte(to e(plicativo y un conte(to predictivo. n
el primer caso, el modelo para cada posible factor de ries$o o protector se a0usta con los
factores que pueden ser confusores para !l. Solo en los estudios predictivos se a0usta el
me0or modelo. 4ebe tenerse en cuenta, en este caso, que una variable puede tener valor
predictivo aunque no sea parte del mecanismo causal que produce el fenmeno en
estudio.
7:
BIBLIOGRAFA
+. <ornfield K, Cordon ;, Smit' J/. `uantal response curves for e(perimentally uncontroled
variables. 1ulletin of the nternational Statistical nstitute +9=+% *A, 9L-++7.
2. JalXer SG, 4uncan 4V. stimation of t'e probability of an event as a function of several
independent variables. 1iometri)a +9=L% S>, +=L-L9.
3. Silva &<, P!rez <, <uellar O. 1so de la estadstica en la investi$acin de salud contempor#nea.
'ac Sanit +99>% 9(>A), +A9-97.
,. &evy PS, Stolte I. Statistical met'ods in public 'ealt' and epidemiolo$y, a looX at t'e recent
past and pro0ections for t'e ne(t decade. Stat Methods Med Res ):::% 9, >+-77.
5. Silva &<. ,xcursin a la regresin logstica en ciencias de la salud. .adrid, 4az de Santos% +997.
&. Kones FG. Probability estimation usin$ a multinomial lo$istic function. +ournal of Statistical
and #omputer Simulation +9L7% *, *+7-)9.
:. Gosmer 4J Kr, &emes'oW S. *pplied /ogistic Regression. /eW BorX, Ko'n Jiley Y Sons% +9A9.
-. .ittlb[cX ., Sc'emper .. (plained variation for lo$istic re$ression. Stat Med +99=% +7,
+9AL-9L.
). 4e Orala K, .artnez .A, Cuill!n 3. M`u! es una variable de confusinN Med #lin (Varc) )::+%
++L, *LL-A7.
+:. Silva &<, Varroso K. Fe$resin &o$stica. <uaderno )L. .adrid, &a .uralla% )::>.
7+

You might also like