You are on page 1of 24
Tablas: de: contingencia: En el capitulo anterior aplicamos la aproximacién normal a la distribucién binomial para efectuar a cabo una prueba de hipétesis para dos proporciones independientes. Sin embargo, pudimos haber conseguido los mismos resultados con otra técnica. Cuando trabajamos con datos nominales que se han agrupado en categorias, a menudo ordenamos los totales en un formato tabular conocido como tabla de contingencia. El caso més sencillo implica dos va- riables aleatorias binarias o (dicétomas); los-renglones de la tabla representan los resultados de-una variable, y.las columnas representan los resultados de la otra. Las entradas de la tabla son'los totales ¢orrespondientes a una combinacién particular de-categorfas. 15.1.1- Tablas:2.x 2: Considere'la siguiente-tabla:de-2 X:2, que.contiene-los resultados de un estudio que analiza Ia efectividad de,los cascos de seguridad para ciclistas, para prevenir lesiones en céisé.de accidentes [1]. Los datos consisten en'una muestra aleatoria de 793 indi suftieron un accidente en bicicleta durante un periodo especifico de un afto. Lesién en Une fe eats In cabeza si No | Total Si 7 28 | 235 No 130. 428 | 558 Total 147. 646 | 793 Delos 793 individués que suftieron accidentes en bicicleta, 147 utilizaban cascos de seguri- dad en el momento del accidente y 646 no los utilizaban..Entre los que utilizaban el casco, Scanned with CamScanner 19.1 rrueod jircuoaroos ata 17 sufrieron lesiones en la cabeza que requirieron atencién médica, mientras que los 130 res- tantes no la requirieron; entre los individuos que no empleaban cascos de seguridad, 218 tu- vieron lesiones en la cabeza serias y 428 no. Asi, las entradas en la tabla de contingencia “ —17, 130, 218 y 428— son los totales observados en cada combinacién de categorias. id sis mula , H,: Laproporcién de personas que sufren lesiones en la cabeza entre la ae ee i 8 til izan ci a ersor en contraste. con la hipétesis alterna 1H, Las proporciones de personas que padecen lesiones en la cabeza son distintas en las dos poblaciones. Llevamos ‘cabo la prueba con el nivel de significancia a= 0.05.) emplean caéco y los que no lo emplean son idénticas; por tanto, podemios ignorar las dos cas, tegorias separadas y considera alos 793 inividuos como una sola muestra homogénes. En 558 Fog 7 108%: Como resultado, de los 147 individuos que utilizan casco de seguridad en el momento del ace! cidente, esperariamos que 29.6%, 0 sooo st (@8) 743.6, sufriera lesiones en la cabeza, y 70.4%, 0 147(0.704) Scanned with CamScanner 344 Copitulo 15. Tablas do contingencia no suftiera Jesiones. De igual. forma, entre los 646 éiclistas ues utilizaron casco de segu- ridad, esperariamos que 29.6%, 0 = cae (235 646(0:296) = 646(35) = 191.4, sufriera lesiones en la cabeza, mientras que 70:4%,-0 é 6 558 10:704) = 5 646,070) = 646 (755 = 454.6, Asi, para el caso de las cuatro categorfas’en la tabla original, fos to- tales esperados son - de ks Uso de casco: la cabeza Si No Total sf 436 1914 | 2350 No i 454.6 ‘558.0 % Total 1470 6460 | 793.0 : Bn general, si una tabla de-2 x 2 de frecuencias observadas para una muestra de tama- fio n puede representarse de Ia'siguien Variable:1 + Sie No Total _ | st a 6 ath ‘No c a. Shera. Total ate bt+d n Ja tabla correspondiente de totales esperados es lor -freweneias Esnuraidas (e) Variable 2 Variable 1 si. “No ‘Total Si (atbyateyn (at b\b+a/n a+b No (C+dlatcin — (e+db+ain etd ; ‘Total i ate a ee n Scanned with CamScanner 15.1 Prueba j-cvodreda 345 Los totiles de renglén y columna de Ia tabla'de totales esperados:son idénticos a los que se cobservan en la tabla. Estos totales marginales sedeterminaron previamente; calculamos las en- ‘radas de las casillas que hubriamos esperado, de no haber relacion entre las clasificaciones de i da grupo permanece constante. ena que re es la ¢ aproxim iter que 5 [2]. fn el caso de la distribucién aleatoria ho debe derecha, No obstante, ast como e lidad, el érea total bajo la curva es igual a 1. Como en el caso de las distribuciones ty F hay ‘una distribucién ji-cuadrada ible de los grad : Debido a que Jos totales esperados para los datos sobre los cascos de seguridad para bi- cicleta son mayores que 5, podemos proceder con la prueba ji-cuadrada, El siguiente paso consiste en calcular la suma Scanned with CamScanner 246. Copitulo 15 Tablas de contingencia a * > x ye ? ’ FIGURA 15.1 iy Distribuciones jicuadrada con 1 y 6 grados de libertad. ¥ 4 t mie 2 que tuvieran df = 1. Por tanto, a-menudo aplicamos.una'correccién de continuidad en‘esta’ situacién, Cuando trabajamos con tna tabla de 2 X 2, el estadistico de prucba corregido es, én de Yates se haempleado:extensamente’en el pasado; muchos invest ‘comenzado'a cuestionar su validez: Algunos creen que resulta una prueba demasiado'conser- vvadora que-podria fallar cuando se-rechaza Ia hipétesis nula {3]. Sin embargo, los totales observados y ios de los datos referentes a los cascos de seguridad para bicicleta en Ia ecuacién corregida, encontramos que = ({17=43.6|— 0.57 , (1130 103.4] ~ 0.5)? 43.6 103.4 (218 = 191.4) 0.5)? , (428 454.6] 0.5)? a EOLA 454.6 ; = 15,624659+3.56+1.50 . ' = 27.27. “ Scanned with CamScanner 15.1 Pruebo'jrcuadods “347 suffen accidentes en bicicleta, el uso del casco de seguridad reduce la incidencia de lesiones en la cabeza. presentamos una tabla de 2 X 2 en el formato general que se muestra enseguida, Variable 2 Variable1.| Sf No | Total St a b a+b No ce a c+d Total atc b+d | vn Gracias a que no hay necesidad de calcular una tabla de totales jerados, esta forma del es- > tadistico resulta més conveniente par resultan. mealies} Jos omitiremos [4]. Sin embargo, hay programas estadisticos que ejecu- tan la prueba exacta de Fisher para tablas de 2 X 2 ademds de la prucba ji-cuadrada, 15.1.2 Tablas der x ¢ ‘Ademés de que es re- ‘hasta inctuir la com= Scanned with CamScanner 348 Copitule 15 Toblas.de contingencia ‘onsidere los siguientes datos, tomados de un estudio que aia certificados de defuncién. En dos hospitales se compararon los resultados de 575 autopsias con las causas de muerte anotadas en los certificados: Uno de los hospitales que participé en el estudio era comunitario, al cual denominaremos A; el otro era un hospital universitario, al cual lameremos B, Los datos aparecen en la forma de tabla de contingencia de 2 x 3 [5]. Estado del certificado de defuncién Exactitud.; . Inexacto —_Incorrecto Hospital: | confirmada.. -sincambio _modificado | _ Total A 157 18 = 54 229° B 268 44 34 346 Total 425 62 88 375 De los 575 certificados de defuncién considerados, se confirmé que 425 eran exactos, 62 carecian de informacién o contenfan inexactitudes pero no ameritaban que se modificara el registro de la causa de muerte, y 88 eran incdfrectos y requerian que se modificara el re- gistro‘de la causa de muerte. Para hacerlo, probamos la a _en comparacién con la hipétesisalterna-de que las proporeiones no son las mismas. Otra ma :cualquier,caso, empleamos.una:prueba ji-cuadrada y.damos al:nivel de sianiieaign un.’ valor de:c = 0.05. se El primer paso para realizar.la‘prucbe-consiste en calcular el total esperado para cada casilla’en'la:tablaide;contingencia. Recuerde:que el total esperado es igual al total del ren- :glén multiplicado por el total de la columna, dividido entre el total-de la tabla. Por ejemplo, nite los certificados de defuncién eran exactos, esperamos qué? 229 x 425 575 169.3 estén en el Hospital A, mientrds 346 X 425 375 = 255.7 __ estén en el Hospital B, Para las seis categorias de la tabla, los totales esperados son los si- guientes: Scanned with CamScanner 15.2. Prueba de McNemar 349 Estado del certificado | Exactitud - Inexacto _ Incorrecto Hospital ia sincambio _modifieado | Total Ap 247 35.0 29.0 B 313 53.0 346.0 Total 62.0 88.0 575.0 2 Trabajamos con una tabla de contingencia de 2 X 3, y como consecuencia no necesitamos incluir la correcci6n de continuidad de Yates. Por tanto, my (sss 4 268-255.79 , (44-373) , (34-53.0? : 255.7 373 53.0 nN 89 + 1.82 + 10.31 + 0.59 + 6.81 + 1.20 vo 1.62. los cettifiados: De forma equivalente; hay ula relacién entre'l hospital y el estado del cer tificado-de defiuncién: De nuevo, al consultar la tabi el Hospital:A tiene 36.9% de certificados con exactitid confirmada,.29.0% de los cuales son, inexactos pero.no requieren que se les cambie, y 61.4% de ellos requieren modificaciones del’ registro, Parece que el Hospital A, el comunitario, tiene una proporcién mayor de certifica dos de muerte incorrectos que requieren modificacién que el Hospital B, ‘Suponga que aiin nos interesa comparar proporciones, gqué podemos hacer si nuestros datos ‘son pareados en lugar de independientes? Como en el caso de los datos continuos, la carac- ‘eristica distintiva de las muestras pareadas para conteos es el hecho de que cada observacién del primer grupo tiene una observacién correspondiente en el segundo grupo, En este caso, utilizamos la prueba de McNemar-para evaluar \a hipétesis referente a los datos. Scanned with CamScanner 350 Copitulo:15 Tables de contingencia Considere 1a siguiente-informacién tomada_ den estudio; que analiza el infarto‘agudo de miocardio (IM) —o ataque cardiaco— entre navajos'tesidentes de Estados Unidos. En el udo de miocardio se relacionaban en edad y género con IM Diabetes | Si No | Total ; St 4625 1 No 989} 27 Total 144144 | 288 Entre los 144 individuos que habfan experimentado un infarto agudo de miocardio, a 46 se les habia diagnosticado diabetes; entre los que no habian padecido enfermedades del co 26n, sdlo 25 padecfan diabetes. Queremos saber cudl de esta: Bs nes de diabéticos; en los dos grupos clasificados por enfermedades cardiacas. La tabla anterior tiene la misma forma de la tabla de contingencia de 2 X 2 empleada apareamiento en nuestro andlisi Suponga que revisamos de nuevo los datos sin procesar del estudio, pero esta vez los clasificamos de la siguiente manera: _ Nohay IM : IM: Diabetes.” No hay-diabetes. |. Total: « : Diabetes... | 9 37 46 No hay diabetes|:. . 16: 82 98 ‘Total 25 ug * | ag De los 46 navajos que habfan sufrido un infarto de miocardio agudo y eran diabéticos, 9 se relacionaban con individuos que padecian diabetes y 37 con individuos que no la padecfan. De las 98 victimas de infarto que no padecian diabetes, 16 se emparejaban con diabéticos y sponde a la combinacién de respuestas para un par rel Scanned with CamScanner 15.2" Prieba'de McNemar 351 + lugar de probar,si‘la proporcién de diabétioos entre individuos'Qjve habfan suftido un infarto « es igual a a proporcién de diabéticos que no'lo han sufrido, probaiio: Ay? aunque el otro” individuo que ha sufrido un infarto no lo es, , mas brevementes? A estadistico (r=sl- FP Zo WesleDK my eee : Esta proporcién -vo utilizamos sumas cretas para aproximar le di Para los datos que‘analizan la relacién entre la diabetes el infarto de miocardio, r=, 37y s= 16: Por tanto; (137-16)-1F 7+ 16) _ @i-1F 53 = 755. Xs Scanned with CamScanner 352 Copiulo 15. Tables de contingencia Para el caso de una di te to que p es menor que « la hip6tesis nula, Para la poblacién dada de navajos, se coneluye que si hay una diferencia entre individuos que Han experimentado un Infarto y 1s que no, las victimas de infarto de miocardio agudo padecerin diabetes con mayor. probabili- dad que los individuos que no padecen enfermedades cardiacas, quienes se relacionaron en cuanto edad'y género, (1/2)/Q/2) = 1 contra 1, Por el contrario, SeamaSRig eI ate gos pe Sot oncaeid y Sexposicién a ella, el indice de disparidad se define como las probabilidades en favor de Ia en- “fermedad entre los individuos expuestos dividida entre la probabilidad en favor de la enfer- medad entre los individuos no expuestos, 0 (enfermedad | expuesto)/[1 — P(enfermedad | expuesto)] P(enfermedad | no expuesto)/[1 — P(enfermedad | no expuesto)] OR= El indice de disparidad tambié He oR = —_Plexpasiciém |.enfermos)/{1.— P(exposicién | citfimos))- i tf P(exposicidn'| no enfermos)/{1 —-P(exposicién | no enfermos)] * Estas expresiones para el indice de disparidad son mateméticamente equivalentes. En conse- cuencia, puede calcularse el indice de disparidad para estudios de grupo y de caso testigo. ‘Suponga que los datos que constan de una muestra de n individuos, se ordenan nueva~ mente en forma de tabla de contingencia de 2 X 2: Expuesto Noexpuesto | Total Enfermo, a a arb No enfermo € qd etd Total ate bed n ‘El cual representamos lo largo del texto con OR (del inglés, odds ratio}: ‘En otros textos esta probabilided se maneja como momias. Scanned with CamScanner En'este caso, se desea calcular el hecho.de/que (enfermedad | expuestos) = each P(enfermedad | no'expuestos) = ae ord? por tanto; * 1—P(enfermedad | expuestos): 6 1. P(enfermedad | no expuestos) = 1 — 55 15,3° Indice de disporidad 353 Este estimador es sencillamente el‘cociente del producto cruzado de las entradas de Ia tabl de2 x 2, 7 Scanned with CamScanner Fis54 Copinls 15 Tobles de coningencia ede el indice de dispar ab +d) Wate) ad be RR = = OR. i por lo general es Los siguientes:datos se tomaron-de-un estudio realizado. para determinar sila ullize cién del monitoreo fetal electrénico (EFM, Electronic Fetal Monitoring) durante el parto in- fluye en'la frecuencia de naciniientos por cesérea. Consideraremos el parto por cesérea como la “enfermedad”, y el monitoreo electrénico como la “exposicién”. De los 5824 recién na- cidos incluidos en el estudio, 2850 se monitorearon electronicamehte durante el parto y 2974 no se monitorearon [7]. Los resultados fueron los siguientes: Exposict6n a EFM ‘Parto por cesirea St No | Total Si 358 229 587 No (2492 2745 5237 Total | 2850" 2974 | .5824 __ La probabilidad de nacer por cesérea en el grupo que se cos respecto del grupo que no se exploré, se calcula por medio de Por tanto, parece-haber una relacién moderada entre el em- pleo del monitoreo.fetal electrénico.y-el método final de parto: Sin embargo, esto no irnplica que el mionitoreo provoque de alguna manera un parto por cesérea; es posible que los fetos con mayor riesgo resulten ser los que se monitorearon. . Recuerde que ja deduccin de In expresion para ut inter- val6 de coafianza de 95% para ina med Me (« -196-2,3+ 1962), Sel Scanned with CamScanner que el tamafio de la muestra es sul en la tabla de contingencia deberia ser de por lo DENOS 3 La expresién para un intervalo de confianza de 95% para el logaritmo natural del indices, de disparidad es z (in ©R) 1.96 se fla OR], In (OR) + 1.96 se [In ORY. Por tanto; para calcular un intervalo de confianza para In (OR), antes debemos conocer ef! error estindar de esta cantidad. En una tabla de 2 X 2 ordenada de la siguiente manera: Expuestos No expuestos | Total Enfermedad a b at No hay enfermedad © qd etd Total ate. b+d n error-estindar es.° ‘Bin OR La aproximacién para'el error estindar puede susttuitse en la expresién para el intervalo de ‘tioned dp exten dntptino seins ior Para el caso de los datos que analizan 1a relacién entre el estatus de monitorgo fetal . , electrénico durante el parto y el método final de parto, el logaritmo del indice de disparidad” es in(OR) = 1n(1,72) 42, Scanned with CamScanner 956 Coptiulo 15 Tablas de contingencia El error estandar calculado de In (OR) es ln ORI = aadatat, ce ee 358 * 229 * 2492 * 2745 3 = 0.089. Por tanto, un intervalo-de:confianza de 95% para el logaritmo del indice de disparidad es (0.542 ~ 1.96(0.089); 0.542.+ 1.96(0.089)), (0.368, 0.716), ¥ y un intervalo de confianza de 95% para el indice de disparidad es (368, 0.716), (1.44, 2.05). pecan ‘las cantidades.de.cada clase. de pareja discordante en:el estudio: Por.ejemplo, en el . cass pelt de Ja relacién entre.el infarto.de miocardio agudo y la diabetes entre los na- {ie residen en Estados Unidos, r representa la-cantidad de parejas en las cuales el divides ‘que ha sufrido un infarto agudo de miocardio era diabético y el individuo relacionado que no padeta enfermedades cariaas no lo er, ys repreenibs la cantidad de parejas en Its que I persona con safer divi Scanned with CamScanner 15.4. Falocia de Berkson 357 el error estindar‘éileulado de (OR) odemos calcular también uni intervalo de confianza para el verdadero. indice de disparidad de poblacién. Un intervalo de 95% para el logaritmo natural del indice de disparidad es In OR) + 1.96 se (In OR}. Puesto que In(OR)=In (2.31). = 0.837 el intervalo de confianza de 95% para In(OR) seria : 4 (0.837 — 1.96(0.299), 0.837 + 1.96(0.299)), 5 (0.251, 1.423). Luego, un intervalo de confianza de 95% para el indice. de disparidad es (e281, e123 (1.29,4.15). Observe que este intervalo no contiene el valor 1. conjunto. pacientes de un solo hospital, la cual se emplea para hacer inferencias sobre la poblacién en Scanned with CamScanner 358 Copttulo 15 Tablas de contingencia En un estudio, los investigadores entrevistaron a.2784 individuos —257 de los cuales se hospitalizaron— y determinaron si cada individuo padecia algtna enfermedad del sistema circulatorio, una enfermedad respiratoria o ambas [8]. De haber limitado sus preguntas a los 257 pacientes hospitalizados, los resultados habrian sido los siguientes: Enfermedad respiratoria: Enfermedad circulatoria | Si | No | Total Si 1 9 36 No 13208 | 221 Total 20 237..| 257. ear = 3.86; entre las dos enfermedades a - (7=2.8)-05) , (29-332)-05? zs Bue 33.2 ? , (1208 ~ 203.8] - 0.5)? 203.8 = 4,894 0.41-+0.80+0.07 hospitalizados y de los que no lo estén: Enfermedad elreulatoria Total, st 193 No 2591 Total 2784 Scanned with CamScanner 15.4 Falacia de Berkson 359 Para estos datos, el = _ (22)(2389) ° OR = (771202) ee 3 (22~15:53]-0.5)? ,.((I71-17747|- 0.5? 15.53 17747 4 (202 —208.47|-0.5) , ((2389 ~ 2382.53] — 0.5? 208.47 7382.53 . = 2.29 +020+0.17+0.01 = 267. Para responder esta pregunta, deben considerarse las tasas de hospitalizacién en cada uno de . los cuatro subgrupos clasificados por enfermedad. Entre los 22 individuos que padecen en- \“' fermedades circulatorias y.respiratorias, 7 se encuentran hospitalizados. Por tanto, la tasa de hospitalizacién para este subgrupo es 1 yD 31.8%, La tasa de hospitalizacién entre individuos con una enfermedad respiratoria es lasers ! 797 7 64%. f Entre los individuos con una enfermedad circulatoria, la tasa es 29 ¥ Tay = 17.0%, 171 4. : y entre las personas que no padecen ninguna de las enfermedades, la tasa de hospitalizacién es 208 Baap 78.7%. iit Scanned with CamScanner 360 Copii 15: Tablas de céntingencia hospitalizados que los que padecen alguna enfermédad respirafotia. Por tanto, si sélo'toma- ‘mos muestras de pacientes hospitalizados, las conclusiones sobre'la relacidn entre estas dos enfermedades se basarén en un prejuicio. Es més probable que elijamos a un individuo que padece ambas enfermedades que una persona de cualquiera de los otros subgrupos, y con ma- yor factibilidad elegiremos a una persona con alguna enfermedad circulatoria que una con problemas respiratorios. En consecuencia, observamos una relacién que en realidad no exis- te. Este tipo de relacién falsa entre variables —que resulta evidente s6lo debido a la manera cen la que se eligié la muestra— se conoce con el nombre de falacia de Berkson, Por ejemplo, considere los siguien- tes datos, tomados de un estudio que analiza una epidemia de gastfoenteritis —inflamacién de Jas membranas del est6mago y de! intestino delgado— por un almuerzo que se sirvié en la ca~ feterfa de una escuela, En Ia muestra de 263 estudiantes que compraron almuerzo en la cafe- terla de la escuela el dia en cuestién, 225 comieron emparedados preparados y 38 no lo hicieron [9]. Las cantidades de casos de gastroenteritis en cada grupo aparecen a continuaci I /Emparedados consumidos si No Total Enfermos 109 4 43] Noenfermos | 116 4 150_ Total 25 38 263 De los estudiantes.que,consumieron empare: de los que na con- sumieron, 19:5% enfermé; Nos gustaria proba ee cn ele ae igiianae = 0.05/La hipétesis alterna dice que existe una relacién. ara comenzar, debemos calcular el total esperado para cada casilla de Ia tabla de 2 X 2. Con Ia hipétesis nula, las proporciones de estudiantes que contrajeron gastroenteritis son idénticas en los dos grupos, Al considerar a los 263 estudiantes como una sola muestra, Ia U3 : 263 2 Scanned with CamScanner 15.5. Aplicaciones odicionales 361". 150 57.0%: (263 Por tanto; de 10s 225 estudiantes que consumieron emparedades, esperariamos que 43%,0 *, no enfermara. Asimismo, de los 38 estudiantes que no comieron emparedados, esperariamos que i eA 113) (35) “= enfermaran y que 30(38)

You might also like