You are on page 1of 12

Tamao de la muestra

CALCULO DEL TAMAO DE LA MUESTRA EN PSIQUIATRIA Y SALUD MENTAL (principios bsicos para su estimacin)
Carlos Gmez Restrepo1. Ricardo Snchez Pedraza 2 .
El presente trabajo tiene por objeto repasar los conceptos subyacentes al clculo del tamao de la muestra necesarios en la etapa de planeacin de cualquier estudio en Psiquiatra y Medicina. Se revisan conceptos tales como el de error tipo I o alfa, error tipo II o beta , poder del estudio, variabilidad de los resultados y diferencias estadstica y clnicamente significativas. Estos son los elementos bsicos a utilizar en las frmulas que ayudan a establecer el nmero de pacientes necesarios en un estudio. Palabras clave: Clculo, Tamao de muestra This work deals with concepts related with sample size estimation that are necessarywhen planing any study in Psychiatry or Medicine. Concepts such as type I error or alpha error, type II error or beta error, Power, variability and clinical and statistical significative differences are revised. These elements are needed to apply statistical formulas useful to determine the number of patients needed in a study. Key words: Estimation, Sample size

INTRODUCCION Una vez el investigador ha definido qu pregunta desea responder y cmo lo va hacer, surge el cuestionamiento acerca del tamao de la muestra. Cuntos pacientes se requieren para el estudio?, Cul sera el nmero mnimo de pacientes con los cuales podra llegar a conclusiones vlidas?, Cmo se calcula el tamao de la muestra?, en qu consiste el poder y el nivel de significancia de un estudio?, Qu diferencia habra entre 12, 25 o ms pacientes en cada grupo?, Qu ocurre si se sobreestima la muestra?, Cunto tiempo puede durar el estudio de acuerdo con la muestra calculada?, Es factible el estudio dada la cantidad de pacientes requeridos? Estas y otras preguntas son a menudo un obstculo para colegas interesados en la investigacin o en evaluar de una manera ms responsable y adecuada la literatura y la evidencia clnica disponible.
1 2 Mdico-Psiquiatra. Profesor Asistente . Departamento de Psiquiatra y Salud Mental y Unidad de Epidemiologa Clnica y Bioestadstica. Pontificia Universidad Javeriana. Mdico-Psiquiatra . Profesor Asociado. Departamento de Psiquiatra y Centro de Epidemiologa Clnica. Universidad Nacional de Colombia.

Rev. Col. Psiquiatra, Vol. XXVII, No. 2, 1998.

131

Gmez C. y Snchez R.

Desde hace algunos aos los editores de revistas mdicas internacionales, y en ciertos casos nacionales, exigen a los autores de un determinado artculo que expliquen con mayor detenimiento los lineamientos metodolgicos utilizados y la forma en que se realiz el muestreo y el clculo del tamao de la muestra. Este cambio de actitud, que en un principio se pudo haber calificado como sorprendente, persecutorio o inclusive innecesario, obedeci a las pruebas cada vez ms concluyentes de parte de la Epidemiologa Clnica, de la Epidemiologa General y de otras especialidades mdicas, de la necesidad de garantizar que estudios rigurosamente planeados y realizados no fallaran en encontrar diferencias significativas debido a tamaos de muestra insuficientes. En esta lnea se ha demostrado que mltiples experimentos clnicos controlados han errado en encontrar diferencias entre grupos por falta de muestras lo suficientemente grandes que permitan discriminar entre determinadas caractersticas(1). Este detalle, que podra sonar para algunos como una minucia epidemiolgica, tiene consecuencias ticas de gran relevancia. S por ejemplo, estamos probando una nueva droga que fuera til para la Esquizofrenia Desorganizada, para la cual no existe un tratamiento del todo exitoso y por falta de una muestra suficientemente grande concluyramos que este medicamento no es diferente del placebo, esta droga til sera descartada del mercado y perderamos una opcin teraputica para estos pacientes. Por otro lado, si existe un extracto floral que en realidad no tiene ninguna utilidad para pacientes esquizofrnicos y lo comparamos con un antipsictico tradicional, podemos llegar a la falsa conclusin de que es un tratamiento adecuado, debido a que una muestra muy pequea me permite detectar diferencias con el tratamiento convencional. Para el adecuado clculo del tamao de la muestra se requieren algunos conceptos fundamentales que facilitan aproximarse a la lgica y a la mecnica del procedimiento (2,3,4). Los autores consideran que el objetivo de un escrito sobre este tema no debe ser el presentar una o ms formulas mgicas que permitan estimar muestras para proporciones, medias, validacin de escalas, evaluacin de pruebas diagnsticas u otros procedimientos estadsticos. Lo fundamental es conocer los conceptos subyacentes al procedimiento con el fin de saber qu es lo que se busca, qu diferencias clnicamente relevantes se espera encontrar y finalmente cul es el procedimiento matemtico ms adecuado para la aproximacin al tamao de muestra requerido. En otras palabras, ms importante que la frmula, es conocer los aspectos que determinan las diferencias en el tamao de la muestra para el estudio que se realizar. De no ser as, un estudio bien concebido alrededor de una hiptesis de gran inters en nuestra rea, podra venirse abajo por no tener en cuenta los tpicos que se describirn posteriormente. Todo libro o artculo que trate sobre el tema del clculo del tamao de la muestra tiene como base los siguientes conceptos : - Error Tipo I o Alfa. - Error Tipo II o Beta. - Poder.
132
Rev. Col. Psiquiatra, Vol. XXVII, No. 2, 1998.

Tamao de la muestra

- Variabilidad. - Diferencia clnica y estadsticamente significativa. El presente trabajo no pretende agotar el tema sino dar las bases para que el lector pueda profundizar en esta rea, sugiriendo a los intesados alguna bibliografa de profundizacin. (5 ,6 ,7 ,8). CONCEPTOS BASICOS Siempre que un investigador inicia un estudio debe tener una pregunta bien establecida de la cual deriven hiptesis susceptibles de ser rebatidas o confirmadas. Por ejemplo, un investigador se plantea la siguiente pregunta: Entre la psicoterapia cognoscitiva y la psicoterapia de orientacin dinmica, cul es ms efectiva para el tratamiento a mediano plazo (1 ao) de pacientes con Trastorno Hipocondraco? A partir de esta pregunta se puede postular una hiptesis de trabajo en trminos que se pueda rebatir, lo cual equivale a lo que conocemos en el lenguaje mdico y estadstico como Hiptesis Nula. Esta podra plantearse as: Ho: No hay diferencias en la eficacia de la psicoterapia cognoscitiva y la de orientacin dinmica para el tratamiento a mediano plazo del Trastorno Hipocondraco. A su vez la Hiptesis Alternativa, que aceptaramos en caso de rechazar la nula, podra ser planteada de las siguientes forma: H1: La psicoterapia cognoscitiva es ms eficaz que la psicoterapia de orientacin dinmica para el tratamiento a mediano plazo del Trastorno Hipocondraco H2: La psicoterapia de orientacin dinmica es ms eficaz que la psicoterapia cognoscitiva para el tratamiento a mediano plazo del Trastorno Hipocondraco H3: Existen diferencias significativas entre la eficacia de la psicoterapia cognoscitiva y la psicoterapia de orientacin dinmica para el tratamiento a mediano plazo del Trastorno Hipocondraco. De acuerdo con esto podemos construir una tabla que nos represente todas las opciones, teniendo en cuenta que existe una verdad absoluta a la cual cada estudio intenta aproximarse con mayor o menor xito (Tabla 1). En la tabla podemos observar que tomamos la decisin correcta cuando los resultados del estudio corresponden a la verdad en la poblacin. En caso contrario incurriramos en errores, que son precisamente, los que intentamos minimizar cuando calculamos correctamente el tamao de muestra. Estos conceptos se describen a continuacin: 1 - Error Tipo I, o Falso Positivo, o Error Tipo Alfa: Alfa Refirindonos al ejemplo citado, supongamos que en realidad la terapia cognoscitiva es tan efectiva como la de corte dinmico en el tratamiento del
Rev. Col. Psiquiatra, Vol. XXVII, No. 2, 1998.

133

Gmez C. y Snchez R.

Tabla 1 RESULTADOS POSIBLES EN UN ESTUDIO


VERD AD EN LA POBLACIN
HIPOTESIS NULA CORRECTA ( X=Y) RESULTADOS DEL ESTUDIO HIPOTESIS NULA CORRECTA ( X=Y) HIPOTESIS ALTERNA CORRECTA (XY) HIPOTESIS ALTERNA CORRECTA (XY) Error Tipo II o Falso Negativo o Beta

Verdadero Negativo

Error Tipo I o Falso Positivo o Alfa

Verdadero Positivo

Trastorno Hipocondraco, pero que en el estudio concluimos que la primera es ms efectiva que la de corte dinmico. Esto quiere decir que rechazamos la hiptesis nula de no diferencias entre las dos terapias (que es la verdad) y aceptamos errneamente la hiptesis alternativa que establece una mayor efectividad para la terapia cognoscitiva en el manejo del Trastorno Hipocondraco. En este caso estamos incurriendo en lo que se denomina un Error tipo I. Se concluye falsamente que una terapia es mejor que la otra cuando en realidad no lo es. Ahora, este error que medimos a travs del nivel Alfa o del nivel de significacin P puede ser, de acuerdo con el estudio, ms o menos indeseable. Por ejemplo, si tenemos un medicamento X que es tan eficaz para el tratamiento de la Esquizofrenia Indiferenciada como los frmacos ya disponibles, pero que es costoso o posee algn potencial de efectos secundarios serios y por error decimos que es mejor que los otros (se rechaza equivocadamente la hiptesis nula de no diferencias), se podra estar aconsejando un medicamento que incrementa gastos y otros problemas al paciente, lo cual a todas luces resulta indeseable. Como se mencion, el Error Tipo I ha sido medido con el nivel alfa o nivel de significacin P que se define como la probabilidad, habitualmente menor del 5 %, de obtener un resultado tan extremo o ms que el encontrado por azar. Dicho de otra forma, la probabilidad de encontrar el resultado del estudio por azar es tan pequea (menor del 5%) que se puede asumir que esta diferencia es debida a la intervencin o al tratamiento realizado. Tradicionalmente y por consenso, en la literatura biomdica el nivel de P, o nivel de significacin, o alfa se ha establecido en el 5 % y ningn resultado por encima de este nivel es aceptado como positivo, por el riesgo de incurrir en Error de Tipo I. Este nivel del 5 % (p< 0.05) sera aquel por debajo del cual se rechazara la hiptesis nula de no diferencias entre grupos. Por otra parte, para estudios con comparaciones mltiples, se ha establecido que la realizacin de pruebas estadsticas repetidas lleva a que por simple azar alguna de ellas sea
134
Rev. Col. Psiquiatra, Vol. XXVII, No. 2, 1998.

Tamao de la muestra

positiva. Por tal razn hay una tendencia cada vez mayor a disminuir el valor de p a nivel de p< 0.001 (1 %) (9). Para reducir el Error Tipo I se requiere incrementar el tamao de la muestra, cuestin que implica un costo adicional para el investigador. De esta forma, una sencilla regla es que a menor Alfa o p se incrementa el nmero de sujetos requeridos para el estudio. 2- Error Tipo II, o Falso Negativo, o Error Tipo Beta: Como se plante anteriormente, resulta inconveniente concluir que hay diferencias estadsticamente significativas cuando en realidad no las hay. Sin embargo lo contrario tambin es cierto. Qu ocurrira si teniendo un tratamiento altamente efectivo para el manejo de Trastornos Fbicos especficos concluyramos que no es diferente o que es equivalente a otros tratamientos convencionales? Este es el que llamamos Error Tipo II o Beta que simplemente significa que falsamente aceptamos la Hiptesis Nula y descartamos la Hiptesis Alterna cuando realmente existen diferencias entre los grupos. Esta situacin traera, como es obvio, consecuencias ticas evidentes. Podemos definir el error tipo Beta como la mxima probabilidad que se esta dispuesto a arriesgar por un resultado falso negativo. Al igual que con el Alfa, se ha establecido un nivel mximo de Beta tolerable, que de acuerdo con la comunidad cientfica es del 0.20 (20 % ). Dicho de otra manera, es bueno desconfiar de todo estudio que nos sugiera una probabilidad mayor del 20 % de que sus resultados sean falsos negativos. Por otra parte, y al igual que con el Error Tipo I, en la medida en que deseemos disminuir la posibilidad de error de falsos negativos, por ejemplo, un Beta del 10 % (0.1) en lugar del 20% (0.2), se requiere un tamao de muestra mayor. Es el precio por disminuir el margen de error y tener as mayor certeza en los resultados. 3- Poder del Estudio: Intimamente ligado al concepto de Error Tipo II esta el de Poder de un estudio que matemticamente lo podramos definir como: Poder = 1 - Beta Como puede verse, el Poder depende enteramente del nivel de Beta fijado por el investigador. Teniendo en cuenta un mximo tolerable del 20% (0.2), se tendr un poder del 80% (0.80). La anterior frmula tambin permite apreciar que al disminuir el Error Tipo II se aumentar el Poder del estudio para detectar diferencias. Otra forma de interpretar el Poder o Sensibilidad es considerarlo como la capacidad del estudio para detectar diferencias significativas entre los grupos, s es que estas existen. Por ejemplo, un estudio con un poder del 80% tiene una probabilidad de 0.8 de detectar diferencias s las hay. Ahora, si deseamos tener un poder mayor (0.9, 0.95, etc.) se requeriran muestras de un tamao superior.
Rev. Col. Psiquiatra, Vol. XXVII, No. 2, 1998.

135

Gmez C. y Snchez R.

Algunos autores (10 ,11 ,12) sugieren la importancia de determinar como no conclusivos aquellos trabajos o estudios que no hubiesen podido rechazar la hiptesis nula y que tengan un poder menor del 60%. En esta lnea Freiman, Chalmers y Colaboradores (1) reportan que 50 de 71 ensayos clnicos controlados publicados en el New England Journal of Medicine carecan del poder suficiente para detectar amplias diferencias entre grupos. Lo anterior nos obliga a pensar en el concepto de poder del estudio cada vez que se deban tomar decisiones clnicas basadas en artculos o publicaciones mdicas. 4- Variabilidad: Esta se refiere a la dispersin de los datos que se esperan encontrar. Estadsticamente se representa por la varianza y su raz cuadrada (desviacin estndar). A menor dispersin de los resultados, ser ms fcil diferenciar un grupo de otro, puesto que cada uno conformar conglomerados alrededor del promedio y as no se confundirn los hallazgos de un grupo y del otro. Estadsticamente se ha comprobado que al incrementar el nmero de sujetos, los resultados tienden a agruparse con mayor probabilidad alrededor del promedio y a variar cada vez menos. A la inversa, con pocos sujetos, las mediciones tienden a variar ms y por lo tanto a confundirse, ms fcilmente, con las mediciones del otro grupo. De esta forma podemos concluir que a mayor variabilidad esperada de los resultados se requerir de un mayor tamao de muestra que lleve a discriminar los grupos participantes y evidenciar las diferencias entre estos. Por otro lado, si se espera un desenlace con escasa variacin, la muestra requerida tender a ser menor. 5- Diferencias estadstica y clnicamente significativas: Tradicionalmente se nos ha enseado la importancia de hallar una diferencia estadsticamente significativa y es as como muchos colegas se enorgullecen diciendo que los resultados de su estudio lo son. Habremos odo o ledo repetidamente que se da un gran valor a un hallazgo que resulte significativo a un nivel de p menor al 5 o 1% (p< 0.05 0.01).
Tabla 2 RESULTADOS: ESTUDIO COMPARATIVO DE DOS ANTIDEPRESIVOS PARA EL MANEJO DE LA DEPRESIN MAYOR
Puntajes de depresin-escala de Hamilton para depresin Nivel Basal - HAM-D Nivel Final - HAM-D

Tratamiento antidepresivo A

Tratamiento antidepresivo B

28 10

28 8

N = 130 pacientes en cada Grupo

136

Rev. Col. Psiquiatra, Vol. XXVII, No. 2, 1998.

Tamao de la muestra

Antes de discutir estas afirmaciones, sera til comentar un estudio que comparaba la eficacia de dos antidepresivos para el tratamiento de la Depresin Mayor y cuyo desenlace fue medido a travs de los puntajes obtenidos en la Escala de Hamilton para depresin arrojando los resultados que se presentan en la Tabla 2: El estudio informaba diferencias estadsticamente significativas (p< 0.05) que favorecan la terapia con el antidepresivo B, a partir de lo cual concluyeron los autores que se debera utilizar este medicamento como tratamiento de eleccin. En este punto vemos que ciertamente ambos antidepresivos fueron tiles para reducir los puntajes en la Escala de Hamilton (de 28 a 10 y de 28 a 8). Sin embargo se podra plantear: es relevante clnicamente una diferencia de 2 puntos (10 vs 8) en el HAM-D? Posiblemente la mayora de colegas respondern que no. Con este ejemplo se quiere ilustrar que no siempre lo que es estadsticamente significativo tiene importancia clnica. No obstante, toda diferencia que sea clnicamente relevante lo debe ser desde el punto de vista del anlisis estadstico. Si complicamos un tanto el ejemplo y agregamos que la droga A tiene un costo 3 veces menor que la droga B, Cul se recetara?. Con lo anterior se intenta demostrar que para el clculo del tamao de la muestra se debe conocer de antemano, no slo el valor de la diferencia que estadsticamente consideremos significativa y que est fijada por el alfa o valor de p en 1 o 5 %, sino la diferencia que se espera encontrar entre los grupos, tambin relevante clnicamente. As, en el ejemplo anterior, dado el costo diferencial de las drogas (mayor 3 veces para el medicamento B), se podra suponer que una diferencia de menos de 7 a 10 puntos a favor del tratamiento B no sera clnicamente importante. Esta ltima (mnima diferencia clnicamente significativa ) es determinada por el investigador o por el consenso que exista en la literatura mdica en ese momento, consideracin que, obviamente, repercute en el tamao de la muestra escogida. En resumen, cuando deseamos detectar diferencias grandes entre grupos se necesitan pocos pacientes o muestras pequeas y si se desea detectar diferencias pequeas se requieren muestras grandes. PROCEDIMIENTOS BSICOS PARA CALCULAR EL TAMAO DE LA MUESTRA El proceso de seleccin de una muestra se basa en dos aspectos: 1. Se desea conocer alguna caracterstica de una poblacin y el tamao de esa poblacin es tan grande que resulta muy difcil hacer la medicin en cada uno de los miembros de ella. 2. Trabajar con una muestra puede tener una buena aproximacin a la caracterstica de la poblacin que se quiere conocer, con la ventaja de ahorrar tiempo y recursos. Por ejemplo, si el propsito es conocer la estatura promedio de los colombianos, se pueden hacer dos cosas:
Rev. Col. Psiquiatra, Vol. XXVII, No. 2, 1998.

137

Gmez C. y Snchez R.

1. Tomar la estatura de todos y cada uno de los colombianos y calcular el valor promedio. 2. Tomar una muestra de colombianos y calcular el valor promedio de esa muestra. El valor encontrado en el primer caso es el valor real y se denomina Parmetro . En el segundo caso tendremos un valor aproximado al valor real que se denomina Estimador Estimador. En la notacin utilizada en publicaciones sobre estos temas los Parmetros se representan con letras griegas y los Estimadores con letras latinas. En el ejemplo que se vinen manejando el valor real del promedio de estatura de los colombianos se denota como m y el valor que arroja la muestra, es decir el Estimador, se denota como x. Vemos que en muchos casos obtener el verdadero valor de una poblacin (Parmetro) es prcticamente imposible debido a lo difcil que resulta hacer la medicin en un nmero muy grande de personas. Por esta razn se debe trabajar con una muestra que permita obtener un Estimador lo ms cercano posible al Parmetro. Para lograrlo se deben dar dos condiciones: 1. Asegurar un adecuado proceso de muestreo: Los resultados del proceso de muestreo sern vlidos slo si se parte de la certeza de contar con una muestra que satisfaga las condiciones exigidas por la inferencia (13). Por ejemplo, si en una muestra se incluye nicamente los habitantes de Neiva, o exclusivamente mujeres, no se obtendr un buen Estimador del Parmetro. 2. Obtener un buen tamao de muestra: Entre mayor el nmero de sujetos seleccionados ms cerca estar el Estimador del Parmetro. La clave en esta situacin es obtener un nmero suficientemente grande de casos de manera que se logre un satisfactorio nivel de precisin. El obtener un buen Estimador permite sacar conclusiones que sean aplicables a toda la poblacin de la cual se obtuvo la muestra. Los estudios en los cuales se maneja este propsito se pueden enmarcar dentro de dos categoras: 1. Estudios para estimar alguna caracterstica de la poblacin: Por ejemplo conocer el porcentaje de personas esquizofrnicas que hay en Bogot (estimacin de una proporcin) o la edad promedio de inicio del primer episodio depresivo en los habitantes de Cali (estimacin de una media). 2. Estudios para evaluar diferencias: Es el caso de un estudio que busca diferencias en los puntajes promedio de una escala de depresin luego de administrar un tratamiento farmacolgico (diferencia de medias), o de un estudio que pretende evaluar cambios en la prevalencia de hechos violentos despus de aplicar un programa educativo en las escuelas de una ciudad (diferencia de proporciones). Con base en lo anterior se plantearn las estrategias elementales para el clculo del tamao de la muestra en estas dos situaciones (14) :
138
Rev. Col. Psiquiatra, Vol. XXVII, No. 2, 1998.

Tamao de la muestra

estimacin poblacionales: 1 . Estudios de estimacin de caractersticas poblacionales Los Estimadores de estas caractersticas deben tener un determinado nivel de precisin. Esta precisin se mide con los intervalos de confianza: entre ms estrecho el intervalo, mayor ser la precisin. Un intervalo de confianza del 95% entre x y y quiere decir que si se repite el procedimiento de seleccin de muestra y de medicin 100 veces, en 95 oportunidades el verdadero valor se encontrar entre las cantidades x y y. 1.1. Estimacin de un promedio: para calcular el tamao de la muestra en esta circunstancia se necesita conocer: 1.1.1 La amplitud del intervalo de confianza (). 1.1.2. Un estimativo de la desviacin estndar de las observaciones (S) 1.1.3. El nivel de confianza (100 (1- )%). Generalmente se establece en el 95 99 %. 1.1.4. Los valores de f (1-): son valores constantes que, dependiendo del nivel de confianza se establecen en: Para el 90% de nivel de confianza 2,706. Para el 95% de nivel de confianza 3,842. Para el 99% de nivel de confianza 6,635. La frmula utilizada para el clculo respectivo es:

n=S 2/2 f (1-)


Como ejemplo para ilustrar este clculo, supongamos que se ha diseado un estudio en el cual se pretende determinar la edad promedio de los consumidores de basuco en un sector de Bogot. Se desea que el estimativo del promedio tenga una probabilidad del 95% de estar 3 aos por encima o por debajo del verdadero valor. Con estos datos efectuamos los siguientes clculos:

n=152 /32 x 3,842= 225/9 3,842= 96


para este estudio se necesita una muestra de 96 habitantes del sector. 1.2. Estimacin de una proporcin (15)) : para este clculo se necesita conocer: 1.2.1 La amplitud del intervalo de confianza (). 1.2.2 Un estimativo de la desviacin estndar de las observaciones (S) 1.2.3 El nivel de confianza (100 (1- )%). Generalmente se establece en el 95 99 %. 1.2.4 Los valores de f (1- ) mencionados previamente. La frmula utilizada es la siguiente:

n= P(100-P)/2 f(1-)
Rev. Col. Psiquiatra, Vol. XXVII, No. 2, 1998.

139

Gmez C. y Snchez R.

A manera de ejemplo, supongamos que se desea conocer la proporcin de fumadores en el grupo de estudiantes que ingresan a primer semestre en una universidad. Se cree que el estimativo de esa proporcin ser de aproximadamente 30% y se espera que el resultado tenga una probabilidad del 95% de estar 4% por encima o por debajo del verdadero valor. Con estos datos se realizan los siguientes clculos:

n=30(100-30)/4 2 x 3,842= 2100/16 x 3,842= 504


Se necesita una muestra de 504 estudiantes. diferencias: 2 . Estudios para evaluar diferencias 2.1. Diferencia entre medias: los datos que se necesitan para el clculo son: 2.1.1 El tamao de la diferencia que clnicamente me interesa () 2.1.2 Un estimativo de la desviacin estndar de las observaciones (S). 2.1.3 Un nivel de significacin o de error tipo I aceptable (generalmente 0.05 0.01). 2.1.4 Definir si se pretende establecer diferencia en cualquier sentido, es decir que no interesa si un promedio es mayor que otro siempre y cuando sean diferentes (Hiptesis a dos colas), o probar una diferencia en un solo sentido, es decir que se est interesado en demostrar que uno de los promedios es mayor que el otro (hiptesis a una cola). 2.1.5 El poder requerido, usualmente 80%. Con los elementos anteriores se aplica la siguente frmula:

n=2S 2/2 f (-)


Los valores f(,) se toman de la siguiente tabla (16) :
Nivel de significacin alfa
Una cola Dos colas

Poder, 1 -
0.05 0.8 0.9 6.18 8.56 0.01 10.04 13.02 0.05 7.85 10.51 0.01 11.68 14.88

Por ejemplo, se desea evaluar si una intervencin educativa puede mejorar en 5 puntos el CI de nios de escuelas distritales de Bogot y se tiene el dato que la desviacin estndar del CI en nios de esas caractersticas es 10, y lo que se pretende evaluar, es si el CI es mayor despus de la intervencin educativa, se tiene una hiptesis a una cola. Usando un nivel de significacin del 0.05% y un poder del 80%, los clculos son los siguientes: n= 2 X 102/ 52 X6,18=50
140
Rev. Col. Psiquiatra, Vol. XXVII, No. 2, 1998.

Tamao de la muestra

Se requieren 50 nios para hacer el estudio. 2.2. Diferencia entre proporciones: los datos que que requieren para el clculo son: 2.2.1 Un estimativo de la proporcin en cada uno de los grupos (P1 y P2). 2.2.2 El nivel de significacin o de error tipo I aceptable (generalmente 0.05 0.01). 2.2.3 Definir si se propone establecer diferencia en cualquier sentido, es decir que no interesa si una proporcin es mayor que la otra, siempre y cuando sean diferentes (Hiptesis a dos colas) o interesa probar una diferencia en un solo sentido, es decir, se pretende demostrar, por ejemplo, que una de las proporciones es mayor que la otra (hiptesis a una cola). 2.2.4 El poder requerido, usualmente 80%. Con estos datos se utiliza la siguiente frmula:

n= P1(100-P1)+P2(100-P2)/(P1-P2)2 X f(,)
Se quiere evaluar un programa psicoeducativo para mejorar la adherencia al tratamiento en pacientes deprimidos. Calculando que la no adherencia pueda reducirse de un 40 a un 35%, se establece una hiptesis a dos colas (tambin se espera detectar si el programa produce un efecto paradjico), y se determina un nivel de significacin del 0.005, con un poder del 0.9. Los clculos son los siguientes:

n= (40X60)+(35X65)/52 X 7,85+ 1.468


En este caso se necesita un nmero de pacientes muy grande (1.468), por lo cual es necesario buscar estrategias que reduzcan el tamao de la muestra. Lo ms sencillo seria aumentar el tamao de la diferencia que se busca, aceptando una disminucin del 10%, el tamao de la muestra resultante ser de 353 pacientes. Los mtodos aqu presentados corresponden a las tcnicas bsicas aplicadas a diseos de investigacin elementales. Existen mtodos ms precisos y aplicaciones especficas para diseos metodolgicos particulares, que sobrepasan la intencin del presente escrito pero que pueden ser utilizadas sin dificultad cuando se conocen los principios bsicos enunciados en este texto (17,18,19) . Puede agilizarse, e incluso obviarse, los clculos respectivos utilizando programas de computacin, dentro de los cuales uno de los ms ampliamente difundidos, por su disponibilidad y facilidad, es Epiinfo Este programa Epiinfo. puede descargarse sin ningn costo desde la direccin http://www.cdc.gov/ epo/epi/downepi6.htm. Tambin existe una versin espaola del programa que se puede obtenerser sin ningn costo en la direccin http://www.cica.es/ aliens/sveacsa/epiinfo.htm. El programa dispone de varios mdulos para calcular tamaos de muestras tales como Statcalc (permite hacer clculos para encuestas poblacionales, para estudios transversales, de cohortes y de
Rev. Col. Psiquiatra, Vol. XXVII, No. 2, 1998.

141

Gmez C. y Snchez R.

casos y controles no apareados), Epitable (dispone de comandos para calcular tamao y poder de muestras) y CSample.

REFERENCIAS
1 Freiman JA, Chalmers TC y Cols. The importance of Beta, the type II errors and the sample size in the design and interpretation of the randomized controlled trial. N Engl J Med 1978; 299: 690-4, . Dupont WD. y Plummer WD. Power and Sample Calculations: A Review and a Computer Program. Controlled Clinical Trials 1990; 11:116-128. Browner WS. Newman TB y Cols. Getting Ready to Estimate Sample Size:Hypothesis and Underlying Principles. En: Hulley, Stephen y Cummings, Steven R. Designing Clinical Research. Baltimore: Williams y Wilkins, 1988; Pp.128 -138. Lachin JM. Introduction to Sampole Size determination and Power Analysis for Clinical Trials. Controlled Clin Trials 1981; 2: 93-114, Ingelfinger JA, Mosteller F, Thibodeau LA y Col. Biostatistics in Clinical Medicine. New York: Macmillan Publishing Co. Inc.,1983. Kelsey Jl, Thompson W D y Evans A S. Methods in Observational Epidemiology. New York: Oxford University Press, 1986. Schlesselman JJ. Case Control Srtudies.New York: Oxford University Press, 1982. Rosner B. Fundamentals of Biostatistics.Belmont: Duxburry Press, 1990. Dennis R. Como estimar el Tamao de Muestra necesario en Investigaciones Humanas. Unidad de Epidemiologa Clnica. Pontificia Universidad Javeriana. Henneckens C H y Mayrent S L. Epidemiology in Medicine. Boston: Little, Brown and Company, 1987. Guyatt GH, Sackett DL. y Cols. Users Guides to the Medical Literature: How to Use an article about Therapy or Prevention. Are the Results of the Study Valid. JAMA 1993; 270.(21): 2598-2601. Guyatt GH, Sackett DL. y Cols. Users Guides to the Medical Literature: How to Use an article about Therapy or Prevention. What were the Results and will they help me in Caring for my Patients? JAMA 1994: 271(1): 59-63. Bautista L. Diseos de Muestreo Estadstico. Bogot: U.N. de Colombia: 1998. Machin D,Campbell M, Fayers P, Pinol A. Sample Size Tables for Clinical Studies. London: Blackwell Science, 1987. Kahn HA, Sempos CT. Statistical Methods in Epidemiology. New York: Oxford University Press, 1989. Dobson AJ. Calculating Sample Size. Transac. Menzies Found 1984; 7:75-79. Schelesselman JJ. Sample Size Requirements in Cohort and Case-Control Studies of Disease. Am J Epidemiology 1974;99:381-384. Donner A, Eliasziw M. Sample Size Requirements for Realibility Studies. Statistics in Medicine 1987; 6:441-448. Connett JE,Smith JA, McHugh B. Sample Size and Power for Pair-Matched CaseControl Studies. Statistics in Medicine 1987;6:53-59.

2 3

4 5 6 7 8 9 10 11

12

13 14 15 16 17 18 19

142

Rev. Col. Psiquiatra, Vol. XXVII, No. 2, 1998.

You might also like