You are on page 1of 20

MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

INFERENCIA ESTADSTICA

Dra. C. San Lus Costas


Dr. A. Lpez de la Llave

Inferencia Estadstica: es un conjunto de procedimientos basados en los modelos


de probabilidad mediante los cuales se pueden realizar validaciones relativas a la
existencia, explicacin y/o prediccin de algn fenmeno de inters a nivel poblacional
con base en la informacin extrada de una muestra de cumple determinadas
caractersticas. Este conjunto de procedimientos se agrupan en dos categoras:
Estimacin de parmetros y Tcnicas de Contraste de Hiptesis (tambin llamadas
Contrastes de Significacin). Sobre Estimacin de Parmetros (tanto puntual como por
intervalos) nos remitimos al apartado anterior dedicando este

a los denominados

contrastes de hiptesis o pruebas de significacin.


En principio vamos a definir un modelo como una
realidad que permite comprender

aproximacin a la

la estructura del sistema modelizado y,

consecuentemente, ser capaz de generar hiptesis contrastables (sobre esta cuestin


abundaremos en el Tema 3). La construccin de un modelo supone siempre una
simplificacin de la realidad, no tiene sentido, pretender que un modelo acomode todos
los datos conocidos en la actualidad y en el futuro. El puente entre la realidad y el
modelo lo proporcionan los datos, a travs de su estudio y anlisis pormenorizado. Dado
que el modelo genera hiptesis constrastables debemos estudiar los procedimientos de
que disponemos en la metodologa para llevar a cabo el contrastar tales de hiptesis.
Si plantemos la cuestin, validar las hiptesis derivadas de un modelo, en
trminos de incertidumbre, tal y como hicimos en el caso de la estimacin de
paramtros, el problema de validacin de hiptesis hace referencia a la determinacin
de procedimeintos que premitn valorar el riesgo en una tarea que hace referncia a
evaluar la congruencia de las hiptesis que genera o se deducen del modelo (tanto a sus
componentes como a las relaciones establecidas) y los datos que hemos obtenido de la
realidad.
1

MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

Como ya hemos comentado en el tema preliminar, existen al menos dos niveles


de hiptesis, las llamadas hiptesis de trabajo, que algunos autores denominan de
investigacin o cientficas y las hiptesis estadsticas.
Las primeras, hiptesis de trabajo, se explicitan de forma lingstica y se deriban
de la teora o del modelo. Estas hipotsis se pueden caracterizar como afirmaciones
acerca de las supuestas relaciones entre constructos o variables implicadas. Deben
explicitarse de tal forma que el modelo que las genera pueda ser falsable y que los
modelos competidores puedan eliminarse (la razn de esta forma de proceder viene
impuesta desde la Filosofa de la Ciencia y concretamente del falsacianismo
popperiano). Su claridad es fundamental para determinar si el resultado obtenido es
similar o no al esperado desde el modelo y su finalidad es servir de gua en el proceso
de investigacin.
Las segundas, hiptesis estadsticas, son conjeturas que realizamos sobre el
como ocurre un suceso (Lpez Cachero, 1991) o, ms claramente, supuestos en los que
se basan algunas operaciones estadsticas y que hacen referencia al valor de un
parmetro, la forma de una distribucin o la ley de probabilidad de un conjunto de
fenmenos (Sierra Bravo, 1991). En otros trminos una hiptesis estadstica es
cualquier conjetura sobre una o varias caractersticas de inters de un modelo de
probabilidad.
La distincin entre hiptesis cientficas y estadsticas es importante: las primeras
se refieren a resultados y relaciones entre los componentes del modelo (sea ste
formalizado o no), las segundas se refieren a subconjuntos de puntos en un espacio
paramtrico.
Las hiptesis estadsticas deben, por tanto, cumplir dos propiedades
asegurar su correcin:

para

1. Deben ser congruentes con las hiptesis de investigacin.


2. Deben de ser lo suficientemente especficas como para determinar si los
resultados obtenidos son similares o no al resultado que se haba supuesto.
La hiptesis estadstica especifica que el punto del parmetro buscado se encuentra
en un lugar particular entre dos posibles. El procedimiento del contraste estadstico acta
sobre la base de un conjunto de observaciones (datos) y permite, con ciertas salvedades,
validar o no tal hiptesis.
2

MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

Clasificaciones de hiptesis:
Las hiptesis pueden clasificarse, segn diferentes criterios que hacen referencia
al nmero de parmetros o relaciones implicadas; al tipo de relacin que se establece y a
la temporalidad de la relacin, o referencindolas a su formulacin y papel dentro del
proceso de contraste. As, atendiendo a la primara categora podemos hablar de:
Hiptesis simple o compuesta:
Hiptesis Simple: es aquella que especifica completamente la distribucin
(tambin se conoce como hiptesis de igualdad), o lo que es lo mismo es aquella que
asigna valores nicos a los parmetros ( = 1'5, = 10,

,...). Ej. El rendimiento

medio escolar de los estudiantes de bachillerato espaoles medido mediante un test es


de 47.
Hiptesis compleja: Es la que asigna un rango de valores a los parmetros poblacionales
desconocidos (

> 1'5, 5 <

< 10,

<

,...). Ej. Los frecuencia del cncer de

pulmn de mayor en los fumadores que en los fumadores, siendo la prevaleca en el


primer caso de 6 por mil y en el segundo de 4 por mil"
Hiptesis direccional o no direccional:
Hiptesis Direccional: La hiptesis direccional establece relaciones asimtricas
entre variables. Ej. "La prctica del deporte es beneficiosa para conseguir un patrn de
sueo satisfactorio en adolescentes entre 12 y 16 aos."
Hiptesis no direccional: Es aquella que establece relaciones simtricas entre
variables. Ej. "Existe una relacin entre el consumo de tabaco y el sueo".
Hiptesis de asociacin o de causalidad:
Hiptesis de asociacin: Es aquella que hace referencia a la variacin conjunta
de las variables (son siempre relaciones simtricas por tanto no pueden establecer
antecedente y consecuente y por ende causalidad). Ej. "Existe una relacin positiva
entre el nmero de accidentes de trfico y el consumo de alcohol.

Hiptesis de causalidad: hacen referencia a variacin conjunta entre variables


pero en la que una de ellas antecede a la ocurrencia de la otra, o lo que es lo mismo la

MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

primera produce un efecto en la segunda (son siempre por tanto relaciones asimtricas).
Ej. " La aspirina infantil reduce el riesgo de infarto
Atendiendo a la segunda de las categoras mencionadas, es decir al papel que
juegan en el proceso de contratacin hablamos de

Hiptesis nula e hiptesis

alternativa.
Hiptesis nula e Hiptesis alternativa:
Hiptesis nula: se denota por H0 y de forme general podemos decir que expresa
la ausencia de relacin (comnmente expresa y recoge la situacin contraria a la
conjetura o hiptesis que la investigacin propone como explicacin del fenmeno en
estudio).
Hiptesis alternativa: Se denota por H1 y es la complementaria de la H0
(coincide generalmente con

la propuesta de explicacin). La excepcin a esta

afirmacin se presenta en el caso de los estudios llamados diseos de equivalencia.


Planteamiento del contraste de hiptesis.
El contraste de hiptesis estadstico se basa en las distribuciones muestrales, que
como sabemos son modelos probabilsticos, de ah que el contraste slo est
circunscrito, y as debe entenderse, a un resultado estrictamente probabilstico, por lo
tanto no podr nunca demostrarse su falsedad en trminos absolutos, lo sern
nicamente en trminos probabilsticos. La finalidad de las tcnicas de contraste es
hacer que dicho soporte se mantenga dentro de unos lmites racionales lgicamente
probabilsticos.
El planteamiento de las tcnicas de contraste de hiptesis se debe a Fisher y a
Neyman y Pearson(como veremos inmediatamente a una mezcla entre el planteamiento
de Fisher y la propuesta de Neyman y Pearson) . Si bien todas ellas se fundamentan en
los mismos principios lgicos (modus tolendo tolens) existe un amplio elenco de
pruebas que responde a exigencias demarcadas por:

especificidades del diseo

implicado, nmero de poblaciones , tipo de parmetro/s, carctersitcas de las


distrisbuciones de las variables implicadas (supuestos que deben cumplir tales que
normalidad, homocedasticidas, etc.).
Podemos definir un contraste (test de hiptesis) como un conjunto de tcnicas
que nos proporciona la Inferencia Estadstica y que permiten comprobar si la
4

MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

informacin que proporciona una muestra observada concuerda (o no) con la hiptesis
estadstica formulada sobre el modelo de probabilidad y, por tanto, se puede validar (o
no) la hiptesis formulada. Esta hiptesis es la que hemos definido anteriormente como
hiptesis nula H0. Si se rechaza, en el sentido de no validacin, la hiptesis nula
implcitamente se asume como plausible la hiptesis alternativa, H1.
El problema del contraste de hiptesis se puede definir:
Dado un punto del espacio muestral x = (x1 , x2, x3, .; xn) conjunto de datos
obtenidos) se define una regla de decisin que siendo funcin de x, permita aceptar o
rechazar la H0 , dividiendo al espacio muestral en dos subconjuntos excluyentes C y Cc
tal forma que:

Si xC rechazamos la H0 (consideramos probado que esa hiptesis


es falsa y por ende admitiendo como plausible la H1 propuesta) a
este subconjunto del espacio muestral se le denomina regin crtica.

.S

xCc entonces diremos que hiptesis (siempre refirindonos a

H0) es compatible con los datos.


Es decir, que el criterio que vamos a seguir para decidir si la hiptesis nula se
mantiene o se rechaza, se basa en la particin de la distribucin muestral del
estadstico en dos zonas mutuamente exclusivas y excluyentes que denominamos regin
crtica y regin de aceptacin y definimos:
Regin Crtica (o de Rechazo): Es el rea de la distribucin muestral

que

corresponde a los valores del estadstico de contraste que se encuentran tan alejados de
la afirmacin establecida en H0 que es muy poco probable que ocurran, si la hiptesis
nula es correcta. Su probabilidad es (o nivel de significacin o riesgo).
Regin de Aceptacin: Es el rea de la distribucin muestral que corresponde a los
valores del estadstico de contraste prximos a la afirmacin establecida en la hiptesis
nula. Su probabilidad es 1- (o nivel de confianza).
El tamao de las zonas de aceptacin y rechazo se determinan fijando el valor de
(nivel de significacin). Considerando que se trata de un nivel de error, su valor debe
ser pequeo, de ah que valores para

considerados en la literatura y utilizados en la

investigacin emprica son habitualmente 0.01 y 0.05.


Dado que la H0 y H1 son complementarias es decir exhaustivas y excluyentes
5

MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

dependiendo de cmo formulemos H1 y en relacin a las regiones de rechazo y


aceptacin de H0, los contrastes de hiptesis pueden ser bilaterales o unilaterales.
Se dice que un contraste es bilateral, cuando las H1 planteada es simple (
,

Y ,...),

'

5,

en tales casos la zona crtica se encuentra, generalmente repartida a

partes iguales entre las dos colas de la distribucin muestral. Cuando la H1 compuesta
( < 1'5; 5 < < 10,

>

Y ,...)

los contraste se dicen unilaterales, en tales casos la

regin crtica se encuentra en una de las colas de la distribucin muestral. (Ver figura 1)
Figura 1

BILATERAL

UNILATERAL
(derecha)

El procedimeinto general para el contraste de hiptesis estadsticas, tal y como


fue introducida por Fisher, se puede resumir en los siguientes pasos:
1) Plantear una hiptesis nula (H0). La hiptesis hace referencia, tpicamente, al
valor de algn parmetro en la poblacin de referencia.
2) Establecer una regla de muestreo. Generalmente, se trata de muestreo
aleatorio simple.
3) Determinar la distribucin muestral del estadstico de inters en funcin de
la hiptesis nula y la regla de muestreo.
4) Determinar una medida de la discrepancia, que no es ms que una diferencia
6

MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

estandarizada, entre el estadtico correspondiente y el parmetro (en otros


trminos entre el valor obtenido a partir de la muestra y lo establecido por la
hiptesis nula dividido por el error tpico de la distribubin del estadstico). 1
El ndice de discrepancia d se denomina estadstico de contraste

Es funcin de los datos muestrales

de

la

informacin

contenida

en

la

hiptesis

nula

(H0).

5) Establecer un nivel de significacin , en otros trminos especificar que


discrepancias se consideran inadmisibles cuando H0 es vlida.
Tras todo ello, se selecciona la muestra y se calcula la medida de discrepancia; si
la probabilidad de obtener bajo H0 una discrepancia igual o mayor que la obtenida es
menor que , se considerar que se debe rechazar la H0, entendiendo que el trmino
hiptesis nula, tal como fue introducido por Fisher, hace referencia a que es la
hiptesis cuya nulidad (falsedad) se pretende demostrar. Actualmente los paquetes
estadsticos para anlisis de datos incluyen en los resultados el valor de p (probalidad
asociada)

que no es ms que la probabilidad de obtener un valor del estadstico de

contraste igual o ms extremo que el obetendio con los datos de la meustra bajo la
condicin de que H0 sea cierta. A los efectos se opera comparando el valor de p con el
nivel de significacin

n :

Si p

Si p

Los dos enfoques del contraste de hiptesis: Fisher y Neyman - Pearson


Para Fisher, un contraste de significacin puede llevar a una de las dos
decisiones siguientes: o bien la H0 se rechaza al nivel de significacin o bien el juicio
se reserva en ausencia de base suficiente. Este autor desarroll los mtodos de contraste

1 Importante tener presente en la definicin del ndice de discrepancia (Estadstico de Contraste) que se trata
de una variable aleatoria cuya distribucun es, por lo ganeral, conocida y es precisamente este caracterstica del ndice
de discrepancia lo que permitir llevar a cabo la toma de decisiones

MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

de hiptesis estadsticas dentro de una perspectiva puramente popperiana: las nicas


decisiones posibles son rechazar la hiptesis nula o declarar que la evidencia no es
suficiente.
Este enfoque se centra de forma exclusiva en el resultado de la prueba estadstica
y en concreto en la evaluacin del valor p (probabilidad asociada)

en relacin al

n arbitrario y previamente fijado), es decir p


suficientes indicios para decartar H0, si p

rminos de la H0 indica que

no es concordante con los datos disponibles. En otros trminos, cuando se rechaza la H0


se puede admitir que el valor de la relacin (el efecto) no es cero, pero cuando se acepta
H0 no se puede concluir que el valor de la relacin (el efecto) sea cero (Cohen, 1988),
como ya advertimos en este contexto nulo no quiere cero.
Por su parte la metodologa de Neyman y Pearson, en oposicin a esto, est
orientada a la resolucin de un tipo diferente de problema, una situacin en la que se
debe tomar una decisin partiendo de informacin limitada y en la que se desea
minimizar los costes de una decisin errnea. Su campo de aplicacin ideal es el control
de calidad, donde la situacin tpica consiste en controlar la produccin de cierto tipo de
objetos, es pues un plateamiento centrado en la toma de decisiones, para lo cual
introducen algunas modificaciones en el esquema fisheriano, al considerar
explcitamente la hiptesis alternativa H1 (contrapuesta a la H0) e introducir los
conceptos de error tipo I y II, regin crtica y potencia de la prueba y la necesidad de
n) como garantia de de que las decisiones no
se toman a posteriorien virtud de los resultados.
Planteemos la cuestin desde el punto de vista de la toma de decisiones para
explicar los los conceptos introducidos en este planteamiento. Dado que existen dos
posibles hiptesis ( H0 y H1) las decisiones que podemos tomar sern: (cyadro 1 y
2 Probabilidad asociada

Se llama nivel crtico p a la probabilidad de obtener una discrepancia mayor o igual que la
observada en la muestra, cuando H0 es cierta. p = P (d d | H0)
Es importante resear que la probabilidad asociada p no es una medida de la magnitud de la
significacin del contraste (tal y como muchas veces se interpreta) ni tampoco una medida de la magnitud
o relevancia del efecto detectado, en otros trminos significacin estadstica no supone significacin
terica ni clnica.

MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

figura 2)

Cuadro 1

Aceptamos H0

H0 es correcta

H0 es incorrecta

Decisin correcta

Error tipo II

(1- )
Rechazamos H0

Error tipo I

Decisin correcta
(1- )

Figura 2

Error Tipo I: error cometido al rechazar H0 siendo verdadera. La probabilidad de


cometer este error es

(nivel de significacin que fija y controla el investigador).

Obviamente la probabilidad complementaria

(1

(recuerdese lo visto al presentar la estimacin por intervalos).


9

MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

Error tipo II: error cometido al aceptar H0 siendo falsa. La probabilidad de cometer
este error se designa por

. La probabilidad complementaria (1- ) se denomina

potencia del contraste y corresponde a la probabilidad de rechazar una hiptesis nula


que es falsa. Indica la capacidad que tiene un contraste para detectar que una hiptesis
nula concreta es falsa, o bien, la capacidad de aceptar H1 siendo esta verdadera.. Es
obvio que una regin crtica es la mejor o la mas potente cuando, para un

dado, su

potencia es mayor que la de cualquier otra de las infinitas regiones que llevan asociadas
esa misma probabilidad .
La problemtica del contraste de hiptesis.
Las pruebas de significacin tal y como se aplican usualmente son el resultado
de un procedimiento hbrido en el que se mezclan las dos posturas (encontradas) de la
filosofa subyacente a los procedimientos de contraste que hemos expuesto.
Simplificando mucho se puede decir que la hibridacin consiste en que se toma del
planteamiento fisheriano la concepcin y el procedimiento de contraste de la hiptesis
nula (H0) pero introduciendo la hipotsis alternativa H1 (del enfoque Neyman
Pearson) como contrapuesta estadsticamente a la H0 ( cuesitn esta absolutamente
inaceptable para Fisher) y en consecuencia incluyendo tambin los conceptos de error
d

n y

fijacin del error de Tipo I (


una toma de decisin entre dos contrarios complementarios y excluyentes.
Crticas al contraste Hiptesis
Son muchas y comprenden desde poner en tela de juicio los planteamientos
tericos y su aplicacin y considerarlas poco interesantes e incluso errneas hasta los
que slo se manifiestan en contra del uso inapropiado y de la mala enseanza que se
hace de ellas fruto de las confusiones sobre algunos de sus elementos claves tales que el
concepto de hiptesis nula; el problema de la significacin estadstica y los factores que
la determinan y desde luego, y como el ms destacable de todos los problemas, la
potencia estadstica. Todo ello ha llevado a que actualmente y en nimo a soslayar las
crticas y seguir las recomendaciones de la American Psychological Association
aparecidas en el American Psychology, 54, 594-604, se propone que para garantizar un
buen uso de estas tcnicas se tomen como mnimo las siguientes precauciones:

Determinacin previa del tamao muestral (n) necesario para


10

MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

garantizar una determinada potencia, o informar de la potencia


obtenida.

Completar los resultados obtenidos de la aplicacin de las


tcnicas de contraste de hiptesis con otros procedimientos
estadsticos que permitan extraer el sentido y la mayor
informacin posible de los datos mustrales, desde el modelo de
la inferencia tal y como lo conocemos (intervalos de confianza y
tamao del efecto).

Contraste de hiptesis desde la perspectiva actual


Conviene aclarar como afirma Frick (1995 y 96) el uso de los contrastes de
hiptesis, tal y como se vena haciendo (y aun se hace) puede ser vlido cuando
planteamos leyes en sentido ordinal o cualitativo y nicamente pretendemos
comprender y estructurar los datos de la realidad (es decir, cuando el valor real de la
relacin, es decir el efecto, no es trascendental) , ms all de este propsito, cuando se
pretenden predicciones cuantitativas o aplicaciones prcticas se hace necesario incluir
otros procedimientos estadsticos complementarios que informan sobre el grado,
direccin e importancia real de los resultados derivados de la aplicacin de las pruebas
de significacin.
Presentamos a continuacin los estadsticos y procedimientos complementarios a
las tcnicas de contrastes de hiptesis y que corresponden tanto a los planteamientos
terico prcticos como a las exigencias que estn imponiendo en las revistas al uso. A
tal efecto retomaremos algunos de los conceptos ya vistos que nos servirn de gua en
este planteamiento.
Comenzamos reproduciendo el cuadro de decisiones estadsticas posibles
relativas a la conclusin que se deriva de la prueba de hiptesis y obviamente
referenciadas a la poblacin/es pero, de forma ms concreta (reproducido de Lipsey,
1990), donde T representa al grupo de tratamiento y C el grupo control (ambos de forma
genrica).

11

MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

Referencia Poblacional

Conclusin estadstica

TyC

TyC

difieren

no difieren

Diferencias Significativas

Conclusin correcta

Error tipo I

Rechazo de H0

Probabilidad = 1-

Probabilidad

POTENCIA
Diferencias no significativas

Error tipo II

Conclusin correcta

Aceptacin de H0

Probabilidad

Probabilidad 1-
(coeficiente de confianza)

Error tipo I: error cometido al rechazar H0 siendo verdadera. La probabilidad


de comenter un error Tipo I o riesgo de comenter este tipo de error , que denominamos
nivel de significacin, se define como la probabilidad de obtener en la distribucin
muestral del estadstico de contraste valores de ste que se encuentran tan alejados de la
afirmacin establecida en H0 que es muy poco probable que ocurran, si la hiptesis nula
es correcta.
Error tipo II: Aceptacin de la hiptesis nula siendo falsa, su probabilidad que
. Estos dos errores ( y ) estn inversamente relacionados. Para
una muestra determinada de tamao n, si disminuye aumenta.
fijado por el investigador, por tanto, se puede decir que el rechazo de las H0 verdaderas
esta controlado. Ahora bien, El error tipo II no se puede conocer hasta que no se
conozca la H1 entendiendo que H1 indica el efecto que el investigador espera, este valor
(que en realidad constituye la hiptesis que le investigador desea evaluar).

12

MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

Relacin entre y

A medida que aumenta disminuye

Potencia es la probabilidad de rechazar correctamente la hiptesis nula cuando debe ser


rechazada. Aunque la especificacin alfa establece el nivel de significacin estadstica
aceptable, es la potencia la que dicta la probabilidad de xito en la bsqueda de las
relaciones/diferencias si es que realmente existen. Es importante tener presente que es
posible, para un parmetro determinado obtener su curva de potencia. 3

Factores que influyen en la Potencia Estadstica:


1.

Dado que y estn inversamente relacionados a medida que


alfa se vuelve ms restrictivo (menor), la potencia decrece. Esto significa
que si reducimos la probabilidad de encontrar un efecto incorrecto
significativo, tambin reducimos la probabilidad de detectar un efecto
correcto.

2. El tamao de la muestra: Para cualquier valor dado, el incremento del


tamao muestral incrementa tambin la Potencia del test estadstico. Pero,
un aumento excesivo del tamao de la muestra puede producir
demasiada potencia en el sentido de se puede llegar a observar que
efectos (valores cuantificados de diferencias o relaciones mnimas pueden
llegar ser significativos, hasta que para muestras muy grandes casi
cualquier efecto es significativo. As, el tamao de la muestra puede
afectar a la prueba estadstica tanto por hacerla insensible (para muestras

3 Curva de potencia: En el contexto que nos ocupa, es una grfica que muestra, para todos los

valores posibles de un parmetro poblacional que contradice la hiptesis nula, la probabilidad, 1 rechazarla correctamente, dado el tamao muestral y un riesgo a mximo especificado.

13

MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

muy pequeas) o demasiado sensible (para muestras muy grandes) 4.


3. Tamao del Efecto: La probabilidad de conseguir significacin
estadstica se basa no slo en consideraciones estadsticas sino tambin en
la magnitud real del efecto que nos interesa (por ejemplo, una diferencia
de medias entre dos grupos o la correlacin entre variables) en la
poblacin, denominado tamao del efecto. Como cabra esperar, un efecto
grande es ms probable de encontrar que un efecto pequeo y por tanto,
afecta a la potencia de la prueba estadstica. Para evaluar la potencia de
cualquier prueba estadstica, el investigador debe entender primero el
efecto examinado.

Relacin entre y el tamao de la


muestra
n1 < n2
n1

n2

A medida que aumenta el tamao de la muestra


disminuye el error estandar y por lo tanto el
riesgo de

4. Si la hiptesis alternativa es simple, pro ejemplo H1:


valor prefijado de habr un nico valor de
situacin no es la comn, lo que ocurre normalmente es que la H1 sea del
tipo < >, es decir hiptesis compuesta (ms de una distribucin posible)
lo cual supone que para cada posible valor del parmetro existe un valor
de
fico). Siendo estrictos deberamos determinar la curva de
que contradicen la hiptesis
nula dado el tamao muestral y prefijado.

4 Es importante resear ahora que para la determinacin del tamao muestral necesario en un estudio se
debe considerar si el inters se centra en la estimacin de parmetros (al respeto lo expuesto en los temas de relativos al
muestreo) o si el inters de la investigacin lleva a planteamientos de contraste de hiptesis referidas a algn parmetro
(problemtica

que

se

plantea

en

este

apartado).

http://masmatematicas.com/estadisticas/n.html

14

Para

ms

informacin

pueden

acudir

MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

Relacin entre el riego y el valor


verdadero de H1

Hay tantos valores de como H1 se hayan enunciado

A continuacin se presentan dos ejemplos sencillos para ilustrar los comentarios


anteriores. El primero implica la comprobacin de la diferencia entre las medias de dos
grupos. Suponiendo que el tamao de efecto sea entre pequeo (0,2) y moderado (0,5)
(siguiendo los criterios convencionales sugeridos pos Cohen (1992).
La Tabla 1.1 muestra el impacto tanto del tamao de la muestra como del nivel
sobre la potencia, reacurdese que la potencia se ha definido como 1- . Como puede
verse, la potencia llega a ser aceptable para tamaos de muestra de 80 o ms en
situaciones en las que el tamao del efecto es mediano para ambos niveles de alfa
prefijados (.70 en el peor caso). Para un tamao de efecto pequeo, obtenemos poca
potencia, incluso con niveles de de 0.01 y muestras de 200 sujetos. Por ejemplo, una
muestra de 200 sujetos en cada grupo con un de 0,05 tiene slo un 50 por ciento de
posibilidades de encontrar diferencias significativas si el tamao del efecto es pequeo.
Lo anterior indica que en el diseo del estudio, si anticipamos los efectos van a ser
pequeos, deberemos trabajar muestras mucho mayores y/o niveles de menos
restrictivos (0,05 o 0,10).
TABLA 2. Niveles de potencia para la comparacin entre dos medias: Tamao de la muestra,
nivel de significacin y tamao del efecto.

15

MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

Tamao

= 0.05

= 0.01

Tamao del

Tamao del

efecto (TE)

efecto (TE)

muestral
Pequeo

Mediano

Pequeo

Mediano

(0.2)

(0.5)

(0.2)

(0.5)

20

0.095

0.338

0.025

0.144

40

0.143

0.598

0.045

0.349

60

0.192

0.775

0.067

0.549

80

0.242

0.882

0.092

0.709

100

0.290

0.940

0.120

0.823

150

0.411

0.990

0.201

0.959

200

0.516

0.998

0.284

0.992

Grafico3

El Grafico 3 representa la curva de potencia para niveles de significacin


de 0,01; 0,05 para distintos tamaos maestrales y un tamao de efecto de .30.
Ntese que para lograr una potencia de .80 (recomendada por Cohen) para
=.05 son necesarios tamaos muestrales inferiores que los necesarios para
=.01.
Cohen ha examinado la potencia para la mayor parte de las pruebas de inferencia
estadstica y ha proporcionado pautas para los niveles aceptables de potencia, sugiriendo
16

MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

que los estudios deben disearse para conseguir niveles de alfa de al menos 0,05 con
niveles de potencia

rminos mantener una relacin

de 4/1
Determinacin de la Potencia
Existen dos formas: a prior y a posteriori

A Priori: Se hace a partir de las Curvas de Potencia y permite determinar


el nmero de sujetos necesarios para alcanzar una potencia deseada. Si
bien, a partir de la propuesta de Cohen (1992) y por convencin se da por
suficiente potencias de .80, no debe tomarse como un criterio
inamovible, el investigador debe plantear su compromiso con las
probabilidades de error
relacin inversa.

A posteriori: Muy tiles cuando los resultados de un estudio son


negativos ya que en general se suele interpretar un resultado negativo
como que le fenmeno estudiado no existe cuando lo que puede estar
ocurriendo es que estemos ante un estudio de potencia baja) bien porque
el tamao muestral sea insuficiente o el tamao del efecto pequeo) de
tal forma que el procedimiento no es capaz de detectar la significacin
estadstica.
Como ya hemos visto los cuatro elementos centrales en inferencia
son n;

y el tamao del efecto, todos ellos mutuamente

interrelacionados de tal forma que cada uno es funcin de los otros tres.
As, y siguiendo a Cohen (1998) podemos plantear cuatro tipos de
anlisis de la potencia:
1.- Potencia en funcin de , TE5 (tamao el efecto) y n. Es decir,
conocidos los tres elementos calculamos (normalmente se busca en las
tablas de potencia) la potencia (si la queremos aumentar cambiaremos las
especificaciones preestablecidas).
2.- Se estima el TE (bien a travs del estudio de la literatura al caso o por
aproximacin fundamentada en la propia experiencia), se establece el
5 A partir de ahora designaremos el tamao del efecto por TE

17

MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

valor de y la potencia deseada y se calcula n. Este procedimiento es


especialmente relevante en estudios clnicos y en diseos experimentales
ya que permite determinar el nmero de sujetos necesario.
3.- Determinar el TE conocidos los otros elementos en juego (apenas se
utiliza).
4.- Determinacin de conocidos los otros tres, apenas tiene utilidad
ya que la convencin de : 0.05 0.01, esta muy extendida e impuesta
por la convencin.(En algunos estudios clnicos se toma = .10)
A ttulo de resumen:
En condiciones ideales los valores de

deberan ser especificados y

utilizados para fijar el valor de n para la prueba estadstica seleccionada para el


anlisis. En general lo comn es fijar y n lo cual determina la potencia. Cuando el
resultado da una potencia baja, la solucin es incrementar n ya que es la nica manera
de reducir los errores tipo I y II, si bien el criterio de incremento de n debe ser
matizado por criterios de coste tanto econmico como de esfuerzo..
En los estudios en los que TE sea un elemento clave (estudios clnicos y algunos
experimentales) deber tenerse presente y prefijado

n necesario,

para el TE postulado.6
Actualmente existe software gratuito que permite, para algunas pruebas
especficas determina n TE la potencia. Por ejemplo el SamplePower del SPSS
permite determinar los tamaos maestrales y ajustar los parmetros del diseo,
obteniendo las curvas de potencia para un amplio nmero de tcnicas de anlisis
(medias, proporciones, correlacin, Anova, Ancova y Regresin). El documento
SOFTWARE PARA CALCULAR TAMAOS MUESTRALES Y POTENCIA incluido
en la carpeta COMPELMENTOS BLOUE 1 contiene direcciones web con software
disponible en la red para estos clculos.

6 Para mayor informacin sobre estas cuestiones ver:


Bono, R.; Arnau, J.; (1995) Consideraciones generales en torno a los estudios de potencia. Anales de
Psicologa, 11 (2), 193-202.
Cohen, J. (1988). Statiscal power anlisis for the behavioral sciences. ( 2da ed.). Hillsdale, NJ: Erlbaum
Cohen, J. (1992). A power primer. Psychological Bulletin, 112, 155- 159.

18

MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

Algunos comentarios relacionados con el TAMAO DEL EFECTO


Cohen define este estadstico como el grado en que el fenmeno en estudio est
en la poblacin. Responde a preguntas el tipo: cual ha sido la magnitud del efecto de
un tratamiento?; cmo de fuerte es la relacin entre las variables?, en otros trminos
facilita no slo el que se conozca que un efecto ocurre, sino tambin su magnitud. Tal y
como ha sido definido (grado en que el fenmeno esta presente en la poblacional)
puede calcularse su intervalo de confianza que indicar el rango dentro del cual es
posible que se encuentre el efecto real en la poblacin (se aplica todo lo visto sobre
intervalos confidenciales dado que se trata de un estadstico con su distribucin
muestral) 7 .
Como ya se comento, para determinar la Potencia Estadstica (ya sea a priori o a
posteriori) es necesario conocer el TE, aunque no esta todo dicho sobre cuales son las
medidas de TE y su interpretacin

(cuestin que hoy constituye un campo de

investigacin) Rosenthal (1994) clasifica las medidas del efecto en dos familias:

Familia d: ndices para diferencias entre medias y proporciones (en ambos casos
hay distintos ndices relativos a puntuaciones brutas d de Cohen; la g de
Hedges; la delta de Glass , tipificadas, estadstico CL de McGraw y Wong,
tambin llamado ndice universal del TE; d

Cox,

para variables dicotomizadas o

trasformaciones a r, en concreto de la de d de Cohen), entre otros.

Familia r: Coeficientes de correlacin de Pearson y sus derivados (correlaciones


cuadrticas o proporciones de varianza explicada. 2; ^2).

A la hora de realizar un estudio completo y, desde la perspectiva presentada, se


hacen una serie de recomendaciones que pueden encontrar en el documento
sugerencias metodolgicas.

7 Importante destacar que las tcnicas que calculan el TE para algunas de las diferentes pruebas estadsticas
de uso comn (ejemplo, t; F) ofrecen una mtrica comn que posibilita la integracin de resultados indispensable en el
Meta-anlisis.
8 Los diferentes ndices sern presentados asociados a las correspondientes pruebas de significacin.

19

MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

20