You are on page 1of 19

Métodos estadísticos Nivel de medición de las variables Tamaño de la muestra 1.

Preguntas que nos hacemos cuando comparamos dos medias Aunque el tamaño del efecto lo presentamos como complemento al contraste de medias tradicional (t de Student), es también aplicable en otros tipos de análisis, como el análisis de varianza y en general en todas las pruebas de significación estadística. Cuando comparamos dos medias nos suele interesar responder a estas tres preguntas: 1º ¿Podemos afirmar que hay una diferencia? A esta pregunta se responde mediante la t de Student. Es lo mismo que preguntar si la diferencia es estadísticamente significativa, o si es mayor de lo puramente aleatorio (diferencia distinta de cero en la población).

y exponer. En buena parte las interpretaciones limitadas. Lo más frecuente es responder a la primera pregunta. e incluso equívocas. que hay una diferencia. pero un valor grande de t no nos permite afirmar que la diferencia es grande. A veces esto puede ser suficiente. El limitarse a exponer y comentar los valores de t y p puede llevar a interpretaciones equívocas. un valor grande de t sólo nos dice que tenemos mucha seguridad para poder afirmar que la diferencia entre las medias de las poblaciones no es cero. de las diferencias estadísticamente significativas radican en las mimas limitaciones del paradigma que utilizamos en el contraste de medias. 3º ¿Es importante la diferencia? La respuesta a esta pregunta supone un juicio cualitativo. los valores de t y de p (la probabilidad asociada al valor de t). pero depende en buena medida de las respuestas a las dos preguntas anteriores. . como datos necesarios y suficientes.2º ¿Es grande la diferencia? A un mayor valor de t no corresponde de manera sistemática una mayor diferencia. insuficientes o a exagerar la importancia de la diferencia. pero no lo es habitualmente.

Niveles de Medición Nominal Las propiedades de la medición nominal son: 1) Exhaustiva: implica a todas las opciones 2) A los sujetos se les asignan categorías. por lo que son mutuamente excluyentes. la variable está presente o no. en ese sentido se pueden establecer jerarquías 2) Las distancias entre un valor y otro no son iguales . Es decir. tiene o no una característica Ordinal Las propiedades de la medición ordinal son: 1) El nivel ordinal posee transitividad. por lo que se tiene la capacidad de identificar que “esto es mejor o mayor que aquello”.

Una escala de intervalos implica: clasificación. siempre y cuando se incluya el 0 . Por ejemplo: Peso corporal en kg. pruebas de conocimientos. por lo tanto incluye sólo los números por su valor en sí. estatura en cm. atributos psicológicos (CI. 2000). Por ejemplo: temperatura. Intervalar 1) El nivel de medición intervalar requiere distancias iguales entre cada valor. Por lo general utiliza datos cuantitativos. 2) Convencionalmente los datos que son de nivel absoluto o de razón son manejados como los datos intervalares. edad en años. etc. nivel de autoestima. magnitud y unidades de tamaños iguales (Brown..Razón 1) La escala empieza a partir del 0 absoluto. 3) Se pueden hacer operaciones aritméticas 4) Cuando se le pide al sujeto que califique una situación del 0 al 10 puede tomarse como un nivel de medición intervalar. por lo que no pueden existir los números con signo negativo.) 2) Las unidades de calificación son equivalentes en todos los puntos de la escala.

.

pero cuando se tiene una escala con reactivos calificados en un nivel ordinal. . Las variables ordinales. por otro lado. ya que matemáticamente se comporta como tal. al ser sumados el resultado de esta suma puede ser considerado como intervalar. aparentemente no se pueden sumar.Las variables intervalares y de razón se pueden incluir en operaciones aritméticas y para efectos de análisis estadísticos se consideran con las mismas propiedades y se clasifican en un rubro general llamado nivel escalar.

¿Cómo es el nivel de creatividad entre los niños de comunidades rurales.Para los problemas de comparación: Nivel NOMINAL: Aquí se habla de proporciones y / o categorías. ¿Cómo es la relación entre fumar o no y morir por cáncer pulmonar? H0: La proporción de sujetos que mueren por cáncer pulmonar es igual entre fumadores y no fumadores. urbanas e indígenas? H0: El nivel de creatividad es igual entre niños de comunidades rurales. urbanas e indígenas. urbanas e indígenas. H1: El nivel de creatividad es diferente entre niños de comunidades rurales. H1: La proporción de sujetos que mueren por cáncer pulmonar es diferente entre fumadores y no fumadores Nivel ORDINAL: Aquí se habla de jerarquías y / o niveles. .

H1: El nivel de irritabilidad hacia los compañeros de trabajo es diferente entre los tres grupos de estrés. . a quienes se les evaluó su nivel de irritabilidad preguntándoles en una escala de 0 a 10 que indique: “cotidianamente ¿qué tan irritable se muestra con sus compañeros de trabajo?” H0: El nivel de irritabilidad hacia los compañeros de trabajo es igual entre los tres grupos de estrés.Nivel INTERVALAR: Se comparan las medias y también se habla de niveles. Para ello se conformaron tres grupos. con 7 profesionistas cada uno. estrés regular y alto estrés. Se desea conocer cómo el nivel de estrés de los sujetos afecta su nivel de irritabilidad hacia sus compañeros de trabajo. bajo estrés.

predecir o explicar por la variable independiente (Snyder y Lawson. de diferencia grande o pequeña7 y consiguientemente de la relevancia de la diferencia encontrada. ni en los símbolos utilizados). nos a permitir hablar de magnitudes. El tamaño del efecto se ha explicado de diversas maneras: nos dice cuánto de la variable dependiente se puede controlar. pero se utiliza igualmente en los casos en los que no hay un diseño propiamente dicho. Aquí le denominaremos tamaño del efecto (no hay unanimidad ni en los términos. 1993) o en qué grado la hipótesis nula es falsa (Cohen. o para al menos minimizarlos e interpretar mejor los resultados. sino un simple contraste de medias. La expresión efecto se refiere obviamente al resultado de un tratamiento experimental. o consecuencia asociada a una determinada variable independiente. en definitiva el tamaño del efecto. una de las nuevas técnicas que se van imponiendo es calcular la magnitud o tamaño del efecto. 1988). como la misma palabra tamaño expresa. .Métodos de análisis complementarios: el tamaño del efecto Para obviar estos problemas.

Lo que se pretende básicamente con estos procedimientos es: 1º Cuantificar una diferencia de manera que se pueda interpretar mejor en términos de magnitud e importancia para no confundir la significación estadística de un resultado con su relevancia práctica. 2º Poder comparar unas diferencias con otras que procedan de estudios diferentes (e incluso obtenidas con instrumentos distintos y analizadas con métodos estadísticos distintos). pero son utilizables y recomendados en cualquier otro planteamiento de investigación primaria. .Estos procedimientos se han desarrollado en buena medida en conexión con el meta análisis (o síntesis cuantitativas de los resultados de diversos estudios).

Se trata en definitiva de llegar a una métrica común que facilite la interpretación y la integración de resultados. De esto trata precisamente el meta-análisis.3º Poder unir o resumir cuantitativamente los resultados obtenidos en investigaciones distintas. que también puede tener su interés) 2º Establecer comparaciones entre diferencias que proceden de pares de grupos de tamaño muy distinto 3º Hacer síntesis claras e interpretables que proceden de estudios distintos . Por estas razones es importante completar el contraste de medias con el cálculo del tamaño del efecto porque nos permite: 1º Interpretar mejor una diferencia estadísticamente significativa (e incluso una diferencia no significativa.

se suele entender otro cálculo distinto del coeficiente de correlación. X2 es la media pos-tratamiento y Σ es la desviación estándar pre-tratamiento.. . Como ya sabemos. la magnitud del efecto nos permite apreciar si la diferencia es grande o es pequeña. si la hipótesis nula es falsa).Concepto y fórmula básica Cuando se habla del tamaño del efecto . Lo que se pretende cuantificar con la magnitud del efecto es en qué grado o en qué medida la hipótesis nula es falsa. sin más aclaraciones y sobre todo en el contexto de la diferencia entre dos medias.X 2 Σ Donde X1 es la media pre-tratamiento. el valor de t (o z) nos dice con qué seguridad (o con qué probabilidad de error) podemos afirmar que hay una diferencia distinta de cero entre las medias de las poblaciones representadas por las muestras cuyas medias contrastamos (es decir. En términos más simples. La fórmula básica del tamaño del efecto: d= X 1 .

por lo tanto estos valores son comparables entre sí aun cuando vengan de estudios distintos e incluso aunque se hayan utilizado instrumentos distintos. por ejemplo. las diferencias entre las medias no son comparables directamente entre sí. Si por ejemplo hemos comparado dos grupos en autoconcepto utilizando una escala con 4 respuestas. de rendimiento.Consecuencias directas de tipificar las diferencias Lo que tenemos con esta fórmula [2]. . y otros dos grupos con otra escala con 6 respuestas. El valor de este tamaño o magnitud es independiente de las puntuaciones originales. una diferencia entre dos medias dividida por una desviación típica. con tal de que se trate de la misma variable aunque se entienda a un nivel más genérico (esto es normal en el meta-análisis).. 1. viene a ser lo mismo que una puntuación típica (z): nos dice a cuántas desviaciones típicas equivale la diferencia. distintas medidas de autoconcepto. pero sí lo son las diferencias tipificadas. Podemos resumirla en los puntos siguientes. por lo que su interpretación es sencilla y muy útil. etc.

Para esto basta calcular coeficientes de correlación. en esto consiste precisamente el procedimiento cuantitativo del meta-análisis. esta diferencia tipificada nos da una información adicional que no nos da el coeficiente de correlación visto antes (las observaciones anteriores también son aplicables al coeficiente de correlación utilizado como tamaño del efecto). para resumir todos los resultados en un único dato. cualquier investigador que haya hecho varios estudios comparando diversos pares de medias en la misma variable con el mimo instrumento: a) Puede calcular la media de los tamaños del efecto para dar una síntesis de sus resultados en vez de limitarse a señalar cuántas veces ha habido un resultado significativo. etc. Si suponemos que la distribución es normal en la población.2.) y tamaño del efecto. 3. cada estudio o comparación particular se convierte en el sujeto del nuevo análisis del que disponemos de dos datos (o muchos más pero tomados de dos en dos): característica del estudio (por ejemplo número de sujetos utilizado. . b) También puede verificar qué características (por ejemplo de la situación) están asociadas al tamaño del efecto. de estos valores se puede calcular la media procedente de estudios diferentes. edad media de la muestra. Sin necesidad de hacer un meta-análisis. Como todos los valores del tamaño del efecto son comparables entre sí.

por ejemplo d = 1. La media más pequeña es ahora igual a z = 0 y la media mayor es igual a z = 1.Si. esto quiere decir que la media del grupo con media mayor se aparta una desviación típica de la media del grupo con media más pequeña (figura 1). .

1988): d = . d = . Estas orientaciones son un tanto arbitrarias (el autor las propone simplemente como orientación).b) Valoración de la magnitud del tamaño del efecto Sobre cuándo se puede considerar grande o pequeño un determinado valor suelen aceptarse estas orientaciones (Cohen.50 (moderado) d = . no conviene tomarlas como norma absoluta.80 (grande). . En la tabla 3 tenemos la proporción de sujetos del grupo con media menor superados por el sujeto medio del grupo con media mayor para los tres tamaños del efecto propuestos como referencia por Cohen. aunque son muy aceptadas como razonables y se citan frecuentemente en la bibliografía experimental.20 (pequeño).

que toma en cuenta el registro pre-tratamiento (Xpre). es decir.Xpost Sdiff . Se debe también evaluar el impacto positivo que nuestras intervenciones tienen sobre la vida diaria de los pacientes. lo suficientemente grande para no ser atribuido al error y para ser notado por otros.Para hacer una evaluación dimensional de los resultados. la significancia clínica. es decir. La mejoría es definida como un cambio estadísticamente confiable.tratamiento (Xpost) y el error estándar de la diferencia entre los dos (Sdiff): RCI= Xpre . el registro post. se consideran 3 aspectos principales: la mejoría. no es suficiente con el uso exclusivo de métodos inferenciales que nos proporcionen la significancia estadística de los cambios. El método más comúnmente utilizado para evaluar la confiabilidad de cambio es determinando el índice de cambio confiable (RCI) con el método de Jacobson y Truax. Para dicha evaluación. la recuperación o una combinación de ambas.

00 22.6282 Upper Bound 28.20 = 11.2055 18.49927 8.0918 Minimum 17. Deviation 9.000 Within Groups Total 5127.8823 .3600 Std.00 55.36 – 15.160 98 99 52.00 50 Mean 25.640 df 1 Mean Square 2580.323 Sig.00 Total 50 100 15.1945 22. .2000 20.0308 8. Error 1.322 Oneway Índice de Cambio confiable = X del pretratamiento – X del postratamiento Diferencia del Error Estándar 25.61241 Std.88238 14.520 7708.00 Maximum 55.35940 Lower Bound 22.00 ANOVA Depres Sum of Squares Between Groups 2580.640 F 49.49487 .2800 3.5292 16.00 2.00 8.47 .Descriptives Depresión 95% Confidence Interval for Mean N 1.82384 .

o como el BDI. para ser significativa. Lunnen & Bonesteel.La recuperación está definida según los parámetros de Kendall y Grove. 2001). Ogles. como en el caso de la depresión en que la recuperación estará definida por la obtención de un puntaje de 9 o menos en el BDI (Ogles. como el regreso de los registros de resultados a la norma empírica. se sigue las sugerencias de Tingey et al. Pero como no siempre es posible el regreso a un nivel de funcionamiento normal. quienes señalan que cuando se cuenta con una escala que mide la patología en un continuo de severidad como el SCL-90-R. como lo es la depresión. cuando se aleja al menos dos desviaciones estándar del grupo disfuncional. cuando cae dentro de 2 desviaciones estándar de la media del grupo funcional. Estrategia que es sugerida para la evaluación de los cambios significativos en poblaciones con enfermedades crónicas (Asenlöf et al. o cuando se encuentra al menos a la mitad entre estos dos punto. . se puede considerar un cambio significativo cuando el paciente se mueve de un puntaje inicial de severidad al siguiente. 2001). Lunnen & Bonesteel.. más que con la comparación con un grupo de referencia normal. 2006.. Jacobson y Truax sugieren también como posibles puntos de corte para considerar que un puntaje postratamiento es funcional. Para lo cual se puede hacer uso de los puntos de corte determinados con base en investigaciones previas.