You are on page 1of 30

Pregunta 1: Es la diferencia significativa?

Pregunta 2: Estn las variables


asociadas?
Pregunta 3: Son los puntajes o categoras
predecibles?
Pregunta 4: Se puede inferir los
parmetros poblacionales a partir de una
muestra?
Pregunta 5: Son las variables latentes? (Los
factores que emergen de un anlisis factorial nunca pueden ser directamente
medidos o controlados por el investigador.
Diferencias significativas
Se presenta en el contexto de la investigacin experimental
donde el rendimiento de los participantes en diferentes
condiciones se est comparando.
En un experimento sobre drogas, el rendimiento bajo
condiciones Experimental y Control se mide y las medias
tienen valores diferentes.
Esto puede parecer apoyar la hiptesis del experimentador;
pero habra una diferencia similar si se repitiera el
experimento?
Aqu el investigador desea probar la significacin estadstica
de la diferencia, es decir, establecer que la diferencia es
demasiado grande como para ser solo una casualidad.
El diseo del experimento
Muestras Independientes
Seleccionamos 100 participantes para un experimento y asignamos al azar a
la mitad a una condicin experimental y el resto a una condicin de control.
La asignacin de una persona a un grupo en particular no tiene ningn
efecto sobre el grupo al que se le asigna.
Las dos muestras independientes de participantes seleccionadas emitirn
dos muestras independientes de puntuaciones.
Un criterio til para decidir si se tiene datos de muestras independientes es
que no debe haber ninguna base para emparejamiento de las
puntuaciones de una muestra con la otra.
Un experimento en el que muestras independientes de participantes se
prueban en condiciones diferentes que se conoce como experimento entre
sujetos.
El diseo del experimento
Muestras Relacionadas
Supongamos que cada uno de cincuenta participantes tira diez
veces a un blanco triangular y diez veces a un blanco cuadrado,
ambos blanco tienen la misma superficie.
Para cada blanco (triangular y cuadrado), cada participante tendr
una puntuacin que van desde 0 (diez fallas) a 10 (diez xitos).
Como en el ejemplo anterior, habr dos muestras de 50
resultados. Esta vez, sin embargo, cada puntuacin de las
muestras se puede emparejar con la puntuacin del mismo
participante con el otro objetivo.
Un experimento como ste, en el que cada participante se prueba
bajo dos (o todas) condiciones, se conoce como experimento
dentro de sujetos. Tambin se dice que tienen medidas repetidas
El diseo del experimento
. Diferentes
pruebas
estadsticas son apropiadas
para su uso con datos de
muestras independientes y
datos de muestras
relacionadas.
Diagrama de flujo para las diferencias entre las medias
Inicio

Ms de dos
Cuntas ANOVA0
condiciones?

Dos

Independiente Independiente Relacionado


o muestras
relacionadas?

Medida u Medida u
Ordinal Nominal Ordinal Nominal
Tipo de datos Tipo de datos

T-test independiente Test de Chi- T-test relacionado Test


(pool o varianza cuadrado McNemar
separada) para No-paramtrico-Test
asociacin de Wilcoxon, Test de
No-paramtrico-Test signo
de Mann-Whitney
Test de t Student
Para comparar los promedios de dos muestras independientes de
datos, la prueba t para muestras independientes es a menudo
apropiado.
En su forma original, la prueba t para muestras independientes
utiliza una estimacin media o agrupada de la varianza de la
poblacin supuestamente constante.
Por esta razn, se conoce a veces como prueba t agrupada (pooled t
test.)
A veces los datos pueden no ajustarse a los requisitos de la prueba t
para muestras independientes.
Si las varianzas de las muestras y/o tamaos de las muestras son
marcadamente diferentes, la prueba t de varianza separada puede
ser una opcin ms segura o posiblemente recurrir a una prueba no
paramtrica.
Ejemplo de una prueba t paramtrica
Para ayudar a profes jvenes a tener xito en el mundo
acadmico, se ha ideado un curso de orientacin en la que
aprenden como utilizar grandes palabras, cuando la pequea
tambin la hara. Y para ayudarse a sobrevivir en el mundo
acadmico, decide hacer una investigacin sobre el mismo. Por
lo tanto, se aleatoriza la mitad de tus profes dispuestos a tomar
el curso y la otra mitad a prescindir, a continuacin, medir todas
las palabras oscuras que murmuran. Cmo voy utiliza estos
datos para decir si curso tuvo xito? En pocas palabras, cmo
se puede determinar la cantidad de la variacin en las
puntuaciones hayan resultado de la diferencia entre los grupos y
la cantidad de variacin dentro de los de grupos? La siguiente
tabla muestra los valores obtenidos luego de asistir al curso y los
obtenidos por el control
Participantes Control
35 22
31 25
29 23
28 29 Participantes Control
35 27
39 30 S 4,55 4
41 28 S2 20,67 16
37 30 n 10 10
39 33
38 21
33 29
Para realizar la comparacin de las medias, se
utiliza la prueba t de dos muestras. La frmula
utilizada varia dependiente del tamao de los
grupos involucrados, es decir si n1 es igual a n2
o no lo es. Para este caso en particular
utilizamos la siguiente frmula:
Resultado de Excel
El cociente intelectual (CI) de 16 estudiantes de una regin de una
ciudad result con una media de 107 y una desviacin estndar de
10, el CI de 14 estudiantes de otra regin de esa ciudad result de
112 y la desviacin estndar de 8. Al nivel de significancia: a) 0.01 y
b) 0.05, hay diferencia entre los CI de estos dos grupos?

R1 R2 Alfa
Media 112 107 1%
Desviacin estndar 8 10 5%
Tamao 14 16
gl: grados de libertad
Para calcular un estadstico, es necesario emplear
observaciones obtenidas de una muestra y tambin ciertos
parmetros poblacionales. Si estos parmetros no se
conocen, es necesario estimarlos a partir de la muestra. El
nmero de grados de libertad de un estadstico, que por lo
general se denota , se define como la cantidad n de
observaciones en la muestra (es decir, el tamao de la
muestra) menos la cantidad k de parmetros poblacionales
que tengan que estimarse a partir de las observaciones
muestrales. En smbolos, = n k. En el caso de la media,
la cantidad de observaciones independientes en la muestra
es n, y a partir de ellas se calculan . Como se necesita
estimar , k = 1 y por lo tanto = n 1.
Ver Tabla C
Para nuestro caso, el grado de libertad es
18, debido a que se determinaron dos
medias aritmticas y la cantidad total de
datos es 20, por lo tanto 20 2 = 18. Para
un test de dos colas con 5% de
significancia el valor crtico para t es 2.10.
Si el valor t calculado es mayor que el
valor crtico 2.10, por tanto la diferencia
entre las medias es significativa.
Para muestras con diferentes tamaos de n1
n2, la frmula generalizada de test de t es la
siguiente:
Tamao de la muestra y potencia

La inversa
Para hacer funcionar esta ecuacin:

Como mnimo necesitamos conocer la media y la desviacin estndar, si


no lo tienes: cralos, y en aras de conseguir una beca por una fundacin,
tratar de justificar los datos con algo de literatura.
Cun grande es el efecto del tratamiento, (1- 2) = , voy a
obtener?, esta pregunta nunca se sabe, porque si supiramos, no
necesitaramos hacer el estudio. Debes inventarlo, si el tamao de la
muestra es ms de lo que puedes conseguir en un ao, dobla el efecto del
tratamiento. Si es muy pequeo reduce a la mitad el efecto del
tratamiento.
La Tabla D nos da el tamao que necesitamos, la primera columna d es la
razn / /. Esta del revs como aparece en la frmula, pero es la
forma estndar de expresar la diferencia de las medias en unidades
estndar, la expresin se denomina efecto tamao.
Las Tablas E de apndice da el tamao que debera tener cada muestra y
la potencia del test, cuyo valor mnimo es de 80%, para un valor
significativo importante.
ANOVA Anlisis de Varianza
Es un conjunto de tcnicas, cada uno de los
cuales se basa en un modelo de cmo se
generaron los datos y culmina en pruebas
que son slo apropiado para ese modelo en
particular.
Por lo tanto, es importante identificar
correctamente los experimentos de ANOVA,
con el fin de elegir las pruebas correctas. Se
describirn los experimentos de ANOVA ms
comunes.
ANOVA: Un factor
Los trminos Factor y Nivel son las variables
independientes y el valor respectivamente.
Un factor puede ser variable independiente o una
caracterstica del participante, tal como el gnero, que
'manipulamos' estadsticamente, mediante el
muestreo de las personas de cada categoras del
conjunto.
Las variables de los participantes son tratados
exactamente de la misma manera que VIs que estn
siendo manipulados directamente por el
experimentador
Factores Entre los sujetos y Dentro de los de
sujetos
Entre sujetos: es decir, el participante se
prueba bajo una sola condicin (es decir, en un
nivel) del factor. El gnero es un ejemplo obvio.
Dentro sujetos, es decir, el participante se
prueba en todas las diferentes condiciones
(niveles) que constituyen el factor.
Un experimento con un factor dentro sujetos
tambin se dice que tiene medidas repetidas en
ese factor.
RO TO
E NT IX
TR DE M
EN
ANOVA de un Factor. Partes del anlisis

PROPSITO
Comparar la Hiptesis Nula (H0) de que los
tratamientos (comparacin de medias) tienen
el mismo efecto medio, es decir:
H0: 1 = 2 = 3 =n, (no hay diferencia en los
efectos de las medias de los tratamientos)
Ha: i j, (al menos una media difiere de las
otras)
Ejemplo
Para promover la campaa sexo seguro para pecadores decides
promover cual es el preservativo ms eficaz.
Rpidamente te sientes desanimado por el reto, ya que una visita a la
farmacia local revela que hay una estantera entera de donde elegir.
Lo que realmente quieres hacer es seleccionar unas pocas marcas y
determinar si existe alguna diferencia global entre las medias de los
grupos e intentar dilucidar a qu son debidas.
Se selecciona un grupo surtido de voluntarios (que no parece que
vaya a ser demasiado complicado), formar grupos de manera
aleatoria asignndoles diferentes marcas (todas servidas con
propsitos experimentales en sencillos envoltorios marrn) y seala
una escala del 1 al 10 el ndice de satisfaccin para diferentes marcas
de preservativos.
Compramos cuatro marcas y una marca casera desconocida. Con diez
individuos por cada grupo. Suponemos que hay una diferencia
discernible entre cada marca. La siguiente tabla muestra los
TABLA DE SATISFACCIN

Sujetos Ramss Jeque Troyano Sin nombre


1 4 5 7
4 5 8 2
2 1
5 6 7
3 5 6 9 2
4 6 7 6
3 6 3 3
5
6 4 4 2 3
7 4 5 2 4
3 6 2 5
8 4 3 3
9 4
10 4
ANOVA un Factor: Programa EXCEL.
Anlisis de varianza de un factor
RESUMEN DESCRIPTIVO
Grupos Tamao Suma Promedio Varianza

Ramss 10 42 4,2 0,84

Jeque 10 53 5,3 1,34

Troyano 10 49 4,9 7,66

Sin nombre 10 31 3,1 1,43


Resultado: ANOVA un Factor: Excel
ANLISIS DE VARIANZA

Origen de las Suma de Grados de Media de Valor crtico


F Probabilidad
variaciones cuadrados libertad cuadrados F

Entre grupos
27,875 3 9,292 3,296 0,031 2,866
(marcas)

Dentro grupos 101,5 36 2,819

Total 129,375 39