Professional Documents
Culture Documents
Cap. 2 EXPERIMENTOS COMPARATIVOS SIMPLES
Cap. 2 EXPERIMENTOS COMPARATIVOS SIMPLES
COMPARATIVOS SIMPLES
Cap. 2
Si se realiza una prueba con dos
formulaciones, se denominan como 2
tratamientos o como dos niveles del
factor formulaciones
Los resultados de los experimentos se los puede mostrar en diferentes graficas como:
𝑛 𝜎2
1 𝜇𝑋ത = 𝜇 𝜎2𝑋ത =
ത
𝑋𝑛 = 𝑋𝑖 𝑛
𝑛
𝑖=1
TEOREMA: Si X1, X2, X3,….,Xn es una muestra aleatoria de tamaño n de una VA con media con media μ y
varianza σ2 entonces la distribución de la media muestral 𝑋ത es aproximadamente una distribución normal
con media μ y varianza σ2/n, entonces :
a) Esto es válido para n ≥ 30 b) Si la población es normal este teorema se aplica para cualquier n
Grados de libertad
A la cantidad n-1 se denomina número de grados de libertad de la suma de cuadrados SS
El número de grados de libertad de una suma de cuadrados es igual al número de
elementos independientes en dicha suma de cuadrados. Solo n-1 se ellos es
independientes, lo cual implica que SS tiene n-1 grados de libertad.
Los grados de libertad son el numero de observaciones no restringidas o con libertad de
variar en un problema estadístico
Muchas de las pruebas estadísticas requieren que el investigador especifique los grados
de libertad para encontrar el valor critico de la prueba estadística en tabulaciones de la
misma
El numero de grados de libertad (gl) es igual a las observaciones menos las suposiciones o
restricciones necesarias para calcular el valor estadistico, en otras palabras (n-1)
Distribución “t” de studennt
W.S. Gosset en 1908. Él dedujo una complicada fórmula para la función de densidad de
𝑋ത − 𝜇 Se distribuye con
para muestras aleatorias de tamaño n desde una población 𝑡= 𝑠
normal y publicó sus resultados bajo el nombre de “Student”. n-1 grados de
𝑛 liobertad
𝑟+1 −(𝑟+1)/2
Tiene las siguientes características: Γ[
2
] 𝑡2
𝑓 𝑡 = 𝑟 1+ 𝑟
- Tiene forma de montículo y es simétrica alrededor de t = 0, 𝑟Π Γ 2
igual que z.
- Es más variable que z, con “colas más pesadas”; esto es, la -∞ < t < ∞
curva t no aproxima al eje horizontal con la misma rapidez
que z. Esto es porque el estadístico t abarca dos cantidades
aleatorias, x y s, en tanto que el estadístico z tiene sólo la
media muestral, 𝑋. ത
- La forma de la distribución t depende del tamaño muestral
n. A medida que n aumenta, la variabilidad de t disminuye
porque la estimación de s está basada en más y más
información. En última instancia, cuando n sea
infinitamente grande, las distribuciones t y z son idénticas.
El divisor (n - 1) en la fórmula para la varianza muestral s2 se denomina número de grados de libertad (df )
asociados con s2. Determina la forma de la distribución t.
El numero de grados de libertad (gl) es igual a las observaciones menos las suposiciones o restricciones
necesarias para calcular el valor estadistico, en otras palabras (n-1)
Los grados de libertad son el numero de observaciones no restringidas o con libertad de variar en un
problema estadístico
P[T≤ tα ]= α
Al indizar un número particular de grados de libertad, la tabla registra tα, un valor de t que tiene área a de
cola a su derecha,
tα = -t1-α
Se trata a la distribución t como N(0,1) cuando r > 30
Ej.) Supongamos que usted tiene una muestra de tamaño
n 10 de una distribución normal. 𝜇=𝐸 𝑡 =0 𝑟>1
Encuentre un valor de t tal que sólo 1% de todos los
valores de t sea más pequeño. 𝑟
𝜎 2 = 𝑉𝑎𝑟 𝑡 = 𝑟>2
gl = n – 1= 9, T0,01 = - 2,821 𝑟−2
Aparece de manera natural al realizar la prueba t de
Student para la determinación de las diferencias entre
dos medias muestrales y para la construcción del
intervalo de confianza para la diferencia entre las medias
de dos poblaciones cuando se desconoce la desviación
típica de una población y ésta debe ser estimada a partir
de los datos de una muestra.
Para medias muestrales:
Si las varianzas
𝑦ത1 − 𝑦ത2 son iguales
𝑡𝑜 =
1 1
𝑆𝑃 +
𝑛1 𝑛2
Sean Z1, Z2…,Zr, VA independientes distribuidas normalmente, cada una con media 0 y varianza 1; NID (0,1).
1 𝑟 0<x<∞
𝑓𝑋 2 𝑥 = 𝑟 𝑟 𝑥 2−1 𝑒 −𝑥/2
22 Γ( )
2 En otros casos
0
La X2 Toma todos los valores reales positivos.
Los GL= r = k = al número de VA independientes que se suman, o como en número de variables que
pueden variar libremente (r).
Son curvas asimétricas positivas, cuando r aumenta se aproxima a una normal 𝜇 = 𝐸 X2 = 𝑟
Se trata a la X2 como N(0,1) cuando r > 30
El símbolo x2α indica que el valor x2 tabulado tiene un área α a su derecha 𝜎 2 = 𝑉𝑎𝑟 X2 = 2r
P[X< x2α ]= α 0<α<1
Aplicaciones
La distribución χ² tiene muchas aplicaciones en
inferencia estadística. La más conocida es la de
la denominada prueba X2 utilizada como
prueba de independencia y como prueba de
bondad de ajuste y en la estimación de
varianzas. Pero también está involucrada en el
problema de estimar la media de una
población normalmente distribuida y en el
problema de estimar la pendiente de una
recta de regresión lineal, a través de su papel
en la distribución t de Student.
Aparece también en todos los problemas de
análisis de varianza por su relación con la
distribución F, que es la distribución del
cociente de dos variables aleatorias
independientes con distribución χ².
Propiedad Aditiva
𝑝
X2= 𝑋12 + 𝑋22 … . . +𝑋𝑝2 𝑟 = σ𝑖=1 𝑟𝑖
Distribución “F”
0 En otros casos
𝑟2
𝜇𝐹 = 𝐸 𝐹 = 𝑟2 > 2
𝑟2 − 2
P[F< fα ]= α
INFERENCIAS ACERCA DE LAS DIFERENCIAS DE MEDIAS, DISEÑOS ALEATORIZADOS.
Prueba de hipótesis
Existen dos causas para que el valor hipotético y el resultado obtenido en la investigación
difieran, esta son:
a) La hipótesis es verdadera y la diferencia observada quizá se deba a un error de
muestreo
b) La hipótesis puede ser falsa y el valor verdadero es otro
Se plantean 2 maneras fundamentales
Hipótesis nula (Ho) o también llamada hipótesis de statu quo, es la que prueba
contra su complemento (Ha)
Hipótesis alterna (Ha), también llamada hipótesis de investigación o de interés
Es conveniente que las hipótesis Ho y Ha deben formularse de manera tal que no puedan
ser verdaderas al mismo tiempo.
Se trata de emplear la evidencia disponible para comprobar cual tiene mas probabilidad de
ser cierta
Para determinar si se va a rechazar o no la hipótesis nula, se requiere una regla de
decision o estandar. Los estadistas formulan las reglas de decisión de este tipo en terminos
o niveles de significado (α).
Ej.. Si se toma un α= 0,05, Esto significa que se rechazará si la prueba indica que la
probabilidad de que ocurra el resultado observado (es decir, la diferencia entre la media
de la muestra y el valor esperado) por probabilidad o por error de muestreo es inferior al
5%.
El valor β nunca se define de antemano, si este aumenta para minimizar el error tipo II, α
disminuye y viceversa para disminuir el error tipo I
𝑆ሶ 21 = 0,100 𝑆ሶ 22 = 0,061
Hipótesis
𝐻𝑂 : 𝜇1 = 𝜇2
𝐻𝑎 : 𝜇1 ≠ 𝜇2
α = 0,05 γ=GL= n1 + n2 -2 = 18
SP = 0,284
El valor P se define como el nivel de significación menor que llevaría a rechazar la hipótesis
nula Ho.
σ= 2,68
a) Cual es la probabilidad de que el proyecto pueda terminarse en menos de 22 semanas?
b) Cual es la probabilidad de que el proyecto requiera más de 28 semanas?
c) Encuentre el número de semanas que se requieren para terminar el proyecto con probabilidad de 0,90
𝑇 − 𝜇 22 − 𝜇 22 − 26
a) 𝑃 𝑡 < 22 = 𝑝 < = 𝑝[𝑍 < ] = 𝑝 𝑍 < −1,5 = 0,0668
𝜎 𝜎 2,68
𝑇 − 𝜇 28 − 𝜇 28 − 26
b) 𝑃 𝑡 > 28 = 𝑝 > = 𝑝[𝑍 > ] = 𝑝 𝑍 > 0,75 = 0,2266
𝜎 𝜎 2,68
𝑡−𝜇 𝑡−𝜇
c) 0,90 = 𝑃 𝑇 ≤ 𝑡 = 𝑝 𝑍 < 𝑍0,90 = 𝑡 = 𝜇 + 𝜎𝑍0,90 𝑡
𝜎 𝜎 = 26 + 2,68 ∗ 1,28
𝑡 = 29,43 semanas
Verificación de los supuestos de la prueba t
-Ambas muestras se toman de poblaciones independientes que pueden describirse con una
distribución normal, que las desviaciones estándar o varianzas de ambas poblaciones son
iguales y que las observaciones son variables aleatorias independientes.
Los supuestos de igualdad de las varianzas y la normalidad son fáciles de verificar utilizando
una gráfica de probabilidad normal.
Las observaciones se grafican con sus respectivas frecuencias acumuladas observadas (j-
0.5)/n.
La escala de la frecuencia acumulada se ha dispuesto de tal modo que si la distribución
hipotetizada describe de manera adecuada los datos, los puntos graficados estarán
aproximadamente sobre una línea recta los puntos graficados muestran una desviación
significativa de una recta, el modelo hipotetizado no es el apropiado.
25,75
84, 50
Cuando ocurren violaciones importantes de los supuestos, se afectara el desempeño de
la prueba t. En general, las violaciones de pequeñas a moderadas no son motivos de
preocupación particular, pero no se deberá ignorar cualquier falla del supuesto de
independencia, así como los indicios claros de que no se satisface el supuesto de
normalidad.
El uso de un diseño aleatorizado permite probar hipótesis sin ningún supuesto respecto
de la forma de distribución.
Si los tratamientos no tienen ningún efecto todas las formas posibles en que podrían
ocurrir las n observaciones son igualmente posibles.
ELECCIÓN DEL TAMAÑO DE LA MUESTRA
La elección del tamaño de la muestra y la probabilidad β del error de tipo II guardan una
estrecha relación.
La probabilidad del error tipo II depende de la verdadera diferencia en las medias δ.
Muchas veces es preferible proporcionar un intervalo dentro del cual cabría esperar que
estaría incluido el valor del parámetro o los parámetros en cuestión.
1 1 1 1
𝑦1 − 𝑦ത2 − 𝑡𝛼,𝑛 𝑆𝑝 + ≤ 𝜇1 − 𝜇2 ≤ 𝑦1 − 𝑦ത2 + 𝑡𝛼,𝑛 𝑛 −2 𝑆𝑝 +
2 1+ 𝑛2 −2 𝑛1 𝑛2 2 1+ 2 𝑛1 𝑛2
-1,43 ≤ 𝜇1 − 𝜇2 ≤ - 0,89
CASO EN QUE 𝝈𝟐𝟏 ≠ 𝝈𝟐𝟐
No hay bases para suponer que las varianzas
Hipótesis 𝜎1 𝑦 𝜎2 son iguales
𝐻𝑂 : 𝜇1 = 𝜇2 𝑦ത1 − 𝑦ത2
𝐻𝑎 : 𝜇1 ≠ 𝜇2 𝑡𝑜 =
𝑆1 𝑆2
+
𝑛1 𝑛2
𝑛1 𝑛1
+
𝑛1 − 1 𝑛2 − 1
CASO EN QUE SE CONOCEN 𝝈𝟐𝟏 𝒚 𝝈𝟐𝟐
Pueden probarse usando el estadístico:
Hipótesis
𝐻𝑂 : 𝜇1 = 𝜇2 𝑦ത1 − 𝑦ത2
𝐻𝑎 : 𝜇1 ≠ 𝜇2 𝑍𝑜 =
𝜎21 𝜎22
+
𝑛1 𝑛2
Si las dos muestras son normales o los tamaños de muestras son suficientemente grandes
para aplicar el teorema del límite central, la distribución Zo es (N(0,1) si la hipótesis nula es
verdadera
Ho se rechazaría si [Zo] > Z (α/2) donde (α/2) es el punto porcentual de (α/2) superior de
la distribución normal estándar
𝜎21 𝜎22 𝜎21 𝜎22
𝑦1 − 𝑦ത2 − 𝑍𝛼 ( + ) ≤ 𝜇1 − 𝜇2 ≤ 𝑦1 − 𝑦ത2 + 𝑍𝛼 ( + )
2 𝑛1 𝑛2 2 𝑛1 𝑛2
COMPARACIÓN DE UNA SOLA MEDIA CON UN VALOR ESPECIFICADO
Hipótesis 𝐻𝑂 : 𝜇 = 𝜇𝑂 𝑦ത1 − 𝜇0
Pueden probarse usando 𝑍𝑜 =
𝐻𝑎 : 𝜇 ≠ 𝜇𝑂 el estadístico: 𝜎
𝑛
Si la población es normal con varianza conocida, o si la población no es normal pero el
tamaño de la muestras es suficientemente grande para aplicar el teorema del límite central,
la distribución es N(0,1) si la hipótesis nula es verdadera
Si Ho: 𝜇 = 𝜇𝑂 es verdadera entonces la distribución Zo es N(0,1) por lo tanto la regla de
decisión para Ho: 𝜇 = 𝜇𝑂 es rechazar la hipótenei nula si [Zo] > Z (α/2) valor de la media 𝜇𝑂
especificado en la hipótesis nula se determina generalmente mediante una de las tres
siguientes formas:
a) Puede ser resultado de evidencia, conocimientos o experimentación previos
b) Puede ser resultado de alguna teoría o modelo que describe la situación bajo
estudio
c) Puede ser resultado de especificaciones contractuales
𝜎 𝜎
𝑦ത − 𝑍𝛼 ∗ ≤ 𝜇 ≤ 𝑦ത + 𝑍𝛼 ∗
2 𝑛 2 𝑛