You are on page 1of 37

EXPERIMENTOS

COMPARATIVOS SIMPLES
Cap. 2
Si se realiza una prueba con dos
formulaciones, se denominan como 2
tratamientos o como dos niveles del
factor formulaciones

Los resultados de los experimentos se los puede mostrar en diferentes graficas como:

Diagrama de puntos Histograma


MUESTREO Y DISTRIBUCIONES DE MUESTREO
DEFINICIÓN: Sea X una VA con función de distribución f(x), media y varianza. Una muestra aleatoria de tamaño
n, de X es un conjunto de n VA X1, X2, ….. ,Xn que cumplen:

1) Cada xi, tiene la misma distribución que X 𝐹𝑋𝑖 𝑥 = 𝐹𝑋 (𝑥) i= 1,2,3….n

𝑓𝑋𝑖 𝑥 = 𝑓𝑋 (𝑥) i= 1,2,3….n


2) Las VA Xi, son independientes 𝑛
1
a) 𝑋ത𝑛 = ෍ 𝑋𝑖
𝜇𝑋𝑖 = 𝐸 𝑋𝑖 = 𝐸 𝑋 = 𝜇 𝑛
𝑖=1
𝜎𝑋2𝑖 = 𝑉𝑎𝑟 𝑋𝑖 = 𝑉𝑎𝑟 𝑋 = 𝜎 2 σ𝑛 ത 2
2 𝑖=1(𝑋𝑖 − 𝑋)
b) La función con junta de la muestra aleatoria X1, X2, ….. ,Xn es: 𝑆 =
𝑛−1
𝑝𝑋1,…, 𝑋𝑛 (𝑥1,……, 𝑥𝑛 ) = 𝑝𝑋 𝑥𝑖 … . . 𝑝𝑋 𝑥𝑛 Si X es discreta

𝑓𝑋1,…, 𝑋𝑛 (𝑥1,……, 𝑥𝑛 ) = 𝑓𝑋 𝑥𝑖 … . . 𝑓𝑋 𝑥𝑛 Si X es continua


NOTA
Esto se cumple cuando la muestra proviene de una población infinita discreta o continua y cuando la muestra
se extrae con reemplazamiento de una población finita.
Si el tamaño de n de la muestra es muy pequeño en comparación con el tamaño de la población, se cumple
aproximadamente la definición anterior
Distribución muestral de la media
Sea X una población con función de distribución de probabilidad f(x), media μ y varianza σ2 Sea X1, X2,
X3,….,Xn una muestra aleatoria de tamaño n de X, la media muestral es:

𝑛 𝜎2
1 𝜇𝑋ത = 𝜇 𝜎2𝑋ത =

𝑋𝑛 = ෍ 𝑋𝑖 𝑛
𝑛
𝑖=1

TEOREMA: Si X1, X2, X3,….,Xn es una muestra aleatoria de tamaño n de una VA con media con media μ y
varianza σ2 entonces la distribución de la media muestral 𝑋ത es aproximadamente una distribución normal
con media μ y varianza σ2/n, entonces :

(por el teorema del límite central)


(𝑋ത − 𝜇) 𝑛
𝑍=
𝜎
Tiene una distribución N(0,1)

a) Esto es válido para n ≥ 30 b) Si la población es normal este teorema se aplica para cualquier n
Grados de libertad
A la cantidad n-1 se denomina número de grados de libertad de la suma de cuadrados SS
El número de grados de libertad de una suma de cuadrados es igual al número de
elementos independientes en dicha suma de cuadrados. Solo n-1 se ellos es
independientes, lo cual implica que SS tiene n-1 grados de libertad.
Los grados de libertad son el numero de observaciones no restringidas o con libertad de
variar en un problema estadístico

Muchas de las pruebas estadísticas requieren que el investigador especifique los grados
de libertad para encontrar el valor critico de la prueba estadística en tabulaciones de la
misma

El numero de grados de libertad (gl) es igual a las observaciones menos las suposiciones o
restricciones necesarias para calcular el valor estadistico, en otras palabras (n-1)
Distribución “t” de studennt

W.S. Gosset en 1908. Él dedujo una complicada fórmula para la función de densidad de
𝑋ത − 𝜇 Se distribuye con
para muestras aleatorias de tamaño n desde una población 𝑡= 𝑠
normal y publicó sus resultados bajo el nombre de “Student”. n-1 grados de
𝑛 liobertad
𝑟+1 −(𝑟+1)/2
Tiene las siguientes características: Γ[
2
] 𝑡2
𝑓 𝑡 = 𝑟 1+ 𝑟
- Tiene forma de montículo y es simétrica alrededor de t = 0, 𝑟Π Γ 2
igual que z.
- Es más variable que z, con “colas más pesadas”; esto es, la -∞ < t < ∞
curva t no aproxima al eje horizontal con la misma rapidez
que z. Esto es porque el estadístico t abarca dos cantidades
aleatorias, x y s, en tanto que el estadístico z tiene sólo la
media muestral, 𝑋. ത
- La forma de la distribución t depende del tamaño muestral
n. A medida que n aumenta, la variabilidad de t disminuye
porque la estimación de s está basada en más y más
información. En última instancia, cuando n sea
infinitamente grande, las distribuciones t y z son idénticas.
El divisor (n - 1) en la fórmula para la varianza muestral s2 se denomina número de grados de libertad (df )
asociados con s2. Determina la forma de la distribución t.
El numero de grados de libertad (gl) es igual a las observaciones menos las suposiciones o restricciones
necesarias para calcular el valor estadistico, en otras palabras (n-1)

Los grados de libertad son el numero de observaciones no restringidas o con libertad de variar en un
problema estadístico
P[T≤ tα ]= α

Al indizar un número particular de grados de libertad, la tabla registra tα, un valor de t que tiene área a de
cola a su derecha,

tα = -t1-α
Se trata a la distribución t como N(0,1) cuando r > 30
Ej.) Supongamos que usted tiene una muestra de tamaño
n 10 de una distribución normal. 𝜇=𝐸 𝑡 =0 𝑟>1
Encuentre un valor de t tal que sólo 1% de todos los
valores de t sea más pequeño. 𝑟
𝜎 2 = 𝑉𝑎𝑟 𝑡 = 𝑟>2
gl = n – 1= 9, T0,01 = - 2,821 𝑟−2
Aparece de manera natural al realizar la prueba t de
Student para la determinación de las diferencias entre
dos medias muestrales y para la construcción del
intervalo de confianza para la diferencia entre las medias
de dos poblaciones cuando se desconoce la desviación
típica de una población y ésta debe ser estimada a partir
de los datos de una muestra.
Para medias muestrales:
Si las varianzas
𝑦ത1 − 𝑦ത2 son iguales
𝑡𝑜 =
1 1
𝑆𝑃 +
𝑛1 𝑛2

𝑛1 − 1 𝑆12 + (𝑛2 − 1)𝑆22


𝑆𝑃2 =
𝑛1 + 𝑛2 − 2
Distribución “Ji 2- Chi 2- X2”

Sean Z1, Z2…,Zr, VA independientes distribuidas normalmente, cada una con media 0 y varianza 1; NID (0,1).

X2= 𝑍12 + 𝑍22 … . . +𝑍𝑟2

1 𝑟 0<x<∞
𝑓𝑋 2 𝑥 = 𝑟 𝑟 𝑥 2−1 𝑒 −𝑥/2
22 Γ( )
2 En otros casos
0
La X2 Toma todos los valores reales positivos.
Los GL= r = k = al número de VA independientes que se suman, o como en número de variables que
pueden variar libremente (r).
Son curvas asimétricas positivas, cuando r aumenta se aproxima a una normal 𝜇 = 𝐸 X2 = 𝑟
Se trata a la X2 como N(0,1) cuando r > 30

El símbolo x2α indica que el valor x2 tabulado tiene un área α a su derecha 𝜎 2 = 𝑉𝑎𝑟 X2 = 2r
P[X< x2α ]= α 0<α<1
Aplicaciones
La distribución χ² tiene muchas aplicaciones en
inferencia estadística. La más conocida es la de
la denominada prueba X2 utilizada como
prueba de independencia y como prueba de
bondad de ajuste y en la estimación de
varianzas. Pero también está involucrada en el
problema de estimar la media de una
población normalmente distribuida y en el
problema de estimar la pendiente de una
recta de regresión lineal, a través de su papel
en la distribución t de Student.
Aparece también en todos los problemas de
análisis de varianza por su relación con la
distribución F, que es la distribución del
cociente de dos variables aleatorias
independientes con distribución χ².
Propiedad Aditiva

𝑝
X2= 𝑋12 + 𝑋22 … . . +𝑋𝑝2 𝑟 = σ𝑖=1 𝑟𝑖

Distribución “F”

En muchas ocasiones estaremos interesados en comparar las varianzas de dos VA independientes


distribuidas normalmente, en este caso se recurre a la distribución F

Sea U y V dos VA independientes que tienen distribuciones Chi-cuadrado, con r1 y r2 GL respectivamente,


entonces:
𝑈/𝑟1
𝐹=
𝑉/𝑟2

- Muestras aleatorias e independientes se sacan de cada una de dos poblaciones normales.


- La variabilidad de las mediciones en las dos poblaciones es igual y puede ser medida por una varianza común,
σ2; esto es, σ12 = σ22 = σ2
0<x<∞
𝑟 + 𝑟2 𝑟1/2 𝑟2/2
Γ 1 𝑟1 ∗ 𝑟2 𝑧 (𝑟1/2) − 1
𝑓𝐹 𝑧 = 2
𝑟 𝑟 (𝑟1 + 𝑟2 )(𝑟1+𝑟2) /2
Γ( 1 )Γ( 2 )
2 2

0 En otros casos

r1= n-1 GL del numerador


r2= m-1 GL del denominador

𝑟2
𝜇𝐹 = 𝐸 𝐹 = 𝑟2 > 2
𝑟2 − 2

2 2𝑟22 (𝑟1 +𝑟2 −2) 𝑟2 > 4


𝜎𝐹 = 𝑉𝑎𝑟 𝐹 =
𝑟1 (𝑟2 −2)2 𝑟2 −4

P[F< fα ]= α
INFERENCIAS ACERCA DE LAS DIFERENCIAS DE MEDIAS, DISEÑOS ALEATORIZADOS.

Prueba de hipótesis

HIPOTESIS: Una suposición que el investigador o el gerente realiza sobre alguna


característica de la población que investiga

Las pruebas estadísticas de la hipótesis ,permiten calcular la probabilidad de observar


determinado resultado en caso de que la hipótesis formulada sea verdadera

Existen dos causas para que el valor hipotético y el resultado obtenido en la investigación
difieran, esta son:
a) La hipótesis es verdadera y la diferencia observada quizá se deba a un error de
muestreo
b) La hipótesis puede ser falsa y el valor verdadero es otro
Se plantean 2 maneras fundamentales

Hipótesis nula (Ho) o también llamada hipótesis de statu quo, es la que prueba
contra su complemento (Ha)
Hipótesis alterna (Ha), también llamada hipótesis de investigación o de interés

Es conveniente que las hipótesis Ho y Ha deben formularse de manera tal que no puedan
ser verdaderas al mismo tiempo.

Se trata de emplear la evidencia disponible para comprobar cual tiene mas probabilidad de
ser cierta
Para determinar si se va a rechazar o no la hipótesis nula, se requiere una regla de
decision o estandar. Los estadistas formulan las reglas de decisión de este tipo en terminos
o niveles de significado (α).

El nivel de significado es fundamental en el proceso de elegir entre la Ho y la Ha

El nivel de significado es la probabilidad que se considera demasiado baja (0,05- 0,10 o


0,1) para justificar la aceptacion de la hipoteis nula.

Ej.. Si se toma un α= 0,05, Esto significa que se rechazará si la prueba indica que la
probabilidad de que ocurra el resultado observado (es decir, la diferencia entre la media
de la muestra y el valor esperado) por probabilidad o por error de muestreo es inferior al
5%.

El rechazar la hipótesis nula, equivale a apoyar hipótesis alterna


Otros aspectos de las pruebas de hipotesis
Las pruebas de hipotesis estan expuestas a dos tipos de errores:
Error tipo I: Se da en los casos cuando el investigador rechaza la Ho cuando es verdadera
El investigador puede cometer este error porque las diferencias que observa entre los
valores de la muestra y de la poblacion se debe a un error de muestreo.
El Nivel alfa (α): es la probabilidad de cometer un error Tipo I.
1- α= Es la probabilidad de efectuar una decision correcta de no rechazar la Ho cuando es
verdadera
Error tipo II: Se da este caso cuando el investigador no rechaza la Ho cuando es falsa

A este error se llama Error Beta (β)

1- β = Refleja la probabilidad de decidir correctamente el rechazo de la Ho


Α +β ≠ 1: Los errores no son complementarios; el valor de β es muy difícil de calcular
El valor de α que se elija debe estar en función de la importancia relativa de los dos tipos de
errores

El valor β nunca se define de antemano, si este aumenta para minimizar el error tipo II, α
disminuye y viceversa para disminuir el error tipo I

Aceptar Ho o no poder rechazar Ho?


La diferencia entre ambas decisiones es importante, al probar la hipótesis se supone que Ho
es verdadera, hasta que se demuestra la posibilidad de que sea falsa.
Ejemplo
La fuerza de la tensión de la adhesión del mortero de cemento portland es una característica importante
del producto. Un ingeniero está interesado en comparar la fuerza de una formulación modificada en la que se
han agregado emulsiones de látex de polímeros durante el mezclado, con la fuerza del mortero sin modificar. El
experimentador ha reunido 10 observaciones de la fuerza de la formulación modificada y otras 10
observaciones de la formulación sin modificar. Los datos se muestran a continuación.
𝑌ത1 = 16,76 𝑘𝑔𝑓/𝑐𝑚2 𝑌ത2 = 17,92 𝑘𝑔𝑓/𝑐𝑚2

𝑆ሶ 21 = 0,100 𝑆ሶ 22 = 0,061

𝑆1ሶ = 0,316 𝑆2 = 0,247


𝑛1 = 10 𝑛2 = 10

Hipótesis
𝐻𝑂 : 𝜇1 = 𝜇2
𝐻𝑎 : 𝜇1 ≠ 𝜇2

α = 0,05 γ=GL= n1 + n2 -2 = 18

Se rechazaría si el valor numérico del


𝐻𝑂 : 𝜇1 = 𝜇2 estadístico to =2,101, o si to= -2.101
𝑛1 − 1 𝑆12 + (𝑛2 − 1)𝑆22 9 ∗ 0,100 + 9 ∗ 0,061
𝑆𝑃2 = = = 0,081
𝑛1 + 𝑛2 − 2 10 + 10 − 2

SP = 0,284

𝑦ത1 − 𝑦ത2 16,76 − 17,92


𝑡𝑜 = 𝑡𝑜 = = −9,13
𝑆 1 1 1 1
𝑃 +
𝑛1 𝑛2 𝑂, 284 ∗ +
10 10

To=-9,13 < -t0,025,18=-2,101


Se rechazaría Ho y se concluiría que las
fuerzas de tensión de adhesión promedio
de las dos formulaciones del mortero de
cemento portland son diferentes
El uso de valores P en la prueba de hipótesis

El valor P es la probabilidad de que el estadístico de la prueba asuma un valor que sea al


menos tan extremo como el valor observado del estadístico cuando la hipótesis nula Ho es
verdadera.

El valor P se define como el nivel de significación menor que llevaría a rechazar la hipótesis
nula Ho.

No siempre es sencillo calcular el valor P exacto de una prueba


Tiempo Tiempo más Tiempo
Ej.) Actividad optimista probable Pesimista Media Var
A 2 3 4 3,00 0,11
B 2 4 10 4,67 1,78
C 2 2 2 2,00 0,00
D 4 6 12 6,67 1,78
E 2 5 8 5,00 1,00
F 2 3 8 3,67 1,00
G 3 7 10 6,83 1,36
H 3 5 9 5,33 1,00
I 5 8 18 9,17 4,69
A-C-E-G-I

E(T)=3+2+5+6,83+9,17= 26 semanas (𝑡𝑝 − 𝑇𝑜)2


𝜎2 =
36
Var(T)=0,11+0+1+1,36+4,69=7,16

σ= 2,68
a) Cual es la probabilidad de que el proyecto pueda terminarse en menos de 22 semanas?
b) Cual es la probabilidad de que el proyecto requiera más de 28 semanas?
c) Encuentre el número de semanas que se requieren para terminar el proyecto con probabilidad de 0,90

𝑇 − 𝜇 22 − 𝜇 22 − 26
a) 𝑃 𝑡 < 22 = 𝑝 < = 𝑝[𝑍 < ] = 𝑝 𝑍 < −1,5 = 0,0668
𝜎 𝜎 2,68

𝑇 − 𝜇 28 − 𝜇 28 − 26
b) 𝑃 𝑡 > 28 = 𝑝 > = 𝑝[𝑍 > ] = 𝑝 𝑍 > 0,75 = 0,2266
𝜎 𝜎 2,68

𝑡−𝜇 𝑡−𝜇
c) 0,90 = 𝑃 𝑇 ≤ 𝑡 = 𝑝 𝑍 < 𝑍0,90 = 𝑡 = 𝜇 + 𝜎𝑍0,90 𝑡
𝜎 𝜎 = 26 + 2,68 ∗ 1,28

𝑡 = 29,43 semanas
Verificación de los supuestos de la prueba t

-Ambas muestras se toman de poblaciones independientes que pueden describirse con una
distribución normal, que las desviaciones estándar o varianzas de ambas poblaciones son
iguales y que las observaciones son variables aleatorias independientes.
Los supuestos de igualdad de las varianzas y la normalidad son fáciles de verificar utilizando
una gráfica de probabilidad normal.

Se ordenan de menor a mayor las observaciones de la muestra

Las observaciones se grafican con sus respectivas frecuencias acumuladas observadas (j-
0.5)/n.
La escala de la frecuencia acumulada se ha dispuesto de tal modo que si la distribución
hipotetizada describe de manera adecuada los datos, los puntos graficados estarán
aproximadamente sobre una línea recta los puntos graficados muestran una desviación
significativa de una recta, el modelo hipotetizado no es el apropiado.
25,75

84, 50
Cuando ocurren violaciones importantes de los supuestos, se afectara el desempeño de
la prueba t. En general, las violaciones de pequeñas a moderadas no son motivos de
preocupación particular, pero no se deberá ignorar cualquier falla del supuesto de
independencia, así como los indicios claros de que no se satisface el supuesto de
normalidad.

Una justificación alternativa de la prueba t

El uso de un diseño aleatorizado permite probar hipótesis sin ningún supuesto respecto
de la forma de distribución.

Si los tratamientos no tienen ningún efecto todas las formas posibles en que podrían
ocurrir las n observaciones son igualmente posibles.
ELECCIÓN DEL TAMAÑO DE LA MUESTRA

La elección del tamaño de la muestra y la probabilidad β del error de tipo II guardan una
estrecha relación.
La probabilidad del error tipo II depende de la verdadera diferencia en las medias δ.

Curva de operación característica Es la grafica de β contra δ

Para un valor dado de δ, el error β se reduce cuando el


tamaño de la muestra se incrementa

𝜇1 − 𝜇2 𝛿 Permite usar el mismo juego de


𝑑= = curvas independientemente del
2𝜎 2𝜎 valor de las varianza

Tamaño de muestra n*=2n-1


INTERVALOS DE CONFIANZA

Muchas veces es preferible proporcionar un intervalo dentro del cual cabría esperar que
estaría incluido el valor del parámetro o los parámetros en cuestión.

Por lo general el investigador esta más interesado en un intervalo de confianza para la


diferencia de las medias 𝜇1 − 𝜇2 .

1 1 1 1
𝑦1 − 𝑦ത2 − 𝑡𝛼,𝑛 𝑆𝑝 + ≤ 𝜇1 − 𝜇2 ≤ 𝑦1 − 𝑦ത2 + 𝑡𝛼,𝑛 𝑛 −2 𝑆𝑝 +
2 1+ 𝑛2 −2 𝑛1 𝑛2 2 1+ 2 𝑛1 𝑛2

Con un nivel de confianza de 100 (1-α)


1 1 1 1
16,76 − 19,92 − 2,101 ∗ 0,284 + ≤ 𝜇1 − 𝜇2 ≤ 16,76 − 19,92 + 2,101 ∗ 0,284 +
10 10 10 10

-1,16 - 0,27 ≤ 𝜇1 − 𝜇2 ≤ - 1,16 + 0,27

-1,43 ≤ 𝜇1 − 𝜇2 ≤ - 0,89
CASO EN QUE 𝝈𝟐𝟏 ≠ 𝝈𝟐𝟐
No hay bases para suponer que las varianzas
Hipótesis 𝜎1 𝑦 𝜎2 son iguales
𝐻𝑂 : 𝜇1 = 𝜇2 𝑦ത1 − 𝑦ത2
𝐻𝑎 : 𝜇1 ≠ 𝜇2 𝑡𝑜 =
𝑆1 𝑆2
+
𝑛1 𝑛2

Este estadístico no se distribuye exactamente como t. No obstante, t es una buena


aproximación de la distribución to si se usa:
𝑆21 𝑆22 2
+
𝑛1 𝑛2
𝑣= 2 2
2
𝑆1 𝑆 22

𝑛1 𝑛1
+
𝑛1 − 1 𝑛2 − 1
CASO EN QUE SE CONOCEN 𝝈𝟐𝟏 𝒚 𝝈𝟐𝟐
Pueden probarse usando el estadístico:
Hipótesis
𝐻𝑂 : 𝜇1 = 𝜇2 𝑦ത1 − 𝑦ത2
𝐻𝑎 : 𝜇1 ≠ 𝜇2 𝑍𝑜 =
𝜎21 𝜎22
+
𝑛1 𝑛2
Si las dos muestras son normales o los tamaños de muestras son suficientemente grandes
para aplicar el teorema del límite central, la distribución Zo es (N(0,1) si la hipótesis nula es
verdadera
Ho se rechazaría si [Zo] > Z (α/2) donde (α/2) es el punto porcentual de (α/2) superior de
la distribución normal estándar
𝜎21 𝜎22 𝜎21 𝜎22
𝑦1 − 𝑦ത2 − 𝑍𝛼 ( + ) ≤ 𝜇1 − 𝜇2 ≤ 𝑦1 − 𝑦ത2 + 𝑍𝛼 ( + )
2 𝑛1 𝑛2 2 𝑛1 𝑛2
COMPARACIÓN DE UNA SOLA MEDIA CON UN VALOR ESPECIFICADO

Hipótesis 𝐻𝑂 : 𝜇 = 𝜇𝑂 𝑦ത1 − 𝜇0
Pueden probarse usando 𝑍𝑜 =
𝐻𝑎 : 𝜇 ≠ 𝜇𝑂 el estadístico: 𝜎
𝑛
Si la población es normal con varianza conocida, o si la población no es normal pero el
tamaño de la muestras es suficientemente grande para aplicar el teorema del límite central,
la distribución es N(0,1) si la hipótesis nula es verdadera
Si Ho: 𝜇 = 𝜇𝑂 es verdadera entonces la distribución Zo es N(0,1) por lo tanto la regla de
decisión para Ho: 𝜇 = 𝜇𝑂 es rechazar la hipótenei nula si [Zo] > Z (α/2) valor de la media 𝜇𝑂
especificado en la hipótesis nula se determina generalmente mediante una de las tres
siguientes formas:
a) Puede ser resultado de evidencia, conocimientos o experimentación previos
b) Puede ser resultado de alguna teoría o modelo que describe la situación bajo
estudio
c) Puede ser resultado de especificaciones contractuales
𝜎 𝜎
𝑦ത − 𝑍𝛼 ∗ ≤ 𝜇 ≤ 𝑦ത + 𝑍𝛼 ∗
2 𝑛 2 𝑛

You might also like