Professional Documents
Culture Documents
Material GB Analizar
Material GB Analizar
Improve Medir
(Mejorar)
Analizar
Analizar
Y = f(X1,X2,X3,X4,X5…Xn)
Pasos de la etapa
Priorizar
Identificar Causas
causas
Analizar
datos
Ejemplo:
¿Las calificaciones de los alumnos tienen relación
con el método de enseñanza?
Hipótesis alternativa H1
Existe cambio, hay diferencia, algo H1: Las calificaciones de los
paso, si hay relación… alumnos SI tienen relación con
el método de enseñanza
Algunos son fáciles
Algunos no tan fáciles
Algunos muy difíciles
Imagina
• Eres el jurado Hipótesis nula
Hipótesis alternativa
que existe
una diferencia cuando en realidad no existe.
– β (beta): Muy útil para determinar que tan capaz es una prueba
Inocente
Culpable
Inocente Culpable
Paso 3:
Selección herramienta
Paso 4:
Dejar de rechazar o Rechazar Ho
• Rechazamos la hipótesis nula en favor de la
hipótesis alternativa. Si nosotros rechazamos
la hipótesis nula, decimos que nuestro
resultado es estadísticamente significante.
Valor de p - P(la diferencia observada se deba al azar) <= alfa, poco riesgo de
error. Podemos afirmar que algo realmente pasó.
– El valor de p se relaciona con la probabilidad (que tanto riesgo) que se tiene en
tomar una decisión equivocada. Sin importar la herramienta seleccionada, esta
regla siempre va a aplicar. La selección de la herramienta específica dependerá
principalmente de los tipos de datos analizados.
Valor P
Probabilidad que los
resultados observados
puedan ocurrir por
casualidad
debe irse
Intervalo de confianza
Es un Rango de valores probables para un parámetro poblacional
Valores Valores
improbables improbables
Nivel de confianza
– H0:
– Ha:
– H0:
– Ha:
– H0:
– Ha:
– H0:
– Ha:
Improve Medir
(Mejorar)
Analizar
Analizar
Normales No Normales
Desviación estándar
Conocida
Media hipotética
de la población
Se debe adaptar para comparar los
datos de la muestra contra la media
de la población hipotética
• La prueba z compara el
valor promedio con el de la
meta o hipotetico. Puede
utilizarsepara demostrar
una variación de la media
después de un cambio de
proceso.
Compara el promedio de la
distribución sencilla contra el
valor meta o hipotético. Puede
utilizarse para demostrar una
variación de la media después de
un cambio del proceso.
Desviación muestral
Distribución t
• •La distribución t de Student fue descubierta
por William S. Gosset en 1908.
• Gosset era un estadístico empleado por la
compañía cervecera Guiness, con quien tenía
un contrato que no podía usar sus nombres en
sus publicaciones.
• Él recurrió al Sobrenombre de “Student”
¿Qué es un valor t?
• Mide la diferencia entre un estadístico de muestra
observado y su parámetro de población hipotético
en unidades de error estándar.
Variables a analizar
Media a probar H0
Prueba t de student una muestra
Prueba t de student una muestra
Gráfico de valores individuales
Histograma
Valor p
Ejercicio
A manufacturer produces crankshafts for an automobile engine. The
wear of the crankshaft after 100,000 miles (0.0001 inch) is of interest
because it is likely to have an impact on warranty claims. The wear from
15 crankshaft that were selected at random follows: 3, 2.5, 2.8, 3.4, 2.9,
3.5, 2.7, 3.2, 3.8, 2.4, 2.5, 3.6, 3.1, 3.2, 2.9. It is known that σ=0.9. Test µ
= 3 (0.0001 inch). (Ver archivo crankshaft).
Ejercicio – Wait Time
Queremos conocer
si el tiempo de
espera de los
pacientes en el
Hospital South View
Health es igual a 10
min. (Ver archivo
Wait time).
Ejercicio
• Determinar la prueba de hipótesis según
corresponda a los siguientes datos:
• 11.3
• 12.8
• 11.9
• 12.2
• 11.5
• 11.9
• 12.6 • La media es diferente a 12.2
• 12.5 • La media es mayor a 11.8
• 11.6 • La media es menor de 12
• 11.7
• 12.7
• 11.9
• 12.3
Ejercicio
Un cliente cree que las lámparas que compró e instaló en su casa están
consumiendo gran cantidad de Watts, por lo tanto, incrementa el gasto
por concepto de energía eléctrica. La compañía proveedora envió una
muestra de 10 lámparas a probar y confirmar esta situación. Los Watts
consumidos por las lámparas fueron:
61.3
60.8
61.9 La especificación de las lámparas es 60
62.2 watts. ¿El cliente tiene razón?
61.5
60.7
59.9
60.9
61.8
62.0
Ejercicio
Un cliente cree que las lámparas que compró e instaló en su casa están
consumiendo gran cantidad de Watts, por lo tanto, incrementa el gasto
por concepto de energía eléctrica. La compañía proveedora envió una
muestra de 10 lámparas a probar y confirmar esta situación. Los Watts
consumidos por las lámparas fueron:
61.3
60.8
61.9 La especificación de las lámparas es 60
62.2 watts. ¿El cliente tiene razón?
61.5
60.7
59.9
60.9
61.8
62.0
Resumen de las pruebas
Probar que hay diferencia entre la media de una
muestra y un valor medio requerido (cuando la
distribución de la variable es normal y cuando no se
puede probar normalidad).
Objetivo: Analizar
las diferencias
entre la media
obtenida dos
Prueba de hipótesis
poblaciones a
través de dos
muestras 2 NIVELES*
independientes. Datos en cada niveles son:
Normales No Normales
Varianzas son: Varianzas son:
Iguales
Iguales Diferentes
Diferentes * Mann- Whitney
* Prueba t con varianzas * Mann- Whitney
* Prueba t con
* Prueba t con varianzas iguales (si n>25)
varianzas iguales diferentes
* Prueba t con varianzas
* ANOVA de una vía (si diferents (si n>25)
* ANOVA de una n>25) *Prueba Mood (Con
vía * Prueba Mood (Con ooutliers)
outliers)
*Muestras no pareadas
Prueba t 2 muestras
• Diferencias en los promedios de 2 diferentes
muestras.
• Ambas deben tener distribución normal
• La hipótesis nula es que los promedios de los
dos grupos son los mismos: Ho = μa = μb
• La hipótesis alternativa es que los promedios
son diferentes: Ha = μa ≠ μb
Ejercicio
Un departamento estatal de carreteras utiliza dos
marcas de pintura para pintar rayas en las
carreteras. Un funcionario de la autopista quiere
saber si la durabilidad de las dos marcas de pintura
son diferentes. Para cada pintura, el funcionario
registra el número de meses que la pintura persiste
en la carretera. (Ver Archivo Highway).
Normalidad
• Ruta: statbasic statistics2 variances
Si las 2 muestras se
encuentran apiladas en una
columna
Si las 2 muestras se
encuentran en diferentes
columnas
• Para el ejemplo
Las varianzas
son iguales
3.-Prueba de t 2 muestras
Ruta: statbasic statistics 2 sample t
Si las 2 muestras se
encuentran apiladas en una
columna
Si las 2 muestras se
encuentran en diferentes
columnas
Normales No Normales
Varianzas son: Varianzas son:
60
50
40
30
20
10
1
70 72 74 76 78 80
Method I
60
50
40
30
20
10
1
70 72 74 76 78 80 82
Method II
60
50
40
30
20
10
1
73 74 75 76 77 78 79 80 81 82
Method III
Method III
Intervalos de confianza
de las medias de cada
método
Prueba de hipótesis
78
78
77
77
Datos
Datos
76
76
75
75
74
74
73
Method I Method II Method III
Method I Method II Method III
La desviación estándar agrupada se utilizó para calcular los intervalos.
Method II - Method I
0 1 2 3 4 5
Normales No Normales
Colocar Variables
Valor objetivo
Lo que se va a
probar
Objetivo: Analizar
las diferencias
entre la media
obtenida dos
Prueba de hipótesis
poblaciones a
través de dos
muestras 2 NIVELES*
independientes. Datos en cada niveles son:
Normales No Normales
Varianzas son: Varianzas son:
Iguales
Iguales Diferentes
Diferentes * Mann- Whitney
* Prueba t con varianzas * Mann- Whitney
* Prueba t con
* Prueba t con varianzas iguales (si n>25)
varianzas iguales diferentes
* Prueba t con varianzas
* ANOVA de una vía (si diferents (si n>25)
* ANOVA de una n>25) *Prueba Mood (Con
vía * Prueba Mood (Con ooutliers)
outliers)
*Muestras no pareadas
Prueba Mann Whitney
Prueba de Mood
Prueba de hipotesis
3 NIVELES
Datos en los niveles son:
Normales No Normales
Varianzas son: Varianzas son:
Improve Medir
(Mejorar)
Analizar
Analizar
Niveles
2 3
1
1 prueba de proporciones
Para comparar una 2 Prueba de proporciones
Ji – cuadrada
proporción vs un target Comparación de 2 Para comparar 3 o más
especifico o proporción proporciones uno vs el otro
histórica
Comparación de proporciones de
dos poblaciones
Esta prueba se basa en las proporciones de la muestra del
evento, y utiliza datos de atributos binarios como:
• '0 ó 1',
• "Éxito o fracaso"
• "Defectuoso o no defectuoso",
• "Ocurrencia o no ocurrencia
120
Planteamiento de hipótesis
100
H0= la satisfacción no tiene diferencia
21 entre región y región (A y B)
80
8
H1:= la satisfacción del cliente es
60 satisfied diferente entre región y región (A y B)
unsatisfied
40
72 79
Nivel α = 0.05
20
0
Area A Area B
RutaMinitab: stat> Basic statistics>2 proportions
El valor de P = 0.037, el
valor es bajo (P<0.05)
H0 se rechaza
Niveles
2 3
1
1 prueba de proporciones
Para comparar una 2 Prueba de proporciones
Ji – cuadrada
proporción vs un target Comparación de 2 Para comparar 3 o más
especifico o proporción proporciones uno vs el otro
histórica
Prueba Ji cuadrada
A B C
Hombres 37 49 72
Mujeres 7 50 31
Ejercicio
Con base en la información presentada en la
parte de abajo, decide si la salida de un
procedimiento quirúrgico depende del hospital
usado. (Ver archivo Hospital).
Controlar Definir
Improve Medir
(Mejorar)
Analizar
Analizar
Y = a + bX
Donde
Y = variable depediente
a = intercepción en Y ( constante o baseline, da el valor de Y
cuando X = 0),
b = coeficiente de regresión (pendiente)
X = variable independiente
El coeficiente determinación da la
proporción de variación de la
variable Y que es explicada por la
variable X.
Decisión
• 𝑟 2 Mide la proporción de variación que es
explicada por el modelo, por la ecuación de
regresión.
Ruta:
Stat>Regression>Fited Line Plot
pemedin@utp.edu.co