www.monografias.

com
MINITAB
Manual de Entrenamiento
Estadísticas Básicas
Manual del usuario
Minitab TM - Making Data Analysis Easier - Version 1
1! E"em#los y e"ercicios
$! %rueba T y %ruebas de %ro#orci&n
! 'egresi&n
(! 'egresi&n sim#le
)! 'egresi&n #olinomial
*! 'egresi&n m+lti#le
,! 'egresiones de los me"ores subcon"untos
-! El análisis de .ariaci&n
/! Análisis de la media
10! Balance AN1VA
E"em#los y e"ercicios
1b"eti.os
%rueba de 2i#&tesis
1b"eti.os
• %rueba de la 3i#&tesis nula utili4ando t-test e inter.alos de con5ian4a!
• E.aluaci&n del %o6er de la #rueba de 3i#&tesis utili4ando el análisis del %o6er!
1
%rueba de 2i#&tesis
E"em#lo 1 7lenado 8a"as de cereal
El propósito de este ejemplo es de introducir los conceptos de la prueba de hipótesis. Tu usaras un one-sample t-test para analizar
datos procesados para determinar sí el proceso esta en el objetivo.
%roblema
El objetivo. Tu quieres determinar sí el proceso esta en el objetivo
'ecolecci&n de datos
Para evaluar el proceso de la media. Elegirs ! cajas de cereal al azar" las pesaras" # usaras los datos de ejemplo para estimar la
media de la población.
2erramientas
9tat: Estadísticas básicas:1-9am#le t
Data set
$E%E&'().*P+
%rueba de 3i#&tesis
;<u= es una #rueba de 3i#&tesis>
,na prueba de hipótesis usa datos de ejemplo para probar una hipótesis acerca de la población de cual el ejemplo es tomado. El one-
sample t-test es uno de los muchos procedimientos disponibles para la prueba de una hipótesis en *-.-T&(.
Por ejemplo" suponga que quiere probar la medida de las ruedas del pistón es igual a la longitud deseada del objetivo. ,sted medir
un numero de ruedas # usara la medida de esas ruedas de ejemplo para estimar la medida de la rueda de la población. Este es un
ejemplo de stastistical inference" usando información acerca de un ejemplo para hacer una inferencia acerca de una población.
;8uándo usar una #rueba de 3i#&tesis>
,sa una prueba de hipótesis cuando tengas datos de ejemplo # quieras hacer inferencias acerca de una o ms poblaciones.
;%or ?u= usar una #rueba de 3i#&tesis>
'a prueba de hipótesis puede a#udar a contestar preguntas como/
• 0Esta el proceso correctamente centrado1
• 0Es el producto de un proveedor mejor que el producto de otro1
• 02a# diferencias entre el tratamiento de los grupos # los e3perimentos1
Por ejemplo"
• 0 Es tu surtido de tu papel en media de 4.5 pulgadas de ancho1
• 0'a gasolina del proveedor es de mejor octanaje que la del proveedor (1
• 0El cliente prefiere una formulación de una bebida sobre otra1
%robando la 3i#&tesis nula
.ecesitas determinar si la media de un proceso de empaque difiere significativamente del peso correcto que es 6!5 gramos. En
T7rminos estadísticos" el proceso de la media es tambi7n llamado la población de la media.
2i#&tesis de estadística
2a# 8 posibilidades" 9 es igual a 6!5 o no lo es. Estas alternativas pueden ser usadas como 8 hipótesis/
• 'a hipótesis nula :2;</ 9 es igual a .6!5 gramos
• 'a hipótesis alternativa:2=</ 9 no es igual a 65 gramos
2
Por que no puedes medir cada caja en la población" nunca podrs saber con e3actitud cual hipótesis es correcta. >in embargo una
prueba de hipótesis apropiada pueda a#udarte a hacer un clculo formal. Para estos datos la prueba apropiada es la one-sample t-test
1- 9am#le t
1!- &bre el pro#ecto $E%E&'().*P+.
$!- Escoge 9TAT ? Basic 9tatistics ? 1-9am#le t!
!- $omplete el recuadro como se indica a continuación/
(.- $lic@ 1@!
Inter#retando tus resultados
7a l&gica de la #rueba de 3i#&tesis
Todas las pruebas de hipótesis siguen los mismos pasos/
• &sumir que 2; es verdadera.
• Aeterminar que tan diferente es tu muestra de lo que esperas dado que 2; es verdad.
• >i tu muestra es diferente dado que 2; es verdad" entonces descarta 2;.
Por ejemplo" los resultados de t-test indican que la muestra es 6!!.B;C. Ae esta manera el e3amen contestara la pregunta" D>i 9 es
igual a 6!5" como obtendrs una muestra de 6!!.B;C:o ma#or<. 'a respuesta es dada como una probabilidad que vale :P<" que para
esta prueba es igual a ;.=C6.
Tomando una decisi&n
Para tomar una decisión" necesitas Escoger el nivel de importancia" E :alpha<" antes de la prueba/
• >i P es menor o igual a E" rechazas 2; .
• >i P es ma#or que E" si fallas al rechazar 2; :T7cnicamente" nunca aceptas 2; " simplemente fallas al rechazarlo<.
3
,n valor típico para E es ;.;5" pero valores ma#ores o menores puedes ser escogidos dependiendo de la e3actitud requerida para la
prueba. &sumiendo que escojas un E-.ivel de ;.;5 para los datos del peso de la caja no tendrs suficiente evidencia para rechazar
2;. P:;.=C6< es ma#or que E.
1ne-9am#le TA BoB6eig3
Test of mu F 6!5 vs not F 6!5
Gariable . *ean >tAev >E *ean H5I $- T P
(o3Jeigh ! 6!!.B;C 8.C;6 ;.H4= :6!C.=46" 6!H.88!< =.BC ;.=C6
8onsideraciones 5inales
8onclusiones #rácticas
(asado en tus datos de muestra" no puedes rechazar la hipótesis nula al ;.;5 nivel E. .o ha# suficiente evidencia para sugerir que los
pesos completos son diferentes a .6!5 gramos.
8onsideraciones de estadística
$uando es conducida una prueba de hipótesis" siempre empiezas con dos hipótesis contrarias/
'a hipótesis nula:2;</
• .ormalmente dice que si una propiedad de una población :tal como la media< no es diferente de un valor especifico o de otra
población.
• Es asumido que es verdad hasta que tengas suficiente evidencia de lo contrario.
• .unca es aceptado--- simplemente fallas al rechazarlo.
'a hipótesis alternativa:2=</
• Aice que la hipótesis nula esta equivocada.
• Tambi7n especifica la dirección de la diferencia.
$ada prueba de hipótesis esta basada en una o ms suposiciones acerca de los datos que estn analizando. >i esas suposiciones no
son conocidas" los resultados puede que no sean precisos. 'as suposiciones de cada prueba sern e3ploradas cuando cada prueba
sea discutida.
El Power de una prueba de estadística es la probabilidad de rechazar correctamente la hipótesis nula. 'a tabla de abajo muestra los C
posibles resultados de la prueba de hipótesis.
2i#&tesis nula
Decisi&n Gerdadero Kalso
Kalla al rechazar
%echazar
El nivel E debe ser escogido antes de conducir la prueba/
• -ncrementando E incrementas tus posibilidades de detectar una diferencia :# tu Power< pero tambi7n incrementas la
posibilidad de rechazar 2; cuando es verdad :error tipo -<.
• Aisminu#endo E disminu#es tus posibilidades de cometer el error tipo -" pero tambi7n disminu#es el poder de la prueba.
Inter.alos de con5ian4a
E"em#lo $ #eso de la ca"a de cereal
%roblema
Aecisión correcta
pF=-E
Error tipo --
p F (
Error tipo -
p F E
Aecisión correcta
p F =- E
:Power<
4
%ecuerde que esta tratando de confirmar que el embalaje del cereal est7 en un objetivo. El objetivo del peso es de 6!5 gramos #
necesitas asegurarte que el proceso de la media est7 dentro de 8.5 gramos que es el objetivo.
'ecolecci&n de datos
>eis cajas de cereal fueron elegidas al azar # pesadas.
2erramientas
9tat : Basic statistics : 1-sam#le t
9et de Datos
$E%E&'().*P+
Inter.alos de con5ian4a
;<ue es un inter.alo de con5ian4a>
,n intervalo de confianza es un rango de posibles valores para un perímetro de una población :tal como 9< que esta basada en un
dato de muestra. Por ejemplo" mu# seguido usaras una muestra para calcular 9. ,n intervalo confidencial te dir que tan lejos esperes
ese clculo.
;8uándo usar el inter.alo de con5ian4a>
,sa un intervalo de confianza para hacer inferencias de una o ms poblaciones de muestra de datos.
;%or ?ue usar inter.alos de con5ian4a>
'os intervalos de confianza te pueden a#udar a contestar muchas de las mismas preguntas de la prueba de hipótesis/
• 0Lue tan grande podría ser 91
• 0Lu7 tan grande podría ser la desviación estndar de la población1
• 0Podría 9 ser un valor cierto1
Por ejemplo"
• Es posible que la longitud de la media de los lpices sea ma#or a 5.B5 pulgadas1
• Podría M para la longitud de los lpices ser tan alto como ;.85 pulgadas1
Csando el inter.alo de con5ian4a
En el ejemplo anterior" usamos una prueba de hipótesis para determinar si la media de tu proceso fuera diferente al valor del objetivo.
Tambi7n puedes usar un intervalo de confianza para evaluar 7sta diferencia.
Esta >esión window resulta para =-sample t inclu#e valores para los fines ma#or # menores del H5I del intervalo de confianza.
Nbtiene una grafica representativa del intervalo al seleccionar (o3plot en Oraphs subdialog bo3.
=-9am#le t
1!- Escoge 9tat : Basic 9tatistics : 1-9am#le tD or #ress $trl P E.
$!- $lic@ Era#3s
!- $ompleta el recuadro como se indica a continuación/
5
(!- $li@ 1@ en cada recuadro.
Inter#retando tus resultados
Inter.alo de con5ian4a
El intervalo de confianza es un rango de posibles valores para 9. Esta mostrado grficamente como una línea roja # dos escuadras
cuadradas debajo del bo3plot.
Es un intervalo de confianza de H5I por que tomamos =;; muestras de la misma población" los intervalos de H5 de las muestras
incluir a 9. Por lo tanto para cualquier ejemplo que pueda ser H5I seguro que la 9 est dentro del intervalo de confianza.
%rueba de 3i#&tesis
El punto rojo de la ) representa la media de la muestra # el punto azul de 2; representa la prueba de la media :6!5<. Puedes usar el
intervalo de confianza para probar la hipótesis nula/
• >i 2; est fuera del intervalo" la p-value para la prueba de hipótesis tambi7n ser menor que ;.;5. Puedes rechazar la
hipótesis nula en EQlevel ;.;5.
• >i 2; esta adentro del intervalo" la p-value ser ma#or que ;.;5. .o podrs rechazar la hipótesis nula en E-level ;.;5.
Por que 2; cae adentro del intervalo de confianza no puedes rechazar la hipótesis nula. .o ha# suficiente evidencia para concluir que
9 no es 6!5 gramos" en el ;.;5 nivel significante.
6
8onsideraciones 5inales
8onclusiones #rácticas
El intervalo de confianza de H5I :como el t-test< no provee suficiente evidencia para rechazar la hipótesis nula que la población de la
media para el peso de las cajas de cereal sea de 6!5 gramos.
8onsideraciones de Estadística
El intervalo de confianza provee un posible rango para
valores de 9:u otros parmetros de población<.
En muchos casos" no puedes conducir un prueba de hipótesis usando un intervalo de confianza. Por ejemplo" si el valor de la prueba
no es entre un H5I de un intervalo de confianza" puedes rechazar 2; en el nivel E ;.;5. >in embargo si tu estructuras un HHI de
intervalo de confianza # no tiene una prueba de la media" puedes rechazar 2; en el nivel E ;.;=.
Inter.alos de con5ian4a
E"em#lo Entendiendo los inter.alos de con5ian4a
%roblema
Este ejemplo E3plora el concepto de las intervalos de confianza. >imularas la recolección de muestras al azar para una población
normal usando *-.-T&(Rs generador de nSmeros al azar.
'ecolecci&n de Datos
Tu debes generar =; columnas de datos al azar
2erramientas
8alc : 'andom data : Normal!
9tat : basic 9tatistics : Dis#lay Descri#ti.e 9tatistics!
Data set
.inguno
Eenerando datos normales al a4ar
,sando un generado de datos al azar" puedes simular la recolección de datos al azar de una población con una media dada. :Esto es
una situación en la cual de hecho puedes saber el valor de 9.<
7
,sando el generador de datos al azar para simular la colección de =; muestras de una población con una media:9< de =; # de una
desviación estndar de =. >e generan 8; observaciones para cada muestra.
Normal
1! - Escoge File : Ne6
$! - >elecciona *-.-T&( Project.
! - $lic@ NT.
(! - Escoge 8alc : 'andom Data : Normal!
)!- $ompleta el recuadro como se indica a continuación/
*!- $lic@ 1@ en cada recuadro.
8alculando inter.alos de 8on5ian4a del /0G
,sa Aispla# Aescriptive >tatistics para calcular intervalos de confianza del H;I para cada muestra. Por definición" H de cada =;
intervalos deben contiener la 9. Aesde que sabes que la 9 representa muestras que son iguales a =;" puedes verificar esto
directamente.
En contraste a los intervalos de confianza del H5I" los de H;I son ms angostos: esto es que inclu#en menos valores<. Porque
estos contiene menos valores" es menos probable que contengan la 9.
Para probar la hipótesis nula que la 9 no es igual a un valor dado" un intervalo de confianza de H;I corresponde a un .=;. nivel de E.
Dis#lay Descri#ti.e 9tatistics
1!- Escoge 9tat : Basic 9tatistics : Era#3ical 9ummary!
$!- En Variables" enter C1-C10.
!- $ompleta el 8on5idence le.el como se muestra/
8
(!- $li@ 1k!
Inter#retando tus resultados
/0G de Inter.alo de con5ian4a #ara Mu HIJ
Toma un momento para repasar los intervalos de confianza para cada uno de tus muestras" 'as opciones seria que uno de tus
intervalos no va a contener 9:=;<.
Es posible que todos tus intervalos contengan 9. Tambi7n es posible que ninguno lo tenga :aunque es e3tremadamente inusual<. >in
embargo" si repites el ejercicio de la generación de muestras al azar # calculando el intervalo de confianza del H;I" encontraras ese
apro3imado H;I de los intervalos que contiene 9.
'esultados 3i#ot=ticos
,n ejemplo de un intervalo de confianza de H;I que no contenga 9 es proveído por derecho. El intervalo se e3tiende de =;.;8B5 a
=;.B4HC.
Aate cuenta que este ejemplo en particular te llevar a un rechazo incorrecto de la hipótesis nula que 9 es igual a =; :asumiendo que
escojas el nivel E de ;.=;<.
Inter.alo de con5ian4a de /0G #ara sigma
Aate cuanta que la suma grfica tambi7n inclu#e a un intervalo de confianza de H;I para M :la desviación estndar de la población<.
El intervalo tiene en rango de ;.B448 a =.65;=. >i repites este procedimiento para un numero largo de muestras" cerca de H de =;
intervalos incluir el valor para M.
Estadísticas Descri#ti.as
9
8onsideraciones 5inales
8onclusiones #rácticas
Es probable que = de =; intervalos de confianza de H;I que calcules no contengan 9. >i este procedimiento fuera repetido para un
nSmero largo de muestras" cada =;I de todos los intervalos confidenciales de H;I no tendrn 9.
8onsideraciones de estadística
Este intervalo de confianza provee un rango de valores para 9:ó los parmetros de la población<.
En promedio" el H;I de los intervalos de confianza de H;I calculados para muestras al azar tomado de una distribución normal de
poblaciones incluir a 9.
%o6er
E"em#lo ( E.aluando el %o6er
E"ercicio
.o estas seguro que confías en el resultado del anlisis del llenado del peso :pgina =-!<. Gas a conducir el anlisis del Power para
determinar si recolectaste suficientes datos
Luieres asegurarte que el llenado de las cajas no difiera del objetivo del peso de 6!5 gramos no ms de 8.5 gramos.
'ecolecci&n de datos
Gas a basar el anlisis del Power en los resultados del t-test del ejemplo =.
2erramientas
9tat: %o6er and 9am#le 9i4e: 1-9am#le t
Data set
.inguno
Análisis del %o6er
;<ue es un análisis del %o6er>
Power es la habilidad de una prueba para detectar un efecto cuando e3iste. $uando conduces una prueba de hipótesis" ha# C posibles
resultados/
2i#&tesis nula
Aecisión correcta
p F=-E
Error tipo --
p F U
Error tipo -
p F E
Decisi&n correcta
# K 1- L
H%o6erJ
10
Aecisión Gerdadero Kalso
Kalla al rechazar
%echazar
El Power de la prueba es la probabilidad que rechazara la hipótesis nula correctamente" dado que la hipótesis nula es falsa. Puedes
usar un anlisis Power para determinar cuanto poder tiene esta prueba" o a#udar a designar una nueva prueba para que tenga el
poder adecuado.
8uando usar un análisis del %o6er
,sa un anlisis del Power cuando estas diseVando un e3perimento o despu7s de conducir una hipótesis nula. .o se requieren datos.
.ecesitaras estimar M :e3cepto por las pruebas de proporción<.
;%or ?u= usar un análisis del %o6er>
El anlisis del Power te puede a#udar a responder preguntas como/
• 0Es tu muestra lo suficiente grande1
• 0Lu7 diferencia puedes detectar con tu prueba1
• 0Aeberías confiar en los resultados insignificantes de la prueba 1
Por ejemplo"
• 0$untas muestras necesitas recolectar para determinar si el papel de proveedor es ms delgado que el de otro por ;.;;=5
pulgadas1
• 0Lu7 tan grande es la diferencia que puedes detectar entre la resistencia de una viga de acero # un historial de la media si
reSnes 4 muestras1
• 0Puedes confiar en los resultados de una prueba t-test que indica la resistencia de 8 fórmulas de pegamento que no tienen
diferencia1
Determinando el %o6er
Tu meta es determinar que tan ciertos son los resultados del anlisis del llenado de las cajas de cereal :pagina=-!<
Valores
>i especificas valores para cualquiera de los 8 parmetros de la prueba" *-.-T&( calcular el parmetro restante/
• >ample size----- el nSmero de observaciones en la muestra
• Aifferences----- un significado cambio en el alejamiento del objetivo que estas interesado en detectar con alta probabilidad.
• Power values----- el poder :probabilidad de rechazar 2; cuando es falso< que te gustaría que tuviera la prueba.
9igma
Porque el poder de una prueba es parcialmente determinada por la variabilidad en los datos" debes proveer un estimado para M . ,sa
un estimado del historial o la desviación estndar de la muestra.
1- 9am#le t
1!- Escoge 9tat : %o6er and 9am#le 9i4e : 1-9am#le t!
$!- $ompleta el recuadro como se indica a continuación/
11
!- $lic@ 1@!
Inter#retando tus resultados
$on ! observaciones" una desviación estndar de 8.;C6 # un E de ;.;5" el Power solo es de .56B!. Esto significa que 9 esta fuera del
objetivo por 8.5 gramos" solo tienes un 56.B!I de oportunidad para detectarlo.
Ae otra manera" ha# un C!.8CI de probabilidad que falles al rechazar 2; e incorrectamente conclu#e que el proceso est en el
objetivo.
;<u= sigue>
Ae manera que incrementes tu probabilidad de detectar un cambio si e3iste" es incrementar el tamaVo de la muestra. Aeterminar 7l
numero de observaciones requeridas para lograr el Power adecuado.
%o6er and 9am#le 9i4e
=->ample t Test
Testing mean F null :versus not F null<
$alculating power for mean F null P difference
&lpha F ;.;5 &ssumed standard deviation F 8.C;6
Determinando el %o6er
$on ! observaciones el Power de tu prueba fue solo de ;.56B!. Para tener mejores posibilidades de detectar un efecto si es que
e3iste" debers incrementar el poder de tu prueba" que por lo menos sea de ;.4; :como regla general<.
$alcular el tamaVo de la muestra requerida para llegar los niveles de Power de ;.4;" ;.45" ;.H5" # ;.H5.
1-9am#le t
1!- Escoge 9tat : %o6er and 9am#le 9i4e : 1-9am#le t!
$!- $ompleta el recuadro como se indica a continuación/
12
.- $lic 1@!
Inter#retando tus resultados
Para tener un Power de al menos ;.4; :objetivo del Power< para detectar una diferencia de 8.5 gramos al nivel E de ;.;5" necesitaras
una muestra de tamaVo =;.
Porque el tamaVo de las muestras debe ser siempre un numero entero. El Power actual de la prueba con =; observaciones :;.468B<
es escasamente ma#or que el objetivo Power.
Nbservaciones adicionales que dan mas Power/
• $on == observaciones" el Power es de ;.4B6H.
• $on =8 observaciones" el Power es de ;.H;54.
• $on =5 observaciones" el Power es de ;.H!85.
&l duplicar el tamaVo de la muestra de ! a =8 cajas" incrementas tus posibilidades de detectar una diferencia de 8.5 gramos :sí es que
e3iste< de 56.B!I a H;.54I.
Tal ves no quieran incrementar tu Power demasiado. >i tu Power es demasiado alto" podrías empezar a detectar cambios que son
demasiado pequeVos para ser parcialmente importantes.
%o6er and 9am#le 9i4e
=->ample t Test
Testing mean F null :versus not F null<
$alculating power for mean F null P difference
&lpha F ;.;5 &ssumed standard deviation F 8.C;6
13
%o6er
E"em#lo ) incrementando %o6er
E"ercicio
El resultado del anlisis de tu Power sugiere que necesitas una muestra ms grande para evaluar tu proceso. $on solo !
observaciones" había mu# poco Power para detectar un diferencia de 8.5 gramos
'ecolecci&n de datos
=8 cajas de cereal son recolectadas al azar # pesadas
2erramientas
9tat: Basic statistic: 1-sam#le t
Data set
$E%E&'().*P+
.ombre Tipo de dato Tipo de variable
(o3Jeigh .um7rico %espuesta
%robando la 3i#&tesis nula
&naliza la nueva muestra para determinar si el proceso de la media es diferente a 6!5 gramos.
1-9am#le t
1!- &bre el pro#ecto $E%E&'().*P+.
$!- Escoge 9tat: Basic 9tatistics: 1-9am#le t
!- $ompleta el recuadro como se indica a continuación/
(!- 2az clic en Era#3s!
)!- $heca BoB#lot o5 data!
*!- $lic@ 1@ en cada recuadro.
14
Inter#retando tus resultados
El t-test indica que la diferencia entre el proceso de la media # el objetivo de 6!5 gramos es significante en el nivel E ;.;5
• El p-value :;.;=H< es menos que E :;.;5<.
• El intervalo de confianza de H5I no inclu#e el valor del objetivo.
&parece que las cajas de cereal estn siendo sobre llenadas. >e deben tomar acciones correctivas para ajustar el proceso.
1ne-9am#le TA More1bs
Test of mu F 6!5 vs not F 6!5
Gariable . *ean >tAev >E *ean H5I $- T P
*oreNbs =8 6!!.!6! 8.;!; ;.5H5 :6!5.68B" 6!B.HC5< 8.B5 ;.;=H
Inter#retando tus resultados
El bo3plot ilustra lo que encontró la prueba/
• El valor del objetivo:2;< esta afuera del intervalo de confianza.
• 'a muestra de la media :)< es ma#or que el valor del objetivo.
8onclusi&n
'a diferencia entre el proceso de la media # el valor del objetivo de 6!5 gramos es significante en el nivel E es de ;.;5.
8onsideraciones 5inales
8onclusiones #rácticas
Es probable que tu primera prueba del llenado de las cajas de cereal no sea significante porque tu Power era demasiado bajo. (asado
en el numero de observaciones :!<" la diferencia que quieres detectar :8.5<" # la variabilidad en los datos" la prueba tuvo un Power de
solo ;.56B!.
,sando una muestra grande te da mas Power" habilitndote para detectar la diferencia.
8onsideraciones estadísticas
Para asegurar que tu prueba tenga suficiente Power" es una buena idea el conducir un anlisis power para recolectar datos.
'as maneras de incrementar el Power de una prueba inclu#e/
• -ncrementar el tamaVo de la muestra.
15
• Aisminuir la variabilidad que no esta atribuida al efecto de inter7s.
• -ncrementar E :aunque esto tambi7n te llevara a incrementar un error del tipo -<.
*a#or Power significa una ma#or probabilidad de detectar los errores. >in embargo tambi7n incrementa la probabilidad de detectar
errores pequeVos que puede que no sean de inter7s. El proceso del conocimiento a#uda a determinar el nivel optimo del Power en
una prueba.
E"ercicio )!1 Detectando #osibilidades en el diámetro de un balero
E"ercicio
,na parte del (alero manufacturado est fuera de especificaciones ;.;5 cm de lo correcto. ,n cambio de ;.;=cm es considerado lo
suficientemente importante para permitir el ajuste al equipo.
'a desviación estndar de los dimetros es casi siempre de ;.;;C cm.
'ecolecci&n de datos
.inguno
Instrucciones
= ,se 9tat : %o6er and sam#le si4e : 1-sam#le t para calcular el tamaVo de la muestra necesitaras detectar una diferencia
de ;.;=cm con el Power de ;.45 en un nivel E de ;.;5
8 $alcular las diferencias puedes detectarlas con un power de ;.H; cuando recolectes 5 # =; observaciones.
Data set
.inguno
%o6er and 9am#le 9i4e
=->ample t Test
Testing mean F null :versus not F null<
$alculating power for mean F null P difference
&lpha F ;.;5 &ssumed standard deviation F ;.;5
%o6er and 9am#le 9i4e
=->ample t Test
Testing mean F null :versus not F null<
$alculating power for mean F null P difference
&lpha F ;.;5 &ssumed standard deviation F ;.;5
>ample
>ize Power Aifference
5 ;.H ;.;H48HCC
%o6er and 9am#le 9i4e
=->ample t Test
Testing mean F null :versus not F null<
$alculating power for mean F null P difference
&lpha F ;.;5 &ssumed standard deviation F ;.;5
>ample
>ize Power Aifference
=; ;.H ;.;5BB848
16
%'CEBA T M %'CEBA9 DE %'1%1'8INN
1b"eti.os
• E.aluar la di5erencia entre la media del #roceso y un .alor de un ob"eti.o usando un 1ne-9am#le t-test!
• E.aluar la di5erencia entre $ muestras de la media usando en T6o-9am#le t-test!
• E.aluar las di5erencias entre $ obser.aciones usando un %aired t-test!
• E.aluar la di5erencia entre una #ro#orci&n y un .alor de un ob"eti.o usando una #rueba de una #ro#orci&n!
8ontenidos
1ne-9am#le t-Test
E"em#lo 1 %roblema del Eran <ueso
E"ercicio
Tu compaVía" El Oran Lueso" -nc." sospecha que uno de tus proveedores de leche le esta aVadiendo agua a su leche para
incrementar sus beneficios. &Vadir agua a la leche incrementa su punto de congelación" que normalmente es de Q;.5C5W $.
'ecolecci&n de datos
El punto de congelación es medido para =; muestras al azar de la leche del proveedor.
2erramientas
9tat: Basic 9tatistics: Normality Test!
9tat: Basic 9tatistics: 1-9am#le t!
Data set
$2EE>E.*P+
17
1ne-9am#le TA Fr4Tem#
Gariable . *ean >tAev >E *ean H5I $-
KrzTemp =; -;.56H6!4 ;.;;BBHH ;.;;8C!! :-;.5CCHCB" -;.566BH;<
1ne-sam#le t-test
;<u= es un 1ne-9am#le t-test>
,n Nne->ample t-test te a#uda a determinar si 9 :la población de la media< es igual a un valor d una hipótesis :la prueba de la media<.
'a prueba utiliza desviaciones estndar de una muestra para estimar M :la desviación estndar de la población<. >i la diferencia entre
la muestra de la media # la prueba de la media es grande relativamente a la variabilidad en la muestra" entonces 9 es improbable que
sea igual a la prueba de la media.
;8uándo usar un one-sam#le t-test>
,sa un one-sample t-test cuando tienes datos continuos de una sola muestra al azar.
'a prueba asume que la población esta distribuida normalmente. >in embargo es mu# justo a las violaciones de esta suposición"
proveídas las observaciones son recolectadas al azar # los datos son continuos # racionalmente sim7tricos. (ver Box, Hunter & Hunter
(1978). Statistics for xperi!enters, "o#n $ile% & Sons, &nc.).
;%or ?u= usar un one-sam#le t-test>
,n one-sample t-test te puede a#udar a responder preguntas tales como/
• 0Esta el proceso en el objetivo1
• 0El producto de tu proveedor cumple con tu criterio1
Por ejemplo"
• Es el ancho de la media de las navajas ma#or o menor que el objetivo1
• Es la resistencia de la media de los tornillos de tu proveedor menor de lo requerido1
Euías al Escoger las 2erramientas de Estadística
Ti#o de Variable de 'es#uesta
18
%robando la su#osici&n de una normalidad
'a prueba de Estadística apropiada para los datos de la temperatura congelante es un one-sample t-test. Esta prueba asume que la
población esta normalmente distribuida.
,sa una prueba de normalidad para determinar si la suposición de la normalidad es valida para esos datos.
%rueba de normalidad
1! &bre el pro#ecto $2EE>E.*P+
$! Elige 9tat: Basic statistics: Normality Test
! $ompleta el recuadro como se indica a continuación/
19
Nne->ample t-Test
$orrelación :dos
respuestas<
1 %'EDI8T1'
%egresión >imple
: 1 %'EDI8T1'
*Sltiple regresión
%espuesta >urface
1 %'EDI8T1'
Twp->ample t-Test
Nne-Ja# ?.NG&
: 1 %'EDI8T1'
*Sltiple %egresión
&. NG& Kactorial
Aesings
Test of Nne Proportion
$hi->quare
1 %'EDI8T1'
'ogistic %egresion
(! 2az clic en 1@
Inter#retando tus resultados
,sa el normal probabilit# plot para verificar que tus datos no se desvíen significativamente de una distribución normal.
• >i los datos vienen de una distribución normal" los puntos mu# apenas seguirn la línea de referencia.
• >i los datos no vienen de una distribución normal" los puntos no seguirn la línea.
Anderson-Darling normality test
,n p-value de &nderson-Aarlin Test :;.;658< accesa a la probabilidad que los datos son de una población con distribución normal.
,sando en E de ;.;5" no ha# suficiente evidencia para sugerir que los datos no son de una población normal.
8onclusi&n
(asado en el argumento # en la prueba es razonable asumir que tus datos no se desvían substancialmente de una distribución
normal. Puedes proceder con el t-test.
20
8onduciendo el 1-sam#le t-test
$onducir un =-sample t-test para determinar si la temperatura congelante de la leche del proveedor es ma#or a Q;.5C5W $.
.o ha# razón para sospechar que el proveedor quitara el agua de la leche. &sí" no necesitas probar si la temperatura congelante es
menor que Q;.5C5W $. En esta situación" puedes usar una prueba =-tailed :en la cual 2= es direccional</
• 2; /9 F -;.5C5
• 2= /9 ? -;.5C5 :En una prueba 8-tailed" 2= .o es direccional/ 9 es diferente a Q;.5C5<
'a ventaja de la prueba =-tailed es que te da mas Power para detectar la diferencia especificada. >in embargo" una prueba =-tailed no
puede detectar una diferencia en la dirección contraria que especifica en 2=. Ae esta manera si ha# diferencias en ambas direcciones
son de inter7s" debers usar una 8 tailed test.
1-9am#le t
1! Escoge 9tat: Basic 9tatistics: 9am#le t!
$! $ompleta el recuadro como se indica a continuación/
21
! 2az clic@ 1#tions!
(! Ae Alternati.e" Escoge greater t3an.
)! $lic@ 1@ en cada recuadro.
Inter#retando tus resultados
,sa un nivel E de ;.;5 para la prueba.
T
El t-statistic :8.84< es calculado de esta manera/
T F :muestra de la media Q prueba de la media< X >E media
Aonde >E media es el error estndar de la media :una medida de variabilidad<. $omo el valor de t se incremente" el p-value se hace
mas pequeVo.
%
El p-value es ;.;8C. Porque este valor es menor que E:;.;5<" puedes rechazar la hipótesis nula. El resultado sugiere que el agua o
cualquier otro liquido halla sido aVadido a la leche.
%o6er
$uando sea apropiado" una prueba =-tailed es mas poderosa que una prueba 8-tailed. Por ejemplo" una prueba 8-tailed :2= / 9 es
diferente a Q;.5C5< regresa a p-value de ;.;C4" que es ma#or que ;.;8C.
1ne-9am#le TA Fr4Tem#
Test of mu F -;.5C5 vs ? -;.5C5
22
8onsideraciones 5inales
8onclusiones #rácticas
El =-tailed" =-sample t-test sugiere que la temperatura congelante de la leche del proveedor es ma#or a la que debe ser" indicando
que se le pudo haber aVadido agua. Esta es una acusación mu# seria para el proveedor. Podría ser mejor evaluar que tan cierto es
antes de tomar una decisión.
$on un nivel E de ;.;5" las probabilidades de haber concluido que se le ha aVadido agua cuando no es así son de 5I. Para estar
seguro que no rechaces 2; incorrectamente" debers Escoger valores menores para E" tales como ;.;= o hasta ;.;;=. $on un E de
;.;=" no concluirs que se le all aVadido agua a la leche :p F ;.;8C<.
8onsideraciones estadísticas
$uando uses una =-sample t-test/
• Tu muestra debe de ser al azar.
• 'os datos de muestra deben de ser continuos .
• 'os datos de muestra deben de distribución normal.
Aebe de ser notado que los procedimientos del t-test son mu# justas a las violaciones de las suposiciones de normalidad" dadas esas
observaciones son recolectadas al azar # los datos son continuos # racionalmente sim7tricos. (ver Box, Hunter & Hunter (1978).
Statistics for xperi!enters, "o#n $ile% & Sons, &nc.).
,na prueba =-tailed es mas poderosa que una prueba 8-tailed. & menos que la diferencia no este en la dirección esperada" Por
ejemplo una prueba =-tailed con una hipótesis alternativa" 2= / 9 ? -;.5C5 nunca ser capaz de detectar la diferencia si alguien
disminu#e la temperatura congelante de la leche.
E"ercicio 1!1 Diámetro de los Valeros de Bola
E"ercicio
Tu compaVía produce Galeros de bola # necesitas verificar que el tamaVo del (alero que est7 en las especificaciones. 'a
especificación del dimetro para los Galeros es de ;.5cm.
,sa un nivel E de ;.;5 para todas las pruebas.
'ecolecci&n de datos
=; Galeros son escogidos al azar # medidos.
Instrucciones
1! Prueba la muestra de normalidad usando 9tat: Basic 9tatics: Normality Test!
$! ,sa 9tat: Basic 9tatistics: 1-sam#le t para determinar si el proceso esta en el objetivo. $onduce una prueba 8-
tailed :2= / 9 es diferente a ;.5< # crea un bo3plot de los datos.
! ,sando la desviación estndar de la muestra como un estimado de M" 0cul es el Power de la prueba para detectar
una diferencia de ;.;;5cm.1
(! 0$ul es el tamaVo mínimo para la muestra requerida para detectar la misma diferencia con un Power de ;.4;1
Data set
(E&%-.O>.*P+
23
T6o-9am#le t-Test
E"em#lo $ 'esistencia #lástica
E"ercicio
Tu compaVía hace estuches de plstico para calculadoras. .ecesitas comparar muestras de plsticos de 8 proveedores en cuanto a
su resistencia. El proveedor & dice tenar el plstico mas fuerte" pero cuesta mas que del proveedor (.
'ecolecci&n de datos
Pellets seleccionadas al azar de un grupo de plstico son prensadas en agua hasta ser barquillas del mismo grueso. 'a resistencia
para romperlos: en psi" libra por pulgada cuadrada< es tomada para cada barquilla.
2erramientas
9tat: Basic 9tatistics: Normality Test
9tat: Basic 9tatistics: $ .ariances
9tat: Basic 9tatistics: $-sam#le t
9et de Datos
P'&>T-$.*P+
T6o-sam#le t-test
;<u= es un t6o-sam#le t-test>
,na two-sample t-test te a#uda a determinar si 8 poblaciones de la media son iguales.
'a prueba usa las desviaciones estndar de la muestra para estimar M para cada población. >i la diferencia entre la muestra de la
media es grande relativamente para la variabilidad estimada entre las poblaciones" entonces la media de la población son improbables
a ser iguales.
,n two-sample t-test tambi7n te puede a#udar a evaluar si la media de 8 poblaciones es diferente por una cantidad especifica.
;8uándo usar una #rueba t6o-sam#le t-test>
24
,sa una prueba two-sample t-test cuando tengas datos continuos de 8 muestras al azar independiente. 'as muestras son
independientes si las observaciones de un one.sample no estn relacionadas a las observaciones de la otra muestra. Por ejemplo" 8
medidas son tomadas por un mismo operador no son independientes.
'a prueba tambi7n asume que tus datos vienen de una población normalmente distribuida. >in embargo es mu# justo hacia las
violaciones de esta suposición proveídas las observaciones son recolectadas al azar # los datos son continuos # razonablemente
sim7tricos. (ver Box, Hunter & Hunter (1978). Statistics for xperi!enters, "o#n $ile% & Sons, &nc.).
;%or ?ue usar una #rueba t6o-sam#le t-test>
,n two-sample t-test te puede a#udar a contestar preguntas tales como/
• 0>on los productos de dos proveedores comparables1
• 0Es la formula de un producto mejor que el otro1
Por ejemplo"
• 0Es similar la viscosidad del aceite de dos proveedores1
• 0Es la formula de una tinta ms brillante que otra1
%robando las su#osiciones de la normalidad
'a prueba de estadística mas apropiada para los datos del proveedor es la two-sample t-test. Esta prueba asume que los datos son de
poblaciones distribuidas normalmente.
,sa la prueba de normalidad para determinar si la suposición de la normalidad es valida para estos datos.
%rueba de normalidad
1! &bre el pro#ecto P'&>T-$.*P+.
$! Escoge 9tat: Basic statistics: Normality Test!
! En Gariable" enter Y>upplr&Y.
(! $lic@ 1@!
)! Escoge 9tat : Basic 9tatistics : Normality Test" or press ctrl. P E.
*! En VariableD enter Y>upplr(.
,! $lic@ 1@
Inter#retando tus resultados
,sa la normal probabilit# plot para verificar que tus datos no se desvíen significativamente de una distribución normal.
• >i los datos vienen de una distribución normal" los puntos mu# apenas seguirn la línea de referencia.
• >i los datos no vienen de una distribución normal" los puntos no seguirn la línea.
El plot para el >upllr& indica que la distribución de la muestra es razonablemente normalZ todos los puntos estn cerca de la línea.
El plot para el >upplr( sin embargo aparentemente muestra desviación de la normalidad.
Anderson-Darling Normality test
'a desviación de la normalidad observada de >upplr( no es significante en un nivel E de ;.;5. &mbas p-values:;.!!C para >upplr&" #
;.;46 para >upplr(< son ma#or que ;.;5.
8onclusi&n
(asado en el plot # las pruebas" es racional asumir que tus datos no se desvían substancialmente de una distribución normal. 'a
suposición de una normalidad es relativamente satisfecha" así que puedes proceder con el t-test.
25
8om#arando las .ariaciones
&ntes de conducir el t-test" debes evaluar las variaciones de las 8 distribuciones para ver si difieren. 2a# dos razones para esto/
• Es importante saber sí el producto de un proveedor varia mas que el del otro
• 'os clculos para el two-sample t-test depende si las variaciones de las muestras son iguales o diferentes.
Para asegurar que encontraste una diferencia entre 8 variaciones si es que e3iste una. Aebes usar un nivel E de ;.=; para esta
prueba en lugar de la normal de ;.;5. Esto incrementara el power de la prueba.
$ Variances
1! Escoge 9tat: Basic statistics: $ Variances!
$! $ompleta el recuadro como se indica a continuación/
26
! $lic@ 1#tions!
(! En 8on5idence le.el" enter H;.
)! $lic@ 1@ en cada recuadro.
Inter#retando tus resultados
Inter.alos de con5ian4a
'os intervalos de confianza son Stiles para comparar M de las 8 poblaciones. >in embargo" tu decisión acerca de sí las 8 variaciones
son iguales ser basadas en una apropiada prueba de variación.
%ruebas de .ariaci&n
'os resultados inclu#en 8 pruebas de variación separadas. El uso de la prueba depende de tus datos.
• >i tus datos son continuos # de distribución normal" usa el K-test.
• >i tus datos son continuos pero no necesariamente de distribución normal" usa el 'evene[s test.
'os datos dados son racionalmente normales" así que puedes usar el K-test. >in embargo" porque el p-value de la prueba de
normalidad del proveedor ( fue mu# baja :;.;46<" ha# que revisar los resultados de la prueba de 'evene[s tambi7n.
8onclusi&n
'os p-values para ambos K-test :;.;!B< # la 'evene[s :;.;58< son menos que E :;.=;<" así que puedes rechazar la hipótesis nula que
las variaciones son iguales. 'os resultados sugieren que las variaciones del plstico del proveedor & son ms pequeVos que las del
proveedor (.
27
K-Test :normal distribution<
Test statistic F ;.84" p-value F ;.;!B
'evene\s Test:an# continuous distribution<
Test statistic F C.8B" p-value F ;.;58
Test 5or E?ual Variances 5or 9u##lrAD 9u##lrB
Inter#retando tus resultados
'os mismos intervalos de confianza # las pruebas estadísticas incluidas en la ventana de resultados de la grafica tambi7n son
proveídas en la ventana de sesión.
Test 5or E?ual VariancesA 9u##lrAD 9u##lrB
H5I (onferroni confidence intervals for standard deviations
K-Test :normal distribution<
Test statistic F ;.84" p-value F ;.;!B
'evene\s Test:an# continuous distribution<
Test statistic F C.8B" p-value F ;.;58
8onduciendo el T6o-9am#le t-test
Por que los datos son razonablemente normales" tu puedes usar 8 >ample t -to test #a sea la resistencia del plstico de los dos
diferentes proveedores.
'a prueba de 2ipótesis es/
• 2; / 9 & Q 9 ( F ;
28
• 2= / 9 & Q 9 ( ] ;
Elabora dotplots # bo3plots para a#udar a visualizar los datos.
Asumir discre#ancias desiguales
>i asumes que las varianzas de las dos poblaciones son iguales" tu t-test ser ms confiable. >in embargo" si asumes que la varianza
es igual cuando no lo son" los resultados de tu t-test sern falsos. &sí" si ha# alguna duda" es mejor no asumir que son iguales.
Porque la variance test indica que la población de la varianza es diferente" no asuma que las varianzas son iguales.
$-9am#le t
1! Escoge 9tat : Basic 9tatistics : $-9am#le t!
$! $omplementa el recuadro como se indica a continuación/
! $lic@ Era#3s!
(! %evisa Dot#lots o5 data # BoB#lots o5 data!
)! $lic@ 1@ en cada recuadro.
Inter#retando los 'esultados
'as grficas ilustran dos puntos /
• El plstico del proveedor & se muestra ms resistente que el del proveedor (.
• 2a# mas variabilidad en la resistencia del Plstico del Proveedor ( que del Proveedor &.
29
Inter#retando tus 'esultados
T6o-9am#le T-Test and 8IA 9u##lrAD 9u##lrB
T6o-9am#le T-Test and 8I9u##lrAD 9u##lrB
30
Indi.idual Value %lot o5 9u##lrAD 9u##lrB
BoB#lot o5 9u##lrAD 9u##lrB
El promedio del punto de quiebre del plstico :media< # dos medidas de la variabilidad^la desviación estndar :>tAev< # el error
estndar de la media :>E *ean<^se presentan en cada Proveedor.
Inter.alos de 8on5ian4a
'a diferencia entre la muestra de la media :B.C4C< se utiliza para estimar la diferencia entre la población de la media :mu >upplr&^mu
>upplr(<. El intervalo de confianza por la diferencia se basa en esta estimación # la variabilidad de las muestras.
Puede ser H5I confiable que la diferencia entre la población de la media es entre !.!4B # 4.84= psi.
T-.alue y #-.alue
El T-value para la prueba es =H.48" lo cual se asocia con un p-value menor que ;.;;;5 :lo cual se redondea a ;.;;;<
&sí" puedes rechazar la 2ipótesis nula en ;.;5 E-level" donde conclu#e que las resistencias son diferentes.
8onsideraciones 5inales
8onclusiones #rácticas
El proveedor de plstico & es significativamente resistente # menos variable que el proveedor (. >in embargo" observamos que el
Proveedor & tambi7n nos cobra mas por el producto. &hora tienes que decidir si la diferencia entre los Proveedores es significativa.
>e cuenta con el H5I de confianza de la verdadera diferencia entre el proveedor !.!4B # 4.84= psi. Tu decides pagar o no un precio
alto por una pequeVa diferencia en la resistencia.
8onsideraciones estadísticas
$uando utilizas two-sample t-test /
• 'as muestras deben ser al azar.
• 'as muestras deben ser independientes.
• 'as muestra deben ser continuas.
• 'as muestras deber ser de distribución normal.
Aebe acentuarse que el procedimiento para la t-test es lo suficientemente veraz a las violaciones de la &sunción de la normalidad"
proveídas estas observaciones los datos son recolectados al azar" son continuos" unimodal # razonablemente sistemticos. (ver Box,
Hunter & Hunter (1978). Statistics for xperi!enters, "o#n $ile% & Sons, &nc.).
Inter#retando tus resultados
31
Dos-e"em#los T #ara 9u##1 rA .s 9u##1 'b
. *edia >tAev >E *edia
>upp=%a =; =!8.!=C ;.5HH ;.=H
>uppl=r( =8 =55.=6 =.=6 ;.66
Aiferencia F mu >upp=r& Q mu >upp=r(
Estimación por diferencia/ B.C4C
H5I $- para diferencia/ :!.!4B" 4.84=<
T- Testo de diferencia F ; : vs no F </ T- Galor F =H.48 P-Galor F ;.;;; AK F =B
'a resistencia a ruptura media :medio<" # dos medidas de desviación estndar de la variabilidad-:>tAev< # del error de estndar del
medio :el >E *ean<- se presenta para cada surtidor.
7os inter.alos de con5ian4a!
'a diferencia entre los medios de la muestra :B.C4C< se utilizan para estimar la diferencia entre los medios de la población :mu
>upplr&-mu >upplr(<. El intervalo de la confianza para la diferencia se basa en esta estimación la variabilidad dentro de las muestras.
,sted puede tener una confianza del H5I que la diferencia entre los medios de la población est entre !.!4B # 4.84= P>-.
T-.alor y el #-.alor
El t-valor para la prueba es =H.48" que se asocia a un p-valor de menos de ;.;;;5 :que redondeado a ;.;;;<.
&sí" usted puede rechazar la hipótesis nula en el ;.;5 _ - nivel" # conclu#e que las fuerzas son diferentes.
8onsideraciones Finales!
8onclusiones #rácticas!
El plstico de &[s del surtidor es perceptiblemente ms fuerte # menos variable que el surtidor ([s. sin embargo recuerda que el
surtidor & tambi7n carga ms para su producto. &hora usted debe decidir si la diferencia entre los surtidores es de significación
prctica.
,sted es el H5I confiable que la diferencia verdadera entre los surtidores es entre !.!4B # 4.84= pis. ,sted decide que no est
dispuesto a pagar el precio alto ms elevado para la pequeVa fuerza de diferencia.

8onsideraciones Estadísticas!
&l usar una t-prueba de la dos-muestra/
• 'a muestra debe ser al azar.
• 'as muestras deben ser independientes.
• 'os datos de la muestra deben ser continuos.
• 'os datos independientes de la muestra deben ser distribuidas normalmente
Aebe ser observado que el procedimiento de la t-prueba es bastante robusto a las violaciones de la asunción de la normalidad" la
condición de que las observaciones se recogen aleatoriamente # los datos son continuos" unimodal" # razonablemente sim7tricas
:v7ase a la caja" al cazador" # a $azador :=HB4<. Estadística para E3perimentos" +ohn Jile# ` >ons" -nc.<.
%rueba- t %areada
E"em#los del Estacionamiento de los 8arros!
%roblema
,n grupo de consumidor desea determinar si ha# una diferencia en la manipulación de capacidad entre dos coches populares. Para
medir la capacidad de dirección de los coches" el tiempo lleva conductores el parque paralelo que cada uno de los coches se registra.
'ecolecci&n de datos
Geinte conductores parquean ambos coches :en orden al azar<" # el tiempo del estacionamiento registrado :en segundos<.
2erramientas
32
9tat : Estadísticas Básicas : %aired
9et de Datos
$&%$'T.*P+
Nombre Ti#o de Dato Ti#o de Variable
$arro - & .um7rico %espuesta
$arro - ( .um7rico %espuesta
%rueba-t %areada
;<u= es una #rueba t #areada>
En una prueba t pareada tu puedes determinar si la media de la diferencia entre las observaciones pareadas es significativa
Estadísticamente" es equivalente a realizar una Prueba t de una-muestra de una diferencia. ,na t-prueba pareada se puede tambi7n
utilizar para evaluar si la diferencia es igual al valor específico.
'as observaciones pareadas se relacionan de una cierta manera. 'os ejemplos inclu#en/
• Pesos registrados para los individuos antes # despu7s un programa de ejercicio.
• *uestras tomadas de la misma parte con dos diferentes dispositivos de medida.
;8uándo utili4ar una #rueba t #areado>
,se una Prueba t pareada cuando tengas una muestra escogida al azar de observaciones pareadas. 'os datos deben ser continuos.
;%or?u= usar una #rueba t #areada>
'as pruebas t pareadas t puede a#udar a responder preguntas tales como/
• 0,n nuevo tratamiento causa la diferencia en el producto1
• 0Aos instrumentos de medida hacen lo mismo1
Para el ejemplo/
• 0Tratando la madera de construcción con ciertos productos químicos aumenta su vida Stil1
• aPueden dos calibradores medir id7nticas partes de la misma manera1
8onduciendo una #rueba t de #areada
Tu estas intentando determinar si un coche se puede estacionar ms rpidamente que otro. Porque se emparejan los datos :cada
individuo estaciono ambos coches<" tu utilizaras una prueba t pareado para probar las hipótesis siguientes/
 2o/ 'a diferencia de la media entre las observaciones pareadas en la población es cero.
 2=/ 'a diferencia de la media entre las observaciones pareadas en la población no es cero.
$ree los dotplots # los bo3plots para a#udar a visualizar los datos. ,tilice el nivel de la confianza del defecto del H5I para la prueba.
t %areadas
1!- &bre el Project 8A'87T!M%O!
$!- Elija 9tat ? Estadísticas bsicas ? Pareo t.
!- $ompleta el recuadro como se indica a continuación/
33
(!- $lic@ Era5icas!
)!- Elija Do#lot de di5erencias # BoB#lot de di5erencias!
*!- $lic@ 1@ en cada recuadro.
Inter#retando tus resultados
El bo3plot # el dotplot ilustran las diferencias entre las observaciones pareadas.
'a diferencia de la media : apro3imadamente 8< es representa por el ). 2o representa la diferencia de la población que estas
probando :cero.
El inter.alo de con5ian4a
*-.-T&( tambi7n dibuja el intervalo de confianza para la diferencia de la media de la población. &sí que la hipótesis nula es verdad"
tu esperarais que 2o estuviera dentro de este intervalo.
Porque el intervalo de la confianza no esta incluido en 2o" tu puedes rechazar la hipótesis nula # concluir que al coche & le toma mas
tiempo estacionar que al coche (.
34
Inter#retando tus resultados
'as medias de los tiempos para estacionarse son 6C.4B segundos para el coche & # 68.H; segundos para el coche (. 'a diferencia
es =.H!B segundos.
'os puntos finales para el intervalo de confianza del H5I para la diferencia de la media son de ;.=B= # 6.B!C.
T-.alor y #-.alor
'a prueba da un valor de t de 8.8H" se asocia con un p-valor de ;.;6C. &sí" tu puedes rechazar la hipótesis nula en el nivel ;.;5 _ #
concluir que el tiempo requerido para estacionar el coche & es ma#or que el tiempo requerido para estacionar el coche (.
%rueba T #ara 8arros A P 8arros PB
8onsideraciones 5inales
8onclusiones #rácticas
En promedio" a los conductores les tomo =.H!B segundos mas estacionar el coche & que el coche (. Esta diferencia aunque
pequeVa es estadísticamente significativa.
0Es una diferencia de 8-segundos de importancia practica1. Esto lo decides tu.
'os tiempos levemente ms largos para estacionarse se asocian a la frustración creciente del conductor" los 8 segundos pueden ser
importantes. Tambi7n" esta diferencia puede ser de ma#or importancia a los conductores que seguido se estacionan paralelo.
35
8onsideraciones Estadísticas
$uando usar una prueba t pareada/
• 'as observaciones deben ser pareadas.
• 'os datos deben ser continuos.
• 'as diferencias deben ser distribuidas normalmente.
Aebe ser observado que el procedimiento de la prueba t es bastante robusto para las violaciones de las suposiciones de la
normalidad" a condición de que los pares de observaciones se recojan aleatoriamente # los datos sean continuos" unimodal" #
razonablemente sim7tricos :v7ase a la caja" al cazador" # a $azador :=HB4<. Estadística para E3perimentos" +ohn Jile# ` >ons" -nc.<.
,tilizando observaciones pareadas eliminas la variabilidad causada por individuos! Por ejemplo" al conductor = le tomo =4.H
segundos para estacionar el coche # =4.8 segundos para estacionar el coche (. En contraste" al conductor =4 le tomó C6.4 # C=.=
segundos para estacionar los mismos coches. Nbviamente" ha# mucha variabilidad entre los conductores. Pero analizando las
diferencias para cada conductor" tu eliminas esta variabilidad de los clculos" aumentando el power de tu prueba.
E"ercicio !1 8om#araciones de 8alibradores
E"ercicio
Tu ests considerando la compra de dos diversos gage para medir vlvulas/ $alibradores por Eas#Oage # Too=-t. Tu deseas
comparar las dos marcas de fbrica del calibrador para determinarse si ofrecen las mismas medidas de promedio.
,tilice un _-nivel de ;.;5 para todas las pruebas.
'ecolecci&n de datos
Aoce operadores cada uno midieron la misma vlvula con los dos diversos calibradores. :El orden en la cual utilizaron el calibrador
fue seleccionado aleatoriamente.<
Instrucciones
=.- ,se una prueba t pareada para determinar si las medidas de cada calibrador son diferentes.
8.- $on la desviación de estndar de la diferencia de la muestra como estimación de _ " calcule la energía de la prueba al detectar
una media de la diferencia de ;.;;5 cm.. :-ndirecta/ $onducir una t-test paired es lo mismo que conducir una t-prueba de la una-
muestra es la diferencia entre las observaciones pareadas.
Por lo tanto" tu puedes utilizar 9tat : %o6er and sam#le si4e : 1- 9am#le t para evaluar el power de la prueba t pareada.
6.- 0cul es la energía de la prueba de detectar una diferencia de la media de ;.;;= centímetro1
>et de datos
$&'-PE%>.*P+
Nombre Ti#o de dato Ti#o de .ariable
Nperator .um7rico %espuesta
Eas# gage .um7rico %espuesta
Toollt .um7rico %espuesta
Aiff .um7rico %espuesta
%rueba de una %ro#orci&n
E"em#lo ( Tele.isiones 'e#aradas #or Tari5a
E"ercicio
Tu quieres determinar si la proporción de tu sistema de televisión de 65- pulgada necesitara ser reparado en el plazo de C aVos de la
compra" es diferente que el índice de la industria !.4I : ;.;!4<
'ecolecci&n de datos
&pro3imadamente =;;";;; encuestas fueron enviadas a los clientes que compraron una televisión 65-plagadas. Ae los 8"45! clientes
que regresaron las encuestas" 86! indicaron que su televisión había requerido la reparación en el plazo de C aVos de la compra.
2erramientas
36
9tat : Estadísticas Básicas : 1 %ro#orci&n
9et de datos
.inguno
%rueba de una #ro#orci&n
;<u= es una #rueba de #ro#orci&n>
,na prueba de una proporción te a#uda determina si una proporción de la población es diferente de un valor específico :proporción de
la prueba.<
;8uándo utili4ar una #rueba de una #ro#orci&n>
,sa una prueba de proporción para evaluar la proporción de los datos de una sola muestra.
;%or?u= usar una #rueba de una #ro#orci&n>
,na prueba de una proporción te puede a#udar a contestar preguntas tales como/
• 0Es una población diferente de ;.51
• b< 0Es una proporción ma#or o menor que el criterio1
Por el ejemplo"
• 0En un programa de inteligencia artificial es posible contestar 9í Q No preguntas con ma#or e3actitud del 5;I1.
• 0Est el porcentaje de averías de los sujetadores plsticos debajo del m3imo aceptable1.
8onduciendo una #rueba de una #ro#orci&n
Tu ests evaluando los resultados de un e3amen enviado a los clientes que compraron una de sus televisiones.
'a proporción de los que respondieron con televisión que la necesito reparación dentro de los C aVos es 86! X 845! F ;.;48!. El
promedio de la industrial es ;.;!4.
,tiliza una prueba de una proporción para determinar si esta diferencia es significativa.
'as hipótesis para la prueba es/
2o/ la proporción de la población para sus clientes es igual a ;.;!4.
2=/ la proporción de la población para los clientes no es igual a ;.;!4.
,tilice un nivel de la confianza del H5I.
1 %ro#orci&nA
1!- Elija 9tat ? 'a Estadística (sica ? = Proporción.
$!- >eleccione 9ummari4ed data!
!- En el .Smero de ensa#os" tipo 845!.
(!- En el N+mero de =Bitos" tipo 86!.
)!- $lic@ 1#ciones!
*!- $omplete el recuadro como se indica a continuación/

,!- $lic@ 1@ en cada recuadro.
Inter#retando tus resultados
,tilice _ de ;.;5 para la prueba.
'os resultados sugieren que el índice de la reparación para su televisión :muestra p F ;.;46< sea ms alta que el índice a nivel
industrial de ;.;!4
 El intervalo de confianza del H5I :;.;B8BHH8 & ;.;H666H< no inclu#e ;.;!4.
 El p-valor :;.;;6< es menos que _ :;.;;5.<
Tu debes rechazar la hipótesis nula" #a que el índice de tu reparación igual que el índice a nivel industrial.
37
Mas Q Para clculos de intervalos de confianza" vea a#uda de *initab.
Test y 8I #ara una %ro#orci&n
8onsideraciones 5inales
8onclusiones #rácticas
'a evidencia sugiere que la proporción de que tu televisión requiera reparación dentro de los de C aVos de la compra es ma#or que la
proporción del índice a nivel industrial de ;.;!4.
Por supuesto" la ma#oría de los clientes que recibieron el e3amen no lo devolvió. Es siempre posible que los clientes que han tenido
un problema en su televisión son los ms probables en devolver el e3amen. >i 7sta es la causa" la proporción real puede ser mucho
menos de ;.;48!66.
8onsideraciones estadísticas
$uantas ms observaciones tu tengas" ms power tendr tu prueba de una proporción.
Tambi7n puedes aumentar el power aumentando R! >in embargo esto tambi7n aumenta la posibilidad de que ocurra el error tipo =.
'EE'E9INN
1b"eti.osA
o *ida el grado de la asociación linear entre dos variables usando los grficos # la estadística.
o *odelo para la relación entre variables de respuestas continuas # unas o ms variables de predicción.
o Aetermine la fuerza de la relación entre variable de respuesta continua # unas o ms variables de predicción.
8ontenidos
38
8orrelaci&n
E"em#lo 1 de 9istemas de Medias
E"ercicio
Tu has desarrollado un sistema de medida en línea que usted cree medirn el p2 como e3actamente el sistema actual en su
laboratorio. El sistema en línea proporcionaría una regeneración ms rpida # la capacidad de ajustar los sistemas en tiempo real. Tu
quieres saber si los dos sistemas producen lecturas similares del p2.
'ecolecci&n de datos
'a colección de datos ambos sistemas se utiliza para medir el p2 de 8; +ornadas aleatoriamente seleccionadas del producto de
limpieza.
2erramientas
Era#3 : %lot
9tat : Basic 9tatistics : 8orrelation
9et de Datos
'&(>TE>T.*P+
Nombre Ti#o De datos Ti#o de Variable
'aboratorio .um7rica %espuesta
39
En línea .um7rica %espuesta
8orrelaci&n
;<u= es correlaci&n>
'a muestra del coeficiente de correlación r" mide el grado de la asociación linear entre dos variables :el grado en la cual una variable
cambia con otra<.
,na correlación positiva indica que ambas variables tienden a incrementarse juntas. ,na correlación negativa indica que una variable
se incrementa" # la otra decrece.
;8uándo utili4ar la correlaci&n>
,tiliza la correlación cuando tengas datos para que dos variables continuas # desees determinen si ha# una relación linear entre ellas.
'a correlación no dir si estas variables estn relacionadas de una manera no lineal.
&lgunos estadísticas creen que la correlación no debe ser utilizado si una variable # es dependiente de la respuesta de la otra.
;%or?u= usar la correlaci&n>
'a correlación te puede a#udar a contestar preguntas tales como/
• 0Estn dos variables relacionadas en una manera linear1.
• 0$ul es fuerza de la relación1.
Por ejemplo"
• 02a# una relación entre la temperatura # la viscosidad del aceite de cocina1.
• 0Es fuerte la relación entre la e3posición ultravioleta # la fuerza reducida en el material de n#lon de la tienda1.
Dibu"ando los datos
$reando un diagrama te a#udar a visualizar la relación entre las medidas tomadas por los dos sistemas que ests utilizando para
medir el p2.
Era5icando las .ariables
Orafica el laboratorio # el Nnline de la variable en ) # b respectivamente.
%lot
1!- &bre el pro#ecto '&(TE>T.*P+.
$. Escoge Era#3 : %lot
!- $ompleta el recuadro como se indica a continuación/
(!- $lick 1@
40
Inter#retando tus resultados
El diagrama Nnline contra medidas del laboratorio indica/
• 2a# una relación fuerte entre los dos sistemas que miden. $uando los valores para el laboratorio cambian" tambi7n lo hacen
los valores para Nnline.
• 'os datos siguen una línea bastante recta que sugiere que la relación es linear.
• 'os altos valores del sistema en línea se asocian a altos valores del sistema del laboratorio" indicando que la relación es
positiva.
;<ue se 3ace des#u=s>
Porque la relación es linear" usted puede calcular la correlación para cuantificar la fuerza de la asociación.
8alculando la correlaci&n
Tu deseas calcular el coeficiente de correlación de Pearson para determinar la fuerza de la asociación linear entre las medidas en
Nnline # del laboratorio.
8orrelaci&n
1!- Escoge 9tat : Basic 9tatistics : 8orrelacion!
$.- Enter en Gariable 'aboratorio.
41
!- $lic@ 1@!
Inter#retando tus resultados
8orrelaci&nA 7aboratorio En línea!
Prueba de la $orrelación 'aboratorio En línea F ;.H5H
P Q Galor F ;.;;;
,se una _ ;.;5 para el te3to.
%earson correlaci&n
El coeficiente de la correlación de la muestra :r< es calculado por la fórmula/
El valor de r estar siempre entre -= # =/
• = indica una correlación positiva perfecta.
• ; indica ninguna correlación.
• -= indica una correlación negativo perfecto.
%-.alor
'a prueba del p-valor las hipótesis siguientes/
2o/ El coeficiente de correlación :p o rho< para la relación entre las poblaciones es igual a cero.
2=/ p no es igual a cero.
8onclusi&nA
El coeficiente de correlación :;.H5H< indica que ahí una fuerte asociación lineal positiva entre la media del 'aboratorio # la del
Nnline. &dems el p-valor :;.;;;< es menos que ` :;.;5<" entonces tus puede rechazar la hipótesis nula" #a que no e3iste ninguna
asociación lineal.
42
;<ue se 3ace des#u=s>
&ntes de sustituir el sistema de laboratorio con el sistema en línea" tu necesitas evaluar dos aspectos adicionales entre la relación de
los dos. -ncluso si la correlación era perfecto :rF=<" todavía podrían haber diferencias importantes entre los sistemas/
 'as medidas de un sistema podrían ser coherentemente ms altas que las medidas del otro.
El coeficiente de correlación no dirige estas cuestiones de tendencia # sensibilidad.
Anotaci&n de la grá5ica
,tilice el diagrama del argumento para a#udarte a evaluar si la medida de los dos sistemas es similar" # si los sistemas son
igualmente sensibles/
• Traza con los datos los mismos valores del mínimo # del m3imo para ambas ).
• b &gregue una línea para indicar donde SFM. :usted podría agregar la línea despu7s de que el grfico sea creado usando las
herramientas para graficas de *-.-T&([s. >in embargo" la caja del subdilogo de la anotación proporciona una manera ms
e3acta de agregar líneas al grfico<.
%lot
1!-Elige Era#3 : %lot.
$!- Ael ca#ítulo" elige el minuto y el máBimo!
!-Elige el mismo mínimo y máBimo #ara las S de S y de M!
(!- $lic@ 1@
)!- Para anotaci&n" elija la línea!
*! Q $ompleta el recuadro como se indica a continuación/
B.- $lic 1@ en cada recuadro.
Inter#retando tus resultados
Para cada punto referente en la línea" S es igual a M. >i ambos sistemas van encima con las mismas medidas para cada muestra"
entonces todos los puntos de referencias caern en esta línea.
$omparando los datos en la línea de referencia revela lo siguiente/
o Todos" menos un punto est debajo de la línea" indicando que el sistema en línea produce medidas constantemente ms
altas que el sistema del laboratorio.
43
o 'a línea que los datos siguen tiene bsicamente la misma cuesta que la línea de referencia. Esto indica que los valores de
los rangos indican que los dos sistemas son similares.
8onsideraciones 5inales
8onclusiones #rácticas
2a# una fuerte correlación positiva del :;.H5H< entre las medidas tomadas con el laboratorio # con los sistemas en línea.
>in embargo el sistema en línea rinde medidas constantemente ms altas que lo hace el sistema del laboratorio. Esto puede indicar la
necesidad de recalibración.
'os resultados de los límites en el e3perimento indican que es menos costoso # ms fcil utilizar el sistema en línea # puede ser un
reemplazo conveniente para el sistema de medida del laboratorio.
8onsideraciones estadísticas
'a $orrelación cuantifica el grado de la asociación linear entre dos variables.
,na correlación fuerte no implica una relación de causa # efecto. Para el ejemplo" una correlación fuerte entre dos variables puede
ser debido a la influencia de una tercera variable" no bajo consideración.
,n coeficiente del correlación cerca de cero no significa necesariamente ninguna asociación" sólo que esa asociación no es linear. Tu
debes trazar siempre sus datos de modo que puedas identificar relaciones lineares cuando ests se presenten.
&lgunos estadísticos discuten que la correlación que sea utilizada si una variable es una respuesta dependiente de la otra.
'a correlación asume que los valores de ambas variables estn libres de variar. Tu no puedes utilizar la correlación si fijas los valores
de una variables una para estudiar cambios en otra.
'egresi&n 9im#le
E"ercicio
Tu sospechas que la revoltura tiene un impacto en el nivel de impurezas en tu producto de pintura.
'ecolecci&n de datos
'as impurezas fueron medidas para lotes de pintura revueltas en rangos de movimientos a partir de 8; a C8 %P* :revoluciones por
minuto.<
2erramientas
9tat : 'egression : Fitted 7ine %lot!
9tat : 'egression : Fitted 7ine %lots!
44
9et de Datos
%AINT!M%O
'EE'E9INN 9IM%7E
;<u= es la regresi&n sim#le>
'a regresión simple e3amina la relación entre una variable de respuesta continua :b< # una variable de predicción :)<. 'a ecuación
general para un modelo de regresión simple es/
b F b F Uo P U= ) P c

Aonde b es la respuesta" ) es la predicción" Uo la es el interceptor :el valor de b cuando ) iguala el cero<" U= la es la cuesta" # c es
el error aleatorio.
;8uándo usar la regresi&n sim#le>
,sa la regresión simple cuando tu tengas b continua # solo una ). 'as siguientes condiciones deben ser encontradas/
• ) puede ser ordinal" o continSa.
• En la teoría" ) debería ser fijada. En la prctica" sin embargo" a menudo le permiten para variar.
• $ualquier variación arbitraria en la medida de ) es asumida para ser insignificante comparada con el rango en cual ) es medido.
'os valores de b obtenidos en su muestra se diferenciarn de estas predicciones por el modelo de regresión :a no ser que todos los
puntos resulten caer sobre la línea perfectamente recta.<. 'laman residual a estas diferencias.
&ntes de la aceptación de los resultados de un anlisis de regresión" tu debes verificar que las suposiciones siguientes sobre los
residuales son vlidas para tus datos/
• Ellos son independientes :# así arbitrarios<.
• Ellos estn distribuidos normalmente.
• Ellos tienen constantes variaciones a trav7s de todos los valores de ).
;%or ?u= usar la regresi&n sim#le>
'a regresión simple te puede a#udar a contestar preguntas tales como/
• 0$ómo importante es ) en la predicción b1
• 0Lu7 valor puedes tu esperar para b cundo ) es 8;1
• 0$unto es que cambio de b si ) en una unidad1
Por ejemplo"
• 0$ómo el proceso de la temperatura de tratamiento se relaciona con la dureza de su acero1
• 0Lue fuerza tendr su acero si usted lo trata a una temperatura particular1
• 0$unto ms difícil tratar ser su acero si aumentas la temperatura en =;;1 d1
A"ustando el modelo lineal
Tu quieres determinar el efecto de tarifa de movimiento sobre la cantidad de impurezas en la pintura. ,tiliza Fitted 7ine %lot para
calcular # graficar la ecuación de la regresión
Fitted 7ine %lot
1!- &bre el Project P&-.T.*P+.
$!- Escoge 9tat : 'egression : Fitted %lot!
45
!- $ompleta el recuadro como se indica a continuación/
(!- $licT 1@
Inter#retando tus resultados
'egresi&n la ecuaci&n
'a ecuación de %egresión relaciona la predicción :stirrate< con la respuesta :la impureza</
-mpureza F-;.84H8BB P ;.C5!!C6 stirrate
'a inclinación de la línea de regresión" ;.C5!!C6" indica cuanto un cambio en la impureza es asociado con cada cambio de una
unidad de stirrate.
9
> es una estimación del promedio de variabilidad media sobre la línea de regresión. 'a > es la raíz cuadrada positiva de *>E. 'a
mejor ecuación predice la respuesta" mas bajo > ser.
'
$
H'-9?J
'a '
$
:$uadrada de r< es la proporción de la variabilidad en la respuesta que es e3plicada por la ecuación. &sí" el H6.C I de la
variación en la impureza puede ser e3plicado por su relación lineal con el >tirrate.
Galores aceptables para '
$
varían dependiendo del estudio. Por ejemplo" los -ngenieros que estudian reacciones químicas pueden
requerir una '
$
del H; I o ms. >in embargo" alguien estudiando el comportamiento humano :que es ms variable< puede estar
satisfecho con valores de '
$
inferiores.
A"ustada Hcuadrado de r Had"JJ
'
$
ajustada es sensible al nSmero de t7rminos :condiciones< en el modelo # es importante comparar los modelos con diferentes
nSmeros de t7rminos :Ger 6-54<.
46
7a menor línea de regresi&n cuadrada
'os coeficientes para la ecuación de regresión son escogidos para reducir al mínimo la suma de las diferencias cuadriculadas entre
los valores de respuesta observados en la muestra # aquellos predichos por la ecuación.
En otras palabras" las distancias verticales entre los puntos # la línea son reducidas al mínimo" ilustrado a la derecha. El resultado es
llamado/ 'a menor parte de la línea de regresión cuadrada.
Est7 atento a esta líneas de fuera usando los procedimientos de la regresión. &lgSn líneas de fuera :llamados altos puntos < tienen un
efecto grande sobre el clculo de la menor parte de línea de regresión de cuadrado. En tales casos" la línea ms puede puede
representar al resto de datos mu# bien.
.ote/ este grfico ha sido corregido para la ilustración.
Inter#retando tus resultados
,se el anlisis de varianza :&.NG&< resultados para evaluar si su modelo de regresión simple es Stil. El &.NG& compara su modelo a
un modelo restringido que no usa >tirrate :S< para predecir la impureza :M</
• *odelo de %egresión/ b F Uo P U= ) P c
• *odelo %estringido/ b F b F UoP c
47
El modelo restringido declara que los cambios de b estn previstos Snicamente al error arbitrario :c<. Es equivalente a un modelo de
regresión simple con una cuesta :U=< de cero. &sí" las hipótesis para el &.NG& son"
• 2o/ U= es igual para cero.
• 2=/ U= no es igual a cero.
-nterprete el p-valor :P< así/
• >i el p-valor es menos que o igual a _ " deseche 2o. El modelo de regresión e3plica considerablemente ms variabilidad en la
respuesta que hace el modelo restringido. 'a U= no iguala el cero.
• >i el p-valor es a ma#or" usted no puede rechazar la 2o. U= no es considerablemente diferente del cero.
8onclusi&n
,sando un _ ;.;5" tu puedes rechazar el modelo simple restringido # afirmar que >tirrate realmente tiene un efecto significativo lineal
sobre la -mpureza.
Análisis de 'egresi&nA Im#ure4a contra 9tirrate
Adicionando con5ian4a y %redicci&n
$onfidencialidad # bandas de predicción.
Tu tambi7n quieres saber si confiar que la media # los puntos individuales en la variable b" -mpurezas caen dentro de ciertos límites
de variabilidad.
'esiduales y Fits
El %esidual es la diferencias entre los valores ajustados de su modelo # los valores observados. >on las estimaciones de punto de la
respuesta estimados para cada nivel de la variable independiente. Tu debes almacenar estos valores para usar ms tarde.
,se un nivel de confianza de falta del H5 I.
Fitted 7ine %lot
1!- Escoja 9tat ? 7a 'egresi&n ? Fitted 7ine %lot presione $trl P E para volver al dialogo Fitted 7ine %lot al cuadro.
$!- . 8lick Npciones.
48
!- $ompleta el recuadro de dilogo como se indica a continuación/
(!- $lic@ 1@!
)! - $lic@ 9torage!
*!- Elige 'esiduals y Fits!
,- $lic@ 1@ en cada recuadro.
Inter#retando tus resultados
Inter.alo de con5ian4a
El H5I de confianza define un e3celente rango de valores en la población de la media de b. Para cualquier valor dado de SD tu pues
confiar que la población de la media de b esta entre las líneas indicadas.
Inter.alo de #redicci&n
El intervalo de predicción del H5 I define una gama probable de valores de M para observaciones individuales. Para cualquier valor
dado de S" tu puedes confiar con un H5 I que el valor correspondiente de M para una observación estar entre las líneas indicadas.
'egresi&n %lot
49
8reando una grá5ica del 'esidual
El residual para cada observación es la diferencia entre el valor observado de la respuesta # el valor predictivo por el modelo :el valor
ajustado<. Por ejemplo" si el valor de respuesta observado es =8 # el modelo predice =;" el residual es 8.
9u#osiciones
Para confirmar que tu anlisis de regresión es vlido" tu debes verificar todas las suposiciones sobre los residuales. ,sa las graficas
de la residual para comprobar que los residuales/
• >ean aleatorios :independientes el uno del otro<
• Est7n normalmente distribuidos.
• Tienen la misma discrepancia a trav7s de todos los valores de S
.ota / >i tienes ms que una columna de residuales # Kits sobre su hoja de trabajo" se cuidadoso al seleccionar las columnas
correctas cuando crees las graficas de la residuales.
'esidual %lot
1! Escoja 9tat ? 'egresi&n ? 'esiduales %lots0
$! $ompletar el recuadro como se indica a continuación/
50
! Q$lic@ 1@
Inter#retando tus residuales
7a grá5ica de #robabilidad de Normalidad
,sa la grafica de la probabilidad normal de la residual para verificar que el residual no este desviada sustancialmente de la
distribución normal.
• >i los residuales viene de una distribución normal" los puntos apro3imadamente seguir una línea directa.
• >i los residuales no vienen de una distribución normal" los puntos no seguir una línea directa.
(asado en este grafico" es razonable asumir que los residuales para sus datos no se desvía considerablemente de una distribución
normal. ,na prueba de normalidad para estos datos :no mostrado dio un p-valor de ;.858.<
2istograma
Tu puedes usar el histograma de las residuales para evaluar la normalidad. >in embargo" la grafica de probabilidad normal es
generalmente ms fcil para hacer de interpretar" sobre todo para pequeVas muestras.
Inter#retaci&n sus resultados
51
Erá5ica
'a grfica presenta los residuales en el orden de la recolección de los datos : proporcionando los datos que fueron entrados en el
misma orden en la cual ellos fueron recogidos<. ,se la grafica para verificar que el residual es independiente.
• >i ha# un efecto debido a la orden de recolección de datos" el residual no estar disperso aleatoriamente sobre el cero. Tu debes
ser capaz de detectar este patrón en la grfica.
• >i no ha# ningSn efecto debido al orden de recolección de datos" los residuales estar disperso aleatoriamente sobre el cero
.o aparece haber en ningSn momento efecto de orden en el set de datos presentes.
Inter#retando tus resultados
'esiduales Versus Fits
,se el grafico de los residuales versus ajustes para verificar que/
• El modelo no omite ningSn termino cuadrtico.
• 'a variación es constante es constante a trav7s de todos los valores ajustados.
• .o ha# valores fuera de línea en tus datos.
>i tu puedes ver cualquier tipo de patrón en esta grafica" una de estas suposiciones ha sido violada.
'a tabla debajo resume el patrón típico que puedes ver.
El #atr&n Indica
$urvilíneo ,n t7rmino cuadrtico
puede fallar en tu
modelo
'a e3tensión desigual
de las residuales a
trav7s de los diferentes
valores ajustados.
'a variación de las
residuales no es
constante.
,n punto est situado
mu# lejos del cero.
Esta fuera de línea.
52
'a grafica de los datos no parece revelar ningSn patrón.
8onsideraciones 5inales
$onclusiones #rácticas
El anlisis simple de la regresión linear reveló que el aumento de los ritmos de revoltura est asociados a los niveles crecientes de
impurezas en su pintura
'a pendiente de la ecuación de la regresión indica que cuando tu aumentas el ritmo del revolvimiento en = rpm" el nivel de impurezas
aumenta en ;.C5!!C6.
Tu puedes usar la ecuación para determinar qu7 las impurezas sern diferentes para las mezclas de pintura. >in embargo" la
ecuación es solamente vlida para la gama de datos que usted ha hecho un muestreo :revolviendo entre 8; # C8<.
8onsideraciones estadísticas
Tu no puedes utilizar el anlisis de la regresión para afirmar que los cambios en la predicción fueron causados por la respuesta" a
menos que los valores del predictor fueran fijos en los niveles predeterminados en un e3perimento controlado. >i los valores de los
predictor se permiten variar aleatoriamente" otros factores pueden influenciar la predicción # la respuesta.
Tu no debes aplicar los resultados de la regresión a los valores que son de S que estn fuera de su gama de la muestra. Por
ejemplo" Tu no debes utilizar la ecuación de la regresión derivada en este ejemplo para predecir los niveles de impureza para un
índice del revolvimiento de =;;" porque los ms altos ritmos de revolvimiento implicada en el anlisis son de C8. 'a relación entre
%evolvimientos # la impureza puede ser mu# diferente para el ritmo de revolvimientos de C8.
Ten cuidado de las líneas de fuera cuando uses el procedimiento de regresión. &lgunas líneas de fuera: llamadas
Est7 alerta para los afloramientos al usar procedimientos de la regresión. &lgunos afloramientos :llamados puntos altos de
apalancamiento< tienen un efecto grande en el clculo de la línea menor de la regresión de los cuadrados. En tales casos" la línea
puede no representar el resto de los datos mu# bien.
E"ercicio $!1
%rotectores de Erosi&n
E"ercicio
Tu estas intentando predecir cómo los protectores de acero de la erosión para las turbinas de vapor resisten la p7rdida de la abrasión.
'a resistencia directamente que mide a la abrasión es difícil" costosa" # destructiva. Por lo tanto" tu esperas poder predecir la
resistencia a la abrasión usando la dureza de acero" que es ms conveniente # menos costosa medir.
'ecolecci&n de datosA
'a p7rdida # la dureza de la abrasión de la recolección de datos fueron medidas para 8C protectores aleatoriamente seleccionados de
la erosión.
53
Instrucciones
=. ,tilice la Kitted 'ine Plot para ajustar el modelo simple de la regresión linear con la abrasión como la respuesta # la dureza como el
predictor/ -nclu#a la confianza # la predicción en sus resultados" # asegSrate de almacenar las residuales # los ajustes.
8. ,tiliza los diagramas residuales de validar las suposiciones necesarias.
>et de Aatos
E%N>-N..*P+
'EE'E9INN %17IN1MIA7
E"em#lo del caudal de la corriente!
E"ercicio
Tu ests conduciendo un estudio de los impactos para el medio ambiente # quieres utilizar la profundidad de una corriente para
estimar el caudal.
'ecolecci&n de datosA
'a profundidad # el flujo fueron registrados para una sola corriente en un periodo de ! meses.
2erramientas
Era#3 : #lot!
9tat : 'egression : Fitted 7ine %lot!
9tat : 'egresi&n : Argumentos 'esiduales!
9et de DatosA
K'NJ.*P+
'egresi&n %olinomial
;<ue es 'egresi&n #olinomial>
$omo la regresión lineal" 'a regresión polinomial e3amina la relación entre una variable continua de la respuesta :M # una variable del
predictor :S<. Es diferente de la regresión simple" sin embargo" un modelo polinomial puede incluir los t7rminos para los e3ponentes
de S/
54
Aonde M es la respuesta" S es el predictor" Uo es el coeficiente para el t7rmino linear" U= es el coeficiente para el t7rmino ajustado" U8
es el coeficiente para el t7rmino cuadriculado" U6 es el coeficiente para el t7rmino cubicado" # c es error al azar.
;8uándo utili4ar la 'egresi&n %olinomial>
,sa la %egresión Polinomial cuando tengas tiene una M continua # un solo S" # evidencia o teoría sugiriendo no-linealidad.
• S Puede ser ordinal o continuo o en la teoría.
• En teoría S debe ser fijo. En la prctica" sin embargo" se permite a menudo variar.
• $ualquier variación aleatoria en la medida de S se asume como insignificante comparado en el rango en donde es
medida ).
Aespu7s de aceptar los resultados en el anlisis de la regresión simple" tu debes verificar que las siguientes suposiciones acerca del
residual sean validas en tus datos.
• Aeben ser independientes :# así al azar<.
• Aeben ser distribuidos normalmente.
• Aeben tener variación constante a trav7s de todos los valores de S.
;%or?u= usar la 'egresi&n %olinomial>
'a %egresión Polinomial te puede a#udar a responder preguntas tales como/
• 0-ncrementando S incrementa M para algunos valores del rango # disminu#e para otras1
• 0Lu7 valor puedes tu esperar para M cuando S es 8;1
Por ejemplo"
• 0&gregando ms cobre a su aleación siempre es mas fuerte o la fuerza disminu#e en concentraciones ms altas1
• $omo puedes esperar que tu aleación sea de ;.;=I de cobre.
Dibu"ando los datos
Para visualizar la relación entre la profundidad de la corriente # el caudal" utilice el diagrama para crear un scatterplot con la
respuesta :flujo< en el #-a3is # el predictor :profundidad< en el 3-a3is.
Plot
1!- &bre el Project K'NJ.*P+.
$!- Elija El Era#3 : %lot
!- $ompleta el recuadro como se indica a continuación/
55
(!- $lic@ 1@
Inter#retando tus resultados
'a grfica revela una relación potencialmente no lineal entre la profundidad # el flujo.
Por ejemplo" .ote que un aumento =.5- pies en profundidad a partir de la ;.5 a 8 pies parece aumentar dos veces el flujo tanto como
un aumento en profundidad a partir del !.; a B.5 pies.
A"ustando el modelo linear
,sa la grafica del modelo linear" para evaluar que tan bien esta el modelo de regresión linear en los datos.
Fitted 7ine %lot
1!- Elige 9tat : %egression : Fitted 7ine %lot!
$!- $ompleta el recuadro como se indica a continuación/
56
!- $lic@ 1@
Inter#retando tus resultados
'a ecuación linear que mejor describe los datos es/
Klujo F ;.6;=!B8 P ;.;B8!6H5 Profundidad
'
$
H'-r-9?J
El %
8
para el modelo linear indica que H=.5I de la variabilidad en flujo es e3plicado por profundidad de la corriente.
;<ue sigue>
*ientras que un porcentaje de la variabilidad es e3plicado por el modelo linear" parece una línea levemente curvada cabría incluso
mejor. Tu debes evaluar cómo en modelo cuadrtico caben estos datos.
'egresi&n %lot
A"ustando el Modelo 8uadrático
57
,sa el Kitted 'ine Plot para cuadrar tu modelo de regresión cuadrtico. &lmacene los ajustes # las residuales para una ree3aminación
ms futura.
Fitted 7ine %lot
1!- Elige el 9tat : 'egresi&n : Fitted 7ine %lot o presiona $trlPE para volver a Fitted 7ine %lot del recuadro.
$!- $ompleta el recuadro como se indica a continuación/
!- $lic 9torage!
(!- $ompruebe las 'esiduals # los Fits.
)!- $lic@ 1@ en cada recuadro.
Inter#retando tus resultados
Ecuación de %egresión
'a %egresión cuadrtica que mejor describe los datos es/
Klujo F ;.8C586; P ;.=66;8B Profundidad
- ;.;;4B=;; Aepthee8
'
$
H'-r-9?J y '
$
- ad"untos H' - 9?Had"JJ
%
8
indica que el modelo cuadrtico considera H!.;I de la variabilidad en el caudal. fste es algo ms que el %
8
de H=.5I obtenidos
con el modelo linear :v7ase 6-68<.
'a estadística ajustada de %
8
estadística ajustada es ajusta segSn el nSmero de t7rminos en el modelo" # debe ser utilizada al
comparar modelos con diversos nSmeros de predictores.
El %
8
ajustado para el modelo cuadrtico :H5.6I< es ma#or que el %
8
ajustado para el modelo linear :H;.BI<" indicando que el t7rmino
adicional mejora la predicción.
'egresi&n %lot
58
Inter#retando tus resultados
,tilizan una _ ;.;5 para todas las pruebas.
Análisis de Varian4a
El p-valor para el modelo en su totalidad :;.;;;< es significativo" indicando que el modelo es Stil.
El p-valor para el t7rmino linear :;.;;;< es tambi7n significativo" indicando que e3plica una cantidad significativa de variabilidad.
Pasado" el p-valor para el t7rmino cuadrtico :;.;;C< es significativo" indicando eso que agrega este t7rmino al modelo linear mejora la
predicción perceptiblemente.
Análisis %olin&mial De la 'egresi&nA
59
Era5icando los residuales
,tilizan las residuales # los ajustes correr graficas de diagnóstico en el modelo cuadrtico. Tu ests utilizando diagramas residuales
para verificar que las suposiciones sobre el t7rmino del error en el modelo de la regresión han sido encontradas.
'esidual %lots
1!- Elige 9tat : 'egresi&n : 'esidual %lots!
$!- $ompleta el recuadro como se indica a continuación/
!- $lic@ 1@
Inter#retando tus resultados
60
Diagramas de %robabilidad Normal
,sa los diagramas de probabilidad normal de los residuos para verificar que tus residuos no se desvían substancialmente de una
distribución normal.
• >i los residuos vienen de una distribución normal" los puntos seguirn una línea recta apro3imadamente
• >i los residuos no vienen de una distribución normal" los puntos no seguirn una línea recta
(asado en este diagrama" es razonable asumir que los residuos para tus datos no se desvían substancialmente una distribución
normal. : ,na prueba de normalidad para estos datos :no mostrado< permitió un p-valor de ;.6C;.<
2istograma
Puedes tambi7n usar el histograma de los residuos para evaluar la normalidad. >in embargo" la probabilidad normal es generalmente
ms fcil de interpretar sobre todo para las muestras pequeVas.
Inter#retando tus resultados
Era5ica 1
61
En la Orafica = se presenta los residuales en el orden de la recolección de datos :los datos que entraron en el mismo orden en los
que fueron recolectados< usa esta grafica para verificar que los residuos son independientes.
• >i ha# un efecto debido al orden de colección de datos los residuales en ceros no sern esparcidos al azar. Podrs detectar
una tendencia en el plot.
• >i no ha# efecto debido al orden de colección de datos" los residuales en ceros se esparcirn al azar
'os datos no aparecern en ningSn tiempo o los efectos del orden de los datos presentes.
Inter#retando tus resultados
7os residuales .s Fits
,se el plot de los residuales vs los Kits para verificarlo/
• El modelo no est perdiendo ninguna condición cuadrtica
• 'a variación es constante por todo los valores de los Kits.
• .o ha# datos fuera de línea.
>i ves cualquier tipo de modelo en el plot uno de estas asunciones ha sido violada. Tu puedes ver en el siguiente cuadro debajo el
resumen de los modelos típicos.
Este modelo -ndicag
$urvilíneo ,n t7rmino cuadrtico puede
estar perdiendo su modelo.
'a e3tensión desigual de las
residuales a trav7s de los diferentes
valores ajustados.

'a variación de los residuales
no es constante
,n punto est situado mu# lejos del
cero.
Kuera de línea

Agregando con5ian4a y #redicci&n a las 8intas
$reando una nueva fitted line plot del modelo agregando confianza # predicción a las cintas. *ostrando las cintas # los intervalos te
da una mejor idea de la variabilidad # estabilidad del modelo cuadrtico.
Kitted 'ine Plot
62
1!- Escoge >tat : 'egression : Fitted 7ine %lot!
$! -(ajo Ty#e o5 'egresi&n Model" Escoge <uadratic!
!-Pulse el botón las N#cions!
(!-$ompleta el recuadro como se indica a continuación/
)!- pulse el botón NT en cada cuadro de dilogo
Inter#retando tus resultados
El inter.alo de con5ian4a
El H5I intervalo de confianza define un rango probable de valores para la media de la población de b. para cualquier valor dado de )"
usted puede ser H5I seguro que la media de la población para b est entre las líneas indicadas.
El inter.alo de la #redicci&n
El H5I intervalo de la predicción define una demostración del rango de los valores de b por las observaciones individuales. Por
cualquier valor dado en ) tu puedes tener H5I de confiabilidad correspondiente al valor de b por una observación que ser dentro de
las líneas indicadas.

63
8onsideraciones Finales
8onclusiones #rácticas
El anlisis indica que la relación entre la profundidad de la corriente # proporción del flujo es ms bien cuadrtica que lineal. $uando
la corriente es baja" pequeVos incrementos se muestran en los resultados de la profundidad # grandes incrementos en el flujo. >in
embargo" cuando la corriente llega a ser mas profundo" los mismos incrementos en la profundidad causan menos cambios en el flujo.
8onsideraciones Estadísticas
Tu no puedes usar la anlisis de la regresión para afirmar que los cambios en las predicciones cambian las causas en la respuesta" a
menos que el valor predictivo fuere arreglado en la predeterminación de niveles en un e3perimento controlado. >i los valores
predictivos se permiten variar al azar" otros factores pueden influenciar en ambos los predictivos # la respuesta.
.o debes aplicar los resultados de la regresión para responder a los valores que estn fuera del rango de la muestra.
E"ercicio !1 Descarga Diesel
Estas investigando los efectos de humedad en las emisiones de la descarga de camiones diesel
'ecolecci&n de datos
'os datos son de la 2are $.T. :=HHB<. D'ight Aut# Aiesel Emisión $orrection Kactors for &mbient $onditionsh el informe final a la
&gencia de protección del ambiente bajo contrato .o. !4-;8-=BBB" -nstituto de la investigación sudoeste" >an &ntonio" T).
Instrucciones
1!- 'a información de la grafica visualiza la relación entre las variables.
$!- ,sa Kitted 'ine Plot para adaptar el modelo apropiado de regresión.
!- &segSrate de verificar las asunciones necesarias con las graficas los residuales.
9et de Datos
E' A-E>E'. *P+
64
'EE'E9INN MT7TI%7E
E"em#lo ( 'educiendo el gol#e del Motor
%roblema
Trataras de identificar las llaves predoctoras del golpe del motor.
'as siguientes variables estn bajo las siguientes consideraciones/
• 'a elección del momento adecuado de la chispa
• 'a proporción de aire-combustible :&K%<
• 'a temperatura de la succión
• 'a temperatura de la descarga
'ecolecci&n de los datos
'os datos son recolectados al azar de =6 motores seleccionados" todos trabajan con gasolina con un octanaje tasa de 4B.
2erramientas
Era#3 : MatriB #lot
9tat : Basic 9tatistics : 8orrelation
9tat : 'egression : 'egression
9et de Datos
T.N$T.*P+
'egresi&n M+lti#le
;8uál es la regresi&n m+lti#le>
'a regresión mSltiple e3amina la relación entre una respuesta continua variable :b< # ms de un predictor :)< de variables. 'a
ecuación general para un modelo de la regresión mSltiple es/
b .F U; P U= )= P U8 )8 P U6 )6 Pg. Pi
Aonde b es que la respuesta" U; es el intercepte cada )i es un predictor variable con una cuesta de Ui" # i es el error aleatorio.
8uándo usar la regresi&n m+lti#le
65
,se la regresión mSltiple cuando tienes un b continuo # ms de una ).
• ) puede ser ordinal" o continua.
• En teoría" ) debería arreglarse. En la practica" sin embargo" con frecuencia permite la varianza.
• $ualquier variación aleatoria en la medida de ) se asume que es una comparación insignificante en el rango en el cual ) es
medido.
&ntes de aceptar los resultados de anlisis de la regresión" debes verificar las siguientes asunciones sobre los residuales que son
vlidos para la información/
• Ellos deben ser independientes :# así aleatorios<.
• Ellos deben ser de distribución normal.
• Ellos deben tener una variación constante por todo los valores de ) .
%or ?u= usa la regresi&n m+lti#le
'a regresión mSltiple puede a#udar a contestar las siguientes preguntas/
0Lu7 tan importantes son tus variables ) en predicción con tus valores b1
0Lu7 valor esperas de b cuando )= es 8; # )8 es 61
0$unto cambiarn b si aumentas )6 por una unidad1
Por ejemplo"
0$ómo procesas la temperatura # porosidad relacionada a la dureza del acero1
0Lu7 tan duro esperas que tu acero esta si tu proceso se encuentra a cierta temperatura por cierto tiempo1
0Lu7 tan resistente es la dureza del acero si incrementas la temperatura a =;; d1
8reando una Matri4 %lot
,saras primero una matriz plot # coeficientes de correlación primero para ver si las relaciones e3isten entre la contestación
inconstante # las variables de la predicción.
Variables del grá5ico
Es ms fcil mirar la relación entre la respuesta # la predicción cuando entras en la respuesta de la ultima variable en las variables
del grfico.
Matri4 %lot
1!- &bre el pro#ecto T.N$T.*P+
$! - Escoge Era#3 : Matri4 %lot!
!- $omplete el recuadro como se indica a continuación/
66
(! - $lic@ Nptions!
)! - (ajo Matri4 Dis#lay Escoge 7o6er 7e5t!
*! - $lic@ 1@ cada recuadro.
Inter#retando tus resultados
'os resultados inclu#en los grficos para cada combinación de variables.
Kíjate para evaluar la relación entre el golpe # las predicciones.
Parece ser una correlación negativa entre el golpe # chispa. &llí tambi7n parece ser correlaciones positivas entre el golpe # cada uno
de las predicciones restante
;<u= sigue>
,sa la correlación para evaluar las fuerzas de relación lineal.
67
8álculo de las 8orrelaciones m+lti#les
$ree una matriz de correlación para evaluar las asociaciones entre el golpe # las predicciones.
8orrelaci&n
1!- Escoge 9tat:Basic 9tatistics:8orrelation
$!- $ompleta el recuadro como se indica a continuación/

!- $lic@ 1@

Inter#retando tus resultados
'a salida inclu#e el coeficiente de correlación # el p-valor para cada par de variables. :,se un ;.;5 para todas las comparaciones.<
,na sugerencia en la matriz plot" ha# una correlación negativa significante entre el golpe # chispa : r F -;.!HH" pF;.;;4<. 2a#
tambi7n" correlaciones positivas significantes entre el golpe # cada uno de las predicciones restante/
• &K%:r F ;.H!="P F ;.;;;<
• -nta@e : r F;.!B6.P F ;.;=8<
• E3haust : r F ;.!48" P F ;.;=;<
<ue sigue!
Porque &K% tiene la relación lineal ms fuerte con la regresión de uso de golpe para ajustarse a un modelo de la regresión lineal
simple con el golpe como la contestación # &K% como las predicciones.
68
Enca"ando a un modelo de la regresi&n sim#le
,sa la regresión para realizar un anlisis de la regresión lineal simple para el golpe # &K%. Podrías tambi7n usar Kitted 'ine Plot
antes de realizar un anlisis.
'egresi&n
1!- Escoja 9tat : 'egresi&n : 'egression
$!- $ompleta el recuadro como se indica a continuación/
!- $lic@ 1@
Inter#retando tus resultados
Ecuaci&n de la 'egresi&n
69
'a ecuación relacionada con la respuesta # la predicción es/
Tnoc@ F 85.5PC.85 &K%
Esto indica que el golpe aumenta C.85 veces por el aumento de la unidad en &K%
Tabla de coe5icientes
'as hipótesis para cada coeficiente es/
• 2o/ el coeficiente es igual a cero
• 2=/ el coeficiente no es igual a cero
El valor-p para la constante :U; " la intercepción< # el coeficiente de &K% :U=" la cuesta< ambos son menores de ;.;5. &sí nosotros
podemos rechazar 2o para cada uno a los ;.;5 E-level # concluimos que estos coeficientes no son cero. En este modelo" &K% es una
predicción significativamente estadística del golpe.
El anlisis de la regresión/ el golpe contra &K%
Inter#retando tus resultados
'UH'-9?J
El %j indica los H8.6I de la variabilidad del golpe predicho por este modelo.
El Análisis de la .arian4a
'lamada que las hipótesis para un modelo de la regresión lineal simple son/
• 2o/ U= es igual a cero
• 2=/ U= no es igual a cero
;<u= sigue>
El modelo de la regresión simple con &K% es Stil para la predicción del golpe. >in embargo" es posible que el Power de la predicción
adicional puede ser ganada inclu#endo otras predicciones en el modelo de regresión.
El análisis de la regresi&nA el gol#e contra AF'
70
EBaminando la asociaci&n residual
7os residuos contra las .ariables
,na t7cnica por determinar si otras variables pueden ser importantes en predecir la respuesta es la grafica de los residuales contra
cada predicción potencial.
'egresi&n
1!- Escoja el 9tat : 'egresi&n : 'egression o presione ctrlPE para regresar al cuadro de dilogo.
$!- $lic@ Era#3ics!
!- $ompleta el recuadro como se indica a continuación/
71
(!- Pulse el botón NT en cada recuadro.
Inter#retando tus resultados
$uando el plotted en contra de la descarga" los residuales no parecen completamente aleatorios. 'os residuales aparecen ms
grandes para los valores de descarga ms grandes. Esto indica que la descarga puede ser Stil respondiendo a la variabilidad adicional
en el golpe.
'a entrada # la chispa tambi7n parecen ser relacionadas con el golpear # pueden responder a la variabilidad adicional.
Es posible para dos o ms variables e3plicar la misma variabilidad en la respuesta. En este caso" el modelo final puede que no
inclu#a todas las variables.
72
73
Enca"ando a un modelo de la regresi&n m+lti#le
,sa la regresión para analizar el modelo de la regresión mSltiple con todos las cuatro predicciones.
'egresi&n
1!- Escoge 9tat : 'egresi&n : 'egresi&n o presione $trl.PE para regresar a la 'egresi&n en el recuadro.
$!- Presione K6 para borrar el cuadro de dilogo
!- $ompleta el recuadro como se indica a continuación/
(!-$lic@ 1@.
Inter#retando tus resultados
,se un E de ;.;5 para todos los anlisis.
Ecuaci&n de regresi&n
74
'a ecuación que relaciona la respuesta # la predicción es/
Tnoc@ F 86.4 - ;.8H! P6.=H &K% P;.65H entrada P ;.;=6C descarga
Tabla de coe5icientes
Tenga el cuidado al interpretar los coeficientes de la regresión mSltiple.
El p-valor para cada variable sólo indica si es significante en el modelo presente.
Por ejemplo" la chispa no es una predicción significante en el modelo presente :p F ;.6!6<. >in embargo" si quitas la descarga del
anlisis" la chispa se hace significativa" est altamente correlacionados :r F - ;.B86"p F ;.;;5" vea pgina 6.CH< # así e3plica la misma
variación en el golpe.
El análisis de la regresi&nA el gol#e contra la c3is#aD succi&nD la descarga"
Inter#retando tus resultados
8uidado con multicolinealidad
$uando las predicciones son sumamente correlacionadas" la estimación del coeficiente de regresión puede ser inestable :>ignifica
que varían ampliamente de un ejemplo al siguiente<. Esta condición es llamada multicolinealidad" # eso hace que la evaluación sea
importante en t7rminos individuales en la dificultad del modelo.
Puedes usar la correlación para tratar de identificar las fuentes potenciales de la multicolinealidad. >i ha# multicolinealidad e3trema en
un modelo" *-.-T&( mostrar un mensaje en la ventana de la sesión # quita una o ms variables para reducir el problema.
Nunca ?uites mas de una #redicci&n en ning+n momento
,na buena forma de Escoger las predicciones de un modelo de regresión mSltiple es tratar a todas las combinaciones potenciales
usando el modelo de procedimientos de comparación como el mejor subconjuntos o una regresión gradual.
El análisis de la regresi&nA el gol#e contra la c3is#aD succi&nD la descarga
75
Inter#retando tus resultados
'UH'-9?J y 'U a"ust& H'-9?Had"JJ
El nuevo modelo e3plica H4.4I de la variabilidad en la respuesta" lo cual es una mejora sobre el %j logrando usar solamente &K%
para predecir el golpe
>in embargo %j nunca disminuir cuando aumente la predicción al modelo" aun cuando eso no resulte un buen modelo. 'a estadística
de %j ajustada :%->q:adj< F H4.8I< es ajustado para el nSmero de condiciones en el modelo" # debe usarse cuando son comparados
los modelos con diferente nSmeros las predicciones.
El %j ajustado para el modelo con sólo &K% como el predictor tenía H=.!I aVos. así" el modelo actual con un %j esta ajustado H4.8I
se mejora.
Análisis de Variaci&n
'as hipótesis para un modelo de la regresión mSltiple es/
2o/ todo U= :a e3cepción de U;< son iguales a cero
2=/ al menos uno Ui :no inclu#e U; < no es igual a cero
Porque p :;.;;;< es menos que E :;.;5<" puedes rechazar 2o.
El modelo de la regresión" con la chispa" &K%" >ucción" # descarga como las predicciones" es significativamente mejor que la
restricción del modelo el cual inclu#e no predicciones.
El análisis de la regresi&nA el gol#e contra la c3is#aD succi&nD la descargaD
76
$onsideraciones Kinales
8onclusiones #rácticas
'a ecuación de la regresión para la $hispa usando ejemplar" &K%" >ucción # Aescarga para predecir el Oolpe es/
El golpe F 86.4-;.8H! $hispa P 6.=H &K% P ;.65H >ucción P;.;=6C Aescarga.
Este modelo responde de H4.4I de la variabilidad en el Oolpe.
2a# problemas del multicolieanidad con el modelo. >in embargo" la chispa sumamente correlacionado con la Aescarga.
En el pró3imo ejemplo" usars los mejores >ubconjuntos para procesar a todos los posibles modelos con estas cuatro predicciones #
Escoger el mejor.
8onsideraciones estadísticas
.o puedes usar el anlisis de la regresión para afirmar que los cambias en las predicciones causan cambios en la respuesta" a
menos que los valores de las predicciones cambien niveles predeterminados en un e3perimento controlado. >i los valores de las
predicciones variar al azar" otros factores pueden influir en las predicciones # la respuesta.
.o deberías aplicar los resultados de regresión # los valores de respuesta que son salidas de tu rango de los ejemplos.
'a precisión de medida es importante. 'a falta de precisión te lleva a la ine3actitud estimada de los coeficientes.
Ten cuidado de no pasar por alto los factores potencialmente importantes al diseVar un estudio de regresión.
Tenga cuidado con multicolinealidad.
$uando las variables de la predicción estn sumamente correlacionadas/
• 'os coeficientes estimados de la regresión pueden ser inestables :Ellos pueden variar ampliamente de una muestra a la
siguiente muestra<
• Puede ser difícil evaluar la importancia de las condiciones individuales del modelo.
Nunca ?uite más de una #redicci&n en ning+n momento.
,na buena forma de Escoger las predicciones de un modelo de regresión mSltiple es tratar a todas las combinaciones potenciales
usando el modelo de procedimientos de comparación como el mejor sub conjuntos o una regresión gradual.
77
*ejores >ubconjuntos de la %egresión
El ejemplo 5 %educiendo el Oolpe del *otor
%roblema
Ests intentando identificar las variables importantes que efectSan el Oolpe del motor. 'as siguientes variables estn bajo las
consideraciones/
• 'a elección del momento adecuado de la chispa
• 'a proporción de aire-combustible :&K%<
• 'a temperatura de la succión
• 'a temperatura de la descarga
'ecolecci&n de datos
'os datos son recolectados al azar de =6 motores seleccionados
2erramientas
9tat : 'egressions:Best subsets!
9tat:'egressions:'egressions!
9et de Datos
T.N$T.*P+
'EE'E9I1NE9 DE 719 MEO1'E9 9CB81NOCNT19
;8uál es el me"or subcon"unto de regresi&n>
'a regresión de los mejores subconjuntos evalSa todas las posibles combinaciones de las predicciones para a#udarle a determinar
qu7 combinación hace al mejor modelo de las regresiones. *-.-T&( usa un criterio de %8 m3imo para Escoger al mejor modelo .
Ntro criterio puede proporcionar a un modelo diferente.
;8uándo usar los me"ores con"untos de regresi&n>
,se la regresión de los mejores subconjuntos cuando usted tiene mucho potencial de predicciones # así varios modelos de regresión
para Escoger.
;%or ?u= usar el me"or subcon"unto de regresi&n>
'os mejores subconjuntos pueden disipar las siguientes preguntas/
• 0 Lu7 combinación de tus factores es 7l ms eficaz para predecir tu respuesta1
• 0$ul es el mejor modelo de regresión posible usando de 5 a 8; predicciones1
Por ejemplo"
• 0Est un modelo usando =; variables para predecir la suavidad del helado mas que uno que usa sólo temperatura # velocidad
en la mezcla1
Escogiendo un modelo a#ro#iado
78
,se los mejores >ubconjuntos para a#udarle a Escoger a un modelo de las regresiones mSltiples para el Oolpe # evita los problemas
siguientes/
• 'os modelos incómodos e ineficaces son el resultado de muchas predicciones.
• $oeficientes inestables que resultan de redundante # predicciones correlacionadas.
• 2abilidad inadecuada de predicciones que resulta pocas predicciones.
%redicciones libres
Entre todas las cuatro variables en las predicciones 'ibre. *-.-T&( probar todas las posibles combinaciones de estas variables # el
reporte estadístico para los mejores modelos. :Gariables de entradas de las Predicciones en todos los modelos sern incluidas en
cada modelo.<
Best 9ubsets
1!- >eleccione 9tat:'egressions:Best.
$!-$ompleta el recuadro como se indica a continuación/
!- $lic@ 1@
-nterpretando tus resultados
'os )s al derecho de la tabla indica qu7 predicciones son incluidas en cada modelo.
Variables
'a columna de Gars indica el nSmero de predicciones en el modelo.
'$ H'-9?J y '$ a"ust& H'-9?Had"JJ
&l comparar a modelos/
>i el nSmero de predicciones es el mismo" busque al modelo con el %8 ms alto.
>i el nSmero de predicciones es diferente" busque al modelo con el %8 ms alto.
8#
(usque a modelos dónde $p es pequeVo # acerca el nSmero de parmetros en el modelo. Por ejemplo" para modelo con 6
predicciones # el interceptor" busque a un modelo con un $p cerca de C 'a fórmula Para $p es/
8# K H99E#QM9EmJ-Hn-$#J
79
Aonde >>Ep son las sumas de error de los cuadrados para el modelo con los parmetros de p :incluso el interceptor<" *>Em el error
de la media cuadrada para el modelo con toda las predicciones de m" # n es el nSmero de observaciones.
'os mejores >ubconjuntos de regresión/ el Oolpe contra la $hispa" &K%" la >ucción" la Aescarga"
7a contestaci&n es el Eol#e
Inter#retaci&n tus resultados
Variabilidad
> es una estimación de la media variabilidad sobre la línea de las regresiones. *atemticamente" > es la raíz cuadrada positiva del
*>E. En general" tu quieres que > sea tan pequeVo como posible.
8onclusi&n
(asado en 7stos criterios" el modelo con &K%" la >ucción" # la Aescarga es el mejor. El modelo
$onteniendo todos las cuatro predicciones es comparable" pero > para este modelo es ligeramente ms grande # allí no parece ser
cualquier ganancia en %8 ajustado para usar el modelo. Es generalmente sabio Escoger al modelo ms simple a menos que un
modelo ms complicado sea claramente mejor.
7os me"ores 9ubcon"untos de regresi&nA el Eol#e contra la 83is#aD AF'D la 9ucci&nD la Descarga
7a contestaci&n es el Eol#e
80
E.aluando el +ltimo Modelo
,sa la 'egresi&n para evaluar al Sltimo modelo. $alcule la ecuación de regresión # confirme que todas las asunciones sobre los
residuales sean conocidas.
'egression
1!- Escoge 9tat : 'egresi&n : 'egresi&n
$!- En 'es#onse" enter @noc@.
!- En %redictors" enter &K% inta@e e3haust
(!- $lic@ Era#3s
)!- $omplete el recuadro como se indica a continuación/
81
!.- clic@ 1@ en cada recuadro.

Inter#retando tus resultados
,se una E de ;.;5 para todos los anlisis.
7a ecuaci&n de regresi&n
'a ecuación de regresión es/
El golpe F =!.5 P6.8= &K% PN.64! >ucción P;.;=!! Aescarga
Tabla del coe5iciente
El valor de p ms bajos :p k ;.;5< en la tabla del coeficiente indica que todas las condiciones en el modelo son significantes.
Análisis de .ariaci&n
Porque p :;.;;;< es menor que E :;.;5< puedes rechazar 2;. El modelo de la regresión que inclu#e &K%Z las >ucciones # la Aescarga
son significativamente buenas que el modelo restringido que no inclu#e ninguna predicción.
82
Inter#retando tus resultados
83
'as grficas residuales verifican que se han reunido todas las asunciones acerca de los residuales. 'os residuales/
• .o parta substancialmente de la normalidad.
• &parece la distribución aleatoria a cero.
• &parece tener la variación constante por los todos valores de ajustes.
• .o e3hiba un tiempo - el efecto del orden.
8onsideraciones 5inales
8onclusiones #rácticas
El mejor modelo para predecir el golpe es/
Tnoc@F =!.5 P6.8= &K%P;.64! -nta@e P ;.;=!! E3haust
8onsideraciones estadísticas
&ntes de usar el mejor subconjunto de regresión para evaluar los modelos de regresión que son diferentes" asegSrate de que tus
predicciones # respuestas son validas para todo el modelo potencial sean modelos validos de regresión.
Todos reglas # las guías tambi7n pertenecen a los modelos de la regresión mSltiple tambi7n aplican cuando Escoge un modelo que
usa este procedimiento.
84
E7 ANV7I9I9 DE VA'IA8INN
1b"eti.osA
• 8om#are gru#os de .ariables usando una #rueba de .arian4a!
• 8om#are las medias de las muestras recolectadas en di5erentes ni.eles de un solo 5actor utili4ando 1ne-Way AN1VA!
• 8om#are las medias de las muestras recolectadas en di5erentes ni.eles de un solo 5actor usando el análisis de la
media!
• 8om#are las medias de las muestras recolectadas en di5erentes ni.eles de uno o más 5actores utili4ando Balance
AN1VA!
• 8om#are las medias de las muestras recolectadas en di5erentes ni.eles en mas de un 5actor utili4ando el Modelo
7ineal Eeneral!
8ontenidos
E"em#los y e"ercicios %ro#&sito %agina
&.NG& sentido Snico 1*-1(/
Ejemplo =
El Precalentamiento del $%T Time
EvalSe la diferencia entre los medios del grupo para un solo
factor que usa un &.NG& Nne-Ja#.
El anlisis de la media 1)0-1)(
Ejemplo 8
El Precalentamiento del $%T Time %evisited
EvalSe la diferencia entre los grupos de medias usando
&nlisis de la *edia.
&.NG& equilibrado 1))-1*,
Ejemplo 6
El ,so de la pintura
Emplee el bloc@ing de variables para reducir la variación en un
anlisis usando (alanced &.NG&.
El *odelo 'ineal Oeneral 1*--1-)
Ejemplo C
'a Aistancia de frenado
EvalSe la diferencia entre las medias del grupo para factores
mSltiples que usan el Oeneral el *odelo 'ineal.
Ejercicio C.=
Prueba de Gino
EvalSe la diferencia entre las medias del grupo para factores
mSltiples que usan el Oeneral el *odelo 'ineal.
Ejercicio C.8
El Golumen de fosfato
EvalSe la diferencia entre las medias del grupo para factores
mSltiples que usan el Oeneral el *odelo 'ineal.
85
1ne Way AN1VA
E"em#lo 1
%recalentamiento del 8'T Time
E"ercicio
Tu ests probando tres lotes de tubos de ra#o catódico para determinar si los períodos del precalentamiento son consistentes.
'ecolecci&n de datos
,na muestra aleatoria de cuatro tubos se toma de cada lote # es probada durante el tiempo del precalentamiento.
2erramientas
9tat : AN1VA : Test 5or E?ual Variances!
9tat : AN1VA : 1ne-Way!
9et de datos
$%T.*P+
Nombre Ti#o de dato Ti#o de Variable Ni.eles
Tubet#pe .um7rico Kactor ="8"6
Timelsec .um7rico %espuesta
AN1VA 1ne Way
;<u= es AN1VA 1ne-Way>
Nne-Ja# &.NG& :&nlisis de varianza< procedimiento es una generalización independiente de las pruebas t. &l contrario de la prueba t. >in
embargo" Nne- Ja# &.NG& puede usarse para analizar las medias de ms de dos grupos :muestras< de una vez.
'a lógica bsica detrs de &.NG& es/
86
• 'a variación dentro del grupo sólo es debida al error aleatorio.
• Por consiguiente" si la cantidad de variación de los grupos es similar dentro de los grupos :lo alto dela grafica<" es probable que la media
del grupo sólo difiera tambi7n debido al error aleatorio.
• >in embargo" si la variación dentro del grupo es relativamente grande dentro del grupo de variación : grfico< es probable que las
diferencias entre las medias del grupo sean causadas por las diferencias por las marcadas de los niveles de factor.
;8uándo usar 1ne-Way AN1VA>
,se Nne-Ja# &.NG :tambi7n llamado el solo factor &.NG&< cuando tengas respuestas continuas de datos de dos o ms niveles fijos de un solo
factor.
&ntes de aceptar los resultados en el &.NG&" debes verificar las siguientes suposiciones acerca del residual # validar los resultados.
• 'a residual debe ser independiente : # ser la azar<.
• 'a residual no tiene una desviación sustancial de la distribución normal.
• 'a residual debe tener constantes variaciones a trav7s de los niveles de factor.
;%or ?u= usar 1ne Way AN1VA>
Nne-Ja# &.NG& te puede a#udar las preguntas de la respuesta como/
• 02a# diferencias entre los productos de tus proveedores1
• 02a# diferencias entre los tratamientos de los grupos1
Por ejemplo
• 0 'a dureza de las muestras de plsticos de tus cuatro o proveedores son diferentes1
• 0'a combustión es ms eficaz cundo usas el aditivo de combustible &" ( o ningSn aditivo de combustible1
• 0'as fuerzas de las muestras plsticas son de sus cuatro proveedores diferente1 0'a combustión es ms eficaz cundo usted usa el
aditivo de combustible ,." combustible ( aditivo" o ningSn aditivo de combustible1
Galidando la Gariación -guales
,sa la prueba para las Gariaciones iguales para validar las suposiciones que las variaciones de todos los grupos comparados sean iguales.
'as respuestas de datos de cada grupo deben estar en la misma columna" con el nivel de factor indicado en otra columna.
,se el nivel de confianza de H5I por default.
Test 5or E?ual Variances
87
1!- &bre el pro#ecto 8'T!M%O!
$!- Escoge 9tat :AN1VA :Test 5or E?ual Variances!
!- $ompleto el cuadro de dilogo como indica a continuación?
(!- Pulse el botón 1@
Inter#retando sus resultados
Inter.alos de 8on5ian4a
'os intervalos de confianza son Stiles para comparar la M para las diferentes poblaciones. >in embargo" tu decisión acerca si las variaciones son
iguales deben ser basado en una prueba de varianza apropiada.
Ael grfico" aparece una sigma para el tubo tipo 8" ms largo que para los otros grupos.
%ruebas de las .ariaciones
'os resultados inclu#en dos pruebas de la variación separadas.
Lu7 prueba uses depende de tus datos/
• >i tus datos son continuos # normalmente distribuidos" use la Prueba de (artletths. :>í solamente se comparan dos grupos" un K-prueba
reportara instantneamente una prueba (artletths<.
• >i sus datos son continuos" pero no necesariamente normalmente distribuidos" use la Prueba de 'evenehs.
8onclusi&n
'os p-valores para ambas pruebas :pF;.=;; para (artletths TestZ pF;.8C4 para 'evenehs Test< es ma#or que ;.;5. Pero no ha# bastante evidencia
así : que con un nivel de ;.;5 M< se conclu#e que las variaciones no son iguales.
88
E"ecutando 1ne-Way AN1VA
,sa Nne-Ja# &.NG& para comparar la media del tiempo de calentamiento para diferentes tipos de tubos de ra#o catódico" # crea los grficos
para visualizar los datos.
1ne- Way
1!- Escoge el 9tat:AN1VA:1ne-Way!
$!- $omplete el recuadro como se indica a continuación/
89
!- $lic@ Era#3s!
(!- >elecciona Do#lots o5 data and BoB#lots o5 data!
)!- $lic@ 1@ en cada cuadro de dilogo.
Inter#retando sus resultados
BoB#lots
'a grafica bo3plot muestra que el rango de valores en el Orupo 8 es ms grande" que el de los otros grupos.
Dot#lots
'a grafica dotplot revela que el grupo 8 contiene una sola observación con un e3traordinario valor alto. $on sólo C observaciones en cada grupo"
tal línea de fuera tiene largos efectos en la media # una desviación de la muestra.
Tales fuera de línea como esta puede ser el resultado de una variación aleatoria" o ellos pueden indicar que algSn empalme pasó en tu proceso. Tu
debes investigar las líneas de fuera para determinar que causo que eso fuera posible.
Para el presente anlisis" asume que todas las observaciones son vlidas.
90
91
Inter#retando sus resultados
El análisis de .arian4a
'a primera fila en la tabla del anlisis de varianza contiene todas las estadísticas asociadas con el factor/ t#bet#pe. 'a siguiente fila contiene
todas las estadísticas asociadas con el error aleatorio : error<.
7os grados de libertad
'os grados de libertad :AK< se refieren al nSmero de valores usados para calcular la suma de los cuadrados :>>< para cada fuente.
7a suma de cuadrados
'a suma de cuadrados :>>< es la medida de la cantidad de variabilidad que cada fuente contribu#e a los datos. .ote que el importe global de
variabilidad en los datos :>> suman" 6B4.B< es igual al >> para el tubet#pe :==C.B< ms el >> para el Error :8!C.;<.
Media cuadrada
:*>< para cada fuente es igual al >> dividió por el AK.
• El *> para el factor es una estimación del promedio de la media junto con el grupo de variabilidad.
• El *> para el error es una estimación del promedio dentro del grupo.
AN1VA sentido +nicoA el timeXsec contra el tubety#e
92
Inter#retando sus resultados
F-estadística
K es el radio de la variabilidad contribuida por el factor de la variabilidad contribuida por el error. Es calculado como el *> para el factor :el
tubet#pe< dividió por el *> para el error.
$uando las diferencias entre el nivel de factor de la media es similar a las diferencias entre las observaciones de cada nivel. K ser cerrado a =.
>i la variabilidad entre el nivel de factor de la media es mas larga que la variabilidad entre las observaciones dentro del factor" K ser ms grande
que =.
El %-.alor
P-valor es la probabilidad que K sería tan grande como es :o ms grande< si su factor no tiene los efectos. $uando K es grande" sugiere que el
nivel de factor de la media es ms diferente que los esperados para la ocasión. &sí que p-valor es pequeVo.
93
,se el p - el valor de probar las hipótesis lo siguiente/
2o: hipótesis nula< todos los factores del nivel de la son iguales.
2=:la hipótesis alternativa< todos los factores del nivel de la son diferentes.
8onclusi&nA
Porque P es ma#or que :;.;5<" tu no puedes rechazar 2o. .o ha# suficiente evidencia para sugerir que los niveles de las medias son diferentes.
Inter#retando sus resultados
/)G 8Is indi.iduales %ara la Media
Para cada nivelado de tu factor *-.-T&( despliega el intervalo de confianza." &sí como lo siguiente las estadísticas/
• .--------- .Smero de observaciones.
• *ean--- *edia de las observaciones.
• >tAev--- Aesviación estndar de las observaciones
7os inter.alos de con5ian4a
'os intervalos de confianza representan rangos de valores probables para la media de cada nivel. Tu puedes estar seguro en un H5I que 9 : de
la población de la media< para cada nivel esta dentro del rango indicado.
94
$alculando los intervalos" *-.-T&( combina las desviaciones estndar de cada nivel con la estimación agrupada de M : desviación estndar de la
población< tambi7n llamada desviación estndar agrupada : Pooled >tAev<.
.ote que ha# mucho traslapo entre los intervalos para los tres los tipos de tubos diferentes. fsta es una buena indicación de que las medias no
son significativamente diferentes uno del otro
>in embargo" la prueba de la comparación es necesaria antes de que cualquier conclusión pueda figurar.
AN1VA sentido +nicoA el timeXsec contra el tubety#e
Validando las 9u#osiciones de la 'esidual
&ntes de que tu puedas confiar en los resultados de un Nne-Ja# &.NG&" tu debes revisar que todas las suposiciones acerca de la residual han
sido encontradas.
,sa Nne Ja# para crear unan grafica de residuales.
95
1ne-Way
1.-Escoja 9tat :AN1VA : 1ne-Way o presiona 8trs Y E para regresar al recuadro de 1ne Way!
$!-$lic@ Era#3s!
!- $omplete el recuadro como se indica a continuación
6 - $lic@ 1@ en cada cuadro de dilogo.
Inter#retando sus resultados
7a gra5ica de #robabilidad normal
,sa la grafica de probabilidad normal de la residual para verificar que tu residual no este desviado sustancialmente de la distribución normal.
• >i la residual viene de la distribución normal" los puntos seguirn una línea recta.
• >i la residual no viene de la distribución normal" los puntos no seguirn una línea recta.
(asado en esta grafica" es razonable asumir que la residual de los datos de $%T no estn desviados sustancialmente de la distribución normal.
96
$omo notaste previamente" ha# una línea de fuera en el conjunto de datos. Tu debes investigar la línea de fuera para determinar que fue lo que la
hizo posible.
Alternati.as
Tu tambi7n puedes usar un histolograma de la residual para evaluar la normalidad. >in embargo la grafica de probabilidad normal es generalmente
fcil de interpretar" especialmente para muestras pequeVas.
Inter#retando sus resultados
'esiduales contra Fits
,se la grafica de la residual versus las fits para verificar que las siguientes suposiciones han sido encontradas/
• Gariaciones constantes a trav7s de la combinación de todos los factores.
• .o estn fuera de línea los datos.
>i tS ves cualquier tipo de patrón en la grafica" una de estas suposiciones encontradas han sido violada. 'a tabla abajo resume los tipos de
patrones que tS puedes ver
97
7os #atronesA IndicaZ
'a e3tensión desigual de las
residuales a trav7s de los
diferentes valores ajustados.
'a variación de tu residual
no es constante.
,n punto est situado mu# lejos
del cero.
Kuera de línea.
2a# un residual e3traordinariamente alto da que la apariencia de una variación no constante. Tu debes poder determinar que causo esta línea de
fuera. Tal vez es apropiado volver a analizar los datos sin esta línea. >in embargo tu solamente deberías remover la observación para
estabilizarla" sin puede establecer que no era representativo de la población.
Inter#retando sus resultados
7a residual .ersus el orden
,tiliza la grafica de la residual contra el orden para verificar que la residual es independiente.
98
• >i ha# un efecto debido al orden de la recolección de los datos" los residuos no se esparcirn aleatoriamente cerca del cero. Tu debes ser
capaz de detectar este patrón en la grafica.
• >i ha# un efecto debido al orden de la recolección de los datos" la residual esta aleatoriamente cerca del cero.
'a grafica revela la misma fuera de línea identificada en la grafica de residual contra el Kitted values plot.
-gnorando la línea de fuera por un momento" ha# dos valores mu# bajos que ocurren uno despu7s del otro.
Tal vez en alguna causa especial causo que la recolección de los tubos # las pruebas del tiempo de calentamiento fueran mas rpidamente que
los otros tubos.
Tal vez valga la pena investigar.
Puede haber tambi7n evidencia de un aumento sistemtico en el precalentamiento para los primeros cuatro tubos probados.
8onsideraciones 5inales
8onclusiones #rácticas
El anlisis los tubos de ra#o catódico no revelaron ninguna diferencia en el tiempo de calentamiento. >in embargo e3isten problemas potenciales
con el estudio/
99
• Kuera de línea--- ,n valor aparece fuera de línea # debe ser investigado. Puede haber tambi7n evidencia de un incremento sistemtico en
el tiempo de calentamiento de los primeros cuatro tubos probados.
• 'os Patrones--- dos tubos consecutivos tienen ms corto el tiempo de calentamiento que lo normal.
• (ajo Power--- basado en una estimación de un 5.C=!" el power de la prueba para descubrir una diferencia de B segundos :a los ;.;5
nivel< es solamente de ;.8!C8 . Esto es est menos de un 8BI de oportunidad para descubrir una diferencia. Ae hecho en el orden tu
tienes un power de ;.4;" # deberías tener una diferencia de .4; segundosX
(asado en estos resultados" quizs el curso mejor de acción sería asegurar el proceso bajo control # recolectar muestras grandes # realizar la
prueba nuevamente. $on una sigma reducida de 6.; # una recolección de ! muestras de tubos de cada lote" tu puedes detectar una diferencia de
B segundo con un power de ;.H=66
8onsideraciones estadísticas
$omparando el nivel del factor mSltiple con un solo &.NG& es preferible a hacer una comparación de dos niveles del tiempo con dos muestras
separadas Esto es porque dirigiendo los aumentos de las pruebas e3tras incrementa tu posibilidad de error tipo = :rechazando 2o" cuando 2o
es verdadera.
'as suposiciones de la independiente son criticas. >i las observaciones son afectadas sistemticamente por otros factores que el que usted este
estudiando los resultados de este &.NG& son sin sentido.
'a suposición de la normalidad no es generalmente crucial especialmente en muestras grandes.
ANV7I9I9 DE 7A MEDIA
E"em#lo $ 8'T 'e.isi&n de tiem#o de calentamiento
%roblema
En el ejemplo = :pgina C-6< realizaste una prueba de tres lotes de tubo de ra#o catódico para determinar si los periodos de calentamiento son
consistentes.
8olecci&n de datosA
,na muestra al azar de los cuatro tubos es tomada de cada grupo # probadas para determinar el tiempo de calentamiento :'os datos de la
muestra son tomados del ejemplo =" Pagina C-6<.
2erramientasA
9tat : AN1VA :Analysis o5 Means
9et de Datos
8'T!M%O
Nombre Ti#o de dato Ti#o de Variable Ni.eles
Tubet#pe .um7rico Kactor ="8"6
Timelsec .um7rico %espuesta
100
Análisis de la media
;<u= es un análisis de la media>
.o es nada parecido que el &.NG&" el cual es usado para determinar si el nivel de la media difiere de algSn otro" el anlisis de la media
: &.N*< es usado para determinar si el nivel de la media es diferente de la gran media.
'a gran media es la media de todas las observaciones sin tener en cuenta el nivel. Por ejemplo/ si tS tienes cuatro observaciones por cada 6
niveles en el factor" la gran media es la suma de las =8 observaciones divididas entre =8.
El resultado de un anlisis de la media es usualmente similar al obtenido con el &.NG&. >in embargo/
• El anlisis de la media es generalmente ms sensible que el &.NG&" cuando un nivel de la media es difiere del resto.
• &.NG& es generalmente ms sensible que el anlisis de la media cuando los niveles de los grupos de la media son diferentes cada uno
de los otros.
;8uándo usar el análisis de la media>
,sa el anlisis de la media cuando tengas datos de uno o dos factores. 'os datos deben de proceder de la distribución normal" (inomial o
Aistribución de Poisson.
;%or?u= usar el análisis de la media>
El anlisis de la media te a#uda a responder preguntas tales como/
• 0Es un tratamiento mejor que el promedio1
Por ejemplo/
• Entre tablas tratadas con diferentes acabados" un acabado confiere mejor que el promedio de las otras características utilizadas.
Desarrollo del análisis de la media
,se el anlisis de la media para evaluar los datos. ,se un m de ;.;5 para la prueba
Análisis de la mediaA
=. - Elija/ 9tat : AN1VA :Analysis o5 Means!
8.- $omplete el recuadro como se indica a continuación
101
6.- Presione 1@
Inter#retando tus resultados
El anlisis de la media comparado con el nivel de la media :puntos negros< con la gran media :línea central verde. 'a gran media es la media de
las =8 observaciones.
>i un nivel de la media es ma#or o menor que el valor critico representado por la línea decisiva :en rojo< esta es significativamente diferente de la
gran media.
8onclusionesA
.inguno de los niveles individuales de la media de los datos de la $%T son significativamente diferentes de la gran media.
102
8onsideraciones 5inales
8onsideraciones #rácticasA
Aiferencias no significativas fueron detectadas en medio del nivel del factor de la media # de la gran media.
>in embargo recordemos que cuando los mismos datos fueron analizados Snicamente con el procedimiento de &.NG& se observaron algunos
problemas con el control del proceso. 'a ma#or desventaja del procedimiento de &nlisis de la media es que no suministra graficas de residual
para a#udarte ubicar problemas en los datos.
8onsideraciones estadísticas
'os resultados del anlisis de la media son usualmente similares a los obtenidos con &.NG&" >in embargo/
• El anlisis de la media es generalmente ms sensible que el &.NG&" cuando un nivel de la media es diferente del resto.
• &.NG& es generalmente ms sensible que el anlisis de la media cuando los niveles de los grupos de la media son diferentes cada uno
de los otros.
>i bien usando &.NG& con dos factores" el diseVo debe tener balance :esto es" debe tener los mismos nSmeros de observaciones por cada
combinación de niveles de factor.
>i bien usando &.NG& con datos binomiales" np # n:=-p< deben los dos tener por lo menos cinco" porque &.NG& usa una apro3imación normal
de la binomial : n es el tamaVo de muestra que deben tener todas las muestras" # P es generalmente proporcional.
Para datos de Poisson" la media debe ser por lo menos de 5.
103
Balance AN1VA
E"em#lo Desgaste de #intura
%roblema
Estas estudiando las características que deben llevar los cuatros diferentes tipos de pintura amarilla para carreteras.
'ecolecci&n de datosA
Pruebas de restos de cada pintura que fueron aplicadas en las carreteras de Kiladelfia" Pittsburg" 2arrisburg # >cranton" Pensilvania.
Aespu7s de un tiempo conveniente de e3posición al mal tiempo # al trfico" el desgaste de la pintura fue medido en cada una de las cuatro
localizaciones. ,n alto puntaje de la media arrojo que la pintura estaba erosionada.
2erramientasA
9tat : Ano.a-1ne-6ay!
Era#3 : 83art!
9tat-AN1VA : Balanced AN1VA!
9et de Datos
%NTWEA'!M%O
Balanced AN1VA
;<u= es el balance AN1VA>
(alance &.NG& es similar al &.NG&" e3cepto que las respuestas pueden ser clasificadas en dos o ms factores al mismo tiempo.
Por ejemplo/ 'a tabla de abajo es el diseVo de un estudio para evaluar si la temperatura del motor funcionando es un factor de ambos/ Peso del
aceite # las revoluciones por minuto del motor.
104
'a información de cada celda de la tabla representa la Snica combinación de %P* # aceite. 'as observaciones son clasificadas en las dos
variables.
;8uándo usar Balance AN1VA>
,sa (alance &.NG& cuando tengas respuestas continuas de datos fijos en uno o ms factores. 'os datos deben estar balanceados" Esto es"
Ddeben tener los mismos nSmeros de observaciones en cada celda del diseVo.
&ntes de aceptar los resultados en el &.NG&" debes verificar las siguientes suposiciones acerca del residual # validar los resultados.
• 'a residual debe ser independiente : # ser la azar<.
• 'a residual no tiene una desviación sustancial de la distribución normal.
• 'a residual debe tener constantes variaciones a trav7s de los niveles de factor.
;%or ?u= ?ue usar Balance AN1VA>
(alance &.NG& te puede a#udar a responder preguntas tales como/
• 02a# diferencias en tus productos a causa de varios factores identificados1
• 0>on ciertas combinaciones de los niveles de factor ideales1
Por ejemplo"
• 0El nivel de temperatura del motor funcionando cambia por el factor de %P* o Peso del aceite1.
• 0E3isten ciertos cambios de maquinas en tus planta que son mas productivos que otros" o es una maquina mas productiva en ciertos
cambios" pero no en otras1
E"ecutando 1ne Way AN1VA
Para una comparación" primero ejecuta one-wa# &.NG&" para analizar el desgaste de la pintura como un factor del tipo de pintura solamente.
1ne-Way AN1VA
1!- &bre el pro#ecto P.TJE&%.*P+.
$!- Escoge 9tat : AN1VA-1NE WAM !
!- En 'es#uesta enter PntJear.
(!- En Factor enter Paint.
)!- $lic@ 1@!
'%M
Aceite =";;; 8";;; 6";;;
5w6; %P* F =";;;
&ceite F 5w6;
%P* F 8";;;
&ceite F 5w6;
%P* F 6";;;
&ceite F 5w6;
=;w6; %P* F =";;;
&ceite F=;w6;
%P* F 8";;;
&ceite F=;w6;
%P* F 6";;;
&ceite F =;w6;
105
Inter#retando tus resultados
&unque la mejor pintura es la de b-;8C8 :media F =C.85< # la peor de b-=B85m :media F =;.B5< estas diferencias fueron no significativas Den el
nivel ;.;5 m :p F;.==5<.
Era5icando los datos
-nformación importante se pierde cuando no inclu#es el factor de localización en tu anlisis. Para ilustrar esto" usa el chart para crear unas barras
agrupadas ilustrando el desgaste de la pintura en función de ambos tipos/ de pintura # locacion.
83art
1!- Escoge Era#3 : 83art!
$!- $omplete el recuadro como se indica a continuación.
106
e &segSrate de cambiar para cada uno de Era#3 a Erou#!
!- $lic@/ 1#tions.
(!- %evisa el Erou# # enter Paint.
5.- $lic@ 1@ en cada recuadro.
Inter#retando tus resultados
'a grafica muestra una gran cantidad de variabilidad en los datos asociados con 'ocalización. En general" el menor desgaste de pintura se
presenta en Philadelphia # la peor en >cranton.
$uando tu no inclu#es D'ocalizaciónh en tu anlisis" esta variabilidad es atribuida al error :dentro del grupo con variación<. Esto disminu#e tu K
ratio.
107
Csando una segunda .ariable del blo?ue de .ariaci&n de 7ocaci&n!
-nclu#endo locación en tu anlisis quieres prevenir la variabilidad asociada con este factor" donde se les atribu#e el error. Esto incrementara tu
habilidad para detectar diferencias en desgaste de cada pintura.
,sa (alance &.NG& para analizar si el desgaste de pintura es un factor de ambos Pintura # 'ocalización. Esto es llamado/ AiseVo aleatorio
del bloque" porque el factor de inter7s es la pintura" # 'ocalización es incluido solamente para reducir el error de variabilidad" Tal factor es
llamado DGariable de bloqueh.
'a respuesta debe estar en una columna con descripciones # columnas adicionales indicando los niveles de cada factor por cada observación.
Balance AN1VA
1!- Escoge 9tat : AN1VA : Balance AN1VA!
$!- $omplete el recuadro como se indica a continuación
108
!- $lic@ 1@!
Inter#retando tus resultados
En este modelo el efecto de ambos/ Pintura # 'ocalización son significantes en un nivel ;.;5 m :p F ;.;;6 # ;.;;B respectivamente<.
.ote que el *> del error :tambi7n llamado *>E< en este modelo es solamente =.845" comparado con el C.=H; del modelo que no inclu#o
localización como factor" porque el *>E es el denominador de todos los K-ratios" reduciendo el *>E" incrementa el K-Galues.
109
Anali4ando el residual
Aespu7s de que confíes en los resultados de &.NG&" debes revisar" para estar seguro de todas las suposiciones acerca del residual que ha#as
encontrado.
,sa (alance &.NG& para crear una tabla de %esidual.
Balanced AN1VA
1!- Escoge 9tat : AN1VA : Balanced AN1VA # presiona $trl P E para regresar a Balance Analysis o5 Variance de los recuadros.
$!- $lic@ Era#3s!
!- *arca las cuatro opciones bajo 'esidual %lots!
(!- $lic@ 1@ en cada recuadro.
Inter#retando tus resultados
110
,sa un cuadro de distribución normal # un histolograma para verificar que tu residual no este desviado considerablemente de la distribución
normal.
• >i la residual viene desde la distribución normal" los puntos tienen una línea recta en la grafica normal # en el histolograma no tiene una
forma de campana recta.
• >i el residual no viene desde una distribución normal" los puntos no continSan en línea recta en la grafica .ormal # en el histolograma no
tiene forma de campana.
(asado en los recuadros" es razonable asumir que la residual no esta desviada sustanciablemente de la distribución normal. :.ormalmente
pruebas ejecutadas del residual :no presentadas en este ejemplo< produce que p F valor menos de ;.C86.<
111
Inter#retando tus resultados
,sa las graficas de residual contra el ajuste para verificar que las siguientes suposiciones han sido encontradas/
• Gariaciones constantes a trav7s de la combinación de todos los factores.
• .o estn fuera de línea los datos.
>i tS ves cualquier tipo de patrón en la grafica" una de estas suposiciones encontradas has sido violada. 'a tabla abajo resume los tipos de
patrones que tS puedes ver/
Para los datos del desgaste de pintura" la varianza de la residual
aparece bastante constante.
'os Patrones -ndicanggg
'a e3tensión desigual de las
residuales a trav7s de los
diferentes valores ajustados.
'a variación de tu residual no
es constante.
,n punto est situado mu#
lejos del cero.
Kuera de línea.
112
Inter#retando tus resultados
,sa la grafica de la residual contra el orden de los datos para verificar que las residuales son independientes.
• >i ha# algSn efecto debido a la recolección de los datos" la residual no ser aleatoriamente dispersa cerca del cero. TS sers capaz de
detectar este patrón en la grafica.
• >i no ha# algSn efecto debido al orden de la recolección de datos las residuales sern aleatoriamente dispersas cerca del cero.
.o ha# ningSn patrón que aparezca en las residuales" por lo tanto las suposiciones de independencia son validas.
8onsideraciones 5inales
8onclusiones #rácticasA
-nicialmente un simple anlisis de los tipos de pintura no revelo diferencias significativas. >in embargo cuando 'ocación fue incluida en el anlisis
de un bloque de variable" efectos significativos de la pintura fueron revelados.
Esto ilustra una de las ventajas del modelo de *ulti-Kactor &.NG&/
• TS puedes algunas veces disminuir la cantidad de un error ine3plicable de variación en la respuesta" si inclu#es factores adicionales en
el modelo.
• TS puedes algunas veces aprovechar recursos investigando dos o ms factores en el mismo tiempo.
• $on un modelo apropiado" tS puedes evaluar interacciones entre dos factores. Esta interacción ocurre cuando los efectos de un factor
cambian basndose en el nivel de algSn otro factor.
8onsideraciones estadísticasA
Para usar (alance &.NG& tus datos deben estar balanceados.
113
Es importante validar las suposiciones de la residual despu7s dibujando las conclusiones finales de los resultados de cualquier &.NG&.
Modelo 7ineal Eeneral
E"em#lo ( Distancia de 5renado!
%roblemaA
TS quieres conocer si la distancia que le toma a un carro para frenar en un pavimento mojado es afectada por los siguientes factores/
• El *odelo de la llanta :'lanta<.
• 'a banda de rodadura :Tread<.
• >i el seguro de freno es adecuado :&(><.
8olecci&n de datos
El mismo carro es utilizado para la recolección de los datos. 'a distancia requerida para frenar a una velocidad de C; millas por hora en un
pavimento mojado fue medida con cada combinación de llantas" banda de rodadura # el &(>. $orridas e3perimentales fueron realizadas en
orden aleatorio.
2erramientasA
9tat-Table : 8ross Tabulation!
9tat-AN1VA : Balanced AN1VA!
9tat-AN1VA : Eeneral 7inear Model!
9et de datos
(%&TEA->.*P+
.ombre Tipo de datos Tipo de variable .iveles
'lanta Te3to Kactor *)"OT"'>
(anda de
rodadura
.um7rico Kactor =;" =.5
&(> Te3to Kactor $apaz
.o capaz
Aistancia .um7rico %espuesta
Modelo lineal Eeneral
;<u= es el Modelo lineal general H E7MJ>
114
O'* es similar al (alance &.NG& e3cepto que/
• Puede ser usado en pruebas de diseVo no balanceadas.
• Puede ser usado tambi7n para comparar los niveles individuales de las medias.
;8uándo usar el Modelo lineal general>
,sa el O'* cuando tengas respuesta continSas de datos de niveles estables de uno o ms factores. El diseVo no debe ser balanceado.
Aespu7s de aceptar los resultados del &.NG&" tS debes verificar que las siguientes suposiciones acerca de la residual sean validas en tus datos/
• 'a residual debe ser independiente :# de esta manera al azar<.
• 'a residual no debe estar desviada sustanciablemente de la distribución normal.
'a residual debe tener constantes variaciones a trav7s de todos los niveles de factor.
;%or ?u= usar el Modelo lineal general>
O'* te a#uda a responder preguntas tales como/
• 02a# diferencia en tu producto debido a diferentes factores identificados1
• 0>on ciertas combinaciones de niveles de factor ideales1
Por ejemplo"
• 0El color de tu plstico cambia en función de la temperatura" humedad o presión1
• 0Es el color del plstico generalmente mejor cuando la presión es alta" o depende este de la presión1
1bser.ando los datos en la tabla
,sa $%N>> tabulación para crear una tabla con los datos para ver posibles diferencias entre doce combinaciones tratadas.
8ross tabulaci&n
1!- &bre el pro#ecto (%&TEA->.*P+.
$!- Escoge 9tat : Table-9tatistics descri#ti.e!
!- En 8lassi5ication .ariables enter Tire Tread &(>.
(!- En Asociated .ariables enter Aistancia.
)!- $omplete el recuadro como se indica a continuación.
115
*!- $lic@ 1@ en cada recuadro.
Inter#retando tus resultados
%rinci#ales e5ectos
.ote que la media de la distancia de frenado cuando el &(> no es utilizado es de H;.!!B. Este es ms largo que la distancia que requiere para
frenar con &(> :BC.B5;< la diferencia es llamada Principales efectos del AB9!
E5ectos de interacci&n
.ote que/
• $uando el &(> fue no utilizado" el =.5 mm de la banda de rodadura frena mas rpidamente
: media F H;.=! < que el =;.mm de banda de rodadura : media FH=.=!B<.
116
• $uando el &(> fue utilizado" el =;.; mm de banda de rodadura :media F B6.466< frena mas rpidamente que el =.5 mm de la banda de
rodadurah: media F B5.!!B<.
'os efectos son llamados interacci'n del &(> b# tread" porque los efectos de la banda de rodadura dependen del nivel del &(>. :>in embargo las
diferencias no son grandes. ,na prueba apropiada revelara que la interacción no es significante.
Anali4ando tu modelo com#leto
,sa el balance &.NG& para analizar el modelo completo. El modelo completo contiene todos los posibles efectos e interacciones.
Anotaciones
Para indicar los t7rminos de interacción" simplemente junta los nombre con un asterisco. Ae esta manera el modelo completo de frenado a
distancia de los datos contiene los siguientes t7rminos/
$omo un atajo el modelo completo puede ser usado tambi7n cargando los datos en barra vertical.
Tire Tread - &(>
'as barras verticales le dicen al minitab que considere los efectos principales e interacciones contenidas en medio de los t7rminos indicados.
Balance AN1VA
117
1!- Escoge 9tat : AN1VA : Balanced AN1VA.
$!-$omplete el recuadro como se indica a continuación
!- $lic@ 1@.
Inter#retando tus resultados
,sa el Galor de P" para la prueba de significancía de cada t7rmino. En este modelo los siguientes efectos son significantes en un ;.;5 m.
• 'lanta :p F ;.;;6<.
• &(> :p F ;.;;;<.
Porque hubo solamente dos niveles del &(> :capaz # no capaz<" tS sabes que la significancía en los t7rminos refleja diferencias significativas entre
los dos niveles.
%rueba de com#araci&n
Porque hubo tres niveles en las llantas" tu quieres realizar una comparación estadística en orden para determinar cuales niveles son diferentes
entre cada uno.
El procedimiento (alanced &.NG& no permite comparaciones individuales entre niveles de la media" por eso vas a usar el *odelo lineal general
para dirigir las pruebas despu7s de eliminar las no significancías # revisar el residual.
118
A"ustando el modelo reducido
El paso siguiente para ajustar el modelo reducido es removiendo los t7rminos no significantes. ,sa el modelo lineal general para ajustar el modelo
con solo la llanta # el &(>. :El modelo proporciona opciones para analizar las diferencias entre niveles individuales de la media<.
TS debes tambi7n crear graficas de residual" para poder validar las suposiciones de la prueba.
Modelo 7ineal Eeneral
1!- Escoge 9tat : AN1VA : Eeneral 7inear Model!
$!- 8om#lete el recuadro como se indica a continuaci&n!
119
!- 8lick Era#3s!
(!- %evisa las opciones bajo 'esidual %lots!
)!- $lic@ 1@ en cada recuadro.
Inter#retando tus resultados
$omo es esperado" ambos/ 'lanta # &(>" tengan una significancía de ;.;;5 m del nivel en el modelo ajustado.
120
Inter#retando tus resultados
(asado en la grafica de probabilidad normal # en el histolograma es razonable asumir que el residual no esta desviado sustanciablemente de la
distribución normal.
121
Inter#retando tus resultados
'a grafica de la residual contra el ajuste" confirma que la variación de la residual es bastante constante.
122
'a grafica de la residual contra el orden de los datos no presenta ningSn patrón" de esa manera las suposiciones de independencia parecen ser
validas.
.o parece haber ninguno fuera de línea.
123
Era5icando los #rinci#ales e5ectos e interacciones
8om#araci&n grá5ica de la media
&hora que tS te has establecido en un modelo" este es usado para visualizar los resultados del anlisis de la media utilizando las graficas # los
principales efectos e interacciones.
&unque tS has elegido no incluir todos los t7rminos del modelo final" es de mucha a#uda incluir todos los factores en las graficas para visualizar
t7rminos significantes # no significantes.
%rinci#ales e5ectos e interacciones gra5icas
1!- Elige 9tat : AN1VA : Main E55ects %lot!
$!- En 'es#onse presiona Distance!
!- En Factors presiona Tire Tread &(>.
(!- Presiona 1@!
)!- Elige 9tat : AN1VA : Interactions %lot!
*!- En 'es#onse presiona Aistance.
,!- En Factors presiona Tire Tread &(>.
-!- Presiona 1@!
Inter#retando tus resultados
124
'a grfica de efectos principales de llanta # &(> tienen líneas inclinadas" indicando que estos efectos son importantes.
En esta grfica esta claro que/
• 'a 'lanta con la distancia mas corta de frenado fue la OT.
• 'as distancias de frenado mas cortas fueron llevadas a cabo con el sistema &(>.
'a grafica de la banda de rodadura muestra una pequeVa inclinación sugiriendo que los efectos no son significativos. 'as bandas de rodadura
producen casi id7ntica frenada a distancia.
Inter#retando tus resultados
'as interacciones de la grafica muestran los dos sentidos de la interacción. 'os nombre de los factores a la izquierda de cada grafica son
representados en el eje b" # todos los factores llamados por debajo de cada grafica son representados en el eje ).
'as líneas de cada grafica en su ma#or parte paralelas" sugieren que no ha# interacción en medio de ningSn t7rmino. Pero es quizs alguna
evidencia de una interacción entre las llantas # la banda de rodadura pero el &.NG& índico que esto no fue significante.
125
8onduciendo la com#araci&n del desgaste de #intura
,tilice el modelo lineal para probar las diferencias entre los niveles de factores significantes.
Eeneral 7inear Model
126
1.- Elija 9tar : AN1VA : Eeneral 7inear Model!
$!- Presione K6 para regresar a las opciones generales
!- En 'es#onse enter Aistancia.
(!- En Model enter Tire &(>.
)!- Presiona 8om#arison!
*!- $ompleta el recuadro como se indica a continuación/
,!- Presiona 1@ en cada recuadro
Inter#retando tus resultados
,se un m de ;.;5 para todas las pruebas.
'a primera tabla compara las llantas OT con las '> # las *). 'os resultados revelan que el promedio de distancia de frenado obtenidos con las
llantas OT es significativamente mas bajo que los obtenidos con cualquier de las otras llantas '> :p F ;.;;;4< # *) :p F ;.;=6=<.
'a segunda tabla compara las llantas '> # *)" donde no hubo diferencias significativas :p F ;.CC6!<
8onsideraciones 5inales
8onclusiones #rácticas
En los t7rminos de frenado # pavimento mojado" la mejor llanta es la OT. Tambi7n es mejor tener el sistema &(> disponible" # no parece mu#
importante que la banda de rodadura sea de =;. mm o =.5 mm de profundidad.
8onsideraciones estadísticas
'as ventajas del procedimiento inclu#en lo siguiente/
127
• Puede ser usado con un modelo desbalanceado.
• Puede ser usado para evaluar las diferencias entre niveles individuales de medias.
Es importante validar las suposiciones del residual" antes de dibujar cualquier conclusión final de los resultados del &.NG&.
Este anlisis inclu#e factores estables significando que los niveles incluidos fueron de inter7s directo # no significo que fueran generalizados a
otros niveles. El procedimiento del modelo lineal general puede tambi7n ser usado con factores aleatorios" los cuales son factores para que los
niveles sean seleccionados aleatoriamente # sean pro#ectados para representar una ma#or población de posibles niveles.
,n ejemplo e3celente es un estudio de un gage %`%.
Todos los factores en este anlisis fueron cruzados significando por ejemplo" que cada nivel de llanta puede ser probado con cada nivel de banda
de rodadura. 'os factores son considerados jerarquizados si todos lo niveles de un factor suceden completamente dentro de un nivel de otro.
E"ercicio (!1 %rueba de .inos
%roblemaA
TS tratas de determinar si e3isten diferencias significativas en la calidad de tres vinos/ *atador" $onquistador # >aeta.
8olecci&n de datos
=; jueces de vinos probaron tres vinos cada uno # cada uno califico su calidad. El orden de las pruebas fue aleatorio # cada juez pruebo los
vinos en diferente orden.
-nstrucciones/
=.- ,se el modelo lineal Oeneral para analizar los puntajes en función del vino.
• -nclu#e los jueces en el bloque de variables para reducir la variabilidad.
• %ealiza el ajuste :Kits< # el residual.
• -nclu#e el pairwise comparación en el factor del vino en tus resultados.

8.- Oenera los efectos principales en la grfica de vinos.
6.- usa 9tat : 'egression : 'esidual %lots para validar las suposiciones del modelo.
9et de Datos
%-N+&.*P+
128
E"ercicio (!$ 8ontenido de 5os5ato
%roblema
TS quieres evaluar cuanto tiempo toma el uso del gravímetro contra el m7todo spectometrico para medir el contenido fosfato que contienen dos
tipos de material.
8olecci&n de datos
>eis ingenieros tomaron muestras del contenido de fosfato de cada material usando cada m7todo.
'os datos son de +. .eter" J. Jasserman # *.2. Tutner :=H45< &plicación lineal del modelo estadístico" segunda edición -rwin " -n. Pagina H6!.
Instrucciones
1!- ,se el modelo lineal general para analizar el tiempo como una función del material # del m7todo.
• -nclu#e a los ingenieros en el bloque de variables para reducir la variabilidad.
• %ealiza el ajuste :Kits< # el residual.
• -nclu#e el pairwise comparación # la interacción entre el m7todo e material en tus resultados.
$!- Oenera una grafica de interacción del material e m7todo.
!- ,sa 9tat : 'egression : 'esidual %lot para validar el modelo de suposiciones.
9et de datos
P2N>P2&b.*P+
129
Trabajo elaborado por
7ic! 8ecilia 8! Día4 Earcía
ccdiagarnhotmail.com
7ic! Ang=lica Es?ui.el
Ing! Maria Valle
*aestría en &dministración # 'iderazgo
*ateria Estadística para administradores
&lumnas de la ,niversidad del .oreste de $oahuila
130