Trabajo Final de Estadistica 2¡

MUESTRA ALEATORIA
En estadstica, una muestra es la seleccin de un numero de observaciones de a partir de

una poblacin objeto de investigacin; una muestra aleatoria es cuando la eleccin sigue
un mtodo impredecible. El muestreo aleatorio puede referirse tambin a tomar una serie
de observaciones independientes de la misma distribucin de probabilidad.
Las muestras nos permiten mediante la inferencia estadstica representar los resultados
de la poblacin de donde haya extrado, pero existiendo una potencial variacin al azar en
los resultados que se denomina error de muestreo. En el caso de muestras aleatorias, la
estadstica dispone de medidas para evaluar el error de muestreo.
Por lo tanto, las estimaciones obtenidas a partir de muestras aleatorias pueden ir
acompaadas de medidas de la incertidumbre asociada a la estimacin. Esto puede tomar
la forma de un error estndar, o si la muestra es lo suficientemente grande y mediante el
teorema central del lmite, podrn calcularse intervalos de confianza.
TIPOS DE MUESTRA ALEATORIA:

Muestra aleatoria simple se selecciona directo cuando todas las potenciales
observaciones de la poblacin son equiponderables.
Una muestra auto-ponderada, es aquella en la que cada individuo o un objeto,

en la poblacin de inters tienen la misma oportunidad de ser seleccionadas
para la muestra. Las muestras aleatorias simples son auto-ponderadas.
El muestreo estratificado implica seleccionar muestras independientes de un

nmero de subpoblaciones, grupo o estratos dentro de la poblacin. Por ejemplo,
si queremos analizar los datos de unas elecciones por gnero o por grupo de
edad, deberemos cerciorarnos de obtener muestras representativas de todas las
subpoblaciones.
El muestreo por clusters, consiste en seleccionar las observaciones de la

muestra por grupos con intereses relacionados. Por ejemplo, si se plantea
conocer la opinin pblica de un trasvase en un rio, deberemos hacer dos
clusters aquello de la zona beneficiada (reciben el agua del rio) y aquellos de la
zona perjudicada (tendrn menos caudal en el rio). El anlisis de muestras por
clusters debe tener en cuenta la correlacin intra-grupo que refleja el hecho de
que las unidades en la misma agrupacin es probable que sean ms similares
que dos unidades escogido al azar.
Pagina:
http://www.enciclopediafinanciera.com/definicion-muestra-aleatoria.html
VARIABLE ALEATORIA
Se llama variable aleatoria a toda funcin que asocia a cada elemento del
espacio muestral e un nmero real.
Se utilizan letras maysculas X, Y, ... para designar variables aleatorias, y las respectivas
minsculas (x, y, ...) para designar valores concretos de las mismas.
Variable aleatoria discreta

Una variable aleatoria discreta es aquella que slo puede tomar valores
enteros.
Ejemplos: El nmero de hijos de una familia, la puntuacin obtenida al lanzar un dado.
Variable aleatoria contina

Una variable aleatoria continua es aquella que puede tomar todos los valores
posibles dentro de un cierto intervalo de la recta real.
Ejemplos: La altura de los alumnos de una clase, las horas de duracin de una pila.
http://www.vitutor.com/pro/3/a_1.html
MODELO DE REGRESIN LINEAL MLTIPLE
Si se cuenta con ms de una variable explicativa, entonces tenemos un modelo de

regresin mltiple
Si adems la relacin entre la respuesta y cada variable explicativa es lineal,

estamos trabajando con un modelo de regresin lineal mltiple (RLM)
Teniendo dos variables explicativas, la representacin geomtrica de un modelo de

regresin lineal es un plano
Con tres o ms variables independientes, el modelo ya no es representable

grficamente, pero s de manera abstracta. En este caso decimos que es un
hiperplano
Desde luengo, tambin pueden existir situaciones en las que la relacin entre las
variables no es lineal sino, por ejemplo, cuadrtica
Modelo de regresin lineal mltiple

Cuando se tiene ms de una variable explicativa, el modelo es:
De donde
O, simplificando la notacin
Al modelo anterior lo estimamos con
Supuestos bsicos del modelo de regresin lineal mltiple
Relacin entre Y y las Xj
Existe una relacin entre Y y cada Xj; dicha relacin es lineal
Cualquier otro factor que influya en Y y no est especificado en el modelo, lo

consideramos como parte de un trmino aleatorio de error,
Es decir, hay una relacin entre las variables que se puede expresar como
Caractersticas de las Xj
Las Xj pueden o no ser aleatorias
Se miden en escala binaria, ordinal, de intervalo o de razn (si alguna de las

X es nominal con m categoras, hay que sustituirla por m-1 variables binarias
o indicadoras)
Las Xj son independientes entre s. De manera prctica, esto significa que

dos Xj distintas no miden lo mismo
Distribucin de los errores,
Para cada combinacin de valores de las X j, los errores se distribuyen

N(0,2), en particular, varianza es siempre la misma
Los errores son independientes entre s
Los errores son independientes del valor de las X j
El que los errores se distribuyan N(0,2) tiene como consecuencia que la variable
Y, en cada combinacin de valores de las X se distribuya N(X, 2)
Esto es importante, porque para que tenga sentido la aplicacin de un modelo de
regresin lineal mltiple, se requiere que la variable Y sea normal, o al menos
continua y simtrica
Si Y no es continua se requiere:
Hacer una transformacin a los datos que nos permita considerar que la
variable transformada s es normal
Utilizar otros modelos de regresin que no son lineales (por ejemplo,

logstica), los cuales no veremos por el momento
Estimadores de mnimos cuadrados del modelo de RLM
Matricialmente, el modelo de RLM lo podemos expresar como
Donde
y1
1 x11

1 x12
y2
Y
X
M
M M

yn
1 x1n
K xk1
0

K xk 2
1
M
O M

K xkn
k
1

2
M

n
Los estimadores de mnimos cuadrados tambin deben minimizar la suma de

cuadrados de los errores:
Puede verse que tales estimadores son:
Ejemplo RLM
X1:
Carbono
X2:
Temperatura
Y:
Produccin
17
5707
13
17
5940
25
3015
13
25
2673
8.17
21
5804
13.8
21
6700
11
15.34
5310
11
26.66
725
11
21
7521
11
21
7642
11
21
7500
11
21
7545
Se realiz un experimento secuencial para

optimizar la produccin de un colorante natural
Se midieron los valores de produccin (Y) para

distintas combinaciones de concentracin de
carbono (X1) y temperatura (X2)
VERIFICACIN DE LA VALIDEZ DEL MODELO
La relacin entre X y Y existe y es lineal:
Grfico de dispersin
Coeficiente de correlacin lineal
Coeficiente de determinacin
Los errores se distribuyen normal, con media cero, con la misma varianza:
Normalidad: Grfico de probabilidad normal, Histograma de residuos
Media cero: Grfico de residuos contra la variable independiente o contra los

valores predichos
Varianzas iguales: dem
MODELO GENERAL DE REGRESIN LINEAL MLTIPLE
Recordemos que el modelo de regresin lineal mltiple (RLM) es:
Estimamos dicho modelo a travs de:
Al obtener las estimaciones de mnimos cuadrados de los coeficientes del modelo
(
contexto del problema particular
) es necesario interpretar su significado en el
INTERPRETACIN DE LOS COEFICIENTES DE UN MODELO DE

REGRESIN LINEAL MLTIPLE
0 representa el valor promedio que toma Y cuando todas las Xj son iguales a cero (j
= 1, 2, , k)
1 representa la cantidad de unidades en promedio que aumenta Y cuando X1

aumenta en una unidad, suponiendo que todas las otras Xj permanecen sin cambio

k representa la cantidad de unidades en promedio que aumenta Y cuando Xk

0 representa el valor promedio que toma Y cuando todas las Xj son iguales a cero (j
= 1, 2, , k)
Porque si hacemos todas las Xj iguales a cero, tenemos:

Por ejemplo: Supongamos el modelo :
Dejemos X2 = 1 fijo y observemos cmo cambia Y con aumentos de una unidad en

X1 (por el momento omitiremos )
X1
X2
Increment
o en Y
-
10
13

Por ejemplo: Supongamos el modelo :
Dejemos X1 = 2 fijo y observemos cmo cambia Y con aumentos de una unidad en

X2 (por el momento omitiremos )
2
2
2
2
2
1
2
3
4
5
Increment
o en Y
-4
-4
-4
-4
4
0
-4
-8
1
2
EJEMPLO 1
Se ha estimado que el costo de la calefaccin en dlares (Y) en cierta zona depende

de la temperatura promedio exterior en F, (X1), el espesor del aislante trmico
colocado en el desvn en pulgadas, (X2), y la edad del calefactor en aos, (X3), y
est dado por el modelo
Interprete los coeficientes de este modelo de RLM
Interpretemos 0:
El valor promedio de Y es igual a 0 si todas las X son iguales a cero, significa que:
El costo de la calefaccin es de $427 si
la temperatura exterior es de 0F (X1 = 0),
no hay aislante trmico en el desvn (X2 = 0), y
el calefactor es nuevo (X3 = 0)
Interpretemos 1:
Por cada unidad que aumente X1, Y aumentar en promedio 1 unidades, si las otras
variables se mantienen constantes significa que
Si la temperatura exterior aumenta 1F (X1 aumenta 1), entonces el costo de

la calefaccin aumentar -4.58 dlares (es decir que disminuir $4.58) en
promedio, suponiendo que las otras variables no cambian de valor
Interpretemos 2:
Por cada unidad que aumente X2, Y aumentar en promedio 2 unidades, si las otras
variables se mantienen sin cambio, significa que
Si se aumenta 1 pulgada al aislante del desvn (X2 aumenta 1), entonces el

costo de la calefaccin aumentar -14.8 dlares (es decir que disminuir
$14.8) en promedio, siempre y cuando las otras variables se mantengan
constantes
Interpretemos 3:
Por cada unidad que aumente X3, Y aumentar en promedio 3 unidades,

suponiendo que las otras variables se mantienen constantes, significa que
Si se tiene un calefactor que es un ao ms viejo (X3 aumenta 1), entonces el

costo de la calefaccin aumentar $6.10 en promedio, si las otras variables
no cambian de valor
PAGINA: http://slideplayer.es/slide/1125718/
TEOREMA CENTRAL DE LMITE

Si una poblacin tiene media y desviacin tpica , y tomamos muestras de
tamao n (n > 30, cualquier tamao si la poblacin es "normal"), las medias de
estas muestras siguen aproximadamente la distribucin:
Consecuencias
1. Permite averiguar la probabilidad de que la media de una muestra concreta est
en un cierto intervalo.
2. Permite calcular la probabilidad de que la suma de los elementos de una muestra
est, a priori, en un cierto intervalo.
3. Inferir la media de la poblacin a partir de una muestra.
Ejemplos
Las bolsas de sal envasadas por una mquina tienen = 500 g y = 35 g. Las
bolsas se empaquetaron en cajas de 100 unidades.
1. Calcular la probabilidad de que la media de los pesos de las bolsas de un paquete
sea menor que 495 g.
2. Calcular la probabilidad de que una caja 100 de bolsas pese ms de 51 kg.
http://www.vitutor.com/estadistica/inferencia/intervalos.html
PROPIEDADES DE LOS ESTIMADORES
O Insesgado o centrado. Un estimador es insesgado siempre y cuando la esperanza

matemtica del estimador coincide con el valor de este. Si no coincide quiere decir
que existe sesgo, de manera que podemos calcularlo, siendo ste igual a la
esperanza del estimador menos el valor de dicho estimador.
O Eficiente - Mnima varianza. Siendo dos estimadores insesgados es ms eficiente

aquel que tienen una varianza menor.
O Error cuadrtico medio. Podemos definir el error cuadrtico medio o ECM como la
esperanza matemtica de la diferencia del estimador menos el parmetro al
cuadrado o de manera ms sencilla como la varianza del estimador menos el sesgo
de este al cuadrado.
O Consistente. Un estimador insesgado es consistente siempre y cuando el limite de
la varianza del estimador al cuadrado es cero, cuando n tiende a infinito.
Tiene sesgo nuestro estimador?
Cul es el sesgo de nuestro estimador?
Clculo del ECM
http://es.slideshare.net/fchca/estimadores
CONTRASTE PARA DISTRIBUCIONES

BINOMIALES
Estudiaremos slo contrastes en los que sea posible aproximaciones de la
binomial mediante la normal, por lo que estudiaremos slo los casos de muestras
grandes, de tamao > 30.
CONTRASTE PARA EL PARMETRO P DE UNA

DISTRIBUCIN BINOMIAL
Partimos de una poblacin que se ajuste al modelo binomial B(n, p), siendo p la
probabilidad de "xito"; denotaremos por p a la proporcin muestral de casos favorables y
por po el valor hipottico con el que queremos contrastar el valor del parmetro p.
Hiptesis de partida
En ste caso, la hiptesis nula ser: Ho: p = po
Y la hiptesis alternativa puede ser:

o Ha: p po en el contraste bilateral, o bien Ha: p > po, en el contraste
unilateral (tambin Ha: p < po).
Estadgrafo de contraste:
Como conocemos que la distribucin binomial B(n, p) se aproxima mediante una
variable normal
N (np, npq) entonces, se verifica que la variable
1 p
p p
z=
Se distribuye como una distribucin normal estndar N(0,1).
Regin crtica:
La regin crtica, ahora, ser la determinada por los valores de la variable Z que
son mayores en valor absoluto que z , en el contraste bilateral, o bien,
mayores que z , en el contraste unilateral.
CONTRASTE PARA LA IGUALDAD DE LOS PARMETROS DE DOS

DISTRIBUCIONES BINOMIALES
Partimos, en ste caso, de dos distribuciones binomiales B(n 1, p1) y B(n2, p2)
respectivamente. En las muestras los parmetros mustrales sern p 1 y p2
respectivamente.
Hiptesis de partida:
La hiptesis nula ser: Ho: p1 = p2
Mientras que la hiptesis alternativa puede ser: Ha: p 1 p2
Ahora, teniendo en cuenta las propiedades de las distribuciones normales, por las que se
aproximan las binomiales, se verifica que la variable.
p 1
1
p2
1
n2
p2
p1
p 2
p1
z=
Se distribuye, cuando la hiptesis nula es cierta, como una distribucin normal estndar
N(0,1).
Regin crtica:
La regin crtica ser anloga a todas aqullas en el que el estadstico de

contraste
Sigue una distribucin normal.
CONTRASTE DE HIPTESIS PARA LA IGUALDAD DE MEDIAS DE DOS

POBLACIONES NORMALES
En este apartado consideraremos dos poblaciones con distribuciones normales con medias
1 1 y 2 2 respectivamente, de las cuales extraemos muestras
1 y 2 y varianzas
aleatorias independientes de tamaos n1 y n2 respectivamente. El objetivo de ste
apartado ser determinar si las dos poblaciones pueden considerarse con la misma media
poblacional, es decir, la hiptesis nula ser Ho ( 1 = 2 ), mientras que la hiptesis
alternativa puede tener diversas expresiones: Ha ( 1 < 2 ), o bien, Ha (1 > 2 ), o bien
Ha (1 2 ).
Estas hiptesis son equivalentes a las siguientes: la hiptesis nula ser H o (1 - 2 = 0),
mientras que la hiptesis alternativa tendr stas expresiones: H a (1 - 2 < 0), o bien, Ha
(1 - 2 > 0), o bien Ha (1 - 2 0).
Conocemos del tema relacionado con las distribuciones normales, que la diferencia de dos
distribuciones normales se distribuye tambin normalmente con media la diferencia de las
medias, y varianza la suma de las varianzas, por lo que la variable
x x
Ser una variable que se distribuye normalmente N
1< 2
1 1 2 2
+
n1
n2
por
lo que en el caso particular de conocer las varianzas poblacionales, podemos utilizar como
estadstico de contraste la variable:
z=
x x
1 1 2 2
+
n1
n2
Que, en el caso de que la hiptesis nula sea cierta (1 = 2), se distribuye como una
distribucin normal estndar N(0,1), y, por lo tanto, puede utilizarse como estadstico de
contraste, dado que conocemos su distribucin.
Regin crtica:
La regin crtica estar formada por los valores de Z elevados, tanto positivos
como negativos. Para especificar cuando se consideran elevados, teniendo en cuenta la
distribucin de Z, sern aquellos que sean mayores, en valor absoluto, que Z/2, en el
contraste bilateral, o que z en el contraste unilateral.
CONTRASTE DE HIPTESIS PARA LA IGUALDAD DE

MEDIAS DE DOS POBLACIONES NORMALES CON VARIANZAS
POBLACIONALES DESCONOCIDAS PERO IGUALES
MUESTRAS GRANDES
Estadgrafo de contraste: Supongamos ahora que las varianzas son
desconocidas pero iguales (1 = 2 = ).Si las muestras tienen tamao
grande, aunque no se conozca la varianza poblacional, se trabaja como si se
conociese utilizando en lugar de la varianza poblacional, su estimador la
cuasivarianza muestral, por lo que la distribucin de la diferencia de medias
2
2
mustrales es ahora N
1< 2, S
1
n1
1
n2
Siendo
S2
n 1+ n22
(n1 1)
S 1 (n21)
Por lo que la variable tipificada es una normal estndar.
z=
( x 1 x 2 ) ( 1< 2 )
S
1
n1
1
n2
Entonces, si ha hiptesis nula es cierta, (1 =2), la variable:

z=
( x 1 x 2 )
1
n1
1
n2
Se distribuye como una distribucin normal estndar, por lo que se puede utilizar
como un estadstico de contraste.
Regin crtica:
La regin crtica se determina igual que en el prrafo anterior, es decir, para los
valores de Z mayores, en valor absoluto, que z/2 (contraste bilateral), o que z
(contraste unilateral).
pagina: http://biplot.usal.es/problemas/libro/5%20Contrastes.pdf
PRUEBA DE HIPTESIS SOBRE LA DIFERENCIA ENTRE MEDIAS: MUESTRAS
PEQUEAS
Estas pruebas se utilizan cuando el muestreo destruye a los elementos, cuando
resulta muy costoso o cuando solo se puede obtener unos cuantos valores
histricos.
Sea u1 y u2, las medias de dos poblaciones normales o aproximadamente
normales; Se quiere probar la hiptesis sobre la diferencia de medias bajo el
supuesto que Ho es cierto es decir:
Hiptesis
Caso I
Ho: 1 2 o
Caso II
Ho : 1o 2 = o
H1 : 1 2 o
H1 : 1 2 < o
Caso III
Ho: o 2 o
H1: 1 2 > o
SUPOSICIONES
1. Las observaciones de las dos muestras son independientes
2. Las dos poblaciones son aproximadamente normales
3. Al menos una muestra es pequea n < 30
Prueba Estadstica:
Caso 1. Se conocen las desviaciones estndar de las poblaciones 1 y 2,.
Caso 2. Se desconoce 1 y 2 pero son iguales 1=2=, se determina s la

desviacin estndar combinada, en funcin de s 1 y S2.
Prueba t con n1+n2 2 grados de libertad
Donde s es un estimado conjunto de (desviacin estndar comn para ambas

poblaciones (pooled variance))
Caso 3. Se desconoce 1 y 2 pero desiguales 12 , se utiliza s1 y Sha, para

estimar 1 y 2 respectivamente en este caso el mtodo aproximado es la
distribucin t,
Los grados de libertad (gl) se determina con la frmula siguiente.
PRUEBA DE HIPTESIS SOBRE LA DIFERENCIA ENTRE MEDIAS:

MUESTRAS PEQUEAS
Ejercicio. Como psiclogo de un hospital para enfermos mentales el lector

obtiene calificaciones para una prueba visual motora para cada uno de dos
grupos de pacientes. La calificacin media para el grupo A (10 pacientes) es 80
con desviacin estndar 18, y la correspondiente al grupo B (15 pacientes) es
70 con desviacin estndar 22. El lector cree tener suficiente razones para
considerar las desviaciones estndar de poblacin iguales, las
poblaciones son normales. Difieren significativamente las calificaciones con
nivel de significacin 10%?.
Solucin
Datos
nA = 10
nB = 15
sA = 18
sB = 22
= 0.10
Hiptesis
De tablas t para dos colas tenemos que:
Ho: A - B = 0 (las calificaciones no difieren)
( ; n1+n2-2)
=t
(0,1 ; 10+15-2)
= t
(0,1 ; 23)
= 1,714
H1: A - B 0 (las calificaciones si difieren)
s=
Zona rechazo
Zona
Ho de aceptacin
Zona rechazo Ho
Ho
T(0,1;23)=-1,714
t= 1,193
t(0,1;23) =1,714
Decisin: como se observa en la figura el t esta dentro del rea de aceptacin

de Ho., luego se acepta Ho, es decir que las calificaciones no difieren
PRUEBA DE HIPTESIS SOBRE LA DIFERENCIA ENTRE MEDIAS: MUESTRAS

GRANDES
Ejercicio: Se conocen los datos de dos muestras de dos poblaciones, que son
los siguientes: Las medias X1 = 74 ; X2 = 78 ; las varianzas S12 = 225 ; S22 =
169; las muestras n1 = 42 ; n2 = 56; Se pide contrastar estadsticamente si
existe diferencia entre las dos poblaciones, a un nivel de significacin del 0.05.
Las dos poblaciones siguen una distribucin Normal N( 1,12) y N(2, 22)
Solucin. Sabemos que las distribuciones de las dos poblaciones son

Normales, pero desconocemos el valor de su desviacin, slo conocemos el
valor de la desviacin tpica de las muestras entonces estimamos las
desviaciones poblacionales con las de las muestras.
Hiptesis:
Ho: 1 - 2 = 0, es decir, 1 = 2 (no existe diferencia entre las poblaciones)

H1: 1 - 2 0, es decir, 1 2 (si existe diferencia entre las poblaciones)
Ya que el tamao de las muestras es elevado, utilizaremos el siguiente

estadstico:
Zona rechazo
Zona Ho
de aceptacin
Zona rechazo Ho
Ho
Estadstico
Z0,025=-1,96
Z0,025 =1,96
Z= 1,38
El nivel de significacin nos dice el enunciado que es de = 0.05 como es de

dos colas /2 = 0.025, y para el criterio de aceptacin tenemos en la figura:
Conclusin. Como (Z = 1,38) queda en el rea de aceptacin de Ho, luego

aceptamos Ho, es decir no existe diferencia entre las poblaciones
Pagina: http://es.slideshare.net/RichardHuamanDurand/captulo-viii-26631974
PRUEBAS DE HIPTESIS PARA LA VARIANZA POBLACIONAL

En situaciones como control estadstico de la calidad, de antemano se conocen los
parmetros de referencia del proceso bajo control. La actividad central para decidir
si en un momento dado, el proceso esta bajo control, es la confrontacin
permanente de los datos obtenidos con la hiptesis sobre la centralidad del
proceso (media) y sobre la magnitud de su variabilidad (varianza).
La varianza como medida de dispersin es importante dado que nos ofrece una
mejor visin de dispersin de datos.
Si se desea probar una hiptesis acerca de la varianza se puede hacer utilizando
las medidas estadsticas con las que se construy el intervalo de confianza 2,
esto es con la distribucin ji-cuadrada. As podremos determinar una franja de
confianza, con base en la cual podramos tomarse decisiones al respecto.
Para esto entonces debemos conocer nuestro estadstico de prueba considerando
que la poblacin sigue una distribucin normal:
Estadstico:
ji-cuadrada
Gl =n-1
EJEMPLO:
Considerando que el arribo de un metrobus a la estacin Iztacalco es en promedio
de 45 segundos y su variabilidad (varianza) debiera ser de 5 segundos. Muestran
los siguientes datos suficiente evidencia de que esta varianza ha cambiado? Use
un = 0.05
Tomamos el tiempo de una muestra peridica de 16 autobuses para controlar la
periodicidad de arribo y se obtienen los siguientes datos en segundos:
46.2
45.2
44.3
51.7
47.5
41.6
46.4
49.0
43.6
42.2
44.0
47.8
43.7
47.8
41.8
44.2
Datos dados en segundos
Datos:
X = 45.4375
S = 2.81
S2 = 7.91
1.-Ensayo de Hiptesis
H0:2 = 5
H1:2 > 5
2.-Nivel de significancia
= 0.05
3.-Regla de decisin
Se rechaza H0 si y solo si
X2 > 24.996
4.-Tomamos la muestra y la aplicamos a nuestro estadstico de prueba:
X2 = (n 1) S2
2
= (16 1) 7.91
5
= 23.73
5.-la Hiptesis se acepta ya que se encuentra en la regin de aceptacin y

podemos afirmar que nuestra variabilidad no ha cambiado de 5 segundos, pero se
acerca mucho al valor crtico y es complicado tomar una decisin.
Pagina: http://es.slideshare.net/hedoer/prueba-de-hipotesis-de-la-varianza
EJEMPLO
Un fabricante de detergente liquido est interesado en la uniformidad de la
maquina utilizada para llenar botellas de manera especfica es deseable que la
varianza sea; 0.01 onzas del lquido. Al tomar una muestra aleatoria de 20
botellas se obtiene una varianza muestral (s) para el volumen de llenado de ese
cuadrado s=0.0153. (Distribucin normal)
El fabricante est preocupado porque piensa que la variacin del proceso es
mayor que la variacin histrica. Con un =0.05, el fabricante tiene elementos que
sustenten se preocupacin?
1) H0: 0.01
H1: 0.01
2) Calcular valores crticos.
3) Decisin.
No hay evidencia estadstica para no aceptar H0.
Conclusin: Existe evidencia que la varianza no es mayor al valor histrico por lo
tanto, no es necesario hacer ajustes al proceso de llenado.
Pagina: http://probyestcgl.blogspot.com.co/2008/12/prueba-de-hiptesis-sobre-lavarianza.html

Trabajo Final de Estadistica 2¡

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Trabajo Final de Estadistica 2¡

Uploaded by

Copyright:

Available Formats

MUESTRA ALEATORIA

En estadstica, una muestra es la seleccin de un numero de observaciones de a partir de

TIPOS DE MUESTRA ALEATORIA:

Una muestra auto-ponderada, es aquella en la que cada individuo o un objeto,

El muestreo estratificado implica seleccionar muestras independientes de un

El muestreo por clusters, consiste en seleccionar las observaciones de la

Variable aleatoria discreta

Ejemplos: El nmero de hijos de una familia, la puntuacin obtenida al lanzar un dado.

Variable aleatoria contina

MODELO DE REGRESIN LINEAL MLTIPLE

Si se cuenta con ms de una variable explicativa, entonces tenemos un modelo de

Si adems la relacin entre la respuesta y cada variable explicativa es lineal,

Teniendo dos variables explicativas, la representacin geomtrica de un modelo de

Con tres o ms variables independientes, el modelo ya no es representable

Modelo de regresin lineal mltiple

Al modelo anterior lo estimamos con

Supuestos bsicos del modelo de regresin lineal mltiple

Relacin entre Y y las Xj

Existe una relacin entre Y y cada Xj; dicha relacin es lineal

Cualquier otro factor que influya en Y y no est especificado en el modelo, lo

Las Xj pueden o no ser aleatorias

Se miden en escala binaria, ordinal, de intervalo o de razn (si alguna de las

Las Xj son independientes entre s. De manera prctica, esto significa que

Distribucin de los errores,

Para cada combinacin de valores de las X j, los errores se distribuyen

Los errores son independientes entre s

Los errores son independientes del valor de las X j

Utilizar otros modelos de regresin que no son lineales (por ejemplo,

Estimadores de mnimos cuadrados del modelo de RLM

Matricialmente, el modelo de RLM lo podemos expresar como

Los estimadores de mnimos cuadrados tambin deben minimizar la suma de

Puede verse que tales estimadores son:

Se realiz un experimento secuencial para

Se midieron los valores de produccin (Y) para

VERIFICACIN DE LA VALIDEZ DEL MODELO

La relacin entre X y Y existe y es lineal:

Coeficiente de correlacin lineal

Normalidad: Grfico de probabilidad normal, Histograma de residuos

Media cero: Grfico de residuos contra la variable independiente o contra los

Varianzas iguales: dem

MODELO GENERAL DE REGRESIN LINEAL MLTIPLE

Recordemos que el modelo de regresin lineal mltiple (RLM) es:

Estimamos dicho modelo a travs de:

Al obtener las estimaciones de mnimos cuadrados de los coeficientes del modelo

) es necesario interpretar su significado en el

INTERPRETACIN DE LOS COEFICIENTES DE UN MODELO DE

1 representa la cantidad de unidades en promedio que aumenta Y cuando X1

2 representa la cantidad de unidades en promedio que aumenta Y cuando X2

k representa la cantidad de unidades en promedio que aumenta Y cuando Xk

Porque si hacemos todas las Xj iguales a cero, tenemos:

1 representa la cantidad de unidades en promedio que aumenta Y cuando X1

Por ejemplo: Supongamos el modelo :

Dejemos X2 = 1 fijo y observemos cmo cambia Y con aumentos de una unidad en

2 representa la cantidad de unidades en promedio que aumenta Y cuando X2

Por ejemplo: Supongamos el modelo :

Dejemos X1 = 2 fijo y observemos cmo cambia Y con aumentos de una unidad en

Se ha estimado que el costo de la calefaccin en dlares (Y) en cierta zona depende

El costo de la calefaccin es de $427 si

la temperatura exterior es de 0F (X1 = 0),

no hay aislante trmico en el desvn (X2 = 0), y

el calefactor es nuevo (X3 = 0)

Si la temperatura exterior aumenta 1F (X1 aumenta 1), entonces el costo de

Si se aumenta 1 pulgada al aislante del desvn (X2 aumenta 1), entonces el

Por cada unidad que aumente X3, Y aumentar en promedio 3 unidades,