Professional Documents
Culture Documents
VARIABLE ALEATORIA
Se llama variable aleatoria a toda funcin que asocia a cada elemento del
espacio muestral e un nmero real.
Se utilizan letras maysculas X, Y, ... para designar variables aleatorias, y las respectivas
minsculas (x, y, ...) para designar valores concretos de las mismas.
Ejemplos: La altura de los alumnos de una clase, las horas de duracin de una pila.
http://www.vitutor.com/pro/3/a_1.html
Desde luengo, tambin pueden existir situaciones en las que la relacin entre las
variables no es lineal sino, por ejemplo, cuadrtica
De donde
O, simplificando la notacin
Es decir, hay una relacin entre las variables que se puede expresar como
Caractersticas de las Xj
El que los errores se distribuyan N(0,2) tiene como consecuencia que la variable
Y, en cada combinacin de valores de las X se distribuya N(X, 2)
Esto es importante, porque para que tenga sentido la aplicacin de un modelo de
regresin lineal mltiple, se requiere que la variable Y sea normal, o al menos
continua y simtrica
Si Y no es continua se requiere:
Hacer una transformacin a los datos que nos permita considerar que la
variable transformada s es normal
Donde
y1
1 x11
1 x12
y2
Y
X
M
M M
yn
1 x1n
K xk1
0
K xk 2
1
M
O M
K xkn
k
1
2
M
n
Ejemplo RLM
X1:
Carbono
X2:
Temperatura
Y:
Produccin
17
5707
13
17
5940
25
3015
13
25
2673
8.17
21
5804
13.8
21
6700
11
15.34
5310
11
26.66
725
11
21
7521
11
21
7642
11
21
7500
11
21
7545
Grfico de dispersin
Coeficiente de determinacin
Los errores se distribuyen normal, con media cero, con la misma varianza:
(
contexto del problema particular
0 representa el valor promedio que toma Y cuando todas las Xj son iguales a cero (j
= 1, 2, , k)
0 representa el valor promedio que toma Y cuando todas las Xj son iguales a cero (j
= 1, 2, , k)
X1
X2
Increment
o en Y
-
10
13
2
2
2
2
2
1
2
3
4
5
Increment
o en Y
-4
-4
-4
-4
4
0
-4
-8
1
2
EJEMPLO 1
Interpretemos 0:
El valor promedio de Y es igual a 0 si todas las X son iguales a cero, significa que:
Interpretemos 1:
Por cada unidad que aumente X1, Y aumentar en promedio 1 unidades, si las otras
variables se mantienen constantes significa que
Interpretemos 2:
Por cada unidad que aumente X2, Y aumentar en promedio 2 unidades, si las otras
variables se mantienen sin cambio, significa que
Interpretemos 3:
PAGINA: http://slideplayer.es/slide/1125718/
Consecuencias
1. Permite averiguar la probabilidad de que la media de una muestra concreta est
en un cierto intervalo.
2. Permite calcular la probabilidad de que la suma de los elementos de una muestra
est, a priori, en un cierto intervalo.
Ejemplos
Las bolsas de sal envasadas por una mquina tienen = 500 g y = 35 g. Las
bolsas se empaquetaron en cajas de 100 unidades.
1. Calcular la probabilidad de que la media de los pesos de las bolsas de un paquete
sea menor que 495 g.
http://www.vitutor.com/estadistica/inferencia/intervalos.html
http://es.slideshare.net/fchca/estimadores
Partimos de una poblacin que se ajuste al modelo binomial B(n, p), siendo p la
probabilidad de "xito"; denotaremos por p a la proporcin muestral de casos favorables y
por po el valor hipottico con el que queremos contrastar el valor del parmetro p.
Hiptesis de partida
En ste caso, la hiptesis nula ser: Ho: p = po
Estadgrafo de contraste:
Como conocemos que la distribucin binomial B(n, p) se aproxima mediante una
variable normal
N (np, npq) entonces, se verifica que la variable
1 p
p p
z=
Regin crtica:
La regin crtica, ahora, ser la determinada por los valores de la variable Z que
son mayores en valor absoluto que z , en el contraste bilateral, o bien,
mayores que z , en el contraste unilateral.
Ahora, teniendo en cuenta las propiedades de las distribuciones normales, por las que se
aproximan las binomiales, se verifica que la variable.
p 1
1
p2
1
n2
p2
p1
p 2
p1
z=
Se distribuye, cuando la hiptesis nula es cierta, como una distribucin normal estndar
N(0,1).
Regin crtica:
Estas hiptesis son equivalentes a las siguientes: la hiptesis nula ser H o (1 - 2 = 0),
mientras que la hiptesis alternativa tendr stas expresiones: H a (1 - 2 < 0), o bien, Ha
(1 - 2 > 0), o bien Ha (1 - 2 0).
Estadgrafo de contraste:
Conocemos del tema relacionado con las distribuciones normales, que la diferencia de dos
distribuciones normales se distribuye tambin normalmente con media la diferencia de las
medias, y varianza la suma de las varianzas, por lo que la variable
x x
1< 2
1 1 2 2
+
n1
n2
por
lo que en el caso particular de conocer las varianzas poblacionales, podemos utilizar como
estadstico de contraste la variable:
z=
x x
1 1 2 2
+
n1
n2
Que, en el caso de que la hiptesis nula sea cierta (1 = 2), se distribuye como una
distribucin normal estndar N(0,1), y, por lo tanto, puede utilizarse como estadstico de
contraste, dado que conocemos su distribucin.
Regin crtica:
La regin crtica estar formada por los valores de Z elevados, tanto positivos
como negativos. Para especificar cuando se consideran elevados, teniendo en cuenta la
distribucin de Z, sern aquellos que sean mayores, en valor absoluto, que Z/2, en el
contraste bilateral, o que z en el contraste unilateral.
MUESTRAS GRANDES
Estadgrafo de contraste: Supongamos ahora que las varianzas son
desconocidas pero iguales (1 = 2 = ).Si las muestras tienen tamao
grande, aunque no se conozca la varianza poblacional, se trabaja como si se
conociese utilizando en lugar de la varianza poblacional, su estimador la
cuasivarianza muestral, por lo que la distribucin de la diferencia de medias
2
2
mustrales es ahora N
1< 2, S
1
n1
1
n2
Siendo
S2
n 1+ n22
(n1 1)
S 1 (n21)
z=
( x 1 x 2 ) ( 1< 2 )
S
1
n1
1
n2
( x 1 x 2 )
1
n1
1
n2
Se distribuye como una distribucin normal estndar, por lo que se puede utilizar
como un estadstico de contraste.
Regin crtica:
La regin crtica se determina igual que en el prrafo anterior, es decir, para los
valores de Z mayores, en valor absoluto, que z/2 (contraste bilateral), o que z
(contraste unilateral).
pagina: http://biplot.usal.es/problemas/libro/5%20Contrastes.pdf
PRUEBA DE HIPTESIS SOBRE LA DIFERENCIA ENTRE MEDIAS: MUESTRAS
PEQUEAS
Estas pruebas se utilizan cuando el muestreo destruye a los elementos, cuando
resulta muy costoso o cuando solo se puede obtener unos cuantos valores
histricos.
Sea u1 y u2, las medias de dos poblaciones normales o aproximadamente
normales; Se quiere probar la hiptesis sobre la diferencia de medias bajo el
supuesto que Ho es cierto es decir:
Hiptesis
Caso I
Ho: 1 2 o
Caso II
Ho : 1o 2 = o
H1 : 1 2 o
H1 : 1 2 < o
Caso III
Ho: o 2 o
H1: 1 2 > o
SUPOSICIONES
1. Las observaciones de las dos muestras son independientes
2. Las dos poblaciones son aproximadamente normales
3. Al menos una muestra es pequea n < 30
Prueba Estadstica:
Solucin
Datos
nA = 10
nB = 15
sA = 18
sB = 22
= 0.10
Hiptesis
De tablas t para dos colas tenemos que:
( ; n1+n2-2)
=t
(0,1 ; 10+15-2)
= t
(0,1 ; 23)
= 1,714
s=
Zona rechazo
Zona
Ho de aceptacin
Zona rechazo Ho
Ho
T(0,1;23)=-1,714
t= 1,193
t(0,1;23) =1,714
Ejercicio: Se conocen los datos de dos muestras de dos poblaciones, que son
los siguientes: Las medias X1 = 74 ; X2 = 78 ; las varianzas S12 = 225 ; S22 =
169; las muestras n1 = 42 ; n2 = 56; Se pide contrastar estadsticamente si
existe diferencia entre las dos poblaciones, a un nivel de significacin del 0.05.
Las dos poblaciones siguen una distribucin Normal N( 1,12) y N(2, 22)
Hiptesis:
Zona rechazo
Zona Ho
de aceptacin
Zona rechazo Ho
Ho
Estadstico
Z0,025=-1,96
Z0,025 =1,96
Z= 1,38
Pagina: http://es.slideshare.net/RichardHuamanDurand/captulo-viii-26631974
Estadstico:
ji-cuadrada
Gl =n-1
EJEMPLO:
Considerando que el arribo de un metrobus a la estacin Iztacalco es en promedio
de 45 segundos y su variabilidad (varianza) debiera ser de 5 segundos. Muestran
los siguientes datos suficiente evidencia de que esta varianza ha cambiado? Use
un = 0.05
Tomamos el tiempo de una muestra peridica de 16 autobuses para controlar la
periodicidad de arribo y se obtienen los siguientes datos en segundos:
46.2
45.2
44.3
51.7
47.5
41.6
46.4
49.0
43.6
42.2
44.0
47.8
43.7
47.8
41.8
44.2
Datos:
X = 45.4375
S = 2.81
S2 = 7.91
1.-Ensayo de Hiptesis
H0:2 = 5
H1:2 > 5
2.-Nivel de significancia
= 0.05
3.-Regla de decisin
Se rechaza H0 si y solo si
X2 > 24.996
X2 = (n 1) S2
2
= (16 1) 7.91
5
= 23.73
3) Decisin.
No hay evidencia estadstica para no aceptar H0.
Conclusin: Existe evidencia que la varianza no es mayor al valor histrico por lo
tanto, no es necesario hacer ajustes al proceso de llenado.
Pagina: http://probyestcgl.blogspot.com.co/2008/12/prueba-de-hiptesis-sobre-lavarianza.html