Professional Documents
Culture Documents
Una variable aleatoria X es una funcin que asigna un nmero real a cada resultado en el
espacio muestral de un experimento aleatorio. El conjunto de los posibles valores de la
variable aleatoria X se denomina rango. Diremos que la variable aleatoria es discreta si su rango
es finito (o infinito contable).
A menudo el inters recae en la probabilidad de que una variable aleatoria X tome un valor
particular x, esto se denota P(X=x). La distribucin de probabilidad de X ser entonces la
descripcin del conjunto de valores posibles de X (rango de X), junto con la probabilidad
asociada con cada uno de estos valores. La distribucin de probabilidad de una variable
aleatoria es a menudo el resumen ms til de un experimento aleatorio.
Diremos que la funcin p(x)=P(X=x) que va del conjunto de valores posibles de la variable
aleatoria X al intervalo [0, 1] es la funcin distribucin de probabilidad para X si y slo si se
satisfacen las siguientes propiedades:
p x 1
x
F(x) = P(X x) = p t
tx
Ejemplo
Experimento aleatorio: se lanza una moneda 3 veces
= {ccc, ccs, csc, css, scc, scs, ssc, sss }
Sea X : # caras observadas
x 0 1 2 3
p(x) 1 3 3 1
8 8 8 8
La distribucin anterior es una distribucin de probabilidades para la variable aleatoria X, en
efecto 0 p(x) 1 para todo x (x = 0, 1, 2 y 3) y adems
p x 1. Para determinar la
x
distribucin acumulada de probabilidad observe que
P(X 0) = P(X = 0) = 1
8
Se tiene entonces,
x 0 1 2 3
F(x) 1 1 7 1
8 2 8
EX = xp x
x
Propiedades:
a) E(k)=k
b) E(kX)=kE(X)
c) E(XY)=E(X)E(Y)
d) E(g(X))=g(x)p(x)
e) Si X y Y son independientes entonces E(XY)=E(X)E(Y)=XY
donde, E X 2 = x2 p x
x
3
2 12 9 3
Entonces, VX = 3
2 4 4
a) V(k)=0
b) V(kX)=k2V(X)
c) V(XY)=V(X)+V(Y) si X y Y son independientes
d) V(aX+bY)= a2V(X)+b2V(Y)+2abCov(XY)
donde Cov(XY) = E((X-X)(Y-Y)) = E(XY)-XY
DISTRIBUCIN BINOMIAL
Un ensayo Bernoulli es un experimento aleatorio que slo admite dos posibles resultados,
denotados xito y fracaso. La probabilidad de xito se denota p.
Por lo tanto si denotamos el xito por 1 y el fracaso por 0 se tiene:
P(1)= p P(0)=1-p=q
Adems se cumple: E(X)= p V(X)=pq
Se puede demostrar que para una variable aleatoria con distribucin binomial
EX = n.p
VX = n.p.q
DISTRIBUCIN HIPERGEOMETRICA:
Una variable aleatoria X tiene una distribucin hipergeomtrica si se toma una muestra sin
reemplazo de un conjunto de N elementos, de los cuales k son considerados de una categora
en especial (aciertos) y los otros N-k son considerados de otra categora (fallas) y se desea
obtener x aciertos de una muestra de n elementos ensayos. Se expresa de la siguiente
formula:
k N k
x nx
P( X x) para x 0,1, 2,....., n
N
n
nk N n nk ( N k )
E ( x) 2 .
N N 1 N2
Ejemplo:
Si existe tres grupos el primero con k1 elementos, el segundo grupo k2 y el tercero con k3 Si
queremos hallar la probabilidad de escoger x elementos del primer grupo, y elementos del
segundo grupo y z elementos del tercer grupo sin reemplazo; la probabilidad es la siguiente:
k1 k2 k3
P( X x, Y y, Z z )
x y z
k1 k2 k3
x yz
DISTRIBUCIN POISSON
Los experimentos que dan valores numricos de una variable aleatoria X que ocurre durante un
intervalo de tiempo dado o en una regin especfica se denominan experimentos Poisson. El
intervalo puede ser de cualquier longitud: un minuto, un da, una semana, un mes o incluso un
ao; y la regin especfica podra ser: un segmento de lnea, un rea o quizs una pieza de
material. Un experimento Poisson se deriva de un proceso Binomial, el cual verifica las
siguientes propiedades:
El nmero de resultados que ocurren en un intervalo o regin es independiente del nmero de
resultados que ocurren en otro intervalo o regin. (Esto determina una caracterstica que se
conoce como falta de memoria)
La probabilidad de que ocurra un solo resultado durante un intervalo muy corto o una regin
pequea es proporcional a la longitud del intervalo o al tamao de la regin y no depende del
nmero de resultados que ocurren fuera de este intervalo o regin.
la probabilidad de que ocurra ms de un resultado en tal intervalo corto o que caiga en tal
regin pequea es insignificante.
DISTRIBUCIONES CONTINUAS
Distribucin uniforme
Se dice que una variable aleatoria X continua tiene una distribucin uniforme en el intervalo
[a,b] si la funcin de densidad de probabilidad (FDP) es
f(x)=
0.14
0.12
0.1
0.08
f(x)=
0.06
0.04
0.02
0
x0 11 223 34 45 56 677 88
Distribucin exponencial
En estadstica la distribucin exponencial es una distribucin de probabilidad continua con un
parmetro > 0 cuya funcin de densidad es
Su funcin de distribucin es
El valor esperado y la varianza de una variable aleatoria X con distribucin exponencial son
f(x)=
f(x)=
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
1 3 5 7 9 11 13 15 17 19
Distribucin Normal
Muchas variables aleatorias continuas presentan una funcin de densidad cuya grfica tiene
forma de campana.
f(x)
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Si X es la media de una muestra aleatoria de tamao n extrada de una poblacin que tiene
media y varianza 2 , entonces
x
z
n
es una variable aleatoria cuya funcin de distribucin de probabilidad se aproxima a la de
la distribucin normal estndar a medida que n aumenta .
Con carcter general, o al menos en los modelos de probabilidad clsicos, se admite una
aproximacin aceptable al modelo normal siempre que n 30 y se dice que la muestra es
grande. Adicionalmente, en este caso, si se desconoce la varianza de la poblacin se puede
usar como aproximacin la varianza muestral: 2 S2
Ejemplo
Un fabricante de latas de pintura especifica que cada una cubre en promedio 500 pies
cuadrados con una desviacin estndar de 36 pies cuadrados. Calcule la probabilidad que la
media del rea cubierta por una muestra aleatoria de 40 de estas latas de pintura tenga un valor
entre 480 y 490 pies cuadrados.
Solucin
X: rea cubierta por una lata de pintura. Es una variable aleatoria cuya distribucin de
probabilidad es desconocida, con media = 500, varianza 2 desconocida.
Por el Teorema del Lmite Central, X tiene distribucin aproximadamente normal si n30, por
lo tanto, ( X -)/(/ n ) tiene distribucin aproximadamente normal estndar. Adicionalmente,
se puede usar la aproximacin: S = 36
Distribucin Weibull
La distribucin de Weibull complementa a la distribucin exponencial y a la normal, se usa
cuando se sabe de antemano que una de ellas es la que mejor describe la distribucin de fallos
o cuando se han producido muchos fallos (al menos 10) y los tiempos correspondientes no se
ajustan a una distribucin ms simple.
Las ecuaciones (1), (2) y (3) slo se aplican para valores de (t - t0) 0. Para valores de (t - t0) < 0,
las funciones de densidad y la tasa de fallos valen 0. Las constantes que aparecen en las
expresiones anteriores tienen una interpretacin fsica:
F(x)=
F(x)=
1.4
1.2
1
0.8
0.6
0.4
0.2
0
x
0.5
0.6
0.7
0.8
0.9
1
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
Distribucin lognormal
a. Representa la evolucin con el tiempo de la tasa de fallos, (t), en la primera fase de vida
de un componente, la correspondiente a los fallos infantiles en la "curva de la baera"
entendindose como tasa de fallos la probabilidad de que un componente que ha
funcionado hasta el instante t, falle entre t y t + dt. En este caso la variable
independiente de la distribucin es el tiempo (figura 1).
b. Permite fijar tiempos de reparacin de componentes, siendo tambin en este caso el
tiempo la variable independiente de la distribucin.
c. Describe la dispersin de las tasas de fallo de componentes, ocasionada por diferente
origen de los datos, distintas condiciones de operacin, entorno, bancos de datos
diferentes, etc. En este caso la variable independiente de la distribucin es la tasa de
fallos.
La distribucin lognormal tiene dos parmetros: m* (media aritmtica del logaritmo de los
datos o tasa de fallos) y (desviacin estndar del logaritmo de los datos o tasa de fallos).
Asigna a valores de la variable < 0 la probabilidad 0 y de este modo se ajusta a las tasas y
probabilidades de fallo que de esta forma slo pueden ser positivas.
Como depende de dos parmetros, se ajusta bien a un gran nmero de distribuciones
empricas.
Es idnea para parmetros que son a su vez producto de numerosas cantidades
aleatorias (mltiples efectos que influyen sobre la fiabilidad de un componente).
La esperanza matemtica o media en la distribucin lognormal es mayor que su
mediana. De este modo da ms importancia a los valores grandes de las tasas de fallo
que una distribucin normal con los mismos percentiles del 5% y 50% tendiendo, por
tanto, a ser pesimista.
Lognormal LOGN(m,o)
Funcin de densidad f(x)= si x>0
de otra
0 manera
Distribucin acumulada F(x)= no existe ecuacin
Parmetros Parmetro de escala: m
Parmetro de forma: o
Rango [0, &]
Media e^-u+o/2
Varianza e^2*u+o^2(e^o^2-1)
LA DISTRIBUCIN T
Suponga que se toma una muestra aleatoria de tamao n<30 de una poblacin con distribucin
normal con media y varianza 2. Se ha establecido anteriormente que la media muestral X
2
tambin tendr distribucin normal con media X y varianza 2X . Por lo tanto, la
n
x
variable z tendr distribucin normal estndar.
n
Este estadstico es til cuando por consideraciones prcticas, no se puede tomar una muestra
aleatoria grande. Pero, para usar este estadstico, es necesario que la poblacin tenga
distribucin normal.
Fig. Distribucin T para = 2, 5, 30 grados de libertad.
Para usar esta distribucin, si no se dispone de un utilitario informtico, se usan tablas que
contienen algunos valores de T para diferentes grados de libertad mediante la siguiente
definicin:
DISTRIBUCION DE PROBABILIDAD F
Supngase que deseamos comparar las varianzas de dos poblaciones normales basados en la
informacin contenida en muestras aleatorias independiente de las dos poblaciones. Supngase
que una muestra aleatoria contiene n1 variables aleatorias distribuidas normalmente con una
varianza comn 12 y que la otra muestra aleatoria contiene n 2 variables aleatorias
distribuidas normalmente con una varianza comn 12 y que la otra muestra aleatoria contiene
n 2 variables aleatorias distribuidas normalmente con una varianza comn 12 . Si calculamos
S12 de las observaciones en la muestra 1, entonces S12 es una estimacin de 12 . De manera
similar, S 22 calculada a partir de las observaciones de la segunda muestra es una estimacin
para 22 . As intuitivamente podramos pensar en utilizar S12 / S 22 para hacer inferencias con
respecto a las magnitudes relativas de 12 y 22 . Si dividimos cada S i2 por i2 , entonces la
razn siguiente
S12 / 12 22 S12
S 22 / 22 12 S 22
tiene una distribucin F con n1 1n2 1 grados de libertad. La definicin general de una
distribucin F es como sigue:
12 / v1
F 2
2 / v2
se dice que tiene una distribucin F con v1 grados de libertad del numerador y v2 grados de libertad
del denominador.
12 n1 1S12 / 12 y 22 n2 1S 22 / 22
v1 n1 1yv2 n2 1
12 / v1 n1 1S12 / 12 n1 1 S12 / 12
F
22 / v2 n2 1S 22 / 22 n2 1 S 22 / 22
tiene una distribucin F con n1 1 grados de libertad del numerador y n2 1 grados de
libertad del denominador.
En al figura 7.3 se muestra la grfica de una tpica funcin de densidad F . Los valoras de F
tales que PF F se dan en la tabla Xi Cuadrado, para los valores de 0.100, 0.050,
0.025, 0.010 y 0.005. En la , los encabezados de las columnas corresponden a los grados de
libertad del numerador, en tanto que los grados de libertad del denominador se encuentran
como los encabezados principales de los renglones.
Frente a los grados de libertad del denominador (los encabezados de los renglones), se
encuentran los valores de 0.100, 0.050, 0.025, 0.010 y 0.005. Por ejemplo, si la variable F
estudiada tiene 5 grados de libertad del numerador y 7 grados de libertad del denominador, F
0.100= 2.88, F 0.050= 3.97, F 0.025 = 5.29, F 0.010 = 7.46 y F 0.005 =9.52. luego la probabilidad de
que una variable aleatoria con una distribucin F con 5 grados de libertad del numerador y 7
grados de libertad del denominador exceda de 7.46 es 0.01 . Lo correspondiente se afirma para
los dems casos.
FIGURA
Una tpica funcin de densidad
De probabilidad F f u
u
F
Los tiempos que tardan en revisar un motor de un automvil avin tienen una distribucin de
frecuencias sesgadas. Las poblaciones asociadas a estas variables aleatorias frecuentemente
tienen distribuciones que se pueden modelar adecuadamente por la funcin de densidad tipo
gamma.
, 0;0 y
y 1 e y /
f ( y)
( )
0
En donde:
( ) y 1e y
dy
0
d y 1e y /
c ( )
dy
Y por lo tanto es importante obtener las reas bajo la funcin de densidad tipo gamma
mediante integracin directa.
Hay dos casos especiales de las variables aleatorias tipo gamma que merece consideracin
particular:
Una variable aleatoria tipo gamma que tiene una funcin de densidad con parmetros alfa igual
a v entre dos y beta igual a dos se denomina variable aleatoria ji - cuadrada.
0;0 y
1 y/
f ( y) e
En cualquier punto.
La funcin de densidad exponencial muchas veces es til en los modelos de duracin de
componentes elctricos.
La distribucin de probabilidad beta es una funcin de densidad con dos parmetros definida en
el intervalo cerrado 0 <= y <= 1. Se utiliza frecuentemente como modelo para fracciones, tal
como la proporcin de impurezas en un producto qumico o la fraccin de tiempo que una
maquina est en reparacin.
( ) ( )
B( , ) y 1 (1 y ) 1 dy
( )
Ntese que la definicin de (y) sobre el intervalo 0<= y <= 1 restringe su aplicacin. Si c<= y <= d,
y = (y- c) / (d- c) definir una nueva variable en el intervalo 0<= y <= 1. As la funcin de densidad
beta se puede aplicar a una variable aleatoria definida en el intervalo c<= y <= d mediante una
traslacin y una medicin en la escala.
y t 1 (1 t ) 1
F ( y) dt I y ( , )
0 B( , )
Para valores enteros de alfa y beta, Iy (alfa, beta) est relacionada con la funcin de
probabilidad binomial. Cuando y = p, se puede demostrar que
y 1 (1 y) 1 n
F ( p) dy p y (1 p) n y
B( , ) y
El propsito de este estudio es proporcionar los conceptos y tcnicas para determinar una
ecuacin que describa de manera razonable a un conjunto de datos dado. Este estudio se
denomina anlisis de regresin y la ecuacin emprica obtenida se denomina ecuacin de
regresin la cual sustituye a un modelo terico no disponible
Se supondr que existe una correspondencia de X a Yde tal manera que cada valor yi est
asociado con un valor xi.
Es importante reconocer que cada valor yi es el resultado de una medicin, por lo tanto, es
posible que pudiesen haber otros valores yi para el mismo valor dado xi. Esto nos permite
reconocer que yi proviene de una variable aleatoria Yi la cual debe tener alguna distribucin de
probabilidad. Tratemos de visualizarlo en el siguiente grfico:
Supondremos que existe una relacin lineal entre X y Y. Este hecho puede reconocerse
graficando los puntos (xi, yi), i = 1, 2, ..., n y observando la tendencia lineal de los puntos. Esta
representacin se denomina grfico de dispersin.
Se propone un modelo lineal que tome en cuenta la aleatoriedad de Y y permita luego explicar
los errores de medicin.
Modelo probabilista propuesto:
Y = 0 + 1 x + .
siendo el componente aleatorio de Y
Se supondr que para cada variable aleatoria Yi el componente aleatorio i tiene la misma
distribucin de probabilidad y que adems son independientes.
Por lo tanto, el valor esperado de este modelo, es una recta terica (desconocida) con los
parmetros 0 y 1 que deben estimarse
E[Y] = 0 + 1 x .
El objetivo es colocar una recta entre los puntos de tal manera la suma de las distancias de esta
recta a los puntos sea la menor posible.
Definicin
y 0 1 x .
Es la recta de mnimos cuadrados. 0 , 1 son los estimadores de 0 y 1
Para cada valor x i se tiene el valor observado yi y un valor yi obtenido con la recta de
mnimos cuadrados: yi 0 1 x i
Sea ei = yi - yi ,
Entonces, el criterio de mnimos cuadrados consiste en minimizar e i2 para todos los puntos. El
cuadrado puede interpretarse como una manera de cuantificar las distancias. No importa si el
punto est sobre o debajo de la recta
SCE SCE
0, 0
0 1
n n n
0 x i 1 x i2 x i y i
i1 i 1 i1
De donde se obtienen finalmente los estimadores 0 , 1
Ejemplo
Los siguientes datos corresponden a una muestra aleatoria de 10 estudiantes que han tomado
cierta materia. Los datos incluyen la calificacin parcial y la calificacin final. Se pretende
encontrar un modelo de regresin que permita predecir la calificacin final que obtendra un
estudiante dada su calificacin parcial.
Solucin
Primero representamos los datos en un diagrama de dispersin
Clculos
i xi yi x 2i xiyi
1 39 65 1521 2535
2 43 75 1849 3225
3 21 52 441 1092
4 64 82 4096 5248
5 57 92 3249 5244
6 43 80 1849 3440
7 38 73 1444 2774
8 75 98 5625 7350
9 34 56 1156 1904
10 52 75 2704 3900
10
i1
466 748 23934 36712
Ecuacin de mnimos cuadrados: y = 35.83 + 0.836 x
Y = 0 + 1 x1 + 2 x2 + ... + k xk + .
Suponer que se tiene una muestra aleatoria (x1,i, x2,i, ..., xk,i, yi), i = 1, 2, ..., n
Fijados los k valores x1,i, x2,i, ..., xk,i se tiene una observacin o medicin yi la cual es uno de los
posibles valores de la variable aleatoria Yi
Se supondr que para cada variable aleatoria Yi el componente aleatorio i tiene la misma
distribucin de probabilidad, y que adems son independientes.
y 0 1 x 1 2 x 2 ... k x k .
Sea ei = yi - yi ,
en donde yi : valor observado en la muestra
yi : valor obtenido con el modelo de mnimos cuadrados:
i 1 i 1 i 1
SCE
Utilizando 0 , i=0, 1, 2, ..., k, se obtienen las ecuaciones normales para encontrar los
i
estimadores 0 , 1 , ..., k
Y = 0 + 1 x1 + 2 x2 + .
y 0 1 x1 2 x 2
Para encontrar 0 , 1 , 2
SCE
0 , i=0, 1, 2
i
n n n n
0 x 1,i 1 x 12,i 2 x 1,i x 2 ,i x 1,i y i
i 1 i1 i 1 i 1
n n n n
0 x 2 ,i 1 x 2 ,i x 1,i 2 x 22 ,i x 2 ,i y i
i 1 i 1 i 1 i1
Datos de la muestra:
(x1,i, x2,i, yi), i = 1, 2, ..., n
Y1 1 x 1,1 x 2,1 1
Y 1 x
x 2,2 0 2
2 1,2
Y=X + . . . . 1 .
. . . . 2 .
Yn 1 x 1,n x 2,n n
X se denomina matriz de diseo
Y1 1 x 1,1 x 2,1 1
Y 1 x x 2,2
2 1,2 0 2
Y= . , X = . . . , = 1 , = .
. . . . 2 .
Yn 1 x 1,n x 2,n n
y 0 1 x1 2 x 2 A =C
n n
1 x 1,1 x 2 ,1
n x 1,i x x 2 ,2
2 ,i
n i1 i 1
1 1 . . 1 1 x 1,2
n
A = x 1,i x 2
x 1,i x 2 ,i = x 1,1 x 1,2 . . x 1,n . . . .
i 1 1,i
x 2 ,1 . . x 2 ,n .
i1 i 1
n n x 2 ,2 . .
x 2 ,i x 2,i x 1,i x 2 ,i 1 x 1,n x 2 ,n
2
i1 i1 i 1
A = XT X
n y1
yi
n i1 1 1 . . 1 y 2
C = x 1,i y i = x 1,1 x 1,2 . . x 1,n . .
i1
n x 2 ,1 x 2 ,2 . . x 2 ,n .
x 2 ,i y i y n
i1
C = XT y
1
Sea = 2
3
Entonces A = C XT X = XT y = (XT X)-1 (XT y)
: vector con los estimadores de mnimos cuadrados
X: matriz de diseo (datos de la muestra)
y: vector de observaciones obtenidas en la muestra
y1
y
2
y = .
.
y n
ANALISIS DE VARIANZA
1 n 1 n
(0) x xi y yi
n i1 n i1
2
n n 1 n
(1) Sxx = ( x i x ) 2
= x i2 x i
i1 i1 n i 1
2
n n 1 n
(2) SCT = Syy = ( yi y) = yi2 2
yi
i1 i1 n i 1
n n 1 n n
(3) Sxy = (x i x )( yi y) = x i yi x i yi
i1 i1 n i 1 i 1
2
n
S xy
(4) SCE = ( yi yi )2 S yy
i1 Sxx
n
S2xy
(5) SCR = ( yi y)
2
i1 S xx
Demostracin de (1)
n n n n
2 2
Sxx = ( x i x ) 2 = (x i2 2x i x x ) = x i2 2x x i nx
i1 i1 i1 i1
n 1 n n n
2 2 2
= x i2 2xn x i nx = x i2 2xnx nx = x i2 nx
i1 n i1 i1 i1
2
n
xi 2
i1 2 1
n n n
= x i n
2
= x i x i
i1 n i1 n i 1
ESTIMACIN DE LA VARIANZA
La varianza 2 puede ser estimada con la varianza de los errores de los datos de la muestra
De cual se obtiene
S2xy
S yy SCE
S xx
n n n
( y i y) 2 ( y i y) 2 ( y i y i ) 2
i1 i1 i1
En forma simblica
Mientras menor es el valor de SCE, mejor es el la eficacia del modelo de mnimos cuadrados
propuesto. Su varianza explica adecuadamente a la varianza de los datos.
Y = 0 + 1 x1 + 2 x2 + ... + k xk +
Para este modelo tambin es vlida la ecuacin anterior con la misma interpretacin de las
fuentes de variacin:
Para medir la eficacia o poder de explicacin del modelo de mnimos cuadrados propuesto se
define la siguiente medida:
Ejemplo
Suponer que con los datos se obtuvo R2 = 0.934
Esto significa que el 93.4% de la variacin de la variable de inters, es explicada por el modelo
de mnimos cuadrados.
Se entiende tambin que el valor de SCE debe ser pequeo y esto debe interpretarse como
que los datos no estn muy alejados de la recta de mnimos cuadrados y que sta los
representa adecuadamente.
Y = 0 + 1 x1 + 2 x2 + ... + k xk +
N(0, 2) .
y 0 1 x 1 2 x 2 ... k x k .
Suposiciones
i es un estimador insesgado del parmetro i
E[ i ] = i
El estimador i tiene distribucin normal
i N(i, 2 i )
Notacin
V[ i ] = 2 i = ii (varianza de i )
Cov[ i , j ] = i j = ij (covarianza de i , j )
Definicin
Matriz de varianzas-covarianzas
11 12 . . 1k
21 22 . . 2k
[ ij ] = . . . . . .
. . . . .
k1 k 2 . . kk
Parmetro: i , i = 0, 1, ..., k
Estimador: i , i = 0, 1, ..., k
El estadstico
i i
t= , tiene distribucin t con = n-k-1 grados de libertad
i
Definicin
Intervalo de confianza para i con nivel 1 -
i - t/2 i i + t/2 , i=0, 1, ..., k .
i i
Ejemplo
Se desea definir un modelo de regresin para predecir la calificacin final Y que tendra un
estudiante, dada su calificacin parcial x1 y su porcentaje de asistencia a clases x2 considerando
los siguientes datos:
Y = 0 + 1 x1 + 2 x2 + .
b) Notacin matricial
Y1 1 67 75 1
Y 1
2 65 78
0
2
Y3 1 78 79 3
1
Y4 1 60 83 4
2
Y5 1 64 65 5
Y6 1 61 76 6
1 67 75
1 65 78
1 78 79
X= (matriz de diseo)
1 60 83
1 64 65
1 61 76
c) Estimacin de parmetros por mnimos cuadrados
y 0 1 x1 2 x 2
0
= 1 = (XT X)-1 (XT y)
2
1
n n
n
n x 1,i x 2 ,i yi
n i 1
n
i 1
n i1
= x 1,i x x 1,i x 2 ,i x y
2
i 1 i 1
1,i
i 1
i1
1,i i
n n n
x 2 ,i x x 1,i x 2 ,i
2 x 2 ,i y i
i1 i 1
2 ,i
i 1 i1
1
6 395 456 442
= 395 26215 30033 29431
456 30033 34840 33877
48.974 02880 0.3927 442
= 0.2880 4.760x10 3
3.360x10 4 29431
0.3927 3.366x10 4 5.458x10 3 33877
134.07
= 1.4888
1.4437
y 134.07 1.4888 x1 1.4437x 2
SCR 906.7503
R2 = = 0.9019 = 90.19%
SCT 1005.33
g) Estimacin de la varianza
SCE 98.583
S2 = = 32.861
nk 1 621
h) Matriz de varianza-covarianza
X X
i, j
T 1
2 X T X
1
S2
48.974 02880 0.3927
= 0.2880 4.760x10 3 3.360x10 4 (32.861)
0.3927 3.366x10 4 5.458x10 3
1609.33 9.4653 12.904
= 9.4653 0.15654 0.01106
12.904 0.01106 0.17937
-261.72 0 -6.4204
e 1 6.0401
e 1.6866
2
e 3 2.1121
=
e 4 5.0878
e 5 4.0562
e 6 3.5294
2 S2 = 32.861
e 0 ei
Zi = i = (valores estandarizados)
S S
F0(Zi) (distribucin normal estndar acumulada)
Estadstico de prueba
Dn = max| Sn(xi) F0(xi)| (para este ejemplo xi son los valores ei)
Regin de rechazo de Ho
= 0.05, n = 6 D0.05 = 0.521 (Tabla K-S)
Dn > 0.521