Professional Documents
Culture Documents
Contenido
Temario original por la escuela....................................................................................................... 3
Temario que se ver en clase.......................................................................................................... 3
Unidad I Inferencia estadstica o inductiva...................................................................................... 4
Introduccin................................................................................................................................. 4
Campos de aplicacin.................................................................................................................. 4
Unidad II Teora elemental del muestreo......................................................................................... 4
Distribuciones de muestreo......................................................................................................... 5
Distribucin de muestreo de medias........................................................................................ 5
Distribucin de muestreo de proporciones...............................................................................7
Distribucin de muestreo de diferencias y sumas....................................................................9
Unidad III Teora de la estimacin estadstica................................................................................ 10
Estimaciones sin sesgo.............................................................................................................. 10
Estimaciones de intervalo de confianza para parmetros de poblacin....................................10
Intervalo de confianza para las medias..................................................................................11
Intervalos de confianza para proporciones............................................................................. 11
Intervalos de confianza para diferencias y sumas..................................................................12
Unidad IV Teora estadstica de las decisiones..............................................................................13
Hiptesis Nula:........................................................................................................................... 13
Hiptesis Alternativa:................................................................................................................. 13
Contraste de hiptesis y significacin o reglas de decisin.......................................................13
Errores de tipo I y de tipo II........................................................................................................ 14
Nivel de significacin................................................................................................................. 14
Contrastes mediante la distribucin normal..............................................................................14
Contrastes de una y dos colas................................................................................................ 15
Curvas de operacin caractersticas, potencia de un contraste.................................................16
Unidad V Test de Ji-Cuadrada..................................................................................................... 16
Definicin de 2.......................................................................................................................... 16
El test de 2 para la bondad de ajuste....................................................................................... 16
Tablas de contingencia............................................................................................................... 16
Unidad VI Ajuste de curvas y el mtodo de mnimo cuadrados....................................................18
Ajuste de curvas........................................................................................................................ 18
El mtodo de mnimos cuadrados.............................................................................................. 19
Introduccin
Comprende aquellas tcnicas por medio de las cuales se toman decisiones sobre una poblacin
estadstica basadas en una muestra o en juicios de los administradores. Debido a que esas
decisiones se toman en condiciones de incertidumbre, se requiere el uso de conceptos de
probabilidad. Considerando que las caractersticas medidas en una muestra se denominan
estadsticas mustrales, las caractersticas medidas en una poblacin estadstica o universo, se
llaman parmetros poblacionales.
Ningn mtodo estadstico puede corregir los defectos por una inadecuada seleccin del
problema que se investiga, o por una mala recoleccin de datos. Una investigacin que empieza
mal, con seguridad termina mal.
Con datos de mala calidad no ser posible dar una respuesta adecuada a un problema
cientfico.
Campos de aplicacin
La inferencia estadstica es ampliamente utilizada en diversas reas, a continuacin se
mencionan unas pocas.
Entre otras.
Distribuciones de muestreo
Si consideramos todas las posibles muestras de tamao n en una poblacin, para cada muestra
podemos calcular un estadstico (como la media o desviacin estndar) que variara de muestra a
muestra. De esta manera obtenemos una distribucin de muestreo. Tenemos diferentes tipos de
distribucin de muestreo que ms adelante veremos.
Distribucin de muestreo de medias
Supongamos que se toman todas las posibles muestras de tamao n, sin reposicin de una
poblacin finita de tamao N. Si denotamos la media y la desviacin estndar de la distribucin
de muestreo de medias por x y x y las de la poblacin , respectivamente entonces
x =
x =
N n
N 1
Donde:
N es el tamao de la poblacin
n es el tamao de la muestra
Si la poblacin es infinita o si el muestreo es con reposicin, los resultados anteriores se reducen
a
x =
x =
Por ejemplo:
Las alturas de 3000 estudiantes varones de una universidad estn normalmente distribuidos con
media 68 pulgadas y una desviacin estndar de 3 pulgadas. Si se toman 80 muestras de 25
estudiantes cada una. Cules sern la media y la desviacin estndar esperadas de la
resultante distribucin de muestreo de medias, si el muestre se hizo a) con reposicin y b) sin
reposicin.
a)
x =68
x =
3
=0.6
25
b)
x =68
x =
3 3000 25
=0.5975
25 3000 1
Como la diferencia es menor se considera para efectos prcticos la misma que en muestre con
reposicin.
En cuntas muestras esperaramos encontrar una media de a) 66.8 y 68.3 pulgadas y b) menor
que 66.4
a)
Z=
X x
x
Z=
66.8 68.0
=2.0
0.6
Z=
68.3 68.0
=0.5
0.6
0.4772+0.1915=0.6687
0.6687*80=53.496 o 53 muestras
b)
Z=
66.4 68.0
=2.67
0.6
0.5-0.4962=0.0038
0.0038*80=0.304 o cero
500 esferas tienen un peso medio de 5.02 gramos y una desviacin estndar de 0.30 g. Hallar la
probabilidad de que una muestra al azar de 100 esferas de ese conjunto tengan un peso total a)
entre 496 y 500 g y b) ms de 510g
x =5.02
x =
a) El peso total estara entre 496 y 500 si el peso medio de las 100 bolas est entre 4.96 y 5 g
Z=
4.96 5.02
=2.23
0.0268
Z=
5 5.02
= 0.74
0.0268
*Entre z a z se restan
*Entre +z a +z se restan
*Si la variable es = a la media, se suma 0.5
0.4871-0.2704=0.2167
b) El peso total exceder los 510g si el peso medio de las 100 bolas excede 5.10 g
Z=
5.10 5.02
=2.98
0.0268
0.5-0.4986=0.0014
p= p
p=
p (1 p)
pq
=
n
n
Esta frmula es vlida para poblaciones finitas realizadas con muestreo con reposicin. Para
poblaciones finitas con muestreo sin reposicin se usa:Y
p= p
p = pq
Ecuacin 0 Formulas de media y desviacin estndar de distribucin de muestreo de proporciones sin
muestreo con reposicin
Cada persona de un grupo de 500 lanza una moneda 120 veces. Cuntas personas se espera
que a) Saquen entre 40% y 60% de soles y b) 5/8 de sus lanzamientos o ms de soles
1
p= =0.5
2
11
22
p=
=0.0456
120
Como la proporcin es una variable discreta, hay que hacer una correccin, si la variable es
menor a la media se resta
Z=
Z=
1
2n
1
2n
0.4857+0.4857=0.9714
500*0.9714=489 muestras
b)
Z=
0.4977
0.5-0.4977=0.0023
500*0.0023= 1 personas.
Se ha encontrado que el 2% de las piezas fabricadas en una cierta mquina son defectuosas
Cul es la probabilidad de que en un envo de 400 piezas a) el 3% o ms b)2% o menos, sean
defectuosas?
p=0.02
p=
0.02 0.98
=0.007
400
a)
1/2N=1/800=0.0012
Z=
0.5-0.3944=0.1056
b)
Z=
0.02+0.0012 0.02
=0.18
0.007
0.5+0.0714=0.5714
Distribucin de muestreo de diferencias y sumas
Sean dadas dos poblaciones. Para cada muestra de tamao n 1 de la primera, calculamos un
estadstico S1; eso da una distribucin de muestreo para S 1, cuya media y desviacin estndar
denotaremos por s1 y s1. Del mismo modo, para cada muestra de tamao n 2 de la segunda
poblacin, calculamos un estadstico S 2; eso nos da un distribucin de muestreo para S 2 cuya
media y desviacin estndar denotaremos con s2 y s2. Si tenemos medias mustrales de ambas
poblaciones, la distribucin de muestreo de las diferencias de medias viene dada para
poblaciones infinitas o con muestreo con reposicin con medias y desviaciones estndar por:
x 1 x 2=x 1 x 2=1 2
21 22
x 1 x 2= + =
+
n1 n2
2
x 1
2
x 2
Se puede usar la misma frmula para poblaciones finitas o muestreo sin reposicin.
Para suma se utiliza:
x 1+ x 2= x 1 + x 2= 1+ 2
21 22
x 1 +x 2= + =
+
n 1 n2
2
x 1
2
x 2
p 1 p 2= p 1 p 2= p1 p2
p 1 p 2 = 2p 1+ 2p 2=
p1 q1 p2 q2
+
n1
n2
Ejemplo:
Las bolas de rodamientos de cierto fabricante pesan 0.50 g de media, con desviacin ESTANDR
de 0.02 g. Cul es la probabilidad de que dos lotes de 1000 bolas cada uno difieran en peso en
ms de 2 g?
x 1 x 2=
Z=
( 0.02 ) ( 0.02 )
+
=0.0008
1000 1000
( x1 x 2 ) 0
0.0008
=0.18
La diferencia entre ambos debe ser de 2g, por lo que 2/1000=0.002 g, asi que
Z=
0.002 0
=2.23
0.0008
Z=
0.002 0
=2.23
0.0008
2.23=0.4871
Ilustracin 0 rea bajo la curva que se busca para P2.23 o P-2.23
(0.5-0.4871)+(0.5-
Nivel
de
confian
za
99.73
%
99%
98%
96%
95.45
%
95%
90%
80%
68.27
%
50%
zc
3.00
2.58
2.05
2.05
2.00
1.96
1.64
5
1.28
1.00
0.67
45
X Z C
n
Ecuacin 0 Intervalo de confianza para medias cuando es infinita o con reposicin
X Z C
n
Nn
N 1
Ecuacin 0 Intervalo de confianza para medias cuando la poblacin es finita sin reposicin
67.45 1.96
2.93
=67.45 0.57 42
100
Esto significa que 66.88 < < 68.02 o en otras palabras podemos decir que la
probabilidad de que la altura media de la poblacin est entre 66.88 y 68.02 pulgadas es
del 95%. Equivale a decir que tenemos el 95% de confianza que la media de la poblacin
est entre 66.88 y 68.02.
b)
67.45 2.58
2.93
=67.45 0.76
100
Esto significa que 66.69 < < 68.21 o en otras palabras podemos decir que la
probabilidad de que la altura media de la poblacin est entre 66.69 y 68.21 pulgadas es
del 99%. Equivale a decir que tenemos el 99% de confianza que la media de la poblacin
est entre 66.69 y 68.21.
Actividad en clase: Realizar ejercicio 9.6 de la pgina 214 del libro Estadstica Segunda Edicin.
p ZC
pq
n
Ecuacin 0 Intervalo de confianza para proporciones cuando la poblacin es infinita o con reposicin
p ZC
pq
n
N n
N 1
Ecuacin 0 Intervalo de confianza para proporciones cuando la poblacin es finita sin reposicin
Ejemplo:
Un sondeo de 100 votantes elegidos al azar en un distrito indica que el 55% de ellos estaban a
favor de un cierto candidato. Hallar los lmites de confianza a) 95% b) 99% y c) 99.73% para la
proporcin de todos los votantes favorables a ese candidato.
a)
0.55 1.96
( 0.55 )( 0.45 )
=0.55 0.10
100
b)
0.55 2.58
( 0.55 )( 0.45 )
=0.55 0.13
100
c)
0.55 3
( 0.55 )( 0.45 )
=0.55 0.15
100
X 1 X 2 Z C
21 22
+
n1 n2
Ecuacin 0 Intervalos de confianza para diferencias y sumas de Medias
Ejemplo:
Una muestra de 150 lmparas del tipo A ha dado una vida media de 1400 horas y una desviacin
estndar de 120h. Una muestra de 100 lmparas del tipo B dan vida media de 1200 h y
desviacin estndar de 80h. Hallar los lmites de confianza a) 95% b) 99% para la diferencia de
las vidas medias de las poblaciones de ambos tipos.
a)
b)
( 120 ) ( 80 )
1400 1200 1.96
+
=200 24.8
150 100
2
2
( 120 ) ( 80 )
1400 1200 2.58
+
=200 32.6
150 100
Proporciones
P1 P 2 Z C
p1 q 1 p2 q 2
+
n1
n2
Ejemplo:
En una muestra aleatoria de 400 adultos y 600 jvenes que vieron un cierto programa de
televisin 100 adultos y 300 jvenes reconocieron que les haba gustado. Determinar los lmites
de confianza a) 95% y b) 99% para la diferencia en proporciones de todos los adultos y jvenes
que vieron con agrado el programa. 300/600=0.5 400/100=0.25
a)
b)
Hiptesis Nula:
En muchos casos se formulan hiptesis estadstica con el nico propsito de rechazarla o
invalidarla. As, si queremos decidir si una moneda est trucada, formulamos la hiptesis de que
la moneda es buena (o sea p=0.5). Esta hiptesis se le llama hiptesis nula y se detona por H o.
Hiptesis Alternativa:
Es toda hiptesis que difiera de una ya dada. Por ejemplo, si una hiptesis es p=0.5, las
alternativas pueden ser p=0.7, p0.5 o p>0.5. Se denota por H 1.
que las diferencias observadas son significativas y nos veramos obligados a rechazar la
hiptesis. Por ejemplo en 20 lanzamientos de una moneda salen 16 caras, estaramos obligados
a rechazar la hiptesis de que la moneda es buena, aunque hay posibilidad de equivocarnos. Los
procedimientos para determinar si las muestras observadas difieren significativamente de los
resultados esperados se llaman contrastes (o tests) de hiptesis o de significacin o reglas de
decisin.
Nivel de significacin
Al contrastar una cierta hiptesis la mxima probabilidad con la que estamos dispuestos a correr
el riesgo de cometer un error de Tipo I se llama nivel de significacin del contraste. Esta
probabilidad denotada a menudo por se especifica antes de tomar la muestra. En la prctica es
frecuente usar un nivel de significacin de 0.05 0.01. , por ejemplo si se usa 0.05 (5%) hay 5
oportunidades de 100 de rechazar la hiptesis, es decir tenemos un 95% de confianza de que
hemos adoptado la decisin correcta y un 5% de que nos hemos equivocado.
Nivel de
significacin
Valores crticos de
z para tests
unilaterales
Valores crticos de
z para tests
bilaterales
0.10
0.05
0.01
0.005
0.02
-1.28 o 1.28
-1,645 o
1.645
-2.33 o
2.33
-2.58 o 2.58
-2.88 o 2.88
-1.645 y
1.645
-1.96 y
1.96
-2.58 y
2.58
-2.81 y 2.81
-3.08 y 3.08
Ilustracin 0 Distribucin normal cannica con un 95% de confianza de que la hiptesis es verdadera
Ejemplos:
En un experimento sobre percepcin extrasensorial (PES), un individuo en una habitacin es
invitado a adivinar el color (rojo o azul) de una carta elegida de un mazo de 50 cartas bien
mezcladas por otro individuo en otra habitacin. El no sabe cuntas rojas y cuantas azules hay
en el mazo. Si el sujeto identifica 32 cartas correctamente, determinar si el resultado es
significativo al nivel de a) 0.005 y b) 0.001
H0:p=0.5 y el sujeto est simplemente diciendo colores al azar.
H1:p>0.5 y el sujeto tiene poderes de PES
Como estamos interesados en saber que adivine 32 o ms entonces se utiliza un contraste de
una sola cola y es hacia la derecha.
z=
32 25
=1.98
3.54
E1
o1
e1
E2
o2
e2
Definicin de 2
Una medida de la discrepancia existente entre las frecuencias observadas y esperadas viene
proporcionada por el estadstico 2 dado por:
k
=
2
j=1
( o j e j )
ej
Ecuacin 0 Formula de 2
Tablas de contingencia
La tabla 3, se le suelen denominar tablas de contingencia, en la cual podemos ver las
frecuencias esperadas y las frecuencias esperadas.
El estadstico 2 necesita de grados libertad, v, para podernos dar un resultado correcto. El grado
de libertad se calcula
v =k 1
Ecuacin 0 Formula para calcular los grados de libertad
Ejemplo
En 200 tiradas de una moneda, han salido 115 soles y 85 guilas. Contrastar la hiptesis de que
la moneda es buena, con nivel de significacin a)0.005 y b) 0.001
Suceso
E1
Soles
115
100
Frecuencia observada o
Frecuencia esperada e
E2
guilas
85
100
Entonces:
2=
20.95
Ajuste de curvas
Para hallar una ecuacin que relacione las variables, el primer paso es recoger datos que
muestren valores correspondientes de las variables bajo consideracin. As por ejemplo,
supongamos que X e Y denotan, respectivamente, la altura y el peso de personas adultas;
entonces una muestra de N individuos revelara las alturas X 1, X2Xn y los pesos Y1, Y2Yn
El prximo paso es marcar los puntos sobre un sistema de coordenadas rectangulares. El
conjunto de puntos resultante se llama diagrama de dispersin. A partir de dicho diagrama de
dispersin es posible, visualizar una curva suave que aproxime los datos. Tal curva se llama una
curva aproximante. El problema general de hallar ecuaciones aproximantes que se ajusten a un
conjunto de datos se llama ajuste de curvas.
Ilustracin 0 Diagrama de dispersin que no es lineal y se dice que es una relacin no lineal
Y =a0 +a1 X
Ecuacin 0 Recta de mnimos cuadrados
Donde a0 y a1 se calculan
a0 =
Y X 2 X XY
2
N X 2 ( X )
a1 =
N XY x y
2
N x 2 ( x )
Ejemplo
Ajustar una recta de mnimos cuadrados a los datos siguientes
X
1 3
1 2
1
1
8
14
9
Y =a0 +a1 X
Entonces tabulamos los valores
X
1
3
4
6
8
9
11
14
Y
1
2
4
4
5
7
8
9
X2
1
9
16
36
64
81
121
196
XY
1
6
16
24
40
63
88
126
Y2
1
4
16
16
25
49
64
81
X =56
Y =40
X 2=524
XY =364
Y 2=256
Entonces
a0 =
( 40 ) (524 ) ( 56 ) ( 364 )
=0.545
8 ( 524 ) ( 56 )2
a1=
8 ( 364 ) (56 )( 40 )
=0.636
2
8 ( 524 ) ( 56 )
Y =0.545+ 0.636 X
Y =a0 +a1 X +a 2 X 2
Ecuacin 0 Parbola de mnimos cuadrados
Correlacin lineal
Si X e Y son dos variables en cuestin un diagrama de dispersin muestra la localizacin de los
puntos (X, Y) sobre un sistema rectangular de coordenadas. Si todos los puntos del diagrama
parecen estar en una recta como en la ilustracin 6 y 7 la correlacin se llama lineal. Si Y tiende
a crecer cuando X crece en como en la ilustracin 6 se dice que es positiva. Si Y tiende a
decrecer cuando X crece como en la ilustracin 7 , se dice que es negativa. Si todos los puntos
parecen estar sobre una cierta curva, la correlacin no es lineal. Si no hay relacin entre las
variables decimos que no hay correlacin entre ellas.
Y =a0 +a1 X
Ecuacin 0 recta de regresin Y sobre X
Donde a0 y a1 se calculan
Y X 2 X XY
a0 =
2
N X 2 ( X )
a1=
N XY x y
2
N x 2 ( x )
X =b0 +b 1 Y
Ecuacin 0 Recta de regresin X sobre Y
Donde b0 y b1 se calculan
X Y 2 Y XY
b0 =
2
N Y 2 ( Y )
b1 =
N XY X Y
N Y 2 ( Y )
Ejemplo:
Altura X del
padre
Altura Y del
hijo
65
63
68
66
6
7
6
8
6
4
6
5
68
62
70
66
68
67
69
71
69
66
68
65
71
67
68
70
X j
1
X j= X jk j=1,2 a
b k =1
El punto en X j se usa para anunciar que el ndice k se ha sumado. Los valores se llaman
medias de grupo, medias de tratamiento o medias de filas. La media global se calcula
a
1
X = X jk
ab j=1 k=1
V W = ( X jk X j )
j ,k
V B =b ( X j X )
V =V W +V B
En la prctica es conveniente restar alguna cantidad fija de todos los datos de la tabla para
simplicar los clculos; tal operacin no tiene efecto alguno sobre el resultado final.
Ejemplo
La siguiente tabla da las producciones por acre de una cierta variedad de trigo que crece en
terrenos tratados con fertilizantes A, B y C. Hallar a) las producciones medias para los diferentes
tratamientos, b) la media global para todos los tratamientos c) la variacin total d) la variacin
entre tratamientos e) la variacin dentro de los tratamientos.
A
B
C
48
47
49
49
49
51
50
48
50
49
48
50
Para hacer mejor el clculo podemos restar 45 a todos los datos y queda la tabla
3
2
4
4
4
6
5
3
5
4
3
5
a)
1
X 1= ( 3+ 4+5+ 4 )=4
4
1
X 2= ( 2+ 4+3+ 3 )=3
4
1
X 3= ( 4+6 +5+5 )=5
4
b)
1
X = ( 3+ 4+ 5+4 +2+4 +3+3+ 4+6+ 5+5 )=4
12
c)
V = ( X jk X ) =( 3 4 )2 + ( 4 4 )2 + ( 5 4 )2 + ( 4 4 )2+ ( 2 4 )2+ ( 4 4 )2 + ( 3 4 )2 + ( 3 4 )2 + ( 4 4 )2 + ( 6 4 )2 + ( 5 4 )2 + ( 5 4
j ,k
d)
2
V B =b ( X j X ) =4 [ ( 4 4 )2+ ( 3 4 )2 + ( 5 4 )2 ] =8
j
e)
V W =V V B=14 8=6
Mtodos Abreviados
V = X 2j , k
j ,k
V B=
T
ab
1
T2
2
Tj
b j
ab
V W =V V B
Ecuacin 0 Mtodos Abreviados para experimento de un factor.
X jk
X jk T j= X jk
k
T =
j,k
V E = ( X jk X j X k + X )
jk
)2
V R =b ( X j X
j=1
)
V C =a ( X k X
j=1
Formas abreviadas
2
V = X j , k
j ,k
V R=
T2
ab
2
1
T
2
Tj
b j=1
ab
b
1
T2
2
V C= T k
a j=1
ab
R V c
V E =V V
Ecuacin 0 Mtodos Abreviados para experimento de 2 factores
Bibliografa
Unidad I Estadstica Aplicada, Julian de la Horra Navarro, Mc Graw Hill. Pgina 84.
Unidad II Estadstica Segunda Edicin, Spiegel, Mc Graw Hill. Pginas 186-207
Unidad III Estadstica Segunda Edicin, Spiegel, Mc Graw Hill. Pginas 208-222
Unidad IV Estadstica Segunda Edicin, Spiegel, Mc Graw Hill. Pginas 223-240
Unidad V Estadstica Segunda Edicin, Spiegel, Mc Graw Hill. Pginas 268-284
Unidad VI Estadstica Segunda Edicin, Spiegel, Mc Graw Hill. Pginas 289-309
Unidad VII Estadstica Segunda Edicin, Spiegel, Mc Graw Hill. Pginas 322-348
Unidad VIII Estadstica Segunda Edicin, Spiegel, Mc Graw Hill. Pginas 375-396