You are on page 1of 27

ANTOLOGIA PARA LA MATERIA DE ESTADISTICA INFERNCIAL

Contenido
Temario original por la escuela....................................................................................................... 3
Temario que se ver en clase.......................................................................................................... 3
Unidad I Inferencia estadstica o inductiva...................................................................................... 4
Introduccin................................................................................................................................. 4
Campos de aplicacin.................................................................................................................. 4
Unidad II Teora elemental del muestreo......................................................................................... 4
Distribuciones de muestreo......................................................................................................... 5
Distribucin de muestreo de medias........................................................................................ 5
Distribucin de muestreo de proporciones...............................................................................7
Distribucin de muestreo de diferencias y sumas....................................................................9
Unidad III Teora de la estimacin estadstica................................................................................ 10
Estimaciones sin sesgo.............................................................................................................. 10
Estimaciones de intervalo de confianza para parmetros de poblacin....................................10
Intervalo de confianza para las medias..................................................................................11
Intervalos de confianza para proporciones............................................................................. 11
Intervalos de confianza para diferencias y sumas..................................................................12
Unidad IV Teora estadstica de las decisiones..............................................................................13
Hiptesis Nula:........................................................................................................................... 13
Hiptesis Alternativa:................................................................................................................. 13
Contraste de hiptesis y significacin o reglas de decisin.......................................................13
Errores de tipo I y de tipo II........................................................................................................ 14
Nivel de significacin................................................................................................................. 14
Contrastes mediante la distribucin normal..............................................................................14
Contrastes de una y dos colas................................................................................................ 15
Curvas de operacin caractersticas, potencia de un contraste.................................................16
Unidad V Test de Ji-Cuadrada..................................................................................................... 16
Definicin de 2.......................................................................................................................... 16
El test de 2 para la bondad de ajuste....................................................................................... 16
Tablas de contingencia............................................................................................................... 16
Unidad VI Ajuste de curvas y el mtodo de mnimo cuadrados....................................................18
Ajuste de curvas........................................................................................................................ 18
El mtodo de mnimos cuadrados.............................................................................................. 19

Recta de mnimos cuadrados.................................................................................................. 19


Parbola de mnimos cuadrados............................................................................................. 20
Unidad VII Teora de la correlacin................................................................................................ 21
Correlacin y regresin.............................................................................................................. 21
Correlacin lineal....................................................................................................................... 21
La recta de regresin de mnimos cuadrados............................................................................22
Unidad VIII Anlisis de varianza.................................................................................................... 23
Experimentos de factor nico.................................................................................................... 23
Variacin total, variacin dentro de los tratamientos y variacin entre tratamientos................24

Temario original por la escuela


Unidad I Inferencia Estadstica o inductiva
Unidad II La estimacin
Unidad III Estimacin Puntual
Unidad IV Estimacin por intervalos
Unidad V Prueba de hiptesis estadsticas
Unidad VI Continua prueba de hiptesis
Unidad VII Prueba de hiptesis referente a dos medias
Unidad VIII Prueba de hiptesis referentes a las varianzas
Unidad IX Prueba de hiptesis para dos poblaciones normales
Unidad X Curvas caractersticas de operacin
Unidad XI Prueba de Ji-cuadrada de la bondad de ajuste
Unidad XII Regresin
Unidad XIV Correlacin
Unidad XV Anlisis de la varianza

Temario que se ver en clase


Unidad I Inferencia Estadstica o inductiva
Unidad II Teora elemental del muestreo
Unidad III Teora de la estimacin estadstica
Unidad IV Teora estadstica de las decisiones
Unidad V Test de Ji-Cuadrada
Unidad VI Ajuste de Curvas y el mtodo de mnimos cuadrados.
Unidad VII Teora de la Correlacin
Unidad VIII Anlisis de varianza

Unidad I Inferencia estadstica o inductiva

Introduccin
Comprende aquellas tcnicas por medio de las cuales se toman decisiones sobre una poblacin
estadstica basadas en una muestra o en juicios de los administradores. Debido a que esas
decisiones se toman en condiciones de incertidumbre, se requiere el uso de conceptos de
probabilidad. Considerando que las caractersticas medidas en una muestra se denominan
estadsticas mustrales, las caractersticas medidas en una poblacin estadstica o universo, se
llaman parmetros poblacionales.
Ningn mtodo estadstico puede corregir los defectos por una inadecuada seleccin del
problema que se investiga, o por una mala recoleccin de datos. Una investigacin que empieza
mal, con seguridad termina mal.
Con datos de mala calidad no ser posible dar una respuesta adecuada a un problema
cientfico.

Campos de aplicacin
La inferencia estadstica es ampliamente utilizada en diversas reas, a continuacin se
mencionan unas pocas.

En las ciencias naturales: se emplea en la descripcin de modelos termodinmicos


complejos (mecnica estadstica), en fsica cuntica, en mecnica de fluidos o en
la teora cintica de los gases, entre otros muchos campos.

En las ciencias sociales y econmicas: es un pilar bsico del desarrollo de la


demografa y la sociologa aplicada.

En economa: suministra los valores que ayudan a descubrir interrelaciones entre

mltiples parmetros macro y microeconmicos.

En las ciencias mdicas: permite establecer pautas sobre la evolucin de las


enfermedades y los enfermos, los ndices de mortalidad asociados a procesos
morbosos, el grado de eficacia de un medicamento, etctera.

Entre otras.

Unidad II Teora elemental del muestreo


La teora del muestreo estudia la relacin entre una poblacin y las muestras tomadas de ella. Es
de gran utilidad en muchos campos. Por ejemplo para estimar magnitudes desconocidas de una
poblacin, tales como media y varianza, llamadas a menudo parmetros, a partir del
conocimiento de esas magnitudes sobre muestras, que se llaman estadsticos. Tambin es til
para determinar si las diferencias observadas entre 2 muestras son debidas a variaciones
fortuitas o si son realmente significativas. Por ejemplo cuando se estudia el resultado de una

medicina como tratamiento de cierta enfermad, o al decidir si un proceso de produccin es mejor


que otro.

Distribuciones de muestreo
Si consideramos todas las posibles muestras de tamao n en una poblacin, para cada muestra
podemos calcular un estadstico (como la media o desviacin estndar) que variara de muestra a
muestra. De esta manera obtenemos una distribucin de muestreo. Tenemos diferentes tipos de
distribucin de muestreo que ms adelante veremos.
Distribucin de muestreo de medias
Supongamos que se toman todas las posibles muestras de tamao n, sin reposicin de una
poblacin finita de tamao N. Si denotamos la media y la desviacin estndar de la distribucin
de muestreo de medias por x y x y las de la poblacin , respectivamente entonces

x =
x =

N n
N 1

Ecuacin 0 Formulas de media y desviacin estndar de distribucin de muestreo de medias con


poblacin finita o sin reposicin

Donde:
N es el tamao de la poblacin
n es el tamao de la muestra
Si la poblacin es infinita o si el muestreo es con reposicin, los resultados anteriores se reducen
a

x =
x =

Ecuacin 0 Formulas de media y desviacin estndar de distribucin de muestreo de medias con


poblacin infinita o con reposicin

Por ejemplo:
Las alturas de 3000 estudiantes varones de una universidad estn normalmente distribuidos con
media 68 pulgadas y una desviacin estndar de 3 pulgadas. Si se toman 80 muestras de 25
estudiantes cada una. Cules sern la media y la desviacin estndar esperadas de la
resultante distribucin de muestreo de medias, si el muestre se hizo a) con reposicin y b) sin
reposicin.
a)

x =68
x =

3
=0.6
25

b)

x =68
x =

3 3000 25
=0.5975
25 3000 1

Como la diferencia es menor se considera para efectos prcticos la misma que en muestre con
reposicin.
En cuntas muestras esperaramos encontrar una media de a) 66.8 y 68.3 pulgadas y b) menor
que 66.4
a)

Z=

X x
x

Z=

66.8 68.0
=2.0
0.6

Z=

68.3 68.0
=0.5
0.6

0.4772+0.1915=0.6687
0.6687*80=53.496 o 53 muestras
b)

Z=

66.4 68.0
=2.67
0.6

0.5-0.4962=0.0038

0.0038*80=0.304 o cero

500 esferas tienen un peso medio de 5.02 gramos y una desviacin estndar de 0.30 g. Hallar la
probabilidad de que una muestra al azar de 100 esferas de ese conjunto tengan un peso total a)
entre 496 y 500 g y b) ms de 510g

x =5.02
x =

0.30 500 100


=0.0268
100 500 1

a) El peso total estara entre 496 y 500 si el peso medio de las 100 bolas est entre 4.96 y 5 g

Z=

4.96 5.02
=2.23
0.0268

Z=

5 5.02
= 0.74
0.0268

*Entre z a z se restan
*Entre +z a +z se restan
*Si la variable es = a la media, se suma 0.5
0.4871-0.2704=0.2167
b) El peso total exceder los 510g si el peso medio de las 100 bolas excede 5.10 g

Z=

5.10 5.02
=2.98
0.0268

0.5-0.4986=0.0014

Distribucin de muestreo de proporciones


Supongamos que una poblacin es infinita y que la probabilidad de ocurrencia de un suceso (su
xito) es p, mientras la probabilidad de que no ocurra es q=1-p. Por ejemplo una poblacin
puede ser todos los posibles lanzamientos de una moneda, en la que la probabilidad de xito es
. Consideremos todas las posibles muestras de tamao n de tal poblacin, y para cada una de
ellas determinaremos la proporcin de xitos P. En el caso de una moneda, P sera la proporcin
de soles en n tiradas. Obtenemos as una distribucin de muestreo de proporciones cuya media
p y cuya desviacin tpica p vienen dadas por

p= p
p=

p (1 p)
pq
=
n
n

Ecuacin 0 Formulas de media y desviacin estndar de distribucin de muestreo de proporciones con


muestreo con reposicin

Esta frmula es vlida para poblaciones finitas realizadas con muestreo con reposicin. Para
poblaciones finitas con muestreo sin reposicin se usa:Y

p= p
p = pq
Ecuacin 0 Formulas de media y desviacin estndar de distribucin de muestreo de proporciones sin
muestreo con reposicin

Cada persona de un grupo de 500 lanza una moneda 120 veces. Cuntas personas se espera
que a) Saquen entre 40% y 60% de soles y b) 5/8 de sus lanzamientos o ms de soles

1
p= =0.5
2

11
22
p=
=0.0456
120
Como la proporcin es una variable discreta, hay que hacer una correccin, si la variable es
menor a la media se resta

Z=

0.4 0.0041 0.5


= 2.28
0.0456

Z=

0.6+ 0.0041 0.5


=2.28
0.0456

1
2n

y si la variable es mayor o igual a la media se suma

1
2n

0.4857+0.4857=0.9714
500*0.9714=489 muestras
b)

Z=

0.625 0.0041 0.5


=2.83
0.0456

0.4977
0.5-0.4977=0.0023

500*0.0023= 1 personas.

Se ha encontrado que el 2% de las piezas fabricadas en una cierta mquina son defectuosas
Cul es la probabilidad de que en un envo de 400 piezas a) el 3% o ms b)2% o menos, sean
defectuosas?

p=0.02
p=

0.02 0.98
=0.007
400

a)
1/2N=1/800=0.0012

Z=

0.03+ 0.0012 0.02


=1.25
0.007

0.5-0.3944=0.1056

b)

Z=

0.02+0.0012 0.02
=0.18
0.007

0.5+0.0714=0.5714
Distribucin de muestreo de diferencias y sumas
Sean dadas dos poblaciones. Para cada muestra de tamao n 1 de la primera, calculamos un
estadstico S1; eso da una distribucin de muestreo para S 1, cuya media y desviacin estndar
denotaremos por s1 y s1. Del mismo modo, para cada muestra de tamao n 2 de la segunda
poblacin, calculamos un estadstico S 2; eso nos da un distribucin de muestreo para S 2 cuya
media y desviacin estndar denotaremos con s2 y s2. Si tenemos medias mustrales de ambas
poblaciones, la distribucin de muestreo de las diferencias de medias viene dada para
poblaciones infinitas o con muestreo con reposicin con medias y desviaciones estndar por:

x 1 x 2=x 1 x 2=1 2

21 22
x 1 x 2= + =
+
n1 n2
2
x 1

2
x 2

Ecuacin 0 Formulas de media y desviacin estndar de distribucin de muestreo de diferencias de


medias.

Se puede usar la misma frmula para poblaciones finitas o muestreo sin reposicin.
Para suma se utiliza:

x 1+ x 2= x 1 + x 2= 1+ 2

21 22
x 1 +x 2= + =
+
n 1 n2
2
x 1

2
x 2

Ecuacin 0 Formulas de mZedia y desviacin estndar de distribucin de muestreo de sumas de medias.

En caso que se hablen de proporciones se usa:

p 1 p 2= p 1 p 2= p1 p2
p 1 p 2 = 2p 1+ 2p 2=

p1 q1 p2 q2
+
n1
n2

Ecuacin 0 Formulas de media y desviacin estndar de distribucin de muestreo de diferencias de


proporciones.

Ejemplo:
Las bolas de rodamientos de cierto fabricante pesan 0.50 g de media, con desviacin ESTANDR
de 0.02 g. Cul es la probabilidad de que dos lotes de 1000 bolas cada uno difieran en peso en
ms de 2 g?

x 1 x 2=1 2=0.5 0.5=0

x 1 x 2=

Z=

( 0.02 ) ( 0.02 )
+
=0.0008
1000 1000

( x1 x 2 ) 0
0.0008

=0.18

La diferencia entre ambos debe ser de 2g, por lo que 2/1000=0.002 g, asi que

Z=

0.002 0
=2.23
0.0008

Z=

0.002 0
=2.23
0.0008

2.23=0.4871
Ilustracin 0 rea bajo la curva que se busca para P2.23 o P-2.23

Como se busca la probabilidad de que P2.23 o P-2.23 entonces


0.4871)=0.0258

(0.5-0.4871)+(0.5-

Unidad III Teora de la estimacin estadstica


Desde un punto de vista prctico, suele resultar ms importante ser capaz de inferir informacin
sobre la poblacin a partir de muestras. Con tal situacin trata la inferencia estadstica, que usa
los principios de la teora del muestreo.

Estimaciones sin sesgo


Si un estadstico de muestreo es igual al que le corresponde en la poblacin, se dice que el
estadstico es un estimador sin sesgo, si no, se llama estimador sesgado. La media de las
distribuciones de muestreo viene siendo un estimador sin sesgo ya que siempre es igual a la
media de la poblacin, cosa contraria con la varianza y desviacin estndar que si varan y por
lo tanto son estimacin sesgadas.

Estimaciones de intervalo de confianza para parmetros de poblacin


Se llama intervalo de confianza en estadstica a un intervalo de valores alrededor de un
parmetro muestral en los que, con una probabilidad o nivel de confianza determinado, se
situar el parmetro poblacional a estimar.

Nivel
de
confian
za

99.73
%

99%

98%

96%

95.45
%

95%

90%

80%

68.27
%

50%

zc

3.00

2.58

2.05

2.05

2.00

1.96

1.64
5

1.28

1.00

0.67
45

Tabla 0 Valores de Zc correspondientes a varios niveles de confianza.

Intervalo de confianza para las medias.


Si la poblacin es infinita o de una finita con reposicin.

X Z C
n
Ecuacin 0 Intervalo de confianza para medias cuando es infinita o con reposicin

Si la poblacin es finita sin reposicin

X Z C
n

Nn
N 1

Ecuacin 0 Intervalo de confianza para medias cuando la poblacin es finita sin reposicin

Donde X es la media de la muestra.


Ejemplo:
Supongamos que las alturas de 100 estudiantes varones de una universidad representan una
muestra aleatoria de estudiantes de esa universidad. La media muestral es de 67.45 pulgadas y
la desviacin estndar muestral es de 2.93 pulgadas. Hallar los intervalos de confianza a) 95% y
b)99% para estimar la altura media de los estudiantes.
a)

67.45 1.96

2.93
=67.45 0.57 42
100

Esto significa que 66.88 < < 68.02 o en otras palabras podemos decir que la
probabilidad de que la altura media de la poblacin est entre 66.88 y 68.02 pulgadas es
del 95%. Equivale a decir que tenemos el 95% de confianza que la media de la poblacin
est entre 66.88 y 68.02.
b)

67.45 2.58

2.93
=67.45 0.76
100

Esto significa que 66.69 < < 68.21 o en otras palabras podemos decir que la
probabilidad de que la altura media de la poblacin est entre 66.69 y 68.21 pulgadas es
del 99%. Equivale a decir que tenemos el 99% de confianza que la media de la poblacin
est entre 66.69 y 68.21.
Actividad en clase: Realizar ejercicio 9.6 de la pgina 214 del libro Estadstica Segunda Edicin.

Intervalos de confianza para proporciones.


Si la poblacin es infinita o de una finita con reposicin.

p ZC

pq
n

Ecuacin 0 Intervalo de confianza para proporciones cuando la poblacin es infinita o con reposicin

Si la poblacin es finita sin reposicin

p ZC


pq
n

N n
N 1

Ecuacin 0 Intervalo de confianza para proporciones cuando la poblacin es finita sin reposicin

Ejemplo:
Un sondeo de 100 votantes elegidos al azar en un distrito indica que el 55% de ellos estaban a
favor de un cierto candidato. Hallar los lmites de confianza a) 95% b) 99% y c) 99.73% para la
proporcin de todos los votantes favorables a ese candidato.
a)

0.55 1.96

( 0.55 )( 0.45 )
=0.55 0.10
100

b)

0.55 2.58

( 0.55 )( 0.45 )
=0.55 0.13
100

c)

0.55 3

( 0.55 )( 0.45 )
=0.55 0.15
100

Intervalos de confianza para diferencias y sumas


Medias

X 1 X 2 Z C

21 22
+
n1 n2
Ecuacin 0 Intervalos de confianza para diferencias y sumas de Medias

Ejemplo:
Una muestra de 150 lmparas del tipo A ha dado una vida media de 1400 horas y una desviacin
estndar de 120h. Una muestra de 100 lmparas del tipo B dan vida media de 1200 h y
desviacin estndar de 80h. Hallar los lmites de confianza a) 95% b) 99% para la diferencia de
las vidas medias de las poblaciones de ambos tipos.
a)
b)

( 120 ) ( 80 )
1400 1200 1.96
+
=200 24.8
150 100
2
2
( 120 ) ( 80 )
1400 1200 2.58
+
=200 32.6
150 100

Proporciones

P1 P 2 Z C

p1 q 1 p2 q 2
+
n1
n2

Ecuacin 0 Intervalos de confianza para diferencias y sumas de Proporciones

Ejemplo:
En una muestra aleatoria de 400 adultos y 600 jvenes que vieron un cierto programa de
televisin 100 adultos y 300 jvenes reconocieron que les haba gustado. Determinar los lmites
de confianza a) 95% y b) 99% para la diferencia en proporciones de todos los adultos y jvenes
que vieron con agrado el programa. 300/600=0.5 400/100=0.25
a)
b)

( 0.5 ) ( 0.5 ) ( 0.25 ) ( 0.75 )


+
=0.25 0.006
600
400
( 0.5 ) ( 0.5 ) ( 0.25 ) ( 0.75 )
0.5 0.25 2.58
+
=0.25 0.008
600
400
0.5 0.25 1.96

Unidad IV Teora estadstica de las decisiones


En la prctica nos vemos obligados con frecuencia tomar decisiones relativas a una poblacin
sobre la base de informacin proveniente de muestras. Tales decisiones se llaman decisiones
estadsticas. Por ejemplo podemos decidir basados en datos mustrales, si un mtodo
pedaggico es mejor que otro o si una moneda esta trucada o no.
Al intentar alcanzar una decisin, es til hacer hiptesis sobre la poblacin implicada. Tales
hiptesis, que pueden ser o no ciertas, se llaman hiptesis estadsticas.

Hiptesis Nula:
En muchos casos se formulan hiptesis estadstica con el nico propsito de rechazarla o
invalidarla. As, si queremos decidir si una moneda est trucada, formulamos la hiptesis de que
la moneda es buena (o sea p=0.5). Esta hiptesis se le llama hiptesis nula y se detona por H o.

Hiptesis Alternativa:
Es toda hiptesis que difiera de una ya dada. Por ejemplo, si una hiptesis es p=0.5, las
alternativas pueden ser p=0.7, p0.5 o p>0.5. Se denota por H 1.

Contraste de hiptesis y significacin o reglas de decisin


Si suponemos que una hiptesis particular es cierta pero vemos que los resultados hallados en
su muestra aleatoria difieren notablemente de los esperados bajo tal hiptesis, entonces diremos

que las diferencias observadas son significativas y nos veramos obligados a rechazar la
hiptesis. Por ejemplo en 20 lanzamientos de una moneda salen 16 caras, estaramos obligados
a rechazar la hiptesis de que la moneda es buena, aunque hay posibilidad de equivocarnos. Los
procedimientos para determinar si las muestras observadas difieren significativamente de los
resultados esperados se llaman contrastes (o tests) de hiptesis o de significacin o reglas de
decisin.

Errores de tipo I y de tipo II


Si rechazamos una hiptesis cuando debiera ser aceptada, diremos que se ha cometido un error
de tipo I. Por otra parte si aceptamos una hiptesis que debiera ser rechazada, diremos que se
ha cometido un error de tipo II. En ambos casos, se ha producido un juicio errneo.

Nivel de significacin
Al contrastar una cierta hiptesis la mxima probabilidad con la que estamos dispuestos a correr
el riesgo de cometer un error de Tipo I se llama nivel de significacin del contraste. Esta
probabilidad denotada a menudo por se especifica antes de tomar la muestra. En la prctica es
frecuente usar un nivel de significacin de 0.05 0.01. , por ejemplo si se usa 0.05 (5%) hay 5
oportunidades de 100 de rechazar la hiptesis, es decir tenemos un 95% de confianza de que
hemos adoptado la decisin correcta y un 5% de que nos hemos equivocado.
Nivel de
significacin
Valores crticos de
z para tests
unilaterales
Valores crticos de
z para tests
bilaterales

0.10

0.05

0.01

0.005

0.02

-1.28 o 1.28

-1,645 o
1.645

-2.33 o
2.33

-2.58 o 2.58

-2.88 o 2.88

-1.645 y
1.645

-1.96 y
1.96

-2.58 y
2.58

-2.81 y 2.81

-3.08 y 3.08

Tabla 0 Tabla de nivel de significacin

Contrastes mediante la distribucin normal


Supongamos que bajo cierta hiptesis y su distribucin de muestreo estadstico S con una
media s y desviacin tpica s.

Ilustracin 0 Distribucin normal cannica con un 95% de confianza de que la hiptesis es verdadera

Como se ve en la ilustracin 2, podemos tener 95% de confianza que la hiptesis es verdadera,


para que esto sea cierto el valor de z debe estar entre -1.96 y 1.96. Si no se encuentra, debemos
concluir que tal suceso podra ocurrir con una probabilidad de 0.05 si la hiptesis fuera cierta.
Entonces tendremos que rechazar la hiptesis.
El rea total sombreada 0.05 es el nivel de significacin del contraste. Representa la probabilidad
de equivocarnos al rechazar una hiptesis (probabilidad de erro tipo I).
El conjunto de z fuera de rango -1.96 a 1.96 (en este ejemplo) se le conoce como regin critica
de la hiptesis o regin de rechazo de la hiptesis o regin de significacin.

El conjunto de z dentro del rango se le conoce como regin de aceptacin de la hiptesis o


regin de no significacin.
Contrastes de una y dos colas
En el contraste anterior se buscaba los valores extremos del estadstico S. A este tipo de
contrastes se les llama de 2 colas o bilaterales.
Si estamos interesados en valores extremos a un lado de la media, como por ejemplo cuando se
contrasta una hiptesis de que un proceso es mejor que otro, tales contrastes se llaman
unilaterales o de una cola.

Ejemplos:
En un experimento sobre percepcin extrasensorial (PES), un individuo en una habitacin es
invitado a adivinar el color (rojo o azul) de una carta elegida de un mazo de 50 cartas bien
mezcladas por otro individuo en otra habitacin. El no sabe cuntas rojas y cuantas azules hay
en el mazo. Si el sujeto identifica 32 cartas correctamente, determinar si el resultado es
significativo al nivel de a) 0.005 y b) 0.001
H0:p=0.5 y el sujeto est simplemente diciendo colores al azar.
H1:p>0.5 y el sujeto tiene poderes de PES
Como estamos interesados en saber que adivine 32 o ms entonces se utiliza un contraste de
una sola cola y es hacia la derecha.

=Np=50 ( 0.5 )=25


= Npq = 50 ( 0.5 )( 0.5 )=3.54
a) para 0.05 utilizamos z=1.645 ya que es un contraste de una sola cola y es hacia la
derecha. Si es mayor que se valor tiene poderes PES si no es al azar

z=

32 25
=1.98
3.54

Entonces el individuo tiene poderes PES


b) para 0.01 utilizamos z=2.33. Como z=1.98 y no es mayor a 2.33 entonces el individuo no
tiene poderes PES
Cuando suceden estos caso que en 0.05 se cumple pero en 0.01 no decimos que es probable que
suceda, as que es mejor hacer ms investigacin o pruebas.

Curvas de operacin caractersticas, potencia de un contraste


Es posible evitar el riesgo de cometer un error de Tipo II simplemente no aceptando nunca la
hiptesis, pero en muchas aplicaciones prcticas esto es inviable. En tales casos se suele recurrir
a curvas de operacin caractersticas o curvas OC, que son grficos que muestran las

probabilidades de error de Tipo II bajo diversas hiptesis. Proporcionan indicaciones de hasta qu


punto un contraste dado nos permitir evitar un error de Tipo II; es decir, nos indicar la potencia
de un contraste a la hora de prevenir decisiones errneas. Son tiles en el diseo de
experimentos porque sugieren entre otras cosas el tamao de muestras a manejar.

Unidad V Test de Ji-Cuadrada


Los resultados obtenidos por muestreo no siempre coinciden exactamente con los esperados
tericamente de acuerdo con las leyes de las probabilidades, por ejemplo, aunque
consideraciones tericas conducen a esperar 50 soles y 50 guilas en 100 lanzamientos de una
moneda (buena), es raro que eso ocurra exactamente. Entonces podemos tener sucesos posibles
(E1, E2, E3) y se observa que ocurren con frecuencias o1, o2, o3 llamados frecuencia
observada pero esperbamos que sucedieran con frecuencia e1, e2, e3 llamada frecuencia
esperada.
A menudo deseamos saber si las frecuencias observadas difieren significativamente de las
esperadas.
Suceso
Frecuencia observada o
Frecuencia esperada e

E1
o1
e1

E2
o2
e2

Tabla 0 Tabla de contingencia

Definicin de 2
Una medida de la discrepancia existente entre las frecuencias observadas y esperadas viene
proporcionada por el estadstico 2 dado por:
k

=
2

j=1

( o j e j )

ej
Ecuacin 0 Formula de 2

El test de 2 para la bondad de ajuste


2 puede utilizarse para determinar la calidad del ajuste mediante distribuciones tericas (como
la binomial o normal) de distribuciones empricas (las obtenidas de las muestras).

Tablas de contingencia
La tabla 3, se le suelen denominar tablas de contingencia, en la cual podemos ver las
frecuencias esperadas y las frecuencias esperadas.
El estadstico 2 necesita de grados libertad, v, para podernos dar un resultado correcto. El grado
de libertad se calcula

v =k 1
Ecuacin 0 Formula para calcular los grados de libertad

Donde k=al nmero de eventos o sucesos.


Los grados de libertad, ms los niveles de significacin se utilizaran con la siguiente tabla

Ilustracin 0 Valores Percentiles de 2

Ejemplo

En 200 tiradas de una moneda, han salido 115 soles y 85 guilas. Contrastar la hiptesis de que
la moneda es buena, con nivel de significacin a)0.005 y b) 0.001
Suceso

E1
Soles
115
100

Frecuencia observada o
Frecuencia esperada e

E2
guilas
85
100

Entonces:

2=

( 115 100 )2 ( 85 100 )2


+
=4.5
100
100

Ya que k=2 entonces v=k-1=2-1=1


a) el valor critico de

20.95

para 1 grado de libertad es 3.84. Asi pues como 4.50>3.84

rechazamos la hiptesis de que la moneda es buena al nivel de significacin de 0.05


b) el valor critico de 20.99 para 1 grado de libertad es 6.63. Asi pues como 4.50<6.63 no
podemos rechazar la hiptesis de que la moneda es buena al nivel de significacin de 0.01
Como sucedi antes es necesario hacer ms pruebas ya que es probable que suceda pero no se
tiene la certeza.

Unidad VI Ajuste de curvas y el mtodo de mnimo cuadrados


Por lo general encontramos que existen relaciones entre dos o ms variables, como por ejemplo
los pesos de las personas dependen en cierta medida de sus alturas, la presin de una masa de
gas dada depende de su volumen y de su temperatura. Suele ser deseable expresar tales
relaciones en forma matemtica determinando una ecuacin que conecte a las variables.

Ajuste de curvas
Para hallar una ecuacin que relacione las variables, el primer paso es recoger datos que
muestren valores correspondientes de las variables bajo consideracin. As por ejemplo,
supongamos que X e Y denotan, respectivamente, la altura y el peso de personas adultas;
entonces una muestra de N individuos revelara las alturas X 1, X2Xn y los pesos Y1, Y2Yn
El prximo paso es marcar los puntos sobre un sistema de coordenadas rectangulares. El
conjunto de puntos resultante se llama diagrama de dispersin. A partir de dicho diagrama de
dispersin es posible, visualizar una curva suave que aproxime los datos. Tal curva se llama una
curva aproximante. El problema general de hallar ecuaciones aproximantes que se ajusten a un
conjunto de datos se llama ajuste de curvas.

Ilustracin 0 Diagrama de dispersin que se aproxima a una lnea recta.

Ilustracin 0 Diagrama de dispersin que no es lineal y se dice que es una relacin no lineal

El mtodo de mnimos cuadrados


Para evitar juicios subjetivos al construir rectas, parbolas u otras curvas aproximantes de ajuste
de datos, es necesario acordar una definicin de recta de mejor ajuste, parbola de mejor ajuste,
etc. Entonces se debe usar el mtodo de mnimos cuadradas.
Recta de mnimos cuadrados
La recta de mnimos cuadrados est dada por la ecuacin:

Y =a0 +a1 X
Ecuacin 0 Recta de mnimos cuadrados

Donde a0 y a1 se calculan

a0 =

Y X 2 X XY
2
N X 2 ( X )

a1 =

N XY x y
2

N x 2 ( x )

Ecuacin 0 Ecuaciones para calcular a0 y a1 para recta de mnimos cuadrados

Ejemplo
Ajustar una recta de mnimos cuadrados a los datos siguientes
X

1 3

1 2

1
1
8

14
9

Y =a0 +a1 X
Entonces tabulamos los valores
X
1
3
4
6
8
9
11
14

Y
1
2
4
4
5
7
8
9

X2
1
9
16
36
64
81
121
196

XY
1
6
16
24
40
63
88
126

Y2
1
4
16
16
25
49
64
81

X =56

Y =40

X 2=524

XY =364

Y 2=256

Entonces

a0 =

( 40 ) (524 ) ( 56 ) ( 364 )
=0.545
8 ( 524 ) ( 56 )2

a1=

8 ( 364 ) (56 )( 40 )
=0.636
2
8 ( 524 ) ( 56 )

Y =0.545+ 0.636 X

Parbola de mnimos cuadrados


La parbola de mnimos cuadrados est dada por la ecuacin:

Y =a0 +a1 X +a 2 X 2
Ecuacin 0 Parbola de mnimos cuadrados

Unidad VII Teora de la correlacin


Correlacin y regresin
Si todos los valores de las variables satisfacen una ecuacin exactamente, decimos que las
variables estn perfectamente correlacionadas o que hay correlacin perfecta entre ellas. Si se
lanzan dos dados 100 veces, no hay relacin entre las puntuaciones de ambos dados (a menos
que estn trucados), es decir, no estn en correlacin. Variables tales como el peso y la altura
tienen una cierta correlacin. Cuando slo estn en juego dos variables, hablamos de correlacin
simple y regresin simple. En otro caso, se habla de correlacin mltiple y regresin mltiple.

Correlacin lineal
Si X e Y son dos variables en cuestin un diagrama de dispersin muestra la localizacin de los
puntos (X, Y) sobre un sistema rectangular de coordenadas. Si todos los puntos del diagrama
parecen estar en una recta como en la ilustracin 6 y 7 la correlacin se llama lineal. Si Y tiende
a crecer cuando X crece en como en la ilustracin 6 se dice que es positiva. Si Y tiende a
decrecer cuando X crece como en la ilustracin 7 , se dice que es negativa. Si todos los puntos
parecen estar sobre una cierta curva, la correlacin no es lineal. Si no hay relacin entre las
variables decimos que no hay correlacin entre ellas.

Ilustracin 0 Correlacin lineal positiva

Ilustracin 0 Correlacin lineal negativa

Ilustracin 0 Sin correlacin

La recta de regresin de mnimos cuadrados


La recta de regresin de Y sobre X es:

Y =a0 +a1 X
Ecuacin 0 recta de regresin Y sobre X

Donde a0 y a1 se calculan

Y X 2 X XY

a0 =
2
N X 2 ( X )
a1=

N XY x y
2

N x 2 ( x )

Ecuacin 0 Ecuaciones para calcular a0 y a1 para recta de regresin

La recta de regresin de X sobre Y es

X =b0 +b 1 Y
Ecuacin 0 Recta de regresin X sobre Y

Donde b0 y b1 se calculan

X Y 2 Y XY

b0 =
2
N Y 2 ( Y )
b1 =

N XY X Y
N Y 2 ( Y )

Ecuacin 0 Ecuaciones para calcular b0 y b1 para recta de regresin

Ejemplo:
Altura X del
padre
Altura Y del
hijo

65

63

68

66

6
7
6
8

6
4
6
5

68

62

70

66

68

67

69

71

69

66

68

65

71

67

68

70

a) Construir un diagrama de dispersin


b) Hallar la recta de regresin de mnimos cuadrados de Y sobre X
c) Hallar la recta de regresin de mnimos cuadrados de X sobre Y
B) Y=35.82+0.476X
C) X=-3.38+1.036Y

Unidad VIII Anlisis de varianza


Ya se ha visto como contrastar las diferencias entre dos medias mustrales, en el supuesto de
que las dos poblaciones de las que se tomaban las muestras tenan la misma varianza. En
muchas situaciones es necesario hacer eso mismo con tres o ms medias mustrales, sea,
equivalentemente, contrastar la hiptesis de que todas las medias son iguales.

Experimentos de factor nico


En un experimento de un factor, las medidas (u observaciones) se obtienen para grupos
independientes de muestras, donde el nmero de medidas en cada grupo es b. Hablamos de a
tratamientos, cada uno de los cuales tiene b repeticiones.
Denotaremos por

X j

la media de las medidas en fila j-sima. Entonces tenemos

1
X j= X jk j=1,2 a
b k =1
El punto en X j se usa para anunciar que el ndice k se ha sumado. Los valores se llaman
medias de grupo, medias de tratamiento o medias de filas. La media global se calcula
a

1
X = X jk
ab j=1 k=1

Variacin total, variacin dentro de los tratamientos y variacin entre


tratamientos
La variacin total denotada por V, se calcula con:
2
V = ( X jk X )
j ,k

Ecuacin 0 Variacin Total

La variacin dentro de los tratamientos se calcula con:


2

V W = ( X jk X j )
j ,k

Ecuacin 0 Variacin dentro de los tratamientos

La variacin entre los tratamientos se calcula con:

V B =b ( X j X )

Ecuacin 0 Variacin entre los tratamientos

Por lo tanto V la podemos calcular tambin con:

V =V W +V B
En la prctica es conveniente restar alguna cantidad fija de todos los datos de la tabla para
simplicar los clculos; tal operacin no tiene efecto alguno sobre el resultado final.
Ejemplo
La siguiente tabla da las producciones por acre de una cierta variedad de trigo que crece en
terrenos tratados con fertilizantes A, B y C. Hallar a) las producciones medias para los diferentes
tratamientos, b) la media global para todos los tratamientos c) la variacin total d) la variacin
entre tratamientos e) la variacin dentro de los tratamientos.
A
B
C

48
47
49

49
49
51

50
48
50

49
48
50

Para hacer mejor el clculo podemos restar 45 a todos los datos y queda la tabla

3
2
4

4
4
6

5
3
5

4
3
5

a)

1
X 1= ( 3+ 4+5+ 4 )=4
4
1
X 2= ( 2+ 4+3+ 3 )=3
4
1
X 3= ( 4+6 +5+5 )=5
4
b)

1
X = ( 3+ 4+ 5+4 +2+4 +3+3+ 4+6+ 5+5 )=4
12
c)

V = ( X jk X ) =( 3 4 )2 + ( 4 4 )2 + ( 5 4 )2 + ( 4 4 )2+ ( 2 4 )2+ ( 4 4 )2 + ( 3 4 )2 + ( 3 4 )2 + ( 4 4 )2 + ( 6 4 )2 + ( 5 4 )2 + ( 5 4
j ,k

d)
2
V B =b ( X j X ) =4 [ ( 4 4 )2+ ( 3 4 )2 + ( 5 4 )2 ] =8
j

e)

V W =V V B=14 8=6

Mtodos Abreviados

V = X 2j , k
j ,k

V B=

T
ab

1
T2
2
Tj

b j
ab

V W =V V B
Ecuacin 0 Mtodos Abreviados para experimento de un factor.

Donde T es el total de valores

X jk

y Tj es el total de valores en el tratamiento j-simo.

X jk T j= X jk
k

T =
j,k

Experimentos de Dos factores


El tratamiento de dos factores es como si fuera una matriz, a continuacin se muestran las
formulas.
2
V = ( X jk X )
j ,k

Ecuacin 0 Variacin total de dos factores

Variacin debida a error o azar

V E = ( X jk X j X k + X )

jk

Ecuacin 0 Variacin debida a error

Variacin entre filas


a

)2
V R =b ( X j X
j=1

Ecuacin 0 Variacin entre filas

Variacin entre columnas


b

)
V C =a ( X k X
j=1

Ecuacin 0 Variacin entre columnas

Formas abreviadas
2

V = X j , k
j ,k

V R=

T2
ab
2

1
T
2
Tj

b j=1
ab
b

1
T2
2
V C= T k
a j=1
ab
R V c
V E =V V
Ecuacin 0 Mtodos Abreviados para experimento de 2 factores

Bibliografa
Unidad I Estadstica Aplicada, Julian de la Horra Navarro, Mc Graw Hill. Pgina 84.
Unidad II Estadstica Segunda Edicin, Spiegel, Mc Graw Hill. Pginas 186-207
Unidad III Estadstica Segunda Edicin, Spiegel, Mc Graw Hill. Pginas 208-222
Unidad IV Estadstica Segunda Edicin, Spiegel, Mc Graw Hill. Pginas 223-240
Unidad V Estadstica Segunda Edicin, Spiegel, Mc Graw Hill. Pginas 268-284
Unidad VI Estadstica Segunda Edicin, Spiegel, Mc Graw Hill. Pginas 289-309
Unidad VII Estadstica Segunda Edicin, Spiegel, Mc Graw Hill. Pginas 322-348
Unidad VIII Estadstica Segunda Edicin, Spiegel, Mc Graw Hill. Pginas 375-396

You might also like