You are on page 1of 235

Inferencia Estadstica

1
Inferencia Estadstica

Qu es estadstica?

2
Inferencia Estadstica

Qu es estadstica?
La ciencia utiliza modelos para describir
fenmenos.

3
Inferencia Estadstica

Qu es estadstica?
La ciencia utiliza modelos para describir
fenmenos.
Un modelo es una explicacin terica del
fenmeno objeto de estudio. Esta explicacin
suele expresarse en forma verbal, muchas
veces mediante ecuaciones matemticas.

4
Inferencia Estadstica

Qu es estadstica?
La ciencia utiliza modelos para describir
fenmenos.
Un modelo es una explicacin terica del
fenmeno objeto de estudio. Esta explicacin
suele expresarse en forma verbal, muchas
veces mediante ecuaciones matemticas.
Existen modelos determinsticos y modelos
no determinsticos.

5
Inferencia Estadstica

Qu es estadstica?
Modelo determinstico:

6
Inferencia Estadstica

Qu es estadstica?
Modelo determinstico: Es posible conocer un
valor preciso de la variable de inters a partir
de otras.

7
Inferencia Estadstica

Qu es estadstica?
Modelo determinstico: Es posible conocer un
valor preciso de la variable de inters a partir
de otras.
Modelo no determinstico:

8
Inferencia Estadstica

Qu es estadstica?
Modelo determinstico: Es posible conocer un
valor preciso de la variable de inters a partir
de otras.
Modelo no determinstico: No es posible
determinar un valor preciso de la variable de
inters pues est presente la incertidumbre.

9
Inferencia Estadstica

No determinsticos

10
Inferencia Estadstica

No determinsticos

Duracin de la batera de litio de una laptop.

11
Inferencia Estadstica

No determinsticos

Duracin de la batera de litio de una laptop.


Cantidad de personas que compran con
tarjeta de crdito en una tienda en un perodo
determinado.

12
Inferencia Estadstica

No determinsticos

Duracin de la batera de litio de una laptop.


Cantidad de personas que compran con
tarjeta de crdito en una tienda en un perodo
determinado.
Promedio de notas en los estudios
universitarios (conocido el promedio de notas
en secundaria).

13
Inferencia Estadstica

Qu es estadstica?
La Estadstica nos ensea cmo realizar juicios
inteligentes y tomar decisiones en presencia de
incertidumbre.

Los mtodos estadsticos estn ideados para


permitir evaluar el grado de incertidumbre de
los resultados.

La Estadstica se ocupa de modelos y


fenmenos no determinsticos.
14
Inferencia Estadstica

Qu es estadstica?
Asociado a modelos no determinsticos est el
concepto de probabilidad.

Existe la Estadstica Descriptiva y la


Estadstica Inferencial.

15
Inferencia Estadstica

Qu es estadstica?
Estadstica Descriptiva:
Tcnicas para describir o representar conjuntos
de datos (grficos y clculo de medidas
numricas).

16
Inferencia Estadstica

Qu es estadstica?
Estadstica Descriptiva:
Tcnicas para describir o representar conjuntos
de datos (grficos y clculo de medidas
numricas).

Estadstica Inferencial:
Mtodos para derivar conclusiones acerca de
un gran grupo de objetos al observar una parte
de ellos.
17
Inferencia Estadstica

Poblacin y muestra
POBLACIN:

Es todo conjunto de elementos, definido por una o ms caractersticas, de


las que gozan todos los elementos que lo componen, y slo ellos.

18
Inferencia Estadstica

Poblacin y muestra
POBLACIN:

Es todo conjunto de elementos, definido por una o ms caractersticas, de


las que gozan todos los elementos que lo componen, y slo ellos.
En muestreo, se entiende por poblacin a la totalidad del universo que
interesa conocer, y que es necesario que est bien definido para que se
sepa en todo momento qu elementos lo componen. Conviene recordar
que poblacin es el conjunto de elementos a los cuales se quieren inferir
los resultados.

19
Inferencia Estadstica

Poblacin y muestra
MUESTRA:

En todas las ocasiones en que no es posible o conveniente realizar un


censo, lo que hacemos es trabajar con una muestra, entendiendo por tal
una parte representativa y adecuada de la poblacin.

20
Inferencia Estadstica

Poblacin y muestra
MUESTRA:

En todas las ocasiones en que no es posible o conveniente realizar un


censo, lo que hacemos es trabajar con una muestra, entendiendo por tal
una parte representativa y adecuada de la poblacin.
Para que una muestra sea representativa, y por lo tanto til, debe de
reflejar las semejanzas y diferencias encontradas en la poblacin,
ejemplificar las caractersticas y tendencias de la misma. Cuando decimos
que una muestra es representativa indicamos que rene
aproximadamente las caractersticas de la poblacin que son importantes
para la investigacin.

21
Inferencia Estadstica

Poblacin y muestra
MUESTRA:

En todas las ocasiones en que no es posible o conveniente realizar un


censo, lo que hacemos es trabajar con una muestra, entendiendo por tal
una parte representativa y adecuada de la poblacin.
Para que una muestra sea representativa, y por lo tanto til, debe de
reflejar las semejanzas y diferencias encontradas en la poblacin,
ejemplificar las caractersticas y tendencias de la misma. Cuando decimos
que una muestra es representativa indicamos que rene
aproximadamente las caractersticas de la poblacin que son importantes
para la investigacin.
Cuando decimos que una muestra es adecuada, nos referimos a que
contiene el nmero de unidades de estudio, tal que permita aplicar
pruebas estadsticas que den validez a la inferencia de los resultados a la
poblacin.
22
Inferencia Estadstica

Ventajas del muestreo

23
Inferencia Estadstica

Ventajas del muestreo


Costos reducidos.

24
Inferencia Estadstica

Ventajas del muestreo


Costos reducidos.
Mayor rapidez para obtener resultados.

25
Inferencia Estadstica

Ventajas del muestreo


Costos reducidos.
Mayor rapidez para obtener resultados.
Mayor exactitud o mejor calidad de la informacin debido a los
siguientes factores:

26
Inferencia Estadstica

Ventajas del muestreo


Costos reducidos.
Mayor rapidez para obtener resultados.
Mayor exactitud o mejor calidad de la informacin debido a los
siguientes factores:
a) Volumen de trabajo reducido.

27
Inferencia Estadstica

Ventajas del muestreo


Costos reducidos.
Mayor rapidez para obtener resultados.
Mayor exactitud o mejor calidad de la informacin debido a los
siguientes factores:
a) Volumen de trabajo reducido.
b) Puede existir mayor supervisin en el trabajo.

28
Inferencia Estadstica

Ventajas del muestreo


Costos reducidos.
Mayor rapidez para obtener resultados.
Mayor exactitud o mejor calidad de la informacin debido a los
siguientes factores:
a) Volumen de trabajo reducido.
b) Puede existir mayor supervisin en el trabajo.
c) Se puede dar ms entrenamiento al personal.

29
Inferencia Estadstica

Ventajas del muestreo


Costos reducidos.
Mayor rapidez para obtener resultados.
Mayor exactitud o mejor calidad de la informacin debido a los
siguientes factores:
a) Volumen de trabajo reducido.
b) Puede existir mayor supervisin en el trabajo.
c) Se puede dar ms entrenamiento al personal.
d) Menor probabilidad de cometer errores durante el
procesamiento de la informacin.

30
Inferencia Estadstica

Ventajas del muestreo


Costos reducidos.
Mayor rapidez para obtener resultados.
Mayor exactitud o mejor calidad de la informacin debido a los
siguientes factores:
a) Volumen de trabajo reducido.
b) Puede existir mayor supervisin en el trabajo.
c) Se puede dar ms entrenamiento al personal.
d) Menor probabilidad de cometer errores durante el
procesamiento de la informacin.
Factibilidad de hacer el estudio cuando la toma de datos implica
tcnicas destructivas, por ejemplo:

31
Inferencia Estadstica

Ventajas del muestreo


Costos reducidos.
Mayor rapidez para obtener resultados.
Mayor exactitud o mejor calidad de la informacin debido a los
siguientes factores:
a) Volumen de trabajo reducido.
b) Puede existir mayor supervisin en el trabajo.
c) Se puede dar ms entrenamiento al personal.
d) Menor probabilidad de cometer errores durante el
procesamiento de la informacin.
Factibilidad de hacer el estudio cuando la toma de datos implica
tcnicas destructivas, por ejemplo:
a) Pruebas de germinacin.

32
Inferencia Estadstica

Ventajas del muestreo


Costos reducidos.
Mayor rapidez para obtener resultados.
Mayor exactitud o mejor calidad de la informacin debido a los
siguientes factores:
a) Volumen de trabajo reducido.
b) Puede existir mayor supervisin en el trabajo.
c) Se puede dar ms entrenamiento al personal.
d) Menor probabilidad de cometer errores durante el
procesamiento de la informacin.
Factibilidad de hacer el estudio cuando la toma de datos implica
tcnicas destructivas, por ejemplo:
a) Pruebas de germinacin.
b) Anlisis de sangre.

33
Inferencia Estadstica

Ventajas del muestreo


Costos reducidos.
Mayor rapidez para obtener resultados.
Mayor exactitud o mejor calidad de la informacin debido a los
siguientes factores:
a) Volumen de trabajo reducido.
b) Puede existir mayor supervisin en el trabajo.
c) Se puede dar ms entrenamiento al personal.
d) Menor probabilidad de cometer errores durante el
procesamiento de la informacin.
Factibilidad de hacer el estudio cuando la toma de datos implica
tcnicas destructivas, por ejemplo:
a) Pruebas de germinacin.
b) Anlisis de sangre.
c) Control de calidad.
34
Inferencia Estadstica

Desventajas del muestreo

35
Inferencia Estadstica

Desventajas del muestreo


Siempre est presente el error de muestreo producto de la
variabilidad intrnseca de los elementos del universo, existen
diferencias entre las medidas muestrales (estadsticos) y los
parmetros poblacionales llamada Error de Muestreo.

36
Inferencia Estadstica

Desventajas del muestreo


Siempre est presente el error de muestreo producto de la
variabilidad intrnseca de los elementos del universo, existen
diferencias entre las medidas muestrales (estadsticos) y los
parmetros poblacionales llamada Error de Muestreo.
El trmino error no debe entenderse como sinnimo de
equivocacin.

37
Inferencia Estadstica

Desventajas del muestreo


Siempre est presente el error de muestreo producto de la
variabilidad intrnseca de los elementos del universo, existen
diferencias entre las medidas muestrales (estadsticos) y los
parmetros poblacionales llamada Error de Muestreo.
El trmino error no debe entenderse como sinnimo de
equivocacin.
Tambin suelen introducirse errores por otras vas, los cuales se
denominan errores sistemticos: Los cuales son:
- Imputables al observador.
- Imputables al mtodo de observacin o medicin.
- Imputables a lo observado (unidad de muestreo).

38
Inferencia Estadstica

Parmetro y estadstico

39
Inferencia Estadstica

Parmetro y estadstico
PARAMETRO: Son las medidas o datos que se obtienen sobre la
poblacin.

40
Inferencia Estadstica

Parmetro y estadstico
PARAMETRO: Son las medidas o datos que se obtienen sobre la
poblacin.

ESTADISTICO: Los datos o medidas que se obtienen sobre una


muestra y por lo tanto una estimacin de los parmetros.

41
Inferencia Estadstica

Parmetro y estadstico
PARAMETRO: Son las medidas o datos que se obtienen sobre la
poblacin.

ESTADISTICO: Los datos o medidas que se obtienen sobre una


muestra y por lo tanto una estimacin de los parmetros.

ERROR MUESTRAL, de estimacin o standard: Es la diferencia


entre un estadstico y su parmetro correspondiente.

42
Inferencia Estadstica

Tipos de muestreo

PROBABILISTICO

NO PROBABILISTICO

43
Inferencia Estadstica

Muestreo probabilstico

44
Inferencia Estadstica

Muestreo probabilstico
Los mtodos de muestreo probabilstico son aquellos que se basan en el
principio de equiprobabilidad.

45
Inferencia Estadstica

Muestreo probabilstico
Los mtodos de muestreo probabilstico son aquellos que se basan en el
principio de equiprobabilidad.

Es decir, aquellos en los que todos los individuos tienen la misma


probabilidad de ser elegidos para formar parte de una muestra y,
consiguientemente, todas las posibles muestras de tamao n tienen la
misma probabilidad de ser elegidas.

46
Inferencia Estadstica

Muestreo probabilstico
Los mtodos de muestreo probabilstico son aquellos que se basan en el
principio de equiprobabilidad.

Es decir, aquellos en los que todos los individuos tienen la misma


probabilidad de ser elegidos para formar parte de una muestra y,
consiguientemente, todas las posibles muestras de tamao n tienen la
misma probabilidad de ser elegidas.

Slo estos mtodos de muestreo probabilstico nos aseguran la


representatividad de la muestra extrada y son, por tanto, los ms
recomendables

47
Inferencia Estadstica

Muestreo no probabilstico
A veces, para estudios exploratorios, el muestreo probabilstico resulta
excesivamente costoso y se acude a mtodos no probabilstico, aun
siendo conscientes de que no sirven para realizar generalizaciones, pues
no se tiene certeza de que la muestra extrada sea representativa, ya que
no todos los sujetos de la poblacin tienen la misma probabilidad de se
elegidos.

48
Inferencia Estadstica

Muestreo no probabilstico
A veces, para estudios exploratorios, el muestreo probabilstico resulta
excesivamente costoso y se acude a mtodos no probabilstico, aun
siendo conscientes de que no sirven para realizar generalizaciones, pues
no se tiene certeza de que la muestra extrada sea representativa, ya que
no todos los sujetos de la poblacin tienen la misma probabilidad de se
elegidos.

En general se seleccionan a los sujetos siguiendo determinados criterios


procurando que la muestra sea representativa.

49
Inferencia Estadstica

Mtodos de muestreo probabilstico


MUESTREO ALEATORIO SIMPLE

MUESTREO ALEATORIO SISTEMTICO

MUESTREO ALEATORIO ESTRATIFICADO

MUESTREO ALEATORIO POR CONGLOMERADOS

50
Inferencia Estadstica

Mtodos de muestreo no probabilstico


MUESTREO POR CUOTAS

MUESTREO OPINTICO O INTENCIONAL

MUESTREO CASUAL O INCIDENTAL

BOLA DE NIEVE

51
Inferencia Estadstica

EJERCICIO 1
Decida, para cada uno de los problemas siguientes, si es apropiado un estudio
estadstico o no. En caso afirmativo explique la razn de su respuesta e
identifique la poblacin:

52
Inferencia Estadstica

EJERCICIO 1
Decida, para cada uno de los problemas siguientes, si es apropiado un estudio
estadstico o no. En caso afirmativo explique la razn de su respuesta e
identifique la poblacin:
1. Se investigar la opinin de 50000 trabajadores que se vern afectados por
el cambio de la jornada laboral tradicional, de ocho horas diarias durante
cinco das a la semana, a la de diez horas diarias por espacio de cuatro das
a la semana.

53
Inferencia Estadstica

EJERCICIO 1
Decida, para cada uno de los problemas siguientes, si es apropiado un estudio
estadstico o no. En caso afirmativo explique la razn de su respuesta e
identifique la poblacin:
1. Se investigar la opinin de 50000 trabajadores que se vern afectados por
el cambio de la jornada laboral tradicional, de ocho horas diarias durante
cinco das a la semana, a la de diez horas diarias por espacio de cuatro das
a la semana.
2. Un despacho de arquitectos debe presentar una cotizacin para un proyecto
de cableado. Estn disponibles siete contratistas elctricos para la tarea. Se
pretende determinar el costo promedio estimado del proyecto y el tiempo
promedio proyectado que se requerira para que cualquiera de los
contratistas realice el proyecto.

54
Inferencia Estadstica

EJERCICIO 1
Decida, para cada uno de los problemas siguientes, si es apropiado un estudio
estadstico o no. En caso afirmativo explique la razn de su respuesta e
identifique la poblacin:
1. Se investigar la opinin de 50000 trabajadores que se vern afectados por
el cambio de la jornada laboral tradicional, de ocho horas diarias durante
cinco das a la semana, a la de diez horas diarias por espacio de cuatro das
a la semana.
2. Un despacho de arquitectos debe presentar una cotizacin para un proyecto
de cableado. Estn disponibles siete contratistas elctricos para la tarea. Se
pretende determinar el costo promedio estimado del proyecto y el tiempo
promedio proyectado que se requerira para que cualquiera de los
contratistas realice el proyecto.
3. Un sistema de cmputo est conectado a cierto nmero de terminales
distantes. A fin de decidir si se aumenta dicho nmero o no, es necesario
estudiar la variable aleatoria X, el tiempo por sesin de cada usuario en las
terminales actualmente instaladas.
55
Inferencia Estadstica

EJERCICIO 2
Se quiere estimar la cantidad de tiempo promedio que los profesores del INTEC
emplean calificando las tareas de cierta semana.
Describa una forma de obtener
a) Una muestra aleatoria simple
b) Una muestra sistemtica
c) Una muestra estratificada

56
Distribuciones muestrales de
medias y de proporciones

57
Inferencia Estadstica

Distribucin muestral de medias

Considere la poblacin 1, 3, 5, 7

Se desea obtener una muestra de tamao 2,


mediante muestreo aleatorio simple, sin
reemplazamiento y sin importar el orden.

a) Cuntas muestras posibles hay?


b) Encuentre la distribucin muestral de medias.
c) Calcule la media de la poblacin.
d) Calcule la media de todas las medias muestrales.
58
Inferencia Estadstica

Distribucin muestral de medias

Considere la poblacin 1, 3, 5, 7

Se desea obtener una muestra de tamao 2,


mediante muestreo aleatorio simple, con
reemplazamiento y se considera el orden.

a) Cuntas muestras posibles hay?


b) Encuentre la distribucin muestral de medias.
c) Calcule la media de todas las medias muestrales.

59
Inferencia Estadstica

EJERCICIO 1

Una marca particular de jabn para lavadora de platos se


vende en tres tamaos: 25 oz, 40 oz y 65 oz. El 20% de
todos los compradores seleccionan la caja de 25 oz, el 50%
seleccionan una caja de 40 oz y el 30% restante selecciona
una caja de 65 oz.
Sean X1 y X2 los tamaos de paquete seleccionados por dos
compradores independientemente seleccionados. Determine
la distribucin muestral de medias.

60
Inferencia Estadstica

Teorema del lmite central

Sea X1, X2, Xn es una muestra aleatoria de una


distribucin con media y varianza .
Entonces, si n es suficientemente grande, X tiene
aproximadamente una distribucin normal con
=
X

=
X n
61
Inferencia Estadstica

EJERCICIO 2

Se tiene un lote de 12 artculos, el cual tiene 4 defectuosos.


Se van a seleccionar 5 artculos al azar de ese lote sin
reemplazo. Genere la distribucin muestral de proporciones
para el nmero de piezas defectuosas.

62
Estimacin

63
Inferencia Estadstica

Estimacin

En Inferencia Estadstica, a travs de una muestra se trata


de:

64
Inferencia Estadstica

Estimacin

En Inferencia Estadstica, a travs de una muestra se trata


de:

Estimar un parmetro desconocido

65
Inferencia Estadstica

Estimacin

En Inferencia Estadstica, a travs de una muestra se trata


de:

Estimar un parmetro desconocido


(ESTIMACION)

66
Inferencia Estadstica

Estimacin

En Inferencia Estadstica, a travs de una muestra se trata


de:
Estimacin
puntual
Estimar un parmetro desconocido
(ESTIMACION)

67
Inferencia Estadstica

Estimacin

En Inferencia Estadstica, a travs de una muestra se trata


de:
Estimacin
puntual
Estimar un parmetro desconocido
(ESTIMACION)
Estimacin por
intervalos

68
Inferencia Estadstica

Estimacin

En Inferencia Estadstica, a travs de una muestra se trata


de:
Estimacin
puntual
Estimar un parmetro desconocido
(ESTIMACION)
Estimacin por
intervalos

Verificar si el parmetro es o no igual a cierto valor

69
Inferencia Estadstica

Estimacin

En Inferencia Estadstica, a travs de una muestra se trata


de:
Estimacin
puntual
Estimar un parmetro desconocido
(ESTIMACION)
Estimacin por
intervalos

Verificar si el parmetro es o no igual a cierto valor


(PRUEBA DE HIPOTESIS)
70
Inferencia Estadstica

Estimacin

Para estimar el parmetro poblacional se utiliza el


estadstico .

71
Inferencia Estadstica

Estimacin

Para estimar el parmetro poblacional se utiliza el


estadstico .

Parmetro Estimador
Ejemplos x
s
s
p p

72
Inferencia Estadstica

Estimacin

El estimador no tiene que ser nico.

73
Inferencia Estadstica

Estimacin

El estimador no tiene que ser nico.


Por ejemplo, en una distribucin simtrica, otro estimador
de es la mediana.

74
Inferencia Estadstica

Estimacin

El estimador no tiene que ser nico.


Por ejemplo, en una distribucin simtrica, otro estimador
de es la mediana.
Otro estimador pudiera ser la media 10% recortada.

75
Inferencia Estadstica

Estimacin

El estimador no tiene que ser nico.


Por ejemplo, en una distribucin simtrica, otro estimador
de es la mediana.
Otro estimador pudiera ser la media 10% recortada.
min + max
Y otro estimador podra ser
2

76
Inferencia Estadstica

Estimacin

El estimador no tiene que ser nico.


Por ejemplo, en una distribucin simtrica, otro estimador
de es la mediana.
Otro estimador pudiera ser la media 10% recortada.
min + max
Y otro estimador podra ser
2

En general se cumple que = + error de estimacin


77
Inferencia Estadstica

Propiedades de un buen estimador

78
Inferencia Estadstica

Propiedades de un buen estimador

1. Ausencia de sesgo o imparcialidad, es decir, que sea


insesgado. Esto es E( ) =

79
Inferencia Estadstica

Propiedades de un buen estimador

1. Ausencia de sesgo o imparcialidad, es decir, que sea


insesgado. Esto es E( ) =

2. Eficacia o eficiencia, esto significa que su varianza es


mnima.

80
Inferencia Estadstica

Propiedades de un buen estimador

1. Ausencia de sesgo o imparcialidad, es decir, que sea


insesgado. Esto es E( ) =

2. Eficacia o eficiencia, esto significa que su varianza es


mnima.

3. Consistencia o coherencia. Un estimador es consistente


cuando su valor tiende a acercarse al correspondiente
valor del parmetro.

81
Inferencia Estadstica

Propiedades de un buen estimador

1. Ausencia de sesgo o imparcialidad, es decir, que sea


insesgado. Esto es E( ) =

2. Eficacia o eficiencia, esto significa que su varianza es


mnima.

3. Consistencia o coherencia. Un estimador es consistente


cuando su valor tiende a acercarse al correspondiente
valor del parmetro.

4. Suficiencia, o sea, que agota toda la informacin sobre


el parmetro contenida en la muestra.
82
Inferencia Estadstica

Propiedades de un buen estimador

La media muestral y la varianza corregida son


buenos estimadores de la media poblacional y la
varianza poblacional.

83
Intervalos de confianza para
la media poblacional

84
Inferencia Estadstica

La estimacin puntual, o sea, estimar un parmetro


a travs de un nico valor no es muy conveniente
pues con ella no se puede determinar el error de
muestreo, ni la precisin de la estimacin, ni la
confianza que merece tal estimacin.

85
Inferencia Estadstica

Existen otros mtodos para estimar parmetros


poblacionales, que son mucho ms precisos.
Por ejemplo,

86
Inferencia Estadstica

Existen otros mtodos para estimar parmetros


poblacionales, que son mucho ms precisos.
Por ejemplo,
Mtodo de los mnimos cuadrados

87
Inferencia Estadstica

Existen otros mtodos para estimar parmetros


poblacionales, que son mucho ms precisos.
Por ejemplo,
Mtodo de los mnimos cuadrados
Mtodo de los momentos

88
Inferencia Estadstica

Existen otros mtodos para estimar parmetros


poblacionales, que son mucho ms precisos.
Por ejemplo,
Mtodo de los mnimos cuadrados
Mtodo de los momentos
Mtodo de la mxima verosimilitud

89
Inferencia Estadstica

Existen otros mtodos para estimar parmetros


poblacionales, que son mucho ms precisos.
Por ejemplo,
Mtodo de los mnimos cuadrados
Mtodo de los momentos
Mtodo de la mxima verosimilitud
Mtodo de estimacin por intervalos de
confianza

90
Inferencia Estadstica

Algunos conceptos

91
Inferencia Estadstica

Algunos conceptos

= probabilidad de que el intervalo NO incluya al


verdadero valor del parmetro.

92
Inferencia Estadstica

Algunos conceptos

= probabilidad de que el intervalo NO incluya al


verdadero valor del parmetro.

1 = probabilidad de que el intervalo incluya al


verdadero valor del parmetro
= nivel de confianza

93
Inferencia Estadstica

Algunos conceptos

= probabilidad de que el intervalo NO incluya al


verdadero valor del parmetro.

1 = probabilidad de que el intervalo incluya al


verdadero valor del parmetro
= nivel de confianza

Ejemplo: = 5% = 0.05
1 = 95% = 0.95

94
Inferencia Estadstica

Teorema del lmite central

95
Inferencia Estadstica

Teorema del lmite central

Sea X1, X2, Xn es una muestra aleatoria de una


distribucin con media y varianza .
Entonces, si n es suficientemente grande, X tiene
aproximadamente una distribucin normal con
=
X

=
X n
96
Inferencia Estadstica

Tabla de la distribucin normal estndar

97
Inferencia Estadstica

Intervalo de confianza al 95%


(para la media siendo conocida)


x - 1.96 x + 1.96
n n

98
Inferencia Estadstica

Tabla de la distribucin normal estndar

99
Inferencia Estadstica

Algunos niveles de confianza

Nivel de confianza Normal z


estndar
95% 0.95 0.05 0.975 1.96
97% 0.97 0.03 0.985 2.17
99% 0.99 0.01 0.995 2.58
90% 0.90 0.10 0.959 1.65

100
Inferencia Estadstica

Ejercicio 1

Un grupo de investigadores en medicina desean estimar el


cambio medio de presin sangunea por paciente en un
sanatorio. Se ha seleccionado una muestra al azar de 30
pacientes y se hall una media de 5 puls/seg. Los
investigadores saben que, segn estudios anteriores, la
desviacin estndar de los cambios de presin sangunea
para todos los pacientes es de 3 puls/seg. Se desea estimar
el cambio medio de la presin sangunea por paciente con
un intervalo del 95% de confianza, suponiendo que la
variable aleatoria cambios de presin sangunea tiene una
distribucin normal.
101
Inferencia Estadstica

Intervalo de confianza al 95%


(para la media para desconocida)

s s
x - 1.96 x + 1.96
n n

Como generalmente la desviacin estndar poblacional es


desconocida, se sustituye por la desviacin estndar de la
muestra.

102
Inferencia Estadstica

Ejercicio 2

Los siguientes datos son los puntajes obtenidos para 45


personas en una escala de depresin (mayor puntaje
significa mayor depresin).
2 5 6 8 8 9 9 10 11
11 11 13 13 14 14 14 14 14
14 15 15 16 16 16 16 16 16
16 16 17 17 17 18 18 18 19
19 19 19 19 19 19 19 20 20

Construir un intervalo de confianza para la depresin


promedio de la poblacin a un nivel de confianza del 95%.
103
Intervalos de confianza para
proporciones

104
Inferencia Estadstica

Intervalo de confianza al 95%


para la proporcin

p (1-p ) p (1-p )
p - 1.96 p p + 1.96
n n

105
Inferencia Estadstica

Ejercicio 1

En un estudio de prevalencia de factores de riesgo


en una cohorte de 412 mujeres mayores de 15
aos en cierta regin se encontr que el 17.6%
eran hipertensas. Determine un intervalo de
confianza al 95% para la proporcin de mujeres
hipertensas en la regin estudiada.

106
Inferencia Estadstica

Ejercicio 2

En cierta poblacin se seleccion aleatoriamente


una muestra de 300 personas a las que se les
someti a cierto test cultural. De ellas resultaron
aprobadas 225. Teniendo en cuenta esta
informacin estimar el porcentaje de personas de
esa poblacin que resultaran aprobados si se les
sometiera a dicho test cultural. Obtener con un
nivel de confianza del 97% un intervalo de
confianza para la proporcin.

107
Inferencia Estadstica

Ejercicio 3

Estamos interesados en conocer el consumo diario


medio de cigarrillos entre los alumnos de cierta
universidad. Seleccionada una muestra aleatoria de
100 alumnos se observ que fumaban una media
de 8 cigarrillos diarios. Si admitimos que la varianza
de dicho consumo es de 16 cigarrillos 2 en el
colectivo total, estime dicho consumo medio con un
nivel de confianza del 90%.

108
Inferencia Estadstica

Ejercicio 4

Tomada al azar una muestra de 120 estudiantes de


una universidad se encontr que 54 de ellos
hablaban ingls. Halle con un nivel de confianza del
90% un intervalo de confianza para estimar la
proporcin de estudiantes que habla el idioma
ingls entre los estudiantes de esa universidad.

109
Inferencia Estadstica

Ejercicio 5

Un diseador industrial quiere determinar la


cantidad promedio de tiempo que tarda un adulto
en ensamblar un juguete fcil de ensamblar. Use
los datos siguientes (en minutos), una muestra
aleatoria, para construir un intervalo de confianza
del 95% para la media de la poblacin muestreada.
17 13 18 19 17 21 29 22 16 28 21 15
26 23 24 20 8 17 17 21 32 18 25 22
16 10 20 22 19 14 30 22 12 24 28 11

110
Intervalos de confianza para
la diferencia de medias y la
diferencia de proporciones

111
Inferencia Estadstica

Intervalo de confianza para la


diferencia de medias

Si x 1 y x 2 son los valores de las medias de muestras


aleatorias independientes de tamaos n y n de poblaciones
1 2

normales con las varianzas conocidas 12 y 22 entonces un


intervalo de confianza para la diferencia entre las dos
medias de las poblaciones es

112
Inferencia Estadstica

Intervalo de confianza para la


diferencia de medias

2 2
1 2
( x1 - x2 ) - z + 1 - 2
n1 n2

2 2
1 2
( x1 - x2 ) + z +
n1 n2
113
Inferencia Estadstica

Intervalo de confianza para la


diferencia de medias

En virtud del teorema del lmite central esta frmula puede


usarse tambin para muestras aleatorias independientes de
poblaciones no normales con varianzas conocidas cuando
los valores de n 1 y n2 son grandes (mayores que 30).

114
Inferencia Estadstica

Intervalo de confianza para la


diferencia de medias
2 2
Si las varianzas 1 y 2 son desconocidas, entonces se
sustituyen sus valores en la frmula por s 2y s 2 y se procede
1 2

como antes.

115
Inferencia Estadstica

Ejercicio 1

Construya un intervalo de confianza al 94% para la


diferencia entre las vidas medias de dos clases de
bombillos dado que una muestra aleatoria de 40
bombillos de la primera clase dur un promedio de
418 horas de uso continuo y 50 bombillos de la
segunda clase duraron en promedio 402 horas de
uso continuo. Las desviaciones estndar de las
poblaciones se sabe que son 1 = 26 y 2 =22 (en
horas).

116
Inferencia Estadstica

Intervalo de confianza para la


diferencia de proporciones

Si p1 y p2 son los valores de las proporciones de dos


muestras tamaos grandes n 1y n2 entonces un intervalo de
confianza para la diferencia de proporciones p p es
1 2

117
Inferencia Estadstica

Intervalo de confianza para la


diferencia de proporciones

p1 (1- p 1) p2(1- p2)


( p1 - p2 ) - z + p 1 - p2
n1 n2

p1 (1- p1) p2(1- p2 )


( p1 - p2 ) + z +
n1 n2
118
Inferencia Estadstica

Ejercicio 2

Si 132 de 200 votantes hombres y 90 de 159


votantes mujeres estn a favor de cierto candidato
que hace campaa, encuentre un intervalo de
confianza del 99% para la diferencia entre las
proporciones reales de votantes hombres y
votantes mujeres que estn a favor del candidato.

119
Inferencia Estadstica

Ejercicio 3

Un estudio del crecimiento anual de ciertos cactus


mostr que 64 de ellos, seleccionados
aleatoriamente en una regin desrtica, crecieron
en promedio 52.80 mm con una desviacin
estndar de 4.5 mm. Construya un intervalo de
confianza del 99% para el verdadero promedio de
crecimiento anual de la clase dada de cactus.

120
Inferencia Estadstica

Ejercicio 4

Un estudio de dos clases de equipos de fotocopiado muestra


que 61 averas del equipo de la primera clase se llevaron en
promedio 80.7 minutos en ser reparados, con una
desviacin estndar de 19.4 minutos, mientras que 61
averas del equipo de segunda clase se llevaron en
promedio 88.1 minutos en ser reparados, con una
desviacin estndar de 18.8 minutos. Encuentre un intervalo
de confianza del 99% para la diferencia entre los verdaderos
promedios del tiempo que toma reparar las averas de las
dos clases de equipo de fotocopiado.

121
Inferencia Estadstica

Ejercicio 5
En una muestra aleatoria de 300 personas que
comen en una cafetera de una tienda
departamental solo 102 pidieron postre.
Si usamos 102/300 = 0.34 como una estimacin de
la verdadera proporcin correspondiente, con qu
confianza podemos afirmar que nuestro error es
menor que 0.05?

122
Lmites de confianza para la
varianza poblacional y para
el cociente de dos varianzas

123
Inferencia Estadstica

Intervalo de confianza para la


varianza poblacional
2
Si s es el valor de la varianza de una muestra
aleatoria de tamao n de una poblacin normal,
entonces un intervalo de confianza del (1-)100%
2
para es

124
Inferencia Estadstica

Intervalo de confianza para la


varianza poblacional
2
Si s es el valor de la varianza de una muestra
aleatoria de tamao n de una poblacin normal,
entonces un intervalo de confianza del (1-)100%
2
para es
2 2
(n-1) s 2
(n-1) s
< <
2 2
, n-1

1 - , n-1
2 2
125
Inferencia Estadstica

Distribucin
Prueba chi-cuadrado
chi-cuadrado de bondad de
ajuste

Si la variable aleatoria X tiene una distribucin normal estndar,


2
entonces la variable aleatoria X tiene una distribucin chi-cuadrado
126
Inferencia Estadstica

Tabla de la distribucin chi-cuadrado

127
Inferencia Estadstica

Ejercicio 1

En 16 corridas de prueba el consumo de gasolina


de un motor experimental tiene una desviacin
estndar de 2.2 galones. Construya un intervalo de
2
confianza del 99% para que mide la verdadera
variabilidad del consumo de gasolina del motor.

128
Inferencia Estadstica

Lmites de confianza para el cociente


de dos varianzas

129
Inferencia Estadstica

Lmites de confianza para el cociente


de dos varianzas

2 2
Si s 1 y s 2 son los valores de dos varianzas de

muestras aleatorias independientes de tamaos n 1

y n2 de poblaciones normales, entonces un


2
1
intervalo de confianza del (1-)100% para es
2
2

130
Inferencia Estadstica

Lmites de confianza para el cociente


de dos varianzas

2 2 2
s1 1 1 s1
< < F , n -1, n -1
2 2 2
s2 F , n -1, n -1 2 s2 2
2 1

1 2
2

131
Inferencia Estadstica

Tabla de la distribucin F

132
Inferencia Estadstica

Ejercicio 2

Se hizo un estudio para comparar los contenidos de nicotina


de dos marcas de cigarrillos. Diez cigarrillos de la marca 1
tuvieron un contenido promedio de 3.1 miligramos con una
desviacin estndar de 0.5 miligramos mientras que ocho
cigarrillos de la marca 2 tuvieron un contenido promedio de
nicotina de 2.7 miligramos con una desviacin estndar de
0.7 miligramos. Suponga que los dos conjuntos de datos
son muestras aleatorias independientes de poblaciones
normales. Encuentre un intervalo de confianza del 98% para
el cociente de las varianzas 2 y 2 .
1 2

133
Inferencia Estadstica

134
Inferencia Estadstica

135
Inferencia Estadstica

Ejercicio 3

Un estudio del crecimiento anual de ciertos cactus


mostr que 64 de ellos, seleccionados
aleatoriamente en una regin desrtica, crecieron
en promedio 52.80 mm con una desviacin
estndar de 4.5 mm. Construya un intervalo de
confianza del 99% para la desviacin estndar del
crecimiento anual de la clase de cactus dada.

136
Inferencia Estadstica

Ejercicio 4

Un estudio de dos clases de equipos de fotocopiado muestra


que 61 averas del equipo de la primera clase se llevaron en
promedio 80.7 minutos en ser reparados, con una
desviacin estndar de 19.4 minutos, mientras que 61
averas del equipo de segunda clase se llevaron en
promedio 88.1 minutos en ser reparados, con una
desviacin estndar de 18.8 minutos. Encuentre un intervalo
de confianza del 98% para la razn de las varianzas de las
poblaciones muestreadas.

137
Inferencia Estadstica

138
Intervalos de confianza para
muestras pequeas

139
Inferencia Estadstica

Muestras pequeas

Cuando estamos tratando con una muestra aleatoria de una


poblacin normal con n<30 y desconocida,

Si x y s son los valores de la media y la desviacin estndar


de una muestra aleatoria de tamao n de una poblacin
normal entonces un intervalo con (1-)100% de confianza
para la media de la poblacin es
s s
x t , n-1 . < < x+t .
, n-1
2 n 2 n

140
Inferencia Estadstica

141
Inferencia Estadstica

Ejercicio 1

Un fabricante de pinturas quiere determinar el tiempo


promedio de secado de una pintura para muros interiores. Si
para 12 reas de prueba del mismo tamao ha obtenido una
media de tiempo de secado de 66.3 minutos y una
desviacin estndar de 8.4 minutos, construya un intervalo
de confianza del 95% para la media verdadera .

142
Pruebas de hiptesis

143
Inferencia Estadstica

Hay problemas como:

Un ingeniero debe decidir, con base a datos muestrales, si


el verdadero promedio de vida de cierta clase de
neumticos es por lo menos 22000 millas.

144
Inferencia Estadstica

Hay problemas como:

Un ingeniero debe decidir, con base a datos muestrales, si


el verdadero promedio de vida de cierta clase de
neumticos es por lo menos 22000 millas.
Un agrnomo debe decidir, con base en experimentos, si
una clase de fertilizantes produce un rendimiento ms alto
de frijol de soya que otro.

145
Inferencia Estadstica

Hay problemas como:

Un ingeniero debe decidir, con base a datos muestrales, si


el verdadero promedio de vida de cierta clase de
neumticos es por lo menos 22000 millas.
Un agrnomo debe decidir, con base en experimentos, si
una clase de fertilizantes produce un rendimiento ms alto
de frijol de soya que otro.
Un fabricante de productos farmacuticos tiene que
decidir, con base en muestras, si el 90% de todos los
pacientes que reciben un nuevo tratamiento se recuperarn
de cierta enfermedad.

146
Inferencia Estadstica

Hiptesis estadstica es una


afirmacin o conjetura acerca de la
distribucin de una o ms variables
aleatorias.

147
Inferencia Estadstica

Frecuentemente las hiptesis se formulan diciendo


exactamente lo contrario de lo que se quiere demostrar.

Ejemplo
Se quiere probar que los estudiantes de INTEC tienen, en
promedio, ms alto IQ que los estudiantes de otra
universidad. Se formula la hiptesis de que no hay
diferencias, es decir, que =
1 2

148
Inferencia Estadstica

Como muchas de las hiptesis se formulan en el lenguaje


no hay diferencias, se usa el trmino hiptesis nula,
aunque el trmino es vlido para cualquier hiptesis que
quisiramos probar.

Se consideran siempre dos hiptesis:


H 0 : hiptesis nula (ejemplo: 1 = 2 )
H : hiptesis alternativa (ejemplo: > )
1 1 2

149
Inferencia Estadstica

Prueba de hiptesis

Procedimiento de prueba: Es una regla, basada en datos muestrales,


para decidir si se rechaza o no Ho.

Un procedimiento de prueba consta de:


Un estadstico de prueba, o sea, una funcin de los datos
muestrales en los cuales ha de basarse la decisin (rechazar Ho, no
rechazar Ho)
Una regin de rechazo, que es el conjunto de todos los valores del
estadstico de prueba para los cuales Ho ser rechazada.

La hiptesis nula ser rechazada si y solo si el valor del estadstico de


prueba observado o calculado queda en la regin de rechazo.

150
Inferencia Estadstica

Hay cuatro posibilidades:

151
Inferencia Estadstica

Hay cuatro posibilidades:

Realidad

152
Inferencia Estadstica

Hay cuatro posibilidades:

Realidad

Ho es cierta

153
Inferencia Estadstica

Hay cuatro posibilidades:

Realidad

Ho es cierta Ho es falsa

154
Inferencia Estadstica

Hay cuatro posibilidades:

Realidad

Ho es cierta Ho es falsa

Decisin
estadstica

155
Inferencia Estadstica

Hay cuatro posibilidades:

Realidad

Ho es cierta Ho es falsa

No rechazar
Ho
Decisin
estadstica

156
Inferencia Estadstica

Hay cuatro posibilidades:

Realidad

Ho es cierta Ho es falsa

No rechazar
Ho
Decisin
estadstica
Rechazar Ho

157
Inferencia Estadstica

Hay cuatro posibilidades:

Realidad

Ho es cierta Ho es falsa

No rechazar
ok
Ho
Decisin
estadstica
Rechazar Ho

158
Inferencia Estadstica

Hay cuatro posibilidades:

Realidad

Ho es cierta Ho es falsa

No rechazar
ok
Ho
Decisin
estadstica
Rechazar Ho (error Tipo I)

159
Inferencia Estadstica

Hay cuatro posibilidades:

Realidad

Ho es cierta Ho es falsa

No rechazar
ok (error Tipo II)
Ho
Decisin
estadstica
Rechazar Ho (error Tipo I)

160
Inferencia Estadstica

Hay cuatro posibilidades:

Realidad

Ho es cierta Ho es falsa

No rechazar
ok (error Tipo II)
Ho
Decisin
estadstica
Rechazar Ho (error Tipo I) ok

161
Inferencia Estadstica

Prueba de hiptesis

La probabilidad de cometer un error de tipo I se


denota por .

La probabilidad de cometer un error de tipo II se


denota por .

162
Inferencia Estadstica

Prueba de hiptesis

Si el tamao de la muestra y el estadstico de


prueba ya estn fijos entonces, si se reduce el
tamao de la regin de rechazo para disminuir ,
se obtiene un valor ms grande de .

En la prctica se fija el valor de , lo cual se conoce


como nivel de significacin de la prueba. Son
usuales los niveles de significacin 0.1, 0.05 y 0.01.

163
Inferencia Estadstica

Pruebas de hiptesis sobre la media

Sea X1, X2, Xn es una muestra aleatoria de una


distribucin con media y varianza .
Sabemos que, si n es suficientemente grande, X tiene
aproximadamente una distribucin normal con
=
X

=
X n
164
Inferencia Estadstica

Pruebas de hiptesis sobre la media

Consideremos la hiptesis nula H0: = 0


Si H0 es verdadera entonces = 0
X
X 0
El estadstico z = es una medida natural de
la distancia entre X (estima-
dor de ) y 0 (valor espera-
n do cuando H0 es verdadera)

Si la distancia es demasiado grande H0 debe ser rechazada.

165
Inferencia Estadstica

Prueba de hiptesis para la media

Caso I
H0: =0
H1: 0
0
0 - z 0 + z
n n

166
Inferencia Estadstica

Prueba de hiptesis para la media

Caso II
H0: =0
H1: >0
0
0 - 0 + z
n n

167
Inferencia Estadstica

Prueba de hiptesis para la media

Caso III
H0: =0
H1: <0
0
0 - z 0 +
n n

168
Inferencia Estadstica

Pruebas de hiptesis sobre la media

Si n es grande y es desconocida usaremos

X 0
el estadstico z =
s

169
Inferencia Estadstica

Ejercicio 1

Suponga que por experiencia se sabe que la desviacin


estndar del peso de paquetes de 8 onzas de galletas en
cierta pastelera es de 0.16 onzas. Para comprobar si su
produccin est bajo control en un da dado, esto es,
comprobar si el peso promedio verdadero de los paquetes
de galletas es 8 onzas, los empleados seleccionan una
muestra aleatoria de 36 paquetes y encuentran que la
media de su peso es 8.077 onzas. Puesto que la pastelera
pierde dinero si >8 y el cliente pierde cuando <8, pruebe
la hiptesis nula =8 contra la hiptesis alternativa 8 al
nivel 0.01 de significacin.
170
Inferencia Estadstica

Ejercicio 2

Suponga que 100 neumticos que cierto fabricante produce


duraron en promedio 21819 millas, con una desviacin
estndar de 1295 millas. Pruebe la hiptesis nula =22000
millas contra la hiptesis alternativa <22000 en el nivel
0.05 de significacin.

171
Ejercicio 3
Inferencia Estadstica

Se utiliza un penetrmetro cnico dinmico para medir la


resistencia de un material a la penetracin (mm/golpe) a medida
que el cono es insertado el pavimento o subrasante. Suponga que,
para una aplicacin particular, se requiere que el valor penetracin
cnica promedio verdadero para un cierto tipo de pavimento sea
menor que 30. El pavimento no ser utilizado a menos que exista
evidencia concluyente de que la especificacin fue satisfecha.
Formule y pruebe las hiptesis apropiadas utilizando los datos
siguientes, con un nivel de significacin de 0.05.
14.1 14.5 15.5 16 16 16.7 16.9 17.1 17.5 17.8
17.8 18.1 18.2 18.3 18.3 19 19.2 19.4 20 20
20.8 20.8 21 21.5 23.5 27.5 27.5 28 28.3 30
30 31.6 31.7 31.7 32.5 33.5 33.9 35 35 35
36.7 40 40 41.3 41.7 47.5 50 51 51.8 54.4
55 57
172
Inferencia Estadstica

Pruebas de hiptesis sobre la media

Si el tamao de la muestra es pequeo y es desconocida


usaremos

X 0
el estadstico t = que tiene una distribucin t
s con n-1 grados de libertad

173
Inferencia Estadstica

Ejercicio

Las especificaciones para cierta clase de cinta piden una


media de la resistencia al rompimiento de 185 libras. Si
cinco piezas, seleccionadas aleatoriamente de diferentes
rollos, tienen una resistencia al rompimiento de 171.6,
191.8, 178.3, 184.9 y 189.1 libras, pruebe la hiptesis nula
=185 libras contra la hiptesis alternativa 185 libras en
el nivel 0.05 de significacin.

174
Inferencia Estadstica

Pruebas de hiptesis sobre la diferencia


de medias

Supongamos que tenemos dos muestras aleatorias


independientes de tamaos n1 y n2 de dos poblaciones
normales que tienen las medias 1 y 2 y las desviaciones
estndar conocidas 1 y 2 entonces para las pruebas de
hiptesis:

Ho: 1 2 =

contra las hiptesis alternativas

H1: 1 2 , H1: 1 2 > , H1: 1 2 <


175
Inferencia Estadstica

Pruebas de hiptesis sobre la diferencia


de medias

Usaremos el estadgrafo de prueba

x1 x2
z=
2 2
1 + 2
n1 n2

Las regiones respectivas son |z| Zc , z Zc , z Zc

176
Inferencia Estadstica

Pruebas de hiptesis sobre la diferencia


de medias

Si 1 y 2 son desconocidas y n1 y n2 suficientemente grandes

x1 x2
z=
2 2
s1 + s2
n1 n2

177
Inferencia Estadstica

Ejercicio
Se hace un experimento para determinar si el contenido promedio de
nicotina de una clase de cigarrillos excede al de otra clase en 0.20
miligramos. Si 50 cigarrillos de la primera clase tuvieron en promedio un
contenido de nicotina de 2.61 miligramos con una desviacin estndar
de 0.12 miligramos en tanto que 40 cigarrillos de la otra clase tuvieron
un contenido promedio de nicotina de 2.38 miligramos, con una
desviacin estndar de 0.14 miligramos, pruebe la hiptesis nula el
contenido promedio de nicotina de la primera clase de cigarrillos excede
en 0.20 miligramos al de la segunda contra la hiptesis alternativa el
contenido promedio de nicotina de la primera clase de cigarrillos no
excede en 0.20 miligramos al de la segunda. Considere el nivel de
significacin 0.1.

178
Inferencia Estadstica

Pruebas de hiptesis sobre proporciones

Si n es grande (n > 100) usaremos el estadstico de prueba

p - p0
z=

p0 (1 p0)

Las regiones respectivas son |z| Zc , z Zc , z Zc

179
Inferencia Estadstica

Ejercicio

Una compaa petrolera afirma que menos del 20%


de los propietarios de vehculos no han probado su
gasolina. Pruebe esta afirmacin en el nivel 0.01 de
significacin si una comprobacin aleatoria revela
que 22 de 200 propietarios de vehculos no han
probado la gasolina de la compaa.

180
Inferencia Estadstica

Pruebas de hiptesis sobre diferencia de


proporciones

Si p1=x1/n1 y p2=x2/n2 son proporciones en dos muestras


de tamaos n1 y n2 respectivamente,

p1 - p2
z=

x1+x2 x1+x2 1 1
1- +
n1+n2 n1+n2 n1 n2

es estadstico de prueba.
181
Inferencia Estadstica

Ejercicio

En una muestra aleatoria de 200 personas que no tomaron


desayuno, 82 reportaron que tuvieron fatiga a media
maana y en otra muestra aleatoria de 300 personas que
tomaron desayuno, 87 personas reportaron que tuvieron
fatiga a media maana. Prueba la hiptesis nula de que no
hay diferencias entre las proporciones correspondientes de
la poblacin contra la hiptesis alternativa de que la fatiga a
media maana est ms extendida entre las personas que
no toman desayuno, al nivel de significacin 0.05.

182
Inferencia Estadstica

Pruebas de hiptesis sobre la varianza

Dada una muestra aleatoria de tamao n de una poblacin


normal queremos probar la hiptesis nula H0: =
0
contra
una de las hiptesis H1: , H1: > ,
0
H1: <
0 0

(n-1) s
Usaremos el estadstico =

0

183
Inferencia Estadstica

Pruebas de hiptesis sobre la varianza

Las regiones crticas son:


Para H1: 0
, n-1 1- , n-1
2 2

Para H1: > 0


, n-1

Para H1: <


0 1- , n-1

184
Inferencia Estadstica

Ejercicio

Suponga que las mediciones del espesor de una muestra


aleatoria de 18 partes usadas de un semiconductor tiene la
varianza s=0.68, donde las mediciones son en milsimas
de pulgada. El proceso se considera que est bajo control si
la variacin del espesor est dada por una varianza no
mayor que 0.36. Suponga que las mediciones constituyen
una muestra aleatoria de una poblacin normal, pruebe la
hiptesis nula =0.36 contra la hiptesis alternativa
>0.36 en el nivel 0.05 de significacin.

185
Inferencia Estadstica

Pruebas de hiptesis sobre la razn de


varianzas

Dadas dos muestras aleatorias independientes de tamaos n1


y n2 de dos poblaciones normales con las varianzas 1 y
2

s1
Usaremos el estadstico
s2

186
Inferencia Estadstica

Ejercicio

Al comparar la variabilidad de la resistencia a la traccin de


dos clases de acero estructural, un experimento dio los
resultados siguientes: n1=13, s1=19.2, n2=16 y s2=3.5,
donde las unidades de medicin son 1000 libras por pulgada
cuadrada. Suponga que las mediciones constituyen variables
aleatorias independientes de dos poblaciones normales,
prueba la hiptesis nula 1=2 contra la alternativa
12 en el nivel 0.02 de significacin.

187
Inferencia Estadstica

Pruebas de hiptesis sobre la razn de


varianzas

Dadas dos muestras aleatorias independientes de tamaos n1


y n2 de dos poblaciones normales con las varianzas 1 y
2

s1
Usaremos el estadstico
s2

188
Ajuste a distribuciones
tericas.
Tablas de contingencia.
Prueba de chi-cuadrado

189
Inferencia Estadstica

Prueba de bondad de ajuste

Una distribucin de frecuencias es la


representacin emprica, y por tanto una
aproximacin, de una distribucin terica
(distribucin de probabilidades).

190
Inferencia Estadstica

Prueba de bondad de ajuste

Una distribucin de frecuencias es la


representacin emprica, y por tanto una
aproximacin, de una distribucin terica
(distribucin de probabilidades).
Se trata de decidir si la distribucin de
frecuencia muestral se ajusta bien o no a la
distribucin de probabilidades (frecuencia)
hipottica de la poblacin en estudio.
191
Inferencia Estadstica

Prueba de bondad de ajuste

H0: las frecuencias observadas coinciden con


las frecuencias esperadas

H1: las frecuencias observadas no coinciden


con las frecuencias esperadas

192
Inferencia Estadstica

Prueba de bondad de ajuste

H0: fij = eij para todo i,j


i=1,2,3,,r
j=1,2,3,,c
H1: fij eij para algn i

193
Estadstica No Paramtrica

Ejercicio 1

Se pidi a 35 nios de manera independiente que


nombraran su da favorito de la semana. Las elecciones
fueron:
Da Lunes Martes Mircoles Jueves Viernes Sbado Domingo
Fr. 1 3 7 8 5 11 0

Analice si estos datos son consistentes con un muestreo de


nios cuyas preferencias se distribuyeron uniformemente
entre todos los das de la semana.

194
Inferencia Estadstica

Prueba de chi-cuadrado

Estadstico de prueba
r c

= (fij eij) = (f e)
i=1 j=1 eij todas las e
celdas

195
Inferencia Estadstica

Prueba de chi-cuadrado

Rechazamos H0 cuando


, (r -1)(c -1)

196
Inferencia Estadstica

Tabla de contingencia

11 12 13 14 15
r 21 22 23 24 25
31 32 33 34 35
41 42 43 44 45
c 197
Inferencia Estadstica

Ejercicio 1

Use los datos mostrados en la siguiente tabla para probar


en el nivel 0.01 de significacin si la habilidad de una
persona en matemticas es independiente de su inters en
estadstica.
Habilidad en Matemticas
Bajo Promedio Alto
Inters en Bajo 63 42 15
Estadstica Promedio 58 61 31
Alta 14 47 29

198
Inferencia Estadstica

Ejercicio 2

Las muestras de un material experimental se producen


mediante tres diferentes prototipos de procesos y se les
hace una prueba de conformidad con un estndar de
resistencia. Si las pruebas mostraron los resultados
siguientes, se puede decir en el nivel 0.01 de significacin
que los tres procesos tienen la misma probabilidad de
aprobar con este estndar de resistencia?
Proceso A Proceso B Proceso C
Pasan la
prueba 45 58 49
No pasan la
prueba 21 12 35
199
Funcin de potencia de una
prueba

200
Inferencia Estadstica

Funcin de potencia

Para evaluar los mritos de un criterio de prueba o


una regin crtica tenemos que considerar las
probabilidades () de cometer error de tipo I para
todos los valores de dentro del dominio
especificado bajo la hiptesis nula H0 y las
probabilidades () de cometer error de tipo II
dentro del dominio especificado bajo la hiptesis
alternativa H1.

201
Inferencia Estadstica

Funcin de potencia

Recordemos que:

: probabilidad de rechazar H0 siendo verdadera


probabilidad de cometer error de tipo I

: probabilidad de no rechazar H0 siendo falsa


probabilidad de cometer error de tipo II

202
Inferencia Estadstica

Funcin de potencia

Recordemos que:

: probabilidad de rechazar H0 siendo verdadera


probabilidad de cometer error de tipo I

: probabilidad de no rechazar H0 siendo falsa


probabilidad de cometer error de tipo II

Entonces
1 : probabilidad de rechazar H0 siendo falsa
probabilidad de no cometer error de tipo II
203
Inferencia Estadstica

Funcin de potencia

La funcin de potencia de una prueba de hiptesis


estadstica H0 contra una hiptesis alternativa H1
est dada por

() para los valores de bajo H0


() =
1- () para los valores de bajo H1

204
Inferencia Estadstica

Funcin de potencia

Los valores de la funcin de potencia son las


probabilidades de rechazar la hiptesis nula H0 para
los diferentes valores del parmetro .

() para los valores de bajo H0


() =
1- () para los valores de bajo H1

205
Inferencia Estadstica

Funcin de potencia

Ejemplo
Supongamos que el fabricante de un nuevo medicamento
quiere decidir, sobre la base de muestras, si el 90% de
todos los pacientes que reciben ese nuevo medicamento se
recuperarn de cierta enfermedad.
Su estadstico de prueba es X, el nmero de xitos
observados (recuperaciones) en 20 intentos.
Consideremos H0: = 0.90
H1: < 0.90
Investigue la funcin de potencia correspondiente al criterio
de prueba aceptar la hiptesis nula si X>14 y rechazarla si
X14
206
Inferencia Estadstica

Funcin de potencia

Ejemplo
Calculemos las probabilidades () de rechazar H0 siendo
verdadera.

Si H0 es verdadera, entonces
p(X14) = p(X=0) + p(X=1) + p(X=2) + + p(X=14)

20 a 20-a
Siendo p(X=a) = (0.90) (1 0.90)
a

Obtenemos p(X 14) = 0.0113


207
Inferencia Estadstica

Funcin de potencia

Ejemplo
Calculemos las probabilidades () de no rechazar H0
(aceptar H0) siendo H0 falsa (H1 verdadera).

Si H1 es verdadera, entonces < 0.90.

Calculemos () para algunos valores de , por ejemplo,


=0.85, 0.80, 0.75, , 0.45

208
Inferencia Estadstica

Funcin de potencia

Ejemplo

Si =0.85
p(X>14) = p(X=15) + p(X=16) + p(X=17) + + p(X=20)

20 a 20-a
Siendo p(X=a) = (0.85) (1 0.85)
a

Obtenemos p(X >14) = 0.9252

209
Inferencia Estadstica

Funcin de potencia

probabilidad probabilidad prob.


error tipo I error tipo II rech. Ho
() () ()
0.90 0.0113 0.0113
0.85 0.9252 0.0748
0.80 0.7952 0.2048
0.75 0.6093 0.3907
0.70 0.4110 0.5890
0.65 0.2423 0.7577
0.60 0.1242 0.8758
0.55 0.0548 0.9452
0.50 0.0205 0.9795
0.45 0.0064 0.9936

210
Inferencia Estadstica

Funcin de potencia
() Curva de potencia
1,0000

0,9000

0,8000
Las funciones de
0,7000
potencia son las
0,6000
probabilidades de
0,5000
tomar la decisin
0,4000
correcta.
0,3000

0,2000

0,1000

0,0000
0,00 0,10 0,20 0,30 0,40 0,50 0,60 0,70 0,80 0,90 1,00

211
Inferencia Estadstica

Curva caracterstica de operacin

Pudieran graficarse las probabilidades de aceptar H0, que


sera la funcin 1-().
Obtendramos entonces la CURVA CARACTERISTICA DE
OPERACIN (o curva CO) prob. No
rechazar
Ho
0.45 0.0064
0.50 0.0205
0.55 0.0548
0.60 0.1242
0.65 0.2423
0.70 0.4110
0.75 0.6093
0.80 0.7952
0.85 0.9252
0.90 0.9887 212
Inferencia Estadstica

Curva caracterstica de operacin


1- ()

1,0000

0,9000

0,8000

0,7000

0,6000

0,5000

0,4000

0,3000

0,2000

0,1000

0,0000
0,00 0,10 0,20 0,30 0,40 0,50 0,60 0,70 0,80 0,90 1,00

213
Correlacin y regresin lineal

214
Inferencia Estadstica

Anlisis de regresin y correlacin

Un objetivo importante de muchas investigaciones


estadsticas es establecer las relaciones que hagan posible
predecir una o ms variables en trminos de otras.

Ejemplos
ventas potenciales de un nuevo producto en funcin de
un precio.
gastos familiares en entretenimiento en funcin del
ingreso familiar.
consumo percpita de ciertos alimentos en funcin de sus
valores nutricionales y la cantidad de dinero que se gasta en
hacerles publicidad en la televisin.
215
Inferencia Estadstica

Anlisis de regresin y correlacin

El anlisis de regresin es la parte de la estadstica que


se ocupa de investigar la relacin entre dos o ms variables
relacionadas en una forma no determinstica.

En la regresin simple hay solo dos variables:


la variable cuyo valor fija el investigador, se denota por X,
se llama variable independiente, pronosticadora, explicativa.
la variable Y que depende de X, se llama variable
dependiente o de respuesta.

En la regresin mltiple hay una variable dependiente y


ms de una variable independiente.
216
Inferencia Estadstica

Regresin lineal simple

217
Inferencia Estadstica

Ejemplo

Consideremos los datos siguientes sobre el nmero de horas


que diez personas estudiaron para una prueba de francs y
sus calificaciones en dicha prueba.

Horas 4 9 10 14 4 7 12 22 1 17
Nota 31 58 65 73 37 44 60 91 21 84

218
Inferencia Estadstica

Ejercicio

Los siguientes datos corresponden al cloro residual en una


piscina en diferentes momentos despus de haberse tratado
con qumicos
Nmero de horas Cloro residual (partes
por milln)
2 1.8
4 1.5
6 1.4
8 1.1
10 1.1
12 0.9

219
Inferencia Estadstica

Ejercicio

a) Ajuste una recta de mnimos cuadrados (recta de


regresin) con la cual podamos predecir el cloro residual
en trminos del nmero de horas transcurridas, luego de
haberse tratado con qumicos.
b) Use la ecuacin de la recta de regresin para estimar el
cloro residual 5 horas despus de haberse tratado con
qumicos.

220
Inferencia Estadstica

Coeficiente de correlacin lineal

Existen situaciones en las cuales el objetivo al estudiar el


comportamiento conjunto de dos variables es ver si estn
relacionados en lugar de utilizar una para predecir el valor
de la otra.

221
Inferencia Estadstica

Ejercicio
Una prueba de rendimiento es confiable si el estudiante que tomar la
prueba varias veces obtendr consistentemente puntuaciones altas
(bajas). Una forma de verificar la confiabilidad de una prueba es dividirla
en dos partes, por lo general problemas con numeracin par y
problemas con numeracin impar, y observar la correlacin entre las
puntuaciones que los estudiantes obtienen. Los datos siguientes son las
calificaciones de una muestra de 20 estudiantes en una prueba, x para
las preguntas impares, y para las preguntas pares. Calcule el valor del
coeficiente de correlacin r.
X 27 36 44 32 27 41 38 44 30 27
y 29 44 49 27 35 33 29 40 27 38
X 33 39 38 24 33 32 37 33 34 39
y 42 31 38 22 34 37 38 35 32 43
222
Regresin mltiple

223
Inferencia Estadstica

Regresin lineal simple

224
Inferencia Estadstica

Regresin mltiple

Si la variable y depende no solo de x sino de ms variables


tendramos en lugar del modelo de regresin simple (lineal)

y = a + bx

el modelo de regresin lineal mltiple

y = a + b1 x1 + b2 x2 + + bk xk

225
Inferencia Estadstica

226
Ejemplo
Inferencia Estadstica

Los datos siguientes muestran el nmero de habitaciones, el


nmero de baos y los precios a los que se vendi una muestra
aleatoria de casas unifamiliares. Encuentre la ecuacin de la recta
de regresin lineal mltiple que permite predecir el precio de una
casa en funcin del nmero de habitaciones y el nmero de baos.
Nmero de habitaciones Nmero de baos Precio
(dlares)
X1 X2 Y
X11 3 X12 2 78800

X21 2 X22 1 74300

X31 4 X32 3 83800

X41 2 X42 1 74200

X51 3 X52 2 79700

X61 2 X62 2 74900

X71 5 X72 3 88400

X81 4 X82 2 82900

227
Anlisis de varianza (ANOVA)

228
Inferencia Estadstica

Anlisis de varianza

El anlisis de varianza, o ms brevemente, ANOVA, es un


mtodo estadstico para decidir si las diferencias entre
dos o ms medias muestrales se puede atribuir al azar o
si hay diferencias reales entre las medias de las poblaciones
muestreadas.

229
Inferencia Estadstica

Anlisis de varianza

Ejemplos

Hay diferencias en la eficacia de tres mtodos para


ensear una lengua extranjera?
Hay diferencias en los efectos de cinco marcas
diferentes de gasolina con respecto a la eficiencia de
operacin de un motor?
Hay diferencias en cuanto al crecimiento de bacterias en
cuatro soluciones azucaradas: glucosa, fructosa, sucrosa y
una mezcla de las tres?

230
Inferencia Estadstica

Anlisis de varianza de un factor

Tambin se llama unifactorial, unidireccional, en un sentido.

Hay un solo factor.

Hay varios niveles o tratamientos.

231
Inferencia Estadstica

Anlisis de varianza de un factor

Se quiere comparar la accin limpiadora de tres


detergentes. Se tomaron 15 muestras de tela blanca, que se
mancharon con tinta china y luego se lavaron a mquina
usando los tres tipos de detergente. Los resultados de las
lecturas de blancura fueron:
Detergente A 77 81 71 76 80
Detergente B 72 58 74 66 70
Detergente C 76 85 82 80 77

Pruebe, en el nivel 0.01 de significacin, si las diferencias


entre las medias de las lecturas de blancura son
significativas.
232
Inferencia Estadstica

Anlisis de varianza de un factor

Tres grupos de seis conejillos de indias se inyectaron, cada


uno, con respectivamente 0.5 miligramos, 1.0 miligramos,
1.5 miligramos de un nuevo tranquilizante. A continuacin
se muestra el nmero de minutos que tardaron en quedarse
dormidos
0.5 miligramos 21 23 19 24 25 23
1.0 miligramos 19 21 20 18 22 20
1.5 miligramos 15 10 13 14 11 15

Pruebe, en el nivel 0.05 de significacin, si se puede


rechazar la hiptesis nula de que las diferencias en
dosificacin no tienen efecto.
233
Inferencia Estadstica

ANOVA bifactorial
Los datos sobre los tiempos (en minutos) que le tom a cierta persona
conducir su vehculo hasta su trabajo, de lunes a viernes, por cuatro
rutas diferentes, fueron las siguientes:
Lunes Martes Mircoles Jueves Viernes

Ruta 1 22 26 25 25 31

Ruta 2 25 27 28 26 29

Ruta 3 26 29 33 30 33

Ruta 4 26 28 27 30 30

Hay diferencias entre los promedios verdaderos de tiempo que tarda la


persona en conducir al trabajo teniendo en cuenta las cuatro rutas y los
cinco das de la semana? Considere el nivel de significacin 0.05

234
Inferencia Estadstica

ANOVA bifactorial
Considere los siguientes datos de un experimento para comparar tres
marcas diferentes de plumas y cuatro tratamientos de lavado distintos
con respecto a su capacidad de eliminar manchas en un tipo particular
de tela. La variable de respuesta es un indicador cualitativo del cambio
de color total de la tela, mientras ms bajo es este valor ms manchas
fueron eliminadas. Existe alguna diferencia entre el cambio de color
promedio verdadero debido a las diferentes marcas de pluma o a los
distintos tratamientos de lavado? Considere =0.05
Tratamiento 1 Tratamiento 2 Tratamiento 3 Tratamiento 4

Marca de pluma 1 0.97 0.48 0.48 0.46

Marca de pluma 2 0.77 0.14 0.22 0.25

Marca de pluma 3 0.67 0.39 0.57 0.19

235