You are on page 1of 180

DIRECCIN DE EDUCACIN ABIERTA Y A DISTANCIA Y VIRTUALIDAD

PROGRAMA ADMINISTRACIN DE EMPRESAS


ESTADSTICA INFERENCIAL
MDULO EN REVISIN

















DIRECCIN DE EDUCACIN ABIERTA Y A
DISTANCIA Y VIRTUALIDAD



PROGRAMA A DISTANCIA DE
ADMINITRACION DE EMPRESAS.



ESTADSTICA INFERENCIAL

COMPILADOR: EVER ANAYA COHEN
REDISEO: ROBINSON MORALES MEDINA

SINCELEJO
2014


TABLA DE CONTENIDO

INTRODUCCIN

JUSTIFICACIN

FORMAS DE ABORDAR LA LECTURA DEL MODULO

PROPSITOS DE FORMACIN

REFERENTE TERICO

ESTRUCTURA DEL MODULO ESTADSTICA INFERENCIAL

COMPETECIAS TRANSVERSALES A DESARROLLAR






















SABERES

1 UNIDAD UNO: DISTRIBUCIONES FUNDAMENTALES DE MUESTREO
1.1 Distribucin muestral
1.2 Distribucin en el muestreo de la media muestral
2.3 Distribucin en el muestreo de una proporcin muestral

2 UNIDAD DOS: ESTIMACIONES POR INTERVALOS
2.1 Intervalos de confianza
2.2 Intervalos de confianza para la media poblacional
2.3 Intervalos de confianza para proporciones poblacionales
2.4 Intervalos de confianza para la media de dos poblaciones

3 UNIDAD TRES: CONTRASTE DE HIPTESIS
3.1 Concepto del contraste de hiptesis.
3.2 Prueba de hiptesis para la media poblacional
3.3 Prueba de hiptesis para la proporcin poblacional
3.4 Prueba de hiptesis para la diferencia de dos medias poblacionales

4 UNIDAD CUATRO: REGRESIN LINEAL SIMPLE Y MULTIPLE
4.1 Interpretacin de la regresin, terminologa y notacin
4.2 Estimacin por mnimos cuadrados
4.3 Verificacin de hiptesis, capacidad explicativa de una funcin de regresin
lineal.





















1. INTRODUCCIN

Para el administrador de empresas es esencial la compresin de la Estadstica
inferencial dado que los diversos mtodos de estimacin, prediccin y contraste de
hiptesis son las herramientas fundamentales en la toma de decisiones en
condiciones de incertidumbre.

Generalmente las poblaciones suelen ser demasiado grandes para estudiarlas en
su totalidad, por tanto se hace necesario la seleccin de una muestra
representativa que tenga un tamao ms manejable, la cual se utiliza para obtener
conclusiones generalizadas sobre la poblacin. Este tema se aborda en la primera
unidad.

Dada la utilidad de los intervalos de confianza en la toma de decisiones sobre
numerosas situaciones relacionadas con la empresa, en la unidad 2 se explica el
modo de construirlos e interpretarlos.

La unidad 3 desarrolla la forma como determinar la validez de una hiptesis o
conjetura sobre una situacin presentada en el mbito empresarial. En esta unidad
se estudian los contrastes de hiptesis para una o dos poblaciones.

El conocimiento del tipo de funcin que liga a determinadas variables econmicas
permitir descubrir la relacin que existe entre las mismas para ser utilizadas en la
toma de decisiones de poltica econmica o poltica empresarial. Por ello es
importante determinar la forma analtica y concreta de esta relacin recurriendo al
anlisis de regresin, y en especial al de regresin lineal, tema de la ltima unidad
del mdulo.


2. JUSTIFICACIN

La inferencia estadstica, como parte de la Estadstica que comprende los
mtodos y procedimientos para deducir propiedades de una poblacin a partir del
estudio de una parte de sta, es esencial para el administrador de empresas, el
contador y el economista dado que los diversos mtodos de estimacin, prediccin
y contraste de hiptesis son las herramientas fundamentales en la toma de
decisiones en condiciones de incertidumbre, de tal manera que les permita ir ms
all de solo reportar y describir datos.



































3. FORMAS DE ABORDAR LA LECTURA DEL MODULO


Estimado(a) estudiante:

Formarse como profesional en administracin de empresas en un programa a
distancia, requiere dedicacin, responsabilidad y de un buen mtodo de estudio
para cada uno de los mdulos que conforman el pensum acadmico.

Respondiendo a los propsitos del nivel de Estadstica Inferencial, ste mdulo ha
sido diseado para el trabajo auto dirigido, de modo que Usted pueda
responsabilizarse de su propio aprendizaje y enfrentar con xito la formacin
Estadstica requerida por la carrera profesional que ha elegido.

Un aprendizaje afectivo y duradero del Mdulo exige, de su parte:

Mantener una actitud de superacin para que con su esfuerzo personal logre
el desarrollo concienzudo de cada una de las actividades propuestas.

Tener un conocimiento profundo de su CIPAS, consiguiendo as que el
trabajo de equipo adquiera una intencin seria y metdica, para compartir
logros, ampliar experiencias, resolver dudas y afianzar aprendizajes
adquiridos.

Utilizacin adecuada de todos los apoyos institucionales, como el servicio de
tutora, la biblioteca, los materiales y medios audiovisuales, as como la
consulta en Internet,



Con tal propsito le recomendamos el siguiente procedimiento:
1. Realice una lectura atenta de cada una de las unidades, sealando y
anotando las ideas centrales, los conceptos bsicos y sus relaciones.

2. Desarrolle cada actividad, siguiendo las orientaciones que se le dan, sin
omitir ninguna por elemental que le parezca.
3. Una vez termine el desarrollo de los talleres, compare las soluciones con
las obtenidas por sus compaeros de grupo.

4. Anote las dudas e inquietudes para llevarlas al tutor y dems compaeros
en la sesin presencial.

5. Complemente la actividad con la consulta de textos, documentos, revistas,
pginas web, ect. Para fortalecer sus conocimientos sobre los temas
desarrollados en el mdulo.

Con la repeticin de ste procedimiento se pretende que cada uno de Ustedes
construya su propio mtodo de estudio, teniendo claro el tiempo que debe
dedicarle, el lugar de estudio ms adecuado, y la disciplina personal para
cumplir con la distribucin que haga de su tiempo y con los compromisos que
demanda el hecho de ser estudiante a distancia.










4. PROPSITOS DE FORMACIN
Al final del curso el alumno ser capaz de utilizar los mtodos y modelos
estadsticos apropiados para el tratamiento de la informacin numrica
fundamental para la toma de decisiones cuando existan condiciones de
incertidumbre, de formular y solucionar problemas propios de las ciencias
administrativas





















5. REFERENTE TERICO

El Ministerio de Educacin Nacional en su documento serie lineamientos
curriculares (1998) en cumplimiento del artculo 78 de la Ley 115 de 1994
consideran que las matemticas en la escuela tienen un papel esencialmente
instrumental, que por una parte se refleja en el desarrollo de habilidades y
destrezas para resolver problemas de la vida prctica, para usar gilmente el
lenguaje simblico, los procedimientos y algoritmos y, por otra, en el desarrollo del
pensamiento lgico-formal, as como el pensamiento variacional.

Jos Chacn en su libro, Una Introduccin a la Estadstica Inferencial concluye
que sta es necesaria cuando queremos hacer alguna afirmacin sobre ms
elementos de los que vamos a medir. La estadstica inferencial hace que ese salto
de la parte al todo se haga de una manera controlada. Aunque nunca nos ofrece
r seguridad absoluta, s nos ofrecer una respuesta probabilstica. Esto es import
ante: la estadstica no decide; slo ofrece elementos para que el investigador o el
lector decidan. En muchos casos, distintas personas perciben diferentes conclusi
ones de los mismos datos.

Ciro Martinez B, en el libro Estadstica y Muestreo, opina que la estadstica facilita
una serie de instrumentos o tcnicas que, al ser utilizadas correctamente, permiten
determinar el grado de validez y confiabilidad, ya sea en las predicciones o las
conclusiones obtenidas a partir de la muestra.

PAUL NEWBOLD en el libro, Estadstica para los Negocios y la economa, realiza
un estudio completo sobre las distribuciones muestrales, los intervalos de
confianza, las pruebas de hiptesis y la regresin lineal; temas del presente
modulo

Mohammed A. Shayib, en el libro, Applied Statistics, aporta en otro idioma un
estudio completo sobre los temas tratados, as como algunos problemas de
aplicacin.


6. ESTRUCTURA DEL MODULO



ESTADSTICA
INFERENCIAL
DISTRIBUCIONES
FUNDAMENTALES DE
MUESTREO
Distribucin en el
muestreo de la media
muestral
Distribucin en el
muestreo de una
proporcin muestral
ESTIMACIONES POR
INTERVALOS
Intervalos de confianza
para la media
poblacional
Intervalos de confianza
para la proporcin
poblacional
Intervalos de confianza
para la diferencia de
media de dos
poblaciones
CONTRASTE DE
HIPTESIS
Prueba de hiptesis para
la media poblacional
Prueba de hiptesis para
la proporcin
poblacional
Prueba de hiptesis para
la difrencia de media de
dos poblacioones
REGRESIN LINEAL
SIMPLE
Estimacin por mnimos
cuadrados
Verificacin de hiptesis
y capacidad explicativa
de una funcin de
regresin lineal.


7. COMPETECIAS TRANSVERSALES A DESARROLLAR

Competencias del Saber

Comprende las distribuciones mustrales de medias y proporciones.

Interpreta intervalos de confianza para le media y para proporciones
poblacionales.

Comprende el contraste de hiptesis para la media y proporcin poblacional.

Comprende el mtodo de los mnimos cuadrados para determinar la
ecuacin de regresin lineal.


Competencias del Saber Hacer

Aplica las distribuciones mustrales de medias y proporciones en
situaciones concretas de la Administracin, para el clculo de
probabilidades

Estima intervalos de confianza para le media y para proporciones
poblacionales.

Formula y contrasta hiptesis en situaciones especficas de la
Administracin, tanto para la media muestral como para proporciones

Utilizar el mtodo de mnimos cuadrados ordinarios, para la estimacin de
parmetros del modelo de regresin en dos variables y establecer
inferencias a cerca de estos.














http://es.wikipedia.org/wiki/Distribuci%C3%B3n_normal













PRESENTACION

La rama de la estadstica dedicada a la inferencia trata bsicamente con las
generalizaciones y predicciones, por ejemplo, se puede estar interesado en
averiguar acerca de la media o varianza de la distribucin poblacional de las
rentas familiares en una ciudad de la Costa Atlntica, o sobre la proporcin de
familias de esta ciudad que tienen unos ingresos inferiores a $450.000.

Para hacer este tipo de afirmaciones las poblaciones suelen ser demasiado
grandes para estudiarlas en su totalidad, por lo tanto se hace necesario elegir una
muestra representativa que tenga un tamao ms manejable, sobre la base de la
informacin muestral; nuestro objetivo ser hacer inferencia acerca de la poblacin
de la que procede la muestra.

PREGUNTA PROBLEMA
Cmo se puede aplicar las distribuciones muestrales en la solucin de situaciones
concretas de una empresa?

COMPETENCIAS ESPECFICAS


SABERES
- Distribucin muestral
- Distribucin en el muestreo de la media muestral
- Distribucin en el muestreo de una proporcin muestral

1. Define que es una distribucin muestral.
2. Utiliza informacin para crear una distribucin muestral.
3. Aplica las distribuciones mustrales de medias y proporciones para el
clculo de probabilidades en situaciones concretas de empresas


DINMICA PARA CONSTRUIR EL CONOCIMIENTO
ACTIVIDAD PREVIA (Trabajo Individual)

Supongamos una poblacin de 6 familias cuyos gastos mensuales en educacin,
en miles de pesos, son: 120, 100, 90, 95, 115, 110.
Con base en esta informacin responde:
1. Cuantas muestras diferentes de 3 familias pueden obtenerse?
2. Cuantas muestras diferentes de 4 familias pueden obtenerse?
3. La media muestral del gasto es igual para cada muestra?
4. La media de las medias muestrales es igual para las muestras de tres familias
que para las de cuatro?
5. La media para la poblacin es igual a la media de las medias muestrales para
las muestras de tres familias o para las de cuatro familia.
6. La desviacin estndar de la media de medias es igual para cualquier tamao
de muestra?
7. La desviacin estndar de la media de medias muestrales es igual a la de la
poblacin?

ACTIVIDAD GRUPAL

1 Socialice los resultados obtenidos individualmente y escriba sus conclusiones
al respecto.
2 Justifique el uso del factor de correccin para poblaciones finitas al calcular el
error tpico.
3 Haga un listado de las dudas e inquietudes presentadas en la socializacin de
las actividades anteriores.




SABERES Y ACTIVIDADES
1 DISTRIBUCIONES MUESTRALES

1.1 DISTRIBUCION MUESTRAL

Quienes toman decisiones lo hacen con solo tomar una muestra.Por ejemplo,
considrese un fabricante que desea saber los tiempos que requieren en promedio
los trabajadores para terminar un trabajo dado, o la cantidad promedio de
combustible necesario para enviar un camin a cierta distancia, o la edad
promedio de quienes utilizan un producto, o la porcin de mercado para un
producto, o el porcentaje de unidades defectuosas en un lote de produccin o
sobre la proporcin de personas que ven un determinado programa de televisin.

En todos estos casos el estadstico est interesado en saber algo sobre una
poblacin estadstica. A falta de un censo, el conocimiento deseado sobre
parmetros como la media de la poblacin ( ), la desviacin estndar de la
poblacin (o ) o la proporcin de una poblacin (t ), slo se puede adquirir si se
saca una muestra representativa de la poblacin, se calcula los estadsticos como
la media muestral ( X ), la desviacin estndar (S) o la proporcin muestral (P), y
se hace inferencia sobre los parmetros a partir del ellos. El proceso de inferir los
valores de parmetros desconocidos de una poblacin, a partir del estadstico de
una muestra conocida se denomina estimacin.

Para comprender la naturaleza de una estimacin estadstica es necesario
entender bien el concepto de la distribucin muestral, sta proporciona un enlace
importante entre la muestra individual que por lo general se toma y la poblacin
sobre la cual se hace inferencia. Es importante distinguir entre las caractersticas
poblacionales y sus correspondientes cantidades mustrales, por ejemplo la media
( ), que es un atributo de la poblacin, es un nmero fijo desconocido. Para hacer
inferencia sobre tal atributo, se extrae una muestra de la poblacin y se calcula la


media muestral. Dado que para cada muestra que se extraiga se
obtendr,posiblemente, un valor diferente de la media, se puede pensar en esta
cantidad como una variable aleatoria con una cierta distribucin de probabilidad.
La distribucin de probabilidad de los posibles resultados mustrales
proporcionan una base para realizar inferencia sobre la poblacin.

Para ilustrar el concepto consideremos que de una gran empresa que tiene 300
empleados se desea tomar una muestra, por ejemplo de 25 empleados, y a partir
de esta muestra calcular el salario medio, y la proporcin P, de hombres que
laboran en la empresa. Esta media muestral sirve despus como estimacin de ,
media aritmtica del salario de los 300 trabajadores.

Como es posible extraer
36
25 300
10 95 , 1 x C = muestras diferentes de tamao 25, para
hacer ms didctico el ejemplo, supngase que se tiene una poblacin de N=5
empleados cuyo salario y sexo se muestran a continuacin:

TABLA 1.1 Poblacin hipottica de salarios y sexo de empleados.
EMPLEADO SALARIO MENSUAL
( Miles de peso)
SEXO
Alejandro 400 M
Berena 300 F
Carlos 350 M
Sandra 500 F
Eliecer 450 M




Con esta informacin completa al alcance es fcil calcular las medidas de
resumen de dicha poblacin como es el salario mensual medio ( ), junto con su
varianza (
2
o ) y desviacin estndar (o ), as como la proporcin de hombres (
h
t ) en las filas de empleados.
Medidas de resumen:
a). Salario. b) Sexo.
400
5
2000
= = =

N
x
6 , 0
5
3
= =
h
t (Proporcin de hombres)
5000
) (
2
2
=

N
x
o ,
71 , 70 5000 = = o


Supngase que no se dispone de esta informacin tipo censo, por lo tanto se
decide hacer la estimacin con una muestra aleatoria de n = 3 empleados con el
fin de estimar los parmetros desconocidos, entonces se elige al azar una de las
muestras posibles, (vase tabla 1.2), por ejemplo, la muestra conformada por los
empleados: Berena, Sandra, Eliecer. (B,S,E) con los cuales se tiene que:

=
416.666 pesos, da una estimacin del salario mensual medio de 416.666 pesos y
una proporcin de hombres en la empresa del 33.3%.







TABLA 1.2 Estimaciones para cada una de las muestras seleccionadas










Si se supone que la probabilidad de elegir cualquier muestra es la misma, la
probabilidad de elegir una muestra que d una de 350 mil es:(

3 5
C


Como = 400 mil, la probabilidad de elegir al azar una muestra que de una
estimacin exacta de es solamente de: (



8 de las 10 muestra darn por resultado una cantidad errnea en el proceso de
estimacin de . Esta cantidad se llama ERROR MUESTRAL, y es la diferencia
entre y la media muestral que se utiliz para estimarla. La diferencia se debe al
azar; si el azar dicta que se extraigan unas cuantas observaciones muy grandes,
la media aritmtica dar estimaciones excesivas de , por ejemplo: Si por azar
sucede que se elija la muestra 9 en la tabla 1.2, la estimacin de sera

Nmero de la
muestra
Unidades en la
muestra
Media muestral (

)
(miles de pesos)
Proporcion de
hombres (P
h
)
1
2
3
4
5
6
7
8
9
10
ABC
ABS
ABE
ACS
ACE
ASE
BCS
BCE
BSE
CSE
350
400
383,333
416,667
400
450
383,333
366,667
416,667
433,333
2/3
1/3
2/3
2/3
3/3
2/3
1/3
2/3
1/3
2/3


que es superior al valor de la media aritmtica en la poblacin, si por el
contrario el azar hace que se extraiga la muestra 1, la muestra dar una
estimacin insuficiente de (

)

ERROR MUESTRAL: Es la diferencia entre el parmetro y el estadstico de la
muestra utilizado para estimarlo.

Es evidente que nunca se podr calcular el tamao real del error muestral, puesto
que la media poblacional sigue siendo desconocida, pero hay que ser consciente
de la probabilidad de incurrir en este error.

Con una poblacin de N = 5 se puede listar todas las medias mustrales posibles,
junto con su probabilidad. Dicha lista se llama DISTRIBUCIN MUSTRAL y se
refleja en la tabla 1.3

TABLA 1.3 Distribucin muestral de la media
Media Muestral Nmero de muestras que Poseen Probabilidad
350
366,667
383,333
400
416,667
433,333
450
1
1
2
2
2
1
1
1/10
1/10
2/10
2/10
2/10
1/10
1/10



Una posible interpretacin de la tabla 1.3 es: Si han de seleccionarse, por ejemplo
1.000 muestras aleatorias simples de tamao n=3, de la poblacin de N = 5,
podra esperarse calcular 100 veces un salario medio de 350 mil pesos o 200
veces un salario medio de 400 mil pesos.

ESTADIGRAFOS Y DISTRBUCION MUESTRAL
Supongamos que se ha extrado una muestra aleatoria de una poblacin y
que se desea hacer inferencia sobre ciertas caractersticas de la distribucin
de la poblacin, esta inferencia est basada en algn estadgrafo, es decir,
alguna funcin particular de la informacin muestral. La lista de todos los
valores posibles de un estadstico y la probabilidad asociada a cada valor se
denomina distribucin muestral.


1.2 DISTRIBUCION EN EL MUESTREO DE LA MEDIA MUESTRAL

Supngase que se ha extrado una muestra de n observaciones de una poblacin
con una media y varianza
2
o , si se representan los elementos de la muestra por

, antes de que la muestra haya sido seleccionada, habr


incertidumbre sobre los resultados. Esta incertidumbre es consecuencia del hecho
de que cada uno de los miembros de la muestra es una variable aleatoria con
media

y varianza
2
x
o . Si el inters es hacer inferencia sobre la media
poblacional, un punto de partida es el promedio de los valores mustrales, es
decir, el anlisis de la distribucin muestral de la variable aleatoria

.



En primer lugar se determina la media de esta distribucin. Como para variables
aleatorias discretas y continuas, la esperanza matemtica de una suma es la
suma de las esperanzas matemticas, se tiene que:(

) (

)
(

) (

)y como cada variable aleatoria

tiene media

, entonces,
(


Pero la media muestral es la suma de los valores de la muestra multiplicada por
1/n, por lo tanto, (

) (


En consecuencia, la media de la distribucin en el muestreo de la media muestral
es la media poblacional
(

)
Esto quiere decir, que la media de las medias mustrales, conocida como la media
general, es igual a la media poblacional.

, K numero de muestras
ACTIVIDAD: Verifica estos valores con los datos de la tabla 1.3

1.2.1 ERROR TIPICO DE LA DISTRIBUCION MUESTRAL DE MEDIAS

La distribucin muestral de las medias mustrales tienen tambin una varianza.
Esta varianza de la distribucin de todas las medias mustrales mide la dispersin
de las observaciones individuales (medias mustrales) en torno a su media (media
general). Se calcula como cualquier otra varianza, es la media aritmtica de los
cuadrados de las desviaciones respecto a la media. Es decir, si

es la varianza


de la distribucin muestral de las medias mustrales, entonces:

,Knmero de muestras.
Con los salarios de los 5 ejecutivos del ejemplo se tiene:

( )

()

( )

( )

( )

( )

( )


Pesos al cuadrado.
Si se extrae la raz cuadrada de la varianza de la distribucin de estas medias
mustrales se tiene el error tpico de la distribucin muestral.
Error tpico de la distribucin muestral en medias mustrales.



Para el ejemplo:

pesos
ERROR TIPICO: Es la medida de la variacin de las medias mustrales en
torno a la media general. Por tanto, mide la tendencia a incurrir en error de
muestreo en el intento de estimar el parmetro.

Si el tamao de la poblacin es muy grande con respecto al tamao muestral,
entonces, una consecuencia del muestreo aleatorio simple es que la distribucin
de cada uno de los valores de la muestra es independiente de la de los otros, en
tal caso la varianza de la suma es la suma de las varianzas y por tanto:
(

) (

) (

) (

) (

)
Como cada

tiene varianza

, entonces: (




Luego (

) (


Esto implica que la varianza de la distribucin muestral de

decrece a medida
que aumenta el tamao de la muestra. As, cuantas ms observaciones tenga la
muestra, ms concentrada estar la distribucin muestral de la media muestral
alrededor de la media poblacional. En otras palabras cuanto mayor sea la
muestra, ms segura ser nuestra inferencia acerca de la media poblacional.

Se puede encontrar una aproximacin suficiente de la varianza y del error tpico
con mucha ms facilidad mediante las expresiones:


Es evidente que estos formatos suponen conocer la varianza de la poblacin.

1.2.2 ERROR TIPICO Y NORMALIDAD.

Si los datos de una poblacin siguen una distribucin normal, la distribucin
muestral de las medias mustrales tambin ser normal, es decir, si de una
poblacin que sigue una distribucin normal se toman todas las muestras posibles
de tamao determinado y despus se calculan las medias de todas esas
muestras, las medias mustrales seguirn una distribucin normal.

Supngase que se tienen los ingresos de varios millares de estudiantes que dan
una media de 500 mil pesos y que dichos ingresos siguen una distribucin normal.
Si se eligen todas las muestras de tamao n de esa poblacin normal de ingreso
de los estudiantes, la distribucin muestral de las medias mustrales tambin ser
normal.





Como el error tpico de la media muestral es

, entonces,


Esto quiere decir que las

estn menos dispersas que los datos originales.



De la expresin

tambin se puede concluir que a medida que aumenta el


tamao de la muestra el error tpico ser menor.

1.3 TEOREMA CENTRAL DEL LMITE


Una distribucin de medias mustrales sigue una distribucin normal si las
muestras se toman de una poblacin normal, pero en muchos casos la poblacin
no sigue una distribucin normal, entonces debemos recurrir al teorema central del
lmite. Esta proposicin esencial afirma que para cualquier poblacin sea normal o
no, la distribucin de las medias muestralesse aproximar a la normalidad si el
tamao de la nuestra es grande, (n30)
TEOREMA CENTRAL DEL LIMITE: Para una poblacin con media y
desviacin tpica a medida que el tamao de la muestra n aumenta, la
distribucin muestral de medias mustrales se aproxima a una distribucin
normal con




1. 4 FACTOR DE CORRECCION CON POBLACIONES FINITAS.

El teorema central del lmite y la hiptesis de una distribucin normal de las
medias mustrales slo se aplica si el muestreo se realiza con remplazamiento o
la extraccin se hace de una poblacin infinita. Si la poblacin es finita y el nmero
n de miembros de la muestra no es una fraccin muy pequea del nmero N
(supera el 10%) de la poblacin, no se puede asumir que los valores individuales
de la muestra se distribuyan independientemente. Si la extraccin se hace sin
sustitucin el proceso de muestreo queda alterado, la probabilidad de elegir un
elemento dado en cualquier extraccin depende de la seleccin previa realizada
anteriormente.

Si se quiere compensar esta modificacin de probabilidades es preciso utilizar el
factor de correccin para poblaciones finitas al calcular el error tpico. En concreto,


se deduce que si la extraccin se hace sin sustitucin de una poblacin finita, la
varianza es:

+ *

+ [

]
EJEMPLO 1.1
La oficina del DANE desea estimar el ndice de natalidad por 100.000 habitantes
en las 100 localidades ms grandes del pas. Se sabe que la desviacin tpica de
los ndices de natalidad de estos 100 centros urbanos es de 12 nacimientos por
cada 100.000 habitantes.
a. Calcular la varianza y la desviacin tpica de la distribucin muestral de n = 8
localidades.
b. Calcular la varianza y la desviacin tpica de la distribucin muestral de n= 15
localidades.

SOLUCION:

a. Como la fraccin

se puede considerar pequea, no se necesita el


factor de correccin. La varianza y el error tpico son:

()



b. Como

, no es una fraccin pequea (mayor que el 10%) es preciso


aplicar el factor de correccin, por tanto, La varianza y el error tpico son:

+ *

+ *
()

+ *

+ y

+ [

]







1.5 DISTRIBUCIN EN EL MUESTREO DE UNA PROPORCIN
MUESTRAL

Si se repite un experimento que tiene probabilidad de xito , entonces la variable
aleatoria X , que recoge el nmero total de xitos en n repeticiones, sigue una
distribucin binomial. Un problema comn consiste en que el parmetro sea
desconocido. Por ejemplo: una corporacin financiera interesada en determinar
cul es la proporcin de clientes que pagan puntualmente sus obligaciones
crediticias o un gerente interesado en la proporcin de artculos defectuosos que
se producen en un turno determinado en una factora. En situaciones de este tipo
es natural basar nuestra inferencia en la proporcin de xitos en una muestra
tomada de la poblacin que nos interese.
PROPORCION MUESTRAL
Sea X el nmero de xitos en una muestra binomial, de n observaciones,
donde la probabilidad de xito es , entonces, la proporcin de xito en la
muestra

Recibe el nombre de proporcin muestral.



La media y la varianza de la distribucin muestral de la proporcin muestral puede
deducirse fcilmente a partir de la media y la varianza del nmero de xitos que
viene dado por: () y () ( ), luego:(

) (

()

.Es decir, la media de la proporcin muestral es la proporcin


de xitos en la poblacin.


Su varianza es :(

) (

()
()


La desviacin tpica de la proporcin muestral, es la raz cuadrada de la varianza
y recibe el nombre de error estndar y est dada por:


()


Se utiliza el factor de correccin si la proporcin de la muestra con respecto a la
poblacin

supera el 10%. En tal caso la desviacin tpica de la distribucin de


proporciones muestrales queda:


()



Si se resta a la proporcin muestral su media y se divide por el error estndar,
se obtiene una variable aleatoria con distribucin normal estndar.



1.6 APLICACIONES DE LAS DISTRIBUCIONES MUSTRALES.

La importancia de las distribuciones mustrales estriba en que muchas decisiones
se toman a partir de resultados mustrales, por ejemplo:

- El director de una empresa elige una muestra de un producto para determinar
si se cumplen determinadas especificaciones de produccin.
- Un organismo oficial toma una muestra de vecinos de una poblacin para
decidir si un determinado programa de Bienestar producir los resultados
deseados.


- El gerente de una compaa de seguro elige una muestra para determinar la
proporcin de clientes que utilizan el seguro por accidente de sus vehculos.

Una aplicacin muy corriente de la distribucin muestral es determinar la
probabilidad de que la media de una muestra caiga dentro de un intervalo
determinado. Puesto que la distribucin muestral seguir una distribucin normal
porque: 1. La muestra se toma de una poblacin normal y 2. El teorema Central
del Lmite garantiza la normalidad si se seleccionan muestras grandes, y adems,
muchas decisiones empresariales dependen de una muestra completa y no solo
de una observacin, entonces la frmula de transformacin ha de ser modificada
para que se tenga en cuenta que no estamos interesados en una observacin X
sino en la media

y la frmula Z se convierte en:




Variable tipificada de la distribucin muestral.



EJEMPLO 1.2
La desviacin tpica de las compras realizadas por los clientes de una tienda
concreta es de 18 dlares. Si se toma una muestra al azar de 100 consumidores.
a. Cul es el error tpico de la distribucin muestral?
b. Cul es la probabilidad de que la media muestral supere la media poblacional
en ms de 5 dlares?

SOLUCION:
a.




b. Como la diferencia entre

se establece en

se tiene:

o un rea de 0,4973.
Luego:(

) ( )
Es decir, la probabilidad de que la media muestral supere la media poblacionalen
ms de 5 dlares es de 0,27%
EJEMPLO 1.3

La duracin de las bombillas producidas por un cierto fabricante tiene una media
de 1.200 horas y una desviacin tpica de 400 horas. La poblacin sigue una
distribucin normal. Suponga que se han comprado 49 bombillas que pueden ser
consideradas como una muestra aleatoria de la produccin del fabricante.
a. Cul es la media de la media muestral de la duracin de estas bombillas?
b. Cul es la varianza de la media muestral?
c. Cul es el error estndar de la media muestral?
d. Cul es la probabilidad de que el tiempo medio de la duracin de las 49
bombillas sea de menos a 1050 horas?

SOLUCIN:

a. Como


b.


c.


d. Se calcula el valor de Z as:


La probabilidad pedida es :(

) ( )




La probabilidad que una variable aleatoria sea menor que -2,63 segn la tabla 1
del apndice es: 0,5 0,4957 = 0,0043, luego la probabilidad de que el tiempo
medio de duracin de las 49 bombillas sea menor de 1.050 horas es del 0,43%.

EJEMPLO 1.4

En un curso de administracin de empresas hay 250 estudiantes. Cada uno de los
integrantes de una muestra aleatoria de 50 estudiantes es interrogado con el fin de
estimar la cantidad de tiempo que gasta semanalmente en resolver los problemas
de estadsticas. Supngase que la desviacin tpica de la poblacin es de 30
minutos.
a. Cul es la probabilidad de que la media muestral exceda a la media
poblacional en ms de 2,5 minutos?
b. Cul es la probabilidad de que la media muestral este ms de 5 minutos por
debajo de la media poblacional?
c. Cul es la probabilidad de que la media muestral difiera de la media
poblacional en ms de 10 minutos?

SOLUCIN:


a. Como la diferencia entre

se establece en

y adems la fraccin

, entonces se debe utilizar el factor de correccin para


poblaciones finitas en el clculo el error estndar, es decir:

]

Luego: (

) (

( )
La probabilidad de que la media muestral exceda a la media poblacional en ms
de 2,5 minutos es del 25,46%

b. La expresin que la media muestral este ms de 5 minutos por debajo de la
media poblacional se puede escribir como

:
Luego: (

) (

) ( )
La probabilidad de que la media muestraleste ms de 5 minutos por debajo de la
media poblacional es de 9,51%

c. La expresin que la media muestral difiera de la media poblacional en ms de
10 minutos se puede escribir as:


Luego la probabilidad de que la media muestral difiera en mas de 10 minutos de la
media poblacional est dada por:
(

) ( ) ()






EJEMPLO 1.5

Una empresa empacadora de cereales asegura que la media del peso que
contienen las cajas de estos cereales es de 200 gramos y sus desviacin tpica de
6 gramos. La distribucin en los pesos es normal. Se eligen 4 cajas que pueden
ser consideradas como una muestra aleatoria del total de la produccin.
a. Cul es el error estndar de la media muestral del peso de estas 4 cajas?
b. Cul es la probabilidad de que, como media, el peso de estas 4 cajas sea
menor que 197 gramos?
c. Cul es la probabilidad de que, como media, el peso de estas 4 cajas sea
mayor que 206 gramos?
d. Cul es la probabilidad de que, como media, el peso de estas cuatro cajas
este entre 195 y 205 gramos?

SOLUCION:
a.




b. Se calcula el valor de Z:


Luego: (

) ( )
La probabilidad pedida es del 15,87%.
c. Se calcula el valor de Z:


Luego: (

) ( )
La probabilidad pedida es del 2,28%
Ahora se pide calcular (

) ( ) ()
EJEMPLO 1.6
El dueo de una tienda de discos ha comprobado que el 20% de los clientes que
entran a su tienda realizan alguna compra. Un da entran a la tienda 180 personas,
que pueden ser considerados como una muestra aleatoria de todos los clientes:
a. Cul ser la media de la proporcin muestral de clientes que realizaron
alguna compra?
b. Cul es la varianza de la proporcin muestral?
c. Cul es el error estndar de la proporcin muestral?
d. Cul es la probabilidad de que la proporcin muestral sea menor que 0,15?

SOLUCION:
a. (

) (

)
b. La distribucin muestral de

tiene varianza

( )

( )


El error muestral de la distribucin de

es:


()

=0,0298


c. La variable tipificada es:


Por lo tanto (

) ( ) (ver grafica)
La probabilidad de que la proporcin muestral sea menor que 0,15 es de 4,75%


EJEMPLO 1.7
Un proceso industrial genera el 8% de unidades defectuosas. Usted compra 100
unidades, cual es la probabilidad de que sean defectuosas menos del 10%.

SOLUCION:

( )

) ( )



La probabilidad de que sean defectuosos menos del 10% es del 77%.

EJEMPLO 1.8
Un proceso de produccin en curso produce un 10% de artculos defectuosos. Un
inspector de calidad toma una muestra aleatoria simple de 70 artculos y
rechazar toda la produccin si ms de un 5% de la muestra est defectuosa.
Cul es la probabilidad de rechazo?
SOLUCION:

( )

) ( )
La probabilidad de que sea rechazada toda la produccin es del 91,77%
Consulte las siguientes pginas en intenet:

http://ftp.utalca.cl/profesores/gicaza/Clases/7Distribuciones%20Muestrales.pdf
http://www.geociencias.unam.mx/~ramon/EstInf/Clase4.pdf
http://www.educatina.com/matematicas/probabilidad-y-estadistica/estadistica/poblacion-
estadistica/diferencias-en-la-distribucion-de-medias-muestrales-video



1.5 RESUMEN

La DISTRIBUCIN MUESTRAL proporciona un enlace importante entre la
muestra individual que por lo general se toma y la poblacin sobre la cual se hace
inferencia y se define como La lista de todos los valores posibles de un
estadstico y la probabilidad asociada a cada valor.

ERROR MUESTRAL: Es la diferencia entre el parmetro y el estadstico de la
muestra utilizado para estimarlo.

ERROR TIPICO: Es la medida de la variacin de las medias mustrales en torno a
la media general. Por tanto, mide la tendencia a incurrir en error de muestreo en el
intento de estimar el parmetro y est dado por



TEOREMA CENTRAL DEL LIMITE: A medida que el tamao de la muestra n
aumenta, la distribucin muestral de medias mustrales se aproxima a una
distribucin normal con



Si la poblacin es finita y el nmero n de miembros de la muestra no es una
fraccin muy pequea del nmero N de la poblacin, no se puede asumir que los
valores individuales de la muestra se distribuyan independientemente, la
probabilidad de elegir un elemento dado en cualquier extraccin depende de la
seleccin previa realizada anteriormente. Para compensar esta modificacin de
probabilidades es preciso utilizar el factor de correccin para poblaciones finitas al


calcular la varianza y el error tpico. Si la extraccin se hace sin sustitucin de una
poblacin finita, la varianza es:

+ *

+ [

]
PROPORCION MUESTRAL: Sea X el nmero de xitos en una muestra binomial,
de n observaciones, donde la probabilidad de xito es entonces, la proporcin
de xito en la muestra

, Recibe el nombre de proporcin muestral.


La media y la varianza de la distribucin muestral de
lasproporcionesmuestralesestn dadas por:
(

) (

)
()


La desviacin tpica de la proporcin muestral, es la raz cuadrada de la varianza y
recibe el nombre de error estndar.


()


()

si

Variable tipificada de la distribucin muestral de medias.


Variable tipificada de la proporcin muestral.










1. Los gastos semanales (en dlares) en publicidad hechos por N = 5
competidores se indican en la siguiente tabla. Establezca la distribucin
muestral para el promedio de gastos, para una muestra aleatoria simple de 3
competidores.
COMPETIDOR DOLRES
A 100
B 92
C 118
D 70
E 135

2. Un banco reporta que la poblacin de sus saldos de depsito a la vista estn
normalmente distribuidos con una media de 1.200 y una desviacin estndar
de 250. Un auditor rechaza certificar el reporte del banco y toma una muestra
aleatoria de 36 estados de cuentas. El certificar el reporte solo si la media
muestral se encuentra a 50 dlares de la supuesta media poblacional. Cul
es la probabilidad de dicho hallazgo?

3. Una fbrica produce pistones cuyos dimetros se encuentran adecuadamente
clasificados por una distribucin normal con un dimetro promedio de 20
centmetros y una desviacin estndar igual a 0,004 centmetros. Para que un
pistn sirva, su dimetro debe encontrarse entre 4,998 y 5,002 centmetros. Si
el dimetro del pistn es menor que 4,998 se desecha; si es mayor que 5,002
el pistn puede reprocesarse. Se selecciona una muestra de 8 pistones. Qu
porcentaje ser desechado? Qu porcentaje ser reprocesado?


4. Cuando un cierto proceso de produccin est funcionando correctamente,
la resistencia en ohmios de los componentes producidos sigue una distribucin
normal con media 92 y desviacin tpica 3,6. Se toma una muestra aleatoria de
cuatro componentes

a. Hallar la media de la distribucin muestral de la media muestral de la
resistencia.
b. Hallar la varianza de la media muestral.
c. Hallar el error estndar de la media muestral
d. Cul es la probabilidad de que la media muestral resulte ser mayor que 93
ohmios.

5. Supongamos que la desviacin tpica de la cuota pagada mensualmente por
los estudiantes de cierta ciudad americana es de 40 dlares. Se toma una
muestra de 100 estudiantes con el fin de estimar la renta media pagada
mensualmente por el total de la poblacin de estudiantes.

a. Cul ser el error estndar de la media muestral de la cuota mensual?
b. Cul es la probabilidad de que la media muestral exceda a la media
poblacional en ms de cinco dlares?
c. Cul es la probabilidad de que la media muestral este ms de 4 dlares por
debajo de la media poblacional?
d. Cul es la probabilidad de que la media muestral difiera de la media
poblacional en ms de tres dlares

6. Una compaa quiere estimar la proporcin de personas que son posibles
compradores de afeitadoras elctricas y que ven los partidos de ftbol del
campeonato nacional. Se toma una muestra de 120 individuos que se
identificaron como posibles compradores de afeitadoras elctricas.Suponga


que la proporcin de posibles compradores de afeitadoras elctricas en la
poblacin que ven las transmisiones es del25%.

a. 0.10 es la probabilidad de que la proporcin muestral exceda a la proporcin
poblacional en qu valor?
b. 0,05 es la probabilidad de que la proporcin muestral este por debajo de la
proporcin poblacional en qu cantidad?
c. 0,30 es la probabilidad de que la proporcin muestral difiera de la proporcin
poblacional en qu cantidad?

7. Una fbrica tiene a 439 obreros contratados. De ellos 239 estn preocupados
sobre sus futuras pensiones. Se toma una muestra de 80 obreros y se les
interroga con el fin de estimar la proporcin de la poblacin que est
preocupada sobre el futuro de su pensin.

a. Cul ser el error estndar de la proporcin muestral de obreros
preocupados?
b. Cul es la probabilidad de que la proporcin muestral sea menor que 0.5?
c. Cul es la probabilidad de que la proporcin muestral se encuentre entre 0.5
y 0,6?

8. El incremento porcentual del salario de los directores ejecutivos de medianas
corporaciones sigue una distribucin normal con una media del 12.2% y una
desviacin tpica del 3.6%. Se toma una muestra aleatoria de 81 de estos
directores ejecutivos. Cul es la probabilidad de que, en promedio, los
individuos de la muestra tengan incrementos salariales menores del 10%?

9. Un proceso de fabricacin produce unidades de longitud media igual a 10
pulgadas, con una desviacin tpica de 3.2 pulgadas. Si solo se pueden utilizar


unidades que midan entre 9.5 y 10.5 pulgadas, cuntas de las muestras de la
muestra de 100 habr que desechar?

10. El alcalde una ciudad de 950 vecinos piensa que la renta media de stos es de
por lo menos $625.000, con una desviacin tpica de $85.900. Si se toma una
muestra aleatoria de 150 personas. Cul es la probabilidad de la renta media
de estos sea mayor que $640.000?

11. La desviacin tpica del tiempo empleado para formar a un trabajador en la
realizacin de una tarea es de 40 minutos. Se toma una muestra aleatoria de
64 trabajadores:

1. Cul es la probabilidad de que la media muestral supere a la media
poblacional en ms de 5 minutos?
a. Cul es la probabilidad de que la media muestral sea inferior en
b. Cul es la probabilidad de que la media muestral sea inferior en mas de 4
minutos a la media poblacional.
c. Cul es la probabilidad de que la media muestral difiera de la media
poblacional en ms de 3 minutos?

12. Una compaa farmacutica sabe que un 5% de todos los usuarios de cierto
medicamento experimentan graves efectos colaterales. Si se examina una
muestra aleatoria simple de 120 usuarios, calcule cul es la probabilidad de
hallar:
a. Qu no hay efectos colaterales.
b. Entre 5 y 10 casos con efectos colaterales.
c. Ms de 10 casos con efectos colaterales.

http://www.educandus.cl/estadistica/ejercicios/bases_teoricas/Distribucion/ResueltosDistribucio
nesMuestrales.pdf


Con base en la informacin responda las preguntas 1 a 4

Supongamos que la desviacin tpica de la cuota pagada mensualmente por los
estudiantes de cierta ciudad americana es de 40 dlares y se toma una muestra
de 100 estudiantes con el fin de estimar la renta media pagada mensualmente
por el total de la poblacin de estudiantes.

1. El error estndar, en dlares, de la media muestral de la cuota mensual es:
A. 0,40 B. 40,0 C. 4,00 D. 400

2. La probabilidad de que la media muestral exceda a la media poblacional
en ms de cinco dlares es:
A. 0,1056 B. 0,3944 C. 0,50 D. 0,8944

3. La probabilidad de que la media muestral este ms de 4 dlares por debajo
de la media poblacional es:
A. 0,3413 B. 0,8413 C. 0,1587 D. 0,1857

4. La probabilidad de que la media muestral difiera de la media poblacional en
ms de tres dlares es:
A. 54,68% B. 77,34% C. 45,32% D. 27,34%
Con base en la informacin responda las preguntas 5 a 8



En un curso de administracin de empresas hay 250 estudiantes. Cada uno de
los integrantes de una muestra aleatoria de 50 estudiantes es interrogado con el
fin de estimar la cantidad de tiempo que gasta semanalmente en resolver los
problemas de estadsticas. Supngase que la desviacin tpica de la poblacin es
de 30 minutos

5. El error estndar, minutos, de la media muestral del tiempo que se gasta
semanalmente en resolver los problemas de estadsticas, es:
A. 3,80 B.4,24 C.0,60 D.9,13

6. La probabilidad de que la media muestral exceda a la media poblacional en
ms de 2,5 minutos es:
A. 74,54% B. 24,54% C. 30,85% D. 25,46%

7. La probabilidad de que la media muestral este ms de 5 minutos por debajo
de la media poblacional es:
A. 0,8413 B. 0,0934 C. 0,1857 D. 0,1587

8. La probabilidad de que la media muestral difiera de la media poblacional en
ms de 7 minutos es:
A. 0,0658 B. 0,8384 C. 0,0808 D. 0,9192
















PRESENTACION
0
5
10
15
20
25
30
35
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22



Se estudi anteriormente la estimacin de un parmetro desconocido de la
poblacin, es decir, el clculo de un nico nmero que fuera una buena
aproximacin para dicho parmetro. En la gran mayora de los casos prcticos, un
estimador puntual por si solo no es adecuado. Por ejemplo, supongamos que un
control realizado sobre una muestra aleatoria de piezas procedentes de un gran
lote de produccin nos lleva a estimar que un 10% de todas las piezas son
defectuosas. Un gerente que se enfrente a este dato posiblemente se har
preguntas del tipo: puedo estar totalmente seguro de que el verdadero porcentaje
de piezas defectuosas est entre el 5% y el 15%? o es muy posible que entre el
8% y el 12% de las piezas sean defectuosas? Esta clase de preguntas va ms
all de la contenida en una simple estimacin puntual; son preguntas que buscan
conocer la fiabilidad de dicho estimador. En otras palabras se trata de la
bsqueda de un estimador por intervalos, un rango de valores entre los que
posiblemente se encuentre la cantidad que se estima.

PREGUNTA PROBLEMA
Cmo se pueden aplicar los intervalos de confianza en la toma de decisiones
empresariales?


COMPETENCIAS ESPECFICAS

1. Estima e interpreta intervalos de confianza para la media poblacional

2. Estima e interpreta intervalos de confianza para la proporcin poblacional

3. Estima e interpreta intervalos de confianza para la diferencia de dos media
poblacionales



SABERES


- Intervalos de confianza
- Intervalos de confianza para la media poblacional
- Intervalos de confianza para proporciones poblacionales
- Intervalos de confianza para la diferencia de media de dos poblaciones


DINMICA PARA CONSTRUIR EL CONOCIMIENTO

ACTIVIDAD PREVIA (Trabajo Individual)

. Clasifica los siguientes intervalos en Abiertos, Cerrados o semi abierto:

A. { } 5 / < e x R x B. { } 2 / > e x R x
C. { } 5 1 / < s e x R x D. { } 7 0 / s s e x R x
E. { } 5 4 / s < e x R x F. { } 3 / > e x R x

2. Estimar un parmetro por intervalo consiste en:
A. Hallar el mximo valor que puede tomar el parmetro.
B. Calcular el valor mnimo del parmetro.
C. Calcular entre que valores est el parmetro.
D. Calcular entre que valores est, posiblemente, el parmetro.


3. Al estimar un intervalo de confianza para un parmetro, se cumple que:



A. La amplitud es independiente del tamao de la muestra.
B. La amplitud es independiente del nivel de confianza.
C. A mayor nivel de confianza, mayor amplitud para una misma muestra.
D. A menor nivel de confianza, mayor amplitud para una misma muestra.

ACTIVIDAD GRUPAL

1 Socialice los resultados obtenidos individualmente y escriba sus
conclusiones al respecto.
2 Haga un listado de las dudas e inquietudes presentadas en la socializacin
de las actividades anteriores.
3 Realice diferentes redacciones para la interpretacin de los intervalos de
confianza. Seleccione la que considere ms adecuada y que presente
mayor claridad.















SABERES Y ACTIVIDADES



2. ESTIMACION POR INTERVALOS

2.1 INTERVALOS DE CONFIANZA

Se puede partir del hecho que cualquier parmetro que se estime es igual al estadstico
que se utilice como estimacin puntual ms el error muestrale (negativo o positivo).
Para el caso de la media muestral se tiene:
X = + e
Si tomamos como ejemplo los datos de la tabla 1.2 y se selecciona la muestra (1), X =
350.000, aqu se manifiesta un error muestral de e = 50.000 por lo tanto
000 . 400 000 . 50 000 . 350 = + =
Al seleccionar la muestra (6) X = 450.000, se manifiesta un error muestral
negativo de e = - 50.000, por lo tanto:
= 450.000 + (-50.000) = 400.000
La inevitable incertidumbre sujeta a cualquier estimacin puntual se puede hacer
explcita si se presenta una estimacin por intervalos y se indica por ejemplo que
S I s s , en donde I es el lmite inferior y S es el lmite superior. Se acostumbra
a construir dichos intervalos al hacer que la estimacin puntual sea el centro del
intervalo y creando un rango abajo y arriba del centro con ayuda del error estndar
del estimador (error tpico). Entonces el parmetro desconocido se supone que se
encuentra dentro del intervalo pero no necesariamente en su centro.
Sin embargo, los lmites del intervalo no necesitan estar precisamente en el error
estndar abajo o arriba de la estimacin puntual. Al definir un coeficiente C como
cualquier valor positivo de fraccin o entorno se puede hacer la afirmacin


I.C = Estimacin puntual | | ) .( tpico error C

EJEMPLO 2.1
Una muestra de salarios ha determinado X = $ 396.670 que podra servir como
estimacin puntual de , el error tpico es
X
o = 35.250. Crear varias estimaciones
posibles de intervalos de con base en error estndar de 0.5, 1.0, 2.0

SOLUCIN:
X
C X para C I o . . =
a) Si C se toma como 0.5, se estima que se encuentre entre los lmites:
396.670 .05 (32.250)
Luego 380545 s s 412.795

b) Si C se toma como 1, se estima que se encuentra entre los lmites
396670 (1) (32250)
Luego 364420 s s 428920

INTERVALO DE CONFIANZA: Si de una poblacin dada se toman
repetidamente muestras aleatorias de tamao n, se encontraran muchos valores
diferentes de un estadstico muestral dado. Si a este valor se suma y se resta
una cierta cantidad, el estadstico muestral se convierte en un rango de valores
entre los que presumiblemente se puede encontrar el parmetro poblacional
desconocido. A este rango de valores se le llama intervalo de confianza


c) Si C se toma como 2.0, se estima que se encuentra entre los lmites
396670 (2) (32250)
Luego 332170 s s 461170
El ejemplo nos muestra claramente que valores ms grande de C producen
intervalos ms anchos y, por tanto, estimaciones menos precisas. El ancho del
intervalo est relacionado con el grado de confianza con el que se puede indicar
que el parmetro de la poblacin en procesos de estimacin se encuentra entre
los lmites del intervalo.

Si la distribucin muestral del estimador utilizado es aproximadamente normal, el
coeficiente C de la expresin:
I.C = Estimacin puntual | | ) ( tpico error C
Se puede tratar como un valor Z tal que
I.C = Estimacin puntual | | ) ( tpico error Z
La tabla 1 del apndice se puede utilizar para calcular las reas bajo la curva
normal que se encuentra dentro de los lmites as calculados.

Considere una distribucin normalmente distribuida de X , y sea
. 66 , 4 40 = =
X X
y o Para hacer estimaciones de intervalos de la media
poblacional, se puede ver a comprendido en el intervalo
X
Z X o . , por lo
tanto | | | | ) . ( ) . (
X X
Z X Z X o o + s s
Si la muestra aleatoria seleccionada de la tabla 1.2 produce una 350 = X qu
puede concluirse?


Al igual que en el ejemplo 2.1 la respuesta depende del valor de Z.
a) Si Z = 0.5, se tiene que el rea bajo la curva normal estndar entre el centro y
Z = 0.5 es 0,1915, por lo tanto el rea entre Z = - 0.5 y Z = 0.5 es igual a
2(0,1915) = 0.383. Debido a que el centro de la distribucin muestral se
encuentra en =
X
, se puede tener un 38% de confianza en que nuestro
mtodo de construccin del intervalo producir un intervalo que en realidad
contiene a .

En efecto | | | | ) 87 , 28 ( 5 , 0 350 ) 87 , 28 ( 5 . 0 350 + s s ; 335,57 s s 364,44
Este intervalo no contiene a 400 = =
X


b) Si Z = 1.0, se tiene que el 68% de todos los valores de X caen dentro del
intervalo de . 1
X X
o Se puede tener un 68,28 % de confianza en que
nuestro mtodo de construccin de intervalo producir un intervalo que
contendr a .
321,13 s s 378,87
Este intervalo no contiene a 400 = =
X


c) Si Z = 2.0, entonces 95,44% de todos los valores de X caen dentro del
intervalo de
X X
o 2 . Por lo tanto se puede tener un 95,44% de confianza
en que nuestro mtodo de construccin de intervalo producir un intervalo que
contendr a .
292,26 s s 407,74
Este intervalo contiene a 400 = =
X



Se nota que un valor de Z ms pequeo significa una mayor precisin en la
estimacin (un intervalo ms angosto), pero tambin implica un menor grado de
confianza en la estimacin. Un valor de Z mayor quiere decir menos precisin
(un intervalo ms ancho) pero implica un mayor grado de confianza.


2.1.1 INTERPRETACION DE LOS INTERVALOS DE CONFIANZA.

Un intervalo de confianza se puede interpretar de dos maneras diferente.
Consideremos el ejemplo 2.1 parte c; en l se tiene un nivel de significancia del
95,44%, entonces este intervalo se puede interpretar as:

1. Confa al 95,44% en que la media de salarios se encuentra entre $292.260 y
$ 407.740.

2. Si se construyen todos los intervalos de confianza posible (
N n
C ), el 95,44%
de ellos incluir el parmetro desconocido, media de los salarios.

Si de una poblacin dada se toman repetidamente muestras aleatorias
simples de tamao n, se encontraran muchos valores diferentes de un
estadstico muestral dado y se podr construir muchos intervalos de
confianza diferentes; algunos de ellos contendrn el parmetro poblacional
desconocido pero otros no. El porcentaje de intervalos que se puede esperar
contengan el valor real del parmetro, cuando se utilice una y otra vez el
mismo procedimiento de construccin, se denomina Nivel de confianza.
El porcentaje de intervalos que se espera no contengan el valor real del
parmetro, se denomina Nivel de significancia ()


2.3 INTERVALOS DE CONFIANZA PARA LA MEDIA POBLACIONAL.
MUESTRAS GRANDES.

Una de las aplicaciones ms corrientes de los intervalos de confianza es la de
estimar la media poblacional. Por ejemplo: La estimacin del nivel medio de
produccin, estimacin del nivel medio de ventas trimestrales, estimacin del nivel
medio salarial de una empresa.

Para la construccin del intervalo de confianza se utilizan las frmulas:
o o conoce se cuando Z X para C I
X
. . =
. . . o desconocid es cuando S Z X para C I
X
o =
EJEMPLO 2.2

La operadora de una central telefnica est conciente de que la poblacin de
duracin de llamadas est normalmente distribuida con una desviacin
estndar de cuatro minutos. Una muestra aleatoria de 50 llamadas produce
una duracin media de 9.1 minutos. Construya e interprete un intervalo de
confianza del 95% para la duracin media de todas las llamadas.

SOLUCION:
% 95
1 , 9
50
. 4
=
=
=
=
confianza de Nivel
minutos X
llamadas n
minutos o



Se tiene una poblacin grande, con o conocido, luego:
5657 , 0
50
4
= = =
n
X
o
o
Para un nivel de confianza del 95%; Z = 1,96

Luego I.C Para
X
Z X o . =
I.C Para ) 5657 . 0 ( ) 96 , 1 ( 1 , 9 =
I.C Para 1085 , 1 1 . 9 =
Luego: 7,99 s s 10.21

Esto quiere decir que con una confianza del 95% se puede afirmar que la
duracin media de las llamadas que entran a la central telefnica esta entre 7,99 y
10,21 minutos.


EJEMPLO 2.3

Se sabe que la poblacin normalmente distribuida de inversiones en acciones
hechas por 75 empleados de una firma tiene una desviacin estndar de 99
dlares. Una muestra aleatoria de 36 empleados demuestra una inversin media
de 736 dlares, construya e interprete un intervalo de confianza del 99,8% para la
inversin media de todos los empleados



SOLUCION:
8 , 99
736
36
99
75
=
=
=
=
=
confianza de Nivel
X
n
N
o


Como la fraccin de muestreo n/N es mayor del 10% se aplica el factor de
correccin para calcular
X
o
Luego
98 , 11
1 75
36 75
36
99
1
=

=
X
X
N
n N
n
o
o
o

Luego I.C para
X
Z X o . = el valor de Z requerido es de 3,08
As I.C para ) 98 , 11 ( ) 08 . 3 ( 736 =
699,1 9 , 772 s s
Lo cual indica que la inversin media de los empleados de la firma en estudio est
comprendida entre 699,1 y 772,9 dlares.

EJEMPLO 2.4
En una ciudad donde hay 200 gasolineras, un economista toma una muestra
aleatoria de 50 de ellas, cuyo precio promedio de gasolina es de 5.839 pesos por
galn, con una desviacin estndar muestral de 68 pesos por galn. Determine e
interprete un intervalo de confianza del 80% para el precio promedio en la ciudad,
si se supone que la distribucin poblacional es normal.


SOLUCION:
N = 200 gasolineras
n= 50
X = 5.839 pesos por galn
S = 68
Nivel de confianza = 80%

Se tiene una muestra grande, con una fraccin de muestreo n/N mayor del 10%,
luego se hace necesario aplicar el factor de correccin. o es desconocido.

35 , 8
1 200
50 200
50
68
1
. =

=
N
n N
n
S
X
o
El valor de Z requerido es de 1,28

Luego
69 , 5849 31 , 5828
688 , 10 5839 .
) 35 , 8 ( ) 28 , 1 ( 5839 .
. .
s s
=
=
=

para C I
para C I
S Z X para C I
X


Esto nos indica que el precio promedio de la gasolina por galn en la ciudad esta
entre 5828,31 y 5849,69 pesos.




2.4 INTERVALOS DE CONFIANZA PARA LA MEDIA
POBLACIONALMUESTRAS PEQUEAS.

Existe un nmero infinito de situaciones prcticas donde no es posible obtener una
muestra grande, las razones sobran, incluyendo el alto costo de muestreo. Un
ejemplo comn es el de las compaas de seguro que comprueban la resistencia
de los automviles a las colisiones. Destruir 30 vehculos o ms puede ser muy
costoso.

Cuando se toma una muestra pequea (n< 30) la distribucin normal puede ser
inadecuada. Es decir, cuando la muestra es pequea y o es desconocida, no se
deber aplicar la distribucin Z. En este caso de muestras pequeas, los errores
estndar de la media y la proporcin
P
X
y o o se estiman solo en forma
deficiente con la ayuda de desviaciones estndar mustrales, S y P
x

Como primero lo demostr William S Gosset, cervecero ingls, que escriba bajo el
seudnimo de student (estudiante), en las circunstancias especificadas, se
puede derivar mejores estimaciones de intervalos si se usa una funcin de
densidad de probabilidad algo diferente de la curva normal.

Gosset, describi una distribucin muestral para una variable aleatoria, t, derivada
de una poblacin normalmente distribuida y definida en analoga a la desviacin
normal estndar Z. Esto se ilustra en la figura 2.1




FIGURA 2.1 Comparacin de la distribucin Z y la distribucin t



FIGURA 2.2 Familia de distribuciones t






Como la curva normal estndar, la funcin de densidad de probabilidad de Gosset,
ahora llamada distribucin t de student, es:

1. De un solo pico sobre la media de la variable aleatoria. La media, la mediana y
la moda son cero.
2. Perfectamente simtrica alrededor de su valor central.
3. Caracterizada por colas que se extienden indefinidamente en ambos
direcciones desde el centro y se aproximan pero nunca tocan al eje horizontal.

La nica diferencia es que la variable aleatoria es t y no Z; como resultado de esto
la varianza de la distribucin no es igual a 1, sino que es igual a

3
1
2

=
n
n
o

Esta varianza de t implica que existe una distribucin t diferente para cada tamao
muestral n, y tambin que la distribucin t se aproxima a la distribucin Z a
medida que aumenta el tamao muestral. La distribucin t para n = tiene una
varianza igual a uno (1) y es indistinguible de la normal (vase figura 2.2).

EL valor adecuado de t se puede encontrar en la tabla 2 del apndice. Dicha tabla
muestra el rea bajo una curva especfica, definida por un nmero dado de
grados de libertad, que se encuentran a la derecha de un valor especfico de t (df),
esta rea de cola superior se denomina o y este valor de t se designa como
o
t .
Con frecuencia los grados de libertad (df) aplicables se agregan al subndice o ya
sea en parntesis o despus de una coma:
df df
t o t
, ) ( o o



Por ejemplo, para 10 grados de libertad y un rea de cola superior de
. 372 , 1 , 1 . 0
) 10 ( 1
= = t o En otras palabras, 0.1 del rea bajo la curva t apropiada para
una muestra de n = 11 est asociada con t > 1,372.

Debido a la simetra de la curva 0.1 del rea bajo esta curva tambin esta
asociada con t < - 1,372. En consecuencia, 0.8 del rea bajo la curva esta
asociada con valores de t entre 1,372 y 1,372; la probabilidad para dicho
valor t es igual a 0.8 . Para construir una estimacin de intervalos con un nivel de
confianza de 0.8, o sea del 80% se debe usar t = 1,372. Luego los intervalos de
confianza se pueden construir con ayuda de los valores t de la tabla 2 del
apndice as:

EJEMPLO 2.5

Una empresa de alquiler de coches est interesada en conocer el tiempo medio
que sus vehculos permanecen en el taller de reparaciones. Una muestra aleatoria
de 9 coches indic que el pasado ao el nmero de das que cada uno de estos
coches haba permanecido fuera de servicio fue:
16 10 21 22 8 17 19 14 19
Especificando las hiptesis necesarias, calcular e interpretar intervalos de
confianza del 90% para el nmero medio de das que la totalidad de los vehculos
de la empresa se encuentran fuera de servicio.





SOLUCION:
Se debe suponer que la distribucin de la poblacin es normal, como un primer
paso, se tiene que hallar la media y la varianza muestral (con la ayuda de una
calculadora).
79 , 4
22 , 16
=
=
X
S
X

Luego
X
S t X para C I = . donde
860 , 1 5967 , 1
9
79 , 4
8 , 10 . 0
= = = t con S
X

As:
19 , 19 25 , 13
9696 , 2 22 , 16 .
) 5967 , 1 ( ) 860 , 1 ( 22 , 16 .
s s
=
=

para C I
para C I

Con un nivel de confianza del 90% se estima que,en promedio, los vehculos de la
empresa se encuentran fuera de servicio entre 13 y 19 das.

EJEMPLO 2.6
El convenio colectivo entre el sindicato de una empresa y la administracin de la
misma exiga que la produccin media de una seccin de la fbrica se mantuviera
en 112 unidades por empleado y mes. Surgieron desacuerdos entre las partes
sobre el cumplimiento de esta norma. El convenio colectivo especificaba que si la
produccin media descenda por debajo de la cantidad estipulada de = 112,
estaba autorizada a tomar medidas correctivas. Para ahorrar costo se decidi
inspeccionar solamente 20 obreros que dieron una media de 106 unidades.
Supngase que se hall una desviacin tpica de 8,5 unidades y que los niveles de
produccin siguen una distribucin normal sugiere un intervalo de confianza del


90% que ha habido violacin del convenio y que est justificado, por lo tanto,
tomar medidas correctivas?

SOLUCION:

Para un intervalo de confianza del 90% y 19 grados de libertad, el valor de t
adecuado es de 1,729. Luego:
29 , 109 71 , 102
29 , 3 106 .
20
5 . 8
) 729 , 1 ( 106 .
.
s s
=
|
|
.
|

\
|
=
=

as
para C I
para C I
n
S
t X para C I


Se observa que la produccin media especificada en el convenio colectivo no se
encuentra en el intervalo. Se puede concluir, con un nivel de confianza del 90% de
que se est violando el convenio. Por lo tanto los directivos de la fbrica estn en
su derecho de emprender acciones contra el descenso de la productividad de la
empresa.

2.5 INTERVALOS DE CONFIANZA PARA PROPORCIONES
POBLACIONALES.

Supongamos ahora que estamos interesados en la proporcin de miembros de la
poblacin que poseen un determinado atributo. Por ejemplo: una empresa quiere
saber qu proporcin de clientes pagan a crdito frente a quien lo hacen de
contado o puede estar interesada en conocer el porcentaje de sus productos que


son defectuosos frente al de unidades no defectuosas. En cada uno de estos
casos solo hay dos resultados posibles.El inters se centra en la proporcin de
respuestas que se clasifican en uno de estos dos resultados.

En el captulo anterior se dedujo el error tpico de la distribucin muestral de
proporciones mustrales con
n
p
) 1 ( t t
o

= , esta frmula contiene el


parmetro que se pretende estimar, por lo tanto se utiliza la proporcin
muestralP
x
como estimador del error y se tiene
n
P P
S
x x
P
) 1 (
= , as:
Si P
x
es la proporcin observada de xitos en una muestra aleatoria de n
observaciones procedentes de una poblacin con una proporcin de xito ,
entonces, si n es grande, un intervalo de confianza para del ( ) o 1 % para la
proporciono poblacional viene dado por
p x
S Z P para C I = t .
Es decir
n
P P
Z P
n
P P
Z P
x x
x
x x
x
) 1 ( ) 1 (
2 2

+ < <

o o
t , donde la variable Z se
distribuye normalmente.
1


EJEMPLO 2.7

En una encuesta a 673 grandes almacenes, 521 declaraban tener problemas con
los robos de los empleados se puede llegar a la conclusin, con una confianza
del 99% de que estos datos indican que el 78% de todas las tiendas tiene
dificultades similares?

1
PAUL NEWBOLD. Estadstica para los Negocios y la economa. Espaa, Prentice Hall 1997, p253



SOLUCION:


( )( )
815 , 0 732 , 0
0412 , 0 774 , 0 .
) 016 , 0 ( ) 58 , 2 ( 774 , 0 .
673
226 , 0 774 , 0
; .
s s
=
=
= =
P
P para C I
P para C I
S S Z P para C I
P P x
t

Con una confianza del 99% se puede concluir que el 78% de todas las tiendas
tienen problemas con los robos de los empleados.

EJEMPLO 2.8
Un almacn de la ciudad quiere estimar la proporcin de clientes que pagan con
tarjetas de crditos. Una muestra de 79 clientes indic que 12 utilizaban el
plstico. Construir e interpretar el intervalo de confianza para el almacn.

SOLUCION:
1519 , 0
79
12
= =
x
P
( )( )
040 , 0
79
8481 , 0 1519 , 0
= =
P
S



Esto quiere decir que la proporcin de clientes que pagan con tarjeta de crdito
esta entre el 5% y el26%.
( )( )
26 , 0 05 , 0
1042 , 0 15189 , 0 .
040 , 0 58 , 2 15189 , 0 .
. .
s s
=
=
=
t
t
t
t
para C I
para C I
S Z P para C I
P x


EJEMPLO 2.9

En una compaa de autobuses, cada mes, miles de sus autobuses llegan a cierta
terminal. Con ayuda de una muestra aleatoria de 49 autobuses, sin
remplazamiento, ha de construirse un intervalo de confianza del 99,9% para la
proporcin de todos los que llegan a tiempo. La proporcin muestral de llegada
exacta es de 0,64.

SOLUCION:
( )( )
0686 , 0
49
36 , 0 64 , 0
= =
P
S
Un nivel de confianza del 99,9% requiere un Z = 3,27

Luego: ( )( )
86 , 0 42 , 0
0686 , 0 27 , 3 64 , 0 .
.
s s
=
=
t
t
t
para C I
S Z P para C I
P x

Con un confianza del 99.9% se puede afirmar que el porcentaje de autobuses que
llegan a tiempo a la terminal est entre 42% y 86%

Consulte las pginas:
http://www.slideshare.net/yohanabonillagutierrez/taller-intervalos-de-confianza
http://www.iesxunqueira1.com/Download/pdf/teointervalos.pdf




Resumen
INTERVALO DE CONFIANZA: Si de una poblacin dada se toman repetidamente
muestras aleatorias de tamao n, se encontraran muchos valores diferentes de un
estadstico muestral dado. Si a este valor se suma y se resta una cierta cantidad,
el estadstico muestral se convierte en un rango de valores entre los que
presumiblemente se puede encontrar el parmetro poblacional desconocido. A
este rango de valores se le llama intervalo de confianza.

Nivel de confianza (NC): Porcentaje de intervalos que se espera contengan el
valor real de un parmetro, cuando se utilice una y otra vez el mismo
procedimiento de construccin.

Nivel de significancia: Porcentaje de intervalos que se espera no contengan el
valor real de un parmetro, cuando se utilice una y otra vez el mismo
procedimiento de construccin, (= 1-NC).

Para la construccin del intervalo de confianza para la media poblacional se
utilizan las frmulas:
o o conoce se cuando Z X para C I
X
. . =
. . . o desconocid es cuando S Z X para C I
X
o =
Para el clculo cuando la muestra es pequea, se utiliza
n
S
S Donde S t X para C I
X X
= = , ) ( ) ( . ,
n
S
X
t

=


Para la construccin del intervalo de confianza para la proporcin poblacional se
utiliza la proporcin muestralP
x
como estimador del error y se tiene
n
P P
S
x x
P
) 1 (
= . Utilizando el factor de correccin
1
.

N
n N
cuando sea
requerido.

Si P
x
es la proporcin observada de xitos en una muestra aleatoria de n
observaciones procedentes de una poblacin con una proporcin de xito P,
entonces, si n es grande, un intervalo de confianza para del ( ) o 1 % para la
proporciono poblacional viene dado por
p x
S Z P P para C I = .
Es decir
n
P P
Z P
n
P P
Z P
x x
x
x x
x
) 1 ( ) 1 (
2 2

+ < <

o o
t , donde la variable Z se
distribuye normalmente.
2








2
PAUL NEWBOLD. Estadstica para los Negocios y la economa. Espaa, Prentice Hall 1997, p253




1. Una muestra de 155 usuarios del tren suburbano emplean en este medio de
transporte una hora y 37 minutos en promedio, con una desviacin tpica de
42 minutos. Cul es el intervalo del 90% para el tiempo medio de todos los
usuarios?

2. El propietario de una pequea empresa desea estimar el tiempo medio
necesario para realizar una tarea determinada. Tiene que asegurarse al 90%
de confianza de que el error es inferior a 0.5 minutos. Se sabe que la
desviacin tpica es de 3.2 minutos. Cuntas observaciones de tiempos de
ejecucin tiene que hacer?
2
|
.
|

\
|
=
e
Z
n
o


3. El director de una tienda de animales de compaa est preocupado por el
aumento del nmero de cachorros que enferman antes de ser vendidos. De 53
cachorros estudiados, 35 mostraban algn signo de problema sanitario.
Elaborar e interpretar el intervalo del 95%

4. En la calificacin de su eficacia, 312 empleados recibieron una puntuacin
media del 73,9 con s = 15.6. Si un intervalo de confianza del 95% indica que la
media de todos los empleados es menor que 65, la direccin pretende
implantar un nuevo programa de formacin. Calcular e interpretar el intervalo
correcto. Se llevar a cabo el programa?

5. Suponga que como experto en control de calidad quiere estimar el espesor
medio de las lentes pticas fabricadas por su empresa. Una muestra de 120


lentes da una media de 0.52mm .Se sabe que la desviacin tpica de la
poblacin es de 0,17mm. Usted piensa que puede arriesgarse a una
probabilidad de error de slo el 1%. Construya el intervalo de confianza
adecuado.

6. Un proceso produce bolsas de azcar refinada. El peso del contenido de estas
bolsas tienen una distribucin normal con desviacin tpica 15gr. Los
contenidos de una muestra aleatoria de 25 bolsas tienen un peso medio de
100gr. Calcular un intervalo de confianza del 95% para el verdadero peso
medio de todas las bolsas de azcar producidas por el proceso.

7. Una muestra aleatoria de 10 autos americano de un determinado modelo
consumen las siguientes cantidades en kilmetros por litro.
17,9 19,8 18,6 18,4 19,2 20,8 19,4 20,5 21,4 20,6
Calcular un intervalo de confianza del 90% para el consumo de gasolina medio
poblacional de los automviles de este modelo, suponiendo que la distribucin
de la poblacin es normal.

8. De una muestra aleatoria de 95 pequeas empresas fabricantes, 29 sealaron
las mejoras en la calidad como la ms importante iniciativa para incrementar la
competitividad de sus productos.

a) Calcular un intervalo de confianza del 99% para la proporcin poblacional
b) Sin hacer los clculos, determinar si un intervalo de confianza del 90%
tendr una longitud mayor, menor o igual a la del intervalo calculado en la
parte a).



9. De una muestra aleatoria de 198 estudiantes de marketing, 98 consideraron
como poco tico inflar las calificaciones acadmicas. Utilizando esta
informacin, un experto en estadstica calcul un intervalo de confianza de
0,435 a 0,554 para la proporcin poblacional. Cul es el contenido
probabilstico de dicho intervalo?

10. Un ingeniero de control de calidad est inspeccionando la maquinaria que se
supone verter 20 onzas de detergente liquido en un recipiente. Una muestra
de 12 recipientes deja ver que la cantidad media dosificada es de 18,9 onzas,
siendo la desviacin estndar de 3.1 onzas. Construya un intervalo de
confianza del 90% para la cantidad media dosificada por la maquinaria,
suponiendo que dichas cantidades estn normalmente distribuidas. funciona
bien la maquinaria?

11. Al muestrear en forma aleatoria 60 de los 900 empleados de la compaa, el
gerente de personal encuentra que un 25% prefieren el plan recientemente
propuesto de trabajar slo cuatro das de la semana, pero ms horas cada da.
Construya un intervalo de confianza para la proporcin de todos los empleados
que nose inclinaron por la propuesta.

12. En una muestra aleatoria de 100 familias, se encuentra que 59 prefieren la
marca KEMA de un determinado producto. Construya un intervalo de
confianza del 98% para la proporcin de todas las familias con esa preferencia.

13. In a simple random sample of 500 employees, 160 preferred to take training
classes in the morning rather than in the afternoon. Construct a 95% C.I. on the
true proportion of employees who favor morning training classes



14. Human beings vary in the time it takes them to respond to driving hazards. In
one experiment in which 100 healthy adults between age 21 and 30 years were
subjected to a certain driving hazard, and the sample variance of the observed
times it took them to respond was 0.0196 second squared. Assuming that the
times to respond are normally distributed, estimate the variability in the time
response of the given age group using a 95% C.I

15. Suppose you want to estimate the average weight of chickens in a laboratory.
You like to be 95% certain that the error is at most 0.1lbs. How many chickens
you should include in your sample?

16. A certain change in a manufacturing procedure for component parts is being
considered. Samples are taken using the existing procedure and the new one.
If 75 items out of 1500 items, from the existing procedure, were found to be
defective, while 80 items out of 2000 items for the new procedure were found
defective. Find a 90% confidence interval for the true difference in the fraction
defective between the existing and the new procedures.
3






3
Mohammed A. Shayib, Applied Statistics, bookboon.com, 2013 p129,133,135, 154





Evaluacin
Con base en la informacin responda las preguntas 1 y 2

La calificacin que obtienen los vendedores de una firma comercial en una
prueba de aptitud, sigue una distribucin normal. Se extrae una muestra de 25
calificaciones que dan lugar a los siguientes estadsticos: 508 . 1
25
1
=

= i
i
x
628 . 95
25
1
2
=

= i
i
x
4

1. La varianza muestral estar dada por:

A.
25
1508 628 . 95
B.
24
1508 628 . 95

C.
25
25
) 1508 (
628 . 95
2

D.
24
25
) 1508 (
628 . 95
2




4
PAUL NEWBOLD. Estadstica para los Negocios y la economa. Espaa, Prentice Hall 1997, p52



2. Un intervalo de confianza del 90% para la media tendr:

1. una longitud mayor que uno del 80%
2. una longitud menor que uno del 80%
3. una longitud igual que uno del 95%
4. una longitud mayor que uno del 95%

3. Un proceso produce bolsas de azcar refinado. El peso del contenido sigue
una distribucin normal con desviacin tpica 15 gramos. Los contenidos de
una muestra aleatoria de 25 bolsas tienen un peso medio de 100 gramos.
El intervalo de confianza del 95% para el verdadero peso medio de todas
las bolsas de azcar producidas por el proceso est dado por:

A. 95 , 104 05 , 95 < < B. 88 , 105 12 , 94 < <
C. 99 , 100 01 , 99 < < D. 18 , 101 82 , 98 < <

4. Como parte de un estudio de mercado, en una muestra de 125personas se
encontr que 84 de ellas tenan conocimiento de cierto producto
5
. El
intervalo de confianza del 90% para la proporcin de personas de la
poblacin que tienen conocimiento del producto, tiene respectivamente los
siguientes limites inferior y superior:

A. 0,589 y 0,754 B. 0,602 y 0,741
C. 0,589 y 0,602 D. 0,602 y 0,754

5
HILDEBRAND Y OTT. Estadstica aplicada a la administracin y a la Economa. U.S.A, Addison Wesley
Iberoamericana 1997, p307.






















PRESENTACION

Cuando se extrae una muestra aleatoria, de una poblacin, la evidencia obtenida
puede usarse para realizar inferencia sobre las caractersticas de la poblacin.
Como hemos visto, una posibilidad es estimar los parmetros desconocidos de la
poblacin mediante el clculo de estimadores puntuales o intervalos de confianza.
Alternativamente, la informacin muestral puede emplearse para verificar la
validez de una conjetura o hiptesis, que se haya formulado sobre la poblacin.
6

.

PREGUNTA PROBLEMA
Son las pruebas de hiptesis una herramienta fundamental en la toma de
decisiones en la empresa?


COMPETENCIAS ESPECFICAS


6
PAUL NEWBOLD. Estadstica para los Negocios y la economa. Espaa, Prentice Hall 1997, p281







SABERES
- Concepto del contraste de hiptesis.
- Prueba de hiptesis para la media poblacional
- Prueba de hiptesis para la proporcin poblacional
- Prueba de hiptesis para la diferencia de dos medias poblacionales


DINMICA PARA CONSTRUIR EL CONOCIMIENTO
ACTIVIDAD PREVIA (Trabajo Individual)

De las siguientes afirmaciones, cules son verdaderas y cules falsas?
1. En un sistema de hiptesis, la hiptesis nula es la que se contrasta.
2. La hiptesis nula siempre es aceptada.
3. Si la hiptesis nula se acepta, entonces la alternativa tambin es vlida.
4. La expresin
X
c
Z X X o = se puede utilizar para calcular el valor crtico en
una prueba unilateral de cola derecha para la media poblacional.
5. En una prueba bilateral, se puede rechazar la hiptesis nula si la media
muestral resulta mayor que el valor critico calculado.
1. Formula y contrastar hiptesis para la media poblacional, para situaciones
especficas de la empresa.
2. Formula y contrasta hiptesis para una proporcin poblacional.
3. Identifica cuando una hiptesis es unilateral o bilateral.
4. Formular y contrastar hiptesis para la diferencia de medias dos poblaciones.


6. El procedimiento para contrastar hiptesis para la proporcin poblacional,
es el mismo utilizado en el contraste de hiptesis para la media.
7. Se puede realizar contraste de hiptesis para comparar dos medias
poblacionales.
8. En algunos problemas de contraste de hiptesis se requiere el uso del
factor de correccin


ACTIVIDAD GRUPAL

1. Socialice los resultados obtenidos individualmente y escriba sus
conclusiones al respecto.

2. Indique los criterios que se deben tener en cuenta para aplicar una prueba t
o una prueba Z.

3. Indique los criterios que se deben tener en cuenta para determinar si una
prueba de hiptesis es bilateral o unilateral.

4. Haga un listado de las dudas e inquietudes presentadas en la socializacin de
las actividades anteriores.





















SABERES Y ACTIVIDADES

3. CONTRASTE DE HIPOTESIS

3.1 CONCEPTO DEL CONTRASTE DE HIPOTESIS

Veamos el concepto con base en algunos ejemplos ilustrativos:

1. Un fabricante de bateras podra afirmar que la duracin promedio de las
bateras tipo A es de 150 horas.

2. Una compaa recibe un gran cargamento de piezas. Slo puede aceptar el
envo si no hay ms de un 5% de piezas defectuosas. La decisin de aceptar o
no el envo se puede basar en el anlisis de una muestra aleatoria de piezas.

3. Un fabricante de detergentes afirma que, en promedio, el contenido de cada
bolsa pesa al menos 500 gramos, Para verificar esta afirmacin, se pesa el
contenido de una muestra aleatoria y se infiere el resultado a partir de los datos
mustrales.



4. Una factora puede afirmar que la produccin de la mquina A contiene menos
unidades defectuosas que los de la mquina B, para verificar esta afirmacin
no es necesario revisar toda la produccin de las dos mquinas, basta con
tomar muestras aleatorias en ambas y hacer la inferencia a toda la produccin.

De estos ejemplos se concluye que la hiptesis se formula sobre la poblacin, y
las conclusiones sobre la validez de esta hiptesis se basa en la informacin
muestral. La hiptesis que se contrasta se llama Hiptesis nula (Ho) y con la que
se contrasta, hiptesis alternativa (Ha). Despus, a partir de los resultados
obtenidos en una muestra, o bien rechazamos la hiptesis nula y se acepta como
verdadera la alternativa, o bien, aceptamos la hiptesis nula y se supone que la
alternativa es falsa. El hecho de no rechazar la hiptesis nula no implica que esta
sea correcta, significa simplemente que los datos de la muestra no son suficientes
para inducir el rechazo.

3.2 FORMULACION DE DOS HIPOTESIS OPUESTAS

Una hiptesis, nula o alternativa, puede designar un nico valor, llamado
0
u , para
el parmetro poblacional u . En este caso se dice que la hiptesis es simple. La
notacin simblica para una hiptesis de este tipo es

0 0
: u u = H
Que se lee La hiptesis nula es que el parmetro poblacional u es igual al valor
especfico
0
u
7
. La hiptesis alternativa es
0
: u u =
A
H .

7
PAUL NEWBOLD. Estadstica para los Negocios y la economa. Espaa, Prentice Hall 1997, p282



La situacin descrita en (1) es un ejemplo de este tipo, aqu el fabricante afirma
que la duracin promedio de las bateras tipo A que l fabrica es de 150 horas.
50 1 :
0
= H
150 : =
A
H

La hiptesis alternativa en cada caso sugiere que el promedio es mayor o menor
que
0
; Siempre que una hiptesis alternativa contenga desviaciones desde la
hiptesis nula en cualquier direccin se denomina HIPOTESIS DE DOS COLAS.
Este tipo de hiptesis se establece cuando la precisin es de gran importancia y
las desviaciones en cualquier direccin son inaceptables por igual.

Una hiptesis tambin puede designar un rango de valores para el parmetro
poblacional desconocido. Una hiptesis de este tipo se denomina compuesta y
ser cierta para ms de un valor del parmetro poblacional.
8
Un ejemplo de este
caso es la situacin (3) descrita por el fabricante de detergentes donde afirma que
en promedio el contenido de cada bolsa pesa al menos 500 gramos, aqu la
hiptesis nula se puede escribir as:
gr H
gr H
mente especifica
H
A
500 :
500 :
, :
0
0 0
<
>
>






8
PAUL NEWBOLD. Estadstica para los Negocios y la economa. Espaa, Prentice Hall 1997, p282


Si en cambio el fabricante asegura que las bolsas de detergentes contienen una
media de ms de 500 gramos, entonces el sistema queda as:
500 :
500 :
0
>
s

A
H
H


Se nota que en cualquiera de los sistemas planteados, la hiptesis alternativa se
indica siempre como inexacta, la nula puede ser indicada como . , , s > = En todo
caso se acostumbra que la
0
H contenga el signo de igualdad.
En el sistema:
0
0 0
:
:


<
>
A
H
H
, la hiptesis nula dice que el parmetro es mayor o
igual que un valor especfico, en tanto que en la alternativa dice que es menor que
ese valor, este sistema de hiptesis se plantea cuando algo puede ser con
seguridad mayor que un cierto valor, pero donde valores menores seran
inaceptables. Por ejemplo, si de una batera se garantiza que tendra una duracin
de 100 horas, nadie se preocupar si dura ms; pero la alternativa de que dure
menos podra ser verdad y exigira una accin correctiva rpida.

En el sistema
0
0 0
:
:


>
s
A
H
H
, la hiptesis nula dice que el parmetro es menor o
igual que un valor especfico, en tanto que la alternativa dice que es mayor que
ese valor. La hiptesis alternativa sugiere que el promedio es mayor que
0
. Este
tipo de hiptesis se establece cuando algo puede ser con seguridad menor o igual
que un cierto valor, pero donde valores mayores seran inaceptables, por ejemplo,
si se considera la hiptesis nula el tiempo promedio de entrega de una compaa
de transporte es igual o menor que tres das, nadie se quejara si es menor, pero
si es mayor sera causa de alarma.



El sistema de hiptesis sobre el valor de una media poblacional , se indica por lo
general en una de estas tres formas con referencia a un valor especfico
0
.
FORMA 1 FORMA 2 FORMA 3
0
0 0
:
:


=
=
A
H
H

0
0 0
:
:


<
>
A
H
H

0
0 0
:
:


>
s
A
H
H



Puede darse el caso que se necesite comparar entre si dos poblaciones
separadas, como por ejemplo: la duracin comparativa de dos productos, la
fiabilidad relativa de dos procesos de fabricacin o el nivel de eficacia de dos
esquemas publicitarios. Las hiptesis opuestas sobre la diferencia entre dos
medias poblacionales
B A
y se indican del mismo modo sealado.
FORMA 1 FORMA 2 FORMA 3
B A A
B A
H
H


=
=
:
:
0

B A A
B A
H
H


<
>
:
:
0

B A A
B A
H
H


>
s
:
:
0


Por lo tanto, la hiptesis nula puede decir, forma 1, que dos medias poblacionales
son las mismas, por ejemplo, que la duracin promedio de dos tipos de llantas son
idnticas. O puede decir forma 2, que una media poblacional es mayor o igual que
otra, por ejemplo que los sueldos promedios de la industria de la construccin en
Bogot son al menos iguales pero posiblemente mayores que los de Barranquilla.
O puede decir forma 3, que una media poblacional es menor o igual que otra, por
ejemplo que la produccin promedio de la fbrica A es al menos igual o
posiblemente menor que la produccin en la fbrica B.



Las hiptesis sobre una proporcin de la poblacin , tal como la proporcin de
unidades defectuosas producidas en un proceso, se formulan de una manera
anloga a aquellas sobre una media poblacional, simplemente se sustituye
por , dejando todo lo dems sin cambios, incluyendo las hiptesis sobre la
diferencia entre las proporciones de la poblacin.



3.3 SELECCIN DE UN ESTADISTICO DE PRUEBA.

Despus de haber diseado el sistema de hiptesis adecuado, el segundo paso
para contrastarla es la seleccin de un estadstico de prueba.

Cada estadstico muestral tiene una distribucin muestral propia que puede
aproximarse muchas veces por la distribucin normal para muestras grandes, o
por una distribucin t de student para muestras pequeas. Es as como el
estadstico de prueba se puede convertir en un valor Z o un valor t al dividir la
diferencia entre el estadstico muestral y el valor extremo del parmetro
poblacional postulado en la hiptesis nula entre el error estndar del estadstico
muestral.
X
x
Z
o

0

= Para una media poblacional Muestras grandes


Un ESTADSTICO DE PRUEBA es aquel valor calculado a partir de los
datos mustrales en una prueba de hiptesis para establecer si se rechaza
o no se rechaza la hiptesis nula.


X
S
X
t
0

= Para una media poblacional Muestras pequeas
P
x
P
Z
o
t
= Para una proporcin de la poblacin

3.4 DERIVACION DE UNA REGLA DE DECISIN

Una vez establecido el sistema de hiptesis y el estadstico de prueba adecuado,
se debe determinar una regla de decisin que nos indique si se rechaza o no la
hiptesis nula. Esta regla de decisin especifica un valor del estadstico tan
diferente del valor del parmetro contenido en la hiptesis, que excluya atribuir la
diferencia al error muestral.

Supngase que se desea contrastar la hiptesis para la situacin planteada en (1).
Un fabricante de bateras afirma que la duracin promedio de las bateras tipo A
es de 150 horas 150 : ; 150 :
0
= =
A
H H
En este caso, la regla de decisin especfica valores crticos de la media muestral
,
C
X demasiado alejados por encima o por debajo de 150 para permitir suponer
que = 150. Si se contrasta la hiptesis nula al nivel de significancia del 5%, se
deben encontrar valores crticos de la media muestral por encima o por debajo del
valor hipottico = 150 que enmarque el 95% del rea comprendida bajo la
curva normal. El 5% restante se divide por igual en dos colas, como se muestra en
la figura 3.1.

FIGURA 3.1 Contraste de hiptesis al 95%




Los valores de X comprendidos en el intervalo del 95% son lo bastante cercanos
al valor hipottico de 150 para que se pueda atribuir la diferencia al error muestral.
Esta diferencia se dice que es insignificante estadsticamente al nivel del 5% y se
puede explicar por la fluctuacin aleatoria de la muestra. Por consiguiente, no se
rechaza la hiptesis nula.
Si el valor obtenido para X se sita ms all de esos valores crticos en una u
otra cola, se rechaza la hiptesis nula de que = 150. Estos valores crticos se
determinan con la siguiente formula
Donde:
H
Valor hipottico de la media poblacional
n
S
S
X
=
1

=
N
n N
n
S
S
X
Error tpico de la distribucin muestral.

A partir de estos valores se formula la regla de decisin


REGLA DE DECISIN: La regla de decisin es un enunciado que se
emite para determinar si se rechaza o no la hiptesis nula. Especfica el
valor crtico de los resultados mustrales.


3.5 PRUEBA DE HPOTESIS PARA UNA MEDIA POBLACIONAL.

Son muchos los casos en que interesa contrastar una hiptesis en relacin con el
valor de una media poblacional, entre los cuales se pueden citar:

- Un proceso industrial produce partes metlicas de una longitud promedio de
0
= 5 pulgadas, perfora orificios con un dimetro promedio de 1,2 pulgadas o
hace mangas de camisa de un largo promedio de 33 pulgadas.
- La cantidad promedio de detergente puesto en una caja por una mquina
llenadora es igual o excede de
0
= 1 libra.
- El promedio de resistencia a la ruptura de cierto tipo de cable es al menos
5000 libras.
- El tiempo promedio de entrega de una compaa de transporte es igual o
menor de
0
= 3 das
- El tiempo promedio de secado de una pintura es a lo ms de 4 horas.
- Algunos funcionarios de la administracin pueden estar interesados en conocer
la renta media de los contribuyentes de un municipio determinado.

En definitiva, un gran nmero de decisiones empresariales, se toman a partir de la
media poblacional. Si se pueden recopilar datos en relacin con este parmetro,
las decisiones seran ms fiables y es probable que produzcan resultados
favorables. En todo caso para llevar a cabo el contraste de una hiptesis nula es
necesario agotar las siguientes cuatro fases:

Fase 1: Formular las hiptesis
Fase 2: Calcular el valor crtico
Fase 3: Formular la regla de decisinpara decidir si se acepta o rechaza la
hiptesis nula


Fase 4: Exponer la conclusin en relacin con la aceptacin o el rechazo de la
hiptesis nula y cualquier otra interpretacin que pudiera derivarse de dicha
conclusin.

Esto se ilustra en las siguientes situaciones.

EJEMPLO 3.1

Un convenio trabajadores- direccin de una fbrica, exige una produccin media
diaria de 50 unidades. Una muestra de 150 das revela una media de
47,3unidades con una desviacin tpica de 5,7 unidades. Poner o = 5% y
determinar si se cumple esta clusula del contrato.

SOLUCIN:
Fase 1: Formulacin de las hiptesis
Como el convenio exige una produccin media de 50 unidades, el sistema de
hiptesis se establece as:
50 :
50 :
0
=
=

A
H
H

Se trata de una prueba bilateral, puesto que la hiptesis nula puede ser rechazada
si los resultados de la muestra estn muy por encima o por debajo de 50. Aparece
una regin de rechazo en cada una de las colas de la distribucin.

Fase 2: Clculo del valor crtico

Para encontrar el valor crtico se debe empezar por encontrar el valor de Z
adecuado, segn el nivel de significancia seleccionado. Para el ejemplo, se divide


el nivel de confianza entre dos, es decir, 0,95/ 2 = 0,475, que corresponde a un
valor Z = 1,96.
Adems: 465 , 0
150
7 , 5
= = =
n
X
o
o
Luego:


49,1 - - - - - - - - - 50.91

Fase 3 Regla de decisin:
No rechazar X si H
0
est comprendida entre 49,1 y 50,91. Rechazar X si H
0

es menor que 49,1 o mayor que 50,91. Esto se ilustra en la figura 3,2





FIGURA 3.2
Fase 4: Conclusin

Una X de 47,3 est en la regin de rechazo demasiado alejado de . 50 =
H

Debe rechazarse la hiptesis nula lo que indica que no se est cumpliendo la
clusula del contrato.

EJEMPLO 3.2
911 , 0 50
) 465 , 0 ( 96 , 1 50
=
=
=
C
C
H C
X
X
Z X
X
o




Una compaa lctea utiliza una mquina para llenar sus latas de kumis de 18
onzas. Si la mquina funciona mal, tiene que ser ajustada. Se elige una muestra
de 50 latas, que dan una media de 18,9 onzas, con una desviacin tpica de 4,7
onzas. Si se admite un error del 5%. Deber reajustarse la mquina?

SOLUCION:
Fase 1: Formulacin de la hiptesis
Como el llenado debe ser de 18 onzas, el sistema de hiptesis conveniente es:
18 :
18 :
0
=
=

A
H
H

Nuevamente se trata de una prueba bilateral dado que la hiptesis nula puede ser
rechazada si los resultados de la muestra estn muy por encima o por debajo de
18 onzas.

Fase 2: Clculo del valor crtico
El valor de Z se encuentra de forma anloga al ejemplo 3.1 y Z = 1,96
665 , 0
50
7 , 4
= =
n
S
S
X

3 , 1 18
) 665 , 0 ( ) 96 , 1 ( 18
=
=
=
C
C
X
H
C
X
X
ZS X

16,7 - - - - - - - 19,3

Fase 3: Regla de decisin


Aceptar X si H
0
est comprendido entre 16,7 y 19,3. Rechazar X si H
0
es
menor que 16,7 o mayor que 19,3; esto se ilustra en la figura 3.3.






FIGURA 3.3
Fase 4: Conclusin

Una X de 18,9 est en la zona de aceptacin. Por lo tanto no se rechaza la
hiptesis nula; es decir no existe suficiente evidencia para rechazar la hiptesis
nula. Luego se puede concluir que no es necesario ajustar la mquina.

EJEMPLO 3.3

El departamento de polica de una ciudad de la costa ha encontrado que los
agentes de trfico deben imponer una media de 27 multas de trnsito al mes. Si
un agente impone ms de estas multas, quizs sea demasiado celoso en el
cumplimiento de su deber. Si entrega menos multas puede que el agente no est
haciendo un buen trabajo. Para evaluar a sus agentes, el jefe de polica anot el
nmero de multas impuestas por 15 agentes. Los resultados se muestran a
continuacin. Al nivel del 5% le parece que la fuerza policial cumple
satisfactoriamente su cometido?
28 33 2534 22 3130 32 3131 38 2429 26 25



SOLUCION:

El problema plantea que los agentes deben imponer una media de 27 multas, ni
ms ni menos, entonces el sistema de hiptesis se establece as:

27 :
27 :
0
=
=

A
H
H


Se trata de una prueba bilateral, dado que la hiptesis nula puede ser rechazada,
si los resultados de la muestra estn muy por encima o por debajo de 27. Como
slo se dispone de datos originales, se hace necesario determinar la media y la
desviacin tpica muestral. Los clculos indican que:


Dado que la muestra es pequea el estadstico a utilizar es la prueba t de student,
como n = 15, con una nivel de confianza del 95% y 15 - 1 = 14 grados de libertad,
el valor de t es 2,145
As:
38 , 2 27
) 11 , 1 ( ) 145 , 2 ( 27
=
=
=
C
C
X
H C
X
X
S t X

24,62 --------------29,38
No rechazar la hiptesis nula si la media muestral est entre 24,62 y 29,38 multas.
Rechazar la hiptesis nula si la media muestral es inferior a 24,62 o superior a
29,38.Ver figura 3.4
11 , 1
15
3 , 4
3 , 4
27 , 29
= = =
=
=
n
S
S
S
X
X








FIGURA 3.4

Como la media muestral es de29,27 no se debe rechazar la hiptesis nula de
=27 y se concluye que la fuerza policial cumple satisfactoriamente su cometido.

OBSERVACIONES
1. Si la desviacin tpica de la poblacin es conocida, se utilizar la prueba z, con
independencia del tamao de la muestra, siempre que la poblacin sea normal.
2. Aplicar una prueba t si se cumplen las condiciones siguientes:
a. La muestra es pequea ( n < 30)
b. Se sabe que la poblacin es normal.
c. o es desconocida.
3. Si no se sabe si la poblacin es normal, aplicar una prueba NO
PARAMETRICA, sea o conocida o desconocida.

EJEMPLO 3.4

Como parte de un proceso de ensamblaje, se usa un taladro para hacer agujeros
en una lmina de metal. Cuando el taladro funciona adecuadamente, los
dimetros de estos agujeros tienen una distribucin normal con media 2
centmetros y desviacin tpica 0,06 centmetros. Peridicamente se miden los


dimetros de una muestra aleatoria de agujeros para controlar que el taladro
funciona adecuadamente. Asuma que la desviacin tpica no vara. Una muestra
aleatoria de 9 medidas da un dimetro medio de 1,95 centmetros. Contrastar la
hiptesis nula de que la media poblacional es de dos centmetros.

SOLUCIN:
A pesar de que el tamao de la muestra se puede considerar pequeo, el
estadstico de prueba a usar es Z dado que se conoce la desviacin tpica
poblacional. Se tiene que:
05 , 0 9 06 , 0 2 95 , 1
0
= = = = = o o n X
02 , 0
9
06 , 0
= = =
n
X
o
o

El sistema de hiptesis a contrastar es:
2 :
2 :
0
=
=

A
H
H


Los valores crticos estn dados por
0392 , 0 2
) 02 , 0 ( ) 96 , 1 ( 2
=
=
=
C
C
H
C
X
X
Z X
X
o


1,96 ------------- 2,039

Aceptar X si H
0
est comprendida entre 1,96 y 2,039. Rechazar X si H
0
es
menor que 1.93 o mayor que 2,039. Ver figura 3.5









FIGURA 3.5
Como X = 1,95 < 1,96 se rechaza la hiptesis nula y por lo tanto se concluye que
la media poblacional no es de dos centmetros y que el taladro no funciona
correctamente.

Hasta ahora slo se han considerado situaciones que conducen a hiptesis
bilaterales puesto que la media poblacional era exactamente igual a un
determinado valor especfico, originndose regiones de rechazo a ambos lados de
la curva. Pero tambin se puede presentar problemas en que interese uno slo de
los extremos. Si este es el caso, entonces se originan los sistemas de hiptesis
unilaterales como los tratados al inicio del captulo. La decisin de cul de las dos
colas es la que debe contener la regin de rechazo es algo delicado y depende
nica y exclusivamente del problema en estudio.

Para determinar la manera de identificar y abordar pruebas unilaterales es crucial
determinar qu sistema de hiptesis es el correcto. En primer lugar se observa
que el signo igual aparece en la hiptesis nula de ambos sistemas; esto es:
Sistema 2 Sistema 3
0 0 0 0
: : s > H H


0 0
: : > <
A A
H H

Esto es as porque se considera que con la hiptesis nula se contrasta la
Ausencia de diferencia, es decir, la hiptesis nula implica que el valor real del
parmetro no difiere de forma significativa de su valor hipottico.
Otra explicacin de por qu la hiptesis nula debe contener el signo igual se basa
en que lo que se contrasta es la hiptesis nula, no la alternativa; adems se
contrasta a un nivel de significancia concreto, no se puede contrastar la
afirmacin ambigua
H
> a un nivel de significancia especifico, por ejemplo
1%. La desigualdad
H
> es ambiguo por que no dice el valor preciso de .
Por consiguiente, para que la hiptesis nula se pueda contrastar a un nivel de
significancia especfico ha de contener la precisin que le proporciona el signo
igual.

Para determinar el sistema de hiptesis adecuado se debe prestar atencin a la
formulacin del problema como se muestra en los siguientes ejemplos.

EJEMPLO 3.5

Supngase que en el ejemplo 3.2 la compaa lctea afirma que las latas de
kumis contienen una media de ms de 18 onzas, Si se interpreta correctamente,
ello significa que 18 > , como sta desigualdad no contiene el signo igual, ha de
ser la hiptesis alternativa; mientras que la hiptesis nula ser 18 s . Luego el
sistema de hiptesis se puede formular as:
18 :
0
s H
18 : >
A
H


Pero si la compaa lctea hubiera afirmado que las latas de kumis contienen una
media de 18 onzas o ms, la interpretacin correcta sera 18 > , como esta
desigualdad contiene el signo igual se convierte en la hiptesis nula y el sistema
de hiptesis pasara a ser:
18 :
18 :
0
<
>

A
H
H

Una vez establecido el sistema de hiptesis adecuado, es conveniente determinar
en qu extremo de la curva se encuentra la regin de rechazo. Para ello basta con
responder la pregunta Qu provocar el rechazo de la hiptesis nula?
Considrese el sistema de hiptesis:

18 :
18 :
0
>
s

A
H
H


Escrita de esta forma, la hiptesis nula no permite utilizar valores pequeos para
la media. Establece claramente que la media es igual o menor que 18 onzas. Los
valores menores que 18, apoyarn y no refutarn la hiptesis nula. Los resultados
a la izquierda de 18 confirmarn la hiptesis nula de que es igual o menor que
18. As pues, son slo valores superiores a 18 los que dan lugar al rechazo de la
hiptesis nula. Por lo tanto, la regin de rechazo se encuentra en el extremo
derecho o superior de la distribucin. Esta prueba de cola a la derecha se ilustra
en la figura 3.6.







FIGURA 3.6

El valor crtico de la media muestral que marca una diferencia significativa con
hipottica limita la regin de rechazo en la cola derecha. La frmula de este valor
crtico en una prueba de cola a la derecha es:

En el caso de que la compaa lctea hubiera indicado que la media fuera 18 o
ms. El sistema de hiptesis sera entonces:

18 :
18 :
0
<
>

A
H
H


Para determinar que extremo de la curva es el que contiene la regin de rechazo
habr que volver a contestar la pregunta Qu podra causar el rechazo de la
hiptesis nula? Tal como se ha indicado, la hiptesis nula admite que existen
valores grandes de la media muestral mayores de 18 que apoyarn y no refutarn
la hiptesis nula. As pues, son los valores significativamente inferiores a 18 los
que provocaran un rechazo de la hiptesis nula. La regin de rechazo estar
solamente en el extremo inferior o izquierdo de la distribucin. Esta prueba de
cola a la izquierda se muestra en la figura 3.7










FIGURA 3.7

El valor crtico de la media muestral que marca una diferencia significativa con la
hipottica, limita la regin de rechazo en la cola izquierda. La frmula de este
valor crtico es:



OBSERVACIONES

Es bueno recordar que para rechazar una prueba unilateral se deben tener en
cuenta las siguientes recomendaciones:

1. Si la interpretacin correcta de la formulacin tiene el signo igual, esta es la
hiptesis nula; si no contiene el signo igual, es la hiptesis alternativa.

2. La cola que contiene la regin de rechazo viene indicada por el smbolo de
desigualdad de la hiptesis alternativa.

EJEMPLO 3.6




Un concesionario de autos afirma que los propietarios de sus coches usados
pueden recorrer una media de 10.000 millas como mnimo sin necesidad de
ninguna reparacin. Con objeto de determinar el grado de honestidad del gerente
se eligen 100 clientes y se halla que recorrieron una media de 9.112 millas sin
reparacin, con una desviacin estndar de 207 millas. Se quiere estar seguro al
99% de que el gerente no miente. Cmo podra contrastar su afirmacin?

SOLUCIN

Como la media de 10.000 millas como mnimo se puede escribir 000 . 10 > y
esta desigualdad contiene el signo de igualdad, se convierte en la hiptesis nula,
luego el sistema de hiptesis adecuado es:

000 . 10 :
000 . 10 :
0
<
>

A
H
H


Segn la hiptesis alternativa se requiere una prueba de cola a la izquierda. El
valor crtico es entonces:
X
H
C S Z X = ; 000 . 10 =
H

7 , 20
100
207
= = =
n
S
S
X


El valor de Z es 0,5 0,01 = 0,4900 al buscar este valor en la tabla 1 del
apndice da un valor de 2,33 luego:
millas X
X
X
C
C
C
952 . 9
23 , 48 000 . 10
) 7 , 20 ( ) 33 , 2 ( 000 . 10
=
=
=



No rechazar la hiptesis nula si la media muestral es superior a 9.952 millas.
Rechazar la hiptesis nula si la media muestral es inferior a 9.952 millas. Ver
figura 3.8





FIGURA 3.8
Como X = 9.112 es menor que 9.952 rechazamos la hiptesis nula. Lo que
nos indica que la afirmacin no es cierta. Por tanto el gerente del concesionario
est mintiendo.
EJEMPLO 3.7

Si en el ejemplo anterior el gerente en cambio de afirmar que los clientes pueden
recorrer 10.000 millas como mnimo, afirma que pueden recorrer ms de 10.000
millas por trmino medio; con la dems informacin del ejemplo 3.6 y el mismo
nivel de significancia contraste la hiptesis para probar la honestidad del
empresario.

SOLUCIN:
Ms de 10.000 millas por trmino medio se pueden expresar con la siguiente
desigualdad 000 . 10 > que representa la hiptesis alternativa, el sistema de
hiptesis es entonces:
000 . 10 :
000 . 10 :
0
>
s

A
H
H

Ahora la prueba es de cola a la derecha (Ver figura 3.9). Se tiene que:


% 1 7 , 20 207 112 . 9 100 = = = = = o
X
S S X n
Luego:
X
H
C S Z X + =
millas X
X
X
C
C
C
2 , 048 . 10
23 , 48 000 . 10
) 7 , 20 ( ) 33 , 2 ( 000 . 10
=
+ =
+ =





FIGURA 3.9
No rechazar la hiptesis nula si la media muestral es menor que 10.048,2 millas.
Rechazar la hiptesis nula si la media muestral es superior a 10.048,2 millas.

Como X =9.112 es menor que 10.048, no se rechaza la hiptesis nula de
000 . 10 s . Se rechaza la afirmacin del gerente de que 000 . 10 > ,
confirmndose la deshonestidad del empresario.

EJEMPLO 3.8

Un Fabricante de detergentes afirma que el contenido de los paquetes que vende
pesa, por trmino medio, al menos 200 gramos. Se sabe que la distribucin de los
pesos es normal, con desviacin tpica de 4 gramos. Una muestra aleatoria de 16
paquetes da un peso medio de 198,4 gramos. Con un nivel de significancia del
10% Tiene razn el fabricante?



SOLUCION:

A pesar de que la muestra es pequea, se puede utilizar como estadstico de
prueba Z dado que la distribucin es normal y se conoce la desviacin tpica
poblacional.
16 % 10 4 4 , 198 = = = = n grs X o o
1
16
4
= = =
n
x
o
o

La afirmacin al menos 200 gramos se puede expresar en el lenguaje de las
desigualdades as: 200 > que es la hiptesis nula, luego el sistema queda:
200 :
200 :
0
<
>

A
H
H

De la hiptesis alternativa se deduce que es una prueba de cola a la izquierda
(Ver figura 3.10), por tanto, el valor crtico se encuentra utilizando la frmula
72 , 198
28 , 1 200
) 1 ( ) 28 , 1 ( 200
=
=
=
=
C
C
C
X
H
C
X
X
X
Z X o






FIGURA 3.10



Como 198,4 es menor que 198,6 se rechaza la hiptesis nula de que 200 > y en
consecuencia se puede decir que el fabricante no tiene la razn.

Cuando no se dispone de muestras grandes y se sabe que la distribucin es
normal y se desconoce la desviacin tpica poblacional, hay que utilizar la prueba t
de student. La frmula de C X se convierte en

izquierda la a cola de ueba S t X
derecha la a cola de ueba S t X
X
H
C
X
H
C
Pr
Pr
=
+ =


Esto se ilustra en los siguientes ejemplos:

EJEMPLO 3.9

Una compaa que recibe cargamento de pilas tiene como poltica aceptar el envo
si el tiempo medio de vida de las pilas del cargamento es como mnimo de 50
horas. Para un cargamento en particular, el tiempo medio de vida en una muestra
aleatoria de 9 pilas fue de 48,2 horas con una desviacin tpica de 3 horas, si se
considera un nivel de significancia del 5% qu se podra decir de la aceptacin de
este lote.

SOLUCIN:

Aqu se tiene una muestra pequea, por lo que el estadstico t es el adecuado. La
frase como mnimo 50 horas se puede escribir 50 > esta desigualdad que
contiene el signo igual se convierte en la hiptesis nula, el sistema es pues:


X
H
C S t X =
50 :
50 :
0
<
>

A
H
H


La hiptesis alternativa indica que es una prueba de cola a la izquierda por lo que
el valor crtico se calcula con el uso de la frmula:

La tabla 2 del apndice muestra que el valor de t para o = 5% y 9 - 1 = 8 grados
de libertad es:
86 , 1
) 8 ( 05 , 0
= t
Ademas, 1
9
3
= = =
n
S
S
X

As :
14 , 48
86 , 1 50
) 1 ( ) 86 , 1 ( 50
=
=
=
C
C
C
X
X
X


Como X = 48,2 es mayor que 48,14 no se rechaza la hiptesis nula. Esto nos
indica que no hay suficiente evidencia para rechazar el envo. Ver FIGURA 3.11
FIGURA 3.11



libras X
X
X
S t X
C
C
C
X
H
C
06 , 31
06 , 1 30
) 62 , 0 ( ) 711 , 1 ( 30
=
+ =
+ =
+ =
EJEMPLO 3.10

El gerente de una empresa dedicada al transporte de encomiendas teme que el
peso medio de sus envos sea superior a 30 libras. Este supuesto es indeseable
porque cualquier peso superior implica costos de envo adicional. Si el contraste
de hiptesis sugiere que el peso medio es superior a 30 libras, la empresa revisar
su procedimiento de embalaje. Para determinar el peso medio de todos los envos
de la empresa, se eligen al azar 25 rdenes. La media muestral es de 32,1 libras
con una desviacin tpica de 3,1 libras.

Formular la hiptesis para la empresa y realizar la prueba con 05 . 0 = o

SOLUCION:

Como ser superior a 30 libras se escribe 30 > , esta desigualdad se trata de
la hiptesis alternativa, puesto que no contiene el signo de igualdad. Entonces:
30 :
30 :
0
>
s

A
H
H

Se requiere una prueba de cola a la derecha con 25 -1 = 24 grados de libertad.
Para una prueba unilateral 711 , 1
) 24 ( 05 , 0
= t

Luego el valor crtico es:





No rechazar la hiptesis nula si la media muestral es inferior a 31,06. Rechazar la
hiptesis nula si la media muestral es superior a 31,06. Ver grfico 3.12




FIGURA 3.12

Como X = 32,1 es mayor que 31,06, lo probable es que sea mayor que 30 y
se rechaza la hiptesis nula de 30 s . La empresa deber tomar medidas para
reducir el peso de sus expediciones y evitar costos de envos excesivos.

3.6 PRUEBA DE HIPTESIS PARA PROPORCIONES

Cuando se trata de una proporcin las observaciones cumplen una determinada
especificacin, as el inters no se centra en la media de la poblacin, sino en el
tanto por ciento de sta que cumplen o dejan de cumplir dicha especificacin. La
prueba de proporciones poblacionales sigue el mismo esquema establecido como
se muestra en los siguientes ejemplos:

EJEMPLO 3.11

ApexCompany supone que el 15% de las mercancas que producen por un nuevo
mtodo son defectuosas. En una muestra de 132 unidades hay 22 defectuosas.
Con un nivel de significancia del 10% Qu se puede decir de la suposicin de
ApexCompany?



SOLUCION:
El sistema de hiptesis es:
15 . 0 :
15 . 0 :
0
=
=
t
t
A
H
H

031 , 0
132
) 85 . 0 ( ) 15 , 0 (
= =
P
o

Como 0,90/2 = 0.45 se obtiene de la tabla el valor de Z = 1,65 Luego:

05 , 0 15 , 0
) 65 , 1 ( ) 031 , 0 ( 15 , 0
=
=
=
C
C
P H C
P
P
Z P o t

2 . 0 1 , 0 =
C
P
No rechazar H
o
si la proporcin muestralP
x
est entre 0,10 y 0,20. Rechazar la
hiptesis H
o
si P
x
es inferior a 0,10 o superior a 0,20
17 , 0
132
22
= =
x
P
Como P
x
= 0,17 est entre 0,10 Y 0,20, no se rechaza la hiptesis nula. Puede
decirse entonces que efectivamente el 15% de las mercancas producidas por la
compaa son defectuosas.

EJEMPLO 3.12

Suponga que ha estado trabajando en una empresa de publicidad durante 5 aos.
Ahora piensa crear su propia empresa, pero le preocupa si perder muchos de los
actuales clientes. Decide que slo se establecer por su cuenta si el 30% como
mnimo de las cuentas que ahora gestiona le siguen a su nuevo negocio. Para


comprobarlo, encuentra que 14 de 54 cuentas que toma como muestra expresan
su deseo de acompaarle si funda su empresa. Al nivel del 7%. Deber fundar
su propia empresa?

SOLUCION:
062 , 0
54
) 70 , 0 ( ) 30 , 0 ( ) 1 (
30 , 0 54 26 . 0
54
14
07 . 0
= =

=
= = = = =
n
P n P
H H
P
H x
t t
o
o


El 30% como mnimo se puede expresar como 30 . 0 > t que es la hiptesis nula,
luego el sistema a contrastar es:

30 . 0 :
30 , 0 :
0
<
>
t
t
A
H
H

La hiptesis alternativa indica una prueba de cola a la izquierda. El valor crtico se
determina al reemplazar en la frmula
P H C
Z P o t :
Donde la tabla del apndice 1 muestra un valor de Z = 1,48
Luego
21 . 0
092 , 0 30 . 0
) 062 , 0 ( ) 48 , 1 ( 30 . 0
=
=
=
C
C
C
P
P
P


No rechazar la hiptesis nula si la proporcin muestral es superior a 0,21.







FIGURA 3.13

Como 0.26 > 0.21 no se rechaza la hiptesis nula, esto nos indica que puede
fundar su propia empresa.

EJEMPLO 3.13

En sus funciones de analista de marketing recin contratado por RAMM Industrias
se le encarga garantizar que ms del 10% de la poblacin conozca su nueva lnea
de productos. De 300 personas encuestadas 36 manifestaron conocerla. Con un
nivel de significancia de o = 4%, ha cumplido usted con su trabajo?

SOLUCION:

Ms del 10% se puede expresar . Como esta desigualdad no contiene
el signo de igualdad se convierte en la hiptesis alternativa, luego el sistema de
hiptesis es:
10 . 0 :
10 . 0 :
0
>
s
t
t
A
H
H

La hiptesis alternativa indica que es una prueba de cola a la derecha, por tanto el
valor crtico se calcula con la expresin
P H C
Z P o t + =
12 , 0
300
36
04 . 0 10 . 0 = = = =
x H
P o t


017 . 0
300
) 9 . 0 ( ) 10 . 0 ( ) 1 (
= =

=
n
H H
P
t t
o

El valor de Z para 4%, (0.5 - 0.04 = 0.46) segn la tabla 1 del apndice es igual
a 1,75, As:
13 , 0
030 , 0 10 , 0
) 017 , 0 ( ) 75 , 1 ( 10 . 0
=
+ =
+ =
C
C
C
P
P
P

Rechazar la hiptesis nula si la proporcin muestral es superior a 0,13.
Como 0,12 < 0,13 no se rechaza la hiptesis nula, esto nos indica que no se ha
cumplido con lo encomendado.


3.7 PRUEBA DE HIPTESIS PARA LA DIFERENCIA ENTRE DOS
MEDIAS POBLACIONALES

Hasta ahora se han manejado situaciones en las que interviene una sola
muestra. Examinaremos ahora el caso en que se dispone de muestras aleatorias
de dos poblaciones, y en el que el parmetro de inters consiste en la diferencia
entre las dos medias poblacionales. En los procedimientos que se desarrollaran
para contrastar este tipo hiptesis, la metodologa adecuada depende de la
manera en la que se tomaron las muestras
9
, es as como se necesita considerar
separadamente los casos de los pares asociados y las muestras independientes.

3.7.1 CONTRASTE DE HIPOTESIS - MUESTRA PAREADA

9
PAUL NEWBOLD. Estadstica para los Negocios y la economa. Espaa, Prentice Hall 1997, p308




Se entiende por muestra pareada, llamada tambin de pares coincidentes, un
procedimiento en el cual se hace coincidir varias parejas de observaciones con la
mayor exactitud posible en las caractersticas de inters. Los dos conjuntos de
observaciones slo difieren en un aspecto o tratamiento, cualquier diferencia
posterior de los dos grupos se atribuye a ese tratamiento.

Supngase que se dispone de una muestra aleatoria de n pares de
observaciones ( )
i i
y x , , de dos poblaciones con medias
B A
y . Se denota por
2
d a
S por y d la media y la varianza observada para las n diferencias ( )
i i
y x ,
los cuales estn dados por:
n
d
d
i
a

= Media de las diferencias en observaciones pareadas.


1
2
2
2

n
d n d
S
a i
d
Varianza de las diferencias en observaciones pareadas

Cuando se hace contraste de hiptesis con muestras pareadas por lo general se
trabaja con muestras pequeas, en este caso el valor crtico est dado por:
n
S
t d
d
C
= Diferencia crtica en la media de observaciones pareadas.

Para llevar a cabo un contraste de hiptesis para muestras pares se sigue el
mismo procedimiento visto para los contraste de una poblacin.

EJEMPLO 3.14



Una corporacin ofrece cursos de preparacin a los estudiantes para superar
exmenes. Como parte de un experimento para evaluar la eficiencia del curso, se
elige doce estudiantes y se dividen en 6 parejas, de manera que los dos miembros
de cada pareja tengan similares expedientes acadmicos. Antes de realizar el
examen, se elige aleatoriamente un miembro de cada pareja para asistir al curso
de preparacin. La siguiente tabla muestra las puntuaciones conseguidas en el
examen.

PAREJA DE ESTUDIANTES ASISTE NO ASISTE
1
2
3
4
5
6
82
73
59
48
69
93
75
71
52
46
70
83

Asumiendo que las diferencias en las puntuaciones sigue una distribucin normal,
contrastar al nivel de significancia del 5% que la media de los puntajes es mayor
para los estudiantes que asisten al curso de preparacin.

SOLUCION:
Fase 1. Formulacin de la hiptesis
Sea
n preparaci de curso al asisten asisten no que s estudiante los de media la
n preparaci de curso al asisten e qu s estudiante los de media la
B
a



La media es mayor para los estudiantes que asisten al curso de preparacin se
puede escribir como
B A
> . Cmo esta desigualdad no contiene el signo igual,
se convierte en la hiptesis alternativa. El sistema a contrastar es:



B A A
B A
H
H


>
s
:
:
0
Que corresponde a una prueba unilateral a la derecha.

Fase 2:Clculo del valor crtico
El valor crtico se obtiene con el uso de la frmula
n
S
t d
d
C
+ =
Parejas de estudiantes Asiste No asiste
i
d
2
i
d
1
2
3
4
5
6
82
73
59
48
69
93
75
71
52
46
70
83
7
2
7
2
-1
10
49
4
49
4
1
100
SUMATORIA 27 207
13 , 4 1 , 17
1 , 17
5
5 , 85
5
) 5 , 4 ( 6 207
1
5 , 4
6
27
2
2
2
2
= =
= =

=
= = =

d
a i
d
i
a
S
n
d n d
S
n
d
d

Con 05 . 0 = o y 6 -1 = 5 grados de libertad el valor de t es:
4 , 3
6
13 , 4
015 , 2
015 , 2
5 ; 05 . 0
=
|
.
|

\
|
=
+ =
=
C
C
d
c
d
d
n
S
t d
t





FIGURA 3.14
Fase 3: Regla de decisin
No rechazar H
0
si , 39 , 3 < a d rechazar la hiptesis nula si
a
d > 3,39

Fase 4: Conclusin
Como 39 , 3 5 , 4 > =
a
d se rechaza la hiptesis nula y se concluye que la media es
mayor para los estudiantes que asisten al curso de preparacin.


3.7.2 CONTRASTE DE HIPTESIS EN MUESTRAS INDEPENDIENTES

Cuando se toman muestras independientes, no es preciso hacer ningn esfuerzo
para que coincidan las observaciones de una muestra con las otras. A diferencia
de las muestras pareadas, las muestras independientes no tienen por qu ser del
mismo tamao.

Al contrastar hiptesis de dos poblaciones distintas con muestras independientes
Las muestras independientes, son muestras aleatorias tomadas de dos
poblaciones distintas.
DIFERENCIA CRTICA: Diferencia entre dos medias mustrales que es demasiado
grande para que pueda atribuirse al azar de la extraccin. Por el contrario, se
puede decir que las medias mustrales difieren en una cantidad tan grande por
que preceden de poblaciones dismiles que tiene medias desiguales.


se sigue el mismo procedimiento estudiado hasta ahora teniendo en cuenta los
siguientes elementos adicionales.

Cuando las varianzas poblacionales son conocidas, la diferencia crtica se halla
por medio de la frmula:
B A
X X
c
Z d

= o
Diferencia crtica entre medias muestrales.
B A
X X
o Es el error tpico de la diferencia entre las dos medias muestrales.
La frmula de clculo es:

.
2 2
muestrales medias dos entre diferencia la de tpico Error
n n
B
B
A
A
X X
B A
o o
o + =


Donde
2 2
B A
y o o son las varianzas de las dos poblaciones y
B A
n y n
Son los dos tamaos mustrales.

Para llevar a cabo la prueba se compara la diferencia real entre las medias
mustrales,
B A a
X X d = con la diferencia crtica
C
d

EJEMPLO 3.15

El CITIBANK quiere comparar el nivel medio de las cuentas de ahorro abiertas en
Bancos comerciales de Amrica con los de Europa. Muestras de 230 Bancos de
ERROR TPICO DE LA DIFERENCIA ENTRE DOS MEDIAS MUESTRALES
Si se toman varios pares de muestras de dos poblaciones, las diferencias entre
las medias de los pares de muestra varan. El error tpico mide esa variacin.


Amrica y 302 de Europa tienen medias de
A
X =1.512 dlares y
E
X =1.317
dlares, respectivamente. Se sabe que la desviacin tpica en las cuentas de
ahorro son de dlares y dlares
E A
485 517 = = o o . Contrastar la hiptesis nula de
que no hay diferencia de ahorros medios al nivel del 5%.

SOLUCIN:

No hay diferencia de ahorros medios se puede escribir como
E A
= que se
convierte en la hiptesis nula, el sistema a contrastar es:

E A A
E A
H
H


=
=
:
:
0

La diferencia crtica se calcula con la frmula

( ) ( )
06 , 44
302
485
230
517
2 2 2 2
= + = + =
=

E
E
A
A
X X
X X
C
n n
Z d
E A
E A
o o
o
o

El valor de Z para = o 0,05 en una prueba bilateral es 1,96.
Luego 34 , 86 ) 05 , 44 ( ) 96 , 1 ( =
C
d




FIGURA 3.15

Regla de decisin:
No rechazar la hiptesis nula si: - 86,34 <
a
d < 86,34

Ahora 195 317 . 1 512 . 1 = = =
E A a
X X d

Como
C a
d d > se rechaza la hiptesis nula. Los datos sugieren que el nivel
medio de ahorro en los dos continentes es diferente


EJEMPLO 3.16

Una empresa fabricante de camisas para hombres tiene dudas sobre el tiempo
medio necesario para fabricar sus dos modelos: clsico e informal. El jefe de
produccin afirma que lleva ms tiempo producir las camisas clsicas que fabricar
las informales. Los datos de produccin indican que para fabricar 90 camisas
clsicas se requiri una media de 140,2 horas con una desviacin tpica de 22,7
horas, mientras que para fabricar 110 camisas informales se tard una media de
131,7 horas con una desviacin tpica de 23,9 horas. Si el jefe de produccin tiene
razn, abandonarn la produccin de las camisas clsicas. Se deber hacer un
cambio en la lnea de produccin?

SOLUCION:



Como las varianzas poblacionales son desconocidas, se utilizan las varianzas
mustrales como estimaciones y el error tpico de la diferencia entre medias
mustrales se estimar por la frmula:
I
I
C
C
X X
n
S
n
S
S
I C
2 2
+ =



La diferencia crtica se convierte en
I C
X X
C
S Z d

=

Como el jefe de produccin afirma que lleva ms tiempo producir las camisas
clsicas
, C
que las informales
I
, se puede escribir
I C
> , y como esta
desigualdad no contiene el signo igual se toma como hiptesis alternativa y el
sistema es:
I C A
I C
H
H


>
s
:
:
0

Que exige una prueba de cola a la derecha.

El valor de Z correspondiente a una prueba unilateral con 65 , 1 05 , 0 = = Z es o

El valor crtico se obtiene reemplazando en la frmula
I C
X X
C
S Z d

=
30 , 3
110
) 9 , 23 (
90
) 7 , 22 (
2 2
= + =

I C
X X
S
45 , 5 ) 30 , 3 ( ) 65 , 1 ( = =
C
d



FIGURA 3.16

Regla de decisin: no rechazar la hiptesis nula si . 45 , 5 <
a
d
Como 5 , 8 7 , 131 2 , 140 = = = I
C a
X X d es mayor que 45 , 5 =
C
d se rechaza la
hiptesis nula y el argumento del jefe de produccin queda respaldado, las
camisas clsicas deben dejar de fabricarse.


Consulte en internet las siguientes pginas:
http://www.youtube.com/watch?v=AJcy4eZMwWM
http://www.itch.edu.mx/academic/industrial/estadistica1/cap02.html
http://www.virtual.unal.edu.co/cursos/ciencias/2001091/html/un6/cont_601_54.html









Resumen
El contraste de hiptesis, es un procedimiento que puede emplearse para
verificar, con base en la informacin muestral, la validez de una conjetura o
hiptesis, que se haya formulado sobre la poblacin.

La hiptesis que se contrasta se llama Hiptesis nula (Ho) y con la que se
contrasta, hiptesis alternativa (Ha).

La hiptesis opuesta sobre el valor de una media poblacional, , se indica por lo
general en una de tres formas con referencia a un valor especfico
0
.

FORMA 1 FORMA 2 FORMA 3
0
0 0
:
:


=
=
A
H
H

Prueba bilateral
0
0 0
:
:


<
>
A
H
H

Prueba unilateral
0
0 0
:
:


>
s
A
H
H

Prueba unilateral

Las hiptesis opuestas sobre la diferencia entre dos medias poblacionales
B A
y se indican del mismo modo sealado.


FORMA 1 FORMA 2 FORMA 3


B A A
B A
H
H


=
=
:
:
0

Prueba bilateral
B A A
B A
H
H


<
>
:
:
0

Prueba unilateral
B A A
B A
H
H


>
s
:
:
0

Prueba unilateral

Las hiptesis opuestas sobre la proporcin poblacional se indican del mismo
modo sealado.

Un estadstico de prueba es aquel valor calculado a partir de los datos
mustrales en una prueba de hiptesis para establecer si se rechaza o no se
rechaza la hiptesis nula. Entre ellos tenemos:
X
X
Z
o

0

=

Para una media poblacional Muestras grandes

X
S
X
t
0

= Para una media poblacional Muestras pequeas
P
x
P
Z
o
t
0

= Para una proporcin de la poblacin


La regla de decisin es un enunciado que se emite para determinar si se rechaza
la hiptesis nula. Especfica el valor crtico de los resultados mustrales; que se
determina con las expresiones:
Para pruebas bilaterales
X
H C
S Z X =
X
H C
S t X =
P H C
Z P o t =



Para pruebas unilaterales
X
H
C S Z X + =
X
H C
Z X o =
X
H C
S t X + =
X
H C
S t X =
P H C
Z P o t + =
P H C
Z P o t =



1. Un fabricante ha estado recibiendo quejas de sus clientes por que los pedidos
llegan 12 o ms das despus de haber sido enviados. El fabricante selecciona
al azar 25 de los pedidos de la semana siguiente y los enva de una manera
diferente. Un estadstico ha de probar si el nuevo procedimiento es mejor, a un
nivel de significancia de o = 0.05. El tiempo medio de entrega en la muestra
resulta de X =10, con una desviacin estndar muestral de s = 3 das. Haga la
prueba.

2. La administracin federal de aviacin cree que el nmero de despegues y
aterrizajes en aeropuertos en los Estados Unidos el ao pasado fue de 50 por
da. Elabore una propuesta de hiptesis adecuada de esta creencia en el nivel
de significancia de o = 0.01, y use estos datos mustrales: n = 100, X = 71,
s = 30 (hay 13.000 aeropuertos en los Estados Unidos).

3. Un gerente desea probar la resistencia a la tensin del hilo que ha de usarse
en las nuevas mquinas de su compaa, la cual debe ser de por lo menos 25
libras. Se toma una muestra aleatoria de 16 carretes de varias remesas de
entrada al almacn cuya resistencia promedio es de 24 libras, con una
desviacin estndar de 0.5 libras. Haga una prueba de hiptesis a un nivel de
significancia de o = 0.10 y diga si el hilo es apropiado.

4. Un economista desea probar si el salario promedio de mecnicos de aviacin
en EEUU es en realidad de 600 dlares por mes, como se ha estado diciendo.
Se toma una muestra aleatoria de n = 100 de los 29.952 mecnicos de
aviacin del pas; el nivel de significancia deseado es de o = 0.05. La muestra


indica un salario medio de 675 dlares mensuales y una desviacin estndar
de 32 dlares. Haga la prueba.

5. Cuando funciona correctamente, un proceso produce frascos de champ cuyo
contenido pesa, en promedio, 200 gramos. Una muestra aleatoria de 9 frascos
de una remesa present los siguientes pesos (en gramos) para el contenido:
214 197 197 206 208 201 197 203 209
Asumiendo que la distribucin de la poblacin es normal, contrastar al nivel del
5%, la hiptesis nula de que el proceso est funcionando correctamente frente
a la alternativa bilateral.

6. Un distribuidor de cerveza afirma que una nueva presentacin, que consiste
en una fotografa de tamao real de un atleta muy famoso, incrementar las
ventas del producto en los supermercados en una media de 50 cajas
semanales. Para una muestra de 20 supermercados, el incremento medio en
las ventas fue de 41,3 cajas con una desviacin tpica de 12,2 cajas.
Contrastar, al nivel del 5%, la hiptesis nula de que la media poblacional del
incremento en las ventas es al menos de 50 cajas, indicando cualquier
supuesto que se haga.

7. Un funcionario que trabaja en el departamento de colocacin de una
Universidad, quiere determinar si los hombres y las mujeres graduados en
Administracin de Empresas reciben, en promedio, diferentes ofertas de
salarios en su primer trabajo despus de graduados. El funcionario seleccion
aleatoriamente 8 pares de egresados en esa disciplina de manera que las
calificaciones, intereses e historia de los integrantes de cada pareja fuesen lo
ms parecido posible. La mayor diferencia fue que un miembro de cada pareja


era hombre y el otro mujer. La tabla adjunta recoge la mayor oferta salarial
que recibi cada miembro de la muestra al terminar su carrera. Asumiendo que
las distribuciones son normales contrastar la hiptesis de que la verdadera
media es mayor para los hombres que para las mujeres.












8. Su empresa ha determinado en el pasado que el 53% exactamente de la gente
de su rea de marketing prefieren su producto. Se han gastado varios millones
de pesos en una campaa publicitaria para aumentar su participacin en el
mercado. Una muestra de 622 personas tomada despus de la campaa
revela que 346 prefieren su producto. Al nivel de significancia del 4%, se
podr concluir que se ha invertido bien el dinero en publicidad?

9. En calidad de nuevo directivo en formacin de la empresa KAM, su jefe le ha
encomendado que determine si los envos de la factora salen a tiempo. Usted
decide contrastar la hiptesis de que por lo menos el 95% de los pedidos
cumplen con los requisitos de plazo. Para guardar las espaldas, fija un nivel de
significancia del 1% y selecciona una muestra de 112 pedidos y encuentra que
8 de ellos se han retrasado. Qu le dira a su jefe?

PAREJA MAYOR OFERTA SALARIAL (Miles de pesos)

1
2
3
4
5
6
7
8
HOMBRE
1524
1472
1568
1586
1434
1446
1572
1524
MUJER
1586
1540
1566
1590
1486
1596
1608
1588


10. Una revista especializada en computacin afirma que la gente tarda mximo34
horas, en promedio, en aprender un nuevo programa informtico. Est esta
afirmacin respaldada al nivel del 10% si 35 personas tardaron en aprender el
programa un promedio de 38,6 horas con una desviacin estndar de15,8
horas?

11. En un proceso de produccin de su empresa tienen que llenarse botellas de
agua pura mineral por lo menos con 16,2 onzas. En caso contrario, el proceso
se interrumpe mientras se hacen los ajustes necesarios. Como estadstico
oficial de la empresa, se le ha asignado la responsabilidad de determinar, con
una confianza del 99%, si el proceso funciona como es debido. En una muestra
de 24 botellas se halla que el peso medio del contenido es de 15,7 onzas y la
desviacin estndar de 3,7 onzas.

Deber ordenar que el proceso se detenga para realizar los ajustes?
12. The government of a wealthy country intends to institute a program to
discourage investment in foreign countries by its citizens. It is known that in the
past 35% of the countrys adult citizens held investment in foreign countries.
The government wishes to determine if the current percentage of adult citizens,
who own foreign investment is greater than this long term figure of 35%. A
random sample of 800 adults is selected, and it is found that 320 of these
citizens hold foreign assets. Is this percentage greater than 35%? Use a 10%
significance level for testing this claim
10





10
Mohammed A. Shayib, Applied Statistics, bookboon.com, 2013, 172




1. Un fabricante de detergente afirma que el contenido medio de los paquetes
que vende es de al menos 200 gramos. Se sabe que la distribucin de los
pesos es normal, con desviacin tpica de cuatro gramos. Una muestra de
16 paquetes da una media de 198,4 gramos. Para realizar el contraste de
hiptesis, al nivel del10%, el sistema requerido es:

A.

>
s
200 :
200 :
0

A
H
H
B.

=
=
200 :
200 :
0

A
H
H

C.

<
>
200 :
200 :
0

A
H
H
D.

s
>
200 :
200 :
0

A
H
H


2. El error tpico de la distribucin muestral del ejercicio 1 es:

A. 12.5 B. 50
C. 0,25 D. 1

3. De una muestra de 361 propietarios de pequeas empresas que
quebraron, 105 no tuvieron asesora profesional antes de abrir el negocio.
Para contrastar la hiptesis nula de que como mucho el 25% de todas estas
pequeas empresa no tuvo asesora profesional antes de abrir el negocio,
el sistema de hiptesis requerido es:


A.

>
s
25 , 0 :
25 , 0 :
0

A
H
H
B.

=
=
25 , 0 :
25 . 0 :
0

A
H
H

C.

<
>
25 , 0 :
25 , 0 :
0

A
H
H
D.

<
>
25 :
25 :
0

A
H
H


4. El error tpico aproximado de la distribucin muestral del ejercicio 2 es:

A.0,240 B. 0,024
C. 0,283 D. 0,239

5. En un contraste de hiptesis cuyo sistema a contrastar es

>
s
200 :
200 :
0

A
H
H
y
se ha obtenido una media X y punto crtico c X
__
, se rechaza la hiptesis
nula si:

A. c X X
__
< B. cSup cInf X X X
__ __
< <
C. c X X
__
> D. c X X
__
=











http://www.virtual.unal.edu.co/cursos/ciencias/2007315/html/un6/cont_08_69.html





PRESENTACION


Existen muchos casos en la teora econmica y en el campo de la administracin
en los que se hace indispensable el uso del anlisis y correlacin como
herramienta fundamental para la constatacin de teoras relacionadas con la
naturaleza de las variables en la verificacin de la dependencia de una con
respecto a otra, y de esta forma hacer estimaciones y predicciones partiendo de
observaciones de la misma empresa.
En este captulo se presentan algunos conceptos fundamentales de anlisis de
regresin; utilizando como ayuda el modelo de regresin lineal en dos variables,
en el cual, la variable dependiente se expresa como una funcin lineal de una sola
variable independiente.

PREGUNTA PROBLEMA
Cmo crees que el anlisis de regresin lineal puede aplicarse en la solucin
de situaciones especficas de una empresa?

COMPETENCIAS ESPECFICAS


Establece inferencia acerca de los parmetros estimados


1. Interpreta correctamente los conceptos bsicos del anlisis de regresin
lineal simple.

2. Utiliza el mtodo de mnimos cuadrados ordinarios (MCO), para la
estimacin de los parmetros del modelo de regresin en dos variables.
3.


SABERES
- Interpretacin de la regresin, terminologa y notacin
- Estimacin por mnimos cuadrados
- Verificacin de hiptesis, capacidad explicativa de una funcin de regresin


DINMICA PARA CONSTRUIR EL CONOCIMIENTO
ACTIVIDAD PREVIA (Trabajo Individual)
1. De las siguientes, es una ecuacin lineal:
A. 1 2 3 2 = xy y x B. 2 3 2
2
= y y x
C. x y x 4 3 2 3 = + D. 5
3
= y x

2. En la ecuacin lineal 6 4 2 = y x la pendiente es:
A. 0,5 B. 1,5
C. -0,5 D. -1,5

3. En una ecuacin lineal, la pendiente representa:

A. El incremento de la variable independiente con respecto a la variable
dependiente.
B. El incremento de la variable dependiente con respecto a la variable
independiente.
C. El intersecto con el eje X.
D. El intersecto con el eje Y.





4. Estimar la regresin lineal de Y sobre X, consiste en:

A. Determinar el intersecto con el eje Y.
B. Determinar el intersecto con el eje X.
C. Determinar la pendiente y la constante de regresin.
D. Determinar el coeficiente de determinacin.

ACTIVIDA GRUPAL
Socialice los resultados obtenidos individualmente y escriba sus
conclusiones al respecto.
Redacte un informe sobre la importancia de la aplicacin de la regresin
lineal en que hacer de su profesin.
Escriba un listado de las dudas y dificultades en el desarrollo de la actividad
individual.













SABERES Y ACTIVIDADES

4. REGRESION LINEAL SIMPLE


Es comn que los economistas y administradores de empresa estn interesados
en la forma en que dos variables estn relacionadas. En general, cualquier estudio
econmico o empresarial debe comenzar con un conjunto de proposiciones que
emanan de la teora econmica y que el analista est interesado en constatar. Las
funciones de demanda de produccin son ejemplos claros de relaciones sobre las
que se puede estar interesado en constatar determinadas propiedades.

Se comenzar por la forma ms simple de regresin, que es la relacin lineal entre
dos variables.


4.1 INTERPRETACIN DE LA REGRESIN

En trminos generales se puede decir que: El anlisis de regresin est
relacionado con el estudio de la dependencia de una variable (VARIABLE
DEPENDIENTE) de una o ms variables adicionales (VARIABLES
EXPLICATIVAS) con la perspectiva de estimar y/o predecir el valor (poblacional)
medio o promedio de la primera en trminos de los valores conocidos o fijos de las
segundas.





EJEMPLO 4.1

Un economista puede estar interesado en estudiar la dependencia que existe
entre los gastos personales de consumo y el ingreso personal real. Este tipo de
anlisis puede ser de gran ayuda para estimar la propensin marginal a consumir,
es decir, el cambio promedio en los gastos de consumo ante una variacin, de por
ejemplo, una unidad en el ingreso real.

EJEMPLO 4.2

Un profesional en economa laboral puede estar interesado en estudiar la relacin
existente entre el porcentaje de cambios en los salarios monetarios o nominales y
la tasa de desempleo. Dicho conocimiento puede ser de gran ayuda para realizar
conjeturas sobre el proceso inflacionario por el cual puede atravesar una
determinada economa, puesto que los aumentos en salarios probablemente se
refieran en aumento en los precios.

EJEMPLO 4.3

El director de mercado de una empresa puede estar interesado en conocer la
manera como se relaciona la demanda de su producto con los gastos en
publicidad en que incurre dicha empresa. Este tipo de estudio sera de gran
utilidad para averiguar la elasticidad de la demanda del producto en los gastos de
publicidad de la empresa, es decir, la respuesta promedio de la demanda ante un
aumento de una unidad, por ejemplo un dlar, en el presupuesto de gastos de
publicidad. Este conocimiento a la vez puede ser de mucha utilidad para
determinar el presupuesto ptimo de publicidad.



De los ejemplos anteriores se puede deducir que dentro del anlisis de regresin
nos interesa lo que se conoce como la dependencia estadstica, y no la
dependencia funcional o determinstica entre las variables, como aquellas que se
representan en la fsica clsica.

En las relaciones estadsticas entre variables tratamos esencialmente con
variables ALEATORIAS O ESTOCSTICAS, es decir, variables que tienen
distribuciones probabilsticas.

La mejor forma de ilustrar la regresin lineal, es utilizando los diagramas de
dispersin.

Supngase que X es el precio de un determinado bien a lo largo del tiempo e Y la
cantidad de demanda del mismo. Si la informacin disponible se refiere a n
observaciones, por ejemplo la cantidad demandada por un grupo de familias, sta
aparece recogida en dos series en la tabla 4.1.

Tabla 4.1 Cantidad demandada por un grupo de familias
Perodo Precio Cantidad demandada
1
2
.
.
.
i
.
.
.
n
X
1

X
2

.
.
.
X
i
.
.
.
X
n

Y
1

Y
2

.
.
.
Y
i

.
.
.
Y
n





Si el precio y la cantidad demandada son variables independientes, se movern
una al margen de la otra. En este caso, la representacin en un sistema de
coordenadas de los pares de la tabla anterior generara una nube de puntos como
las de la figura 4.1.

En el caso de que ambas variables no sean independientes, sino que estn
relacionadas funcionalmente, y si la relacin existente entre ambos es inversa, un
valor elevado de Y aparecer asociado a un valor pequeo de X y viceversa. En
trminos grfico, la relacin entre demanda y precio podra entonces tomar la
forma recogida en el diagrama de puntos de la figura 4.2.









La representacin grfica es eficaz para obtener una informacin intuitiva sobre la
evolucin de dos variables (y su relacin). Esta informacin, sin embargo, no suele
ser suficiente para el empresario o economista, que normalmente pretender
cuantificar la relacin existente entre las variables analizadas.

Dos tcnicas ampliamente utilizadas con objeto de cuantificar la relacin existente
entre las variables son el anlisis de regresin y el anlisis de correlacin. Aunque
estn estrechamente relacionadas conceptualmente las dos son muy diferentes.


La regresin es una expresin cuantitativa de la naturaleza bsica de la relacin
entre las variables dependientes e independientes. Por ejemplo, dado un modelo
de regresin simple con una variable independiente, el modelo determinar si las
dos variables tienden a desplazarse en la misma direccin (las dos crecen o
decrecen al mismo tiempo) o en sentido opuesto (una aumenta cuando la otra
disminuye). Tambin indicar la cantidad en qu Y cambiar cuando la variable
independiente vare en una unidad.

En el anlisis de correlacin el objetivo fundamental es la medicin de la fuerza o
grado de asociacin lineal entre variables, el coeficiente de correlacin mide la
solidez de dicha relacin.

4. 2 TERMINOLOGIA Y NOTACIN

Los trminos variables dependientes y variable explicativa se definen o describen
de varias maneras:

Variable Dependiente Variable Independiente
Variable Explicada Variable Explicativa
Variable Predicha Variable Predictor
Variable Regresada Variable Regresor
Variable Respuesta Variable de Control.
Variable Endgena Variable Exgena

Si estamos estudiando la dependencia de una variable en una sola variable
explicativa, como en el ejemplo de las ventas y la publicidad, dicho estudio se
conoce como Anlisis de Regresin Simple o en dos variables


4.3 FUNCIN DE REGRESIN POBLACIONAL

Se ha dicho que el objetivo del anlisis de regresin es estimar o predecir el valor
medio o promedio de la variable dependiente con base en los valores fijos o
conocidos de la variable explicativa.

Veamos mediante un ejemplo como se lleva acabo este anlisis:
Supngase que se est interesado en estudiar la relacin existente entre los
gastos de consumo familiar semanal Yy el ingreso familiar disponible semanal X.
Es decir, se desea predecir el nivel promedio de gastos de consumo semanales,
conociendo el ingreso de la familia en este lapso.

Se parte de una poblacin de 60 familias, divididas en 10 grupos con el mismo
ingreso aproximadamente.

Tabla 4.2 Datos hipotticos de ingresos familiares por semana
Ingreso familiar 80 100 120 140 160 180 200 220 240 260


Consumo por
semana.
55
60
65
75
70

65
70
74
80
85
88
79
84
90
94
98

80
93
95
103
108
113
115
102
107
110
116
118
125

110
115
120
130
135
140

120
136
140
144
145

135
137
140
152
157
160
162
137
145
155
165
175
189

150
152
175
178
180
185
191
Total 325 462 445 707 678 750 685 1043 966 1211
Valor esperado 65 77 89 101 113 125 137 149 161 173


Esta tabla se puede interpretar as:
Para un ingreso semanal de 100 mil pesos, hay 6 familias cuyos gastos de
consumo semanales estn entre 65 mil y 88 mil pesos. Es decir, cada columna
muestra la distribucin de los gastos de consumo Y correspondiente a un nivel fijo
de Ingreso X, esto es, muestra la distribucin condicional de Y dado valores de X.

Mediante el uso de la probabilidad condicional se puede calcular el valor esperado
de Y dado X, que es simplemente la media o valor promedio de la poblacin. Para
los datos hipotticos del ejemplo la media condicional de Y dado X = 120 se
calcula as:

E (Y/X= 120) = (1/5) (79) + (1/5) (84) + (1/5)(90) + (1/5) (94) + (1/5) (98) = 89.
En la ltima fila de la tabla 4.2 se muestran los dems valores esperados para Y
dado Xi respectivos.
Los valores de la tabla 4.2 se muestran en el siguiente diagrama de dispersin.


FIGURA 4.3 Distribucin de gastos para diferentes niveles de ingreso


En el diagrama se muestra claramente que, en promedio, los gastos de consumo
aumentan al incrementarse el ingreso. La anterior afirmacin puede apreciarse
mejor si se concentra la atencin en los puntos que representan diferentes valores
condicionales medios de Y que aparecen exactamente sobre una lnea recta con
pendiente positiva. Esta lnea se denomina lnea de regresin lineal.

De aqu se puede concluir que cada media condicional E (Y/X
i
) est en funcin de
X
i
. Simblicamente:

En donde f (X
i
) denota una funcin de la variable explicativa X.

La ecuacin 4.1 se conoce como la funcin de regresin poblacional (FRP). Dicha
funcin denota nicamente que la media poblacional de la distribucin de Y dado
X
i
est funcionalmente relacionada con X
i
. Es decir, dice cmo la respuesta media
o promedio de Y vara con X.

En situaciones reales no se cuenta con la totalidad de la poblacin para efectuar el
anlisis. Por tanto la forma funcional de FRP debe ser aproximada de una manera
emprica; se puede suponer que la FRP es una funcin lineal de X
i
.

En la cual
2 1
| | y son parmetros desconocidos pero fijos que se denominan
coeficientes de regresin. Esta expresin se conoce como funcin de regresin
lineal poblacional.

E(Y/X
i
) = f ( X
i
)
(4.1)
E(Y/Xi) =
(4.2)


4.4 ESPECIFICACIONES ESTADISTICAS DE LA FRP.

Como se aprecia en la figura 4.3 a medida que el ingreso familiar aumenta, los
gastos de consumo familiar en promedio tambin aumentan. Pero si observamos
la tabla 4.2 se deduce que no necesariamente aumentan con el nivel de ingreso.
Por ejemplo: para un nivel de ingreso de $100.000 existe una familia cuyos gastos
de consumo de $65.000 son menores que el gasto de consumo de dos familias
cuyo ingreso semanal es solo de $80.000.

Sin embargo los gastos de consumo promedio de las familias con ingresos
semanales de $100.000 son superiores que los de familia con ingresos semanales
de $80.000; $77.000 y $65.000 mil respectivamente.

De este anlisis se concluye que para un nivel de ingreso dado X
i
, los gastos de
consumo de una familia se concentran alrededor del consumo promedio de todas
las familias para ese mismo X
i
, esto es, alrededor de su esperanza condicional.
Por consiguiente, se puede expresar la desviacin de un Y
i
individual alrededor de
su valor esperado as:

(4.3)

En donde la desviacin
i
e es una variable aleatoria no observable que toma
valores positivos o negativos y se le conoce como perturbacin estocstica o
trmino del error estocstico.





La ecuacin 4.3 postula que los gastos de una familia, dado su nivel de ingreso,
son iguales a los gastos promedios de consumo de todas las familias con ese nivel
de ingreso, ms una cantidad que es aleatoria.
Si se supone que E( Y/X
i
) es lineal en X
i
como en la ecuacin 4.2, entonces:
Y
i
= E( Y/Xi) +
i


(4.4)

Ahora si se toma el valor esperado en la ecuacin 4.3 a ambos lados se tiene:
E (Y
i
/ X
i
) = E [ E (Y
i
/X
i
)] + E (
i

/X
i
)
= E (Y / X
i
) + E (
i

/ X
i
)
Puesto que E ( Y
i
/ X
i
) = E ( Y/ X
i
), entonces E (
i

/ Xi) = 0

En otras palabras, el supuesto de que la lnea de regresin pasa por los medios
condicionales implica que los valores medios condicionales
i
e
son iguales a
cero. De donde se deduce que:
E ( Y/ X
i
) = Xi
2 1
| | + es equivalente a :
Y
i
= 0 ) / (
2 1
= + + Xi Yi E si Xi
i
| |
La especificacin estocstica de 4.4 ofrece la ventaja de mostrar que, adems del
ingreso, existen otras variables que afectan los gastos de consumo de una familia,
los cuales no se pueden explicar en su totalidad por la variable incluida en el
modelo de regresin.

4.5 FUNCION DE REGRESION MUESTRAL (FRM)


Como en la prctica lo que est al alcance del analista es una muestra de valores
de Y correspondientes a valores fijos de X, se debe hacer consideraciones de
muestreo. Por consiguiente la tarea es la estimacin de la Funcin de Regresin
Muestral (FRM) con base en informacin muestral. Para ello supngase que se
obtienen dos muestras de Y seleccionadas aleatoriamente para valores fijos de X.
(vase tabla 4.3). Ahora se cuenta con un solo valor de Y para cada X dado.

Al realizar un diagrama de dispersin con los datos de la tablas 4.3 se observa
que no es factible estimar con precisin la FRP, debido a las fluctuaciones
mustrales como se ve en la figura 4.4, en donde se grafican dos lneas de
regresin muestral que tratan de ajustar lo mejor posible los puntos de dispersin.
FRM1 y FRM2 son las resultantes de la primera y segunda muestra
respectivamente; aqu no existe modo alguno de afirmar con certeza cul de las
dos lneas representan la verdadera lnea de regresin poblacional.
Supuestamente, ambas representan la lnea de regresin poblacional, pero debido
a las fluctuaciones mustrales son una aproximacin de la verdadera FRP. En
general se obtendr N FRMS diferentes para N muestras diferentes y no es
factible que estas sean iguales.

TABLA 4.3 Muestras de Y para valores fijos de X
Muestra aleatoria 1 Muestra aleatoria 2
Y
70
65
90
95
110
115
120
X
80
100
120
140
160
180
200
Y
55
88
90
80
118
120
145
X
80
100
120
140
160
180
200


140
155
150
220
240
260
135
145
175
220
240
260



FIGURA 4.4 Distribucin de un solo gasto para diferentes niveles de ingreso.

De manera anloga a la FRP en que se fundamenta la regresin lineal
poblacional, es posible desarrollar el concepto de funcin de regresin muestral.
Para representar la lnea de regresin muestral, la expresin a utilizar es:
2 2
1
2 1

) / (

:

| |
| |
| |
de Estimador
de Estimador
Xi Y E de Estimador Y donde
Xi Y
I
i
i
=
=
=
+ =

En la forma estocstica la funcin de regresin poblacional es:
i i
e Xi Y + + =
2 1

| |
En donde
i
e denota el trmino residual (muestral).


En sntesis, el objetivo fundamental del anlisis de regresin consiste en estimar
la FRP
i i
Xi Y | | + + =
2 1

Con base en la FRM
i i
e Xi Y + + =
2 1

| |










FIGURA 4.5 Comparativo de la FRM con la FRP
4.6 ESTIMACION POR MINIMOS CUADRADOS

Supngase que se dispone de ) , ( . .. ) , ( , ) , (
2 2 1 1 n n
y x y x y x n pares de observaciones.
El objetivo es encontrar la recta que se ajuste mejor a estos datos, es decir,
estimar los coeficientes desconocidos de la recta de regresin poblacional. La
manera natural de estimar los parmetros, es encontrar estimadores de
2 1
| | y
que hagan mnimos los errores.



FIGURA 4.6 Estimacin minimizando los errores

Cualquier estimador razonable de la recta de regresin dejar algunos de los
datos observados por debajo y otros por encima de la recta estimada. Por lo tanto
alguno de los
i
e de la ecuacin Xi Y e i
i 2 1

| | =
.
, sern positivos y otros
negativos. Si se quiere penalizar por igual los valores positivos y los negativos de
la misma magnitud, una posibilidad es trabajar con los cuadrados de
i
e . La suma
de las descripciones al cuadrado entre los puntos y la recta es:
2
2 1
2 2
)

( )

( Xi Y Y Y e i
i i i
| | = =

.

El mtodo de mnimos cuadrados selecciona cono estimador de la recta de
regresin poblacional, a aquellos valores para los cuales esta suma de cuadrado
es menor.

Para minimizar,
2 1
2
| | y a respecto e i

se tiene:


( ) 0

2
2 1
1
2
= =
c
c

i
i
X Yi
e
| |
|

0 )

( 2
2 1
2
2
= =
c
c

Xi Yi Xi
e
i
| |
|

Luego:
( )
( ) ) 2 ( 0

) 1 ( 0

2 1
2 1
=
=

Xi Yi Xi
Xi Yi
| |
| |


Las ecuaciones (1) y (2) se pueden escribir:
) 2 (

) 1 (

, ,

2
2
1
1
2 1
1
2
1
1
1


+ =
+ = + =
=
= = =
i
n
i
n
i
n
i
n
i
X Xi XiYi
Xi n Yi entonces Xi Yi
| |
| | | |

Estas ecuaciones se llaman Ecuaciones Normales. Este sistema se puede
resolver por sustitucin u otro mtodo.
Despejando ) 1 (

1
en | se tiene:
(*)

2
1
n
i X Yi

.

=
|
|



Sustituyendo * en (2) se obtiene:



( )
( )
(
(

=
+ =
+
(
(



.
.
n
Xi
X
n
Yi Xi
XiYi
X
n
Xi
n
Yi Xi
XiYi
X Xi
n
Xi Yi
XiYi
i
i
i
2
2
2
2
2
2
2
2
2
2

|
|
|
|
|

Entonces:
( ) ( )

=
n n
Xi n
X
n n
Yi Xi n
Yi Xi
n
Xi
X
n
Yi Xi
Yi Xi
i i
.
.

2
2
2
2
2
|

EJEMPLO 4.4

Con los siguientes datos relativos a consumo renta (en Dlares) de 15 familias
ajuste una regresin:
Consumo =
2 1
| | + renta.
Los datos se dan en dlares semanales.
Consumo 74 98 80 53 57 81 44 90 72 47 87 50 42 101 44
Renta 80 110 90 60 60 65 45 91 78 84 87 92 90 98 56

Solucin:
i
X Y
2 1
. .
+ = | |




Y
i (Consumo)
X
i (Renta)
X
i
Y
i

2
i
X
74
98
80
53
57
81
44
90
72
47
87
50
42
101
44
80
110
90
60
60
65
45
91
78
84
87
92
90
98
56
5920
10780
7200
3180
3420
5265
1980
8190
5616
3948
7569
4600
3780
9898
2464
6400
12100
8100
3600
3600
4225
2025
8281
6084
7056
7569
8464
8100
9604
3136

15 98344 83810 06 , 79 68
2
= = = = =

n X XiYi X Y
i

69 , 0
75 , 4586
8 , 3168
25 , 93757 98344
2 , 80641 83810
) 06 , 79 ( 15 98344
) 68 ( ) 06 , 79 ( ) 15 ( 83810

2
2
2
2
2
= =

|
|
X n X
Y X n Yi Xi
i

69 , 0

2
= |
38 , 13

) 06 , 79 ( ) 69 , 0 ( 68


1
1
2 1
=
=
=
|
|
| | X Y



As el modelo estimado queda representado por Y = 13,38 + 0,69X

Se puede interpretar la regresin estimada de la siguiente manera: Si la renta
semanal aumenta en un dlar, se espera que el consumo promedio diario
aumente aproximadamente en 69 centavos de dlar.

Si la renta de una familia fuera de cero dlares, se esperara que el consumo
semanal sea de aproximadamente 13,4 dlares.

La grfica 4.7 presenta la recta de regresin estimada junto con los dems
puntos.


FIGURA 4.7 Estimacin Consumo - Renta

4.7 SUPUESTOS FUNDMENTALES PARA EL MODELO DE REGRESION
LINEAL



Se ha dicho que en el anlisis de regresin el objetivo no es solamente
obtener
2 1
. .
| | y , si no tambin hacer inferencia acerca de los verdaderos
valores de
2 1
| | y . Es decir, se puede estar interesado en saber que tan
cerca estn
2 1
. .
| | y de los parmetros poblacionales, as como que tan
ajustado est i Y
.
al verdadero E(Y/X
i
). Por lo tanto se hace necesario plantear
ciertos supuestos sobre la manera como se genera X
i
y
i
, dado que
i i i
X Y | | + + =
2 1
. Lo cual muestra que Y
i
depende tanto de X
i
como de
i
.
As, para hacer cualquier inferencia estadstica sobre Y
i
y sobre
2 1
| | y , se
deben plantear los siguientes supuestos:

SUPUESTO 1
El valor medio o promedio de
i
es igual a cero, ese decir, E(
i
/X
i
) = 0.
Con este supuesto se asegura que aquellos factores que no estn
explcitamente incluidos en el modelo no afectan sistemticamente al valor de
Y. En otras palabras, se supone que los valores positivos de
i
se cancelan
con los valores negativos de tal forma que sus efectos promedios sobre Y es
cero.

SUPUESTO 2
Igual varianza para
i
. Esto quiere decir que el trmino aleatorio tiene la
misma varianza en cada periodo o elemento de la muestra. A esta propiedad
se le denomina HOMOCEDASTICIDAD, e implica que las observaciones de
Y
i
que corresponden a diferentes valores de X
i
tienen la misma varianza.
| |
2 2 2
i
) ( ) ( X de Varianza

o = = =
i i i
E E E



SUPUESTO 3
No existe auto correlacin entre las
i

Esto significa que los trminos aleatorios de un periodo son independientes
de los de cualquier otro periodo o covarianza.
| || | 0 ) ( ) ( ) , ( = =
j j i i j i
E E E

SUPUESTO 4
Cero varianza entre
i
y X
i

Aqu se supone que el trmino de perturbacin es independiente de la
variable explicativa. Este supuesto se introduce para poder establecer un
efecto individualizado de X y de
i
sobre la variable Y. Si la variable
explicativa y el trmino aleatorio estn correlacionados no es posible
establecer su efecto individual sobre la variable explicada.

Adems, sobre la variable independiente se establece que:
- Los valores de la variable permanecen fijos de una muestra a otra.
- La variable se mide sin error de observacin.

4.8 VERIFICACIN DE HIPTESIS

Dado que las perturbaciones siguen una distribucin para las que se han
introducido unos supuestos, la forma de clculo de los estimadores hace que ellos
tambin sean variables aleatorias con una cierta distribucin. Esto implica que el
verdadero valor puede cambiar de una muestra a otra y por ello resulta
conveniente alguna medida de precisin de estos estimadores. Para ello en
estadstica se utiliza la desviacin estndar o ERROR ESTANDAR DE LOS
ESTIMADORES. En este sentido cabe sealar que si a los supuestos anteriores


se les aade la hiptesis de que la variable
i
sigue una distribucin normal, con
media cero y varianza
2
o , se puede demostrar que el cociente entre la diferencia
de los estimadores
2 1
. .
| | y y los parmetros poblacionales, y sus desviaciones
estndar
2 1
. .
| |
S y S se distribuyen como una t de student con n 2 grados de
libertad (numero de observaciones menos numero de parmetros estimados). Esto
es:



1
.
|
S Donde representa la
desviacin estndar o error
estndar de
1
.
| y se
obtiene mediante la
frmula:


El error estndar de
2
.
| ,
2
.
|
S se calcula con la frmula:



En ambas expresiones se representa la varianza residual corregida, estimador
insesgado de la varianza del trmino de perturbacin
2

o y se define as:

2
2
2

=
n
e
S
i
e





Dada una muestra y obtenida una estimacin de
1
| mediante el mtodo de
mnimos cuadrados, se puede construir un intervalo de confianza a travs de la
expresin
2 ,
.

n i
t S
i
o
|
|
, la cual arrojara dos valores entre los cuales se encuentra
el parmetro buscado con nivel de significancia que se desee. Cuanto mas
pequeo sea dicho intervalo, mas precisa ser la estimacin.

EJEMPLO 4.5

Con los datos relativos a Consumo Renta de 15 familias (ejemplo 4.4), construir
un intervalo de confianza del 95% para el coeficiente de regresin.

SOLUCION:

Primero se debe calcular el error estndar de
2
.
| ,

=
.
2
2
2
2
X n X
S
S
i
e
|


2
2
2

=
n
e
S
i
e
, para este caso n 2 = 15 2 = 13

= SCE e
i
2
, suma de cuadrados

i i i i i
X Y Y Y e 69 , 0 38 , 13 , + = =
. .



Luego reemplazando cada valor de X
i
, se obtiene el valor estimado respectivo
para Y
i
, como se muestra en la siguiente tabla.





i
X
i
Y

i i
X Y 69 , 0 38 , 13 + =
.

.
=
i i i
Y Y e
2
i
e
80
110
90
60
60
65
45
91
78
84
87
92
90
98
56
74
98
80
53
57
81
44
90
72
47
87
50
42
101
44
68,58
89,28
75,48
54,78
54,78
58,23
44,43
76,17
67,20
71,34
73,41
76,86
75,48
81,00
52,02
5,42
8,72
4,52
-1,78
2,22
22,77
-0,43
13,83
4,80
-24,34
13,59
-26,86
-33,48
20,00
-8,02
29,3764
76,0384
20,4304
3,1684
4,9284
518,4729
0,1849
191,2689
23,0400
592,4356
184,6881
721,4596
1120,9104
400,0000
64,3204

1186
1020 1019,04 0,96 3950,7228

~ 0
i
e

= 7228 , 3950
2
i
e

Luego 90 , 303
13
7228 , 3950
2
= =
e
S

As, 2574 , 0
746 , 4586
90 , 303
) 06 , 79 ( 15 98344
90 , 303
2 2
2
2
2
= =

.
X n X
S
S
i
e
|


Al reemplazar los valores 2574 , 0
2
=
.
|
S ; n 2 = 13 y 160 , 2
13 , 5 . 0
= t , los lmites del
intervalo para el coeficiente de regresin son:

556 , 0 69 , 0 ) 160 , 2 )( 2574 , 0 ( 69 , 0
13 , 5 . 0 2
2
= =
.
t S
|
|
.

As, ) 246 . 1 , 134 . 0 (
2
e | , lo que indica que el parmetro
2
| aproximadamente est
entre 0,13 y 1,25 con una confianza del 95%.


Adems si e hace uso de la expresin
2 ,
.
~

.
n
i i
t
S
i
o
|
| |
se puede verificar o
contrastar la hiptesis acerca de un parmetro determinado. Esto es, si se quiere
verificar que
1
| toma un valor concreto h, se platea como sistema de hiptesis:

h H
h H
A
o
=
=
1
1
:
:
|
|

Como
2
.
~

.
n
i i
t
S
i
|
| |
, bajo la hiptesis nula se puede obtener
2
.
-
~

=
.
n
i
t
S
h
t
i
|
|
.

Este valor se contrasta con el valor terico arrojado por las tablas de distribucin al
nivel de significancia escogido con n 2 grados de libertad. Debe tenerse en
cuenta si la hiptesis es bilateral o unilateral.

En el caso de una hiptesis bilateral, si el valor del estadstico es tal que
c
t t >
-
se
rechaza H
o
.

EJEMPLO 4.6

Verificar si la renta es explicativa de las variaciones en el consumo (Ej. 4.4)
SOLUCION:
Se formula es sistema de hiptesis:
0 :
0 :
2
2
>
=
|
|
A
o
H
H


La eleccin del test de una sola cola responde al conocimiento que se tiene sobre
la teora de consumo que es funcin directa de renta.

Para un nivel de significancia del 5% y 13 grados de libertad, 77 , 1 =
c
t


Ahora, 68 , 2
2574 , 0
69 , 0
2 2
2 2 2
= = =

=
. .
. .
-
| |
| | |
S S
t

FIGURA 4.8 Prueba de hiptesis, Consumo - Renta

Como
c
t t >
-
se rechaza H
o
y por lo tanto se puede decir que en la muestra
estudiada 69 , 0
2
=
.
| es un parmetro significativo, pudindose concluir entonces
que la renta es explicativa de las variaciones en la cantidad consumida.

4.9 CAPACIDAD EXPLICATIVA DE UNA ECUACION DE REGRESION LINEAL.

Una ecuacin de Regresin puede considerase como un intento de emplear la
informacin proporcionada por una variable independiente X para explicar el
comportamiento de una variable dependiente Y.
11


Existe una medida de uso muy generalizada en el anlisis de regresin que indica
el grado de explicacin que la variable independiente logra al ajustar los datos
mediante una relacin lineal que se denomina coeficiente de determinacin, R
squared; cuando los datos son arrojados mediante ordenador.

11
PAUL NEWBOLD. Estadstica para los Negocios y la economa. Espaa, Prentice Hall 1997, p398



El coeficiente de determinacin se representa por R
2
y se calcula mediante
el cociente entre la varianza explicada por el modelo y la varianza total de la
variable dependiente.

Para los valores muestrales, la recta de regresin estimada puede escribirse
como
i i
e X Y + + =
2 1
| | o tambin,
i
e Y Y + =
.
donde
i
X Y
2 1
| | + =
.

La cantidad
.
i
Y es el valor predicho por la recta de regresin para la variable
dependiente, y el residuo
i
e es la diferencia entre los valores observado y
predicho. Por tanto, el residuo representa la parte del comportamiento de la
variable dependiente que no puede ser explicada por su relacin lineal con la
variable independiente
12
(Ver figura 4.9)

FIGURA 4.9. Particin de los componentes de la variacin de
i
Y

12
PAUL NEWBOLD. Estadstica para los Negocios y la economa. Espaa, Prentice Hall 1997, p399



Ahora si a la ecuacin
i
e Y Y + =
.
se resta Y a cada lado se obtiene:
i i i
e Y Y Y Y + =
.
) ( ) ( . Elevando al cuadrado ambos trminos de la ecuacin y
sumando respecto al ndice i, se obtiene como resultado:

SCE SCR SCT
licada no elo el por Total
ad Variabilid licada da Variabilia ad Variabilid
e Y Y Y Y
i i i
+ =
+ =
+ =

.
exp mod
exp
) ( ) (
2 2 2

Dnde: SCT = Suma de cuadrados total.
SCR = Suma de cuadrados de la regresin.
SCE = Suma de cuadrados residual (o del error).

Al dividir la ecuacin SCT = SCR + SCE entre SCT se tiene:

SCT
SCE
R Luego
R
SCT
SCR
Pero
SCT
SCE
SCT
SCR
SCT
SCE
SCT
SCR
SCT
SCT
=
= + =
+ =
1
1
2
2


1 0
2
s s R , ya que es imposible explicar ms del 100% de la variable Y.


Con los valores del ejemplo 4.4 se obtiene la siguiente informacin:

i
Y

i i
X Y 69 , 0 38 , 13 + =
.

.
=
i i i
Y Y e
Y Y
i

Y Y
i

.

74
98
80
53
57
81
68,58
89,28
75,48
54,78
54,78
58,23
5,42
8,72
4,52
-1,78
2,22
22,77
6
30
12
-15
-11
13
0,58
21,28
7,48
-13,22
-13,22
-9,77


44
90
72
47
87
50
42
101
44
44,43
76,17
67,20
71,34
73,41
76,86
75,48
81,00
52,02
-0,43
13,83
4,80
-24,34
13,59
-26,86
-33,48
20,00
-8,02
-24
22
4
-21
19
-18
-26
33
-24
-23,57
8,17
-0,8
3,34
5,41
8,86
7,48
13
-15,98

= = 7228 , 3950
2
i
e SCE

= = 6138 ) (
2
Y Y SCT
i

= =
.
2828 , 2176 ) (
2
Y Y SCR
i


El coeficiente de determinacin es por tanto:

3563 , 0
6138
7228 , 3950
1
2
= = R

Este resultado indica que aproximadamente el 36% de la variabilidad muestral del
consumo est explicada por su dependencia lineal con la renta por hogar.

Otra forma de calcular el coeficiente de determinacin R
2
es utilizando las formula:
Y X
XY
S S
S
R
2
2
) (
= , donde


=
n
Y X
XY S
XY

( ) ( )
n
Y
Y S
n
X
X S
Y X
2
2
2
2

= =

Para el ejemplo:




3162
15
) 1020 )( 1186 (
83810 = =
XY
S
93 , 4570
15
) 1186 (
98344
2
= =
X
S
6138
15
) 1020 (
75498
2
= =
Y
S
3563 , 0
34 , 28056368
9998244
) 6138 )( 93 , 4570 (
) 3162 ( ) (
2 2
2
= = = =
Y X
XY
S S
S
R



Consulte las siguientes pginas en internet:

http://www.uv.es/uriel/material/Morelisi.pdf
http://www.youtube.com/watch?v=J1DoRMupI8k
http://www.slideshare.net/adangraus/regresion-lineal-simple-13381573











En trminos generales se puede decir que: El anlisis de regresin est
relacionado con el estudio de la dependencia de una variable (VARIABLE
DEPENDIENTE) de una o ms variables adicionales (VARIABLES
INDEPENDIENTES) con la perspectiva de estimar y/o predecir el valor
(poblacional) medio o promedio de la primera en trminos de los valores
conocidos o fijos de la segunda.

En trminos grfico, la relacin entre demanda y precio podra entonces tomar la
forma recogida en el diagrama de puntos








La representacin grfica es eficaz para obtener una informacin intuitiva sobre la
evolucin de dos variables (y su relacin). Esta informacin, sin embargo, no suele
ser suficiente para el empresario o economista, que normalmente pretender
cuantificar la relacin existente entre las variables analizadas.



El mtodo de mnimos cuadrados selecciona cono estimador de la recta de
regresin poblacional, a aquellos valores para los cuales esta suma de cuadrado
es menor.
Para minimizar,
2 1
2
| | y a respecto e i

se tiene:
X Y
n
i X Yi
2
2
1

.
.
=

=

|
|
|

=
2
2
2

X n X
Y X n Yi Xi
i
|
La recta estimada de regresin queda expresada como
i
X Y
2 1
. . .
+ = | |

El Coeficiente de determinacin R
2
indica el grado de explicacin que la
variable independiente logra al ajustar los datos mediante una relacin lineal Es
una medida de uso muy generalizada en el anlisis de regresin.

El coeficiente de determinacin se representa por R
2
y se calcula mediante
el cociente entre la varianza explicada por el modelo y la varianza total de la
variable dependiente.
SCE SCR SCT
licada no elo el por Total
ad Variabilid licada da Variabilia ad Variabilid
e Y Y Y Y
i i i
+ =
+ =
+ =

.
exp mod
exp
) ( ) (
2 2 2


Dnde: SCT = Suma de cuadrados total.
SCR = Suma de cuadrados de la regresin.
SCE = Suma de cuadrados residual (o del error).

SCT
SCE
R =1
2
1 0
2
s s R



1. Una compaa asigna diferentes precios a una radio grabadora particular en 8
ciudades diferente del pas, la tabla adjunta muestra el nmero de unidades
vendidas y los precios correspondientes en miles de pesos.

Ventas: 420 380 350 400 440 380 450 420
Precio: 55 60 65 60 50 65 45 50
a. realice un grfico con estos datos y estime la regresin lineal de las ventas
sobre el precio.
b. Qu efectos se esperara en las ventas si se produjera un incremento de
10.000 pesos
c. Halle un estimador puntual del volumen de venta cuando el precio de radio
grabadora en una ciudad dada es de 48. 000 pesos.
d. Si el precio de una radio grabadora se fija en 48.000 pesos, hallar intervalos de
confianza del 95% para el volumen de ventas reales en una ciudad concreta y
para el nmero esperado de ventas en esa regin.

2. Para una muestra de 20 observaciones mensuales, un analista financiero quiere
efectuar la regresin de la tasa porcentual del rendimiento (Y) de las acciones de
una empresa sobre la tasa porcentual del rendimiento (X) de un ndice burstil.
Dispone de la siguiente informacin:


5 , 150 7 , 145
4 , 25 6 , 22
2
= =
= =


i i i
i i
Y X X
X Y




a. Estime la regresin lineal de Y sobre X.
b. Interprete la pendiente de la recta de regresin muestral
c. Interprete la constante de la recta de regresin muestral.

3. Una compaa distribuye un test de aptitud entre todos sus nuevos
representantes de venta. La direccin tiene inters en conocer la capacidad del
test para predecir el eventual xito de estos representantes. La tabla adjunta
recoge el valor de las ventas semanales medias (en millones de peso) y las
puntuaciones obtenidas en el test de aptitud para una muestra aleatoria de 8
representantes
Ventas semanales: 10 12 28 24 18 16 15 12
Puntuacin en el test: 55 60 85 75 80 85 65 60

Estime la regresin lineal de las ventas semanales sobre las puntuaciones en el
test de aptitud.

4. Se conjetura que el nmero de botellas de una cerveza importada que se vende
cada noche en los restaurantes de una ciudad depende linealmente del costo
medio de las cenas en esos restaurantes. Los siguientes resultados se obtuvieron
de una muestra de 17 restaurantes de aproximadamente de igual tamao, donde
( )
( ) ( )
000 . 18
1
000 . 500 . 3
1
16 550 . 2
2
=

= =

n
Y Y X X
n
X X
Y X
i i
i

Hallar la recta de regresin muestral


5. Una cadena de restaurantes de comidas rpidas decide llevar a cabo un
experimento para medir la influencia del gasto en publicidad sobre las ventas. En 8
ciudades del pas, se realizaron diferentes variaciones relativas en el gasto en
publicidad, comparado con el del ao anterior, y se observaron las variaciones en
los niveles de ventas resultantes. La tabla adjunta muestra los resultados.

Incremento del gasto en publicidad (%) Incremento en las ventas (%)
0
4
14
10
9
8
6
1
2,4
7,2
10,3
9,1
10,2
4,1
7,6
3,5

a. Estimar la regresin lineal del incremento en las ventas sobre el gasto en
publicidad.
b. Hallar un intervalo de confianza del 90% para la pendiente de la recta de
regresin.

6. Se intent evaluar el tipo a plazo como predictor del tipo al contado en el
mercado de valores. Para una muestra de 79 observaciones trimestrales, se
obtuvo la regresin lineal estimada Y = 0.00027 + 0.7916X, donde Y es la
Variacin real en el tipo al contado y X es la Variacin en el tipo a plazo. El
coeficiente de determinacin fue de 0.097 y la desviacin tpica estimada de la
pendiente de la recta de regresin poblacional fue de 0.2759.



a. Interpretar la pendiente de la recta de regresin estimada.
b. Interpretar el coeficiente de determinacin
c. Contrastar la hiptesis de que la pendiente de la recta de regresin es positiva,
interprete el resultado.
d. Contrastar la hiptesis de que la pendiente de la recta de regresin poblacional
es 1.

7. La tabla muestra, para 8 marcas de caf instantneo, el nmero medio de
adquisiciones por comprador (Y) y el porcentaje de compradores en un ao (X)

Y 3.6 3.3 2.8 2.6 2.7 2.9 2.0 2.6
X 24 21 22 22 18 13 9 6

a. Estimar la regresin de las adquisiciones por comprador sobre el porcentaje
de compradores.
b. Interpretar la pendiente de la recta de regresin estimada.
c. Hallar e interpretar el coeficiente de determinacin.
d. Hallar e interpretar un intervalo de confianza del 90% para la pendiente de la
recta de regresin poblacional.
e. Hallar un intervalo de confianza del 90% para las adquisiciones por comprador
esperadas en una marca cuyo porcentaje de compradores es 20.

8. Supongamos que el pasado ao ocho empresas tuvieron los beneficios y gastos
(en millones de pesos) en investigacin recogidos en la tabla adjunta.



a. Ajuste una lnea de regresin tomando los beneficios como variable
dependiente y los gastos en investigacin como variable independiente.
b. Obtenga el coeficiente de terminacin y verifique la significacin de la
pendiente de la recta de regresin. A partir de los resultados obtenidos,
podremos concluir que los gastos en investigacin originan beneficios?

BENEFICIOS GASTOS DE INVESTIGACION
50
60
40
50
30
45
50
50
40
40
30
50
40
45
35
55

9. Los economistas suelen afirmar que las variaciones del PNB real afectan a la
rentabilidad de los fondos de inversin. A continuacin se presentan los datos
recogidos para u periodo de 10 aos.
Porcentaje de variacin del PNB real Rendimiento de los fondos de
inversin (%)
1.3
1.5
0.2
-1.1
1.9
2.1
2.6
2.4
3.1
2.7
21.0
25.0
18.0
7.0
25.0
21.0
31.0
29.0
33.0
32.0




a. Qu sugiere el coeficiente de regresin?
b. Respalda el coeficiente de determinacin esta afirmacin?
c. Calcular e interpretar el error tpico de la estimacin.




















RESPONDA LAS PREGUNTAS CON BASE EN LA SIGUIENTE INFORMACION

Se prueba una campaa publicitaria para un producto en 10 ciudades. La
intensidad X de la publicidad vara de una ciudad a otra. El porcentaje Y de
familiaridad con el producto se determina por medio de una encuesta despus
de la campaa publicitaria; en esta se obtuvo el siguiente resumen numrico:


= = = 7 , 413 25 , 411 5 , 62
2
y x x

= = 45 , 2930 27 , 23421
2
xy y

1. La pendiente de la recta estimada est dada por la expresin:

A.
2
) 5 , 62 ( 10 25 , 411
) 7 , 413 )( 5 , 62 ( 10 45 , 2930

B.
2
) 25 , 6 ( 25 , 411
10
) 7 , 413 )( 5 , 62 (
45 , 2930


C.
10
) 5 , 62 (
25 , 411
10
) 7 , 413 )( 5 , 62 (
45 , 2930
2

D.
2
) 5 , 62 ( 10 25 , 411
) 37 , 41 )( 25 , 6 ( 10 45 , 2930



2. El valor de la pendiente de regresin indica:

A. El incremento en el porcentaje de aceptacin del producto por cada
punto de aumento en la intensidad de la publicidad.
B. El incremento en la intensidad de la publicidad por cada punto de
aumento en el porcentaje de aceptacin del producto.


C. El incremento en el porcentaje de aceptacin del producto cuando la
intensidad de la publicidad es cero.
D. El incremento en la intensidad de la publicidad cuando el aumento en
el porcentaje de aceptacin del producto es cero.

3. El valor de coeficiente de determinacin R
2
indica que:

A. La intensidad en la publicidad est explicada por su dependencia
lineal con el porcentaje de aceptacin en un R
2
x100%
B. La intensidad en la publicidad est explicada por su dependencia
lineal con el porcentaje de aceptacin en un R
2
%
C. El porcentaje de aceptacin est explicado en un R
2
% por su
dependencia lineal con La intensidad en la publicidad.
D. El porcentaje de aceptacin est explicado en un R
2
x100% por su
dependencia lineal con La intensidad en la publicidad.

4. La constante de regresin est dada por la expresin:

A.
10
) 5 , 62 (
25 , 411
10
) 7 , 413 )( 5 , 62 (
45 , 2930
10
7 , 413
2


B.
2
) 25 , 6 ( 25 , 411
10
) 7 , 413 )( 5 , 62 (
45 , 2930
10
7 , 413



C.
2
) 5 , 62 ( 10 25 , 411
) 7 , 413 )( 5 , 62 ( 10 45 , 2930
10
7 , 413


D.
2
) 5 , 62 ( 10 25 , 411
) 37 , 41 )( 25 , 6 ( 10 45 , 2930
10
7 , 413

























TABLA 1
DISTRIBUCION NORMAL
13


Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964
2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981
2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986
3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990

13
http://www.disfrutalasmatematicas.com/datos/distribucion-normal-estandar.html


TABLA 2
DISTRIBUCION t (Unilateral)





TABLA 3
DISTRIBUCION t (Bilateral)






















BIBLIOGRAFIA

+ GEORGE C. CANAVOS. Probabilidad y Estadstica Aplicaciones y mtodos.
Mxico, Mc Graw Hill 1995.

+ HILDEBRAND Y OTT. Estadstica aplicada a la administracin y a la
Economa. U.S.A, Addison Wesley Iberoamericana 1997.

+ KEINZ KOHLER. Estadstica para negocios y economa, editorial cesca

+ MEYER P. Probabilidad y aplicaciones estadsticas, Fondo educativo
Interamericano.

+ MORRIS H GROOT. Probabilidad y estadstica, Mxico, Mc Graw Hill 1996.

+ PAUL NEWBOLD. Estadstica para los Negocios y la economa. Espaa,
Prentice Hall 1997.

+ STEVENSON WILLIAM. Estadstica para administracin y economa, Editorial
Harla.

+ WALPOLE MYERS. Probabilidad y estadstica, Mxico, Mc Graw Hill 1995.

CIBERGRAFIA
Distribuciones muestrales
http://ftp.utalca.cl/profesores/gicaza/Clases/7Distribuciones%20Muestrales.pdf
http://www.geociencias.unam.mx/~ramon/EstInf/Clase4.pdf
http://www.educatina.com/matematicas/probabilidad-y-estadistica/estadistica/poblacion-
estadistica/diferencias-en-la-distribucion-de-medias-muestrales-video


http://www.educandus.cl/estadistica/ejercicios/bases_teoricas/Distribucion/ResueltosDistribucio
nesMuestrales.pdf
Intervalos de confianza
http://www.slideshare.net/yohanabonillagutierrez/taller-intervalos-de-confianza
http://www.iesxunqueira1.com/Download/pdf/teointervalos.pdf

Prueba de hiptesis
http://www.youtube.com/watch?v=AJcy4eZMwWM
http://www.itch.edu.mx/academic/industrial/estadistica1/cap02.html
http://www.virtual.unal.edu.co/cursos/ciencias/2001091/html/un6/cont_601_54.html

Regresin Lineal
http://www.uv.es/uriel/material/Morelisi.pdf
http://www.youtube.com/watch?v=J1DoRMupI8k
http://www.slideshare.net/adangraus/regresion-lineal-simple-13381573


DIRECCIN DE EDUCACIN ABIERTA Y A DISTANCIA Y VIRTUALIDAD

PROGRAMA ADMINISTRACIN DE EMPRESAS
ESTADSTICA INFERENCIAL
Carretera Troncal de Occidente - Va Corozal - Sincelejo (Sucre)
Telfonos: 2804017 - 2804018 - 2804032, Ext. 126, 122 y 123
Mercadeo: 2806665 Celular: (314) 524 88 16
E- Mail: facultadeducacion@cecar.edu.co