You are on page 1of 210

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA


UNIDAD DE CIENCIAS BSICAS

JEAMMY JULIETH SIERRA HERNNDEZ


(Director Nacional de Curso)

100403 INFERENCIA ESTADSTICA


Vol. 1

IBAGU
FEBRERO 2013

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

COMITE DIRECTIVO
Jaime Alberto Leal Afanador
Rector

Constanza Abada Garca


Vicerrectora Acadmica y de Investigacin

Gloria Herrera
Vicerrector de Medios y mediaciones Pedaggicos

Maribel Crdoba Guerrero


Secretaria General

Inferencia Estadstica
Tercera Versin
Actualizacin por Jeammy Julieth Sierra Hernndez

Autores Primera Edicin:


Jorge Rondon
Danis Brito
Copyright
Universidad Nacional Abierta y a Distancia

ISBN

2012
Unidad de Ciencias Bsicas UNAD

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

CAMPOS DE
Bsica CRDITOS: 2 TRABAJO INDEPENDIENTE: 72
TIPO
DE
CURSO
Terico CDIGO:100403 ACOMPAAMIENTO
TUTORIAL: 24
FORMACIN
Horas
Horas
OBJETIVO GENERAL:
Que el estudiante comprenda, aplique y desarrolle la teora y las tcnicas de la
inferencia estadstica en diversos campos de su saber formativo, y que dicha
aplicacin se convierta en una herramienta de uso matemtico para la toma de
decisiones sobre hiptesis cuantitativas de datos, basado en la informacin
extrada de una muestra.
OBJETIVOS ESPECFICOS:
Que el estudiante identifique las tcnicas y procedimientos que se
deben emplear para que las muestras sean representativas de la poblacin
que se pretende estudiar, de forma que los errores en la determinacin de
los parmetros de la poblacin objeto de estudio sean mnimos.
Que el estudiante comprenda el comportamiento de una poblacin a
partir del anlisis metdico de una muestra aleatoria de la misma, y que
entienda que la inferencia inductiva de los parmetros estadsticos que
estime sobre dicha muestra, conlleva un error, el cual es posible de ser
cuantificado.
Conocer los criterios tcnicos que hay que tener en cuenta antes
de seleccionar un tamao de muestra.
Identificar el tipo de muestreo de acuerdo a los objetivos del estudio.
Diferenciar y analizar las ventajas y desventajas de la estimacin
por intervalos de confianza y las pruebas de hiptesis.
Determinar la prueba o tcnica apropiada a aplicar en las diferentes
pruebas de hiptesis paramtricas y No paramtricas.
COMPETENCIA GENERAL DE APRENDIZAJE:
Identificar un procedimiento adecuado para seleccionar de una poblacin una
parte de ella, con el fin de obtener resultados confiables y poder generalizar los
resultados obtenidos a toda la poblacin.
Determinar los estadsticos necesarios para el anlisis y solucin de situaciones
que implican conjuntos de datos de su disciplina de formacin, por medio del

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

conocimiento de la teora elemental del muestreo y de las distribuciones


muestrales.
Plantear y desarrollar el proceso de la inferencia estadstica para resolver
problemas concretos de investigacin en el mbito de otras disciplinas.
Aplicar apropiadamente los resultados tericos y metodolgicos de la inferencia
estadstica de estimacin y prueba de hiptesis en el marco de la modelacin.
Habilidad para planear una investigacin, diseo de instrumentos, definicin de
variables, recoleccin de la informacin, resumen y presentacin de los datos.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

UNIDADES DIDCTICAS
INTRODUCCIN ..................................................................................................................................... 6
UNIDAD UNO: ........................................................................................................................................ 7
MUESTREO, DISTRIBUCIN MUESTRAL E INTERVALOS DE CONFIANZA ............................................. 7
CAPITULO UNO: PRINCIPIOS DE MUESTREO .................................................................................... 8
Leccin No 1: Conceptos Bsicos ................................................................................................ 10
Leccin No 2: Tipos de muestreo y seleccin de muestra ......................................................... 15
Leccin No 3: Tipos de Seleccin de Muestras .......................................................................... 30
Leccin No 4: Mtodos de Inferencias, Paramtrico y No Paramtrico.................................... 31
Leccin No 5: Estimadores y propiedades de los estimadores .................................................. 34
..................................................................................................................................................... 36
CAPITULO DOS: DISTRIBUCIONES MUESTRALES ............................................................................ 37
Leccin No 6: Distribuciones Muestrales ................................................................................... 38
Leccin No 7: Distribucin Muestral de la Media y de la Proporcin ....................................... 40
Leccin No 8: Distribucin Muestral de la proporcin .............................................................. 58
Leccin No 9: Distribucin Muestral de Diferencias de Medias y de la Proporciones .............. 63
Leccin No 10: Tamao de la muestra para estimar la media, la proporcin y el total de la
Poblacin ..................................................................................................................................... 67
CAPITULO TRES: INTERVALOS DE CONFIANZA ............................................................................... 74
Leccin No 11: Nociones Fundamentales. ................................................................................. 75
Leccin 12. Intervalos de confianza para medias y diferencias de medias con muestras
pequeas n 30 ....................................................................................................................... 80
Leccin 13. Intervalos de confianza para la media y diferencias de medias muestras grandes

n 30 ...................................................................................................................................... 101
Leccin 14. Intervalos de confianza para la proporcin y diferencias de proporciones (siempre
son muestras grandes) n 30 ................................................................................................ 105
Leccin 15. Intervalos de confianza para la varianza poblacional. .......................................... 107

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

INTRODUCCIN

El presente modulo est dirigido a estudiantes de programas de pregrado que


oferta la UNAD, bajo la modalidad de educacin superior a distancia.
El material est estructurado en dos unidades que son las temticas macro del
curso acadmico.
El contenido de cada una de las partes fue seleccionado, teniendo en cuenta los
saberes mnimos que se esperara debe alcanzar un estudiante de la
Universidad Nacional Abierta y a Distancia en el campo de la Inferencia
estadstica.
La propuesta permite que los estudiantes reconozcan los conocimientos
mnimos del curso en mencin, que le permita resolver situaciones propias del
mismo y adems, abordar posteriores temticas que requieran de stos
conocimientos.
Para el mejor aprovechamiento de este material, se recomienda que el estudiante
posea como conocimientos previos: de estadstica descriptiva y de la teora de
probabilidad.
El modulo se caracteriza porque en cada leccin se presentan ejemplos
modelos del tema en estudio, al final de cada captulo se exponen ejercicios con
respuesta, que permite a los estudiantes contextualizarse en diversas reas del
conocimiento, con el fin de fortalecer las temticas propias del curso.
Al final de cada unidad se presenta una Autoevaluacin de un nivel medio-alto, las
cuales permiten verificar los alcances de los estudiantes en las temticas
analizadas y detectar las debilidades y as centrarse en stas, con el fin de
alcanzar las metas propuestas.
Finalmente, el Material pretende servir como gua de aprendizaje autnomo, se
recomienda apoyar este proceso por medio de lecturas especializadas, ayudas
audiovisuales, visitas a sitios Web y prcticas de laboratorio; entre otros, as
lograr una efectiva comprensin, y aplicacin de las temticas estudiadas.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

UNIDAD UNO:
MUESTREO, DISTRIBUCIN MUESTRAL E INTERVALOS DE CONFIANZA

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

CAPITULO UNO: PRINCIPIOS DE MUESTREO


Introduccin
En los estudios de investigacin lo primero que se define es el fenmeno a
analizar, luego la poblacin objeto de estudio, la cual puede ser finita cuando
se conocen todos los elementos, o infinita cuando no se conocen todos
los elementos de la misma. Desde estos puntos de vista analizar la poblacin
no es prctico, por tiempo y costos, lo que induce a seleccionar una
muestra, cuya importancia
radica en el proceso de consecucin de
datos que proporcionan la informacin suficiente y necesaria a cerca de
la poblacin, adems que con la muestra se estn utilizando menos recursos,
debido a que slo una parte de la poblacin se encuentra bajo observacin,
lo que resulta significativamente beneficioso sobre todo cuando se trata
de poblaciones grandes y dispersa.
Otro aspecto que justifica la decisin de tomar una muestra es en casos donde
se debe destruir los elementos de sta, por ejemplo cuando se desea
identificar el grado de vaco de un producto enlatado, la resistencia de un
material y otros.
En las encuestas de opinin sobre la preferencia de un producto se nota ms
claramente la utilidad de una muestra en contraste con la poblacin,
para conocer las preferencias de los consumidores y poder acomodar
rpidamente el sistema de produccin a dichos cambios.
En desarrollo del presente modulo, se utiliza la coma para indicar la parte decimal
de un nmero.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

Objetivo general
Que los estudiantes identifiquen los principios sobre poblacin y
muestra, mtodos de muestreo,
distribucin de muestreo para medias,
el teorema central del lmite, aplicados al clculo de tamaos de muestras
pertinentes.

Objetivos especficos

Comprender los conceptos de poblacin y muestra.


Identificar los diferentes diseos de muestreo y su utilidad en
diferentes campos del saber.
Conceptuar una distribucin muestra y calcular las estimaciones
requeridas, la varianza y el error de estimacin para los mismos.
Conocer y comprender los elementos del teorema central de
lmite y su utilidad.
Determinar un tamao de muestra representativo tanto para medias
como para proporciones.
Realizar
aplicaciones
en
Excel
y
SPSS.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

10

Leccin No 1: Conceptos Bsicos


Dentro de la inferencia estadstica, el proceso de muestreo permite que a
partir de los resultados obtenidos al analizar una muestra, se pueda obtener
conclusiones en cuanto a una o varias de las caractersticas o parmetros de una
poblacin. Esta rea de la Estadstica, ayuda a determinar la confiabilidad de la
inferencia de que los fenmenos observados en la muestra ocurrirn tambin
en la poblacin de donde se selecciona la muestra. Es decir, sirve para
estimar la eficacia del razonamiento inductivo con el cual se infiere que lo
observado en una parte ser equivalente a lo observado en la poblacin.
Las tcnicas de muestreo son importantes en la medida que se utilice en
forma adecuada para la situacin que se requiera. De las tcnicas ms
conocidas y utilizadas se tienen el Muestro Aleatorio Simple (M.A.S), Muestreo
Aleatorio Estratificado (M.A.E), Muestro Sistemtico (M.S) y Muestreo por
Conglomerados (M.C). Se tratar de analizar estas tcnicas, especialmente el
M.A.S y M.A.E.
El xito en el desarrollo del curso en mencin est en los buenos
conocimientos previos en Estadstica
Descriptiva, Probabilidad y, algebra,
Trigonometra y Geometra analtica. Lo anterior debido a que se debe predecir
resultados o tomar decisiones que tienen un grado de incertidumbre o un
grado de error que se debe definir de antemano.
1.1.

Poblacin Y Muestra

Existe una serie de trminos estadsticos bsicos, que son muy utilizados y se
requiere sean comprendidos para avanzar en otros temas o unidades, en
esta seccin se tratarn los conceptos de poblacin y muestra.
Poblacin Universo: Se considera a todo aquello sobre el que se
desea
hacer
un
estudio estadstico. Segn el nmero de unidades,
elementos o casos que la constituyen, la poblacin puede ser finita o infinita.
Poblacin Finita: Es aquella conformada por un determinado o limitado nmero
de elementos.
Poblacin Infinita: Es aquella conformada por un determinado o limitado
nmero de elementos.
Cuando el nmero de unidades que integra una poblacin es muy grande, se
puede considerar a sta como una poblacin infinita. El investigador define la

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

11

poblacin objeto de estudio en trminos de espacio y tiempo, ya que de esta


manera los resultados sern sobre la poblacin definida en
el
espacio
demarcado y en el tiempo definido.
Ejemplo
Estudiantes del Programa de Ingeniera de Sistemas
Estudiantes del programa de Ingeniera de sistemas de la UNAD
Estudiantes del programa de Ingeniera de sistemas en la UNAD de los
aos
2.010, 2.011 y 2.012
Muestra: Se considera una muestra al subconjunto representativo de la
poblacin, que ha sido seleccionada de manera tcnica mediante un
procedimiento denominado diseo de muestreo, para garantizar que dicha
muestra es representativa de la poblacin, es decir, que las unidades
seleccionadas en la muestra mediante un proceso aleatorio, hayan tenido
igual probabilidad de haber sido seleccionadas para el anlisis.

Figura 1. Poblacin y muestra

Muestra representativa: Subconjunto de sujetos que pertenecen a una


poblacin determinada. Debera tener las mismas caractersticas generales que
la poblacin. En caso contrario, tenemos una muestra sesgada. (M. J. Navas,
2001, p. 19). Ir al referente. Los dos principios que determinan la

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

12

representatividad de una muestra son, la forma de seleccin, que debe ser


aleatoria y el otro corresponde al tamao de la muestra.
Parmetros: Segn Moore, D. (2000) es un nmero que describe alguna
caracterstica de la poblacin. En la prctica estadstica el valor del parmetro no
es conocido ya que en muchos casos no podemos examinar toda la poblacin.
Pudiendo ser por ejemplo el porcentaje de personas con VIH en Colombia, aqu
el parmetro es la Proporcin de personas en la poblacin (Colombia) que
tienen dicho virus.
Es conveniente el uso de un smbolo general para designar el parmetro de
inters, entonces ste ser:
Entre los parmetros ms importantes tenemos:
= Tamao total de la poblacin
= Promedio Poblacional
= Varianza Poblacional
= Desviacin estndar Poblacional
= Total Poblacional
=Proporcin poblacional
Estadstico: Es un nmero que se puede calcular a partir de los datos de la
muestra. Moore, D. (pg. 270). Entonces un estadstico mide caractersticas,
pero en una parte de la poblacin, es decir, en una muestra; por ejemplo el
porcentaje de personas en Bogot con VIH; aqu se evidencia que la muestra es
la capital en donde se est analizando una caracterstica, lo que permite sacar
conclusiones de todo el pas, por lo cual se dice que la inferencia suministra
conclusiones de la poblacin sirvindose de los resultados encontrados en las
muestras.
El objetivo fundamental del muestreo es Estimar los parmetros de la
poblacin a partir de algunos elementos cuyas mediciones son los Estadsticos
Los estadsticos ms utilizados por su importancia son:
n =Tamao de la muestra
=Promedio de muestra
S2 =Varianza Muestra
S =Desviacin estndar Muestra
=Total Estimado
p =Proporcin Muestra
Cuando los dos nuevos trminos de arriba son usados, por ejemplo, el proceso

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

13

de estimacin en inferencia estadstica puede ser descrito como el proceso de


estimar un parmetro a partir del estadstico correspondiente, tal como usar una
media muestra (un estadstico) para estimar la media de la poblacin (un
parmetro).
Error de muestreo (error muestral): En estadstica se sabe que existen
diferencias entre lo que se obtuvo en el estudio y lo que se esperaba. En el
proceso de estimacin es poco probable que la media Muestra sea idntica a la
media poblacional, igual para la varianza y la desviacin estndar. El error de
muestreo es la diferencia entre el estadstico y el parmetro, es decir diferencia
entre lo encontrado en la muestra con lo esperado en la poblacin.
|

es el Parmetro y es el estadstico.

Recuerde que | | es el smbolo de valor absoluto


A medida que el tamao de la muestra aumenta el error de muestreo disminuye,
es decir, son inversamente proporcionales.
Error tolerable: Se considera el error tolerable al error mximo que se
est dispuesto a aceptar y an considerar que el muestreo ha alcanzado
su objetivo. En todo estudio estadstico siempre se considera un error tolerable,
partiendo del principio que a menor error tolerable, mayor ser el tamao de
la muestra. Si es el parmetro y es el estadstico, el error tolerable est
determinado por B, donde:
|
|
Error estndar: La desviacin estndar de una distribucin, en el
muestreo de un estadstico, es frecuentemente llamada el error estndar del
estadstico. Por ejemplo, la desviacin estndar de las Medias de todas las
muestras posibles del mismo tamao, extradas de una poblacin, es llamada el
error estndar de la media. De la misma manera, la desviacin estndar de las
proporciones de todas las muestras posibles del mismo tamao, extradas de una
poblacin, es llamada el error estndar de la proporcin. La diferencia entre los
trminos desviacin estndar y error de estndar es que la primera se refiere
a los valores originales, mientras que la segunda est relacionada con valores
calculados.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

1.2.

14

Razones para seleccionar una muestra

Entre los motivos que inducen a tomar una muestra aleatoria estn:
Naturaleza Destructiva: Existen casos donde se requiere destruir los
elementos de la muestra para medir la caracterstica, como es el caso de
medir la resistencia de un material, el vaco de un producto enlatado, otros. No
es lgico pensar en destruir todos los elementos de la poblacin, de all que se
tome una muestra.
Imposibilidad Fsica de Medir Todos los Elementos de la Poblacin:
Se sabe que existen poblaciones muy grandes, consideradas infinitas y es
casi imposible conocer todos los elementos de la misma.
Costos: Estudiar todos los elementos de la poblacin es muy costoso, tanto en
tiempo como en dinero, por lo que es ms rentable hacer un estudio Muestra.
Confiabilidad del Estudio Muestra: Esta demostrado con soporte matemtico
que una muestra representativa arroja resultados que permiten inferir sobre la
poblacin con una confiabilidad muy alta.
Unidad de observacin: Son los elementos que se miden; es decir, sobre los
que se toman los datos de las variables a medir. En el caso de los hogares, la
unidad de observacin sern las personas y en el caso de las llantas del
automvil, cada una sern las unidades de observacin.
Marco de muestreo: Se considera el referente para identificar las unidades de
observacin, ste NO incluye todos los elementos de la poblacin. Ejemplos de
marcos de muestreo tenemos el directorio telefnico de una ciudad, como
potenciales votantes, el registro de ventas de los ltimos 5 aos en
una compaa comercializadora y muchos otros.

1.3.

Etapas en la Seleccin de La Muestra

En todo estudio de muestreo se debe definir las etapas que permiten su


desarrollo.
a) Definicin de objeto de Estudio: Comprende la identificacin del problema y
el establecimiento de las metas que busca el estudio.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

15

b) Marco de Muestreo: Establecimiento de una metodologa para identificar los


elementos que estarn en el muestreo, sus caractersticas y el modelo que
los identifica.
c) Identificacin de Variables: Es pertinente identificar las variables de
estudio, para as definir la forma de medicin que se hara.
d) Tamao de la Muestra: Por medio del modelo de muestreo pertinente
seleccionar la muestra representativa, sobre la que se realizarn las
mediciones.
e) Unidad de Muestreo: Se debe extraer las unidades de muestreo segn el
modelo definido que determinan las n unidades maestrales de la poblacin N.
f) Trabajo de Campo: Son todas las acciones necesarias para obtener la
informacin, definiendo los costos, desplazamientos, herramientas fsica y
logsticas para su realizacin.
g) Anlisis de Informacin: La informacin obtenida, requiere de un proceso
estadstico, el cual puede ser descriptivo o inferencia, para el curso que
nos ocupa se deben hacer los dos.
h) Resultados: Con el proceso desarrollado sobre los datos obtenidos, se
procede a la emisin de los resultados y la confrontacin con las metas
propuestas para verificar el grado de eficiencia del trabajo realizado. Es
pertinente saber presentar los resultados, ya que un buen trabajo que no se
presente de la mejor manera, quedara oscuro en su informacin.

Leccin No 2: Tipos de muestreo y seleccin de muestra


Tipos de Muestreo
Con los conceptos previos que se han analizado, ahora corresponde
estudiar las clases de muestreo. Los dos grandes grupos estn enmarcados en
las siguientes clases:

Muestreo probabilstico
Muestreo No probabilstico

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

16

2.1. Muestreo No Probabilstico


Son aquellos muestreos donde los elementos de la muestra se toman al azar,
siendo imposible determinar el grado de representatividad de la muestra. Para
el caso de una poblacin homognea, la representatividad de tal muestra puede
considerarse satisfactoria.
Por otra parte, en problemas comerciales diarios y en la toma de decisiones
que a falta de tiempo no permiten disecar mtodos de muestreo probabilstico
hay que recurrir a este tipo de muestreo, donde el investigador conoce la
poblacin.
Dentro del muestreo no probabilstico se conoce varios
tipos:
Muestreo por conveniencia.
Muestreo por juicio
Muestreo Causa / Efecto
Muestreo por Cuotas
Muestreo de Poblaciones Mviles
2.1.1. Muestreo por conveniencia
La muestra se determina por conveniencia, incorporando elementos en la muestral
sin probabilidades especificadas o
conocida de
seleccin. Por ejemplo un
profesor que se encuentra investigando una causa universitaria, puede usar
alumnos voluntarios para formar la muestra, tan solo porque dispone fcilmente
de ellos y participan como elementos a un costo pequeo o nulo. Tiene la
ventaja de ser de fcil seleccin y recoleccin de sus datos. Tiene la
desventaja de no poderse evaluar en su bondad de la muestra en
funcin de la representatividad de la poblacin, motivo por el cual se hace
imposible inferir a cerca de la poblacin correspondiente.
2.1.2. Muestreo por juicio
En este mtodo la persona por experiencia y capacidad selecciona a los
individuos u otros elementos de la poblacin, que supone son los ms
representativos de esa poblacin.
Por ejemplo un reportero puede
muestrear uno o dos senadores, por considerar que ellos reflejan la opinin
general de todos.
2.1.3. Muestreo causa / efecto
Se realiza cuando no hay una poblacin definida y se requiere tomar
elementos para el estudio en cuestin, caso por el cual se toman los elementos
disponibles.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

17

2.1.4. Muestreo por cuotas


Cuando es necesario obtener una cantidad dada de elementos que constituyen
una muestra proporcional a la poblacin, se toman elementos hasta cubrir
dicha cuota. El caso de tomar una cantidad de carros en una esquina para
hacer un estudio sobre accidentalidad en dicho sitio.
2.1.5. Muestreo de poblaciones mviles
Mtodo propio de poblaciones mviles como en estudios de migracin
ocurridos en un sitio determinado. El caso tpico es con animales que migran,
donde se hace captura-marca- recaptura.
2.2. Muestreo Probabilstico
El muestreo aleatorio o muestreo probabilstico, es aquel en que cada uno de
los elementos de la poblacin objeto de estudio, tienen una probabilidad
matemtica conocida, y frecuentemente igual, para ser elegido en la muestra.
Muestra probabilstica
Una muestra se considera probabilstica si cumple con las siguientes
condiciones:
a)

Se pueda definir un conjunto de muestras M1, M2, M3... Mi posibles


derivados del proceso de seleccin propuesta. As se puede identificar
que unidades de muestreo pertenecen a la muestra M1, M2, M3... Mi

b)

A cada muestra posible le debe corresponder una probabilidad de


seleccin conocida P(S).

c)

El proceso de seleccin garantiza que todos los elementos de la poblacin


tienen una probabilidad P(yi)>0 de ser elegido en alguna muestra.

d)

La seleccin es un proceso aleatorio que garantiza que cada


muestra S tenga una probabilidad P(S) de ser elegida. Muestreo aleatorio
simple
Dentro del muestreo probabilstico o aleatorio existen cuatro mtodos:
1. Muestreo aleatorio simple
2. Muestreo estratificado
3. Muestreo sistemtico
4. Muestreo por conglomerados

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

18

2.2.1. Muestreo Aleatorio Simple


El M A S es la forma m s sencilla de muestreo probabilstico y es la base de
tcnicas ms complejas. La muestra se puede tomar de una poblacin finita
o infinita, la cantidad de muestras posibles depende del tipo de diseo y la
forma de tomar las muestras. Este tipo de muestreo se utilize cuando se
considera que la poblacin es ms o menos homognea. Como ya sabemos el
muestreo puede ser con y sin reemplazamiento.
El marco de muestreo corresponde a la lista codificada de todas las observaciones
que hacen parte de la poblacin. La muestra se elige de tal manera que cada
observacin tiene la misma probabilidad de ser elegida, la eleccin de una
observacin NO tiene influencia sobre la eleccin de otra. Es de aclarar que en el
M.A.S la unidad de muestreo es igual a la unidad de observacin.

Este tipo de muestreo requiere la construccin de un marco de


muestreo, consistente en el listado completo de las unidades de la
poblacin.

Tcnicas para Seleccionar la Muestra


a) Tabla de nmeros aleatorios
(Ver tabla siguiente). Se enumeran las unidades que conforman la poblacin
objetivo de estudio, partiendo desde 01 hasta 99, desde 001 hasta 999, y as
sucesivamente, dependiendo del tamao poblacional. Luego se define el
tamao de la nuestra y como los elementos de la
poblacin estn
listados
y codificados, entonces se establece un punto de partida:
Columna x Fila y, se van leyendo ya sea horizontal o verticalmente los
nmeros de la tabla hasta completar el tamao de la muestra.
Ejemplo
Suponga que tenemos N=30 facturas de servicios pblicos (unidades en la
poblacin), saque una muestra aleatoria simple de tamao n=5.
Paso 1: Asigne etiquetas: D a cada unidad en la poblacin un nmero, etiqueta o
identificacin. Todas las etiquetas deben tener el mismo nmero de dgitos. Como
tenemos 30 unidades y el nmero 30 tiene dos dgitos, todas las unidades tienen
que tener dos dgitos.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA
Tabla 1.
Facturas de servicios pblicos
Recibo No.
Valor $
01
$
45.661
02
$
43.629
03
$
41.502
04
$
45.069
05
$
45.813
06
$
49.687
07
$
45.960
08
$
35.001
09
$
49.553
10
$
46.976

Recibo No.
11
12
13
14
15
16
17
18
19
20

$
$
$
$
$
$
$
$
$
$

Valor $
37.798
33.672
39.607
34.904
36.701
34.001
36.302
48.728
48.706
34.881

Recibo No.
21
22
23
24
25
26
27
28
29
30

$
$
$
$
$
$
$
$
$
$

19

Valor $
44.901
40.155
48.082
32.825
45.915
30.382
41.835
47.227
48.485
45.159

Paso 2: Use la tabla: Empezando en un lugar escogido al azar lea grupos de


dgitos (dependiendo del nmero de dgitos en las etiquetas) de izquierda a
derecha, continuando con la lnea siguiente cuando se acabe la lnea que est
leyendo. Si el grupo de dgitos corresponde a una de las etiquetas, ese nmero
identifica a una de las unidades que ser seleccionada. Si el grupo de dgitos no
corresponde a una de las etiquetas o si ya fue seleccionado, se salta al grupo
siguiente.
Por ejemplo suponga que el lugar de partida escogido al azar fue la fila 05,
columna 1 (la columna 1 es la 12345) y la lectura sera vertical (aunque puede ser
horizontal):

33850

Se toman dos digitos porque la muestra es 30 (que tiene dos digitos)


Este nmero no se escoge porque est por encima de 30

97340
Este nmero no se escoge porque solo se escogen numerous entre
01 y 30. Se sigue buscando y se llega hasta un nmero menor o
igual a 30
Este nmero si se escoge porque es menor a 30.
14756
Se contina y si con la primera columna no se han encontrado los 5 nmeros para
la muestra se pasa a la siguiente.
Cabe notar que el nmero 23913 de la tabla se salta ya que se repite el 23 que se
encontr en 23236
La muestra est conformada por las observaciones que se ubican en la posicin:
14, 23, 09, 11 y 06

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

20

Tabla 2.
Nmeros aleatorios
Columna
00000
12345

00001
67890

11111
12345

11112
67890

22222
12345

22223
67890

33333
12345

33334

01
02
03

49280
61870
43898

00283
08612
86129
84598
85507

07275
97349
97653

89863
20775
91550

62993
33850

35779
07468
25078
30454
51438

81163
98083
78496

04
05

88924
41657
65923
93912
58555

56095
71865

20664
79488

12872
76783

02348
45091
08078
64647
31708

06
07
08
09

97340
70543
89382
37818
60430

03364
29776
93809
72142
22834

88472
10087
00796
67140
14130

04334
10072
95945

63919
55980
34101

36394
64688
81277

68239
66090

50785
96593

22380
23298

16703
56203

53362
92671

92470
20461
88872
44940
15925

82975
39087
55700
14756
32166

66158
71938
24586

19436
54324

55790
08401
11865

1367512
59208
43189

83832
63491

69229
26299
63397
32768
04233

28661
49420
44251

23997
53251

84731
40355
93247
78643
70654

18928
33825

57070
69662

23236
45794
09893
54382
94750

73751

31888

83246

47651

15130
14225

81718
82455
68514

06546

26926
20505
74598
89923

14523
20048

55058
56788
27686
94598

52551
96297
46162
26940

04877
47182

91499
37089

78305
46427
68479
80336

70297
85157

34135
47954

53140
32979

33340
26575

42050
57600

82341
40881

44104

22
23
24

11100
36871

02340
50775

12860
30592

96644
17381
51690

89439
68856
54607

28707

22255
60103

Rengln

10
11
13
14
15
16
17
18
19
20
21

32596
75912
92827

11095

12250

67890

78822
83554
36858
82949
73742
25815
35041

25

23913

48357

63308

74697
57143
16090

26
27

79348
92074

36085
54641

27973
53673

65157
54421

28
29
30

06873

21440

75593

41373

07456
18130
49502

17972

25626
69593
82578

12478
57175

37622
55564

99659
65411

31065
42547

83613
70457

69889
03426

58869
72937

83792

31
32

91616
78025
27587

11075
73539
67228

07831
39044
10175

59309
47450
12822

13276
03197
86687

26710
12787
65530

73000
47709
49325

16690
70183

20427
58065

80103
14621
80145
04251
65489

64477
31833

73709
82093

73945
16747

92396
10386

68263
59293

35385
93242

15679
13431

99742
24590

50866
02770

78028
48582

75573

67257
58595

38

90730
10934
82462
27463

47416
16285

13389
93699

80268
60912

40

02979

30166
10433
52997

79613

39

92709

90110

41

46888

75233

52507

42

53638

69929
83161

08289

12639

32097
08141

43
44

82433

61427
31672

17239

89160

50082

22795

19666
66948

42581

08792

13257

27398
90542

72906

63955

77563

51839

66530

16687
85264

35179
05575
34189

33
34
35
36
37

45

35766
10853

46

20341

47
48

54458

49

26337
34314

50

28603

23729
10708

07606
09079

68933

25853
72407

00906
05085

55538
57054
49464
16364
29571

94532

96666
95632

47506

53693

49892

37594

10067
28437

67327

08814
65581

37841

12847

84393

61973

24450

52351

15890
16602

17276
52901

10646

74692

48438

53355

46560

00123

83281
44546

19177
79896

96855
92166

23820
15181

11091

79821

66628

58599

12640

09268

Fuente:Web

Paso 3: Indicar segn las posiciones que arroja la tabla de nmeros aleatorios

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

21

cuales elementos se escogern para la muestra


Tabla 3:
Seleccin muestra de 5 recibos ejemplo 1
No. Recibo
Valor $
No. Recibo
01
$
45.661
11
02
$
43.629
12
03
$
41.502
13
04
$
45.069
14
05
$
45.813
15
06
$
49.687
16
07
$
45.960
17
08
$
35.001
18
09
$
49.553
19
10
$
46.976
20

$
$
$
$
$
$
$
$
$
$

Valor $
37.798
33.672
39.607
34.904
36.701
34.001
36.302
48.728
48.706
34.881

No. Recibo
21
22
23
24
25
26
27
28
29
30

$
$
$
$
$
$
$
$
$
$

Valor $
44.901
40.155
48.082
32.825
45.915
30.382
41.835
47.227
48.485
45.159

Este mtodo de seleccin permite que todos los elementos que constituyen la
poblacin tengan la misma posibilidad de ser incluidos en la muestra. Los
elementos se escogen en forma individual y aleatoriamente de la totalidad de
la poblacin. Esta seleccin puede ser sin reemplazamiento, similar a la que
se realiza en la extraccin aleatoria de nmeros en el juego denominado baloto.
Cada elemento que constituye la muestra se selecciona
una sola vez,
denominndose extracciones sin reposicin.
En otras ocasiones, cada elemento puede ser elegido ms s de una vez en
la misma muestra, como por ejemplo, cuando se selecciona aleatoriamente el
nmero ganador de una lotera, que puede ocurrir ser el mismo nmero; en
estos casos se dice que las extracciones son realizadas con reposicin.
b)

Programa de Computador: Utilizando el programa Excel que es el ms


comn se puede desarrollar nmeros aleatorios de la siguiente manera:

Si la poblacin es de N = 1.000 observaciones y se desea una muestra de 20,


entonces: Sobre una celda se escribe =ALEATORIO ()*N y se da clic, el
sistema genera el primer nmero aleatorio, se despliega en la parte inferior
derecha de la celda del nmero hasta el tamao de la muestra definida.
Sintaxis para obtener
observaciones

nmeros aleatorios

Figura 2. Sintaxis nmero aleatorio en Excel

de una

poblacin de 1000

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

22

Al dar clic se genera el primer nmero aleatorio y desplegando se obtiene los


que se desea.
De esta manera se obtiene los nmeros aleatorios que se requieren
para tomar la muestra aleatoria de la poblacin objeto de estudio. Si se
vuelve a hacer el proceso, se obtendrn nuevos nmeros y cada que se realice
un nuevo proceso, se generarn diferentes nmeros; esto por lo de Aleatorio.
VIDEOS
Seleccin de
muestras a travs
de M.A.S

c)

Mtodo de Fan Muller:

Para seleccionar una muestra aleatoria simple mediante este mtodo hay que
seguir los siguientes pasos:
1. Para cada elemento de la poblacin se genera un nmero aleatorio entre 0
y 1. Ese nmero aleatorio se llamar r.
2. Se hace un recorrido secuencial de la poblacin y se incluye a la muestra
el nmero aleatorio r si cumple:
Comprobando que no estuviera anteriormente introducida, en el caso de
que est repetida se pasa a la siguiente unidad. Si se introduce la unidad
se vuelve a empezar en el paso 1.
3. El algoritmo termina cuando

d)

Coordinado Negativo: El proceso general es de la siguiente manera:


1. Se adiciona una variable aleatoria U con distribucin uniforme U (0, 1)
2. Se ordena el marco muestral segn la distribucin U.
3. La muestra se forma de los n primeros elementos del marco ordenado

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

23

2.2.2. Muestreo Aleatorio Estratificado


En el diseo de muestreo probabilstico, es pertinente identificar la poblacin
objeto de estudio, ya que no siempre la variable de anlisis es ms o menos
homognea. Si se desea analizar la variable peso; por lo general los hombres
pesan ms s que las mujeres, en estratos altos se paga ms arriendo que
en estratos bajos. En estos y otros muchos casos el M. A. S. no es adecuado.
En casos donde la poblacin es muy heterognea respecto a la variable
de estudio el muestreo estratificado es mejor que el muestreo aleatorio simple.
La palabra estratificar hace referencia a formar Capias.
DEFINICIN: Una muestra aleatoria estratificada se obtiene mediante la
separacin de los elementos de la poblacin en subgrupos llamados ESTRATOS,
los cuales son disyuntos.
Obtenidos los estratos, en cada uno se obtiene la muestra por M.A.S para el
estudio de la variable de inters.
Como los elementos de los estratos son disyuntos, entonces cada
unidad de
muestreo pertenece solo a un estrato.
Las
muestras
seleccionadas en los estratos deben ser independientes; es decir, la elegida
en un estrato no debe afectar la eleccin de otra muestra en otro estrato.
La esencia de la estratificacin es que sta saca provecho de la
homogeneidad conocida de las sus poblaciones, de tal forma slo se requieran
muestras relativamente pequeas para estimar las caractersticas de cada
sub-poblacin, estas estimaciones individuales pueden entonces ser
fcilmente
combinadas para producir una estimacin de toda la
poblacin; adems, la economa en el tamao
de la muestra, un
valioso sub-producto del esquema del muestreo estratificado es que las
estimaciones obtenidas para diferentes partes
de la
poblacin se
pueden usar posteriormente para hacer comparaciones.
Para una descripcin general del muestreo aleatorio estratificado y los
mtodos de inferencia asociados con este procedimiento, suponemos
que
la poblacin est dividida en h subpoblaciones o estratos de tamaos
conocidos N1, N2,..Nh
tal que las unidades en cada estrato sean
homogneas respecto a la caracterstica en cuestin.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

24

Figura 3. Poblacin divida en estratos

Ejemplo
Poblacin de tutores del CEAD Ibagu - UNAD (ver figura 3). El tamao de la
poblacin 18 tutores (N= 18), la cual est dividida en 3 escuelas o subgrupos
(H=3). Cada escuela es un estrato, y se tiene que son diferentes los perfiles de los
tutores de una escuela a otra pero al interior de cada una son similares sus
profesiones, esto significa que los subgrupos son heterogneos entre s, pero
homogneos dentro de cada uno.

VENTAJAS DEL MUESTREO ESTRATIFICADO


1.

Evitar la obtencin de muestras errneas, tal es el caso de


escoger elementos que podran sesgar el muestreo, por consiguiente
se puede perder representatividad de la poblacin.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

precisa

de

ciertos

subgrupos

para

25

2.

Obtener informacin
comparaciones

hacer

3.

Producir un lmite de error de estimacin (B) ms pequeo, comparado con


el obtenido en el M.A.S. para un mismo tamao de muestra.

4.

Los costos por observacin en las encuestas son ms reducidos ya


que se evitan desplazamientos extremos.

5.

Las estimaciones se obtienen por subgrupos as los estratos se hacen


identificables.

Notacin: Partiendo de la poblacin o universo U cuyo tamao es N,


sta se divide en NL estratos.

Figura 4. Tamao de estratos

N = N1 + N2 ++NL (Tamao poblacional)


= Tamao del estrato i.
= Valor de la observacin j en el Estrato i.
= Media poblacional en el estrato i.
= Varianza poblacional en el estrato i.
= Total poblacional en el estrato i.
Proporcion poblacional en el estrato i
La media poblacional del estrato, la varianza poblacional del estrato, el
total poblacional del estrato y el total poblacional, se obtiene de la siguiente
manera:
En cada estrato se obtiene una muestra aleatoria por M.A.S. Si tenemos el

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

26

estrato l, se puede hacer el siguiente anlisis.


Tamao de la muestra en el estrato i

Promedio de la muestra del estrato i


Varianza muestral del estrato i

Proporcin estimada del estrato i

Donde

son los elementos j del estrato i

Tamao de la submuestras en los estratos


( ) Ecuacin No.1
Dnde:
N = Tamao de la poblacin
N=

Tamao de la muestra

Ni= Tamao del estrato i


ni= Tamao de muestra en el estrato i
N= N1+N2+N3+..+Nh
n = n1 + n2++ ni
Ejemplo
La seccin operativa de una empresa de confecciones cuenta con 100
empleados, la cual est dividida en operarios de maquina plana, dibujantes y
cortadores, de los que hay 40, 35 y 25 operarios respectivamente; se quiere hacer
un estudio estadstico y se toma una muestra de 20 empleados. Cuntos
operarios de cada lnea deben escogerse si la seleccin se hace a travs de un
muestreo estratificado?
N= 100
n = 20
N1= 40
N2= 35
N3= 25

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

27

La muestra de 20 empleados debe estar compuesta por 8 de mquina plana,


7 dibujantes y 5 cortadores.

2.2.3. Muestreo Sistemtico


Es utilizado por algunos contadores para revisar sumas, cuentas, inventarios,
etc., por ser un mtodo directo y econmico. Consiste en seleccionar uno a
uno, los elementos de la muestra en un orden determinado, dando un inicio
aleatorio. Es decir, la muestra queda ordenada.
La fraccin de muestreo se establece por medio de la siguiente relacin:

Dnde:
f = Fraccin de muestreo
N= Poblacin
n = Tamao de la muestra
Ejemplo
De una poblacin de 1.000 observaciones, se desea tomar una muestra de 10,
cules seran las observaciones que haran parte de la muestra sistemtica.
La fraccin de muestreo es:
f = Fraccin de muestreo
N= Poblacin
n = Tamao de la muestra
Como la fraccin de muestreo dio 100, el primer elemento se selecciona
aleatoriamente en el intervalo cero a cien, por ejemplo seleccionando el
nmero 25, el segundo elemento que se selecciona es 125 (25+100), luego el
225 (125+100) y as sucesivamente, hasta completar la muestra de diez.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

28

Puede ver un ejemplo de muestreo sistemtico en:


https://sites.google.com/site/unadjeammysh/recursos-de-apoyo

Clic all para descargar archivo

Figura 5. Recursos de apoyo

Un problema especfico del muestreo sistemtico es la existencia de cualquier


factor peridico o cclico en la lista de la poblacin que pudiera conducir a
un error sistemtico en los resultados muestrales.
Ejemplo
Si en un hospital hay un universo de quince mil cien historias clnicas
que estn numeradas interrumpidamente y se desea tener una muestra
equivalente al 10%, o sea, mil quinientas diez historias, ello significa que ha
de tomarse una de cada 10, ya que (15100 /1510 = 10). La primera historia
puede seleccionarse del primer grupo de 10. Si la primera historia
seleccionada es la nmero 8 en la poblacin, teniendo en cuenta que el
ocho es un nmero cualquiera tomado aleatoriamente; la segunda ser la 18=
(8+10) la tercera ser la 28 = (18 + 10), la cuarta ser la 38 = (28 + 10), y as
sucesivamente.
La estimacin y tamao de muestra tiene un anlisis similar al muestreo
aleatorio simple M.A.S.

2.2.4. Muestreo Conglomerados


Este es un mtodo de muestreo aleatorio en el que los elementos de la
poblacin se dividen en forma natural en subgrupos, de tal forma que dentro de
ellos sean lo ms heterogneo posible y entre ellos sean homogneos, caso
contrario al muestreo estratificado.
Este tipo de muestreo se usa en particular cuando no se dispone de una

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

29

lista detallada y enumerada de cada una de las unidades que conforman el


universo y resulta muy complejo elaborarla. Se le denomina as debido a
que en la seleccin de la muestra en lugar de escogerse cada unidad se
procede a tomar los subgrupos o conjuntos de unidades, a los que se llama
"conglomerados". Aunque quiz por ello se tienda a creer que es lo
mismo que
el estratificado, ambos se diferencian en que en los
conglomerados los subconjuntos se dan en la vida real o ya estn
agrupados de esa manera; por ejemplo: Escuelas, tipos de Industrias,
bloques de casas y otros. En el estratificado el investigador decide las
agrupaciones que utilizar segn la posible variabilidad de los fenmenos a
estudiar; otra diferencia es que en este el investigador conoce la distribucin
de la variable, todo lo contrario que en el muestreo por conglomerado.
El proceso se indica definiendo los conglomerados, despus se seleccionan los
subconjuntos a estudiar (o sea, que se realiza un muestreo de
conglomerados); de estos seleccionados se procede a hacer el listado de las
unidades que componen cada conglomerado, continuando posteriormente con la
seleccin de las unidades que integrarn la muestra, siguiendo algunos de los
mtodos aleatorios indicados.
Si se desea hacer un estudio en las escuelas de educacin primaria sobre un
determinado fenmeno, inicialmente se seleccionan las escuelas que se
estudiarn, de esas escuelas seleccionadas se determinan los grados o clases
que deben incluir y posteriormente se escogen los alumnos, que sern las
unidades de observacin, utilizando uno de los mtodos aleatorios. Se estima
que las inferencias que se hacen en una muestra conglomerada no son tan
confiables como las que se obtienen de un estudio hecho por muestreo aleatorio.
Ejemplo
Si un analista de la Secretara de Salud necesita hacer un estudio de los
servicios mdico-asistenciales que reciben los trabajadores del rea
metropolitana, sera difcil obtener una lista de todos los trabajadores de la
poblacin objetivo. Sin embargo podra obtenerse una lista de las empresas y
fbricas del rea. Con esta lista, el analista puede tomar una muestra aleatoria
de las empresas o
fbricas,
que representan conglomerados de
trabajadores, y obtener la informacin de los servicios mdicos que se les
estn prestando.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

30

Leccin No 3: Tipos de Seleccin de Muestras


En el diseo Muestra hacemos referencia a la probabilidad de seleccin, la
cual consiste en definir el valor de probabilidad de que una muestra dada
sea seleccionada. En teora de probabilidad existen dos tipos de seleccin:
3.1. Seleccin con Reemplazamiento:
Consiste en que los elementos seleccionados una vez medidos vuelven a la
muestra, lo que hace que el espacio Muestra permanezca constante. Por lo
anterior la ocurrencia de un evento no afecta la ocurrencia de otro, por lo que
los eventos se consideran independientes.
Ejemplo
Si en una bolsa se tiene 4 bolas blancas y 5 bolas negras. Cul ser
la probabilidad que al seleccionar dos bolas, estas sean blancas?
La probabilidad de que la primera sea negra es: (
La probabilidad de que la segunda sea negra es: (

3.2.

)
)

Seleccin sin Reemplazamiento:

Los elementos elegidos una vez la medicin, estos NO vuelven a la


muestra, lo que hace que el espacio muestral cambie a medida que se van
tomado elementos de la muestra.
Ejemplo
Si en una bolsa se tiene 4 bolas blancas y 5 bolas negras. Cul ser la
probabilidad que al seleccionar dos bolas estas sean blancas, la seleccin es
sin reemplazamiento?
La probabilidad de que la primera sea negra es: 4/9
La probabilidad de que la segunda sea negra es: 3/8
Recordemos que una vez elegida la primera, sta no vuelve a la muestra.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

31

Ejemplo
Suponga que tenemos N = 4 unidades 1, 2, 3 y 5 en una poblacin
hipottica y
desea seleccionar muestras con reemplazamiento y sin
reemplazamiento de tamao n=2
Para los propsitos de esta seleccin, los valores podran ser el nmero de
las personas que viven en cada una de cuatro unidades habitacionales que
constituyen una poblacin. Se realizar una comparacin entre el muestreo
aleatorio con y sin reemplazamiento para una muestra de tamao n=2.
Primero se listan todas las posibles muestras no ordenadas de tamao n= 2.

Para recordar:

Tabla 4:
Tcnicas de conteo
Muestreo
Con Orden
Con Repeticin
Regla del exponente (o permutaciones
con repeticin)
Nn

Sin Orden
Combinaciones
(

(
(

)
)

Multiplicacin de opciones:
n1 x n2 x n3.
Sin Repeticin

Permutaciones (de n elementos tomados


todos a la vez)
N! = NPn
Permutaciones (de N elementos tomados
de r en r. con
)
(

Combinaciones
(de
N
elementos tomados de r en r.
con
)
(

Leccin No 4: Mtodos de Inferencias, Paramtrico y No


Paramtrico
4. Mtodos De Inferencia
Los procedimientos de inferencia permiten establecer conclusiones acerca de
una poblacin, a partir de las propiedades estudiadas en una muestra de ella.
Adems, como dichas conclusiones dependen de sucesos aleatorios, se les
asociar un nivel de confianza o de verosimilitud.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

32

Mtodos de
Inferencia

Parmetrico

Estimacin

Pruebas de
Hiptesis

No
Parmetrico

Pruebas No
Parmetricas

Grfico No.1 Mtodos de inferencia

4.1. Mtodos Paramtricos


Resuelve objetivos relacionados con parmetros de una poblacin, tales como
media, varianza, proporcin etc. Estos modelos se apoyan en el conocimiento
de la distribucin de probabilidad asociada a dicha poblacin aunque se
desconozca algn parmetro de dicho modelo. Por ejemplo podemos suponer
que el nmero de clientes atendidos por hora en una entidad bancaria sigue un
modelo de Poisson pero de parmetro desconocido.
Para resolver un problema de inferencia paramtrico se utilizan dos tipos de
procedimientos:
4.1.1. Estimacin: Puntual cuando obtenemos valores aproximados del
parmetro desconocido y una medida de error asociado; por Intervalos
cuando obtenemos un rango de valores, que contiene el verdadero valor
del parmetro con una probabilidad o confiabilidad prefijada.
4.1.2. Test de Hiptesis: Cuando aceptamos o rechazamos una hiptesis
relacionada con uno o varios parmetros de una poblacin desconocidos,
con un cierto nivel de error prefijado.
4.2. Mtodos no paramtrico
Los mtodos no paramtricos se refieren a menudo como distribucin
libremente mtodos pues no confan encendido asunciones que los datos estn
dibujados del dado distribucin de la probabilidad. Resuelven situaciones
relacionadas con el tipo de distribucin de probabilidad asociada a la poblacin
de estudio u otros objetivos no relacionados directamente con parmetros.
Lo deseable en estos casos ser buscar la inferencia en contrastes que sean
vlidos bajo un amplio rango de distribuciones de la poblacin. Tales contrastes

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

33

se denominan no paramtricos.
El trmino no paramtrico no se significa implicar que tales modelos carecen
totalmente parmetros, sino que el nmero y la naturaleza de los parmetros son
flexibles y no fijados por adelantado.
Ventajas y Desventajas
Las pruebas no paramtricas no necesitan suposiciones respecto a la
composicin de los datos poblacionales. Las pruebas no paramtricas son de
uso comn:
1. Cuando no se cumplen las suposiciones requeridas por otras
tcnicas usadas, por lo general llamadas pruebas paramtricas.
2. Cuando es necesario usar un tamao de muestra pequeo y no es
posible verificar que se cumplan ciertas suposiciones clave.
3. Cuando se necesita convertir datos cualitativos a informacin til para
la toma de decisiones.
Existen muchos casos en los que se recogen datos medidos en una escala
nominal u ordinal. Muchas aplicaciones de negocios involucran opiniones o
sentimientos y esos datos se usan de manera cualitativa.
Ventajas
Las pruebas no paramtricas tienen varias ventajas sobre las pruebas
paramtricas:
1. Por lo general, son fciles de usar y entender.
2. Eliminan la necesidad de suposiciones restrictivas
paramtricas.
3. Se pueden usar con muestras pequeas.
4. Se pueden usar con datos cualitativos.
Desventajas
Tambin las pruebas no paramtricas tienen desventajas:
1. A veces, ignoran, desperdician o pierden informacin.
2. No son tan eficientes como las paramtricas.

de

las

pruebas

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

34

Leccin No 5: Estimadores y propiedades de los estimadores


5. Estimador
En estadstica, un estimador es un estadstico (esto es, una funcin de la
muestra) usado para estimar un parmetro desconocido de la poblacin. Por
ejemplo, si se desea conocer el precio medio de un artculo (el parmetro
desconocido) se recogern observaciones del precio de dicho artculo en
diversos establecimientos (la muestra) y la media aritmtica de las
observaciones puede utilizarse como estimador del precio medio.
Para cada parmetro pueden existir varios estimadores diferentes. En general,
escogeremos el estimador que posea mejores propiedades que los restantes,
como insesgadez, eficiencia, convergencia y robustez (consistencia).

5.1. Propiedades de un estimador


El concepto de estimacin de parmetros mediante la especificacin de las
propiedades que deben cumplir los estimadores y el desarrollo de tcnicas
apropiadas para implementar el proceso de estimacin. Se utilizar el punto
de vista prctico de la teora del muestreo, que considera un parmetro como
una cantidad fija pero desconocida.
Para evaluar la calidad de un estadgrafo como un estimador este debe
cumplir las siguientes propiedades:
5.1.1. Insesgado
Un estimador insesgado es aquel cuya media o valor esperado de la distribucin
de las de las estimaciones es igual al parmetro estimado. En otras palabras,
cuando el promedio de un estimador muestral es igual al parmetro poblacional
que se desea estimar.
5.1.2. Eficiencia:
La eficiencia se refiere al tamao del error estndar del estadgrafo de la
muestra. Si se comparan dos estadgrafos de una muestra del mismo tamao y
se desea decidir cul de los dos es el estimador ms eficiente, se escoger
el estadgrafo que tenga el menor error estndar o desviacin de la
distribucin muestra. Supngase que se escoge una muestra de un tamao
dado y se decide cuando usar la media muestra o la mediana muestra para

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

35

estimar la media de la poblacin. Si se calcula el error estndar de la media


muestra y se encuentra que es igual a 2.15 y luego se calcula el error
estndar de la mediana muestra y se encuentra que es de 2.6, se podr
decir que la media muestra es un estimador ms eficiente de la media de la
poblacin porque su error estndar es menor o con menos variacin, tendr
una mayor oportunidad de producir un estimador ms cercano al parmetro de
la poblacin bajo estudio.
5.1.3. Consistencia:
Un estadgrafo es un estimador consistente de un parmetro de la poblacin
si en la medida en que el tamao de la muestra aumenta se est seguro de
que el valor del estadgrafo se acerca al valor del parmetro de la poblacin.
Cuando un estimador es consistente, se vuelve ms confiable tomando
muestras grandes. De esta manera, cuando usted se preocupa por
aumentar el tamao de la muestra para obtener ms informacin acerca de
un parmetro de la poblacin, debe primero encontrar si su estadgrafo es
un estimador consistente, si no es as, usted desperdiciar dinero y tiempo
al tomar muestras grandes.
5.1.4. Suficiencia:
Estadsticos que, de alguna manera, resumen toda la informacin de una muestra
relacionada con un parmetro objetivo, se dice que tienen la propiedad de
suficiencia, es decir, utilizan toda la informacin relevante contenida en una
muestra.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

36

Ejercicios propuestos

En cierta cadena de centros comerciales trabajan 150 personas en el


departamento de personal, 450 en el departamento de ventas, 200 en el de
contabilidad y 100 en el de servicios al cliente. Con el objeto de realizar una
encuesta laboral, se quiere seleccionar una muestra de 180 trabajadores. Qu
nmero de trabajadores tendramos que seleccionar en cada departamento
atendiendo a un criterio de proporcionalidad
R/ta: 30, 90, 40, 20

Suponga que se quiere estimar el nmero de das-hombre perdidos debido


a accidentes de trabajo en un mes particular. Adems se sabe que la mayor
parte de dichos accidentes se presentan en los niveles operativo, tcnico y
administrativo. Cul de los siguientes diseos de muestreo es el ms
aconsejable?:
R/ta: Estratificado, identificando como estrato los niveles de trabajo

Supongamos que en la ciudad T hay 200 barrios. Si elegimos al azar dos


de estos barrios, de manera que la muestra est compuesta por todos
los individuos de esos dos barrios. Se trata de de:
R/ta: Por conglomerados

Se ha proyectado realizar una encuesta sobre el consumo de leche en


las familias. El nmero de familias de la poblacin es 6000 y el tamao de
la muestra 840, con la siguiente clasificacin de profesin u oficio:
Profesionales:
Operarios:
Servicios
Generales:

100 Comerciantes: 200


2000 Agricultores:
600
1900 Empleados:
1200

Cuntas familias de agricultores deben estar representadas en la muestra.


R/ta: 84

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

37

CAPITULO DOS: DISTRIBUCIONES MUESTRALES


Introduccin
Como se ha sealado anteriormente, el propsito del muestreo es averiguar las
caractersticas de la poblacin en estudio. Se recuerda de nuevo que para
poder dar conclusiones de los parmetros se usan los estadsticos que son
mediciones obtenidas en la muestra, mientras que los parmetros son
caractersticas medibles propias de la poblacin.
El escoger una muestra, es un proceso que inevitablemente puede arrojar
diferentes subconjuntos de la poblacin, por ejemplo de la poblacin de tutores,
se puede escoger como muestra los tutores de la ECBTI o escoger los de
ECEDU. El valor del estadstico es aleatorio porque depende de los elementos
elegidos en la muestra seleccionada- tambin aleatoria- de tamao n y, por lo
tanto, el estadstico tiene una distribucin de probabilidad la cual es llamada la
Distribucin Muestral del estadstico.
Objetivo general
Que los estudiantes lleguen a formar, no slo, una muestra si no un conjunto de
posibles muestras de una poblacin, con las unidades de observacin y sean
capaces de reconocer la distribucin de ese conjunto de muestras.

Objetivos especficos

Comprender la importancia del teorema del lmite central.


Establecer las diferencias entre un parmetro y un estadstico

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

38

Leccin No 6: Distribuciones Muestrales


En estadstica, la distribucin muestral es lo que resulta de considerar todas las
muestras posibles que pueden ser tomadas de una poblacin. Su estudio permite
calcular la probabilidad que se tiene, dada una sola muestra, de acercarse al
parmetro de la poblacin. Mediante la distribucin muestral se puede estimar el
error para un tamao de muestra dado.
Como bien lo afirma Ximenez, C. (S, F.) La estadstica inferencial trata sobre las
inferencias con respecto a las poblaciones (sus parmetros y 2) a partir de la
informacin contenida en las muestras (los estadsticos y S2).
Para poder llevar a cabo esas inferencias es necesario conocer la relacin que se
establece entre estadsticos y parmetros. El concepto que permite poner en
relacin ambas cosas es la distribucin muestral de un estadstico.

Figura 6. Distribucin de un estadstico

Algunos estadsticos pueden ser: La media, la proporcin y la desviacin.


Recuerde que todos son clculos en las muestras.
A cada una de las muestras se les calcula el respectivo estadstico, es decir, se
tendr tantos estadsticos como muestras se haya obtenido. Por ejemplo, si el
estadstico que se est estimando es la media, y si se obtuvo 8 muestras,
entonces, sern 8 medias muestrales las que tendr.
Con todos los resultados del estadstico en todas las muestras, se forma la
distribucin muestral del estadstico.
Distribucin Muestral: Es la distribucin de Probabilidad de un estadstico

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

39

6. Diferentes distribuciones muestrales


Ya que a nivel muestral se pueden calcular diferentes estadsticos, como la
media, desviacin y la proporcin entre otros, se pueden encontrar sus
respectivas distribuciones muestrales, entre estas:

Distribucin muestral de la medias


Distribucin muestral de las proporciones
Distribucin muestral de la diferencias de medias
Distribucin muestral de la diferencias de proporciones

Nota: El muestreo se puede hacer sin o con reemplazamiento.

Ejemplo
En la figura a continuacin se tiene que la variable X, es el nmero de prrafos
digitado por minuto, X: 1, 2, 3, 4.

Figura 7. Distribucin de la poblacin

Poblacionalmente se tiene:
Parmetros
E(X)=
2.5
Var (X)=
1.1180
E(x) es el valor esperado de la variable o promedio, y V(x) es la varianza.

( )
( )

)
(

)
)

(
)

Se sugiere al lector comprobar los clculos para la varianza con el comando


VAR.P en Excel.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

40

Ejemplo
Si se quiere escoger una muestra de tamao 3, es decir compuesta por 3
personas y si adems las muestras se toman con reposicin es decir se puede
volver a incluir el individuo. La distribucin muestral ser:

14

Distribucin de frecuencias de medias


muestrales

12
10
8
6
4
2
0
1,00 1,33 1,67 2,00 2,33 2,67 3,00 3,33 3,67 4,00
Grfico No.2. Histograma de medias muestrales

El 1,00 que se observa corresponde a la media de la muestra conformada por las


observaciones 1, 1, 1; es decir se tomo una muestra de tres personas pero al ser
con reposicin, el primer elemento que se obtuvo fue 1, ste se devuelve la
poblacin y tiene de nuevo la posibilidad de ser escogido, que es lo que vuelve a
suceder, del mismo modo en la tercera extraccin. El valor 1,33 es la media de
una muestra que puede ser por ejemplo las observaciones 1, 1, 2. El total de
muestras es 24 conformadas por 3 personas, ya que se aplica el principio de las
permutaciones.

Leccin No 7: Distribucin Muestral de la Media y de la


Proporcin
Los estadsticos obtenidos en una muestra son variables aleatorias, por lo cual
deben tener una distribucin de probabilidad, as que la media muestral tiene una
distribucin.
Supongamos que se tiene una muestra de tamao n observaciones tomada de
una poblacin normal N (; 2) cada observacin X1= 1, 2, 3,, n tendr la
misma distribucin que la poblacin de donde fue tomada la muestra.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

41

7. Principios y conceptos en la medias muestrales


Teorema: (Poblacin infinita)
------------------------------------------------------------------------------------------------------Sea
la media de la muestra aleatoria de tamao n
proveniente de una poblacin infinita de tamao N con media y varianza 2.
Entonces:
( )
El valor esperado de la media muestral es la media poblacional
( )
La varianza del estimador es igual a la varianza poblacional dividida por el tamao
de la muestra.
Teorema: (Poblacin Finita)
------------------------------------------------------------------------------------------------------Sea

la media de la muestra aleatoria de tamao n


proveniente de una poblacin finita de tamao N con media y varianza 2.
Entonces:
( )
( )
Comentario:

Se conoce como el factor de correccin para poblaciones finitas. Cuando N es


muy grande comparado con n, la diferencia se hace despreciable lo que origina
que para poblaciones infinitas dicho factor de correccin se hace uno.

7.1. Distribucin Muestral de la Media


Las muestras aleatorias obtenidas de una poblacin son, por naturaleza propia,
impredecibles. No se esperara que dos muestras aleatorias del mismo tamao y
tomadas de la misma poblacin tenga la misma media muestral o que sean
completamente parecidas; puede esperarse que cualquier estadstico, como la
media muestral, calculado a partir de las medias en una muestra aleatoria, cambie

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

42

su valor de una muestra a otra, por ello, se quiere estudiar la distribucin de todos
los valores posibles de un estadstico. Tales distribuciones sern muy importantes en
el estudio de la estadstica inferencial, porque las inferencias sobre las poblaciones
se harn usando estadsticas muestrales. Como el anlisis de las distribuciones
asociadas con los estadsticos muestrales, podremos juzgar la confiabilidad de un
estadstico muestral como un instrumento para hacer inferencias sobre un parmetro
poblacional desconocido.
Como los valores de un estadstico, tal como x, varan de una muestra aleatoria a
otra, se le puede considerar como una variable aleatoria con su correspondiente
distribucin de frecuencias.
La distribucin de frecuencia de un estadstico muestral se denomina distribucin
muestral. En general, la distribucin muestral de un estadstico es la de todos sus
valores posibles calculados a partir de muestras del mismo tamao.

Figura 8. Distribucin muestral de medias

Ejemplo Construccin de la distribucin de las medias muestrales.


Un Colegio tiene siete profesores, la retribucin por hora ctedra es la que se
muestra a continuacin:
Tabla 5:
Tabla No. Salario profesores

Profesor
1
2
3
4
5
6
7

Salario $
7000
7000
8000
8000
7000
8000
9000

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

43

Paso 1: Media de la poblacin


9

Paso 2: Varianza de dicha poblacin.


La varianza poblacional est dada por:

Entonces:

(9

9 9

Otra formulacin es:

Recuerde que la desviacin es la raiz cuadrada de la varianza, entonces la


desviavin en este caso es

9 9

699

Paso 3: Distribucin muestral de las medias


Para determinar la distribucin muestral de las medias, se seleccionaron todas
las muestras posibles de tamao 2, sabiendo que son sin sustitucin y que
no interesa el orden de seleccin en la poblacin. Se calculan las medias de
cada muestra y se calcula la media de las medias muestrales.
Para saber cuntas muestras posibles se pueden tomar, se utiliza la combinatoria,
por los preceptos tomados: Sin repeticin y no importa el orden

7 2=

7!
7!
5! 6 7 42 42
=
=
=
=
= 21
(7 2)! 2! (5)! 2!
5! 2!
2!
2

El valor de 21, es el nmero de muestras tamao 2 que se pueden formar de


una poblacin de 7 elementos. A continuacin se indican las 21 muestras posibles
y el valor de la media para cada una de las muestras:

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA
Tabla 6:
Distribucin salarios de profesores. Muestreo sin reemplazamiento y las medias

Muestra

Prof.

Salario

Media Muestra

Prof.

Salario

Media

1y2

7000-7000

7000

12

3y4

8000-8000

8000

1y3

7000-8000

7500

13

3y5

8000-7000

7500

1y4

7000-8000

7500

14

3y6

8000-8000

8000

1y5

7000-7000

7000

15

3y7

8000-9000

8500

1y6

7000-8000

7500

16

4y5

8000-7000

7500

1y7

7000-9000

8000

17

4y6

8000-8000

8000

2y3

7000-8000

7500

18

4y7

8000-9000

8500

2y4

7000-8000

7500

19

5y6

7000-8000

7500

2y5

7000-7000

7000

20

5y7

7000-9000

8000

10

2y6

7000-8000

7500

21

6y7

8000-9000

8500

11

2y7

7000-9000

8000
Suma Total

162.000

En el cuadro siguiente se indica la distribucin de probabilidad para el


muestreo de medias, donde la sumatoria de todas las probabilidades es igual
a uno:
Tabla 7:
Distribucin de probabilidad
Media muestral

Nmero de medias

Probabilidad

7000

0,1429

7500

0,4285

8000

0,2857

8500

0,1429

Suma

21

1,000

Grfico No.3. Histograma de medias muestrales salario de los profesores

44

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

45

Paso 4: Media de la distribucin muestral de medias


La media de la distribucin muestral de medias, se determina sumando las
diferentes medias muestrales y dividiendo la suma entre el nmero de muestras.
La media de todas las medias muestrales en general se expresa:

Ecuacin No.2

Primero se obtiene todas las muestras (todos los subconjuntos) y luego a cada
muestra le calcula la media, finalmente obtendr, tantas medias como muestras
haya, y con esas medias calcula de nuevo un promedio; es decir, se calcula una
media de medias.
6

Vea el valor obtenido en el paso 1 (Media poblacional) y comprelo con el


resultado anterior Son equivalentes!

Note que:

es la media de las medias muestrales y

es la media poblacional.

Por tanto para nuestro caso:


La media poblacional es igual a la media de las medias muestrales

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

46

Paso 5: Construccin de distribucin de errores muestrales

Error Muestral
Cualquier medida conlleva algn error. Si se usa la media para medir, estimar, la
media poblacional , entonces la media muestral, como medida, conlleva algn
error. Por ejemplo, supongamos que se ha obtenido una muestra aleatoria de
tamao 25 de una poblacin con media
; si la media de la muestra es

, entonces a la diferencia observada


se le denomina
el error muestral. Una media muestral x puede pensarse como la suma de dos
cantidades: la media poblacional y el error muestral; si e denota el error
muestral, entonces:

Ecuacin No.3

Al calcular la media y desviacin estndar de los errores muestrales e (ltima


columna de la tabla 7) se tiene respectivamente:

Se deja como ejercicio al lector calcular y

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA
Tabla 8:
Distribucin de errores muestrales. Salario promedio de profesores
Muestra No.

Media de la muestra Media de las medias muestrales Error muestral

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21

7000
7500
7500
7000
7500
8000
7500
7500
7000
7500
8000
8000
7500
8000
8500
7500
8000
8500
7500
8000
8500

7714,3
7714,3
7714,3
7714,3
7714,3
7714,3
7714,3
7714,3
7714,3
7714,3
7714,3
7714,3
7714,3
7714,3
7714,3
7714,3
7714,3
7714,3
7714,3
7714,3
7714,3

-714,3
-214,3
-214,3
-714,3
-214,3
285,7
-214,3
-214,3
-714,3
-214,3
285,7
285,7
-214,3
285,7
785,7
-214,3
285,7
785,7
-214,3
285,7
785,7

Paso 6: Desviacin estndar de las medias muestrales


( )

Y otra forma es:

Dnde:
:


9.

.
.

9.
6

Varianza
Desviacin

47

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

48

Error estndar del estadstico


La desviacin estndar de la distribucin muestral de un estadstico se conoce
como error estndar del estadstico. Para el ejercicio anterior el error estndar
de la media denotado por , es 451,75.

Aunque, se puede notar que en este caso la desviacin de los errores


muestrales y el error estndar, son iguales.

Muestreo con reemplazo


Si de una poblacin se eligen muestras de tamao n con
reemplazo (o la poblacin es No finita), entonces el error estndar
de la media es igual a la desviacin estndar de la distribucin de
los errores muestrales.
En general se tiene:

Ecuacin No.4

Muestreo sin reemplazo


Cuando las muestras se toman de una poblacin pequea y sin
reemplazo se puede usar la siguiente frmula para encontrar

Ecuacin No.5

Es llamado factor de correccin para poblaciones finitas, o en donde

se muestrea sin reemplazo.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

49

Ms adelante se ver que, estas dos concepciones hacen parte de los principios
del teorema del lmite central. Para lo cual se desarrollan dos ejemplos, uno de
muestreo con reemplazamiento y otro sin reemplazamiento.

El siguiente es un diagrama de flujo que le permite identificar en que caso debe


usar o no el factor de correccin.
COMIENZO

si

Es la poblacin
infinita?

No
Se muestrea
con sustitucin?

si

No
si

Es N 20n?

Grfico No.4. Diagrama de flujo para error estndar de la media

Teorema central del lmite.


En el caso de una poblacin con media y varianza 2 , la distribucin muestral
de medias de todas las muestras posibles de tamao n a partir de la poblacin,
tendr una distribucin aproximadamente normal (siendo la media de la
distribucin muestral igual a y la varianza igual a 2 / n ) considerando que el
tamao de la muestra es bastante grande.
El teorema central del lmite es uno de los teoremas ms importantes dentro de

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

50

las ciencias estadsticas, ya que su funcionalidad es muy grande.


TEOREMA CENTRAL DEL LMITE:
Sea X1, X2,, Xn una variable aleatoria independiente e
idnticamente distribuida de una poblacin infinita con media y
varianza 2. Para 2< ,

Entonces:

Presenta una

distribucin Normal estndar.


O sea:

Hay que destacar tres aspectos importantes del teorema central de lmite.
Primer principio:
Si el tamao de la muestra n es suficientemente grande, la distribucin muestral
de las medias ser ms o menos normal. Esto se cumple ya sea que la poblacin
est o no distribuida normalmente. Esto es, el teorema se verifica, ya sea que la
poblacin est distribuida en forma normal, o bien sea sesgada o uniforme.
Segundo principio:
Como se mostr con anterioridad, la media de la poblacin, , y la media de todas
las medias muestrales posibles,

x , son iguales. Si la poblacin es grande y se

selecciona un nmero grande de muestras de la poblacin, la media de las medias


muestrales se aproximar a la media poblacional.
Tercer principio:
La varianza de la distribucin de medias muestrales se determina de 2 / n .
No existe acuerdo general sobre lo que constituye un tamao de muestra
suficientemente grande. Algunos estadsticos consideran que es 30; otros
piensan que un nmero pequeo como 12 es adecuado. El ejemplo sobre los
salarios por hora de todos los profesores del colegio funcion bastante bien con
una muestra de 2. Sin embargo, a menos que la poblacin sea aproximadamente
normal, los tamaos de muestra as de pequeos, por lo general no dan como
resultado una distribucin muestral que se distribuya normalmente. A medida que
el tamao de la muestra se vuelve cada vez ms grande, la distribucin de la
media muestral se aproxima ms a la distribucin normal con forma de campana.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

51

Ejemplo: Muestreo sin Reemplazamiento

Suponga que se tiene una poblacin conformada por 5 empleados de una


empresa (N = 5), y la variable de inters es el nmero de aos de experiencia
laboral de cada empleado. Los datos de la poblacin son:

X i 1,2,3,4,5

Paso 1: Media de la poblacin

1 N
1 2 3 4 5
xi
3 Promedio de aos de experiencia por empleado.
N i 1
5
Paso 2: Varianza de dicha poblacin.

1 N
1
( xi ) 2 (1 3) 2 (2 3) 2 ... (5 3) 2 1.999
N i 1
5
2

Ahora extraemos la raz cuadrada a la varianza y obtenemos la desviacin


estndar. 1.414

Paso 3: Distribucin muestral de las medias


Seleccione ahora todas las muestras posibles de tamao dos, sin
reemplazamiento (poblaciones finitas):
Recordar que cuando el muestreo es sin reemplazamiento y no interesa el orden,
entonces tenemos una combinatoria.

C NN

N!
N n! xn!

Reemplazando:

C25

5!
5!
5 x4 x3!

10
5 2! x2! 3!2! 3! x2

Se tiene 10 muestras posibles de tamao dos. Las posibles muestras se indican a


continuacin:
Tabla 9:
Distribucin de las medias muestrales
Muestra
1-2
13
14
15
23

Media Muestral X
1.5
2.0
2.5
3.0
2.5

Muestra
24
25
3 4
3 5
4-5

Media Muestral X
3.0
3.5
3.5
4.0
4.5

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

52

Paso 4: Media de la distribucin muestral de medias


X

1.5 2.0 2.5 3.0 2.5 3.0 3.5 3.5 4.0 4.5
3
10

Con la informacin anterior se logra demostrar el primer principio del teorema


central del lmite, que consiste en que el promedio de la poblacin es igual al
promedio de la distribucin muestral de medias: X 3
Observe que dicho principio se ha cumplido, en consideracin a que el promedio
de aos de experiencia para la poblacin es de tres y el promedio de la
distribucin muestral de medias es igual tambin a tres.

Paso 6: Desviacin estndar de las medias muestrales


Como siempre primero calculamos la varianza y luego la desviacin estndar.

X 1.5 3 2.0 3

4.5 3.0

10

0.7499

Ahora extrayendo raz cuadrado a la varianza, obtenemos la desviacin estndar.

X 0.7499 0.8660
Observemos que la desviacin estndar de la poblacin (1.4142) es diferente a la
desviacin estndar de la distribucin muestral de medias (0.8660), y una forma
de corregir esta diferencia es mediante la siguiente igualdad:

N n
n N 1

Ecuacin No.6

Dnde:
X

n
N

Desviacin estndar de la distribucin muestral de medias.


Desviacin estndar de la poblacin.
Tamao de la muestra.
Tamao de la poblacin.

N n
Factor de correccin para poblaciones finitas.
N 1

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

53

Reemplazando los valores correspondientes se tiene:

1,4142 5 2
0,8660
5 1
2

El segundo principio del teorema central del lmite para poblaciones finitas se
expresa: La desviacin estndar de la distribucin muestral de medias es igual al
factor de correccin poblacional multiplicada por la relacin entre la desviacin
estndar poblacional y la raz cuadrada del tamao de la muestra. Dicho principio
queda demostrado con la relacin anterior.
Ejemplo: Muestreo con Reemplazamiento

Ahora, cuando el muestreo se realiza para poblaciones finitas, y con reemplazamiento, el


nmero de muestras posibles est dada por:

Nn

Para N = Tamao de la poblacin y n = Tamao de la muestra


El nmero de muestras de tamao dos es: N n 5 2 25

Paso 3: Distribucin muestral de las medias


Tabla 10:
Distribucin de las medias muestrales
No. muestra
Muestra
Media muestral
1
1-1
1.0
2
1-2
1.5
3
1-3
2.0
4
1-4
2.5
5
1-5
3.0
6
2-1
1.5
7
2-2
2.0
8
2-3
2.5
9
2-4
3.0
10
2-5
3.5
11
3-1
2.0
12
3-2
2.5
13
3-3
3.0

No. muestra
14
15
16
17
18
19
20
21
22
23
24
25

Muestra
3-4
3-5
4-1
4-2
4-3
4-4
4-5
5-1
5-2
5-3
5-4
5-5

Media muestral
3.5
4.0
2.5
3.0
3.5
4.0
4.5
3.0
3.5
4.0
4.5
5.0

Paso 4: Media de la distribucin muestral de medias


X

1.0 1.5 2.0 2.5 4.0 4.5 5.0


3
25

El primer principio se mantiene, en el sentido, que la media poblacional es igual a


la media de la distribucin muestral de medias.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

54

Paso 6: Desviacin estndar de las medias muestrales

1 32 1.5 32 4.5 3.02 5.0 3.02


25

1.0

Observe que la desviacin estndar de la poblacin (1.4142) sigue siendo


diferente a la desviacin estndar de la distribucin muestral de medias (1.0)
La forma de corregir esta diferencia para poblaciones no finitas es mediante la
siguiente igualdad:

Correccin para poblaciones no finitas

Reemplazando en el caso que nos ocupa: x

1.41421356
2

Para qu me sirve conocer la distribucin muestral de las medias?

Recordemos que se puede calcular la probabilidad de algn


evento relacionado con la variable aleatoria que se distribuye
normal, mediante la siguiente frmula:
(lo que se conoce como estandarizacin)

Para transformar una variable normal general en una normal estndar (este
proceso se llama tipificar) se debe:

X~N( ,

~ N(0,1)

Ejemplo
a) Probabilidad acumulada en el valor 0,67: la respuesta es 0,7486
b) Probabilidad acumulada en el valor 1,35: la respuesta es 0,9115
c) Probabilidad acumulada en el valor 2,19: la respuesta es 0,98574
La dcima del valor buscado (por ejemplo en 0.67, es 0.6) le indica el valor a
buscar en la primera columna; luego use la centsima para ubicarse en la primera
fila (por el ejemplo en 0.67, es 7); finalmente la interseccin de esas dos hileras es
la probabilidad buscada.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

55

Grfico No 5. Ejemplo de uso de la tabla normal

Veamos ahora, como podemos utilizar la tabla de una distribucin


normal:
Clic para ver Video:
Uso de la tabla normal

As mismo, las medias muestrales se distribuyen como una normal, por tanto, se
puede calcular la probabilidad del comportamiento del estadstico, en este caso la
media de la muestral, de la siguiente manera:
Poblaciones infinitas (o no se conoce):

Ecuacin No.7

Poblaciones finitas y muestreo con reemplazo:

Ecuacin No.8

Ejemplo
Clculo de Probabilidades. Distribucin de medias
Poblaciones infinitas (o no se conoce)
La altura media de los alumnos de un plantel de secundaria es de 1,50 mts. Y su
desviacin tpica es de 0,25 mts. Determinar la probabilidad de que en una
muestra de 36 alumnos, la media sea superior a 1,60 mts.
P( X > 1,60) = ?
Se estandariza la variable (aplicar ecuacin 7):

1,60 1,50 0,10 0,60

2,40
0,25
0,25 0,25
6
36

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

56

Ahora la pregunta queda convertida en: P(Z> 2,40)


O su equivalente: 1- P(Z< 2,40) =?
Si se observa en la tabla de la normal, P(Z< 2,40) = 0,9918,

Entonces

1- P(Z< 2,40) = 1 0,9918 = 0,0082 = 0,8%


Entonces al tomar una muestra la probabilidad de que la media muestral de la
estatura sea superior a 1,60 es 0,8%, es decir, menos del 1%.

Ejemplo
Clculo de Probabilidades. Distribucin de medias
Poblaciones finitas y muestreo con reemplazo
Una empresa elctrica fabrica focos que tienen una duracin que se distribuye
aproximadamente en forma normal, con media de 800 horas y desviacin
estndar de 40 horas. Encuentre la probabilidad de que una muestra aleatoria de
16 focos tenga una vida promedio de menos de 775 horas.
Se estandariza la media muestral (se aplica la ecuacin 7):

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

57

es equivalente:

Este valor se busca en la tabla de z

La interpretacin sera que la probabilidad de que la media de la muestra de 16


focos sea menor a 775 horas es de 0.0062.

7.1.1. Distribucin Muestral de Medias: Poblaciones Finitas:


Las poblaciones finitas, tiene la caracterstica de que N es conocido, al hacer la
distribucin muestral de las medias y muestreo sin reemplazamiento, se obtiene
una grfica de la distribucin que presenta una forma aproximadamente
acampanada, lo cual se puede observar en la siguiente grfica.

Figura 9. Distribucin Muestral de Medias: Poblaciones Finitas

7.1.2. Distribucin Muestral de Medias: Poblaciones No Finitas:


La grfica de la distribucin muestral de medias para poblaciones no finitas y
muestreo con reemplazamiento tiene una distribucin normal, tal como se puede

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

58

observar a continuacin:

Figura 10. Distribucin muestral de medias: Poblaciones No Finitas:

Entonces:
No importa que distribucin tenga la poblacin, pero la distribucin muestral de
medias a partir de esa poblacin, tiene una distribucin normal

Leccin No 8: Distribucin Muestral de la proporcin


8. Distribucin muestral de proporciones
Existen ocasiones en las cuales no estamos interesados en la media de la
muestra, sino que deseamos investigar la proporcin de artculos defectuosos o
la proporcin de personas con telfono, etc en la muestra.
La distribucin muestral de proporciones es la adecuada para dar respuesta a
estas situaciones.
Esta distribucin se genera de igual manera que la distribucin muestral de
medias, a excepcin de que se calcula la proporcin en la poblacin y no la
media (paso 1) ese clculo corresponde a P = A /N, en donde A es el total de
elementos con la caracterstica en la Poblacin y N el tamao de la poblacin.
As mismo, al extraer las muestras de la poblacin se calcula el estadstico
proporcin (p= a / n en donde a es el nmero de xitos u observaciones de
inters y n el tamao de la muestra, en lugar de la media de cada muestra que
era lo que se calcula antes. (Curso de Estadstica 1. Pgina web, Instituto
Tecnolgico De Chihuahua). Ir a la pgina.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

59

Ahora bien, se debe tener en cuenta que cuando se hace anlisis de una
caracterstica cualitativa o atributo, se emplea la proporcin de xitos y no el
nmero de xitos como en la distribucin binomial.
Una distribucin es una distribucin total de xitos en las muestras, mientras que
una distribucin de proporciones es la distribucin de un promedio (media) de los
xitos.

Figura 11. Distribucin muestral de proporciones


Imagen extrada de: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image802.gif

Ejemplo
Construccin de la distribucin de las proporciones muestrales.
Suponga que se cuenta con un lote de 12 piezas, el cual tiene 4 artculos
defectuosos. Se van a seleccionar 5 artculos al azar de ese lote sin reemplazo.
Genere la distribucin muestral de proporciones para el nmero de piezas
defectuosas.
Paso 1: Proporcin Poblacional

Por lo que podemos decir que el 33% de las piezas de este lote estn
defectuosas.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

60

Paso 2: Distribucin muestral de proporciones


El nmero posible de muestras de tamao 5 a extraer de una poblacin de 12
elementos es 12C5=792, las cuales se pueden desglosar de la siguiente
manera:
Tabla 11:
Distribucin de proporciones
Artculos
Artculos Malos
Buenos

1
2
3
4
5
Total

Proporcin de
artculos
defectuoso

4
3
2
1
0

Nmero de
maneras en las que
se puede obtener la
muestra

4/5=0.8
3/5=0.6
2/5=0.4
1/5=0.2
0/5=0

8C1*4C4=8
8C2*4C3=112
8C3*4C2=336
8C4*4C1=280
8C5*4C0=56

792

Grfico 6. Frecuencias para las proporciones de las muestras

Paso 3: Media de la distribucin muestral de proporciones


Para calcular la media de la distribucin muestral de proporciones se tendra
que hacer la sumatoria de la frecuencia por el valor de la proporcin muestral y
dividirla entre el nmero total de muestras. Esto es:

( 6

6)

6)

Como podemos observar la media de la distribucin muestral de proporciones


es igual a la Proporcin de la poblacin.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

61

Paso 4: Desviacin estndar de la distribucin muestral de proporciones


Tambin se puede calcular la desviacin estndar de la distribucin muestral
de proporciones, directamente con los datos:

( 6

Error estndar del estadstico


La desviacin estndar de la distribucin muestral de un estadstico se conoce
como error estndar del estadstico. Para el ejercicio anterior el error estndar
de la proporcin denotado por
, es 0,1681
La varianza de la distribucin binomial es
distribucin muestral de proporciones es

, por lo que la varianza de la

.
Ecuacin No.9

Si se sustituyen los valores en esta frmula tenemos que:


( )( )

Este valor no coincide con el de 0.1681, ya que nos falta agregar el factor de
correccin para una poblacin finita y un muestreo sin reemplazo:

Ecuacin No.10

Lo que da como resultado:

( )( )

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

62

Para qu me sirve conocer la distribucin muestral de las proporciones?

Recordemos que se puede calcular la probabilidad. La frmula


que se utilizar para el clculo de probabilidad en una
distribucin muestral de proporciones est basada en la
aproximacin de la distribucin normal a la binomial. Esta
frmula nos servir para calcular la probabilidad del
comportamiento de la proporcin en la muestra.

Ecuacin No.11

A esta frmula se le puede agregar el factor de correccin

si se cumple con

las condiciones necesarias.

Ejemplo
Clculo de Probabilidades. Distribucin de proporciones muestrales
Cuarenta y seis por ciento de los sindicatos del pas estn en contra de comerciar
con la China Continental; Cul es la probabilidad de que en una encuesta a 100
sindicatos muestre que ms del 52% tengan la misma posicin?
P = 0,46
Z

pP
PQ
n

p = 0,52

n = 100

0,52 0,46

0,460,54
100

P(p>0,52) = ?

0,06
0,2484
100

1,21

P ( z > 1,21) = 0,1131 P (p > 0,52) = 11,31%

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

63

Leccin No 9: Distribucin Muestral de Diferencias de Medias y


de la Proporciones
9. Dos poblaciones.
En esta seccin es importante destacar que ya no se trabaja con una sola
poblacin sino con dos, de las cuales se extraen muestras respectivamente para
ser analizadas y que permitan inferir y comparar las dos poblaciones.
9.1.

Distribucin Muestral de Diferencia de Medias

Suponga que se tienen dos poblaciones distintas, la primera con media


y
desviacin estndar , y la segunda con media
y desviacin estndar . Ms
an, se elige una muestra aleatoria de tamao n1 de la primera poblacin y una
muestra independiente aleatoria de tamao n2 de la segunda poblacin; se calcula
la media muestral para cada muestra y la diferencia entre dichas medias. La
coleccin de todas esas diferencias se llama distribucin muestral de las

diferencias entre medias o la distribucin muestral del estadstico

Figura 11. Distribucin muestral de diferencia de medias


Imagen tomada de:
http://www.itch.edu.mx/academic/industrial/estadistica1/img/image811.gif

La distribucin es aproximadamente normal para n1 30 y n2 30. Si las


poblaciones son normales, entonces la distribucin muestral de medias es normal
sin importar los tamaos de las muestras. En ejercicios anteriores se haba
demostrado que

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

64

As que:

Ecuacin No.12

Ecuacin No.13

La frmula que se utilizar para el clculo de probabilidad del estadstico de


diferencia de medias es:
(

Ecuacin No.14

Ejemplo
Clculo de
muestrales

Probabilidades.

Distribucin

de

diferencia

de

medias

El rendimiento de los autos de la marca A es de 20 kilmetros por galn de


gasolina (k.p.g), con una desviacin estndar de 6 k.p.g. las cifras comparables
para los autos B son de 25 y 5,5 k.p.g. se supone que el rendimiento de cada una
de ambas marcas est normalmente distribuido. cul es la probabilidad de que
en un concurso, el rendimiento medio para 10 autos de la marca A sea mayor que
el de 9 autos de la marca B?

x = 20

y =

25

x= 6

y=

5,5

n1 = 10

P( x y > 0) = ?
Z

0 20 25
36 30,25

10
9

0 5
3,6 3,36

5
6,96

1,90

P( x y > 0) = 0,5000 - 0,4713 = 0,0287 = 2,87%

n2 = 9

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

9.2.

65

Distribucin muestral de diferencias de dos proporciones

Muchas aplicaciones involucran poblaciones de datos cualitativos que deben


compararse utilizando proporciones o porcentajes. A continuacin se citan algunos
ejemplos:

Educacin.- Es mayor la proporcin de los estudiantes que aprueban


matemticas que las de los que aprueban ingls?
Medicina.- Es menor el porcentaje de los usuarios del medicamento A que
presentan una reaccin adversa que el de los usuarios del frmaco B que
tambin presentan una reaccin de ese tipo?
Administracin.- Hay diferencia entre los porcentajes de hombres y
mujeres en posiciones gerenciales.
Ingeniera.- Existe diferencia entre la proporcin de artculos defectuosos
que genera la mquina A a los que genera la mquina B?

Cuando el muestreo procede de dos poblaciones binomiales y se trabaja con dos


proporciones muestrales, la distribucin muestral de diferencia de proporciones es
aproximadamente normal para tamaos de muestra grande (n1p1 5, n1q1 5,n2p2
5 y n2q2 5). Entonces p1 y p2 tienen distribuciones muestrales aproximadamente
normales, as que su diferencia p1-p2 tambin tiene una distribucin muestral
aproximadamente normal.

Figura 12. Distribucin muestral de diferencia de proporciones

Imagen tomada de:


http://www.itch.edu.mx/academic/industrial/estadistica1/img/image816.gif

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

66

En el caso de dos poblaciones independientes de tamao N 1 y N 2 , distribuidas


binomialmente, con parmetros, medias poblacionales P1 y P2 (tambin se
pueden representar las medias por P y
1

) y desviaciones proporcionales P

, siendo: P1 P1Q1 y P2 P2 Q2 .

El error estndar de las diferencias entre las dos medias proporcionales estar
dada por:
P1Q1 P2 Q2

n1
n2

P P
1

Cuando son valores poblacionales

Cuando n1 y n 2 corresponden a muestras grandes, es decir, ambas superiores a


30:
p1 q1 p 2 q 2

n1
n2

s P1 P2

La media de las diferencias entre dos medias proporcionales, se simboliza por:


P P P P P1 P2
1

La variante estadstica Z, estar dada en la misma forma en que fue presentada


para diferencias entre dos medias mustrales:

p1 p2 P

P2

P1Q1 P2 Q2

n1
n2

p 2 P1 P2
p1 q1 p 2 q 2

n1
n2

cuando n1 y n 2 > 30

Ejemplo
Clculo de Probabilidades. Distribucin de diferencia de proporciones muestrales

Consideremos dos mquinas que producen un determinado artculo, la primera


produce por trmino medio un 14% de artculos defectuosos, en tanto que otra,
produce el 20% de artculos defectuosos; si se obtienen muestras de 200
unidades en la primera y 100 unidades en la segunda, Cul es la probabilidad
que difiera A de B en 8% o ms?
P( P1 P2 0,08 ) = ?
P P
1

n1 = 200

= 0,14 0,20 = -0.06

n 2 = 100

P1 = 0,14

P2 = 0,20

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

67

p1 p 2 = 8% = 0,08

0,08 0,06

0140,86 0,20,8

200
100

0,14
2,98
0,047

P( P1 P2 0,08 ) = 0,0014 = 0,14%

Leccin No 10: Tamao de la muestra para estimar la media, la


proporcin y el total de la Poblacin
10. Tamao de muestra
En el apartado anterior se analiz la forma de estimar los parmetros
poblacin:

de la

Promedio, Varianza, total y proporcin poblacional

respectivamente. Pero siempre que se realiza una investigacin se debe definir el


tamao de la muestra. Tomar observaciones para una muestra cuesta dinero, por
lo cual se debe tomar la muestra adecuada, que de la informacin necesaria y a
costos razonables. Una muestra mal tomada arroja informacin inadecuada, lo
que hace perder tiempo y dinero.
10.1. Tamao de la Muestra para estimar :
Determinar el nmero de observaciones que harn parte de la muestra, para
estimar , con un lmite de estimacin B definido, se obtiene a partir de la
ecuacin del error de estimacin.
10.1.1.

Para poblaciones Finitas y Varianza Poblacional Conocida:


2 N n
B Z (1 / 2)

n N 1
Ecuacin No.15

Despejando n, se obtiene:

Z (21 / 2) 2 N
( N 1) B 2 Z 2 2

Ecuacin No.16

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

68

Ejemplo
Un Banco desea identificar el promedio de cuentas por cobrar, estudios previos
han determinado que la variacin de las cuentas est en $1.000. El Banco cuenta
con 1.400 clientes activos. Si el lmite de error de estimacin es de $50 Cul
debe ser el tamao de la muestra a un nivel de significancia del 5%?
Se trata de una poblacin finita. Por teora la amplitud de variacin es 4 veces la
desviacin tpica: A = 4 entonces: = A/4 = 1.000/4 = 250
Z(1-/2) = Z0,975 = 1,96

Z (21 / 2) 2 N

(1,96) 2 (250) 21.400


n

( N 1) B 2 Z 2 2 (1400 1)(50) 2 (1,96) 2 (250) 2

(1,96) 2 (250) 21.400


336'140.000

89,93
(1400 1)(50) 2 (1,96) 2 (250) 2 3'497.500 240.100

En las condiciones dadas, la muestra debe ser de n = 90 cuentas.

10.1.2.

Para Poblaciones Infinitas y Varianza Poblacional Conocida:

Cuando N es muy grande, se asume una poblacin infinita, en estos casos N


1 se aproxima a N, entonces N n ~ N, as se puede obtener el tamao de una
muestra para poblaciones infinitas.

B Z (1 / 2)

2
n

Ecuacin No.17

Entonces:

Z (21 / 2) 2
B2

Ecuacin No.18

Ejemplo
En un estudio sobre el tamao de las manos para el diseo de guantes, se
estableci que la longitud de estas sigue una distribucin normal. Por datos
conocidos se sabe que la desviacin tpica es de 1,5 cm. Cul ser el tamao de

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

69

la muestra para estimar el promedio de la longitud de los guantes, si se asume un


error de estimacin de 0,5 cm. y un nivel de significancia del 5%?
Z(1-/2)=Z0,975 = 1,96
B = 0,5 y = 1,5
Segn el problema la poblacin es infinita, entonces:
n

Z (1 / 2) 2
B2

(1,96) 2 (1,5) 2
34,57
(0,5) 2

En tamao requerido para estimar la media de la longitud de los guantes, con un


error de estimacin de 0,5 cm. y un nivel de significancia del 5% debe ser de n =
35 observaciones.
10.2. Tamao de la Muestra para estimar P:
En muchos estudios el Investigador est interesado en estimar la proporcin de
poblacin que tienen la caracterstica, como la proporcin de dietas preparadas
del total de dietas planeadas, la proporcin de aves con un peso definido respecto
al total de aves pesadas, el porcentaje de personas que observan un programa de
televisin respecto al total de la poblacin potencial que puede ver la televisin.
Dichos fenmenos son de tipo binomial.

Se sabe que: p

1 n
yi Para yi = 1.
n i 1

El nmero de observaciones necesarias para estimar la proporcin poblacional,


con un lmite de error de estimacin asumido B y un nivel de significancia
definido, est dado a partir de la ecuacin del error de estimacin.
B Z (1 / 2)


p * q N n

n 1 N

Ecuacin No.19

Despejando n se obtiene:


Z (21 / 2 ) p * qN NB 2
n

NB 2 Z (21 / 2 ) p * q
Ecuacin No.20

NOTA: Cuando no se conoce o no se puede determinar el valor de p, entonces se


asume como un caso dudoso y en estos casos p = 0,5

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

70

Ejemplo
En una ciudad se desea realizar una encuesta para determinar la proporcin de
habitantes que estn de acuerdo con el consumo de cigarrillo. La ciudad tiene
7.500 habitantes y por estudios previos se ha determinado que de cada 100
habitantes, 15 estn de acuerdo. Cul debe ser el tamao de la muestra para
estimar la proporcin poblacional P; con un lmite de error de estimacin de 0,05 y
un nivel de significancia del 5%.
Por los datos:
15

p
0,15 Luego
100

q 1 0,15 0,85

Aplicando la ecuacin correspondiente:


Z (21 / 2) p * qN NB 2 (1,96) 2 (0,15)(0,85)(7.500) (7.500)(0,05) 2
n

NB 2 Z (21 / 2) p * q
(7.500)(0,05) 2 (1,96) 2 (0,15)(0,85)
(1,96) 2 (0,15)(0,85)(7.500) (7.500)(0,05) 2
3673,53 18,75
n

2
2
(7.500)(0,05) (1,96) (0,15)(0,85)
18,75 0,4898
n

3673,53 18,75
3692,28

191,908
18,75 0,4898
19,2398

Por consiguiente se debe tomar una muestra de 192 habitantes para estimar la
proporcin poblacional, con un lmite de error de 0,05 y un nivel de confianza de
95%.
Ejemplo
En una compaa de 3.500 empleados, se desea saber la proporcin de
empleados que estn a favor de la organizacin de un Sindicato. El investigador
tomo una muestra de 400 empleados fruto del clculo respectivo; adems, asume
un nivel del 5%. Por ser una compaa relativamente nueva, NO hay datos al
respecto. De qu valor fue tomado el error de estimacin del muestreo?
Inicialmente por no conocer proporciones anteriores, entonces se asume un
fenmeno dudoso, as p = 0,5 luego q = 0,5. Conocemos el tamao de la
poblacin y de la muestra. Debemos despejar B de la ecuacin del tamao
muestral.


Z (21 / 2 ) p * qN NB 2
n
Despejando B:
NB 2 Z (21 / 2 ) p * q

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

B
2



Z (21 / 2) p * qN Z (21 / 2) p * qn
nN N

71

(1,96) 2 * 0,5 * 0,5 * 3.500 (1,96) 2 * 0,5 * 0,5 * 4.000


400 * 3.500 3.500

(1,96) 2 * 0,5 * 0,5 * 3.500 (1,96) 2 * 0,5 * 0,5 * 4.000 2.977,24


B

0,002132
400 * 3.500 3.500
1'396.500
2

B 0,002132 0,04617
El error de estimacin tomado fue casi de 0,04617, es decir casi 0,05
Ejemplos
1. El mantenimiento de cuentas puede resultar demasiado costoso, si el promedio
de compra por cuenta baja de cierto nivel. El gerente de un gran almacn por
departamentos desea estimar el promedio de lo comprado mensualmente por los
clientes que usan la cuenta de crdito, con un error de $1.500, y una probabilidad
aproximada de 0,95. Cuntas cuentas deber seleccionar, si sabe que la
desviacin estndar es de $30.000, la cual fue obtenida de los balances
mensuales de la cuenta de crdito?

Z 2 2
n=
E2

2 2 30.000
1.500 2

1.600 cuentas se deben seleccionar

2. un auditor desea tener un nivel de confianza del 95%, para que la verdadera
proporcin de error no exceda del 2%. Si la poblacin es muy grande, Qu
tamao tendr la muestra que va a tomarse, si el auditor estima que la proporcin
de error es del 5%?

Z 2 PQ
n=
E2

2 2 0,050,95
=
0,02 2

475 cuentas

Calculo de n en poblaciones finitas


La frmula ms utilizada para el tamao ptimo en el muestreo aleatorio simple,
cuando la poblacin es finita, se obtiene:

no
n=
n
1 o
N

donde:

Z 2 2
no
E2

En variables

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

no
n=
n
1 o
N

donde:

Z 2 PQ
no
E2

72

En proporciones

10.3. Tamao de la Muestra para estimar :


El nmero de observaciones necesarias para estimar , el total poblacional, con
un lmite de error de estimacin asumido B y un nivel de significancia definido,
est dado a partir de la ecuacin del error de estimacin, partiendo que se conoce
la varianza poblacional.

B Z (1 / 2)

2 N n
N

n N 1
2

Ecuacin No.21

Despejando n se obtiene:
n

Z (21 / 2) N 3 2
( N 1) B 2 Z (21 / 2) 2 N 2
Ecuacin No.22

Ejemplo
Una compaa que hace estudios a nivel social, desea estimar el total de ingresos
de una poblacin de 3.000 habitantes que tiene ingresos. Por estudios previos se
sabe que la varianza poblacional para los ingresos es de $40.000 Cuntas
personas se deben tomar como muestra, si se asume un lmite de error de
estimacin de $100.000 y un nivel de confianza del 95%?
Los datos:
N = 3.000
2 = 40.000
B = 100.000
Entonces:
n

Z (21 / 2) N 3 2
( N 1) B 2 Z (21 / 2) 2 N 2

Para Z(1-/2) = Z0,975 = 1,96 Reemplazando en la ecuacin:

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

(1,96) 2 (3.000)3 40.000


(40.000 1)(100.000) 2 (1,96) 2 (3.000) 2 40.000

4,148928 X 1015
2,9225 X 1015

7,281
3,9999 X 1014 1,382976 X 1012 4,01372976 X 1014

73

Por consiguiente para estimar el promedio de ingresos de la poblacin objeto de


estudio, con un nivel de confianza del 95% y el error de estimacin de $40.000, se
debe tomar una muestra aleatoria de 8 personas.
10.4. Tamao de muestra para la diferencia de dos medias
Para calcular los tamaos de muestras en estos casos, se presentan dos
situaciones:
Tamaos de muestras iguales
Tamaos de muestras diferentes
Para el primer caso no se tiene ningn problema porque al ser n1 sera igual n2
Se calcula una sola muestra de tamao n
(

Ecuacin No.23

Para el segundo caso se calcula una n en funcin de la otra as.


(

Ecuacin No.24

10.5. Tamao de muestra para la diferencia de dos proporciones


En este caso se calculan los tamaos con los mismos criterios anteriores, es decir
para muestras de igual tamao y tamaos desiguales, as:
Tamaos Iguales:
(
Ecuacin No.25

Tamaos Desiguales:
)

(
Ecuacin No.26

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

74

CAPITULO TRES: INTERVALOS DE CONFIANZA


Introduccin
El problema que presenta la estimacin puntual de un parmetro reside en que
no garantiza ni mide la precisin de la estimacin. Slo la bondad de ajuste y el
tamao de la muestra pueden proporcionar una mayor o menor confianza en la
estimacin obtenida. Por esta razn es necesario dar, junto a la estimacin, una
medida del grado de confianza que se merece, la cual se consigue mediante un
intervalo de confianza que proporcione unos lmites dentro de los cuales se
confa est el valor desconocido del parmetro. Esta confianza de inclusin se
mide mediante un porcentaje.
Con frecuencia se encuentra informacin como la siguiente:
El peso de un objeto es 104 ms o menos 2 gramos.
El dimetro de un tornillo es de 8 ms o menos 0.05 milmetros.
El contenido de protenas de la carne de pollo es de 20.2 ms o menos 1%.
En estos casos y otros similares se quiere indicar que la media verdadera se
encuentra en algn lugar entre el intervalo.
Lo anterior indica que existe la probabilidad de error en la medicin y adems no
se puede estar absolutamente seguro que el verdadero valor se encuentre
dentro del intervalo obtenido. Ntese que si el intervalo se hace ms amplio
aumenta la posibilidad que se incluya el verdadero valor de la media.
Objetivo general
Mostrar los diferentes mtodos para calcular los intervalos de confianza, a partir
de muestras grandes y pequeas, para estimar los parmetros poblacionales de
una media y proporcin, as como para la diferencia de medias y proporciones.
Objetivos especficos
Calcular el intervalo de confianza para estimar el parmetro poblacional a
partir de muestras pequeas, para una media y una proporcin.
Calcular el intervalo de confianza para estimar el parmetro poblacional a
partir de muestras grandes, para una media y una proporcin.
Calcular el intervalo de confianza para la diferencia de dos medias y dos
proporciones.
Exponer el uso de clculo de intervalos de confianza utilizando paquetes de
Excel y SSPS.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

75

Leccin No 11: Nociones Fundamentales.


En estadstica muchos problemas exigen construir conjuntos (intervalos) que
contengan el verdadero valor del parmetro en estudio con una probabilidad
dada generalmente alta. Si por ejemplo X representa los grados de grasa de
una margarina se puede estar interesado en encontrar los lmites bajos y altos
aceptables para este tipo de producto; pero no se puede asegurar con
probabilidad de uno que el verdadero valor se encuentre entre estos dos lmites,
lo mximo que se puede lograr es elegir un nmero uno menos alfa ( 1 ) que
est muy prximo a uno (recuerde que alfa es el nivel de significacin o error
tipo uno) tal que la probabilidad que el verdadero valor se encuentre entre estos
dos lmites inferior y superior sea mayor o igual a uno menos alfa.
En la prctica se elige un alfa fijo generalmente pequeo 0.01 o 0.05. La
probabilidad que la afirmacin del intervalo incluya al parmetro sea cierta es
por lo menos (1 ) ; por lo tanto la probabilidad que la afirmacin sea falsa es
por lo ms un alfa. Un intervalo de confianza dado que incluya o no el verdadero
valor del parmetro, esto nunca se conoce con exactitud al menos que se
conozca el parmetro, pero se sabe que se tendr xito en encontrar el valor
verdadero del parmetro dentro de este tipo de intervalos por lo menos en el
(1 ) 100% de las veces.
Los dos tipos de problemas que resuelven las tcnicas estadsticas son:
estimacin y contraste de hiptesis. En ambos casos se trata de generalizar la
informacin obtenida en una muestra a una poblacin. Estas tcnicas exigen
que la muestra sea aleatoria. En la prctica rara vez se dispone de muestras
aleatorias, por la tanto la situacin habitual es la que se esquematiza en la figura

Figura 13. Estimacin

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

76

Entre la muestra con la que se trabaja y la poblacin de inters, o poblacin


diana, aparece la denominada poblacin de muestreo: poblacin (la mayor parte
de las veces no definida con precisin) de la cual nuestra muestra es una
muestra aleatoria. En consecuencia la generalizacin est amenazada por dos
posibles tipos de errores: error aleatorio que es el que las tcnicas estadsticas
permiten cuantificar y crticamente dependiente del tamao muestral, pero
tambin de la variabilidad de la variable a estudiar y el error sistemtico que
tiene que ver con la diferencia entre la poblacin de muestreo y la poblacin
diana y que slo puede ser controlado por el diseo del estudio.

11. Estimacin.
El objetivo principal de la estadstica inferencial es la estimacin, esto es que
mediante el estudio de una muestra de una poblacin se quiere generalizar las
conclusiones al total de la misma. Como vimos en la seccin anterior, los
estadsticos varan mucho dentro de sus distribuciones muestrales, y mientras
menor sea el error estndar de un estadstico, ms cercanos sern unos de otros
sus valores.

ESTIMACION

Puntual:

Por intervalos:

Una estimacin puntual es un nico


valor estadstico y se usa para estimar un
parmetro. El estadstico usado se
denomina estimador

Una estimacin por intervalo es un rango,


generalmente de ancho finito, que se espera
que contenga el parmetro, de la forma (a, b)

Grfico No.7 Estimacin

La inferencia estadstica est casi siempre concentrada en obtener algn tipo de


conclusin acerca de uno o ms parmetros (caractersticas poblacionales). Para
hacerlo, se requiere que un investigador obtenga datos muestrales de cada una de
las poblaciones en estudio. Entonces, las conclusiones pueden estar basadas en
los valores calculados de varias cantidades muestrales. Por ejemplo,
representamos con (parmetro) el verdadero promedio de resistencia a la
ruptura de conexiones de alambres utilizados para unir obleas de

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

77

semiconductores. Podra tomarse una muestra aleatoria de 10 conexiones para


determinar la resistencia a la ruptura de cada una, y la media muestral de la
resistencia a la ruptura se poda emplear para sacar una conclusin acerca del
valor de . De forma similar, si
es la varianza de la distribucin de resistencia a
la ruptura, el valor de la varianza muestral s2 se podra utilizar para inferir algo
acerca de
.
11.1. Estimacin puntual
Cuando se analizan conceptos generales y mtodos de inferencia es conveniente
tener un smbolo genrico para el parmetro de inters. Se utilizar la letra
griega para este propsito. El objetivo de la estimacin puntual es seleccionar
slo un nmero, basados en datos de la muestra, que represente el valor ms
razonable de .
Una estimacin puntual de un parmetro es un slo nmero que se puede
considerar como el valor ms razonable de . La estimacin puntual se obtiene al
seleccionar una estadstica apropiada y calcular su valor a partir de datos de la
muestra dada. La estadstica seleccionada se llama estimador puntual de .
El proceso de estimacin conlleva a obtener un estimador que tenga ciertas
condiciones deseables para hacer inferencia sobre el modelo de probabilidad que
ha generado los datos. Entre los mtodos de estimacin de la estadstica
paramtrica, se tiene: Momentos, mnimos cuadrados y mxima verosimilitud.

ESTIMACIN PUNTUAL
Una estimacin puntual es un nico valor estadstico y se usa para
estimar un parmetro. El estadstico usado se denomina estimador

Media
poblacional

Proporcin

Total
poblacional

De
proporciones

Grfico No.8 Estimacin puntual

Diferencias de
medias

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

78

11.2. Intervalos de confianza


Es un conjunto de valores formado a partir de una muestra de datos, de forma que
exista la posibilidad de que el parmetro poblacional se encuentre en dicho
intervalo, cuyos extremos son aleatorios; con una probabilidad especifica que
efectivamente se encuentre all el parmetro, llamada nivel de confianza (NC).
La estimacin por intervalo se calcula al sumar o restar al estimador puntual una
cantidad llamada margen de error. La frmula general de una estimacin por
intervalo es:

Dependiendo del estadstico a usar el margen de error puede ser:


Tabla 12:
Margen de error

MARGEN DE ERROR
Se conoce la varianza
Poblacional
Si
Estadstico
Media
( )

No
(

INTERVALOS DE
CONFIANZA
DOS
POBLACIONES

UNA POBLACIN

MUESTRAS
GRANDES n
>=30

MUESTRAS
PEQUEAS
n<30

Media

Proporcin

VARIANZA

Media

MUESTRAS
GRANDES n>=30

Diferencia de
proporciones

MUESTRAS
PEQUEAS n<30

Diferencia de
medias

Diferencia de
medias

Grfico No.9 Intervalos de confianza

Clic ac para ver Recurso: Mapas conceptuales intervalos de confianza

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

79

Tabla 13. Valores de Z y Z ms frecuentemente utilizados


Za

0.200
0.150
0.100
0.050
0.025
0.010

Test unilateral
0.842
1.036
1.282
1.645
1.960
2.326
Potencia

(1-)

Zb

0.01
0.05
0.10
0.15
0.20
0.25
0.30
0.35
0.40
0.45
0.50

0.99
0.95
0.90
0.85
0.80
0.75
0.70
0.65
0.60
0.55
0.50

2.326
1.645
1.282
1.036
0.842
0.674
0.524
0.385
0.253
0.126
0.000

Test bilateral
1.282
1.440
1.645
1.960
2.240
2.576

Nivel de Confianza y significancia.


La probabilidad de que el verdadero valor del parmetro se encuentre en el
intervalo construido se denomina nivel de confianza, y se denota
. La
probabilidad de equivocarnos se llama nivel de significancia y se simboliza .
Generalmente se construyen intervalos con confianza
9
(o significancia
. Menos frecuentes son los intervalos con
o
.
VIDEOS

Intervalo de

Intervalo de confianza

Intervalo de

confianza para la

para la diferencia de

confianza para la

media

medias

proporcin

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

80

Leccin 12. Intervalos de confianza para medias y diferencias de


medias con muestras pequeas n 30
La inferencia de la distribucin muestral de la media en muestras grandes es una
curva normal. Con mucha frecuencia la varianza se desconoce 2
en los
problemas de la vida real. Cuando se desconoce la varianza el estadgrafo z ya no
puede utilizarse para obtener intervalo de confianza. Parece lgico desarrollar
procedimientos en los cuales se utilice S 2 en lugar de 2 , de esta manera en lugar
del estadgrafo z utilizaremos el t n 1 para deducir inferencias acerca de la media. Si
la media de la poblacin es la distribucin muestral de

t n-1 es una distribucin t,

teniendo en cuenta que las observaciones, x1, x2,


aleatoriamente y extradas de una poblacin normal.

x3, xn

son elegidas

Entonces, queda claro que cuando las muestras son pequeas la distribucin
muestral es la distribucin t. Esta se caracteriza porque es ms puntual que la
distribucin normal, reuniendo mayor proporcin de casos en los extremos de la
curva a diferencia de la distribucin normal.
La distribucin t a medida que el tamao de la muestra "n" aumenta, tal
distribucin t se va pareciendo ms a la normal, de tal modo que cuando n > 30
no existen diferencias entre la distribucin normal y la distribucin t. Entonces,
cuando n < 30 existe una curva diferente para cada valor de "n".

Grados de libertad.
Nmeros de elementos en una muestra que pueden variar despus de haber
seleccionado cierto nmero de ellas. Supngase que existen dos elementos en
una muestra y se conoce la media. Se tiene libertad para especificar slo uno de
los dos valores, ya que el otro queda determinado automticamente; queda claro
que el total de los dos valores es dos veces la media.

Ejemplo
Si la media es de $ 6 pesos es posible elegir slo un valor. Si se elige $ 4 pesos el
otro valor es $ 8, ya que $ 4 + $ 8 = 12 /2 = $ 6. As que hay un grado de libertad
en este ejemplo. Se podra haber determinado mediante n - 1 = 2 - 1 = 1 grados
de libertad. Si n=4, entonces hay 3 grados de libertad, lo que se obtiene mediante
n - 1 = 4 1 = 3.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

81

En general, para la distribucin t de Student, se puede decir que el nmero de


grados de libertad es igual al tamao de la muestra o nmero de datos menos
uno, es decir: g.l = t n 1

12.

Pasos para la construccin de un Intervalo de confianza para la media


, muestras pequeas.

1. Determinar el nivel de confianza al que vamos a trabajar.


2. Obtener los grados de libertad g L = n 1
3. Calcular el valor t correspondiente al nivel de confianza fijado con
grados de libertad y con ayuda de la tabla del anexo.
4. La tabla se divide en 10 columnas. La primera indica los grados de
libertad, y las siguientes columnas corresponden a los niveles de
significanca que son 0.5, 0.4, 0.2, 0.1, 0.05, 0.025, 0.010, 0.005 y
0.001
5. De esta manera para un valor t correspondiente a un nivel de
significanca del 10% y 18 grados de libertad hay que buscar la
interseccin de la columna del 10% y la fila donde aparezca 18 (grados)
g 1, obteniendo un valor de t = 1.734

6. Calcular el error tpico de la media y determinar el error muestral

7. Determinar el intervalo de confianza para la media de la poblacin,


sumando y restando a la media de la muestra ( x ) el error muestral as:

S
X t

n
Ecuacin No.27

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

82

con n 1 grados de libertad y el valor de t depende del nivel de confianza.

Ejemplo Intervalo de confianza para pequeas muestras


Una muestra de 10 cajas de atn dio un peso neto medio de 184 gramos y una
desviacin estndar de 3.0 gramos. Encontrar los lmites de confianza con un 95%
para el verdadero peso promedio de todas las latas de atn.
La siguiente grafica nos ayuda a comprender la presente situacin:

Distribucin T-student con V grados de libertad

0,45
0,4

Probabilidad

0,35
0,3

Grados de
Libertad n-1 =
10 - 1= 9

0,25
0,2
0,15
0,1
0,05

1 0,95

/2 0,025

/2 0,025

0
-2,26

+2.26
Valor estadstico t

Grfico No.10 Distribucin t-student con 9 grados de libertad

En la tabla de la distribucin t con 9 grados de libertad y un nivel de significancia


del 5% para dos colas, se registra un valor de 2.262 como valor crtico. (Recuerde
que es a dos colas.
El intervalo de confianza para la media de peso de todas las cajas de atn est
dado por:
(

6 (

Se interpreta que las cajas de atn tienen un promedio de peso entre 181.85 y
186.14 gramos con un nivel de confianza del 95% y expresado matemticamente
es: (
6 )
9

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

83

La tabla t-student que se usa en este mdulo es a dos colas, por


tanto deben ubicarse en la columna directamente del nivel de
significancia que se est aplicando, es decir, si el alfa es de 5% se
ubica en la columna del 0,05 y busca los grados de libertad
correspondiente.
Clic ac para descargar tablas

12.1.

Intervalos diferencias de medias, varianzas desconocidas pero


iguales (

Cuando las varianzas son desconocidas, se debe realizar previamente una prueba
estadstica para verificar si stas son iguales o diferentes. Para realizarlo debemos
hacer uso de la distribucin F, bien sea mediante el clculo de la probabilidad de
que la muestra tomada provenga de dos poblaciones con varianzas iguales, o
mediante el uso de un intervalo de confianza para la relacin de dos varianzas,
segn se estudiar ms adelante.
INTERVALO PARA LA
DIFERENCIA DE MEDIAS
(varianza desconocida

Verificar si las varianzas son iguales usando la prueba F


F

SI.
Aplicar la frmula:

NO.
Usar frmula de intervalo
para la diferencia de medias
pero con varianzas
desiguales

El limite inferior se obtiene restandole a la diferencia


de medias muestrales
lo que da la frmula y
el limite superior sumando.
Grfico No.11 Intervalos de confianza para diferencia de medias

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

84

Primera fase: Probar varianzas iguales

Grfico No.12 Distribucin F. Prueba varianzas iguales

Ejemplo Prueba para determinar si las varianzas son iguales.

Para encontrar si un nuevo suero detiene la leucemia, se seleccionan nueve


ratones, todos con una etapa avanzada de la enfermedad. Cinco ratones reciben
el tratamiento y cuatro no. Los tiempos de sobrevivencia en aos, a partir del
momento en que comienza el experimento son los siguientes:
Con Tratamiento

2.1

5.3

1.4

4.6

Sin Tratamiento

1.9

0.5

2.8

3.1

Con un nivel de significancia del 0.05 pruebe que las varianzas son iguales.
Datos:
Con tratamiento

6
s= 1.97
n=5
Estadstico de prueba: F

Sin tratamiento

s = 1.1672
n=4

0.9

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

85

La sugerencia que se hace es que el numerador sea el de valor mayor . En este


caso la desviacin ms grande corresponde a la muestra con tratamiento.
Entonces los grados de libertad se calculan restndole 1 al tamao de la muestra;
ya que con tratamiento se ubica en el numerador, los grados de libertad de dicho
numerador son 4.
GL1= 5-1 = 4 y GL2 = 4-1=3.

Grfico No.13 Prueba de varianzas iguales. Tratamiento de leucemia

Para hallar un valor crtico en la tabla de la F, se debe tener en cuenta que dichos
valor est calculando el rea bajo la curva hacia la derecha del mismo, es decir,
determinan el rea por arriba del valor critico.
Si quiere determinar el valor en la tabla F que deja por encima el 2.5% del rea,
debe hacer en Excel: =DISTR.F.INV(0,025;4;3)=15,1
Si quiere determinar el valor en la tabla F que deja por encima el 97.5% del rea,
debe hacer en Excel: =DISTR.F.INV(0,975;4;3)=0.10
VIDEOS :
Clic para ver video:
Valores crticos en la
tabla F

Regla de decisin:

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

Si 0.10

Fc

86

15.1 no hay evidencia para decir que las varianzas NO son iguales,

Si la Fc < 0.10 si Fc > 15.1 las varianzas No son iguales.


Clculo:
9
6

F
Decisin y Justificacin:

Como 2.85 esta entre los dos valores de Ho no se rechaza , y se concluye con
un = 0.05 que existe suficiente evidencia para decir que las varianza de las
poblaciones son iguales.
Segunda fase: intervalo de confianza
Si mediante el uso de la distribucin F se llega a la conclusin de que las
varianzas son iguales, el procedimiento a seguir para el clculo del intervalo de
confianza para la diferencia de dos medias ser el siguiente:
Pasos despus de verificar que las varianzas son iguales:
a) El estadstico usado como estimador puntual de la diferencia de medias 1 - 2
ser T, que es un estimador suficiente.
b) La variable aleatoria asociada con el estimador ser la variable T definida como:

Ecuacin No.28

Donde

es un estimador combinado de
(

, mejor que
(

Ecuacin No.29

por separado, y

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

87

c) Para calcular el intervalo de confianza se debe tener en cuenta la siguiente


probabilidad:

]
Ecuacin No.30

De nuevo, manipulando la expresin anterior en forma similar a los casos se llega


al siguiente teorema que nos define el intervalo de confianza para la diferencia
entre dos medias 1 - 2 con varianzas desconocidas
y , pero iguales:
Teorema. Si , ,
y
son las medias y las varianzas de dos muestras
aleatorias de tamaos n1 y n2, respectivamente, tomadas de dos poblaciones
normales e independientes con varianzas desconocidas pero iguales, entonces un
intervalo de confianza del 100(1- )% para la diferencia entre medias 1 - 2 es:

Ecuacin No.31

Si el intervalo de confianza que se construye contiene al cero (0) no


existe diferencia significativa entre las medias .

Construccin de un intervalo de confianza


1.
2.
3.
4.

Se usa la ecuacin No. 31

Calcular

Calcular la t-student con n1+n2-2 grados de libertad


Calcular el es la raz del valor que se encuentre al reemplazar la ecuacin No. 29

5. Calcular

6. Hallar los limites del intervalo:


El limite inferior se encuentra al realizar
la operacin:
(

El limite supeior se encuentra al realizar la


operacin:
(

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

88

Recordar:
Con tratamiento

6
s= 1.97
n=5

2.
3.

Sin tratamiento

s = 1.1672
n=4

6
entonces buscar en la tabla t-student, el valor para 7 grados de

libertad y

T=2,365

4.

( )

67

( )

67

recuerde que , debe ser siempre la desviacin ms grande

5.

6. El limite inferior se encuentra al realizar la operacin:

6 ( 6 )( 6 )

El limite supeior se encuentra al realizar la operacin:

6 ( 6 )( 6 )

Intervalo: (-1,87; 3,44)


Cmo el intervalo contiene al cero (0) no existen evidencia para decir que hay
diferencias entre las medias.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

89

Ejemplo Intervalo de confianza para pequeas muestras


La siguiente tabla presenta los resultados de dos muestras aleatorias para comparar el
contenido de nicotina de dos marcas de cigarrillos.

Marca A
10
3,1
0,5

Marca B
8
2,7
0,7

Suponiendo que los conjuntos de datos provienen de muestras tomadas al azar de


poblaciones normales con varianzas desconocidas, construya un intervalo de
confianza del 95% para la diferencia real de nicotina de las dos marcas.
Primera fase: Probar varianzas iguales

Inicialmente mediante la distribucin F debemos verificar si las varianzas son


iguales
(

Buscando en la tabla de la distribucin F para 7 grados de libertad en el


numerador y 9 en el denominador, vemos que los dos valores que acotan la zona
de aceptacin son 0.207 y 4,197, entonces el F calculado 1,96 cae en la zona de
aceptacin . Se concluye que no hay evidencia para rechazar la hiptesis de que
las varianzas sean iguales.
Segunda fase: intervalo de confianza

Como las varianzas son iguales, calculamos

que est dado por:

El intervalo de confianza del 95% est dado por (t0.025,16 = 2.12):

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

96

La diferencia de medias (

90

96

) esta en el intervalo (-0,2 ; 1,0)

Debido a que la diferencia real puede ser nula, ya que el intervalo construido
contiene al cero, no se puede concluir que existe una diferencia en el contenido de
nicotina de las dos marcas de cigarrillos.
Ejercicio propuesto
El gerente de una refinera piensa modificar el proceso para producir gasolina a
partir de petrleo crudo. El gerente har la modificacin slo si la gasolina
promedio que se obtiene por este nuevo proceso (expresada como un porcentaje
del crudo) aumenta su valor con respecto al proceso en uso. Con base en
experimentos de laboratorio y mediante el empleo de dos muestras aleatorias de
tamao 12, una para cada proceso, la cantidad de gasolina promedio del proceso
en uso es de 24.6 con una desviacin estndar de 2.3, y para el proceso
propuesto fue de 28.2 con una desviacin estndar de 2.7. El gerente piensa que
los resultados proporcionados por los dos procesos son variables aleatorias
independientes normalmente distribuidas con varianzas iguales. Con base en esta
evidencia, debe adoptarse el nuevo proceso?

12.2.

Intervalos para diferencias de medias y varianzas desconocidas y


desiguales

Si mediante el uso de la distribucin F se llega a la conclusin de que las


varianzas son diferentes, el procedimiento a seguir para el clculo del intervalo de
confianza para la diferencia de dos medias ser el siguiente:
a. El estadstico usado como estimador puntual de la diferencia de medias 1 2 ser
, que es un estimador suficiente
b. La variable aleatoria asociada con el estimador ser la variable T definida
como:

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

91

Estadstico de prueba para la diferencia de medias con varianzas desiguales

V: grados de libertad Donde V es:

( )

( )

c. El intervalo de confianza est dado por el siguiente teorema, basado en la


distribucin t con n grados de libertad.
Teorema. Si
son las medias y las varianzas de dos muestras
aleatorias de tamaos n1 y n2, respectivamente, tomadas de dos poblaciones
normales e independientes con varianzas desconocidas y desiguales, entonces un
intervalo de confianza aproximado del 100(
)% para la diferencia entre medias
1 - 2 es:

Ecuacin No.32

Ejemplo
Un fabricante de monitores prueba dos diseos de microcircuitos para determinar si
producen un flujo de corriente equivalente. El departamento de ingeniera ha obtenido los
datos siguientes:

Diseo 1

n1 = 16

s12 = 10

Diseo 2

n2 = 10

s22 = 40

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

92

Con = 0.05, se desea determinar si existe alguna diferencia significativa en el flujo


de corriente promedio entre los dos diseos, donde se supone que las dos
poblaciones son normales, pero no es posible suponer que las varianzas
desconocidas sean iguales.Tomado de la web del Instituto Tecnolgico de
Chihuaha, Mxico)

Primera fase: Probar varianzas iguales

Estadstico de prueba:
F

0
0

La sugerencia que se hace es que el numerador sea el de valor mayor . En este


caso la desviacin ms grande corresponde a la muestra Diseo 2.
Entonces los grados de libertad GL1= 10-1 = 9 y GL2 = 16-1=15.

Grfico No.14 Prueba de varianzas iguales. Diseo de microcircuitos

Decisin y Justificacin:
Como 4 es mayor que 3.12, esta en la zona de rechazo, se concluye con un =
0.05 no existe suficiente evidencia para decir que las varianza de las poblaciones
son iguales, por tanto se suponen varianzas diferentes.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

93

Segunda fase: intervalo de confianza

Para poder buscar el valor de t en la tabla, se necesita saber el valor de los grados
de libertad:
(
(

(
]

(
)

( )
6 ]
6

Este valor se redondea al prximo menor que sera 11. Entonces los grados de
libertad son 11.
Ver la tabla t-student en los Contenidos del curso, Anexo: Tablas estadsticas.
Recuerde que si el nivel de significancia es 0,05 debe ubicarse directamente en la
columna 0,05 con 11 grados de libertad, ya que siempre un intervalo de confianza
supone una distribucin a dos colas y el Excel por defecto supone distribucin a
dos colas con la funcin =DISTR.T.INV, por tanto, no es necesario dividir el alfa en
dos.
En el caso de las pruebas de hiptesis se pueden dar pruebas a una o dos colas,
por ello cuando se utilice la tabla t-student del anexo si la prueba tiene un alfa de
0,05 y es a una cola, usted deber ubicar la columna 0,10 ( es decir multiplica por
dos el alfa antes de ver en la tabla).
Estadstico de prueba
Se aplica el estadstico de prueba para la diferencia de medias con varianzas
desiguales:
9

( )

6
Y se compara con los valores encontrados en la tabla t-student con 11 grados de
libertad y un = 0.05

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

94

Grfico No.15 Intervalos de confianza. Diseo de microcircuitos

Justificacin y decisin:
Como 0.1395 esta entre 2.201 y 2.201, no se rechaza la hiptesis de que las
diferencia de medias es cero. Se concluye con un = 0.05, que no existe
diferencia significativa en el flujo de corriente promedio entre los dos diseos.
El intervalo de confianza aplicando la ecuacin No.32 es:

. )

. )

Al realizar los clculos se tiene que el intervalo de confianza para la diferencia de


las medias del flujo corrientede los diseos es (-4,43; 5,033) el cual contiene al
nmero cero, por tanto no hay evidencia de diferencias entre los diseos, es decir
que producen un flujo de corriente equivalente y por tanto es indiferente el diseo
que seleccione el fabricante de monitores para los microcircuitos.

En el caso de que el intervalo no contenga al cero, se rechaza la


hiptesis de que las medias son iguales, por tanto al ser diferentes se
asume que es mayor que

En el ejemplo anterior si en el intervalo no estuviera el cero, por ejemplo un


intervalo (0.12 ; 3) se concluira que la diferencia entre los amperajes
promedios esta entre 0.12 y 3; adems que el diseo 2 produce un flujo
promedio de corriente mayor, por lo cual el fabricante de monitores escogera
dicho diseo.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

95

Ejercicio propuesto
Cierto metal se produce, por lo comn, mediante un proceso estndar. Se
desarrolla un nuevo proceso en el que se aade una aleacin a la produccin del
metal. Los fabricantes se encuentran interesados en estimar la verdadera
diferencia entre las tensiones de ruptura de los metales producidos por los dos
procesos. Para cada metal se seleccionan 12 ejemplares y cada uno de stos se
somete a una tensin hasta que se rompe. La siguiente tabla muestra las
tensiones de ruptura de los ejemplares, en kilogramos por centmetro cuadrado:

Si se supone que el muestreo se llev a cabo sobre dos distribuciones normales e


independientes, obtener los intervalos de confianza estimados del 95 y 99% para
la diferencia entre los dos procesos. Interprete los resultados

12.3.

Intervalos unilaterales para diferencias de medias y varianzas


desconocidas e iguales

En algunas situaciones prcticas, no es necesario encontrar tanto el limite inferior


como el limite superior para el parmetro de inters, sino solo uno de ellos. Por
esta razn, ahora se contruirn intervalos unilaterales para la diferencia de medias
cuando las varianzas son desconocidas pero iguales.

Ejemplo
Usar los datos del ejemplo del fabricante de monitores que prueba dos diseos de
microcircuitos para determinar si producen un flujo de corriente equivalente, pero en este
caso construir un intervalo unilateral para diferencia de medias con varianzas
desconocidas pero iguales

Tamao de la muestra =
Cuasi varianza =
Media muestral =
Nivel de confianza =

Poblacin1 Poblacin2
16
10
10
40
24,2
23,9
0,95

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

96

Caso de varianzas poblacionales desconocidas pero iguales


Intervalo bilateral
to =
Radio del intervalo =
Lmite infer.=
Lmite super.=

2,063898562
3,835257238
-3,535257238
4,135257238

Intervalos unilaterales
to =
1,71088208
Radio =
3,179261327
Cota inferior =
-2,879261327
Cota superior =
3,479261327

El procedimiento en el caso unilateral es idntico al bilateral, en primer lugar se


prueba si las varianzas son iguales y luego se procede a calcular el intervalo de
confianza; pero en el caso unilateral cuando se calcula el estadstico terico (
tabulado) se debe multiplicar por dos (2) el nivel de confianz alfa (); en excel se
obtiene con la funcin =DISTR.T.INV(2*(1-);n1+n2-2)
Los valores de la table se obtienen as:

Estadstico tabulado

to =DISTR.T.INV(2*(1-0,95);16+10-2)

Radio

Recordar:
(

Cota inferior y superior

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

12.4.

97

Intervalos unilaterales para diferencias de medias y varianzas


desconocidas y desiguales

Ejemplo
Usar los datos del ejemplo del fabricante de monitores que prueba dos diseos de
microcircuitos para determinar si producen un flujo de corriente equivalente, pero en este
caso construir un intervalo unilateral para diferencia de medias con varianzas
desconocidad pero desiguales.
Caso de varianzas poblacionales desconocidas y desiguales
Intervalo bilateral
Intervalos unilaterales
Cuasivarianza1/Cuasivarianza2=
0,25
Grados de libertad=
11
to =
2,20098516
to =
1,795884819
Radio del intervalo =
4,733397564
Radio =
3,862196338
Lmite infer.=
-4,433397564
Cota inferior =
-3,562196338
Lmite super.=
5,033397564
Cota superior =
4,162196338

Los valores de la table se obtienen as:

Estadstico tabulado

to =DISTR.T.INV(2*(1-0,95);GL)

Radio

Cota inferior y superior

12.5.

Intervalos de confianzas para diferencias entre dos medias con


muestras relacionadas o dependientes.

Cuando se comparan las medias de dos niveles es deseable que las


observaciones dentro de cada nivel sean lo ms homogneas posibles. Si existe
un efecto debido a factores externos stos pueden neutralizarse mediante la

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

98

aplicacin del principio de la aleatoriedad. Esto se logra tomando las


observaciones en pares. Se supone que las condiciones exteriores son las
mismas para cada par, pero pueden variar de un par a otro. Por ejemplo, suponga
que se tiene un grupo de personas que se someten a una dieta para reduccin de
peso, y para cada persona se lleva el registro del peso, en kgs, antes de la dieta, y
un tiempo razonable despus de haber empezado la dieta. En este caso, el peso
de cada persona despus de la dieta no es independiente del peso de la misma
persona antes de la dieta; por lo tanto estas dos variables estn correlacionadas, y
si se quiere examinar el efecto de la dieta, se debe llevar el registro del peso para
la
misma
persona
antes
y
despus
de
la
dieta.
Sean (X11, X21), (X12, X22),..., (X1n, X2n) los datos consistentes de n pares;
supondremos que las variables aleatorias X1 y X2 tienen medias 1 y 2, y
varianzas
y , respectivamente. Podemos suponer que el conjunto de datos
apareados son observaciones de un conjunto independiente de parejas de
variables aleatorias provenientes de una distribucin normal bivariada
(X1 X2) ~ f(X1, X2), y que las diferencias D = X1 - X2 se distribuyen normalmente
con valor esperado ED y varianza .
Sea Dj la diferencia entre las variables aleatorias del j-simo par, es decir, Dj =
X1j-X2j. El valor esperado y la varianza de la diferencia entre las variables est
dado por:

Si las variables X1 y X2 se distribuyen normalmente, las diferencias estarn


distribuidas tambin de manera normal con media
y varianza
Para estimar la media y la varianza de la diferencia, se debe tomar una muestra
aleatoria de tamao n, antes y despus, calcular la diferencia, y luego la diferencia
promedio y la varianza muestral de las diferencias, como se ilustra en el siguiente
cuadro.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

99

Dada la muestra aleatoria se calculan los siguientes estadsticos que servirn para
estimar la media y la varianza de la diferencia,
y
, respectivamente:

Sabemos que la siguiente variable aleatoria sigue una distribucin normal


estndar:

Sin embargo, como , no es conocido, lo podemos estimar mediante la varianza


muestral , en cuyo caso la siguiente variable aleatoria sigue una distribucin t
con n-1 grados de libertad.
Usando la distribucin t podemos calcular el intervalo de confianza para la media
de observaciones pareadas, el cual est dado por el siguiente teorema.
Teorema. Si
y
son la media y la desviacin estndar mustrales de la
diferencia de n pares aleatorios de mediciones normalmente distribuidas, entonces
(
) para la diferencia de medias
un intervalo de confianza del
Es:

Ecuacin No.33

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

100

Ejemplo Intervalo de confianza diferencia de medias para pequeas muestras

Se est investigando la utilidad de dos lenguajes de diseo para mejorar las tareas
de programacin. Se le ha pedido a 12 programadores expertos, familiarizados
con los dos lenguajes, que codifiquen una funcin estndar con ambos lenguajes,
y se registra el tiempo requerido, en minutos, para realizar estas dos tareas. Los
datos obtenidos son los siguientes:

Encuentre un intervalo de confianza para la diferencia en los tiempos medios de


codificacin. Use un nivel de confianza del 95%. Existe alguna evidencia que
indique
una
preferencia
por
alguno
de
los
dos
lenguajes?
Tenemos que:

El intervalo de confianza est dado por:

Dado que la diferencia puede ser cero, se concluye que no hay evidencia para
rechazar la hiptesis de que ambos lenguajes requieren el mismo tiempo de
programacin, y por lo tanto no hay preferencia por ninguno de los dos lenguajes.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

101

Leccin 13. Intervalos de confianza para la media y diferencias de


medias muestras grandes n 30
13.

Recordemos que para obtener un intervalo de confianza se procede


como sigue:
1.

2.

Se determina el riesgo de error que se quiere asumir al afirmar que el


parmetro (en este caso la media) se encuentra en el interior del
intervalo.
El intervalo de confianza se obtiene separando a izquierda y derecha
de la estimacin del parmetro (en este caso la media) un mltiplo de
error estndar (

) . El mltiplo est determinado por el valor del

estadstico Z asociado al nivel de confianza escogido.

13.1.

Para la construccin del intervalo de confianza para la media


poblacional , se han fijado los siguientes pasos:
1. Fijar el nivel de confianza 1 -

2. Calcular la estandarizacin z de acuerdo al nivel de confianza


predeterminado a travs de la tabla de la distribucin normal N (0,1)
3. Calcular la media x y desviacin tpica S de la muestra.

4. Calcular el error tpico de la media (desviacin tpica de la distribucin


muestral)

5. Calcular el error muestral

6. Construir el intervalo de confianza, sumando y restando a la media de la


muestra ( x ) el error muestral.
(

Ecuacin No.34

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

102

Ejemplo
Suponga por ejemplo que Ud. est dispuesto a aceptar un riesgo de error de
0.05 ; entonces 1 0.95 , se trata de un intervalo de confianza del nivel 0.95.
Dado que esta probabilidad se distribuye simtricamente a los dos lados de la
media, se obtiene 0.475 a cada lado. Ahora bien, recuerde que no buscar en la
tabla el valor de Z asociado a una probabilidad de 0.95, ya que debe agregarle la
cola, que en este caso es la mitad del nivel de significancia alfa (es decir
/2=0,05/2=0,025), entonces lo que buscar es el valor Z asociado a una
probabilidad de 0.975
que es 1.96 (de acuerdo a la tabla de la distribucin
normal) a la derecha de la media y de 1.96 a la izquierda, como se puede
apreciar en la siguiente grfica:
Intervalo de confianza para grandes muestras

Grfico No.16 Intervalo de confianza para muestras grandes

El intervalo de confianza est dado por la siguiente relacin:



; X 1.96

X 1.96
n
n

Expresado en forma generalizada, para poblaciones infinitas o si se muestrea sin


reemplazamiento una poblacin finita, la relacin es:

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

103


X 1.96
n
Si la poblacin es finita o si se muestrea sin reemplazamiento una poblacin finita,
la relacin es la siguiente:

X Z

N n

N 1

Ecuacin No.35

Recuerde que Z depende del nivel de confianza que se fije y que si la desviacin
estndar poblacional es desconocida, se utiliza como estima la desviacin
muestral (S).
Podr darse cuenta las semejanzas con los procedimientos utilizados para las
pruebas de hiptesis, vistas anteriormente para pruebas unilaterales y bilaterales.
Ejemplo
El contenido de protenas de una muestra de 100 pollos criados en una
determinada granja dio una media de 20.2 gramos con una desviacin estndar
de 1.14 gramos. Obtener el intervalo de confianza del 99% para el contenido
medio de protena de todos los pollos de la granja.
Como el intervalo de confianza se distribuye simtricamente a los dos lados de la
media, en este caso a cada lado le corresponde una probabilidad de 0.495 (0.99/2
= 0.495). El valor de Z asociado a una probabilidad de 0.995 es 2.58.
El intervalo para la media ser:

S
1.14
X Z
20.2 2.58
20.2 0.294
n
100
El contenido medio de protena de toda la poblacin de pollos de la granja est
dentro de un intervalo de 19.91 y 20.49 gramos con un nivel de confianza del 99%,
y se expresa de la siguiente forma:
P19.91 20.49 0.99

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

104

Ejemplo
Se toma una muestra al azar de 40 vasos de kumis de un lote de 500, dieron un
promedio de 76 caloras por cada 100 gramos con una desviacin estndar 2.9
caloras. Obtener el intervalo de confianza del 95% para el contenido medio de
caloras para todo el lote.
Ntese que se trata de una poblacin finita y muestreo sin reemplazamiento. El
valor de Z asociado a un nivel de confianza del 95% es 1.96 (0.95/2 = 0.475) de
acuerdo a la tabla de la distribucin normal.
El intervalo de confianza en este caso est dado por:
N n
2.9 500 40
X Z

76

76 0.87

499
n N 1
40

Por tanto el contenido medio de caloras del lote esta dentro del intervalo de 75.13
y 76.87 caloras con un 95% de nivel de confianza, y expresado matemticamente
es:

P75.13 76.87 0.95

13.2.

Intervalo de confianza para la diferencia entre dos medias.

El intervalo de confianza para la diferencia de medias de poblaciones infinitas est


dado por:
X1 X 2 Z

12
n1

22
n2

Ecuacin No.36

Se analiz el contenido de vitamina A de una muestra de mantequilla y de una


muestra de margarina enriquecida. En la muestra de mantequilla formada por 40
potes de 100 gramos, el contenido medio de vitamina A fue de 4.86 unidades con
una desviacin estndar de 0.06. En la muestra de margarina enriquecida formada
por 50 potes de 100 gramos el contenido medio de vitamina A fue de 5.0 unidades
con una desviacin estndar de 0.08 unidades. Encontrar el intervalo de confianza
del 95% para la diferencia de contenido medio de vitamina A para el experimento
en mencin.
Generalmente el mayor valor de la media se toma como

X1 .

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

105

El nivel de confianza del 95% corresponde un Z = 1.96.


Aplicando la frmula se tiene:

X1 X 2 Z

12 22
0.082 0.062

5.0 4.86 1.96

n1 n2
50
40

0.14 1.96 0.000128 0.00009 0.14 0.029


Por lo tanto se puede afirmar con un nivel del 95% que la diferencia de los dos
contenidos de vitamina A de la mantequilla y la margarina enriquecida se
encuentran entre 0.111 y 0.169 unidades.

Leccin 14. Intervalos de confianza para la proporcin y


diferencias de proporciones (siempre son muestras grandes)
n 30

14.

Las proporciones.

Siempre que se trabaje con proporciones la muestra debe ser grande.


14.1.

Intervalo de confianza para proporciones.

Recuerde las propiedades de la distribucin binomial y de las pruebas de hiptesis


vistan anteriormente.
El intervalo de confianza para la proporcin de la poblacin infinita y muestreo con
reemplazamiento est dada por:

PZ

PQ
n

Ecuacin No.37

En tanto que el intervalo de confianza para la proporcin de la poblacin finita y


muestreo con reemplazamiento est dada por:

PZ

PQ

N n

N 1

Ecuacin No.38

Donde el valor de Z depende del nivel de confianza deseado.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

106

Ejemplo
De un lote de 500 frascos de jugo se extrae una muestra de 50 frascos de los
cuales 43 cumplen con las especificaciones exigidas y 7 fueron rechazados. Hallar
el intervalo de confianza del 95% para la proporcin de frascos de jugo aceptados
del lote de estudio.
Para un nivel de confianza de 95% el valor de Z = 1.96 (tabla de distribucin
normal)
Aplicando la frmula se tiene:

PZ

PQ
n

N n
43

1.96
N 1
50

0.86 1.96

43501 4350
50

500 50
500 1

(0.86)(0.14) 450
50
499

0.86 1.960.0490.95 0.86 0.09

Con un nivel de confianza del 95% la proporcin de frascos aceptados fue de 0.77
y 0.95, es decir el nivel de aceptacin est entre 380 y 480 frascos de lujo de un
lote de 500 frascos
14.2.

Intervalo de confianza para la diferencia de dos proporciones.

El intervalo de confianza para la diferencia de proporciones de poblaciones


infinitas est dado por:
P1 P2 Z

p1q1 p2 q2

n1
n2

Ecuacin No.39

En un supermercado se vende queso de dos marcas diferentes. En el mismo


perodo de tiempo se vende 380 de un total de 500 unidades de la marca A y 333
de un total de 450 unidades de la marca B. Hallar el intervalo de confianza del

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

107

99% para la diferencia entre las proporciones de los quesos A y B que salen al
mercado y se venden.
Aplicando la frmula de la diferencia de proporciones se tiene:

P1 P2 Z

380 120 333 117

p1q1 p2 q2
380 333
500 500 450 450

2.58

n1
n2
500 450
500
450

0.76 0.74 2.58

(0.76)(0.24 (0.74)(0.26)

0.02 0.073
500
450

Por lo cual es de esperar con un nivel de confianza del 99% que la verdadera
diferencia de proporcin de venta de los quesos A y B se encuentre entre 0.053 y
0.093. La diferencia de proporcin negativa del lmite inferior del intervalo indica
que en esta regin la diferencia est a favor del queso B cuya proporcin de venta
es menor en las muestras estudiadas.

Leccin 15. Intervalos de confianza para la varianza poblacional.


Para ver cmo se aplica un intervalo de confianza para la varianza poblacional,
suponga que se est interesado en estimar la varianza poblacional para el
mecanismo de llenado de tal modo que la media de la cantidad de llenado sea de
16 onzas y es crtica la varianza de los llenados. Para el efecto se toma una
muestra de 20 envases llenos y se encuentra que la varianza de las cantidades de
llenado es s 2 0.0025 Sin embargo, no se puede esperar que esa varianza que
procede de una muestra de 20 envases, proporcione el valor exacto de la varianza
de la poblacin de recipientes llenos con dicho producto. En consecuencia el
inters est es determinar un estimado de intervalo de la varianza poblacional.
Se utiliza el smbolo 2 para representar el valor de la distribucin ji cuadrado que

da como resultado un rea, o probabilidad, de a la derecha del valor ji


cuadrado establecido. Por ejemplo en la siguiente figura, se observa la distribucin
ji cuadrado con 02.025 32,8523 que indica que el 2.5% de los valores de ji
cuadrado est a la derecha de 32,8523, y 02.975 8,90655 que indica que el 97.8%
de los valores de ji cuadrado est a la derecha de 8,90655. Consultan con la tabla
del anexo G que hace relacin a la tabla de distribucin de ji cuadrado, los
resultados son iguales.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

108

En la grfica se puede observar que 0.95 o el 95% de los valores de la ji cuadrada


estn entre 02.975 y 02.025 . Significa esto que existe una probabilidad del 95% de
obtener un valor de

tal que:

02.975

n 1S 2

02.025

Esta ecuacin define un estimado de intervalo, porque el 95% de todos los valores
posibles de

n 1S 2

2
se encuentran en el intervalo de 0,975 a 02.025 .

Distribucin Chi-Cuadrado. Funcin de Densidad Probabilidad


con 19 grados de libertad

1 0,95

2(0,975) =8,90

38

36

34

32

30

28

26

24

22

20

18

16

14

/2 =0,025

12

10

/2= 0,025

0,001

0,08
0,07
0,06
0,05
0,04
0,03
0,02
0,01
0

2(0,025) =32,85

Grfico No.17 Intervalo de confianza. Mecnismo de llenado.

Ahora se requiere llevar a cabo algunas operaciones algebraicas de la ecuacin,


para determinar un estimado de intervalo de 2 de la varianza poblacional.
Realizando operaciones del extremo izquierdo de la ecuacin se tiene:

02.975

n 1S 2
2

despejando la varianza se tiene:

n 1S 2

02.975

realizando operaciones semejantes con la desigualdad del extremo derecho de la


ecuacin se tiene:

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

n 1S 2
02.025

despejando la varianza se tiene:

109

n 1S 2
02.025

Por ltimo combinando los resultados de las operaciones se llega a:

n 1S 2
02.025

n 1S 2
02.975

Esta relacin representa el estimado del intervalo de confianza para la varianza 2


.
Ejemplo
Regresando al problema para determinar un estimado de intervalo de la varianza
poblacional de las cantidades de llenado, recuerde que la muestra es de 20
envases que presenta una varianza de S 2 0.0025 . Con un tamao de muestra
de 20, los grados de libertad son de 19. En la figura presentada anteriormente, se
determina que 02.975 8,90655 y
02.025 32,8523 . Con dichos valores,
reemplazando en la ecuacin del intervalo para la varianza poblacional se tiene:

20 10.0025 2 20 10.0025
32,8523

8,90655

O sea que el intervalo se encuentra dentro de los lmites: 0.0374 2 0.0728 .


Con lo anterior se ha ilustrado el proceso de aplicar la distribucin ji cuadrado para
establecer estimados de intervalo de una varianza y de una desviacin estndar
2
de una poblacin. Especficamente observe que como se us 0,975 y 02.025 el

estimativo tiene un coeficiente de confianza de 0.95. Cuando la ecuacin se


ampla a un caso general de cualquier coeficiente de confianza, el estimativo del
intervalo de confianza es:

n 1S 2
2

n 1S 2

21
2

Ecuacin No.40

En donde los valores de

se basan en una distribucin ji cuadrado con (n-1)

grados de libertad, y en donde 1 es el coeficiente de confianza.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

110

EJERCICIOS COMPLEMENTARIOS
1. Una investigacin efectuada a 400 familias de clase medias, revel que un
62% de sus ingresos anuales son utilizados para servicios de salud.
Determinar los lmites de confianza del 99%

2. En una muestra de 14 observaciones que tienen una media de 34.86 y una


desviacin estndar de 4.23, encuentre los lmites que en el 95% de los casos
permiten acertar al afirmar que la media poblacional queda incluida entre ellos.

3. Un laboratorio qumico desea estimar la reaccin promedio de mercurio


utilizadas en un medicamento. Qu tamao de muestra se requiere para
garantizar que habr un riesgo de solo 0.001 de sobrepasar un error de 5mm o
ms en la estimacin? La desviacin estndar de la reaccin se estima en
50mm

4. Un sondeo efectuado a 400 familias de clase media revel un gasto trimestral


promedio de $ 374.000 en productos de salud, con desviacin de $80.000.
a) Determine un intervalo de confianza del 95%
b) Cul es el mximo error, cuando se afirma que dicha media es de $374.000 con
una confianza del 99%?

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

111

REFERENTES

Cmo crear un grfico Chi-cuadrado en Excel (S, F). Extrado el 01 de Octubre de


2012 de: http://www.youtube.com/watch?v=eDCZhK7jeYg

Jurez, F., Villatoro, J. A. y Lpez, E. K. (2002). Apuntes de Estadstica Inferencial.


Mxico, D. F.: Instituto Nacional de Psiquiatra Ramn de la Fuente. Extrado el 10
de enero de 2012 de: http://rincondepaco.com.mx/Apuntes/Inferencial.pdf.

M. J. Navas, A (2001). Mtodos, diseos y tcnicas de investigacin psicolgica,


p.19.
Madrid: Editorial: UNED. Extrado el 11 de octubre de 2012 de:
http://www.uv.es/mperea/T1.pdf

Mendoza, H, Bautista, G. (2002). Probabilidad y Estadstica. Universidad Nacional


de Colombia, http://www.virtual.unal.edu.co/cursos/ciencias/2001065/. Licencia:
Creative Commons BY-NC-ND.

Salinas, J. (s.f.). Estimacin por Intervalos. Extrado el 08 de Junio de 2012 de:


http://www.ugr.es/~jsalinas/apuntes/C12.pdf.

Ximnez, C. (s.f.). Tema 21: Distribucin muestral de un estadstico. Extrado el 20


de
enero
de
2012
de:
http://www.uam.es/personal_pdi/psicologia/carmenx/EsquemaTema21.pdf

CANAVOS, George. Estadstica y Probabilidad. Mc Graw Hill. Mexico 1.998


DEVORE, Jay. Probabilidad y estadstica. Quinta edicin. Thomsom-Learning.
Mxico 2.001
CHRISTENSEN, Howard B. (1999). Estadstica Paso a Paso. Mxico: Editorial
Trillas.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

112

HERNNDEZ MAHECHA, Carlo Marcelo (2002). Inferencia Estadstica. Gua de


Estudio. Santaf de Bogot: UNAD.
JONHSON, Richard. Probabilidad y Estadstica para Ingenieros. Printece mall
Mxico 1.997
MONTGOMERY, Douglas. Estadstica y Probabilidad. Segunda edicin. Limusa.
Mxico, 2.002
PEA, Daniel. Estadstica, Modelos y Mtodos. Vol. 1. Alianza Editorial. Madrid
1.988
ROSS, Sheldon. Probabilidad y Estadstica para Ingenieros. Segunda Edicin. Mc
Graw Hill. Mxico 2.001
SPIEGEL, Murria R. (1991). Estadstica. Serie de compendios Schaum. Mxico:
McGraw Hill
CASAS, J.M. (1997). Inferencia Estadstica. Centro de Estudios Ramn Areces,
Madrid.
SARABIA, J.M. (2000). Curso Prctico de Estadstica. Segunda Edicin. Civitas,
Madrid.
SARABIA, J.M. (2002). Apuntes de Inferencia Estadstica.
SARABIA, J.M., PASCUAL, M. (2002). Prcticas de Inferencia Estadstica.
CASAS, J.M., SANTOS, J. (1999). Estadstica Empresarial. Centro de Estudios
Ramn Areces, Madrid.
CUADRAS, C.M. (1983). Problemas de Probabilidades y Estadstica. Tomo II.
PPU, Barcelona.
MENDENHALL, W., REINMUTH, J.E. (1993). Estadstica para Administracin y
Economa. Grupo Editorial Iberoamericana, Mxico.
PEA, D. (2001). Fundamentos de Estadstica. Alianza Editorial, Madrid.
RUIZ-MAYA, L., MARTN PLIEGO, F.J. (2001). Estadstica II: Inferencia. Segunda
Edicin. AC, Madrid.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

113

Sitios Web
http://ice.unizar.es/uzinnova/jornadas/pdf/95.pdf
http://www.fcnym.unlp.edu.ar/catedras/estadistica/programa2002.html#2
http://aprendeenlinea.udea.edu.co/lms/moodle/mod/resource/view.php?inpopup=tr
ue&id=3
http://aprendeenlinea.udea.edu.co/portal/
http://egkafati.bligoo.com/content/view/182409/Del_como_y_porque_ensenar_esta
distica.html
http://metro40.edv.uniovi.es/metroweb/charlas/Estadistica.pdf
http://www.uned.es/experto-metodos-avanzados/
http://aprendeenlinea.udea.edu.co/lms/moodle/course/view.php?id=322
http://server2.southlink.com.ar/vap/PROBABILIDAD.htm
http://es.wikipedia.org/wiki/Probabilidad
http://www.terra.es/personal2/jpb00000/pprobjunio99.htm
http://www.fvet.edu.uy/estadis/probabilidad.htm
http://thales.cica.es/rd/Recursos/rd98/Matematicas/28/matematicas-28.html
http://www.aulafacil.com/CursoEstadistica/CursoEstadistica.htm
http://www.uantof.cl/facultades/csbasicas/Matematicas/academicos/emartinez/Esta
distica/index.html

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
UNIDAD DE CIENCIAS BSICAS

JEAMMY JULIETH SIERRA HERNNDEZ


(Director Nacional de Curso)

100403 INFERENCIA ESTADSTICA


Vol. 2

IBAGU
FEBRERO 2013

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

COMITE DIRECTIVO
Jaime Alberto Leal Afanador
Rector

Constanza Abada Garca


Vicerrectora Acadmica y de Investigacin

Gloria Herrera
Vicerrector de Medios y mediaciones Pedaggicos

Maribel Crdoba Guerrero


Secretaria General

Inferencia Estadstica
Tercera Versin
Actualizacin por Jeammy Julieth Sierra Hernndez

Autores Primera Edicin:


Jorge Rondon
Danis Brito
Copyright
Universidad Nacional Abierta y a Distancia

ISBN

2012
Unidad de Ciencias Bsicas UNAD

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

CAMPOS DE
Bsica CRDITOS: 2 TRABAJO INDEPENDIENTE: 72
TIPO
DE
CURSO
Terico CDIGO:100403 ACOMPAAMIENTO
TUTORIAL: 24
FORMACIN
Horas
Horas
OBJETIVO GENERAL:
Que el estudiante comprenda, aplique y desarrolle la teora y las tcnicas de la
inferencia estadstica en diversos campos de su saber formativo, y que dicha
aplicacin se convierta en una herramienta de uso matemtico para la toma de
decisiones sobre hiptesis cuantitativas de datos, basado en la informacin
extrada de una muestra.
OBJETIVOS ESPECFICOS:
Que el estudiante identifique las tcnicas y procedimientos que se
deben emplear para que las muestras sean representativas de la poblacin
que se pretende estudiar, de forma que los errores en la determinacin de
los parmetros de la poblacin objeto de estudio sean mnimos.
Que el estudiante comprenda el comportamiento de una poblacin a
partir del anlisis metdico de una muestra aleatoria de la misma, y que
entienda que la inferencia inductiva de los parmetros estadsticos que
estime sobre dicha muestra, conlleva un error, el cual es posible de ser
cuantificado.
Conocer los criterios tcnicos que hay que tener en cuenta antes
de seleccionar un tamao de muestra.
Identificar el tipo de muestreo de acuerdo a los objetivos del estudio.
Diferenciar y analizar las ventajas y desventajas de la estimacin
por intervalos de confianza y las pruebas de hiptesis.
Determinar la prueba o tcnica apropiada a aplicar en las diferentes
pruebas de hiptesis paramtricas y No paramtricas.
COMPETENCIA GENERAL DE APRENDIZAJE:
Identificar un procedimiento adecuado para seleccionar de una poblacin una
parte de ella, con el fin de obtener resultados confiables y poder generalizar los
resultados obtenidos a toda la poblacin.
Determinar los estadsticos necesarios para el anlisis y solucin de situaciones
que implican conjuntos de datos de su disciplina de formacin, por medio del

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

conocimiento de la teora elemental del muestreo y de las distribuciones


muestrales.
Plantear y desarrollar el proceso de la inferencia estadstica para resolver
problemas concretos de investigacin en el mbito de otras disciplinas.
Aplicar apropiadamente los resultados tericos y metodolgicos de la inferencia
estadstica de estimacin y prueba de hiptesis en el marco de la modelacin.
Habilidad para planear una investigacin, diseo de instrumentos, definicin de
variables, recoleccin de la informacin, resumen y presentacin de los datos.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

UNIDADES DIDCTICAS

UNIDAD DOS:......................................................................................................................................... 6
PRUEBA DE HIPTESIS, ANLISIS DE VARIANZAS Y ESTADSTICAS NO PARAMTRICAS ..................... 6
CAPITULO CUATRO: PRUEBAS DE HIPTESIS ................................................................................... 7
Leccin 16: Conceptos Bsicos ..................................................................................................... 8
Leccin 17: Pruebas para la Media y la Diferencia de medias con grandes muestras. ............. 14
Leccin 18: Pruebas para la proporcin y la Diferencia de proporciones (siempre con grandes
muestras)..................................................................................................................................... 26
Leccin 19: Pruebas para la media y la diferencia de medias (muestras pequeas). ............... 34
Leccin 20: Pruebas para la varianza.......................................................................................... 44
CAPITULO CINCO: ANLISIS DE VARIANZA .................................................................................... 47
Leccin 21: Generalidades .......................................................................................................... 49
Leccin 22. Anlisis de Varianza de un Factor ............................................................................ 50
Leccin 23. Comparacin Mltiple de Medias (Pruebas a Posteriori) .................................. 60
Leccin 24. Anlisis de varianza con dos factores (diseo de bloques aleatorizados). ........... 61
Leccin 25. Anlisis de varianza de dos factores con interaccin. (Diseo factorial). ............. 66
CAPITULO SEIS: PRUEBAS NO PARAMETRICAS .............................................................................. 80
Leccin 26. Generalidades .......................................................................................................... 82
Leccin 27. Prueba de Bondad de Ajuste de Ji-cuadrado

................................................... 83

Leccin 28. Prueba de Kolmogorov-Smirnov ............................................................................. 87


Leccin 29. Prueba de Wilcoxon ................................................................................................. 88
Leccin 30. Prueba de Mann-Whitney para muestras independiente y prueba de KruskalWallis para comparar k muestras independientes..................................................................... 89

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

UNIDAD DOS:
PRUEBA DE HIPTESIS, ANLISIS DE VARIANZAS Y
ESTADSTICAS NO PARAMTRICAS

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

CAPITULO CUATRO: PRUEBAS DE HIPTESIS


Introduccin
En casos relacionados con situaciones especiales en las cuales se desea
comprobar la efectividad de estndares preestablecidos, la tcnica de prueba de
hiptesis resultaba bastante apropiada, por cuanto permite comprobar con
bastante certeza el grado de acierto en la fijacin de stos.
Una hiptesis estadstica se define como un supuesto hecho sobre algn
parmetro de la poblacin. Por ejemplo, los siguientes enunciados podran ser
tomados como hiptesis:
-

El ingreso promedio de los trabajadores de la fbrica es de $X.


El rendimiento promedio de los empleados de dos fbricas es
diferente.
El promedio de duracin de las bombillas es de 1.000 horas.
El promedio de duracin de las llantas es de 100.000 kilmetros.

Ya se ha recabado en muchas ocasiones, que el objetivo es tomar muestras


para extraer alguna conclusin o inferencia sobre la poblacin y que el nico
objetivo de examinar muestras, es que las poblaciones suelen ser demasiado
grandes y costosas de estudiar.

Objetivo general.
Contrastar la validez de una hiptesis o conjetura que se haya planteado en
relacin con una situacin determinada de la empresa, analizando errores
estadsticos posibles en las pruebas de hiptesis
Objetivos especficos.

Examinar que se entiende por hiptesis y qu por prueba de hiptesis.


Describir los pasos que se siguen para demostrar una hiptesis.
Describir los errores estadsticos que se pueden presentar.
Realizar pruebas en relacin con una y dos medias poblacionales, con una
y dos colas.
Realizar pruebas con una y dos proporciones poblacionales.
Realizar pruebas de hiptesis para datos que se encuentran en una escala
nominal u ordinal con aplicacin de la distribucin chi cuadrado.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

Leccin 16: Conceptos Bsicos


16. DECISIONES ESTADSTICAS
En la prctica, con frecuencia se tienen que tomar decisiones acerca de una
poblacin con base en informacin muestral.
A tales decisiones se les llama decisiones estadsticas. Por ejemplo, tal vez se
tenga que decidir, con base en datos muestrales, si determinado suero es
realmente eficaz en la curacin de una enfermedad, si un mtodo educativo es
mejor que otro, o bien si una moneda est alterada o no.
16.1. Hiptesis
Hiptesis estadsticas: Cuando se trata de tomar una decisin es til hacer
suposiciones o proposiciones (o conjeturas) acerca de la poblacin de que se
trata. Muchos problemas de ingeniera, ciencia, y administracin, requieren que se
tome una decisin entre aceptar o rechazar una proposicin sobre algn
parmetro. A estas suposiciones, que pueden ser o no ciertas, se les llama
hiptesis estadsticas. Estas hiptesis estadsticas son por lo general afirmaciones
acerca de las distribuciones de probabilidad de las poblaciones.
Este es uno de los aspectos ms tiles de la inferencia estadstica, puesto que
muchos tipos de problemas de toma de decisiones, pruebas o experimentos en el
mundo de la ingeniera, pueden formularse como problemas de prueba de
hiptesis. Consultado en la Web de ITC (s.f).
Otras definiciones
Una hiptesis estadstica es una afirmacin para verificar acerca de las
caractersticas de una o ms poblaciones. Alvarado, J. & Obagi, J. (2008)
Una hiptesis estadstica es una aseveracin o conjetura acerca de la distribucin
de la poblacin, afirmacin que generalmente est asociada a un subconjunto del
espacio del parmetro correspondiente al modelo probabilstico que representa
la citada poblacin. Mayorga, J. (2004, p. 189)

Una hiptesis estadstica es un enunciado provisional referente a uno o ms


parmetros de una poblacin o grupo de poblaciones. En el proceso de
estadstica inferencial hay dos tipos de hiptesis:

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

1. Hiptesis nula, designada mediante Ho y se lee H subcero. La letra H


significa hiptesis y el subndice cero indica no hay diferencia. Por lo
general en la hiptesis nula se plantea en trminos de no hay cambio, no
hay diferencia, se plantea con el objetivo de aceptarla o rechazarla.
2. Hiptesis alternativa, describe lo que se considerar si se rechaza la
hiptesis nula. A menudo tambin se le denomina hiptesis de investigacin,
y se designa por H1, que se lee h subuno
Otras definiciones
Hiptesis Nula: Es la conjetura inicial, es la suposicin que se hace sobre la
base de la experiencia del pasado, el conocimiento a priori y las necesidades
empresariales, es, en un comienzo la respuesta ms lgica al problema que
se ha planteado; es el valor que se asumira como cierto de no poderse hacer
la investigacin. La aseveracin se enuncia despus de la abreviatura
y
Mayorga, J. (2004, p. 189).
Hiptesis Alternativa: A toda hiptesis que difiera de la hiptesis dada se le
llama hiptesis alternativa. Por ejemplo, si una hiptesis es p = 0.5, la
hiptesis alternativa puede ser
7
5
. La hiptesis
alternativa a la hiptesis nula se denota H1. Murray, R. ()

16.2. Prueba de hiptesis


Prueba de hiptesis: Segn Mayorga, prueba de hiptesis es una de las
acepciones ms comunes, al igual que Contraste de hiptesis o Docimacia, para
lo que l prefiere llamar, como justifica en su libro, juzgamiento de hiptesis, que
define como, el proceso que culmina con una decisin de rechazar o de no
rechazar una hiptesis con base en la informacin de una muestra aleatoria
de una poblacin para la cual se ha asumido un modelo probabilstico
).
cuya funcin de densidad es (
Si se supone que una hiptesis es verdadera, pero se encuentra que los
resultados que se observan en una muestra aleatoria difieren marcadamente de
los resultados esperados de acuerdo con la hiptesis (es decir, esperados con
base slo en la casualidad, empleando la teora del muestreo), entonces se dice
que las diferencias observadas son significativas y se estar inclinado a rechazar
la hiptesis (o por lo menos a no aceptarla de acuerdo con la evidencia obtenida).
Murray, R. ()

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

10

Una Prueba de hiptesis es el proceso para determinar si las muestras


observadas difieren significativamente de los resultados esperados, ayudando
as a decidir si se acepta o se rechaza la hiptesis.

Pasos en una prueba de hiptesis

La prueba de hiptesis consiste en aplicar tcnicas estadsticas que


permitan aceptar o rechazar una hiptesis. Este procedimiento se conoce como
contraste de hiptesis. Las pruebas de hiptesis utilizan un procedimiento
de cinco pasos, los cuales se mencionan a continuacin:
1. Plantear las hiptesis nula y alternativa. Definiendo la lateralidad de la
prueba.
2. Determinar el nivel de significancia. (valores aceptables de error I y II)
3. Estimar el valor estadstico de prueba. (a partir de la muestra)
4. Establecer la regla de decisin. (al comparar el valor crtico o terico con el
de prueba)
5. Tomar la decisin.
PRUEBAS DE
HIPTESIS
Muestras Grandes
(Z-normal)

Muestras pequeas n<30


(T-student)

*Meias

*Diferencia de Medias

*Medias

*Proporciones

*Diferencia de Proporciones

*Diferencia de Medias

Varianza

Grfico 1. Pruebas de Hiptesis

16.3. Tipos de error.


La hiptesis nula y alternativa son entonces aseveraciones sobre la poblacin
que compiten entre s, en el siguiente sentido: la hiptesis nula (Ho) es
verdadera, o lo es la hiptesis alternativa (H1), pero no ambas. En el caso ideal,
el procedimiento de prueba de hiptesis debe conducir a la aceptacin de Ho
cuando sea verdadera y al rechazo de H1. Desafortunadamente no siempre es
posible puesto que como las pruebas de hiptesis se basan en la informacin de
la muestra, se debe considerar la posibilidad de cometer errores. La siguiente
tabla muestra los dos tipos de errores que se pueden cometer:

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

11

Tabla No.1 Tipos de errores

DECISIN SOBRE Ho

VERDADERA

FALSA

Aceptar H0

Correcta

Rechazar H0

Error tipo I
Nivel de significancia

Error tipo II

Correcta 1
Potencia de la prueba

Cuando se tiene una hiptesis esta puede ser verdadera o falsa y la decisin que
se toma en la prueba es aceptar o rechazar la hiptesis. Si la decisin que se
toma est de acuerdo con la realidad no se cometen errores, en este caso las
dos buenas decisiones son: aceptar la hiptesis nula cuando es cierta o rechazar
la hiptesis nula cuando es falsa.
Pero cuando la decisin no est de acuerdo con la realidad se pueden comete r
dos tipos de errores vistos anteriormente: rechazar la hiptesis nula cuando en
realidad es cierta, llamado error tipo I representado por alfa ( ); aceptar la
hiptesis nula cuando en realidad es falso, llamado error tipo II representado por
beta ( ), llamados tambin nivel de significancia. El procedimiento utilizado
consiste en limitarlos a un nivel preestablecido pequeo, generalmente 0.01
0.05. Este planteamiento se le denomina la potencia de la prueba y se
representa as:
Probabilidad de cometer el error tipo I
Probabilidad de rechazar Ho cuando es verdadera.
Probabilidad de NO cometer el error tipo I
(1 - ) Probabilidad de acertar la Ho cuando es verdadera.
Probabilidad de cometer el error tipo II
Probabilidad de aceptar Ho cuando es falsa.
Probabilidad de NO cometer el error tipo II
(1 - ) Probabilidad de rechazar Ho cuando es falsa.
Toda prueba de hiptesis determina una regin de rechazo de la hiptesis
llamada regin crtica, la cual depende del tipo de hiptesis que se pruebe y se
determina utilizando un nivel de significancia .

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

12

16.4. El Nivel mnimo o de rechazo.


Al establecer una prueba de hiptesis una de las formas de llegar a una
conclusin es a travs de la comparacin del valor crtico (o terico) con el de
prueba. Otra forma de poder tomar una decisin es, usar
en lugar del valor
crtico, es decir, observar la probabilidad de rechazar Ho cuando es verdadera
(error tipo I), o como afirma Alvarado, J.A y Otros (2008), responder a la pregunta:
cul es el riesgo que debo correr para poder rechazar Ho? Si ese riesgo es
grande, no se puede rechazar Ho; si es pequeo se rechaza Ho.
El p-valor
El mnimo de rechazo recibe tambin el nombre de valor p en el cual Ho sera
rechazado. Si el p-valor es menor que el nivel de significancia, la hiptesis nula se
rechaza. Lo puede encontrar en algunos textos como p-value en ingls. Ms
adelante puede verse un ejemplo dnde se utiliza el p-value para rechazar la
hiptesis nula.
En una prueba de hiptesis unilateral derecha, no se puede rechazar la
hiptesis nula Ho, si el estadstico de prueba (o calculado) es menor o igual
que el terico (tabulado). O lo mismo es, se rechaza la hiptesis nula cuando
el valor calculado es mayor que el tabulado

Una prueba de hiptesis es significativa si el p-value es menor que el nivel de


significacin, es decir:
<

16.5. Lateralidad de las pruebas


Dependiendo del planteamiento de la hiptesis alternativa (H1) se distingue dos
tipos de pruebas:
Pruebas bilaterales.
Pruebas unilaterales
Prueba Bilateral: El investigador desea comprobar la hiptesis de un cambio en
el parmetro. El nivel de significancia se divide en dos y existen dos regiones de
rechazo.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

13

Prueba de hiptesis:

Prueba Unilateral Derecha: El investigador desea comprobar la hiptesis de un


aumento en el parmetro, en este caso el nivel de significancia se carga todo
hacia el lado derecho, para definir las regiones de aceptacin y de rechazo
Prueba de hiptesis:

Prueba Unilateral Izquierda: El investigador desea comprobar la hiptesis de una


disminucin en el parmetro, en este caso el nivel de significancia se carga todo
hacia el lado izquierdo, para definir las regiones de aceptacin y de rechazo.
Prueba de hiptesis:

<

Ho
Verdadera)

Probabilidad

1
/2

/2

valor crtico
Regin de rechazo

Valor crtico
Regin de aceptacin

Grfico No. 1. Prueba bilateral (o a dos colas)

Regin de rechazo

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

14

Probabilidad

Ho
(Verdadera)

Valor crtico
Regin de rechazo

Regin de aceptacin

Probabilidad

Grfico No. 2. Prueba unilateral izquierda (inferior)

Ho
(verdadera)

Valor crtico

Regin de aceptacin

Regin de rechazo

Grfico No. 3. Prueba unilateral derecha (superior)

Leccin 17: Pruebas para la Media y la Diferencia de medias con


grandes muestras.
17.

Prueba para la media y diferencia de medias (Muestras grandes


( )

En las pruebas para la media de poblacin de muestra grande se distingue dos


situaciones:
Conocida la desviacin estndar de la poblacin.
Desconocida la desviacin estndar de la poblacin.
17.1. Prueba para la media (conocida la desviacin estndar poblacional).
Cuando se tiene la oportunidad de conocer

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

17.1.1.

15

Prueba bilateral (para la media)

El procedimiento de prueba de hiptesis para pruebas bilaterales a cerca de la


media de una poblacin, cuando se considera el caso de muestra grande 3
en que el teorema del lmite central permite suponer que la media de la
distribucin muestral de medias se puede aproximar a una distribucin normal de
probabilidad, y la desviacin estndar de la poblacin es conocida, sigue la
siguiente forma general:
Muestra grande ( 3 )
Planteamiento de hiptesis:

H 0 : 0
H1 : 0
Estadstico de prueba para desviacin estndar poblacional conocida:

Ecuacin No.1

Regla de rechazo a un nivel de significancia :

Rechazar H0 si z -Z o si Z Z
2

Ejemplo
La empresa coca cola ha establecido como poltica general para su produccin en
pequea escala, un promedio ( ) de llenado para sus envases de 200
centmetros cbicos con una desviacin estndar ( ) de 16 centmetros cbicos.
Dado que recientemente se han contratado y diseado nuevos mtodos de
produccin, utilizando un nivel de significancia del 0.01, se desea probar la
hiptesis, que el promedio de llenado sigue siendo de 200 centmetros cbicos.
Para tal efecto se tom una muestra de 100 envases llenos, los cuales mostraron
una media de llenado de 203.5 centmetros cbicos.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

16

Paso 1: Planteamiento de hiptesis

Planteamiento de la hiptesis nula: la media poblacional es 200


Planteamiento de la hiptesis alternativa: La media poblacional es
diferente a 200. Estas hiptesis se expresan como sigue:

Esta es una prueba de dos colas, debido a que la hiptesis alternativa (

) es

planteada en palabras de diferencia, es decir, la hiptesis no indica si la media


es mayor o menor que 200.

Paso 2: Nivel de significancia

El nivel de significancia es de 0.01 que es el alfa ( ), la probabilidad de


cometer el error de tipo uno, es decir la probabilidad de rechazar la hiptesis
siendo verdadera. Para ste tipo de problema se utiliza la distribucin normal
estandarizada en Z.

En los intervalos de confianza el alfa siempre se divide en


dos, para distribuirlo en las dos colas, en las pruebas de
hiptesis el alfa slo se divide, si la prueba es a dos colas

Paso 3: Estadstico de prueba (o calculado)

El valor estadstico de prueba para este tipo de problema es utilizando la


distribucin normal estandarizada en Z:

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

17

Paso 4: Estadstico terico (o tabulado) y regla de decisin

La formulacin de la regla de decisin consiste en hallar el valor crtico de Z


con una prueba de dos colas. En la tabla de la normal estndar (descargar
tabla) se identifica el valor de Z correspondiente a una probabilidad igual
1 2 1
5
995. El valor ms cercano a 0,995 es 0.995059 que
corresponde a un valor de Z igual a 2.58, que es el valor crtico para la prueba
de hiptesis. Dado que es una prueba de dos colas, se tendrn dos valores
crticos, tal como se indica en el siguiente grfico:

Grfico No. 4. Prueba bilateral (a dos colas)

La regla de decisin es aceptar la hiptesis nula (Ho), puesto que el valor


estadstico de prueba (2.19) ha cado en la zona de aceptacin de dicha
hiptesis
Prueba de
hiptesis para la
media (Bilateral)

Paso 5: Tomar la Decisin


Se concluye que el llenado de los envases cumple con las polticas generales de
la empresa, y la diferencia de promedios se atribuye a variaciones aleatorias.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

17.1.2.

18

Prueba unilateral (para la media)

Con anterioridad de dijo que la hiptesis alternativa indica una direccin ya sea
mayor que o menor que, la prueba es de una cola. El procedimiento para
demostrar la hiptesis es por lo general igual a la prueba de dos colas, excepto
que el valor crtico es diferente. Ahora se modificar la hiptesis alternativa del
problema anterior, sobre el llenado de los envases de una factora de coca cola,
pues se sospecha que el promedio de llenado est por encima de lo que la
empresa determina (por eso en la hiptesis alterna se plantea una relacin mayor
que).
Paso 1: Planteamiento de hiptesis
H 0 : 200
H1 : 200

Paso 2: Nivel de significancia


Igual al ejemplo anterior.

Paso 3: Estadstico de prueba (o calculado)


Igual al ejemplo anterior.
Paso 4: Estadstico terico (o tabulado) y regla de decisin
El valor crtico cambia. En la tabla de la distribucin normal se identifica el valor
de Z correspondiente a una probabilidad igual 0,99. El valor ms cercano a 0,99
corresponde a un valor de Z igual a 2.33, que es el valor crtico para la prueba de
hiptesis. Dado que es una prueba de una cola, se tendr el valor crtico, tal como
se indica en la siguiente grfica:

Prueba de
hiptesis para la
media (unilateral)

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

19

Probabilidad

Ho (verdadera)

200
|2.33

Escala Z
Regin de rechazo

Regin de aceptacin

Grfico No. 5. Prueba unilateral derecha (superior)

Paso 5: Tomar la Decisin


Igual, puesto que el valor estadstico de prueba est ubicado en la zona de
aceptacin de la hiptesis nula, es decir, se est diciendo que el promedio de
llenado es de 200, tal como est planteada la hiptesis nula.
17.2. Prueba para
poblacional).

la

media

(desconocida

la

desviacin

estndar

En la mayora de los casos se desconoce la desviacin estndar de la poblacin


, la cual debe calcularse en estudios previos o se estima utilizando la desviacin
estndar de la muestra (s). En estos casos se utiliza la desviacin estndar de la
muestra, quedando la frmula para el estadstico de prueba as:

Ecuacin No.2

Ejemplo
Una cadena grande de almacenes expide su propia tarjeta de crdito y Ud. desea
saber si los saldos promedios por crditos de los clientes son mayores que 400
unidades monetarias. El nivel de significancia se fija en 0.05. Una revisin
aleatoria de 172 clientes, revel que el promedio por crdito de los clientes es de
407 unidades monetarias y la desviacin estndar de la muestra es de 38

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

20

unidades monetarias. Concluye UD. que la media poblacional es mayor que 400
unidades monetarias?
Paso 1: Planteamiento de hiptesis

H 0 : 400
H1 : 400
Dado que la hiptesis alternativa se enuncia mayor que, se aplica una cola a la
derecha, y como la muestra es grande (n >= 30), se aplica la distribucin normal
estandarizada en Z.
Paso 2: Nivel de significancia
El nivel de significancia se fija en 0.05
Paso 3: Estadstico de prueba (o calculado)
Z

X 407 400

2.42
S
38
n
172

Probabilidad

Paso 4: Estadstico terico (o tabulado) y regla de decisin

Ho (verdadera)

1- =0,95

= 0,05

200

|1,645
Regin de aceptacin

Unidades
monetarias de
crdito
Escala Z
|2.42
Regin de rechazo

Grfico No. 6. Prueba unilateral derecha (superior)

El valor crtico es 1.645 y la ubicacin del estadstico de prueba se encuentra en la


zona de rechazo de la hiptesis nula, por lo tanto se acepta la hiptesis
alternativa.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

21

Paso 5: Tomar la Decisin


La decisin a tomar por Ud. es que el promedio de los crditos es mayor que 400
unidades monetarias con un grado de confianza del 95%.
17.3. Prueba para la diferencia de medias (desconocida la desviacin
estndar poblacional).
En la mayor parte de los casos no se conoce la varianza o desviacin estndar
real de ninguna poblacin. En general la nica informacin que es posible obtener
se relaciona con las medias muestrales y , las varianzas muestrales
y
y las desviaciones estndar de las muestras
y . Si se hacen las suposiciones
que las muestras se obtienen de manera aleatoria e independiente a partir de las
poblaciones respectivas que tiene una distribucin normal y que las varianzas
poblacionales son iguales, es decir,
, se puede utilizar una prueba de
distribucin normal de varianzas combinadas para determinar si existe una
diferencia significativa entre las dos poblaciones.
Recordemos que para diferencias de medias se utiliza el siguiente estadstico de
prueba:

) (

2
1
1

2
2
2

Ecuacin No.3

Ejemplo
Una obra de construccin requiere un gran nmero de bloques de concreto. Dos
empresas abastecedoras A y B licitan para su adjudicacin, y dentro del pliego de
condiciones se estipula que la resistencia mnima es de 1.000 unidades mtricas a
la resistencia, y el contrato se adjudicar a la empresa que mayor resistencia
presente su producto.
Paso 1: Planteamiento de hiptesis
Se plantea la hiptesis nula (Ho) que no existe diferencia entre las resistencias
medias a la compresin de los bloques de concreto. La hiptesis alternativa se
plantea en trminos que hay alguna diferencia significativa entre las dos
resistencias medias a la compresin. Simblicamente se expresa as:

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

22

H0 : A B
H1 : A B
Dado que la hiptesis alternativa no indica una direccin especfica, la prueba es
de dos colas
Paso 2: Nivel de significancia
Se elige un nivel de significancia de 0.01. Esto equivale a cometer un error de tipo
I. Se usar una distribucin normal estandarizada en Z, razn por la cual se debe
seleccionar una muestra que al menos contenga como mnimo 30 unidades de
bloque, cada una de las empresas licitantes.

Paso 3: Estadstico de prueba (o calculado)


El estadstico de prueba a aplicar est dado por la siguiente frmula:

2

2
2
2

Ecuacin No.4

Suponga que Ud. Seleccion una muestra de cada una de las empresas licitantes
y determin la resistencia a la compresin, con los siguientes resultados:
Tabla No.2 Resultados de muestra

Licitante A

Licitante B

= 1.070

X = 1.020

n = 81

n = 64

S = 63

S = 57

El valor del estadstico de prueba es:

X1 X 2
S12 S 22

n1 n2

1.070 1.020

632 572
81

64

50
5.01
9.98827

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

23

Paso 4: Estadstico terico (o tabulado) y regla de decisin


Recurdese que se seleccion un nivel de significancia del 0.01 y se utilizar una
prueba de dos colas. Los valores crticos y zonas de aceptacin para las hiptesis
se presentan en la siguiente figura:

Probabilidad

Ho (Verdadera)

0.01/2= 0.005

0.01/2=0.005

Resistencia ladrillos

valor crtico -2.58|


Regin de rechazo

|2.58
Regin de aceptacin

|5.01

Regin de rechazo

Grfico No. 7. Prueba bilateral (o a dos colas)

Paso 5: Tomar la Decisin


El valor Z calculado queda en el rea de rechazo de la hiptesis nula, por lo tanto se
concluye que la media poblacional de la resistencia a la compresin es diferente en las
dos empresas y la diferencia no se debe al azar del muestreo, con un grado de confianza
del 99%.

17.4. Prueba para la diferencia de medias (Muestras independientes


desviacin estndar poblacional conocida).

(1 2 )( 1 2 )
2

1
1

Ecuacin No.5

2
2
2

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

Si

<

Recuerde que

<

24

entonces No se rechaza

es el estadstico de prueba (o calculado)

Ejemplo

Un constructor est considerando dos lugares alternativos (dos comunidades)


para construir un centro comercial. Como los ingresos de los hogares de la
comunidad son una consideracin importante en sta seleccin, desea probar que
el ingreso promedio de la primera comunidad excede al promedio de la segunda
comunidad en cuando menos $1.500 diarios. Con la informacin de un censo
realizado el ao anterior sabe que la desviacin estndar del ingreso diario de la
primera comunidad es de $1.800 y la de la segunda es de $2.400
Para una muestra aleatoria de 30 hogares de la primera comunidad, encuentra
que el ingreso diario promedio es de $35.500 y con una muestra de 40 hogares de
la segunda comunidad el ingreso promedio diario es de $34.600. Pruebe la
hiptesis con un nivel de confianza del 95 por ciento.
Paso 1: Planteamiento de hiptesis

15
< 15

Paso 2: Nivel de significancia


Recordemos que el nivel de confianza es 95%
Es decir 1
95 eso indica que:
5
Paso 3: Estadstico de prueba (o calculado)
El tamao de las muestras es grande y las varianzas poblacionales son conocidas,
por consiguiente la estadstica de trabajo a utilizar la ecuacin 5.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

25

Tabla No.3 Resultados de las comunidades

Comunidad 1

Comunidad 2
4
34 6
24

(35


2
1
1

2
2
2

346

18

) 15

24
4

1 195

Paso 4: Estadstico terico (o tabulado) y regla de decisin


Para un nivel de confianza del 95 %, ya que es una prueba de unilateral izquierda,
lo que se busca es el valor crtico que deja por encima un 95% de rea, por tanto
es lgico pensar que el valor ser un Z negativo, en la tabla de la distribucin
normal se tiene un valor de Z de -1,64 (estadstico terico o tabulado). Como
puede observarse en el grfico No.8, el estadstico de prueba se ubica en la zona
de aceptacin de la hiptesis nula.

Probabilidad

Ho
(Verdadera)

= 0.05

Valor crtico -1.64|


Regin de rechazo

-1.195|
Regin de aceptacin

Grfico No. 8. Prueba unilateral izquierda (cola inferior)

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

26

Paso 5: Tomar la Decisin


Por lo tanto, con una confiabilidad del 95 por ciento, la diferencia entre el ingreso
promedio por hogar en las dos comunidades es mayor a $1.500 diarios.

En una prueba de hiptesis la confiabilidad significa la probabilidad


de no rechazar la hiptesis nula que es cierta, porque el nivel de
confianza es la probabilidad que el estadstico de prueba se
encuentre en la zona de aceptacin.

Leccin 18: Pruebas para la proporcin y la Diferencia de


proporciones (siempre con grandes muestras).
18.

Prueba de hiptesis para proporciones.

Se entiende por proporcin, la porcin relativa o porcentaje que expresa la parte


de la poblacin o muestra que tiene un atributo particular de inters como el
resultado comparativo de contar algo, Se cuenta el nmero de partes defectuosas;
se cuenta el nmero de votantes por la preferencia de un candidato. As la prueba
de proporcin implica niveles nominales de medida.
18.1. Prueba para una proporcin
Para demostrar una proporcin muestral se requiere cumplir con ciertos principios
binomiales, tales como:
1.
2.

Los datos recolectados son el resultado de un conteo.


El resultado de un experimento se clasifica en una de las dos
categoras mutuamente excluyentes: un xito o un fracaso.
3.
La probabilidad de xito se mantiene constante.
4.
Los intentos para realizar cada experimento son independientes.
5.
El tamao de la muestra debe ser tan grande para que se d la
siguiente condicin: (n)(p)>5 y (n)(1-p)>5
Para realizar una prueba de hiptesis a fin de evaluar la magnitud de la diferencia
entre la proporcin muestral

p y la proporcin poblacional (P), se puede usar el

siguiente estadstico de prueba:

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

27

PP
P(1 P)
n

Ecuacin No.6

Dnde:

es la proporcin muestral.

es la proporcin poblacional.

es el tamao de la muestra.

De otra manera, en lugar de examinar la proporcin de xitos en una muestra


como en el caso anterior, es posible estudiar el nmero de xitos en una muestra,
para determinar el nmero de xitos esperados o hipotticos en la poblacin, se
utiliza el siguiente estadstico de prueba:
Z

X n p
n p q

Ecuacin No.7

Dnde:
X
P

es el nmero de xitos en la muestra.


es la proporcin hipottica de xitos.

Ejemplo
Suponga que para que lo elijan a Ud. como alcalde, es necesario que logre al
menos el 80% de los votos del barrio donde vive. Dado su inters decide hacer
una encuesta en el barrio con una muestra de 2.000 personas, para ver la
posibilidad y 1.550 dieron respuesta favorable por sus aspiraciones. Pruebe la
hiptesis de favorabilidad, con un nivel de significancia del 0.05.
Antes de realizar el procedimiento de los cinco pasos, veamos si cumple la
condicin de:
(n)(p)>5

(2.000)(0.8)>5 1.600>5

Cierto

(n)(1-p)>5

(2.000)(0.2)>5 400>5

Cierto

Paso 1: Planteamiento de hiptesis


La hiptesis nula se plantea diciendo que Ud. s tiene el 80% de favorabilidad de
voto en su barrio y la hiptesis alternativa en que no alcanza a tener este

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

28

porcentaje de favorabilidad de voto. Simblicamente se expresa como sigue:

Ho : P 0.80
H1 : P 0.80
Paso 2: Nivel de significancia
La distribucin de probabilidad a utilizar es la normal estandarizada en Z, con un
nivel de significancia del 5%, con una cola a la izquierda.
Paso 3: Estadstico de prueba (o calculado)

PP
P(1 P)
n

Dnde:

es la proporcin muestral.

es la proporcin poblacional.

es el tamao de la muestra.

P(1 P)
P
n

Es el error estndar de la proporcin poblacional.

Reemplazando los diferentes valores en la ecuacin se tiene:

PP

P(1 P)
n

1.550
0.80
0.775 0.80
0.025
2.000

2.80
0.0089443
0.80(1 0.80)
0.00008
2.000

Paso 4: Estadstico terico (o tabulado) y regla de decisin


La regla de decisin se toma sobra la base de un valor critico calculado a partir de
la tabla de distribucin Z, con un rea de 0.4500 (0.5000-0.0500)

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

29

Grfico No. 9. Prueba unilateral izquierda (cola inferior)

Paso 5: Tomar la Decisin


Como el valor Z (-2080) est en la regin de rechazo de la hiptesis nula,
entonces se acepta la hiptesis alternativa y se concluye la favorabilidad de voto
es menos al 80%.

Ejemplo
Probar al nivel de significancia del 0.01 la aseveracin que el 55% de las familias
que planean adquirir una residencia en Melgar desea su ubicacin en un
condominio. Para su estudio Ud. toma una muestra aleatoria de 400 familias que
planean comprar una residencia en Melgar, de las cuales 228 familias desean en
un condominio.
Paso 1: Planteamiento de hiptesis
La hiptesis nula se plantea diciendo que el 55% de las familias desean adquirir
residencia en un condominio en Melgar.

Ho : P 0.55
H1 : P 0.55
Paso 2: Nivel de significancia
La distribucin de probabilidad a utilizar es la normal estandarizada en Z, con un
nivel de significancia del 1%, con dos colas.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

30

Paso 3: Estadstico de prueba (o calculado)

PP

P(1 P)
n

0.55
0.02
400

0.80
0.55(1 0.55) 0.0248747
400

280

Paso 4: Estadstico terico (o tabulado) y regla de decisin


La regla de decisin se toma sobre la base del siguiente grfico:

Grfico No. 10. Prueba Bilateral (a dos colas)

Paso 5: Tomar la Decisin


La hiptesis nula que la proporcin verdadera es del 55% no es rechazada a un
nivel de significancia del 1%, concluyendo que el 55% de las familias planean
adquirir residencia vacacional en Melgar lo desean en un condominio.

18.2. Prueba para diferencias entre dos proporciones


Se presenta a continuacin un ejemplo donde se emplea la prueba de proporcin
para dos poblaciones, utilizando el siguiente estadstico de prueba:
Z

( P1 P2 ) P1 P2
PC (1 PC ) PC (1 PC )

n1
n2
Ecuacin No.8

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

31

Dnde:

n1 Es la cantidad seleccionada en una muestra.

n2 Es la cantidad seleccionada en la otra muestra.

PC

X1 X 2
Es la media ponderada de las proporciones muestrales.
n1 n2

X1

Es la cantidad de xitos de la primera muestra.

X2

Es la cantidad de xitos de la segunda muestra.

P1 yP2 Proporcin de xitos de la poblacin uno y dos respectivamente.

Ejemplo
Una fbrica de perfumes ha desarrollado un nuevo producto. Varias pruebas de
comparacin indican que el perfume tiene un buen potencial en el mercado. Sin
embargo el departamento de mercadotecnia y publicidad quieren planear una
estrategia de manera que el producto llegue e impresione al sector ms grande
posible del pblico comprador. Una de las preguntas es si prefiera el perfume una
proporcin mayor de mujeres jvenes o una proporcin mayor de mujeres
maduras. Por tanto, existen dos poblaciones: una que consta de mujeres jvenes
y otra de damas maduras. Se us una prueba estndar de aroma. Se
seleccionaron aleatoriamente damas y se les pidi que olieran varios perfumes,
incluyendo el que suelen usar, y por supuesto el nuevo perfume. La persona que
realiza la prueba es la nica que conoce el nombre de los perfumes. Cada mujer
selecciona el perfume que le agrada ms.
Paso 1: Planteamiento de hiptesis
La hiptesis nula se plantea diciendo que no hay diferencia entre la proporcin de
mujeres jvenes y maduras que prefieren el nuevo perfume. La hiptesis
alternativa se plantea que las dos proporciones no son iguales.

Ho : P1 P2
H1 : P1 P2
Se designa P subuno como la proporcin de mujeres jvenes y P subdos como la
proporcin de mujeres maduras.
Paso 2: Nivel de significancia
Se decidi un nivel de significancia del 0.05.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

32

Paso 3: Estadstico de prueba (o calculado)


Los planes son tomar una muestra al azar de 100 mujeres jvenes designada por
n subuno y una muestra de 200 mujeres mayores designada como n subdos. Los
resultados una vez hecha el experimento dio los siguientes resultados: de las 100
mujeres jvenes 20 eligieron el nuevo perfume, designando este valor como X
subuno; y de las 200 mujeres maduras 100 prefirieron el nuevo perfume,
designando este valor como X subdos.
La proporcin ponderada, da como resultado:

PC

X1 X 2
20 100 120

0.40
n1 n2
100 200 300

P1 P2
PC (1 PC ) PC (1 PC )

n1
n2

20
100
0.30
100
200

5.0
0.06
0.40(1 0.40) 0.40(1 0.40)

100
200

Paso 4: Estadstico terico (o tabulado) y regla de decisin


Los valores crticos para un nivel de significancia del 5% son 1.96 y +1.96. Igual
que en los otros casos, la siguiente grafica establece la regla de decisin:

Grfico No. 11. Prueba Bilateral (a dos colas)

Paso 5: Tomar la Decisin


El valor de Z calculado de 5.0 se encuentra en el rea de rechazo de la hiptesis
nula. Por tanto, la hiptesis que las proporciones son iguales se rechaza a un nivel
del 5% de significancia.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

33

Ejemplo
Dos lotes de frutas conformados cada uno por 250 unidades son tratados y
almacenados en iguales condiciones salvo que el lote No 1 est a temperatura
ligeramente inferior que el lote No 2. Pasado un tiempo se encuentra que el lote
No 1 hay 225 frutas sanas y en el lote No 2 hay 200 sanas. Probar la hiptesis que
la temperatura ms baja favorece la conservacin de las frutas al nivel de
significacin de 0.05.
Paso 1: Planteamiento de hiptesis

Ho : P1 P2
H1 : P1 P2
Paso 2: Nivel de significancia
Utilizando la distribucin de probabilidad normal con ensayo unilateral a la derecha
con un nivel significativo de 0.05, el valor critico es de 1.645.
Paso 3: Estadstico de prueba (o calculado)
Z

P1 P2
PC (1 PC ) PC (1 PC )

n1
n2

PC

0.90 0.80
0.10

3.13
0.0319
(0.85)(0.15) (0.85)(0.15)

250
250

X 1 X 2 225 200

0.85
n1 n2
250 250

Paso 4: Estadstico terico (o tabulado) y regla de decisin

Grfico No. 12. Prueba unilateral superior (cola derecha)

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

34

Paso 5: Tomar la Decisin


Como 3.12>1.645 se rechaza la hiptesis nula y se acepta la hiptesis alternativa.
La temperatura ms baja favorece la conservacin de las frutas.

Leccin 19: Pruebas para la media y la diferencia de medias


(muestras pequeas).
19.

Pruebas de hiptesis para pequeas muestras.

Ahora veamos el caso en que las muestras son pequeas, n 30 , pero donde la
distribucin muestral del estadstico de prueba se puede aproximar a una
distribucin t student. Dicha aproximacin es posible cuando los valores
subyacentes de la poblacin son casi normalmente distribuidos, y cuando
intervienen poblaciones donde las desviaciones estndar, aunque desconocidas,
se sabe que son iguales. Habiendo estudiado pruebas para muestras grandes con
todo detalle, podemos restringirnos a ejemplos en donde se aplique este tipo de
distribucin.
19.1. Prueba para media (pequea muestra)
Si tambin es razonable suponer que la poblacin tiene una distribucin normal de
probabilidad, con la distribucin t se puede hacer inferencia a cerca del valor de la
media de la poblacin.
Ejemplo
Una compaa de seguros revela que en promedio la investigacin por demandas
en accidentes y todos los trmites tiene un costo promedio de 60 unidades
monetarias. Este costo se considera exagerado comparado con el de otras
compaas del mismo tipo. A fin de evaluar el costo se seleccion una muestra
aleatoria de 26 demandas recientes y se realiz el estudio de costos. Se concluy
que el costo promedio es de 57 unidades monetaria con una desviacin estndar
de 10 unidades monetarias. Con un nivel de significancia del 0.01 se puede decir
que el estudio revel un costo menor al establecido por la empresa?

Paso 1: Planteamiento de hiptesis


La hiptesis nula se plantea en el sentido que el costo promedio es de 60

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

35

unidades monetarias. La hiptesis alternativa que el costo es menor a 60 unidades


monetarias. Esto se expresa en la siguiente forma:

H 0 : 60
H 1 : 60
La prueba es de una cola a la izquierda, segn el planteamiento de la hiptesis
alternativa.
Paso 2: Nivel de significancia
Se usa un nivel de significancia del 0.01 con una distribucin t, en consideracin
a que la muestra en menor a 30, es decir, es una pequea muestra.
Paso 3: Estadstico de prueba (o calculado)
Utilizando los datos de la muestra, se utiliza la siguiente frmula como estadstico
de prueba:

X 57 60

1.530
S
10
n
26

Paso 4: Estadstico terico (o tabulado) y regla de decisin


Los valores crticos para la distribucin t se encuentran en la tabla
correspondiente (anexo D), con 25 grados de libertad (26 1), prueba de una cola
a un nivel de significancia de 0.01, correspondiendo un valor crtico de 2.485. En el
siguiente figura se indica el presente planteamiento:

Grfico No. 13. Prueba unilateral superior (cola derecha)

Paso 5: Tomar la Decisin


Puesto que 1.53 se encuentra en la regin de aceptacin de la hiptesis nula a

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

36

un nivel del 1% de significancia, se concluye que los costos para los tramites de
seguros de accidente no se han disminuido y se mantiene a un nivel promedio de
costo de 60 unidades monetarias.
Ejemplo
Una empresa produce elementos con un promedio de 43 mm de largo. Un ajuste
en las mquinas de produccin supone que dicho estndar ha cambiado. Se
quiere probar sta hiptesis con un nivel de significancia del 0.02.
Para afrontar el problema Ud. selecciona una muestra aleatoria de 12 elementos y
procede a medir su largor con los siguientes resultados:
Tabla No. 4. Seleccin muestra aleatoria

Elemento 1

10

11

12

Medida

39

42

45

43

40

39

41

40

42

43

42

42

Plantea sus hiptesis:

H 0 : 43
H1 : 43

Paso 1: Planteamiento de hiptesis


Como hiptesis nula que no se ha producido un cambio en las dimensiones del
producto. Como hiptesis alternativa que se ha producido un cambio en las
caractersticas internas del producto debido a los ajustes en las mquinas.
Paso 2: Nivel de significancia
Se dispone a probar la hiptesis con un nivel de significancia del 0.02, utilizando la
distribucin t porque es una pequea muestra, con 11 grados de libertad
aplicando el principio de (n- 1) y clculo para dos colas puesto que la hiptesis
alternativa est planteada desde el punto de vista de diferente.

Paso 3: Estadstico de prueba (o calculado)


El estadstico de prueba a utilizar es el siguiente:

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

37

X
S
n

Procede al clculo de la media y la desviacin estndar muestral:

X
X
n

X X

498

41.5
12

n 1

35
1.78
11

Con la informacin anterior, aplica la frmula del estadstico de prueba:

X 41.5 43.0

2.92
S
1.78
n
12

Paso 4: Estadstico terico (o tabulado) y regla de decisin


Para aplicar la regla de decisin, muestra en el siguiente grfico el planteamiento
anterior:

Grfico No. 14. Prueba Bilateral (a dos colas)

Paso 5: Tomar la Decisin


La hiptesis nula que la media poblacional es 43 mm se rechaza a un nivel de
significancia del 0.02 y se acepta la hiptesis alternativa, concluyendo que los
ajustes en las mquinas s causaron un cambi en la calidad de control en el

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

38

largor de los diferentes elementos que se producen.


Anteriormente se analiz ampliamente la prueba de hiptesis para cuando las
muestra son pequeas, es decir, el tamao de la muestra es menor a 30. A
continuacin se propone un ejercicio de aplicacin, para que Ud. los desarrolle
atendiendo las sugerencias dadas.

19.2. Prueba para dos medias muestrales (pequea muestra)


Una prueba que utiliza la distribucin t tambin puede aplicarse para comparar dos
medias muestrales que tienen las siguientes caractersticas:
1.
2.
3.
4.
5.

Las poblaciones deben de distribuirse normalmente.


Las poblaciones deben de ser independientes.
Las varianzas de las poblaciones deben de ser iguales.
Las muestras tienen menos de 30 observaciones.
Las desviaciones estndar de las poblaciones no se conocen.

Cuando se est frente a estas caractersticas, el estadstico de prueba a utilizar es


el siguiente:

( X 1 X 2 ) 1 2

S12 n1 1 S 22 n2 1 1 1


n1 n2 2

n1 n2
Ecuacin No.9

Dnde:

X1 y X 2

Las medias de las muestras

n1 yn2 Los tamaos de las muestras


S12 yS 22 Las varianzas de las muestras
G.L.

Grados de libertas, igual a = n1 n2 2

Ejemplo
Se ha propuesto realizar un examen de estadstica a dos grupos de estudiantes,
con el propsito de saber si los grupos tienen similares conocimientos sobre
pruebas de hiptesis. Para ello Ud. seleccion el grupo A compuesto de 5

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

39

estudiantes de educacin a distancia y el grupo B compuesto por 6 estudiantes de


educacin presencial, y los someti a la prueba, dando como resultado los
siguientes tiempos en minutos:
Tabla No. 5. Prueba para dos grupos

Educacin a distancia
2

Educacin presencial
3

4
3

Probar con un nivel de significancia del 0.10 si existe alguna diferencia de


habilidad en los conocimientos de los dos grupos.

Paso 1: Planteamiento de hiptesis


Las hiptesis las plantea en los siguientes trminos:

Ho : 1 2
H1 : 1 2
La hiptesis nula consistente en que los dos grupos no tienen alguna diferencia en
la habilidad de conocimiento, y la hiptesis alternativa en que existe diferencia
entre los grupos sobre la habilidad en la aplicacin de los conocimientos.
Paso 2: Nivel de significancia
Prueba la hiptesis con un nivel de significancia del 10%, utilizando la distribucin
t student porque las muestras son menores que 30, con 9 grados de libertad (5+6
2) y prueba de dos colas porque la hiptesis alternativa est planteada en
funcin de diferente.
Paso 3: Estadstico de prueba (o calculado)
Para el clculo del estadstico de prueba se requiere estimar las medias de los
grupos y sus varianzas, los cuales se presentan en el siguiente cuadro:

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

40

Tabla No.6. Resultados para los grupos de estudiantes

Grupo estudiantes a distancia

Grupo presencial

Media = 4

Media = 5

Varianza = 8.5

Varianza = 4.4

Muestra = 5

Muestra = 6

X1 X 2

2
1

n1 1 S n2
2
2

n1 n2 2

1 1
1

n2
n1

45

1
8.55 1 4.46 1 1

562

0.6620

Paso 4: Estadstico terico (o tabulado) y regla de decisin

Grfico No. 15. Prueba Bilateral (a dos colas). Diferencia de dos medias

Paso 5: Tomar la Decisin


La decisin es no rechazar la hiptesis nula debido a que el valor del estadstico
de prueba 06620 ha cado en la zona de aceptacin de dicha hiptesis,
concluyendo que no existe diferencia en la habilidad de aplicacin de
conocimientos entre los estudiantes a distancia y los estudiantes de presencial,
con un nivel de significancia del 10%.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

41

19.3. Prueba de hiptesis para observaciones pareadas o relacionadas


La caracterstica principal para aplicar este tipo de prueba, es que las muestras
sean dependientes y el tamao de cada muestra sea inferior a 30 elementos
seleccionados.
Ejemplo
Un grupo de alumnos registra un ndice de puntuacin en estadstica, que se
considera muy bajo para aceptarlos al siguiente nivel. Proceden a tomar un curso
de nivelacin, obteniendo los siguientes registros antes y despus del curso. Con
un nivel de significancia del 0.05 probar si el curso de nivelacin mejor las
condiciones del grupo.
Antes

128

105

119

140

98

123

127

115

122

145

Despus 135

110

131

142

105

130

131

110

125

149

En estas condiciones hay un par de ndices de eficiencia para cada miembro del
grupo, antes y despus del curso,; ste conjunto de pares es lo que se denomina
muestra por pares. La prueba de hiptesis que se realiza para determinar si hay
diferencia entre los ndices antes y despus del curso de nivelacin, es lo que
denomina prueba de diferencia por pares. Obsrvese que las dos muestras, una
antes y una despus, dependen entre s, debido a que los mismos alumnos estn
en ambas pruebas, por tanto son dependientes.
La muestra est constituida por la diferencia entre los registros de puntuacin
antes y despus del programa. As, la media de las diferencias entre los registros
de rendimiento, se designa mediante d . Se presenta a continuacin el
procedimiento de la prueba:

Paso 1: Planteamiento de hiptesis

Ho : d 0
H1 : d 0
La hiptesis nula plantea que no hay diferencia de eficiencia despus del curso. La
hiptesis alternativa plantea que el programa de nivelacin mejor el nivel de los
estudiantes.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

42

Paso 2: Nivel de significancia


Se usa un nivel de significancia del 5%, la muestra seleccionada es de 10
estudiantes considerada pequea muestra, la distribucin de probabilidad a utilizar
es la t student, con n 1 grados de libertad.
Paso 3: Estadstico de prueba (o calculado)
El estadstico de prueba a utilizar es:

d
Sd
n

Ecuacin No.10

Dnde:
d : es la media de la diferencia entre las observaciones por pares.

S d : es la desviacin estndar de las diferencias entre las

observaciones por

pares.
n: es el nmero de observaciones por pares.
G.L: son los grados de libertad (n 1)
Para determinar el clculo del estadstico de prueba se requiere conocer la media
de las diferencias y su desviacin estndar, para lo cual procedemos a su clculo
utilizando el siguiente cuadro:
Tabla No. 7. Calculo estadstico sobre diferencia de medias

Muestra
1
2
3
4
5
6
7
8
9
10
Sumas

Registro
antes
128
105
119
140
98
123
127
115
122
145

Registro
despus
135
110
131
142
105
130
131
110
125
149

Diferencia
d
7
5
12
2
7
7
4
-5
3
4
46

Diferencia al
cuadrado
49
25
144
4
49
49
16
25
9
16
386

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

43

d 46 4.60
n

10

d
d n

Sd

n 1

386

462

10
10 1

4.40

Aplicando la frmula, se obtiene:

d
4.6

3.30
Sd
4.4
n
10

Paso 4: Estadstico terico (o tabulado) y regla de decisin


El valor crtico de t para esta prueba de una cola a la derecha, es 1.833 que se
obtiene en la tabla de la distribucin t (anexo D), ubicando en la columna de la
izquierda 9 grados de libertad y recorriendo a la derecha hasta la columna de una
cola con 0.05 nivel de significancia. En la siguiente grfica se indica lo expuesto:

Grfico No. 16. Prueba unilateral superior (cola derecha). Prueba de hiptesis por pares

Paso 5: Tomar la Decisin


Como el valor t (3.30) est en la regin de rechazo de la hiptesis nula, entonces
se acepta la hiptesis alternativa y se concluye que el programa de adiestramiento
para los alumnos fue eficaz para aumenta su eficiencia.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

44

Leccin 20: Pruebas para la varianza


20.

Pruebas de hiptesis para la varianza

Como su nombre lo indica, consiste en comparar tres o ms medias de una


muestra para identificar su homogeneidad o variabilidad. esta tcnica estadstica,
normalmente es utilizada para analizar resultados en la investigacin con diseos
experimentales y cuasi-experimentales; muchas veces necesitamos comparar dos
o ms distribuciones que corresponden a variaciones de una misma variable
dependiente, afectada por una o ms variables independientes.

Comparacin de dos varianzas poblacionales


Su utilidad radica en determinar si una poblacin normal tiene ms variacin que
otra poblacin que se considera tambin normal. Como ejemplo se pueden
mencionar, si dos mquinas dedicadas a producir cierto artculo de precisin
pueden ser confiables en el control de calidad, es decir, el producto tiene el mismo
largor, el mismo dimetro y las variaciones presentadas son similares.

Ejemplo
La tasa media de rendimiento de dos tipos de acciones se puede apreciar en el
siguiente cuadro, se desea saber si el rendimiento promedio es diferente a un nivel
de significancia del 0.10.
Tabla No. 8. Tasa de rendimiento de las acciones

Acciones

Rendimiento
promedio

Desviacin
estndar

Tamao de la
muestra

Tipo A

56

12

Tipo B

58

Paso 1: Planteamiento de hiptesis


Ho : 12 22
H1 : 12 22

La variacin de los rendimientos promedios de las acciones es igual como la


hiptesis nula. La variacin de los rendimientos de las acciones es diferente como

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

45

hiptesis alternativa.
Paso 2: Nivel de significancia
Se selecciona un nivel de significancia de 0.01 utilizando la distribucin F.
Paso 3: Estadstico de prueba (o calculado)
El valor del estadstico de prueba sigue una distribucin F, con la siguiente
relacin:

S12 122
F 2 2 5.76
S2
5
Se acostumbra a colocar el mayor valor en el numerador, de tal forma que la
relacin siempre ser por lo menos igual a uno.
Paso 4: Estadstico terico (o tabulado) y regla de decisin
El valor crtico se obtiene del Anexo F, para lo cual se reproduce una parte de la
tabla. Debido a que utiliza una prueba de dos colas, el nivel de significancia para
cada cola ser de:

0.10 0.05
.
2
2
Grados de libertad para el numerador: n 1 = 7-1 = 6
Grados de libertad para el denominador: n 1 = 8 1 = 7
Para encontrar el valor crtico, se incorpora parte de la tabla F:

Tabla No. 9. Grados libertad numerador denominador


GRADOS LIBERTAD NUMERADOR
G.L
5
6
7
8
Denominador
1
2
3
4
5
6
7
8
9
10

230
19.3
9.01
6.26
5.05
4.39
3.97
3.69
3.48
3.33

234
19.3
8.94
6.16
4.95
4.28
3.87
3.58
3.37
3.22

2.7
19.4
8.89
6.09
4.88
4.21
3.79
3.50
3.29
3.14

239
19.4
8.85
6.04
4.82
4.15
3.73
3.44
3.23
3.07

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

46

Paso 5: Tomar la Decisin


Dado que el valor de la distribucin F (5.76) se encuentra a la derecha del valor
crtico (3.87), se acepta la hiptesis alternativa y se concluye que los rendimientos
promedios de las acciones son diferentes.

Ejercicios propuestos
A continuacin se proponen dos ejercicios para que los desarrolle aplicando las
sugerencias propuestas:
1. Se lanza una moneda 200 veces y se obtienen 105 caras. Si el nivel de
significancia es de 1% probar la hiptesis que la probabilidad de caras es de
contra la hiptesis:
a.
b.
c.

Que es mayor de .
Que es menor de .
Que es diferente de .

Sugerencia: En este caso utilice las propiedades de la distribucin binomial donde:

np 200 1 2 100

n p q 2001 2 1 2 7.07

X n p
n p q

2. Un fabricante de un empaque para harinas garantiza que tiene una efectividad


de 95% en la proteccin contra la humedad durante un perodo de 6 meses. Se
observ una muestra de 100 paquetes encontrndose resultados positivos en
85 paquetes. Comprobar si la afirmacin del fabricante es verdadera con un
nivel de significancia de 0.05.
Sugerencia: Utilizar prueba de una proporcin.
3. Un fabricante de pastas alimenticias sostiene que el contenido medio de
protenas del producto es de 10.7. Un anlisis de una muestra de 8 paquetes
dio como resultado un contenido medio de 10% con una desviacin de 1. Se
puede aceptar como verdadera la afirmacin del fabricante a un nivel de 0.01?
Sugerencia:
Utilizar el siguiente estadstico de prueba: t

X
S
n

Un ensayo unilateral con cola a la izquierda con un nivel significativo de 0.01 el


valor crtico con 7 grados de libertad es igual a 3.0

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

47

CAPITULO CINCO: ANLISIS DE VARIANZA


Introduccin.
En esta unidad se prosigue con el anlisis de pruebas de hiptesis. Recuerde que
en captulo anterior se examin la teora general de la prueba de hiptesis y se
describi el caso en el que fue seleccionada una muestra grande a partir de la
poblacin. Se emple la distribucin Z como base para determinar si es razonable
concluir que una media calculada a partir de una muestra, proviene de una
poblacin hipottica. Adems se prob si dos medias muestrales provienen de
poblaciones iguales. Tambin se efectuaron pruebas de una y dos muestras para
relaciones proporcionales utilizando la distribucin normal como entidad
estadstica de prueba. Se utiliz la distribucin t como entidad estadstica de
prueba para muestras pequeas (con menos de 30 observaciones)
Cuando se desea conocer la homogeneidad que existe entre tres o ms medias
muestrales, se procede a determinar la variabilidad entre esas medias, tcnica que
se conoce como anlisis de varianza. Es decir, cuando productos o individuos
son sometidos a tratamientos determinados para ver cmo stos influyen en
resultados o comportamientos, lo ms aconsejable es utilizar la tcnica de anlisis
de varianza.
El objetivo del anlisis de varianza es determinar cules son las variables
independientes de importancia en un estudio, y en qu forma interactan y afectan
la respuesta.
El Anlisis de varianza en el
siguiente forma.

presente capitulo se encuentra dividido de la

ANALISIS DE
VARANIZA

De un Factor

De dos Factores

Con interaccin

Grfico No. 17. ANOVA

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

48

Objetivo general.
Reconocer la importancia principios en que se basa y campos de aplicacin de la
tcnica de Anlisis de Varianza.

Objetivos especficos.
Comprender la nocin general del anlisis de varianza.
Realizar una prueba de hiptesis para determinar si dos varianzas
muestrales provienen de poblaciones iguales.
Probar e interpretar hiptesis aplicando el anlisis simple de varianza.
Establecer y organizar datos en una tabla de ANOVA de una y de dos
direcciones.
Plantear, probar e interpretar hiptesis de anlisis de varianza de dos
factores de diseo de bloque aleatorizado.
Plantear, probar e interpretar hiptesis de anlisis de varianza de dos
factores con interaccin o diseo de factorial.
Definir los trminos tratamientos y bloques.
Dar a conocer el manejo de la herramienta de Anlisis de varianza en
Excel.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

49

Leccin 21: Generalidades


Como su nombre lo indica, el ANALISIS DE VARIANZA, se utiliza para probar
hiptesis sobre la igualdad de tres o ms medias poblacionales. Al comparar las
varianzas muestrales, es posible sacar una conclusin o inferencia sobre los
valores relativos de las medias poblacionales.

21.

Comparacin de ms de dos poblaciones

Del anlisis de varianza, podemos decir que esta tcnica estadstica normalmente
es utilizada para analizar resultados en la investigacin con diseos
experimentales y cuasi-experimentales; muchas veces necesitamos comparar dos
o ms distribuciones que corresponden a variaciones de una misma variable
dependiente, afectada por una o ms variables independientes.

El anlisis de varianza estudia la relacin entre una variable cualitativa (o variable


independiente) con ms de dos categoras y una variable cuantitativa (o variable
dependiente).

Ejemplo

Un agrnomo desea estudiar el rendimiento (en libras) de cuatro variedades


diferentes de calabacitas.
La variable cualitativa es el factor de este experimento, que en este caso es la
variedad de calabacita, los niveles son cada una de las cuatro variedades. Y la
variable cuantitativa es el rendimiento (en libras).

El factor corresponde a la variable cualitativa y los niveles a las


categoras de esa variable

El anlisis de varianza tiene como objetivo identificar, si hay evidencia de una


diferencia significativa entre los niveles, basados en las medias muestrales.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

50

21.1. Variabilidad producto de factores controlables e incontrolables


Tericamente es posible dividir la variabilidad del resultado de un experimento en
dos partes: la originada por factores o tratamientos que influyen directamente en el
resultado del experimento, y la producida por el resto de factores desconocidos o
no controlables, que se conoce con el nombre de error experimental. En el
ejemplo anterior los factores desconocidos pueden ser: la humedad, la
temperatura y plagas entre otros.

21.2. Tipos de modelos


Modelo de efectos fijos: Un modelo de anlisis de varianza es de efectos
fijos cuando los resultados obtenidos slo son vlidos para esos determinados
niveles del factor estudiado y lo que ocurra a otros niveles del factor puede ser
diferente.
Modelo de efectos aleatorios: Un modelo de anlisis de varianza es de
efectos aleatorios cuando los resultados obtenidos son vlidos para cualquier
nivel del factor estudiado.
Modelo replicado: Un modelo es replicado si el experimento se repite varias
veces para cada nivel del factor; en caso contrario se dice que el modelo es
por unidad de casilla.

21.3. Supuestos Del Anlisis De Varianza


Para cada poblacin la variable de respuesta est normalmente distribuida.
La varianza de la variable respuesta es la misma para todas las
poblaciones.
Las observaciones deben ser independientes.

Leccin 22. Anlisis de Varianza de un Factor


El anlisis de varianza simple se presenta cuando se tiene un solo factor
estudiado en sus distintos niveles que influyen sobre una variable respuesta que
mide el resultado del experimento, y el resto de los factores conforman el error
experimental influyendo sobre la variable respuesta de manera no controlable. El
factor se presenta con j niveles, y dentro de cada nivel se analiza una serie de
observaciones del experimento en control (unidades experimentales) y su efecto
sobre la variable respuesta, es decir, para cada nivel se repite el experimento
varias veces (replicacin).

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

51

El anlisis de varianza descompone la variabilidad del resultado de un


experimento en componentes independientes (variacin total descompuesta en
variaciones particulares).
Ejemplo
Se puede considerar los rendimientos de un mismo cultivo en parcelas diferentes,
que aunque labradas en las mismas condiciones, producen cosechas que son
distintas. La variabilidad de rendimientos es producida por factores o tratamientos
controlables (abono, riego, etc.), donde cada factor o tratamiento puede presentar
diferentes niveles (diferentes cantidades o calidades de abono, distinta intensidad
de riego); tambin puede ser producida por otros factores o tratamientos no
controlables (humedad relativa, clima, plagas, etc.).

Tabla No. 10. Observaciones por cada nivel

Nivel1
X11
X21
.
.
.
Xi1

Nivel 2
X12
X22
.
.
.
Xi2

Nivel j
X1j
X2j
.
.
.
Xij

X ij : Observacin i-sima de la variable respuesta relativa al j-simo nivel de


factor.
En el ejemplo anterior, X ij es el rendimiento obtenido (variable respuesta) bajo el
nivel j del factor (abono) en la observacin i-sima (Para cada nivel j de factor se
repite el clculo de rendimiento
veces para recoger el efecto del error
experimental).
: Tamao de la muestra para cada nivel (categoras de la variable cualitativa)

En esta seccin se considera el anlisis de varianza de un solo factor, en el cual


solo interviene en el experimento un solo tipo de tratamiento. Cuando se desea
contrastar las hiptesis sobre la diferencia global entre tres o ms medias de
poblacin, se aplica la distribucin de probabilidad F encontrando en cociente de

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

52

dos varianzas calculadas a partir de los datos experimentales. El modelo lineal en


que se basa el mtodo de anlisis de varianza de un solo factor es:

X iJ i ij
Ecuacin No.11

Dnde:
Es la i-sima observacin del j-simo nivel experimental.
La media de todas las observaciones de todas las poblaciones j del tratamiento. Es
una constante.
Efecto del tratamiento en la poblacin j. Son variables aleatorias independientes.
Error aleatorio asociado a la i-sima observacin del factor de la poblacin j

El efecto i del tratamiento o factor es la diferencia entre la gran media y la media

J de la poblacin en tratamiento J, esto es:

i J .
Ecuacin No.12

Por consiguiente, si hay J tratamientos en un experimento, la suma de todos los J


efectos de los tratamientos debe ser igual a cero:
J

J 1

J 1

J 1

i J J J 0
Ecuacin No.13

El ltimo trmino iK refleja la variabilidad dentro de cada una de las poblaciones


en tratamiento, y su presencia se atribuye al proceso aleatorio, y se interpreta
como lo resultante de la diferencia entre el resultado observado y la media de la
poblacin del tratamiento:

iJ X ij j
Ecuacin No.14

El valor esperado o la esperanza de ij es igual a cero.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

53

El modelo se basa en las siguientes suposiciones:


Admite que los errores aleatorios ij tienen una distribucin normal
para cada poblacin en tratamiento J.
Admite que los errores iJ se distribuyen independientemente tanto
entre poblaciones en tratamiento como dentro de ellas.
Acepta que la varianza 2 del error permanece constante para cada
una de las poblaciones.
Hiptesis del ANOVA de un factor.
El anlisis de varianza se usa para probar la igualdad de K medias poblacionales
y la forma general del planteamiento de las hiptesis es:

Dnde: j = Media de la j-sima poblacin.


La media general de las muestra, est representada por X , y es la suma de todas
las observaciones divida entre la cantidad total de las mismas, expresada de la
siguiente forma:
Media General:
K

nj

X
j 1 i 1

ij

nt

Ecuacin No.15

Dnde: nt n1 n2 ... nK

Si el tamao de cada muestra es n, nT kn , la ecuacin de la media general se


reduce a:
K

nj

X ij
j 1 i 1

nt

nj

X ij

j 1 i 1

X
j 1

Ecuacin No.16

En otras palabras, cuando los tamaos de muestra son iguales, la media general
muestral es justamente el promedio de las medias de las K muestras.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

54

Si supone que se ha tomado una muestra aleatoria simple de tamao n j de cada


una de las K poblaciones, se tiene:

X ij es la i-sima observacin del grupo, nivel j.


n j es el nmero de observaciones del grupo, nivel j.

es el total del nmero de observaciones en todos los grupos combinados.

K Es el nmero total de grupos, niveles del factor de inters.

X j Media de la muestra del j - simo tratamiento.

Pasos para la Realizar un anlisis de varianza.


1. Establecer la hiptesis nula y alterna.

2. Establecer el nivel de significancia


3. Realizar el ANOVA
4. Calcular el valor F o el valor crtico correspondiente al nivel de confianza
fijado con los grados de libertad.
5. Hallar el estadstico de prueba
6. Tomar la decisin teniendo en cuenta que:
A
Rechaza H0 si Valor crtico
B

Grfico No. 18. Distribucin F.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

55

Ejemplo 1
Suponga que una empresa tiene tres dependencias diferentes en donde produce
tubos de iluminacin, y desea verificar el control de calidad en cuanto a duracin
se refiere de las bombillas, y para ello toma una muestra de 6 unidades de cada
factora y las somete a desgaste hasta que dejan de iluminar con los siguientes
resultados en horas:

Tabla No. 11. Observaciones por cada nivel

Observacin Planta 1 Planta 2 Planta 3 Total


1
85
71
59
2
75
75
64
3
82
73
62
4
76
74
69
5
71
69
75
6
85
82
67
79
74
66
73
X
J

34

20

32

5.83

4.47

5.66

18

474

444

396

1314

2
J

S
SJ
nJ
n

X
J !

iJ

La media general es igual a:


3

X
J 1

nJ

79 74 66 219

73
18
3

Se observa que se obtienen las medias para cada tratamiento (79, 74 y 66) y una
media general (73). Para llevar a cabo la prueba de la igualdad de las medias de
la poblacin, se subdivide la variacin total en dos mediciones:
Diferencia entre los grupos.
Diferencia dentro de los grupos.
La varianza de la muestra total se particiona en la varianza dentro de las plantas y
la varianza entre las plantas, tal como se indica en el siguiente grfico:
Variacin
Total (VT)

Grfico No. 18. Distribucin F.

Variacin Dentro
del Grupo (VDG)

Variacin Entre
Grupo (VEG)

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

Variacin total (VT)


k

VT X ij X
j 1 i 1

J 1

i 1

Ecuacin No.17

VT

56

ij

85 73 75 73 ... 71 73 75 73 ...
2

59 732 64 732 946

Variacin dentro del grupo (VDG)


k

VDG X ij X j

j 1 i 1

Ecuacin No.18

85 79 75 79 ... 71 742 75 742 ...


VDG
2
2
j 1 I 1 59 66 64 66 .... 430
3

Variacin entre grupos (VEG)


K

VEG n j X j X
j 1

VEG n6 X X
J 1

Ecuacin No.19

679 73 674 73 666 73 516


2

Se debe comprobar que la variacin total sea igual a la sumatoria de la variacin


entre y dentro de los grupos.
Puesto que K es el total de niveles comparados, existen (K-1) grados de libertad
asociados con la suma de cuadrados entre los grupos, niveles o tratamientos.
Como cada uno de los K niveles contribuye con ( n j 1 ) grados de libertad, existen
(nk) grados de libertad asociados con la suma de cuadrados dentro de los
grupos.
Si cada suma de cuadrados se divide entre sus grados de libertad asociados, se
obtienen tras varianzas o trminos cuadrticos medios, como se indica en el

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

57

siguiente cuadro:
Tabla No. 12. Componentes del anlisis de varianza
Variacin
Entre tratamiento

Suma cuadrados
K

n
j 1

Dentro o error

X
k

X
j 1 i 1

Total

X j

ij

j 1 i 1

ij

Grados libertad
(K-1)

Cuadrado medio

(n-K)

VDT
B
n k

(n-1)

VT
n 1

Distribucin F

VET
A
K 1

A
B

Los resultados para el problema de anlisis es el siguiente:


Tabla No. 13. Resultados del anlisis de varianza
Variacin

Suma cuadrados

Entre
tratamiento

516

Grados
libertad
(K-1)= 2

Dentro o error

430

(n-K)=15

Total

946

(n-1)=17

Cuadrado
medio

Distribucin
F

516
258.00
2
430
28.67
15

258
8.99
28.67

En la Tabla de Distribucin F se determina el correspondiente valor crtico para el


numerador (k-1= 3-1=2) y el denominador (n-K = 18-3=15), con una probabilidad
de error tipo 1 o un nivel de significancia del 5%, que corresponde a F0.05 3.68 ,
significando que si se tuviera que seleccionar un valor al azar de una distribucin F
con 2 grados de libertad en el numerador y 15 en el denominador, slo el 5% de
las veces se obtendra un valor mayor que 3.68. Adems la teora del anlisis del
varianza indica que si es cierta la hiptesis nula, la relacin entre los cuadrados
medios entre y dentro de los tratamientos sera un valor dentro de esa distribucin,
tal que se rechaza si, el valor de dicha relacin es mayor que el valor crtico:
El valor de la relacin es superior al valor crtico, por tal razn se rechaza la
hiptesis nula consistente en que las medias poblacionales sean iguales.

Rechaza H0 si

A
Valor crtico
B

Para el caso la relacin es igual a 8.99 mayor que el valor crtico 3.68, entonces se
tienen pruebas suficientes para rechazar la hiptesis nula consistente en que las

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

58

medias de las tres poblaciones son iguales. En otras palabras el anlisis de


varianza apoya la conclusin que las medias para la duracin de las bombillas es
diferente en las tres plantas.
El grfico para dicho planteamiento es el siguiente:

Grfico No. 19. Distribucin F.

Ejemplo: Anlisis de varianza

Suponga que dispone de un conjunto de rboles clasificados por altura (en


metros) y por especie, segn los siguientes datos:

Tabla No. 14. Altura de rboles segn especies


Especie
Altura
Especie

Altura

Especie

Altura

8.52

8.52

8.13

6.45

6.43

7.17

7.41

6.21

8.40

7.15

7.07

8.87

8.73

8.83

6.12

7.55

8.53

8.91

6.54

7.84

8.81

7.74

8.59

7.40

8.65

7.41

8.19

8.81

8.94

8.56

Para ajustar la informacin a un modelo de anlisis de varianza, se considera


como variable respuesta la altura de los rboles en metros, y como nico factor la
variable cualitativa especie con cinco niveles (A, B, C, D, E). Dado que se tiene un

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

59

modelo de un solo factor, se desea probar si las variadas especies de rboles


tienen igual o diferente promedio de altura con un nivel de significancia del 1%.
Primero se estiman las medias para cada una de las especies y la media total,
conforme al siguiente cuadro:
Tabla No. 15. Registro de estadsticos para diferentes especies

Especie A Especie B Especie C Especie D Especie E Total


8.52
7.15
6.43
6.21
8.13
6.12

Sumas
Promedio
Observaciones

6.45
8.73
8.52
8.83
8.53
8.94
8.40
8.91
8.19
8.56
84.06
8.406
10

42.56
7.093
6

7.41
8.65
8.81
8.59
8.87
8.81

7.55
7.74
7.84
7.41
7.40

6.54
7.07
7.17

51.14
8.523
6

37.94
7.588
5

20.78
6.926
3

236.48
7.707
30

Gran media =
nj

ij

j 1 i 1

nt

8.52 7.15 ... 6.45 8.76 ... 7.41 8.65 ... .... 236.48

7.882666
30
30

Variacin total (VT) =

X
k

j 1 i 1

8.52 7.88 ... 6.12 7.88 ... 7.07 7.88 7.17 7.88
2

ij

24.0741867

Variacin dentro del grupo (VDG) =

X
k

j 1 i 1

X j

ij

8.52 7.09 ... 6.45 8.406 ... 7.41 8.523 .... 7.17 6.926

11.9584533

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

60

Variacin entre grupos (VEG) =


K

n
j 1

7.093 7.88 8.406 7.88 .... 6.926 7.88


2

12.1157333

Para calcular el estadstico de prueba perteneciente a la distribucin F , se resume


en el siguiente cuadro:
Tabla No. 16. Clculos del cuadro de anlisis de varianza
Variacin
Entre tratamiento
Dentro o error
Total

Suma cuadrados
12.1157333
11.9584533
24.0741867

Grados libertad
(K-1)= 4
(n-K)=25
(n-1)=29

Cuadrado medio
3.0289
0.4783

Distribucin F
6.332

En la tabla F determina el correspondiente valor crtico para el numerador (k-1=


5-1=4) y el denominador (n-K = 30-5=25), con una probabilidad de error tipo 1 o un
nivel de significancia del 1%, que corresponde a F0.01 4.18 . Para el caso la
relacin es igual a 6.332 mayor que el valor crtico 4.18, entonces se tienen
pruebas suficientes para rechazar la hiptesis nula consistente en que las medias
de las cinco variedades de rboles son iguales. En otras palabras el anlisis de
varianza apoya la conclusin que las medias para la altura de las diferentes
especies de rboles es diferente.

Leccin 23.
Posteriori)

Comparacin Mltiple de Medias (Pruebas a

Las pruebas "a posteriori" son un conjunto de pruebas para probar todas las
posibles medias que podra ser diferente al rechazar la hiptesis.
Existen varias, (Duncan, Newman-Keuls, LSD): todas ellas muy parecidas. Usan el
rango (diferencia entre medias) de todos los pares de muestras como estadstico y
dicho rango debe superar un cierto valor llamado mnimo rango significativo para
considerar la diferencia significativa.
La principal diferencia con respecto a la t-student radica en que usan MSE como
estimador de la varianza, es decir un estimador basado en todas las muestras.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

61

Leccin 24. Anlisis de varianza con dos factores (diseo de


bloques aleatorizados).
Con frecuencia interesa analizar los efectos de dos tipos de factores o
tratamientos. Suponga que un experimento incluye dos tipos de factores: el uno
llamado C (lo que sugiere columna) consistente en K tratamientos diferentes, y el
otro, denominado F (lo que sugiere fila) consistente en J tratamientos diferentes.
Se admite que respecto al j-simo tratamiento de F y el K-simo tratamiento de C,
existen cuatro componentes as:

X ijK i j ijk
Ecuacin No.20

Dnde:

La varianza total de la muestra se particiona en la varianza entre las filas, varianza


entre columnas, varianzas entre la j x k, y las varianzas del error aleatorio. Para
este modelo, los clculos del anlisis de la varianza para las sumas de los
cuadrados son idnticos a los realizados en el modelo de un solo factor, tan solo
que se calculan variaciones para el factor de fila, de columna y para el error
aleatorio. De manera anloga, los grados de libertad y los cuadrados medios son
los mismos. A continuacin se indica el cuadro resumen para el anlisis de
varianza de dos factores:
Tabla No. 17. Anlisis de varianza para dos factores
Fuente de
variacin
Entre los grupos
o columnas (j)

Suma de los cuadrados, SC

Entre los bloques


o filas (i)

VEF c X i. X

i 11

Error de
muestreo, E

VE X ij X . j X i. X

Total, T

VT X ij X

j 1 i 1

VEC r X . j X

j 1
r

j 1 i 1

r 1

Grados
de Media cuadrtica, Relacin F
Libertad, gl
MC
MCA
VEC
c 1
F
MCA
MCE
c 1

r 1c 1
rc 1

MCB

VEF
r 1

MCE

VE
r 1c 1

MCB
MCE

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

62

La definicin de los trminos del cuadro son los siguientes:


X ij Valor del bloque i - simo para el tratamiento del grupo i - simo.
X i La media de todos los valores en el bloque i.
X j La media de todos los valores para el tratamiento del grupo j.
c

X
j 1 i 1

ij

X La sumatoria de los valores de todos los bloques y de todos los grupos,

equivalent e al gran total.


r El nmero de bloques.
c El nmero de grupos.
n Nmero total de observacio nes.

Para contrastar los efectos de los factores en el modelo, se construye un


estadstico que se compara los cuadrados medios, que bajo la hiptesis nula sigue
una distribucin F.
Ejemplo

Suponga que existen cuatro parcelas diferentes las cuales son sometidas
sucesivamente a seis tipos de insumos y se piensa que la produccin es afectada
por el tipo de insumo y mantenimiento a que es sometida. Se desea probar los
diferentes tratamientos afectan la produccin por parcela, y la produccin es la
siguiente:
Tabla No. 19. Rendimientos en kilos por parcela

Tratamiento

RENDIMIENTO EL KILOS
Parcela 1

Parcela 2

Parcela 3

Parcela 4

Total

Medias

A
B
C
D
E
F

70
77
76
80
84
78

61
75
67
63
66
68

82
88
90
96
92
98

74
76
80
76
84
86

287
316
313
315
326
330

71.75
79.00
78.25
78.75
81.50
82.50

Totales
Medias

465
77.50

400
66.67

546
91.00

476
79.33

1.887
78.625

Los totales por grupo (parcelas) y sus correspondientes promedios, los totales y
los promedios por tratamientos o bloques (insumo y manteniendo), as como la
gran media se indican en el cuadro.
Adems de las estadsticas representadas en el cuadro, se tiene:
r 6;

c 4;

n rc 24

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA
c

63

X
j 1 i 1

ij

rc

1.887
78,625
24

Para determinar los resultados del experimento de diseos de bloques


aleatorizados con fines ilustrativos, se hacen los siguientes clculos:
Variacin Total de Cuadrados:
c

VT X ij X
j 1 i 1

70 78,625 77 78,625 ... 86 78,625 2.295,63


2

Variacin entre grupos o columnas:


C

VEC r X . j X
j 1

Ecuacin No.21

6 77.5 78,625 66.67 78,625 ... 79.33 78,625 1.787,46

Variacin entre bloques o filas:


r

VEF c X i. X
i 11

Ecuacin No.22

VEF 4 71.75 78,625 79 78,625 ... 82.5 78,625 238,38


2

Variacin del error de muestreo:


c

VE X ij X . j X i. X
j 1 i 1

Ecuacin No.23

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

64

VE 70 77.5 71.75 78,625


2

77 77.50 79.00 78,6252

.
.
86 - 79.33 - 82.50 78,625
244.79

Los medios o promedios cuadrticos, se calculan as:

MCA

VEC 1.787,46

595,82
c 1
4 1

MCB

VEF 283.38

56,676
r 1
6 1

MCE

VE
224.79
224.79

14,986
r 1c 1 6 14 1
15

Los clculos anteriores se pueden resumir en el siguiente cuadro:


Tabla No. 20. Resultados del anlisis de varianza para dos factores
Fuente
Suma
de Grados
Cuadrado
medio
cuadrados
libertad
(varianza)
Entre grupos
1.787.46
VEC
1.787.46
4-1=3
3
595,820
Entre
283.38
VEF
Bloques
283.38
6-1=5
5
56,676
Error

Total

224.79

(6-1)(4-1)=15

2.295.63

(6)(4)-1=23

224.79
15
14,986

VE

595.82
14,986
39,758
56,676
F
14,986
3,782
F

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

65

Adems de los registros anteriores, en las tablas ANOVA de los diferentes


paquetes de software estadsticos, incluyen el p-valor que consiste en la
probabilidad de obtener un estadstico F igual o mayor a la obtenida dado que la
hiptesis nula sea verdadera, es decir, si el p- valor es menor que el nivel
especificado de significancia , la hiptesis nula es rechazada. Para nuestro caso
se utiliza la informacin contenida en el cuadro anterior.
Si se desea probar las diferencias entre los rendimientos de las parcelas con un
nivel de significancia del 5%, la regla de decisin consiste en rechazar la hiptesis
nula H o : 1 2 3 4 si el valor F calculado es mayor que 3.29 (Ver tabla F
con 3 grados de libertad en el numerador y 15 grados en el denominador). Para el
caso F = 39,758 es mayor que el valor crtico 3.29, entonces se rechaza la
hiptesis nula y se llega a la conclusin que existe evidencia de una diferencia
entre la produccin promedio de las diferentes parcelas, como se puede apreciar
en el siguiente grfico:

Grfico No. 20. Regin de aceptacin de hiptesis

Como una verificacin de la efectividad de la utilizacin de insumos, se puede


probar la diferencia de efectividad de los diferentes insumos aplicados. La regla de
decisin utilizando un nivel de significancia del 5%, sera la de rechazar la
hiptesis nula H o : 1 2 3 4 5 6 si el valor F calculado excede a
2.90 (Ver anexo F con 5 grados de libertad en el numerados y 15 grados en el
denominador). Para el caso el valor F = 3,782 es mayor al valor crtico, lo que se
concluye que la utilizacin de los diferentes insumos, produce diferencia
significativa entre los promedios de produccin para las parcelas, y que la
conformacin de dichos bloques es ventajosa para reducir el error experimental,
situacin que se presenta en el siguiente grfico:

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

66

Grfico No. 21. Regin de aceptacin de hiptesis

Leccin 25. Anlisis de varianza de dos factores con interaccin.


(Diseo factorial).
Se ha visto hasta ahora el anlisis de varianza de una direccin o el modelo de
diseo completamente aleatorizado, despus el modelo de diseo de bloque
aleatorizado, y en la presente seccin el anlisis de varianza de dos factores con
interaccin.
Con el propsito de desarrollar el procedimiento de la prueba F, se define a
continuacin los siguientes trminos:
X ijk Valor de la k - sima observaci n del nivel i del factor A t del nivel j del factor B.
X ij Suma de los valores de la celda ij (las observacio nes del nivel i del factor A y del nivel j del factor B.
X i.. Suma de los valores de la hilera i del factor A.
X.j. Suma de los valores de la columna j del factor B.
GT Gran total de todos los valores en todas las hileras y columnas.
r Nmero de niveles del factor A.
c Nmero de niveles del factor B.
n ' Nmero de valores(replicas) para cada celda.
n Nmero total de observacio nes del experiment o (con n r.c.n '

Con fines ilustrativos se hacen planteamientos tanto conceptuales como de


clculos para la descomposicin de la variacin total necesaria para el desarrollo
del procedimiento de la prueba F. Debido a la gran cantidad de clculos se
recomienda que dicho proceso sea llevado por el paquete de software analizado

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

67

ms adelante.
Tabla resumen para el anlisis de varianzas de dos vas con ms de una
observacin por clula se resume en el siguiente cuadro:

Tabla No. 21. Resumen de anlisis de varianza de dos vas


Fuente de
variacin
Entre grupos
de tratamiento
A
Entre grupos
de
tratamiento, B
Interaccin
entre factores
A y B.

Suma de los cuadrados,


SC
2
r
X 2 GT
VEGA i..'
rcn'
i 1 cn

X .2j .

j 1

rn'

VEAB
i 1 j 1

X .2j .

j 1

rn'

Error
de
muestreo, E

VEGB

n'

rcn'
r

i 1

X i2..
cn '

rcn'
r

VE X ijk2
i 1 j 01 k 1

Total, T

X ij2

GT 2

Media
MC

c 1

VEGA
r 1
BEGB
MCB
c 1
VEABI
MCC
r 1c 1

r 1

cuadrtica,

MCA

r 1c 1

Relacin F

MCA
MCE
MCB
F
MCE
MCI
F
MCE
F

GT 2
n'

Grados
de
libertad, gl

n'

i 1 j 1

VT X ijk2
i 1 J 1 K 1

X ij2.
n

'

GT 2

rc n' 1

MCE

VE
rcn' 1

rcn' 1

rcn'

Ejemplo

Para ilustrar el modelo factorial de dos factores, suponga que UD como dueo y
propietario de una cadena de supermercados est interesado en saber el efecto
de la colocacin de los estantes en la venta de un producto. Para ello estudia 4
posibles lugares distintos donde colocar los estantes: Colocacin normal entre el
pasillo(A), colocacin ingreso del pasillo (B), colocacin a la entrada del pasillo con
impulsadora (C) y colocacin normal con propaganda (D). Se toman ventas
aleatorias en las jornadas de la maana, tarde y noche y los resultados de las
ventas semanales se resumen en la siguiente tabla:

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA
Tabla No. 22. Colocacin de productos en un estantes durante jornadas

JORNADA

COLOCACIN ESTANTE
A
B
45
56
50
63
57
69
65
78
70
75
78
82
365
423
60.83
70.50

Maana
Tarde
Noche
Totales
Medias

C
65
71
73
80
82
89
460
76.67

D
48
53
60
57
71
75
364
60.67

Totales
451

Medias
56,375

539

67,375

622

77,750

1.612
67,167

Se tiene la siguiente informacin:


r 3
c4

X 1.. 451

n' 2

X 3.. 622

X 2.. 539

X .1. 365

X 11. 95

X 21. 122

X 31. 148

X .2. 423

X 12. 119

X 22. 147

X 31. 157

X .3. 460

X 13. 136

X 23. 153

X 33. 171

X .4. 364

X 14. 101

X 24. 117

X 34. 146

GT 1.612
r

n'

X
i 1 j 1 k 1

2
ijk

452 502 ... 752 111.550

X i2.. 4512 5392 6222

110.100,75

'
42
i 1 cn
r

j 1

3652 4232 4602 3642

109.375
32
rn'

X .2j .

i 1 j 1

GT 2
rcn'

X ij2.
n'

952 1192 ... 1462


111.292
2

1.6122
108.272.66
342

68

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

Variacin Total de Cuadrados:


r

n'

VT X ijk2
i 1 J 1 K 1

GT 2
rcn'

111.550 108.272.66 3.277.34

Variacin entre grupos del tratamiento A:

X i2.. GT
VEGA '
110.100.75 108.272.66 1.828.09
rcn'
i 1 cn
2

Variacin entre grupos del tratamiento B:


c

X .2j .

j 1

rn'

VEGB

GT 2
rcn'

109.375 108.272.66 1.102.34

Variacin entre los factores A y B:


r

VEAB
i 1 j 1

X ij2
n'

i 1

X i2.. c X . j . GT

cn ' j 1 rn'
rcn'
2

111.292 - 110.100.75 - 109.375 108.272.66 88.91

Variacin del error de muestreo:


r

n'

VT X ijk2
i 1 J 1 K 1

GT 2
rcn'

111.550 111.292 258

Para el clculo de las varianzas se utilizan las siguientes relaciones:

MCA

VEGA 1.828.09

914.045
r 1
3 1

MCB

BEGB 1.102.34

367.447
c 1
4 1

69

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

MCC

VEABI
88.91

14,818
r 1c 1 3 14 1

MCE

VE
258

21.5
'
rc n 1 342 1

70

Los clculos anteriores se resumen en el siguiente cuadro:


Tabla No. 23. Resumen de anlisis de varianza de dos vas
Fuente de variacin
Entre grupos de
tratamiento A
Entre grupos de
tratamiento, B
Interaccin entre
factores A y B.
Error de muestreo, E
Total, T

Suma de los
cuadrados, SC

Grados de libertad,
gl

Media
cuadrtica, MC

Relacin
F

1.828.09

3 1 2

914.045

42.51

1.102.34

4 1 3

367.447

17.09

14.818

0.69

88.91
258
3.277.34

3 14 1 6
342 1 12
342 1 23

21.5

Si utiliza un nivel de significancia del 0.05 y se prueba la diferencia entre las


ventas en las diferentes jornadas (maana, tarde, noche), la regla de decisin es
la rechazar la hiptesis nula ( H 0 : 1 2 ... r ) si el valor calculado para F
(42.51) es mayor que 3.49 (observar tabla F para 2 grados de libertad en el
numerador y 12 grados de libertad en el denominador); se rechaza la hiptesis
nula y se llega a la conclusin que existe evidencia que entre las diferentes
jornadas las ventas en promedio son diferentes.
As mismo si utiliza un nivel de significancia de 0.05 para probar si existe alguna
diferencia entre la ubicacin de los estantes, la regla de decisin es rechazar la
hiptesis nula ( H 0 : 1 2 ... c ), si el valor calculado F (17.09) es mayor que
3.49 (observar tabla F para 3 grados de libertad en el numerador y 12 grados de
libertad en el denominador); se rechaza la hiptesis nula y se concluye que existe
una diferencia entre los promedios de ventas para la colocacin de los diferentes
estantes en el almacn.
Finalmente se puede probar si existe algn efecto de interaccin entre el factor A
(ventas en las diferentes jornadas) y el factor B (colocacin de los estantes).
Utilizando un nivel de significancia del 5%, la regla de decisin es rechazar la
hiptesis nula ( ABij 0, para todo i y j ), si el valor calculado F (0.69) es mayor que
3.0 (observar tabla F para 6 grados de libertad en el numerador y 12 grados de

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

71

libertad en el denominador); no se rechaza la hiptesis nula y se concluye que no


existe evidencia de un efecto de interaccin entre las jornadas del da y la
colocacin de los estantes.

INTERPRETACIN DE LOS EFECTOS DE LA INTERACCIN


Se ha realizado hasta ahora las pruebas para la significacin del factor A, del
factor B y de la interaccin, corresponde entender en mejor forma el concepto de
interaccin, si se grafica las medias, empleando la siguiente frmula:
X ij

X ij
n'

95
47.5
2
119

2
136

2
101

50.5
2

122
2
147

2
153

2
117

148
74.0
2
157

78.5
2
171

85.5
2
146

73.0
2

X 11.

X 21.

61.0

X 31.

X 12.

X 22.

73.5

X 32.

76.5

X 33.

58.5

X 34.

X 13.
X 14.

X 23.
X 24.

Se procede a graficar las ventas semanales promedio de cada jornada y de cada


colocacin de la estantera, como se indica a continuacin:
Grfico No. 22. Ventas de producto en tres jornadas

Ventas

Ventas Jornada maana-tarde-noche


90
85
80
75
70
65
60
55
50
45
40

A
B
C
D

Maana

Tarde
Jornada

Noche

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

72

Las cuatro lneas representan las colocaciones de las estanteras aparecen


apuntando casi representando en la misma direccin, lo que significa que la
diferencia en las ventas entre las cuatro colocaciones de los estantes es
virtualmente la misma para las ventas de las diferentes jornadas. En otras
palabras, no existe interaccin entre los dos factores (jornada y estantera), como
claramente se evidenci en la prueba F vista anteriormente.
Cul es la interpretacin si se presenta el efecto de interaccin? En tal situacin,
algunos niveles del factor A responden mejor con ciertos niveles del factor B; por
ejemplo, suponga que algunas colocaciones en los estantes fueran mejor para las
jornadas. Si este fuera el caso, las lneas de la figura no estaran apuntando en la
misma direccin que las hace casi paralelas y el efecto de interaccin sera
estadsticamente significativo, y por consiguiente, las diferencias entre las
diferentes localizaciones de estantes no seran las mismas para las diferentes
jornadas.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

73

EJERCICIOS COMPLEMENTARIOS
1.
Un inspector de un distrito escolar quiere estudiar el ausentismo de los
profesores de diversos grados escolares. Se seleccionaron muestras aleatorias de
profesores en escuelas primarias, secundarias, y preparatorias, y el nmero de
das de ausencia el ao anterior fue como sigue:
Primaria
7
4
10
6
5

Secundaria
13
14
9
8
7
10

Preparatoria
7
2
6
9
9

Con un nivel de significancia de .025, determine si hay una diferencia en el


ausentismo entre los diversos grados.
2.
El propietario de una distribuidora de combustible pretende investigar la
rapidez con la cual le pagan sus facturas en tres reas suburbanas. Se
seleccionaron muestras de clientes en cada zona y se registr el nmero de das
entre la entrega y el pago de la factura, con los siguientes resultados:
rea 1
8
18
14
20
12
14
15
16

rea 2
10
16
28
25
7
17

rea 3
32
8
16
27
17
20
19
21
20

Con un nivel de significancia de .025, determine si hay una diferencia en la


rapidez con que pagan las facturas en estas tres reas.
3.
Un agrnomo desea estudiar el rendimiento (en libras) de cuatro variedades
diferentes de calabacitas. Se dividi una parcela en 16 lotes y se asignaron cuatro
lotes al azar a cada variedad. Los resultados del experimento (en libras) fueron

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

Calabacita
redonda
86
74
88
76

Calabacita
comn
40
48
54
46

Calabaza
alargada
30
36
42
34

74

Calabacita
rayada
48
54
42
56

Con un nivel de significancia de .01, determine si hay una diferencia en el


rendimiento de las diferentes variedades de calabacitas.
4.
Un distribuidor de automviles nuevos quiere estudiar la cantidad de dinero
aplicado a la compra de equipo opcional en automviles de tamao grande. Se
seleccion una muestra de 20 compras. Los sujetos se dividieron en las siguientes
clasificaciones por edades: 18-24, 25-29, 30-39, 40-59, 60 y ms. La cantidad de
equipo opcional comprado (en miles de pesos) se organiz en grupos de edad
como sigue:

18-24
6.31
4.27
5.75

25-29
7.64
5.36
3.85
6.24

Edad
30-39
8.37
9.26
10.16
6.48
7.86

40-59
11.23
10.64
8.32
9.00
7.53

60 y ms
6.74
7.36
5.12

Con un nivel de significancia de .05, determine si hay una diferencia en la


cantidad de dinero aplicado a la compra de equipo opcional en automviles
nuevos entre los diferentes grupos de edad.
5.
Los alumnos de la clase de mercadotecnia calificaron el desempeo del
profesor como excelente, bueno, malo y psimo. Las calificaciones que dieron los
estudiantes al profesor fueron comparadas con sus calificaciones finales del curso
de mercadotecnia. Lgicamente, se pensara que en general, los estudiantes que
calificaron al profesor con excelente tendran una calificacin final mucho ms alta
que los que lo calificaron como bueno, malo o psimo. Esto supondra tambin
que quienes calificaron al docente como psimo obtendran las calificaciones mas
bajas. Se seleccionaron muestras de calificaciones finales de los alumnos por
cada tipo de calificacin dada al maestro.

Excelente
94
90
85
80

Calificaciones finales de la clase de Mercadotecnia


Bueno
Malo
75
70
68
73
77
76
83
78
88
80

Psimo
68
70
72
65
74

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA
68
65

75

65

Se pretende determinar si hay una diferencia estadstica entre la calificacin


promedio obtenida por los estudiantes de acuerdo a la calificacin otorgada al
maestro. Utilice un nivel de significancia de .01
6.
En un esfuerzo por determinar la ms efectiva manera de ensear
principios de seguridad a un grupo de empleados de una compaa, cuatro
diferentes mtodos fueron tratados. Veinte empleados fueron asignados
aleatoriamente a cuatro grupos. El primer grupo recibi instruccin programada en
folletos y trabajaron a lo largo del curso a su propio paso. El segundo grupo
atendi lecturas. El tercer grupo observ presentaciones en televisin, y el cuarto
fue dividido en pequeos grupos de discusin. Al final de las sesiones, una prueba
fue aplicada a los cuatro grupos. Los resultados fueron:

Instruccin
programada
6
7
6
5
6

Calificaciones
Lecturas
Televisin
8
5
8
6
8

7
9
6
8
5

Grupos de
discussion
8
5
6
6
5

Pruebe en el nivel de significancia de .05 si hay o no diferencia entre las cuatro


medias.
7.
Una revista para consumidores est interesada en saber si existe o no
alguna diferencia en la duracin promedio de cuatro marcas diferentes de pilas
para radios de transistores. Se prob una muestra aleatoria de cuatro pilas de
cada marca, con los siguientes resultados (en horas):
Marca 1
12
15
18
10

Marca 2
14
17
12
19

Marca 3
21
19
20
23

Marca 4
14
21
25
20

Con un nivel de significancia de .05, pruebe si hay alguna diferencia en la


duracin promedio de estas cuatro marcas de pilas para radios de transistores
8.
Un psiclogo industrial querra determinar el efecto del consumo de
bebidas alcohlicas sobre la capacidad mecanogrfica de un grupo de secretarias.
Se asignaron en forma aleatoria cinco secretarias a cada uno de los tres niveles

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

76

de consumo y a cada una de las tres diferentes bebidas. Se dieron a cada


secretaria las mismas instrucciones para mecanografiar la misma pgina. Se
registr el nmero de errores cometido por cada secretaria con los siguientes
resultados
1 onza
Tequila Brandy
2
3
5
4
3
4
6
5
4
5

Ron
4
4
4
4
4

Consumo de alcohol
2 onzas
Tequila Brandy Ron
7
5
9
5
6
4
6
4
8
3
4
2
9
7
11

Tequila
10
6
10
12
12

3 onzas
Brandy
8
7
8
13
10

Ron
12
5
12
11
12

Con un nivel de significancia de .01, pruebe las siguientes hiptesis:

Es diferente la cantidad de errores dependiendo de la cantidad de bebida.

Es diferente la cantidad de errores dependiendo del tipo de bebida.

Es diferente la cantidad de errores dependiendo de la interaccin de las


dos variables.

9.
El gerente de menudeo de una cadena de tiendas desea determinar si la
ubicacin del producto tiene o no algn efecto sobre la venta de juguetes de
peluche en forma de animales. Se van a considerar tres ubicaciones diferentes en
el pasillo: frente, centro y atrs. Se seleccion una muestra de 18 tiendas y se hizo
una asignacin aleatoria en seis tiendas para cada ubicacin en el pasillo. Los
juguetes estaban presentados en cuatro figuras de animales diferentes. Al final de
un periodo de prueba de una semana las ventas de los productos fueron como
sigue:

osos
86
72
54
40
50
62

frente
perros
gatos
81
76
77
82
49
44
45
50
45
40
67
72

len
71
87
39
55
35
77

osos
20
32
24
18
14
16

centro
perros
gatos
16
19
36
32
20
23
22
18
10
13
20
16

len
24
29
28
15
18
13

osos
46
28
60
22
28
40

Atrs
Perros
gatos
51
56
24
20
65
68
18
16
33
34
36
36

Con un nivel de significancia de .01 pruebe las siguientes hiptesis:

Las ventas en las diferentes ubicaciones del pasillo son diferentes


Las ventas de las diferentes figuras de animales son diferentes
Las ventas son diferentes debido a la interaccin de las dos variables.

len
56
21
66
19
30
41

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

77

10.
El departamento de nutricin de cierta universidad lleva a cabo un estudio
para determinar si hay diferencia o no en el contenido de cido ascrbico entre
tres diferentes marcas de concentrado de jugo de naranja. Se hacen cuatro
pruebas de los tres tipos de concentrado de jugo de naranja que fue congelado
durante tres periodos de tiempo diferentes (en das). Los resultados, en
miligramos de cido ascrbico por litro, son los siguientes:
MARCA
0
RICA
BUENA
BARATA

52.6
49.8
56.0
49.6
52.5
51.8

54.2
46.5
48.0
48.4
52.0
53.6

TIEMPO ( DAS )
3
49.4
49.2
42.8
53.2
48.8
44.0
44.0
42.4
48.0
47.0
48.2
49.6

7
42.7
40.4
49.2
42.0
48.5
45.2

48.8
47.6
44.0
43.2
43.3
47.6

Utilice un nivel de significancia de .05 para probar la hiptesis de que:

Los contenidos de cido ascrbico por marca de jugo son diferentes

Los contenidos de cido ascrbico por tiempo de congelamiento son


diferentes

Los contenidos de cido ascrbico son diferentes debido a la interaccin de


las dos variables.
11. Se estudia el comportamiento de tres camadas de ratas bajo dos condiciones
ambientales en una prueba de laberinto. Las calificaciones de error para las 48
ratas se registran a continuacin:
Camada
Brillante
Mezclada
Lenta

Ambiente
28
12
36
83
101
94

Libre
22
25
23
10
33
41
14
76
33
122
56
83

36
86
22
58
35
23

72
48
60
89
136
120

Restringido
25
32
91
31
35
83
126
110
38
64
153
128

93
19
99
118
87
140

Utilice un nivel de significancia de .05 para probar la hiptesis de que:

Las calificaciones de error para las camadas son diferentes

Las calificaciones de error para los ambientes son diferentes


Las calificaciones de error son diferentes debido a la interaccin de las dos
variables
12.
Considere la combinacin de dos factores en la eliminacin de mugre en
cargas estndar de lavandera. El primer factor es la marca del detergente, X, Y o

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

78

Z. El segundo factor es la temperatura del agua, caliente o tibia. El experimento se


replica seis veces. La respuesta es el porcentaje de eliminacin de mugre. Los
datos son los siguientes:
Marca
X
Y
Z

Temperatura
85
78
90
92
85
87

Caliente
88
75
78
92
60
88

80
72
76
76
70
68

82
75
86
88
76
55

Caliente
83
75
88
76
74
57

85
73
76
77
78
54

Utilice un nivel de significancia de .05 para probar la hiptesis de que:

Los porcentajes de eliminacin de mugre son diferentes dependiendo del


detergente.
Los porcentajes de eliminacin de mugre son diferentes dependiendo de la
temperatura.
Los porcentajes de eliminacin de mugre son diferentes debido a la
interaccin de las dos variables.

13.
Los puntajes obtenidos en una prueba de rendimiento motor hecha a dos
grupos de estudiantes que participan en deportes universitarios, el primer grupo
est formado por estudiantes que practicaron deporte en la preparatoria, mientras
que el segundo est formado por estudiantes que no practicaron deporte en la
preparatoria. Los puntajes obtenidos por ambos grupos son los siguientes:
GRUPO 1
GIMNASIA
FUTBOL
55
56
59
40
63
59
58
70
50
52
52
43
69
28
77
37
60
51

GRUPO 2
GIMNASIA
FUTBOL
58
86
48
55
58
65
54
56
51
55
42
32
79
45
45
32

Utilice un nivel de significancia de .01 para probar la hiptesis de que:

El rendimiento motor es diferente dependiendo del grupo


El rendimiento motor es diferente dependiendo del deporte
El rendimiento motor es diferente debido a la interaccin de las dos variables.

14. La asociacin de egresados de la escuela Mao Meno, sospecha que sus


miembros reciben en promedio un sueldo inferior al ingreso de los egresados de la
escuela Much A. Money. Para comprobarlo se obtuvieron muestras de

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

79

egresados de ambas escuelas. La informacin que se obtuvo fue la siguiente: (en


miles de pesos)
MAO MENO
CRIMINOLOGA
PSICOLOGA
5.0
3.2
5.5
3.5
4.5
4.5
3.5
8.2
7.5
6.6

MUCH A. MONEY
CRIMINOLOGA
PSICOLOGA
5.5
7.5
3.5
5.5
9.5
4.5
3.4
8.5
6.8
3.2

Utilice un nivel de significancia de .01 para probar la hiptesis de que:

El ingreso es diferente dependiendo de la escuela


El ingreso es diferente dependiendo de la carrera
El ingreso es diferente debido a la interaccin de las dos variables.

15.
En una secundaria se formaron al azar dos grupos de estudiantes,
formados por alumnos de todos los grados. En un grupo se utiliz un nuevo
mtodo de enseanza. En el otro se utilizaron los mtodos tradicionales. Las
calificaciones al final del curso fueron las siguientes:
MTODO TRADICIONAL
PRIMERO SEGUNDO TERCERO
8
9
8.5
6.5
10
10
7
8
9
8
7
8.5
6
7.5
8
8
8
8

MTODO NUEVO
PRIMERO SEGUNDO TERCERO
8
8
7.5
7
10
8.5
5
10
7.5
8
9
8
7
8.5
9
7.5
9
9

Utilice un nivel de significancia de .025 para probar la hiptesis de que:

Las calificaciones son diferentes dependiendo del mtodo


Las calificaciones son diferentes dependiendo del grado
Las calificaciones son diferentes debido a la interaccin de las dos variable

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

80

CAPITULO SEIS: PRUEBAS NO PARAMETRICAS


Introduccin
Uno de los problemas ms difciles para el principiante y para el investigador
experimentado, es decidir cul de las pruebas estadsticas es la ms adecuada
para analizar un conjunto de datos. La aplicacin de la estadstica en el anlisis de
datos es muy amplia y las reas en las que se aplica son diversas, desde las
ciencias exactas hasta las ciencias sociales. La seleccin de la prueba estadstica
necesaria para el caso, depende de varios factores, en primer lugar se debe saber
cul es la escala con la que se estn midiendo los datos que se analizarn, pues
no se puede aplicar la misma prueba estadstica para el caso en que la variable de
inters sea el peso de un producto que cuando lo es la profesin del usuario de un
producto.
Queremos introducir en este parte la nocin de pruebas no paramtricas como
aquellas que no presuponen una distribucin de probabilidad para los datos, por
ello se conocen tambin como de distribucin libre. En la mayor parte de ellas los
resultados estadsticos se derivan nicamente a partir de procedimientos de
ordenacin y recuento, por lo que su base lgica es de fcil comprensin. Cuando
trabajamos con muestras pequeas (n < 10) en las que se desconoce si es vlido
suponer la normalidad de los datos, conviene utilizar pruebas no paramtricas, al
menos para corroborar los resultados obtenidos a partir de la utilizacin de la
teora basada en la normal.
En estas tcnicas, solamente se necesitan conocimientos elementales de
matemticas, pues los mtodos son relativamente ms sencillos que en las
pruebas paramtricas. En estas pruebas, tambin se tienen supuestos, pero son
pocos y no tienen que ver con la naturaleza de la distribucin de la poblacin, por
lo que a estas tcnicas tambin se les conoce como de libre distribucin.
En general el nico supuesto que se debe cumplir en la mayora de las pruebas no
paramtricas para confiar en ellas, es que la muestra haya sido seleccionada en
forma probabilstica.
Las pruebas que se mencionarn son las que se podran necesitar con mayor
frecuencia, se mencionarn sus principales caractersticas y aplicaciones.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

81

Objetivo general.
Contrastar la validez de hiptesis o conjetura sobre la relacin entre variables y
sobre las distribuciones de probabilidad terica que adoptan dichas variables, sin
sujetarse a los condicionamientos de la validez de supuestos paramtricos.

Objetivos especficos.

Examinar que se entiende por hiptesis y por prueba de hiptesis No


paramtricas.
Realizar pruebas No paramtricas para una variable y para datos pareados
Realizar pruebas sobre la bondad de ajustes de variables a distribuciones
de probabilidad terica de carcter cuantitativas.
Realizar pruebas de hiptesis para datos que se encuentran en una escala
nominal u ordinal con aplicacin de la distribucin chi- cuadrado.
Realizar pruebas sobre la relacin entre dos y ms variables poblacionales.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

82

Leccin 26. Generalidades


Las pruebas de hiptesis hacen inferencias respecto a los parmetros de la
poblacin, como la media. Estas pruebas paramtricas utilizan la estadstica
paramtrica de muestras que provinieron de la poblacin que se est probando.
Para formular estas pruebas, se hace suposiciones restrictivas sobre las
poblaciones de las que se extraen las muestras. Por ejemplo: se supona que las
muestras eran grandes o que provenan de poblaciones normalmente distribuidas.
Pero las poblaciones no siempre son normales.
Los estadsticos han desarrollado tcnicas tiles que no hacen suposiciones
restrictivas respecto a la forma de las distribuciones de las poblaciones. stas se
conocen como pruebas sin distribucin, o pruebas no paramtricas. Las hiptesis
de una probabilidad no paramtrica se refieren a algo distinto del valor de un
parmetro de poblacin

Pruebas no paramtricas son procedimientos estadsticos que pueden


utilizarse para contrastar hiptesis cuando no son posibles lo supuestos
respecto a los parmetros o a las distribuciones poblacionales.

Ventajas de los mtodos no paramtricos.


1. No requieren que hagamos la suposicin de que una poblacin est
distribuida en forma de curva normal u otra forma especfica.
2. Generalmente, son ms fciles de efectuar y comprender.
3. Algunas veces, ni siquiera se requiere el ordenamiento o clasificacin formal.
Desventajas de los mtodos no paramtricos.
1. Ignoran una cierta cantidad de informacin
2. A menudo, no son tan eficientes como las pruebas paramtricas. Cuando
usamos pruebas no paramtricas, efectuamos un trueque: perdemos
agudeza al estimar intervalos, pero ganamos la habilidad de usar menos
informacin y calcular ms rpidamente.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

83

Leccin 27. Prueba de Bondad de Ajuste de Ji-cuadrado


La pruebas de Bondad de Ajuste ji-cuadrado ( ) tiene como objetivo verificar si
los datos de una muestra se asocian a una distribucin terica, para variables
cuantitativas discretas y continuas.
A continuacin se establece la prueba 2 para bondad de ajuste. Supngase que
al realizar un experimento aleatorio n veces, se presentan los resultados
con frecuencias observadas
y de acuerdo con las leyes
de las probabilidades, se espera que estos resultados se presenten con
frecuencias
.
Una medida de las diferencias entre las frecuencias observadas y las esperadas
est dada por el estadstico 2 definido por:

Ecuacin No.24

= Frecuencias Observadas
= Frecuencias Esperadas
K= Nmero de observaciones
Si las frecuencias observadas coinciden o se aproximan mucho a las esperadas,
el valor estadstico
tiende a cero. Por el contrario, si las frecuencias
observadas difieren significativamente de las esperadas, el valor del estadstico
ser positivo y tan grande cuantos mayores sean las diferencias entre las
frecuencias. Bajo estas condiciones se tiene que la regin de rechazo es slo la
regin derecha (cola derecha o unilateral superior), cuando la hiptesis son las
siguientes:
: Los datos provienen de una muestra al azar de una poblacin
distribuida de acuerdo a un modelo terico.
: Los datos no provienen de una poblacin distribuida de acuerdo al
modelo terico.
En una prueba de hiptesis usando Ji-cuadrado las frecuencias esperadas se
calculan suponiendo que La hiptesis nula es cierta

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

84

El estadstico de prueba se puede expresar, para fines de clculo, como:

Ecuacin No.25

Con k r grados de libertad.


k: es el nmero de eventos o categoras
r : es el nmero de restricciones (r 1 es siempre es una restriccin, ya que

, y cada parmetro que se estima con la informacin de la


muestra es otra restriccin ms).
En ocasiones, las frecuencias esperadas dan resultados menores que 1, y los
investigadores frecuentemente hacen notar en la literatura que el estadstico no
se distribuye como
si las frecuencias esperadas son pequeas. Por lo tanto
1 Si, en la prctica resultaran una o varias
< 1 se juntan las categoras.
El estadstico terico es el valor de la Ji-cuadrado con k-r grados de libertad al
nivel de significancia dado.
Esta prueba de hiptesis utiliza un procedimiento de cinco pasos, los cuales se
presentan a continuacin:

Plantear las hiptesis nula y alternativa.


Determinar el nivel de significancia.
Estimar el valor estadstico de prueba.
Establecer la regla de decisin.
Tomar la decisin.

Ejemplo. Distribucin de Poisson

El administrador de un hospital ha estado estudiando el nmero de urgencias que


llega a un hospital por da y sospecha que estas se distribuyen segn un modelo
de Poisson. Tambin ha determinado que el nmero medio de urgencias por da
es de 3.
Para determinar si efectivamente el nmero de urgencias por da que llegan al
hospital siguen la distribucin de Poisson, se tom una muestra al azar de 90 das
de los archivos del hospital. Los datos se resumen en la siguiente tabla.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

85

Tabla No. 23. Nmero de urgencias que llegan por da al hospital.


Nmero de Nmero de das
urgencias
por da
0
1
2
3
4
5
6
7
8
9
10 o mas

5
14
15
23
16
9
3
3
1
1
0
90

Apoyan estos datos la sospecha del administrador? Use

= 0.05.

Paso 1: Plantear la hiptesis


nula y alternativa
: Los datos se distribuyen segn el modelo de Poisson.
Los datos no estn distribuidos segn el modelo de Poisson.
Paso 2: Determinar el nivel de significancia.
.
= 0.05.
Paso 3: Estimar el estadstico de prueba.
Clculos con
3 y la tabla de la distribucin Poisson, determinamos las
probabilidades de Poisson para x= 0, 1, 2,., 9; y para
1 ; restamos de 1 la
suma de las probabilidades anteriores. Para obtener las frecuencias esperadas
multiplicamos las probabilidades por n=90. Vase en la tabla No.24.
Podemos ver que
< en las tres ltimas categoras, por lo tanto debemos
unirlas quedando 9 categoras, as k=10; r=1 ya que el valor de , fue dado.
El valor calculado de la Ji-cuadrada es:

93 7563 9

3 75

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

86

Tabla No. 24 Frecuencias esperadas.

0
1
2
3
4
5
6
7
8
9
10 o mas

5
14
15
23
16
9
3
3
1
1
0
90

( )
0,050
0,149
0,224
0,224
0,168
0,101
0,050
0,022
0,008
0,003
0,001
1,000

4,481
13,443
20,164
20,164
15,123
9,074
4,537
1,944
0,729
0,243
0,099
90

Paso 4: Establecer la Decisin


Valor Critico: El valor de la ji-cuadrada terica para 8 (k-r=9-1) grados de
grados de libertad, a un nivel de significancia de 0.05 es 15.507

Paso 5: Toma de la Decisin


Como el valor del estadstico de prueba no cae en la regin de rechazo y es
menor que el estadstico terico concluimos, por tanto, que el nmero de
urgencias que llegan por da al hospital sigue una distribucin de Poisson con
3

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

87

Leccin 28. Prueba de Kolmogorov-Smirnov


La nica premisa que se necesita es que las mediciones se encuentren al menos
en una escala de intervalo. Se necesita que la medicin considerada sea
bsicamente continua. Adems dicha prueba es aplicable cualquiera sea el
tamao de la muestra.
La prueba Kolmogorov-Smirnov Compara las funciones de distribucin terica y
emprica (slo vlido para variables continuas).
Caractersticas de la prueba
La prueba de K-S de una muestra es una hiptesis de bondad de ajuste. Esto es,
se interesa en el grado de acuerdo entre la distribucin de un conjunto de valores
de la muestra y alguna distribucin terica especfica. Determina si
razonablemente puede pensarse que las mediciones mustrales provengan de
una poblacin que tenga esa distribucin terica. En la prueba se compara la
distribucin de frecuencia acumulativa de la distribucin terica con la distribucin
de frecuencia acumulativa observada. Se determina el punto en el que estas dos
distribuciones muestran la mayor divergencia.
Se trata de un mtodo no paramtrico sencillo para probar si existe una diferencia
significativa entre una distribucin de frecuencia observada y otra frecuencia terica. Es
otra medida de la bondad de ajuste de una distribucin de frecuencia terica.
Se basa en la comparacin de distribuciones acumuladas: la distribucin acumulada de
los datos observados y la distribucin acumulada terica correspondiente al modelo
elegido.
Hiptesis
Ho: La distribucin observada se ajusta a la distribucin terica.
F(x) = Ft(x) para todo x.
H1: La distribucin observada no se ajusta a la distribucin terica.
Ft(x): es la funcin terica. Esta puede ser por ejemplo la funcin normal con cierta
media y varianzas conocidas.

Estadstico de prueba
D = mxima
Sn(x): es la funcin de distribucin emprica.

Tiene varias ventajas: es una prueba poderosa y fcil de utilizar, puesto que no
requiere que los datos se agrupen de determinada manera.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

88

Es particularmente til para juzgar qu tan cerca est la distribucin de


frecuencias observada de la distribucin de frecuencias esperada, porque la
distribucin de probabilidad Dn depende del tamao de muestra n, pero es
independiente de la distribucin de frecuencia esperada (Dn es una estadstica de
distribucin libre).
Para calcular la estadstica K-S, simplemente se elige Dn (la desviacin absoluta
mxima entre las frecuencias observadas y tericas).
Una prueba K-S siempre debe ser una prueba de un extremo.
Luego se busca el valor crtico en la tabla, para las n observaciones, considerando
el nivel de significancia adoptado.
Si el valor de la tabla es mayor que el valor de Dn, entonces aceptaremos la
hiptesis nula.

SUGERENCIAS:

La prueba de Kolmogorov puede usarse con muestras muy pequeas, en


donde no se pueden aplicar otras pruebas paramtricas.
Podemos usar la prueba de Kolmogorov para verificar la suposicin de
normalidad subyacente en todo anlisis de inferencia.
Si bien constituye una prueba de implementacin sencilla, tenga en cuenta que
carga con las desventajas de los mtodos no paramtricos en general, en el
sentido de producir resultados menos precisos que los procedimientos
convencionales.
Cuando trabaje con muestras pequeas, recuerde usar la frecuencia cumulada
experimental.

Leccin 29. Prueba de Wilcoxon


29.1. Wilcoxon de los rangos con signo
Esta prueba nos permite comparar nuestros datos con una mediana terica.
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos, y
sea X1, X2 .. Xn los valores observados. Se calcula las diferencias X1-M0, X2-M0,
..., Xn-M0. Si la hiptesis nula fuera cierta estas diferencias se distribuiran de
forma simtrica en torno a cero.
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se
ordenan de menor a mayor, asignndoles su rango (nmero de orden). Si hubiera
dos o ms diferencias con igual valor (empates), se les asigna el rango medio (es

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

89

decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 2.5 a
ambas). Ahora calculamos R+ la suma de todos los rangos de las diferencias
positivas, aquellas en las que Xi es mayor que M0 y R- la suma de todos los
rangos correspondientes a las diferencias negativas. Si la hiptesis nula es cierta,
ambos estadsticos debern ser parecidos, mientras que si nuestros datos tienen a
ser ms altos que la mediana M0, se reflejar en un valor mayor de R+, y al
contrario si son ms bajos. Se trata de contrastar si la menor de las sumas de
rangos es excesivamente pequea para ser atribuida al azar, o, lo que es
equivalente, si la mayor de las dos sumas de rangos es excesivamente grande.
29.2. Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de
parejas de valores, por ejemplo antes y despus del tratamiento, que podemos
denominar (X1,Y1), (X2,Y2), ... ,(Xn,Yn). De la misma forma, ahora calcularemos
las diferencias X1-Y1, X2-Y2, ... , Xn-Yn y las ordenaremos en valor absoluto,
asignndoles el rango correspondiente. Calculamos R+ la suma de rangos
positivos (cuando Xi es mayor que Yi), y la suma de rangos negativos R-. Ahora la
hiptesis nula es que esas diferencias proceden de una distribucin simtrica en
torno a cero y si fuera cierta los valores de R+ y R- sern parecidos.

Leccin 30. Prueba de Mann-Whitney para muestras


independiente y prueba de Kruskal-Wallis para comparar k
muestras independientes
30.1. Prueba de Mann-Whitney para muestras independientes
La prueba de Mann-Whitney puede utilizarse para probar la hiptesis nula de que
las medianas de dos poblaciones son iguales. Se supone que las dos poblaciones
tienen la misma forma y dispersin, porque tales diferencias tambin podran
conducir al rechazo de la hiptesis nula. Es necesario que los valores de las dos
muestras aleatorias independientes estn al menos en la escala ordinal.
Las dos muestras se combinan en un conjunto ordenado, en el que cada valor
muestral se identifica segn el grupo muestral original. Los valores se clasifican
entonces de menor a mayor, asignando el rango 1 al menor valor muestral
observado. En caso de valores iguales, se les asigna el rango medio. Si la
hiptesis nula es cierta, el promedio de los rangos de cada grupo muestral debera
ser aproximadamente igual.
30.2. Prueba de Kruskal-Wallis para comparar k muestras independientes (o
Prueba H de suma de rangos)

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

90

Cuando se tiene inters o necesidad de probar una hiptesis nula en la que se


afirma que k tratamientos son iguales o que k muestras aleatorias independientes
provienen de poblaciones idnticas, siendo k > 2, la prueba estadstica que se
realizara dentro de la estadstica paramtrica sera el anlisis de varianza de un
sentido y para la prueba se utilizara la distribucin F; sin embargo, cuando la
escala es ordinal o se desconfa del supuesto de que las muestras provienen de
poblaciones con forma de distribucin normal, se puede utilizar esta prueba para
muestras independientes. La hiptesis alternativa sera que al menos dos
poblaciones tienen una distribucin diferente.
La prueba de Kruskal-Wallis sirve para probar la hiptesis nula de que varias
poblaciones tienen las mismas medianas. As, es el equivalente no paramtrico
del diseo completamente aleatorizado de un factor de anlisis de varianza. Se
supone que las diversas poblaciones tienen la misma forma y dispersin para que
la hiptesis anterior sea aplicable, ya que diferencias en forma o dispersin
podran tambin conducir al rechazo de la hiptesis nula. Es necesario que los
valores de las diversas muestras aleatorias independientes estn al menos en la
escala ordinal.
Las varias muestras son vistas primeramente como un conjunto de valores, y cada
valor de este grupo combinado se clasifica de menor a mayor. En caso de valores
iguales, se les asigna el rango medio. Si la hiptesis nula es cierta, el promedio de
los rangos de cada grupo muestral debera ser ms o menos igual.

Ejercicios propuestos
1. Cinco antiguos pacientes son seleccionados aleatoriamente del ala A de un
hospital y cuatro pacientes son seccionados del ala B. Los pacientes estuvieron
los siguientes nmeros de das:
Ala A
Ala B

13
10

4
9

2
7

10
8

Se debe efectuar una prueba U de Mann-Whitney para determinar si existe


diferencia significativa entre la duracin de las estancias en el hospital para las
dos alas. Cul es la clasificacin para la estancia de 13 das en el Ala A?
R/ta: 9 das

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

91

2. Elija la muestra con la mayor suma de rangos si los elementos son


clasificados de mayor a menor:
Muestra A: 1
Muestra B: 5
Muestra C: 9

3
1
4

9
8
2

R/ta: 16
3. En una partida de Rol se lanza 200 veces un dado de cuatro caras
obtenindose 60 veces el nmero 1, 45 veces el nmero 2, 38 veces el nmero
3 y 57 veces el nmero 4. Se puede aceptar, a un nivel de confianza del 95%,
que estos resultados corresponden a un dado homogneo.
R/ta: Se acepta de la hiptesis que los resultados corresponden a un dado
homogneo
4. En una encuesta preelectoral realizada a 500 personas se obtuvo la
siguiente distribucin en funcin de sus edades y de su intencin de
voto:

Partido
A
B
C
D

Edad
18 35
10
15
45
30

35 50
40
70
60
30

50 o ms
60
90
35
15

A un nivel de confianza del 90% Puede afirmarse que la intencin de


voto es independiente de la edad?
R/ta: Se rechaza la hiptesis de independencia de las variables
5. Los tiempos de respuesta de 9 sujetos en una tarea de reconocimiento de
palabras, previamente presentadas, han sido los siguientes:
115, 98, 123, 109, 112, 87, 118, 104, 116
A un nivel de confianza del 95% Son compatibles estos resultados con la
hiptesis de que el tiempo de reaccin en esta tarea sigue una distribucin
Normal de media 110 y desviacin tpica 10?
R/ta: Se acepta la hiptesis de normalidad de la variable.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

92

Autoevaluacin

1.
Los miembros de un equipo ciclista se dividen al azar en tres grupos
que entrenan con mtodos diferentes. El primer grupo realiza largos recorridos
a ritmo pausado, el segundo grupo realiza series cortas de alta intensidad y el
tercero trabaja en el gimnasio con pesas y se ejercita en el pedaleo de alta
frecuencia. Despus de un mes de entrenamiento se realiza un test de
rendimiento consistente en un recorrido cronometrado de 9 Km. Los tiempos
empleados fueron los siguientes:
Mtodo I
15
16
14
15
17

Mtodo II Mtodo III


14
13
15
16
14

13
12
11
14
11

A un nivel de confianza del 95% Puede considerarse que los tres mtodos
producen resultados equivalentes? O por el contrario Hay algn mtodo
superior a los dems?
Solucin:
E estadstico de contraste vale: F = 13,4/ 1,43 = 9,37
El valor de la F terica con 2 y 12 grados de libertad, a un nivel de confianza
del 95% es 3,89. Por consiguiente se rechaza la hiptesis nula y se concluye
que los tres mtodos de entrenamiento producen diferencias significativas.
(Tomado de problemas de anlisis de datos Tema 14 Anlisis de varianzas: Jos
Mara Salinas)
Test No Parmetro
2.
En una partida de Rol se lanza 200 veces un dado de cuatro caras
obtenindose 60 veces el nmero 1, 45 veces el nmero 2, 38 veces el nmero
3 y 57 veces el nmero 4. Se puede aceptar, a un nivel de confianza del 95%,
que estos resultados corresponden a un dado homogneo.
Solucin:
Paso 1: La hiptesis nula ser que el dado es homogneo, esto implica que la
distribucin de los nmeros es uniforme, es decir que los cuatro nmeros
tienen una probabilidad de aparecer de 0,25.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

93

Paso 2: La hiptesis alternativa ser que la distribucin no es


uniforme.
Paso 3: Como la variable es discreta utilizaremos el test Ji-cuadrado de
bondad de ajuste a una distribucin.
Paso 4: En la tabla siguiente se han realizado todos los clculos
necesarios, obtenindose el valor 4,36 para el estadstico de contraste.
xi
np i)2 /np i
1
2
3
4
200

ni

pi

Np i

ni-np i

(ni-np i)2

60
45
38
57

0,25
0,25
0,25
0,25

50
50
50
50

10
-5
-12
7

100
25
144
49

(ni2
0,5
2,88
0,98
4,36

Paso 5: Como el estadstico tena 4 sumandos, buscamos en las tablas de la


Ji- cuadrado con 3 grados de libertad el valor que deja por debajo una
probabilidad de 0,95 y obtenemos que el valor crtico es 7,81.
Como el valor del estadstico es inferior al valor crtico, aceptamos la
hiptesis nula. Estos resultados son compatibles con el hecho de que el
dado sea homogneo.
3.
En una encuesta preelectoral realizada a 500 personas se obtuvo la
siguiente distribucin en funcin de sus edades y de su intencin de voto:
Partido
A
B
C
D

18 - 35
10
15
45
30

35 - 50
40
70
60
30

50 o ms
60
90
35
15

A un nivel de confianza del 90% Puede afirmarse que la intencin de voto es


independiente de la edad?
Solucin:
1 La hiptesis nula es que las dos variables son independientes.
2 La hiptesis alternativa es que hay relacin entre ambas variables.
3 Se trata de un contraste de independencia entre dos variables, por
consiguiente el estadstico de contraste a utilizar es el estadstico Jicuadrado para tablas de contingencia.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

4 Las tablas siguientes presentan los clculos del estadstico:


Edad
Partido 18 35 35 50 50 o ms
40
60
A B C 10
15
70
90
D
45
60
35
30
30
15
100
200
200

110
175
140
75
500

A partir de las frecuencias marginales de la tabla anterior, se obtienen las


frecuencias esperadas que aparecen a continuacin:
Edad
Partido 18 35
A
22
B
35
C
28
D
15

35 50
44
70
56
30

50 o ms
44
70
56
30

Por consiguiente las discrepancias entre frecuencias empricas y frecuencias


esperadas son:

Los cuadrados de las discrepancias son:


Edad
Partido 18 35 35 50
A
144
16
B
400
0
C
289
16
D
225
0

50 o ms
256
400
441
225

94

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

Dividiendo por las frecuencias esperadas se obtiene:


Edad
Partido 18 35 35 50 50 o ms
A
6,55
0,36
5,82
B C
11,43
0
5,71
10,32
0,29
7,88
D
15
0
7,5
43,30
0,65
26,91 70,86
Sumando, se obtiene el valor del estadstico 70,86.
5 Como la edad presenta tres intervalos y los partidos son cuatro, el
estadstico tendr (3 - 1)(4 -1 ) =
6.
Buscamos en las tablas de la
distribucin Ji-cuadrado con 6 grados de libertad el valor de la variable que
deja por debajo una probabilidad de 0,9 encontramos que el valor crtico es
10,64.
6 Como el valor del estadstico es mayor que el valor crtico rechazamos la
hiptesis nula de que ambas variables son independientes.
7 La edad cambia la intencin de voto.

4.
Los tiempos de respuesta de 9 sujetos en una tarea de reconocimiento
de palabras, previamente presentadas, han sido los siguientes:
115, 98, 123, 109, 112, 87, 118, 104, 116
A un nivel de confianza del 95% Son compatibles estos resultados con la
hiptesis de que el tiempo de reaccin en esta tarea sigue una distribucin
Normal de media 110 y desviacin tpica 10?
Solucin:
1 La hiptesis nula es que los datos proceden de una Normal (110, 10).
2 La hiptesis alternativa es que no siguen esa distribucin Normal.
3 Como la variable es continua, y la hiptesis nula especfica totalmente la
distribucin utilizaremos el test de Kolmogoroff-Smirnoff, cuyo estadstico de
contraste es:
max | Fn (xi ) - Mn (xi) |
4 los clculos del estadstico se especifican en la siguiente tabla:

95

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

xi
zi

87
-2,3
Fn
0,0107
Mn
0,1111
|Fn -Mn | 0,1004

98
-1,2
0,1151
0,2222
0,1071

104
-0,6
0,2743
0,3333
0,059

109
-0,1
0,4602
0,4444
0,0158

112
0,2
0,5793
0,5556
0,0237

115
0,5
0,6915
0,6667
0,0248

116
0,6
0,7257
0,7778
0,0521

118
0,8
0,7881
0,8889
0,1008

96

123
1,3
0,9032
1
0,0968

5 Buscando en las tablas del test Kolmogoroff-Smirnoff para n = 9 el valor


crtico para
un nivel de confianza del 95% se obtiene 0,43001.
6 Como el valor del estadstico 0,1071 es menor que el valor crtico se acepta
la
hiptesis nula.
7 A un nivel de confianza del 95% no hay evidencia en contra de que el
tiempo de reaccin siga una distribucin N(110, 10). (Tomado de
problemas de anlisis de datos Tema 14 Anlisis de varianzas: Jos
Mara Salinas)

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

97

REFERENTES
Alvarado, J. A., Obagi, J.J. (2008). Fundamentos de Inferencia Estadstica.
Pontificia Universidad Javeriana. Bogot. D.C. Colombia. Extrado el 18 de octubre
de
2012
de
http://books.google.com.co/books?id=3uhUqvF0_84C&printsec=frontcover&dq=inf
erencia&source=bl&ots=DC7Ajfx6Os&sig=pOn4JMXwSC0qd0FmDBlpoMGQLkg&
hl=es&sa=X&ei=_2qAUKmEJaqG0QHT6YGwBw&ved=0CD0Q6AEwAw

Jurez, F., Villatoro, J. A. y Lpez, E. K. (2002). Apuntes de Estadstica Inferencial.


Mxico, D. F.: Instituto Nacional de Psiquiatra Ramn de la Fuente. Extrado el 10
de enero de 2012 de: http://rincondepaco.com.mx/Apuntes/Inferencial.pdf

Mayorga, J. (2004). Inferencia Estadstica. Universidad Nacional de Colombia.


Bogot. D. C. Colombia. Extrado el 18 de octubre de 2012 de
http://books.google.com.co/books?id=bmCV6r_pQQUC&printsec=frontcover&dq=i
nferencia&source=bl&ots=KM2dtf_GYn&sig=vFmWR0tlvVlMGVrNUKn9MKRlr_I&h
l=es&sa=X&ei=G2mAUK6qLIeo8gTa_oCwAw&redir_esc=y#v=onepage&q=prueba
%20de%20hip%C3%B3tesis&f=false

Web del Instituto Tecnolgica De Chihuahua curso Estadstica 1 ITC (s. f).
Extrado
el
18
de
octubre
de
2012
de:
http://www.itch.edu.mx/academic/industrial/estadistica1/cap02.html.