You are on page 1of 28

MDULO 1

INFERENCIA ESTADSTICA
Bibliografa bsica:
Berenson y Levine (1996) Estadstica para Administracin y Economa. 6. Ed.
Prentice Hall Hispanoamericana. Madrid.
Captulos: 9, 10 (Apartados 10.1, 10.2, 10.3, 10.4, 10.5, 10.6)

1.1.

ESTIMACIN

La mayora de las aplicaciones actuales de la Estadstica se relacionan con la


obtencin de conclusiones referidas a la poblacin, a partir de la evidencia recogida en
una muestra correspondiente a una pequea porcin de casos, en situaciones
prcticas como las siguientes:

Analizar la evolucin del total de desempleados en las grandes ciudades de un


pas.
Medir el gasto promedio de las familias en cierto rubro de inters.
Cuantificar la variabilidad de un producto surgido de cierto proceso industrial
estandarizado.
Conocer el porcentaje de votantes que prefieren a cierto candidato con
anterioridad a una eleccin.

Las tcnicas correspondientes a la Inferencia estadstica permiten dar respuesta a


estos interrogantes, utilizando slo una pequea porcin de casos de la poblacin de
inters. Para los objetivos de informacin propuestos previamente como ejemplos,
podran tomarse muestras de las poblaciones:

Seleccionando individuos residentes en las ciudades de inters y registrando


su estado ocupacional.
Obteniendo por muestreo un conjunto de familias, y consultndolas sobre el
gasto en ese rubro.
Estudiando por muestreo la caracterstica de anlisis de un grupo de productos
elaborados en tal sistema.
Indagando a un conjunto representativo de votantes del lugar en cuestin.

Como primer paso en este estudio de la Estadstica inferencial, nos detendremos en


este mdulo en las diferentes tcnicas que permiten dar considerado plausible acerca
de un valor de un parmetro poblacional de inters (tales como la media poblacional,

Materia: Herramientas Matemticas V Estadstica II


Profesora: Vernica Herrero

-1-

la varianza poblacional, la proporcin poblacional, o las diferentes entre medias o entre


proporciones).

1.1.1. Parmetros y estadgrafos


En primer lugar, recordemos la diferencia entre Parmetro y Estadgrafo.
Los parmetros son las medidas de resumen poblacionales que permiten describir el
conjunto de datos analizados. Ejemplos de parmetros son la media poblacional, la
varianza poblacional, etc.
Los estadgrafos son las medidas anlogas obtenidas a partir de datos muestrales.
Este tipo de medida incluye a la media muestral, la varianza muestral, la proporcin
muestral, entre otras. Estos valores, tambin conocidos como estimadores, se utilizan
para proporcionar una idea del valor de la medida poblacional correspondiente, pero
considerando slo datos muestrales.

1.1.1.1.

Estimadores: caractersticas de un buen estimador

Comenzaremos estudiando la media muestral, el estimador natural de la media


poblacional, que es la medida de tendencia central ms utilizada. La medida a su vez,
es la medida ms adecuada para describir un conjunto de datos que se distribuye
siguiendo el modelo normal.
Las tres propiedades que nos interesa destacar de la media muestral como estimador
de la media poblacional son:
1. Imparcialidad (insesgada)
2. Eficiencia
3. Consistencia

Imparcialidad
Decimos que un estimador es imparcial o insesgado cuando su valor esperado
coincide con el parmetro poblacional que estima.
En el caso de la media muestral, esta propiedad se demuestra muy fcilmente con
unos pocos pasos algebraicos:
Partiendo de la frmula de clculo de la media muestral, estudiada en la materia
anterior de Estadstica:
n

x
i 1

Materia: Herramientas Matemticas V Estadstica II


Profesora: Vernica Herrero

-2-

La esperanza o valor esperado de la media muestral es:

n
xi
E ( x ) E i 1
n

Como la esperanza de una constante es la constante, resulta:

n
E xi
E ( x ) i 1
n
Como la esperanza de una suma es igual a la suma de las esperanzas:

E ( x i )

E ( x ) i 1
n
Y como sabemos que la esperanza de la variable estudiada es :

E( x)

n.
n

Simplificando resulta:

E (x )

Eficiencia
Un estimador es eficiente si en promedio se acerca ms al parmetro estimado que
cualquier otro estimador.
La media muestral cumple este requisito para la media poblacional, ya que tiene la
mnima varianza entre los estimadores de la media poblacional.

Consistencia
Decimos que un estimador es consistente si a medida que se aumenta el tamao de la
muestra, el estimador se aproxima sistemticamente al valor del parmetro
poblacional.

Materia: Herramientas Matemticas V Estadstica II


Profesora: Vernica Herrero

-3-

Al aumentar el tamao de la muestra, cada vez, las diferencias entre la media muestral
y la media poblacional se van haciendo ms reducidas.
El cumplimiento de estas propiedades hace de la media muestral el mejor estimador
de la media poblacional.

Error estndar de la media


Es intuitivamente fcil de visualizar que a medida que mayor es la muestra (es decir,
ms elementos de la poblacin se incluyen para estimar la media muestral), menor
ser la dispersin de los valores respecto de la media muestra, ya que el efecto de un
valor extremo tiende a diluirse a medida que ms elementos se toman en
consideracin para el clculo.
Por tal motivo, la desviacin estndar de la media muestral, conocido como error
estndar de la media, se relaciona de la siguiente manera con la desviacin estndar
poblacional:

x
n

Como puede observarse, la frmula anterior refleja la relacin indicada entre la


dispersin de la muestra y el tamao muestral.

Distribucin en el muestreo de la proporcin


Para las variables categricas, en las cuales es registra la posesin o no de una
caracterstica, el parmetro poblacional de inters es la proporcin, que indica
justamente qu parte de la poblacin posee una caracterstica.
Por ejemplo, si en una poblacin de 10.000 individuos, 2400 tiene ojos claros, decimos
que

X
N

2400
10000

es la proporcin de individuos con ojos claros en la poblacin.

Materia: Herramientas Matemticas V Estadstica II


Profesora: Vernica Herrero

-4-

Donde X es la cantidad de casos de la poblacin que tienen la caracterstica,


conocidos habitualmente como xitos. N es el tamao de la poblacin.

El estimador de P ser p, la proporcin muestral. Para obtener p:

x
n

Donde x es la cantidad de xitos en la muestra, y n es el tamao de la muestra.


Como puede observarse la proporcin se ubica en el intervalo [0,1], siendo los
extremos del intervalo las situaciones extremas en las que ningn individuo posee la
caracterstica o bien, cuando la poseen todos. Estos dos casos extremos son los que
implican la menor dispersin entre los individuos (ya que por tener o por no tener la
caracterstica, los individuos se parecen), y en cambio, la mayor dispersin ocurre en
los valores intermedios (cuando p=0,5), ya que es mxima la cantidad de individuos
que difieren de p.

P(1 P)
n

La distribucin muestral de la proporcin sigue una distribucin binomial, que puede


aproximarse a la normal cuando se cumplen las siguientes condiciones:

np 5
y

n(1 p) 5
Estas condiciones implican requerimientos de muestras de tamao considerables para
las estimaciones de proporciones.

Muestreo de poblaciones finitas


Cuando se selecciona una muestra, debe establecerse con precisin cul fue el
mecanismo con el que se procedi a escoger a los elementos que componen la
muestra.
El diseo bsico que se encuentra implcito en muchos de los desarrollos estadsticos
supone que los elementos fueron seleccionados con reemplazo. Esto implica que
una vez que se seleccion un individuo o elemento, ste vuelve a formar parte de los

Materia: Herramientas Matemticas V Estadstica II


Profesora: Vernica Herrero

-5-

casos seleccionables, por lo que la probabilidad de seleccin de los distintos casos no


cambia a medida que se va construyendo la muestra.
En diversas situaciones de aplicacin de muestreo esto no ocurre de tal manera por
diferentes razones. Por ejemplo, cuando realizamos una encuesta para un estudio de
mercado, no tiene demasiado sentido encuestar dos veces al mismo individuo en un
estudio; incluso en ocasiones, como las aplicaciones para control de calidad, pueden
implicar la destruccin del caso seleccionado en la muestra, tal como cuando se
analiza la duracin de una pieza, por lo que difcilmente en tales casos usemos un
muestreo con reposicin.
En todas estas situaciones debemos introducir una correccin a las frmulas que
ajuste la diferente probabilidad de seleccin que tienen los sucesivos casos que
integran la muestra.
Esta correccin se conoce como factor de correccin para poblaciones finitas (fcpf) y
se obtiene a travs del siguiente cociente:

N n
N 1

fcpf

Con esta frmula se ajusta tanto el error estndar de la media muestral:

x
n

N n
N 1

como el error estndar de la proporcin muestral:

P(1 P) N n
n
N 1

El fcpf siempre ser menor que 1, lo cual implica que en este tipo de muestreo, las
estimaciones surgidas de este tipo de muestreo resultan ms exactas, o lo que es lo
mismo tienen menos dispersin en el muestreo.

Preguntas de reflexin:

Por qu usamos los estimadores habituales para estimar la media poblacional


o la proporcin poblacional?
Cmo se comporta el error estndar si tomamos muestras ms grandes?
Qu debe verificarse para que la proporcin muestral se distribuya normal?
Qu implicancias tiene para la muestra?
Por qu se usa el fcpf? Cmo afecta al error estndar?

Materia: Herramientas Matemticas V Estadstica II


Profesora: Vernica Herrero

-6-

1.1.1.2.

Estimacin puntual y por intervalos

Hasta ahora hemos visualizado el proceso de estimacin simplemente como el acto de


proporcionar un valor nico que sirva como referencia indicativa del valor que
suponemos que alcanza el parmetro poblacional de inters. En definitiva, como se
indica en Berenson y Levine (texto bsico de la materia, p. 344):
La estimacin puntual consiste en una sola estadstica de muestra que
se utiliza para estimar el valor verdadero del parmetro de la poblacin.

Tabla: Estimadores puntuales


Parmetros

Estimadores puntuales ms usuales

Media poblacional

Media muestral

Proporcin poblacional

Proporcin muestral

Varianza poblacional

Varianza muestral

Sin embargo, con este procedimiento no estamos aprovechando realmente la


potencialidad de conocer con qu probabilidad de acertar hacemos nuestra afirmacin.
Debemos considerar la variabilidad posible que es propia de un estimador, ya que el
valor de ste depender de la muestra que haya sido seleccionada.
Para tener en cuenta esta caracterstica, la estimacin por intervalos considera
justamente las distribuciones en el muestreo de los respectivos estimadores.
Cuando obtengamos un intervalo, estaremos considerando una determinada confianza
de estimar acertadamente el parmetro.
En definitiva, vamos a poder decir, a travs del intervalo, con una confianza
establecida por el investigador (por ejemplo para la estimacin de la media
poblacional) que un intervalo a partir de la estimacin puntual ms / menos un cierto
margen de error o error de muestreo, atrapa al verdadero valor del parmetro.
Los intervalos en este caso tendrn la siguiente estructura:

x margen de error

Materia: Herramientas Matemticas V Estadstica II


Profesora: Vernica Herrero

-7-

Estimacin por intervalo de la media


Caso: Desviacin estndar conocida
Por el Teorema del lmite central (que Ud. conoce por la materia previa, pero
recordaremos ms adelante en el mdulo), sabemos que es posible determinar qu
porcentaje de las medias muestrales se ubican a determinada distancia de la media de
la poblacin, teniendo en cuenta la distribucin de la medias muestrales.
Si bien tenemos en cuenta ese razonamiento, permanentemente en las diferentes
investigaciones que llevemos a cabo, tomaremos una nica muestra, a partir de la cual
haremos la estimacin, considerando lo que probabilsticamente podemos deducir de
la distribucin de muestreo de la media.
La idea de este tipo de estimacin es considerar que la muestra que fue seleccionada
nos proporciona una de las medias muestrales posibles, que con una probabilidad 1-a,
se encuentra a una distancia de

Z
1

x
n

con respecto del valor de la media poblacional.


Donde, Z

ese valor 1

es el valor de la tabla estandarizada normal, que tiene acumulado hasta

de probabilidad. Este valor se denomina valor crtico de la distribucin.

Algunos de los valores crticos ms usados, correspondientes a los niveles de


confianza (1-) usuales, son:
(1-

95%

1,96

99%

2,575

90%

1,645

Por lo tanto, a travs de la construccin de un intervalo de confianza, con un nivel de


confianza de 1-, podemos decir que la media poblacional es atrapada por el intervalo:

LI , LS x Z1

x
n

;x Z

Materia: Herramientas Matemticas V Estadstica II


Profesora: Vernica Herrero

-8-

Donde LI = lmite inferior y LS= lmite superior.


Si se tomaran todas las muestras posibles de tamao n de la poblacin bajo estudio,
en el (1-)% de los intervalos surgidos de tales estimaciones de la media poblacional,
la media poblacional (que es fija aunque desconocida para nosotros) quedara incluida
en tales intervalos. Como destacamos antes, ya que en cualquier estimacin
trabajaremos con una muestra al azar, podemos decir que la probabilidad de que se
cumpla la condicin detallada es (1-).

Veamos un ejemplo:
Deseamos estimar la altura promedio de una poblacin de estudiantes varones
de esta Universidad.
Utilizaremos para ello una muestra aleatoria de 10 estudiantes. Los valores
obtenidos de la medicin de la altura son:
Caso
1
2
3
4
5
6
7
8
9
10

Altura (en cm.)


162
176
169
165
171
172
169
168
175
167

De un estudio previo se conoce que la varianza de esta poblacin es 16 cm2.


Cmo podemos estimar la altura promedio?
En primer lugar veamos una estimacin puntual de la media, que va a estar
dada por la media muestral.
n

x
i 1

x 169,4 cm
Para obtener el intervalo de confianza suponemos que la variable aleatoria se
distribuye normal, y calculamos cada uno de los valores que indicamos.
Trabajaremos con un 1-=0,95.

Materia: Herramientas Matemticas V Estadstica II


Profesora: Vernica Herrero

-9-

1,96

x 4
n 10
Por lo tanto, el intervalo que surge ser:

LI , LS 166,920; 171,879

Y podemos expresar la conclusin: Con un nivel de confianza del 95%, la altura


promedio de los varones de la poblacin de estudiantes de la Universidad es
atrapada por el intervalo [166,92 cm; 171,88 cm].

Como puede analizarse a partir del ejemplo, el intervalo que surge depende de la
muestra que ha sido seleccionada, en el caso de haber elegido a otros estudiantes y
no a esos, el resultado de la media muestra podra haber sido distinto, y en
consecuencias tambin el intervalo obtenido.

Estimacin por intervalo de la media


Caso: Desviacin estndar desconocida
En general, cuando no se dispone de informacin referida a la media poblacional,
tampoco resulta conocido el valor de la varianza poblacional.
Si tal es la situacin, no podemos aplicar la distribucin normal para la estimacin por
intervalos de la media poblacional.
Para solucionar esta situacin, se aplica la distribucin t, que presentaremos, para
calcular el intervalo de confianza.
Distribucin t de Student1

La nota que se indica est basada en:


http://www.matematicasvisuales.com/html/probabilidad/varaleat/tstudent.html. En este sitio se
pueden realizar visualizaciones de las diferentes distribuciones que estudiaremos en este
mdulo, simplemente ajustando los parmetros de las mismas. En la pgina
http://www.matematicasvisuales.com/html/probabilidad/varaleat/tstudentprob.html pueden
calcularse y compararse las respectivas probabilidades de la tabla normal y la tabla t de
Student.

Materia: Herramientas Matemticas V Estadstica II


Profesora: Vernica Herrero

- 10 -

La distribucin t de Student fue estudiada por William Gosset (1876-1937) quien se


ocupaba de tareas de control de calidad en la fbrica de cervezas Guiness, en Irlanda.
Figura: Comparacin de la distribucin t y la normal estndar para diferentes grados
de libertad:
Distribucin t con 2 grados de
libertad
Grfico de la distribucin
normal: lnea roja
Grfico de la distribucin t:
azul

Distribucin t con 5 grados de


libertad

Distribucin t con 15 grados


de libertad

Distribucin t con 30 grados


de libertad
Observar cmo prcticamente
no hay diferencia entre ambas
distribuciones.

Materia: Herramientas Matemticas V Estadstica II


Profesora: Vernica Herrero

- 11 -

Fuente:
Elaboracin
propia
en
base
a
herramienta
de
simulacin
provista
por:
http://www.geogebra.org/en/upload/files/Juan%20de%20Jesus%20Sandoval/la_distribucion_normal_t_student.html

Desarroll trabajos acerca de esta distribucin que le permitiera analizar muestras


pequeas. Debido a ciertas restricciones que le impona la fbrica, no pudo publicar
sus trabajos con su nombre y us el seudnimo de Student, dado que consider que
su aporte podra servir a otros.
La distribucin t, en realidad est conformada por una familia de variables aleatorias
continuas. Esta familia se diferencia entre s de acuerdo con un parmetro que sec
denomina "grados de libertad".
La distribucin t es similar a la distribucin normal estndar: tiene forma de campana,
su media es 0 y es simtrica. Su varianza es mayor que 1. Cuanto ms grados de
libertad posee, ms cercana a 1 es la varianza y ms se aproxima la distribucin t de
Student a la normal estndar. Si trabajamos con ms de 30 grados de libertad, se
considera despreciable la diferencia entre la t de Student y la normal estndar.
Para buscar valores de t en la tabla se procede de manera similar a la correspondiente
a la bsqueda en la tabla normal estndar. En este caso debern considerarse los
grados de libertad (indicados en las filas de las tablas).
Por ejemplo, si queremos buscar el t (con 25 grados de libertad) que acumula 0,90 de
probabilidad hasta ese valor, en primer lugar ubicamos la fila que corresponde a esos
grados de libertad.
Como la tabla que presentamos en este caso seala las probabilidades a la derecha
del valor respectivo, se debe seleccionar el valor de t asociado con una probabilidad a
la derecha de 0,10.
A continuacin recuadramos el valor de t buscado.

Materia: Herramientas Matemticas V Estadstica II


Profesora: Vernica Herrero

- 12 -

En otras ocasiones, como ya han aprendido para la distribucin normal, queremos


conocer cul es la probabilidad acumulada hasta determinado valor de la variable
aleatoria.
Podemos querer saber qu probabilidad hay de que una variable t, con 17 grados de
libertad sea menor o igual a 2,1098. Nuevamente, buscamos en la tabla la fila
correspondiente a los grados de libertad que nos interesan. Luego, entre los valores
de la fila, identificamos el valor que nos interesa.
En este caso, la columna donde se ubica el 2,1098 nos seala que la probabilidad de
obtener un nmero mayor a ese valor de t es 0,025. Por lo tanto, la probabilidad
acumulada hasta ese nmero ser su complemento: 1 0,025 = 0,975.

Materia: Herramientas Matemticas V Estadstica II


Profesora: Vernica Herrero

- 13 -

Fuente: Anderson, David y Sweeney, (2008) Dennis J. Estadstica para administracin y


economa. 10 edicin. Cengage Learning. Mxico. Extracto de la tabla t.

Para los diversos problemas en los cuales es requieren valores de t o probabilidades


asociadas con valores de la variable t se pueden utilizar las tablas que indicamos a
continuacin.
Existen diversas tablas publicadas. La nica recomendacin importante para el uso es
considerar cuidadosamente qu probabilidad estn informando, y hacer uso de la
propiedad de simetra de la distribucin t (que se debe aplicar de manera anloga a la
de la distribucin normal, ya conocida del curso anterior).

Materia: Herramientas Matemticas V Estadstica II


Profesora: Vernica Herrero

- 14 -

Figura: Valores de la Tabla t (segn la probabilidad de la cola superior)

Materia: Herramientas Matemticas V Estadstica II


Profesora: Vernica Herrero

- 15 -

Figura: Valores de la Tabla t (segn la probabilidad de la cola superior) Continuacin

Fuente: Anderson, David y Sweeney, Dennis J. (2008) Estadstica para administracin y


economa. 10 edicin. Cengage Learning. Mxico.

Las distribuciones t de Student son parecidas a la normal. Se pueden utilizar para


hacer estimaciones de la media cuando se desconoce la varianza (situacin que de
ms est decirlo es la habitual) y se usan muestras pequeas.

Materia: Herramientas Matemticas V Estadstica II


Profesora: Vernica Herrero

- 16 -

Los intervalos as obtenidos son, no podra ser de otra manera, ms grandes y menos
precisos que los que se obtendran si conocemos la varianza en una distribucin
normal.
Si la variable aleatoria X es normal, el estadstico:

x
s
n
Se distribuye t con n-1 grados de libertad.

Para buscar valores de probabilidad o de la variable aleatoria en la tabla t, se deben


considerar los grados de libertad de la variable que se est analizando.

Grados de libertad
La idea de grados de libertad remite a la cantidad de valores de una muestra que
podran asumir cualquier valor. Si nosotros conocemos o calculamos en funcin de
tales datos un estadstico, podemos perder grados de libertad o valores que pueden
variar, del total de datos disponibles de la muestra. El Diccionario de metodologa
estadstica (Gonzalo Gonzalvo Maynar, 1978, Morata Ed., Madrid) indica que cuando
un estadstico se usa en la estimacin de un parmetro poblacional, los grados de
libertad dependen de las restricciones impuestas sobre las observaciones: cada
restriccin hace perder un grado de libertad.
Estimacin del intervalo de confianza
El intervalo de confianza para la media se construir segn el siguiente esquema:
Nivel de confianza: (1-)%
Lmites del intervalo:
Inferior:

x t

1 ;n 1
2

Superior:

x t

1 ;n 1
2

Materia: Herramientas Matemticas V Estadstica II


Profesora: Vernica Herrero

- 17 -

Veamos un ejemplo:
Repitamos el ejercicio vinculado con la altura promedio de una poblacin de
estudiantes varones de esta Universidad, pero ahora suponiendo que no
conocemos la varianza poblacional.
Supongamos que estimamos con los datos de la muestra la varianza muestral,
s2 = 16,16 cm2.
Trabajaremos con un 1-=0,95.

x 169,4 cm

29;1

2,0452

s 4,02
n 10
Por lo tanto, el intervalo que surge ser:

LI , LS 166,8; 171,99

La conclusin en este caso ser: Con un nivel de confianza del 95%, la altura
promedio de los varones de la poblacin de estudiantes de la Universidad es
atrapada por el intervalo [166,8 cm; 171,99 cm].
Si comparamos el resultado con el caso de varianza conocida (a pesar de la
pequea diferencia de varianzas implicadas), el intervalo que surge de
considerar que no conocemos la varianza implica un intervalo ms amplio
(menos preciso), lo cual est asociado con un mayor margen de seguridad
debido a que no conocemos el verdadero valor de la varianza.

Materia: Herramientas Matemticas V Estadstica II


Profesora: Vernica Herrero

- 18 -

Estimacin por intervalo de la proporcin


En el caso de datos categricos tambin podemos aplicar estimacin por intervalos de
la proporcin poblacional de casos que poseen cierta caracterstica.
Tal como sealamos en el caso de la estimacin puntual, la base de la estimacin va a
estar dada por la proporcin muestral.
La propiedad que permite hacer uso de la distribucin normal en este caso es la
aproximacin de la distribucin binomial a la normal cuando se verifican las
condiciones:
P.n5
y
(1-P).n5
Con esta premisa, los lmites del intervalo van a estar dados por:

LI , LS p Z1

p(1 p)
;pZ
1
n
2

p(1 p)

Donde:

p proporcin muestral
P proporcin poblaciona l
n tamao de la muestra
Z valor crtico de la distribuci n normal

Veamos un ejemplo de estimacin de una proporcin poblacional.


En un estudio de opinin pblica, en el cual se quiere estimar la proporcin de
votantes que elegirn a un candidato, se realiza una encuesta a una muestra
representativa de votantes. El tamao de la muestra es 400 casos.
Tras procesar las encuestas se obtiene que 178 individuos se encuentran seguros en
la eleccin del candidato en cuestin.
Cmo se estima la proporcin de electores que tendr el candidato en la eleccin,
con un nivel de confianza del 99%?
La estimacin puntual que surge de la proporcin muestral es:

Materia: Herramientas Matemticas V Estadstica II


Profesora: Vernica Herrero

- 19 -

178
400
p 0,445
p

Veamos si se cumplen las condiciones para aproximar la distribucin binomial a la


distribucin normal.
n . p = 400 . 0,445
= 178
n (1-p) = 400 . 0,555
= 222
En ambos casos se cumple la condicin.

Ahora procedamos a estimar el intervalo de confianza:

LI , LS p Z1

p(1 p)
;pZ
1
n
2

p(1 p)

El estadstico Z que tiene acumulada una probabilidad de 0,995,

2,576

LI , LS 0,445 2,576

0,445(1 0,445)
0,445(1 0,445)
;0,445 2,576

400
400

LI , LS 0,38;0,51
Como conclusin, podemos decir que con un nivel de confianza del 99%, el intervalo
[0,38; 0,51] atrapa el verdadero valor poblacional de la proporcin de votantes que
tienen decidido votar al candidato.
Observe que, dependiendo de los porcentajes de otros candidatos, esto podra
significar que pierda la eleccin (si obtiene un porcentaje inferior al 50% de los votos,
algn otro candidato puede alcanzar un porcentaje mayoritario) o bien que gane (si
obtiene un valor mayor al 50% de los votos), en ambos casos, con el nivel de
confianza definido que, siendo tan elevado, le permite estar casi seguro de que el
resultado se encuentra en el intervalo estimado.

Materia: Herramientas Matemticas V Estadstica II


Profesora: Vernica Herrero

- 20 -

Resumen de casos de estimacin


La siguiente figura resume los casos presentados de estimacin por intervalos.
Figura:

Fuente: Elaboracin propia

Cundo aplicar cada estadstico?

Como mencionamos, para estimar el intervalo para la media poblacional, se


aplica distribucin normal; en caso de distribucin normal de la variable de
estudio, o en su defecto, si la muestra es superior a 30 casos.

El uso de la distribucin t en la estimacin por intervalos de la media


poblacional es un requisito cuando desconocemos la varianza poblacional, con
distribucin de la variable de estudio normal si la muestra es menor a 30 casos,
y es recomendable, en idnticas condiciones, an cuando la muestra es mayor.
De hecho, los paquetes estadsticos, usan las pruebas t, en los casos en los
que se necesita estimar la varianza.

Para la estimacin de la proporcin poblacional, debe verificarse que tanto


p.n5 y (1-p).n5.

Materia: Herramientas Matemticas V Estadstica II


Profesora: Vernica Herrero

- 21 -

Un resultado fundamental para la Inferencia estadstica:


Si bien este tema fue desarrollado en Estadstica I, es muy importante recordarlo, ya
que es un concepto fundamental para la Inferencia estadstica, del cual se nutren los
contenidos de ste y los siguientes mdulos.

Teorema Central del lmite


Este resultado nos indica que:
Cuando el tamao es suficientemente grande, la distribucin de la variable aleatoria
media muestral puede aproximarse a la distribucin normal. Y esta relacin es vlida,
cualquiera sea la distribucin de los datos de la variable original.
Por ejemplo, si estamos interesados en analizar la media de ingresos en cierta
poblacin, an cuando la distribucin de ingresos en esa poblacin no sea normal, si
tomamos muestras suficientemente grandes, la distribucin en el muestreo de las
medias muestrales de ingresos, tendrn una forma aproximadamente normal.

Analicemos un ejemplo:

Analizamos la supervivencia adulta en una pequea poblacin rural. Uno de los datos
que analizamos es el nmero de hermanos tenidos en promedio.
Consideremos la siguiente tabla que indica el nmero de hermanos tenidos por todos
los residentes.

Materia: Herramientas Matemticas V Estadstica II


Profesora: Vernica Herrero

- 22 -

Tabla: Datos de anlisis


Caso

Nmero de
hermanos

Caso

Nmero de hermanos

26

27

28

29

30

31

32

33

34

10

35

11

36

12

37

13

38

14

39

15

40

16

41

17

42

18

43

19

44

20

45

21

46

22

47

23

48

24

49

25

50

La informacin que proveemos en la tabla anterior corresponde a los 50 residentes


mayores de 40 aos del paraje.
Vamos a analizar qu hubiramos estimado si las muestras hubieran sido de tamaos:
3, 5 y 7 casos. Para ejemplificar, tomamos 10 muestras de cada tamao, de entre
todas las posibles de ese tamao.

Materia: Herramientas Matemticas V Estadstica II


Profesora: Vernica Herrero

- 23 -

Tamao 3

Muestra

Casos seleccionados

24

14

37

49

11

41

48

21

50

30

10

40

48

26

34

11

17

47

40

10

31

47

11

Tamao 5

Muestra

Casos seleccionados

45

21

14

15

33

41

33

16

38

34

49

22

35

17

49

30

17

15

39

21

35

28

11

26

40

24

45

42

31

23

19

19

38

46

50

37

33

31

48

10

34

46

33

46

37

Materia: Herramientas Matemticas V Estadstica II


Profesora: Vernica Herrero

- 24 -

Tamao 7

Muestra

Casos seleccionados

40

41

20

14

17

32

30

50

23

45

21

13

37

30

13

22

17

35

10

25

19

28

17

14

42

28

31

41

27

36

10

14

20

38

36

18

38

48

18

48

35

46

17

23

39

14

33

19

48

10

13

49

20

27

48

34

Ahora, para muestra, calculemos la media muestral:

Muestra

Tamao 3
Valores de los casos de la
muestra seleccionada

Media muestral

4,33

5,67

2,67

4,67

3,33

4,33

10

4,33

Materia: Herramientas Matemticas V Estadstica II


Profesora: Vernica Herrero

- 25 -


Muestra

Tamao 5
Valores de los casos de la muestra
seleccionada

Media muestral

4 4 7 6 2

4,6

3 5 6 1 9

4,8

5 8 4 2 4

4,6

8 3 4 2 6

4,6

4 7 2 4 6

4,6

5 4 3 2 4

3,6

4 2 1 5 4

3,2

4 9 5 3 6

5,6

5 3 1 6 3

3,6

10

5 5 3 5 5

4,6

Muestra

Tamao 7
Valores de los casos de la muestra seleccionada

Media muestral

4,43

4,86

3,57

4,28

4,43

3,71

4 4

6,71

4,14

3,86

10

4,14

Veamos a continuacin cmo se distribuyen las medias muestrales obtenidas en cada


tamao de muestra, a travs de histogramas de frecuencia:
Figura: distribucin de medias muestrales de muestras de tamao 3

Materia: Herramientas Matemticas V Estadstica II


Profesora: Vernica Herrero

- 26 -

Figura: distribucin de medias muestrales de muestras de tamao 5

Materia: Herramientas Matemticas V Estadstica II


Profesora: Vernica Herrero

- 27 -

Figura: distribucin de medias muestrales de muestras de tamao 7

A partir de este ejemplo, qu reflexin puede hacer, teniendo en cuenta el Teorema


del Lmite central, vinculada con la media muestral que se analiza de una muestra en
particular (y el tamao de una muestra que se considere), y la probabilidad de
aproximarse lo ms posible al verdadero valor del parmetro poblacional de inters?

Materia: Herramientas Matemticas V Estadstica II


Profesora: Vernica Herrero

- 28 -