You are on page 1of 26

Seminario A: ESTADISTICA APLICADA A LA EDUCACIÓN

TRABAJ O FINAL
 Desarrollar el marco teórico de la teoría de muestro.
 Resolver los siguientes ejercicios.

1. En la tabla se muestran los promedios de una muestra de alumnos de un colegio
secundario cuya población es de 126 alumnos. Se sabe que la varianza de la población
es igual a la varianza de la muestra.
a. Hallar los límites de confianza del 95% para la media población.
b. Hallar el nivel de confianza para afirmar que la media de la población es 6,94± 0,1.
7,25 4,66 6,97 6,58 5,77
6,33 6,38 7,06 3,08 8,3
4,55 8,25 8,33 7,45 7,51
5,74 9,15 6,92 9,51 7,03
6,98 6,55 5,19 5,14 6,8
3,86 6,89 7,45 7,02 7,25
6,03 7,47 7,02 6,9 6,68
6,58 7,92 8,6 8,85 5,22
7,06 8,26 6,71 7,96 7,44
8 8,47 8,23 5,16 8,09


2. De una muestra de 15 alumnos del nivel medio se encontró que el tiempo medio
empleado para recibirse es de 5 años y 9 meses; y desviación típica de 27 días.
a. Encontrar los límites del nivel de confianza del 95% para el tiempo medio.
b. Expresar el resultado del ítem a en términos probabilísticos.

3. El 60% de una muestra de 80 estudiantes de un colegio secundarios eligieron
ingles y el resto francés. Encontrar los límites confianza del 96% de la proporción de
estudiantes secundarios que eligen ingles.

4. A los alumnos de una muestra aleatoria de 200 alumnos de escuelas técnicas y
600 de ENS (no técnicas) se les preguntó si les gustaba la matemática. 120 alumnos de
escuelas técnicas y 280 alumnos de ENS contestaron que sí. Hallar los límites de
confianza del 98% para la diferencia de proporciones de los alumnos de ENS y de
escuelas técnicas.


TEORÍA DE MUESTREO

La teoría de muestreo se refiere al estudio de las relaciones que existen entre
una población y las muestras que se extraen de las mismas. El estudio de las muestras
permite hacer estimaciones de características desconocidas de la población (tales
como media, desviación típica, proporciones, etc.). Estas estimaciones se hacen a partir
del conocimiento de las características de las muestras (media, desviación típica,
proporción, etc.).
Las características o medidas obtenidas de una muestra se llaman estadísticos;
y las medidas correspondientes a la población parámetros. Cuando una medida
muestral o estadístico es utilizada como representante de una característica poblacional
o parámetro se denomina estimador.
Actualmente el muestreo puede ser considerado como un instrumento
organizado para obtener hechos. Permite que se tomen decisiones que toman en
cuenta factores de importancia de los problemas que se desean resolver, además de
ocuparse de la adecuada presentación de los hechos individuales registrados y de la
manera en que estos se recopilan y resumen.
En el diseño de una muestra hay que considerar dos aspectos: inicialmente un
proceso de selección, en la que se incluyen en la muestra algunos elementos de la
población; y posteriormente un proceso de estimación, en el que se llevan a cabo los
cálculos de las estadísticas de la muestra, que son estimadores muestrales de valores
de la población.
El diseño de una muestra considera las tareas de selección y estimación para
realizar inferencias que vayan del valor muestral al valor de la población. Un valor de la
población es una expresión numérica que sintetizan los valores de una o varias
características de la totalidad de la población; en otras palabras, una medida resumen
de una cualidad de la distribución de la variable o variables en la población definida.
El valor de la muestra, o estadística, es una estimación que se calcula a partir
de los elementos que conforman la muestra. Por el contrario, el valor de la población
depende de todos los elementos que forman parte de la población.
Una de las desventajas al utilizar el muestreo, es que dentro de los valores
muestrales que se pueden obtener, es posible llegar a toparse con algunas deficiencias
resultado de una designación de solo una fracción de la población total a ser observada
en la muestra, sin embargo, al realizar un buen diseño de muestra, se tiene como
consecuencia que estos errores tengan la menor presencia posible.
En general, correspondiente a cada parámetro poblacional habrá un estadístico
a calcularse de la muestra. Comúnmente el método para obtener un estadístico de la
muestra es semejante al de obtener el parámetro de una población finita, ya que una
muestra consiste de un conjunto finito de valores. Sin embargo, esto no siempre
produce el mejor estimador y uno de los problemas importantes de la teoría de
muestreo es decidir cómo formar el estadístico muestral apropiado que mejor estime un
parámetro poblacional dado.
Donde sea posible se utilizarán letras griegas, tales como , , µ o etc., para
valores de parámetros poblacionales y letras romanas , , m s etc., para valores del
correspondiente estadístico muestral.

Muestras aleatorias:
Como la inferencia estadística se formula con base en una muestra de objetos
de la población de interés, el proceso por medio del cual se obtiene será aquel que
asegure la selección de una buena muestra. Una manera de obtener una buena
muestra resulta cuando el proceso de muestreo proporciona, a cada objeto en la
población, una oportunidad igual e independiente de ser incluido en la muestra. Si la
población consiste de N objetos y de estos se selecciona una muestra de tamaño n, el
proceso de muestro debe asegurar que cada muestra de tamaño n tenga la misma
probabilidad de ser seleccionada. Este procedimiento conduce a lo que comúnmente se
conoce como una muestra aleatoria simple. En este contexto, la palabra aleatorio
sugiere una total imparcialidad en la selección de la muestra.

Muestreo con o sin remplazamiento:
Hablamos de muestreo con remplazamiento cuando un elemento de la
población puede ser escogido varias veces para formar parte de la muestra.
El muestreo sin remplazamiento es cuando un elemento de la población solo
puede ser seleccionado una sola vez para formar parte de la muestra.
De esta manera, una población finita, en la que se realiza un muestreo con
remplazamiento, puede teóricamente ser considerada como infinita, puesto que puede
extraerse cualquier número de muestras sin agotar la población.

Parámetros poblacionales:
Se considera que se conoce una población cuando conocemos la distribución
de probabilidad ( )
f x (función de probabilidad o función de densidad) de la variable
aleatoria asociada X . Existirán ciertas cantidades que aparecen en
( )
f x , como µ y
o el caso de la distribución normal o p en el caso de distribución binomial. Otras
cantidades como la mediana, los momentos, sesgos, etc., pueden determinarse en
términos de éstos. Todas estas cantidades se conocen como parámetros poblacionales.
Cuando tenemos una población dada, de manera que conocemos ( )
f x , entonces los
parámetros de la población también se conocen.
Un problema importante surge en el caso de que la distribución de probabilidad
( )
f x de la población no se conozca precisamente, aunque podemos tener idea de él,
o al menos podemos formular alguna hipótesis relativa al, comportamiento general de
( )
f x Así por ejemplo podemos tener alguna razón para suponer que una población
determinada está distribuida normalmente. En tal caso no sabríamos uno o ambos
valores de µ y o y así desearíamos estimarlos.

Estadísticos muestrales:
Podemos tomar muestras aleatorias de la población y entonces emplearlas para
obtener valores que sirven para estimar los parámetros poblacionales
En general, una muestra de tamaño n puede describirse por los valores

1 2
, ,...,
n
x x x de las variables aleatorias
1 2
, ,...,
n
X X X . En el caso de muestreo
con remplazamiento
1 2
, ,...,
n
X X X serían variables aleatorias independientes
distribuidas idénticamente con distribución de probabilidad
( )
f x . Entonces su
distribución conjunta sería
( ) ( ) ( ) ( )
1 1 2 2 1 2
, ,...,
n n n
P X x X x X x f x f x f x = = = =
En otras palabras, como hemos enunciado antes las características o medidas
obtenidas de una muestra se llaman estadísticos; y las medidas correspondientes a la
población parámetros. Cuando una medida muestral o estadístico es utilizada como
representante de una característica poblacional o parámetro se denomina estimador.

Distribución muestral:
Se define la distribución muestral de un estadístico (distribución de muestreo)
en una población, como la distribución de probabilidad de todos los posibles valores
que un estadístico puede asumir para cierto tamaño de la muestra. Específicamente, se
trabajará con las distribuciones muestrales para: medias, proporciones y varianzas.
Una distribución muestral es una distribución de probabilidad de un estadístico
muestral calculado a partir de todas las muestras posibles de tamaño n , elegidas al
azar en una población determinada. Si la población es infinita, tenemos que concebir la
distribución muestral como una distribución muestral teórica, ya que es imposible sacar
todas las muestras aleatorias posibles de tamaño n de una población infinita. Si la
población es finita y moderada se puede construir una distribución muestral
experimental, sacando todas las muestras posibles de un tamaño dado, calculando
para cada muestra el valor del estadístico que nos interesa.

Distribución muestral de medias:
Sea
1 2
, ,...,
n
X X X las variables aleatorias para una muestra específica de
tamaño n , la media de la muestra o media muestral es una variable aleatoria definida
por

1 2
...
n
X X X
X
n
+ + +
=
La distribución muestral de medias es la distribución de probabilidad de todas
las medias posibles de las muestras, para un tamaño n determinado. Esta distribución
de probabilidad tiene asociados (parámetros) tales como la media
X
µ , desviación
estándar
X
o y varianza
2
X
o . Para calcular, estos parámetros de la distribución muestral
de medias se utilizan las siguientes relaciones:
X
µ µ =
2
2
1
1
X
X
N n
n N
N n
N n
o
o
o
o
÷
=
÷
÷
=
÷
para poblaciones finitas


2
2
X
X
n
n
o
o
o
o
=
=
para poblaciones infinitas
La expresión de la desviación estándar de la distribución muestral de medias,
se le llama error típico o estándar de la media y nos indica la diferencia promedio entre
los diversos valores de X y µ . Como se observa, a medida que el tamaño de la
muestra aumenta este error disminuye, las diversas medias muestrales se hacen más
uniforme en su valor, y en consecuencia, cualquier media muestral es una buena
estimación de la media poblacional µ .
Para valores grandes de n con 30 n > la distribución muestral de medias se
aproxima a una distribución normal con media
X
µ y desviación estándar
X
o
independiente de la población de que se trate (siempre que la media y la varianza
poblacional sean finitas y el tamaño de la población sea al menos dos veces el tamaño
de la muestra). Este resultado en una población infinita es un caso especial del teorema
del límite central de teoría de probabilidad superior que demuestra que la aproximación
es tanto mejor conforme n se hace mayor. Esto se indica diciendo que la distribución
muestral es asintóticamente normal.
En caso de que la población se distribuya normalmente, la distribución muestral
de medias se distribuye también normalmente, incluso para pequeños valores de n (es
decir, 30 n < ).
Si la población de la cual se toman las muestras tiene una distribución de
probabilidad con media µ y varianza
2
o que no necesariamente tiene una distribución
normal. Entonces la variable tipificada asociada con X , dada por

X
Z
n
µ
o
÷
=


Distribución muestral para la diferencia de medias
( )
1 2 X X ÷ :
A veces interesa hacer inferencias sobre la diferencia poblacional de medias
1 2
µ µ ÷ , o saber si es razonable concluir que dos medias poblacionales no son iguales,
considerando que se tienen sendas muestras para las poblaciones 1 y 2,
respectivamente, donde:
1
1
2
1
1
2
2
2
Tamaño de la muestra de la población 1
Media de la muestra 1
Varianza de la población 1
Tamaño de la muestra de la población 2
Media de la muestra 2
Varianza de la población 2
n
X
n
X
o
o
=
=
=
=
=
=

Entonces, la diferencia de las medias muestrales 1 2 X X ÷ , estima a
1 2
µ µ ÷ .
La forma funcional de la distribución muestral de 1 2 X X ÷ depende de la forma
funcional de las poblaciones donde se extraen las muestras tomando en cuenta:
- Si ambas poblaciones son normales la distribución muestral de la diferencia de
medias es normal.
- Si una o ambas de las poblaciones no es normal, la distribución muestral de
las diferencias de medias 1 2 X X ÷ es normal si
1 2
, 30 n n > (grandes muestras), este
resultado se deduce del teorema del límite central.
En estos casos, los parámetros que definen esta distribución muestral de las
diferencias de medias vienen dados por:
1 2
1 2
1 2
2 2
1 2
1 2
X X
X X
n n
µ µ µ
o o
o
÷
÷
= ÷
= +

El cual se aplica para dos casos específicos dependiendo de la muestra:
a) Para grandes muestras, cuando
1 2
, 30 n n > , se trabaja con la distribución
normal. En estos casos, estandarizando la diferencia de medias muestrales, se tiene:
( )
( ) 1 2
1 2
2 2
1 2
1 2
X X
Z
n n
µ µ
o o
÷ ÷ ÷
=
+

b) Para pequeñas muestras, Cuando
1 2
, 30 n n < , se trabaja con la Distribución
t de Student. Por lo tanto, el valor viene dado por:
( )
( ) 1 2
1 2
2 2
1 2
p p
X X
t
S S
n n
µ µ ÷ ÷ ÷
=
+

Donde:
( ) ( )
2 2
2 1 1 2 2
1 2
1 1
p
n S n S
S
n n
÷ ÷ ÷
=
+


Distribución de una proporción muestral:
Existen ocasiones en las cuales no estamos interesados en la media de una
muestra, sino que queremos investigar la proporción de casos con cierta preferencia, en
la muestra. Supóngase una población infinita y que la probabilidad de ocurrencia de un
suceso (conocido como su éxito) es p , mientras que la probabilidad de no ocurrencia
del suceso es 1 q p = ÷ .
Esta distribución se genera de igual manera que la distribución muestral de
medias, a excepción de que al extraer las muestras de la población se calcula el
estadístico proporción. Se define una proporción muestral como el cociente:


Números de casos favorables
Total de casos o tamaño de la muestra
p
p µ = =

La distribución muestral de proporciones está estrechamente relacionada con la
distribución binomial; una distribución binomial es una distribución del total de éxitos en
las muestras, mientras que una distribución de proporciones es la distribución de un
promedio (media) de los éxitos.
La distribución de una proporción muestral, se define de una manera análoga a
la distribución de media, o sea que para las muestras
1 2
, ,...,
n
n n n se tendrá
1 2
, ,...,
n
p p p

distribución de una proporción muestral.
De acuerdo a lo expuesto, la distribución muestral de proporciones corresponde
a una distribución de probabilidad de todas las proporciones posibles de las muestras,
para un tamaño n determinado.
Los parámetros que definen esta distribución vienen dados por:
p
p
P µ µ = =
2
1
1
p
p
p q N n
n N
p q N n
N n
o
o
÷
=
÷
÷
=
÷
para poblaciones finitas


2
p
p
p q
n
p q
n
o
o
=
=
para poblaciones infinitas
Para el cálculo de probabilidades relativa a proporciones, se trabaja de manera
análoga al caso de la distribución muestral de medias.


Distribución muestral para la diferencia de proporciones
( ) 1 2
p p ÷ :
De manera análoga a la distribución muestral para la diferencia de medias
pueden obtenerse para distribuciones muestrales de diferencias de proporciones de dos
poblaciones distribuidas binomialmente con parámetros
1 1
, p q y
2 2
, p q respectivamente.
En este caso
1 2
y S S corresponden a las proporciones de éxitos
1 2
y P P resultando:
1 2 1 2
1 2 1 2
1 2
2 2
1 1 2 2
1 2
P P P P
P P P P
p p
p q p q
n n
µ µ µ
o o o
÷
÷
= ÷ = ÷
= + = +

En vez de tomar diferencias de estadísticos algunas veces estamos interesados
en la suma de estadísticos. En tal caso la distribución muestral de la suma de
estadístico
1 2
y S S tiene media y desviación estándar dada por
1 2 1 2
1 2 1 2
2 2
S S S S
S S S S
µ µ µ
o o o
+
+
= +
= +


Distribución muestral de varianza:
Si
1 2
, ,...,
n
X X X

denota las variables aleatorias para una muestra de tamaño n
, entonces la variable aleatoria que da la varianza de la muestra o la varianza muestral
se define como

( )
2
2
1
n
i
i
X X
S
n
=
÷
=
¿

Siempre que el valor esperado de un estadístico sea igual al parámetro
poblacional correspondiente llamamos al estadístico un estimador insesgado, y el valor
una estima insesgada, de este parámetro y vendrá dada por

2
2
2
1
S
n
S
n
µ o
÷
= =
Que está muy próximo a
2
o solamente para grandes valores de
( )
30 n n > . El
estimador insesgado está definido por
( )
2
2
2
1
1
1
n
i
i
X X
n
S S
n n
=
÷
÷
= =
÷
¿

Debido a estos, algunos estadistas escogen para definir la varianza muestral
por
2
S en cambio de
2
S y sencillamente remplazan n por 1 n ÷ en el denominador.
Si el muestreo es sin remplazo de una población finita de tamaño N , entonces
la media de la distribución muestral de varianza está dada por
2
2
1
1
S
N n
N n
µ o
÷
| || |
=
| |
÷
\ .\ .

Tomando todas las posibles muestras aleatorias de tamaño n extraídas de una
población y computando la varianza para cada muestra de
2
S ó
2
S es conveniente
hallar la distribución muestral de la variable aleatoria relacionada
( )
( )
2
2
2
1
2 2 2
1
n
i
i
X X
n S
nS
o o o
=
÷
÷
= =
¿

Si la varianza poblacional se conoce, entonces:
Para grandes muestras, cuando 30 n > , hallamos la variable tipificada, se
tiene:
X
Z
n
µ
o
÷
=
Para pequeñas muestras, Cuando 30 n < , se trabaja con la distribución t de
Student. Por lo tanto, el valor viene dado por:
1
X X
T
S
S
n
n
µ µ ÷ ÷
= =
÷

T tiene una distribución t de Student con 1 n ÷ grados de libertad.

Estimación de parámetros:
Estimador: Un estimador de un parámetro poblacional es una función de los
datos muestrales, también llamado estadístico. En pocas palabras, es una fórmula que
depende de los valores obtenidos de una muestra, para realizar estimaciones.
Formalmente, si u

es un parámetro poblacional, se dice que u es un estimador
puntual de u

si
( )
1 2
, ,...,
n
x x x u u = , donde
1 2
, ,...,
n
x x x

son las variables aleatorias que
integran una muestra aleatoria de tamaño N de la población en cuestión.
Por ejemplo, un estimador de la media poblacional
( ) µ , puede ser la media
muestral
( )
X según la siguiente fórmula:
1
1
n
i
i
X x
n
µ
=
~ =
¿

donde
1 2
, ,...,
n
x x x

es el conjunto de de datos de la muestra X .
El estimador es una variable aleatoria que asigna a cada posible valor de la
muestra un valor numérico. Como tal, tiene sentido calcular su esperanza, su varianza y
otras características propias de las variables aleatorias.

Estimador consistente:
Es razonable esperar que un buen estimador de un parámetro u sea cada vez
mejor conforme crece el tamaño de la muestra. Esto es, conforme la información en una
muestra aleatoria se vuelve cada vez mas completa, la distribución de muestreo de un
buen estimador se encuentra cada vez mas concentrada a través del parámetro u . Se
tendrá un mejor estimador de u si se basa en 30 observaciones que si lo hacen con
solo 5. Esta idea origina lo que se conoce como un estimador consistente.

Estimación puntual
Para estimar un parámetro u de una población se toma una muestra
representativa de la misma y se calcula el estadístico u , el valor del estadístico se
conoce como la estimación puntual del parámetro u . Por ejemplo:
Parámetro Estimación puntual
u µ =
X u = (media muestral)
u o =
S u = (varianza muestral)
p u =
p u = (proporción muestral)
1 2
u µ µ = ÷
1 2
X X ÷ (diferencia muestral de media)

Estimación por intervalos de confianza
En la sección anterior se habló sobre la estimación puntual, una de sus
desventajas es el hecho de no saber qué tan próxima está del parámetro, es decir,
cuando se obtiene una estimación u , a partir de una muestra aleatoria de tamaño n ,
se desconoce que tan cerca (por defecto o exceso) está del parámetro a estimar u .
Por eso se utiliza frecuentemente otro tipo de estimación, la estimación por intervalos,
la cual nos permite de acuerdo a un nivel de confianza especificado obtener una
información más precisa sobre el parámetro a estimar.
1. Intervalo de confianza para medias con 30 n > (grandes muestras):
2 2
, X Z X Z
n n
o o
o o
µ
| |
e ÷ +
|
\ .
es una estimación por intervalo de la media de
la población para un nivel de confianza del
( )
1 % o ÷ ; por ejemplo, si se define un nivel
de confianza del 95 %, esto significa que por cada 100 muestras de tamaño 30 n > en
95 de ellas la media de la población cae dentro de este intervalo.

2. Intervalo de confianza para medias con 30 n < (pequeñas muestras):
Se utiliza la t de Student para estos casos y cuando se desconoce la
desviación de la población, utilizando la siguiente expresión
2 2
,
S S
X Z X Z
n n
o o
µ
| |
e ÷ +
|
\ .

Es una estimación por intervalo de la media de la población para un nivel de
confianza del ( )
1 % o ÷

3. Intervalo de confianza para diferencias de medias ( )
1 2
µ µ ÷ :
a) Si 30 n > (grandes muestras) se usa la distribución normal:
( )
( ) ( )
2 2 2 2
1 2 1 2
1 2 1 2
1 2
1 2 1 2 2 2
, X X Z X X Z
n n n n
o o
o o o o
µ µ
| |
÷ e ÷ ÷ + ÷ + + |
|
\ .

b) si n < 30 (pequeñas muestras) se usa la t de Student:
( )
( ) ( )
2 2 2 2
1 2 1 2
1 2 1 2
1 2
1 2 1 2 2 2
,
S S S S
X X Z X X Z
n n n n
o o
µ µ
| |
÷ e ÷ ÷ + ÷ + + |
|
\ .

para un nivel de confianza del
( )
1 % o ÷ y
1 2
, 30 n n <
donde
( ) ( )
2 2
2 1 1 2 2
1 2
1 1
p
n S n S
S
n n
÷ ÷ ÷
=
+

4. Intervalo de confianza para proporciones
( )
p :
a) grandes muestras:
2 2
,
p q p q
p p Z p Z
n n
o o
| |
e ÷ +
|
\ .

b) pequeñas muestras:
2 2
,
p q p q
p p t p t
n n
o o
| |
e ÷ +
|
\ .

5. Intervalo de confianza para varianzas:
( ) ( )
2 2
2 2
1
2 2
1 1
,
n S n S
o o
o
ì ì
÷
| |
| ÷ ÷
e
|
|
\ .

Estimador insesgado:
Por supuesto, cualquier función de la muestra, con la definición anterior, podría
ser un estimador, pero es deseable que las estimaciones que surjan a partir de un
estimador "se parezcan", en cierto modo, al parámetro que se desea estimar.
Con este propósito, se dice que un estimador de un parámetro θ es insesgado
si su esperanza es el propio θ.


Estimación puntual
Consiste en la estimación del valor del parámetro mediante un sólo valor,
obtenido de una fórmula determinada. Por ejemplo, si se pretende estimar la talla media
de un determinado grupo de individuos, puede extraerse una muestra y ofrecer como
estimación puntual la talla media de los individuos. Lo más importante de un estimador,
es que sea un estimador eficiente. Es decir, que sea insesgado (ausencia de sesgos) y
estable en el muestreo o eficiente (varianza mínima).

Variabilidad del Parámetro
Si no se conoce, puede obtenerse una aproximación en los datos aportados por
la literatura científica o en un estudio piloto. También hay métodos para calcular el
tamaño de la muestra que prescinde de este aspecto. Habitualmente se usa como
medida de esta variabilidad la desviación típica poblacional y se denota σ.

Error de la estimación
Es una medida de su precisión que se corresponde con la amplitud del intervalo
de confianza. Cuanta más precisión se desee en la estimación de un parámetro, más
estrecho deberá ser el intervalo de confianza y, si se quiere mantener o disminuir el
error, más ocurrencias deberán incluirse en la muestra estudiada. En caso de no incluir
nuevas observaciones para la muestra, más error se comete al aumentar la precisión.
Se suele llamar E, según la fórmula E = θ
2
- θ
1
.

Valor α
También llamado nivel de significación. Es la probabilidad (en tanto por uno)
de fallar en nuestra estimación, esto es, la diferencia entre la certeza (100) y el nivel de
confianza (1-α). Por ejemplo, en una estimación con un nivel de confianza del 95%, el
valor α es (100-95)/100 = 0,05

Valor crítico
Se representa por
2
Z
o
. Es el valor de la abscisa en una determinada
distribución que deja a su derecha un área igual a
2
o
, siendo
( )
1 o ÷ el nivel de
confianza. Normalmente los valores críticos están tabulados o pueden calcularse en
función de la distribución de la población. Por ejemplo, para una distribución normal, de
media 0 y desviación típica 1, el valor crítico para α = 0,1 se calcularía del siguiente
modo: se busca en la tabla de la distribución ese valor (o el más aproximado), bajo la
columna "Área"; se observa que se corresponde con -1,28. Entonces
2
Z
o
= 1,64. Si la
media o desviación típica de la distribución normal no coinciden con las de la tabla, se
puede realizar el cambio de variable
( )
x
X
X
t
µ
o
÷
= para su cálculo.
- Con estas definiciones, si tras la extracción de una muestra se dice que "3 es
una estimación de la media con un margen de error de 0,6 y un nivel de confianza del
99%", podemos interpretar que el verdadero valor de la media se encuentra entre 2,7 y
3,3, con una probabilidad del 99%. Los valores 2,7 y 3,3 se obtienen restando y
sumando, respectivamente, la mitad del error, para obtener el intervalo de confianza
según las definiciones dadas.
- Para un tamaño fijo de la muestra, los conceptos de error y nivel de confianza
van relacionados. Si admitimos un error mayor, esto es, aumentamos el tamaño del
intervalo de confianza, tenemos también una mayor probabilidad de éxito en nuestra
estimación, es decir, un mayor nivel de confianza.

Otros usos del término
El término estimación también se utiliza en ciencias aplicadas para hacer
referencia a un cálculo aproximado, que normalmente se apoya en la herramienta
estadística aunque puede no hacerlo. En este sentido, un ejemplo clásico son los poco
conocidos pero útiles en economía problemas de Fermi.

Otros datos estadísticos:
Muchos otros datos estadísticos además de la media, varianza y desviación
típica pueden definirse para muestras. Por ejemplo la mediana, la moda, la moda, los
momentos, el sesgo, la curtosis, etc. Sus definiciones son análogas a esas dadas para
poblaciones. Algunos de estos se presentan en la siguiente tabla:

Errores típicos para algunas distribuciones muestrales

Distribución
Muestral
Error Típico Notas Especiales
Medias
X
n
o
o =
Se cumple para grandes muestras o pequeñas
donde la población es finita o el muestreo es con
remplazamiento. La distribución muestral de
medias se ajunta mucho a una normal para
30 n > incluso para poblaciones no normales
X
µ µ = , la media poblacional en todos los
casos.
Proporciones
( )
1
P
p p
p q
n n
o
÷
= =
Las notas anteriores para medias son igualmente
aplicables aquí
P
P µ = en todos los casos.
Desviación
Típica
( )
( )
4
4
2
1
2
2
4
S
S
n
n
t
o o
µ o
o
o
=
÷
=

Para 30 n > , la distribución muestral de S es
muy próxima a una normal.
S
o está dada por (1) solamente cuando la
población es normal (o aproximada). Si la
población no es normal, puede utilizarse (2).
Nótese que (2) pasa a ser (1) cuando
4
4
30 µ =
lo que se cumple para poblaciones normales.
Para 100,
S
n µ > ≥100 con gran aproximación.
Medianas
1, 2533
2
med
n n
t o o
o o = =


Para 30 n > , la distribución muestral de la
mediana es muy próxima a una normal. Los
resultados dados son válidos solamente si la
población es normal o aproximadamente normal.
med
µ µ =
Varianzas
( )
( )
2
2
2
2
1
2
S
t
P
S
n
n
o o
µ o
o
=
÷
=

Las notas para desviaciones típicas son
igualmente aplicables aquí. Nótese que (2) pasa a
ser (1) en caso de que la población sea normal.
( )
2
2
1
s
n
n
o
µ
÷
=
que es casi igual a
2
o para valores ( )
30 n n s


Resolución de problemas
1 .En la tabla se muestran los promedios de una muestra de alumnos de un colegio
secundario cuya población es de 126 alumnos. Se sabe que la varianza de la población
es igual a la varianza de la muestra.
a. Hallar los límites de confianza del 95% para la media población.
b. Hallar el nivel de confianza para afirmar que la media de la población es 6,94± 0,1.
7,25 4,66 6,97 6,58 5,77
6,33 6,38 7,06 3,08 8,3
4,55 8,25 8,33 7,45 7,51
5,74 9,15 6,92 9,51 7,03
6,98 6,55 5,19 5,14 6,8
3,86 6,89 7,45 7,02 7,25
6,03 7,47 7,02 6,9 6,68
6,58 7,92 8,6 8,85 5,22
7,06 8,26 6,71 7,96 7,44
8 8,47 8,23 5,16 8,09

Cálculo de la media:
6,932 X =
Cálculo de la desviación típica y varianza:

2
1,756128 o =
1,3251892 o =
Hallamos la Varianza respecto a la media
0,18741014
X
n
o
o = =


Sabemos que:
Coeficiente de
confianza
1 ÷
(1 ÷ ) z LIC
u

÷ c
u
o


LSC
u

+ c
u
o


0.90 0.45 1.645
u

÷ 1.645
u
o

u

+ 1.645
u
o


0.95 0.475 1.96
u

÷ 1.96
u
o

u

+ 1.96
u
o


0.99 0.495 2.575
u

÷ 2.575
u
o

u

+ 2.575
u
o



Límite inferior de confianza:
1,96 6,56467613
X
X o ÷ =
Límite superior de confianza:
1,96 7, 29932387
X
X o + =
También los límites de confianza pueden ser representados por:
Conclusión: Los límites de confianza del 95% para la media de la población son:
Puesto que la población nos es muy grande en relación con el tamaño de la muestra
debe emplearse la fórmula para poblaciones finitas con muestreo sin remplazamiento.
Entonces:
6,94 0,1
1
c
X
N n
X Z
N
o
÷
± = ±
÷

( )
6,56467613 7, 29932387
6,932
2
X
+
e =
Respuestas:
a) Los límites de confianza del 95% para la de la población:
[6,564; 7,299].
b) El nivel de confianza para afirmar que la de la población es 6,94 0,1 es:

Entonces el nivel de confianza es del 0,0693 %.

2. De una muestra de 15 alumnos del nivel medio se encontró que el tiempo medio
empleado para recibirse es de 5 años y 9 meses; y desviación típica de 27 días.
a. Encontrar los límites del nivel de confianza del 95% para el tiempo medio.
b. Expresar el resultado del ítem a en términos probabilísticos.
n= 15 alumnos.
= 5 años, 9 meses.
Considerando que un mes tiene 30 días, entonces:
9 meses 270 días.
5 años___ 12 meses____ 360 días.
Tiempo para recibirse 630 días


2
27días o =

27
1,341640787
15
X
n
o
o = = =
630 1,96 1,341640787
c
X
X Z o ± = ±
= 630 2,629615942
=
= -627,3703841
Entonces el intervalo quedara formado por:
[627,3703; 632,6296] en días.


Respuesta:
P( 627,3703 632,6296).


4. A los alumnos de una muestra aleatoria de 200 alumnos de escuelas técnicas y 600
de ENS (no técnicas) se les preguntó si les gustaba la matemática. 120 alumnos de
escuelas técnicas y 280 alumnos de ENS contestaron que sí. Hallar los límites de
confianza del 98% para la diferencia de proporciones de los alumnos de ENS y de
escuelas técnicas.

98%___ t
c
Z
c
= 2, 33

Escuelas técnicas
- P
1
=

- Q
1=


ENS:
- P
2
=

- Q
2=
1-p
2
= 0,5

Entonces:

1
-
2
= 0,6 – 0, 4

= 0,1

1 1
1
p q
n
=

2 2
2
p q
n
=

1 1 2 2
1 2
1 2
0,13 2,33 0, 0012 0, 000414814
c
p q p q
p p Z
n n
÷ ± + = ± +

Respuesta:
Los límites de confianza del 98% para la diferencia de proporciones de los alumnos de
ENS y de escuelas técnicas es (0,039702869

)