UTPAQP ESTADISTICA Y PROBABILIDADES II

1

Tabla de contenido
INTERVALOS DE CONFIANZA ................................ ................................ ................................ ....... 2
I. Concepto de Intervalo de Confianza. ................................ ................................ ................... 2
II. Intervalo de confianza para la Media muestral ................................ ................................ .... 3
a) Población Conocida ʹ Desviación poblacional conocida (n>30): ................................ ....... 3
b) Población Desconocida ʹ Desviación Poblacional Desconocido (n>30) ............................. 3
c) Población Normal ʹ Desviación Poblacional Conocido ................................ ..................... 4
d) Población Normal ʹ Desviación Poblacional Desconocido ................................ ................ 4
III. Intervalo de Confianza para una Proporción................................. ................................ ... 5
IV. Uso de Intervalos de Confianza para verificar Hipótesis. ................................ .................. 5
V. Intervalo de confianza para la varianza ................................ ................................ ............... 6
Ejemplo ................................ ................................ ................................ .............................. 7
VI. Intervalo de confianza para la diferencia de medias poblacionales................................ .. 8
VII. Intervalos de confianza para la diferencia de proporciones................................ ........... 10
VIII. Desigualdad de Chevychev ................................ ................................ ............................ 11


UTPAQP ESTADISTICA Y PROBABILIDADES II
2

INTERVALOS DE CONFIANZA
I. Concepto de Intervalo de Confianza.
En el contexto de estimar un parámetro poblacional, un intervalo de confianza es un rango de
valores (calculado en una muestra) en el cual se encuentra el verdadero valor del parámetro,
con una probabilidad determinada.

La probabilidad de que el verdadero valor del parámetro se encuentre en el intervalo construido
se denomina nivel de confianza, y se denota 1-ɲ. La probabilidad de equivocarnos se llama nivel
de significancia y se simboliza ɲ. Generalmente se construyen intervalos con confianza 1- ɲ
=95% (o significancia ɲ =5%). Menos frecuentes son los intervalos con ɲ=10% o ɲ=1%.
Para construir un intervalo de confianza, se puede comprobar que la distribución Normal
Estándar cumple:
P (-1.96 < z < 1.96) = 0.95
(Lo anterior se puede comprobar con una tabla de probabilidades o un programa computacional
que calcule probabilidades normales).
Luego, si una variable X tiene distribución N( ,
2
), entonces el 95% de las veces se cumple:

Despejando en la ecuación se tiene:

El resultado es un intervalo que incluye al el 95% de las veces. Es decir, es un intervalo de
confianza al 95% para la media cuando la variable X es normal y es conocido.





UTPAQP ESTADISTICA Y PROBABILIDADES II
3

II. Intervalo de confianza para la Media muestral
a) Población Conocida ʹ Desviación poblacional conocida (n>30):
ܫܥ ቆ
x

ଵି
ן

ʍ
ξ
൑ ʅ ൑
x

ଵି
ן

ʍ
ξ
ቇ ൌ ሺͳെןሻ
X= media de la muestra
Z
ɲ/2
= valor de Tablas de Z con ɲ/2 en cada extremo
ʍ = Desviación Estándar de la Población
Para la muestra:
 ൌ

ଵିןȀଶ

כ ʍ

‡


Ejemplo
Se toma una muestra aleatoria de tamaño n=36, y la distribución de X es normal. Si la
desviación estándar de la población (ʍ) es 18. El valor esperado de X es la media de la
Población (µ), el parámetro que se está estimando, y el error estándar de X es:

Según las propiedades de la distribución Normal, existe un 95% de probabilidad que X se
encuentre en el rango entre µ y 1.96 errores estándar.

b) Población Desconocida ʹ Desviación Poblacional Desconocido (n>30)
En la práctica si la media poblacional es desconocida entonces, es bien probable que la
varianza también lo sea puesto que en el cálculo de W
2
interviene Q. Si ésta es la
situación, y si el tamaño de muestra es grande (n> 30), entonces W
2
es estimada por la
varianza muestral s
2
y se puede usar la siguiente fórmula para el intervalo de confianza de
la media poblacional:
UTPAQP ESTADISTICA Y PROBABILIDADES II
4

ܫܥ ቆ
x

ଵି
ן

ξ
൑ ʅ ൑
x

ଵି
ן

ξ
ቇ ൌ ሺͳെןሻ


Para la muestra:
 ൌ

ଵିןȀଶ

כ

‡


c) Población Normal ʹ Desviación Poblacional Conocido

ܫܥ ቆ
x

ଵି
ן

ʍ
ξ
൑ ʅ ൑
x

ଵି
ן

ʍ
ξ
ቇ ൌ ሺͳെןሻ

Para la muestra
 ൌ

ଵିןȀଶ

כ ʍ

‡



d) Población Normal ʹ Desviación Poblacional Desconocido
Para tamaños de muestra menores a 100, es mejor utilizar la distribución ͞t͟. En este caso el
intervalo de confianza es:
ܫܥ ቆ
x
െ–
ሺଵି
ן

Ǣ୬ିଵሻ

ξ
൑ ʅ ൑
x
൅ –
ሺଵି
ן

Ǣ୬ିଵሻ

ξ
ቇ ൌ ሺͳെןሻ
Para la muestra:
 ൌ

ଵିןȀଶ

כ

‡


Ejemplo:
Los siguientes datos son los puntajes obtenidos para 45 personas de una escala de depresión
(mayor puntaje significa mayor depresión).
2 5 6 8 8 9 9 10 11
11 11 13 13 14 14 14 14 14
14 15 15 16 16 16 16 16 16
16 16 17 17 17 18 18 18 19
19 19 19 19 19 19 19 20 20

Para construir un intervalo de confianza para el puntaje promedio poblacional, asumamos que
los datos tienen distribución normal, con varianza poblacional desconocida. Como es
desconocido, lo estimamos por s =18,7. Luego, un intervalo de confianza aproximado es:

UTPAQP ESTADISTICA Y PROBABILIDADES II
5

Luego, el intervalo de confianza para es (13,2, 15,8). Es decir, el puntaje promedio poblacional
se encuentra entre 13,2 y 15,8 con una confianza 95%.


III. Intervalo de Confianza para una Proporción.
En este caso, interesa construir un intervalo de confianza para una proporción o un porcentaje
poblacional (por ejemplo, el porcentaje de personas con hipertensión, fumadoras, etc.)
Si el tamaño muestral n es grande, el Teorema Central del Límite nos asegura que:

O bien:

Donde p es el porcentaje de personas con la característica de interés en la población (o sea, es el
parámetro de interés) y p es su estimador muestral.
Luego, procediendo en forma análoga al caso de la media, podemos construir un intervalo de
95% de confianza para la proporción poblacional p.

Ejemplo:
En un estudio de prevalencia de factores de riesgo en una cohorte de 412 mujeres mayores de
15 años en la Región Metropolitana, se encontró que el 17.6% eran hipertensas. Un intervalo de
95% de confianza para la proporción de mujeres hipertensas en la Región Metropolitana está
dado por:


Luego, la proporción de hipertensas varía entre (0,139 ; 0,212) con una confianza de 95%.

IV. Uso de Intervalos de Confianza para verificar Hipótesis.
Los intervalos de confianza permiten verificar hipótesis planteadas respecto a parámetros
poblacionales.
Ejemplo
Supongamos que se plantea la hipótesis de que el promedio de peso de nacimiento de cierta
población es igual a la media nacional de 3250 gramos.
UTPAQP ESTADISTICA Y PROBABILIDADES II
6

Al tomar una muestra de 30 recién nacidos de la población en estudio, se obtuvo:
= 2930
s= 450
n= 30
Al construir un intervalo de 95% de confianza para la media poblacional, se obtiene:

Luego, el peso de nacimiento varía entre 2769 y 3091 gramos, con una confianza de 95%.
Como el intervalo no incluye el valor =3250 gramos planteado en la hipótesis, entonces esta
es rechazada con confianza 95% (o un valor p menor a 0,5).
V. Intervalo de confianza para la varianza
Para estimar un intervalo de confianza para la varianza, nos ayudaremos de la siguiente
propiedad de la distribución :

Consideremos dos cuantiles de esta distribución que nos dejen una probabilidad en la
``zona central'' de la distribución:
Figura: Cuantiles de la distribución .




Entonces un intervalo de confianza al nivel para la varianza de una distribución gaussiana
UTPAQP ESTADISTICA Y PROBABILIDADES II
7

(cuyos parámetros desconocemos) lo obtenemos teniendo en cuenta que existe una
probabilidad de que:


Por tanto el intervalo que buscamos es

Ejemplo
En un ejemplo anterior se estudiaba la altura de los individuos de una ciudad, obteniéndose en
una muestra de tamaño 25 los siguientes valores:


Calcular un intervalo de confianza con para la varianza de la altura de los
individuos de la ciudad.
Solución:
Para estimar un intervalo de confianza para (varianza poblacional) el estadístico que nos
resulta útil es:

Entonces el intervalo de confianza que buscamos lo obtenemos mediante (cf. figura)

Figura: Percentiles del 2,5% y del 97,5% para la
distribución .
UTPAQP ESTADISTICA Y PROBABILIDADES II
8





Por tanto, para el valor poblacional de la desviación típica tenemos que


con una confianza del 95%, que por supuesto contiene a las estimaciones
y calculados sobre la muestra. puntuales
VI. Intervalo de confianza para la diferencia de medias poblacionales
Suponemos dos poblaciones independientes
,

Tomamos muestras de tamaño y , respectivamente.
a) Si y son conocidas, como , el intervalo
de confianza será:


UTPAQP ESTADISTICA Y PROBABILIDADES II
9

b) Si y son desconocidas pero iguales, como
, el intervalo de confianza será:

Ejemplo: Dos universidades públicas tienen dos métodos distintos para inscribir a sus
alumnos. Los dos desean comprobar el tiempo promedio que toma la inscripción de los
alumnos. En cada universidad se tomaron los tiempos de inscripción de 31 alumnos tomados al
azar. Las medias y desviaciones típicas muéstrales fueron: , , ,
. Si se supone que el muestreo se llevó a cabo en dos poblaciones normales e
independientes, obtener los intervalos de confianza al nivel de riesgo 0'05 para la diferencia
entre las medias del tiempo de inscripción para las dos universidades,
a) suponiendo que las varianzas poblacionales son , .
b) suponiendo que las varianzas poblacionales son desconocidas pero iguales.
Para el apartado a
Sustituyendo los valores en el intervalo obtenemos:


Para el apartado b, buscamos en la tabla de la t de Student .
Sustituyendo los valores en el intervalo obtenemos:




c) poblaciones normalesindependientes, con varianzas desconocidas y que no pueden
suponerse iguales
UTPAQP ESTADISTICA Y PROBABILIDADES II
10



VII. Intervalos de confianza para la diferencia de proporciones
Sean e dos poblaciones independientes con y
desconocidos. Extraemos muestras de tamaño y , respectivamente. Como
y desconocemos los valores de y ,
aproximaremos las proporciones poblacionales por las proporciones muestrales
correspondientes. Por tanto, el intervalo de confianza será:

Caso particular: Si tenemos , entonces y
. Lo que haremos es sustituir p por
Ejemplo:
En dos grandes empresas se lleva a cabo un estudio sobre la proporción de mujeres entre sus
empleados diplomados y licenciados. De cada empresa se toma una m.a.s. de 40 empleados
entre los diplomados y licenciados, obteniéndose que en la empresa A había 16 mujeres y en la
empresa B, 22 mujeres. Obtener el intervalo de confianza para la diferencia de proporciones
poblacionales al nivel de confianza 0'96 ¿Podemos pensar que la proporción es la misma?



Sustituyendo en el intervalo:
UTPAQP ESTADISTICA Y PROBABILIDADES II
11


=
=

El intervalo contiene al cero, pero el extremo inferior se aleja bastante de cero.
VIII. Desigualdad de Chevychev
Se trata de un principio muy importante en la teoría estadística, que estudia la variabilidad de
las observaciones alrededor de la media en cualquier tipo de distribución.
Teorema:
Si X es una variable aleatoria, la probabilidad de que un valor de la variable esté comprendido en
el Intervalo [u- t v, [ u + t v, ], siendo t un número real positivo es mayor o igual a 1-
1/t
2
.

Ejemplo:
En la industria de la computación, la edad promedio de empleados profesionales tiende a ser
más joven que en muchas otras profesio-nes de negocios.
Supongamos que la edad promedio de un profesional en este sector es de 28 años , con un
desvío estándar de 5 años.
Un histograma de edades de los empleados revela que los datos no están normalmente
distribuídos sino que se agrupan en el intervalo de 20 a 30 años y pocos trabajadores tienen más
de 40 años.
Aplicar el teorema de Cheviychev para determinar dentro de que rango de edades se encuenta
al menos el 85 % de los trabajadores.
Solución
El teorema expresa que al menos un proporción de 1 - 1/t
2
de los valores están dentro
de u±o.
1 - 1/t
2
= 0.85 y al despejar t se obtiene: 0.15 = 1/t
2
; t
2
= 6.667 ; t = 2.58
El teorema indica que al menos 0.85 de los valores están dentro de ± 2.58 o de la media.
Para u = 28 y o = 5, al menos el 85 % de los valores están dentro de 28 ± 2.58(5) = 28 ±
12.9 años de edad, o entre 15.1 y 40.9 años.

P P{ { u u - - t t o o · · X X · · u u + + t t o o l l l l/ /t t
2 2

La probabilidad de equivocarnos se llama nivel de significancia y se simboliza . entonces el 95% de las veces se cumple: Despejando en la ecuación se tiene: El resultado es un intervalo que incluye al el 95% de las veces. La probabilidad de que el verdadero valor del parámetro se encuentre en el intervalo construido se denomina nivel de confianza..96 < z < 1. 2 . Generalmente se construyen intervalos con confianza 1=95% (o significancia =5%). un intervalo de confianza es un rango de valores (calculado en una muestra) en el cual se encuentra el verdadero valor del parámetro. Luego. Para construir un intervalo de confianza. Concepto de Intervalo de Confianza. y se denota 1.96) = 0. se puede comprobar que la distribución Normal Estándar cumple: P (-1. con una probabilidad determinada.95 (Lo anterior se puede comprobar con una tabla de probabilidades o un programa computacional que calcule probabilidades normales). si una variable X tiene distribución N( . 2 ). es un intervalo de confianza al 95% para la media cuando la variable X es normal y es conocido. En el contexto de estimar un parámetro poblacional. Es decir. Menos frecuentes son los intervalos con =10% o =1%.UTPAQP ESTADISTICA Y PROBABILIDADES II INTERVALOS DE CONFIANZA I.

96 errores estándar. Si ésta es la situación. es bien probable que la varianza también lo sea puesto que en el cálculo de W2 interviene Q . ESTADISTICA Y PROBABILIDADES II Intervalo de confianza para la M edia muestral a) Población Conocida Desviación poblacional conocida (n>30): x X= media de la muestra Z /2   x   = valor de Tablas de Z con /2 en cada extremo = Desviación Estándar de la Población Para la muestra:    ‡ Ejemplo Se toma una muestra aleatoria de tamaño n=36.UTPAQP II. existe un 95% de probabilidad que X se encuentre en el rango entre µ y 1. entonces W2 es estimada por la varianza muestral s2 y se puede usar la siguiente fórmula para el intervalo de confianza de la media poblacional: 3 . b) Población Desconocida Desviación Poblacional Desconocido (n>30) En la práctica si la media poblacional es desconocida entonces. y si el tamaño de muestra es grande (n> 30). y el error estándar de X es: Según las propiedades de la distribución Normal. El valor esperado de X es la media de la Población (µ). y la distribución de X es normal. Si la desviación estándar de la población ( ) es 18. el parámetro que se está estimando.

En este caso el intervalo de confianza es: x Para la muestra: –      x  –       ‡  Ejemplo: Los siguientes datos son los puntajes obtenidos para 45 personas de una escala de depresión (mayor puntaje significa mayor depresión). un intervalo de confianza aproximado es: 4 .UTPAQP x Para la muestra:   ESTADISTICA Y PROBABILIDADES II   x      ‡  c) Población Normal Desviación Poblacional Conocido x Para la muestra      x    ‡ d) Población Normal Desviación Poblacional Desconocido Para tamaños de muestra menores a 100. lo estimamos por s =18.7. asumamos que los datos tienen distribución normal. Como es desconocido. con varianza poblacional desconocida. Luego. 2 11 14 16 19 5 11 15 16 19 6 13 15 17 19 8 13 16 17 19 8 14 16 17 19 9 14 16 18 19 9 14 16 18 19 10 14 16 18 20 11 14 16 19 20 Para construir un intervalo de confianza para el puntaje promedio poblacional. es mejor utilizar la distribución t .

IV. el Teorema Central del Límite nos asegura que: O bien: Donde p es el porcentaje de personas con la característica de interés en la población (o sea.8 con una confianza 95%.UTPAQP ESTADISTICA Y PROBABILIDADES II Luego. interesa construir un intervalo de confianza para una proporción o un porcentaje poblacional (por ejemplo. Los intervalos de confianza permiten verificar hipótesis planteadas respecto a parámetros poblacionales. Uso de Intervalos de Confianza para verificar Hipótesis. es el parámetro de interés) y p es su estimador muestral.6% eran hipertensas. la proporción de hipertensas varía entre (0. el porcentaje de personas con hipertensión. podemos construir un intervalo de 95% de confianza para la proporción poblacional p. etc. En este caso.8).212) con una confianza de 95%. III. Es decir. se encontró que el 17. Ejemplo: En un estudio de prevalencia de factores de riesgo en una cohorte de 412 mujeres mayores de 15 años en la Región Metropolitana. Luego. el puntaje promedio poblacional se encuentra entre 13. el intervalo de confianza para es (13. Intervalo de Confianza para una Proporción. procediendo en forma análoga al caso de la media.139 . Ejemplo Supongamos que se plantea la hipótesis de que el promedio de peso de nacimiento de cierta población es igual a la media nacional de 3250 gramos.) Si el tamaño muestral n es grande.2 y 15.2. 15. fumadoras. Un intervalo de 95% de confianza para la proporción de mujeres hipertensas en la Región Metropolitana está dado por: Luego. 0. 5 .

nos ayudaremos de la siguiente propiedad de la distribución : Consideremos dos cuantiles de esta distribución que nos dejen una probabilidad ``zona central'' de la distribución: en la Figura: Cuantiles de la distribución . Intervalo de confianza para la varianza Para estimar un intervalo de confianza para la varianza. con una confianza de 95%. se obtuvo: = 2930 s= 450 n= 30 Al construir un intervalo de 95% de confianza para la media poblacional.UTPAQP ESTADISTICA Y PROBABILIDADES II Al tomar una muestra de 30 recién nacidos de la población en estudio. Entonces un intervalo de confianza al nivel 6 para la varianza de una distribución gaussiana . V. Como el intervalo no incluye el valor =3250 gramos planteado en la hipótesis. entonces esta es rechazada con confianza 95% (o un valor p menor a 0.5). el peso de nacimiento varía entre 2769 y 3091 gramos. se obtiene: Luego.

figura) Figura: Percentiles del 2.5% y del 97. 7 . obteniéndose en una muestra de tamaño 25 los siguientes valores: Calcular un intervalo de confianza con individuos de la ciudad.UTPAQP ESTADISTICA Y PROBABILIDADES II (cuyos parámetros desconocemos) lo obtenemos teniendo en cuenta que existe una probabilidad de que: Por tanto el intervalo que buscamos es Ejemplo En un ejemplo anterior se estudiaba la altura de los individuos de una ciudad. Solución: Para estimar un intervalo de confianza para resulta útil es: para la varianza de la altura de los (varianza poblacional) el estadístico que nos Entonces el intervalo de confianza que buscamos lo obtenemos mediante (cf.5% para la distribución .

Intervalo de confianza para la diferencia de medias poblacionales Suponemos dos poblaciones independientes .UTPAQP ESTADISTICA Y PROBABILIDADES II Por tanto. a) Si y son conocidas. respectivamente. que por supuesto contiene a las estimaciones y calculados sobre la muestra. el intervalo de confianza será: 8 . para el valor poblacional de la desviación típica tenemos que con una puntuales confianza del 95%. VI. como . Tomamos muestras de tamaño y .

el intervalo de confianza será: Ejemplo: Dos universidades públicas tienen dos métodos distintos para inscribir a sus alumnos. con varianzas desconocidas y que no pueden suponerse iguales 9 . Para el apartado a Sustituyendo los valores en el intervalo obtenemos: Para el apartado b. Los dos desean comprobar el tiempo promedio que toma la inscripción de los alumnos. . . Las medias y desviaciones típicas muéstrales fueron: . a) suponiendo que las varianzas poblacionales son . obtener los intervalos de confianza al nivel de riesgo 0'05 para la diferencia entre las medias del tiempo de inscripción para las dos universidades. . c) poblaciones normalesindependientes. buscamos en la tabla de la t de Student Sustituyendo los valores en el intervalo obtenemos: . . Si se supone que el muestreo se llevó a cabo en dos poblaciones normales e independientes.UTPAQP b) Si y son ESTADISTICA Y PROBABILIDADES II desconocidas pero iguales. como . b) suponiendo que las varianzas poblacionales son desconocidas pero iguales. En cada universidad se tomaron los tiempos de inscripción de 31 alumnos tomad al os azar.

Extraemos muestras de tamaño respectivamente. Como y . Lo que haremos es sustituir p por Ejemplo: En dos grandes empresas se lleva a cabo un estudio sobre la proporción de mujeres entre sus empleados diplomados y licenciados. De cada empresa se toma una m. Intervalos de confianza para la diferencia de proporciones e dos poblaciones independientes con y .UTPAQP ESTADISTICA Y PROBABILIDADES II VII. entonces y . Por tanto.a. de 40 empleados entre los diplomados y licenciados. 22 mujeres. Obtener el intervalo de confianza para la diferencia de proporciones poblacionales al nivel de confianza 0'96 ¿Podemos pensar que la proporción es la misma? Sustituyendo en el intervalo: 10 . el intervalo de confianza será: las proporciones muestrales Caso particular: Si tenemos .s. y desconocemos los valores de aproximaremos las proporciones poblacionales por correspondientes. y Sean desconocidos. obteniéndose que en la empresa A había 16 mujeres y en la empresa B.

que estudia la variabilidad de las observaciones alrededor de la media en cualquier tipo de distribución. o entre 15. Supongamos que la edad promedio de un profesional en este sect r es de 28 años . Aplicar el teorema de Cheviychev para determinar dentro de que rango de edades se encuenta al menos el 85 % de los trabajadores. 11 .  Para Q = 28 y W = 5. la probabilidad de que un valor de la variable esté comprendido en el Intervalo [u. Solución  El teorema expresa que al menos un proporción de 1 .85 y al despejar t se obtiene: 0.9 años de edad. VIII. Desigualdad de Chevychev Se trata de un principio muy importante en la teoría estadística.1 y 40. siendo t un número real positivo es mayor o igual a 1 1/t2.58  El teorema indica que al menos 0.15 = 1/t2 . pero el extremo inferior se aleja bastante de cero.t v. Ejemplo: P{ Q . Teorema: Si X es una variable aleatoria.1/t2 = 0. t2 = 6.58 W de la media. al menos el 85 % de los valores están dentro de 28 s 2. t = 2. la edad promedio de empleados profesionales tiende a ser más joven que en muchas otras profesio-nes de negocios. ]. con un o desvío estándar de 5 años. Un histograma de edades de los empleados revela que los datos no están normalmente distribuídos sino que se agrupan en el intervalo de 20 a 30 años y pocos trabajadores tienen más de 40 años.9 años.1/t2 de los valores están dentro de QsW.UTPAQP ESTADISTICA Y PROBABILIDADES II = = El intervalo contiene al cero.667 .  1 .58(5) = 28 s 12.t WeX eQ + t Wat  En la industria de la computación. [ u + t v.85 de los valores están dentro de s 2.

Sign up to vote on this title
UsefulNot useful