You are on page 1of 9

Inferencia estatística: Intervalos de confianza

1. Introdución
2. Intervalo de confianza para a media
2.1 Tamaño da mostra
2.2 Intervalo de confianza para a media dunha distribución Normal con
descoñecida
3. Intervalo de confianza para a proporción
4. Intervalo de confianza para a diferenza de medias poboacionais
5. Análise de informacións estatísticas: a ficha técnica

1. Introdución
Cando temos unha variable aleatoria X que segue unha distribución normal, pero
descoñecemos a súa media ou a súa desviación típica, estes parámetros podemos
estimalos extraendo unha mostra, como xa vimos na unidade anterior. Traballaremos
agora o cálculo dun intervalo o cal pertenza ditos valores, este tipo de estimación é
máis fiable que a estimación puntual. Este intervalo chámanse intervalo de confianza
e a probabilidade de que o parámetro estudado se atope nel, será o que chamaremos
nivel de confianza. Tamén veremos como calcular o tamaño da mostra para minimizar
o erro cometido. Tendo en conta que canto maior sexa o tamaño da mostra, maior
eficacia teremos na nosa estimación e menor será o erro mostral.

2. Intervalo de confianza para a media


É moi improbable que a media poboacional , coincida co valor medio da dunha
mostra ̅ , porén, é máis interesante determinar un intervalo centrado na media
mostral, de maneira que o valor descoñecido de atópase en dito intervalo cunha
probabilidade tan grande coma desexemos. A esta probabilidade lle chamamos nivel
de confianza e a simbolizamos por , mentres que a o denominaremos nivel de
significación ou nivel de risco.
Concretando temos que buscar un número c, de modo que pertenza ao intervalo
(̅ ̅ ) con probabilidade , é dicir, que verifique:

[̅ ̅ ]

Despexando c nas desigualdades do corchete anterior temos,

̅ ̅
̅ ̅

Podemos escribir a probabilidade así:


[ ̅ ]

Se agora facemos uso do valor absoluto quédanos:


[| ̅ | ]

Supoñendo que coñecemos , pola unidade anterior sabemos que ̅ segue unha
distribución normal N( ), ao dividir a desigualdade por , tipificamos a variable ̅
√ √
e obtemos:

1
|̅ |
[ ] [ ]
√ √ √
Onde Z é unha N(0,1). Se buscamos na táboa o valor de correspondente a unha

probabilidade de e chamamos a ese valor ⁄ , despexamos e obtemos


c=

Quen será ⁄ ?
É o valor dunha abscisa da N(0,1) que deixa a súa dereita un área de probabilidade
correspondente a: ⁄

Polo tanto, o intervalos buscado é :


⁄ ⁄
(̅ ̅ )
√ √

Que obviamente dependerá da probabilidade elixida. Trátase polo tanto, dun intervalo,

centrado na media da mostra tomada, ̅ e de radio . Este radio o denominamos

erro máximo admisible, e é a máxima diferenza que poderá existir entre e a media
da mostra elixida ̅ , para un nivel de confianza 1- . Simbolízase por:


E=

Da expresión observamos que o erro depende de α e de n do seguinte modo:


 Canto maior sexa o tamaño da mostra, , menor é erro, E(máis estreito é o
intervalo, é dicir, máis afinaremos na estimación)
 Canto maior sexa (é dicir canto máis seguros queiramos estar da nosa
estimación), maior é E.

Na seguinte táboa incluímos os niveis de confianza máis comunmente usados.


Neles obsérvase que canto maior é , maior é ⁄ é polo tanto , maior é E.

0,90 0,10 1,645


0,95 0,05 1,96
0,99 0,01 2,575

2
Exemplo

Desexamos valorar o grao de coñecementos de historia dunha poboación de varios


miles de alumnos. Sabemos que . Propoñémonos estimar µ pasándolle unha
proba a 100 alumnos. Unha vez realizada a proba a 100 alumnos concretos,
obtívose unha media de ̅ . Determinar o intervalo de confianza de µ cun nivel
de confianza do 95%

As medias, ̅ , de todas as posibles mostras de tamaño 100 distribúense segundo


unha ( ) ( ) ( )
√ √

O nivel de confianza do 95%:

⁄ (Buscamos este valor nas táboas da normal, o valor que ten


unha probabilidade de 0,975)

√ √
O intervalo de confianza para µ é:
⁄ ⁄
(̅ ̅ )
√ √

(̅ ̅ ) ( ) ( )

2.1 Tamaño da mostra


Se o valor do erro máximo admisible, E, e o nivel de confianza, son fixos, o
mínimo tamaño que deberá ter a mostra para conseguir esas condicións obtense
despexando n da expresión de E:
⁄ ⁄
E= ( )

Observamos que o tamaño da mostra é:


- Tanto maior canto maior sexa ⁄ , ou sexa, canto menor sexa , e maior sexa
É dicir, para aumentar o nivel de confianza debemos aumentar o tamaño
da mostra.
- Tanto maior canto menor sexa E. É dicir, para ser máis precisos na estimación,
temos que aumentar o tamaño da mostra.

Exemplo 1

Nun laboratorio obtivéronse 6 estimacións de PH dunha solución cos resultados


seguintes: 7,91 7,94 7,90 7,93 7,89 7,91. Suponse que a poboación de
todas as determinacións de PH da solución teñen unha distribución normal de media
descoñecida e desviación típica 0,02.

a) Determinar una intervalo de confianza do 98% para a media de todas as


determinacións de PH.
b) Co mesmo nivel de confianza , cal deberá ser o tamaño mínimo da mostra para
que a amplitude do intervalo de confianza sexa ao sumo do 0,01?

A variable aleatoria X é de PH é unha N(µ; 0,02)

a) Temos que determinar o intervalo, nivel de confianza=1-




3
√ √
Como la media mostral é: ̅

Polo tanto o intervalo que nos piden é:

⁄ ⁄
(̅ ̅ )= ( ) ( )
√ √
O que significa que o 98% das mostras de tamaño 6 teñen unha media mostral
que difire ou dista da media poboacional menos de 0,019


b) O tamaño da mostra ( ) ( )
Polo tanto o tamaño da mostra como mínimo deberá ser n=22

Exemplo 2

A altura dos estudantes de primeiro ano da universidade teñen unha distribución


normal de media descoñecida µ e desviación típica Calcula o tamaño da
mostra para estimar cun erro inferior a 3cm e un nivel de confianza do 95%.

Sexa X a variable que mide a altura dos estudantes e unha mostra de


tamaño n. Se se desexa estimar mediante un intervalo de confianza do 95%, cun
erro inferior a 3cm, como e :


E= ( )

É dicir, o mínimo tamaño mostral necesario para estimar a media da altura coa
precisión desexada é n=28 observacións.

2.2 Intervalo de confianza para a media dunha distribución Normal con


descoñecida
No apartado anterior supoñemos a desviación típica, é coñecida, claro que moitos
podemos pensar, como é posible coñecer sen coñecer µ.
Cando se descoñece a desviación típica poboacional, esta pódese aproximar pola
cuasi desviación típica mostral, a súa fórmula é:
∑ ( ̅)

e que as veces tamén se lle chama desviación típica da mostra. Cando facemos unha
estimación puntual da descoñecida pola cuasi desviación típica mostral, S, o
tamaño da mostra deberá ser grande xa que se n é menor que 30 ao tipificar a
̅
variable ̅ obtemos: ⁄√
Esta variable tipificada non segue unha distribución normal N(0,1), senón unha t de
Student que non é un obxectivo deste curso.
Resumindo cando n é grande e descoñecemos a desviación típica , podemos
estimar a desviación típica poboacional pola cuasi desviación típica mostral, ou
simplemente desviación típica mostral, S, como vermos no exemplo seguinte.

4
Exemplo

Se rexistramos a idade dunha mostra de 200 persoas que fan a compra nun
supermercado, rexistramos que a media de idade é 453 anos, cunha desviación
típica mostral de 16,8 anos. Determina un intervalo de confianza, cun nivel de
significación do 5%, para a idade media das persoas que fan a compra no
supermercado.

Como é descoñecida e n=200 (maior que 30) a desviación pódese aproximar


pola desviación típica mostral S=16,8 anos.
⁄ ⁄
O intervalo ten a expresión : ( ̅ ̅ )
√ √

Onde e ⁄ (buscamos na táboa o valor


que ten unha probabilidade do 0,975)

A media da mostraxe ̅ entón temos que o intervalo é :

( ) ( )
√ √

3. Intervalo de confianza para a proporción


Sabemos que si unha poboación ten unha proporción poboacional p dunha
determinada característica, entón a variable aleatoria ̂ , das proporcións da mostraxe,
cando n é grande, tende a unha distribución normal de media e desviación típica
( ) ( )
√ , é dicir, a distribución de ̂ aproxímase a unha N( √ )
Coñecido o valor da proporción de ̂ dunha mostra, podemos determinar un intervalo
de confianza para , a proporción poboacional da característica, do mesmo modo que
fixemos no caso do intervalo de confianza para a media. Buscamos un intervalo no
que o valor descoñecido de , atópese cunha probabilidade ou nivel de confianza
, onde indica o nivel de significación.
Porén, en vez de seguir o mesmo camiño que na dedución do intervalo de confianza
para a media, faremos outra cousa. Pódese demostrarse que se , tamaño da mostra,
̂
é grande, o cociente: ̂( ̂)

Segue aproximadamente una distribución normal N(0,1), é dicir, que:

|̂ |
P[| | ⁄ ] = P[ ⁄ ]=
̂( ̂)

|̂ | ̂( ̂)
Da desigualdade do segundo corchete: ⁄ obtemos | ̂ | ⁄ √
̂( ̂)

̂( ̂) ̂( ̂)
- ⁄ √ < ̂ < ⁄ √

Multiplicase por -1, as desigualdades anteriores e chegamos a :

̂( ̂) ̂( ̂)
⁄ √ >- ̂ >- ⁄ √

5
Sumamos a todas as desigualdades ̂ e obtemos o intervalo:

̂( ̂) ̂( ̂)
(̂ ⁄
√ ̂ ⁄
√ )

Onde ao igual que para o intervalo da media, o valor ⁄ é o valor dunha abscisa
dunha N(0,1) que deixa a súa dereita unha probabilidade de ⁄

̂( ̂)
Trátase dun intervalo centrado na proporción da mostra elixida ̂ e radio ⁄ √
A este radio, coma no caso do intervalo da media, se lle chama erro máximo
admisible, e é o erro que se comete ao estimar p, mediante ̂ , e o simbolizamos por:
̂( ̂)

Ao igual que no apartado anterior agora podemos calcular o tamaño da mostra para a
proporción, entón despexando da fórmula anterior:
̂( ̂)
( ⁄ )

Exemplo 1

Tomada unha mostra de 300 persoas maiores de 15 anos, nunha gran cidade,
encontrouse que 104 delas lían algún periódico regularmente. Calcular, cun nivel de
confianza do 90% un intervalo para estimar a proporción de lectores de periódicos
entre os maiores de 15 anos.

O nivel de confianza é do 90% ( ) ⁄

A proporción da mostra é ̂ =

̂( ̂)
O erro máximo admisible é: E= ⁄ √ √

O intervalo é:

̂( ̂) ̂( ̂)
(̂ ⁄
√ ̂ ⁄
√ )

Polo tanto o intervalo pedido é (0,347-0,045; 0,347+0,045)=(0,302; 0,392)

Cun nivel de confianza do 90% a proporción de lectores de periódicos, no colectivo


total, está entre 0,302 e 0,392.

6
Exemplo 2

A vista do resultado anterior, pretendemos repetir a experiencia para conseguir


unha cota de erro do 0,01 so mesmos nivel de confianza do 90%. Cantos individuos
deberá ter a mostra?

Temos que calcular o valor de n :


̂( ̂)
( ⁄ )

Temos os valores ⁄ , E=0,01


O valor da proporción non podemos obtelo porque non sabemos o tamaño da
mostra, así que tomaremos coma referencia o valor anterior ̂ =0,347

( )

Polo tanto a mostra que deberíamos tomar é unha de tamaño 6132 persoas. Con
este valor podemos calcular a proporción e logo calcular o intervalo de confianza
onde se atopa a proporción buscada cunha probabilidade do 90%.

4.Intervalo de confianza para a diferenza de medias poboacionais


Na unidade anterior viuse que a distribución na mostraxe da diferenza de medias,
̅ ̅ é unha N( √ ). Tendo en conta que a diferenza das medias de
mostra ̅ e ̅ , é un valor particular das variable ̅ ̅ , que nos permite estimar a
diferenza das medias poboacionais e razoando coma nos apartados anteriores
obtemos:
Sexan dúas poboacións N( ) ( ) de cada unha delas elíxese unha
mostra de tamaño respectivamente.
Sexan ̅ ̅ as medias da primeira e da segunda mostra, respectivamente. Se o
nivel de confianza é , tense que o intervalo de confianza vén dado por:

( ̅ ̅ ⁄ √ ̅ ̅ ⁄ √ )

Se as desviacións típicas son descoñecidas e as mostras son de tamaño maior que


30 podemos aproximalas polas cuasivarianzas de cada mostra.

Exemplo

O tempo ata a primeira avaría de dúas marcas de televisores segue unha


distribución normal. Dúas mostras aleatorias de 50 televisores de cada unha das
marcas, deron os seguintes resultados(en miles de horas):

A: ̅ 24,8 B: ̅ 20,1

Atopar intervalos de confianza do 90% e 98%, para a diferenza dos tempos medios
de duración ata a primeira varía das dúas marcas.

Neste caso cambiaremos o intervalo anterior polas cuasivarianzas, xa que os


tamaños das mostras 50 son suficientemente grandes.

7
 A un nivel de confianza do 90% tense ⁄

Así que o intervalo de confianza é:

( ̅ ̅ ⁄ √ ̅ ̅ ⁄ √ )

Substituímos os valores e temos:

( √ √ )=

( )

 Para o intervalo de confianza do 98% tense ⁄

Así que o intervalo de confianza é:

( √ √ )=( )

En ambos caso pódese observar con claridade que os televisores da marca B


avaríanse, en promedio, antes que os da marca A.

5. Análise de informacións estatísticas: a ficha técnica


A ficha técnica dun procedemento estatístico é o documento no que debe constar a
metodoloxía e o proceso que se levou a cabo para realizar dito estudio estatístico.
A información que deberá incluír a ficha técnica, a lo menos , é a seguinte:
1. Obxectivos da investigación claramente definidos.
2. Descrición do universo ou poboación obxecto do estudo.
3. Método de selección da mostra e tamaño mostral.
4. Nivel de confianza e erro co que se presentarán os resultados.
5. Descrición de como se levou a cabo o traballo de campo.
6. Período de recollida da información.
7. Organismo, empresas ou persoas responsables do informe.
Se se trata dunha investigación tipo social e importante que conste cal era a
hipótese de partida no citado estudo.
A ficha é un elemento indispensable para, entre outros aspectos:
 Interpretar de forma correcta os resultados que se presentan no
informe.
 Comparar con outras investigacións sobre o mesmo tema.
 Analizar se a información é realmente relevante ou, polo contrario,
non o é.
 Xulgar a calidade da información presentada.

8
Exemplo

A seguinte ficha técnica corresponde a unha enquisa con obxectivo coñecer a


proporción de cidadáns satisfeitos cos aspectos da actualidade.

Ámbito xeográfico: España

Recollida da información: Mediante unha enquisa telefónica

Poboación: Poboación maior de 18 anos residentes en fogares con teléfono

Tamaño da mostra: 1000 enquisas

Nivel de confianza: 95%

Erro: 2,78% baixo o suposto da máxima indeterminación

Selección da mostra: Unidades primarias da mostraxe, concellos, seleccionados


de forma aleatoria proporcional a poboación obxectivo de cada provincia.
Unidades secundarias, fogares, selección aleatoria mediante números de
teléfono, unidades terciarias, individuos, seleccionados segundo coutas cruzadas
de sexo, idade e recordo de voto das eleccións xenerais derradeiras.

A esta ficha técnica fáltalle a empresa responsable do traballo de campo.

You might also like