You are on page 1of 11

UNED

UNED

Introduccin al anlisis de datos

TEMA 8

Introducci
Introduccin al an
anlisis de datos
ESTIMACI
ESTIMACIN

TEMA 8

El proceso a seguir, en cinco fases, es el siguiente:

ESTIMACIN

Especificacin de la poblacin

Obtencin de la muestra: muestreo

Medicin de la variable

Anlisis descriptivo y verificacin de los datos

Inferencia estadstica sobre un parmetro (estimacin por intervalos y


contraste de hiptesis)

CONCEPTOS PREVIOS:

En este tema iniciaremos el estudio de la parte del anlisis de datos


denominada inferencia estadstica que bsicamente consiste en estimar,
con cierta probabilidad, un parmetro desconocido a partir de una muestra
aleatoria extrada de una poblacin. As, a partir de las caractersticas
(media, proporcin ...) de una muestra inferiremos esas mismas
caractersticas a la poblacin.

Poblacin (N): conjunto total de elementos en el que se quiere estudiar una o ms


caractersticas (por ejemplo, las personas mayores de 65 aos residentes en Galicia)
Censo: listado de todos los elementos de la poblacin
Muestra (n): subconjunto del total de los elementos, individuos o casos de una
poblacin
Estadsticos: ndice descriptivo calculado sobre una muestra
Parmetros: los mismos ndices que describen a una muestra, cuando se utilizan para
describir o inferir las caractersticas de la poblacin

2010

Centro Asociado A Coru


Corua

Carmen Voces

UNED

Introducci
Introduccin al an
anlisis de datos
ESTIMACI
ESTIMACIN: MUESTREO

TEMA 8

2010

UNED

Introducci
Introduccin al an
anlisis de datos
ESTIMACI
ESTIMACIN: MUESTREO PROBABIL
PROBABILSTICO

TEMA 8

El muestreo es el proceso mediante el que se selecciona una muestra de una


poblacin con el fin de obtener una muestra lo ms semejante posible a la poblacin y
as obtener estimaciones precisas.

Tipos de muestreos probabilsticos:

Tamao de las muestras: Hay que tener en cuenta que una muestra debe ser lo
suficientemente amplia para representar adecuadamente las propiedades de la
poblacin y lo suficientemente reducida para que pueda ser examinada en la prctica.
Por lo tanto, el tamao es una caracterstica esencial de una muestra

Cada elementos de la poblacin tiene la misma probabilidad de ser elegido.

Los elementos se seleccionan uno a uno, y con reposicin, por lo que la poblacin
permanece idntica en todas las extracciones. No obstante, cuado el tamao de la
poblacin (N) es grande es indiferente que el muestreo sea con o sin reposicin.

Muestreo aleatorio simple. Decimos que hemos extrado una muestra aleatoria simple
cuando:

Tipos de muestreos:
Probabilstico: se conoce, o puede calcularse, la probabilidad asociada a una
determinada muestra y cada elemento de la poblacin tiene una probabilidad
conocida, o calculable, de pertenecer a la muestra.
No probabilstico: Se desconoce, o no se tiene en cuenta, la probabilidad asociada
a cada una de las muestras posibles y se selecciona la muestra que ms
representativa le parece al investigador o aquella que pueda obtenerse ms
fcilmente (voluntarios, alumnos de una determinada clase ...)

Muestreo sistemticos: supongamos una poblacin de tamao 100 y una muestra de


tamao 5, n = 5. Entonces el muestreo se realizar de la siguiente forma:

Seleccionamos al azar un elemento entre el primero y el que ocupa el lugar N/n =


100/5 = 20. Imaginemos que obtenemos el nmero 15.

Completamos la lista sumando de 20 en 20, el valor obtenido anteriormente (15)


hasta completar la muestra. As, el resto de los elementos de la muestra seran:
(15+20) 35, (35+20) 55, (55+20) 75, (75+20) 95.

Una forma de obtener una muestra representativa es utilizar un procedimiento


que garantice a todos y cada uno de los elementos de la poblacin la misma
probabilidad de formar parte de la muestra.
2010

2010

UNED

Introducci
Introduccin al an
anlisis de datos
ESTIMACI
ESTIMACIN: MUESTREO PROBABIL
PROBABILSTICO

TEMA 8

Los muestreos sealados deben utilizarse cuando existe homogeneidad en la


poblacin. Cuando existen grupos o subpoblaciones heterogneos, y disponemos de
informacin suficiente podemos utilizar el muestreo aleatorio estratificado. Por
ejemplo, si queremos estudiar alguna caracterstica de los alumnos de un centro en el
que se imparten las enseanzas de Infantil, Primaria y Secundaria podemos elegir una
muestra en funcin del nmero de alumnos en cada nivel de enseanza o estrato.
Los mtodos anteriores requieren disponer de un listado de la poblacin o poder
elaborarlo fcilmente. Cuando esto no es posible, podemos utilizar el muestreo
aleatorio por conglomerados. Si quisiramos, por ejemplo, extraer una muestra de
los universitarios espaoles podemos proceder de la siguiente manera:
seleccionaramos al azar primero algunas universidades, luego algunas facultades
dentro de cada universidad, despus algunos cursos y finalmente, todos los alumnos
de los cursos seleccionamos. Llamamos conglomerados a estas unidades en que se
clasifican los elementos de la poblacin. Si los conglomerados son heterogneos, este
mtodo puede llevarnos a muestras poco representativas puesto que slo se analizan
algunos de ellos.
Hay otro tipo de muestreo, denominado muestreo aleatorio polietpico, que es una
combinacin de los dos anteriores (estratificado y por conglomerados)
2010

UNED

Introducci
Introduccin al an
anlisis de datos
INFERENCIA ESTAD
ESTADSTICA

El muestreo por cuotas (o accidental): se base en un buen conocimiento de los


estratos o individuos ms representativos o adecuados para los fines de la
investigacin a realizar. Es por tanto, semejante al muestreo estratifica pero carece del
carcter aleatorio de ste.

El muestreo opintico (o intencional): se caracteriza por el inters de incluir en la


muestra a grupos supuestamente tpicos. Su uso es frecuente, por ejemplo en sondeos
preelectorales de zonas que en anteriores ocasiones han marcado la tendencia de voto

El muestreo casual (o incidental): se selecciona directamente a individuos o


elementos de la poblacin a los que se tiene fcil acceso (por ejemplo, los profesores
emplean a sus alumnos)

El denominado bola de nieve: se caracteriza porque un elemento de la poblacin


lleva a otro y este, a su vez, a otro... Hasta completar la muestra. Suele utilizarse en
estudios con poblaciones de difcil acceso (delincuentes, sectas, determinados tipos de
enfermos...)

NOTA: Las nociones de muestra representativa y muestra aleatoria se refieren a


aspectos distintos aunque ambos deseables de un muestra. Una muestra es
representativa si exhibe internamente el mismo grado de diversidad que la poblacin y
una muestra es aleatoria si los elementos han sido extrados al azar de la poblacin.
2010

TEMA 8

UNED

Las medidas de estas caractersticas obtenidas en una muestra pueden resumirse


mediante estadsticos como la media, la proporcin, etc.
Pero una muestra es slo un subconjunto de la poblacin por lo que el valor del
estadstico obtenido en la muestra (como la media) no ser igual, por lo general, al
valor del parmetro de la poblacin. Para inferir un parmetro a partir de un
estadstico hay que aplicar herramientas estadsticas de tipo inferencial como la
estimacin por intervalo (intervalo de confianza) o el contraste de hiptesis

Introducci
TEMA 8
Introduccin al an
anlisis de datos
ESTIMACI
ESTIMACIN: MUESTREO NO PROBABIL
PROBABILSTICO

En ocasiones, el muestreo probabilstico resulta demasiado costoso y se acude a


mtodos no probabilsticos:

Hemos obtenido una muestra aleatoria de una poblacin. Ahora bien, en


investigacin interesa estudiar ciertas caractersticas de los elementos de la
poblacin, como puede ser la inteligencia emocional, la agresividad, etc.

Introducci
Introduccin al an
anlisis de datos
ESTIMACI
ESTIMACIN DE LA MEDIA

Ejemplo: Sea una poblacin formada por 5 sujetos (N = 5) que en la variable X


tienen las siguientes puntuaciones: 1, 2, 3, 4 y 5.
X

ni

f(X)
f(X)

0,2

0,2

Parmetro
Parmetro

0,2

0,2

Media:

0,2

Varianza:

S x2

0,25
0,20

=3

0,15

2 = 2

0,10

= 1,41

0,05
0,00
1

=
7

TEMA 8

La media muestral es una variable aleatoria que toma un valor u otro segn la
muestra concreta a partir de la que se obtenga. En realidad, tendremos tantas
medias como posibles muestras del mismo tamao podamos extraer de la
poblacin. Se denomina distribucin muestral de la media a su funcin de
probabilidad.

Estadstico
Estadstico

Proporcin:
2010

UNED

1+ 2 + 3 + 4 + 5
=3
5

2010

2 =

(1 3) 2

+ ( 2 3) 2

+ (3 3) 2
5

+ (4 3) 2

+ (5 3) 2

=2

= 2 = 1,41
8

UNED

Introducci
Introduccin al an
anlisis de datos
ESTIMACI
ESTIMACIN DE LA MEDIA

TEMA 8

Ejemplo: Sea una poblacin formada por 5 sujetos (N = 5) que en la variable X


tienen las siguientes puntuaciones: 1, 2, 3, 4 y 5.
Extraemos de esa poblacin, al azar y con reposicin, todas las muestras posibles
de tamao n = 2. Cada uno de los elementos de esta poblacin tiene una
probabilidad 1/5 = 0,2 de ser elegido tanto en la primera como en la segunda
extraccin (es con reposicin). El conjunto de muestras posibles es:
Muestras posibles de tama
tamao n = 2

Media obtenida en cada muestra X

UNED

Introducci
Introduccin al an
anlisis de datos
ESTIMACI
ESTIMACIN DE LA MEDIA

Para cada muestra obtenemos diferentes medias, que pueden ser iguales o
distintas, porque su valor depende de los elementos que forman la muestra. Se
comprueba, entonces, que la media de la muestra (media muestral) se comporta
como una variable aleatoria.

El siguiente paso ser construir su tabla de distribucin de probabilidad y su


representacin grfica:
Distribucin muestral de la media

ni

f( X )

1/25 = 0,04

1,1

2,1

3,1

4,1

5,1

1,5

2,5

1,5

2/25 = 0,08

0,25

1,2

2,2

3,2

4,2

5,2

1,5

2,5

3,5

3/25 = 0,12

0,20

1,3

2,3

3,3

4,3

5,3

2,5

3,5

2,5

4/25 = 0,16

1,4

2,4

3,4

4,4

5,4

2,5

3,5

4,5

5/25 = 0,20

1,5

2,5

3,5

4,5

5,5

3,5

4,5

3,5

4/25 = 0,16

3/25 = 0,12

4,5

2/25 = 0,08

1/25 = 0,04

Para cada una de estas muestras podemos calcular su media. Esta


media vara para las distintas muestras, como puede observarse en la
tabla de la derecha
2010

UNED

Introducci
Introduccin al an
anlisis de datos
ESTIMACI
ESTIMACIN DE LA MEDIA

2010

TEMA 8

UNED

El ltimo paso consiste en calcular los momentos que describen la


distribucin muestral de la media, esto es, su media, su varianza y su
desviacin tpica.
E( X ) = X =

ni

f( X )

X f (X )

1/25 = 0,04

0,04

0,04

1,5

2/25 = 0,08

0,12

0,18

3/25 = 0,12

0,24

0,48

2,5

4/25 = 0,16

0,40

1,00

5/25= 0,20

0,60

1,80

2 = 10 32

f (X )

3,5

4/25= 0,16

0,56

1,96

3/25 = 0,12

0,48

1,92

4,5

2/25 = 0,08

0,36

1,62

1/25 = 0,04

0,20

0,10
0,05
0,00
1

Distribucin poblacional de X
N=5

n=2

2 = 1
X

1,00

=1
X

11

2010

1,5

2,5

3,5

4,5

ni

f(X)
f(X)

0,2

0,2

0,2

0,2

0,2

Distribucin muestral de la media de X

V ( X ) = 2 = E ( X 2 ) [ E ( X )]2

0,15

Introducci
Introduccin al an
anlisis de datos
DISTRIBUCI
DISTRIBUCIN MUESTRAL DE LA MEDIA

X = 3

2010

f (X )

10

X f ( x)

X2

TEMA 8

ni

f( X )

0,04

1,5

0,08

0,12

2,5

0,16

0,20

3,5

0,16

0,12

4,5

0,08

0,04

TEMA 8

Parmetros poblacionales de X

Media poblacional: = 3
Varianza poblacional: 2 = 2
Desv. tpica poblacional: = 1,41
=
Momentos de la dM de la media de X

Media de la dM de la media:

X = 3
Varianza de la dM de la media:
2 = 1
X

Desv. tpica de la dM de la media :


=1
X

12

UNED

Introducci
Introduccin al an
anlisis de datos
DISTRIBUCI
DISTRIBUCIN MUESTRAL DE LA MEDIA

TEMA 8

La media como estimador (propiedades):


La media de la distribucin muestral de la media es igual a la media de la
poblacin =
X
Esta circunstancia indica que la media muestral es un estimador insesgado de la
media poblacional.
La varianza de la distribucin muestral de la media es igual al cociente entre la
varianza poblacin (2) y el tamao de la muestra (n):
2 =
X

2
n

1=

2
2

=
X

=
n
n

1=

1,41
2

La desviacin tpica de la distribucin muestral de la media o el error tpico de la


media es un indicador de la precisin de la estimacin de la media: cuanto
menor es el error tpico mayor es la precisin. El error tpico de la media depende
de la desviacin tpica de la poblacin y del tamao de la muestra. Cuanto
menor es la desviacin tpica de la poblacin, menor ser el error tpico de la
media y cuanto mayor es n, menor ser el error tpico de la media
2010

UNED

Introducci
Introduccin al an
anlisis de datos
ESTIMACI
ESTIMACIN DE LA MEDIA

Media

X
N

Varianza

2 =

( X )2
N

Desviaci
Desviacin
tpica

( X )2
N

2010

Muestra

X=

Sn21 =

Sn 1 =

X
n

( X X )2
n1
( X X )2
n1

TEMA 8

En la prctica las poblaciones son mucho ms grandes y las muestras tambin son ms
grandes, por lo que no es posible (ni necesario) obtener la distribucin muestral como
en el ejemplo expuesto. De hecho, podemos conocer las caractersticas de la
distribucin muestral de la media a partir de ciertos teoremas. Estos teoremas son el
teorema central del lmite y la ley de los grandes nmeros.
Dado el muestreo aleatorio simple:
Si la distribucin de X en la poblacin es normal con media y desviacin tpica
entonces la distribucin muestral de la media es normal
,
n

Si la distribucin de X en la poblacin no es normal con media y desviacin


tpica , entonces la distribucin muestral de la media tiende a la normal a
medida que n crece (Teorema central del lmite):
,
n

2010

TEMA 8

UNED

Distribuci
Distribucin
muestral de la
media

Introducci
Introduccin al an
anlisis de datos
ESTIMACI
ESTIMACIN DE LA MEDIA

La forma de la distribucin muestral de la media se parece a una distribucin


normal aunque la distribucin original de la variable en la poblacin no es normal

13

Media, varianza y desviacin tpica de la variable cuantitativa X en la poblacin y en la


muestra, y de la distribucin muestral de la media X .

Poblaci
Poblacin

UNED

14

Introducci
Introduccin al An
Anlisis de Datos
EJEMPLO

TEMA 8

Ejemplo: 2010 Septiembre (Modelo B).


24. Si extraemos una muestra aleatoria sin reposicin de 25 casos de una
poblacin, en la que conocemos que la varianza es 9, cul es el valor del
error tpico de la media?
a) 0,6
b) 0,7
c) 0,8

X =

2X =
X =

2
n
2
n
15

2010

16

UNED

Introducci
Introduccin al An
Anlisis de Datos
EJEMPLO

TEMA 8

Ejemplo: 2010 Septiembre (Modelo B).


24. Si extraemos una muestra aleatoria sin reposicin de 25 casos de una
poblacin, en la que conocemos que la varianza es 9, cul es el valor del
error tpico de la media?
a) 0,6
b) 0,7
c) 0,8

X =

2
n

X =

9
3
= = 0, 6
25 5

La proporcin muestral es una variable aleatoria que toma un valor u otro


segn la muestra concreta que se obtenga.
Sea X una variable que slo toma valores 0 y 1, la proporcin de la muestra
se define como:
X
P=

Introducci
Introduccin al an
anlisis de datos
ESTIMACI
ESTIMACIN DE LA PROPORCI
PROPORCIN

17

2010

TEMA 8

UNED

La proporcin como estimador (propiedades):


La media de la distribucin muestral de la proporcin es igual a la proporcin
de la poblacin P =

=
P

Media

(1 )
n

La desviacin tpica de la distribucin muestral de la proporcin, llamada error


tpico de la proporcin, es un indicador de la precisin de la estimacin de la
proporcin: cuanto menor es el error tpico mayor es la precisin. Depende de la
desviacin tpica de la poblacin = (1 ) y del tamao de la muestra.
Cuanto menor es la desviacin tpica de la poblacin, menor ser el error tpico de
la proporcin y cuanto mayor es n, menor ser el error tpico de la proporcin
2010

20

Introducci
Introduccin al an
anlisis de datos
ESTIMACI
ESTIMACIN DE LA PROPORCI
PROPORCIN

Poblaci
Poblacin

La varianza de la distribucin muestral de la proporcin es:


(1 )
=
n

19

TEMA 8

Media, varianza y desviacin tpica de la variable dicotmica X en la poblacin y en la


muestra, y de la distribucin muestral de la proporcin (P).

Esta circunstancia indica que la proporcin muestral es un estimador insesgado


de la proporcin poblacional.

Cuanto ms alejado est de 0,5, ms elementos debe tener la muestra para realizar
la aproximacin a la normal. En la prctica, se suele aplicar el criterio siguiente: n(1- )
5, por lo que el tamao muestral mnimo requerido se obtiene a partir de:
5
n
(1 )

2010

UNED

TEMA 8

Como P es la media de los valores de X en la muestra (donde X toma valores 0 y 1),


entonces segn el Teorema Central del Lmite, a medida que el tamao de la muestra
crece, la distribucin muestral de la proporcin tiende a la normal con media y
varianza:
(1 )
2P =
P =
n

2 = 9

2
=
n

Introducci
Introduccin al an
anlisis de datos
ESTIMACI
ESTIMACIN DE LA PROPORCI
PROPORCIN

Dado el muestreo aleatorio simple (por lo que permanece constante en cada


extraccin), el estadstico proporcin (P) se distribuye segn una binomial con
parmetros n y .

Datos:

n = 25

UNED

X
N

Muestra

P=

X
n

Varianza

2 = (1 )

S 2 = P (1 P )

Desviaci
Desviacin
tpica

= (1 )

S = P (1 P )

2010

Distribuci
Distribucin
muestral de la
media

P =

2P =
P =

(1 )
n
(1 )
n
21

UNED

UNED

Introduccin al anlisis de datos

TEMA 8

Introducci
Introduccin al an
anlisis de datos
INTERVALOS DE CONFIANZA: MEDIA

TEMA 8

Intervalo de confianza aplicado a la media


Supuestos: muestreo aleatorio simple, variable cuantitativa, distribucin de la
variable en la poblacin normal, conocida.
La finalidad de un intervalo de confianza es estimar un parmetro
desconocido de una poblacin a partir de una muestra.

INTERVALOS DE CONFIANZA

Al estimar la media de la poblacin a partir de una muestra, podemos


cometer un error de estimacin que se define como:

La inferencia estadstica bsicamente consiste en estimar, con cierta


probabilidad, el parmetro desconocido a partir de una muestra aleatoria
extrada de una poblacin. En este apartado estudiaremos la forma de
realizar inferencias sobre un parmetro mediante intervalos de confianza.

| X |
Desconocemos ese error dado que no conocemos , que es lo que queremos
estimar.
La estimacin por intervalo consiste en acotar el error de estimacin con una alta
probabilidad 1 (llamada nivel de confianza) de tal manera que el error de
estimacin no sea superior a un error de estimacin mximo (Emx) fijado por el
investigador:

| X | Emx

2010

Centro Asociado A Coru


Corua

UNED

Introducci
Introduccin al an
anlisis de datos
INTERVALOS DE CONFIANZA: MEDIA

Carmen Voces

TEMA 8

2010

UNED

23

Introducci
Introduccin al an
anlisis de datos
INTERVALOS DE CONFIANZA: MEDIA

TEMA 8

Intervalo de confianza aplicado a la media

Intervalo de confianza aplicado a la media TAMAO DE LA MUESTRA

El error de estimacin mximo (Emx) es funcin de la variabilidad de la variable


en la poblacin, del nivel de confianza (n.c.) y del tamao de la muestra:

Cuanto mayor sea el tamao de la muestra, mayor ser la precisin de las


estimaciones de los parmetros. No obstante, hay razones que imponen lmites al
tamao de la muestra. Por ello, interesa saber cul debe ser el tamao de la muesttra
para un error de estimacin mximo (Emx) dado.

El tamao de la muestra se obtiene despejando n de la ecuacin:

Emx = z1 2

Emx = z1 2

Donde:
Z1-/2 es funcin del n.c. = 1 - y se obtiene en la tabla de la distribucin
normal tipificada (tabla IV). Los valores ms comunes del n.c. son: 0,95, 0,99 y
0,999

es la desviacin tpica de la distribucin muestral de la media, es decir, el


error tpico de la media

La ecuacin es bsica, a partir de ella deduciremos tanto el tamao de la muestra


como los lmites del intervalo de confianza.
2010

24

n=

2
2
E mx

z12

Ejemplo: un investigador quiere conocer el tiempo de reaccin en una tarea de


discriminacin en nios de 12 aos. La variable tiempo de reaccin en la tarea de
discriminacin se distribuye normalmente en la poblacin con = 3. Decide realizar una
estimacin por intervalo del parmetro desconocido y fija un error de estimacin
mximo de 1 segundo para un n.c. = 0,95. Cul debe ser el tamao de la muestra
para estimar la media?

n.c. = 0,95 Z1-/2 = Z1-0,05/2 =


(Tabla IV)
2010

Z 0,975 = 1,96

n=

2
2
E mx

z12

1,96 2 3 2
= 34 ,57 35
12
25

UNED

Introducci
Introduccin al an
anlisis de datos
INTERVALOS DE CONFIANZA: MEDIA

TEMA 8

UNED

Introducci
Introduccin al an
anlisis de datos
INTERVALOS DE CONFIANZA: MEDIA

TEMA 8

Intervalo de confianza aplicado a la media LMITES DEL INTERVALO

Intervalo de confianza aplicado a la media

Los lmites inferior (Li) y superior (Ls) del intervalo de confianza se obtienen a partir
del error de estimacin mximo (Emx).

El nivel de confianza o probabilidad 1 - asociado al intervalo de confianza significa


que si extrajsemos todas las muestras posibles de una poblacin mediante muestreo
aleatorio simple, calculsemos la media en cada una de ellas (recuerde la distribucin
muestral de la media) y para cada media calculramos el intervalo de confianza, con
una proporcin 1 - de todos los intervalos de confianza contendr la media
poblacional y una proporcin no lo contendr:

Li = X Emx = X z1 2

Ls = X + Emx = X + z1 2

Ejemplo: un investigador quiere conocer el tiempo de reaccin en una tarea de


discriminacin en nios de 12 aos. La variable tiempo de reaccin se distribuye
normalmente en la poblacin con = 3. Decide realizar una estimacin por intervalo del
parmetro desconocido y fija un error de estimacin mximo de 1 segundo para un
n.c. = 0,95. El investigador extrae una muestra aleatoria simple de n = 35 nios, les
mide el tiempo de reaccin medio en la tarea y obtiene X = 4 segundos. Cul es el
intervalo de confianza?
Li = X Emx = 4 1 = 3

Ls = X + Emx = 4 + 1 = 5

Interpretacin: con una probabilidad del 95% (n.c. = 0,95) la media poblacional estar
comprendida entre los valores 3 y 5.
2010

UNED

Introducci
Introduccin al an
anlisis de datos
INTERVALOS DE CONFIANZA: MEDIA

1,96 X

TEMA 8

UNED

XB

27

Introducci
Introduccin al An
Anlisis de Datos
EJEMPLO

TEMA 8

Ejemplo: 2010 Septiembre (Modelo A).


25. Para estimar el intervalo confidencial de la media poblacional de una variable
X con desviacin tpica poblacional igual a 4, hemos seleccionado una
muestra de 100 personas y en ella hemos obtenido una media de 10.
Trabajando con un nivel de confianza del 95%, los lmites del intervalo
confidencial son:
a) 8,968 y 11,032
b) 9,216 y 10,784
c) 8 y 12

/2= 0,025

1,96 X

Respecto a la precisin de la estimacin, es fcil imaginar que cuanto menor es el


error de estimacin mximo, menor es la amplitud del intervalo y ms precisa es la
estimacin, dado que el rango de valores qe recoge el intervalo es ms estrecho.
2010

n.c. =
0,95

1,96 X

X z1 2 = 1
P X + z1 2
n
n

La amplitud del intervalo es dos veces el error de estimacin mximo (Emx) y es


constante, es decir, la amplitud es siempre la misma independientemente del intervalo
de confianza que se obtenga. Lo que vara es el valor de la media y es lo que hace
variar los lmites del intervalo de confianza pero no su amplitud.

26

Intervalo de confianza aplicado a la media NIVEL DE CONFIANZA

/2= 0,025

P(X Emx X + Emx) = 1

1,96 X

1,96 X

1,96 X

XA

Vemos que el intervalo asociado a la media A contiene el parmetro y el intervalo de


confianza asociado a la media B no lo contiene. Imagnese que representramos todos
los posibles intervalos de confianza. Pues bien, 1 - = 0,95, significa que el 95% de los
intervalos de confianza contendr el parmetro y el 5% no lo contendr.
2010

28

2010

29

UNED

Introducci
Introduccin al An
Anlisis de Datos
EJEMPLO

TEMA 8

UNED

Introducci
Introduccin al An
Anlisis de Datos
EJEMPLO

TEMA 8

Ejemplo: 2010 Septiembre (Modelo A).

Ejemplo: 2010 Febrero (Modelo A).

25. Para estimar el intervalo confidencial de la media poblacional de una variable


X con desviacin tpica poblacional igual a 4, hemos seleccionado una
muestra de 100 personas y en ella hemos obtenido una media de 10.
Trabajando con un nivel de confianza del 95%, los lmites del intervalo
confidencial son:

25. Para estimar el intervalo confidencial de la media poblacional de una variable


X, hemos seleccionado una muestra de 100 personas y en ella hemos
obtenido una media de 10. Trabajando con un nivel de confianza del 95% se
han obtenido para ese intervalo unos lmites de 9,216 y 10,784, cul es el
valor de la desviacin tpica de esa variable X en la poblacin?


= 1
X z1 2
P X + z1 2
n
n

a) 8,968 y 11,032
b) 9,216 y 10,784
c) 8 y 12

a) 16
b) 4
c) 2

Datos:

X = 10 n = 100 = 4 = 0,05
P(Z z) = 1 /2 = 1 0,05/2 = 0,975 Tabla IV z0,975 = 1,96

Li = X z1 2
Ls = X + z1 2

= 10 1,96

= 9,216

100

= 10 + 1,96

= 10,784

100

2010

UNED

Introducci
Introduccin al An
Anlisis de Datos
EJEMPLO

30

2010

TEMA 8

UNED

31

Introducci
Introduccin al An
Anlisis de Datos
EJEMPLO

TEMA 8

Ejemplo: 2010 Febrero (Modelo A).

Ejemplo: 2010 Febrero (Modelo D).

25. Para estimar el intervalo confidencial de la media poblacional de una variable


X, hemos seleccionado una muestra de 100 personas y en ella hemos
obtenido una media de 10. Trabajando con un nivel de confianza del 95% se
han obtenido para ese intervalo unos lmites de 9,216 y 10,784, cul es el
valor de la desviacin tpica de esa variable X en la poblacin?

24. En una investigacin, la variable estrs laboral se distribuye normalmente


con = 5. Qu tamao mnimo debe tener la muestra para realizar una
estimacin por intervalo de la media si queremos que el error de estimacin
no sea mayor que 2 para un nivel de confianza de 0,99?

a) 16
b) 4
c) 2

Li = X Emx
Ls = X + Emx

9,216=10 Emx
10,784=10+ Emx

Emx = 0,784

Emx = z1 2

0,784=1,96

a) 24
b) 34
c) 42

100

0,784=1,96

7,84
7,84=1,96 =
1,96
10

=4
2010

32

2010

33

UNED

Introducci
Introduccin al An
Anlisis de Datos
EJEMPLO

TEMA 8

Vimos que el tamao de la muestra se obtiene despejando n de la ecuacin:

Ejemplo: 2010 Febrero (Modelo D).


24. En una investigacin, la variable estrs laboral se distribuye normalmente
con = 5. Qu tamao mnimo debe tener la muestra para realizar una
estimacin por intervalo de la media si queremos que el error de estimacin
no sea mayor que 2 para un nivel de confianza de 0,99?
a) 24
b) 34
c) 42

n=

z12

n=

Emx = z1 2

n=

2
2
E mx

z12

Vemos que n depende de tres factores:

La desviacin tpica de la poblacin ()


El nivel de confianza (n.c = 1 - Z1-/2)
El error de estimacin mximo (Emx)

2
E mx

Interesa que un intervalo de confianza sea lo ms estrecho posible y que la


probabilidad del intervalo sea lo ms alta posible. Lamentablemente, a mayor nivel de

n.c. = 0,99 Z1-/2 = Z1-0,01/2 = Z0,995 = 2,58

z12 2
2
E mx

UNED
Introducci
TEMA 8
Introduccin al an
anlisis de datos
INTERVALOS DE CONFIANZA: TAMA
TAMAO DE LA MUESTRA

confianza mayor es el error de estimacin mximo, por lo que ms amplio ser el


intervalo y menos precisa ser la estimacin. Una forma de mantener un error de

2,58 2 5 2
= 41,6025 42
22

estimacin mximo dado y aumentar el n.c., es aumentando el n.


Una forma de reducir el error de estimacin mximo y por lo tanto de aumentar la
precisin de la estimacin es aumentando el n.
Cuanto mayor sea la desviacin tpica de la poblacin mayor debe ser n para alcanzar
una misma precisin.

2010

UNED

Introducci
Introduccin al an
anlisis de datos
INTERVALOS DE CONFIANZA: MEDIA

34

2010

TEMA 8

UNED

Los pasos a seguir para aplicar un intervalo de confianza son los siguientes:

37

Introducci
Introduccin al an
anlisis de datos
INTERVALOS DE CONFIANZA: MEDIA

Lmites de los intervalos de confianza y supuestos para la estimacin de la media

Establecer un error de estimacin mximo para un nivel de confianza 1 -

Supuestos

Obtener el tamao de la muestra n para el error de estimacin mximo especificado


Muestreo aleatorio simple
conocida
Distribuci
Distribucin normal o no normal con n
30 (aprox. a la normal)

Extraer una muestra aleatoria de tamao n y mediar la variable

Calcular el estadstico (el estimador del parmetro) con las medidas obtenidas

Calcular los lmites del intervalo de confianza

Muestreo aleatorio simple


conocida
Distribuci
Distribucin normal o no normal con n 30 (aprox. a la normal)
Muestreo aleatorio simple
desconocida
Distribuci
Distribucin normal
n < 30
Muestreo aleatorio simple
desconocida
Distribuci
Distribucin normal o no normal con n 30 (aprox. a la normal)

2010

TEMA 8

Distribuci
Distribucin Normal

Distribuci
Distribucin t de
Student

Muestreo aleatorio simple


desconocida
Distribuci
Distribucin normal
n < 30

Muestreo aleatorio simple


desconocida
Distribuci
Distribucin normal o no normal con n
30 (aprox. a la normal)

Distribuci
Distribucin normal

39

2010

Lmites del intervalo de confianza


para la media
Li = X z1 2 X

Ls = X + z1 2 X

Donde: z1 /2 Tabla IV

Li = X t n 1;1 2 S X

Ls = X + t n 1,1 2 S X

Donde: tn-1;1 /2 Tabla VI

Li = X z1 2 S X

X =

S
S X = n1
n

Ls = X + z1 2 S X

Donde: z1 /2 Tabla IV

S
S X = n1
n
40

UNED

Introducci
Introduccin al an
anlisis de datos
INTERVALOS DE CONFIANZA: PROPORCI
PROPORCIN

TEMA 8

UNED

Introducci
Introduccin al an
anlisis de datos
INTERVALOS DE CONFIANZA: PROPORCI
PROPORCIN

TEMA 8

Intervalo de confianza para la proporcin

Intervalo de confianza para la proporcin LMITES DEL INTERVALO

Supuestos: muestreo aleatorio simple, variable dicotmica o dicotimizada.

Los lmites inferior (Li) y superior (Ls) del intervalo de confianza se obtienen a partir
del error de estimacin mximo (Emx).

El error de estimacin mximo (Emx) es funcin de la variabilidad de la variable


en la poblacin, del nivel de confianza (n.c.) y del tamao de la muestra:
Emx = z1 2

(1 )
n

Donde:
Z1-/2 es funcin del nivel de confianza 1 - y se obtiene en la tabla de la
distribucin normal tipificada (tabla IV).

(1 ) es la desviacin tpica de la distribucin muestral de la proporcin, es


n

decir, el error tpico de la proporcin (P)

Li = P Emx = P z1 2

P(1 P)
n

Ls = P + Emx = P + z1 2

P(1 P)
n

Ejemplo: se ha propuesto un tratamiento para curar una determinada enfermedad y la


comunidad cientfica quiere estimar la proporcin de pacientes que se curaran si se aplicara
el tratamiento a todos los pacientes. Deciden aplicar un intervalo de confianza para la
proporcin de pacientes curados, y fijan un error de estimacin mximo de 0,20 para un n.c.
= 0,95. Empiezan por calcular el tamao de la muestra para ese error de estimacin mximo
y obtienen n = 24. A Continuacin, extraen una muestra aleatoria simple de 24 pacientes, les
aplican el tratamiento y obtienen 13 pacientes curados, cul es el intervalo de confianza?
n.c. = 0,95 Z1-/2 = Z0,975 = 1,96

Ls = P + Emx = 0,54+ 0,20= 0,74

P = 13/24 = 0,54

Li = P Emx = 0,54 0,20= 0,34

Interpretacin: con una probabilidad del 95% (n.c. = 0,95) la proporcin poblacional de
pacientes curados estar comprendida entre los valores 0,34 y 0,74.
2010

UNED

Introducci
Introduccin al An
Anlisis de Datos
EJEMPLO

41

2010

TEMA 8

UNED

42

Introducci
Introduccin al An
Anlisis de Datos
EJEMPLO

TEMA 8

Ejemplo: 2010 Febrero (Modelo B).

Ejemplo: 2010 Febrero (Modelo B).

25. Algunos trabajos indican una alta prevalencia de depresin en el profesorado


de grado medio. Para cuantificar este problema, se selecciona a una muestra
de 300 profesores de Secundaria encontrando que 63 de ellos presentan
trastornos de tipo depresivo. Utilizando un = 0,01, entre qu lmites se
encontrar la verdadera `proporcin de maestros con problemas depresivos?
a) 0,148 y 0,210
b) 0,062 y 0,210
c) 0,148 y 0,272

25. Algunos trabajos indican una alta prevalencia de depresin en el profesorado


de grado medio. Para cuantificar este problema, se selecciona a una muestra
de 300 profesores de Secundaria encontrando que 63 de ellos presentan
trastornos de tipo depresivo. Utilizando un = 0,01, entre qu lmites se
encontrar la verdadera `proporcin de maestros con problemas depresivos?
a) 0,148 y 0,210
P(1 P)
P(1 P)
b) 0,062 y 0,210 L = P E = P z
Ls = P + Emx = P + z1 2
i
mx
1 2
n
n
c) 0,148 y 0,272
= 0,01 (n.c. = 99%) Z1-/2 = Z0,995 = 2,58

Emx = z1

P = 63/300 = 0,21

P (1 P )
0,21(1 0,21)
= 2,58
= 2,58 0,024 = 0,062
n
10

Li = P Emx = 0,21 0,062= 0,148

Ls = P + Emx = 0,21+ 0,062= 0,272

Interpretacin: con una probabilidad del 99% (n.c. = 0,99) la proporcin poblacional de
pacientes curados estar comprendida entre los valores 0,148 y 0,272.
2010

43

2010

44

UNED

Introducci
Introduccin al An
Anlisis de Datos
EJEMPLO

TEMA 8

UNED

Introducci
Introduccin al An
Anlisis de Datos
EJEMPLO

TEMA 8

Ejemplo: 2010 Febrero (Modelo C).

Ejemplo: 2010 Febrero (Modelo C).

25. Se sospecha que los padres con hijos que padecen el trastorno por dficit
atencional con hiperactividad (TDAH) pueden manifestar tambin dicho
trastorno. Para estudiar este aspecto se ha extrado una muestra de 200
padres y se ha obtenido que el 30% padecen el TDAH. Para un nivel de
confianza del 95%, la amplitud del intervalo de confianza de la proporcin de
padres con TDAH es:
a) 0,064
b) 0,127
c) 0,032

25. Se sospecha que los padres con hijos que padecen el trastorno por dficit
atencional con hiperactividad (TDAH) pueden manifestar tambin dicho
trastorno. Para estudiar este aspecto se ha extrado una muestra de 200
padres y se ha obtenido que el 30% padecen el TDAH. Para un nivel de
confianza del 95%, la amplitud del intervalo de confianza de la proporcin de
padres con TDAH es:
a) 0,064
P(1 P)
P(1 P)
b) 0,127
Li = P Emx = P z1 2
Ls = P + Emx = P + z1 2
n
n
c) 0,032
= 0,05 (n.c. = 95%) Z1-/2 = Z0,975 = 1,96

Emx = z1

P = 0,30

P (1 P )
0,30(1 0,30)
= 1,96
= 1,96 0,0324 = 0,0635
n
200

La amplitud del intervalo es 2 Emx = 2 0,0635 = 0,127


2010

45

2010

46