You are on page 1of 18

tema

67 MATEMÁTICAS

Inferencia Estadística.
Tests de hipótesis.
24-13859-13

Temario 1993
tema 67

matemáticas

1. Inferencia Estadística
1.1. Muestreo Aleatorio

1.2. Tipos de muestreo

1.3. Distribuciones de muestreo

1.4. Distribución muestral de la media

1.5. Distribución muestral de la proporción

1.6. Estimación por intervalos

2. Contraste de hipótesis
2.1. Elementos de un contraste de hipótesis

2.2. Pasos para realizar un test de hipótesis

3
tema 67

matemáticas

INTRODUCCIÓN

La Inferencia Estadística es la rama de la Estadística que trata de sacar conclusiones de la


población objeto de estudio a partir de la información que proporciona una muestra de la
misma. Esta forma de tomar decisiones está basada en la probabilidad, y una gran parte
de estas inferencias están interesadas bien con la estimación de parámetros o bien con la
verificación de hipótesis.
Consideremos la siguiente situación, a modo de ejemplo. Supongamos que se desea realizar
un estudio para determinar cuál es la talla de zapato media del conjunto de mujeres españo-
las. Teóricamente, el valor de este parámetro poblacional existe, pero es desconocido para
nosotros. Si quisiéramos calcularlo con exactitud deberíamos obtener la talla de zapato de
todas y cada una de las mujeres españolas, lo cual sería un trabajo arduo y en ocasiones im-
posible de realizar. Además, ese valor obtenido no tendría validez en poco tiempo, ya que la
población de mujeres ¿Cómo se resuelve esta situación? Considerando solamente una parte
de la población, lo que se conoce como una muestra. Elegimos un grupo de mujeres que
«representen» a toda la población y obtenemos la talla de zapato media de ese subconjunto.
Tendremos calculado entonces un parámetro muestral: la media muestral. Ahora podre-
mos estimar el parámetro poblacional a partir del parámetro muestral. Podríamos decidir
como estimación de la talla de zapato media de las mujeres españolas la media obtenida
en la muestra. Estaríamos realizando lo que se conoce como una estimación puntual. O en
cambio, podríamos analizar la situación y observar cómo se distribuye la media muestral
para poder dar un intervalo en el que, con cierta probabilidad, se encuentre el valor real del
parámetro poblacional. Estaríamos realizando una estimación por intervalos de confianza.
Otra situación sería la siguiente: supongamos que de estudios anteriores sabemos que la
talla media de zapato de las mujeres españolas es una 38. Tomamos una muestra, medimos
su talla y obtenemos una media muestral de 39. Cabe preguntarse si existen evidencias
estadísticas para aceptar que la media ha cambiado o simplemente este cambio ha sido
debido al azar. En este caso hablamos de un problema estadístico conocido como test de
hipótesis.
En este tema vamos a abordar todos los conceptos anteriores: cómo elegir los elementos
que formarán una muestra para que ésta sea lo más representativa posible, cómo se dis-
tribuyen los parámetros muestrales para estimar los parámetros poblacionales utilizando
intervalos de confianza, y, finalmente, cómo plantear y resolver un contraste de hipótesis.

5
tema 67

matemáticas

1 Inferencia Estadística

1.1. Muestreo Aleatorio

Estudiaremos ahora el tratamiento estadístico de las muestras. ¿Bajo qué condi-


ciones es apropiada una muestra? Existen dos aspectos fundamentales que hay
que tener en cuenta a la hora de considerar una muestra. El primero es el tamaño
de la misma. Resulta que cuanto mayor sea el tamaño de la muestra más cerca es-
tarán los parámetros muestrales a los poblacionales. El otro aspecto, seguramente
el más importante, hace referencia a la representatividad de la muestra, es decir,
cómo elegir los elementos que compongan la muestra con el fin de que ésta repro-
duzca fielmente todas las características de la población de origen. Así, si preten-
demos inferir sobre la población, a partir de los cálculos muestrales lo podremos
hacer con el menor error cuanto mayor sea la representatividad de la muestra.
Las consideraciones referentes al tamaño de la muestra, se estudiarán más adelan-
te. Ahora nos centraremos en las que se refieren a la forma de elegir la muestra.

1.2. Tipos de muestreo

El modo más eficaz de conseguir que una muestra sea representativa es elegirla
al azar. Hablamos entonces de muestreo aleatorio. Existe también el muestreo
no aleatorio, aunque las muestras obtenidas por este procedimiento carecen de la
representatividad de las anteriores, y por tanto no resulta tan adecuado.
Dentro del muestreo aleatorio podemos distinguir las siguientes clases:
„„ Muestreo aleatorio simple
Cada muestra tiene la misma probabilidad de ser elegida. Una vez identificados
(por ejemplo numerándolos) todos los elementos de la población y decidido
el tamaño de la muestra, los elementos que formarán parte de la muestra se
eligen aleatoriamente. Si después de cada selección se devuelve el individuo
seleccionada a la población para que pueda volver a ser elegido, el muestreo es
con reemplazamiento.
„„ Muestreo aleatorio sistemático
Es similar al anterior, aunque resulta más cómoda la elección de los individuos.
Con los individuos identificados, se decide el tamaño de la muestra, n, se se-
lecciona aleatoriamente el primer individuo, n0, y se calcula el entero, k, más
próximo al cociente entre el tamaño de la población y el tamaño de la muestra,
esto es N/n. Los siguientes, a partir de n0, se eligen de k en k, teniendo en cuenta
que si se sobrepasa el valor de N debemos comenzar otra vez. Este procedi-
miento puede resultar menos representativo que el anterior.

6
tema 67

matemáticas

„„ Muestreo aleatorio estratificado


Es posible que la característica que se pretende estudiar de la población acon-
seje dividir la población en subconjuntos o estratos. Una vez realizados estos
estratos se decide el tamaño de la muestra, n, y se procede a determinar el ta-
maño de la submuestra en cada estrato proporcionalmente a la población total.
Finalmente, se obtienen las muestras en cada estrato por muestreo aleatorio
simple o sistemático.
„„ Muestreo aleatorio por conglomerados
Se divide la población en subconjuntos o conglomerados, que no necesaria-
mente presenten las mismas características respecto de la variable estudiada.
Después se elige por muestreo aleatorio, los elementos necesarios dentro de
cada conglomerado.

1.3. Distribuciones de muestreo

El objetivo de nuestro estudio es poder hacer inferencia sobre la población a partir


de los cálculos obtenidos en las muestras. Al trabajar con muestras hay que dife-
renciar los parámetros observados en la muestra (parámetros estadísticos o sim-
plemente estadísticos) de los parámetros reales correspondientes a la población
(parámetros poblacionales o simplemente parámetros).
Supongamos que de la población formada por todas las mujeres españolas, se
extrae aleatoriamente una muestra de 100 mujeres y se les pregunta por su talla de
zapato, obteniendo una talla media de 38,2. ¿Cuál sería este valor si obtuviéramos
otra muestra? ¿Serían iguales? Evidentemente, cada vez que obtuviéramos una
muestra diferente el cálculo de la talla media podría variar. Esto hace que la talla
media se comporte como una variable aleatoria, y por tanto tiene una distribución
de probabilidad, que llamaremos distribución muestral. Los parámetros de esta
distribución nos ofrecerán una aproximación del parámetro poblacional que estu-
diamos.
Efectivamente, para cada parámetro objeto de estudio (media, proporción, varian-
za…) se puede tener en cuenta el estadístico asociado (media muestral, proporción
muestral, varianza muestral…) y se define entonces su distribución muestral.
A continuación veremos dos resultados referentes a la distribución muestral de las
medias y la distribución muestral del parámetro p de una distribución binomial.

1.4. Distribución muestral de la media

Supongamos una población con media μ y varianza σ2. Consideremos todas las
muestras posibles de tamaño n y se calcula el valor de la media de cada una de
las muestras. Consideremos la variable aleatoria X , que asigna a cada muestra el
valor de la media obtenida. Sean μ X y σ X la media y la desviación típica de la
variable. Así, tenemos:

7
tema 67

matemáticas

„„ La media de la media de las muestras es igual a la media de la población, esto


es μ = μ X

σ
„„ σX = . Esto indica que a medida que n crece, la variabilidad con la que la
n
media muestral se distribuye alrededor de la media poblacional disminuye, con
lo que aumentaría la precisión para estimar la media poblacional por el estadís-
tico muestral.
„„ Si la población tiene distribución normal, entonces X sigue también una distri-
bución normal. Si la población no sigue una distribución normal, a medida que
n crece, la distribución de X se aproxima a una normal. Consideraremos una
buena aproximación a partir de tamaños muestrales n = 30. Si la población no
es normal y n < 30, entonces X sigue la distribución t-Student.
Ejemplo
La edad de los alumnos de cierto instituto se distribuye con una media de 14 y una
desviación típica de 2 años. Tomamos al azar una muestra de 100 alumnos y que-
remos calcular la probabilidad de que la edad media sea superior a los 14.5 años.
Los parámetros poblacionales son μ = 14 y σ = 2. Como el tamaño de la muestra
es n – 100 > 30 entonces la variable aleatoria que asigna a cada muestra de tama-
ño 40 su edad media se distribuye:
 σ   2 
X ≈ N  μ,  = N 14,  = N (14, 0.2 )
 n  100 
Así, la probabilidad que deseamos calcular es:
 X − 14 14.5 − 14 
P ( X > 14.5 ) = P  >  = P ( Z > 2.5 ) =
 0.2 0.2 
= 1 − P ( Z ≤ 2.5 ) = 0.0062

1.5. Distribución muestral de la proporción

Supongamos que se desea estudiar la proporción, p, que cumple determinada ca-


racterística en una población. Consideremos todas las muestras posibles de ta-
maño n y se calcula el valor de dicha proporción en estas muestras. Sea P la
variable aleatoria que asigna a cada muestra de tamaño n el valor de la proporción
calculada. Sean μ P y σ P la media y la desviación típica de la variable P . Así
tenemos:

p ⋅ (1 − p )
„„ μP = p y σ P =
n
„„ Si además np > 5 y n ⋅ (1 − p ) > 5 , se considera buena la aproximación normal
de la binomial, y entonces:
 p ⋅ (1 − p ) 
P ≈ N  p, 
 n 
 

8
tema 67

matemáticas

Ejemplo
Después de aprobarse su utilización, un fármaco ha curado de su enfermedad al
52% de los pacientes que lo utilizaron. Si, antes de aprobarlo se hubiera decidido
suministrarlo a una muestra de 500 de estos pacientes, se quiere calcular la proba-
bilidad de que el fármaco hubiese sido eficaz en menos del 50% de los pacientes.
El parámetro poblacional es p = 0,52
Como np = 500 ⋅ 0, 52 = 260 > 5 y n ⋅ (1 − p ) = 500 ⋅ 0, 48 = 240 > 5

 p ⋅ (1 − p ) 
P ≈ N  p,  = N ( 0, 52; 0, 022 )
 n 
 
y por tanto la probabilidad que deseamos calcular es:

 P − 0, 52 0, 5 − 0, 52 
P ( P < 0, 5 ) = P  <  = P ( z < −0, 91) = 0,1814
 0, 022 0, 022 

1.6. Estimación por intervalos

Supongamos que nos encontramos con una población cuya distribución denotare-
mos por f (x) y sea θ un parámetro desconocido de dicha distribución. Entendere-
mos por problema de estimación el que trata de inferir el valor de θ en base a los
datos de una muestra.
La estimación de parámetros de uso común son de dos tipos: la estimación pun-
tual, en la que se aproxima el valor del parámetro a partir de un estadístico cal-
culado en la muestra, la estimación por intervalos de confianza, en la que se
ofrece un intervalo que debe contener el verdadero valor del parámetro con cierta
probabilidad.

XX Estimación puntual

A la hora de estimar un parámetro se pueden considerar, en principio, diferentes


estadísticos. Si pretendemos estimar la media poblacional, se puede utilizar la
media muestral, pero también la mediana o la moda muestrales. ¿Cuál de estos
estadísticos, llamados también estimadores, ofrece una estimación más fiable del
parámetro?. No existe un criterio único para encontrar el mejor estimador, pero sí
existen una serie de propiedades que es deseable que un buen estimador cumpla,
obtenidas a partir de su distribución.

Diremos que un estimador θ de un parámetro es insesgado cuando su distribu-


ción está centrada en el parámetro a estimar. Esto es, si su esperanza coincide con

()
el valor del parámetro: E θ = θ . En caso contrario se dice que el estimador tiene
sesgo, cuyo valor es θ − E (θ ) .

9
tema 67

matemáticas

Por ejemplo la media muestral X es un estimador insesgado de la media pobla-


cional μ, ya que E ( X ) = μ .
Diremos que un estimador θ de un parámetro θ es consistente si la probabilidad
de que estén muy próximos la estimación y el parámetro aumenta y tiende a 1 al
aumentar el tamaño de la muestra.
Dados dos estimadores θ 1 y θ 2 de un parámetro , diremos que θ 1 es más eficiente
( ) ( )
que θ 2 si tiene menor varianza, esto es, si Var θ 1 < Var θ 2 .
Se considera que un estimador es bueno, cuando es insesgado y tan consistente y
eficiente como sea posible.

XX Estimación por intervalos de confianza

Si se decide estimar el valor de un parámetro θ por intervalos de confianza, en-


tonces el objetivo es encontrar un intervalo, cuyos extremos se han calculado en
base a los datos de la muestra, y que exista una probabilidad alta de contener al
verdadero valor del parámetro desconocido.
De entrada debemos fijar la probabilidad 1 − α con la que se pretende que el inter-
valo contenga al parámetro θ. Esta probabilidad, 1 − α también se conoce como
nivel de confianza y al valor de α se le llama nivel de significación (habitual-
mente se denotan en %)
Para obtener el intervalo de confianza asociado a un parámetro, necesitaremos
conocer la distribución muestral del estadístico utilizado.
Anteriormente vimos la distribución muestral de la media y de la proporción.
Esto nos ayudará a calcular el intervalo de confianza en cada uno de estos casos.
Evidentemente, si pretendemos estimar otro parámetro diferente (varianza de una
distribución normal, diferencia de medias entre dos distribuciones, etc) necesi-
taremos conocer la distribución muestral de estos estadísticos para poder dar el
intervalo de confianza.
Como decíamos, y a modo de ejemplo, obtendremos los intervalos de confianza
para la media y para la proporción.

10
tema 67

matemáticas

2 Contraste de hipótesis
El contraste de hipótesis, también conocido como test de hipótesis, es, en esencia,
un procedimiento que permite verificar una afirmación acerca de la función de
densidad de una variable aleatoria. Evidentemente también en este procedimiento
trabajaremos con muestras aleatorias, y el objetivo será determinar si los datos
ofrecen evidencia estadística para poder aceptar la hipótesis que se plantea.
En ocasiones, se desea contrastar si una variable aleatoria, se distribuye según un
modelo normal, o si dos variables aleatorias dadas son o no independientes. Son
ejemplos de contrastes en los que se pretende verificar el modelo a aplicar a la
variable o variables aleatorias. Hablamos en este caso de contrastes no paramé-
tricos.
En otros casos, se desea verificar si el valor de la media de una distribución es
μ = 10 , o si cierta proporción vale p = 0.4. Estos son ejemplos de contrastes cuyas
hipótesis consisten en afirmaciones acerca del valor de un parámetro de la función
de densidad. Hablamos entonces de contrastes paramétricos, y son en los que
nos centraremos en adelante.

2.1. Elementos de un contraste de hipótesis

Vamos a introducir los diferentes elementos que intervienen en un test de hipótesis


con un sencillo ejemplo. Consideremos que de estudios anteriores se acepta que la
talla de zapato de las mujeres españolas se distribuye normalmente con una media
μ = 38 y una desviación típica σ = 2. Supongamos que hemos tomado una muestra
aleatoria formada por 256 mujeres de la cual se obtiene una talla media X = 39.
¿Quiere decir esto que ha cambiado la media poblacional? O dicho de otro modo
¿Existe evidencia estadística para admitir que μ > 38?
Aquí nos encontramos con los primeros elementos de un contraste: las hipótesis.
De entrada tenemos la hipótesis que se considera cierta y que deseamos contrastar
con los datos. En el ejemplo, la que afirma μ = 38, y es la que se conoce como hi-
pótesis nula, y se denota por H0. Cualquier hipótesis contraria a la hipótesis nula,
como en este caso la que afirma μ > 38 se conoce como hipótesis alternativa, y
se denota por H1. Así el contraste se plantea del siguiente modo:

 H 0 : μ = 38

 H1 : μ > 38
Habitualmente se toma como la hipótesis a contrastar, aceptándola o rechazán-
dola. Vamos a trabajar en términos de probabilidad y, en consecuencia, tanto si
aceptamos como si rechazamos existe la posibilidad de equivocarse. Podemos
rechazar H0 siendo ésta cierta (error de tipo I) o aceptarla siendo falsa (error de
tipo II).

11
tema 67

matemáticas

En estos dos casos estaríamos cometiendo un error al tomar una decisión equivo-
cada. La siguiente tabla muestra las diferentes situaciones al aceptar o rechazar la
hipótesis nula y el error cometido, si es el caso.

H0 Cierta Falsa
Se acepta No hay error Error de tipo II
Se rechaza Error de tipo I No hay error

La probabilidad de cometer un error de tipo I se representa por α, y se le llama ni-


vel de significación. La probabilidad de cometer un error de tipo II se representa
por β. Al valor 1 – β se le conoce como potencia del contraste.
Los contrastes de hipótesis tratan de diseñarse procurando que la probabilidad de
error sea mínima, es decir, minimizar los valores α y β. Pero en la práctica esta no
es una tarea sencilla; a menudo, al tratar de disminuir un tipo de error aumenta el
otro.
Existen diferentes procedimientos para determinar un test que, de algún modo,
equilibre estos riesgos. Nos centraremos en el más habitual, que consiste en esta-
blecer un valor fijo para α, siendo el valor más usual α = 0,05 (aunque también se
utilizan 0,01 ó 0,02) y tomar como hipótesis nula aquello que se considera cierto,
válido inicialmente (hipótesis conservadora). El valor α = 0,05 nos indica que
aproximadamente el 5% de las veces las hipótesis nulas ciertas que se contrastan
serán rechazadas.
Así pues, retomemos nuestro problema y añadamos los elementos nuevos. Que-
remos contrastar:
 H 0 : μ = 38

 H1 : μ > 38
con un nivel de significación α = 0,05.
Recordemos que este es un contraste paramétrico, referente a la media de una
distribución normal. Vamos a elegir un estimador de μ, al que llamaremos esta-
dístico de contraste. En este caso, sabemos que un buen estimador es la media
muestral X .
De los apartados anteriores, sabemos cuál es la distribución muestral de este esti-
mador, y debemos tener en cuenta que el nivel de significación es la probabilidad
de rechazar la hipótesis nula siendo cierta, luego estamos en las condiciones de
H0, esto es, μ = 38. Por tanto:
 σ   2 
X ≈ N  μ,  = N  38,  = N ( 38, 0.125 )
 n  256 
Ahora llegamos al punto clave del contraste. Debemos determinar una región de
rechazo R, a la que llamaremos región crítica, de manera que la probabilidad de
que el estadístico de contraste esté en esta región sea justamente el nivel de signi-
ficación, esto es:
P ( X ∈ R ) = α ⇒ P ( X ∈ R ) = 0.05

12
tema 67

matemáticas

Como la hipótesis alternativa es H1 : μ > 38 , rechazaremos la hipótesis nula sola-


mente si μ toma valores alejados de 38 pero más grandes. Es decir, buscamos un
valor k tal que P ( X > k ) = 0.05 . Estandarizando en esta expresión tenemos:
 X − 38 k − 38   k − 38 
P ( X > k ) = 0.05 ⇔ P  >  = 0.05 ⇔ P  Z ≤  = 0.95
 0.125 0.125   0.125 

De las tablas de la normal sabemos que el valor zα = 1.645 cumple P(Z ≤ zα) = 0,95.
Con lo cual:
k − 38
= 1.645 ⇒ k = 0.125 ⋅1.645 + 38 ⇒ k = 38.2056
0.125
Por tanto, la región crítica será el intervalo (38.2056, +∞). Solamente quedará
comprobar si el estadístico de contraste utilizado cae o no dentro de la región de
rechazo. Del enunciado teníamos X = 39 que pertenece claramente al intervalo,
con lo que deberemos concluir el test rechazando la hipótesis nula. Es decir, exis-
te evidencia estadística para afirmar que la talla media de zapato de las mujeres
españolas es mayor que una 38.

2.2. Pasos para realizar un test de hipótesis

Vamos a resumir los pasos necesarios para realizar un contraste de hipótesis. Su-
pongamos que, con un nivel de significación α, deseamos contrastar el valor de
un parámetro poblacional λ y consideremos conocida la distribución. Seguiremos
los pasos siguientes:
1. Plantear las hipótesis nula y alternativa.
2. Elegir un estimador de λ cuya distribución sea conocida bajo la hipótesis
nula.
3. Determinar la región crítica.
4. Calcular el valor del estadístico de contraste en la muestra.
5. Aceptar o rechazar la hipótesis nula en función de si el estadístico de contraste
queda fuera o dentro de la región crítica.
Ejemplo
Un partido político asegura que en las próximas elecciones obtendrá el 80% de
los votos. Una encuesta realizada por una empresa privada sobre 1600 personas
revela que 1200 personas votarán a este partido. Veamos si, para un nivel de signi-
ficación del 5% podemos aceptar la hipótesis que mantiene el partido político.
Se trata de contrastar el valor del parámetro p de una distribución binomial (es
decir, de una proporción). Planteamos las hipótesis
 H 0 : p = 0.8

 H1 : p ≠ 0.8

13
tema 67

matemáticas

Consideramos el estadístico de contraste la proporción muestral P cuya distribu-


ción bajo la hipótesis nula es conocida
 p ⋅ (1 − p )   0.8 ⋅ 0.2 
P ≈ N  p,  = N  0.8,
  = N ( 0.8, 0.01)
 n   1600 
 
Vamos a determinar la región crítica. Como la hipótesis alternativa mantiene
p ≠ 0.8 , rechazaremos la hipótesis nula siempre que el valor estimado del pará-
metro p esté lejos de 0.8; pero esto puede ocurrir con valores mayores que 0.8 ó
con valores menores que 0.8.
Por tanto, la región crítica será de la forma:
R = ( −∞, k1 ) ∪ ( k2 , +∞ )
Es decir, debemos encontrar los valores k y k2 que cumplen:
P ( P ∈ R ) = 0.05 ⇔ P ( k1 < P < k2 ) = 0.95
Estandarizando, tenemos:
P − 0.8
Z= ≈ N ( 0,1)
0.01
y por tanto:
 k − 0.8 k − 0.8 
P 1 <Z< 2  = 0.95
 0.01 0.01 
De las tablas de la normal estándar podemos encontrar el valor zα tal que:
2

   
P  − zα < Z < zα  = 0.95 ⇔ P  Z < zα  = 0.975 ⇒ zα = 1.96
 2 2   2  2

Igualando obtenemos los valores k1 y k2


k1 − 0.8 k − 0.8
= −1.96 ⇒ k1 = 0.7804 2 = 1.96 ⇒ k2 = 0.8196
0.01 0.01
La región crítica será entonces:
R = ( −∞, 0.7804 ) ∪ ( 0.8196, +∞ )
Calculemos el estadístico de contraste de la muestra:
1200
P= = 0.75
1600
Este valor queda dentro de la región crítica, y por tanto debemos rechazar la hi-
pótesis nula.
Concluiremos diciendo que a un nivel de significación del 5% los datos muestran
suficiente evidencia de que la proporción de votantes al partido político no será
de 0.8.

14
tema 67

matemáticas

BIBLIOGRAFÍA
CASELLA Y BERGER: Statistical Inference. Wadsworth and Brooks/Cole, 1990.
DE GROOT: Probabilidad y Estadística. Addison-Wesley Iberoam., 1988
HOEL, P. G.: Introducción a la estadística matemática. Ariel, SA, 1980

15
tema 67

matemáticas

RESUMEN

Inferencia Estadística.
Tests de hipótesis.

1.
1 Inferencia Estadística
Es la rama de la Estadística que trata de sacar conclusiones de la población objeto de estu-
dio a partir de la información que proporciona una muestra.

1.1. Muestreo Aleatorio


¿Bajo qué condiciones es apropiada una muestra? Es tan importante controlar el tamaño
de la muestra como la representatividad de esta.

1.2. Tipos de muestreo


Se ven los diferentes tipos de muestreo aleatorio que garantizan la representatividad de la
muestra. Se definen: Muestreo aleatorio simple, sistemático, estratificado y por conglo-
merados

1.3. Distribuciones de muestreo


Los parámetros observados en las muestras, también llamados estadísticos, toman valores
diferentes si consideramos muestras diferentes. Por lo tanto se comportan como variables
aleatorias y estudiamos su distribución.

1.4. Distribución muestral de la media


En una población con distribución normal (o si no es el caso, suponiendo que tomamos
una muestra de tamaño n > 30) cuya media es μ y la desviación típica es σ, el estadístico
media muestral X se distribuye según una ley normal.

 σ 
X ≈ N  μ, 
 n

1.5. Distribución muestral de la proporción


Se pretende estudiar el parámetro p de una distribución binomial (una proporción). Para
tamaños muestrales n tales que np > 5 y n ⋅ (1 − p ) > 5 la distribución de la proporción mues-
tral es:

 p ⋅ (1 − p ) 
P ≈ N  p, 
 n 
 

17
tema 67

matemáticas

1.6. Estimación por intervalos


XX Estimación puntual
Se basa en estimar un parámetro poblacional por un estadístico obtenido de la muestra. Se
estudian las características de los estimadores: sesgo, consistencia y eficiencia.
XX Estimación por intervalos de confianza
Este modo de estimación se basa en dar un intervalo en el que se encontrará el valor real
del parámetro con cierta probabilidad, a la que se llama nivel de confianza. Vemos dos
ejemplos en los siguientes apartados.

2.
2 Contraste de hipótesis
Es un procedimiento que permite verificar una afirmación acerca de la función de densidad
de una variable aleatoria. El objetivo será determinar si los datos ofrecen evidencia esta-
dística para poder aceptar la hipótesis que se plantea.

2.1. Elementos de un contraste de hipótesis


Se definen los conceptos siguientes: Hipótesis nula y alternativa, error de tipo I y de tipo
II, nivel de significación, potencia del contraste, estadístico de contraste y región crítica

2.2. Pasos para realizar un test de hipótesis


Primero se deben plantear las dos hipótesis. El siguiente paso es elegir un estimador cuya
distribución sea conocida bajo la hipótesis nula. Pasaremos a calcular la región crítica y
por último comprobaremos si el estadístico de contraste queda dentro o fuera de esta re-
gión, con lo que aceptaremos o rechazaremos la hipótesis nula.

18