You are on page 1of 29

Estadística Matemática

• Estimación por intervalos y prueba de hipótesis
– La estimación puntual no proporciona información al investigador sobre qué tan cerca está del “verdadero” parámetro poblacional
• ¿Si obtengo un estimador de 1.2, qué puedo concluir? • Necesito entonces apelar no sólo al valor de la estimación puntual sino a cómo luce la distribución muestral del estimador
– ¿Qué tan lejos estás 1.2 de 1? – Comenzaré por intervalos de confianza, luego iré a las pruebas de hipótesis – Comenzaré con un ejemplo

Estadística Matemática
• Estimación por intervalos – ejemplo
– Supongamos que tengo una población normal con media y varianza conocida 2 entonces la media muestral tiene distribuciónY normal Z con media y varianza 2/n. La variable estandarizada / n tiene distribución normal (0,1). Podemos escribir entonces, conociendo los valores de la tabla normal
Y / n

P

1.96

1.96

0.95 0.95

P Y 1.96 / n o sintéticam ente Y 1.96 / n

Y 1.96 / n

Estadística Matemática • Estimación por intervalos – ejemplo – ¿Cómo interpretarlo? • Cuando decimos que por ejemplo que Y 1. entendemos que este intervalo aleatorio contiene a con probabilidad de 0. ya que los extremos cambiarán según tengamos muestras distintas .95. como lo es un estimador puntual.96 / n es el intervalo de confianza al 95% para . Si = * Y z * /2 / n • Este es el estimador de intervalo de confianza para la media poblacional cuando es conocida • Es aleatorio.

puede contener o no contener al verdadero parámetro poblacional. es que si uno repite infinitamente el muestreo.23. para el 95% de las muestras aleatorias el intervalo de confianza construido contendrá a .65 0. ya no hay interpretación probabilística.95” • Una vez calculado.Estadística Matemática • Estimación por intervalos – ejemplo • ¿Cómo NO interpretarlo? – “la probabilidad de que esté en dicho intervalo es 0. ej. no lo sabremos nunca • La interpretación probabilística correcta ex ante. 0.

13-2. reproducida en parte Intervalos de confianza simulados de una distribución normal ( .27 1.75 Intervalo al 95% 1.34-2.61-2.43 1..60 0.88 2.03-2.2 JW.58 0.98 1..58 2.65 1.26-2.1). 19 20 Promedio muestral 1.85 1.96-3.34 2.54-1.58 1.. Luego obtengo para cada muestra el intervalo para la media muestral 1 2 3 4 5 6 7 8 9 .23 1.16 1.20 1.96-2. con =2 Ejercicio: obtengo muestras aleatorias extraídas de una población normal que TIENE =2 y varianza unitaria.20 0.36-2.96 1.78 1.50 1.72-2.05 1.81-2.Estadística Matemática • • • Estimación por intervalos – ejemplo tabla C.96 1.37 .

no podemos construir el intervalo de confianza como lo hicimos antes – Debemos reemplazar la varianza poblacional por un estimador. la Y varianza muestral. ahora teniendo en cuenta que la variable se distribuye t. pero entonces la variable S / n no se distribuye normal sino tn-1 (recuerden la definición que ya vimos) – Elegimos el nivel de confianza y nuevamente construimos el intervalo de confianza. Los valores t se obtienen de tabla n P PY t /2 Y S/ n /2 t /2 1 t /2 t S/ n Y S/ n 1 .Estadística Matemática • Estimación por intervalos – varianza desconocida – Si no conocemos la varianza.

Estadística Matemática • Intervalo de confianza distribución t .

Vamos a diseñar contrastes de hipótesis (tests) para determinar si podemos rechazar o no rechazar la hipótesis nula. más que de grado. versus H1: * – Ho se denomina hipótesis nula. La prueba de hipótesis será del estilo • Ho: = *.Estadística Matemática • Prueba de hipótesis – ¿cómo evaluar las siguientes preguntas? • ¿Es cierto que los profesionales tienen salarios más altos que los no profesionales? • ¿Reciben las mujeres salarios más bajos que los hombres? • ¿Son efectivos los programas de seguridad ciudadana? – Todas estas preguntas requieren una respuesta de SI/NO . .

• Pero como no conocemos la media poblacional y sólo tenemos una muestra lo que en definitiva haremos es evaluar si nuestros datos son consistentes con tener una media igual a 2.Estadística Matemática • Prueba de hipótesis – Importante • La prueba de hipótesis involucra el parámetro. entonces indirectamente no fuimos capaces de rechazar que la media poblacional era dos . • Indirectamente ya lo hemos hecho cuando construimos un intervalo de confianza – Si el intervalo de confianza contenía el número 2. queremos saber por ejemplo si la media de una cierta variable es igual a 2.

Estadística Matemática • Prueba de hipótesis – errores que podemos cometer – Error tipo I: rechazar la hipótesis nula cuando esta es verdadera • Rechazamos que la media sea dos cuando efectivamente =2 (en sólo una muestra de 20 en la tabla C. ¿Por qué? Construimos el test bajo el supuesto que la hipótesis nula es cierta • Veamos un ejemplo y la mecánica de construir un test de hipótesis .estamos fijando el error tipo I.2) – Error tipo II: no rechazar la hipótesis nula cuando ésta es falsa – Podemos calcular las probabilidades de cometer ambos errores. el problema es que no podemos reducir un error sin aumentar el otro – Cuando definimos el nivel de confianza 1.

• Cuando construí el intervalo de confianza obtuve PY t /2 S/ n Y t /2 S/ n 1 • Ahora voy a ver la otra cara de la moneda .Estadística Matemática • Prueba de hipótesis – ejemplo • Quiero diseñar un contraste o test para la media poblacional • Quiero evaluar si es igual o distinta de dos • Como no conozco la varianza poblacional debo usar la muestral y entonces tengo que usar la distribución t.

ver gráfico en ejemplo más simple =2 =3 Error tipo II . Fijo el error tipo I.05 • Estoy dispuesto a rechazar erróneamente Ho el 5% de las veces en aras de detectar desviaciones con respecto a Ho • Si quiero reducir el error tipo I.Estadística Matemática • Prueba de hipótesis – ejemplo – Quiero evaluar Ho: =2 vs H1: 2 . entonces Y 2 • Si la hipótesis nula es cierta la variable t S / n tiene una distribución t con n-1 gdl. la probabilidad de rechazar Ho dado que Ho es cierta. aumento el error tipo II. =0.

Estadística Matemática • Prueba de hipótesis – ejemplo – Errores que cometo según decisión que tome y estado de la realidad Decisión que tomé Rechazar H0 No rechazar H0 Estado de la realidad H0 es cierta H0 es falsa Error tipo I: α Decisión correcta Error tipo II: β Decisión correcta – Otro concepto: poder de un test • Complemento del error tipo II: probabilidad de rechazar la hipótesis nula cuando esta es falsa .

98 2 0.23 1. Supongamos que n=25 y S/ n Y 0.23 0. los datos son consistentes con una media poblacional igual a dos .98 – El test se calcula tobs Y 2 S/ n 1.39) No puedo rechazar Ho.Estadística Matemática • Prueba de hipótesis – ejemplo – Cálculo del test.0866 Cae en zona de no rechazo (t crítico con 24 gdl es 2.

el valor p es igual a p=P(|t|>|t-obs|) => zona sombreada en el gráfico. p=0.8. – Supongamos que el t-observado es 1. Si n=25.077 – Si conocemos el valor p y el valor sabemos si caemos en zona de rechazo o no rechazo.Estadística Matemática • Prueba de hipótesis – p-value – Fijado el nivel de significancia una forma alternativa de evaluar si caemos en zona de rechazo o no rechazo es el valor-p. La regla es Rechazo si p-value< Caigo en zona de rechazo Valores de p pequeños conducen a rechazo 0 Suma de las áreas=p-value .

509 X se (6.3 / 8 42.16 .813 14.036) t 3.41) (.Ejemplo en el modelo de regresión • Estimamos el siguiente modelo (n=10) Y = 24.47 + 0.243 ¿Cómo obtenemos estos números? ^ 2 ˆi n 2 2 337 .

16 10(33.41 var ( ) S XX ^ .000 6.4 error standard ( ) ^ 2 var ( ) 42.000) ^ 41.036 .0013 ^ error standard ( ) var ( ) .16 33.000 42.Ejemplo en el modelo de regresión ^ var ( ) X i2 nS XX ^ ˆ 2 322.

– Esta es una meida de cuánto varía de una muestra a otra – Podemos definir un intervalo de confianza o contrastar hipótesis acerca del estimador .036.Ejemplo • El valor estimado para la pendiente es 0.509 (estimación) y su correspondiente error estándar es 0.

Hasta ahora sólo hemos hablado de su esperanza y varianza .Test de hipótesis • Definamos una hipótesis nula de que nuestro parámetro no es estadísticamente distinto de cero – H0: = 0 – ¿Qué significa?: • En el modelo de salarios y educación. que la educación no afecta el salario horario – Podemos evaluar si nuestros datos son consistentes o no con esta hipótesis – Pero necesitamos saber cuál es la distriabución de estimador de .

Test de hipótesis • Sabemos que es una función lineal de Y – Si asumimos que el error se distribuye normal con media 0 y ˆ varianza 2 podemos demostrar que se distribuye normal con esperanza y varianza ^ 2 Var ( ) S XX – Como no conocemos el verdadero 2 no podemos usar este resultado directamente. vuelvo a esto luego . sino que utilizaremos un estadístico t.

1) .Test de hipótesis • ˆ ~ N( . entonces: ˆ Z / ˆ x 2 i ~ N(0. construir un intervalo de confianza o realizar una hipótesis – Son pasos equivalentes • tiene una distribución normal con media 0 y una varianza como ya la escribimos. ( )2) • Podemos entonces.

Test de hipótesis • Como no conocemos la verdadera varianza – La estimamos – Luego tenemos: 2 ˆ2 ^ 2 / ^ xi2 ~ t n -2 . ˆ n 2 2 i where .

154218 .0056847=33. t P>|t| [95% Conf.2190831 266 .266092 ------------------------------------------------------------------------------ • H0: = 0 (0.909536 267 1.05682 125.0000 = 0. 266) Prob > F R-squared Adj R-squared Root MSE = 268 = 1141.40 = 0.8110 = 0.000 7. Interval] -------------+---------------------------------------------------------------educ | .2032467 _cons | 7.1808614 .1920541-0)/0.8103 = .690453 Residual | 61.1920541 .21314433 Number of obs F( 1.0056847 33.47974 -----------------------------------------------------------------------------ln_sal | Coef.91 0.78 . Err.000 .Test de hipótesis .042344 7. Std.690453 1 262.78 0.Ejemplo Source | SS df MS -------------+-----------------------------Model | 262.230146929 -------------+-----------------------------Total | 323.

5944 • Valor crítico (95% nivel de confianza) t266=1.9689 • Valor crítico (90% nivel de confianza) t266=1.6506 .Ejemplo Caigo en zona de rechazo • Valor crítico (99% nivel de confianza) t266=2.Test de hipótesis .

78)=número muy pequeño. 0.Ejemplo Caigo en zona de rechazo • p-value: Prob(t<-33.00…(96 ceros)32 .Test de hipótesis .78)+Prob(t>33.

96 xi2 ^ .96 x 2 i ˆ 1.96 * 0.95 ˆ ^ 1.95 / ^ P ˆ 1.96 x 2 i .96 P 1.1809 0.95 ˆ 0.96 * 0.01114201 P 0.96 t 1.005 P ˆ 0.Intervalo de confianza .96 se ( ˆ ) .95 .Ejemplo P( 1.96 ) .95 ˆ 1.95 P ˆ 1.95 .96 se ( ˆ ) P ˆ 1.01114201 .005 .2031 ˆ 1.

909536 267 1. Err. 266) Prob > F R-squared Adj R-squared Root MSE = 268 = 1141.154218 .690453 Residual | 61.0056847=-1.47974 -----------------------------------------------------------------------------ln_sal | Coef.000 .266092 ------------------------------------------------------------------------------ • H0: = 0. Interval] -------------+---------------------------------------------------------------educ | .40 = 0.Test de hipótesis .0000 = 0.78 0.91 0.20 (0.2190831 266 .1920541 .05682 125.042344 7.8110 = 0.230146929 -------------+-----------------------------Total | 323.21314433 Number of obs F( 1.3967 .000 7.1920541-0.Ejemplo Source | SS df MS -------------+-----------------------------Model | 262.8103 = .690453 1 262.1808614 . Std.20)/0. t P>|t| [95% Conf.2032467 _cons | 7.0056847 33.

Ejemplo Caigo en zona de no rechazo • Valor crítico (99% nivel de confianza) t266=2.Test de hipótesis .5944 • Valor crítico (95% nivel de confianza) t266=1.6506 .9689 • Valor crítico (90% nivel de confianza) t266=1.

84 .3967)+Prob(t>1.3967)=0.Test de hipótesis .16 • Sólo podríamos rechazar si eligieramos un nivel de confianza inferior al 0.Ejemplo Caigo en zona de no rechazo • p-value: Prob(t<-1.