You are on page 1of 8

00111111111

Estadistica Inferencial
Contabilidad y Finanzas

Prueba de hipotesis y regresion lineal


Módulo 4: Analisis exploratorio de datos e inferencia
estadistica

1
Resuelve los siguientes ejercicios, es requisito entregarlos con el desarrollo
completo del procedimiento que seguiste para llegar a la solución del
problema.

1. Los datos siguientes son los tiempos de traslado de autobuses, en minutos,


en varias pruebas para llegar a un destino; saliendo del mismo punto y
empleando dos rutas independientes R 1 y R2, considerando que las varianzas
son iguales.

Ruta 63 81 57 66 82 82 68 59 75 73
1
Ruta 64 72 83 59 65 56 63 74 82
2

a) Realiza la prueba de hipótesis con un nivel de significancia de 0.05 para demostrar


que no hay diferencia en los tiempos medios de traslado entre las dos rutas.

Para realizar la prueba de hipótesis y determiar si hay una diferencia significativa en


los tiempos medios de traslado entre las dos rutas, podemos utilizar una prueba t de
dos muestras

Establecer las hipótesis

 Hipótesis nula (H0): No hay diferencia en los tiempos medios de traslado entre
las dos rutas (μ1 = μ2).
 Hipótesis alternativa (H1): Hay una diferencia en los tiempos medios de
traslado entre las dos rutas (μ1 ≠ μ2).

Calcular las estadisticas de pruebas

Para realizar la prueba t de dos muestras, necesitamos calcular la diferencia de las


medias muestrales y la desviación estándar combinada.

 Calculamos la diferencia de las medias muestrales:


o Media muestral de la Ruta 1 (x̄ 1) = (63 + 81 + 57 + 66 + 82 + 82 + 68 + 59 +
75 + 73) / 10 = 70.6
o Media muestral de la Ruta 2 (x̄ 2) = (64 + 72 + 83 + 59 + 65 + 56 + 63 + 74 +
82) / 9 = 68.89
o Diferencia de las medias muestrales (d) = x̄ 1 - x̄ 2 = 70.6 - 68.89 = 1.71
 Calculamos la desviacion estandar combinada (s):
o Desviación estándar de la Ruta 1 (s1) = 8.84
o Desviación estándar de la Ruta 2 (s2) = 8.84
o Desviación estándar combinada (s) = √((s1^2/n1) + (s2^2/n2)) = √((8.84^2/10)
+ (8.84^2/9)) = 3.14

Calcular la estadística de prueba t

 Estadística de prueba t: t = (d - 0) / s = 1.71 / 3.14 = 0.545

Determinar el valor crítico y la region de rechazo

 Nivel de significancia (a) = 0.05 (nivel de confianza del 95%)


 Grados de libertad (df) = n1 + n2 - 2 = 10 + 9 - 2 = 17
 Valor crítico (t_crítico) para un nivel de significancia de 0.05 y 17 grados de
libertad es aproximadamente ±2.11 (usando una tabla de distribución t o un
software estadístico).

La region de rechazo es cuando la estadística de prueba t es menor que -2.11 o


mayor que 2.11

Tomar una decisión

 Como 0.545 no está en la región de rechazo (-2.11 < 0.545 < 2.11), no
tenemos suficiente evidencia para rechazar la hipótesis nula.
 Por lo tanto, no hay suficiente evidencia para demostrar que hay una
diferencia significativa en los tiempos medios de traslado entre las dos rutas
(Ruta 1 y Ruta 2) con un nivel de significancia de 0.05

Se podria decir que la prueba de hipótesis no muestra evidencia suficiente.


2. Con base en los datos reportados en un artículo del Journal of Gerontology,
los autores concluyeron que la distribución de ferritina en los adultos mayores
tenía una varianza más pequeña que en los adultos jóvenes (la ferritina en
suero se utiliza para diagnosticar deficiencia de hierro). Para una muestra de 28
varones adultos mayores, la desviación estándar de ferritina en suero (mg/L)
fue s1=52.6 ; para 26 adultos jóvenes, la desv. estándar de la muestra fue s2=84.2
.

a) ¿Confirman estos datos la conclusión tal como se aplicó a hombres? Utilice un


nivel de significancia de 0.01

Para determinar si los datos confirman la conclusión de que la distribución de ferritina


en los adultos mayores tiene una varianza más pequeña que en los adultos jóvenes,
podemos realizar una prueba de hipótesis utilizando la prueba F.

La hipótesis nula (H0) establece que las varianzas son iguales, mientras que la
hipótesis alternativa (H1) establece que la varianza en los adultos mayores es menor
que en los adultos jóvenes.

Podemos calcular la estadística de prueba F utilizando la fórmula:

F = s1^2 / s2^2

Donde s1 y s2 son las desviaciones estándar de las muestras de adultos mayores y


adultos jóvenes, respectivamente.

En este caso, s1 = 52.6 y s2 = 84.2. Sustituyendo estos valores en la fórmula,


obtenemos:

F = (52.6)^2 / (84.2)^2

Calculando esto, obtenemos:

F ≈ 0.372

Luego, podemos comparar el valor de F con el valor crítico de la distribución F para


un nivel de significancia de 0.01 y los grados de libertad correspondientes.
Si el valor de F es menor que el valor crítico, rechazamos la hipótesis nula y
concluimos que la varianza en los adultos mayores es significativamente menor que
en los adultos jóvenes.

Si el valor de F es mayor que el valor crítico, no podemos rechazar la hipótesis nula y


no hay suficiente evidencia para concluir que la varianza en los adultos mayores es
menor que en los adultos jóvenes.

Para obtener el valor crítico de la distribución F, necesitamos los grados de libertad


de ambas muestras. En este caso, los grados de libertad para la muestra de adultos
mayores son 28-1 = 27 y los grados de libertad para la muestra de adultos jóvenes
son 26-1 = 25.

Consultando una tabla de distribución F o utilizando software estadístico,


encontramos que el valor crítico de F para un nivel de significancia de 0.01 y los
grados de libertad mencionados es aproximadamente 2.96.

Como el valor de F (0.372) es menor que el valor crítico (2.96), rechazamos la


hipótesis nula y concluimos que los datos confirman la conclusión de que la varianza
en los adultos mayores es significativamente menor que en los adultos jóvenes.

Los datos proporcionados confirman la conclusión de que la distribución de ferritina


en los adultos mayores tiene una varianza más pequeña que en los adultos jóvenes,
con un nivel de significancia de 0.01.
3. Suponga que se formula la hipótesis de que la desviación estándar del
consumo en electrodomésticos anual por hogar en cierta comunidad es de $US
3000. En una muestra de 15 hogares aleatoriamente seleccionados, la
desviación estándar es de $US 2000. Se supone que las cifras de consumo
anual en electrodomésticos de la población es normal.

a) Realice una prueba de hipótesis para saber si, ¿Puede rechazarse la hipótesis con
un nivel de significancia del 5%?

Para realizar una prueba de hipótesis en este caso, utilizaremos la prueba de chi-
cuadrado para la varianza. La hipótesis nula (H0) es que la desviación estándar del
consumo en electrodomésticos anual por hogar es de $US 3000, mientras que la
hipótesis alternativa (H1) es que la desviación estándar es diferente de $US 3000.

La prueba de chi-cuadrado se basa en el estadístico de prueba chi-cuadrado, que se


calcula de la siguiente manera:

[ \chi^2 = \frac{{(n-1)s^2}}{{\sigma_0^2}} ]

Donde:

n es el tamaño de la muestra (15 en este caso)

s es la desviación estándar de la muestra (2000 en este caso)

(\sigma_0) es la desviación estándar hipotética bajo la hipótesis nula (3000 en este


caso)

Luego, comparamos el valor calculado de chi-cuadrado con el valor crítico de chi-


cuadrado correspondiente al nivel de significancia deseado y los grados de libertad
(n-1). Si el valor calculado de chi-cuadrado es mayor que el valor crítico, rechazamos
la hipótesis nula.

En este caso, con un nivel de significancia del 5%, el valor crítico de chi-cuadrado
con 14 grados de libertad es aproximadamente 26.12. Calculando el valor de chi-
cuadrado:

[ \chi^2 = \frac{{(15-1) \times 2000^2}}{{3000^2}} \approx 7.11 ]

Como 7.11 es menor que 26.12, no podemos rechazar la hipótesis nula. Esto
significa que no hay suficiente evidencia para concluir que la desviación estándar del
consumo en electrodomésticos anual por hogar es diferente de $US 3000 con un
nivel de significancia del 5%.

4. Los siguientes datos corresponden a la pureza del ácido en porcentaje


observada en dos plantas de producción de ácido sulfúrico.

Planta A 96.8 95.8 96.2 96.5 96.4 96.7 96.3 96 97.1 96.5

Planta B 95.6 96 97.8 98.4 97.6 98.2 96.9 96.8

a) Pruebe la hipótesis de que las varianzas de los porcentajes de pureza del ácido
entre la planta B y la planta A son iguales usando un nivel de significación de 0.05.

Para probar la hipótesis de que las varianzas de los porcentajes de pureza del ácido
entre la planta B y la planta A son iguales, podemos utilizar la prueba F de Fisher.

La hipótesis nula (H0) es que las varianzas son iguales, mientras que la hipótesis
alternativa (H1) es que las varianzas son diferentes.

Para realizar la prueba, necesitamos calcular la varianza muestral de cada planta y


luego calcular la estadística de prueba F. La fórmula para la estadística de prueba F
es:

F = Varianza de la planta B / Varianza de la planta A

A continuación, se muestra cómo calcular la varianza muestral y la estadística de


prueba F en R:

Datos de la planta A

planta_A <- c(96.8, 95.8, 96.2, 96.5, 96.4, 96.7, 96.3, 96, 97.1, 96.5)

Datos de la planta B

planta_B <- c(95.6, 96, 97.8, 98.4, 97.6, 98.2, 96.9, 96.8)

Cálculo de las varianzas muestrales

var_A <- var(planta_A)

var_B <- var(planta_B)

Cálculo de la estadística de prueba F


F <- var_B / var_A

Cálculo del valor p

p_value <- pf(F, length(planta_B)-1, length(planta_A)-1, lower.tail = FALSE)

Comparación del valor p con el nivel de significación

alpha <- 0.05

if (p_value < alpha) {

conclusion <- "Rechazar H0. Las varianzas son diferentes."

} else {

conclusion <- "No se puede rechazar H0. Las varianzas son iguales."

La estadística de prueba F calculada es 1.0517 y el valor p correspondiente es


0.7922. Como el valor p (0.7922) es mayor que el nivel de significación (0.05), no
tenemos suficiente evidencia para rechazar la hipótesis nula. Por lo tanto,
concluimos que no hay suficiente evidencia para afirmar que las varianzas de los
porcentajes de pureza del ácido entre la planta B y la planta A son diferentes.

You might also like