Professional Documents
Culture Documents
Media del
Error
Variable N N* Media estndar Desv.Est. Mnimo Q1 Mediana Q3
edad 37 0 21.108 0.287 1.745 18.000 20.000 21.000 22.000
creditos 37 0 89.73 6.27 38.15 15.00 64.00 95.00 119.50
iadm 37 0 3.0797 0.0902 0.5489 2.0500 2.6500 3.1700 3.5500
familia 37 0 3.784 0.202 1.228 1.000 3.000 4.000 5.000
hestud 37 0 18.11 1.24 7.56 5.00 12.50 16.00 23.50
htv 37 0 9.297 0.841 5.115 2.000 5.000 10.000 11.000
promsem 37 0 12.084 0.453 2.757 7.500 9.700 12.000 14.350
Variable Mximo
edad 25.000
creditos 162.00
iadm 3.9600
familia 6.000
hestud 35.00
htv 23.000
promsem 17.500
con estos resultados podemos describir todas las variables segn sus estadsticos como
por ejemplo la edad promedio de estos estudiantes es de 21 aos cuyas edades oscilan
entre 18 y 25 aos, el rendimiento acadmico de estos estudiantes tiene un promedio 12
con una desviacin estndar 2.75 lo que indica que la mayora tiene promedios entre 9 y
15 aproximadamente. Y asi sucesivamente se puede ir comentando o interpretando los
resultados.
Acompaando a estos resultados podemos obtener los resmenes grficos de cada
variable, en este caso graficamos para edad, familia y rendimiento acadmico: siguiendo
la ruta:
Stat Basic StatisticsGrafical Summary o
Estadisticas Estadisticas Basicas Resumen grafico
Elementos del cuadro de dilogo
Variables: Ingrese las columnas para las cuales desea crear un resumen grfico. En este caso
marque edad, crditos, iadm, familia, hestud, htv, promsem y clicar en seleccionar
2
Por variables (opcional): Ingrese las columnas que contienen Por variables para crear
resmenes grficos separados para cada nivel de una variable de agrupacin.
Nivel de confianza: Ingrese un valor para el nivel de confianza de los intervalos de
confianza. El nivel predeterminado es 95%.
Los grficos resultantes son los siguientes:
Resumen para edad
Prueba de normalidad de Anderson-Darling
A -cuadrado 0.79
V alor P 0.036
Media 21.108
Desv.Est. 1.745
V arianza 3.044
Sesgo 0.356261
Kurtosis 0.142797
N 37
Mnimo 18.000
1er cuartil 20.000
Mediana 21.000
3er cuartil 22.000
18 20 22 24
Mximo 25.000
I ntervalo de confianza de 95% para la media
20.526 21.690
I ntervalo de confianza de 95% para la mediana
20.000 22.000
I ntervalo de confianza de 95% para la desviacin estndar
I ntervalos de confianza de 95%
1.419 2.266
Media
Mediana
Media 3.7838
Desv.Est. 1.2278
V arianza 1.5075
Sesgo -0.228832
Kurtosis -0.606757
N 37
Mnimo 1.0000
1er cuartil 3.0000
Mediana 4.0000
3er cuartil 5.0000
1 2 3 4 5 6
Mximo 6.0000
I ntervalo de confianza de 95% para la media
3.3744 4.1932
I ntervalo de confianza de 95% para la mediana
3.0000 4.0000
I ntervalo de confianza de 95% para la desviacin estndar
I ntervalos de confianza de 95%
0.9985 1.5949
Media
Mediana
3
Resumen para promsem
Prueba de normalidad de A nderson-Darling
A-cuadrado 0.45
Valor P 0.257
Media 12.084
Desv.Est. 2.757
Varianza 7.602
Sesgo 0.293558
Kurtosis -0.905117
N 37
Mnimo 7.500
1er cuartil 9.700
Mediana 12.000
3er cuartil 14.350
8 10 12 14 16
Mximo 17.500
I ntervalo de confianza de 95% para la media
11.164 13.003
I ntervalo de confianza de 95% para la mediana
10.720 12.590
I ntervalo de confianza de 95% para la desviacin estndar
I ntervalos de confianza de 95%
2.242 3.581
Media
Mediana
En estos grficos podemos analizar su distribucin y adems nos muestra los intervalos
de confianza para la media y la mediana y podemos compararlo. En el variable del
rendimiento acadmico vemos que la mediana y la media son parecidas.
4
<Grficas mltiples> Grficas mltiples > Variables mltiples aqu marcar En grficas
separadas:
<Opciones de datos>
El resultado es el siguiente:
m
43.2%
f
56.8%
publ
43.2%
priv
56.8%
5
Grfica circular de programa
Categora
biol
farm
biol
8. 21,6% pmed
pmed
15. 40,5%
farm
14. 37,8%
Prueba de mu = 3 vs. no = 3
Media del
Error
Variable N Media Desv.Est. estndar IC de 95% T P
familia 37 3.784 1.228 0.202 (3.374, 4.193) 3.88 0.000
Se rechaza la hiptesis nula porque P es menor a 0.05, es ms el intervalo de confianza no
contiene a la media propuesta 3.
Grfica de caja de familia
6
Grfica de caja de familia
(con Ho e intervalo de confianza t de 95% para la media)
_
X
Ho
1 2 3 4 5 6
familia
Estadsticas
7
95% Intervalos de confianza unilaterales
Lmite Lmite
inferior inferior
para para
Variable Mtodo Desv.Est. varianza
htv Estndar 4.30 18.5
Ajustado 4.24 18.0
Pruebas
Variable Mtodo Chicuadrada GL Valor P
htv Estndar 58.86 36.00 0.009
Ajustado 50.20 30.70 0.015
Se rechaza la hiptesis nula porque P es menor a 0.05, es ms el limite inferior del intervalo
de confianza no contiene a la desviacin estndar propuesta 4. Cuando evaluamos el resumen
grafico para esta variable all pudimos notar que las horas de tv no tiene distribucin normal
por lo tanto la interpretacin lo hacemos con el mtodo ajustado.
Media 9.2973
Desv.Est. 5.1146
Varianza 26.1592
Sesgo 0.668560
Kurtosis 0.354736
N 37
Mnimo 2.0000
1er cuartil 5.0000
Mediana 10.0000
3er cuartil 11.0000
5 10 15 20 Mximo 23.0000
I ntervalo de confianza de 95% para la media
7.5920 11.0026
I ntervalo de confianza de 95% para la mediana
6.2017 10.0000
I ntervalo de confianza de 95% para la desviacin estndar
I ntervalos de confianza de 95%
4.1592 6.6437
Media
Mediana
8
El resultado de esta prueba de hiptesis es:
Prueba e IC para dos varianzas: creditos vs genero
Mtodo
Pruebas
Estadstica
Mtodo GL1 GL2 de prueba Valor p
F 20 15 1,02 0,984
Se acepta la hiptesis nula porque P es mayor a 0.05, esto indica que la varianza de los
crditos aprobados tanto en mujeres como en varones es la misma.
Prueba e IC para dos varianzas: creditos vs genero
Prueba e IC para dos varianzas: creditos vs genero
Relacin = 1 vs. Relacin 1
30 35 40 45 50 55 60
f
genero
9
IDs de muestra: Ingrese la columna que contiene los ID de muestra. Marcar genero y
seleccionar
Cada muestra est en su propia columna: Elija esta opcin si los datos de las dos muestras
estn en columnas separadas. Ahora no marcamos esta opcin
Muestra 1: Ingrese la columna que contiene una muestra.
Muestra 2: Ingrese la columna que contiene la otra muestra.
Datos resumidos: Elija esta opcin si tiene valores de resumen para el tamao de la muestra ,
la media y la desviacin estndar para cada muestra. Ahora no marcamos esta opcin
Muestra 1
Tamao de muestra: Ingrese el valor para el tamao de la muestra.
Media de la muestra: Ingrese el valor de la media.
Desviacin estndar: Ingrese el valor de la desviacin estndar.
Muestra 2
Tamao de muestra: Ingrese el valor del tamao de la muestra.
Media de la muestra: Ingrese el valor de la media.
Desviacin estndar: Ingrese el valor de la desviacin estndar.
<Grficas>
<Opciones>
El resultado de esta prueba de hiptesis es:
Prueba T e IC de dos muestras: creditos. genero
T de dos muestras para creditos
Error
estndar
de la
genero N Media Desv.Est. media
f 21 92,3 38,7 8,5
m 16 86,4 38,3 9,6
160
140
120
creditos
100
80
60
40
20
0
f m
genero
10
e) Se desea saber si en igual proporcin ingresaron alumnos de los colegios
particulares y nacionales.
En este caso desarrollamos una prueba de hiptesis con respecto a la proporcin.
Nos interesa contrastar las hiptesis H0 : p = 0.50 vs. H1 : p 0.50.
a un nivel de significacin del 0.05,
Seguimos la ruta Estadsticas > Estadsticas Basicas > 1 proporcin;
Elementos del cuadro de dilogo
Muestras en columnas: Elija esta opcin si tiene datos en las columnas, Marcar colegio y
seleccionar
Datos resumidos: Elija esta opcin si tiene valores de resumen para los nmeros de ensayos
y eventos. Ahora no elegimos esta opcin
Nmero de eventos: Ingrese el nmero de eventos observados. Si usted ingresa ms de un
valor; el valor entero que ingrese en Nmero de ensayos se aplicar a todos.
Nmero de ensayos: Ingrese un valor individual para el nmero de ensayos.
Realizar prueba de hiptesis: Marcar esta opcin para realizar la prueba de hiptesis de que
la proporcin de poblacin es igual a un valor especificado
Proporcin hipottica: Ingresar el valor de la proporcin 0.50 para la hiptesis nula de la
prueba.
<Opciones>
El resultado de esta prueba de hiptesis es:
Prueba e IC para una proporcin: colegio
Evento = publ
Valor P
Variable X N Muestra p IC de 95% exacto
colegio 16 37 0.432432 (0.270979, 0.605116) 0.511
Se acepta la hiptesis nula porque P es mayor a 0.05, esto indica que en igual proporcin
ingresaron alumnos de colegios pblicos y privados.
11
Porcentajes de columnas: Marcar esta opcin para mostrar el porcentaje que cada celda
representa de las observaciones totales en la columna de la tabla.
Porcentajes totales: Marcar esta opcin para mostrar el porcentaje que cada celda representa
de todas las observaciones en la tabla.
<Chi-cuadrada> Marcar Anlisis de chi-cuadrada
<Otras estadsticas>
<Opciones>
El resultado de esta prueba de hiptesis es:
Estadsticas tabuladas: sexo, programa
Filas: sexo Columnas: programa
biol farm odon pmed Todo
f 5 7 5 4 21
23.81 33.33 23.81 19.05 100.00
62.50 70.00 55.56 40.00 56.76
13.51 18.92 13.51 10.81 56.76
m 3 3 4 6 16
18.75 18.75 25.00 37.50 100.00
37.50 30.00 44.44 60.00 43.24
8.11 8.11 10.81 16.22 43.24
Todo 8 10 9 10 37
21.62 27.03 24.32 27.03 100.00
100.00 100.00 100.00 100.00 100.00
21.62 27.03 24.32 27.03 100.00
12
Grfica de dispersin de creditos vs. edad
180
160
140
120
creditos
100
80
60
40
20
0
18 19 20 21 22 23 24 25
edad
Se puede observar que a medida que aumenta la edad tambin aumenta el creditaje aprobado
lo que significa una posible relacin el cual lo probaremos con el anlisis de regresin.
Como solo hay una variable respuesta (crditos = Y) y una sola variable predictiva (edad =
X) entonces realizamos el anlisis de lnea ajustada
Seguimos la ruta Estadsticas > Regresin > Grfica de lnea ajustada;
Elementos del cuadro de dilogo
Respuesta [Y]: Seleccione la columna que contiene la Y, o la variable de respuesta. Marcar
crditos y seleccionar
Predictor [X]: Seleccione la columna que contiene la X, o la variable predictora. Marcar
edad y seleccionar
Tipo de modelo de regresin
Lineal: Elija esta opcin para ajustar un modelo de regresin lineal . Marcar esta opcin
Cuadrtico: Elija esta opcin para ajustar un modelo cuadrtico .
Cbico: Elija esta opcin para ajustar un modelo cbico .
<Grficas>
<Opciones> marcar Mostrar intervalo de confianza y Mostrar intervalo de prediccin
<Almacenamiento>
El resultado de este anlisis de regresin es:
Anlisis de regresin: creditos vs. edad
La ecuacin de regresin es
creditos = - 233.9 + 15.33 edad
Anlisis de varianza
Fuente GL SC MC F P
Regresin 1 25761.9 25761.9 33.86 0.000
Error 35 26627.4 760.8
Total 36 52389.3
13
Se rechaza la hiptesis nula porque Valor P = 0.000 es menor a 0.05, esto indica la edad de
los estudiantes influye significativamente en el creditaje aprobado.
Lnea ajustada: creditos vs. edad
S 27.5823
R-cuad. 49.2%
150
R-cuad.(ajustado) 47.7%
creditos
100
50
18 19 20 21 22 23 24 25
edad
Finalmente para estudiar las posibles relaciones entre todas las variables cuantitativas de
estudio podemos hallar el grafico matriz de dispersin.
14
Grfica de matriz de edad, creditos, iadm, familia, hestud, htv, ...
50 100 150 2 4 6 0 10 20
25.0
22.5
edad
20.0
150
100
creditos
50
4
3
iadm
2 6
4
familia
2
30
20
hestud
10
20
htv 10
18 0
12 promsem
6
20.0 22.5 25.0 2 3 4 10 20 30 6 12 18
De este grafico podemos concluir que las variables que posiblemente se relacione son la edad
con crditos y las horas de estudio (hestud) y el rendimiento acadmico (promsem)
Podemos hacer el anlisis de regresin de (hestud) y (promsem)
4. Regresin multiple:
Para una regresin multiple podemos tomar las variable ndice de ingreso, horas de
estudio y como variable respuesta rendimiento acadmico.
Seguimos la ruta Estadsticas > Regresin > Regresin;
Elementos del cuadro de dilogo
Respuesta: Seleccione la columna que contiene la Y, o la variable de respuesta . Marcar
promsem y seleccionar
La ecuacin de regresin es
promsem = 6.37 + 0.193 iadm + 0.283 hestud
Anlisis de varianza
Fuente GL SC MC F P
Regresin 2 168.173 84.086 27.10 0.000
Error residual 34 105.498 3.103
Total 36 273.670
Fuente GL SC sec.
iadm 1 11.326
hestud 1 156.847
Residuo
Obs iadm promsem Ajuste Ajuste SE Residuo estndar
7 2.15 16.500 12.439 0.604 4.061 2.45R
Se rechaza la hiptesis nula porque Valor P = 0.000 es menor a 0.05, esto indica en conjunto
el ndice de ingreso y las horas de estudio influyen significativamente en el rendimiento
acadmico.
Si analizamos por separado estos coeficientes podemos verificar que quien influye en el
rendimiento acadmico es realmente las horas de estudio. Como se ve en el cuadro que sigue.
Predictor Coef Coef. de EE T P
Constante 6.372 1.711 3.72 0.001
iadm 0.1931 0.5474 0.35 0.727
hestud 0.28258 0.03975 7.11 0.000
16
Grficas de residuos para promsem
Grfica de probabilidad normal vs. ajustes
99
4
90
2
Porcentaje
Residuo
50 0
10 -2
1 -4
-5.0 -2.5 0.0 2.5 5.0 8 10 12 14 16
Residuo Valor ajustado
6 2
Frecuencia
Residuo
4 0
2 -2
0 -4
-3 -2 -1 0 1 2 3 4 1 5 10 15 20 25 30 35
Residuo Orden de observacin
Los residuos tienen distribucin normal se puede decir tambin que no estn correlacionados
entre si y tienen la misma varianza
17
Prueba chi-cuadrada para asociacin: colegio. programa
Filas: colegio Columnas: programa
priv 6 7 8 21
4,541 7,946 8,514
publ 2 7 7 16
3,459 6,054 6,486
Todo 8 14 15 37
6. Pruebas no paramtricas
Se pueden realizar pruebas de hiptesis tanto para muestras de una variable y de dos o
ms variables.
a) Se desea probar si la mediana de la edad de los estudiantes universitarios es 22 aos.
Para realizar esta prueba tenemos dos alternativas; Prueba de signos y prueba de los signos de
Wilcoxon de 1 muestra de la mediana.
Prueba de signo
Se usa la prueba de signo como alternativa no paramtrica a las prueba Z de 1 muestra y las
pruebas t de 1 muestra las cuales utilizan la media en lugar de la mediana.
Elementos del cuadro de dilogo
Variables: Seleccione la columna Edad que contienen las variables que desea probar.
Intervalo de confianza: Elija esta opcin para calcular un intervalo de confianza de seales.
Nivel: Ingrese un intervalo de confianza entre 0 y 100 (el valor predeterminado es 95.0).
Nota Minitab calcula el intervalo de confianza para el nivel ms cercano al nivel solicitado.
Mediana de la prueba: Elija esta opcin para realizar una prueba de seales y luego
especificar el valor de la prueba de la hiptesis nula.
Hiptesis alterna: Haga clic en la flecha para elegir el tipo de prueba ejecutada,
seleccionando menos que (de cola inferior), no igual (de dos colas) o ms que (de cola
superior) en el cuadro desplegable.
18
Salida de la ventana Sesin
19
Salida de la ventana Sesin
Nmero
de Estadstica Mediana
N prueba de Wilcoxon P estimada
edad 37 37 703,0 0,000 21,00
Interpretacin de los resultados
El valor p es menor que 0.05. Por consiguiente, existe evidencia de que la mediana de la edad
de estos universitarios no es 22 aos.
N Mediana
iadm_priv 21 3,1900
iadm_publ 16 3,0900
d) Como los
21