Professional Documents
Culture Documents
Primer punto: Sea X ~ N (500, 102) a) Generar k = 200 muestras aleatorias de tamao n = 25. Obtenga la media, varianza, desviacin estndar y la mediana para cada muestra y gurdelas en un vector. b) Construir el histograma y la grfica de cajas de y bigotes para el ventor de medias mustrales. Obtenga la media y la varianza para este vector. Estime el error cuadrtico medio de la media de la muestra. c) Repetir el numeral anterior para el vector de medianas. d) Construir los k = 200 intervalos de confianza del 95% para = 500. Cuntos de estos intervalos cubren a ?. Desarrollar este numeral asumiendo primero que 2 es conocido y despus que no lo es. e) Para el vector de varianzas mustrales calcule su media y su varianza. Estime el error cuadrtico medio para el vector de varianzas mustrales. Realice el mismo ejercicio
2 2 para S* = ( X i X ) / n . Compare los errores cuadrticos medios estimados de estos i =1 n
dos estimadores de la varianza poblacional Observacin: Generar 200 muestras de tamao 25, es equivalente a generar una sola muestra de tamao 5000. Las primeras 25 observaciones son la primera muestra, las siguientes 25 son la segunda muestra y as sucesivamente hasta que las ltimas 25 observaciones son la muestra nmero 200.
Figura 1
StatAdvisor interpreta una tabla de Anlisis de la Varianza y aconseja sobre posteriores anlisis Podemos acceder a esta herramienta desde los iconos correspondientes en la Barra de Herramientas o en la de Tareas. Veremos as la interpretacin correspondiente al ltimo anlisis realizado. Si queremos guardar la informacin generada para cada anlisis junto con el resultado de los mismos activaremos la opcin VERSTATADVISOR de la barra de men.
La configuracin de paneles dentro de una pgina de StatGallery puede personalizarse sencillamente desplazando con el ratn las barras horizontales y verticales que los delimitan. En la Figura anterior podemos ver un ejemplo de una pgina personalizada cargada con distinta informacin grfica y textual.
Ventana de edicin
Comandos directos
Guardar resultados
Caja de dialogo
Opciones Tabulares
Opciones grficas
Luego en la ventana de PROBABILITY DISTRIBUTIONS clic derecho y ANALYSIS OPTIONS para cambiar la media por 500 y la desviacin estndar por 10 y obtenemos
A continuacin por TABULAR OPTIONS (icono amarillo del men propio de PROBABILITY DISTRIBUTIONS) seleccionamos la opcin RAMDON NUMBERS. Despus de lo anterior se obtiene la ventana siguiente:
Ventana RANDOM NUMBERS: Permite generar nmeros aleatorios para varias distribuciones de probabilidad
Entonces, nos ubicamos en la ventana nmeros aleatorios y con clic derecho seleccionamos la opcin PANE OPTIONS y modificamos el tamao muestral por 5000 en nuestro caso y OK. Esto es,
Despus de la instruccin anterior se han generado 5000 nmeros aleatorios de una normal con media 500 y desviacin estndar 10. Para salvar estos resultados procedemos as, en el icono SAVE RESULTS indicamos guardar los nmeros aleatorios y especificamos el nombre de la variable, X en nuestro caso, y OK y cerramos la ventana de PROBABILITY DISTRIBUTIONS; despus de lo anterior aparece una columna llamada X con 5000 datos en la ventana de edicin.
OK Observacin: Antes de cerrar la ventana de PROBABILITY DISTRIBUTONS podemos generar la muestra aleatoria de la distribucin UNIFORME [0, = 400]. Para ello procedemos as: En la CAJA DE DIALOGO (icono rojo) de los comandos para PROBABILITY DISTRIBUTONS con clic izquierdo cambiamos la distribucin normal por la uniforme. Luego en la ventana de PROBABILITY DISTRIBUTIONS clic derecho y ANLISIS OPTIONS para cambiar el lmite superior por 400 y el limite inferior por cero. A continuacin en la ventana RAMDON NUMBERS con clic derecho y PANE OPTIONS cambiamos el tamao de la muestra por 9000 para generar las 300 muestras de tamao n = 30.
Muestra de la uniforme
Muestra de la normal
Para continuar el proceso generemos unas variables de cdigos para identifica las 200 muestras de tamao 25 de la normal y las 300 muestras de tamao 30 de la uniforme continua; esto lo hacemos de la siguiente manera: En la ventana de edicin seleccionamos la tercera columna (Col_3) con clic izquierdo sobre Col_3. A continuacin con clic derecho se activan las opciones sobre la columna, seleccionamos la opcin MODIFY COLUMN para cambiar el nombre de la columna. Esta columna la llamaremos Cod1.
Opciones sobre la columna. Entonces, nuevamente sobre la tercera columna (Cod1) con clic derecho seleccionamos la opcin GENERATE DATA y se obtiene la ventana
Algunas funciones
A continuacin, generamos los cdigos para identificar las 200 muestras de tamao 25 de la normal utilizando los operadores Rep(?;?) y Count(?;?;?). Esto lo hacemos as, en la lnea para expresiones de la ventana anterior escribimos Rep(Count(1;k;1);n) y de esta forma se genera una columna que contiene 25 veces uno, 25 veces dos, y as sucesivamente hasta 25 veces 200. Para generar los cdigos para identificar las 300 muestras de la uniforme, procedemos de la misma forma y creamos la variable Cod2 en la columna Col_4.
Observe que en Cod1 hay 25 veces uno, luego sigue el dos y as sucesivamente. Adems, en Cod2 hay 30 veces uno, luego le sigue el dos y as sucesivamente hasta que aparece 30 veces trescientos. Ahora, para obtener los vectores de medias, varianzas, desviaciones estndar y medianas para cada una de las 200 muestras aleatorias de la normal procedemos como sigue: Seleccionamos el comando DESCRIBE; luego, el comando NUMERIC DATA de las opciones de DESCRIBE y a continuacin la opcin SUBSET ANLISIS como se observa a continuacin,
A continuacin indicamos que los datos estn en la columna X y los cdigos estn la columna Cod1. Esto es,
Nombre de la ventana
Entonces nos ubicamos en la ventana Summary Statistics y con clic derecho en Panel OPTIONS seleccionamos los estadsticos deseados como se observa a continuacin:
Guardar resultados
Finalmente, guardamos los resultados usando el icono SAVE RESULTS e indicamos los estadsticos a guardar y el nombre de cada columna e indicamos OK. LO anterior se muestra a continuacin:
Para finalizar cerramos la ventana SUBSET ANLISIS y en la ventana de edicin aparecen las columnas que contienen los 200 valores de los estadsticos requeridos como se observa a continuacin,
b) Construir el histograma y la grfica de cajas y bigotes para el ventor de medias de las muestras. Obtenga la media y la varianza para este vector. Estime el error cuadrtico medio de la media de la muestra. Solucin: Para resolver lo anterior procedemos de la siguiente forma. Por el comando DESCRIBE del men principal seleccionamos NUMERIC DATA y a continuacin la opcin ONE-VARIABLE-ANALYSIS como se observa a continuacin. Luego, indicamos que los datos para el anlisis estn en la variable MediaX.
Despus de lo anterior se obtiene un anlisis descriptivo de la variable. Para construir el histograma y la grfica de cajas y bigotes entramos por el comando por Graphical Options y seleccionamos las opciones histograma de frecuencias Box-and-Whisker Plot como se muestra a continuacin:
En las opciones grficas estn los grficos pedidos y en Summary Statistics estn las estadsticas descriptivas para el vector de medias de las muestras. Los resultados anteriores se copian y se llevan a un procesador de texto para su anlisis posterior, a continuacin cerramos la ventana One-Variable-Analysis.
Finalmente, para estimar el error cuadrtico medio para la media de la muestra 2 generamos la columna ECM1 con la instruccin mediaX 500 ; esto es,
c) Repetir el numeral anterior para el vector de medianas. Solucin: Se procede igual que en el numeral (b) anterior pero usando los datos que estn en la columna MedianasX. d) Construir los k = 200 intervalos de confianza del 95% para = 500. Cuntos de estos intervalos cubren a ?. Desarrollar este numeral asumiendo primero que 2 es conocido y despus que no lo es. Solucin: Sabemos que el intervalo de confianza para la media de una poblacin < < x + z 2 normal con varianza conocida es x z 2 . Por lo tanto, para n n construir los intervalos generamos dos columnas que llamaremos 1.96*10 1.96*10 LI1 = mediaX , y LS1 = mediaX + , como se observa a continuacin 25 25
Despus de lo anterior aparecen las columnas LI1 y LS1 en la ventana de edicin. Para contar cuantos de estos intervalos contienen a la media poblacional, generamos una nueva columna que llamaremos CONTAR1 con la siguiente instruccin: (LI1<500)&(LS1>500). De esta forma, se obtiene una variable cuyo valor es 1 cuando la condicin se cumple y toma el valor de cero en otro caso. Lo anterior lo hacemos as:
Ahora,
cuando la varianza poblacional es desconocida el intervalo es s s x t 2,n 1 < < x + t 2,n 1 . Entonces, para obtener los 200 intervalos n n generamos dos variables que llamaremos LI2 y LS2 de la siguiente forma: INVSTUDENT(0.975;24)*SX LI2 = mediaX y 25 INVSTUDENT(0.975;24)*SX LS2 = mediaX + . Para determinar cuantos de estos 25 intervalos cubren a la media poblacional, procedemos de la misma forma que en le caso de varianza conocida.
e) Para el vector de varianzas de las muestras calcule su media y su varianza. Estime el error cuadrtico medio para el vector de varianzas de las muestras. Realice el mismo
2 2 ejercicio para S* = ( X i X ) / n . Compare los errores cuadrticos medios estimados i =1 n
de estos dos estimadores de la varianza poblacional Solucin: Procedemos de la siguiente forma Para encontrar la media y la varianza del vector de varianzas de las muestras ingresamos por el comando DESCRIBE, luego la opcin NUMERIC DATA y a continuacin ONE-VARIABLE ANLISIS e indicando que los datos estn en la variable S 2 . 2 Nos ubicamos en resmenes estadsticos para S X , damos clic derecho y en opciones de ventanas marcamos los cuadros de la media y la varianza y aceptar (OK). Vamos a opciones graficas y seleccionamos los grficos que deseamos realizar; aceptar. 2 Para hallar el ECM_ S X , activamos la columna, le damos clic derecho Generar Datos ECM_ S X 2 S X 2 100 , aceptar.
Datos
ECM_ S X 2
n 1 S X 2 , aceptar.
n