Professional Documents
Culture Documents
Contenido
Temario original por la escuela ............................................................................................................................................... 3 Temario que se ver en clase .................................................................................................................................................. 3 Unidad I Inferencia estadstica o inductiva ............................................................................................................................. 3 Introduccin ........................................................................................................................................................................ 4 Campos de aplicacin ......................................................................................................................................................... 4 Unidad II Teora elemental del muestreo ............................................................................................................................... 4 Distribuciones de muestreo ................................................................................................................................................ 4 Distribucin de muestreo de medias .............................................................................................................................. 5 Distribucin de muestreo de proporciones .................................................................................................................... 7 Distribucin de muestreo de diferencias y sumas .......................................................................................................... 8 Unidad III Teora de la estimacin estadstica ...................................................................................................................... 10 Estimaciones sin sesgo ...................................................................................................................................................... 10 Estimaciones de intervalo de confianza para parmetros de poblacin .......................................................................... 10 Intervalo de confianza para las medias......................................................................................................................... 10 Intervalos de confianza para proporciones. ................................................................................................................. 11 Intervalos de confianza para diferencias y sumas ........................................................................................................ 12 Unidad IV Teora estadstica de las decisiones ..................................................................................................................... 13 Hiptesis Nula: .................................................................................................................................................................. 13 Hiptesis Alternativa: ........................................................................................................................................................ 13 Contraste de hiptesis y significacin o reglas de decisin .............................................................................................. 13 Errores de tipo I y de tipo II............................................................................................................................................... 13 Nivel de significacin......................................................................................................................................................... 13 Contrastes mediante la distribucin normal .................................................................................................................... 14 Contrastes de una y dos colas ....................................................................................................................................... 14 Curvas de operacin caractersticas, potencia de un contraste ....................................................................................... 15 Unidad V Test de Ji-Cuadrada ........................................................................................................................................... 15 Definicin de 2 ................................................................................................................................................................. 16 El test de 2 para la bondad de ajuste ............................................................................................................................... 16 Tablas de contingencia...................................................................................................................................................... 16 Unidad VI Ajuste de curvas y el mtodo de mnimo cuadrados ........................................................................................... 18
Ajuste de curvas ................................................................................................................................................................ 18 El mtodo de mnimos cuadrados .................................................................................................................................... 19 Recta de mnimos cuadrados ........................................................................................................................................ 19 Parbola de mnimos cuadrados ................................................................................................................................... 20 Unidad VII Teora de la correlacin ....................................................................................................................................... 21 Correlacin y regresin ..................................................................................................................................................... 21 Correlacin lineal .............................................................................................................................................................. 21 La recta de regresin de mnimos cuadrados ................................................................................................................... 22 Unidad VIII Anlisis de varianza ............................................................................................................................................ 23 Experimentos de factor nico ........................................................................................................................................... 23 Variacin total, variacin dentro de los tratamientos y variacin entre tratamientos .................................................... 23
Introduccin
Comprende aquellas tcnicas por medio de las cuales se toman decisiones sobre una poblacin estadstica basadas en una muestra o en juicios de los administradores. Debido a que esas decisiones se toman en condiciones de incertidumbre, se requiere el uso de conceptos de probabilidad. Considerando que las caractersticas medidas en una muestra se denominan estadsticas mustrales, las caractersticas medidas en una poblacin estadstica o universo, se llaman parmetros poblacionales. Ningn mtodo estadstico puede corregir los defectos por una inadecuada seleccin del problema que se investiga, o por una mala recoleccin de datos. Una investigacin que empieza mal, con seguridad termina mal. Con datos de mala calidad no ser posible dar una respuesta adecuada a un problema cientfico.
Campos de aplicacin
La inferencia estadstica es ampliamente utilizada en diversas reas, a continuacin se mencionan unas pocas.
En las ciencias naturales: se emplea en la descripcin de modelos termodinmicos complejos (mecnica estadstica), en fsica cuntica, en mecnica de fluidos o en la teora cintica de los gases, entre otros muchos campos. En las ciencias sociales y econmicas: es un pilar bsico del desarrollo de la demografa y la sociologa aplicada. En economa: suministra los valores que ayudan a descubrir interrelaciones entre mltiples parmetros macro y microeconmicos. En las ciencias mdicas: permite establecer pautas sobre la evolucin de las enfermedades y los enfermos, los ndices de mortalidad asociados a procesos morbosos, el grado de eficacia de un medicamento, etctera. Entre otras.
Distribuciones de muestreo
Si consideramos todas las posibles muestras de tamao n en una poblacin, para cada muestra podemos calcular un estadstico (como la media o desviacin estndar) que variara de muestra a muestra. De esta manera obtenemos una distribucin de muestreo. Tenemos diferentes tipos de distribucin de muestreo que ms adelante veremos.
Distribucin de muestreo de medias Supongamos que se toman todas las posibles muestras de tamao n, sin reposicin de una poblacin finita de tamao N. Si denotamos la media y la desviacin estndar de la distribucin de muestreo de medias por y las de la poblacin , respectivamente entonces
Ecuacin 1 Formulas de media y desviacin estndar de distribucin de muestreo de medias con poblacin finita o sin reposicin
Donde: N es el tamao de la poblacin n es el tamao de la muestra Si la poblacin es infinita o si el muestreo es con reposicin, los resultados anteriores se reducen a
Ecuacin 2 Formulas de media y desviacin estndar de distribucin de muestreo de medias con poblacin infinita o con reposicin
Por ejemplo: Las alturas de 3000 estudiantes varones de una universidad estn normalmente distribuidos con media 68 pulgadas y una desviacin estndar de 3 pulgadas. Si se toman 80 muestras de 25 estudiantes cada una. Cules sern la media y la desviacin estndar esperadas de la resultante distribucin de muestreo de medias, si el muestre se hizo a) con reposicin y b) sin reposicin. a)
b)
Como la diferencia es menor se considera para efectos prcticos la misma que en muestre con reposicin. En cuntas muestras esperaramos encontrar una media de a) 66.8 y 68.3 pulgadas y b) menor que 66.4 a)
0.5-0.4962=0.0038
0.0038*80=0.304 o cero
500 esferas tienen un peso medio de 5.02 gramos y una desviacin estndar de 0.30 g. Hallar la probabilidad de que una muestra al azar de 100 esferas de ese conjunto tengan un peso total a) entre 496 y 500 g y b) ms de 510g
a) El peso total estara entre 496 y 500 si el peso medio de las 100 bolas est entre 4.96 y 5 g
*Entre z a z se restan *Entre +z a +z se restan *Si la variable es = a la media, se suma 0.5 0.4871-0.2704=0.2167 b) El peso total exceder los 510g si el peso medio de las 100 bolas excede 5.10 g
0.5-0.4986=0.0014
Distribucin de muestreo de proporciones Supongamos que una poblacin es infinita y que la probabilidad de ocurrencia de un suceso (su xito) es p, mientras la probabilidad de que no ocurra es q=1-p. Por ejemplo una poblacin puede ser todos los posibles lanzamientos de una moneda, en la que la probabilidad de xito es . Consideremos todas las posibles muestras de tamao n de tal poblacin, y para cada una de ellas determinaremos la proporcin de xitos P. En el caso de una moneda, P sera la proporcin de soles en n tiradas. Obtenemos as una distribucin de muestreo de proporciones cuya media y cuya desviacin tpica vienen dadas por
Ecuacin 3 Formulas de media y desviacin estndar de distribucin de muestreo de proporciones con muestreo con reposicin
Esta frmula es vlida para poblaciones finitas realizadas con muestreo con reposicin. Para poblaciones finitas con muestreo sin reposicin se usa:Y
Ecuacin 4 Formulas de media y desviacin estndar de distribucin de muestreo de proporciones sin muestreo con reposicin
Cada persona de un grupo de 500 lanza una moneda 120 veces. Cuntas personas se espera que a) Saquen entre 40% y 60% de soles y b) 5/8 de sus lanzamientos o ms de soles
Como la proporcin es una variable discreta, hay que hacer una correccin, si la variable es menor a la media se resta y si la variable es mayor o igual a la media se suma
0.4857+0.4857=0.9714
500*0.9714=489 muestras b)
0.4977 0.5-0.4977=0.0023 500*0.0023= 1 personas. Se ha encontrado que el 2% de las piezas fabricadas en una cierta mquina son defectuosas Cul es la probabilidad de que en un envo de 400 piezas a) el 3% o ms b)2% o menos, sean defectuosas?
a) 1/2N=1/800=0.0012
0.5-0.3944=0.1056 b)
0.5+0.0714=0.5714 Distribucin de muestreo de diferencias y sumas Sean dadas dos poblaciones. Para cada muestra de tamao n1 de la primera, calculamos un estadstico S1; eso da una distribucin de muestreo para S1, cuya media y desviacin estndar denotaremos por s1 y s1. Del mismo modo, para cada muestra de tamao n2 de la segunda poblacin, calculamos un estadstico S2; eso nos da un distribucin de muestreo para S2 cuya media y desviacin estndar denotaremos con s2 y s2. Si tenemos medias mustrales de ambas poblaciones, la distribucin de muestreo de las diferencias de medias viene dada para poblaciones infinitas o con muestreo con reposicin con medias y desviaciones estndar por:
Se puede usar la misma frmula para poblaciones finitas o muestreo sin reposicin.
Ejemplo: Las bolas de rodamientos de cierto fabricante pesan 0.50 g de media, con desviacin ESTANDR de 0.02 g. Cul es la probabilidad de que dos lotes de 1000 bolas cada uno difieran en peso en ms de 2 g?
La diferencia entre ambos debe ser de 2g, por lo que 2/1000=0.002 g, asi que
2.23=0.4871
-2.23
2.23
99% 2.58
98% 2.05
96% 2.05
95.45% 2.00
95% 1.96
90% 1.645
80% 1.28
68.27% 1.00
50% 0.6745
Intervalo de confianza para las medias. Si la poblacin es infinita o de una finita con reposicin.
Ecuacin 9 Intervalo de confianza para medias cuando la poblacin es finita sin reposicin
Donde X es la media de la muestra. Ejemplo: Supongamos que las alturas de 100 estudiantes varones de una universidad representan una muestra aleatoria de estudiantes de esa universidad. La media muestral es de 67.45 pulgadas y la desviacin estndar muestral es de 2.93 pulgadas. Hallar los intervalos de confianza a) 95% y b)99% para estimar la altura media de los estudiantes. a)
42
Esto significa que 66.88 < < 68.02 o en otras palabras podemos decir que la probabilidad de que la altura media de la poblacin est entre 66.88 y 68.02 pulgadas es del 95%. Equivale a decir que tenemos el 95% de confianza que la media de la poblacin est entre 66.88 y 68.02. b)
Esto significa que 66.69 < < 68.21 o en otras palabras podemos decir que la probabilidad de que la altura media de la poblacin est entre 66.69 y 68.21 pulgadas es del 99%. Equivale a decir que tenemos el 99% de confianza que la media de la poblacin est entre 66.69 y 68.21. Actividad en clase: Realizar ejercicio 9.6 de la pgina 214 del libro Estadstica Segunda Edicin.
Intervalos de confianza para proporciones. Si la poblacin es infinita o de una finita con reposicin.
Ecuacin 10 Intervalo de confianza para proporciones cuando la poblacin es infinita o con reposicin
Ecuacin 11 Intervalo de confianza para proporciones cuando la poblacin es finita sin reposicin
Ejemplo: Un sondeo de 100 votantes elegidos al azar en un distrito indica que el 55% de ellos estaban a favor de un cierto candidato. Hallar los lmites de confianza a) 95% b) 99% y c) 99.73% para la proporcin de todos los votantes favorables a ese candidato.
a)
b)
c)
Ejemplo: Una muestra de 150 lmparas del tipo A ha dado una vida media de 1400 horas y una desviacin estndar de 120h. Una muestra de 100 lmparas del tipo B dan vida media de 1200 h y desviacin estndar de 80h. Hallar los lmites de confianza a) 95% b) 99% para la diferencia de las vidas medias de las poblaciones de ambos tipos. a) b)
Proporciones
Ecuacin 13 Intervalos de confianza para diferencias y sumas de Proporciones
Ejemplo: En una muestra aleatoria de 400 adultos y 600 jvenes que vieron un cierto programa de televisin 100 adultos y 300 jvenes reconocieron que les haba gustado. Determinar los lmites de confianza a) 95% y b) 99% para la diferencia en proporciones de todos los adultos y jvenes que vieron con agrado el programa. 300/600=0.5 400/100=0.25
a) b)
Hiptesis Nula:
En muchos casos se formulan hiptesis estadstica con el nico propsito de rechazarla o invalidarla. As, si queremos decidir si una moneda est trucada, formulamos la hiptesis de que la moneda es buena (o sea p=0.5). Esta hiptesis se le llama hiptesis nula y se detona por Ho.
Hiptesis Alternativa:
Es toda hiptesis que difiera de una ya dada. Por ejemplo, si una hiptesis es p=0.5, las alternativas pueden ser p=0.7, p0.5 o p>0.5. Se denota por H1.
Nivel de significacin
Al contrastar una cierta hiptesis la mxima probabilidad con la que estamos dispuestos a correr el riesgo de cometer un error de Tipo I se llama nivel de significacin del contraste. Esta probabilidad denotada a me nudo por se especifica
antes de tomar la muestra. En la prctica es frecuente usar un nivel de significacin de 0.05 0.01. , por ejemplo si se usa 0.05 (5%) hay 5 oportunidades de 100 de rechazar la hiptesis, es decir tenemos un 95% de confianza de que hemos adoptado la decisin correcta y un 5% de que nos hemos equivocado. Nivel de significacin Valores crticos de z para tests unilaterales Valores crticos de z para tests bilaterales 0.10 -1.28 o 1.28 -1.645 y 1.645 0.05 -1,645 o 1.645 -1.96 y 1.96 0.01 -2.33 o 2.33 -2.58 y 2.58 0.005 -2.58 o 2.58 -2.81 y 2.81 0.02 -2.88 o 2.88 -3.08 y 3.08
0.95
-1.96
1.96
Ilustracin 2 Distribucin normal cannica con un 95% de confianza de que la hiptesis es verdadera
Como se ve en la ilustracin 2, podemos tener 95% de confianza que la hiptesis es verdadera, para que esto sea cierto el valor de z debe estar entre -1.96 y 1.96. Si no se encuentra, debemos concluir que tal suceso podra ocurrir con una probabilidad de 0.05 si la hiptesis fuera cierta. Entonces tendremos que rechazar la hiptesis. El rea total sombreada 0.05 es el nivel de significacin del contraste. Representa la probabilidad de equivocarnos al rechazar una hiptesis (probabilidad de erro tipo I). El conjunto de z fuera de rango -1.96 a 1.96 (en este ejemplo) se le conoce como regin critica de la hiptesis o regin de rechazo de la hiptesis o regin de significacin. El conjunto de z dentro del rango se le conoce como regin de aceptacin de la hiptesis o regin de no significacin. Contrastes de una y dos colas En el contraste anterior se buscaba los valores extremos del estadstico S. A este tipo de contrastes se les llama de 2 colas o bilaterales. Si estamos interesados en valores extremos a un lado de la media, como por ejemplo cuando se contrasta una hiptesis de que un proceso es mejor que otro, tales contrastes se llaman unilaterales o de una cola.
Ejemplos:
En un experimento sobre percepcin extrasensorial (PES), un individuo en una habitacin es invitado a adivinar el color (rojo o azul) de una carta elegida de un mazo de 50 cartas bien mezcladas por otro individuo en otra habitacin. El no sabe cuntas rojas y cuantas azules hay en el mazo. Si el sujeto identifica 32 cartas correctamente, determinar si el resultado es significativo al nivel de a) 0.005 y b) 0.001 H0:p=0.5 y el sujeto est simplemente diciendo colores al azar. H1:p>0.5 y el sujeto tiene poderes de PES Como estamos interesados en saber que adivine 32 o ms entonces se utiliza un contraste de una sola cola y es hacia la derecha.
a) para 0.05 utilizamos z=1.645 ya que es un contraste de una sola cola y es hacia la derecha. Si es mayor que se valor tiene poderes PES si no es al azar
Entonces el individuo tiene poderes PES b) para 0.01 utilizamos z=2.33. Como z=1.98 y no es mayor a 2.33 entonces el individuo no tiene poderes PES Cuando suceden estos caso que en 0.05 se cumple pero en 0.01 no decimos que es probable que suceda, as que es mejor hacer ms investigacin o pruebas.
E1 o1 e1
E2 o2 e2
Definicin de 2
Una medida de la discrepancia existente entre las frecuencias observadas y esperadas viene proporcionada por el estadstico 2 dado por:
Ecuacin 14 Formula de
2
Tablas de contingencia
La tabla 3, se le suelen denominar tablas de contingencia, en la cual podemos ver las frecuencias esperadas y las frecuencias esperadas. El estadstico 2 necesita de grados libertad, v, para podernos dar un resultado correcto. El grado de libertad se calcula
Los grados de libertad, ms los niveles de significacin se utilizaran con la siguiente tabla
Ejemplo En 200 tiradas de una moneda, han salido 115 soles y 85 guilas. Contrastar la hiptesis de que la moneda es buena, con nivel de significacin a)0.005 y b) 0.001 Suceso Frecuencia observada o E1 Soles 115 E2 guilas 85
Frecuencia esperada e
100
100
Entonces:
Ya que k=2 entonces v=k-1=2-1=1 a) el valor critico de para 1 grado de libertad es 3.84. Asi pues como 4.50>3.84 rechazamos la hiptesis de que la moneda es buena al nivel de significacin de 0.05 b) el valor critico de para 1 grado de libertad es 6.63. Asi pues como 4.50<6.63 no podemos rechazar la hiptesis de que la moneda es buena al nivel de significacin de 0.01
Como sucedi antes es necesario hacer ms pruebas ya que es probable que suceda pero no se tiene la certeza.
Ajuste de curvas
Para hallar una ecuacin que relacione las variables, el primer paso es recoger datos que muestren valores correspondientes de las variables bajo consideracin. As por ejemplo, supongamos que X e Y denotan, respectivamente, la altura y el peso de personas adultas; entonces una muestra de N individuos revelara las alturas X 1, X2Xn y los pesos Y1, Y2Yn El prximo paso es marcar los puntos sobre un sistema de coordenadas rectangulares. El conjunto de puntos resultante se llama diagrama de dispersin. A partir de dicho diagrama de dispersin es posible, visualizar una curva suave que aproxime los datos. Tal curva se llama una curva aproximante. El problema general de hallar ecuaciones aproximantes que se ajusten a un conjunto de datos se llama ajuste de curvas.
Ilustracin 5 Diagrama de dispersin que no es lineal y se dice que es una relacin no lineal
Donde a0 y a1 se calculan
Entonces
Correlacin lineal
Si X e Y son dos variables en cuestin un diagrama de dispersin muestra la localizacin de los puntos (X, Y) sobre un sistema rectangular de coordenadas. Si todos los puntos del diagrama parecen estar en una recta como en la ilustracin 6 y 7 la correlacin se llama lineal. Si Y tiende a crecer cuando X crece en como en la ilustracin 6 se dice que es positiva. Si Y tiende a decrecer cuando X crece como en la ilustracin 7 , se dice que es negativa. Si todos los puntos parecen estar sobre una cierta curva, la correlacin no es lineal. Si no hay relacin entre las variables decimos que no hay correlacin entre ellas.
Donde a0 y a1 se calculan
Donde b0 y b1 se calculan
a) Construir un diagrama de dispersin b) Hallar la recta de regresin de mnimos cuadrados de Y sobre X c) Hallar la recta de regresin de mnimos cuadrados de X sobre Y B) Y=35.82+0.476X C) X=-3.38+1.036Y
El punto en se usa para anunciar que el ndice k se ha sumado. Los valores se llaman medias de grupo, medias de tratamiento o medias de filas. La media global se calcula
En la prctica es conveniente restar alguna cantidad fija de todos los datos de la tabla para simplicar los clculos; tal operacin no tiene efecto alguno sobre el resultado final. Ejemplo La siguiente tabla da las producciones por acre de una cierta variedad de trigo que crece en terrenos tratados con fertilizantes A, B y C. Hallar a) las producciones medias para los diferentes tratamientos, b) la media global para todos los tratamientos c) la variacin total d) la variacin entre tratamientos e) la variacin dentro de los tratamientos. A B C 48 47 49 49 49 51 50 48 50 49 48 50
Para hacer mejor el clculo podemos restar 45 a todos los datos y queda la tabla 3 2 4 4 4 6 5 3 5 4 3 5
a)
b) c)
d) e) [ ]
Mtodos Abreviados
Formas abreviadas
Bibliografa
Unidad I Estadstica Aplicada, Julian de la Horra Navarro, Mc Graw Hill. Pgina 84. Unidad II Estadstica Segunda Edicin, Spiegel, Mc Graw Hill. Pginas 186-207 Unidad III Estadstica Segunda Edicin, Spiegel, Mc Graw Hill. Pginas 208-222 Unidad IV Estadstica Segunda Edicin, Spiegel, Mc Graw Hill. Pginas 223-240 Unidad V Estadstica Segunda Edicin, Spiegel, Mc Graw Hill. Pginas 268-284 Unidad VI Estadstica Segunda Edicin, Spiegel, Mc Graw Hill. Pginas 289-309 Unidad VII Estadstica Segunda Edicin, Spiegel, Mc Graw Hill. Pginas 322-348 Unidad VIII Estadstica Segunda Edicin, Spiegel, Mc Graw Hill. Pginas 375-396