You are on page 1of 27

ANTOLOGIA PARA LA MATERIA DE ESTADISTICA II

Contenido
Temario original por la escuela ............................................................................................................................................... 3 Temario que se ver en clase .................................................................................................................................................. 3 Unidad I Inferencia estadstica o inductiva ............................................................................................................................. 3 Introduccin ........................................................................................................................................................................ 4 Campos de aplicacin ......................................................................................................................................................... 4 Unidad II Teora elemental del muestreo ............................................................................................................................... 4 Distribuciones de muestreo ................................................................................................................................................ 4 Distribucin de muestreo de medias .............................................................................................................................. 5 Distribucin de muestreo de proporciones .................................................................................................................... 7 Distribucin de muestreo de diferencias y sumas .......................................................................................................... 8 Unidad III Teora de la estimacin estadstica ...................................................................................................................... 10 Estimaciones sin sesgo ...................................................................................................................................................... 10 Estimaciones de intervalo de confianza para parmetros de poblacin .......................................................................... 10 Intervalo de confianza para las medias......................................................................................................................... 10 Intervalos de confianza para proporciones. ................................................................................................................. 11 Intervalos de confianza para diferencias y sumas ........................................................................................................ 12 Unidad IV Teora estadstica de las decisiones ..................................................................................................................... 13 Hiptesis Nula: .................................................................................................................................................................. 13 Hiptesis Alternativa: ........................................................................................................................................................ 13 Contraste de hiptesis y significacin o reglas de decisin .............................................................................................. 13 Errores de tipo I y de tipo II............................................................................................................................................... 13 Nivel de significacin......................................................................................................................................................... 13 Contrastes mediante la distribucin normal .................................................................................................................... 14 Contrastes de una y dos colas ....................................................................................................................................... 14 Curvas de operacin caractersticas, potencia de un contraste ....................................................................................... 15 Unidad V Test de Ji-Cuadrada ........................................................................................................................................... 15 Definicin de 2 ................................................................................................................................................................. 16 El test de 2 para la bondad de ajuste ............................................................................................................................... 16 Tablas de contingencia...................................................................................................................................................... 16 Unidad VI Ajuste de curvas y el mtodo de mnimo cuadrados ........................................................................................... 18

Ajuste de curvas ................................................................................................................................................................ 18 El mtodo de mnimos cuadrados .................................................................................................................................... 19 Recta de mnimos cuadrados ........................................................................................................................................ 19 Parbola de mnimos cuadrados ................................................................................................................................... 20 Unidad VII Teora de la correlacin ....................................................................................................................................... 21 Correlacin y regresin ..................................................................................................................................................... 21 Correlacin lineal .............................................................................................................................................................. 21 La recta de regresin de mnimos cuadrados ................................................................................................................... 22 Unidad VIII Anlisis de varianza ............................................................................................................................................ 23 Experimentos de factor nico ........................................................................................................................................... 23 Variacin total, variacin dentro de los tratamientos y variacin entre tratamientos .................................................... 23

Temario original por la escuela


Unidad I Inferencia Estadstica o inductiva Unidad II La estimacin Unidad III Estimacin Puntual Unidad IV Estimacin por intervalos Unidad V Prueba de hiptesis estadsticas Unidad VI Continua prueba de hiptesis Unidad VII Prueba de hiptesis referente a dos medias Unidad VIII Prueba de hiptesis referentes a las varianzas Unidad IX Prueba de hiptesis para dos poblaciones normales Unidad X Curvas caractersticas de operacin Unidad XI Prueba de Ji-cuadrada de la bondad de ajuste Unidad XII Regresin Unidad XIV Correlacin Unidad XV Anlisis de la varianza

Temario que se ver en clase


Unidad I Inferencia Estadstica o inductiva Unidad II Teora elemental del muestreo Unidad III Teora de la estimacin estadstica Unidad IV Teora estadstica de las decisiones Unidad V Test de Ji-Cuadrada Unidad VI Ajuste de Curvas y el mtodo de mnimos cuadrados. Unidad VII Teora de la Correlacin Unidad VIII Anlisis de varianza

Unidad I Inferencia estadstica o inductiva

Introduccin
Comprende aquellas tcnicas por medio de las cuales se toman decisiones sobre una poblacin estadstica basadas en una muestra o en juicios de los administradores. Debido a que esas decisiones se toman en condiciones de incertidumbre, se requiere el uso de conceptos de probabilidad. Considerando que las caractersticas medidas en una muestra se denominan estadsticas mustrales, las caractersticas medidas en una poblacin estadstica o universo, se llaman parmetros poblacionales. Ningn mtodo estadstico puede corregir los defectos por una inadecuada seleccin del problema que se investiga, o por una mala recoleccin de datos. Una investigacin que empieza mal, con seguridad termina mal. Con datos de mala calidad no ser posible dar una respuesta adecuada a un problema cientfico.

Campos de aplicacin
La inferencia estadstica es ampliamente utilizada en diversas reas, a continuacin se mencionan unas pocas.

En las ciencias naturales: se emplea en la descripcin de modelos termodinmicos complejos (mecnica estadstica), en fsica cuntica, en mecnica de fluidos o en la teora cintica de los gases, entre otros muchos campos. En las ciencias sociales y econmicas: es un pilar bsico del desarrollo de la demografa y la sociologa aplicada. En economa: suministra los valores que ayudan a descubrir interrelaciones entre mltiples parmetros macro y microeconmicos. En las ciencias mdicas: permite establecer pautas sobre la evolucin de las enfermedades y los enfermos, los ndices de mortalidad asociados a procesos morbosos, el grado de eficacia de un medicamento, etctera. Entre otras.

Unidad II Teora elemental del muestreo


La teora del muestreo estudia la relacin entre una poblacin y las muestras tomadas de ella. Es de gran utilidad en muchos campos. Por ejemplo para estimar magnitudes desconocidas de una poblacin, tales como media y varianza, llamadas a menudo parmetros, a partir del conocimiento de esas magnitudes sobre muestras, que se llaman estadsticos. Tambin es til para determinar si las diferencias observadas entre 2 muestras son debidas a variaciones fortuitas o si son realmente significativas. Por ejemplo cuando se estudia el resultado de una medicina como tratamiento de cierta enfermad, o al decidir si un proceso de produccin es mejor que otro.

Distribuciones de muestreo
Si consideramos todas las posibles muestras de tamao n en una poblacin, para cada muestra podemos calcular un estadstico (como la media o desviacin estndar) que variara de muestra a muestra. De esta manera obtenemos una distribucin de muestreo. Tenemos diferentes tipos de distribucin de muestreo que ms adelante veremos.

Distribucin de muestreo de medias Supongamos que se toman todas las posibles muestras de tamao n, sin reposicin de una poblacin finita de tamao N. Si denotamos la media y la desviacin estndar de la distribucin de muestreo de medias por y las de la poblacin , respectivamente entonces

Ecuacin 1 Formulas de media y desviacin estndar de distribucin de muestreo de medias con poblacin finita o sin reposicin

Donde: N es el tamao de la poblacin n es el tamao de la muestra Si la poblacin es infinita o si el muestreo es con reposicin, los resultados anteriores se reducen a

Ecuacin 2 Formulas de media y desviacin estndar de distribucin de muestreo de medias con poblacin infinita o con reposicin

Por ejemplo: Las alturas de 3000 estudiantes varones de una universidad estn normalmente distribuidos con media 68 pulgadas y una desviacin estndar de 3 pulgadas. Si se toman 80 muestras de 25 estudiantes cada una. Cules sern la media y la desviacin estndar esperadas de la resultante distribucin de muestreo de medias, si el muestre se hizo a) con reposicin y b) sin reposicin. a)

b)

Como la diferencia es menor se considera para efectos prcticos la misma que en muestre con reposicin. En cuntas muestras esperaramos encontrar una media de a) 66.8 y 68.3 pulgadas y b) menor que 66.4 a)

0.4772+0.1915=0.6687 0.6687*80=53.496 o 53 muestras b)

0.5-0.4962=0.0038

0.0038*80=0.304 o cero

500 esferas tienen un peso medio de 5.02 gramos y una desviacin estndar de 0.30 g. Hallar la probabilidad de que una muestra al azar de 100 esferas de ese conjunto tengan un peso total a) entre 496 y 500 g y b) ms de 510g

a) El peso total estara entre 496 y 500 si el peso medio de las 100 bolas est entre 4.96 y 5 g

*Entre z a z se restan *Entre +z a +z se restan *Si la variable es = a la media, se suma 0.5 0.4871-0.2704=0.2167 b) El peso total exceder los 510g si el peso medio de las 100 bolas excede 5.10 g

0.5-0.4986=0.0014

Distribucin de muestreo de proporciones Supongamos que una poblacin es infinita y que la probabilidad de ocurrencia de un suceso (su xito) es p, mientras la probabilidad de que no ocurra es q=1-p. Por ejemplo una poblacin puede ser todos los posibles lanzamientos de una moneda, en la que la probabilidad de xito es . Consideremos todas las posibles muestras de tamao n de tal poblacin, y para cada una de ellas determinaremos la proporcin de xitos P. En el caso de una moneda, P sera la proporcin de soles en n tiradas. Obtenemos as una distribucin de muestreo de proporciones cuya media y cuya desviacin tpica vienen dadas por

Ecuacin 3 Formulas de media y desviacin estndar de distribucin de muestreo de proporciones con muestreo con reposicin

Esta frmula es vlida para poblaciones finitas realizadas con muestreo con reposicin. Para poblaciones finitas con muestreo sin reposicin se usa:Y

Ecuacin 4 Formulas de media y desviacin estndar de distribucin de muestreo de proporciones sin muestreo con reposicin

Cada persona de un grupo de 500 lanza una moneda 120 veces. Cuntas personas se espera que a) Saquen entre 40% y 60% de soles y b) 5/8 de sus lanzamientos o ms de soles

Como la proporcin es una variable discreta, hay que hacer una correccin, si la variable es menor a la media se resta y si la variable es mayor o igual a la media se suma

0.4857+0.4857=0.9714

500*0.9714=489 muestras b)

0.4977 0.5-0.4977=0.0023 500*0.0023= 1 personas. Se ha encontrado que el 2% de las piezas fabricadas en una cierta mquina son defectuosas Cul es la probabilidad de que en un envo de 400 piezas a) el 3% o ms b)2% o menos, sean defectuosas?

a) 1/2N=1/800=0.0012

0.5-0.3944=0.1056 b)

0.5+0.0714=0.5714 Distribucin de muestreo de diferencias y sumas Sean dadas dos poblaciones. Para cada muestra de tamao n1 de la primera, calculamos un estadstico S1; eso da una distribucin de muestreo para S1, cuya media y desviacin estndar denotaremos por s1 y s1. Del mismo modo, para cada muestra de tamao n2 de la segunda poblacin, calculamos un estadstico S2; eso nos da un distribucin de muestreo para S2 cuya media y desviacin estndar denotaremos con s2 y s2. Si tenemos medias mustrales de ambas poblaciones, la distribucin de muestreo de las diferencias de medias viene dada para poblaciones infinitas o con muestreo con reposicin con medias y desviaciones estndar por:

Ecuacin 5 Formulas de media y desviacin estndar de distribucin de muestreo de diferencias de medias.

Se puede usar la misma frmula para poblaciones finitas o muestreo sin reposicin.

Para suma se utiliza:


Ecuacin 6 Formulas de mZedia y desviacin estndar de distribucin de muestreo de sumas de medias.

En caso que se hablen de proporciones se usa:

Ecuacin 7 Formulas de media y desviacin estndar de distribucin de muestreo de diferencias de proporciones.

Ejemplo: Las bolas de rodamientos de cierto fabricante pesan 0.50 g de media, con desviacin ESTANDR de 0.02 g. Cul es la probabilidad de que dos lotes de 1000 bolas cada uno difieran en peso en ms de 2 g?

La diferencia entre ambos debe ser de 2g, por lo que 2/1000=0.002 g, asi que

2.23=0.4871

Ilustracin 1 rea bajo la curva que se busca para P2.23 o P-2.23

-2.23

2.23

Como se busca la probabilidad de que P2.23 o P-2.23 entonces (0.5-0.4871)+(0.5-0.4871)=0.0258

Unidad III Teora de la estimacin estadstica


Desde un punto de vista prctico, suele resultar ms importante ser capaz de inferir informacin sobre la poblacin a partir de muestras. Con tal situacin trata la inferencia estadstica, que usa los principios de la teora del muestreo.

Estimaciones sin sesgo


Si un estadstico de muestreo es igual al que le corresponde en la poblacin, se dice que el estadstico es un estimador sin sesgo, si no, se llama estimador sesgado. La media de las distribuciones de muestreo viene siendo un estimador sin sesgo ya que siempre es igual a la media de la poblacin, cosa contraria con la varianza y desviacin estndar que si varan y por lo tanto son estimacin sesgadas.

Estimaciones de intervalo de confianza para parmetros de poblacin


Se llama intervalo de confianza en estadstica a un intervalo de valores alrededor de un parmetro muestral en los que, con una probabilidad o nivel de confianza determinado, se situar el parmetro poblacional a estimar.

Nivel de 99.73% confianza zc 3.00

99% 2.58

98% 2.05

96% 2.05

95.45% 2.00

95% 1.96

90% 1.645

80% 1.28

68.27% 1.00

50% 0.6745

Tabla 1 Valores de Zc correspondientes a varios niveles de confianza.

Intervalo de confianza para las medias. Si la poblacin es infinita o de una finita con reposicin.

Ecuacin 8 Intervalo de confianza para medias cuando es infinita o con reposicin

Si la poblacin es finita sin reposicin

Ecuacin 9 Intervalo de confianza para medias cuando la poblacin es finita sin reposicin

Donde X es la media de la muestra. Ejemplo: Supongamos que las alturas de 100 estudiantes varones de una universidad representan una muestra aleatoria de estudiantes de esa universidad. La media muestral es de 67.45 pulgadas y la desviacin estndar muestral es de 2.93 pulgadas. Hallar los intervalos de confianza a) 95% y b)99% para estimar la altura media de los estudiantes. a)

42

Esto significa que 66.88 < < 68.02 o en otras palabras podemos decir que la probabilidad de que la altura media de la poblacin est entre 66.88 y 68.02 pulgadas es del 95%. Equivale a decir que tenemos el 95% de confianza que la media de la poblacin est entre 66.88 y 68.02. b)

Esto significa que 66.69 < < 68.21 o en otras palabras podemos decir que la probabilidad de que la altura media de la poblacin est entre 66.69 y 68.21 pulgadas es del 99%. Equivale a decir que tenemos el 99% de confianza que la media de la poblacin est entre 66.69 y 68.21. Actividad en clase: Realizar ejercicio 9.6 de la pgina 214 del libro Estadstica Segunda Edicin.

Intervalos de confianza para proporciones. Si la poblacin es infinita o de una finita con reposicin.
Ecuacin 10 Intervalo de confianza para proporciones cuando la poblacin es infinita o con reposicin

Si la poblacin es finita sin reposicin

Ecuacin 11 Intervalo de confianza para proporciones cuando la poblacin es finita sin reposicin

Ejemplo: Un sondeo de 100 votantes elegidos al azar en un distrito indica que el 55% de ellos estaban a favor de un cierto candidato. Hallar los lmites de confianza a) 95% b) 99% y c) 99.73% para la proporcin de todos los votantes favorables a ese candidato.

a)

b)

c)

Intervalos de confianza para diferencias y sumas Medias

Ecuacin 12 Intervalos de confianza para diferencias y sumas de Medias

Ejemplo: Una muestra de 150 lmparas del tipo A ha dado una vida media de 1400 horas y una desviacin estndar de 120h. Una muestra de 100 lmparas del tipo B dan vida media de 1200 h y desviacin estndar de 80h. Hallar los lmites de confianza a) 95% b) 99% para la diferencia de las vidas medias de las poblaciones de ambos tipos. a) b)

Proporciones
Ecuacin 13 Intervalos de confianza para diferencias y sumas de Proporciones

Ejemplo: En una muestra aleatoria de 400 adultos y 600 jvenes que vieron un cierto programa de televisin 100 adultos y 300 jvenes reconocieron que les haba gustado. Determinar los lmites de confianza a) 95% y b) 99% para la diferencia en proporciones de todos los adultos y jvenes que vieron con agrado el programa. 300/600=0.5 400/100=0.25

a) b)

Unidad IV Teora estadstica de las decisiones


En la prctica nos vemos obligados con frecuencia tomar decisiones relativas a una poblacin sobre la base de informacin proveniente de muestras. Tales decisiones se llaman decisiones estadsticas. Por ejemplo podemos decidir basados en datos mustrales, si un mtodo pedaggico es mejor que otro o si una moneda esta trucada o no. Al intentar alcanzar una decisin, es til hacer hiptesis sobre la poblacin implicada. Tales hiptesis, que pueden ser o no ciertas, se llaman hiptesis estadsticas.

Hiptesis Nula:
En muchos casos se formulan hiptesis estadstica con el nico propsito de rechazarla o invalidarla. As, si queremos decidir si una moneda est trucada, formulamos la hiptesis de que la moneda es buena (o sea p=0.5). Esta hiptesis se le llama hiptesis nula y se detona por Ho.

Hiptesis Alternativa:
Es toda hiptesis que difiera de una ya dada. Por ejemplo, si una hiptesis es p=0.5, las alternativas pueden ser p=0.7, p0.5 o p>0.5. Se denota por H1.

Contraste de hiptesis y significacin o reglas de decisin


Si suponemos que una hiptesis particular es cierta pero vemos que los resultados hallados en su muestra aleatoria difieren notablemente de los esperados bajo tal hiptesis, entonces diremos que las diferencias observadas son significativas y nos veramos obligados a rechazar la hiptesis. Por ejemplo en 20 lanzamientos de una moneda salen 16 caras, estaramos obligados a rechazar la hiptesis de que la moneda es buena, aunque hay posibilidad de equivocarnos. Los procedimientos para determinar si las muestras observadas difieren significativamente de los resultados esperados se llaman contrastes (o tests) de hiptesis o de significacin o reglas de decisin.

Errores de tipo I y de tipo II


Si rechazamos una hiptesis cuando debiera ser aceptada, diremos que se ha cometido un error de tipo I. Por otra parte si aceptamos una hiptesis que debiera ser rechazada, diremos que se ha cometido un error de tipo II. En ambos casos, se ha producido un juicio errneo.

Nivel de significacin
Al contrastar una cierta hiptesis la mxima probabilidad con la que estamos dispuestos a correr el riesgo de cometer un error de Tipo I se llama nivel de significacin del contraste. Esta probabilidad denotada a me nudo por se especifica

antes de tomar la muestra. En la prctica es frecuente usar un nivel de significacin de 0.05 0.01. , por ejemplo si se usa 0.05 (5%) hay 5 oportunidades de 100 de rechazar la hiptesis, es decir tenemos un 95% de confianza de que hemos adoptado la decisin correcta y un 5% de que nos hemos equivocado. Nivel de significacin Valores crticos de z para tests unilaterales Valores crticos de z para tests bilaterales 0.10 -1.28 o 1.28 -1.645 y 1.645 0.05 -1,645 o 1.645 -1.96 y 1.96 0.01 -2.33 o 2.33 -2.58 y 2.58 0.005 -2.58 o 2.58 -2.81 y 2.81 0.02 -2.88 o 2.88 -3.08 y 3.08

Tabla 2 Tabla de nivel de significacin

Contrastes mediante la distribucin normal


Supongamos que bajo cierta hiptesis y su distribucin de muestreo estadstico S con una media s y desviacin tpica s.

Regin crtica 0.025

0.95

Regin crtica 0.025

-1.96

1.96

Ilustracin 2 Distribucin normal cannica con un 95% de confianza de que la hiptesis es verdadera

Como se ve en la ilustracin 2, podemos tener 95% de confianza que la hiptesis es verdadera, para que esto sea cierto el valor de z debe estar entre -1.96 y 1.96. Si no se encuentra, debemos concluir que tal suceso podra ocurrir con una probabilidad de 0.05 si la hiptesis fuera cierta. Entonces tendremos que rechazar la hiptesis. El rea total sombreada 0.05 es el nivel de significacin del contraste. Representa la probabilidad de equivocarnos al rechazar una hiptesis (probabilidad de erro tipo I). El conjunto de z fuera de rango -1.96 a 1.96 (en este ejemplo) se le conoce como regin critica de la hiptesis o regin de rechazo de la hiptesis o regin de significacin. El conjunto de z dentro del rango se le conoce como regin de aceptacin de la hiptesis o regin de no significacin. Contrastes de una y dos colas En el contraste anterior se buscaba los valores extremos del estadstico S. A este tipo de contrastes se les llama de 2 colas o bilaterales. Si estamos interesados en valores extremos a un lado de la media, como por ejemplo cuando se contrasta una hiptesis de que un proceso es mejor que otro, tales contrastes se llaman unilaterales o de una cola.

Ejemplos:

En un experimento sobre percepcin extrasensorial (PES), un individuo en una habitacin es invitado a adivinar el color (rojo o azul) de una carta elegida de un mazo de 50 cartas bien mezcladas por otro individuo en otra habitacin. El no sabe cuntas rojas y cuantas azules hay en el mazo. Si el sujeto identifica 32 cartas correctamente, determinar si el resultado es significativo al nivel de a) 0.005 y b) 0.001 H0:p=0.5 y el sujeto est simplemente diciendo colores al azar. H1:p>0.5 y el sujeto tiene poderes de PES Como estamos interesados en saber que adivine 32 o ms entonces se utiliza un contraste de una sola cola y es hacia la derecha.

a) para 0.05 utilizamos z=1.645 ya que es un contraste de una sola cola y es hacia la derecha. Si es mayor que se valor tiene poderes PES si no es al azar

Entonces el individuo tiene poderes PES b) para 0.01 utilizamos z=2.33. Como z=1.98 y no es mayor a 2.33 entonces el individuo no tiene poderes PES Cuando suceden estos caso que en 0.05 se cumple pero en 0.01 no decimos que es probable que suceda, as que es mejor hacer ms investigacin o pruebas.

Curvas de operacin caractersticas, potencia de un contraste


Es posible evitar el riesgo de cometer un error de Tipo II simplemente no aceptando nunca la hiptesis, pero en muchas aplicaciones prcticas esto es inviable. En tales casos se suele recurrir a curvas de operacin caractersticas o curvas OC, que son grficos que muestran las probabilidades de error de Tipo II bajo diversas hiptesis. Proporcionan indicaciones de hasta qu punto un contraste dado nos permitir evitar un error de Tipo II; es decir, nos indicar la potencia de un contraste a la hora de prevenir decisiones errneas. Son tiles en el diseo de experimentos porque sugieren entre otras cosas el tamao de muestras a manejar.

Unidad V Test de Ji-Cuadrada


Los resultados obtenidos por muestreo no siempre coinciden exactamente con los esperados tericamente de acuerdo con las leyes de las probabilidades, por ejemplo, aunque consideraciones tericas conducen a esperar 50 soles y 50 guilas en 100 lanzamientos de una moneda (buena), es raro que eso ocurra exactamente. Entonces podemos tener sucesos posibles (E1, E2, E3) y se observa que ocurren con frecuencias o1, o2, o3 llamados frecuencia observada pero esperbamos que sucedieran con frecuencia e1, e2, e3 llamada frecuencia esperada. A menudo deseamos saber si las frecuencias observadas difieren significativamente de las esperadas.

Suceso Frecuencia observada o Frecuencia esperada e


Tabla 3 Tabla de contingencia

E1 o1 e1

E2 o2 e2

Definicin de 2
Una medida de la discrepancia existente entre las frecuencias observadas y esperadas viene proporcionada por el estadstico 2 dado por:
Ecuacin 14 Formula de
2

El test de 2 para la bondad de ajuste


2 puede utilizarse para determinar la calidad del ajuste mediante distribuciones tericas (como la binomial o normal) de distribuciones empricas (las obtenidas de las muestras).

Tablas de contingencia
La tabla 3, se le suelen denominar tablas de contingencia, en la cual podemos ver las frecuencias esperadas y las frecuencias esperadas. El estadstico 2 necesita de grados libertad, v, para podernos dar un resultado correcto. El grado de libertad se calcula

Ecuacin 15 Formula para calcular los grados de libertad

Donde k=al nmero de eventos o sucesos.

Los grados de libertad, ms los niveles de significacin se utilizaran con la siguiente tabla

Ilustracin 3 Valores Percentiles de

Ejemplo En 200 tiradas de una moneda, han salido 115 soles y 85 guilas. Contrastar la hiptesis de que la moneda es buena, con nivel de significacin a)0.005 y b) 0.001 Suceso Frecuencia observada o E1 Soles 115 E2 guilas 85

Frecuencia esperada e

100

100

Entonces:

Ya que k=2 entonces v=k-1=2-1=1 a) el valor critico de para 1 grado de libertad es 3.84. Asi pues como 4.50>3.84 rechazamos la hiptesis de que la moneda es buena al nivel de significacin de 0.05 b) el valor critico de para 1 grado de libertad es 6.63. Asi pues como 4.50<6.63 no podemos rechazar la hiptesis de que la moneda es buena al nivel de significacin de 0.01

Como sucedi antes es necesario hacer ms pruebas ya que es probable que suceda pero no se tiene la certeza.

Unidad VI Ajuste de curvas y el mtodo de mnimo cuadrados


Por lo general encontramos que existen relaciones entre dos o ms variables, como por ejemplo los pesos de las personas dependen en cierta medida de sus alturas, la presin de una masa de gas dada depende de su volumen y de su temperatura. Suele ser deseable expresar tales relaciones en forma matemtica determinando una ecuacin que conecte a las variables.

Ajuste de curvas
Para hallar una ecuacin que relacione las variables, el primer paso es recoger datos que muestren valores correspondientes de las variables bajo consideracin. As por ejemplo, supongamos que X e Y denotan, respectivamente, la altura y el peso de personas adultas; entonces una muestra de N individuos revelara las alturas X 1, X2Xn y los pesos Y1, Y2Yn El prximo paso es marcar los puntos sobre un sistema de coordenadas rectangulares. El conjunto de puntos resultante se llama diagrama de dispersin. A partir de dicho diagrama de dispersin es posible, visualizar una curva suave que aproxime los datos. Tal curva se llama una curva aproximante. El problema general de hallar ecuaciones aproximantes que se ajusten a un conjunto de datos se llama ajuste de curvas.

Ilustracin 4 Diagrama de dispersin que se aproxima a una lnea recta.

Ilustracin 5 Diagrama de dispersin que no es lineal y se dice que es una relacin no lineal

El mtodo de mnimos cuadrados


Para evitar juicios subjetivos al construir rectas, parbolas u otras curvas aproximantes de ajuste de datos, es necesario acordar una definicin de recta de mejor ajuste, parbola de mejor ajuste, etc. Entonces se debe usar el mtodo de mnimos cuadradas. Recta de mnimos cuadrados

La recta de mnimos cuadrados est dada por la ecuacin:

Ecuacin 16 Recta de mnimos cuadrados

Donde a0 y a1 se calculan

Ecuacin 17 Ecuaciones para calcular a0 y a1 para recta de mnimos cuadrados

Ejemplo Ajustar una recta de mnimos cuadrados a los datos siguientes X Y 1 3 1 2 4 4 6 4 8 5 9 7 11 14 8 9

Entonces tabulamos los valores X 1 3 4 6 8 9 11 14 Y 1 2 4 4 5 7 8 9 X2 1 9 16 36 64 81 121 196 XY 1 6 16 24 40 63 88 126 Y2 1 4 16 16 25 49 64 81

Entonces

Parbola de mnimos cuadrados

La parbola de mnimos cuadrados est dada por la ecuacin:

Ecuacin 18 Parbola de mnimos cuadrados

Unidad VII Teora de la correlacin


Correlacin y regresin
Si todos los valores de las variables satisfacen una ecuacin exactamente, decimos que las variables estn perfectamente correlacionadas o que hay correlacin perfecta entre ellas. Si se lanzan dos dados 100 veces, no hay relacin entre las puntuaciones de ambos dados (a menos que estn trucados), es decir, no estn en correlacin. Variables tales como el peso y la altura tienen una cierta correlacin. Cuando slo estn en juego dos variables, hablamos de correlacin simple y regresin simple. En otro caso, se habla de correlacin mltiple y regresin mltiple.

Correlacin lineal
Si X e Y son dos variables en cuestin un diagrama de dispersin muestra la localizacin de los puntos (X, Y) sobre un sistema rectangular de coordenadas. Si todos los puntos del diagrama parecen estar en una recta como en la ilustracin 6 y 7 la correlacin se llama lineal. Si Y tiende a crecer cuando X crece en como en la ilustracin 6 se dice que es positiva. Si Y tiende a decrecer cuando X crece como en la ilustracin 7 , se dice que es negativa. Si todos los puntos parecen estar sobre una cierta curva, la correlacin no es lineal. Si no hay relacin entre las variables decimos que no hay correlacin entre ellas.

Ilustracin 6 Correlacin lineal positiva

Ilustracin 7 Correlacin lineal negativa

Ilustracin 8 Sin correlacin

La recta de regresin de mnimos cuadrados


La recta de regresin de Y sobre X es:

Ecuacin 19 recta de regresin Y sobre X

Donde a0 y a1 se calculan

Ecuacin 20 Ecuaciones para calcular a0 y a1 para recta de regresin

La recta de regresin de X sobre Y es

Ecuacin 21 Recta de regresin X sobre Y

Donde b0 y b1 se calculan

Ecuacin 22 Ecuaciones para calcular b0 y b1 para recta de regresin

Ejemplo: Altura X del padre Altura Y del hijo 65 68 63 66 67 68 64 68 65 69 62 66 70 68 66 65 68 71 67 67 69 68 71 70

a) Construir un diagrama de dispersin b) Hallar la recta de regresin de mnimos cuadrados de Y sobre X c) Hallar la recta de regresin de mnimos cuadrados de X sobre Y B) Y=35.82+0.476X C) X=-3.38+1.036Y

Unidad VIII Anlisis de varianza


Ya se ha visto como contrastar las diferencias entre dos medias mustrales, en el supuesto de que las dos poblaciones de las que se tomaban las muestras tenan la misma varianza. En muchas situaciones es necesario hacer eso mismo con tres o ms medias mustrales, sea, equivalentemente, contrastar la hiptesis de que todas las medias son iguales.

Experimentos de factor nico


En un experimento de un factor, las medidas (u observaciones) se obtienen para grupos independientes de muestras, donde el nmero de medidas en cada grupo es b. Hablamos de a tratamientos, cada uno de los cuales tiene b repeticiones. Denotaremos por la media de las medidas en fila j-sima. Entonces tenemos

El punto en se usa para anunciar que el ndice k se ha sumado. Los valores se llaman medias de grupo, medias de tratamiento o medias de filas. La media global se calcula

Variacin total, variacin dentro de los tratamientos y variacin entre tratamientos


La variacin total denotada por V, se calcula con:

Ecuacin 23 Variacin Total

La variacin dentro de los tratamientos se calcula con:

Ecuacin 24 Variacin dentro de los tratamientos

La variacin entre los tratamientos se calcula con:

Ecuacin 25 Variacin entre los tratamientos

Por lo tanto V la podemos calcular tambin con:

En la prctica es conveniente restar alguna cantidad fija de todos los datos de la tabla para simplicar los clculos; tal operacin no tiene efecto alguno sobre el resultado final. Ejemplo La siguiente tabla da las producciones por acre de una cierta variedad de trigo que crece en terrenos tratados con fertilizantes A, B y C. Hallar a) las producciones medias para los diferentes tratamientos, b) la media global para todos los tratamientos c) la variacin total d) la variacin entre tratamientos e) la variacin dentro de los tratamientos. A B C 48 47 49 49 49 51 50 48 50 49 48 50

Para hacer mejor el clculo podemos restar 45 a todos los datos y queda la tabla 3 2 4 4 4 6 5 3 5 4 3 5

a)

b) c)

d) e) [ ]

Mtodos Abreviados

Ecuacin 26 Mtodos Abreviados para experimento de un factor.

Donde T es el total de valores

y Tj es el total de valores en el tratamiento j-simo.

Experimentos de Dos factores


El tratamiento de dos factores es como si fuera una matriz, a continuacin se muestran las formulas.

Ecuacin 27 Variacin total de dos factores

Variacin debida a error o azar

Ecuacin 28 Variacin debida a error

Variacin entre filas

Ecuacin 29 Variacin entre filas

Variacin entre columnas

Ecuacin 30 Variacin entre columnas

Formas abreviadas

Ecuacin 31 Mtodos Abreviados para experimento de 2 factores

Bibliografa
Unidad I Estadstica Aplicada, Julian de la Horra Navarro, Mc Graw Hill. Pgina 84. Unidad II Estadstica Segunda Edicin, Spiegel, Mc Graw Hill. Pginas 186-207 Unidad III Estadstica Segunda Edicin, Spiegel, Mc Graw Hill. Pginas 208-222 Unidad IV Estadstica Segunda Edicin, Spiegel, Mc Graw Hill. Pginas 223-240 Unidad V Estadstica Segunda Edicin, Spiegel, Mc Graw Hill. Pginas 268-284 Unidad VI Estadstica Segunda Edicin, Spiegel, Mc Graw Hill. Pginas 289-309 Unidad VII Estadstica Segunda Edicin, Spiegel, Mc Graw Hill. Pginas 322-348 Unidad VIII Estadstica Segunda Edicin, Spiegel, Mc Graw Hill. Pginas 375-396

You might also like