You are on page 1of 127
SHAS yantee <€x)* INSTITUTO TECNOLOGICO fe Aye DE ORIZABA Pou |, APUNTES DE ANALISIS DE DATOS EXPERIMENTALES eects tte elie ANAUSIS DE DATOS EXPERIMENTALES MC. Luis A. Carretero Mufioz UNIDAD 1: ESTADISTICA DESGRIPTIVA Y FUNDAMENTOS DE PROBABILIDAD Estadistica: Es la rama de la Matemética que nos permite recoger, organizar y analizar los datos. Es la ciencia que trata de la recopilacién, organizacién, presentacién, andlisis e interpretacién de datos numéricos con el fin de realizar una toma de decisién mas efectiva. Es la sen tiene por objeto aplicar las leyes de la cantidad a los hechos sociales para medir su intensidad, deucir las leyes que los rigen y hacer su prediccién proxima. Poblacién: Es &f conjunto de Watos que caracteriza el fendmeno que se desea analizar ‘Muestra: Es un subconjunto ef pobecn que se desea estudiar \Probabilidad: La probabilidad de un suceso es una medida de la tendencia ‘que tiene a darse dicho suceso, Esta medida sera situada entre 0, que sera la }, probabilidad de un suceso que no se pueda dar nunca (Suceso Imposible) y 1 30, son llamadas Grandes Muestras. Para muestras de tamafio menor que 30 esa aproximacién no es buena y empeora al decrecer N, estas son Ilamadas Pequefias Muestras Ja Distribucion Normal a la Binomial Es importante destacar que la Distribueién de Poisson se puede utilizar para aproximar probabilidades Binomiales cuando n es bastante grande y p es muy cercana a 0 0 a 1. Las probabilidades asociadas con experimentos binomiales se obtienen ficilmente usando la formula o tablas de probabilidad correspondientes, siempre y cuando n sea pequefia. La Distribucién Normal es una buena aproximacién a. una Distribueién Discreta cuando la tiltima adquiere la forma de una campana simétrica; tedricamente algunas distribuciones con la normal conforme sus parimetros se aproximan a ciertos limites. Existe un teorema que permite utilizar éreas bajo la curva normal para aproximar propiedades binomiales cuando nes suficientemente grande, Si N es grande y si ni p ni q tienen valores muy cercanos a 0, la distribucién binomial puede ser aproximada por una distribucién normal con la variable estandarizada dada por: Npq Instituto Tecnolégico de Cec) ANALISIS DE DATOS EXPERIMENTALES M,C. Luis A. Carretero Mufioz ‘A medida que crece N, la aproximacién mejora y en el caso limite es exacta. En la prictica, la aproximacién es muy buena si tanto Np como Ng son mayores aS imacién de la Distribueion Normal a la Distribucién Poisson Puesto que existe una relacién entre la Distribuciones Binomial y Normal y las Distribuciones Binomial y Poisson, se deduce que hay también una relacién entre la Distribucién Poisson y Normal. La Distribuci6n Poisson tiende a la Normal a medida que A > 00 Teoria de Muestras Pequehas © La Distribucién Normal, tiene mayor utilidad entre mayor sea Ja muestra N, donde N > 30, son llamadas Grandes Muestras. © Para muestras de tamaiio menor que 30 esa aproximacién no es buena y empeora al decrecer N, estas son lamadas Pequeftas Muestras © El Estudio para pequefias muestras se lama Teoria de PequeRas Muestras; pero su nombre més apropiado es Teoria Exacta M del Muestreo; y sus resultados son vélidos para pequeflas muestras eed como grandes ‘MUESTRAS Distribueii ‘ue publicada en 1908 por W. S. Gosset bajo el seudénimo de Student, Supone que las muestras se seleccionan de una poblacién normal. Por ello es similar a la Distribueién Z ya que ambas tienen forma de campana pero la T = es mas variable, ya que los valores de T dependen de las fluctuaciones de 2 cantidades ¥ H.T se define como el cociente entre una variable aleatoria Normal Estandar y la raiz. cuadrada de una variable aleatoria Ji-Cuadrada dividida por sus grados de libertad. El conjunto de todos los intervalos de T es el intervalo (-:0, 00) Para cualquier v > 0, la distribucién es simétrica con respecto al origen y la funcién de densidad tiene su valor méximo cuando t= 0 La distribucién ¢ difiere de la de z en que la varianza de ¢ depende del tamafio de muestra de n y siempre es mayor a I Instituto Tecnolégico de Orizaba ANAUISIS DE DATOS EXPERIMENTALES Distribucion y* El modelo matematico de la distribucién viene dado por: Donde v= N-1 es el ntimero de grados de libertad, e Yo es una constante que depende de v tal que el area total bajo la curva es 1. Ademés de la importancia de la distribucién 7” como la distribucién a la que se ajusta la distribucién muestral de la varianza de una poblacién normal, y su posterior aplicacién en el contraste de la varianza, otras aplicaciones importantes de dicha distribucién son: © Test de Bondad de Ajustes © Test de Independencia © Test de Homogeneidad Distribuoién F - Fisher Esta distribucién permite inferir con respecto a las varianzas de dos distribuciones normales independientes, con base en las muestras aleatorias de cada una. La distribucién de muestreo F de Fisher o en breve distribucién F, con v= Ny ~ 1 y v= Nz~1 grados de libertad vienen dada por (4 /2)-1 y CF aol i, Donde Ces una constante que depende de vy y v2tal que el drea total bajo la curva es / M,C. Luis A. Carretero Mutioz DISTRIBUCIONES CONTINUAS 1.P(2<1.01) | 9.p(e<-2.27) | 17.p(-1.04<2<0.09) | 25.p(-2.81z>050) 2.p(z>-1.23) | 10.p (z<-0.27) | 18.p(-0.822>0.30) 3.p(z>-2.10) | 11. p(z>0.62) | 19. p(-2.19<2<0.07) 27.p(0z>1.00) | 4.p(z<-1.32) | 12. p(z>2.05) | 20.p(-1.45z>2.10) | 5.p(2>-3.59) | 13. p(z>- 21. p(-3.59<2<3.59) | 29.p(-2.13z>1.53) | 6p (2<3.59) | 14. p(z> 22. p(0.00<2<2.09) | 30.p(0.36z>3.16) | 7.p(2<0.93) | 15. p(z>- 23. p(-1.25z>0.50) | 39. p(-2.49<2< 1.04) [_8.p(z<1.68) | 16.p(z>1.06) | 24.p(0.5660.4) P (X>46.9) P (X>51.7) P(50X>54) P (Xs 52) P(4749.2) P(51X>53) Ejercicio 3 ‘Se supone que los resultados de un examen siguen una distribucién normal con media de 78 y varianza de 36. Se pide a) Que probabilidad tendré una persona de obtener una calificacién superior a 77, by si se sabe que la calificacién del alymno es superior a 72 ;Cual es la probabilidad de que su calificacién sea superior a 83? e) Cus es la probabilidad de que obtenga una calificacién menor a 75? Gamnne! En una ciudad se estima que la temperatura méxima en el mes de junio sigue una distribucién normal, con media de 25 ° y desviacién tipica de 8°. a) Calcular el nimero de dias del mes en los que se espera alcanzar maximas entre 21 y 27.5 °, b) Determine cuantos dias sobrepasaran los 26 °. ¢) Mencione en cuantos dias no se alcanzaran los 20.5 °. La media de los pesos de 500 estudiantes de un colegio es 70 kg. y la desviacién tipica es de 3 kg. suponiendo que los pesos se distribuyen normalmente hallar cuantos estudiantes pesan: a) Entre 62.5 y 65 kg. b) Mas de 74.5 Kg. ¢) Menos de 64 kg. d) 66 Kg. GESEExS Si los pesos de los bultos de arroz.estn distribuidos normalmente con una media de 41.5 kg. y una desviacién tfpica de 3 kg. determine: a) El porcentaje de los bultos que estén entre 39.80 y 42.3 kg. Si se realiza un muestreo de 250 bultos; b) Cuantos son mayores en peso a 42.5 kg. ¢) Cuantos bultos son menores de 40.5 kgs. | a TRO oo ANALISIS DE DATOS EXPERIMENTALES Orizaba Problemario de Unidad 1: Variables Aleatorias oe Si las alturas de 500 soldados esta normalmente distribuida con media en 175 ems. y desviacién esténdar de 15 cms. a) Cuantos soldados tienen la altura entre 175.5 y 183 cms b) Cuantos soldados son mayores de 180 cms. ¢) Cuantos son menores de 173.5 cms. d) Cuantos miden 178 cms. Cierto tipo de bateria de almacenamiento dura en promedio 3 afios, con una desviacién estindar de 0.5 afios. Suponga que las duraciones de la bateria se distribuyen normalmente, a) Encuentre la probabilidad de que una bateria dure menos de 2.3 afios b) Determine la Probabilidad de que la duracién de la bateria sea de 3.5 e) Y si su tiempo de vida fuera menor de 3.5 afios? d) Por tiltimo, encuentre cual es la probabilidad de que el tiempo de vida titil de las baterias este entre 2 y 3.5 afios Teoria de Muestras Pequefias Lt pietapusie Ts esdcent Con 9 grados de libertad hallar el valor de ¢; para el que a) El area sombreada de la derecha es 0.05 b) El Area total sombreada es 0.05 ¢) El area total sin sombrear es 0.99, d) El rea sombreada de la izquierda es 0,01 y e) El drea a la izquierda de t; es 0.90 L Con 15 grados de libertad hallar el valof de #; para el que ‘) El 4rea sombreada de la derecha es 0.01 b) La suma de Areas a la derecha de t; y a la izquierda de - t; sea 0.01 ¢) El area sombreada de la izquierda es 0,95 y d) El area entre - ty t sea 0.95 [Con 20 grados de libertad hallar el valor de #, para el que a) El rea sombreada de la derecha es 0.025 b) El drea total sombreada es 0.10 ¢) El Area total sin sombrear €s 0.95, d) El érea sombreada de Ia izquierda es 0.025, e) El drea a la izquierda de t, es 0.90 f) La suma de fireas a la derecha de t, ya la izquierda de -t; sea 0.05 y g) El érea entre - ty ¢; sea 0.90 [Z\Con 30 grados de libertad hallar el valor de ¢, para el que }) El area sombreada de la derecha es 0.01 b) El érea total sombreada es 0.20 e) El rea total sin sombrear es 0.99, d) El area sombreada de la izquierda es 0.95, e) El area a la izquierda de 1, ¢s 0.975 f) La suma de fireas a la derecha de t;y a la izquierda de - t; sea 0.01 y g) El area entre - try t; sea 0.90 ~ G}Con 35 grados de libertad hallar el valor de ¢; para el que a) El érea sombreada de la derecha es 0.05 b) E rea total sombreada es 0.05 ¢) El drea total sin sombrear €s 0.99, d) El area sombreada de la izquierda es 0.01 y e) El drea a la izquierda de ¢, es 0.90 Steet ied ANALISIS DE DATOS EXPERIMENTALES Cire) Problemario de Unidad 1: Variables Aleatorias MC. Luis A. Carretero Mufioz FBI Hallar los valores criticos de ¢ para los que el drea de la cola derecha de la distribucién tes 0.05, si el niimero de grados de libertad ves a) 16, b) 27, €) 200, d) 30, e) 55 Hallar los valores eriticos de ¢ para los que el area de la cola derecha de la distribucién tes 0.01, si el niimero de grados de libertad ves a) 4, b) 12, ¢) 25, d) 35 y e) 150 Bl Hallar los valores criticos de ¢ con 5 grados de libertad para los que a) EI drea sombreada a la derecha es 0.05 b) El dea total en sombra es 0.05, ¢) El area sombreada de la izquierda es 0.10 y d) El area sombreada a la derecha es 0.01 B Hallar los valores criticos de 72 con v= 12 a) El érea sombreada a la derecha es 0.01 b) El érea total en sombra es 0.01, ¢) El érea sombreada de la izquierda es 0.99 y d) El érea sombreada a la derecha es 0.05 FEB Hallar los valores criticos de 7? con v= 20 ) El area sombreada a la derecha es 0.05 b) El érea total en sombra es 0.10, ¢) El érea sombreada de la izquierda es 0.90 y d) El drea sombreada a la derecha es 0.005 Hallar los valores criticos de 72 para los cuales el drea de la cola derecha de la distribucién 72 es 0.05, si el niimero de grados de libertad ves a) 15, b) 21, e) 50, d) 30, e) 55 FEB Hallar los valores criticos de 72 para los cuales el érea de la cola izquierda de la distribucién 77 es 0.05, | nimero de grados de libertad ves a) 8, b) 19, e) 28, d) 40, e) 30 Hallar los valores criticos de 7 para los cuales el area de la cola derecha de la distribucién 72 es 0.25, I niimero de grados de libertad ves a) 9, b) 13, ¢) 23, d) 32, e) 43 eitcnes ANAUSIS DE DATOS EXPERIMENTALES M.C. Luis A. Carretero Mufioz Hallar los siguientes valores criticos de F a) Fasscon v= 8 y v2= 10 b) Fas» con v= ©) Faso con Ni= 16 y N3= 25 4) Fasscon Ni €) Foss con v= 22. v= 27 f) Faso con Ni= 21 y Ni= 36 2) Fasrscon v= 28 y v= 29 hh) Fosrscon v= 35 y v2= 60 i) Fasscon Ni= 16 y No= 31 3) Fase con vi= 25 y v= 24 k) Faso con Ni= 22 y v2= 30 1) Fasseon v= Ly v= 40 m) Fase con v= 3 y ve= 12 1) Faso con Ni= 15 y Ne= 17 0) Fasrscon v= 8 y v2= 10 P) Fasrscon Ni= 7 y N= 21 PROBLEMAS ADICIONALES. La posibilidad de que cada muestra de aire contenga una molécula rara particular es de 10 %. Supéngase que las muestras son independientes con respecto a la presencia de la molécula. Encuéntrese la probabilidad de que en las 18 muestras siguientes a) Exactamente 2 contengan la molécula rara. b) Al menos 4 contengan la molécula rara ¢) Por lo menos 3 y menos de 7 contengan la molécula rara, Las lineas telefonicas del sistema de reservacién de una aerolinea estin ocupadas 40 % del tiempo. Suponga que los eventos donde las lineas estén ocupadas en llamadas sucesivas son independientes. Suponga que se hacen diez. Hamadas telefnicas al sistema de reservacién. {Cuil es la probabilidad de que, a) al llamar 3 veces, las lineas estén ocupadas? b) al menos en una de las llamadas, las lineas no estén ocupadas €) cuanto mas en dos ocasiones las lineas no estén ocupadas? En San Francisco, 30 % de los trabajadores emplean el transporte piiblico, En una muestra de 10 trabajadores, cual es la probabilidad de que a) exactamente 3 empleen el transporte piblico. b) por lo menos 3 empleen el transporte piblico ¢) cuanto mas 4 empleen el transporte publico d) més de 3 y ‘menos de 7 e) por lo menos 4 y cuanto més 8 trabajadores usen el transporte piblico. La preferencia por el color de auto cambia con los aitos y de acuerdo al modelo particular que seleccione el cliente. En un allo reciente suponga que 10 % de todos los autos de lujo que se vendieron eran negros. Si 125 autos de ese afto y tipo se scleccionan al azar, encuentre las siguientes probabilidades: a) Al ‘menos 5 auto son negros b) A los sumo 6 autos son negros ¢) Mas de 4 autos son negros d) Entre 3 y 5 autos (inclusive) son negros e) Mas de 20 autos no son negros oR rey ANALISIS DE DATOS EXPERIMENTALES M. Luis A. Carretero Mufioz GEES Suponga que en promedio se reciben 10 llamadas por hora, ,Cuél es la probabilidad de que a) lleguen exactamente 5 Iamadas en una hora b) se reciban 3 llamadas 0 menos en una hora e) se reciban mas de 5 llamadas en una hora d) se reciban entre 2 y 7 llamadas en una hora e) se reciban por lo menos 4 y ‘cuanto mas 9 Ilamadas en una hora? Ta produccién do alaacien de cute doceatn fabricante, tiene un nimero de fallas promedio de 2.3 fallas por milimetro. Determine la probabilidad de tener a) 2 fallas en un milimetro de alambre b) 10 fallas en 5 milimetros de alambre ¢) al menos 1 falla en 2 milimetros de alambre d) cuanto més 4 fallas por milimetro e) por lo menos 4 y cuanto més 6 fallas por milimetro f) mas de 5 y menos de 8 por milimetro El numero de baches en una seccién de una carretera interestatal que requieren reparacién urgente tiene tuna media de 2 baches por milla. Cudl es la probabilidad de que a) No haya baches que reparar en un ‘tramo de 5 millas b) Sea necesario reparar al menos un bache en un-tramo de media milla e) Se requiera reparar por lo menos 3 baches en un tramo de 4 millas d) Cuanto mas 5 baches en un tramo de 2 millas. E] nimero promedio de accidentes de trinsito en cierto crucero de carretera es 2 por semana, Encuentre la probabilidad de que a) No haya accidentes en este crucero de carretera durante una semana b) A lo sumo haya 3 accidentes en esta seccién de carretera durante un periodo de 2 semanas e) Por lo menos haya 4 accidentes por semana d) Que haya por lo menos 2 y menos de 7 accidentes por semana Un lote de piezas contiene 100 de un proveedor local de tuberia y 200 de un proveedor del mismo material pero de otro estado. Si se eligen 4 piezas al azar, cual e3 la probabilidad de que a) Todas provengan del proveedor local b) 2 0 mas piezas de la muestra sean del proveedor local ¢) al menos 1 pieza de la muestra sea del proveedor local. Un lote de 75 arandelas contiene 5 en las que la variabilidad en el espesor alrededor de la circunferencia de la arandela es inaceptable, Se toma una muestra al azar de 10 arandelas sin remplazo. Cuél es la probabilidad de que a) Ninguna de las arandelas inaceptables se encuentre en la muestra b) Al menos una de las arandelas inaceptables se encuentre en la muestra c) Exactamente una de las arandelas inaceptables se encuentre en la muestra d) Cuanto més 4 arandelas inaceptables se encuentren en la muestra, Es frecuente que las semillas sean tratadas con un fungicida para protegerlas de ambientes mal drenados, himedos. En un intento a pequefia escala antes de un experimento a gran escala para determinar que dilucién del fungicida aplicar, cinco semillas tratadas y cinco semillas no tratadas se plantaron en suelo arcilloso y se registr6 el nimero de plantas que emergieron de las semillas tratadas y de las no tratadas. Suponga que la dilucién no fue eficaz y solo emergieron 4 plantas. Represente con x el nimero de plantas que emergieron de semillas tratadas. Encuentre la probabilidad de que a) x = 4 b) P (x < 3) €) P(2 30, Desde el punto de vista téenico, la poblacién no necesita tener una distribueién que sea exactamente normal, aunque si debe ser aproximadamente normal, es decir que la distribucién sea un tanto simétrica, con una moda y sin datos distantes. Investigue la normalidad uitilizando los datos muéstrales para construir un histograma, después determine si tiene aproximadamente forma de campana, Por lo regular podemos considerar que la poblacién se distribuye normalmente después de utilizar los datos muéstrales para confirmar que no hay datos distantes y que el histograma tiene una forma que no es muy distinta de la de una distribucién normal. Supuestos del tamao de la muestra que se requiere Se utiliza la Distribucién Normal como la distribucién de medias muéstrales. Si la poblacién original, en si misma, normalmente se distribuye, entonces las medias de muestras de cualquier tamafio se distribuirén normalmente. Si la poblacién original no se distribuye normalmente, decimos que las medias de las muestras con tamafio n > 30 tienen una distribucién que llega aproximarse a una distribucién normal. La condicién de que el tamatio de la muestra sea m > 30 se usa por lo regular como lineamiento pero no es posible identificar un tamafio de muestra minimo especffico que sea suficiente para todos los casos. El tamafio de muestra minimo realmente depende de cuanto se desvia la distribucién de la poblacién de una distribucién normal. Tamafios de muestra de 15 a 30 son adecuados si la poblacién parece tener una distribucién que no es lejana a la normal, pero algunas otras poblaciones tienen distribuciones que son extremadamente diferentes de la normal y pueden necesitarse tamafios de Ja muestra de 50, 100 o mas altos. Usaremos el criterio simplificado de n > 30 como justificacién para el tratamiento de la distribucién de medias muestrales como una distribucién normal. - Hipmeamaaed oT Sareneeiertacaitaeaia cama Sree ce eRe ek tre ANAUSIS DE DATOS EXPERIMENTALES M,C. Luis A. Carretero Mufioz © Es raro que conozcamos la Desviacién Estindar de una poblacién y que no conozcamos su media. Por esta raz6n, en la pritctica, cuando se desconoce la desviacién esténdar de una poblacién, esta debe ser estimada por la Desviacién estindar muestra, s. Para tales aplicaciones existe una distribucién continua llamada la distribucién t de Student Teneo aCe STE CY eee ett reer emeteteets eter L A partir de experiencias anteriores, se encontré que la desviacién estindar de MMUPOBIGIOHDUe los diimetros de las varillas producidas por una maquina es 6 = 0.053”. Para una muestra aleatoria simple {de n = 30 varillas, se encontré que el diémetro promedio de @ = 1.400". Encuentre el intervalo de confianza del a) 95%, b) 99 % e) 90 % para el valor promedio de los didmetros de las varillas. i Una Hlave de torsién utilizada en el montaje final de las cabezas de un cilindro tiene una desviaci6n estindar del proceso de 5 Ib/ft. Los Ingenieros han especificado que es conveniente un promedio del proceso de 135 Ib/ft. Para un@{HUGStfalaleatoria simple de 30 tuercas que la maquina apreté recientemente, la media de la muestra es 137 Ib/ft. Construya ¢ interprete el intervalo de confianza de a) 95%, b) 90%, para la media actual del proceso. Analice la posibilidad de que la maquina necesite ajuste para corregir la media del proceso. enor ‘medidas de los didmetros de un: le 200 cojinetes de bolas hechos por una determinada mAquina durante una semana dieron una media de 0.824” y una desviacién tipica de 0.042” Hallar los limites de confianza del a) 95%, b) 99 % €) 90 % pata el didmetro medio de todos los cojinetes. QQ sian on Un gue La visable adpiaion medida por el Cuestionario de Adaptacién para adolescentes de Bell, posee una varianza de 1.44, hemos extraido una muestra de 164 alumnos y ha sido calculado la media de la variable adaptacién obteniendo el valor de 5 {Cuél sera el intervalo confidencial para la media con un nivel de riesgo de 0.05? La media y la desviacién tipica de los didmetros de una({fiU88tfalde 250 remaches fabricados por una compafifa son 0.72642” y 0.00058”, respectivamente. Hallar los limites de confianza del a) 99% b)98 % ©) 95% y d) 90% para el diametro medio de todos los remaches fabricados por la compaiiia.

You might also like