You are on page 1of 18
16 La warabiided en los placos de entrega genera inceridumbre ‘nla plameacin de a roduccién. Los métodos (qe 4 presentan en esi seccion ayudan a mediry entender la varabiidd. Capitule 3. Estadistica descriptive: Medias numéricas Medidas de variabilidad [Ademés de las medidas de posicién o localizacién, con frecuencia es conveniente considerar las medidas de variabilidad o dispersién, Por ejemplo, suponga que usted es gerente de compras de una empresa manufacturera grande y que coloca con regularidad pedidos con dos proveedo- res diferentes, Después de varios meses de operacién, nota que el niimero medio de dias nece- sario para que ambos surtan los pedidos es de 10 dias. Los histogramas que resumen el nimero de dfas de trabajo requeridos para que los proveedores suministren los pedidos se muestran en la figura 3.2. Aunque el ndmero medio de dfases 10 para los dos proveedores, ;ambos muestran el mismo grado de confiabilidad en cuanto a efectuar las entregas a tiempo? Note la dispersi6n, © vatiabilidad, en los plazos de entrega indicados por los histogramas. ; Qué proveedor prefiere usted? Para la mayorfa de las empresas es importante recibira tiempo los materiales y suministros para sus procesos. Los plazos de entrega de 7 u 8 dias mostrados para J.C, Clark Distributors podrfan considerarse favorables, sin embargo, algunos plazos largos de 13 a 15 dias podrfan resultar desastrosos en términos de mantener ocupada ala fuerza laboral y la produccién dentro de lo programado, Este ejemplo ilustra una situacién en Ia que la variabilidad en los tiempos de centrega puede ser una consideracién primordial al seleccionar a un proveedor. Para la mayoria de los gerentes de compras, la menor variabilidad mostrada por Dawson Supply, Ine. Io haria el preferido. ‘Ahora se verd la revisidn de algunas medidas de variabilidad de uso comin, Rango [La medida de vaiabildad mas sencila es el rango RANGO Rango = Valor mayor ~ Valor menor Revise los datos sobre los sueldos iniciales de los licenciados en administracién de empresas recign egresados que hemos venido trabajando de la tabla 3.1. El sueldo inicial mayor es de 4325, yeel menor es de 3710. El rango es 4325 ~ 3710 = 615. FIGURA 3.2 Datos histéricos que muestran el niimero de dfas que se requiere para surtir los pedidos os os g 04 g 04 g Dawson £ 1€.Clark i soon q cass 03} E os 4 4 5 5 i 02 g 02] é & 01 a1 9 0 1 TS 9 DNR Dw 1S Niimero de dias de trabajo Niimero de dias de trabajo Lavarianza muesiral ses eLetimador dela variance poblacional 0% 3.2 Modides de variabilidad 17 ‘Aun cuando el rango es la medida de variabilidad mas ffcil de ealcular, pocas veces se usa como la tnica medida, debido a que se basa s6lo en dos de las observaciones y, por lo tanto, Jos valores extremos influyen mucho en él. Suponga que uno de los licenciados recién ezre- ssados recibe un sueldo inicial de $10000 al mes, En este caso, el rango serfa 10000 — 371 6290 en vez de 615. Este valor mayor para el rango no describe con claridad la variabilidad de Jos datos debido a que 11 de los 12 sueldos iniciales se agrupan estrechamente entre 3710 y 4130, tercuartilico o intercuartil Rango ‘Una medida de la variabilidad que supera la dependencia sobre los valores extremos es el rango intercuartilico 0 intercuartil (RIC). Esta medida de la variabilidad es la diferencia entre el tercer cuartil, Q,,y el primer cuartil, Q,. En otras palabras, el rango intercuartilico es el rango de 50% del total de los datos que se encuentran en medio de la distribucién. RANGO INTERCUARTILICO O INTERCUARTIL RIC = Q,~ (3.5) Para os datos sobre sucldos mensuals iniciales, los curiles son Q, = 3600 y Q, = 3465. Por Jo tanto el rango intercvantco es 3600 — 3465 = 135, Varianza La varianza es una medida de la variabidad que utiliza todos los datos. Se basa en la diferen- cia entre el valor de cada observacién (x,) y 1a media. La diferencia entre cada x, y la media G para una muestra; « para una poblacin) se llama desviacién respecto dela media. Para una muestra, una desviacién respecto de la media se escrbe (x; ~ ¥); para una poblaciGn, se es cribe (x, ~ 4). Si se desea calculr la varinza, las desviaciones respecto dela media se elevan al euadrado, Silos datos pertenecen 2 una poblaciGn, el promedio de las desviaciones elevadas al cua- 4rado se llama varianza poblacional, la cual se denota por medio del simbolo griego 0%, Para una poblaci6n de V observaciones con una media poblacional la definicién de Ia varianza poblacional es la siguiente: VARIANZA POBLACIONAL (3.6) En la mayoria de las aplicaciones de estadistica, los datos que se analizan provienen de una ‘muestra. Cuando se calcula una varianza muestral, a menudo lo que interesa es usarla para esti- ‘mar la varianza poblacional a. Aunque una explicaci6n detallada esti mis allé del alcance de este libro, puede mostrarse que si la suma de las desviaciones respecto de la media al cuadrado se divide entre n ~ 1, y no entre n, la varianza muestral resultante proporciona un estimador insesgado de la varianza poblacional, Por esta razén, la varianza muestral, que se denota con 8°, se define como sigue. \VARIANZA MUESTRAL 2H = xP aad (3.7) 18 TABLA 3.3 Caleulo de desvi Copitulo 3 Estadlistca descriptive: Medidas numéricas jones respecto de Ia media y desviaciones cuadradas respecto de la media de los datos de tamaftos del grupo de estudiantes Niimero de Media det Desviacién respecto Desviacién cuadrada ‘estudiantes en tamaiio det de la medi rrespecto de la media el grupo (;) grupo) 3D ,- 3 46 4 a 100 2 4 46 4 2 as 256 Lavarianca es dtl para comparar ia variabiidad dd dos o més variables, Para ilustrar el célculo de la varianza muestral se usardn los datos sobre Ios tamafios del ‘grupo de la muestra de cinco grupos de estudiantes universitarios que se presenta en la seccién 3.1. Un resumen de los datos, que incluye el célculo de las desviaciones respecto de la media ¥y los cuadrados de las desviaciones respecto de la media, se aprecia en la abla 3.2, La summa de. tos cuadrados de estas desviaciones es Sx, — 7} muestral es 256. Por ende, sin ~ 1 = 4, la varianza Ey — 3) _ 256 n=l 4 ‘Antes de proseguir, observe que las unidades asociadas con la varianza muestral suelen ‘causar confusi6n. Debido a que los valores que se suman para calcular la varianza, (x — 3) ‘estén elevados al euadrado, las unidades asociadas con la varianza muestra también estén ele- vadas al cuadrado. Por ejemplo, la varianza muestal para los datos del tamatio de grupo es 43? = 64 (estudiantes). Las unidades cuadradas asociadas con la varianzadificultan obtener una ‘comprensién e interpretacin inuitiva del valor numérico de ésta, Se recomienda considerar- Ja como una medida itil en la comparaci6a de Ie cantidad de variablidad para dos 0 mas varia- bles. En una comparacién de las variables, aquellacon la varianiza més grande muestra la mayor variabiidad, Tal vez no sea necesaria una interpretaci6n del valor de la varianza, Como otro ejemplo del célculo de una varianza muestral, consiere los sueldos iniciales listados en la tabla 3.1 para los 12 licenciados en administraci6n de empresas. En la secci6n 3.1 se observa que la media muestral de los sueldos es de 3940. El cfleulo dela varianza muestal («2 = 2744091) se muestra en la tabla 3.4. Enlastablas 3.3 y 3.4 se aprecian la suma de las desviaciones sobre la media y la sua de las desviaciones cuadadas respecto ala media. Para cualquier conjuntode datos, a suma de la des- viaciones respecto ala media siempre serd igual a cero. Note queen esas tablas, 20%, ~ X) Las desviaciones positivas y negativas se cancelan entre sf, ocasionando que la suma de las desviaciones respecto a la media sea igual a cero. Desviacién estandar La desviacién estiindar se define como la rafz cuadrada positiva de la varianza. Siguiendo la notacién que se adopts para las varianzas muestral y poblacional, se usa s para denotar Ia des- vviacién estindar muestral y o para denotar la desviaci6n estindar poblacional. La desviacién estindar se obtiene de la varianza de Ia manera siguiente. 3:2. Medidas de variabilidad 19 TABLA 3.4. Cateulo dela varianza muestra de los datos de os sueldos i ‘Sueldo Media Desviacién respecto Desviacin cuadrada mensual aestral de la media respect dela media &) @) &-2 @, - 3 2490 30 -% s100 3930 390 » 100 4050 3040 no 12100 3880 350 -0 360 15s 390 =a suns a0 390 220 2500 3990 390 “9 2500 410 390 190 3e100 300 390 ° o ans 390 385 148225 a0 38:0 = “00 3880 390 -0 200 ° 3o1880 25-9 26-3 Usundo le ecuacin 8.7), La dervacién esndar Imuestral see extinador de a desviacin esundor poblacional 9. La desviacin stindar es ind cil de interpreta que la varianza debidoa que 1 idee as mismas tnidades que los das. El coeficiene de varacion ‘es una medida relaiva ea variabildad: mide Ia desviacinestindor respecto de la medi DESVIACION ESTANDAR Desviacién estindar muestral = s = Vs? ‘oe Desviaci6n esténdar poblacional = 0 = Recuerde que la varianza muestral para los tamaiios de grupo de la muestra de cinco grupos de estudiantes ess? = 64. Asf, la desviacién estindar muestral es s = V64 = 8. Para los datos sobre. los sueldos iniciales, la desviaci6n estindar muestral es s = V27440.91 = 165.65. {,Qué se gana al convertr Ia varianza en la desviacién estindar correspondiente? Recuerde. {que las unidades asociadas con la varianza estén elevadas al cuadrado. Por ejemplo, la varianza ruestral para los datos sobre los sueldos iniciales de los licenciados en administracién de em- presas recién egresados es s* = 27440.91 (d6lares)?, Debido a que la desviacién esténdar es la raiz cuadrada de la varianza, las unidades de esta ttima, Ios délares al cuadrado, se convierten ‘en délares en la desviaci6n estindar. Por consiguiente, la desviacién estindar de los datos de los sueldos iniciales es $165.65. En otras palabras, ésta se mide en las mismas unidades que los datos originales; por esta razén la desviacién estindar se compara mis fécilmente con la media y con otros estadisticos que se miden en las mismas unidades que los datos originales. Coeficiente de variacién En algunas situaciones nos interesa el estadistico descriptivo que indique qué tan grande es la desviacién estindar respecto de la media. Esta medida se llama coeficiente de variacién, y se cexpresa por lo general como porcentaje. 120 Capitulo 3. Estadistca descriptive: Medidas numéricas (COEFICIENTE DE VARIACION ease estindar a op (310) Para los datos de los tamafios de grupo, se encontré una media muestral de 44 y una des- vviaciOn estindar muestral de 8. El coeticiente de variacién es ((8/44) X 100]% = 18.2%, Ex- presado con palabras, el coeficiente de variaci6n indica que la desviacin estindar muestral es 18.26 del valor de la media muestral, Para los datos de los sueldos iniciales con una media ‘muestral de 3940 y una desviacién estindar muestral de 165.65, el coeficiente de variacién, [(165.6573940) x 100]% = 4.2%, sefiala que la desviacién estdndar muestra es s6lo 4.2% del valor de la media muestral. En general, el coeficiente de variacién es un estadistico itil para ‘comparar la variabilidad de las variables que tienen tanto desviaciones estindar como medias distintas. rein aeons Elsoftware ylashojas de cleulo para estadistica se san para obtener los estadisticos deseriptivos que se presentaronen este capfulo, Una ver que los da- tos se introducen en una hoja de eéleulo, bastan unos comandas seneillos para generar el resultado \descado, En los tes apéndices del capitulo se ex- plica emo usar Minitab, Excel y StatTools para obtener estadisticos descripivos, La desviacién estindar es una medida de uso eo- ‘main para el riesgo asociado con le inversién en acciones y fondos de acciones (sitio web Morning sar, 21 de julio de 2012), Proporciona una medida de cémo fluctian los rendimientos mensuales en ‘oro al rendimiento promedio a largo plazo. . Cuando se redondean los valores de la media mues- ttal Ty Ios valores de los cuadrados de las desvia- «iones (x; — ¥)? se pueden introduc errores en la calculadora al obtener la varianza y la desviacién cestindar. Para reducir los erores de redondeo, se recomienda trabajar por lo menos con seis dfgitos signficativos durante los edleulosintermedios. La Varianza o la desviacién esténdar resultantes pue- den redondearse después a menos digits. 4, Una formula opcional para el edleulo de Ia varian- za muestaales| donde Ex} =x} +2 +-+-x3 El error medio absoluto (mean absolute error, MAB) es otra medida de variabilidad que se eal- cula sumando el valor absoluto de las desvisciones de los elementos sobre Ia media y dividiendo el resultado entre el ndimero de elementos, Para una muestra de tamafo n, el error medio absoluto se caleularia dela siguiente manera: sent6en la seccién 3.1, = 44,3 |x, —¥) = 28, yel MAE = 28/5 = 5.6, Puede aprender més sobre el MAB y ors medidas de variabiidad en el ca- pitulo 17 Métodos 23. Considere una muestra con los datos 10,20, 12, 17 y 16. Caleule el rango y el rango intercuar- tic. 24, Considere una muestra con los datos 10, 20, 12, 17 y 16, Determine la varianza y la desviscién esindar. AUTO RIRIESIN 25. considere una mvs con fs datos 27, 25,2015, 30,34, 28 25, Calele lang, el rango imtercuartico, la varianzay la desviaeién estindar, 3.2 Medidas de voriabilidad 121 Aplicaciones 26. Las pasos qe sb un jupor bl ns pars fron 12,168 124, AUTO 1907) 13 Undo edt mo nn muta, eee bs esses esses siguientes: a) Rango ©) Desviacin estindar ) Varianza ©) Coeficiente de variacion 27. La siguiente tabla muestra los resultados de una investigaci6n para determinar el viaje redondo ims econdmico (Round-Trip Cost) hacia Atlanta y Salt Lake City desde 14 de las principales ciudades de Estados Unidos. La fecha de salida fue 20 de junio de 2012 y la de regreso 27 de junio de 2012. Round-Trip Cost ($) Departure City Atlanta Salt Lake City Cincinnati 340.10 70.10 New York 321.60 354.60 Chicago 291.60 465.60, Denver 339.60 219.60 Los Angeles. 359.60 31160 Seattle 384.60 297.60 Detroit 308.60 471.60 Philadelphia 415.60 61840 ‘Washington, D.C. 293.60 513.60 Miami 249.60 523.20 San Francisco 539.60 381.60 Las Vegas 455.60 159.60 Phoenix 359.60 267.60 Dallas 333.0 458,60 42) Caleule el precio medio de un viaje redondo para Atlanta y Salt Lake City. ;8s més eco- rnémico viajar a Atlanta que a Salt Lake City? De ser ast, ;qué explicaria la diferencia? +) Calcule el rango, la varianza y la desviaci6n estandar para las dos muestras. ;Qué le indica sta informacién sabre los precios de los vuelos a estas dos ciudades? 28, El tomeo de tenis Abierto de Australia es el primero de los cuatro eventos profesionales del Grand Slam que se llevan a cabo cada afo. Victoria Azarenka vencié a Maria Sharapova y gand el ttulo femenil de este torneo el aio 2012 (Washington Post, 27 de enero de 2012). Durante el torneo, la velocidad de los servicios de Azarenka alcan26 los 178 kilémetros por hora. A con= tinuaciGn se presenta una lista de la velocidad de los servicios de las 20 lideres del Abierto de Australia en 2012, Player Serve Speed (kn/h) Serve Speed (km/h) S. Williams 191 179 S.Lisicki 190 178 M.Keys 137 178 L. Hradecka 187 178 J. Gajdosova 187 178 J. Hampton. 181 Y. Dushevina 178 B. Mattek-Sands 181 S-Stosur 178 F. Schiavone 19 8. Cirstea 71 P. Parmentier 1m M. Barthel m7 N. Petrova 179 P. Ormaechea a 44) Caleule la media, la varianza y la desviaci6n estindar de las velocidades de servicio (Serve Speeds). +b) Una muestra similar de las 20 lideres en velocidad del servicio de 2011 en el torneo de ‘Wimbledon mostré una media muestral de velocidad de 182.5 kilémetros por hora. La va- 122 WEB)iGl lo Cotes weBiiile BackToSenoo! Copitulo 3 Estodisica descripiva: Medias numérices rianza y la desviacion estindar fueron 33.3 y 5.77 respectivamente. Analice ls diferencias, ‘en velecidad del servicio para el Abierto de Australia y el torneo de Wimbledon. 29, Los Angeles Times informa el fadice de calidad del sire de varias zonas del sur de California Una muestra de valores de est indice en Pomona proporcion6 los datos siguientes: 28,42, 58, 48,45, $5, 60,49 50, 4), Calevle et ango y e ango intereuertico. 1) aleve la varianza muesiraly Ia desviacin estndar muestl. )_ Una miesta de registos del fice de calidad dl sire de Anaheim proporcioné na me- ia muesial de 48.5, una varianza muestra de (36 y ua desvgein estndar muestra de 11,66. Qué comparaciones puede hacer entre la ealidad del aire en Pomona y en Anaheim she a base de estos estadsticosdeseripivos? 30. Los siguientes datos se utilizaron para elaborar los histogramas del niimero de das que se re- uiere para que Dawson Supply, Inc. y J.C. Clark Distributors surtan pedidos Figura 3.2. Dias de entrega de Dawson Supply 11:10 «9 «1 11 M10 11 10 10 Dias de entrega de Clark Diswribwors 8 10 13 7 10 M10 7 1S 12 Use el rango y la desviacin estindar para apoyar la observacién anterior de que Dawson Supply proporciona ios tiempos de entrega mis consistentes y confiables. 31. Los resultados de la encuesta mas reciente Workonomix de Accounting Principal indica que ol trabajador estadounidense promedio gasta 1092 délares anuales en café (The Consumerist, 20 de enero de 2012). Para determinar si existen diferencias en los patrones de gasto de café por grupo de edad, se seleccioné una muestra de 10 consumidores en tes grupos de edad (18-34, 35-44 y 45 y mayores). A continuacién se presenta la cantidad de dinero que gasté la muestra de consumidores el afo pasado. 18.34 35-44 45 and Older 1355 969 1135 us 434 956 1456 192 400 2045 1500 1374 1621 277 10a 994 1056 825 1937 1922 163 1200 1350 1192 1567 1586 1305 1390 11s 1510 4) Calcule la media, 1a varianza y la desviaci6n estindar de cada una de las res muestra, 5) {Qué observaciones puede realizar con base en estos datos? 32, La Federacién Nacional de Minorstas inform6 que los estudiantes universitarios de primer allo gastan més en articulos de regreso a clases que cualquier otro grupo universitario (USA Today, 4 de agosto de 2006). El archivo BackToSchool contiene una base de datos mucstra- les que compara los gastos de regreso a clases de 25 estudiantes de primer afio y 20 del dl- timo aio. 4) {Cudlesel gasto medio de regreso a clases de cada grupo? {Los datos son consistentes con el informe de 1a Federacién Nacional de Minoristas? ) {Cufl es el rango de los gastos de cada grupo? ©) {Cual es el rango intercuartflico para cada grupo? ) {Cuil es la desviacién estindar de los gastos de cada grupo? ©) {Qué gasios de regreso a clases muestran mds variacidn: los de los estudiantes de primer ao 0 Ios de los universtarios de sltimo aio? 33. Las puntuaciones anotadas por un golfista amateur en el campo de golf de Bonita Fairways, en Bonita Springs, Florida, durante 2011 y 2012 son los siguientes: Temporada2011 748 Temporada20120 1S STD PB, iM — 3.3. Medidas de a forma de lo dsribucion, poscion relative y deteccién de observacones.... 123 44) Uiilice a media y la desviacion estindar para evaluar el desempefio del golfista durante el periodo de dos aos b) {Cuil es la principal diferencia en su desempeiio entre 2005 y 2006? ;Qué mejora, sila hay, puede verse en las puntuaciones de 2006 24. Los corredores de un equipo universitario de atltismo registraron los siguientes tiempos para las carreras de cusrto de milla y de milla (los tiempos estén en minutos) Tiempos de cuarto de milla 0.92 098 1.04 090 099 Tiempos de milla 452 435 460 4704.50 Después de ver esta muestra de tiempos, uno de los entrenadores coment6 que los corredores de cuarto de milla regisraron tiempos més consistentes. Utilice la desviacién estindar y el Coeficiente de variacién para resumir la variabilidad de los datos. EI uso del coeficiente de ‘variacién indica que el comentario del entrenador es correcto? Medidas de la forma de la distribucién, posicion relativa y deteccién de observaciones atipicas ‘Se han descrito varias medidas de posicién y variabilidad para los datos. Ademas de Estas, es importante tener una medida de la forma de la distribucién. En el capitulo 2 se vio que un his- {tograma proporciona una representacién gréfica de la forma de una distribucién. Una medida numérica importante de la forma de una distribucién es el sesgo. Forma de la distribucién En la figura 3.3 aparecen cuatro histogramas elaborados a partir de distribuciones de frecuen- cia relativa, Los histogramas A y B estin moderadamente sesgados. El A esté sesgado a la i2- uierda: su sesgo es —0.85, EIB esté sesgado a la derecha; su sesgo es +0.85. El histograma C 5 simétrico; su sesgo es cero, El D estd muy sesgado ala derechs:; su sesgo es 1.62. La formula ‘empleada para calcular el sesgo es un tanto compleja' Sin embargo, éste se obtene fécilmentc utilizando software para estadistca. Para datos sesgados @ la izquierda, el sesgo es negativo: para datos sesgados a la derecha, el sesgo es positivo, Si los datos son simétricos, el sesgo es En una distribuciGn simétrca, la media y la mediana son iguales. Cuando los datos estén sesgados positivamente, la media por lo general seré mayor que la mediana: cuando estén sesge- dos negativamente, la media serd menor que la mediana. Los datos que se usaron para construir el histograma D corresponden a las compras de los clientes de una tienda de ropa femenina El monto medio de compra es $77.60 y la mediana del monto de compra es $59.70. Los pocos ‘montos de compra grandes tienden @ inerementar la media, mientras que & ln mediana no le afectan, Cuando los datos estén muy sesgados, se prefiere la mediana como medida de posicién, Valor z Ademiés de las medidas de posicién, variabilidad y forma, también interesa la posicién relativa de los valores dentro de un conjunto o banco de datos. Las medidas de posicién relativa ayudan ‘adeterminar a qué distancia de In media se encuentra un valor determinado. Ta femula paral sasg de datos muosrles es: seme = Gas w Ul 124 Copitvle 3. Estadistin deseripiva: Mes FIGURA 3.3 Histogramas que muestran el sesgo de cuatro distribuciones ‘Histograma A: moderadamente Histograma B: moderadamente sesgado ala izquierda sesgado a la derecha, ‘Sesgo = -085 Sesgo = 085 035 ni 035 . 03 03 02st 028 oF 02 ash os on 0s 00s 0 ° Histograma C: simétrico Histograma D: muy sesgado a la derecha ono Sesgo = 1.82 03 re oa ‘i im 03s 03 oe 025 oust. 02| ag os on 00s ae o ° ‘A partir de la media y la desviacién estindar se puede determinar la posicién relativa de cualquier observacién, Suponga que se tiene una muestra de n observaciones, con los valores. denotados por x,,.15,..,%,- Asimismo, suponga que la media muestra, F, y la desviacién es ‘ndar muestra, s, ya se caleularon, Asociado con cada valor, x, hay otro valor llamado val La ecuacién (3.11) muestra cémo se calcula la puntuaci6n z para cada.x, VALOR z (3.11) donde valor z para x, media muestral ss = desviaci6n esténdar muestral 3.9 Medidas de la forma de la dishibucién, posicién relative y deteccién de observaciones.... 125 TABLA 3.5 Valores de los datos de tamafios del grupo de estudiantes Niimero de Desviacin respecto Valorz estudiantes en dela media xo el grupo (x) @ - 2 ¥ 46 2 2e= 025 s4 0 los = 1.25 2 2 218 = -025 46 2 2B= 025 2 “12 128 = 150 EL valor z se llama valor estandarizado, El valor z, 2, puede interpretarse como el niimero de desviaciones estindar que x, se encuentra de la media X. Por ejemplo, z, = 1.2 indicaria ue x; es 1.2 desviaciones estindar mayor que la media muestral. De modo similar, z= —0.5 indicaria que x3 es 0.5, 0 1/2 desviaciones estindar menor que la media muestral. Un valor z -mayor que cero ocurre para abservaciones con un valor mayor que la media, y un valor z me- nor que cero ocurre para observaciones con un valor menor que la media. Un valor z de cero indica que el valor de la observacién es igual a la media, El valor z para cualquier observacién puede interpretarse como una medida de la posicién relativa de la observacién en un conjunto de datos. Por lo tanto, se dice que las abservaciones ‘de dos conjuntos de datos diferentes con el mismo valor z tienen la misma posicién relativa en términos de que presentan igual nimero de desviaciones estindar de la media, Elprocesopara convertir Los valores z para los datos de los tamatios de grupo se calculan en la tabla 3.5. Recuerde elvelordeuna veriahleen Ja media muestal previamente calculada, X = 44, y la desviacién esténdar muestra, = 8. ansformacion FIGURA 3.4 Diagrama de puntos con los valores El valor z de — 1,50 de la quinta observacién indica que éstaes la mis alejada de la media: ests 1.50 desviaciones estindar por debajo de la media. La figura 3.4 muestra un diagrama de puntos: de los datos del tamafio de los grupos de estudiantes con una representaciGn grifica asociada ccon los valores zen el eje inferior. Teorema de Chebyshev El teorema de Chebyshev permite hacer afirmaciones acerca de Ia proporcién de los valo- res de datos que deben estar dentro de un niimero especifico de desviaciones esténdar de la media. para los tamafos de los grupos de estudiantes 126 Bn el teorema de Chebyshev se requiere 2> I: perono ex necesario que zea wn Inimero entero Lavegla emprica se ‘basa en la distribucion de probabilided normal, a cual se estudia ene cptudo 6. Ladistibucién normal se utizaempliamente ‘en todo el libre Copitvlo 3 Estadisica descriptiva: Medides numéricos ‘TEOREMA DE CHEBYSHEV Por lo menos (1 — 1/z*) de los valores de datos debe encontrarse dentro de z desvia- cciones esténdar de la media, donde z es cualquier valor mayor que |. A continuacién se mencionan algunas implicaciones de este teorema cuando

You might also like