You are on page 1of 89
Octava Edicién ESTADISTICA ELEMENTAL John E. Freund Arizona State University Gary A. Simon New York University TRADUCCION JOSE JULIAN DIAZ DIAZ Traductor REVISION TECNICA MARCIAL GIL RICO RICO Ingeniero Civil México» Argentina» Brail + Colombia * Costa Rica + Chile + Eeuador Espata + Guatemala» Panam + Pera * Puerto Ricp + Uryguay ¢Vemézuela 040220 COLEF BIBLIOTECA INTRODUCCION 1.1 El crecimiento de la estadistica moderna 2 1.2 Elestudio de la estadistica 3 1.3 Estadistica descriptiva e inferencia estadistica 5 1.4 La naturaleza de los datos estadisticos * 7 1.5 Revisi6n de términos clave 10 1.6 Ejercicios de revisién 10 17 Referencias 11 2 ‘car. TRODUCCION La recopilacién, el proceso, la interpretacién y la presentacién de los datos numéricos pertenece al dominio de la estadistica. Estas tareas comprenden el célculo de los pro- medios de bateo de beisbol, la recopilacién de datos sobre nacimientos y muertes, la evaluaci6n de la efectividad de productos comerciales y el pronéstico del tiempo. La in- formacién estadistica se nos presenta constantemente en la radio y a television. Nues- {ro entusiasmo por los hechos estadisticos se ve alentado por diarios nacionales, tales como The Wall Street Journal y USA Today. La palabra “estadistica’ se usa de varias maneras. Se puede referir no s6lo a la simple tabulacién de informacién numérica, como en los informes de las transacciones bursatiles, sino también al conjunto de técnicas que se utilizan en el procesamiento 0 el andlisis de datos. ‘También el término “estadista" se usa de varias maneras. Eltérmino se puede api cara quienes simplemente recopilan informacion, asi como a aquellos que elaboran anélisis 0 interpretaciones y también a los académicos que desarrollan la teoria mate- matica sobre la cual se basa la estadistica. En las secciones 1.1 y 1.2 estudiamos el crecimiento reciente de la estadistica y ‘su campo de aplicaciones siempre creciente, En la seccién 1.3 explicamos la diferencia ‘entre las dos ramas principales de la estadistica, la estadistica descriptiva y la inferen- cia estadistica y en la seccién 1.4, que es opcional, analizamos la naturaleza de las di- versas clases de datos y en relaci6n con esto, advertimos al lector acerca del uso del tratamiento matematico indiscriminado de los datos estadisticos. 1 EL CRECIMIENTO DE LA ESTADISTICA MODERNA Hay varias razones por las que el alcance de la estadistica y a necesidad de estudiar la cstadistica han crecido de manera considerable en los tiltimos quince alos 0 algo asf Una razén es el planteamiento cuantitativo que se usa en forma creciente en todas las Ciencias, asf como en los negocios y muchas otras actividades que afectan nuestras vi ddas de modo directo. Esto incluye el uso de técnicas matemiéticas en la evaluacién de sistemas de control de emisin de contaminantes, la planificacién de las existencias, el ‘andlisis de los patrones del trinsito, el estudio de los efectos de varias clases de medi ‘camentos, la evaluacién de técnicas de ensefianza, el anslisis del comportamiento com- petitivo de empresarios y gobiernos, el estudio de la dieta y la longevidad y demas ac- tividades pertinentes. La disponibilidad de computadoras poderosas ha incrementado cen gran medida nuestra capacidad para manejarinformacién numérica, El costo de mu- cchas computadoras también es accesible, de modo que pequefias empresas, estudiantes universitarios y aun bachilleres pueden efectuar un trabajo estadfstico sofisticado. La otra raz6n es que la cantidad de datos que se recopila, procesa y difunde al pi- blico poralgiin motivo se ha incrementado casi masallé de la comprensi6n y cada quien debe determinar la parte “buena” y Ia parte “mala” de la estadistica, Para actuar como vigilantes, se requiere que cada vez mis personas con cierto conocimientoestadistico participen en forma activa en la recopilaciGn y el audlisis de los datos y, lo que es de igual importancia, en toda la planificacién preiiininar. Sin haber participado en esta tl- tima actividad, es aterrador pensar en todos los aspectos que pueden presentar proble- mas en la recopilacién de datos estadisticos. Los resultados de costosas encuestas pue- EJEMPLO Solucién EJEMPLO Solucién den ser ittiles si las preguntas son ambiguas ose formulan errSneamente, si se formu: Jan a las personas equivocadas, en el lugar oel momento equivocado. Como lo ilustran Jos ejemplos siguientes, gran parte de esto consiste tan sélo en el sentido comin: Para determinar la opiniérdel pablico acerca de la continuacién de cierto programa gu- bernamental, un entrevistador pregunta: “Piensa que este programa derrochador se deberfa detener?” Explique por qué esta pregunta quiz4 no obtendré la informacion de- seada, De hecho, el entrevistador esté “rogando por la pregunta” a sugerir que el programa in- ccurre en el dispendio. Para estudiar la reaccién de los consumidores en relacién con un nuevo producto ali- ‘menticio, se realiza una encuesta casa por casa todos los dias durante las mafianas, sin repetir la visita en caso que nadie se encuentre en casa. Explique por qué esto puede ge- nerar informacién equivocada, Esta encuesta no Hlegard a aquellas personas que es més probable usen el producto: sol- teros y parejas de casados en las que ambos trabajan. Si bien gran parte del crecimiento de la estadistica al que se hizo mencién comen- 26 antes de la “revolucién de las computadoras”, la amplia disponibilidad y el uso de Ja computadora han acelerado el proceso en gran medida. En particular, las computa- doras nos permiten manejar, analizary clasificar grandes cantidades de datos, asi como realizar cdlculos que en el pasado parecfan demasiado complicados inclusive para ob- servarlos, El objetivo de este libro ser que usted comprenda las ideas de la estadistica. Para ésta, el acceso a la computadora no es crucial. A veces, en el texto se ilustran los uusos de la computadora, pero casi todos los ejercicios pueden realizarse s6lo con una calculadora de cuatro funciones, 12 EL ESTUDIO DE LA ESTADISTICA ‘La materia de la estadistica puede presentarse en diferentes niveles de dificultad mate- ‘matica y puede estar dirigida hacia aplicaciones en distintos campos de la investiga- cidn, De acuerdo con esto, se han escrito muchos libros de texto sobre estadistica empresarial, estadistica educativa, estadistica médica, estadistica psicol6gica,...,e in- clusive sobre estadistica para historiadores. Si bien los problemas que surgen en estas distintas disciplinas en ocasiones requerirdn de técnicas estadisticas especiales, ninguno de los métodos basicos que se analizan en este libro esta limitado a un campo de apli- caciénen particular, De la misma forma en que 2+2= 4 sin importar silo que sumamos son délares, caballos o drboles, Los métodos que presentaremos proporcionan modelos ‘estadisticos que se aplican sin importar silos datos son coeficientes intelectuales, pa- ‘208 de impuestos, tiempos de reaccidn, lecturas de la humedad, evaluacién de pruebas, SEC.12 / ELESTUDIODELAESTADISTICA 3 4 ‘cap. / BNTRODUCCION eteétera, Para ilustrar mejor esto, considere el ejercicio 13.96 de la pégina 379, que ela- bors el autor. 13,96 En una muestra aleatoria de 200 personas jubiladas, 137 afirmaron que prefieren vivir en un departamento que vivir en una casa unfamiliar. En el hivel 0.05 de significancia, zest refuta la aseveracidn de que el 60% de todas las personas jubiladas prefieren vivir en un departamento que en una casa unifamiliar? puesta serfa interesante sobre todo para los cientificos sociales o para personas de la in- {lusria de la construcci6n, Sin embargo, si quisiéramos satisfacer los intereses de estu- diantes de biolog(a, ingenieria, educdcién oecologt, tendrfamos que replantearel eer- La pregunta que se plantea au‘ deberfa ser clara y también deberia serlo que la res- cicio como sigue: 13.96 En una muestra aleatoria de 200 Arboles de cftricos expuestos a una tempe- ratura de — 6.66", 137 mostraron dafios en sus frutos. En el nivel 0.05 de significancia, esto refuta la aseveraciGn de que el 60% de todos los érboles de citricos expuestos a una temperatura de ~6.66° presentarén algin daio en sus frutos? 13.96 En una muestra aleatoria de 200 transstores producidos por un fabricante 1 0 que 2.< 4 y no podemos expresar que 2-1 = 4-3, que 1+3=40 que 4+2=2, de ahi que siempre es importante verificar si los célculos mateméticos efectuados en un andlisis estadistico en realidad son legitimos. ‘Ahora consideremos algunos ejemplos en que los datos comparten algunas, pero no necesariamente todas las propiedades de los nmeros que manejamos con Ia aritmé- tica ordinaria, Por ejemplo, en mineralogta, la dureza de los s6lidos se determina me- diante la observacién de “qué raya qué”. Si un mineral puede rayar otro, éte recibe un niimero de dureza més alto y en Ia escala de Mohs, los nmeros det 1 al 10 se asignan al talco, el yeso, la calcita, la fluorita, la apatita, el feldespato, el cuarzo, el topacio, el zafiro y el diamante. Con estos niimeros podemos expresar que 6 > 3, por ejemplo, © que 7 <9, yaque el feldespato es mas duro que la calcita y el cuarzo es més suave que el zafiro. Por otro lado, no podemos expresar que 10 9 = 2 ~ 1, por ejemplo, porque la diferencia entre el diamante y el zafiro en realidad es mucho més grande que la di- ferencia entre el yeso y el talco. Asi mismo, no seria significativo indicar que el topacio dos veces mas duro que la fluorita simplemente porque sus nimeros de dureza res- pectiva en la escala Mohs son de 8 y 4. Sino podemos hacer nada mas que determinar desigualdades, como fue el casoen el ejemplo anterior, nos referimos a los datos ordinales. En relacién con los datos or- dinales, > no significa necesariamente “mayor que”; Se puede usar para denotar con- ‘mis dificil que”, "més sabroso que” y ceptos como “més feliz que”, “preferible que”, demis, ‘Como se expicéenetprefacio todas las secciones marcadas con el simbolo son opeionals. Aunque el material de esta seceiénpretende servir como una advertencia en contra del teataniento matemtico indi criminado de los datos estadistcos, es de mayor importanca para los estudiantes dela ciencias del compor- tamiento sociales, donde lasescalasatfcialssirven pra medi, digamos, tendencias de neurosis, felicidad ‘© conformidad con ls normas sociales SEC. 14 J LANATURALEZA DELOS DATOS ESTADISTICOS. 7 ccap.1 1 yTRODUCCION Si también podemos determinar diferencias, pero no podemos multiplicar o di nos referimos a los datos como datos de intervalo, Para dar un ejemplo, suponga ‘que se nos dan las lecturas de temperatura siguientes en grados Fahrenheit: 63°, 68°, 91°, 107°, 126° y 131°. Aqui, podemos expresar que 107° > 68° 091° < 131°, que sim- plemente significa que 107° es més célido que 68° y que 91° es mas frio que 131°. Del mismo modo, podemos expresar que 68° — 63° = 131° ~ 126°, ya que las diferencias de temperatura iguales son iguales en el sentido de que se requiere de la misma cantidad de calor para aumentar la temperatura de un objeto de 63° a 68° al igual que de 126° a 131°. Por otro lado, no serfa muy significativo expresar que 126° es el doble de célido de 63°, aunque 126° + 63° = 2, Para demostrar por qué, s6lo tenemos que convertir a ‘grados Celsius, donde la primera temperatura se convierte en $(126-32)=52.2°, lase- ‘gunda temperatura se convierte en $(63 ~ 32) = 17.2°, y demostrar que la primera ci fra ahora es de mas de tres veces de la segunda. Esta dificultad surge porque las escalas Fahrenheit y Celsius tienen origen (cero) artificial; en otras palabras el nfimero cero de ninguna escala indica la ausencia de cualquier cantidad que intentemos medir. ‘Sitambién podemos formar cocientes, nos referimos a los datos como datos racio- nales y no es dificil obtener tales datos. Estos incluyen todas las medidas (o determina- ciones) comunes de longitud, altura, cantidades de dinero, peso, volumen, rea presiGn, tiempo transcurrido (aunque noel tiempo calendario), intensidad del sonido, densidad, brillo, velocidad y demés. La diferencia que hemos hecho aqui entre datos nominales, de intervalo y raciona- les es importante, ya que como apreciaremos, la naturaleza de un conjunto de datos puede sugerirel uso de técnicas estadisticas particulares. Para enfatizarel punto de que lo que podemos y lo que no podemos hacer aritméticamente con un conjunto de datos determinado depende de la naturaleza de los datos, considere las siguientes calificacio- nes obtenidas por cuatro estudiantes en las tres partes de una prueba de historia com- pleta Historia de Historia de Historia América Europa antigua Linda 89 st 40 Tom 6 56 s4 Henry 40 0 5s Rose B 1 n Los totales de los cuatro estudiantes son de 180, 171,165 y 162, de modo que Linda ob- tuvo la calificacién més alta, seguida por Tom, Henry y Rose. ‘Ahora suponga que alguien propone que comparemos el rendimiento total de los, ‘cuatro estudiantes clasificando sus calificaciones de altas a bajas para cada parte de la, prueba promediando luego sus clasificaciones. Lo que obtenemos aparece en la tabla siguiente Historiade Historiade Historia Rago ‘América Europa antigua _—_promedio Linda 1 4 4 3 Tom 2 3 3 4 Henry 3 2 2 a Rose 4 1 1 444_9 ‘Aqui, la clasificacién del promedio de Linda se caleulé como 1+ 4* 24+343_8 3 3 Ahora, si observamos el rango promedio, encontramos que Rose resulté ser la me- jor, seguida por Henry, Tom y Linda, de modo que el orden es el inverso del anterior. {,Cémo es esto posible? Bien, pueden suceder cosas raras cuando promediamos rangos. Por ejemplo, cuando se trata de sus rangos, el excedente de 28 puntos de Linda sobre ‘Tom en historia de América cuenta tanto como el excedente de Tom de 5 puntos en his- toria de Europa y el excedente de Tom sobre Henry de 21 puntos en historia de América cuenta tanto como el excedente de Henry sobre él por un solo punto en historia antigua. Concluimos que, tal vez, no deberiamos haber promediado sus rangos sino que también se podria sefialar que ni siquiera deberiamos haber totalizado las calificaciones origi- nales. La variacin de las calificaciones en historia de América que van de 13 a 89 es ‘mucho mis alta que lade las otras dos clases de calificaciones y esto afectaen gran me- dida las calificaciones totales y sugiere un resultado imperfecto del procedimiento. No ‘alo o racionales? Explique sus respuesta. 15 REVISION DE TERMINOS CLAVE* (con referencias de pégina a sus definiciones) Analisis exploratorio de datos, 6 xDatos de intervalo, 8 Datos nominales, 7 Datos ordinales, 7 ‘xDatos racionales, 8 16 EJERCICIOS DE REVISION+ 1.13 El boletaje pagado para asistr alos juegos de futbol en, casa de una pequeiia universidad fue de 12,305, 10,984, 6,850, 11,733 y 10,641. ,A cual de las siguientes conclu- siones se puede legar a partir de estas cifras por medio de ‘métodos meramente descriptivos y que requieren de ge- neralizaciones? Explique sus respuesta. (a) Nameros de seguridad social (b) El mimero de pasajeros que viajan en autobis de Los Angeles a San Diego. (©) Clasificaciones del interés vocacional, consistentes ‘ene niimero total de respuestas de "sf" para un con. junto de preguntas, si se puede suponer que cada respuesta de “s{” representa el mismo incremento del interés vocacional (@) Grados militares. Las clasificaciones del coeficiente intelectual en ocasio- res se consideran como datos de intervalo. Qué suposi- ‘cin implicarfa esto acerca de las diferencias de la inteli- ‘encia de tres personas con coeficientes intelectuaes de 95, 105 y 135? .Es logica esta suposici6n? +L 41.12. E> lapigina8 indicamos que los datos que pertenecen al tiempo calendario (por ejemplo, los aos en que el equipo de futbol dela Armada derrota al dela Marina) no son da- tos racionales. Explique por qué. ; Qué tipo de medidas temporales constituyen los datos racionales? Estadistica descriptiva, 5 Inferencia estadistica, 6 Modelos estadisticos, 3 Teorfa de la probabilidad, 6 (2) La asistencia al tercer partido en casa fue baja por- que ovis, (b) Entre os cinco juegos, el boletaje pagado fue mas alto en el primer partido. (©) El boletaje pagado supers los 11,000 en dos de los cinco juegos. ‘Los txminos qu se han seal comelsfmbolo s forman parte del material opcional ‘Los ejercicios de revisién marcados con el simbolo + pertenecen al material opciona 10 canis INTRODUCCION (8) Elbotetae pagado se inerement6 del tercer al cuat- to partido en casa porque el equipo de futbol de la universidad habia estado ganando, ‘#114 {Los datos siguientes son nominales, ordinals, de inter- Valo 0 racionales? Explique sus respuestas. (a) Elevaciones sobre el nivel del mar (b) Respuestas ala pregunta de si (en el rea del centro de una ciudad grande) las condiciones de vida "es- ‘tin empeorando mucho”, “estin empeorando un poco”, “permanecen igual”, “estin mejorando un poco” 0 “estin mejorando mucho”, (©) Antigdedad de automéviles usados. (@) Respuestas de las licencias para conductores en re- lacién con el color de ojos. 1.15. Explique por qué cada uno de los datos siguientes bien podria fracasar para proporcionar la informacién deseada: (@) Para pronosticar una eleccién municipal, un en- cuestador de opinin pdblica hace preguntas a las personas que caminan frente a la oficina de gobier- ‘no municipal. (b) Paradeterminar la opinin del pablico sobre ciertas. restricciones a las importaciones, un entrevistador pregunta alos electores: ",Cree que a los consumi- dores norteamericanos se les deberia negar el uso de estos productos?" 41.16 Silos estudiantes calculan sus indices de puntuacién de calificaciones (esto es, el promedio de sus calificaciones) contando A, B,C, Dy F como 4, 3,2, 1 y 0, qué implica esto acerca de la naturaleza de las calificaciones? 1.17 Explique por qué cada uno de los datos siguientes bien ppodrfa fracasar para proporcionar la informacién desea- da: (@) Para conocer Ia opinién del piblico en cuanto alas 17 REFERENCIAS Se pueden encontrar andlisis breves e informales sobre lo que es la estadis importaciones de India, e pregunta a personas se- leccionadas si les agrada el arte hinds, (b) Para valorar los hechos relacionados con los hibi- tos de bao, a una muestra de los ciudadanos de un pais europeo se le pregunta cudntas veces en pro- ‘medio se bafian a la semana. 1.18 Usando el mismo modelo de automévil, cinco conducto- res promediaron 9.95, 9.57, 10.2, 9.95 y 9.65 kil6metros por ltr. A cud de las siguientes conclusiones se puede Iegara partir de estas cifras por medio de métodos mera- ‘mente descriptivos y que requieren de generalizaciones? Explique sus respuestas (a) Con mayor frecuencia que ninguna de las otras ci- fras, los conductores promediaron 9.95 kil6metros Por litro. (b) Con mayor frecuencia que ninguna de las otras. {ras los conductores de este tipo de automevil pro- ‘mediaron 9.95 kilémettos por litt. (©) Ninguno de los promedios difiere de 9.99 por mas de 1.6093 kilémetros. (B) Sise repite el experimento completo, ninguno de los conductores promediard menos de 9.57 ni mis de 10.41 kilmetros por itr. 41.19 En dos torneos de golf de Ia liga mayor, un golfista pro- fesional terminé en el segundo y el noveno lugar, en tanto {que otro terminé en el sextoy el quinto, Comente sobre el argumento de que como 2 +9 = 6+5, el rendimiento total de los dos golfstas en estos dos torneos fue igualmente bueno, 1.20 _Replantee el ejercicio al que nos referimos en la pigina 4 cde manera que sea de especial interés para (a) un abogado; (b) um agente de viajes; (©) unautor. -ayloque hacen los estadistas en los panfletos titulados Careers in Statistics y Statistics asa Ca- reer: Women at Work, publicados por la American Statistical Association, Se pueden obtener escribiendo a esta organizacién a 1429 Duke Street, Alexandria, VA, 22314. Entre los pocos libros sobre la historia de laestadistica, en el nivel elemental, tenemos WALKER H.M., Studies inthe History of Statistical Method. Baltimore: The Williams & Wit- kins Company, 1929. SEC.17 1 REFERENCIAS 14 2 ccaP.1. J INTRODUCCION y enel nivel ms avanzado PEARSON E. S. y KENDALL, M. G.,editores, Studies in the History of Statistics and Prob- ability. Nueva York: Hafner Press, 1970. KENDALL, M.G. y PLACKET, R.L., editores, Studies in the History of Statistics and Prob- ability, Vol. I, Nueva York: Macmillan Publishing Co., Inc., 1977. : SmIGLER, S. M., The History of Statistics. Cambridge, Mass.: Harvard University Press, 1986. Un anélisis més detallado de la naturaleza de los datos estadisticos y el problema ge- neral de la escala (en particular, el problema de la construccién de escalas de medicién) se puede encontrar en Hi.peBrAND, D. K., LAING, .D. y ROSENTHAL, HL, Analysis of Ordinal Data, Beverly Hill, Calif: Sage Publications, Inc., 1977 REYNOLDS, H. T, Analysis of Nominal Data, Beverly Hills, Cali 1977. ‘SiecEt, S., Nonparametric Statistics for the Behavioral Sciences. Nueva York: McGraw-Hill ‘Book Company, 1956. ‘Sage Publications, Inc., Los siguientes son algunos titulos de la lista siempre creciente de libros sobre estadis- ticaeseritos para los principiantes. BROOK, R. J, ARNOLD, G. C., HASSARD, T. H. y PRINGLE, R. M.,editores, The Fascination ‘of Statistics. Nueva York: Marcel Dekker, Inc. 1986. CAMPBELL, S.K., Flaws and Fallacies in Statistical Thinking. Englewood, Cliffs, N. J: Pren- tice-Hall, Ine. 1974 HOLLANDER, M. y PROSCHAN, F., The Statistical Exorcist: Dispelling Statistics Anxiety. ‘Nueva York: Marcel Dekker, Inc., 1984 Hooke, R., How to Tell the Liars from the Statisticians. Nueva York: Marcel Dekker, Inc., 1983. Kime, G. A., How to Use (and Misuse) Statistics. Englewood Cliffs, N..: Prentice-Hall, Inc., 1978. Larsen, R.J.y STROUP, D. F., Statistics in the Real World. Nueva York: Macmillan Publis- hing Co., Inc., 1976. RUNYON, RP., Winning with Statistics. Reading, Mass.: Addison-Wesley Publishing Com- pany, Inc., 1977. ‘Tana, J.M. editor, Statistics: A Guide to the Unknown, San Francisco: Holden-Day, Inc., 1972. RESUMEN DE DATOS: DISTRIBUCION DE LA FRECUENCIA “4 En afos recites, a recoplaciin de datos estadistcos se ha incrementado con una tasa tal que seria imposible mantenerse al dia siquiera con una pequefia parte de los factores quo afecan drectamente nuestas vidas, a menos de que se difunda esta informacién en una forma “digrida’o resumida, La actividad de agrupar grandes can- tidades de datos en una forma uti siempre ha sido imporiante, pero en las ulimas décadas esta actividad se ha mulipicado en gran medida En part, esto ha sido con- secvencia del desarrollo de compuladoras que ahora permitan efectuar on minutos ac. tvidades quo antes se evtaban porque habrian requerido de meses oafosy en parte son resultado dela multud de datos generados por el planteamiento cada vez més cuanttatvo dela clencas, en especial de las cioncias del comportamientoy las soca- tes, donde casitodos los aspectos de a vida humana ena actualdad se miden de una ota manera Elmélodo de resumen de datos mas coman consste en su presentacién en forma condensada en tablaso gréficasy en algun momento esto consuy la mejor pate de Un curso elemental de estadistic, Hoy en dla, hay tanto més que aprender sobre es- tadistica, que se dedica muy poco tiempo a este tipo de trabajo. En cierto modo, esto 8 desafortunado porque no se necesita buscar con detenimiento«n dari, revistas y aun en publcaciones perédicas profesional para encontrar gréficas estadistias que ton intenionslmente engafosas La seccién 2.1 abordala area del istado de valores numércos y presenta una téc- nica nueva, la exposiciin de troncoy hoje. La seccién 22 estucia las distribuciones de ta frecuencia, elmétodo esténdar para a agrupacion de datos La secciin 2.3 presenta algunos métodos géficos 24 LISTA DE VALORES NUMERICOS La organizacién y la presentacién de un conjunto de informacién numérica es una de las primeras tareas para comprender un problema. Como una situacién tipica, conside- re los valores que aparecen en seguida, los cuales representan el tiempo del trayecto al trabajo de 100 empleados de un gran edificio de oficinas ubicado en el centro. Los tiempos se dan en minutos y cada valor representa el tiempo promedio de un empleado encinco dfas de trabajo consecutivos. La simple recopilacién de esta informacién no ‘es una tarea sencilla, pero es evidente que se debe hacer més para que los niimeros sean comprensibles. 440 354 284 370 460 354 194 204 S64 432 362 384 492 318 864 126 274 140 394 394 158 288 380 440 384 740 230 114 398 302 292 406 496 304 122 1238 420 470 324 392 352 S64 310 450 902 1000 390 370 494 282 126 220 478 526 410 400 280 236 376 378 300 458 180 410 226 242 896 904 430 298 562 248 126 536 1254 162 390 408 336 394 456 374 180 506 1034 524 202 646 222 600 422 420 162 1082 480 426 394 376 414 404 CCAP.2. / RESUMEN DE DATOS: DISTRIBUCION DE LA FRECUENCIA {Qué se puede hacer para que esta informacién sea mas préctica? Algunas personas en- ‘cuentran interesante identificar los valores extremos. Para esta lista, el valor més bajo es de 11.4 minutos y el més alto es de 125.4 mi nutos. En ocasiones, es itil ordenar los valores de los datos en orden de creciente a de- reciente. La lista que se presenta a continuacién da estos valores ordenados y ahora es posible saber més acerca de los tiempos de trayecto. Por ejemplo, ahora vemos que hay ‘muchos valores que se aproximan a 40 minutos. 114 122 126 126 126 140 158 162 162 180 180 194 202 204 222 226 230 236 242 248 270 274 280 282 284 2S 29.2 298 300 302 304 31.0 M8 324 336 352 354 354 362 370 370 374 376 376 378 380 384 384 390 390 392 304 394 394 304 398 400 404 406 408 410 41.0 414 420 420 422 426 430 432 440 440 440 450 456 458 460 470 478 492 494 49.6 506 S24 526 S36 562 564 S64 600 646 TAO 864 896 90.2 904 1000 1034 1082 1238 1254 ‘Ordenar un conjunto numeroso de datos en forma creciente o decreciente es una labor sorprendentemente difcil Esta lista de niimeros, aun en su forma ordenada, sigue siendo una vasta pieza de informacién, Sera itil contar con otras formas de manejar estos valores. Una técnica desarrollada hace poco, la grafiea de tronco y hoja, brindaré una buena impresi6n to- tal de los datos. Para ilustrar esta técnica, considere las siguientes calificaciones en una prueba de coordinacién fisica aplicada a 20 estudiantes que habfan ingerido una cantidad de al- cohol equivalente a 0.1% de su peso: 69 84 52 93 61 74 79 65 88 63 57 64 67 72 74 55 82 61 68 77 Ahora divida cada niimero en sus decenas y unidades, disponiendo juntos los valores ‘que comparten las decenas. Esto es, pensaremos en el ntimero 69 como en 6 | 9. En- tonces las decenas se dispondrén en forma vertical con unidades dispuestas al lado, Para el conjunto de las 20 calificaciones de coordinacicn fisica, la gréfica es ésta: El primer renglén de la gréfica, expresamente 5 | 2 7 5,nos indica que la lista con-* tiene los valores de 52, 57 y 55. El segundo renglén nos indica que la lista contiene ocho valores de la decena de los 60. Esta tabla se conoce como una representacin grifica de tronco y hoja porque cada renglén representa una posicién de tronco y cada dfgito a la derecha de Ia linea vertical se puede considerar como una hoja. Para hacer esta grfica de tronco y hoja, comience s6lo con los troncos, de la siguiente manera: SEC.21 / LISTADE VALORES NUMERICOS. 15 16 Con todo, este paso no tiene que ser perfecto, es fécil disponer posiciones de tronco adi- cionales en la parte superior o en Ia inferior. Luego, marque las hojas por elementos de datos individuales en orden consecutivo. Después de los tres primeros valores (69, 84, 52), la grfica de tronco y hoja luciré a 5 6 1 8 9 La gréfica de tronco y hoja estaré completa después de efectuar s6lo un paso.con los da- tos. La grfica de tronco y hoja contiene la misma informacién que la lista original, pero es mucho més compacta. La gréfica de tronco y hoja destaca, os aspectos impor- tantes de los datos. Por ejemplo, en este caso revela de inmediato que la mayorfa de los datos pertenece al orden de los 60. La grfica de tronco y hoja desarrolla la mayor parte dela tarea de clasificacion de los valores. A la mayoria de la gente le agrada completar la clasificacién ordenando también las hojas. En este ejemplo, se llega a lo siguiente: s]257 6]/11345789 7)24479 a}248 913 ‘No todos los valores se pueden disponer en una gréfica de tronco y hoja con tanta facilidad. El tratamiento de situaciones més complicadas es una cuesti6n de dit cernimiento. Consideremos los 100 tiempos de trayecto antes seftalados. Estos ntime- 10s se dieron con décimas de minuto. Al realizar la gréfica de tronco y hoja, més que redondear los valores al minuto més cercano, recomendamos que se ignoren las dé ‘mas. Este introduce un sesgo de medio minuto en la gréfica, pero con casi el mismo.es- fuerzo se produce el mismo resultado tan apropiado como el redondeo.' Usaremos los digitos de las decenas para clasificar el tronco y esto produce la siguiente gréfica: *Descartar mero representa varias ventas durante el proceso de redondeo cuidadosoyéste esl pro- cedimientorecomendado por John Tukey, el inventor de la epresentacin grifica de troncoy ho, Su libro parece en la lista de referencia al final del captuo. CAP.2/- RESUMEN DE DATOS: DISTRIBUCION DE LA FRECUENCIA 122224566889 (0022334477888899 (0001 123555677777788899999999 (0000111222233444555677999 0223666 o4 4 6 9 | 0 10 | 038 n NOTA: 7 | 4 medidas 74 minutos 12 | 35 12 | 3 medidas 123 minutos B Esta grfica de tronco y hoja s6lo requiere una revisiGn de la lista original. Se pueden ordenar las hojas. De hecho, esta gréfica comunica el mensaje de la lista original en una forma muy clara en términos gréficos. Es dtil agregar una nota, como lo hicimos, para ayudar al lector de esta gréfica. Esta ciertamente es til cuando los nmeros del tronco no son decenas. La grafica de tronco y hoja se puede modificar de varias formas para satisfacer ne- cesidades particulares. Si queremos elaborar una gréfica de tronco y hoja con mAs tron- os de los que habria de otra manera, podemos dividir en dos cada posicién del tronco. Usamos 1a primera posicién del tronco para disponer las hojas 0, 1, 2,3 y 4 y usamos la segunda posicién para disponer las hojas 5,6, 7,8 y 9. Por tanto, para el segundo gru- po de datos de la pégina 15, obtendrfamos la representaciGn gréfica de doble tronco: Se e 6+ p 1 & 8e 9 Enesta grética, duplicamos el ndmero de posiciones del tronco dividiendo por la mitad el intervalo que cubre cada decena. ‘Asif mismo, en el caso de algunas descripciones més detalladas (véase la secci6n 3.4), es conveniente tener algunas hojas en cada tronco dispuestas por tamafio, comoen Ia figura 2.1, donde usamos una computadora para elaborar la gréfica de tronco y hoja anterior. No estudiaremos las gréficas de tronco y hoja con mayor detalle, ya que nuestro objetivo fue en esencia presentar una de las técnicas relativamente nuevas que forman parte del término general de andlisis exploratorio de datos. Estas técnicas se utilizan sobre todo para anaizar datos sin emplear los métodos mas tradicionales de andisises- tadisticos o antes de aplicar los mismos. SEC.21 / LISTADE VALORES NUMERICNS 17 040230 Maree BIBLIOTECA TY" se 6 R a 3 MtB_ > conguwro ct DATOS > 69 84 52 DaTos > 57 64 67 MIB > TRONCO cL GRAEICA. DE TRONCO 2 57 1is4 5789 244 79 24 H ¥ HOJA DE ct ‘DNEDAD. DE TRONGO Y HOA = 1.998 REPRESENTA 12. 63 7 93 n 61 "4 "4 35 1 82 65 61 88 68 FIGURA 21 Impresin por computadora para la elaboracién de una gréfica de doble tronco, EJERCICIOS 2a 23 18 Las siguientes son las alturas en centimetros de dieciséis, estudiantes de bachillerato: 172, 182, 177, 174, 166, 158, 170, 178, 163, 161, 191, 167, 171,201, 166, 172. Elabore una grafica de tronco y hoja con las clasificaciones de tronco 15, 16, 17, 18, 19 y 20, Los siguientes son los pesos en libras de veintesolicitan- tes de empleo en un departamento de bomberos de la ciu- dad: 225, 182, 194, 210, 205, 172, 181, 198, 164, 176, 180, 193, 178, 193, 208, 186, 183, 170, 186, 188. Elabore tuna gréfica de tronco y hoja con las clasificaciones de tronco 16, 17, 18, 19, 20, 21 y 22. Las siguientes son las ganancias semanales en d6lares de quince vendedores: 425, 440, 610, 518, 324, 482, 624, 390, 468, 457, 509, 561, 482, 480, 520. Elabore una gré- fica de tronco y hoja con ls clasificaciones de tronco 3, 4, 5 6; las decenas se deben usar como hojas. 2.2 24 25 26 labore una lista de los valores de datos que aparecen en la geifica de tronco y hoja siguiente Elabore una grea de doble tronco para los datos del ejercicio 22. Las siguientes son las edades de treinta y dos cabezas de familia de una comunidad de jubilados: 68,81, 62,61, 76, 65, 69, 73, 66, 68, 71, 74, 64, 70, 68, 73, 82, 79,63, 69, (68, 66,73, 74,77, 80, 73,66,67,81,77y 66 alos. Elabore una grifica de doble tronco para estos valores. DISTRIBUCIONES DE LA FRECUENCIA. Cuando manejamos conjuntos cuantiosos de datos, a menudo podemos obtener una GAP.2. /- RESUMEN DE DATOS: DISTRIBUCION DE LA FRECUENCIA SESUuBe buena imagen general y toda la informacin que necesitemos agrupando los datos en un. niimero de clases, intervalos 0 categorfas. Por ejemplo, los datos correspondientes a 1983 sobre el tamafio de los sistemas de televisi6n por cable de Estados Unidos se pue- den resumir como sigue: Nimerode Sistemas de television suscriptores porcable Menos de 1,000 1,000 3,499 3.500 9,999 10:000-19,999 20,000-49,999 50,000 0 més Toul 5.640 Una tabla como ésta se conoce como una distribucién de la frecuencia (0 simple ‘mente como una distribucién); esto demuestra cémo se distribuyen los sistemas de te- levisi6n por cable entre las seis clases. Entonces cuando los datos se agrupan por tama- fios hacemos referencia a una tabla como la anterior como una distribucién numérica (0 cuantitativa). Enel ejemplo de la televisi6n por cable, cada clase cubri6 un amplio rango de va- lores, pero también hay distribuciones numéricas en que la clase cubre s6lo un valor \inico. Esto se ilustra por medio del ejemplo siguiente con base en un estudio en el que se pregunté a 200 personas cudintas veces habfan visitado el z0016gico local durante los doce meses anteriores: Niimero de visitantes Nimero de del zoolégico local personas %0 n % x 3 ° 1 Total — 200 Si se agrupan los datos en categorfas no numéricas, a tabla resultante se conoce como una distribucién categérica (0 cualitativa). Esta clase de aistribuci6n se ilustra mediante la tabla siguiente de 2,439 quejas sobre las caracterfsticas de comodidad de una linea aérea: SEC.22 / DISTRIBUCIONES DE LAFRECUENCIA 19 Niimero de Naturaleza de ta queja quejas —<—<—_—_—_—_——— Espacio insuficiente para Tas piernas 79 Asientos incémodos 914 Pasllos angostos 146 ‘Compartimientos de ‘equipaj insuficientes 218 Sanitarios insuficientes 58 (tras quejas diversas 384 Tora 2.439 Podrfamos convertir una distribucién como ésta en una distribucién numérica codit cando los datos, digamos, asignando a las seis alternativas los nimeros 1, 2, 3,4, 5 y 6, pero esto nos darfa datos nominales, que son numéricos s6lo en un sentido trivial. Las distribuciones de la frecuencia presentan los datos en una forma relativamente compacta, dan una buena imagen en general y contienen informacién adecuada para muchos propésitos, pero por lo general hay algunos factores que no se pueden determi- nar sin referirse alos datos originales. Por ejemplo, a partir de la primera tabla de esta ‘eccidn no podemos encontrar ni el tamafio del més pequefio de los 5,640 sistemas de televisién por cable, ni el promedio de suscriptores de los diez sistemas més grandes. De modo similar, con base en la tercera tabla no podemos indicar el ntimero de quejas sobre asientos ineémodos por la amplitud de los asientos de los mismos 0 el ntimero de ‘quejas por compartimientos de equipaje insuficientes en relacién con el espacio para Jos portatrajes. No obstante, las dstribuciones de la frecuencia presentan datos en bru- to (no procesados) de una manera més prictica y el precio que debemos pagar por esto Ia pérdida de cierta informacién— por lo regular vale la pena. ‘En esencia la claboraciGn de una distribucién de la frecuencia consiste en tres pa- sos: (I) la seleccién de las elases (intervalos 0 categorias), (2) la selecci6n 0 clasifica- Cin de los datos en estas clases y (3) el conteo del ntimero de factores de cada clase. Dado que el segundo y el tercer paso son meramente mecdnicos en este caso debemos ‘concentrarnos, a saber, en el de la seleccién de una clasificacién ideal. Para las distribuciones numéricas, esto consiste en decidir el nimero de clases que se usardn y de qué clase a qué clase se debe ir. Ambas alternativas son en esencia ar- bitrarias, sin embargo por lo comiin se observan las reglas siguientes: Rara vez usamos menos de 6 o mis de 15 clases; el ntimero exacto que tusaremos en una situaci6n determinada dependeré en gran medida del niimero de lecturas u observaciones implicitas. Es evidente que perderiamos més de lo que ganarfamos si agrupéramos cinco observa~ ciones en doce clases con la mayor parte de éstas vacfas y quiz4 descartarfamos mucha informacién si agrupdramos mil lecturas en tres clases. Asegarese siempre de que cada factor (lectura u observacién) perte- nezea a una y sélo una clase. Para concluir, debemos asegurarnos de que los valores inferiores y superiores caigan en 20. cAP.2./-_RESUMEN DE DATOS: DISTRIBUCION DE LA FRECUENCIA EJEMPLO- la clasificacién, que ninguno de los valores caiga en una brecha entre clases sucesivas ¥y que las clases no se traslapen, expresamente, que las clases sucesivas no tengan va- lores en comin. Siempre que es posible hacemos que las clases cubran rangos de valo- res iguales. Del mismo modo, si podemos, disponemos los rangos en miltiplos de ndimeros de ma- nejo fécil, tales como 5, 10 0 100 porque esto tenderé a facilitar Ia elaboracién y el uso de una distribucién, Por lo que respecta a estas reglas, la distribucién dela televisién por cable de la pé- gina 19 satisface las dos primeras, pero viola la tercera. En realidad, la tercera regla se viola de varias maneras, ya que las clases 1,000-3,499, 3,500-9,999, 10,000-19,999 y 20,000-49,999 cubren distintos rangos de valores, la primera clase no tiene ningsin If mite inferior especifico y la dtima clase no tiene ningtin limite superior espectfico. Es probable que los estadisias del gobierno responsables de esta tabla tengan buenas razo- nes para seleccionar las clases como lo hicieron. Nos referimos a las clases de la variedad de “menos de”, “o menos”, “més de” més” como clases abiertas y las usamos para reducir el mimero de clases necesarias cuando algunos de los valores son bastante menores 0 bastante mayores que el resto. Sin embargo, generalmente se deben evitar las clases abiertas, ya que éstas hacen im- posible el célculo de ciertos valores de interés, tales como los promedios o los totales (véase el ejercicio 3.52, pagina 62). En cuanto a la segunda regla, tenemos que observar si los datos se dan al délar 0 al centavo més cercano, si se dan a la pulgada o a la décima de pulgada més cercana, la onza o al céntimo de onza més cercano y asf, dependiendo el caso. Por ejemplo, si ‘queremos agrupar los pesos de ciertos animales podriamos usar la primera de las cla- sificaciones siguientes cuando los pesos se dan al kilogramo més cercano, la segunda ‘cuando se dan a la décima de kilogramo més cercana y latercera cuando se danalla cén- tima de kilogramo més cercana: Peso Peso Peso (ilogramos) —_—_(kilogramos)__—_(kilogramos) 10-14 100-149 10,00-14.99 15.19 150.199 15.00-19.99 20-24 200-249 2000-2499 25-29 250.299 2500.29.99 30-34 300-349 30000-3499 ee. te. ete. Para ilustrar lo que hemos estudiado en esta seccién, ahora revisemos los pa- sos reales de agrupacién de un conjunto de datos de una distribucién de la fre- cuenci Elabore una distribucién de las siguientes cantidades de éxidos de azufre (en toneladas cmitidas por una planta industrial en 80 dias: 'SEC.22 / DISTRIBUCIONES DELAFRECUENCIA 24 22 158 264 173 112 239 248 187 139 90 132 227 98 62 147 175 261 128 286 176 237 268 227 180 205 110 209 15S 194 167 107 19.1 152 229 266 204 214 192 216 169 190 185 230 246 201 162 180 7.7 135 235 145 144 296 194 170 208 243 225 246 184 181 83 219 123 223 132 118 193 200 257 318 259 105 159 275 181 179 94 241 2.1 285 Solucién Dado que el valor inferior es 6.2 y el valor superior es 31.8, podrfamos seleccionar las, seis clases 5.0-9.9, 10.0-14.9,... y 30.0-34.9, las siete clases 5.0-8.9, 9.0-12.9,...y 29.0-329, las nueve clases 5.07.9, 8.0-10.9,.. y 29.0-31.9 0 muchas otras clasifica- cciones. Nétese que en cada una de las clasificaciones mencionadas, las clases acomo- Co) porlo mene Tenn vc ios 0) mas de 10 scene vc 0-9 (c) més de 14 asientos vacfos; 80.0- 99.9 u (0 porlo enon etn ak wooo-19 a (e) exactamente 9 asientos vacios? 120.0-139.9 1 2.11 El administrador de una oficina de correos ha agrupado Total 125 Jos valores de las compras de timbres en una distibucion ‘SEC.22 J DISTRIBUCIONES DELAFRECUENCIA. 25 243 24 2a5 216 247 218 249 Sies posible, encuentre cudntas de las muestras pesan ‘como méximo (2) 59.9 gramos, (b) mas de 59.9 gramos; (©) mas de 80.0 gramos: (@ 80.0 gramos 0 menos; (©) exactamente 70.0 gramos; (cualquier valor de 60.0 a 100.0 gramos. Los niimeros de enfermeras en servicio cada dfa en un hospital se agrupan en una distribucin que tiene las cla- ses 15-29, 30-44, 45-59, 60-74 y 75-89. Encuentre (@) 0s limites de clase; (b) las fronteras de clase; () las mateas de clase: el intervalo de clase de Ia distribuci6n, Los valores declarados de los paquetes enviados por co- reo de Gran Bretafia a Estados Unidos se agrupan en una distribucién con las clases $0.00-49.99, $50.00.99.99, '$100.00-149.99, $150.00-199.99, $200.00-249.99, '$250,00-299.99 y $300.00 y més. Encuentre () os limites de clase; (b) las fronteras de clase; (©) las marcas de clase; (@) elintervalo de clase de Ia distribucisn, Las marcas de clase de una distribuci6n del nimero de asaltos registrados diariamente en una delegaciGn de po- licia son 4, 13, 22, 31 y 40. Silos intervalos de clase son iguales, encuentre (a) las fronteras de clase; (b) los limites de clase. Las marcas de clase de una distribucién de VCRs (graba- doras de video cassette) reparadas diariamente por un ‘centro de servicio regional del fabricante son 6, 19, 32 y 45. Silos intervalos de clase son iguales, encuentre (a) las fronteras de clase; (0) los limites de clase. Para agrupar datos sobre el niimero de dias Iluviosos re- ‘gistrados por una estacién climatol6gica para el mes de ‘agosto durante lo iltimos seis dias, un meteor6logo usa las clases 0-5, 6-11, 12-16, 18-24 y 24-30. Explique en HIST Ch 6.95 4.0 cl WEDIA DE NUMERO DE ‘OBSERVACTONES lp tataseanee 4 aaneasenee 5 sanaaaanaaaananes: Fd saneaaaanene 3 aaaaene 2 FIGURA 2.3. Impresién por computadora para la elaboracién det histograma de los datos dela emisin de dxidos de azufre. 28 caP.2 /-_RESUMEN DE DATOS: DISTRIBUCION DELA FRECUENCTA 7 14 10 9 a | | 2 Boss 9oe oIse Toms ToT mows WOT ‘onoladas de oxides de azute FIGURA24 Grifica de barras de la distribucién de los datos de la emisin dxidos de azufre. ser conveniente elaborarhistogramas directamente a partir de los datos en bruto usando un paquete de computacién adecuado, Por ejemplo, la figura 2.3 presenta un histogra- ma de los datos de la emisién de 6xidos de azufre creado por computadora.' Como se puede apreciaren el comando “HIST C1 6.95 4.0”, la primera marca de clase es de 6.95 yel intervalo de clase es 4, de modo que las clases estén dispuestas como en la tabla de a pagina 22. En comparaci6n con la figura 2.2, el diagrama que esté a su lado en reali- dad no es un histograma de acuerdo con la definicién que mencionamos. No obstante, combina algunas de las caracteristicas de las figuras 2.4 y 2.7 y representa la misma idea. Las gréfieas de barras, como la que aparece en la figura 2.4, son parecidas a los histogramas, Las alturas de los rectiingulos o barras representan las frecuencias de la clase como un histograma, pero no hay motivo para tener una escala horizontal continua. tra forma de representaciGn gréfica de uso menos comin es el poligono de fre- ccuencias, como el que se presenta en la figura 2.5. Aquf, las frecuencia de clase estn trazadas en las marcas de clase y los puntos sucesivos estén unidos con lineas rectas, Notese que agregamos clases con frecuencia cero en ambos extremos de la distribucién para “sujetar” la gréfica ala escala horizontal. Si aplicamos una técnica similar a una distribuci6n acumulativa, obtenemos lo que se conoce como una ojiva. Sin embargo, ‘en una ojiva, las frecuencias acumulativas se trazan en las fronteras de clase en lugar de hacerlo en las marcas de clase; es obvio que la frecuencia acumulativa correspon diente a, digamos, “menos de 13.0” se deberfa trazar en la frontera de clase 12.95, ya "Bin lnimpresin dela figura 2.3 y otras que se presentanen este texto, las palabras ylos nimerosparecen refers alos aspectostfenicos de la operacisn del programa de computacin particular empleado, Si tiene ac- ‘eso a. una computadora, el lector debera referirse alos manuslespertinenes de insrucciones de operacién Yuna lista de problemas para poder resolver on ls programas exstentes. Los usuarios capacitados pueden ‘rear los programas necesarios SEC.23 | REPRESENTACIONESGRAFICAS 29 FIGURA 2.5. Pollgono de frecuencias de la distribucin de ls datos de la cemisin de bxidos de azufre. que “menos de 13.0” en realidad comprende todos los valores hasta 12.95. La figura 2.6 presenta una ojiva de la distribucién acumulativa de “menos de” obtenida que aparece cn la pagina 24 para los datos de la emisi6n de los 6xidos de azufre. ‘A pesar de que el atractivo visual de los histogramas, gréficas de barras, poligonos de frecuencias y ojivas es un claro avance sobre las tablas simples, hay varias maneras de presentar las distribuciones de un modo més dramético y a menudo con mayor efec- FIGURA 2.6. Ojiva de la distribucién acumulativa de los datos de la emisién de bxidos de azufre. 30 CAP.2. J, RESUMEN DE DATOS: DISTRIBUCION DE LA FRECUENCIA FIGURA 2.7. Pictograma de la poblacién de Estados Unidos. tividad. Un ejemplo de tales representaciones pictéricas (frecuentemente vistas en los diarios, revistas ¢ informes de varios tipos) es el pictograma de la figura 2.7. A menudo, las distribuciones categ6ricas (o cualitativas) se representan gréfica- ‘mente como gréficas circulares, como la que aparece en la figura 2.8, donde se divide tun cfrculo en secciones (partes en forma de segmento) que son proporcionales en tama- fio con las frecuencias o los porcentajes correspondientes. Para elaborar una gréfica circular, primero convertimos la distribucién en una distribucién porcentual. Luego, ya que un cfrculo completo corresponde a 360 grados, obtenemos los éngulos centrales de varias secciones multiplicando los porcentajes por 3.6. 3) i f hy i FIGURA28 Produccién de energia elctrica de Estados Unidos en 1982. SEC.23 J REPRESENTACIONESGRAFICAS 31 Muchas computadoras estin programadas con anticipacién de modo que, una vez que se han capturados los datos, un simple comando produciré una gréfica circular o va~ riaciones de la misma, Algunas gréficas circulares creadas por computadora utilizan colores, algunas son tridimensionales, algunas cortan secciones (como rebanadas de pastel) para hacer énfasis y algunas sombrean o entintan las diferentes secciones. La investigacin sobre la capacidad para leer representaciones gréficas ha sugeri do que los usuarios no capacitados presentan problemas para interpretar las gréficas circulares. Comparar la informaciGn de dos gréficas circulares adyacentes es particu- larmente dificil. La comparacién de las alturas de barras de los histogramas es més bien fécil. Se recomienda usar las gréficas circulares s6lo en raras ocasiones y con extrema precaucién. EJERCICIOS 254 Lasigiewecstadisibucin del fctrcin mens 237 Conver ladisibcin del ejeicio aneoren un die 150 coonat dunn Senda depute caacigeasmulaea ce nseo day tone eae — 2.38 Lasigieneublademoesea cn vsjan su taj os "Grae," Frecuencia tice cn Dover Coben 0.00- 19.99 2 Medios de - es Poretje aw beso Pace, Ao 3 ae m3 SS Vij 2 Soo Vee ocnmwomint 13 ones 8 veers A ee eee ee (a) Trace un histograma de esta distribucién. Elabore wi ifica circular para esta distribucién por- (b) Trace una grifica de barras de esta distribucién. ‘centual. na gra lar Bo. 235 Conve dtc deljeccosmteiorenuads- ° " o eds 239. Lafgua29 reset acu de lscalifcaiones tribucién aumulativa de “menos de" y trace una ova fe 80 principlantes de una univesidad en un examen de 26. Lasigiete esa csibcin de os pesos de 150 mie- ae ae conan de engun exile _Explique por qué se podria dar con facilidad una impre- ‘es que ingresaron a una universidad: sign errénea e indique e6mo se podria mejorar. Peso en libras Frecuencia a 90-99 6 100-109 25 110-119 46 120-129 37 130-139 2 140-149 7 $ 150-159 3 2 160-169 3 ie 170-179 0 es 130-189 1 a (@) Trace un histograma de esta distribucién, FIGURA 2.9. Distribucién de las calficaciones en el (b) Trace un poligono de frecuencias de esta distibu- ‘examen de clasificacién de conocimientos de lenguas ign. ‘extranjeras. 32. CAP.2./RESUMEN DE DATOS: DISTRIBUCION DE LA FRECUENCIA 240 241 24 Ingreso familar FIGURA 2.10. Pictograma para el ejercicio 2.40 El pictograma de la figura 2.10 pretende ilustrar que en ciertaregi6n, el ingreso familiar promedio se ha duplica- do de $7,000 en 1970 a $14,000 en 1982. Explique por {qué este pictograma da una impresi6n errénea y sefiale ‘c6mo se podria modificar. labore una gréfica circular de la siguiente distribucién, {que presenta los nimeros de vehfculos de motor registra- ddos en una oficina estatal: Tipo de vehiculo Nimero ‘Automevil de pasajeros 248 Minivan 2 Camién de dos ejes a2 Camién multicjes 2 Motocicleta 55 Lancha de motor 9 Total REVISION DE TERMINOS CLAVE* (Con referencias de pigina a sus definiciones) Anélisis exploratorio de datos, 17 Clases, 20 Clases abiertas, 21 ‘Los uérminos que se presentan en fos ejrccios aparecen en negra, Aqui, de nuevo, presentamos las calificaciones (del ejer- cicio 2.19) que obtuvieron 40 estudiantes en una prueba de psicologia: 75 89 66 52 90 68 8&3 94 77 60 38 47 87 65 97 49 65 72 73 81 63 77 31 88 74 37 85 76 74 63 69 72 91 87 16 58 63 70 72 65 Usilice un paquete de computacién para elaborar un hi togramacon laslases 20-29, 30-39, 40-49, 50-59, 60-69, 70-79, 80-89 y 90-99, Elabore también un histograma con las clases 20-39, 40-59, 60-79 y 80-99. ,Qué histo- ‘rama prefiere? Uiilice un paquete de computadora para elaborar un his togramacon las clases 40-44, 45-49,50-54, 55-59, 60.64, (65-69, 70-74 y 75-79 para el nimero de clientes del al- muerzo del ejercicio 2.25. Utilice un paquete de computadora para elaborar un his tograma con las clases 22.5-22.9, 23.0-23.4, 23.5-23.9,, 24.0-24.4, 24.5-24.9, 25.0-25.4 y 25.5-25.9 para los da- tos de millas por galén del ejercicio 2.27 de las pginas 26-27. Datos en bruto, 20 Distribucién, 19 Distribucién acumulativa, 24 SEC,24 / REVISIONDE TERMINOS CLAVE 33. Distribucién categérica, 19 Distribucién cualitativa, 19 Distribucién cuantitativa, 19 Distribucién de la frecuencia, 19 Distribucién numérica, 19 Distribucién porcentual, 23 Distribuciones porcentuales acumulativas, 25 Frecuencias de clase, 22 Fronteras de clase, 22 Grafica de tronco y hoja, 15 Gréficas circulares, 31 Gréficas de barras, 29 25 EJERCICIOS DE REVISION 24S Las marcas de clase de una distribuci6n del ndimero de Namadas recibidas a diario por una pequefia compatifa, detaxis son 18, 25,32, 39, 46y 53. = 5. El cuantil inferior es la mediana de los cuatro valores por debajo de la mediana y el cuartil superior es la mediana de los cuatro de la mediana. Ordenando los datos de acuerdo con su tamafio, te- 66 73 74 79 82 86 88 90 94 4 se puede apreiar que la medianaes 82, 1 curt inferir > +74 86+ 90 778 til superior es ‘Si alguno de los valores son iguales, modificamos la definicién de cuartiles su tuyendo “menores que Ia mediana” con “a la izquierda de la posicién mediana’” “y’ ““mayores que la mediana” con “a la derecha de la posicién mediana”. Por ejemplo, los nueve golfistas del ejemplo de la pagina 48 obtuvieron los golpes 333344445 cenel tercer hoyo de un campo. El cuarti inferior, lores, es 3. La mediana, el quinto valor, es 4. El cu yee tercer valores a partir de la derecha, es 4. media del segundo y el tercer va~ superior, la media del segundo ‘CAP.3 /- RESUMEN DE DATOS: MEDIDAS DE TENDENCIA. jos se presentan otras definiciones de los cuartiles. exploratorio de datos observamos el proceso de la obtencién de los valores que dividen un conjunto de datos en cuatro partes de una manera distinta; como un proceso de doblamiento. En relacién con el primero de nuestros dos ejemplos, en ‘el que el tamafio de Ia muestra fue doce, suponga que en Ia parte superior de la figura, 3.1 o de la figura 3.2 doblamos la pagina a lo largo de la nea punteada de la izquierda, * To largo de la {nea punteada de la derecha y Iuego a lo largo de la linea punteada de ‘en medio. Si hacemos esto, se traslapardn las cuatro partes en que hemos dividido los consuwro ct paTOS> 15.8 26.4 U2 23.9 24.8 18.7 3 DATOS> 22.7 | 9.8 147 26:1 16 DATOS> 26.8 22.7 20:5 26.9 loa 16:7 patos> 19:1 26:6 aa ais 16:9 patos> 18:5 20:1 16:2 18.8 Lis 235 patos> 14.4 17:8 26:8 24:3 24°56 18.4 DATOS> 8.3, 22:3 1313 11‘ 20:8 25.7 DATOS> 25:9 25 18.1 17.9 241 2821 ‘TB > MEDIA. = wre > STAN CL DESVIACION = ESTANDAR FIGURA 34. Impresién por computadora de la media de los datos de a emisién de dxidos de azufre. ara encontrar la linea divisoria entre las dos mitades de un histograma (cada una de las cuales representa pe Jos elementos agrupados) debemos contar 5 de los elementos comenzando por cualquier extremo de la distribucién. El ejemplo siguiente ilustra ‘e6mo se hace esto: EJEMPLO _Obtenga la mediana de la distribucién de los datos de la emisién de 6xidos de azutre. n_ 80 Solucién Yaque 5 = ">' = 40, debemos contar 40 de los elementos empezando por cualquies 2 ‘extremo. Empezando por la parte inferior de la distribuci6n (esto es, empezando con Jos valores mas bajos), encontramos que 3 + 10 + 14= 27 de los valores caen en las pri- et | |] |i { | BOET TOT TOS OT MOD OWS WOW “Tonolades de xis de azuto FIGURA3.5 La mediana de la distribucién de los datos de la emisién de dridos de azufre. CCAP.3./- RESUMEN DE DATOS: MEDIDAS DE TENDENCIA Mediana de tos datos agrupados EJEMPLO Solucion ‘eras tres clases y que 3+ 10+ 14 +25 = 52de los valores caen en las primeras cuatro, clases. Por tanto, debemos contar 40 ~ 27 = 13 valores més, adems de los 27 valores que caen en las tres primeras clases. Con base en la suposicién de que 25 valores de las cuatro clases estén distribuidos en forma regular a través de la clase, podemos hacer esto sumando +} del intervalo de la clase de 4 a 16.95, la frontera inferior de las cuatro clases. Asf, tenemos 13 = 1695 + 55 = 19.03 para la mediana de la distribucién. En general, si Les la limitaci6in inferior de la clase en que debe caer la mediana, Fes la frecuencia, c es el intervalo de la clase y jes el nmero de articulos que atin nos faltan cuando obtenemos Z, entonces la mediana de la distribucién se obtiene por medio de i Lttee f Si lo preferimos, podemos encontrar la mediana de una distribucién comenzando por contar desde el otro extremo (comenzando con los valores més altos) y sustrayendo una fraccién adecuada del intervalo de la clase a la frontera superior de la clase en que debe caer la mediana, Use este planteamiento alternativo para encontrar la mediana de la distribucién de los datos de la emisi6n de Sxidos de azufre. Dado que 2 +9 + 17 = 28 de los valores deben caer sobre 20.95, necesitamos 40 - 28 = 12 de los 25 valores que caen en la clase siguiente para obtener la mediana, y expre~ samos que 20.95 ie 738 19.03 Es evidente que el resultado es el mismo. Notese que se puede obtener la mediana de una distribucién sin importar que todos los intervalos de la clase sean iguales; de hecho, por lo general, se puede encontrar atin si alguna o ambas clases de la parte superior ola inferior de una distribucién son abier- tas (véase el ejercicio 3.52). ‘También podemos usar el método por el que encontramos la mediana de una dis- tribucién para determinar otros fractiles. Por ejemplo, se definen los tres cuartiles (que pretenden dividir un conjunto de datos en cuatro partes més 0 menos iguales) para los datos agrupados de modo que 25% del érea total de los rectingulos del histograma cae del lado izquierdo de Q1, 25% cae entre Q1 y Q:, 25% cae entre Ory Qs y 25% cae ala derecha de Qs. En forma similar, se definen los nueve deciles (que pretenden dividir un conjunto de datos en diez partes mAs o menos iguales) para los datos agrupados de ‘modo que 10% del érea total de los rectangulos del histograma cae a la izquierda de Ds, 10% cae entre Ds y D2... ¥ 10% cae del lado derecho de Ds. Y finalmente, se definen SEC.37. LADESCRIFCIONDELOS DATOS AGRUPADOS 64 los noventa y nueve percentiles (que pretenden dividir un conjunto de datos en cien par- tes més o menos iguales) para los datos agrupados de modo que 1% del dea total de los rectiingulos del histograma cae del lado izquierdo de Pi, 1% cae entre Pi y P2,.. ¥ 1% cacala derecha de Pry. Nétese que 2, Ds y Pso son iguales a la mediana y que Pas equi- vale a Q1 y Prs equivale a Qs. Véase también el ejercicio 3.43 de la pagina 57. EJEMPLO — Encuentre Qi y Qs para la distribucién de los datos de la emisi6n de 6xidos de azufre. Solucién Paraencontrar Q1, debemos contar 4 = 20 de los articulos comenzando por la parte in- ferior de la distribuci6n, Puesto que hay 3 + 10 = 13 valores en las dos primeras clases, debemos contar 20 13 = 7 de los 14 valores de la tereera clase para obtener Qi y te- emos 12.95, 7 14.95, = 129547 Para encontrar Qs, debemos contar 20 de los articulos iniciando por el otro extremo de Ja distribucién, Ya que 2 + 9 = 11 de los valores caen en las dos clases de la parte su- perior de la distribucién, debemos contar 20~ 11 = 9 de los 17 valores de la clase si- fuiente para obtener Qs y tenemos 0, = 2495 ~ 2-4 = 2288 = 1495 Pan EJEMPLO _ Encuentre Ds y P: para la distribucién de los datos de la emisiGn de 6xidos de azufre. Soluci6n —Contando 80(0.20) = 16 de los articulos empezando con los valores més altos, tenemos 5 = 2495 5-4= 23,7 Dy = 2495 — 754 = 23, Y contando 80(0.02) = 1.6 de los articulos comenzando con los valores mas bajos, te- hemos 1 495 + 7.08 ‘Nétese que cuando determinamos un fractil de una distribucién, el nimero de: articulos que contamos y la cantidad j de la formula de la pdgina 61 no necesita ser un nimero, entero. EJERCICIOS 46352 Determine, para cada una de as siguientes distbucio- ® 1 Frecuencia ts, es posible encontrar a media yf a means SUE Menos de 90 3 (@) Catfeacin Frecuencia 30. 9 4 —{_— 100-109 2 io-119 19 ee 3 wae ; oo 7 0 1S 40-89 é 62 CCAP.3. /- RESUMEN DE DATOS: MEDIDAS DE TENDENCIA 4353 #354 4355 43.56 9357 (© Peso Frecuencia 100.0 menos 41 101-110 2B HL-120 8 a L-130 3 131-140 1 _Encuentre la media de la siguiente distribuciGn de as ca- lificaciones que obtuvieron 500 estudiantes en un exa- ‘men de geografia: ‘Niimero de Calificacién estudiantes 10-24 44 25-39 0 40-54 72 55-69 17 70-84 1s 85-99 32 Refiriéndonos a la distribucién del eercicio anterior, en- cuentre (@) Ia mediana; () los cuartiles Q1 y Qs. Refiréndonos ala dstibucin del ejercicio 3.53, encuentre (2) los deciles Di y Ds; (b) los percentiles Psy Pos. Encuentre la media dela siguiente distibucién de os por- ccentajes de los estudiantes que pertenecen a un grupo ét- ico determinado en una muestra de 50 escuelas prima- Mimero de Porcentaje —_escuelas o4 8 59 15 10-14 9 15-19 7 20-24 1 Refiriéndonos a a distribucién del ejecicio anterior, en- cuentre (@) la mediana; () los cuartiles Q1 y Os 43.58 43.59 #3.60 43.61 $3.62 43.63, 43.64 SEC.3 /- LA DESCRIPCION DE LOS DATOS AGRUPADOS Refiiéndonos ala distribucién del ejecicio 3.56, encuentre (@) los deciles Ds y Dr; () los percentiles Ps y Pos. ‘Obtenga la media dela siguiente distribuciGn de edades de los miembros de un sindicato: Edad (aios) _\ Frecuencia 15.19 16 20-24 35 25-29 44 30-34 7 35-39 "7 40-44 8 45-49 2 50-54 1 Refiriéndonos a la distribucién del ejercicio anterior, en- ccuentre (2) 1a mediana; (b) los cuartiles Q1 y Qs Refiriéndonos a la distribucisn del ejercicio 3.59, en- ccuentre los dos fractiles que dividen ladistribucién en tres partes iguales. Encuentre la media de la distribucién obtenida en el ejer- cicio 2.22 de la pagina 26 para los pesos de las 50 ratas. ‘También, use un programa de computacién 0 una calcu- ladora para encontrar la media de los datos originales (no agrupados) y luego determine el tamafio del error de agru- pacién, Encuentre la media de la dstribucién obtenida en el ejer- cicio 2.27 de la pagina 26 para los rendimientos obtenidos ‘con 40 tanques Hlenos de gasolina. También, use un pro- ‘grama de computacién 0 una calculadora para encontrar Ja media de los datos originales (no agrupados) y luego determine el tamafio del error de agrupacién. ‘Suponga que se han agrupado los valores de los datos en ‘una distribucién con el intervalo de la clase c. Se garan- tizaque el error de agrupacién en elealculode la mediano puede ser mayor que c. Compare, paracada uno de los dos e|jercicios anteriores, el error de agrupacién con el inter- valo dela clase. 63 38 NOTA TECNICA (SUMATORIAS) En la notacién que presentamos en la pégina 40, x no nos indica cudles ni cudntos va- lores de x debemos sumar. Se maneja esto con la notacién més explicita ae donde es evidente que estamos sumando las x's cuyos subindices, , son 1, 2, festamos usando la notacién més explicita en este texto para simplificar la apariencia {general de as férmulas, suponiendo que en cada caso es evidente a qué s’snos estamos refiriendo y cuéntas hay. ‘Usando la notaci6n E, también tendremos la ocasién para escribir expresiones ta- les como Ex2, Exy, Ex'f,... que representan (mas explicitamente) las sumas pag tit My Extextexdedtcta Lene 1a + XaVa toe + Xin Lh df tbh to +8 ‘Trabajando con dos subindices, también tendremos la ocasi6n de evaluar dobles suma- torias como Naum Dut tat tay ed =X qq t Xa, Nar + Xan + Xia + X22 + X32 + Naz + X13 + X23 + X33 + Mas ara verificar algunas de las férmulas que implican sumatorias que se mencionan pero que no se prueban en el texto, elector tendré necesidad de las reglas siguientes: Rega: (xy ty)= Lt dy Reglas para c ReglaB: Yk*x, ReglaC: Sk=ken La primera de estas reglas establece que la sumatoria de la suma (0 diferencia) de dos términos equivale a la suma (o diferencia) de las sumatorias individuales y se puede ge~ neralizar ala suma o diferencia de més de dos términos. La segunda regla establece que podemos, por asf decirlo, factorizar una constante de una sumatoria y la tercera regla G4 CAP.3./-RESUMEN DE DATOS: MEDIDAS DE TENDENCIA establece que la sumatoria de una constante simplemente es n veces esa constante. To- das estas reglas se pueden probar escribiendo por completo lo que cada sumatoria ze- presenta. EJERCICIOS 3.468 Escriba por completo cada una de las siguientes expresio- 2 a nes es dect sin signos de sumatoria: @ Yu © Yafe @y @) Yahi ©) Fhe @ Y Ph * 2 3.69 Considerando que x1 =~2,5; oy oy te a “ @ 3x8 © Vx O Ley+yp « i Us 3.70 Considerando que x 3.66 Escriba cada una de las siguientes expresiones sin signos evaqteeeaie de sumatoria y simplifique si es posible: ee © Born (@) x, por separado paraj=1,2,3 4: () Y Gy (b) 5 xy por separado para i= 1, 2y 3. 3.71. En relacién con el ejercicio anterior, evale la doble su- © Zant ¥ er z i a 3.467 Escriba como sumatorias cada una de las siguientes ex- presiones (2) Ios resultados de la parte (a) de exe ejerci (a) 2, +2) +25 +245 (b) los resultados de la parte (b) de ese ejercicio. (b) Xo + X7 + Xe + Xo t+ Mot Xi © ie i (©) xh + ¥afat ahs t kale + tale + ahs 3:72 Demuestre que 5 (x — 2) = 0 para cualuirconjunto @ yit vit yi + va + yb (6) 3x, 43x; + 3x5 + 3x4 + Bay + tgs de x's cuya media sea (8) (1 — yu) + x2 — Ya) + Oa — Yad + Oe = Yas ir Sx) = Sar? (B) (wy — 5) + (w2 — 5) + (ws — 5); 3.73 (Escierto, en érminos generales, que (§ ‘) =” (h) aybyey + asbace + asbscs + aabacy (Sugerencia: Verifique si la ecuacin es verdadera para 3.68 Considerando que.xi= 1,x:=3,5 n=2) 39 REVISION DE TERMINOS CLAVE (con referencia de pégina asus definiciones) Amplitud media, 57 *Cuartil medio, 54 ‘*Cuartiles 50 *Deciles, 50 ‘Cuartil inferior, 52 Doblamiento, 53 SEC,39 J LISTATERMINOS CLAVE 65 Doble sumatoria, 64 ‘xError de agrupacién, 59 ‘xFractiles, 50 Grafica de recuadro, 55 ‘sklnterpolacién, 57 Media, 39 Media aritmética, 39 Media arménica, 46 Media geométrica, 46 Media general, 44 Mediana, 47 Medidas de localizaci6n, 38 Medidas de localizacién central, 38 Moda, 55 Muestra, 38 3.10 EJERCICIOS DE REVISION 34 43.75 3.76 43.77 Las siguientes son las clasificaciones de televidentes es- timadas para diecistis partidos de futbol profesional: 139 163 1 135 1.66 137 132 186 146 182 132 121 138 136 1.88 176 CObtenga la mediana y la moda para estos valores. Encuentre los puntos esenciales para las clasificaciones de televidentes del problema anterior. En una venta de beneficencia, una organizacién de servi- ios vendié 120 libros con un precio medio de $2.10, 80 pasteles con un precio medio de $2.75 y 50 artesanfas con un precio medio de $4.55. Encuentre el importe del otal de las ventas y del precio medio por articulo vendido. Lasiguientees la distribuci6n del nimero de das que llo- -vi6 en Seattle en 60 mes Caleule 1a media. CCAP.3. /- RESUMEN DE DATOS: MEDIDAS DE TENDENCIA Notacién de sumatori 1 40 Parémetro, 41 Percentiles, 50 Poblacién, 38 Posicién mediana, 48, Puntos esenciales, 53 Punto esencial inferior, 53 Punto esen I superior, 53 Representacién gréfica de recuadro y secciGn, 54, 55 Tamafio de la muestra, 40 ‘Tamafio de la poblacién, 41 Teorema de Markov, 46 43.78 43.79 3.82 43.83 384 En relacién con el ejercicio 3.77, encuentre (a) 1a mediana de la distribucién; () los cuartiles de la distribucién. Refiriéndonos al ejercicio 3.77, encuentre el 60% percentil_ | de Ia distribucién. Un productor de comerciales de televisiGn sabe exacta- ‘mente cusinto dinero se gast6 en la produccién de cada, ‘uno de diez comerciales de un minuto. Dé un ejemplo de ‘un problema en el que estos datos se considerarfan como (@) una poblacién; (b) una muestra, Encuentre a posicién mediana para @ n=31; (b) n= 80. Las siguientes son las ganancias de 1990, en miles de d6- lars de diez vendedoras industriales: 282 305 258 204 232 325 330 264 288 273 (@) Encuentre la mediana de estas ganancias. (b) Encuentre la media de estas ganancias. Con base en los datos del problema anterior, encuentre los puntos esenciales de las ganancias de 1990 de estas vendedoras. En un dia de clases, un estudiante obtuvo 78 de califica- cidn en la primera prueba, 83 en la segunda prucba y 88 ‘en{a final. El profesor considera que la segunda prucbaes del doble de importancia que la primera y que la prucba final es tres veces mas importante que la segunda prueba. Cull es la calificacién media ponderada de ls res prue- bas del estudiante? 3.85 Durante las tes semanas anteriores a Navidad, doce per- sonas hicieron compras, en promedio, en $.75 tiendas de ropa. {Es posible que por lo menos sietedeestas personas hayan hecho compras en diez o mas tiendas? 3.86. Se pregunté a veinteelectores registrados si se conside~ raban demécratas, republicanos o independientes. Use las respuestas siguientes para determinar su seleceién modal: Deméerata Demécrata Demécrata Demécrata Independiente Independiente Independiente Independiente _Repablicano Deméerata Independiente Independiente Republicano Republicano Demécrata Independiente Republicano 4387 Considerando una muestra de 23 observaciones, en- cuentre las posiciones de la mediana y los dos puntos esenciales. Considerando una muestra de 24 observaciones, en- cuentte las posiciones de la mediana y los dos puntos esenciales, 43.88 3.89 Los siguientes valores son las retenciones porcentuales de azufte de 42 dreas de vertientes del noroeste de Esta- dos Unidos, registrados en 1989: 183 419 324 332 259 606 190 547 488 430 S14 442 562 596 435 178 376 662 49.7 390 SRT 398 218 432 243 420 193 42.1 539 282 478 3443 330 332 422 BLT 380. 453. 41.7 457 370 51.0 Elabore una gritica de toncoy hojaydsela para encon- trar la mediana de estos datos. 3.90 Los siguientes son los nimeros de pasajeras de 46 auto- ‘buses con vista panorimica en Boston, Massachusetts Nimero de personas Frecuencia —<—< 15.0 menos 5 16-20 8 21-35 u 26-30 B 31-35 6 36-40 3 Siees posible, encuentre la media y la mediana, 43.91. Refirigndonos a Ia distribucién del ejercicio anterior, en- ‘cuentre,sies posible, (@) el cuartl inferior; (b) el cuartl superior; (©) 1 40® percent (@) 1 80° percentil. Considerando que #1 = 3,2 5,.5=-2,x4 =-4.xr=2y.4=4, encuentre Sieel salario medio de todos los empleados de sexo mas- cculino de la compafiia A excede el de todos los empleados de sexo masculino dela compafiaB y el salario medio de todos los empleados de sexo femenino de la compatia A ‘es mayor que el de todos los empleados de sexo femenino de la compatia B, se deduce que el salario medio de to- dos os empleados de la compafiaA excede el de todos los cempleados de la compatifa B? Explique su respuesta, 392 393 3.94 Los promedios de bateo de beisbol se obtienen dividien- dol nero de hits de un jugador entre su nimero de ve- ces il bat, expresando el resultado como una cifra de tres

You might also like