You are on page 1of 84
1.1 Poblaciones, muesrasy procesos 9 Adlesivo tipo 2 Aadesivo tipo 1 Figura 1.3 Material conductor Fuerzas de adhesién promedio en el ejemplo 1.4 recursos para hacer incluso una observacién sencilla para cada una de estas combinaciones. En el capitulo 11 se ver cémo la selecciGn cuidadosa de una fraccién de estas posibilida- des usualmente daré la informacién deseada, . [ EJERCICIOS — Seccidn 1.1 (1-9) 1, Dé una posible muestra de tamaio 4 de cada una de las si- uientes poblaciones, a, Todos los periédicos publicados en Estados Unidos. ’. Todas las compasias listadas en la Bolsa de Valores de ‘Nueva York. «. Todos los estudiantes en su colegio o universidad, Todas las calificaciones promedio de los estudiantes en su ‘colegio 0 universidad, 2, Para cada una de las siguientes poblaciones hipotéticas, dé ‘una muestra posible de tamaio 4 4a, Todas las distancias que podsfan resultar cuando usted lan- ‘zaun bal6n de ftbol americano. b, Las longitudes de las péginas de libros publicados de aqui 5 ais, «. Todas las mediciones de intensidades posibles de terremo- tos (escala de Richer) que pudieran registrarse en Califor- nia durante el siguiente aio, 4. Todos los posibles rendimientos (en gramos) de una cierta reaccién quimica tealizada en un laboraterio, 3. Considere la poblacién compuesta de todas las computadoras de ‘una cieta mazca y modelo y enféquese en si una computadora necesita servicio mientras se encuentra dentro de la garantia, a, Plantee varias preguntas de probabilidad con base en la se- leeci6n de 100 de esas computadoras '. iQue pregunta de estadistica inferencial podria ser respondi- dda determinando el nimero de dichas computadoras en una ‘muestra de tama 100 que requieren servicio de garantia? 4. a, Dé tres ejemplos diferentes de poblaciones concretas y tes ejemplos distintos de poblaciones hipotéticas. b. Por cada tna de sus poblaciones concretas ¢ hipotsticas, dé ‘un ejemplo de una pregunta de probabilidad y un ejemplo de pregunta de estadistia inferencial '5, Muchas universidades y colegios han instituido programas de instruecidn suplementaria (1S), en los cuales un facilitador te ularmente se retine con un pequefio grupo de estudiantes 5. El sistema de la Universidad Estatal de California (CS1 inscrtos en el curso para promover discusiones sobre el ma- terial incluido en el cutso y mejorar el dominio de la materia ‘Suponga que los estudiantes inscritos en un largo curso de es- tadistica (gde qué més?) se dividen al azar en un grupo de control que no partcipars en Ia instruccién suplementaria y enun grupo de tratamiento que sf participars. Al final del eur- +0, se determing la calificacin total de cada estudiante en cl a, Son las calificaciones del grupo IS una muestza de una poblacidn existente? De ser asi, ;cudl es? De no ser asf {cud es la poblaci6n conceptual pertinente? b, {Cuil piensa que es la ventaja de dividi tudiantes en los dos grupos en lugar de permitir que cada estudianteelia el grupo al que desea unirse? . {Por qué los investigadores no pusieron a todos los estu- iantes en el grupo de tratamiento? Nota: El articulo (Supplemental Instruction: An Effective Component of Student Affairs Programming”, J. of College Student De vel,, 1997:577-586) discute el anlisis de datos de varios programas de instruccién suplementaria, al azar alos ex por sus sighas en inglés) consta de 23 terrenos universitaios, des- dela Estatal de San Diego en el sur hasta la Estatal Humboldt cerca de Ia frontera con Oregon. Un administrador de CSU desea hacer una inferencia sobre la distancia promedio entre la ciudad natal y sus terrenos universitarios. Deseriba y diseuta, iferentes métodos de muestreo, que pudieran ser empleados Biste seria un estudio enumerativo o un estudio analitico? Explique su razonamiento, . Ciesta ciudad se divide naturalmente en diez distritos. ;Cémo podria seleccionar un valuador de bienes rafces una muestra de casas unifamiliares que pudiera ser wtilizada como base para desarvollar una ecwacién para predecir el valor estimado ‘partir de caracterfsticas tales como antiguedad, tamafio, a6 ‘mero de batios, distancia a Ia escuela mas cercana y asi suce- sivamente? {El estudio es enamerativo 0 analitico? 10 CAPITULO Generalidadesy estacstica descriptive 48, La cantidad de flujo a través de una vélvula solenoide en el _—_—b, Este estudio es enumerativo o analitica? Explique su ra- sistema de control de emisiones de un automévil es una ca- Zonamiento racterfstica importante Se realiz6 wn experimento para estd- 9, Ey un famoso experimento realizado en 1882, Michelson y dar cdmo la velocidad de flujo dependia de tres factores: Ia Tongitud de la armadura, la fuerza de resortey la profundidad Newcomb obtuvieron 66 observaciones del tiempo que re- queria Ia luz para viajar entre dos lugares en Washington, dela bobina. Se eligieron dos niveles diferentes alto ybajo) de D.C. Algunas de las mediciones (codificadas en ciesta mane- «cada factory se realiz6 una sola observacigm del flujo por e&- ya) fueron, 31, 23, 32. 36, —2, 26,27 y 31. dda combinacién de niveles. fa. Por qué no son idénticas estas mediciones? a, {De cuintas observaciones consisté el conjunto de datos Bs date un estudio enumerative? jPor qué fo por qué resultante? a2 Métodos pictéricos y tabulares en la estadistica descriptiva La estadistica descriptiva se divide en dos temas generales. En esta seccién, se considera la representacién de un conjunto de datos por medio de técnicas visuales. En las secciones 1.3 y 14, se desarrollarén algunas medidas numéricas para conjuntos de datos. Es posible que usted ya conozca muchas técnicas visuales; tablas de frecuencia, hojas de contabilidad, his- togramas, gréficas de pastel, grficas de barras, diagramas de puntos y similares. Aqui se se- leccionan algunas de estas técnicas que son més titiles y pertinentes a la estadistica de probabilidad e inferencial. Notacion Alguna notacién general facilitaré la aplicacién de métodos y frmmulas a una amplia varie- dad de problemas précticos. El mimero de observaciones en una muestra tinica, es decir, el tamafo de muestra, a menudo seré denotado por n, de modo que n = 4 para la muestra de universidades (Stanford, Iowa State, Wyoming, Rochester) y también para la muestra de lecturas de pH {6.3, 6.2, 5.9, 6.5}. Si se consideran dos muestras al mismo tiempo, m y nom, y n, se pueden utilizar para denotar los mémeros de observaciones. Por lo tanto, si (29.7, 31.6, 30.9} y (28.7, 29.5, 29.4, 30.3) son lecturas de eficiencia térmica de dos tipos diferentes de motores diesel, entonces m = 3 yn = 4. Dado un conjunto de datos compuesto den observaciones de alguna variable x, enton- 665 X,, 23,2 +. +, denotarén las observaciones individuales, El subindice no guarda nin- guna relacion con la magnitud de una observacién particular. Por lo tanto, x, en general no sera la observacién més pequeia del conjunto, ni x, sera la mas grande. En muchas aplic ciones, x, serd la primera observaci6n realizada por el experimentador, x, Ia segunda, y asi sucesivamente. La observacién i-ésima del conjunto de datos sera denotada por x, Graficas de tallos y hojas Considérese un conjunto de datos numéricos x;, xj... .X, para el cual x, se compone de por lo menos dos digitos. Una forma rpida de obtencr la representacién visual informativa del conjunto de datos es construir una grdfica de tallos y hojas. Pasos pata construir una gréfica de tallos y hojas 1, Seleccione uno o més de los primeros digitos para los valores de tallo. Los segun- dos digitos se convierten en hojas. 2, Enumere los posibles valores de tallos en una columna vertical 3. Anote la hoja para cada observacién junto al valor de tallo. 4, Indique las unidades para tallos y hojas en algtin lugar de La grafica 20 (CAPITULO 1 Generalidadesy estacstica descriptive os Gritca de revere rlatva ve ealiiesién a9 Ccaltesciin Figura 1.12 Histograma de calificaciones de las escuelas obtenido con MINITAB, Mis de Ia mitad de los encuestados otorgaron una calificacién A 0 B y s6lo un poco mas de 10% otorgé una calif wcién D oF. Los porcentajes de padres de nifios que asisten a escuelas pblicas fueron un poco més favorables para las escuelas: 24, 40, 24, 6,4y 2 por ciento, Hl Datos multivariantes Los datos multivariantes en general son mis dificiles de describir en forma visual. Varios métodos para hacerlo aparecen més adelante en cl libro, notablemente en grificas de pun- tos de datos numéricos bivariantes. 10. ML. EJERCICIOS Seccién 1.2 (10-32) ‘Considere los datos de resistencia de las vigas del ejemplo 1.2 a. Construya una grifiea de tallos y hojas de los datos {.Cuél parece ser cl valor de resistencia representativo? {Parecen estar las observaciones altamente concentradas ‘en torno al valor representative o algo dispersas? b, {Parece ser la gritica razonablemente simética en torno ‘un valor representativo o deseribirfa su forma de otra {Parece haber algunos valores de resistencia extremos? 4. Qué proporcién de las abservaciones de resistencia en tesla muestra exceden de 10 MPa? ‘Cada calificacién en el siguiente lote de calificaciones de ceximenes se encuentra en los 60, 70, 80 0 90. Una gréfiea de tallos y hojas con s6lo los cuatro tallos 6, 7, 8 y 9 no des- ctibiria detalladamente la distibucién de califcaciones. En tales situaciones, ¢ deseable utilizar tallos repetidos. En es- te caso se repetira el tall 6 dos veces, uilizando 6L para las califcaciones en los 60 bajos (aojas 0, 1,2. 3 y 4) y 6H para las calificaciones en los 60 altos (hojas 5, 6,7, 8 9) ‘Asimismo, los demés tallos pueden ser repetidos dos veces pata obtener una grdfica de ocho flas. Construya la geifi- ca para las calificaciones dadas. Qué caracterstica de los datos es resaltada por esta gréfica?” 74 $9 80 93 64 67 72 70 71 74 82 85 63 72 81 BI 69 66 60 83 85 98 84 68 88 66 85 89 81 81 95 84 81 80 70 90 82 69 72 87 12. Los valores de densidad relativa anexos de varios tipos de ‘madera utlizados en la construceisn aparecieron en el Jo (‘Bolted Connection Design Values Based on European Yield Mode!”, J of Seructural Engr., 1993: 2169-2186) 031 035 ost 041 04s 046 054 055 0.40 0.40 043 0.44 sl 054 0.68 0.75 036 036 0.42 0.42 045 0.47 058 0.62 037 038 0.40 042 042 042 048 048 048 065 0.66 067 Construya una grfica de tallos y hojas con tallos repetidos (véase el ejercicio previo) y comente sobre cualquier carac- (eristica interesante de la gréfica 13, Las propiedades mecénieas permisibles para el disesio es tauctural de vehculos aeroespaciales metélicos requieren un rmétodo aprobado para analizar estadisticamente datos de ‘prucba empiricos, El ardculo (“Establishing Mechanical Pro- perty Allowables for Metals”, J of Testing and Evaluation, 1998: 293-299) wilizé los datos anexos sobre resistencia ala tensiGn ditima (Ibfpulg’) coma base para abordar las dificul- tades que se presentan en el desarollo de dicho método, 122.2 1242 1243 1256 1263 1265 1265 127.2 1273 1275 1279 1286 1288 129.0 129.2 1294 129.6 1302 1304 1308 1313 1314 1314 1315 1316 1316 131.8 1318 1323 1324 1324 1325 1325 1325 1325 1326 1327 1329 1330 133.1 133.1 133.1 133.1 1332 1332 1332 1333 1333 1335 1335 1335 1338 1339 1340 1340 1340 1340 1341 1342 1343 1344 1344 1346 13471347 1347 1352 1357 1359 1366 B78 1384 139.1 1409 1436 1348 1353 1358 136.1 1369) 1379 1385 1398 114 143.9 1348 1334 1358 1362, 1370 B79. 1385 1398 14s 1441 1348, 1355 1358 1362, 1371 1382 1386 1400 116 1445 1349 1355 1359) 1363 1372, 1382, 1387 1400 1429 Mas 1349) 1356 1359) 1364 1375 1383, 1387) 140.7 434 a7 135.2, 1356 1359) 1364 1376 1383 1390 1407 1435 77 1352 1358 1360 1368 B78 138.4 1395 1409 13.8 1353 1358 1360 1369 B78 138.4 B96 1812 13.8 ‘a, Construya uns grifica detalles y hojas de los datos eli- ‘minando (truncanda) los digitos de décimos y luego re~ pitiendo cada valor de tallo cinco veees (una ver para las haojas 1 y 2, una segunda vez para las hojas 3 y 4, etc.) {Por qué es relativamente fil identificar un valor de 1e~ sistencia representativo? >. Construya un histograma utilizando clases de ancho igual con a primera clase que tiene un Iimite inferior de 122 y un limite superior de 124, Enseguids comente so- bre cualquier caracteristica interesante del histograma 14. El conjunto de datos adjunto se compone de observaciones de flujo de una regadera (Vimin) para una muestra de m = 29 casas en Perth, Australia ("An Application of Bayes Methodology to the Analysis of Diary Records in a Water Use Study”, J Amer Stat. Assoe., 1987: 705-711): 46 123 71 70 40 92 67 69 118 Si 112 105 143 80 88 64 SI 56 96 75 7S 62 SS 23 34 104 98 66 37 54 83 65 76 93 92 73 50 63 138 62 54 48 75 60 69 18 75 66 50 33 76 39 119 22 180 72 61 153 189 72 S455 43 90 127 113 74 50 35 82 84 73 103 19 60 $6 9S 93 104 97 51 67 102 62 84 70 48 $6 105 146 IOS ISS 75 64 34 55 66 59 150 96 78 70 69 41 36 119 37 57 68 113 93 96 104 93 69 98 91 106 45 62 83 32 49 50 60 82 63 38 60 a. Construya una grfica de tallos y hojas de los datos, 1b. {Cual 6s una velocidad de flujo o gasto tipico o repre- cc. (Parece estar la grifica altamente concentrada o dis- persa? 4. (Es a distribucién de valores razonablemente simétrica? Sino, jeémo describiria el alejamiento dela simetsia? . {Deseribiria cualquier observacién como alejada del resto de los datos (un valor extremo)? 1S. Un artculo de Consumer Reports sobre erema de cacahus- te (Septiembre de 1990) reports las siguientes calificaciones pata varias marcas: Creamy 56 44 62 36 39 53 50 65 45 40 56 68 41 30 40 50 56 30 22 Crunchy 62 53 75 42 47 40 34 62 52 50 34 42 36 75 80 47 56 62 1.2. Métodospicércosytabulares en I estacistca descriptive 21 16. v7, 18. Construya una grifica de tallos y hojas comparativa y pone ‘ga una lista de tallos ala mitad dela pagina y luego cologue las hojas “creamy” ala derecha y las “crunchy” la izquier- dda, Deseriba la similitudes y diferencias de los dos ipo. El articulo citado en el ejemplo 1.2 también dio las obser vaciones de resistencia adjuntas para los cilindros: 61 58 78 71 78 81 74 85 12 92 66 89 98 97 83 141 10 126 83 n2 a. Construya na grica de alls y hojas comparativa (véa- se el ejercicio previo) de los datos dela vigay el clindro Yy luego responda las preguntas en las partes b)-d) del ejercicio 10 para las observaciones de los cilindros, bb. {Bn qué formas son similares los dos lados de la gre cca? (Existen algunas diferencias obvias entre las obser- vvaciones de la viga y las observaciones del cilindro? © Construya una grifica de puntos de los datos del cilindr. “Transductores de termperatura de cierto tipo se envian en lotes de 50, Se seleecions una muestra de 60 lotes y se determind cl ntimero de wansductores en cada lote que no cumplen con las especificaciones de disefo y se obtuvieron los datos siguientes: 21240132053313247023 04213113412322845131 5$0232106421603336123 Determine las frecuencias y las freeuencias relaivas de ls valores observados de x — nlimero de transductores en tn Jote que no cumple con las especificaciones. . {Qué proporeién de lotes muestreados tienen a lo sumo cinco transductores que no cumplen con las especificacic- es? , Qué proporcin tiene menos de cinco? {Qué propor cién tienen por lo menos cinco unidades que no cumplen. con las especificaciones? c, Trace un histograma de los datos que uiizan la freewencia relativa en Ia escala vertical y comente sus caracterfsicas En un estudio de productividad de autores ("Lotke Collection Mgmt, 1982: 111-118), se clasificg a un gran ni mero de autores de aticulos de acuerdo con el nsimero de ar- ticulos que publicaron durante cierto periodo. Los resultados se presentaron en la disiibucién de frecuencia adjunta ‘Test Niimero de aniculos 1 2 3 4 8 6 7 8 Frecuencia 784 204 127 50 33 28 19 19 Niimero de ariculos 9 10 11 12 13 14 15 16 17 Frecuencia 6 7 6 7 4 4 5 3 3 a. Construya un histograma correspondiente a esta distri bucién de frecuencia. ;Cual es la caracterfstica mas in- teresante de la forma de la distribucién? Db. {Qué proporcién de estos autores publics por lo menos cinco artculos? :Por lo menos diez articulos? (Mas de diez articulos? fe. Suponga que los cinco 15, los tes 6 y los tr ‘agruparon en una sola categoria mostrada como ¢Podsia azar un histograma? Explique. Ns 1s 22 CAPITULO Generalidadesy estacstica descitiva 4. Suponga que los valores 15, 16 y 17 se enlistan por se- pparado y se combinan en la categoria 15-17 con frecuen- cia 11. {Serfa capaz de trazar un histogram? Explique. 19. Se determiné el mimero de particulas contaminadas en una doblea de silicio antes de cierto proceso de enjuague por ca da oblea en una muestra de tamaio 100 y se obtuvieron las siguientes frecuencia: Niimero de partewas «90 1 2 3 4 5 6 7 Freewnciad 1 2 3 12 1 15 18 10 Nimero de pariculas 8 9 10 IL 12 13 14 Freuencia 12 4 58 3 1 204 44. {Qué proporcis de las obleas muestreadas tuvieron por Jo menos una partfcula? ;Por lo menos cinco particulas? 1b. Qué proporcién de las obleas muestreadas tuvieron en- tte cinco y diez particulas, inclusive? (Estictamente entre cinco y diez particulas? ¢. Trace un histograma con la frecuencia relativa en el eje vertical. {Cémo describiria Ia forma del histograma? 20, El anticulo (“Determination of Most Representative Subdi- vision”, J. of Energy Engr., 1993: 43-55) dio datos sobre varias caracteristicas de subdivisiones que podrian ser utli- ‘zados para decidir si se suministra energia eléetrica eon I= reas clevadas o Iineas sublerrdneas. He agué los valores de Ja variable x = longitud total de calles dentro de una sutvli- 1280 5320 4390-2100 1240 30604770 1030 360 33303380340 «1000-960. 1320 5303350 -S40 «3870-1280 2400 960 1120 2120 450 2250 2320 2400 3150 5700 5220 5001850 24605850 2700 2730-1670 +100 $770-3150 1890 5102403961419 2109, Histograma del ejercicio 22 ‘a. Construya una grifica de hojas y tallos con las milés- mas como el talloy las centésimas como las hojas y €o- ‘mente sobre algunas caracteristicas de la grafic. b. Construya un histograma con los limites de clase, 0, 1000, 2000, 3000, 4000, 5000 y 6000. , Qué proporcién de subdivisiones tienen una longitud ‘otal menor que 2000? (Entre 2000 y 4000? ;Cémo describinia la forma Sel histograma? 21, Elarticul citado en el ejercicio 20 también da los siguien- tes valores de las variables y ~ niimero de calles cesradas y = mimero de intersecciones: yloOLo0o20111210011011 z1861153004400121404 ylLooorl201221102110 zO301101324660118335 ylso301100 2052310003 a. Construya un histograma con los datos y. {Qué propor ign de estas subdivisiones no tenia calles cerradas? {Por lo menos una calle cerrada? . Construya un histograma con los datos x. (Qué propor ciga de estas subdivisiones tenia cuando mucho cinco intersecciones? {Menos de cinco intersecciones? 22, {Cémo varia la velocidad de un coredor en el recorrido del ceurso de un maratén (una distancia de 42.195 km)? Consi- dere determinar tanto el tiempo de record de los prime- ros 5 km y el tiempo de recorrido entre los 35 y 40 km, luego resie el primer tiempo del segundo. Un valor posi- tivo de esta diferencia corresponde a un cortedor que co- sre mas lento hacia el final de la carrera, El histograma adjunto esté basado en tiempos de corredores que partici- paron en vatios maratones japoneses ("Factors Affecting Runners’ Marat6n Performance”, Chance, oto de 1993: 24-30) Frecuencia 200 150 100 so Diferencia — Jt de tiempo =o) 0100200900400 S00 600700800

You might also like