You are on page 1of 48
SET TET 10 Estadistica unidimensional EJERCICIOS PROPUESTOS 1, Clasifica justificadamente las siguientes variables en cualitativas, cuantitativas discretas 0 continuas. a) Namero de defectos en un modelo de automévil 'b) Origen, por continentes, de los ciudadanos extranjeros residentes en Espafia, ©) Edad de los habitantes de una determinada ciudad. 4) Cociente intelectual de los alumnos de una escuela, €) Distribucién del PIB de un pals en 2012 por sectores econémicos (agricultura, industria, servicios). ) Temperatura registrada el dia 1 de julio en cada una de las capitales de provincia de Espafia. 49) Color de ojos de los alumnos y alumnas de un centro hh) Toneladas de cereal producidas en una determinada regién en los iltimos 50 afios. @) Variable cuantitativa discreta @) Variable cualitativa b) Variable cualitativa 4) Variable cuantitatva continua ©) Variable cuantitativa discreta 9) Variable cualitativa 4) Variable cuantitatva continua hh) Variable cuantitatva continua 2. La tabla recoge Ia percepcién de la situacién econémica de Espafia, segin el barémetro del CIS (enero 2013), sobre una muestra de 2483 personas Muy buena Muy | NSI mala | NC el + [16 [ 207 [oa [rata] 4 [2aes) x Buena | Regular | Mala Total a) Halla las frecuencias relativas y los porcentajes. 'b) Representa graficamente los porcentajes mediante un diagrama de barras y uno de sectores a) Las frecuencias rolativas y los porcentajes para las categorias de la variable se recogen en la tabla siguiente x fi hi % Muy buena] 1 | 0,00040 | 0,08 Buena 16 | 0.00646 | 064 Roguiar | 207 | 0.08997 | 5,24 Mala 942 | o,s7e38 | 37,94 Muy mata | 1313 | 0.52880 | 52.88 NSINC 4 | ooo11 | 0.16 b) Los diagramas de baras y de sectores Total ze [4 400 wo Perveptin do i sucin econiion on Expat to. 5ae8 Enero 2013, (Fuente: CS} 04% a 3794 ote — 0% o,0% » co Muy buena » Buena 10 am guar oL2 0.84 oe (i Maia Buena Regular Wale Nig NGING neibescumesgmcett tne me on apa, ‘Enero 2013, (Fumie: CS) inane 50 Unidad 10] Estadistica unidimensional 4 STATE TT ‘Allo largo del ditimo mes, las urgencias atendidas en un centro de salud han sido las siguientes 013127412143653 122586301135422 4) Construye la tabla de frecuencias, bb) Representa graficamente los datos mediante un diagrama de barras de frecuencias absolutas y otro de ‘frecuencias absolutas acumuladas. Dibuja los correspondientes poligonos de frecuencias, a) Efectuado el recuento, la tabla de frecuencias absolutas y absolutas acumuladas queda: x i Fi 0 2 2 1 7 9 2 6 15 3 5 | 20 4 3 | 23 5 326 6 2 | 28 7 1 28 @ 1 30 30, 'b) Los diagramas de barras de frecuencias absolutas y absolutas acumuladas son: aback 1 HD ATE 2X :ndimaro de urgenciag dari 2X :nfimara de urgencias arias Ejercicio resuelto. TATE 5, En una encuesta sobre el precio mensual del alquiler en euros (X), se han obtenido los datos de 1000 viviendas repartidas en una amplia regién. a) Representa gréficamente los datos mediante e! histograma de frecuencias absolutas, 'b) Dibuja el histograma de frecuencias relativas acumuladas ©) Representa los poligonos de frecuencias en los histogramas anteriores. Cases TE 1100, 2007 | 42 [200, 300) | 55 (300; 500) | 135 £500; 700) | 300 {700, 1000) | 283 {1009, 1500)| 110 [1500, 2000]| 75 1a) Como los intervalos no tienen la misma longitud, para dibujar los rectangulos x 7 [Atura del histograma se debe calcular su altura en funcién de la densidad de ftecuontas conespondert a cada ass, Para oll se olge tna unde, on |00.200) { 42 | az ‘esto caso unidad-100 y Ia altura del rectangulo se establece para que el aroa | (200.300) | 65 | 55. represente la frecuencia absoluta: (300, 500) [135 | 67.5 [s00, 700) [300 | +50 {700, 1000) [ 283 | 94.3 {1000, 1800) [ 710 | 22 [7500, 2000} | 75 [15 71000 6 100300 "500700 ‘1000 "1500 wu Proda dal alqul 7000 "500 ) Para representar el histograma de frecuencias relativas acumuladas, se debe caloular la altura de cada rectangulo, teniendo en cuenta la longitud de cada clase y la frecuencia relativa que le corresponde: altura x fi hy Hi attura | gcc 100,200) | 42 | 0.042 | 0,042 ‘0,042 0,042 (200, 300) [55 | 0,055 | 0,097 0,055. 0,097 (300, 500) | 135 | 0,135 | 0,282 0,068: 0,165 1500, 700) | 300 | 0,300 | 0,532 0,150 0,315 700, 1000) | 283 | 0,283 | 0.815 0,094 0,409 T1000, 1500) | 110 | 0,110 | 0,925 0,022 0,434 11500, 2000) [75 [0.075 1 0,015 0,446 71000 1 a0; 040} 0.20) 030) 9,104 ol ‘00900 600700" 1000, 180020002500 2 Procte dol akqulor €) Los poligonos de frecuencias de los histogramas anteriores ya se han dibujado en los mismos. 52 Unidad 10] Estadistica unidimensional STATE TT 6. El gasto medio mensual en calefaccién (X), en euros, de 73 viviendas se muestra en el siguiente grafico ‘0s 100 160 20 250 300 26 Gonto medio on osiefesaiin a) Completa la tabla de frecuencias. 'b) Dibuja los histogramas de frecuencias absolutas y de frecuencias relativas acumuladas. ) Se completa la tabla con las frecuencias relativas (h) y las frecuencias acumuladas, tanto las absolutas (F)) ‘como las rolativas (H): ‘Clases f 7 Fi He [o, 50) 6 | oaz1a | 6 _| 008218 [s0. 100) | 18 | 0.24658 [24 | 0.3287 [100-1507 [15 | 0.205483 | 0.53425 (150.200) [47 | 023266 | 56_[ o,reri2 (200-250) [10 | 0.13699 66 | o,g0ait (250,200) | 7 | o.09sea | 73 | 1.00000 73 4 bb) Se representan los histogramas de frecuencias absolutas, sin acumular y acumuladas 20 10 # a ie oa. “ ar % gos % as. a Od 5 a3] ‘ a2 2 a a aa ‘an 10 veo 260 amo ato "Ooo 100 100 200 a0 900 Gano med on calefeccin 2 Gaeto med en ealteccién 7. Ejercicio interactive. 8y9. Ejercicios resueltos. OTA ONT 10. Considera la siguiente distribucién de frecuencias de una variable cuantitativa discreta. 4) Calcula la media aritmética, 'b) Determina la moda y la mediana €) Halla los cuartles y los percentiles § y 95. a) La tabla proporciona Ja distribucién de frecuencias absolutas y absolutas acumuladas necesarias para contestar las preguntas. x fi A | 2 3 2 16 3 7 1s [ ai 4 i [ = | a0 5 3 [a0 6 3 [se 7 3 ae] 2 % 25 Lancia es nono 221244075, bb) Usando la tabla anterior tenemos que la modal es Ms = 4, al ser este el valor de frecuencia absoluta Para la mediana se tiene en cuenta que el 50 % de 48 es 24, y ordenados los datos de menor a mayor, el valor do la variable que ocupa los lugares 24 y 25 es 4, de acuerdo a la columna de frecuencias absolutas ‘acumuladas. Por tanto es M= 4, ¢) Utlizando la columna de las frecuencias acumuladas de la tabla, los cuartles Qs y Qs se calculan de forma similar @ la mediana: 125 % de 48 es 12 y por tanto el primer cuart corresponde al valor 3, por tanto Q}= 3 De igual forma , ol 75% de 48 es 36, con lo que se llega a Q; Los percentiles 5 y 95 se calculan por el mismo procedimiento que los cuarties: E15 % de 48 es 2,4; de manera qui | percenti § coresponde al valor 2, esto es, ps = 2. E195 % de 48 es 45,6; con los que finalmente, se tiene pos = 7. 54 Unidad 10] Estadistica unidimensional STATE TT 11. La tabla recoge la distribucién acumulada de las e a) Completa la tabla de frecuencias. 'b) Dibyja e! histograma de frecuencias absolutas. €) Galcula la media, la moda y la mediana ylos deciles 1 y 9. ) La tabla proporciona la distribucién de las frecuencias absolutas acumuladas. Se incluyen las clases, las frecuencias absolutas y relativas y las frecuencias relativas acumuladas y la columna fx. Clases § Fi by Hy im, 10.5) 3 3 | 0.0260 [ 00260 [7.5 [s, 10) 2 5 | 00167 [0047 | 150 110, 15) 3 @ [0.0250 [0.0667 | 37.5 (75,25) [4 12 [0.0333 [0.1000 | 80,0 (25, 50) [36 48 | 9,3000_|0,4000_| 1350.0 (50.75) [32 ‘30 | 0.2667 | 0.8667 | 2000.0 175,100) [40 120__|_0,3333 | 1,0000 [3600.0 120) 1 6990.0 'b) Para dibujar el histograma debe tenerse en cuenta que las clases tienen distinta amplitud. En la tabla se ha calculado la altura de los rectangulos del histograma tomando 5 afios como unidad: a Gases [| ature 0.5) | 3 3 3 16.10) | 2 2 i (10.15) [3 3 (15, 25) 4 2 i vaso) [ae | 9 i 150,75) | 32 64 175, 100) [40 3 120 05 1015 a5 La clase modal es [75, 100] ya que presenta la mayor densidad de frecuencias por unidad de medida ( afios) (el recténgulo es et de més altura en el histograma) Para la madiana se tiene en cuenta que el 50% de 120 es 60, y por tanto esta en el intervalo (50, 75), intervalo de amplitud 25, con 32 observaciones. Antes de este intervalo se acumulan 48 observaciones, luego la mediana es: a0 L80=48):28 . 2 9,38 Los deciles 1 y 9 se calculan por el mismo procedimiento: E110 % de 120 es 12 y, como se ve en la tabla de las frecuencias acumuladas, 1D, 25. E190 % de 120 es 108, de manera que el percenti 90 se encuentra en el intervalo [75, 100], intervalo de amplitud 25 con 40 observaciones. Antes de este intervalo se tienen 80 observaciones: __(108~80)-25 40 =75 925 12, Ejercicio resuelto OTA ONT 13. Enun test de aptitudes, la puntuacién obtenida (X) por 260 alumnos se distribuye como sigue: Giases| (0. 10) [{10. 20) |120, 30) [ (90, 40) [140, 50) zt [a [a [| 2 | a 4) Dibuja e! histograma de frecuencias absolutas. 'b) Calcula la media, la mediana y la moda. ¢) Halla las desviaciones absoluta media y tipica y ol CV. a @ o 2 of OD 2%: purusotin obfanida on al tant ») Para los calculos se construye la tabla siguiente: Clases | f, x [ex | aoe |e ax x i [as | s | 7 [37 | 15 | 35596 {10,20 [a1 | 15 18 | e225 | 66 _| 562,96 (20.30) |_| 25 | 2100 | $2500 | 140_| 313,38 (90.40) | ~72_| 35 2520 [ 08 200 | 212 | 451,38 140.50) [a8 _|_45_| 2160 | 97 200 | 260 | 70,92 260 7470 [247 500 246462 x 140 Lamedia es: X- 9 99.73, 0 La clase modal es [20, 30), que contiene 84 observaciones. Calculo de la mediana: EI 50 % de 260 es 130, de forma que la mediana esta en ol intervalo [20, 30), de amplitud 10 y 84 observaciones. Hasta llegar a esta clase se han acumulado 56 observaciones, lueg} 130 -56)-10 ca M=201, = 2881 464,62 €) La desviacion absoluta media es: D, - 4°? 9.479 7 2600 Se calculan la varianza y la desviacién tipica: ATO og73 260 Finalmente, el coeficiente de variacién, que mide la varia 126,466 -> 8 126,466 11.246 fad relativa de las puntuaciones del test: 14, Ejercicio interactive. 1520 Ejercicios resueltos. 58 Unidad 10] Estadistica unidimensional STATE TT EJERCICIOS. Tablas de frecuencia y gréficos 21. Para determinar si un dado es equilibrado © no, snza 100 veces y se anota el nimero obtenido en cada lanzamiento 1125164434365161231 3456425443523656513 1565652126325243433 4255435231362641142 52166146142134316152 ) Forma la tabla de frecuencias absolutas y relativas, b) Representa gréficamente la distribucién, ©) Ala vista de la tabla y el grafico, .se puede afimmar que el dado esté equilibrado? 6 3 6 6 8) Una vez realizado el reevento, a dtibucén de focuonciasabsoltas y° pp relativas es: 1 18 0.18 2 15 0.15) 3 7 o.47, 4 16 0.16: 5 16 0.16: 6 18 0.18: Lo b) La distibucién de las frecuencias absolutas (0 relativas) se puede representar mediante un diagrama de barras (observa la escala del eje vertical): 6 i 2 3 4 6 6 _X ndrnere de cara del dad. €) Ala vista del diagrama de barras y de Ia tabla de trecuencias, aunque hay diferencias entre las frecuencias de los distintos resultados, no hay suficiente informacién para decir que el dado esta sesgado. Habria que ‘aumentar el ntimero de ensayos para poder llegar a una conclusién, Si el dado esta equilibrado, la frecuencia road cad ented deri etbzane entre a OTA ONT 22, Enla tabla siguiente, se muestra la distribucién de frecuencias de una variable estadistica X. 1] 3[s[7]9 |" 14 [10 [8 [ 30 | 32 [21 distribucién de frecuencias absolutas acumuladas y de frecuencias relativas absolutas y acumuladas. a) Hal 'b) Representa los diagramas de frecuencias relativas y de frecuencias relativas acumuladas. a) La tabla se amplfa con las columnas de las frecuencias absolutas y las frecuencias relativas. 1 [14 forat[ 14 | oat 3 [10 [ooaro| 24 [02087 5 | 8 |[oosse| 32 | o27e9 7 [30 [o2608[ 62 | 05391 2 [32 [ozres| ea | oaira a1_[_2t_[o.te26| 175 [1.0000 bb) Los diagramas de frecuencias relativas y frecuencias relativas acumuladas son respectivamente: 0.904 0.7788 920001 He 3 peEeseeaees a 58 Unidad 10] Estadistica unidimensional STATE TT 23.*La primera estrofa y el estribillo de la cancién del pirata, de José Espronceda (1808-1842) dicen asi: Con cien caftones por banda, Viento en popa a toda vela, ro corta el mar, sino vuela, un velero bergantin; bbajel pirata que llaman por su bravura, e! Temido fen todo el mar conocido a] s2__| 1933 1a) Representa las dos distribuciones mediante un diagrama de barras. bb) Dibuja el diagrama de sectores para cada distribucién con los porcentajes correspondientes. @) Los diagramas de barras de frecuencias absolutas son: som : com 00 m= aon a Stee) en = Jam i a0 zm ‘eo ‘tt 6000- - 1933, a ¢ a2 ° 2 3 7a 4 2 3 78 vcr tovdiace xin dp dine Imngiicadou en acckderriog mplicados en acciderrieg moriaiea ') A\la tabla se le aftaden las columnas correspondientes a los porcentajes del niimero de accidentes con vicimas mortales y del numero total de accidentes, ademas de las columnas con los grados sexagesimales que corresponden a cada valor de la variable. x |monates] Total | iomies | % Tota | AMIE | Anguo tote + [asa [2120 | 5308% | a060% | 19102 | 190.27 2 | 690 | 4a50a | a7aa% | 52.40% | 10476 | 10865 3a tos | sess [642% | 658% | 2310 | 23,70 >a_| s2_| 1939 | 300% | 290% | 11.92 8:38 1688 [e027 | 100% | 100% | 360 360 Y los diagramas de sectores correspondientes son \Vahfoube inplondoe on naskirtss mornin \Vehloutoe Inpcadon en aceldonie a 00% sare 1 1 59,06% 2 a 2 srs BA OTA ONT 26. El porcentaje de poblacién activa, por sectores_ [ —"Seqier [Total MlereS | HOMES econémicos, quo se desprende de la Encuesta de Poblacién Activa (EPA), de finales de 2012, incluyendo el total y [Agricultura 44 | 26 5a distinguiendo entre hombres y mujeres, se muestra en ta [Industria 141 | 78 | 193 tabla siguiente. Construccion [66 [1.2 [11.4 4) Representa las tres distribuciones en un mismo diagrama de [Servicios 749 | 685 | 63.7 barras, b) .Qué diferencias se observan entre los hombres y las mujeres? ©) Dibuja un diagrama de sectores para cada distribucién, @) El diagrama de barras es el dela derecha 'b) Entre otras observaciones, se puede ver que los hombres son mayorla en los sectores de agricultura, industria y SRBESEESIES wate nts el ec aeNcos Sore ‘te omen . cs abe Go as €) Para nace ls agar de sores nay on a ala una cona con fos gos soxgusnls este Se detain [Angulo “Angulos Angulo Sec [Fo | RE [ans | ERS | ones | RS, Agricultura 44 | 15,84 25 9 59 21,24 rasa [144] sore | 7a | ee | ies | ea onamuedba| 65 [zay6| 12 [ase [| 5895 Senin — [7a [oso.e| eos | ates [ear | zoom 0 0 360 (Distribucién de mujeres por sector (Distribucién de hombres por sector 2 re ap 1.2% Agreubura. Agcubira, (0 Inekuatrta 0 Industria (@ Construcaién [BE Servicios chet ene perme 62 Unidad 10| Estadistica unidimensional STATE TT Medidas de localizacién y de dispersion 27. En cierta ocasién, se reunieron § miembros de una misma familia, de edades 23, 28, 32, 35 y 40 aftos. ) Calcula la media y la varianza de las edades. ) Cuatro aos mas tarde vwelven a reunirse los mismos familiares, {cual sera entonces su edad media? gy la varianza? 23) 28132) 35 140 4) La media artmética es 2 16 Ya varianza: s? PORE SE 3814 sag 33,84 'b) Cuatro afios més tarde, la nueva variable es Y= X + 4. La media seré cuatro afios més y la varianza la misma, 03 decir, ¥ 356 33,84 Silos datos se “trasladan’ uniformemente, la dispersion respecto a la media no varia 28. Sabiendo que 3 es la media del conjunto de datos: 2,3,2,5,x,6,4,0 Encuentra el valor del dato que falta, ‘Se escribe la media del conjunto de datos y se iguala a 3: 2312151 x: 61410 8 }-9x 4 22=Dh-ox=2. SET TET 64 29. El salario medio (X) en cuatro empresas ubicadas en una 30. Unidad 10| Estadistica unidimensional misma poblacién y cl numero de empleados que |Empresa| A BI & py actualmente tiene cada una de ollas viene dado en la tabla |__| 1500 | 1625 | 1450 | 1275 siguiente fi 115 [ eo [ 38 | 7 a) Calcula el ingreso medio de todos los empleados. ') Elige y dibuja un grafico que represente la importancia relativa de estas cuatro empresas en cuanto al niimero de empleados, ©) Halla la varianza y la desviacién tipica 4) Calcula el coeficiente de variacién y comenta el resultado que se obtiene Para los calculos de los apartados a), ¢) y d) se construye la tabla siguiente: Empresa] | fi tx tat ‘A__| 1500 | 115 | 172500 | 258 750000 B [1625 | 60 | 97500 | 188437 500 c [1450 | ae | 55100 | 79895 000 D__[ 1275 | 77 | 98175 [125173 126 290 | 423276 | 622255 625 x1 Spy, . 428275 EI salario medio de los empleados de las cuatro empresas es: X= > fx, ° i a0" 145957 'b) Se puede representar el ntimero de empleades de cada empresa mediante un diagrama de barras o uno de sectores, ulizando las frecuencias absolutas 0 relativas (porcentajes). En el diagrama de barras se ha representado cada empresa con su numero de empleados (frecuencia absoluta) y en el de sectores cada ‘empresa con el porcentaje de empleados del total que le corresponde (frecuencia relativa). 140 Dierbuciin ce femion vo] 418 100 0. 7 4% a 3 wo. oo 5 ie = ‘os e 3 =D 2. 21% ° €) Caleta a vatianza yl desictn lea usando os datos deal antro a lS pat Re SESE ye 572 woe 280 ‘2397 $-Ta887 El valor cide inde cue loser sn lta hemagnecs ent lt empress, protein una bola arabe s 4d) El coeficiente de variaciones, por tanto, CV 0849 En un determinado mes la media aritmética de los salarios abonados por una empresa a sus empleados ascendié a 1400 euros. La media de los salarios pagados alos hombres ascendié a 1600 euros, mientras que la media de los pagados a las mujeres fue de 1360. Con esta informacién, zcudles son los porcentajes. de mujeres y hombres empleados en esta empresa? Sip es la proporci6n de hombres que trabaja en esta empresa, 1 ~ p es la proporcién de mujeres. Entonces, con la informacion proporcionada se tiene que 1600 p1350(1-p}- 1400 De donde se obtione que p = 0,2. Es decir el 20 % de las empleados de esta empresa son hombres y el 80 % mujeres. OLUCIONARIO 31, El nimero de faltas de asistencia (X), en un grupo de 35 alumnos, a la clase de Matematicas Aplicadas a la Giencias Sociales |, se ha agrupado en la tabla siguiente wlol+[2[3][4 ifels[7[sl[a a) Representa graficamente la distribucién de frecuencias absolutas y absolutas acumuladas. ') Dibuja los poligonos de frecuencias absolutas y absolutas acumuladas. ©) Calcula el nimero medio de fatas de asistencia en esta clase, También la moda y la mediana, 4) Calcula as desviaciones absoluta media y tipica ){Cudntas falas tiene como minimo un alumno que se encuentra entre el 25% que mas falta? f)Determina los percentiles 34 y 67. a) Para las representaciones graficas y los x fi A ty | te? fx X | fx X célculos de mecia y meciana se aftaden a Es ta tabla las couimnas ‘de frecuencas [0 | 12 | 12 | 0 | 0 | 150 | 19.08 absoluias acumuladas y ta de bos [1 | 8 | 20 |e |e | ose | 472 Brodit nacesaris para tos apatades [pT 7 |ar [ia [ a8 [eat | 578 siguientes 3 [5s | 2 [1s [as [sar] 705 Los diagramas de barras y tas grafcas de [4 | 3 | 35 | 12 | 43 | 2ar | 723 tos poligonos de frecuencias absolutas y [5 [2 [a7] 10 | 80] 341 [682 absolutas acumuladas son: 7 is OT “ 4 2 c do ba i. ps fe he 45 i : Ea 5 ° ° o 4 2 4 4 6 oi 2 3 4 6 "x: nam defn anita "X:nmansd tetas a antincle 'b) Los potigonos de frecuencias se incluyen en los grficos anteriores ©) El nimero medio de falta viene dado por: x - 9° 159 faltas de asistencia La moda es M, -0, ya que es el valor de la variable que presenta mayor frecuencia (12). ‘Como se tiene un nlimera impar de datos (37), la mediana es al valor de la variable que ocupe la posicién 19 que, observando la columna de las frecuenclas acumuladas, es M1. 4) La varianza y desviacién tipica vienen dadas por: 21 Spe 2 184592 2295-5 5, 1515 a a7 Para ol célculo dela desviacionabsolita metia usamos la dima columna ts), gy 5064 0-2 Sth -¥ 378 ap lA“ €) Un alumno que esta entre el 25% de alumnos que mas falta se siti por encima del tercer cuartl, Como el 75% do 37 os 27,75, mirando la columna de frecuencias absolutas acumuladas, vemos que debe tener al menos 3 faltas. ) Para identiicarlos percentiles 34 y 67, vemos que’ EI 34 % de 37 es 12,58. La primera frecuencia absoluta acumulada que alcanza esta cifra corresponde a ps1 E167 % de 37 es 24,79. La primera frecuencia absoluta acumulada que alcanza esta cifra corresponde a pey= 1. OTA ONT 32, De una muestra de 100 hogares, seleccionados al rnlimero de personas empleada: toriamente en una ciudad pequefa, se contabiliza e! ‘Los datos se recogen agrupados en /a tabla siguiente ol[1[2|[3]|4 11 | 35 [ 32 [13 [9 1) Caloula ol numero medio de empleados por hogar y su desviacién tipica. 'b) Representa los datos. {Puede considerarse asimétrica esta distribucién? ©) Determina los percentiles 5 y 95. ;Cudntas unidades de la muestra se encuentran entre esos dos percentiles? 2) Se amplia la tabla con las columnas necesarias para calculor los (SERN fi [Nn me] valores que se pide o [| oo Entonces, el nimero medio de empleados (la media de ta [1 | 35 | 35 [35 distribuci6n), su varianza y desviacién tipica son: 2 32, 64 128 Media x 174 474 empleadios 3 ee eC 100 4 9 36 144 Varianza: sf 424 474? 42124-6, [too [174] 424 | 100 7 * b) Se representa la grafica mediante un diagrama de barras 35 de frecuencias absolutas: 35: a2 duo. La dstibucién de frecuencias es claramente asimética. Boe Para vor smoten, os fecuences a suena years A del valor x= 2 deberian serparecidas 2 1: 8 i ia a 5 0 oo 4) 3 3 4 X :ndmero do empleedoa por hoger €) Para el céleulo del percent 5, ps, se ordenan los datos de menor a mayor y el valor que deja al menos el 5 % de los datos por debajo (y como mucho el 95 % de los datos por encima) (el 5 % de 100 es §) os Ps=0. El percentil 95, pes, el que deja como mucho 5% de los datos encima (y al menos el 96% por debajo) es ps = Entre estos dos valores se encuentra el 90% de los datos de la muestra. Como se tienen 100 observaciones, 90 de ellas estén entre estos dos valores. Ahora bien, si descontamos los valores x= 0 (11 observaciones) y (9 observaciones), entre estos dos valores tenemos 80 observaciones distintas de 0 y 4 66 Unidad 10| Estadistica unidimensional OLUCIONARIO 33. Ena tabla siguiente se muestra el nimero de alumnos fi, la calificacién media, x, y la varianza, s de alumnos que cursan Matematicas aplicadas a las Ciencias Sociales, de 1° de Bachillerato. Guo * [| = aA_| 3 | 62 | 28 a | 3 | se | 3 ec pz] s [2 a) Calcula la nota media global de los tres grupos. ') Halla 6! coeficiente de variacién para cada grupo y ordena los grupos por homogeneidad, *) Para responder a le cuestonesplateedae, ee afteden aa table ls columnas de fos producto fy lade los cosficientes de variacién de cada grupo, CV, Grupo [fi % s tx__OVi A 31 | 62 | 28 | 1922 | 0.2609 8 35_| 58 3 [203 [0.2986 c 32 5 2 | 160 | 0.2828 98 555.2 La nota media global se obtiene ponderando la media de cada grupo por su numero de alumnos. Es decir: b) El-coeficiente de variacién de cada grupo se ha incluido en la titima columna de a tabla CY, 3, con ne reit, rete demerara mayor seabed v0 9890, 02828 CVo-0.2066. 34.*La produccién de romolacha azucarora dada on toneladas (X), en 4 fincas con distintos tipos de cultivo y distintas superficies dadas en hectareas se da en la tabla siguiente: Fincas [ha x A 6 42 B 10 60 c 4 32 D 7 40 ) Calcular el rendimiento por ha en cada una de las cuatro fincas, ') Hallar el rendimiento medio global y la variabilidad por ha de terreno. 8) Se aftade a la tabla la columna de los rendimientos medios por ha en cada una de las cuatro fincas, obtenido dvidiendo |_Fineas | ha x | RWha fa produecién total de cada finea por su superficie. A 6 42 | 7,000 Puede observarse que el rendimiento medio mas alto se da | __B. 10 so__| 6.000 en a finca C, 8 toneladas por ha, y ol més bajo en lafinea D, | c 4 32 |_8.000 5,714 toneladas por ha. D 7 4o__| 5714 ) EI rendimionto global se oblione divdiondo la produccién 2 174 total 174 toneladas, entre las 27 ha de cultivo que hay entre las tres fincas. Es decir: 174 _ 6,444 toneladas por ha. 2 OTA ONT 35. La distribucién de ‘5 temperaturas maximas en °C (X) alcanzadas en una localidad en 60 dias consecutives viene dada en la tabla de la derecha. (100) | 11 fo) [12 15.10) | 14 (10.15) [14 115,25) | 12 4) Representa gréficamente los datos y dibuja el poligono de frecuencias. 'b) Calcula la temperatura media en la localidad de los 60 dias y su desviacién tipica ) Determina la temperatura que solo fue superada el 5 % de los dias. a) Se representa la distribucién de las temperaturas mediante un diagrama de barras. Se ha tomado § como Unidad para la base de los rectangulos, de tal manera que las frecuencias de cada clase se corresponden con el érea de los rectangulos. ara dibujar el poligono de frecuencias se aftaden dos clases con frecuencia cero al principio y al final de la distribucién. La longitud de estas clases es la misma que la de las clases que le siguen 0 que le preceden respectivamente “7 0 os =! XC tamporsturaa miodnas b) Se afiaden a la tabla las columnas necesarias para el célculo de la media y de la desviacion tipic (10,0) (0,8) 15, 10) [10, 15) (15, 25) De esta manera, la media es: X. 7625 °C 60 la varanza y desvicion tipica son: «*— 9-28 reas 6a.4gas > s-8:345°C ¢) Para determinar esta temperatura, se incluy6 en la tabla anterior Ia columna de las frecuencias absolutas acumuladas. Se trata de encontrar el percentil 95, pes, Como el 95% de 60 observaciones son 57, el percentil 95 se encuentra en el intervalo [15, 25), cuya longitud es 10 y que contiene 12 observaciones. Ademés antes de este intervalo se tienen acumuladas 48 observaciones. Luego: Unidad 10| Estadistica unidimensional STATE TT Sintesis 36. El nGimero de hijos (X) de una muestra de 100 familias se recoge en el siguiente diagrama de barras. co 30 25 . 20 15 10} 5 0 Ci 2a 4 ‘Naimero Ha ios a) Escribe la tabla de fracuencias y representa la distribucién mediante el diagrama de frecuencias relativas acumuladas. 'b) Calcula la media, la moda y la mediana. ¢) Determina los cuartiles Q1 y Q3. ) Construimos la tabla a la que se le afiaden las columnas de las frecuencias relativas (h) y las frecuencias relativas acumuladas (H) y las columnas con los productos necesatios para los célculos posteriores. o 020 | 0,20 1 [os a5] 0.55 = 2 25 | 80 | 025 | 080 | 50 3 ses [ors {oes [ss a 700 | 0,05 Se a] Y el diagrama de barras correspondientes os 19: op. ag. i a7 os. os: Ua- 0s. E oz. of 09. o 4 2 4 4 > rnimera da hips 'b) Para calcular la media y la mediana recurrimos a la tabla de manera que la media es 1 Spy 180 Xe agg“ a00" 88 La modiana, se obtiene de la siguiente manera: el 50 % de 100 es 50 y ol valor de la variable X que, una vez cordenados los datos de menor a mayor, ocupa el lugar 50-51 (observa que el nimero de datos es par) es 1. Por tanto, M- La moda es M, = 1, al ser el valor que aparece mas veces (36) en la distribucién, €) Los cuartiles primero y tercero se caleulan de forma similar a la mediana (cuartl 2). Q,, cuartl 1°. EI 25 % de 100 es 25. E! valor de la variable que ocupa el lugar 25, ordenados los datos de ‘menor a mayor, es Q; = 1. Coincide, por tanto con la mediana. E175 % de 100 es 75. Por tanto el cuartil Qs =2, que es el valor que ocupa el lugar 75 una vez ordenados los datos de menor a mayor. SET TET 37. La distribucién del peso en kg (X) de una muestra de 65 estudiantes 25; de un centro educativo se muestra en el siguiente grafico: %. a) Escribe la tabla de frecuencias y dibuja el poligono de frecuencias 35. relativas acumuladas. 1% 'b) Obtén el peso medio y desviacién tipica 15. €) Caloula la mediana y los cuartiles primero y tercero. 10. 6 4 6 6 70 8 oD XX: peso estudientos (ka) 2) A partir del histograma construimos la tabla de frecuencias ampliada para los cdlculos posteriores: x fh 5 hi Hh x fix, a 140, 50) |_6 6 | cos | oo92 | 45 270 __| 12150 50,60) | 12 | 18 | 0185 | 0277 | 55 660__|_36 300 0.70) | 25 | 43 | 0385 | 0662 | 65 1625 | 105 625 vo,a0) | 14 | s7 | ozs | oar | 75 soso_| 78750 jso,00) | 8 | 65 | 0123 1 85 e30_| 57 800 6 1 4285 | 290 625 AA pattir de los datos de la tabla se construye el poligono de frecuencias relativas acumuladas. oe 4 0 0 8 7% 0 w Psa estadortes (3) 'b) El peso medio de los estudiantes y su desviacién tipica se calculan a partir de los datos de la tabla x A osers kg 5 Pgs 9928? =125,902 > = 125,302 11194 kg ©) Para el célculo de los cuartiles se utlza la columna de las frecuencias absolutas acumuladas. Cuaril Qs. E125 % de 65 es 16,25, que se acumula en el intervalo [50, 60), de longitud 10 y que contiene 12 observaciones. Antes de éste intervalo se tienen acumuladas 6 observaciones, luego: 0, = 50410-18258) 58 5429 Cuarll Q:. Es la mediana. EI 50 % de 65 es 32,5, que se acumula en el intervalo (60, 70), de longitud 10 y que Contiene 25 observaciones. Antes de este intervaio se tienen acumuladas 18 observaciones. Luego 10. 325 18) 25 Cuartl Qs, E175 % de 65 ¢s 48,75, que se acumula en el intervalo [70, 80), de longitud 10 y que contiene 14 observaciones. Antes de este intervalo se tienen acumuladas 43 observaciones. Luego: 18 kg M-Q,-60 10-(43,75~ 43) 70 a 4 74,11kg 70 Unidad 10] Estadistica unidimensional STATE TT o[’]2]3|]4|5 wa folel4[s|t 1a) Determina ta moda, la mediana y la media Cual de ellas representa mejor la distribucién de los datos? 'b) Calcula la desviacién absoluta media, €) LQué porcentaje de datos se encuentran en el intervalo (X-2s,¥-+2s), siendo s la desviacion tipica. a) Para los caiculos posteriores, se afiaden a la tabla las columnas de las frecuencias absolutas acumuladas y las necesarias para hallar la media y la varianza, [a Te a [| o | o ee 6 [30 | 12 | 24 4 [34 [2 | 36 3 1 a7_|_12_| 48 38_|_5 | 25 a a Con los datos y resultados de la tabla, se tiene que: Lamoda es M; = 0, que es el numero de materias suspendidas que aparece con mas frecuencia. La mediana es M~= 1, ya que ordenadas de menor a mayor es la calficacién que ocupa los lugares 19 y 20, La media aritmética: x - 511342 asignaturas suspensas, El valor que mejor representa la distribucién, dada su asimetria, es la mediana, aunque en esto caso el valor de la media no esta muy alejado de la mediana. 'b) La desviacién absoluta media se calcula a partirde su definicién: EM x[- At 109 la desviacién tipica de la distribucién a partir dela Gitima columna de la tabla: 0, NB ano 1019 o> 8 /19619 -14007 4) De modo que el intervalo: (28, X28) (1342-28014, 1;342+2,8018) 1459, 4.1434) incluye 37 observacions , que representan el 97,37 % de las mismas. n OTA ONT 39, Unidad 10| Estadistica unidimensional En los diez primeros partidos de liga, los goles marcados por dos equipos de fitbol rivales fueron: Equipo A: 0, 2,1, 5,1,4,3,0,2,1 Equipo B: 2, 1, 0,0, 6,1, 4,2,1,1 4) Determina la media, mada y mediana del nimero de goles marcados por cada equipo y compéralas. ') Halla los cuartles del nimero de goles de cada equipo. ©) Dibuja el diagrama de caja de las dos distribuciones. Compéralos. 4) Calcula el coeficiente de variacién. 4. Cual de los dos equipos muestra mayor regularidad? 2) De los datos se obtione que la media de goles de cada equipo os Os 2111511: 4s Bi 08264 10 10 ‘Ambos equipos presentan la misma moda Mo, ~ Mo, -1. En el caso del equipo A, marcé esa cifra de goles en tres partidos y en el caso del equipo B en cuatro partidos. ise ordena de menor a mayor la distribuciin de los goles en ambos equipos: Equipo A: 0,0, 1,1, 1,2,2,3,4,5 Equipo B: 0,0,1,1,1,1,2,2,4,6 Al tener 10 observaciones (niimero par), la mediana es cualquier valor comprendido entre los que ocupen las osiciones 5 y 6. Luego la mediana del equipo A es 1 6 2 (cualquier valor entre estos dos puede considerarse ‘mediana), mientras que la mediana del equipo B es 1. Si se comparan estos valores, se deduce que ambos ‘equipos presentan cifras muy similares. 19 DAN OO+G As 2etit 18 b) Se deben calcular, para amas distribuciones, los cuartiles primero y tercero. El segundo cuartl, Ja mediana, ya ha sido calculado, Cuartles de la distribucién del equipo A: Q: = 1, Qz= 1,5 y Q)= 3 (Para la mediana se ha tomado el punto ‘medio entre 1 y 2) Luego ol rango intercuartiico del equipo A es RIC, 3-1-2. ‘Andlogamente para la distribucion de goles del equipo &: Cuartles de la distribucién del equipo B: Qy = 1, Q=1y Qs El rango intercuartiico del equipo B es RICe. 2 €) De los resultado del apartado b) resulta que para el equipo A, los extremos del diagrama (los bigotes) son: Q + 1,5 RIC, = 3 + 1,5:2 = 6. De donde LSs (mayor de los valores que son menores o iguales que Qy=1,5 RICK es 5 Q; - 1,5 RICy = 1 ~ 1,5:2 = -2 De donde Li, (menor de los valores que son mayores 0 iguales que Q;— 1,5 RICp =0. Y para el equipo 8: Q + 1,5 RIC = 3 + 1,52 = 6. De donde LSs (mayor de los valores que son menores o iguales que Qy+ 1,5 RIC)=6. @; - 1,5 RIC Q;— 1,5 RIC) =0. Los diagramas de cajas quedan, entonces, ast j Hi 4-152 2. De donde Llp (menor de los valores que son mayores o iguales que : STATE TT 4) Para calcular los coefcientes de variacién necesitamas las desviaciones tipicas: (0-19)7-2+ (1-49)°-3+(2-19)"-2+(3—19)' +(4-19)' +(5—19)" ge oT 49 = 5, =1578 og Oat 21-18) +(2-48) 24-18) 6-18) gig, -a778 De donde: ov, = 1578 gest cv, -1778 _aoe8 19 1 Parece que el equipo A presenta algo menos de variabilidad. Esto también se puede observar en el diagrama de cajas. CUESTIONES. 40. El valor mas pequefio observado de una variable estadistica cuantitativa continua es 34,2 y el mayor 43,3. Se dispone de 110 observaciones. Haz, de forma razonada, al menos dos propuestas para agrupar las observaciones de esta variable en clases. ‘Como el rango de las observaciones es 43,3 ~ 34,2 = 9,1; se puede proponer: 2) Dividir el recorrido de la variable en 7 clases de longitud 1,3 cada clase: (34,2; 35.5); (35,5; 36,8); (36,8; 38,1); [38,1; 39,4); (99,4; 40,7); (40,7; 42,0) y (42,0; 43,3] Es la propuesta mas ajustada y, tal vez, la mas recomendable en este caso 'b) Si se propone utlizar 10 clases (por tener mas de 100 observaciones), puede hacerse con clases de longitud 1, desde 34a 44: (34; 35); (35; 36); (96: 37): (37; 38); [38; 39); (39; 40}; (40; 41); [41 42): (42; 43) y (43; 44) ‘Aunque en esta propuesta los intervals incia y final han quedado algo desequilbrados, ya que se resté 0,2 al primero y se afiadié 0,7 al titimo. €) Una tercera posibilidad, con 10 intervalos de longitud 1 seria equilbrar lo que se afiade y se resta al maximo y al minimo, respectivamente, de las observaciones: (33,8; 34,8), (34,8; 35,8); (35,8; 96,8); (36,8; 37,8), (37.8; 38,8); (38,8; 39,8); (39,8; 40,8); (40,8; 41,8); (41.8; 42,8); (42,8; 43.8) 41. Sea una variable estadistica X que toma valores x,,x, xX, con frecuencias v FA fafyoof, ¥ Suya media es X Considera la variable aleatoria Y, de valores los dela [yy x] f tabia y con frecuencias absolutes f,f,..., iguales a las de los valores |y' y x| + correspondientes de X. 7 2 Calcula la media de Y. yx xt Se calcula ta mosia de Y susituyendo sus valores en funcion de X yuiizando que N= Sify X ae so obtiene Portanto, ¥ =0. OTA ONT “ 45. Sila media, obtenida a partir de una muestra, de una variable 42, De una caracteristica X se obtienen las observaciones 1, 5, 7, 3,7, 11, 1¥3 a) Caloula la media y la varianza de X. 'b) Multiplica los valores anteriores por 2 y obtén ahora su media y su varianza, W5/TBTIMNN3 3B 8 8 gE ry 475 39-475? 10,4375 a) La media es X= 75 y la varianza ») Para la variable Y=2X se obtionen los valores 2, 19, 14, 6, 1 22, 2,8. Entonces: Y- Zero ren S ete 72+216 P95; es decir, 7 2266210142422" 8 La varianza de Y: 95-4175 jes decir, 63 =2's: 43. Sea X una variable estadistica cuya media aritmética es X , y su varianza s*. A los valores de la variable X se les suma la constante k, obtenléndose una nueva variable eCuales seran la media y la varianza de Y? ‘Si X es una variable estadistica cuya media aritmética es X , la media aritmética de la variable Y= X + kes: 13 Tey KE VS xk Ut Sth x ok WO er yy te Bry, Ws yla varianza es: s? Bl 1k Xs wy TSG (XY NY Es decir, a varianza no cambia pero la media se ve trasladada k unidades, por tanto la traslacién de los datos no influye en su dispersion alrededor de la media. 44, Sea X una variable estadistica cuya media aritmética es X , y su varianza s Considera ahora la variable Y, resultado de multiplicar los valores de X por una constante ¢. Calcula la media y la varianza de Y. =X es: Si Xs una variable estadstica cuya media antmética es X, la media arimética de fa variable Es decir, la media queda mutiplicada por ¢ y la varianza por c”, por tanto la dilatacién de los datos influye en su dispersién alrededor de la media, sstadistica cuantitativa es 3 y su varianza 25, use puede decir que la media es representativa del conjunto de datos? Para estudiar la variabilidad hay que calcular el coeficiente de variacién. Si la variable es X se tiene: Esto indica que los datos no son muy homogéneos y, por tanto, es facil que la media resulte poco representativa, Unidad 10| Estadistica unidimensional STATE TT 48. Sia los valores obtenidos de una variable estadistica cuantitativa se les multiplica por una constante k, Zen qué medida cambia ol coeficiente de variacién? Nota: prueba con los valores 1, 2, 5, 7 y 8; y con k= 3. SiXtoma los valores 1, 2, 5, 78, entonces ¥=3X tomaré los valores 3, 6, 15, 21 y 24, de donde: x M2 TIB yg. y 916152 ey gy 5 5 Las varianzas y desviaciones tipicas son: PLS HTB 34 68158421 +64” 46 =7.44 = 5, =273 y Sf ~ 13,8" = 66,96 => s, = 8,183 5 5 273 58188 x 46 0.883 ¥ OW Yo 138 Es decir, os coefcientes de variacién no cambian ante una dilatacién de los datos. Para el caso general, se pueden aplicar los resultados obtenidos en la cuestion 44, Asi, al multipicar una variable estadistica X por una constante k, se obtione la variable Y= KX, cuya media y desviacion tipica se relacionan con la de X en la forma: ¥=4X y 5, =K's, . Por tanto, los respectivos coeficientes de variacién se relacionan en la forma: OMe — $y. $5. 8X _ boy X Ov, WR or tanto los cooficientes de variacién son: CV, 593, = CV, = CV, que confirma el resultado obtenido anteriormente, SET TET PROBLEMAS. 47. En la encuesta del CIS (centro de Investigaciones Sociolégicas) correspondiente al primer trimestre de 2013 sobre el nivel de estudios, se obtuvo Nivel de estudios f Sin estudios 147 Primaria 1055 ‘Secundaria| 319) FP 451 Universitarios Medios 210 Universitarios Superiores 293 No contesta 8 2483) ) Calcula la distribucion de frecuencias relativas y de porcentajes. ') Ulliza el grafico més adecuado para representar la distribucién de los porcentajes. a) Ala tabla se le afiaden las columnas de las frecuencias relativas y de los porcentajes: Nivel de estudios i _[ Porcentajos Sin ostudios 1a7__| 00592 | 5.92% Primaria 7055 | 0.4269 | 42.49% Secundaria 318 | 0285 | 12.85% FP. 451 0.1816 | 18.16% Universitarios Medios 210 | 0.0846 | 8.46% Universitarios Superiores | 203 | 0.1180. | _11,80% No contesta 8 00032 | 0.32% 2483 1 100% 'b) Se propone un grifico de barras o un diagrama de sectores: 45) azaom a 25. 20: 3. 2. Ba 8 126% 100% 10: jaan 240% 280% 76 Unidad 10] Estadistica unidimensional So tie? Dibtbuciin del nbel de extudion 08% same Sin extuckon Primaria Secundaria =F 1 Unbecitaroa radios 1m Unbortiarcs. supariorea: 1 No contosta OLUCIONARIO 48. La esperanza de vida, con base en 2012, en los paises de Africa se muestra en el siguiente histograma con los paises agrupados por intervalos de edad (Fuente: CIA WorldFactbook). in % 2 a 3 Ope Hate 2. Dh 7B 2¢ esperanza de vida {aroa) ) Construye la tabla de frecuencias. 'b) Dibuja el poligono de frecuencias absolutas acumuladas. ©) Calcula la media, mediana y la moda. 4) Determina la varianza y las desviaciones tipica y absoluta media, Compara estas dos iltimas. 2) A partir del histograma se recupera y amplia > = la tabla de frecuencias para los calculos | Clases | f | A | m | fx fx! Ax, | osterires: assa)_| 17 | 17 [515 | 0755 [45 088,25] 135,370 La tina columa se ha escrito aqui por (15459) | 12 | 29 [65 67a | sas07_ | 35,558 comodidad, aunque para su calculo se utiza | (68.64) | 15 | 44 [61.5 | 922.5 [66 733,75] 30,556 la media hallada en el apartado o) (469) | 2 | 45 [965] 133 | aaaas | 14.074 (e974) | 2 | 48 [715] 143 | 102045 | 24,074 (r4.7a|_| 6 | 54 [765] 459 | 351135 | 102,202 4 B2it [1943115] 341,852 'b) El poligono de frecuencias absolutas acumuladas es: 1: a? i 20. 2. 10. o. ao 4 oS emo 26 ecparuiza a via (fw) ©) Para los caleulos recurrimos a la tabla: Media aritmetica: x - 9211 59.46 afias 54 La mediana: el 50% de las 54 observaciones son 27. Ordenadas de menor a mayor y mirando en la tabla la columna de las frecuencias absolutas acumuladas (F), la observacién que ocupa el lugar 27 se encuentra en el intorvalo [54,58), cuya longitud es 5 y que contiene 12 observaciones y antes de este intervalo se han (27-176 acumulado 17 observaciones, Luego la mediana es: M4 544 598,17 aos. El intervalo modal es [49, 54), que contiene 17 observaciones. 4) Con ayuda de la tabla del apartado anterior se obtienen la varianza y las desviacion tipica y absoluta media, 194.3145 341.852 34 93 anos, D, 6,33 aftos. ‘Se observa que la desviacién tipica tiene un valor superior al de la desviacién absoluta media, SET TET 49. En la siguiente tabla se han agrupado las provincias espafiolas segin su tasa de natalidad (X: nacidos por 1000 habitantes) en el afio 2011 (Fuente x fi INE). 157; 8) 4) Halla la tasa media de nacimientos por provincia en el afio 2011 [g; 10.3) 24 'b) Determina la moda y la mediana, (10,3; 12,6) 8 ¢) Representa los datos. (12.6; 14.9) 0 4) Caloula la varianza y a desviacién tipic. (14.9; 17.2) 1 ) Determina el cosficiente de variacién. 17.2: 19,5] 1 a) Se afiaden ala tabla las columnas necesarias para efectuar los célculos que se piden x fi Fi x 1% i (5.7:8) 8 8 605 | 548 | 375,98 {g; 10.3) 24 2 3.15 _ [2196 | 2009.34 10.3: 12.6) [18 50, 11.45 | 206.1 | 2359,845 (12,6: 14.9) [0 50, 13.75 o 0 (14.9: 17.2) [1 51 16,05 | 16,05 _| 257.6025 (72195) [+ 52 78,35_| 18.35 _| 336,7225 52 514.9 | 5338.80 La tasa media de natalidad en el afio 2011 fue 5149 x= 8149 _ 9.902 nacimientos por cada 1000 habitantes 32 por bb) El intervalo modal es [8; 10,3) y contiene 24 observaciones. Mediana: el 50% del total 52 son 26 observaciones. De la columna de las frecuencias acumuladas se observa que la observacién numero 26 (una vez ordenadas de menor a mayor) se encuentra en el intervalo [8; 10,3), de longitud 2,3 y que contiene 24 observaciones. Antes de este intervalo se han acumulado 8 observaciones. Luego M8 (26 8)23 (25-9) 9725 nacmentos por cada 1000 habianes ) El histograma de frecuencias absolutas es: o7 6 08 128 4a 172 105 ‘Nacinlentos por cada 1.000 habhamba 4) La varianza se obtiene a partir de los resultados de la tabla: 22 9898.89 9.9077 4.6720 > 8 /A,6200 — 2.1501 52 ©) El cooficionte de variacién es: ws 2 x 78 Unidad 10] Estadistica unidimensional STATE TT 50, La tabla siguiente incluye los porcentajes de gastos de administracién (X) calculados sobre el total de primas recaudadas (f), en millones de euros, por cinco empresas en seguros de hogar. A 11 | 220 8 16 | 130 c 4 | 145 D 12 | 180 E 1_[ 150 1) Determina el porcentaje medio de gastos. ') Sise supone que estas cinco empresas cubren todo el mercado de seguros de hogar, calcula el coeficiente de variacion y haz una valoracién del resultado, a) Se completa la tabla con las columnas necesarias para el calculo del porcentaje medio y la varianza de los porcentae fempresa[ x [i [tx Txt] A_| 11 | 220 | 2420 | 25.620 | 15_[ 130 1950 | 29250 [14 | 145 | 2030 | 28.420 oO [ 12 [180 | 2160 | 25 920 — | 14 _| 150_| 1650 | 18 160 El porcentaje medio de gastos de administracién se obtiene a partir de los calculos de la tabla: 'b) Para calcular el coeficiente de variacin se necesita la desviacién tipica: gr 178960 1280p -24085 > ASM y de aqui reste cy - $5504 12376 Que informa de ta variabilidad en el porcentaje de gastos de administracién cobrados por las distintas ‘empresas y, en este caso puede verse que esa variabilidad es relativamente pequefia. Estadistica unidimensional | Unidad 10 79 SET TET 51. Los tiompos de vida (X, en horas) de 500 bombillas de una cierta marca se han agrupado en la tabla. 4) Representa el histograma correspondiente, junto con el poligono de frecuencias. 'b) Calcula la media, la mediana y el intervalo modal. €) Determina la desviacién absoluta media, a varianza y la desviacién tipica 4) Halla os cuariles, @) Estucia la variabilidad de ta distribucién de frecuencias. 4) El histograma y el poligono de frecuencias son 200. 60. ™ x fi (0.500) | 45 1500, 1000) |_ 56 11000, 1500) | 178 (1500, 2000) |_115 (2000, 2500) | 64 (2500, 3000) | 52 soo 1000 1500 2000 2900 $000 3500 bb) Elintervalo modal es el (1000, 100), que contiene 178 observaciones ©) Clases fi A | « hx fit fix, x (0, 500) 15 | 15 | 250 | 3750 | 937500 | 20295 1500, 1000) _| 66 | 71 | 750 | 42000 | 31500000 | 47768 1000, 1500) | 178 | 249 | 1250 | 222.500 | 278 125000 | 62634 11500, 2000) | 115 | 364 | 1750 | 201 260 | 352 187500 | 16905 [2000,2500)_| 84 | 448 | 2250 | 189000 | 425 250.000 | 54348 2500, 3000) | 62 _| 00 | 2750 | 143.000 | 393.250 .000 | 59 644 500) ‘801 500 [1 481250000 261794 Para el célculo de la media y la mediana se afaden a la tabla las columnas necesarias. En también fa columna necesaria para el cdlculo de la varianza El tiempo medio de vida de las bombillas es: x 921800 _ 4605 horas. la tabla se incluye Mediana del tiempo de vida de las bombillas. El 50 % de 600 es 250 y la observacién 250, una vez ordenados los datos queda incluida en el intervalo [1500, 2000), de longitud 500 y que incluye 115 observaciones. Hasta este intervalo se han acumulado 249 observaciones, luego: (290 249)500 19 (20 _248}800 15 M1504 1904.3 horas 80 Unidad 10] Estadistica unidimensional STATE TT 261796 4) Ladesviacion absoluta media viene dada por:p, = 7°10 573.588 horas La varianza del tiempo de vida de las bombilas y su desviacién tipica son: 2 1481250000 500 Como se puede observar, la desviaci6n tipica resulta ser mas algo superior que la desviacién absoluta media, 1603" = 392 891 5 = 626,81 horas. @) Para determinar los cuartiles se procede como sigue: E1 25% de 500 es 125 y a observacién 125, una vez ordenados los datos queda incluida en el intervalo [1000, 1900), de longitud 600 y que incluye 178 observaciones, Hasta este intervalo se han acumulado 71 observaciones, luego: 10002 719° 15160 horas Por otro lado Q, -M 1504.3 horas. Para el tercer cuartil se tione en cuenta que el 75 % de 600 es 375 y la observacién 375, una vez ordenados Jos datos queda incluida en el intervalo [2000, 2500), de longitud 500 y que incluye 84 observaciones. Hasta este intervalo se han acumulado 364 observaciones, luego: 00 . (375=364)500 Q Ba = 2085.48 horas 9 lad se determina el coeficiente de variacion que resulta: 626.8 a 70381 ¢ indica una variabilidad media de los datos. SET TET 52, Las temperaturas medias (X) registradas a lo largo del mes de mayo en 50 ciudades se presentan agrupadas en la siguiente tabla 8) Rupresena gamers des, meant in Hstoxaay ata ol polgon de p-—z - 'b) Determina la media, la mediana y el intervalo modal. (15, 18) 7 ¢) Halla los deciles 3 y 8 (18,21) [10 4) Caleua tas desviaciones absolut media yl desviacion tice. Compalas wiz) [76 ¢) Dotermina la proporcién de vriacin dei dstibucén de as temperaturas a7) [78 [27, 30) 5 f) cPor debajo de qué temperatura se encuentra el 35% de las ciudades con temperatura media mas baja? a) El histograma y el poligono de frecuencias son: 18: “4. b) Para los célculos de este apartado y siguientes so» 12 ampliala tabla con las columnas necesarias 10 2 2 8 x [aA «| m% [ix x | 3 fs 18)[ 7 [7 (res) r155[ e158 [reos7s] § 6 ga,2[10 [a7 [ros] 195 | 204 [ses] 8 4 21,24)] 15 [32 |22.5]3975| 09 [7599.75 ° i24,27)] 19 [45 |25.5] 391.5] 99,78 [9459.25 5 1 27, aol] 5 [50 [2a5|142.5] 30,3 [4061.25 ee a a a 50 122 | 747,96 [25 616.5] Tapani modi el rede mays que la temperatura media es x "122 79.44 Temperatura mediana: ol 50% de las 50 observaciones es 25. La observacién que ocupa el lugar 25, ordenadas de menor @ mayor, esté incluida en el intervalo (21, 24), de longitud 3 y que contiene 15 observaciones. Antes de este intervalo se acumulan 17 observaciones, luego la mediana es: (25.17)3 Mon 226° El intervalo modal es [21, 24), ya que es el que contiene mayor numero de observaciones. 15. Para calcular el decil 3, Ds, se observa que el 30 % de las 50 observaciones es 15. La observacién que ocupa el lugar 15, ordenadas de menor a mayor, esta incluida en el intervalo [18, 21), de longitud 3 y que contiene 10 obsorvadones. Anes de este noralo se azumuian 10 obsenvacons, ego 0,18 178 2g arc (40-32)3 Razonando de la misma forma se calcula el decil 8: D, ~ 24 + 25,85 °C 14196 4) La desviacién absoluta media se obtiene a partir de los calculos de la tabla: D, = 2.8392 °C Y la varianza y desviacion tipica: «? - 258166 224K? 12,7164 > 5 12,1764 -3,5744 °C. ‘Se observa que la desviacién tipica es mayor que la desviacién absoluta media, ° 35744 El coeficiente de variacién de la distribucién de temperaturas es CV 11593. 1) Para responder @ esta cuestiin, hay que calcular el percent 35. Como el 35% de las 50 observaciones es 17,5 que esta por encima de 17. La observacion que ocupa el lugar 18, una vez ordenadas de menor a mayor, «si incuida en el interval (21, 24, de longitud 3 y que contone 15 observaciones. Antes de este intervalo se (175-17)3 1 1 De donde el 35 % de as ciudades con temperatura mas baja no superaron los 21,1 °C. acumulan 17 observaciones, luego este percentiles: p,, ~ 2 au 82 Unidad 10] Estadistica unidimensional OLUCIONARIO 53. De una muestra de 100 recién nacidos en una clinica de maternidad, se ha obtenido Ia siguiente tabla de pesos en kg (X) para bebés de entre 3 y 4 kg de x f peso. (30:32) | 27 €) Dibuja el histograma de la distribucién de frecuencias relativas. 13.234) | 38 'b) Encuentra la media, la mediana y el intervalo modal Base) | 16 ) Determina ta varianza y la desviacién tipica 63a) | 10 4) CEs simétrica la distribucién? Justfica la respuesta, (3.84.0) 9 ©) Calcula los percentiles § y 95. ,Cudntos bebés se encuentran por encima del 90 % del peso? ‘Se amplia la tabla con las columnas necesarias para responder a los apartados siguientes Cas | i [| A] m ) «| mm | ie wo3a[ 27 | or | 027 _| 31 | #37 _| 25047 23a] 36 [65] 038 [33 | 154 | arg. Base[ te [ot [or | 35 [58 | 196 ges8)[ 10 | | of [37 [37 69 (38i40)[ 9 | 400} 098 | 3.9 | 35,1 | 196.89 700 o 397.2 [1143008 2) El histograma de frecuencias relatvas se constuye con UA 038 Ia columna de las he os "3) oar ons oz 16 oa * a 51 aoe 908 9, $2 320 34 38) 3B a 2 pao recién neckdoe (kp) ) El intervalo modal es [3,2; 3,4), ya que contiene mas observaciones (todos los intervalos son de igual amplitud). El peso medio de los bebés es x 39:2 _ 3.379 kg La mediana del peso de los bebés se encuentra en el intervalo (3,2: 34), puesto que una vez ordenadas las ‘observaciones, buscamos la que ocupa el lugar 50 (50 % de 100 observaciones). En intervao tiene longitud 0.2 kg e incluye 38 observaciones. Ademas antes de legar a este intervalo se acumulan 27 observaciones. Luego: (60 27)03 M=324 3382 kg ¢) La varianza y la desviacion tipica vienen dadas por =? 3.98 5.79» _9,9604 -> s - 0,0604 -0,2858 4) A\la vista del histograma se puede afirmmar que Ia distribucién no es simétrica, puesto que las observaciones no ‘se reparten de forma equilibrada a la izquierda y a la derecha de la media, @) Para calcular los percentiles 5 y 95 se sigue el mismo procedimiento que con la mediana: E15 % de 100 observaciones es 5, de modo que el percenti 5 se encuentra en el primer intervalo [3,0; 3,2), que 5:02 5037 tg, EI 95 % de 100 es 95, de manera que el percentil 95 se encuentra en el intervalo (3.8; 4,0), de longitud 0,2 y ue contiene 9 observaciones. Como antes de este intervalo se acumulan 91 observaciones, resulta 3, © 99-02 9 tiene longitud 0,2 y contiene 27 observaciones, luegop, - 3.01 Pas 3.889 kg. Por encima del 90 % del peso se encuentra el 10 % de los bebés, es decir 10 bebés. SET TET oy 54, Unidad 10| Estadistica unidimensional Dado el siguiente conjunto de datos, relativos a los vecinos de un inmueble mayores de 40 afios. 61 69 42 49 62 66 41 48 43 54 51 43 49 42 43 53 44 41 51 51 54 59 56 58 64 63 46 52 42 66 69 57 48 44 67 69 58 54 66 65 42 57.55 53 50 48 63 68 41 70 a) Para los datos sin agrupar dibua el diagrama de caja 'b) Agrupa los datos en intervalos de longitud 5, por un lado, y de longitud 10 por otro. €) Representa graficamente las dos distribuciones. 4) Calcula la media, la mediana y e! intervalo modal en cada una de las dos distrbuciones. ) Caloula el coeficiente de variacién de ambas distribuciones y comenta las diferencias encontradas. ) Para la representacién del diagrama de cajas, ordenamos los 50 datos de menor a mayor. El valor minimo es 41 y el maximo es 70. Como el 25 % de 60 es 12,5; el primer cuartil vendra dado por la media de los que ocupen las posiciones 12 y 18, estos son los valores 46 y 48 y por tanto Qy = 47 Del mismo modo, como el 75 % de 50 es 37,5; el tercer cuartl vendra dado por la media de los que ocupen las posiciones 37 y 38, estos son los valores 62 y 63 y por tanto Q; = 62,5. La mediana viene dada por el valor intermedio de los que ocupan las posiciones 25 y 26, que son 53 y 54, de donde M=53.5. aa eg ee a as G0 as b) Como el maximo de las observaciones es 70 y el minimo 41, elegimos seis intervalos de longitud 5 y 3 intervalos de longitud 10, empezando en 40 y finalizando en 70. Efectuado el recuento en ambos casos, resulta Clases [fh x cm 2. Fi (40,45) [12 as | sto | 2167s [12 (45,50) [6 47s | 205 [i3sa75 [18 (50,55) [10 52.5 525 | 275625 [28 (55.60) [7 575 | 4028 [2314375] 35 (60,65) [5 25_| 312.5 |19531,25| 40 (65,70) [70 7s | 675 | 455625 [50 50 2710 [151 01 Clases [fi x 1 i Fi (40,50) [18 45 10 | 36450 | 18 (50,60) [17 55) 235 | s1a2s | 35 (60,70) | 15 66 75 | 63375 | 50 30 2720_| 151250 Alas dos tablas se les han afiadido las columnas necesarias para los caleulos posteriores STATE TT ) Se dibuja el histograma correspondiente a las dos distribuciones: " ” 2 8 40. 7 a 10 6 4 8 2 1“ 0. 8 40 7040 70 6 50 55D ry a 3 Edad do loo voctnoa & 40 anos) 2 Edad de loa vedlnoe ¢ 40 anos) Que son dos formas diferentes de representar la misma distribucion del nGmero de vecinos mayores de 40 afos. La apariencia, como se ve en los histogramas, es claramente distnta 4) Para cada distribucién se calcula la media, la mediana y el intervalo modal De la primera tabla, la de las clases de longitud 5, se obtiene que la media aritmética es x- 20 6 > afos 50 La mediana se encuentra en el intervalo [50,55), de longitud 5 y que contiene 10 observaciones. Antes de este (25~18)5 Ta rvalo se ha acumulado 18 observaciones, Iuego la mediana es M = 50+. 33.5 aflos muy proxima a la media, Elintervalo modal en este caso es [40,45), ya que es el que contiene el mayor niimero de observaciones (12). En el caso de la segunda tabla, donde se han agrupade los datos en clases de longitud 10, se tiene que la ritmética es x20 ‘544 afias, muy similar a la obtenida con las clases de longitua 5. La mediana se encuentra en el interval {50, 60), de longitud 10 y que contiene 17 observaciones. Hasta legar a este interalo se acumulan 18 observaciones, de modo que ahora la mediana es in -50, 25-18 a2, cea aa medane obra cones delogt En cuanto al intervalo modal, en este caso es [40, 50), que incluye el intervalo modal anterior. @) Se debe obtener la desviacién tipica de cada una de las agrupaciones: Para as clases de longitud 6: sf AS 5427-8061 > 5, 82,61 - 9089 aftos 151250 (65.64 -8102 aos 65,64 > s, Paralasclases de ongiud 0. sf Baa? 9.089 - 88° os0r7 ev) 9102 _ 4 Entonces, CV(x) 01489 La agrupacién en clases de longitud 10 presenta menor variabilidad que la agrupacién en clases de longitud 5, ‘como era de esperar, puesto que en el primer caso, en realidad solo se elgen 3 valores distintos para realizar los célculos (las marcas de clase de las tres clases), mientras que en el segundo caso son 6 os valores elegidos. SET TET 86 55. La siguiente tabla recoge la edad, agrupada en intervalos, de una muestra de 1000 conductores de 140 mas aos involucrados en accidentes con victimas en via urbana, a) ») °) 4 a) ») Unidad 10| Estadistica unidimensional Edad [fi 14, 18) [_ 16 18,25) [149 (25,45) [526 145,65) | 255 (65,75) [_36 (75,30) [18 Representa la distibucién mediante el diagrama de barras y el poligono de frecuencias absolutas. Calcula la media, la mediana y las desviaciones tipica y absoluta media. Caleula el coeficiente de variacion ‘Suponiendo que la muestra es representativa de la poblacién objeto de estudio, {Qué porcentaje de la misma se encuentra en el intervalo (¥-2s,¥ + 2s) El histograma y el poligono de frecuencias con el niimero de conductores por intervalos de edad de la muestra de 1000 conductores es Diatbucén da una musata de 1.000 conductores irvolorcon fon sania da trefica, 2». 25. » 5 0 5 °. o ate 2s, 5 oa OS 2%: Eilat fom concurs ‘Se ampliala tabla con las columnas necesarias para os célculos de los dos apartados siguientes: Edad fi Fi x we | xX (14, 18) |_16 16 16 4096 | 382.4 (1a,25) | 149 765 25 68 875,25 | 2741.6 (25, 45) | 526 691 35 644 350_| 2577.4 (45, 65) | 255 346 55 771.375 | 3850.5 (65,75) | 36 982, 70 176 400_| 1083.6 (75.90) | 18 1000 | _82.5 122 512,5 1000 1 787 60% La media de la edad de los conductores involucrados en accidentes de trafico es x - 998998 _29 9 afas. 1000 Es decir, aproximadamente 40 afios de edad. EI 50 % de 1000 observaciones es 500. La observacion que ocuparia el lugar 500 una vez ordenados los datos de menor a mayor esta, por tanto, en el intervalo (25, 45) segun se desprende de a columna F de la tabla. El intervalo tiene longitud 20 y $26 conductores se encuentran en este intervalo de edad. Las observaciones acumuladas hasta llegar al intervalo (25, 45) son 165. De esta forma, la mediana es: {500 165).20 526 M 31,7 afios °) STATE TT A pattir de los datos de la tabla se calculan la varianza y la desviacion tipica. — 1IBTEDB8 59.97 495,639 + 513987 affos 1000 La desviacién absoluta media viene dada por: 1402,3 Px 000 = 44023, El coeficiente de variacién es una medida de la variabilidad de los datos observados: 13987 OF agg O08 EI intervalo (X25, X 4 2s) (39,9. 2.13,987; 39,9 + 2.13,987) -(1193;67,87), que contiene todas las observaciones desde 14 hasta 67,87. Antes del intervalo (65, 75) hay 846 observaciones acumuladas. El intervalo (65, 75), de longitud 10, contiene 36 observaciones. Como 67.87-85 ~ 2,87, resulta que, suponiendo distibuidas "de manera uniforme las 36 observaciones. en ol intarvalo, an al intorvalo 185: 67.87) se incuyen 28729 10:38 946 + 10 = 956 observaciones, que representan 61 95,6 % de la poblacién estudiada. 1s decit, 10 observaciones. Luego desde 14 hasta 67,87 se incluyen a7 TATE ENTORNO MATEMATICO A la biisqueda de un trabajo. Mariela y Fernando son dos hermanos a punto de terminar sus estudios universitarios e intentar acceder al mercado laboral, 0, como ellos dicen, ponerse a buscar curro. Estan preocupados por el tema, y no hacen mas que leer sobre tasas _[/]Afio | Total [Hombres | Mujeres de empleo, tasas de empleo por sexo, o por grupos de edad. y [2007 [11.45] 630 16,15 demés términos Indescifablex que compllcan ia Informacion de os [P9553 —Tat 4s] a5 | 164 2004 [10,97| 3,26 | 14,82 2005 [9.15 | 7.14 | 1199 y Fernand leyenda urbana, Marit 2006 [845 [ 635 | 11,35 aunque Fernando cree que eso os una leyenda urbana, Mariola piensa que su hermano es un ingenuo y que, posiblemente, sus | 2007 |823{| 641 | 10,70 amigos tengan razén. 2o08_[11,25| 10,05 | 12,82 Para hacer que su hermano “‘se caiga del guindo”, le propone que | 2009 | 17.86| 17.65 | 18,13 investiguen un poco y ya de paso suefien con lo que pueden llegar a |_2010 | 19,86| 19,67 | 20,22 ganar, y dejar asi de depender de sus padres. Investigando en el | 2011 _|21,39| 21,05 | 21.81 Insitute Nacional de Estaisticaobtionen la tabla de la Tasa de Paro [~aoig[24 70] 2458 | 25.04 en Espafia, de los dltimos afios (en %). Soa tona} eee er @) {Quién tiene razon Mariela o su hermano? Estudia cémo ha |—gora—Toasat o3a7 | 2565 fevolucionado la brecha de género (diferencia en puntos porcentuales 69] 234 : enire Ia tasa de empleo de los hombres y de las mujeres) alo largo de los iimos afios. ,Ha aumentado? 5, 15416 Besant ato TATE De forma que la variacién relativa del numero de grandes incendios en estos 18 afios es: cv(x)- S88 _osaza4 En segundo lugar se representa en un diagrama de barras la distribucién del numero de incendios (aquellos en los que la superficie afectada es de mas de 1 hectérea) por comunidades auténomas. Se ha elegido el aro 2012, el itimo del que se dispone de datos definitivos en el momento de elaborar esta respuesta 2012 reondion siniestros _| Incendios(1) io 400 tO BD 1000 12h. 'b) Respecto a la superficie forestal afectada por los incendios, se tienen datos desde 1995 (INE) y se pueden realizar diferentes tipos de estudios. En la tabla siguiente se recoge la informacin disponible de la superficie total quemada en Espatia y también desglosada segin ol tipo de masa forestal afectada (Vegetacion lefiosa, arbolado, matorral y monte abierto 0 herbaceos) 1995 [ 1996 [ 1997 [ 1998 [ 1988 | 2000 | 2001 [ 2002 [2003 Superficie forestal total 143468 | 59813,7 |98503,2| 139643 | 82217,4| 188586 |93297,5| 107464 | 148173, [Vegetacion lefiosa, 136821 | 53039,3| 94207 | 126082 | 76996,5| 170832 |75710,8| as007,8 | 124141 ‘Arbolado. 42380,3 | 10530,9 [213262 | 42969,5 | 24034, | 46138,2 | 19363,4| 25196,9 | 53673 Matorral y monte abierto (8) | 94540,7 | 42508,4 |72880,8 | 83123,1|52962,2| 124304 |56347,4| 638109 | 704678 a 6546.8 | 6774,3 | 4296,1 | 7560.3 | 5221 | 18053,4|17586,8| 18458,2 | 240316 dehesas) Poreniae supers 08s | ozze | oave | ostz | oats | ores | oase | ont | osee zooa_| 2005 | 2006 | 2007 | 2008_| 2000_| 2070 [aon @)| 2072) SpE PESTO 124198 | 100008 [155269 [061125 [s0ae1 3] r19ee2 |sa7e0 9] tozr61 | z00ass Vegeta lefosa 08338 [175674 [149136 [7170.1 [1280 | Tareas [2aaea2| 91235. | te8067 Abolads srraa.2| 60006 8|rioez 9 [204026 | 2443.1 [40900.3[ ore4.9| 18847 6 | 62201 4 Matorral y monte ablerto (3)_| 5606.1 | 106277 [720533 | 42391,6 | 32846,6 | 67302,7 [39279,3| 72387,8 | 116735 Herbaceas (pastos y 585) ers Riser 25884,3| 190736 | 12226,7| 14318,4| 9031.6 | 12195,7| 53057 | 10926 | 10918,6 Porcentaje superficie eA ois | 0,724 | 0572 | 0,333 | 0,195 | 0.428 | 0,198 | 0,369 | 0,759 90° Unidad 10] Estadistica unidimensional OLUCIONARIO En la tabla debe observarse que: Superficie forestal total - vagetacién lefiosa + herbéceos Vegetacion leriosa = arbolado + matorral y monte abierto ‘A continuacién se representa conjuntamente en un diagrama la superficie total y la que corresponde a arbolado (parte de vegetacién lenosa}: ‘Superioiaafsotaa por ios named. 225.000: 200.000) 3 175.000) i 180,000} & 125000 i 100.000} & 75.000 0000 mao0e IN in ° oe gh PIE FESS PESEF SEES S # Tet $A 2012: 209 855 ha (provisional). También la superficie de arbolado ha variado notablemente, en linea con Ia total afectada En a tabla siguiente se presentan los valores medios de superficie quemada desde 1995 hasta 2012 y en los ‘ikimos diez afos junto con su desviacién tipica y su coeficiente de variacién: Media 10 Desviacion. eo Media total] ditimos | Desviacién | — tipica | oyrotal | citmos 1995-2012] aos | tipica total | ltimos 10, Aaa 2002-2012 afios ‘Supericie forestal total s1seo7.2 | 1249537 | 4560582 | so36a.e8 | 0.3807 | 0.4031 Vegetacién lefiosa sorass,7 | 1111705 | 4375242 | 4869560 | 0.4072 | 0.4980 ‘Arbolado. 370715 | 43635,8 | 21596,44 | 25011,04 | 0.5826 | 0,5745 Matorral y monte abierto 7o3e42 | 676348 | 2559620 | 25997.1 | 03637 | 0,835 Herbéceos (pasios ydehesas) | 129543 | 137882 | s1es.14 | 060,44 | 0.5006 | 0.4395 Puede comprobarse que las cifras de las iltimos 10 afos son en todos los casos mas allas que en el total excepto el caso de matorral y monte abierto. También puede verse que la variabilidad més alta corresponde a la superficie arbolada quemada y la més baja a la superficie total. €) Los incendios no afectan por igual a los distintos tipos de superficie, Es claro que la superficie de matorral y ‘monte abierto es la mas afectada por los incendios, debido también a que dentro de la superficie forestal es la {que ocupa la mayor parte. NOTA: Los gréficos y resultados presentados son solo una pequefia parte de las posibilidades de andlisis que pueden hacerse con los datos disponibles. Quedas invitado a analizar lo que ha pasado en tu comunidad auténoma_e incluso en tu provincia y compararlo con lo que ha sucedido en el total del pals 0 con otras comunidades auténomas. SET TET AUTOEVALUACION Comprueba qué has aprendido 1. Dado el siguiente diagrama de barras, 20: 25: B20 16 a) Clasitica la variable 'b) Escribe la tabla de frecuencias absolutas, relativas y relativas acumuladas, ©) Calcula la media, la moda y la mediana 4) Caloula la varianza y la desviacién tipica. a) La variable es cuantitativa discreta y toma los valores 2, 3, 4, 5y 6 ') La tabla que se deduce del diagrama es la siguiente, con las frecuencias absolutas (f), las relativas (h) y las relativas acumuladas (). ©) Para calcular los valores de este apartado y del siguiente, se construye la tabla con los valores de la variable, las frecuencias absolutas, las absolutas a acumuladas y los productos necesarios: 375 De manera que la media aritmstica es X = 525 - 4,167 90 xf fi Hi 2[ 10 | ont | 047 3 | 17 | 019 | 0.30 4 | 26 | 020 | 059 5 | 2 | 024 | 083 e| 3 | ov | 1 20 1 xf Fi ix [x 2 | 10 10 20 40 3 | 7 27 St 153 4 [2 | 53 | 104 | 416 6 | 22 75 [| 110 | 550 6 | 1s | 90 ‘30 | 540 30 375_|_ 1699 La moda es M.=4, ya que es el valor de a variable que mas veces aparece en la muestra La mediana es M = 4, ya que una vez ordenados los 90 datos de menor a mayor, los lugares 45 y 46 estén ‘ocupades por el valor 4 4) La varianza y la desviacién tipica se obtienen a partir de los resultados de la tabla del apartado anterior: 2 _ 1699 1898 | 4.167? =4514 > 8-123 3 1 4 2, _Elnnimero de hijos de 7 familias es 1, 1, 2, 2, 2, 6, 7. Calcula la media, la moda y la mediana .Cual de las tros os mas representativa? La media, la moda y la mediana son respectivamente X z 442242424647 <8 Mi=2 y M=2, Parace claro que, en este caso, la mas representativa de las tres es la mediana (o la moda), puesto que ninguna de las familias tiene 3 hijos. La media es muy sensible a datos extremos. 82 Unidad 10] Estadistica unidimensional OLUCIONARIO 3 4 EI nimero de extranjeros empadronados en una ciudad, segiin el continente de procedencia viene dado en la tabla. Describe el tipo de variable y representa [oontnente[ 7 adecuadamente los datos Africa 26 990, [América [49104 Se trata de una variable cualtatva Asia 5635 Oceania |_73 Eltipo de grtico mas apropiado , bien un diagrama de Barras o bien uno de sectores: [Europa | 61 000 13.000 soa wi pv die ‘oo| pan ‘on B enone aa 40.000; 2% Oona 20.000} ‘im Europe ‘pee eh Ose ™ Una variable estadistica X tiene la siguiente distribucién de frecuencias: * Case |-2 00.4) [14,8] 18, 14] # | 8 [ 2 | 30 | 30 @) Dibuja el histograma 'b) Calcula la media, la moda y la median ) Calcula la varianza, a) Debe tenerse en cuenta que las clases tienen distinta 10 longitud. Tomamos como unidad de base 2; asi, la primera clase “mide” 1, la segunda clase "mide" 2, a tercera “mide” 2B. 75 ya cuarta “mide” 3. 08 6 5 a 4 2 'b) Para calcular las medidas de este apartado y del siguiente se construye la tabla: 6 20 4 a 4 case] fA [ FL. « | fm | i x rao] 8 | 8 | + | 3 | 8 0.4) | 26 | 4 | 2 | 82 | 104 (4a) | 30 | 64 | 6 | 120 | 1080 18,14) 30_| 94 | 11 | 330_| 3630 of 554 | 4822 De esta manera, la media aritmética es x- 4 _ 5 eca6, 4 El Intervalo modal es [4,8) como se puede ver en el histograma, ya que es el que tiene mayor densidad de observaciones, puesto que su longitud es 4, mientras que la del intervalo [8, 14) es 6. EI 50% de 84 es 47, por lo que, observando la columna de las frecuencias acumuladas, Ia mediana se encuentra en el interval [4,8), que tiene longitud 4 y contiene 30 observaciones. Antes de este intervalo se han acumulado 34 observaciones. Luego M4447 944 _ 5 733 ) La varianza se obtiene a partir de los resultados de la dltima columna de la tabla del apartado anterior 8225 p96? 16,563 SET TET 5. Los dos conjuntos siguiontes de datos se refieron a la estatura de un grupo de 20 estudiantes, en em, ya las puntuaciones obtenidas por un grupo de 25 personas en un test psicotécnico. Estatura (x): 174 178 165 167 182 172 185 178 205 180 187 166 172 190 161 170 178 183 169 176 Puntuaciéntest(Y) 56 86 70 67 68 76 68 45 58 74 68 87 51 27 67 51 30 58 97 70 a7 7% ST 71 56 a) Determina cual de los dos conjuntos de datos presenta mayor variabilidad relativa 'b) Calcula os cuartiles de ambos conjuntos de datos. ©) Dibuja el diagrama de caja de cada distribucién de datos y sefiala si existen valores extremos, 1) Para poder comparar la variabilidad hay que conocer los coeficientes de variacién. En el caso de las estaturas, se pueden agrupar los datos en intervalos de amplitud 10 Estatura a [| A) «| m | ie 155, 165) | 2 | 2 | 160 | 320 | 81200 (165, 175)_|_8 | 10 | 170 | 1360 [231 200 (175,185) |_7 | 17 _| 180 | 1260 [226800 (185, 195) [2 | 18 | 190 | 380 | 72200 {195,205]_| 1 | 20 | 200 | 200 | 40000 20 3520 [621 400 3620 De donde la media es: x 176. 2 + 621400 =176? = 94 = 5 = {04 = 9,695 20 La varianza y la desviacién tipica son: s’ El cosiciente de variacion es CV, = 2585 _ 9055 176 En el caso de las puntuaciones, los datos se pueden agrupar en intervalos de amplitud 15. Puntos 7 A 125, 40) 2 | 2 | 328 | 65 [arts (40, 55) 4 [6 | 475 | 190 | 9025 (5.70) | 40 [16 | 62.5 | 625 | 390625 (70, 85) 6 | 22 | 775 | 465 | 360975 185,100) | 3 | 25 | 925 | 27755 | 25 668.75 25 1622.5 | 111 906,25 De donde la media es: y - 16225 _ 64.9 3 Le varianza y la desviaciontpica son: «= “INNG22_ 476° 764,20» 9- J264.24 -16,26. El cooficiente de variacién es cv, = 7828 0,25 84, PPor tanto las puntuaciones del test presentan mayor variablidad 94 Unidad 10] Estadistica unidimensional b) ° STATE TT Para calcular los cuartles y los datos necesarias en el siguiente apartado se opera como sigue: Estaturas Carl 125% do 285 uso aca on rena 165,175), dd 10 ave canoe 8 Sbstmadnon host se ane tren eundsn#neatonce uae 0-165 299 9750m Car a an £1 50% do 201, sso aur on lat [15,178 de na 6 ya Corto id ncn, d ae anal o anon cra # saeco ge My, = 0,04) 165+ 00-210 75m Cuartil Qs. El 75 % de 20 es 15, que se acumula en el intervalo [175, 185), de longitud 10 y que contiene 7 Sbooraconas. dota Se ble otra sa fonon asumniades 1 epsovclones, nose 0,00)=175-28=!9)0 9 s4em Elrango ntereuation os RIG, = 0,(X)@X) = 18214-10875 13:9 De donde ls lms infer y superior sn 1, nH) AB RIG, = 16875745713, 39 = 14866 AXIS RIG, ‘Tenemos asi un valor atipico que es 205 y quedan como maximo y minimo respactivamente 180 y 157. Puntos Cuartl Q,. £1 25 % de 25 es 6,25 que se acumula en el intorvalo (55, 70), de longitud 15 y que contione 10 observaciones. Antes de ésteintervalo se tienen acumuladas 6 observaciones, luego: (6.25-6)15 7 CCuartl @,, la mediana. E150 % de 25 es 12.5, que se acumula en el intervalo (55, 70), de ongitud 18 y que Contiens 10 observaciones. Antes de éste intervalo se tienen acumuladas 6 observaciones, luego: a: Q(y) = 55+ 5,375 My =O,(¥)=55~ Cuartil Qs, E175 % de 25 es 18,75, que se acumula en el interval (70, 85), de longitud 15 y que contiene 6 observaciones. Antes de éste intervalo se tienen acumuladas 16 observaciones, luego: (18,75-16).15 (y)=70 + G8 75=18) 15, 240 z = 76,875 El rango inter cuartlico es RIC, = Q,(Y)-Q,Y) =76,785-85,375 = 215 De donde los limites inferior y superior son: Lly = Q(Y)-15-RIC, = 85,375 -15-2454 = 23,125 LS, = Q,(Y)+45-RIC, = 76,875 + 15-245 = 109,125 Por tanto no hay valores atipicos. Con estos datos los diagramas de caja son: es tab 455 460485170 475460" 105 180" 185200208 210 Purana Estadistica unidimensional | Unidad 10 95 OTA ONT Relaciona y contesta Ellje la Gnica respuesta correcta en cada caso 1 En una poblacién de 5200 habitantes mayores de 18 afios, 780 son inmigrantes. Una muestra de 200 personas en la que esté representada la poblacién inmigrante, debe constar de: A. 20 inmigrantes. B. 150 nativos €. 30 inmigrantes D. 100 nativos ‘Como la proporcién de inmigrantes en la muestra debe ser igual que en toda la poblaci6n, ha de ser: 5200 _ 200 780 x 10 inmigrantes debe haber en la muestra. Respuesta C Los datos recogides de una variable estadistica cuantitativa indican que @ 14, RIC 9 y que la distancia entre la mediana y ol Q; 0s el doble que entre la mediana y Qs. Entonces, los valores de a mediana y del Qs son: A. M-17,,-20 BoM 0.9, 23 ©. M73, -20 D. M-19.,-73 Por definicin os Qs = Q) + RIC= 14 + 9 =23. Por otra parte el enunciado afima que M — Q; = 2(Qs~ M), de donde se deduce que M=20. Respuesta B Las observaciones de una variable estadistica continua tienen media 5 y varianza §. Si todas las cobservaciones se dividen por 2, la nueva media y varianza sor A ¥25,8-125 BY125,8-25 9 125, ‘La media se dividen por 2 y a varianza por 2 (cuestion 44). Respuesta A El coeficiente de variacién de la variable Xes el triple que el de la variable Y. Sila media de Yes seis veces mayor que la de X, A 26s? B. 72s, z © 32st D. 37-457 sso 5 CV, = 804, > St 3 25, = si =4si Respuesta D STS KE OX a Sefiala, en cada caso, las respuestas correctas, 5. Unidad 10| Estadistica unidimensional En una distribucién, Q, 29, entonces A Elrango intercuartlice coincide con el primer cuart B. La mediana es la media aritmética de los cuartiles primero y tercero. . El limite inferior necesario para calcular el diagrama de caja es negativo. D. La distancia entre los limites superior e inferior (del diagrama de caja) es cuatro veces el primer cuarti A Cierta. RIC = Qs Q; = 20; ; = B.Falso. Por ejemplo en la serie 1, 1, 1.2, 2, 2,9,9, 9, 9¢8 Qi= 1; Qs ©. Cierto, Li = Q; ~1,5RIC = Q ~1,5Q,= -0,50s 1: M= 2 x BO 2 D. Cleo. LS LI = Qs + 1,5RIC - (Q; ~ 1,5RIC) = 20, Q; + 3 Q; = 4Q, Respuesta A, C yD STATE TT 6. Para medir la dispersién de los datos en tomo ala media, se utiliza A. Los percentiles de la distribucién. B, La varianza o la desviacintipica ©. La desviacién absoluta media, . El rango o recorrdo de la variable. La dispersion de los datos se evalia con las llamadas "medidas de dispersion’. De las magnitudes dadas en las soluciones solo los percentiles (A) no pertenecen a a esa categoria, Por tanto las respuestas correctas son B,C y D. Elige la relacién correcta entre las dos afirmaciones dadas 7. 4, Lamedia de un conjunto de datos es 2 y su varianza 35. 2.1 conjunto de datos es heterogéneo. Ato2 pew 251 B21 pero 152 e102 1. No hay relacién entre 4 y 2. Si por heterogéneo se entiende disperso, entonces la afirmacién 1 implica que este conjunto de dato os bastante disperso ya que su coeficiente de variacién tiene un valor elevado: Se 98.7 96 x2 cv Por tanto 1 = 2. La relacién inversa, 2 => 1, no es cierta porque saber que un conjunto de datos es mas 0 ‘menos disperso no dice nada respecto a qué valores concretos puedan tener su media y su desviacién tipica En resumen, la respuesta es la A

You might also like