You are on page 1of 16
UNIDAD 2 Medidas de Tendencia Central 2.1 INTRODUCCION El objetivo hisico de Ia Estadistica Descriptiva, como ya se mencioné, es presentar de una manera resumida Ia informacién contenida en un conjunto de datos. Luego, esta finalidad se logra presentando los datos en una tabla de distribucion de frecuencias, Sin embargo cuando se trata de una variable cuantitativa puede resumir atin més la informacion dando: algunos valores que describen ciertos aspectos importantes de la distribu on de in de las frecuencia, como por ejemplo cl erntro, Ia forma, ta variabilidad 0 disper obsernaciones, Estos valores se denominan medidas descriptivas Por ello, en el tema nos ocuparemos exclusivamente de las variables cuantitativas. Como hemos estudiado, Jas variables estadisticas cuantitativas se dividen o clasifican en discretas o continuas, por lo que necesitaremos precisar como se calculan dichas medidas en cada caso. En Jas variables cuantitativas continuas, dado que Ia tabulacién de los datos se hace mediante intervalos, necesitaremos tomar la marca de la clase. Asi, las medidas estadisticas se clasifican en: * Medidas de Tendencia Central: Que nos sirven para ver sobre que valores se concentran la variables. * Medidas de Dispersion: Nos van a dar una idea sobre la representatividad de las medidas centrales, a mayor dispersion menor representatividad. = Medidas de Localizacion: Utiles para encontrar determinados valores importantes, para una “clasificacién” de los elementos de la muestra. * Medidas de la Simetria: Sirven para ver si la distribucién tiene el mismo comportamiento por encima y por debajo de los valores centrales. Medidas de la Forma: Comparan la forma de la distribucién con la forma de la distribucién Normal, que es la distribucién que se toma como referencia. .2 MEDIDAS DE TENDENCIA CENTRAL En general, se podria decir que las medidas de tendencia central son valores numéricos que tienden a localizar la parte central de un conjunto de datos. ‘A menudo, el término promedio se asocia s6lo con la media aritmética, pero en realidad cada una de Jas medidas de tendencia central puede recibir el nombre de medida promedio. Entre las medidas de tendencia central se pueden mencionar, la media aritmética, la mediana, y el modo, En la practica, constantemente, se necesita conocer y comparar tales medidas, por ejemplo, si entre las personas que tienen una determinada ocupacion Mse observa que pierden en promedio, a causa de enfermedades, cinco dias por ato, y en otra nN la pérdida promedio es de 10 dias por aio, vemos que las dos distribuciones ¢ razones de tales UNIDAD? | seaiaas de Tenders central cine aificren en su posicion, ¥ centonces, se puede trata a remediable- s observados dividida ve como ta sua de TOS palore observacion de la res. En 2.2.1 Media aritmética 7 , Matematicamente, la media cavitmétion 52 def ide observaciones- stumbre de nda observacion centre el miner En Jas formulas est variable x con %y general, el valor de la # ésima se tiene n observaciones es: tadisticas se acos el valor de Ia segt! observaci XX: Media aritmética. x: Valores de la variable. nm: Niimero de observaciones. esentan el Para ilustrar el célculo de la media , consideremos los siguientes datos que rept tamafo de cinco grupos de una Universidad: 46 54 42 46 32 Se emplearé la notaci6n %,%3,%3.%4.%s Para representar el ntimero de estudiantes en cada uno de los cinco grupos; entonces para calcular la media hacemos: ye bxy byte txs 46454442446432 n 5 3 “ Por lo tanto, la media del tamaiio de estos 5 grupos es 44. Cuando la variable est4 agrupada en una distribucién de frecuencias, la media ari , tia aritmé| se calcula por la formula: sfitmftutase & Ejempl Un centro de salud infantil d lesea llevar a cabo i A. Uno de los requerimientos més i eee : eae . Los registros ofrecidos por la corres; al Soe ‘Pondiente ofici ‘ina —. Unipap2 | Medidas de Tendencia Central ‘Tabla N° 2.1: Distrbucién de casos detectados de hepatitis A en la Provincia de Cordoba Edad Cantidad de casos 3 24 4 23 6 47 7 44 8 47 9 57 12 52 14 41 15 35 Total N=370 Luego la media aritmética es F =32444234647+7.44+8474+9.5741252+144A1415.35 _ 3366 _ 5 9 ~ 370 370 Si la informacién esté relacionada en una distribucién de frecuencias por intervalos, se toman como valores de la variable las marcas de clase de ios intervalos. Tustraremos el caso a través de un ejemplo, para ello, supongamos que la fabrica de baldosas “De las casas”, con el objeto de ofrecer una garantia de su producto, desea hacer un estudio técnico de su produccién, para lo cual extrae una muestra de 100 baldosas, cada una de las cuales se somete a una prueba de resistencia destructiva cuyos datos, expresados en Kg/cm?, se muestran en la siguiente tabla de frecuencias: ‘Tabla N* 2.2; Tabla de frecuencia para a Resistencia de Baldosas Resistencia Kg/em? x | fle) | xf) [100,200) 150 | 4 600) (200,300) 250 | 10 | 2500 (300,400) 350 | 21 | 7350 [400,500) 450_| 33 [_ 14850 ~[500,600) 550 | 18 [9900 [600,700) 650 [9 | 5850 [700,800] 750 | 5 | 3750 Total 100 | 44800 Luego la media aritmética es 7 _ 44800 Xa = 448 100 La resistencia promedio de las 100 baldosas es de 448 Kg/cm?2. 2.2.1.1 Propiedades —<+.---S unipap2 | Medidas de Tendencia Central ia aritmética es igual cero. delas diferencias de los datos con respecto Ia media 1. Lasuma : : S(u-¥)=0 a Demostraci6n De-¥)-Ls-L* a att fat pero como 2. La suma de las diferencias cuadrdticas de los datos, con respecto a la Media Aritmética, es minima. Quiere decir esta propiedad que cualquier otro pardmetro p, diferente a la media aritmética hace mayor la expresi6n, es decir DG, -p) es mayor que 3°(x, - ¥F Para ¥ # p Q 3. Sia cada uno de los resultados le sumamos o le restamos una constante C, la Media Aritmética queda alterada en esa constante. Demostracion: Tenemos Jos datos x1,x2,.. Sea Xn. Cuya media aritmética es X . y= (x, tC)y. = (xy +C),. La media aritmética de la nueva variable es: =(x,£C)... y» Leto) yx Yc ds fe n n n an entonces Y=X+c 4. Si cada uno de Jos datos se multiplica por una constante k, entonces la media aritmética queda multiplicada por esa constante. Demostracién Tenemos los datos x1,x2,... Sea os -=-=-—=«=SCié“#, = __], Xn Cuya media aritmética ia Central Uninap2 | Medidas de Tendencia Entonces 2.2.2 Media Aritmética Ponderada itud de los datos, Hemos visto que la Media Aritmética se calcula con base a la magni ea otorgandoles igual importancia a cada uno de ellos. Sin embargo eee magnitud del dato esta ponderada con un determinado peso que lo afec ee La Media Aritmética ponderada tiene en cuenta la importancia relativa de ca datos, para lo cual la definimos con la siguiente expresion: Donde ,: Media aritmética ponderada x¢ Valor de la variable, wy: Ponderaci6n de xj. Ejemplo: Una empresa vende tres productos diferentes, con distintos margenes de utilidad y diferentes cantidades vendidas. Producto Margen de Ventas x, Utilidad A 42% 30.000 126.000 B 55% 20.000 110.000 Cc 7A% 5.000 37.000 D 10,1% 3.000 30.300 Total 27;2% 58.000 303.300 Sicalculamos la media aritmética legariamos a la conclusién de que el margen de utilidad promedio de la empresa es del 68 %. Al observar las cantidades vendidas de cada Producto se observa que las mayores ventas corresponden a Jos productos de menor margen de utilidad, por lo que la media aritmética simple no serfa una media adecuada 4,2+5,5+7,4+10,1 UnipAD2__| Medidas de Tendencia Central En este caso se debe calcular la media ponderada, utitizando como factor de ponderacion las cantidades vendidas, obteniendo un margen de utilidad promedio del 5,2%. 1 _ 30,000» 4.2-+ 20.000 5,5 +5.000¢ 7.4 +3,000¢101 _ 303.300 _ 5 5, Sw, 30.000 + 20.000 + 5.000 + 3.000 58.000 ad de ventajas, pero tiene la siguiente La media aritmética tiene una importante cantid de la serie 0 conjuntos de datos. desventaja: esta afectada por los valores extremos 2.2.3 Mediana La mediana es el valor central de las variables, es decir, supuesta la muestra ordenada en orden creciente o decreciente, el valor que divide en dos partes Ia muestra. Para calcular la mediana debemos tener en cuenta como estén agrupados los datos. 2.2.3.1 Céilculo de la mediana para datos no dgrupados ‘Tendremos en cuenta el tamafo de Ja muestra. Si mes impar, hay un término central, el término x,,, que seré el valor de la mediana, entonces Me = Xn Si m es par, hay dos términos centrales, x,,*, la mediana sera la media de esos dos yy valores, es decir Veamos un ejemplo = Simesimpar Consideremos el conjunto formado por 1,4,6,7,8,9,12,16,20,24,25,27,30. Como 1=13, entonces = =7..Luego, el término central, el 7°, es 12, es decir Me=12 = Sines par Consideremos el siguiente conjunto de valores 1,4,6,78,9,12,16,20,24,25,27.Como n=12 entonces 378 y oA =7 Luego los términos Centrales, el 6° y 7°, son 9 y 12, con lo que 9+12 = = 105 aT Unioav2 | Medidas de -tendencia Central ciones simples ra datos agrupados a cada a efectuando el co 2.2.32 Ciileulo de Ia mediane pare agrupa eynpuin sin) se calcula la mediana pat 8 Se calculan las frecuencias acumuladas correspondent ~ontinuacién se calcula el orden de Jocalizacién de la medi donde N es el total de datos. Dentro de la columna correspondiente frecuencia acumulada que no supera @ sucede en orden sera Fi. Efectuando una comparacién pertinente pueden dar valor de la variable. A Veremos ahora como ciente N/2, a las frecuencias acumuladas se busce Ia mayor N/2y se simboliza con Fra. La frecuencia que le se dos casos, a saber: a) Que Fi sea menor a N/2,0 b) Que Fis sea igual a N/2. Enel caso a) Me=x;, 0 sea, el valor de la variable que posee frecuencia acumulada Fi. En el caso b) Me=(xia+1i)/2 siendo xi1 el valor de la variable con frecuencia absoluta Fiay sel valor de la variable con frecuencia absoluta Fi. Volviendo al ejemplo de la campatia de prevencién de la Hepatitis A, podemos calcular la mediana de la siguiente manera “Tabla N° 2. Céleulo dela Mediana para a Distribueién de casos detectados de hepatitis & en la Provincia de Cordoba Edad Cantidad de Fea) casos 24 2B 47 Ss PATS [SS 37 F 52 41 35 1=370 ‘Total ‘Como n/2= 185, juego la mediana sera 22.3.3 Cal i ‘élculo de la mediana para datos agrupados en intervalos Para obtener la e agrupados en aa matemética que permite calcular la medi: frecuencii nos vamos a apoyar en Ai liana para datos ‘ias acumuladas. un grifico de un histograma d le + UnipaD2___| Medidas de Tendencia Central a ba Me Ik zi La mediana seré Als Me=1,.+% ate Como los triéngulos ABC y ADE son semejantes se tiene que z 4)? 4D _ DE L AB OBC . siendo AD=x, WB=E,—L,,=¢, DE="-Fra y BO=F Fah Fe ‘De donde la mediana vale: donde ‘Me: Mediana 1L._ Limite inferior del intervalo donde se encuentra la mediana (intervalo mediano), a eleual se determina observando en que clase se encuentra la posicién 11/2.) m Numero de observaciones. Fat Frecuencia acumulada anterior al intervalo mediano. fit. Frecuencia del intervalo mediano. c: Amplitud del intervalo. Veamoslo por medio del ejemplo para la resistencia de baldosas. ‘Tabla N° 2.4: Céleulo de la Medtiana para la Resistencia de Baldosas Resistencia Kg/em? fi F ig "[100,200) 4 4 oe [200,300) 10 14 [00,400) 21 35 i [400,500) 733 68 [509,600) 18 86 [600,700) 9 9% [700,800] 5 100 Total 100 ome cele de la muestra es n=100, buscamos el intervalo en el que la frecuencia wulada es mayor que 100/2=50, que en est ° y apli See y que en este caso es el 4° y aplicamos la formula cl tral nipan2 | Medidas de Tendencia centr 100 _. 5 2100 = 445.45 Kgfem™ 33 Me = 400: / nos de 445.45 Kg/em? y €] 50% resiste Se concluye que el 50% de las baldosas resiste m mas de 445.45 Kg/cm?. 2.2.4 Moda La moda, como su nomibre lo indica, es el de una distribucién). Una informacion puede tener w modas y se Hama bimodal, o varias modas y lamars ocurrir que la informacién no posea moda. Unimodal Bimodal Sin moda ~~ (IN a Por Io tanto el calculo de la moda en distribuciones simples 0 cualitativas no precisa de una explicacién mayor; sin embargo, debemos detenernos un poco en el célculo de la moda para datos agrupados en intervalos. é frecuencia dentro mas comin (de mayor eerste y se llama unimodal, dos e multimodal. Sin embargo puede Para ello veamos como se obtiene de modo grafico y posteriormente Iegaremos a su determinacién analitica Supongamos que la figura que aparece a continuacién representa tres rectangulos del histograma de la distribucién de frecuencias, correspondiendo el recténgulo central a la clase modal. Y supongamos ademés que los intervalos de clase tienen el mismo ancho. Definimos la moda como la abscisa Mo del punto P de interseccién de las rectas QS y RT. Sean Lia y L; los limites inferior y superior de la clase modal, y sean Ary Az los excesos de frecuencia de la clase modal sobre las clases adyacentes a izquierda y derecha respectivamente. De los triéngulos semejantes PQR y PST tenemos. <= UniDAD2 | Medidas de Tendencia Central osea luego ‘43 (Mo-Li1)=A\ (Li- Mo) aplicando la propiedad distributiva AQMo = AgLj.1 = AiLj - AiMo agrupando convenientemente y sacando factor comin Mo (Ai + A) AiLi+ Abin con lo que Mo = Bibi AaLin A, +A, Como Li = Li1 + c donde c es la amplitud de los intervalos de clase, resulta Ai GEa +e) +A2L, 7 A+, Siendo = frnt A2=fm~ fost donde ‘Mo: Moda La: Limite inferior del intervalo modal fu; Frecuencia de la clase modal. fui: Frecuencia de la clase premodal. Jn; Frecuencia de la clase posmodal. ¢ — Amplitud de los intervalos. El resultado admite una interesante interpretacion. Si se construye una parabola que pase por los tres puntos medios de los techos de los rectngulos de la figura anterior, la abscisa del maximo de esa parabola seré la moda antes obtenida. En el problema de la resistencia de baldosas, tenemos iad? | Medida Tendent a Central ci UNIDAD \ edidas de Mota para a Resistencia eB ‘abla N° 2.8: Cielo de lt |__| clase premodal Clase modal Clase posmodal [700,800] Total 2 : ‘Mo = 400+ 23724 __ 199 = 400+ > 100 = 444.44 kg/cm @3-21)+ 3-18) 12415 El valor 444.44 es el parametro de mayor frecuencia. 2.2.4.5 Propiedades de las medidas de tendencia central Medias: # En su céleulo intervienen todos Jos datos, por lo tanto, se ven influidos role variacién de cualquiera de ellos. En particular, tienen el inconveniente de que los valores extremos producen grandes modificaciones. © La media aritmétioa ponderada es muy Gitil cuando se considera que los distintos valores promediados tienen una importancia desigual. Mediana: © Utiliza menos informacién que la media, ya que s6lo depende del orden de los datos, pero tiene la ventaja de que no se ve influida por los valores extremos. * Cuando se trata de distribuciones que no son excesivamente asimétricas, se cumple Ia siguiente relaci6n empirica entre la media aritmética, la moda y la mediana: X-Mo=3(X-Me) Moda: © Esel valor més comin. Se obtiene fécilmente de una clasificacion ordenada. Es ta ‘inica medida de posicién que puede utilizarse con datos cualitativos, Si bien siempre hay una sola Media aritmética y una sola mediana, puede no haber ‘ohaber una o més de una Moda, 2.3 MEDIDAS DE LOCALIZACION: CUARTILES, DECILES Y PERCENTILES Las medidas de localizacion dividen la distribucion en partes iguales, sirven para clasificar a un individuo 0 elemento dentro de una determinada ejemplo la mediana los divide en dos partes iguales, los cuartiles son tres valores que dividen a la serie de datos en cuatro partes iguales, los quintiles son cuatro valores que lo dividen en 5 partes, los deciles en 10 y los percentiles en 100. poblacién o muestra. Asi por —./7_!_____ Unipad2 | Medidas de Tendencia Central 2.3.1 Cuartiles Media de locatizacion que divide In poblacion o muestra en cuntro parles iguales. Asi, Qi= Valor de la variable que deja a la izquierda el 25% de la distribucion. Qe= Valor de la variable que deja a la izquierda el 50% de la disteibucién (Mediana) Qs= Valor de la variable que deja a la izquierda el 75% de la distribuci6n. Graficamente: Qa Q Q@ oo __+_+_.__+ 0% 25% 50% 75% 100% Al igual que ocurre con el calculo de la mediana, el célculo de estos estadisticos, depende del tipo de agrupacién de los datos. No tiene mucho sentido calcularlas para datos sin agrupar Para agrupaciones simples se procede de la misma manera que con la mediana. La tinica diferencia que existe es que, en el caso de ubicar el orden para Qi se debe considerar "/4 y enel caso de Qs se debe utilizar 3n/4. Para datos agrupados en intervalos el cdlculo es mas simple, se calcula como sigue "Pas, donde K: Orden del cuartil k=1,2,3 List Limite inferior del intervalo que contiene el cuartil. Numero de observaciones. Fat Frecuencia acumulada anterior al intervalo que contiene el cuartil Frecuencia del intervalo que contiene el cuartil. ‘Amplitud del intervalo. En el ejemplo para la resistencia de baldosas, es ‘Tabla N° 2.6: Cleulo dela Qu y Qs para la Resistencia de Baldosas Resistencia Kg/em? | f | F [200,200) a4 | 4 200,300) 10 | 14 300,400) 21_|_35__|Contiene a Q, (400,500) 33_| 68 |Contiene a Qo 500,600) 18 _|_ 86 |Contiene a Qs [600,700) 9 | 95 [700,800] 5_| 100 L Total 100 Primer cuartil (k=1): —s--s-ss-T ia Central Usipa2 | Medidas de Tendencia Centr Jo en el que Ja frecuencia pane) 7 = mos el interval | i a es 12100, busca ee eer 00/4925, que en este caso es el 3° y apticam m acumulada es mayor qu , anterior. Luego el primer cuartil es n iia = 300+ 254100 =352.38 Kg/em? : i 2 Este valor indica que el 25% de las baldosas resiste menos de 352.38 Kg/cm? y el 75 % tiene una resistencia superior. : Como el segundo cuartil es lo mismo que la mediana: Me=Qr 445.45 Kg/cm?. Texcer cuartil (k=3): Calculando el tercer cuartil tenemos Bahar aR, @=1,+4 15-68 = 500+ 100 = 538.88 Kg/cm? El 75% de las baldosas tiene una resistencia inferior a 538.88 Kg/cm? y el 25% una resistencia superior. 2.3.2 Deciles ‘Medida de localizacién que divide la poblacién o muestra en 10 partes iguales. No tiene mucho sentido calcularlas para agrupaciones simples. Por Jo que lo vamos a ver s6lo para agrupaciones en intervalos. Dy.~ Decil k-esimo es aquel valor de la variable que deja a su izquierda el k10 % de la distribucién. Se calcula de la siguiente manera: Ko~ Ps, W123 ,..9 nt Notese que el quinto decil es la mediana. El segundo, cuarto, i § sexto y octavo decil, que dividen la distribucion en cinco partes iguales, se llaman quintiles. 2.3.3 Percentiles Medida de localizacién que divide la poblacié; : EI percentil Py # poblacién o muestra en 100 partes iguales. €s un valor tal que por lo menos p por ciento de las observaciones son menores que 0 iguales que este valor y por lo menos (100 - p) por ciento de las Observacones son mayores o iguales que este valor. caso de agrupaciones simples, se calcuta el percentil de Ia siguiente forma: Caleulo del percentil p, Paso 1: 0 1: Ordenar los datos de menor a mayor (colocar los datos en orden ascendente). 7 Unipab2 | Medidas de Tendencia Central Paso 2: Calcular el indice Notese que se divide por 100 porque se trata de percentiles. Donde pes el percentil buscado y 1 el mimero de observaciones. Paso 3: (a) Si Xi no es un mimero entero, debe redondearlo. El primer entero mayor que i, denota la posicién del percentil pi. ____ (0) Si Xi es un némero entero, el percentil p es el promedio de los valores en las Posiciones x,y x,,. Ejemplo: calcular el percentil 85 en la siguiente lista de datos: 3310 - 3925 - 3650 - 3730 3355 - 3450 - 3480 - 3480 -3490 - 3520 - 3540 - 3550 Paso 1: Ordenar los datos de menor a mayor 3310 3355 3450 3480 3480 3490 3520 3540 3550 3650 3730 3925 xi-(2i-(S)a-102 100)” ~\i00 Paso 3: como Xi no es un miimero entero, se debe redondear. La posicién det percentil 85 es el primer entero mayor que 10.2, es la posici6n 11. Paso 2: Entonces el percentil 85 es el dato de la posicién 11, 0 sea 3730 También podemos afirmar que, Pj Percentil k-simo es aquel valor de la variable que deja a su izquierda el k % de la distribucién. Para datos en agrupacién por intervalos, se calcula usando la formula: "%oo- Fes, K=1,2,3.~99 NOTA: El célculo de X; también se utiliza en las restantes medidas de posicién (cuartiles, deciles, etc. ) cuando los datos son sin agrupar. Colectivamente, cuartiles, deciles y percentiles se denominan ewantiles. Los cuantiles son pardmetros que dividen la distribucién en r partes iguales, para calcularlos se puede utilizar la formula Fes donde Unian2 | Medidas de Tendencia Central Niimero de partes en que se divide la distribucién. Orden del cuantil K=1,23,...0-1 : Limite inferior del intervalo que contiene el cuantil Numero de observaciones. : Frecuencia acumulada anterior al intervalo que contiene el cuantil ‘fir. Frecuencia del intervalo que contiene el cuantil. Amplitud del intervalo. 2.4 RESUMEN DE CINCO PUNTOS Para describir un conjunto de datos es muy eficaz un resumen de cinco puntos. Esta informacién se obtiene facilmente y es muy ilustrativa. El resumen de cinco puntos esté integrado por: 1. Xmin, el menor valor en el conjunto de datos. 2. Qr el primer cuartil. 3. Me, la mediana. 4. Qel tercer cuartil. 5. Xmux, el maximo valor en el conjunto de datos. El resumen de cinco puntos para el ejemplo de baldosas es Me= 445.45 Qs=538.88 Xmaéx= 780 El resumen de cinco puntos es atin mAs informativo cuando se representa en un diagrama trazado a escala. Una de las representaciones gréficas generadas por computadora que realiza lo anterior se denomina diagrama de anja y brazos. Los cinco valores numéricos (el minimo, el primer cuartil, la mediana, el tercer cuartil y el maximo) se localizan sobre una escala, ya sea vertical u horizontal. La caja se usa para mostrar la mitad central de los datos que estan entre los dos cuartiles. Los brazos son segmentos de recta que se usan para representar la otra mitad de los datos: un segmento de recta representa la cuarta parte de los datos que son mas pequefios en valor que el primer cuartil, y el segundo segmento de recta representa el cuarto de datos que es mayor en valor que el tercer cuartil. En la Figura 2.1 se muestra una representacién de cajas y brazos de las 100 baldosas Figura 21: Represenacén de js y brazos de

You might also like