You are on page 1of 42

Módulo 2.

Medidas de Resumen
Objetivos. Al terminar este módulo podrá.  Estadísticos Muestrales.
A partir de un conjunto de datos dispuestos en planilla electrónica, obtener estadígrafos de posición y de tendencia, tales como:

UDA

2-1

Módulo 2. Medidas de Resumen

 

La media aritmética (Promedio) La moda Percentiles Percentiles especiales: Mediana, Cuartiles, Quintiles, Deciles.

UDA

2-2

Estadígrafos: llamaremos estadígrafo o estadístico, a números resúmenes, que nos permiten establecer conclusiones sobre de la estructura de una muestra, estos números son construidos considerando toda la información que contiene dicha muestra, es decir consideran todos los datos que han sido recolectados.

UDA

2-3

Se analizarán cuatro tipos de ellos.

Estadígrafos de:
   

Posición Tendencia central Variabilidad o dispersión Y de forma.

UDA

2-4

  Cada vez que la muestra de datos. indica una posición. Consideremos un ordenamiento ascendente UDA 2-5 . medidos en al menos en escala ordinal. este ranking. se establece un ranking para cada una de las observaciones. ha sido ordenada.

33 y 21 al ordenarlos de forma ascendente se tiene: 12. X(3)=21 X(4)=24 X(5)=33 UDA 2-6 . 21. 24. 15. 24. 15. se tiene: X(1)=12. 33 Al denotar simbólicamente este ordenamiento.Por ejemplo si se tienen los siguientes datos: 12. X(2)=15.

De esta forma. (X(1).X(1) X(2) X(3) En general para n datos. las que estarían referenciadas por una posición.X(2) … X(n)) MÁXIMO X(n-1) X(n) y X(n) = máx. (X(1). de manera directa se establece: MÍNIMO X(1) = mín.X(2) … X(n)) UDA 2-7 . se puede disponer en forma ordenada las n mediciones.

De forma inmediata surge el mínimo y máximo. UDA 2-8 . al disponer de forma ascendente las mediciones en nuestra muestra.Estadígrafos de posición  Estadígrafos de posición: son aquellos que dan información a cerca del orden en la estructura de una muestra.

2. Percentil (Pk ): es aquel valor teórico de la variable en estudio que deja por debajo de él. donde k es el orden del percentil indicado.  Hay 99 percentiles. y se denotan por P(k).  UDA 2-9 . … 99 Dado el percentil P(k). este divide la muestra en dos partes. k: 1. la inferior que contiene el k% inferior de las observaciones y la superior que contiene el (100-k)% de las observaciones. 3. al k% de la distribución.

k% (100-k)% Mín. P(k) Máx. 2-10 UDA .

será el P(k) buscado. determina una posición. El valor deterministico se establece como: n ·k V .k: es el k % buscado V. se ubica el Valor determinístico en la Frecuencia Absoluta Acumulada inmediatamente superior y. Percentiles para variables medidas en escala Ordinal o variables en escala Discreta: Para localizar el P(k). 2-11 .n: tamaño de muestra .: Valor deterministico.d.  100 UDA . la clase o variable asociada a aquella Frecuencia absoluta.d .

 Por ejemplo. se pueden calcular e interpretar algunos percentiles.xls) mediante la aplicación megastat en Excel. al tabular la variable Número de Transacciones en cajero automático ( Base: banco. para esto se procede de la siguiente forma: UDA 2-12 .

 Ordenar en forma ascendente la variable: num_trans. con la intención de observar los valores que tomará la variable discreta numero de transacciones en cajero automático: UDA 2-13 .

Se entiende que el número de transacciones en un cajero automático es una variable con medición discreta. Y se verifica que las observaciones muestrales están registradas entre 1 a 9 transacciones en cajero automático. UDA 2-14 .

que tomará la variable. Se especifica los valores en particular. de aquellos valor a ser contados. se proceda a abrir la aplicación Megastat. Frecuency Distributions y Qualitative Se selecciona la variable. luego. UDA 2-15 .Para tabular a variable. incluyendo su etiqueta.

UDA 2-16 .

se puede obtener cualquier Percentil k. determinar e interpretar el P25 UDA 2-17 . Ejemplo. A partir de la tabulación anterior. y establecer algunas interpretaciones.

una variable de tipo continuo se tendría: UDA 2-18 . Si la variable es de naturaleza continua. se procede de una forma más optima. Para la variable saldo en cuenta.

UDA 2-19 .

UDA 2-20 .

2-21   UDA . que corresponden respectivamente a los percentiles P20. ellos dividen la muestra en cinco partes iguales. C3 y C4.. denotados por D1. Los deciles: son nueve. que corresponden respectivamente a los percentiles P25. P50 y P75. P90. ellos dividen la muestra en cuatro partes iguales. P20. P40. P60 y P80.. que corresponden respectivamente a los percentiles P10. denotados por Q1. (Es muy usado para efectos descriptivos) Los quintiles: son cuatro. C2. que por la comodidad y popularidad de interpretación.. Existen percentiles especiales.. Q2 y Q3 .. denotados por C1. D2.D9. ellos dividen la muestra en diez partes iguales. reciben nombres en particulares: entre ellos se destacan:  Los Cuartiles: son tres....

dada una colección de datos. 2-22 UDA . ¿es posible saber a que valores tienden dichos datos? La respuesta la entregan los llamados estadígrafos de tendencia central. Cada vez que se observa un fenómeno cuantitativo. que inicien cotizaciones previsionales. interesa saber si los datos recolectados se unifican en torno a ciertos valores representativos que son propios del fenómeno estudiado: Por ejemplo si pensamos en la Edad de inicio en que las personas comienzan a hacer cotizaciones previsionales. la experiencia diría que sus edades varían entre los 18 y 45 años. siendo en menor número. pero no imposible.   Ahora la pregunta general es evidente. además sabemos que la gran mayoría de estos los individuos que inician su cotizaciones tienen entre 20 y 30 años. encontrar individuos con más de 40 años o menores de 18 años.

Los mas utilizados son:  MODA MEDIANA PROMEDIO O MEDIA 2-23   UDA .Estadísticos de Tendencia Central  Llamaremos estadísticos de tendencia central a aquellos valores hacia los cuales tienden a converger los datos de una variable en estudio recogidos en una muestra.

Ordinal y/o tipo discreto. básicamente. La moda se utiliza para describir. UDA 2-24 . MODA: Es aquel valor teórico de la variable que experimenta la mayor frecuencia. en datos con escala de medición del tipo: Nominal.

UDA 2-25 .

es apropiada para describir datos medidos en escala ordinal o de razón. MEDIANA: es el punto que divide a la muestra en dos partes iguales. porque se trata de un percentil en particular. Por tanto es aquel valor teórico de la variable que deja por debajo de él. ha sido revisada. La forma de calcular la mediana. ya sean discretos o continuos. el 50% de los datos (superior e inferiormente)  Se trata en consecuencia del P50. el percentil 50 UDA 2-26 .

Utilizando Megastat UDA 2-27 .

UDA 2-28 .

Utilizando aplicaciones sólo de Excel UDA 2-29 .

UDA 2-30 .

UDA 2-31 .

UDA 2-32 .

. • Describe bien sólo si la muestra es homogénea y/o simétrica. (se verá en sesiones posteriores con mayor profundidad) •Sólo puede ser calculada en variables de naturaleza cuantitativa (Nunca sobre variables medidas en escala nominal u ordinal) UDA 2-33 .MEDIA: es el punto en donde se ubica el centro de masas de la muestra.  Es el estadígrafo de tendencia central mas conocido. el punto de equilibrio.  X n 1 x  n n _ X i 1 n i • Se interpreta como el valor al cual se pueden asimilar todos y cada uno de los datos... usado y abusado y se calcula:: X 1  X 2  .

Comúnmente. para una variable en estudio. UDA 2-34 . los parámetros utilizan letras griegas. Promedio poblacional:   i 1 N Xi N Un parámetro (señala información sobre la población). El promedio poblacional. se calcula utilizando todos los datos de la población.

UDA 2-35 .

UDA 2-36 . supongamos la siguiente situación ilustrativo-pedagógica. el “casero”. Viaja con su bus a distintos pueblos vendiendo ropa de adulto joven. vende su ropa a sectores rurales. Ahora bien. Un comerciante.

Tunca x  24 años UDA 2-37 .

 Con la misma lógica. conforme a los buenos resultados de venta en el pueblo anterior. UDA 2-38 . decide aventurarse a otro pueblo.

Miraflores x  24 años UDA 2-39 .

x  24 años UDA 2-40 .

RUIDO VALORES MUY EXTREMOS MINIMO Y MAXIMOS DISTINTOS PROMEDIO NO ES VÁLIDO PARA DESCRIBIR UNA MUESTRA Y TOMAR UNA DECISIÓN ENTORNO A UNA PROBLEMÁTICA ETC. 2-41        UDA . POCA HOMOGENEIDAD Y/O MUCHA DISPERSION. ¿Que le ocurrió al comerciante? DISPERSIÓN.

¿le proporcionaríamos más información al "casero" para la toma de decisiones? Si. medidas de dispersión o de Variabilidad … Próxima clase ! UDA 2-42 .¿Habrán medidas que capturen o ayuden a explicar la variabilidad de un fenómeno en estudio? Con aquellas medidas.