You are on page 1of 73

ESTADISTICA I

_________________________________________________________________________

Programas de Estudio a Distancia

Estadística I

www.unipamplona.edu.co
Esperanza Paredes Hernández
Rectora
María Eugenia Velasco Espitia
Decana Facultad de Estudios a Distancia

_________________________________________________________________________
UNIVERSIDAD DE PAMPLONA-.Facultad de Estudios a Distancia

ESTADISTICA I
_________________________________________________________________________

Tabla de Contenido
Presentación
Introducción

UNIDAD 1: Generalidades de la Estadística
Núcleos Temáticos y Problemáticos
Proceso de Información
1.1. DEFINICIÓN
1.1.1 Importancia
1.1.2 Población
1.1.3 Muestra
1.1.4 Métodos de Selección de una Muestra al Azar
1.1.5 Unidad Estadística
1.2 ESTADÍSTICA DESCRIPTIVA – DISTRIBUCIÓN DE FRECUENCIAS
1.2.1 Recolección de Datos
1.2.2 Intervalos
1.2.3 Amplitud
1.2.4 Frecuencia de Clase o Frecuencia Absoluta
1.2.5 Marca de Clase (X)
1.2.6 Frecuencia Relativa (Fr)
1.2.7 Frecuencia Acumulada (Fa)
1.2.8 Frecuencia Relativa Acumulada (Fra)
Proceso de Comprensión y Análisis

UNIDAD 2: Medidas de Tendencia Central
Núcleos Temáticos y Problemáticos
Proceso de Información
2.1 PRIMER CASO: CUANDO LOS DATOS NO ESTÁN AGRUPADOS
2.1.1 Media Aritmética
2.1.2 Mediana
2.1.3 Moda
2.2 SEGUNDO CASO: CUANDO LOS DATOS ESTÁN AGRUPADOS
2.2.1 Media Aritmética
2.2.2 Mediana
2.2.3 Moda
Proceso de Comprensión y Análisis

_________________________________________________________________________
UNIVERSIDAD DE PAMPLONA-.Facultad de Estudios a Distancia

ESTADISTICA I
_________________________________________________________________________
UNIDAD 3: Medidas de Dispersión
Núcleos Temáticos y Problemáticos
Proceso de Información
3.1 DESVIACIÓN ESTÁNDAR O TÍPICA
3.2 VARIANZA
3.3 COEFICIENTE DE VARIACIÓN
Proceso de Comprensión y Análisis

UNIDAD 4: Medidas de Ubicación
Núcleos Temáticos y Problemáticos
Proceso de Información
4.1 CUARTILES, PERCENTILES Y DECILES
4.2 DIAGRAMAS DE CAJA
Proceso de Comprensión y Análisis

UNIDAD 5: Presentación de la Información
Núcleos Temáticos y Problemáticos
Proceso de Información
5.1 HISTOGRAMA
5.2 POLÍGONOS DE FRECUENCIA
5.3 OJIVAS
5.4 BARRAS
5.4.1 Barras Verticales
5.4.2 Barras Horizontales
Proceso de Comprensión y Análisis

ANEXO: Tablas

BIBLIOGRAFÍA GENERAL

_________________________________________________________________________
UNIVERSIDAD DE PAMPLONA-.Facultad de Estudios a Distancia

en especial de los sectores menos favorecidos y para quienes las oportunidades se ven disminuidas por su situación económica y social. y los estudiantes entre sí”. el profesor y el estudiante. La Educación Superior a Distancia ofrece esta cobertura y oportunidad educativa ya que su modelo está pensado para satisfacer las necesidades de toda nuestra población. la dignidad humana y el desarrollo nacional. Visión: La Universidad de Pamplona al finalizar la primera década del siglo XXI. deberá ser el primer centro de Educación Superior del Oriente Colombiano. brindando oportunidades de superación y desarrollo personal y social.ESTADISTICA BASICA Presentación La educación superior se ha convertido hoy día en prioridad para el gobierno Nacional y para las universidades públicas. para contribuir colectivamente a la construcción del país que queremos. sin que la población tenga que abandonar su región para merecer de este servicio educativo. promotores de la paz. La Universidad de Pamplona gestora de la educación y promotora de llevar servicios con calidad a las diferentes regiones. el cual define: “Que la Educación Superior a Distancia es aquella que se caracteriza por diseñar ambientes de aprendizaje en los cuales se hace uso de mediaciones pedagógicas que permiten crear una ruptura espacio temporal en las relaciones inmediatas entre la institución de Educación Superior y el estudiante. presentan los siguientes materiales de apoyo con los contenidos esperados para cada programa y les saluda como parte integral de nuestra comunidad universitaria e invita a su participación activa para trabajar en equipo en pro del aseguramiento de la calidad de la educación superior y el fortalecimiento permanente de nuestra Universidad. con actividades flexibles acordes a las posibilidades de los estudiantes. Maria Eugenia Velasco Espitia – Directora CEDUP UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia . y el Centro de Educación Virtual y a Distancia de la Universidad de Pamplona. apuntando siempre hacia el cumplimiento de nuestra visión y misión como reza en el nuevo Estatuto Orgánico: Misión: Formar profesionales integrales que sean agentes generadores de cambios. prueba de ello es el espíritu de las actuales políticas educativas que se refleja en el proyecto de decreto Estándares de Calidad en Programas Académicos de Educación Superior a Distancia de la Presidencia de la República.

Como dijo Salomón Fabricant “todo el mundo parece hoy coincidir en que la Estadística puede ser útil para comprender. se debe matematizar. el progreso puede medirse mediante diversos índices numéricos. que manejan y manipulan de una manera sorprendente. Esta información que de cierta manera se manipula. dio la base para revelar tos misterios del mundo.ESTADISTICA BASICA Introducción La importancia que tiene la matemática en el desarrollo de los procesos intelectuales del hombre es notoria a través de su historia. Contrariamente a los griegos. dar explicaciones razonables para alcanzar la verdad de los fenómenos que lo suceden. la matemática en la edad moderna ayudó a buscar explicaciones concretas de problemas que se daban en ingeniería. a partir de los trabajos de Galileo. En nuestra sociedad. analiza e interpreta esas informaciones mediante unas representaciones significativas para él y así se obtiene una serie de conclusiones razonables. organiza. La Estadística es utilizada en casi todas las ramas de la ciencia moderna. Es decir. manipular e interpretar estos números. Sin embargo. seguir un procedimiento para poder tabular la información. así como en muchos otros campos de la actividad humana. la estadística se utiliza para describir. presentarla y así hacer el análisis respectivo para dar las conclusiones pertinentes al estudio que se está realizando. evaluar y controlar el funcionamiento de la sociedad”. en cierta forma se está efectuando una serie de operaciones: recoge. es decir. Fue así como en la antigüedad el pensamiento matemático contribuyó a resolver problemas en tareas económicas y constructoras de diferentes pueblos. gracias al medio. los hombres de la edad media utilizaron el contenido matemático como una simple rutina para disciplinar la mente. Aún cuando los tipos de problemas a los cuales puede aplicarse la Estadística como herramienta fundamental para el análisis e interpretación de resultados son UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia . Es decir. Por tal motivo. las personas están rodeadas constantemente por un conjunto de experiencias. construcción y otras actividades prácticas del hombre.

ésta es la parte que más tiempo consume en toda investigación que sea realizada. Con respecto a la representatividad de la muestra. A la vez este tamaño será afectado por el método empleado para la selección de la muestra representativa. cuanto menos opiniones impongamos. tomando en cuenta el tiempo. Spss. Se considera este punto dentro del desarrollo del módulo. Es esta etapa la que le da el objetivo final a la estadística. UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia . De hecho. Por lo cual es necesario adquirir conocimientos generales de los métodos más importantes para hacer inferencias. En cada caso práctico debe situarse con cuidado la naturaleza del problema específico. Esto implica. acerca de la población correspondiente. formular preguntas claras e imponer limitaciones adecuadas al problema. Cuarta etapa: tabulación y formulación de la respuesta. ésta debe sujetarse a reglas estrictas. Segunda etapa: diseño del experimento. Se han propuesto varios métodos para vencer esta dificultad y se han usado en la práctica. serán mejores los resultados. Para investigar con éxito un problema dado. En la actualidad existen varios paquetes estadísticos sencillos de manejar. tales como el Statgraphics. No existe una fórmula mágica ni única en estadística que tome en cuenta todas las situaciones prácticas concebibles. Existe el peligro de que una selección pueda ser preferida en alguna forma. Nuestro deseo es obtener un máximo de información empleando un mínimo de costo y tiempo. por lo tanto se recomienda utilizar e integrar un software apropiado para tal fin. se debe observar que no es fácil obtener selecciones que sean completamente aleatorias. Al aplicar el método estadístico antes mencionado. Con el apoyo del computador los cálculos matemáticos se hacen más fáciles. entre otras cosas. En general. en muchos casos los pasos de una investigación estadística son los siguientes: Primera etapa: formulación del problema. Tercera etapa: experimentación o recolección de datos. que se debe determinar el tamaño de la muestra o la cantidad y tipo de datos que resolverán más eficientemente el problema. primero se tienen que crear conceptos precisos. puesto que se van a tomar decisiones con base en los resultados obtenidos en el estudio descriptivo de la muestra.ESTADISTICA BASICA bastante heterogéneos. Es decir. se va a inferir sobre la muestra y se trata de sacar conclusiones para la población. se obtienen conclusiones a partir de la muestra. Sas. para estar seguros de que será escogido el método más apropiado. dinero disponible y la habilidad de los investigadores. Minitab.

ESTADISTICA BASICA De común acuerdo con su Tutor se pueden desarrollar los ejercicios propuestos al final de cada tema. se puede utilizar calculadora y computador para facilidad de los cálculos. UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .

medir y comparar las riquezas de las naciones Lo anterior no significa que antes de los estudios de Godofredo Achenwaü. los chinos y los egipcios efectuaron censos que eran simples inventarios elementales Desde su creación la estadística se ha enriquecido continuamente con los aportes de matemáticos. Se considera fundador de la estadística a Godofredo AchenwalL profesor y economista alemán (1719 . los estados no hubiesen efectuado inventarios de sus riquezas. filósofos y científicos. Además.ESTADISTICA BASICA UNIDAD 1: Generalidades de la Estadística Núcleos Temáticos y Problemáticos  Definición  Estadística Descriptiva – Distribución de Frecuencias Proceso de Información 1. es analítica. se transforman. Se sabe que 2000 a 2500 años antes de Cristo.1772) quien. siendo profesor de la universidad de Leipzig. considerándose esta última como la función más UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia . de observar y describir el hecho En su origen la estadística era histórica: hoy en día. dividen y aún cambian de nombre. además de ser descriptiva. estos invéntanos o censos se efectuaron desde la antigüedad. en un principio se consideraba que la función de ¡a estadística era la descripción de las características de un grupo. escribió sobre el descubrimiento de una nueva ciencia que ¡lamo estadística (palabra derivada de Staat que significa gobierno) y que definió como “el conocimiento profundo de la situación respectiva y comparativa de cada estado” Achenwaü y sus seguidores estructuraron los métodos estadísticos que se orientaron a investigar. Como ciencia que es. la estadística.1 DEFINICIÓN Al evolucionar las ciencias. pierden sus rasgos primitivos. la estadística ha sufrido igual proceso y para comprender su estado actual y su campo de actividades se necesita conocer algo de su historia.

Las siguientes son unas definiciones que ayudan a determinar el sentido de la estadística: Dicaonano de Webster “una rama de las matemáticas que trata de la recopilación. Fraser “la estadística trata con métodos para obtener conclusiones a partir de los resultados de los experimentos o procesos. como aplicaciones particulares a variantes de la teoría general. después siguieron los comerciantes. Es decir a partir de un conjunto de métodos.' Kendall y Stuart “la estadística es la rama del método científico que traía de los datos reunidos al contar o medir las propiedades de alguna población”. ya que permite obtener conclusiones para un grupo mayor. los educadores. etc. describir. sean estos de nivel técnico o científico). normas. mediante la indicación de ámbitos dentro de los cuales puede suponerse o rechazarse una hipótesis. agrupar. se puede notar que a partir de la recopilación de datos se pueden hacer inferencias con respecto a resultados de experimentos.1 Importancia La teoría general de la estadística es aplicable a cualquier campo científico en el cual se hacen observaciones el estudio y aplicación de los métodos estadísticos son necesarios en todos (los campos del saber. partiendo de una investigación realizada en un grupo menor. la descriptiva y la de inferencia. 1.1. el análisis. Es entonces.ESTADISTICA BASICA importante que realiza. denominado muestra. la interpretación y la presentación de una gran cantidad de datos numéricos. Las primeras aplicaciones de la estadística fueron los asuntos de gobierno. Es obvio que en cada campo se aplican o desarrollan procedimientos específicos. Se acostumbran a distinguir dos clases de Estadística. Matemáticamente los procedimientos estadísticos están muy desarrollados y asegurados en el plano de la teoría. reglas y de principios para observar. luego las utilizaron las compañías de seguros y los empresarios de juegos de azar. por ejemplo. los industriales." Al unir estas definiciones. cuantificar y analizar el comportamiento de un grupo. denominado población. UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia . un campo parcial de la Matemática aplicada a un conjunto de objetos que se asignan valores numéricos y luego estos se siguen elaborando matemáticamente.

infinita cuando consta de infinitos elementos. 1. son poblaciones finitas. Si una muestra es representativa de una población es posible inferir importantes conclusiones sobre la población a partir del análisis de la muestra.3 Muestra Se considera como muestra el subconjunto de elementos que pertenecen a la población objetivo sobre los cuales se recogerá la información necesaria.1. tormentas o granizos.ESTADISTICA BASICA Es por tanto que las técnicas estadísticas se utilizan en casi todos los aspectos de la vida:  Se diseñan encuestas para recoger información y así poder predecir algún suceso. Las muestras pueden ser de dos tipos: probabilística o al azar.1.  Los experimentos que se hacen para determinar el método apropiado para curar cierta enfermedad. Es población finita cuando el número de elementos que la componen es limitado. los estudiantes matriculados en un colegio.2 Población Es el conjunto de elementos que se toma de referencia para el estudio que se desea investigar la ocurrencia de una característica o propiedad. para tomar una decisión válida relativa a la población de estudio. las Temperaturas. Según sea el tamaño. las piezas fabricadas por una máquina. cruces) de sucesivas tiradas de una moneda. la intensidad y dirección del viento son variables aleatorias. 1. cantidad de carros que transitan por un peaje en un tiempo determinado es finita pero si no se especifica este tiempo es entonces infinita. objetos o cosas. cuando cada uno de los elementos tiene la misma probabilidad de ser escogido y no probalística cuando se seleccionan los datos con determinado criterio o conveniencia del UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia . mientras que la determinada por todos los posibles resultados (caras. Ejemplo La población consistente en todas las tuercas producidas por una fábrica en un día específico. intensidad. las personas que hoy y en el futuro subscriban un seguro de vida. son poblaciones infinitas. Los elementos que integran la población pueden pertenecer a personas.  La duración. la población puede considerarse como finita o infinita. extensión de las lluvias.

este muestreo puede ser probabilística o intencional Es probabilística cuando todos los elementos de la población tienen la misma posibilidad de ser elegidos. En cambio. algunas unidades tienen mayor posibilidad que otras de ser seleccionadas. También cuando las características que” se investiga presentan poca variabilidad o cuando la población facilita su enumeración para su selección.1. este se concentra en un área pequeña. Por Estratos Para el muestreo estratificado se divide la población en vanos grupos o estratos con el fin de dar representatividad a los distintos factores que integran la población del estudio. La selección de esta muestra probabilística se puede realizar por medio de los siguientes métodos: Azar Simple Este método de selección permite que todos los elementos que constituyen la población tengan la misma posibilidad de ser incluidos en la muestra.2 N 1000 Lo cual indica que el 20% de los obreros corresponden a 120 de los técnicos 50 y 30 profesionales. ni la confianza que merecen dichos resultados. la condición de la estratificación es la presencia en cada estrato de las características que conforman la población. 1. la probabilidad de selección de cada persona es: n 200 P= = = 0. en este caso. en estos casos.4 Métodos de Selección de una Muestra al Azar La clave de un procedimiento de muestreo es garantizar que la muestra sea representativa de la población. Ejemplo: en la fabrica T&T hay mil personas trabajando.ESTADISTICA BASICA investigador. por tal razón no se puede determina la validez. 600 de las cuales son obreros. Este método es de gran importancia cuando la población no es grande o siendo grande. es cuando el investigador selecciona bajo un criterio la muestra. UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia . intencional. 250 son técnicos y 150 son profesionales Si se quiere seleccionar una muestra aleatoria simple de 200 personas.

En este tipo el tamaño de muestra por estrato se escoge de tal forma que sea proporcional al tamaño poblacional del mismo. cuyo número si se conoce. repartición en todos los estratos. En este caso las probabilidades de selección serían. por estrato. En estos casos típicamente los elementos de la población se encuentran de manera natural agrupados en conglomerados. los habitantes de una ciudad en barrios.  Afinación óptima. simplemente porque estos últimos son menores. etc. Dentro de este muestreo encontramos casos tres especiales:  Muestras de igual tamaño. Por Conglomerado Existen situaciones donde ni el muestreo aleatorio simple ni el estratificado son aplicables. Si se supone que cada uno de estos conglomerados es una muestra representativa de la población total respecto a la variable que se estudia. UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .ESTADISTICA BASICA Este procesó de estratificación requiere que la población sea dividida en grupos homogéneos donde cada elemento tiene una característica tal que no le permite pertenecer a otro estrato.133 Técnicos 80/250= 0. Ejemplo: en el caso de la fabrica T&T se puede argumentar que obreros.53 Donde se puede apreciar que la probabilidad de selección no es igual para todas las personas. Para la selección de los elementos o unidades representantes de cada estrato se utiliza el método del muestreo aleatorio o al azar. considerando tanto la variación como el tamaño de cada estrato además se tiene en cuota el costo de la investigación. Este método utiliza la mejor subdivisión posible de una muestra total. las siguientes: Obreros 80/600= 0. Por ejemplo la población se distribuye en provincias. técnicos y profesionales son importantes para establecer comparaciones y se decide escoger 80 de cada estrato. En este tipo de muestreo debe seleccionarse un número igual de elementos en cada grupo mediante procedimiento al azar.  Muestreo proporcional.32 Profesionales 80/150= 0. sino que depende del estrato en que éstas se encuentran y así un obrero tiene menor posibilidad de ser seleccionado que un profesional. ya que no se dispone de una lista con el numero de elementos de la población ni en los posibles estratos.

es decir.1. Sistematizada Una forma práctica para seleccionar la muestra es hacerla en forma sistemática. V. Ejemplo: si se quiere tomar una muestra de 500 viviendas en un barrio que tiene 2000 viviendas. Dato Hace referencia a la observación particular. hasta completar la muestra. o sea el objeto de la medición. dichas variables pueden ser: UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia . si se supone que la edad y el sexo pueden influir en la opinión. 1. dimensión que adopta la forma de una clasificación. La unidad estadística es el elemento del universo que reporta la información (observación) y sobre el cual se realiza un determinado estudio (análisis). Para iniciar el proceso de selección sistemática se escoge al azar un número entre 1 y 4. lo que implica una muestra estratificada. donde el intervalo se calcula así: K= N/n. a partir del número seleccionado y cada 4 viviendas se hace una escogencia. h etc. que puede tomar un conjunto prefijado de valores. anotados u observados Variables Es una dimensión o una característica de una unidad de análisis. Z. la información relacionada con las características de cosas existentes que pueden ser recogidos. analizar todos sus elementos o una muestra aleatoria simple. Ejemplo: se desea tomar una muestra de la población colombiana para estudiar la proporción de personas que están de acuerdo con la relaciones prematrimoniales. el intervalo de selección será: K= 2000 / 500 = 4.5 Unidad Estadística Una vez identificada la población y la muestra. se ubica la unidad estadística.ESTADISTICA BASICA se puede seleccionar algunos de estos conglomerados al azar y dentro de ellos. Y. se debería tomar una muestra donde estas características sean las mismas que en la población base. x. donde N es el tamaño de la población y n el de la muestra. Una variable se puede representar por un símbolo X. escogiendo una muestra de cada intervalo.

hay que tener en cuenta los siguientes pasos: 1. azul. amarillo. la medición de la temperatura la cual se puede hacer por medio de un termómetro en grados Fahrenheit. el anaranjado como 2 etc. verde. 1. Por ejemplo. Puede ser posible sustituir tales variables por entidades numéricas de la siguiente manera: denotando el rojo como 1. La estatura H de una persona que puede ser 1. 1.DISTRIBUCIÓN DE FRECUENCIAS La distribución de frecuencias o tabla de frecuencia. 2. violeta y rosado. en una competencia ciclística se tiene en cuenta los cinco primeros puestos para la premiación. Por ejemplo.  Variable Continua: es la variable que puede tomar cualquier valor entre dos valores dados.  Intervalo: en adición a la clasificación y ordenamiento se introduce la posibilidad de establecer el ordenamiento con intervalos iguales.2.ESTADISTICA BASICA  Nominal: a veces conviene extender la noción de variable a entidades no numéricas: es decir que relacionan un carácter. es la toma de datos u observaciones. El número N de hijos en una familia puede ser O.  Ordinal: le asigna valores numéricos a los sujetos. 1. Por ejemplo. anaranjado.  Variable Discreta: es la variable que solo puede tomar un determinado número de valores enteros. el color C de un arco iris es una variable que puede tomar los valores rojo. un nombre. 1. Para la elaboración de esta distribución si los datos son cuantitativos.1 Recolección de Datos Es la base para cualquier estudio estadístico. UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia . es la disposición tabular de los datos por clases junto con las correspondientes frecuencias de clase.2 ESTADÍSTICA DESCRIPTIVA .65 cm.80.62 cm. una cualidad. de tal forma que los valores más altos se le asignan a los individuos que tienen más de la característica que se mide. 3. estos se llevan a cabo mediante la recopilación de los mismos sin ninguna ordenación de acuerdo a lo que se está investigando. Esto hace que necesariamente satisfaga la característica de diferenciación pero en adición introduce la posibilidad de ordenamiento.

Existe un tipo de ordenación y se hacen generalmente en una tabla de distribución de frecuencias. los resultados son: 40 17 26 10 26 21 18 27 16 38 22 33 24 20 28 14 30 25 29 37 28 28 33 22 25 29 29 29 21 32 19 35 23 28 22 15 34 13 16 26 24 20 31 29 18 19 11 23 20 24 28 11 34 39 10 25 17 21 34 18 Después de tener dicha información.33 log 60 = 6. Esta fórmula esta determinada por: m = 1 + 3. Así: R = Dm . que es la diferencia entre el mayor y el menor dato obtenido. colocar los datos numéricos en orden creciente o decreciente.92 n = tamaño de la muestra Lo cual indica que se puede aproximar a 6 o 7 intervalos. para estudiar sus ventas semanales en miles de pesos. en cuanto al número de clases el investigador es autónomo para escoger el número de intervalos para trabajar. donde m = número de intervalos m = 1 + 3. es decir. donde R = rango Dm = dato mayor dm = dato menor R= 40 . Para ello se debe encontrar inicialmente el rango de la distribución. sin embargo existe una fórmula que se utiliza como base o guía para indicar la cantidad de intervalos que se van a crear en la tabla de frecuencias. pero se agregan dos más que son: el intervalo menor que el dato menor y el intervalo mayor que el dato mayor. En este caso se toman 6 intervalos. esto cuando se utiliza un programa de computador.dm. UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .2.2 Intervalos Al resumir grandes colecciones de datos es útil distribuidos en clases o categorías.33 log n. se procede a ordenarla.ESTADISTICA BASICA Por ejemplo la empresa “Cuero Lindo” recopiló la información resultante de encuestar 60 establecimientos pequeños.10 = 30 1.

40 40 - Otra manera de formar los intervalos de clase es tomar un dato como medida de referencia.40 UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .20 4 20 . La amplitud indica la distancia que debe tener cada clase. La amplitud se puede determinar como el cociente entre el rango y el número de intervalos.3 Amplitud El rango nos ayuda a determinar la amplitud o el tamaño de cada clase.30 5 30 .30 6 30 .10 2 10 .35 6 35 . Entonces el primer grupo esta comprendido entre 10 y 15 miles de pesos. se parte del dato menor 10 y se le suma la amplitud. A = R / m. donde el intervalo estará entre 15 y 20 miles de pesos.2. NÚMERO DE CLASES INTERVALOS .20 3 20 . así.25 5 25 .25 4 25 .15 3 15 . donde A = amplitud A = 30 / 6 = 5 miles de pesos Para formar los intervalos de clase.35 7 35 .10 1 10 . incluyendo los intervalos menores a 10 miles de pesos y mayores a 40 miles de pesos.ESTADISTICA BASICA 1. 10 + 5=15. por ejemplo 5 (que indica $5000) o el dato menor y sumarle el valor de la amplitud: NÚMERO DE INTERVALOS INTERVALOS 1 5 .15 2 15 . si es utilizando un programa estadístico. En forma similar se crean los demás intervalos. El siguiente grupo será: 15 + 5 = 20. siendo esta una constante para cada intervalo.

Como cada clase está formada por un intervalo. 29 y 30. 28.5 15 . van a estar los valores 21. las menores ventas presentadas son de $10000.30 27. 24 y 25.25 ///////////// 14 25 .5 20 . las mayores ventas están entre $25000 y $30000.20 17.5 Marca de Clase (X) Es el punto medio del intervalo de clase y se obtiene promediando el limite inferior y superior de cada clase. por ejemplo: que para hacer el conteo para determinar las frecuencias correspondientes al intervalo 20 - 25.35 32. 1.20 //////////// 12 20 . 23.35 //////// 8 35 .2. Intervalos X 5 . 27. De igual manera los valores que van a estar entre 25 . por ejemplo: que 12 establecimientos tienen ventas semanales entre $15000 y $20000.10 / 2 10 .5 UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia . Esto quiere decir.30 son 26.40 //// 4 TOTAL 60 Esta frecuencia significa. etc.5 25 .10 7.4 Frecuencia de Clase o Frecuencia Absoluta Se determina el número de individuos que pertenecen a cada clase.5 30 . 22.25 22.5 10 .15 ///// 5 15 .30 ////////////// 15 30 .ESTADISTICA BASICA 1.40 37.2.15 12. podemos utilizar el siguiente cuadro para realizar el conteo: Número de Intervalos F Establecimientos 5 .5 35 . entonces se debe tomar como un intervalo abierto a izquierda y cerrado a derecha. Teniendo esto en cuenta.

esto quiere decir que el promedio del primer intervalo es de $7500.2. La frecuencia acumulada ascendente se obtiene así: se inicia por la frecuencia absoluta del último intervalo.  La tercera acumulada se obtiene de sumar 7 + 12 = 19 y así sucesivamente.33% de los establecimientos tienen ventas entre $10000 a $15000.27.ESTADISTICA BASICA 5+10 = 7. 2+5 = 7. Este porcentaje se obtiene al multiplicar por 100 el resultado obtenido. la frecuencia relativa del segundo intervalo es de 0. F Fr =  n La frecuencia relativa del primer intervalo es 0.2.0833. La frecuencia acumulada descendente se obtiene de la siguiente manera:  La primera frecuencia acumulada corresponde a la primera frecuencia absoluta. 1.0333. es decir. La siguiente es sumar esta frecuencia acumulada con la anterior: 4+8 = 12.5 X= 2 Miles de pesos. 1. La que sigue sería 4 + 8 = 12 y así sucesivamente.5 . Por ejemplo: 32. en este caso 4. significa que el 3.6 Frecuencia Relativa (Fr) Es su frecuencia dividida por la frecuencia total de todas las clases y se expresa generalmente como un porcentaje.  La segunda acumulada se obtiene sumando las dos primeras absolutas. UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia . Otra manera de hallar la amplitud de un intervalo es encontrar la diferencia común entre marcas de clase sucesivas.33% de los establecimientos tienen ventas menores de $10000.0333.7 Frecuencia Acumulada (Fa) Es la acumulación ascendente o descendente (de la primera a la última clase o viceversa) de frecuencias absolutas.5 = 5 miles de pesos. Este valor se obtuvo de la relación entre 2/60 = 0. De igual manera. que significa que el 8.

8833 20 .6833.2333 0. cuyo significado es que el 80% de los establecimientos tienen ventas semanales menores a $30000.35 8 56 12 35 . significa que 19 establecimientos tienen ventas semanales entre $10000 y $20000 o inferiores a $20000.25 0.20 12 19 53 20 .1167 0.33% de los establecimientos tienen ventas mayores a $20000 mil pesos.9333 0.0333 + 0.1167 y así sucesivamente. se obtiene sumando las dos primeras frecuencias relativas.9666 15 . si tomamos el grupo 4 ascendente su acumulado será del 0. La segunda.6833 25 .15 5 7 58 15 .25 0.10 2 2 60 10 .0667 1 0.2 35 . La frecuencia relativa acumulada ascendente se obtiene así: se inicia por la frecuencia relativa del último intervalo. UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia . La siguiente es sumar esta frecuencia acumulada con la anterior 0.2 0. La primera frecuencia relativa acumulada corresponde a la primera frecuencia relativa.ESTADISTICA BASICA Fa Intervalos F 5 .0833 0. esto significa que el 68.2 y así sucesivamente.8 Frecuencia Relativa Acumulada (Fra) Es la acumulación sucesiva en forma ascendente o descendente de frecuencias relativas.0667.20 0.8.30 15 48 27 30 .40 0.25 14 33 41 25 . en este caso 0.0667 Si tomamos el grupo 5 descendente su acumulado es de 0. 0. Fra Intervalo Fr 5 – 10 0. es decir.45 30 .3167 0.8 0.1333 = 0.0333 0.0333 1 10 . 1.2. quiere decir que 12 establecimientos tienen ventas semanales entre $30000 y $40000 o mayores a $30000.40 4 60 4 El significado de este cuadro es el siguiente: si tomamos el tercer grupo descendente.30 0.0833 = 0.0667 + 0.55 0. Y si tomamos el segundo grupo ascendente.1333 0. su frecuencia acumulada.35 0.15 0.

 “La Estadística estudia el comportamiento de fenómenos colectivos y nunca de una observación individual” comentar este principio.0833 7 58 0.0667 Total 60 1.10 2 0.00 La tabla presenta el resumen de la clasificación de los 60 establecimientos analizados por los investigadores de la empresa Cuero Lindo.2 19 53 0.0667 60 4 1 0.6833 25 .9333 0.20 12 0.8833 20 .35 8 0.0333 1 10 .8 0.1167 0.55 0.  Clasificar a que tipo de estadística pertenecen los siguientes ítems:  Realizar un inventario  Determinar la demanda de un producto  La posibilidad que llueva en una ciudad determinada  El porcentaje de desempleo en una ciudad específica  El promedio de las acciones vendidas en la bolsa de valores en una empresa en un mes determinado  El aumento del índice de precios al consumidor en un mes específico  El aumento del costo de vida en un mes específico  El número de accidentes ocurridos en una ciudad determinada  Las ventas de un almacén en un mes determinado UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .1333 56 12 0.2333 33 41 0.25 48 27 0.2 35 . esto significa que se ha organizado la información.30 15 0.9666 15 .40 4 0. Proceso de Comprensión y Análisis  Decir de las siguientes variables cuáles son continuas y cuáles son discretas  La altura de las personas  La medida de la cantidad de lluvia caída en una localidad en un mes  La edad de las personas.0333 2 60 0.45 30 .25 14 0.15 5 0.ESTADISTICA BASICA Fa Fra Intervalo F Fr 5 . en años cumplidos  El número de alumnos de cada curso de un colegio  Por qué es útil la estadística en el campo para el cual se está preparando.3167 0.

 Dar un ejemplo donde se aplique la estadística en los siguientes campos:  Agricultura  Educación  Mercadeo  Biología  Electrónica  Ciencias políticas  Negocios  Medicina  Psicología  Química  Física  Ingeniería  Comunicaciones  Mercadeo  Administración  Finanzas  Ciencias políticas  Producción  Economía  Psicología  Sociología  Educación  Medicina  Electrónica  Física  Responder a los siguientes enunciados:  ¿Qué significan las variaciones en los precios de los artículos al consumidor?  ¿Cree que cualquier investigación requiere información estadística?  ¿Cuáles son las funciones del Departamento Administrativo Nacional de Estadística (DANE)?  Las calificaciones finales de 80 estudiantes son: 68 93 71 78 82 79 83 57 88 77 84 60 59 66 75 60 71 73 78 85 75 73 85 72 94 95 79 80 62 75 82 88 75 63 77 75 62 65 76 76 68 79 61 78 69 61 67 75 53 63 90 73 65 95 74 89 97 71 74 72 62 93 75 62 68 78 78 65 86 81 88 76 87 74 60 96 85 76 67 73 Hallar:  La calificación más alta  La calificación más baja  El rango  Las cinco notas más altas  Las cinco notas más bajas  La décima nota de mayor a menor  La tabla de frecuencias utilizando 7 intervalos UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .ESTADISTICA BASICA  El aumento de costos de producción con respecto al mismo mes del año anterior.

construir una distribución de frecuencias con 5 intervalos y establecer las conclusiones más importantes.000?  ¿Qué porcentaje de empleados tienen un salario entre $1'228.000?  En la tabla que sigue se recogen los pesos de 40 estudiantes varones de una universidad con precisión de 1 Kilo.25%?  Cuál es el significado del 33.71 e interpretar cada uno de los siguientes valores en la clasificación: X4 Fr6 Fa2 F5 Fra 4 n Fa 3 Fra 5 Fr 2  Responder:  ¿Cuántos empleados tienen un salario inferior a $1'382.000?  ¿Cuántos empleados tienen un salario entre $921.000 y $1'382.ESTADISTICA BASICA  Comprobar que la amplitud de los intervalos es de 6.75%?  En una empresa se investigó una muestra de 56 empleados para determinar su salario mensual en miles de pesos.000 y $1'075. Los resultados fueron los siguientes: 987 1176 1233 1248 944 1105 1243 1109 1173 1233 985 1093 1310 824 1185 1157 1330 1024 1079 1690 1262 956 816 1220 1331 1000 1032 1229 1385 1252 972 1381 1240 932 1358 614 1022 1404 1415 1303 984 1234 1324 918 1067 1203 827 1209 1055 1104 1343 1202 759 1024 905 1490  Crear la tabla de frecuencias con siete intervalos y comprobar que su amplitud es de 153.  Cuál es el significado del 91.29  El número de estudiantes de 79 o más  El número de estudiantes con calificaciones por debajo de 71  El porcentaje de estudiantes con calificaciones mayores de 65 pero no superiores a 85.000?  ¿Qué porcentaje de empleados tienen un salario superior a $1'228. 69 72 62 74 78 73 79 70 73 68 82 84 63 69 88 81 99 77 82 74 75 73 86 71 73 67 76 70 67 76 66 80 72 67 71 75 78 72 64 72 UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .

 Los límites de clase. 164.  Determinar un conjunto apropiado de intervalos de clase.  La marca de clase o punto medio de la tercera clase.000 .000 .  El porcentaje de empleados que cobran igual o menos de $300.18 m y la mayor 7.  El intervalo de clase con máxima frecuencia.000 a la semana.000 10 $300.44 m.$310.$290.  La frecuencia de la tercera clase.000 . SALARIOS NÚMERO DE EMPLEADOS $250. Hallar:  La anchura del intervalo de clase.$320.$280.000 .  El porcentaje de empleados que cobran menos o igual de $280.000 8 $260.000 16 $280.  La anchura del quinto intervalo de clase.ESTADISTICA BASICA  La siguiente tabla muestra una distribución de frecuencia de los salarios semanales de 65 empleados de la empresa P & R.000 por semana.  La siguiente tabla muestra una distribución de frecuencias de las vidas medias de 400 válvulas de radio probadas en la empresa L & M. UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .  La menor de 150 medidas es 5.  El límite superior de la cuarta clase.$260.00 . 137.  Marcas de clase que puedan usarse para formar la distribución de frecuencia de esas medidas.000 2 Total 65 Determinar de la tabla de frecuencias:  El límite inferior de la sexta clase. 155. 173 y 182 libras.$270.000 pero al menos $260.  Si las marcas de clase en una distribución de frecuencias de pesos de estudiantes son 128.000 5 $310.$300.000 . 146.000 14 $290.000 . suponiendo que los pesos se midieron con 1 libra de precisión.000 10 $270.

735 1.  Porcentaje de tubos cuya vida media es de al menos 501 horas.729 1.736 1.740 1.735 1.  La frecuencia relativa de la sexta clase.740 UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .737 1.735 1.734 1.742 1.741 1.730 1.  La frecuencia de la cuarta clase. 0.727 1.733 1.736 1.736 1.729 1.732 1.738 1.700 76 700 .732 1.324.729 1.  La tabla adjunta muestra los diámetros en centímetros de una muestra de 60 bolas de cojinete manufacturadas por una fábrica.735 1.737 1.1000 48 1000 .  La anchura de intervalos de clase. Hallar la anchura del intervalo de clase y los límites de clase.738 1.739 1.738 1. 0. Construir una distribución de frecuencias con intervalos de clase apropiados y establecer las conclusiones respectivas.743 1.  Los diámetros internos de los tubos fabricados por una empresa se miden con precisión de milésima de pulgada.  Porcentaje de tubos cuya vida media es mayor de 900 horas.33.500 46 500 .724 1.736 1.736 1.400 14 400 . pero menor o igual que 1000 horas.  La marca de clase de la séptima clase.737 1.735 1.321.740 1.727 1.745 1.  Porcentaje de tubos cuya vida media no pasa de 600 horas.742 1.733 1.735 1.732 1.900 62 900 .734 1.730 1.333 y 0.1100 22 1100 . Si las marcas de clase de una distribución de frecuencias de esos diámetros vienen dadas por 0.736 1.731 1.731 1.  El límite inferior de la octava clase.741 1. 0.732 1.732 1.746 1.726 1.744 1.ESTADISTICA BASICA VIDA MEDIA (Horas) NÚMERO DE TUBOS 300 .1200 6 Total 400 Determinar de la tabla de frecuencias:  El límite superior de la quinta clase.728 1.600 58 600 .336.739 1.728 1. 0.730 1.327.733 1.734 1. 1.735 1.734 1.735 1.800 68 800 .725 1.

ESTADISTICA BASICA UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .

ESTADISTICA BASICA

UNIDAD 2: Medidas de Tendencia
Central

Núcleos Temáticos y Problemáticos
 Primer Caso: Cuando los Datos no Están Agrupados
 Segundo Caso: Cuando los Datos Están Agrupados

Proceso de Información
Las medidas de centralización son valores que tienden a situarse en el centro del
conjunto de datos ordenados según su magnitud. Las medidas de centralización
más usadas son: Media aritmética, mediana y moda.

La media aritmética es la medida de tendencia central más conocida, es fácil de
calcular, de gran estabilidad en el muestreo; se puede aplicar a variables de
intervalos ya sean discretos o continuos. Esta medida se define como la suma de
todos los valores observados dividido por el número de observaciones, es decir
encontrar el promedio de los datos en estudio.

La mediana se define como la medida de tendencia central que divide a cualquier
distribución en dos partes iguales. Esta medida se puede aplicar a variables de
intervalos (discretas y continuas) y variables ordinales.

La moda de una distribución se define como el valor que presenta la mayor
frecuencia, se usa con variables de intervalos nominales y ordinales. Es
comúnmente utilizada como una medida de popularidad que refleja la tendencia de
una opinión.

UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia

ESTADISTICA BASICA

2.1 PRIMER CASO: CUANDO LOS DATOS NO ESTÁN AGRUPADOS

2.1.1 Media Aritmética

La media aritmética de un conjunto de n números x1, x2, X3..., Xn, se representa
por x y se define como:

n

X1 + X2 + X3 + ……Xn xi
X= = i=1
n
n
Cuando los números x1, x2, x3,....xn, aparecen f1, f2, f3,..... fn veces,
respectivamente, es decir, que sus frecuencias respectivas son f1, f2, f3,....fn, la
media aritmética se puede calcular del modo siguiente:
n

f1X1 +f2X2 + f3X3 + ....+fnXn fixi
X= = i=1
n
f1+f2+f3+………+fn fi
i=1

En ocasiones, a cada uno de los números x1, x2, x3,....xn, se les asigna un peso
determinado w1, w2, w3,....wn. En estos casos, se acostumbra a calcular la media
aritmética ponderada del modo siguiente:
n

w1x1 +w2x2 + w3x3 + ....+wnnn wixi
X= i=1
n
w1+w2+w3+…..+wn wi
i=1

Ejemplo

 Hallar la media aritmética del puntaje obtenido por 5 estudiantes en una
prueba: 6, 4, 3, 7, 8.

6+4+3+7+8 28 Este es el puntaje promedio de los 5
x =    =5,6 estudiantes
5 5

 Hallar la media aritmética de los siguientes datos que representan las edades
de 10 niños. 6, 6, 6, 4, 4, 4, 4, 3, 3, 7.

UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia

ESTADISTICA BASICA

3*6+4*4+2*3+1*7 47
x= =   4,7
3+4+2+1 10

El promedio de edad de los 10 niños es de 4 años, 7meses ó de 5años.

 Un estudiante ha obtenido las calificaciones siguientes:

Asignatura Nota Peso
Historia 8 1
Química 7 3
Física 3 3
Matemática 6 3
Biología 5 3
Geología 6 2
Dibujo 5 2
Idioma 7 2
filosofía 4 1

Calculando su nota media ponderada:

1*8 + 3*7 + 3*3 + 3*6 + 3*5 + 2*6 + 2*5 + 2*7 + 1*4
X=
1+3+3+3+3+2+2+2+1

111
X= = 5,55
20

Por lo tanto el promedio de las notas del estudiante es de 5,55

2.1.2 Mediana

La mediana es una serie de datos ordenados en orden de magnitud, es el valor
medio si el número de datos es impar o bien la media aritmética de los valores
medios si el número de datos es par.

Ejemplo

 Hallar la mediana de los siguientes datos que corresponden a la venta de leche
en un expendio durante los últimos 7 días:

UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia

344.1.3 Moda La moda no puede ser única e incluso puede no existir.332. 339. El precio de la venta de leche que se encuentra en la mitad de los precios es de $54350.ESTADISTICA BASICA 27800 54300 60800 73200 43850 60500 54350 27800 43850 54300 54350 60500 60800 73200 Md = 54350. 283 295 304 332 339 344 304+332 Md = = 318 2 El puntaje de las pruebas que se encuentra en la mitad es de 318.  Hallar el valor de la mediana para los siguientes puntajes de las pruebas ICFES: 304. se presentan los siguientes resultados: Deporte Nº de Alumnos Basket 10 Fútbol 18 Voleibol 5 Otros 4 La moda en este caso es el Fútbol.295. 2.  Se le ha preguntado a un grupo de personas acerca del color preferido por ellas y se obtuvo lo siguiente: UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia . Ejemplo  En una encuesta realizada sobre los deportes que se practican en un grado determinado de un Colegio de Varones. 283. puesto que la mayoría de los alumnos lo prefieren.

 Hallar la moda de los números 2.5 315 25 .25 14 22.5 150 40 .10 2 7.2 SEGUNDO CASO: CUANDO LOS DATOS ESTÁN AGRUPADOS 2.5 412.5 15 . 8.5 15 10 .40 4 37.1 Media Aritmética n  x i fi X= i=1 n Ejemplo  Hallar la media aritmética de las ventas de los sesenta establecimientos: Intervalos F X X*F 5 . por consiguiente no hay moda.30 15 27.2. 2. 4.15 5 12. café y vinotinto.5 62. 5.5 210 20 . 6.20 12 17.5 30 . 0 0 Total 60 1425 UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia . 7.5 260 35 . como ningún número se repite más que los otros.35 8 32. 3.ESTADISTICA BASICA Color Numero de Personas Blanco 4 Gris 8 Azul 9 Negro 4 Rojo 3 Morado 2 Café 8 Vinotinto 8 Lo cual indica que los colores que pueden estar de moda son el gris.

4 73. donde: a n/2 F n/2 F n/2 es la frecuencia donde está n/2 A es la amplitud del intervalo UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .4 Total 40 1532.  Encontrar el valor del límite real inferior del intervalo dónde está.67.8 148 19.6 10 14.3 = 38 40 El puntaje promedio de los 40 alumnos es de 38.4 .6 8 62.19.2.2 Mediana Para hallarla cuando los datos están agrupados se siguen los siguientes pasos:  Ubicar el intervalo donde quede la frecuencia correspondiente a la mitad del tamaño de la muestra.ESTADISTICA BASICA 1425 X= = 23.4 7 43.8 X= = 38.48.  Aplicar la siguiente fórmula: li :es el límite real inferior donde está la F n/2 n _ Fa Fa es la sumatoria de frecuencias anteriores Md = li + 2 A. 2.8 1532.  Hallar el valor promedio para la distribución correspondiente a las notas obtenidas por 40 estudiantes en una prueba estadística: Intervalos F X X*F 10 .29.2 266 58 .8 .8 7 34 238 38.2 .38.8 502.2 29.6 305.6 .2 3 24.2 48.58 5 53.7 = 24 60 Las ventas promedio de los sesenta establecimientos son de $24000.

40 4 TOTAL 60 $24.6 10 19. y después se aplica la siguiente fórmula:  Li es el límite real inferior donde está la moda. UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .58 5 58 – 67.30 15 30 . 1es la diferencia entre la frecuencia modal y la frecuencia inmediatamente anterior.4 7 48.48. 2.  Encontrar la mediana de la distribución correspondiente a las notas obtenidas por 40 estudiantes en una prueba estadística Intervalos F 10 .2 .38.6 8 Total 40 La nota que está en la mitad en esta distribución es Moda.2 3 29.4 .ESTADISTICA BASICA Ejemplo  Encontrar la mediana de las ventas de los sesenta establecimientos: Intervalos F 5 .2.25 14 25 .35 8 35 .000 corresponde a la venta que está en la mitad.8 7 38.8 .6 .  .29.19.3 Moda Se debe ubicar el intervalo donde esté la mayor frecuencia.10 2 10 – 15 5 15 – 20 12 20 .

40 4 Total 60  Encontrar la moda de la distribución correspondiente a las notas obtenidas por 40 estudiantes Intervalo F 10-19.6-29.10 2 10 .ESTADISTICA BASICA  2 es la diferencia entre la frecuencia modal y la frecuencia inmediatamente posterior. 8 galones a $2550 c/u. 10 galones a $2500 c/u.2-38. Ejemplo  Encontrar la moda de las ventas de los sesenta establecimientos: Intervalos F 5 . un automovilista hace las siguientes compras de gasolina.15 5 15 . 15 galones a $2600 c/u y 12 galones $2480 c/u.2 3 29.4 7 48.20 12 20 .30 15 30 .8-48.  A es la amplitud del intervalo.4-58 5 58-67. Cuál sería el costo medio por galón?.25 14 25 .6 8 Total 40 Proceso de Comprensión y Análisis  Supóngase que en un viaje.35 8 35 .8 7 38.  La siguiente tabla muestra los salarios mensuales en miles de pesos de 144 empleados de una empresa: UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .6 10 19.

Hallar la media aritmética.808 24 808 . 40 son cincos.875 26 875 .72 .  Diez medidas del diámetro de un cilindro fueron anotadas por un científico como 3.97. 4.158 5 158 . 3. 60 cobran $7000 a la hora y el resto $4000 a la hora.607 6 607 .741 36 741 .92. 3.1.942 19 942 .  De entre 100 números: 20 son cuatros. hallar la media aritmética de tales medidas.63 5 1.66 .09.02. mediana y moda de los pesos de 40 estudiantes de la siguiente tabla: PESO (Lb) F 118 . 30 son seis y los restantes sietes. 3.174 2 Total 40 UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia . 3. 4.03. 4.60 .69 .166 4 166 . la moda y la mediana.  Usar la distribución de frecuencias para hallar la altura media.98.674 19 674 .95.66 18 1. Altura (m) F 1. la media y la moda.  De los 80 empleados de una empresa. Hallar cuánto cobran la media por hora.75 8 Total 100  Hallar la media. 3.72 27 1.1009 10 1009 .1.92 y 4.69 42 1.1076 4 Total 144  Encontrar la media.126 3 126 – 134 5 134 – 142 9 142 – 150 12 150 . la altura que más se repite y la altura que se encuentra en la mitad de 100 estudiantes.88.63 .1.1.06 centímetros.ESTADISTICA BASICA Salarios F 540 .1.

9.171 43 .11.654 47 . la carga máxima que se repite y la carga que más se repite. estableciendo las respectivas conclusiones.31 6.587 7.19 121 481 19 .3 . Determinar su tiempo medio de reacción.193 31 .35 11.893 35 .3 .786 4.12.1 .27 5. mediana y moda tanto para hombres como para mujeres.39 9.ESTADISTICA BASICA  Los tipos de reacción de un individuo ante diversos estímulos.1 4 Total 60  La siguiente tabla muestra el número de bodas en Colombia para hombres y mujeres de distintos grupos de edad durante 1984.  Hallar la media. 0.049 9.1 5 10.022 39 .5.51 2.47 5.43 8.441 4. 0.23 2.53.524 UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .44 y 0.  La siguiente tabla muestra la distribución de cargas máximas en toneladas cortas que soportan los cables producidos en cierta fábrica.184 23 . Determinar la carga máxima media. Edad Hombres Mujeres (años) (Miles) (Miles) 15 .5 12 10.7 2 9.581 1.3 14 11.10.5 .7 6 11.55 segundos respectivamente. 0.52.7 .10. 0.749 8.7 .952 27 .930 6.10. 0.9 .11.49.9 17 10.46. medidos por un psicólogo.788 11. fueron: 0.53. 0. Carga Máxima F (Toneladas Cortas) 9.

.. Si los datos no están agrupados.. X1. x2. Las medidas de dispersión más utilizadas son: 3.1 DESVIACIÓN ESTÁNDAR O TÍPICA Indica que tan dispersos están los datos con respecto a la media aritmética..ESTADISTICA BASICA UNIDAD 3: Medidas de dispersión Núcleos Temáticos y Problemáticos  Desviación Estándar o Típica  Varianza  Coeficiente de Variación Proceso de Información Las medidas de dispersión o variación dan idea de la separación de los datos numéricos alrededor de una medida de centralización. la desviación estándar viene dada por: Las anteriores fórmulas se utilizan cuando se trabaja con la población. UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .. la desviación estándar de una serie de números n. x3.xn está determinada por: Si los datos están agrupados.

4. UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .ESTADISTICA BASICA Si los datos están agrupados. 7. 4. 4. 8. 3. X= 5. 4. 3. la desviación estándar viene dada por: Las anteriores fórmulas se utilizan cuando se trabaja con la muestra. 6. 7. 3.6  Hallar la desviación estándar de las edades de 10 niños: 6. Ejemplo  Hallar la desviación estándar del puntaje obtenido por 4 estudiantes en una prueba: 6 4. 6.

Intervalos F X (X-x)2 F 5 – 10 2 7..5 661.5 25 . pesos cuadrados.20 12 17. Xn está determinada por: Si los datos están agrupados. ya que se obtiene a partir de la media aritmética de una distribución. la varianza viene dada por: UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .25 14 22. la varianza de una serie de números n: x1.5 31..5 507 20 . Si los datos no están agrupados. personas cuadradas. La varianza de un conjunto de datos se define como el cuadrado de la desviación típica.40 4 37.5 578 35 .5 544.15 5 12.. es decir.ESTADISTICA BASICA  Hallar la desviación estándar de las ventas de los sesenta establecimientos x = 24. etc. La varianza es una medida de dispersión. x2..2 VARIANZA Esta es la medida de variación más importante.. las unidades son los cuadrados de las unidades de los datos. y por esto no son expresiones fáciles de interpretar.25 15 .5 10 . en la cual.5 729 Total 60 3235 3.35 8 32.75 30 .. x3.. La varianza señala la distancia promedio de cualquier observación en el conjunto de datos.30 15 27..5 183.

75 30 . X = 4.5 25 – 30 15 27.81 10  Hallar la varianza de las ventas de los sesenta establecimientos: X = 24 Intervalos F X (X-x)2 F 5 – 10 2 7. 3.5 578 35 . 4.7 18.1 S2 =  = 1.5 661. 4.5 10 – 15 5 12.  Hallar la varianza de las edades de 10 niños: 6. 7. 8.5 544.25 15 – 20 12 17.ESTADISTICA BASICA Ejemplo  Hallar la varianza del puntaje de 5 estudiantes: 6. 7.5 183. 6.5 507 20 – 25 14 22. 4.5 31.40 4 37.35 8 32. 3. 4. 3. 4. 6.5 729 Total 60 3235 UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .

34 Cv = 23.ESTADISTICA BASICA 3235 S2 =  = 53. si el coeficiente de variación es pequeño la información es homogénea y si el coeficiente de variación es grande la información es heterogénea.9 60 3. Para estos casos.9% Este porcentaje indica cómo se distribuye la desviación estándar con respecto a la media a través de los datos.3 7.3 COEFICIENTE DE VARIACIÓN Esta medida relaciona la desviación estándar y la media. 4. Este coeficiente de variación se acostumbra expresarlo en porcentaje. Ejemplo  Hallar el coeficiente de variación de 6.42%.3 Cv =  *100 24 Cv = 30. S La fórmula que se utiliza es: cv =  * 100 X El coeficiente de variación es una medida muy utilizada en control de calidad.6 S = 1. También nos sirve para determinar la homogeneidad de la información. 3. UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia . es decir.  Hallar el coeficiente de variación de las ventas de los sesenta establecimientos y obtener conclusiones. X = 24 S = 7. 7. 8 X = 5. generalmente existen especificaciones que limitan el coeficiente de variación. De aquí se puede decir que las ventas de los sesenta establecimientos son homogéneas. para expresar la variación de la desviación con respecto a la media aritmética.

$8. $9.560. 3.000 14 UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia . $9.000 . presenta menor variación. 6.850. Proceso de Comprensión y Análisis  Hallar la desviación estándar y la varianza de los puntos obtenidos asignados a 8 niños en un juego: 12. $3.66 – 1. con desviación de 5 tornillos y el trabajador B produce 180 tornillos en promedio con desviación de 15.000.72 – 1.234.69 42 1. $8. 10 18 y 5.000 16 $280.4% Para el operador B 180 Esto significa que el operador B.000 .63 – 1. quien tiene mayor desviación en la producción.235.66 18 1. porque la media de producción para el operador B es mucho mayor que la del operador A.63 5 1.$280.ESTADISTICA BASICA  Si el trabajador A produce por hora 40 tornillos en promedio. 7.345.$260.000 8 $260. $8.  Hallar la desviación estándar de las alturas de los estudiantes de acuerdo a la siguiente tabla: Altura (m) F 1.72 27 1.000 .  Hallar la desviación estándar y la varianza en la compra de cremas dentales: $9.456.578. 15. EMPLEADOS $250. ¿cuál de los trabajadores presenta menor variabilidad? 5 CVA =  *100 = 12.5% para el operador A 40 15 CVB =  *100 = 9.75 8 Total 100  Hallar la desviación estándar de la distribución de salarios de la siguiente tabla: SALARIOS NÚM.$290.$270.000 10 $270.60 – 1.69 – 1.000 . y 18.

 Hallar la desviación estándar y el coeficiente de variación para los datos de la siguiente tabla: Carga Máxima F (Toneladas Cortas) 9.1 5 10. que tienen vidas medias respectivas: xA = 1495 horas y xB = 1875 horas y desviación típica de SA = 280 horas y SB = 310 horas. ¿En qué materia fue mayor la dispersión?.7 2 9.3 .000 .5 . Hallar la desviación estándar: F X 4 70 9 74 16 78 28 82 45 86 66 90 85 94 72 98 54 102 38 106 27 110 18 114 11 118 5 122 2 126  Un fabricante de tubos de televisión produce dos tipos de tubos A y B.$320. EMPLEADOS $290.9 17 UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .000 .000 2 Total 65  La siguiente tabla muestra los cocientes de inteligencia (lQ) de 480 niños de una escuela elemental.1 .10. ¿Qué tipo de tubo tiene mayor dispersión?  En un examen final de Estadística.10.000 5 $310.9.000 .7 – 10. la puntuación media de 150 estudiantes fue de 78 y la desviación estándar 8.5 12 10.6. En Álgebra la media fue de 73 y la desviación estándar 7.ESTADISTICA BASICA SALARIOS NÚM.$300.000 10 $300.$310.

7 6 11.9 .3 14 11.7 .11.1 4 Total 60 UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .12.ESTADISTICA BASICA Carga Máxima F (Toneladas Cortas) 10.11.3 .

segundo y tercer cuartil respectivamente. El D5 coincide con la mediana. los valores que dividen a los datos en 10 partes iguales se llaman deciles y se denotan por D1 D2. se puede pensar en aquellos valores que dividen al conjunto en cuatro partes iguales.. es la mediana. llamados primer... UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia . denotados por P1 P2. Y los valores que dividen a los datos en 100 partes iguales se llaman percentiles.. Extendiendo esa idea.D9.P99. Análogamente. el valor central que divide al conjunto en dos mitades iguales. DECILES Si un conjunto de datos está ordenado por magnitud. El P50 coincide con la mediana.. El Q2 coincide con la mediana. Percentiles y Deciles  Diagramas de Caja Proceso de Información 4.. (cuartiles) esos valores denotados Q1 Q2 y Q3.. PERCENTILES.1 CUARTILES.ESTADISTICA BASICA UNIDAD 4: Medidas de Ubicación Núcleos Temáticos y Problemáticos  Cuartiles..

n*p 8 * 80 P80 =  =  = 6. se deben ordenar en forma ascendente o descendente y ubicar el dato que esté en la posición n * p :donde.ESTADISTICA BASICA Si los datos no están agrupados. 10. ya que está en la segunda posición. Cuando los datos están agrupados. 100 p = Número a la ubicación al que se desea referir n = Total de datos Ejemplo  Con los siguientes datos ubicar el que corresponde a:  Al primer cuartil  Al tercer decil  Al percentil 80 12 8 5 10 11 4 6 3 3 4 5 6 8 10 11 12 n*p 8*1 Q1 =  = = 2 q 4 El dato que está en el primer cuartil es 4. n*p 8*3 D3 =  =  = 2. q q = 4.4  2 q 10 El dato que está en el tercer decil es 4. utilizamos la misma fórmula de la mediana y reemplazamos donde esté n/2 por n * p. el límite inferior es donde está la F (n*p)/q q UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia . ya que este valor está en la sexta posición.4  6 q 100 El dato que está en el percentil 80 es 10. ya que está en la segunda posición.

30 15 Li= 15 30 . li es el limite inferior donde está F(n*p)/q Ejemplo  En las ventas de los sesenta establecimientos encontrar:  El primer. Intervalo n = 60 F 5 .30 Li= 20 15 30 .20 n*p 12 = 60*2 = 30 20 .15 5 q=4 15 .25 q 14 4 25 .40 F (n*p)/q4 = 14 Total A = 560 UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .35 8 Fa = 7 35 .20 12 n*p = 60*1 = 15 20 . cincuenta y ochenta n*p Para encontrar estas medidas.10 2 p=1 10 .40 4 F (n*p)/q = 12 A=5 Total 60 De donde el 25% de las ventas de los 60 establecimientos es de $18000 o menos.15 q = 4 5 15 .10 p = 2 2 10 .ESTADISTICA BASICA Donde U hace referencia a la medida de ubicación. primero hay que encontrar para ubicar el intervalo correspondiente a esta posición.25 14 q 4 25 . q El Primer. quinto y el sexto decil  El percentil doce. Segundo y Tercer Cuartil Intervalos F n = 60 5 . segundo y tercer cuartil  El primer.35 Fa =819 35 .

15 q = 4 5 15 .30 Li= 1015 30 .20 n*p =1260*3 = 45 20 .35 Fa = 82 35 . Intervalosn = 60F 5 .40 F (n*p)/q4= 15 Total A = 560 Por lo tanto el 75% de las ventas de los 60 establecimientos es de $29000 o menos El Primer.10 p = 1 2 10 . UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .ESTADISTICA BASICA Donde el 50% de las ventas de los 60 establecimientos es de $24000 o menos.10 p = 3 2 10 .35 Fa = 833 35 .15 q = 105 15 .30 Li= 2515 30 .20 n*p =1260*1 = 6 20 . Quinto y el Sexto Decil Intervalosn = 60F 5 .40 F (n*p)/q4= 5 Total A = 560 El 10% de las ventas es de $9000 o menos.25 q 14 10 25 .25 q 14 4 25 .

20 n*p 12 = 60*5 = 30 20 .25 q 14 10 25 .15 5 q = 100 15 . Cincuenta y Ochenta Intervalo F n = 60 5 .35 Fa =819 35 .20 12 n*p = 60*12 = 7.20 n*p12= 60*6 = 36 20 .40 4 = 15 F (n*p)/q Total A=5 60 Y el 60% de las ventas es de $26000 o menos.35 8 F (n*p)/q = 5 35 .25 14 Li= 10 25 .ESTADISTICA BASICA Intervalosn = 60 F 5 – 10 p = 5 2 10 .25 q 14 10 25 .15 q=5 10 15 .15 q = 10 5 15 .30 15 Fa = 2 30 .40 F (n*p)/q4 = 14 Total A = 560 El 50% de las ventas es de $24000 o menos Intervalos n=F 60 5 .30 Li= 15 25 30 .2 = 7 q 100 20 .40 4 A=5 Total 60 UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .10 p=6 2 10 .30 Li= 20 15 30 .35 Fa =8 33 35 .10 2 p = 12 10 . El Percentil Doce.

Intervalos n =F60 5 .15 q =5 100 15 .30 Li=1525 30 .9  24  14 El 50% de las ventas de los sesenta establecimientos es de $24000 o menos.40 4 = 14 F (n*p)/q Total A=560 60*50  -19 P50= 20+ 100 5 = 23. UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .40 F (n*p)/q 4 = 15 Total A= 605 Y el 80% de los establecimientos tienen ventas de $30.2  15  5 Por lo tanto el 12% de las ventas de los sesenta establecimientos es de $15000 o menos.35 Fa8 = 33 35 .20 n*p12= 60*50 = 30 20 . Intervalo n =F 60 5 .35 Fa8= 19 35 .10 p =250 10 .25 q14 100 25 .30 15 Li= 20 30 .25 q14 100 25 .ESTADISTICA BASICA 60*12  -2 P12= 10+ 100 5 = 15.000 o menos.15 q =5100 15 .10 p =2 80 10 .20 n*p12 = 60*80 = 48 20 .

 Identificar todos los datos que están fuera del intervalo (li. aquellas observaciones que parecen ser distintas de las demás. Ls). que está dentro del intervalo (li. Ejemplo: Los siguientes datos muestran el número de días con aire contaminado en 2001 y 2002 en varias ciudades colombianas: 2001 2002 A 248 221 B 208 171 C 113 131 D 128 89 E 106 F 118 101 G 60 33 H 79 63 I 55 56 UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia . ls) marcándolos como atípicos. localizándolos en una recta numérica utilizando una escala adecuada.  Dibujar un rectángulo cuyos extremos son Q1 y Q3.  Calcular unos limites admisibles superior e inferior que van a servir para identificar los valores atípicos. Q2. Estos límites se calculan con : Q3 – Q1 Li = Q1-1.5  2 Q3 – Q1 Li = Q3 +1.2 DIAGRAMAS DE CAJA Es una representación del diagrama de una distribución construida para mostrar sus características principales y señalar los posibles datos atípicos. Un diagrama de caja se construye así:  Ordenar los datos de la muestra y obtener el valor mínimo. es decir. el máximo y los tres cuartiles Q1.ESTADISTICA BASICA 4. es decir. Q3. ls).5  2  Considerar como valores atípicos los situados fuera del intervalo (li. Su principal utilidad es para depurar información puesto que se pueden eliminar los datos de mayor variación en los extremos.  Dibujar una línea que vaya desde cada extremo del rectángulo central hasta el valor más alejado no atípico.

5 Ls = 113 + 1.5  = 11.75  4 tienen entre 33 y 55 días de contaminación. 4 15*2 Q2 = = 7.5  8 El 50% de ciudades tienen 82 días o menos de 4 contaminación 15*3 Q3 =  = 11.ESTADISTICA BASICA 2001 2002 J 47 54 K 88 55 L 47 69 M 58 59 N 82 48 O 33 16 Construir el diagrama de cajas correspondiente a la tabla dada.5 2 UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia . Por tanto los límites admisibles son: 113 – 55 Li = 55 – 1.25  11 El 75% de ciudades tienen 113 días o 4 menos de contaminación. Para 2001 El primer paso es ordenar la información de mayor a menor: 33 47 47 55 58 60 79 82 88 106 113 118 128 208 248 Luego se encuentran los tres cuartiles: El 25% de ciudades tienen 55 días o menos de 15*1 contaminación o el 25% de las ciudades de EEUU Q1 = = 3.55  = 156.5 2 113 .

2001 Este diagrama de caja. 14*3 Q3= = 10.5  = 20. muestra que la mayor parte de las observaciones son menores que 113 y que el extremo superior de 248 está muy alejado del grupo principal de datos.5 2 101 .55 Li = 55 – 1.55 Ls = 101 + 1.5  11 El 25% de ciudades tienen 101 4 días o menos de contaminación. 101 .ESTADISTICA BASICA Como todos los valores son superiores al límite inferior.75  4 días o menos de contaminación.33 = 215).5 2 UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .5  = 135. Se ve con claridad la amplitud de los datos. Para 2002 16 33 48 54 55 56 59 63 69 89 101 131 171 221 14*1 El 25% de ciudades tienen 55 Q1= = 3. que es la longitud del diagrama completo (248 . la línea inferior del diagrama de caja deberá llegar hasta el valor mínimo y no hay atípicos en esta dirección. 4 14*2 Q2= = 7 El 25% de ciudades tienen 59 días 4 o menos de contaminación.

determinar el primer.63 5 1. el cual permaneció alto durante los dos años.1.ESTADISTICA BASICA 2002 Estos diagramas de caja son muy eficaces cuando ellos se comparan conjuntos de datos.1.66 18 1.72 .1.75 8 Total 100  Hallar en la siguiente tabla para los salarios en miles de pesos de 144 empleados de una empresa: UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .1.63 .69 42 1.1.69 .60 . el segundo y tercer cuartil y realizar el gráfico correspondiente: Altura (m) F 1. excepto el extremo alto.72 27 1. Proceso de Comprensión y Análisis  En la siguiente tabla que relaciona las alturas de 100 estudiantes. 2001 2002 Nótese como los datos tienden a concentrarse más y más hacia el extremo inferior de la escala.66 .

segundo y tercer cuartil de la siguiente tabla que relaciona los pesos de 40 personas y realizar el gráfico correspondiente: Peso (Lb) F 118 . tercer cuartil y su respectiva gráfica  El segundo.607 6 607 .808 24 808 . 3.09.98. 3.ESTADISTICA BASICA  El primer cuartil  El quinto y octavo decil  El percentil 10 y el percentil 45 Salario F 540 .03. segundo.158 5 158 . Encontrar:  El primer.1009 10 1009 . 4. el sexto y noveno decil  El percentil 48 y el percentil 10  La siguiente tabla muestra una distribución de frecuencias de las vidas medias de 400 válvulas de radio probadas en la empresa L & M. Hallar:  El primer y tercer cuartil  El cuarto.92.97.134 5 134 .126 3 126 .674 19 674 .06 centímetros. UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .166 4 166 – 174 2 Total 40  Las siguientes son diez medidas del diámetro de un cilindro: 3.741 36 741 .875 26 875 – 942 19 942 .1076 4 Total 144  Encontrar el primer.  El cincuenta percentil. 4.92 y 4.95.02 3. 3. cuarto y sexto decil.88.150 12 150 . 4.142 9 142 . 3.

600 58 600 .1200 6 Total 400 UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .500 46 500 .1000 48 1000 .700 76 700 .900 62 900 .800 68 800 .ESTADISTICA BASICA Número Vida Media de Tubos 300 – 400 14 400 .1100 22 1100 .

 Presentar resultados de una investigación. Para la elaboración de un gráfico hay que tener en cuenta:  Título: indica la descripción del contenido de la gráfica.ESTADISTICA BASICA UNIDAD 5: Presentación de la Información Núcleos Temáticos y Problemáticos  Histograma  Polígonos de Frecuencia  Ojivas  Barras Proceso de Información Una gráfica estadística es aquella en la cual se presentan los datos estadísticos en términos de magnitudes. indica el fenómeno de estudio. Producción de café en Colombia en el período 1995 . Por ejemplo. para interpretarlos en forma visual.1997. Estas gráficas se pueden utilizar para:  Evaluar resultados de un proceso. barras. Presentar la información de la tabla de frecuencias por medio de gráficas sirve para reforzar las conclusiones que se determinan de esta tabla. UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia . es decir.  Diagrama: es empleado para representar los datos mostrados en una gráfica. dimensiones y símbolos. los diagramas pueden ser de varios tipos: líneas.

Estos datos son: VENTAS PARA SESENTA ESTABLECIMIENTOS (Miles de pesos) Intervalo F 5 .1 HISTOGRAMA Sirve para representar gráficamente una distribución de frecuencias. Existen varios tipos de gráficas para representar los datos estadísticos y al mismo tiempo sirven para reforzar las conclusiones dadas en la tabla de frecuencias. 0 Total 60 UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .25 14 25 . El gráfico se diseña trazando los intervalos sobre el eje X y las frecuencias absolutas sobre el eje Y.30 15 30 . Las magnitudes en la ordenada o eje “Y” y las clasificaciones de los datos en las abscisas o eje “X”.ESTADISTICA BASICA  Escala: se aplica para saber la dimensión del fenómeno graficado.15 5 15 . Se debe identificar en los ejes X y Y de un sistema de coordenadas.10 2 10 .20 12 20 . A partir del intervalo se traza la altura respectiva dada por la frecuencia absoluta.40 4 40 . 5.35 8 35 . La empresa Cuero Lindo ha recopilado información sobre las ventas en miles de pesos de 60 almacenes.

5. la cual se diseña con base en los datos del histograma. UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia . Y la menos frecuente está en $10000.ESTADISTICA BASICA Las ventas más frecuentes de los sesenta establecimientos están entre $25000 y $30000. $20000 y $25000. estos se unen por medio de una línea recta.2 POLÍGONOS DE FRECUENCIAS Es una curva que se traza a partir de los puntos medios de cada clase de amplitud.

absoluta) descendente o ascendente. Esta gráfica indica la forma como crece la información a través de los intervalos. El punto donde se cortan las dos ojivas es el punto central de la distribución es decir la mitad de la información.ESTADISTICA BASICA 5. 5.4.3 OJIVAS Es el gráfico de una distribución de frecuencias acumuladas (relativa.1 Barras Verticales Se emplean para presentar datos clasificados cronológica o cuantitativamente: UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .4 BARRAS Sirven básicamente para establecer las diferencias entre grupos individuales y pueden ser de dos tipos: 5. se puede utilizar como medición de las variaciones de los grupos.

2 Barras Horizontales Se emplean para dar datos clasificados geográfica y cualitativamente.ESTADISTICA BASICA Ejemplo: en la siguiente tabla se encuentra la información correspondiente a las ventas anuales de la empresa “El Retorno” durante el período de 1987 . indican la importancia de un atributo con respecto a los demás.4. Años Ventas 1987 6 1988 9 1989 15 1990 30 1991 50 1992 80 1993 110 1994 150 1995 130 1996 100 5.1996 (en millones de pesos). Ejemplo: la siguiente información nos indica el número de profesionales egresados de distintas carreras en la ciudad de Bogotá en 2002: Carrera Número de profesionales Ciencias Sociales 1100 Administración 800 Ingenierías 500 derecho 700 UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .

UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia . se presenta en miles de pesos.ESTADISTICA BASICA Segmentada Ejemplo: presenta una comparación de la magnitud relativa de ventas dentro de cada departamento y de las ventas totales por departamentos. La siguiente información corresponde a las ventas por departamentos al contado y a crédito en un almacén. Departamento Contado Crédito Total Hombres 200 120 320 Mujeres 180 110 290 Niños 150 90 240 Electrodomésticos 300 210 510 Agrupada Muestra las ventas por departamento en una empresa al contado y a crédito y permite hacer comparaciones entre departamentos y al interior de cada uno.

5 es la frecuencia absoluta del x =  = 18 segundo intervalo. Es efectiva para permitir las comparaciones cuando los segmentos son relativamente grandes.ESTADISTICA BASICA Las Gráficas de barras horizontales pueden presentarse de dos formas: Circular o de Tortas Se utiliza para representar las variables y sirve para hacer notar las diferencias en las proporciones o porcentajes. 360°  n x Fi Así por ejemplo: 360  60 x 2 Donde 60 es la muestra de las ventas de los establecimientos. El proceso para realizar el diagrama consiste en una regla de tres para: Conocer el ángulo de cada sector. 2 es la frecuencia absoluta 360*2 del primer intervalo. x =  = 12 60 360  60 x 5 Donde 60 es la muestra de las ventas de los 5 360*3 establecimientos. 60 UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia . entonces se debe relacionar los 360° que tiene una circunferencia con el tamaño de la muestra y con cada una de sus frecuencias absolutas.

Se tienen los porcentajes invertidos por 15 industrias manufactureras en el control de contaminación de Colombia en 2001: UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .3  3% tienen ventas entre $5000 y $10000. relacionando 100% con el tamaño de la muestra con la frecuencia absoluta.ESTADISTICA BASICA Y para conocer el porcentaje que corresponde a cada parte. 100 n y Fi Así. 100*2 Esto quiere decir que el 3% de los establecimientos y=  = 3. 60 Tallo y Hojas Se puede tener un cuadro más informativo que la tabla de recolección de datos si se hace un listado diferente. por ejemplo: 100% 60 Donde 60 es la muestra de las ventas de los establecimientos. y 2 2 es la frecuencia absoluta del primer intervalo.

4. a la derecha de la barra vertical.4.4.3. En los siguientes datos los resultados son obtenidos en miles de pesos: 40 17 26 10 26 21 18 27 16 38 22 33 24 20 28 14 30 25 29 37 28 28 33 22 25 29 29 29 21 32 19 35 23 28 22 15 34 13 16 26 24 20 31 29 18 19 11 23 20 24 28 11 34 39 10 25 17 21 34 18 UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .1 1 7.0 Ya que la mayor parte de las observaciones tienen el cero como primer dígito. Como es fácil de ordenar las observaciones en cualquier renglón.4.2.7 Ahora se ve con facilidad que las observaciones van de 01 a 17.3. que nueve de las 15 observaciones son de 4 o menos.2.3. también se puede presentar la gráfica ordenada de tallo y hojas. El O y 1 se usa para formar el tallo y se escribe en columna vertical.ESTADISTICA BASICA 17 02 07 04 08 17 04 04 14 03 03 02 04 10 01 Para elaborar el diagrama de Tallos y Hojas hay que seguir los siguientes pasos: El dígito de la extrema izquierda de cada valor es el punto de partida adecuado para clasificar los datos en dos grupos.4.2.2. A continuación se escribe el segundo dígito como si fuera una hoja en el renglón adecuado del tallo. se puede alargar el tallo a dos categorías de O y dos de 1.7.4 O 7. O 3.4.4 1 7.8. O 1.7.4. en la que los segundos dígitos del O al 4 quedarán en el renglón superior y los dígitos del 5 al 9 en el inferior.4.8 1 0. se puede elaborar este diagrama de tallos y hojas. Con el ejemplo que se ha venido trabajando.

8.9 30.2.8.0.4 15.1.4.ESTADISTICA BASICA Presentación de los Datos en Forma de Tallo y Hojas 10.9.7.7. los dígitos de las centenas y decenas formarán el tallo y las unidades serán las hojas.6.6.9.4.6.3.6.3.4 38. Los siguientes datos muestran el número de días con aire contaminado en el 2001 en varias ciudades de Colombia: Ciudad 2001 A 248 B 208 C 113 D 128 E 106 F 118 G 60 H 79 I 55 J 47 K 88 L 47 M 58 N 82 O 33 Para construir una gráfica de tallo y hojas con los datos del 2001.1.7.3.4 25.3. 03 3 11 3.4.8.2..2.9 20.0.0.8.1.3.1.8 13 21 06 0 14 22 07 9 15 23 08 28 16 24 8 09 17 10 6 18 UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .7 12 8 20 8 05 5.8.8.8 19 04 7.9.6.2.1.9.8.8.9.5.1.9 4O 4 Las presentaciones de tallo y hoja de más de dos dígitos se pueden elaborar de diversos modos.4.5.

48 2 Proceso de Comprensión y Análisis  La siguiente tabla muestra la población de alguna ciudad (en millones) en los años de 1882 – 2002.5  La siguiente tabla muestra el número de sacos de trigo y maíz en la cooperativa PQR durante los años de 1992 – 2002: NÚMERO DE SACOS DE NÚMERO DE AÑO TRIGO SACOS DE MAIZ 1992 200 75 1993 185 90 1994 225 100 1995 250 85 1996 240 80 UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .28 1 2 08. POBLACIÓN AÑO (Millones) 1882 31.60.7 1952 122.2 1912 62.79.8 1962 131.18.58.8 1902 50.13.82.9 1922 76 1932 92 1942 105.3 2002 226.47 0 55.4 1892 39.1 1982 179.47.88 1 06.3 1992 203. Representar estos datos en un diagrama de barras.ESTADISTICA BASICA Como esta gráfica es muy dispersa: hay que hacer que el tallo contenga las centenas y las hojas los demás dígitos 0 33.7 1972 151.

5  En la siguiente tabla.3 Chocó 6.7 Antioquia 10. AÑO ELEMENTAL MEDIA SUPERIOR 1982 32.2 UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .7 7. determinar el año o años durante los cuales:  La producción de trigo fue mínima.ESTADISTICA BASICA NÚMERO DE SACOS DE NÚMERO DE AÑO TRIGO SACOS DE MAIZ 1997 195 110 1998 210 110 1999 225 105 2000 250 95 2001 230 110 2002 235 100 Con referencia a la gráfica.4 Meta 3. ÁREA (miles de millas DEPARTAMENTO cuadradas) Cundinamarca 11. media y superior en Colombia.8 15.2 3.  La de maíz fue máxima.4 Armenia 1.  Se dio el mayor descenso en la producción de trigo.9 Amazonas 9.9 Norte de Santander 7.1 14.  Se produjo idéntica cantidad de trigo  La producción conjunta de trigo y maíz fue máxima. se ven los números (en millones) de estudiantes de enseñanza elemental. Representar los datos.7 1992 37.  Las áreas de algunos departamentos de Colombia (en miles de millas cuadradas) se recogen en la siguiente tabla.9 Total 51.7 2002 30.4 1997 33. Representar estos datos en un gráfico de tortas y determinar las conclusiones más relevantes.7 9.6 1987 35.  Decreció la producción de maíz respecto al año anterior y creció la de trigo. usando gráficos de barras y determinar algunas conclusiones.6 14.5 13 5.4 10.6 10.

Representar los datos mediante dos gráficos circulares y un gráfico de diseño propio.  Un artículo de revista titulado Amargo Panorama.8 7. Los puntos obtenidos fueron los siguientes: 19 24 26 31 18 17 22 21 24 19 18 19 21 32 31 26 28 27 22 17 19 21 22 24 30 19 26 27 28 21 24 26 Realizar la representación del esquema de tallos y hojas de esta información.3 Viudo 2. para lo cual se realiza un test de aceptación de dicho sabor. habla acerca del café colombiano y muestra un gráfico de este tipo: UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .4 Casado 66.9  Una fábrica de gaseosa proyecta lanzar al mercado un nuevo sabor.7 61. HOMBRES MUJERES ESTADO CIVIL (% total) (% total) Soltero 25. en una muestra de 32 personas.1 18.ESTADISTICA BASICA  La siguiente tabla muestra el estado civil de hombres y mujeres (de más de 18 años) en Colombia en 2001.4 12. Se utiliza una escala de 30 para medir el grado de aceptación.4 Divorciado 5.

Y muestra entre otras los siguientes gráficos: UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .  En la sección de actualidad de una revista. hay un titular sobre “Los Derechos Humanos: una tortura”.ESTADISTICA BASICA ¿Qué se puede decir de este gráfico?.

ESTADISTICA BASICA De acuerdo a estas gráficas responder:  ¿Qué porcentaje de quejas están concluidas?  ¿Qué significado tiene el valor 3794 en el gráfico de estado de las quejas?  ¿Qué interpretación le puede dar al gráfico “quiénes se quejan”? UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .

ESTADISTICA BASICA ANEXO: Tablas UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .

ESTADISTICA BASICA UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia .

Madrid: McGraw Hill. MARTÍNEZ BENCARDINO. Elaboración y Presentación de Datos Universidad de Pamplona. MORENO GARZÓN. GALLARDO. Estadística. Estadística Modelos y Métodos I. Damel. Curso Práctico de Estadística. Miguel. Emmanuel. UNIVERSIDAD DE PAMPLONA –Facultad de Estudios a Distancia . 1987. 1993.ESTADISTICA BASICA BIBLIOGRAFÍA GENERAL BERNAL V. 1986. PEÑA SÁNCHEZ. Estadística: Programa de Sicología Universidad de Pamplona. 1986. Lincoyán. Adonay. Bogotá: McGRAW . 1981. PARZEN. Cali: ICFES. Estadística Descriptiva: J. PORTUS GOVINDEN. Bogotá: Norma. Ciro. Serie aprender a investigar: Recolección de la información. 1991. Teoría Moderna de Probabilidades y sus Aplicaciones México: LIMUSA. SPIEGEL Murria R.Hill. 1995. 1997. Yolanda. Madrid: Alianza editorial. Fundamentos. Estadística Comercial.