You are on page 1of 71

Centro de Educacin Virtual y a Distancia

Pamplona
Universidad de

Programas de Educacin a Distancia

Estadstica Bsica
Yolanda Gallardo de Parada Aurora Ins Gfaro Rojas Sandra Patricia Valero Ortega

Formando Colombianos de Bien


lvaro Gonzlez Joves
Rector

Mara Eugenia Velasco Espitia

Decana Facultad de Estudios Avanzados, Virtuales, a Distancia y Semiescolarizados

Luis Armando Portilla Granados


Director Centro de Educacin Virtual y a Distancia

Tabla de Contenido
Presentacin Introduccin UNIDAD 1: Generalidades de la Estadstica Ncleos Temticos y Problemticos Proceso de Informacin 1.1. DEFINICIN 1.1.1 Importancia 1.1.2 Poblacin 1.1.3 Muestra 1.1.4 Mtodos de Seleccin de una Muestra al Azar 1.1.5 Unidad Estadstica 1.2 ESTADSTICA DESCRIPTIVA DISTRIBUCIN DE FRECUENCIAS 1.2.1 Recoleccin de Datos 1.2.2 Intervalos 1.2.3 Amplitud 1.2.4 Frecuencia de Clase o Frecuencia Absoluta 1.2.5 Marca de Clase (X) 1.2.6 Frecuencia Relativa (Fr) 1.2.7 Frecuencia Acumulada (Fa) 1.2.8 Frecuencia Relativa Acumulada (Fra) Proceso de Comprensin y Anlisis UNIDAD 2: Medidas de Tendencia Central Ncleos Temticos y Problemticos Proceso de Informacin 2.1 PRIMER CASO: CUANDO LOS DATOS NO ESTN AGRUPADOS 2.1.1 Media Aritmtica 2.1.2 Mediana 2.1.3 Moda 2.2 SEGUNDO CASO: CUANDO LOS DATOS ESTN AGRUPADOS 2.2.1 Media Aritmtica 2.2.2 Mediana 2.2.3 Moda Proceso de Comprensin y Anlisis

UNIDAD 3: Medidas de Dispersin Ncleos Temticos y Problemticos Proceso de Informacin 3.1 DESVIACIN ESTNDAR O TPICA 3.2 VARIANZA 3.3 COEFICIENTE DE VARIACIN Proceso de Comprensin y Anlisis UNIDAD 4: Medidas de Ubicacin Ncleos Temticos y Problemticos Proceso de Informacin 4.1 CUARTILES, PERCENTILES Y DECILES 4.2 DIAGRAMAS DE CAJA Proceso de Comprensin y Anlisis UNIDAD 5: Presentacin de la Informacin Ncleos Temticos y Problemticos Proceso de Informacin 5.1 HISTOGRAMA 5.2 POLGONOS DE FRECUENCIA 5.3 OJIVAS 5.4 BARRAS 5.4.1 Barras Verticales 5.4.2 Barras Horizontales Proceso de Comprensin y Anlisis ANEXO: Tablas BIBLIOGRAFA GENERAL

Estadstica Bsica

Presentacin
La educacin superior se ha convertido hoy da en prioridad para el gobierno Nacional y para las universidades pblicas, brindando oportunidades de superacin y desarrollo personal y social, sin que la poblacin tenga que abandonar su regin para merecer de este servicio educativo; prueba de ello es el espritu de las actuales polticas educativas que se refleja en el proyecto de decreto Estndares de Calidad en Programas Acadmicos de Educacin Superior a Distancia de la Presidencia de la Repblica, el cual define: Que la Educacin Superior a Distancia es aquella que se caracteriza por disear ambientes de aprendizaje en los cuales se hace uso de mediaciones pedaggicas que permiten crear una ruptura espacio temporal en las relaciones inmediatas entre la institucin de Educacin Superior y el estudiante, el profesor y el estudiante, y los estudiantes entre s. La Educacin Superior a Distancia ofrece esta cobertura y oportunidad educativa ya que su modelo est pensado para satisfacer las necesidades de toda nuestra poblacin, en especial de los sectores menos favorecidos y para quienes las oportunidades se ven disminuidas por su situacin econmica y social, con actividades flexibles acordes a las posibilidades de los estudiantes. La Universidad de Pamplona gestora de la educacin y promotora de llevar servicios con calidad a las diferentes regiones, y el Centro de Educacin Virtual y a Distancia de la Universidad de Pamplona, presentan los siguientes materiales de apoyo con los contenidos esperados para cada programa y les saluda como parte integral de nuestra comunidad universitaria e invita a su participacin activa para trabajar en equipo en pro del aseguramiento de la calidad de la educacin superior y el fortalecimiento permanente de nuestra Universidad, para contribuir colectivamente a la construccin del pas que queremos; apuntando siempre hacia el cumplimiento de nuestra visin y misin como reza en el nuevo Estatuto Orgnico: Misin: Formar profesionales integrales que sean agentes generadores de cambios, promotores de la paz, la dignidad humana y el desarrollo nacional. Visin: La Universidad de Pamplona al finalizar la primera dcada del siglo XXI, deber ser el primer centro de Educacin Superior del Oriente Colombiano. Luis Armando Portilla Granados. Director CEVDUP

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

Introduccin
La importancia que tiene la matemtica en el desarrollo de los procesos intelectuales del hombre es notoria a travs de su historia. Fue as como en la antigedad el pensamiento matemtico contribuy a resolver problemas en tareas econmicas y constructoras de diferentes pueblos, dio la base para revelar tos misterios del mundo, es decir, dar explicaciones razonables para alcanzar la verdad de los fenmenos que lo suceden. Contrariamente a los griegos, los hombres de la edad media utilizaron el contenido matemtico como una simple rutina para disciplinar la mente. Sin embargo, a partir de los trabajos de Galileo, la matemtica en la edad moderna ayud a buscar explicaciones concretas de problemas que se daban en ingeniera, construccin y otras actividades prcticas del hombre. Por tal motivo, gracias al medio, las personas estn rodeadas constantemente por un conjunto de experiencias, que manejan y manipulan de una manera sorprendente. Es decir, en cierta forma se est efectuando una serie de operaciones: recoge, organiza, analiza e interpreta esas informaciones mediante unas representaciones significativas para l y as se obtiene una serie de conclusiones razonables. Esta informacin que de cierta manera se manipula, se debe matematizar. Es decir, seguir un procedimiento para poder tabular la informacin, presentarla y as hacer el anlisis respectivo para dar las conclusiones pertinentes al estudio que se est realizando. La Estadstica es utilizada en casi todas las ramas de la ciencia moderna, as como en muchos otros campos de la actividad humana. Como dijo Salomn Fabricant todo el mundo parece hoy coincidir en que la Estadstica puede ser til para comprender, evaluar y controlar el funcionamiento de la sociedad. En nuestra sociedad, el progreso puede medirse mediante diversos ndices numricos, la estadstica se utiliza para describir, manipular e interpretar estos nmeros. An cuando los tipos de problemas a los cuales puede aplicarse la Estadstica como herramienta fundamental para el anlisis e interpretacin de resultados son bastante heterogneos, en muchos casos los pasos de una investigacin estadstica son los siguientes:

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

Primera etapa: formulacin del problema. Para investigar con xito un problema dado, primero se tienen que crear conceptos precisos, formular preguntas claras e imponer limitaciones adecuadas al problema, tomando en cuenta el tiempo, dinero disponible y la habilidad de los investigadores. Segunda etapa: diseo del experimento. Nuestro deseo es obtener un mximo de informacin empleando un mnimo de costo y tiempo. Esto implica, entre otras cosas, que se debe determinar el tamao de la muestra o la cantidad y tipo de datos que resolvern ms eficientemente el problema. A la vez este tamao ser afectado por el mtodo empleado para la seleccin de la muestra representativa. Con respecto a la representatividad de la muestra, se debe observar que no es fcil obtener selecciones que sean completamente aleatorias. Existe el peligro de que una seleccin pueda ser preferida en alguna forma. Se han propuesto varios mtodos para vencer esta dificultad y se han usado en la prctica. Se considera este punto dentro del desarrollo del mdulo. Tercera etapa: experimentacin o recoleccin de datos. En general, sta es la parte que ms tiempo consume en toda investigacin que sea realizada, sta debe sujetarse a reglas estrictas. De hecho, cuanto menos opiniones impongamos, sern mejores los resultados. Cuarta etapa: tabulacin y formulacin de la respuesta. Al aplicar el mtodo estadstico antes mencionado, se obtienen conclusiones a partir de la muestra, acerca de la poblacin correspondiente. Es decir, se va a inferir sobre la muestra y se trata de sacar conclusiones para la poblacin. Es esta etapa la que le da el objetivo final a la estadstica, puesto que se van a tomar decisiones con base en los resultados obtenidos en el estudio descriptivo de la muestra. No existe una frmula mgica ni nica en estadstica que tome en cuenta todas las situaciones prcticas concebibles. Por lo cual es necesario adquirir conocimientos generales de los mtodos ms importantes para hacer inferencias. En cada caso prctico debe situarse con cuidado la naturaleza del problema especfico, para estar seguros de que ser escogido el mtodo ms apropiado. Con el apoyo del computador los clculos matemticos se hacen ms fciles, por lo tanto se recomienda utilizar e integrar un software apropiado para tal fin. En la actualidad existen varios paquetes estadsticos sencillos de manejar, tales como el Statgraphics, Sas, Minitab, Spss. De comn acuerdo con su Tutor se pueden desarrollar los ejercicios propuestos al final de cada tema, se puede utilizar calculadora y computador para facilidad de los clculos.
UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

UNIDAD 1: Generalidades de la Estadstica


Ncleos Temticos y Problemticos
Definicin Estadstica Descriptiva Distribucin de Frecuencias

Proceso de Informacin
1.1 DEFINICIN

Al evolucionar las ciencias, pierden sus rasgos primitivos, se transforman, dividen y an cambian de nombre. Como ciencia que es, la estadstica ha sufrido igual proceso y para comprender su estado actual y su campo de actividades se necesita conocer algo de su historia. Se considera fundador de la estadstica a Godofredo AchenwalL profesor y economista alemn (1719 - 1772) quien, siendo profesor de la universidad de Leipzig, escribi sobre el descubrimiento de una nueva ciencia que lamo estadstica (palabra derivada de Staat que significa gobierno) y que defini como el conocimiento profundo de la situacin respectiva y comparativa de cada estado Achenwa y sus seguidores estructuraron los mtodos estadsticos que se orientaron a investigar, medir y comparar las riquezas de las naciones Lo anterior no significa que antes de los estudios de Godofredo Achenwa, los estados no hubiesen efectuado inventarios de sus riquezas; estos invntanos o censos se efectuaron desde la antigedad. Se sabe que 2000 a 2500 aos antes de Cristo, los chinos y los egipcios efectuaron censos que eran simples inventarios elementales Desde su creacin la estadstica se ha enriquecido continuamente con los aportes de matemticos, filsofos y cientficos. Adems, en un principio se consideraba que la funcin de a estadstica era la descripcin de las caractersticas de un grupo, de observar y describir el hecho En su origen la estadstica era histrica: hoy en da, la estadstica, adems de ser descriptiva, es analtica, considerndose esta ltima como la funcin ms

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

importante que realiza, ya que permite obtener conclusiones para un grupo mayor, denominado poblacin, partiendo de una investigacin realizada en un grupo menor, denominado muestra. Las siguientes son unas definiciones que ayudan a determinar el sentido de la estadstica: Dicaonano de Webster una rama de las matemticas que trata de la recopilacin, el anlisis, la interpretacin y la presentacin de una gran cantidad de datos numricos.' Kendall y Stuart la estadstica es la rama del mtodo cientfico que traa de los datos reunidos al contar o medir las propiedades de alguna poblacin. Fraser la estadstica trata con mtodos para obtener conclusiones a partir de los resultados de los experimentos o procesos." Al unir estas definiciones, se puede notar que a partir de la recopilacin de datos se pueden hacer inferencias con respecto a resultados de experimentos. Es decir a partir de un conjunto de mtodos, normas, reglas y de principios para observar, agrupar, describir, cuantificar y analizar el comportamiento de un grupo. Es entonces, un campo parcial de la Matemtica aplicada a un conjunto de objetos que se asignan valores numricos y luego estos se siguen elaborando matemticamente. Matemticamente los procedimientos estadsticos estn muy desarrollados y asegurados en el plano de la teora, por ejemplo, mediante la indicacin de mbitos dentro de los cuales puede suponerse o rechazarse una hiptesis. Se acostumbran a distinguir dos clases de Estadstica, la descriptiva y la de inferencia. 1.1.1 Importancia

La teora general de la estadstica es aplicable a cualquier campo cientfico en el cual se hacen observaciones el estudio y aplicacin de los mtodos estadsticos son necesarios en todos (los campos del saber, sean estos de nivel tcnico o cientfico). Es obvio que en cada campo se aplican o desarrollan procedimientos especficos, como aplicaciones particulares a variantes de la teora general. Las primeras aplicaciones de la estadstica fueron los asuntos de gobierno, luego las utilizaron las compaas de seguros y los empresarios de juegos de azar, despus siguieron los comerciantes, los industriales, los educadores, etc.

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

Es por tanto que las tcnicas estadsticas se utilizan en casi todos los aspectos de la vida: Se disean encuestas para recoger informacin y as poder predecir algn suceso. Los experimentos que se hacen para determinar el mtodo apropiado para curar cierta enfermedad. La duracin, intensidad, extensin de las lluvias, tormentas o granizos, las Temperaturas, la intensidad y direccin del viento son variables aleatorias. Poblacin

1.1.2

Es el conjunto de elementos que se toma de referencia para el estudio que se desea investigar la ocurrencia de una caracterstica o propiedad. Los elementos que integran la poblacin pueden pertenecer a personas, objetos o cosas. Segn sea el tamao, la poblacin puede considerarse como finita o infinita. Es poblacin finita cuando el nmero de elementos que la componen es limitado; infinita cuando consta de infinitos elementos.

Ejemplo
La poblacin consistente en todas las tuercas producidas por una fbrica en un da especfico, los estudiantes matriculados en un colegio, son poblaciones finitas; mientras que la determinada por todos los posibles resultados (caras, cruces) de sucesivas tiradas de una moneda, las personas que hoy y en el futuro subscriban un seguro de vida, las piezas fabricadas por una mquina, son poblaciones infinitas, cantidad de carros que transitan por un peaje en un tiempo determinado es finita pero si no se especifica este tiempo es entonces infinita. 1.1.3 Muestra

Se considera como muestra el subconjunto de elementos que pertenecen a la poblacin objetivo sobre los cuales se recoger la informacin necesaria, para tomar una decisin vlida relativa a la poblacin de estudio. Si una muestra es representativa de una poblacin es posible inferir importantes conclusiones sobre la poblacin a partir del anlisis de la muestra. Las muestras pueden ser de dos tipos: probabilstica o al azar, cuando cada uno de los elementos tiene la misma probabilidad de ser escogido y no probalstica cuando se seleccionan los datos con determinado criterio o conveniencia del
UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

investigador; en estos casos, algunas unidades tienen mayor posibilidad que otras de ser seleccionadas, por tal razn no se puede determina la validez, ni la confianza que merecen dichos resultados. 1.1.4 Mtodos de Seleccin de una Muestra al Azar

La clave de un procedimiento de muestreo es garantizar que la muestra sea representativa de la poblacin, este muestreo puede ser probabilstica o intencional Es probabilstica cuando todos los elementos de la poblacin tienen la misma posibilidad de ser elegidos. En cambio, intencional, es cuando el investigador selecciona bajo un criterio la muestra. La seleccin de esta muestra probabilstica se puede realizar por medio de los siguientes mtodos:

Azar Simple
Este mtodo de seleccin permite que todos los elementos que constituyen la poblacin tengan la misma posibilidad de ser incluidos en la muestra. Este mtodo es de gran importancia cuando la poblacin no es grande o siendo grande, este se concentra en un rea pequea. Tambin cuando las caractersticas que se investiga presentan poca variabilidad o cuando la poblacin facilita su enumeracin para su seleccin. Ejemplo: en la fabrica T&T hay mil personas trabajando, 600 de las cuales son obreros, 250 son tcnicos y 150 son profesionales Si se quiere seleccionar una muestra aleatoria simple de 200 personas, en este caso, la probabilidad de seleccin de cada persona es: n 200

P=

1000

= 0.2

Lo cual indica que el 20% de los obreros corresponden a 120 de los tcnicos 50 y 30 profesionales.

Por Estratos
Para el muestreo estratificado se divide la poblacin en vanos grupos o estratos con el fin de dar representatividad a los distintos factores que integran la poblacin del estudio, la condicin de la estratificacin es la presencia en cada estrato de las caractersticas que conforman la poblacin.

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

Este proces de estratificacin requiere que la poblacin sea dividida en grupos homogneos donde cada elemento tiene una caracterstica tal que no le permite pertenecer a otro estrato. Para la seleccin de los elementos o unidades representantes de cada estrato se utiliza el mtodo del muestreo aleatorio o al azar. Dentro de este muestreo encontramos casos tres especiales: Muestras de igual tamao. En este tipo de muestreo debe seleccionarse un nmero igual de elementos en cada grupo mediante procedimiento al azar. Muestreo proporcional. En este tipo el tamao de muestra por estrato se escoge de tal forma que sea proporcional al tamao poblacional del mismo. Afinacin ptima. Este mtodo utiliza la mejor subdivisin posible de una muestra total, reparticin en todos los estratos, considerando tanto la variacin como el tamao de cada estrato adems se tiene en cuota el costo de la investigacin.

Ejemplo: en el caso de la fabrica T&T se puede argumentar que obreros, tcnicos y profesionales son importantes para establecer comparaciones y se decide escoger 80 de cada estrato. En este caso las probabilidades de seleccin seran, por estrato, las siguientes: Obreros Tcnicos Profesionales 80/600= 0,133 80/250= 0,32 80/150= 0,53

Donde se puede apreciar que la probabilidad de seleccin no es igual para todas las personas, sino que depende del estrato en que stas se encuentran y as un obrero tiene menor posibilidad de ser seleccionado que un profesional, simplemente porque estos ltimos son menores.

Por Conglomerado
Existen situaciones donde ni el muestreo aleatorio simple ni el estratificado son aplicables, ya que no se dispone de una lista con el numero de elementos de la poblacin ni en los posibles estratos. En estos casos tpicamente los elementos de la poblacin se encuentran de manera natural agrupados en conglomerados, cuyo nmero si se conoce. Por ejemplo la poblacin se distribuye en provincias, los habitantes de una ciudad en barrios, etc. Si se supone que cada uno de estos conglomerados es una muestra representativa de la poblacin total respecto a la variable que se estudia,
UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

se puede seleccionar algunos de estos conglomerados al azar y dentro de ellos, analizar todos sus elementos o una muestra aleatoria simple. Ejemplo: se desea tomar una muestra de la poblacin colombiana para estudiar la proporcin de personas que estn de acuerdo con la relaciones prematrimoniales; si se supone que la edad y el sexo pueden influir en la opinin, se debera tomar una muestra donde estas caractersticas sean las mismas que en la poblacin base, lo que implica una muestra estratificada.

Sistematizada
Una forma prctica para seleccionar la muestra es hacerla en forma sistemtica, escogiendo una muestra de cada intervalo, donde el intervalo se calcula as: K= N/n; donde N es el tamao de la poblacin y n el de la muestra. Ejemplo: si se quiere tomar una muestra de 500 viviendas en un barrio que tiene 2000 viviendas, el intervalo de seleccin ser: K= 2000 / 500 = 4. Para iniciar el proceso de seleccin sistemtica se escoge al azar un nmero entre 1 y 4, a partir del nmero seleccionado y cada 4 viviendas se hace una escogencia, hasta completar la muestra. 1.1.5 Unidad Estadstica

Una vez identificada la poblacin y la muestra, se ubica la unidad estadstica, o sea el objeto de la medicin. La unidad estadstica es el elemento del universo que reporta la informacin (observacin) y sobre el cual se realiza un determinado estudio (anlisis).

Dato
Hace referencia a la observacin particular, es decir, la informacin relacionada con las caractersticas de cosas existentes que pueden ser recogidos, anotados u observados

Variables
Es una dimensin o una caracterstica de una unidad de anlisis, dimensin que adopta la forma de una clasificacin. Una variable se puede representar por un smbolo X, Y, Z, V, x, h etc. que puede tomar un conjunto prefijado de valores; dichas variables pueden ser:

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

10

Nominal: a veces conviene extender la nocin de variable a entidades no numricas: es decir que relacionan un carcter, un nombre, una cualidad. Por ejemplo, el color C de un arco iris es una variable que puede tomar los valores rojo, anaranjado, amarillo, verde, azul, violeta y rosado. Puede ser posible sustituir tales variables por entidades numricas de la siguiente manera: denotando el rojo como 1, el anaranjado como 2 etc. Ordinal: le asigna valores numricos a los sujetos, de tal forma que los valores ms altos se le asignan a los individuos que tienen ms de la caracterstica que se mide. Esto hace que necesariamente satisfaga la caracterstica de diferenciacin pero en adicin introduce la posibilidad de ordenamiento. Por ejemplo, en una competencia ciclstica se tiene en cuenta los cinco primeros puestos para la premiacin.

Intervalo: en adicin a la clasificacin y ordenamiento se introduce la posibilidad de establecer el ordenamiento con intervalos iguales. Por ejemplo, la medicin de la temperatura la cual se puede hacer por medio de un termmetro en grados Fahrenheit.

Variable Continua: es la variable que puede tomar cualquier valor entre dos valores dados. La estatura H de una persona que puede ser 1.62 cm, 1.65 cm, 1.80. Variable Discreta: es la variable que solo puede tomar un determinado nmero de valores enteros. El nmero N de hijos en una familia puede ser O, 1, 2, 3. ESTADSTICA DESCRIPTIVA - DISTRIBUCIN DE FRECUENCIAS

1.2

La distribucin de frecuencias o tabla de frecuencia, es la disposicin tabular de los datos por clases junto con las correspondientes frecuencias de clase. Para la elaboracin de esta distribucin si los datos son cuantitativos, hay que tener en cuenta los siguientes pasos: 1.2.1 Recoleccin de Datos

Es la base para cualquier estudio estadstico, es la toma de datos u observaciones; estos se llevan a cabo mediante la recopilacin de los mismos sin ninguna ordenacin de acuerdo a lo que se est investigando.

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

11

Por ejemplo la empresa Cuero Lindo recopil la informacin resultante de encuestar 60 establecimientos pequeos, para estudiar sus ventas semanales en miles de pesos, los resultados son: 40 22 28 19 24 28 17 33 28 35 20 11 26 24 33 23 31 34 10 20 22 28 29 39 26 28 25 22 18 10 21 14 29 15 19 25 18 30 29 34 11 17 27 25 29 13 23 21 16 29 21 16 20 34 38 37 32 26 24 18

Despus de tener dicha informacin, se procede a ordenarla; es decir, colocar los datos numricos en orden creciente o decreciente. Existe un tipo de ordenacin y se hacen generalmente en una tabla de distribucin de frecuencias. Para ello se debe encontrar inicialmente el rango de la distribucin; que es la diferencia entre el mayor y el menor dato obtenido. As: R = Dm - dm, donde R= 40 - 10 = 30 1.2.2 Intervalos R = rango Dm = dato mayor dm = dato menor

Al resumir grandes colecciones de datos es til distribuidos en clases o categoras; en cuanto al nmero de clases el investigador es autnomo para escoger el nmero de intervalos para trabajar, sin embargo existe una frmula que se utiliza como base o gua para indicar la cantidad de intervalos que se van a crear en la tabla de frecuencias. Esta frmula esta determinada por: m = 1 + 3.33 log n; donde m = 1 + 3.33 log 60 = 6.92 m = nmero de intervalos n = tamao de la muestra

Lo cual indica que se puede aproximar a 6 o 7 intervalos. En este caso se toman 6 intervalos, pero se agregan dos ms que son: el intervalo menor que el dato menor y el intervalo mayor que el dato mayor; esto cuando se utiliza un programa de computador.

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

12

1.2.3

Amplitud

El rango nos ayuda a determinar la amplitud o el tamao de cada clase, siendo esta una constante para cada intervalo. La amplitud indica la distancia que debe tener cada clase. La amplitud se puede determinar como el cociente entre el rango y el nmero de intervalos. A = R / m; donde A = amplitud A = 30 / 6 = 5 miles de pesos Para formar los intervalos de clase, si es utilizando un programa estadstico, se parte del dato menor 10 y se le suma la amplitud, as, 10 + 5=15. Entonces el primer grupo esta comprendido entre 10 y 15 miles de pesos. El siguiente grupo ser: 15 + 5 = 20, donde el intervalo estar entre 15 y 20 miles de pesos. En forma similar se crean los dems intervalos, incluyendo los intervalos menores a 10 miles de pesos y mayores a 40 miles de pesos. NMERO DE CLASES 1 2 3 4 5 6 INTERVALOS - 10 10 - 15 15 - 20 20 - 25 25 - 30 30 - 35 35 - 40 40 -

Otra manera de formar los intervalos de clase es tomar un dato como medida de referencia, por ejemplo 5 (que indica $5000) o el dato menor y sumarle el valor de la amplitud: NMERO DE INTERVALOS INTERVALOS 1 5 - 10 2 10 - 15 3 15 - 20 4 20 - 25 5 25 - 30 6 30 - 35 7 35 - 40
UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

13

1.2.4

Frecuencia de Clase o Frecuencia Absoluta

Se determina el nmero de individuos que pertenecen a cada clase. Como cada clase est formada por un intervalo, entonces se debe tomar como un intervalo abierto a izquierda y cerrado a derecha. Esto quiere decir, por ejemplo: que para hacer el conteo para determinar las frecuencias correspondientes al intervalo 20 25, van a estar los valores 21, 22, 23, 24 y 25. De igual manera los valores que van a estar entre 25 - 30 son 26, 27, 28, 29 y 30. Teniendo esto en cuenta, podemos utilizar el siguiente cuadro para realizar el conteo: Intervalos 5 - 10 10 - 15 15 - 20 20 - 25 25 - 30 30 - 35 35 - 40 Nmero de Establecimientos / ///// //////////// ///////////// ////////////// //////// //// TOTAL F 2 5 12 14 15 8 4 60

Esta frecuencia significa; por ejemplo: que 12 establecimientos tienen ventas semanales entre $15000 y $20000; las mayores ventas estn entre $25000 y $30000, las menores ventas presentadas son de $10000, etc. 1.2.5 Marca de Clase (X)

Es el punto medio del intervalo de clase y se obtiene promediando el limite inferior y superior de cada clase. Intervalos 5 - 10 10 - 15 15 - 20 20 - 25 25 - 30 30 - 35 35 - 40 X 7,5 12,5 17,5 22,5 27,5 32,5 37,5

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

14

X=

5+10 2

= 7,5

Miles de pesos; esto quiere decir que el promedio del primer intervalo es de $7500. Otra manera de hallar la amplitud de un intervalo es encontrar la diferencia comn entre marcas de clase sucesivas. Por ejemplo: 32,5 - 27,5 = 5 miles de pesos. 1.2.6 Frecuencia Relativa (Fr)

Es su frecuencia dividida por la frecuencia total de todas las clases y se expresa generalmente como un porcentaje. F Fr = n La frecuencia relativa del primer intervalo es 0.0333. Este valor se obtuvo de la relacin entre 2/60 = 0.0333; significa que el 3.33% de los establecimientos tienen ventas menores de $10000. Este porcentaje se obtiene al multiplicar por 100 el resultado obtenido. De igual manera, la frecuencia relativa del segundo intervalo es de 0.0833, que significa que el 8.33% de los establecimientos tienen ventas entre $10000 a $15000. 1.2.7 Frecuencia Acumulada (Fa)

Es la acumulacin ascendente o descendente (de la primera a la ltima clase o viceversa) de frecuencias absolutas. La frecuencia acumulada descendente se obtiene de la siguiente manera: La primera frecuencia acumulada corresponde a la primera frecuencia absoluta. La segunda acumulada se obtiene sumando las dos primeras absolutas, es decir, 2+5 = 7. La tercera acumulada se obtiene de sumar 7 + 12 = 19 y as sucesivamente.

La frecuencia acumulada ascendente se obtiene as: se inicia por la frecuencia absoluta del ltimo intervalo; en este caso 4. La siguiente es sumar esta frecuencia acumulada con la anterior: 4+8 = 12. La que sigue sera 4 + 8 = 12 y as sucesivamente.

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

15

Intervalos 5 - 10 10 - 15 15 - 20 20 - 25 25 - 30 30 - 35 35 - 40

F 2 5 12 14 15 8 4 2 7 19 33 48 56 60

Fa 60 58 53 41 27 12 4

El significado de este cuadro es el siguiente: si tomamos el tercer grupo descendente, su frecuencia acumulada, significa que 19 establecimientos tienen ventas semanales entre $10000 y $20000 o inferiores a $20000. Y si tomamos el segundo grupo ascendente, quiere decir que 12 establecimientos tienen ventas semanales entre $30000 y $40000 o mayores a $30000. 1.2.8 Frecuencia Relativa Acumulada (Fra)

Es la acumulacin sucesiva en forma ascendente o descendente de frecuencias relativas. La primera frecuencia relativa acumulada corresponde a la primera frecuencia relativa. La segunda, se obtiene sumando las dos primeras frecuencias relativas, es decir, 0,0333 + 0,0833 = 0,1167 y as sucesivamente. La frecuencia relativa acumulada ascendente se obtiene as: se inicia por la frecuencia relativa del ltimo intervalo; en este caso 0,0667. La siguiente es sumar esta frecuencia acumulada con la anterior 0,0667 + 0,1333 = 0,2 y as sucesivamente. Intervalo 5 10 10 - 15 15 - 20 20 - 25 25 - 30 30 - 35 35 - 40 Fr 0.0333 0.0833 0.2 0.2333 0.25 0.1333 0.0667 0.0333 0.1167 0.3167 0.55 0.8 0.9333 1 Fra 1 0.9666 0.8833 0.6833 0.45 0.2 0.0667

Si tomamos el grupo 5 descendente su acumulado es de 0.8, cuyo significado es que el 80% de los establecimientos tienen ventas semanales menores a $30000; si tomamos el grupo 4 ascendente su acumulado ser del 0,6833, esto significa que el 68.33% de los establecimientos tienen ventas mayores a $20000 mil pesos.

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

16

Intervalo 5 - 10 10 - 15 15 - 20 20 - 25 25 - 30 30 - 35 35 - 40 Total

F 2 5 12 14 15 8 4 60

Fr 0,0333 0,0833 0,2 0,2333 0,25 0,1333 0,0667 1,00 2 7 19 33 48 56 60

Fa 60 58 53 41 27 12 4 0,0333 0,1167 0,3167 0,55 0,8 0,9333 1

Fra 1 0,9666 0,8833 0,6833 0,45 0,2 0,0667

La tabla presenta el resumen de la clasificacin de los 60 establecimientos analizados por los investigadores de la empresa Cuero Lindo, esto significa que se ha organizado la informacin.

Proceso de Comprensin y Anlisis


Decir de las siguientes variables cules son continuas y cules son discretas La altura de las personas La medida de la cantidad de lluvia cada en una localidad en un mes La edad de las personas, en aos cumplidos El nmero de alumnos de cada curso de un colegio Por qu es til la estadstica en el campo para el cual se est preparando. La Estadstica estudia el comportamiento de fenmenos colectivos y nunca de una observacin individual comentar este principio. Clasificar a que tipo de estadstica pertenecen los siguientes tems: Realizar un inventario Determinar la demanda de un producto La posibilidad que llueva en una ciudad determinada El porcentaje de desempleo en una ciudad especfica El promedio de las acciones vendidas en la bolsa de valores en una empresa en un mes determinado El aumento del ndice de precios al consumidor en un mes especfico El aumento del costo de vida en un mes especfico El nmero de accidentes ocurridos en una ciudad determinada Las ventas de un almacn en un mes determinado
UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

17

El aumento de costos de produccin con respecto al mismo mes del ao anterior. Dar un ejemplo donde se aplique la estadstica en los siguientes campos: Agricultura Biologa Negocios Qumica Comunicaciones Finanzas Economa Educacin Electrnica Educacin Electrnica Medicina Fsica Mercadeo Ciencias polticas Psicologa Medicina Fsica Mercadeo Ciencias polticas Psicologa Ingeniera Administracin Produccin Sociologa

Responder a los siguientes enunciados: Qu significan las variaciones en los precios de los artculos al consumidor? Cree que cualquier investigacin requiere informacin estadstica? Cules son las funciones del Departamento Administrativo Nacional de Estadstica (DANE)? Las calificaciones finales de 80 estudiantes son: 68 84 75 82 68 90 62 88 93 60 73 88 79 73 93 76 71 59 85 75 61 65 75 87 78 66 72 63 78 95 62 74 82 75 94 77 69 74 68 60 79 60 95 75 61 89 78 96 83 71 79 62 67 97 78 85 57 73 80 65 75 71 65 76 88 78 62 76 53 74 86 67 77 85 75 76 63 72 81 73

Hallar: La calificacin ms alta La calificacin ms baja El rango Las cinco notas ms altas Las cinco notas ms bajas La dcima nota de mayor a menor La tabla de frecuencias utilizando 7 intervalos

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

18

Comprobar que la amplitud de los intervalos es de 6.29 El nmero de estudiantes de 79 o ms El nmero de estudiantes con calificaciones por debajo de 71 El porcentaje de estudiantes con calificaciones mayores de 65 pero no superiores a 85. Cul es el significado del 91.25%? Cul es el significado del 33.75%? En una empresa se investig una muestra de 56 empleados para determinar su salario mensual en miles de pesos. Los resultados fueron los siguientes: 987 1173 1330 1331 1240 984 1055 1176 1233 1024 1000 932 1234 1104 1233 985 1079 1032 1358 1324 1343 1248 1093 1690 1229 614 918 1202 944 1310 1262 1385 1022 1067 759 1105 824 956 1252 1404 1203 1024 1243 1185 816 972 1415 827 905 1109 1157 1220 1381 1303 1209 1490

Crear la tabla de frecuencias con siete intervalos y comprobar que su amplitud es de 153.71 e interpretar cada uno de los siguientes valores en la clasificacin: X4 Fr6 Fa2 F5 Fra 4 n Fa 3 Fra 5 Fr 2 Responder: Cuntos empleados tienen un salario inferior a $1'382.000? Qu porcentaje de empleados tienen un salario superior a $1'228.000? Cuntos empleados tienen un salario entre $921.000 y $1'075.000? Qu porcentaje de empleados tienen un salario entre $1'228.000 y $1'382.000? En la tabla que sigue se recogen los pesos de 40 estudiantes varones de una universidad con precisin de 1 Kilo, construir una distribucin de frecuencias con 5 intervalos y establecer las conclusiones ms importantes. 69 82 75 66 72 84 73 80 62 63 86 72 74 69 71 67 78 88 73 71 73 81 67 75 79 99 76 78 70 77 70 72 73 82 67 64 68 74 76 72

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

19

La siguiente tabla muestra una distribucin de frecuencia de los salarios semanales de 65 empleados de la empresa P & R.
SALARIOS $250.000 - $260.000 $260.000 - $270.000 $270.00 - $280.000 $280.000 - $290.000 $290.000 - $300.000 $300.000 - $310.000 $310.000 - $320.000 Total NMERO DE EMPLEADOS 8 10 16 14 10 5 2 65

Determinar de la tabla de frecuencias: El lmite inferior de la sexta clase. El lmite superior de la cuarta clase. La marca de clase o punto medio de la tercera clase. La anchura del quinto intervalo de clase. La frecuencia de la tercera clase. El intervalo de clase con mxima frecuencia. El porcentaje de empleados que cobran menos o igual de $280.000 a la semana. El porcentaje de empleados que cobran igual o menos de $300.000 pero al menos $260.000 por semana. Si las marcas de clase en una distribucin de frecuencias de pesos de estudiantes son 128, 137, 146, 155, 164, 173 y 182 libras. Hallar: La anchura del intervalo de clase. Los lmites de clase, suponiendo que los pesos se midieron con 1 libra de precisin. La menor de 150 medidas es 5,18 m y la mayor 7.44 m. Determinar un conjunto apropiado de intervalos de clase. Marcas de clase que puedan usarse para formar la distribucin de frecuencia de esas medidas. La siguiente tabla muestra una distribucin de frecuencias de las vidas medias de 400 vlvulas de radio probadas en la empresa L & M.

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica VIDA MEDIA (Horas) 300 - 400 400 - 500 500 - 600 600 - 700 700 - 800 800 - 900 900 - 1000 1000 - 1100 1100 - 1200 Total NMERO DE TUBOS 14 46 58 76 68 62 48 22 6 400

20

Determinar de la tabla de frecuencias: El lmite superior de la quinta clase. El lmite inferior de la octava clase. La marca de clase de la sptima clase. La anchura de intervalos de clase. La frecuencia de la cuarta clase. La frecuencia relativa de la sexta clase. Porcentaje de tubos cuya vida media no pasa de 600 horas. Porcentaje de tubos cuya vida media es mayor de 900 horas. Porcentaje de tubos cuya vida media es de al menos 501 horas, pero menor o igual que 1000 horas. Los dimetros internos de los tubos fabricados por una empresa se miden con precisin de milsima de pulgada. Si las marcas de clase de una distribucin de frecuencias de esos dimetros vienen dadas por 0.321, 0.324, 0.327, 0.33, 0.333 y 0.336. Hallar la anchura del intervalo de clase y los lmites de clase. La tabla adjunta muestra los dimetros en centmetros de una muestra de 60 bolas de cojinete manufacturadas por una fbrica. Construir una distribucin de frecuencias con intervalos de clase apropiados y establecer las conclusiones respectivas.
1.738 1.735 1.736 1.739 1.728 1.733 1.738 1.735 1.736 1.735 1.729 1.731 1.735 1.735 1.738 1.730 1.729 1.727 1.744 1.735 1.743 1.726 1.724 1.745 1.725 1.732 1.727 1.734 1.732 1.729 1.740 1.737 1.733 1.736 1.733 1.730 1.735 1.732 1.737 1.734 1.736 1.728 1.742 1.742 1.734 1.739 1.735 1.736 1.731 1.730 1.741 1.737 1.736 1.740 1.732 1.734 1.732 1.741 1.746 1.740

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

21

UNIDAD 2: Medidas de Tendencia Central


Ncleos Temticos y Problemticos
Primer Caso: Cuando los Datos no Estn Agrupados Segundo Caso: Cuando los Datos Estn Agrupados

Proceso de Informacin
Las medidas de centralizacin son valores que tienden a situarse en el centro del conjunto de datos ordenados segn su magnitud. Las medidas de centralizacin ms usadas son: Media aritmtica, mediana y moda. La media aritmtica es la medida de tendencia central ms conocida, es fcil de calcular, de gran estabilidad en el muestreo; se puede aplicar a variables de intervalos ya sean discretos o continuos. Esta medida se define como la suma de todos los valores observados dividido por el nmero de observaciones, es decir encontrar el promedio de los datos en estudio. La mediana se define como la medida de tendencia central que divide a cualquier distribucin en dos partes iguales. Esta medida se puede aplicar a variables de intervalos (discretas y continuas) y variables ordinales. La moda de una distribucin se define como el valor que presenta la mayor frecuencia, se usa con variables de intervalos nominales y ordinales. Es comnmente utilizada como una medida de popularidad que refleja la tendencia de una opinin.

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

22

2.1 2.1.1

PRIMER CASO: CUANDO LOS DATOS NO ESTN AGRUPADOS Media Aritmtica

La media aritmtica de un conjunto de n nmeros x1, x2, X3..., Xn, se representa por x y se define como:
n

X=

X1 + X2 + X3 + Xn

xi
i=1

n Cuando los nmeros x1, x2, x3,....xn, aparecen f1, f2, f3,..... fn veces, respectivamente, es decir, que sus frecuencias respectivas son f1, f2, f3,....fn, la media aritmtica se puede calcular del modo siguiente:
n

X=

f1X1 +f2X2 + f3X3 + ....+fnXn = f1+f2+f3++fn

fixi
i=1 n

fi
i=1

En ocasiones, a cada uno de los nmeros x1, x2, x3,....xn, se les asigna un peso determinado w1, w2, w3,....wn. En estos casos, se acostumbra a calcular la media aritmtica ponderada del modo siguiente:
n

X=

w1x1 +w2x2 + w3x3 + ....+wnnn wixi w1+w2+w3+..+wn


i=1 n

wi
i=1

Ejemplo
Hallar la media aritmtica del puntaje obtenido por 5 estudiantes en una prueba: 6, 4, 3, 7, 8. Este es el puntaje promedio de los 5 estudiantes

6+4+3+7+8 28 x = = =5,6 5 5

Hallar la media aritmtica de los siguientes datos que representan las edades de 10 nios. 6, 6, 6, 4, 4, 4, 4, 3, 3, 7.

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

23

3*6+4*4+2*3+1*7 47 x= = = 4,7 3+4+2+1 10 El promedio de edad de los 10 nios es de 4 aos, 7meses de 5aos. Un estudiante ha obtenido las calificaciones siguientes: Asignatura Historia Qumica Fsica Matemtica Biologa Geologa Dibujo Idioma filosofa Calculando su nota media ponderada: X= 1*8 + 3*7 + 3*3 + 3*6 + 3*5 + 2*6 + 2*5 + 2*7 + 1*4 1+3+3+3+3+2+2+2+1 X= 111 20 Por lo tanto el promedio de las notas del estudiante es de 5,55 2.1.2 Mediana = 5,55 Nota 8 7 3 6 5 6 5 7 4 Peso 1 3 3 3 3 2 2 2 1

La mediana es una serie de datos ordenados en orden de magnitud, es el valor medio si el nmero de datos es impar o bien la media aritmtica de los valores medios si el nmero de datos es par.

Ejemplo
Hallar la mediana de los siguientes datos que corresponden a la venta de leche en un expendio durante los ltimos 7 das:

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

24

27800 43850 27800 43850 54300

54300 60500 54350

60800 54350 60500

73200 60800 73200

Md = 54350. El precio de la venta de leche que se encuentra en la mitad de los precios es de $54350. Hallar el valor de la mediana para los siguientes puntajes de las pruebas ICFES: 304, 283,332, 344;295, 339. 283 295 304 332 339 344

Md =

304+332

= 318

2 El puntaje de las pruebas que se encuentra en la mitad es de 318. 2.1.3 Moda

La moda no puede ser nica e incluso puede no existir.

Ejemplo
En una encuesta realizada sobre los deportes que se practican en un grado determinado de un Colegio de Varones, se presentan los siguientes resultados: Deporte Basket Ftbol Voleibol Otros N de Alumnos 10 18 5 4

La moda en este caso es el Ftbol, puesto que la mayora de los alumnos lo prefieren. Se le ha preguntado a un grupo de personas acerca del color preferido por ellas y se obtuvo lo siguiente:

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

25

Color Blanco Gris Azul Negro Rojo Morado Caf Vinotinto

Numero de Personas 4 8 9 4 3 2 8 8

Lo cual indica que los colores que pueden estar de moda son el gris, caf y vinotinto. Hallar la moda de los nmeros 2, 3, 4, 5, 6, 7, 8; como ningn nmero se repite ms que los otros, por consiguiente no hay moda. SEGUNDO CASO: CUANDO LOS DATOS ESTN AGRUPADOS Media Aritmtica
n

2.2 2.2.1

X=

xi f i
i=1

Ejemplo
Hallar la media aritmtica de las ventas de los sesenta establecimientos: Intervalos 5 - 10 10 - 15 15 - 20 20 - 25 25 - 30 30 - 35 35 - 40 40 Total F 2 5 12 14 15 8 4 0 60 X 7.5 12.5 17.5 22.5 27.5 32.5 37.5 X*F 15 62.5 210 315 412.5 260 150 0 1425

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

26

X=

1425 60 = 23,7 = 24

Las ventas promedio de los sesenta establecimientos son de $24000. Hallar el valor promedio para la distribucin correspondiente a las notas obtenidas por 40 estudiantes en una prueba estadstica: Intervalos 10 - 19.6 19.6 - 29.2 29.2 - 38.8 38.8 - 48.4 48.4 - 58 58 - 67.6 Total 1532.8 40 = 38.3 = 38 F 10 3 7 7 5 8 40 X 14.8 24.4 34 43.6 53.2 62.8 X*F 148 73.2 238 305.2 266 502.4 1532.8

X=

El puntaje promedio de los 40 alumnos es de 38. 2.2.2 Mediana

Para hallarla cuando los datos estn agrupados se siguen los siguientes pasos: Ubicar el intervalo donde quede la frecuencia correspondiente a la mitad del tamao de la muestra. Encontrar el valor del lmite real inferior del intervalo dnde est. Aplicar la siguiente frmula:

Md = li +

n _ Fa 2 F n/2

A; donde:

li :es el lmite real inferior donde est la F n/2 Fa es la sumatoria de frecuencias anteriores a n/2 F n/2 es la frecuencia donde est n/2 A es la amplitud del intervalo

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

27

Ejemplo
Encontrar la mediana de las ventas de los sesenta establecimientos: Intervalos 5 - 10 10 15 15 20 20 - 25 25 - 30 30 - 35 35 - 40 TOTAL F 2 5 12 14 15 8 4 60

$24.000 corresponde a la venta que est en la mitad. Encontrar la mediana de la distribucin correspondiente a las notas obtenidas por 40 estudiantes en una prueba estadstica F 10 3 7 7 5 8 40

Intervalos 10 - 19.6 19.6 - 29.2 29.2 - 38.8 38.8 - 48.4 48.4 - 58 58 67.6 Total

La nota que est en la mitad en esta distribucin es Moda. 2.2.3 Moda

Se debe ubicar el intervalo donde est la mayor frecuencia, y despus se aplica la siguiente frmula:

Li es el lmite real inferior donde est la moda. , 1es la diferencia entre la frecuencia modal y la frecuencia inmediatamente anterior.

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

28

2 es la diferencia entre la frecuencia modal y la frecuencia inmediatamente posterior.

A es la amplitud del intervalo.

Ejemplo
Encontrar la moda de las ventas de los sesenta establecimientos: Intervalos 5 - 10 10 - 15 15 - 20 20 - 25 25 - 30 30 - 35 35 - 40 Total F 2 5 12 14 15 8 4 60

Encontrar la moda de la distribucin correspondiente a las notas obtenidas por 40 estudiantes Intervalo 10-19.6 19.6-29.2 29.2-38.8 38.8-48.4 48.4-58 58-67.6 Total F 10 3 7 7 5 8 40

Proceso de Comprensin y Anlisis


Supngase que en un viaje, un automovilista hace las siguientes compras de gasolina. 10 galones a $2500 c/u, 8 galones a $2550 c/u, 15 galones a $2600 c/u y 12 galones $2480 c/u. Cul sera el costo medio por galn?. La siguiente tabla muestra los salarios mensuales en miles de pesos de 144 empleados de una empresa:

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica
Salarios 540 - 607 607 - 674 674 - 741 741 - 808 808 - 875 875 - 942 942 - 1009 1009 - 1076 Total F 6 19 36 24 26 19 10 4 144

29

Encontrar la media, la moda y la mediana. Diez medidas del dimetro de un cilindro fueron anotadas por un cientfico como 3.88, 4.09, 3.92, 3.97, 4.02, 3.95, 3.98, 4.03, 3.92 y 4.06 centmetros; hallar la media aritmtica de tales medidas. De entre 100 nmeros: 20 son cuatros, 40 son cincos, 30 son seis y los restantes sietes. Hallar la media aritmtica, la media y la moda. De los 80 empleados de una empresa, 60 cobran $7000 a la hora y el resto $4000 a la hora. Hallar cunto cobran la media por hora. Usar la distribucin de frecuencias para hallar la altura media, la altura que ms se repite y la altura que se encuentra en la mitad de 100 estudiantes.
Altura (m) 1.60 - 1.63 1.63 - 1.66 1.66 - 1.69 1.69 - 1.72 1.72 - 1.75 Total F 5 18 42 27 8 100

Hallar la media, mediana y moda de los pesos de 40 estudiantes de la siguiente tabla:


PESO (Lb) 118 - 126 126 134 134 142 142 150 150 - 158 158 - 166 166 - 174 Total F 3 5 9 12 5 4 2 40

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

30

Los tipos de reaccin de un individuo ante diversos estmulos, medidos por un psiclogo, fueron: 0.53, 0.46, 0.5, 0.49, 0.52, 0.53, 0.44 y 0.55 segundos respectivamente. Determinar su tiempo medio de reaccin. La siguiente tabla muestra la distribucin de cargas mximas en toneladas cortas que soportan los cables producidos en cierta fbrica. Determinar la carga mxima media, la carga mxima que se repite y la carga que ms se repite.
Carga Mxima (Toneladas Cortas) 9.3 - 9.7 9.7 - 10.1 10.1 - 10.5 10.5 - 10.9 10.9 - 11.3 11.3 - 11.7 11.7 - 12.1 Total F 2 5 12 17 14 6 4 60

La siguiente tabla muestra el nmero de bodas en Colombia para hombres y mujeres de distintos grupos de edad durante 1984. Hallar la media, mediana y moda tanto para hombres como para mujeres, estableciendo las respectivas conclusiones.
Edad (aos) 15 - 19 19 - 23 23 - 27 27 - 31 31 - 35 35 - 39 39 - 43 43 - 47 47 - 51 Hombres (Miles) 121 2.441 5.930 6.587 11.788 9.049 8.749 5.786 2.581 Mujeres (Miles) 481 4.184 6.952 7.193 11.893 9.022 8.171 4.654 1.524

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

31

UNIDAD 3: Medidas de Dispersin


Ncleos Temticos y Problemticos
Desviacin Estndar o Tpica Varianza Coeficiente de Variacin

Proceso de Informacin
Las medidas de dispersin o variacin dan idea de la separacin de los datos numricos alrededor de una medida de centralizacin. Las medidas de dispersin ms utilizadas son: 3.1 DESVIACIN ESTNDAR O TPICA

Indica que tan dispersos estn los datos con respecto a la media aritmtica. Si los datos no estn agrupados, la desviacin estndar de una serie de nmeros n. X1, x2, x3,.....xn est determinada por:

Si los datos estn agrupados, la desviacin estndar viene dada por:

Las anteriores frmulas se utilizan cuando se trabaja con la poblacin.

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

32

Si los datos estn agrupados, la desviacin estndar viene dada por:

Las anteriores frmulas se utilizan cuando se trabaja con la muestra.

Ejemplo
Hallar la desviacin estndar del puntaje obtenido por 4 estudiantes en una prueba: 6 4, 3, 7. 8. 5.6

X=

Hallar la desviacin estndar de las edades de 10 nios: 6, 6, 6, 4, 4, 4, 4, 3, 3, 7.

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

33

Hallar la desviacin estndar de las ventas de los sesenta establecimientos x = 24. Intervalos 5 10 10 - 15 15 - 20 20 - 25 25 - 30 30 - 35 35 - 40 Total F 2 5 12 14 15 8 4 60 X 7.5 12.5 17.5 22.5 27.5 32.5 37.5 (X-x)2 F 544.5 661.25 507 31.5 183.75 578 729 3235

3.2

VARIANZA

Esta es la medida de variacin ms importante, ya que se obtiene a partir de la media aritmtica de una distribucin. La varianza seala la distancia promedio de cualquier observacin en el conjunto de datos. La varianza de un conjunto de datos se define como el cuadrado de la desviacin tpica. La varianza es una medida de dispersin, en la cual, las unidades son los cuadrados de las unidades de los datos, es decir, pesos cuadrados, personas cuadradas, etc., y por esto no son expresiones fciles de interpretar. Si los datos no estn agrupados, la varianza de una serie de nmeros n: x1, x2, x3........ Xn est determinada por:

Si los datos estn agrupados, la varianza viene dada por:

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

34

Ejemplo
Hallar la varianza del puntaje de 5 estudiantes: 6, 4, 3, 7, 8.

Hallar la varianza de las edades de 10 nios: 6, 6, 6, 4, 4, 4, 4, 3, 3. 7.

X = 4.7

18.1 S2 = = 1.81 10 Hallar la varianza de las ventas de los sesenta establecimientos: X = 24 Intervalos 5 10 10 15 15 20 20 25 25 30 30 - 35 35 - 40 Total F 2 5 12 14 15 8 4 60 X 7.5 12.5 17.5 22.5 27.5 32.5 37.5 (X-x)2 F 544.5 661.25 507 31.5 183.75 578 729 3235

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

35

3235 S2 = = 53.9 60 3.3 COEFICIENTE DE VARIACIN

Esta medida relaciona la desviacin estndar y la media, para expresar la variacin de la desviacin con respecto a la media aritmtica. Este coeficiente de variacin se acostumbra expresarlo en porcentaje. S La frmula que se utiliza es: cv = * 100 X El coeficiente de variacin es una medida muy utilizada en control de calidad. Para estos casos, generalmente existen especificaciones que limitan el coeficiente de variacin. Tambin nos sirve para determinar la homogeneidad de la informacin, es decir, si el coeficiente de variacin es pequeo la informacin es homognea y si el coeficiente de variacin es grande la informacin es heterognea.

Ejemplo
Hallar el coeficiente de variacin de 6, 4, 3, 7, 8 X = 5.6 S = 1.34 Cv = 23.9% Este porcentaje indica cmo se distribuye la desviacin estndar con respecto a la media a travs de los datos. Hallar el coeficiente de variacin de las ventas de los sesenta establecimientos y obtener conclusiones. X = 24 S = 7.3

7.3 Cv = *100 24 Cv = 30.42%. De aqu se puede decir que las ventas de los sesenta establecimientos son homogneas.

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

36

Si el trabajador A produce por hora 40 tornillos en promedio, con desviacin de 5 tornillos y el trabajador B produce 180 tornillos en promedio con desviacin de 15, cul de los trabajadores presenta menor variabilidad?

5 CVA = *100 = 12.5% para el operador A 40 15 CVB = *100 = 9.4% Para el operador B 180 Esto significa que el operador B, quien tiene mayor desviacin en la produccin, presenta menor variacin, porque la media de produccin para el operador B es mucho mayor que la del operador A.

Proceso de Comprensin y Anlisis


Hallar la desviacin estndar y la varianza de los puntos obtenidos asignados a 8 nios en un juego: 12, 6, 7, 3, 15, 10 18 y 5. Hallar la desviacin estndar y la varianza en la compra de cremas dentales: $9.345, $3.850, $8.235, $8.000, $9.578, $8.560, $9.234, y 18.456. Hallar la desviacin estndar de las alturas de los estudiantes de acuerdo a la siguiente tabla:
Altura (m) 1.60 1.63 1.63 1.66 1.66 1.69 1.69 1.72 1.72 1.75 Total F 5 18 42 27 8 100

Hallar la desviacin estndar de la distribucin de salarios de la siguiente tabla:


SALARIOS $250.000 - $260.000 $260.000 - $270.000 $270.000 - $280.000 $280.000 - $290.000 NM. EMPLEADOS 8 10 16 14

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica
SALARIOS $290.000 - $300.000 $300.000 - $310.000 $310.000 - $320.000 Total NM. EMPLEADOS 10 5 2 65

37

La siguiente tabla muestra los cocientes de inteligencia (lQ) de 480 nios de una escuela elemental. Hallar la desviacin estndar:
F 4 9 16 28 45 66 85 72 54 38 27 18 11 5 2 X 70 74 78 82 86 90 94 98 102 106 110 114 118 122 126

Un fabricante de tubos de televisin produce dos tipos de tubos A y B, que tienen vidas medias respectivas: xA = 1495 horas y xB = 1875 horas y desviacin tpica de SA = 280 horas y SB = 310 horas. Qu tipo de tubo tiene mayor dispersin? En un examen final de Estadstica, la puntuacin media de 150 estudiantes fue de 78 y la desviacin estndar 8. En lgebra la media fue de 73 y la desviacin estndar 7.6. En qu materia fue mayor la dispersin?. Hallar la desviacin estndar y el coeficiente de variacin para los datos de la siguiente tabla:
Carga Mxima (Toneladas Cortas) 9.3 - 9.7 9.7 10.1 10.1 - 10.5 10.5 - 10.9 F 2 5 12 17

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica
Carga Mxima (Toneladas Cortas) 10.9 - 11.3 11.3 - 11.7 11.7 - 12.1 Total F 14 6 4 60

38

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

39

UNIDAD 4: Medidas de Ubicacin


Ncleos Temticos y Problemticos
Cuartiles, Percentiles y Deciles Diagramas de Caja

Proceso de Informacin
4.1 CUARTILES, PERCENTILES, DECILES

Si un conjunto de datos est ordenado por magnitud, el valor central que divide al conjunto en dos mitades iguales, es la mediana. Extendiendo esa idea, se puede pensar en aquellos valores que dividen al conjunto en cuatro partes iguales, (cuartiles) esos valores denotados Q1 Q2 y Q3, llamados primer, segundo y tercer cuartil respectivamente. El Q2 coincide con la mediana. Anlogamente, los valores que dividen a los datos en 10 partes iguales se llaman deciles y se denotan por D1 D2,...D9. El D5 coincide con la mediana. Y los valores que dividen a los datos en 100 partes iguales se llaman percentiles, denotados por P1 P2,.....P99. El P50 coincide con la mediana.

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

40

Si los datos no estn agrupados, se deben ordenar en forma ascendente o descendente y ubicar el dato que est en la posicin n * p :donde, q q = 4, 10, 100 p = Nmero a la ubicacin al que se desea referir n = Total de datos

Ejemplo
Con los siguientes datos ubicar el que corresponde a: Al primer cuartil Al tercer decil Al percentil 80 12 3 n*p 8 4 8*1 5 5 10 6 11 8 4 10 6 11 3 12

Q1 = = = 2 q 4 El dato que est en el primer cuartil es 4, ya que est en la segunda posicin. n*p 8*3

D3 = = = 2.4 2 q 10 El dato que est en el tercer decil es 4, ya que est en la segunda posicin. P80 n*p 8 * 80 = = = 6.4 6 q 100

El dato que est en el percentil 80 es 10, ya que este valor est en la sexta posicin. Cuando los datos estn agrupados, utilizamos la misma frmula de la mediana y reemplazamos donde est n/2 por n * p; el lmite inferior es donde est la F (n*p)/q q

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

41

Donde U hace referencia a la medida de ubicacin, li es el limite inferior donde est F(n*p)/q

Ejemplo
En las ventas de los sesenta establecimientos encontrar: El primer, segundo y tercer cuartil El primer, quinto y el sexto decil El percentil doce, cincuenta y ochenta n*p q para ubicar el

Para encontrar estas medidas, primero hay que encontrar intervalo correspondiente a esta posicin.

El Primer, Segundo y Tercer Cuartil


Intervalos 5 - 10 10 - 15 15 - 20 20 - 25 25 - 30 30 - 35 35 - 40 Total F 2 5 12 14 15 8 4 60 n = 60 p=1 q=4 n*p = 60*1 = 15 q 4 Li= 15 Fa = 7 F (n*p)/q = 12 A=5 De donde el 25% de las ventas de los 60 establecimientos es de $18000 o menos. Intervalo 5 - 10 10 - 15 15 - 20 20 - 25 25 - 30 30 - 35 35 - 40 Total F 2 5 12 14 15 8 4 60

n = 60 p=2 q=4 n*p = 60*2 = 30 q 4 Li= 20 Fa = 19 F (n*p)/q = 14 A=5

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

42

Donde el 50% de las ventas de los 60 establecimientos es de $24000 o menos.

Intervalos 5 - 10 10 - 15 15 - 20 20 - 25 25 - 30 30 - 35 35 - 40 Total

F 2 5 12 14 15 8 4 60

n = 60 p=3 q=4 n*p = 60*3 = 45 q 4 Li= 25 Fa = 33 F (n*p)/q = 15 A=5 Por lo tanto el 75% de las ventas de los 60 establecimientos es de $29000 o menos

El Primer, Quinto y el Sexto Decil


Intervalos 5 - 10 10 - 15 15 - 20 20 - 25 25 - 30 30 - 35 35 - 40 Total F 2 5 12 14 15 8 4 60 n = 60 p=1 q = 10 n*p = 60*1 = 6 q 10 Li= 10 Fa = 2 F (n*p)/q = 5 A=5

El 10% de las ventas es de $9000 o menos.

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

43

Intervalos 5 10 10 - 15 15 - 20 20 - 25 25 - 30 30 - 35 35 - 40 Total

F 2 5 12 14 15 8 4 60

n = 60 p=5 q = 10 n*p = 60*5 = 30 q 10 Li= 20 Fa = 19 F (n*p)/q = 14 A=5

El 50% de las ventas es de $24000 o menos Intervalos 5 - 10 10 - 15 15 - 20 20 - 25 25 - 30 30 - 35 35 - 40 Total F 2 5 12 14 15 8 4 60

n = 60 p=6 q = 10 n*p = 60*6 = 36 q 10 Li= 25 Fa = 33 F (n*p)/q = 15 A=5

Y el 60% de las ventas es de $26000 o menos.

El Percentil Doce, Cincuenta y Ochenta


Intervalo 5 - 10 10 - 15 15 - 20 20 - 25 25 - 30 30 - 35 35 - 40 Total F 2 5 12 14 15 8 4 60 n = 60 p = 12 q = 100 n*p = 60*12 = 7.2 = 7 q 100 Li= 10 Fa = 2 F (n*p)/q = 5 A=5

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

44

P12= 10+

60*12 -2 100 5

5 = 15.2 15

Por lo tanto el 12% de las ventas de los sesenta establecimientos es de $15000 o menos. Intervalos 5 - 10 10 - 15 15 - 20 20 - 25 25 - 30 30 - 35 35 - 40 Total F 2 5 12 14 15 8 4 60 n = 60 p = 50 q = 100 n*p = 60*50 = 30 q 100 Li= 20 Fa = 19 F (n*p)/q = 14 A=5

P50= 20+

60*50 -19 5 = 23.9 24 100 14

El 50% de las ventas de los sesenta establecimientos es de $24000 o menos. Intervalo 5 - 10 10 - 15 15 - 20 20 - 25 25 - 30 30 - 35 35 - 40 Total F 2 5 12 14 15 8 4 60 n = 60 p = 80 q = 100 n*p = 60*80 = 48 q 100 Li= 25 Fa = 33 F (n*p)/q = 15 A=5

Y el 80% de los establecimientos tienen ventas de $30.000 o menos.

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

45

4.2

DIAGRAMAS DE CAJA

Es una representacin del diagrama de una distribucin construida para mostrar sus caractersticas principales y sealar los posibles datos atpicos, es decir, aquellas observaciones que parecen ser distintas de las dems. Su principal utilidad es para depurar informacin puesto que se pueden eliminar los datos de mayor variacin en los extremos. Un diagrama de caja se construye as: Ordenar los datos de la muestra y obtener el valor mnimo, el mximo y los tres cuartiles Q1, Q2, Q3, localizndolos en una recta numrica utilizando una escala adecuada. Dibujar un rectngulo cuyos extremos son Q1 y Q3. Calcular unos limites admisibles superior e inferior que van a servir para identificar los valores atpicos. Estos lmites se calculan con : Li = Q1-1.5 Q3 Q1

Li = Q3 +1.5

Q3 Q1

Considerar como valores atpicos los situados fuera del intervalo (li, Ls). Dibujar una lnea que vaya desde cada extremo del rectngulo central hasta el valor ms alejado no atpico, es decir, que est dentro del intervalo (li, ls). Identificar todos los datos que estn fuera del intervalo (li, ls) marcndolos como atpicos.

Ejemplo: Los siguientes datos muestran el nmero de das con aire contaminado
en 2001 y 2002 en varias ciudades colombianas:
A B C D E F G H I 2001 248 208 113 128 106 118 60 79 55 2002 221 171 131 89 101 33 63 56

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica
2001 47 88 47 58 82 33 2002 54 55 69 59 48 16

46

J K L M N O

Construir el diagrama de cajas correspondiente a la tabla dada.

Para 2001
El primer paso es ordenar la informacin de mayor a menor: 33 47 47 55 58 60 79 82 88 106 113 118 128 208 248 Luego se encuentran los tres cuartiles: El 25% de ciudades tienen 55 das o menos de contaminacin o el 25% de las ciudades de EEUU tienen entre 33 y 55 das de contaminacin.

15*1 Q1 = = 3.75 4 4 15*2 Q2 = = 7.5 8 4

El 50% de ciudades tienen 82 das o menos de contaminacin El 75% de ciudades tienen 113 das o menos de contaminacin.

15*3 Q3 = = 11.25 11 4 Por tanto los lmites admisibles son: Li = 55 1,5

113 55 2 113 - 55 2

= 11,5

Ls = 113 + 1,5

= 156,5

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

47

Como todos los valores son superiores al lmite inferior, la lnea inferior del diagrama de caja deber llegar hasta el valor mnimo y no hay atpicos en esta direccin.

2001

Este diagrama de caja, muestra que la mayor parte de las observaciones son menores que 113 y que el extremo superior de 248 est muy alejado del grupo principal de datos. Se ve con claridad la amplitud de los datos, que es la longitud del diagrama completo (248 - 33 = 215).

Para 2002
16 33 48 54 55 56 59 63 69 89 101 131 171 221 14*1 Q1= = 3.75 4 4 14*2 Q2= = 7 4 14*3 Q3= = 10.5 11 4 El 25% de ciudades tienen 55 das o menos de contaminacin.

El 25% de ciudades tienen 59 das o menos de contaminacin.

El 25% de ciudades tienen 101 das o menos de contaminacin. 101 - 55 2 101 - 55 2 = 20.5

Li = 55 1,5

Ls = 101 + 1,5

= 135.5

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

48

2002

Estos diagramas de caja son muy eficaces cuando ellos se comparan conjuntos de datos.

2001

2002

Ntese como los datos tienden a concentrarse ms y ms hacia el extremo inferior de la escala, excepto el extremo alto, el cual permaneci alto durante los dos aos.

Proceso de Comprensin y Anlisis


En la siguiente tabla que relaciona las alturas de 100 estudiantes, determinar el primer, el segundo y tercer cuartil y realizar el grfico correspondiente: Altura (m) 1.60 - 1.63 1.63 - 1.66 1.66 - 1.69 1.69 - 1.72 1.72 - 1.75 Total F 5 18 42 27 8 100

Hallar en la siguiente tabla para los salarios en miles de pesos de 144 empleados de una empresa:
UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

49

El primer cuartil El quinto y octavo decil El percentil 10 y el percentil 45 Salario 540 - 607 607 - 674 674 - 741 741 - 808 808 - 875 875 942 942 - 1009 1009 - 1076 Total F 6 19 36 24 26 19 10 4 144

Encontrar el primer, segundo y tercer cuartil de la siguiente tabla que relaciona los pesos de 40 personas y realizar el grfico correspondiente: Peso (Lb) 118 - 126 126 - 134 134 - 142 142 - 150 150 - 158 158 - 166 166 174 Total F 3 5 9 12 5 4 2 40

Las siguientes son diez medidas del dimetro de un cilindro: 3.88, 4.09, 3.92, 3.97, 4.02 3.95, 3.98, 4.03, 3.92 y 4.06 centmetros. Hallar: El primer y tercer cuartil El cuarto, el sexto y noveno decil El percentil 48 y el percentil 10 La siguiente tabla muestra una distribucin de frecuencias de las vidas medias de 400 vlvulas de radio probadas en la empresa L & M. Encontrar: El primer, segundo, tercer cuartil y su respectiva grfica El segundo, cuarto y sexto decil. El cincuenta percentil.
UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

50

Vida Media 300 400 400 - 500 500 - 600 600 - 700 700 - 800 800 - 900 900 - 1000 1000 - 1100 1100 - 1200 Total

Nmero de Tubos 14 46 58 76 68 62 48 22 6 400

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

51

UNIDAD 5: Presentacin de la Informacin


Ncleos Temticos y Problemticos
Histograma Polgonos de Frecuencia Ojivas Barras

Proceso de Informacin
Una grfica estadstica es aquella en la cual se presentan los datos estadsticos en trminos de magnitudes, para interpretarlos en forma visual. Presentar la informacin de la tabla de frecuencias por medio de grficas sirve para reforzar las conclusiones que se determinan de esta tabla. Estas grficas se pueden utilizar para: Evaluar resultados de un proceso. Presentar resultados de una investigacin.

Para la elaboracin de un grfico hay que tener en cuenta: Ttulo: indica la descripcin del contenido de la grfica, es decir, indica el fenmeno de estudio. Por ejemplo, Produccin de caf en Colombia en el perodo 1995 - 1997. Diagrama: es empleado para representar los datos mostrados en una grfica; los diagramas pueden ser de varios tipos: lneas, barras, dimensiones y smbolos.

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

52

Escala: se aplica para saber la dimensin del fenmeno graficado. Se debe identificar en los ejes X y Y de un sistema de coordenadas. Las magnitudes en la ordenada o eje Y y las clasificaciones de los datos en las abscisas o eje X.

Existen varios tipos de grficas para representar los datos estadsticos y al mismo tiempo sirven para reforzar las conclusiones dadas en la tabla de frecuencias. 5.1 HISTOGRAMA

Sirve para representar grficamente una distribucin de frecuencias. El grfico se disea trazando los intervalos sobre el eje X y las frecuencias absolutas sobre el eje Y. A partir del intervalo se traza la altura respectiva dada por la frecuencia absoluta. La empresa Cuero Lindo ha recopilado informacin sobre las ventas en miles de pesos de 60 almacenes. Estos datos son: VENTAS PARA SESENTA ESTABLECIMIENTOS (Miles de pesos) Intervalo 5 - 10 10 - 15 15 - 20 20 - 25 25 - 30 30 - 35 35 - 40 40 Total F 2 5 12 14 15 8 4 0 60

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

53

Las ventas ms frecuentes de los sesenta establecimientos estn entre $25000 y $30000; $20000 y $25000. Y la menos frecuente est en $10000. 5.2 POLGONOS DE FRECUENCIAS

Es una curva que se traza a partir de los puntos medios de cada clase de amplitud; estos se unen por medio de una lnea recta, la cual se disea con base en los datos del histograma.

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

54

5.3

OJIVAS

Es el grfico de una distribucin de frecuencias acumuladas (relativa, absoluta) descendente o ascendente. Esta grfica indica la forma como crece la informacin a travs de los intervalos, se puede utilizar como medicin de las variaciones de los grupos. El punto donde se cortan las dos ojivas es el punto central de la distribucin es decir la mitad de la informacin.

5.4

BARRAS

Sirven bsicamente para establecer las diferencias entre grupos individuales y pueden ser de dos tipos: 5.4.1 Barras Verticales

Se emplean para presentar datos clasificados cronolgica o cuantitativamente:

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

55

Ejemplo: en la siguiente tabla se encuentra la informacin correspondiente a las ventas anuales de la empresa El Retorno durante el perodo de 1987 - 1996 (en millones de pesos). Aos 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 Ventas 6 9 15 30 50 80 110 150 130 100

5.4.2

Barras Horizontales

Se emplean para dar datos clasificados geogrfica y cualitativamente, indican la importancia de un atributo con respecto a los dems. Ejemplo: la siguiente informacin nos indica el nmero de profesionales egresados de distintas carreras en la ciudad de Bogot en 2002:
Carrera Ciencias Sociales Administracin Ingenieras derecho Nmero de profesionales 1100 800 500 700

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

56

Segmentada
Ejemplo: presenta una comparacin de la magnitud relativa de ventas dentro de cada departamento y de las ventas totales por departamentos. La siguiente informacin corresponde a las ventas por departamentos al contado y a crdito en un almacn, se presenta en miles de pesos.
Departamento Hombres Mujeres Nios Electrodomsticos Contado 200 180 150 300 Crdito 120 110 90 210 Total 320 290 240 510

Agrupada
Muestra las ventas por departamento en una empresa al contado y a crdito y permite hacer comparaciones entre departamentos y al interior de cada uno.

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

57

Las Grficas de barras horizontales pueden presentarse de dos formas:

Circular o de Tortas
Se utiliza para representar las variables y sirve para hacer notar las diferencias en las proporciones o porcentajes. Es efectiva para permitir las comparaciones cuando los segmentos son relativamente grandes. El proceso para realizar el diagrama consiste en una regla de tres para: Conocer el ngulo de cada sector, entonces se debe relacionar los 360 que tiene una circunferencia con el tamao de la muestra y con cada una de sus frecuencias absolutas. 360 n x Fi As por ejemplo: 360 60 x 2 360*2 x = = 12 60 360 60 x 5 360*3 x = = 18 60
5

Donde 60 es la muestra de las ventas de los establecimientos; 2 es la frecuencia absoluta del primer intervalo.

Donde 60 es la muestra de las ventas de los establecimientos; 5 es la frecuencia absoluta del segundo intervalo.

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

58

Y para conocer el porcentaje que corresponde a cada parte, relacionando 100% con el tamao de la muestra con la frecuencia absoluta. 100 n y Fi As, por ejemplo: 100% y 60 2 Donde 60 es la muestra de las ventas de los establecimientos; 2 es la frecuencia absoluta del primer intervalo.

100*2 y= = 3.3 3% 60

Esto quiere decir que el 3% de los establecimientos tienen ventas entre $5000 y $10000.

Tallo y Hojas
Se puede tener un cuadro ms informativo que la tabla de recoleccin de datos si se hace un listado diferente. Se tienen los porcentajes invertidos por 15 industrias manufactureras en el control de contaminacin de Colombia en 2001:
UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

59

17 17 03

02 04 02

07 04 04

04 14 10

08 03 01

Para elaborar el diagrama de Tallos y Hojas hay que seguir los siguientes pasos: El dgito de la extrema izquierda de cada valor es el punto de partida adecuado para clasificar los datos en dos grupos. El O y 1 se usa para formar el tallo y se escribe en columna vertical. A continuacin se escribe el segundo dgito como si fuera una hoja en el rengln adecuado del tallo, a la derecha de la barra vertical. O 1 3,2,4,2,7,4,4,4,8,3,1 7,7,4,0

Ya que la mayor parte de las observaciones tienen el cero como primer dgito, se puede alargar el tallo a dos categoras de O y dos de 1; en la que los segundos dgitos del O al 4 quedarn en el rengln superior y los dgitos del 5 al 9 en el inferior. Como es fcil de ordenar las observaciones en cualquier rengln, tambin se puede presentar la grfica ordenada de tallo y hojas. O O 1 1 1,2,2,3,3,4,4,4,4 7,8 0,4 7,7

Ahora se ve con facilidad que las observaciones van de 01 a 17, que nueve de las 15 observaciones son de 4 o menos. Con el ejemplo que se ha venido trabajando; se puede elaborar este diagrama de tallos y hojas. En los siguientes datos los resultados son obtenidos en miles de pesos: 40 22 28 19 24 28 17 33 28 35 20 11 26 24 33 23 31 34 10 20 22 28 29 39 26 28 25 22 18 10 21 14 29 15 19 25 18 30 29 34 11 17 27 25 29 13 23 21 16 29 21 16 20 34 38 37 32 26 24 18

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

60

Presentacin de los Datos en Forma de Tallo y Hojas


10,0,1,1,3,4 15,6,6,7,7,8,8,8,9,9 20,0,0,1,1,1,,2,2,2,3,3,4,4,4 25,5,5,6,6,6,7,8,8,8,8,8,9,9,9,9,9 30,1,2,3,3,4,4,4 38,9 4O 4 Las presentaciones de tallo y hoja de ms de dos dgitos se pueden elaborar de diversos modos. Los siguientes datos muestran el nmero de das con aire contaminado en el 2001 en varias ciudades de Colombia:
Ciudad A B C D E F G H I J K L M N O 2001 248 208 113 128 106 118 60 79 55 47 88 47 58 82 33

Para construir una grfica de tallo y hojas con los datos del 2001, los dgitos de las centenas y decenas formarn el tallo y las unidades sern las hojas. 03 04 05 06 07 08 09 10 3 7.7 5.8 0 9 28 6 11 3.8 12 8 13 14 15 16 17 18 19 20 8 21 22 23 24 8

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

61

Como esta grfica es muy dispersa: centenas y las hojas los dems dgitos 0 0 1 1 2 2 33,47,47 55,58,60,79,82,88 06,13,18,28 08,48

hay que hacer que el tallo contenga las

Proceso de Comprensin y Anlisis


La siguiente tabla muestra la poblacin de alguna ciudad (en millones) en los aos de 1882 2002. Representar estos datos en un diagrama de barras.
AO 1882 1892 1902 1912 1922 1932 1942 1952 1962 1972 1982 1992 2002 POBLACIN (Millones) 31.4 39.8 50.2 62.9 76 92 105.7 122.8 131.7 151.1 179.3 203.3 226.5

La siguiente tabla muestra el nmero de sacos de trigo y maz en la cooperativa PQR durante los aos de 1992 2002:
AO 1992 1993 1994 1995 1996 NMERO DE SACOS DE TRIGO 200 185 225 250 240 NMERO DE SACOS DE MAIZ 75 90 100 85 80

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica AO 1997 1998 1999 2000 2001 2002 NMERO DE SACOS DE TRIGO 195 210 225 250 230 235 NMERO DE SACOS DE MAIZ 110 110 105 95 110 100

62

Con referencia a la grfica, determinar el ao o aos durante los cuales: La produccin de trigo fue mnima. La de maz fue mxima. Se dio el mayor descenso en la produccin de trigo. Decreci la produccin de maz respecto al ao anterior y creci la de trigo. Se produjo idntica cantidad de trigo La produccin conjunta de trigo y maz fue mxima. Las reas de algunos departamentos de Colombia (en miles de millas cuadradas) se recogen en la siguiente tabla. Representar estos datos en un grfico de tortas y determinar las conclusiones ms relevantes.
DEPARTAMENTO Cundinamarca Antioquia Armenia Amazonas Meta Choc Norte de Santander Total REA (miles de millas cuadradas) 11.7 10.4 1.9 9.4 3.3 6.9 7.9 51.5

En la siguiente tabla, se ven los nmeros (en millones) de estudiantes de enseanza elemental, media y superior en Colombia. Representar los datos, usando grficos de barras y determinar algunas conclusiones.
AO 1982 1987 1992 1997 2002 ELEMENTAL 32.4 35.5 37.1 33.8 30.6 MEDIA 10.2 13 14.7 15.7 14.6 SUPERIOR 3.6 5.7 7.4 9.7 10.2

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

63

La siguiente tabla muestra el estado civil de hombres y mujeres (de ms de 18 aos) en Colombia en 2001. Representar los datos mediante dos grficos circulares y un grfico de diseo propio. ESTADO CIVIL Soltero Casado Viudo Divorciado HOMBRES (% total) 25.1 66.7 2.4 5.8 MUJERES (% total) 18.4 61.3 12.4 7.9

Una fbrica de gaseosa proyecta lanzar al mercado un nuevo sabor, para lo cual se realiza un test de aceptacin de dicho sabor, en una muestra de 32 personas. Se utiliza una escala de 30 para medir el grado de aceptacin. Los puntos obtenidos fueron los siguientes: 19 24 28 30 24 19 27 19 26 18 22 26 31 19 17 27 18 21 19 28 17 32 21 21 22 31 22 24 21 26 24 26

Realizar la representacin del esquema de tallos y hojas de esta informacin. Un artculo de revista titulado Amargo Panorama, habla acerca del caf colombiano y muestra un grfico de este tipo:

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

64

Qu se puede decir de este grfico?. En la seccin de actualidad de una revista, hay un titular sobre Los Derechos Humanos: una tortura. Y muestra entre otras los siguientes grficos:

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

65

De acuerdo a estas grficas responder: Qu porcentaje de quejas estn concluidas? Qu significado tiene el valor 3794 en el grfico de estado de las quejas? Qu interpretacin le puede dar al grfico quines se quejan?

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

66

ANEXO: Tablas

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

67

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

Estadstica Bsica

68

BIBLIOGRAFA GENERAL
BERNAL V. Miguel. Estadstica Descriptiva: J. Elaboracin y Presentacin de Datos Universidad de Pamplona, 1987. GALLARDO, Yolanda. Pamplona. 1997. Estadstica: Programa de Sicologa Universidad de

MARTNEZ BENCARDINO, Ciro. Estadstica Comercial. Bogot: Norma, 1981. MORENO GARZN, Adonay. Serie aprender a investigar: informacin. Cali: ICFES, 1995. Recoleccin de la

PARZEN, Emmanuel. Teora Moderna de Probabilidades y sus Aplicaciones Mxico: LIMUSA, 1991. PEA SNCHEZ, Damel. Estadstica Modelos y Mtodos I. Fundamentos. Madrid: Alianza editorial, 1986. PORTUS GOVINDEN. Lincoyn. Curso Prctico de Estadstica. Bogot: McGRAW - Hill, 1986. SPIEGEL Murria R. Estadstica. Madrid: McGraw Hill, 1993.

UNIVERSIDAD DE PAMPLONA Centro de Educacin Virtual y a Distancia

You might also like