You are on page 1of 13

PROGRAMA DE ESTADISTICA UNIDAD I ESTADISTICA DESCRIPTIVA 1.- Conceptos Generales I.1.1 Antecedentes Historicos I.1.2 Representacion e interpretacion de grafica I.1.3 Elementos fundamentales I.1.

4 Distribucion de Frecuencias I.1.5 Organización de la informacion

resulta difícil.1Antecedentes Historicos Desde los comienzos de la civilización han existido formas sencillas de estadísticas. ordenación. para ver en qué medida los datos se agrupan o dispersan en torno a un valor central. dar una definición. superficie y renta de todos los territorios bajo su control. El registro de nacimientos y . llevado a cabo en 1086. se recoge en el Domesday Book. animales. los babilonios usaban ya pequeñas tablillas de arcilla para recopilar datos en tablas sobre la producción agrícola y de los géneros vendidos o cambiados mediante trueque.) a los que se refieren los datos que se consideran. pues. Hacia el año 3000 A.en algunas partes. Este análisis es muy básico.C. trabajos de estadística. la idea más adecuada es considerar que incumbe a la Estadística la recogida. Sin embargo. pues ya se utilizaban representaciones gráficas y otros símbolos en pieles. resumen y análisis de datos de cualquier tipo sobre colectivos. las primeras conclusiones obtenidas tras un análisis descriptivo. experimentos. y sus aplicaciones directas o indirectas. cosas. etc. considerar un grupo de elementos (personas. La información obtenida con este censo. Después de la conquista normanda de Inglaterra en 1066. por ello. Los reyes carolingios Pipino el Breve y Carlomagno ordenaron hacer estudios minuciosos de las propiedades de la Iglesia en los años 758 y 762 respectivamente. rocas.C.1. es un estudio calculando una serie de medidas de tendencia central. Los griegos clásicos realizaban censos cuya información se utilizaba hacia el año 594 A. 1 Conceptos Generales El concepto de Estadística es muy amplio. para cobrar impuestos. 1. El primero contiene dos censos de la población de Israel y el segundo describe el bienestar material de las diversas tribus judías. lo que significa que no tiene sentido pensar en un dato aislado o individual como terreno de trabajo de la Estadística: es necesario.C. el rey Guillermo I de Inglaterra encargó un censo.C. palos de madera y paredes de cuevas para contar el número de personas. Los libros bíblicos de Númerosy Crónicasincluyen. Aunque hay tendencia a generalizar a toda la población. Durante la edad media sólo se realizaron algunos censos exhaustivos en Europa. En China existían registros numéricos similares con anterioridad al año 2000 A. El Imperio romano fue el primer gobierno que recopiló una gran cantidad de datos sobre la población. Los egipcios anallizaban los datos de la población y la renta del país mucho antes de construir las pirámides en el siglo XXXI a. animales o ciertas cosas. muy numerosas.Unidad 1 Estadística Descriptiva La estadística descriptiva es una gran parte de la estadística que se dedica a analizar y representar los datos.

Después de la conquista normanda de Inglaterra en 1066. llevado a . Muchos conjuntos de datos se pueden aproximar. utilizando determinadas distribuciones probabilísticas. fue utilizado por el astrónomo inglés Edmund Halley como base para la primera tabla de mortalidad. sociales. trabajos de estadística. Los griegos clásicos realizaban censos cuya información se utilizaba hacia el año 594 A. la estadística se ha convertido en un método efectivo para describir con exactitud los valores de los datos económicos. realizado en 1691. palos de madera y paredes de cuevas para contar el número de personas. el rey Guillermo I de Inglaterra encargó un censo. Los libros bíblicos de Númerosy Crónicasincluyen. El Imperio romano fue el primer gobierno que recopiló una gran cantidad de datos sobre la población. en Alemania. pues ya se utilizaban representaciones gráficas y otros símbolos en pieles. En el siglo XIX. y sirve como herramienta para relacionar y analizar dichos datos. Hacia el año 3000 A. superficie y renta de todos los territorios bajo su control. con la generalización del método científico para estudiar todos los fenómenos de las ciencias naturales y sociales. Los egipcios anallizaban los datos de la población y la renta del país mucho antes de construir las pirámides en el siglo XXXI a.C. La información obtenida con este censo. biológicos y físicos. psicológicos. animales o ciertas cosas. con gran exactitud.C. Los reyes carolingios Pipino el Breve y Carlomagno ordenaron hacer estudios minuciosos de las propiedades de la Iglesia en los años 758 y 762 respectivamente. los investigadores aceptaron la necesidad de reducir la información a valores numéricos para evitar la ambigüedad de las descricpciones verbales. El trabajo del experto estadístico no consiste ya sólo en reunir y tabular los datos. sino sobre todo el proceso de interpretación de esa información. En China existían registros numéricos similares con anterioridad al año 2000 A. El primero contiene dos censos de la población de Israel y el segundo describe el bienestar material de las diversas tribus judías.en algunas partes.C. rocas. los resultados de éstas se pueden utilizar para analizar datos estadísticos. Un estudio similar sobre la tasa de mortalidad en la ciudad de Breslau. El desarrollo de la teoría de la probabilidad ha aumentado el alcance de las aplicaciones de la estadística. La probabilidad es útil para comprobar la fiabilidad de las inferencias estadísticas y para predecir el tipo y la cantidad de datos necesarios en un determinado estudio estadístico. titulado Observations on the London Bills of Mortality (Comentarios sobre las partidas de defunción en Londres).C. y en 1662 apareció el primer estudio estadístico notable de población. Desde los comienzos de la civilización han existido formas sencillas de estadísticas. para cobrar impuestos. Durante la edad media sólo se realizaron algunos censos exhaustivos en Europa. políticos. los babilonios usaban ya pequeñas tablillas de arcilla para recopilar datos en tablas sobre la producción agrícola y de los géneros vendidos o cambiados mediante trueque.defunciones comenzó en Inglaterra a principios del siglo XVI. En nuestros días.

sino sobre todo el proceso de interpretación de esa información. El registro de nacimientos y defunciones comenzó en Inglaterra a principios del siglo XVI. Los estadísticos se enfrentan a un complejo problema cuando. biológicos y físicos. Métodos Estadísticos La materia prima de la estadística consiste en conjuntos de números obtenidos al contar o medir cosas. la estadística se ha convertido en un método efectivo para describir con exactitud los valores de los datos económicos. El desarrollo de la teoría de la probabilidad ha aumentado el alcance de las aplicaciones de la estadística. la dificultad al compilar un censo está en obtener el número de habitantes de forma completa y exacta. Por tanto. psicológicos.cabo en 1086. en Alemania. por ejemplo. políticos. con gran exactitud. Por ejemplo. Para establecer una ley física. titulado Observations on the London Bills of Mortality (Comentarios sobre las partidas de defunción en Londres). con la generalización del método científico para estudiar todos los fenómenos de las ciencias naturales y sociales. En el siglo XIX. pronto se dieron cuenta de que las predicciones obtenidas utilizando éste método no utilizaban métodos correctos. fue utilizado por el astrónomo inglés Edmund Halley como base para la primera tabla de mortalidad. Al recopilar datos estadísticos se ha de tener especial cuidado para garantizar que la información sea completa y correcta. de la misma manera que un físico que quiere contar el número de colisiones por segundo entre las moléculas de un gas debe empezar determinando con precisión la naturaleza de los objetos a contar. Sin embargo. biológica o social. El trabajo del experto estadístico no consiste ya sólo en reunir y tabular los datos. La probabilidad es útil para comprobar la fiabilidad de las inferencias estadísticas y para predecir el tipo y la cantidad de datos necesarios en un determinado estudio estadístico. se recoge en el Domesday Book. utilizando determinadas distribuciones probabilísticas. el futuro crecimiento de la población se empezó a calcular basándose en el número anual de nacimientos por cada mil habitantes. sin que el número de defunciones tenga importancia. realizado en 1691. Los expertos en estudios de población comprobaron que la taza de crecimiento depende sólo del número de nacimientos. en los primeros estudios sobre crecimiento de la población los cambios en el número de nacimientos y el número de fallecimientos en un determinado lapso. toman una muestra para un sondeo de opinión o una muestra electoral. En nuestros días. sociales. El primer problema para los estadísticos reside en determinar qué información y cuánta se ha de reunir. los resultados de éstas se pueden utilizar para analizar datos estadísticos. El seleccionar una muestra capaz de representar con exactitud las preferencias del total de la población no es tarea fácil. Un estudio similar sobre la tasa de mortalidad en la ciudad de Breslau. y sirve como herramienta para relacionar y analizar dichos datos. los investigadores aceptaron la necesidad de reducir la información a valores numéricos para evitar la ambigüedad de las descricpciones verbales. el estadístico debe comenzar con un conjunto de datos y modificarlo basándose en la experiencia. Muchos conjuntos de datos se pueden aproximar. . En realidad. y en 1662 apareció el primer estudio estadístico notable de población.

Esto es debido a que solo realizamos los cálculos y el análisis con los datos obtenidos de una muestra de la población y no con toda la población. como por ejemplo. Esto nos lleva a la conclusión de que la estadística tiene aplicación en cualquier campo. Además nos permiten inferir el comportamiento de suscesos iguales o similares sin que estos ocurran. o extraer datos de archivos y/o de observaciones de campo. Por tanto. O bien saber que porcentaje de personas tiene vehiculos en una determinada ciudad. O bien saber que porcentaje de vehiculos azules hay en el mundo. Pues hacerlo con todos los datos o población en algunos casos seria muy dificil y en otros casos casi imposible o imposible. asi como realizar proyecciones del comportamiento de algún suceso. El valor obtenido utilizando este dato mejora al combinarlo con el dato del porcentaje de mujeres sin descendencia. lo cual no es posible determinar con . Mostraremos las ideas expuestas con un caso practico de la vida real. Cuanto más complicado sea. como por ejemplo si quisieramos saber el promedio de goles por juego de un equipo de futbol.Los estadísticos comprobaron que hay otros factores que limitan el crecimiento de la población. y dado que las mujeres sólo tienen hijos durante parte de su vida. y no del total de la población. más ayuda nos presta para resolver la situación. La estadística es una Ciencia que tiene como finalidad facilitar la solución de problemas en los cuales necesitamos conocer algunas caracteristicas sobre el comportamiento de algun suceso o evento. el número de nacimientos por cada mil habitantes sólo expresa la taza de crecimiento en el mismo período. y sólo el número de nacimientos por cada mil mujeres en edad de procrear sirve para predecir el número de habitantes en el futuro. donde necesitamos conocer el promedio de edad de los habitantes en todo el mundo (son muchas personas) y teniendo en cuenta que para ello es necesario aplicar encuestas. entrevistas. Analizando esto podemos ver que también simplemente puede ser muy sencillo. siempre le interesa saber con anticipación como será su resultado al finalizar el curso. a pesar de que se tienen los registros de todos los resultados de sus juegos. pues son pocos y conocidos es sencillo obtener los datos. Características que nos permiten conocer o mejorar el conocimiento de ese suceso. Es posible que sea muy dificil y complicado o que simplemente no se pueda conseguir los datos de todas las personas. son muchisimos los juegos y llevaria tiempo revisar todos los archivos para obtener esos datos. sin importar que tan sencillo o complicado sea. Esto nos da la posibilidad de tomar decisiones acertadas y a tiempo. como por ejemplo determinar el promedio de edad de los gobernadores de los Estados Unidos. la diferencia entre fallecimientos y nacimientos sólo es útil para indicar el crecimiento de población en un determinado periodo de tiempo del pasado. Por otra parte podría ser casi imposible o imposible en una situación. Dado que el número de posibles nacimientos depende del número de mujeres. Dificil porque podría tratarse de una situación donde el número de datos es muy grande. Que oportunidad tiene de aprobar el curso y con que calificación. el dato más importante que se ha de utilizar para predecir la población es el número de niños nacidos vivos por cada mil mujeres en edad de procrear. el cual se presenta con muchisima frecuencia: Un estudiante que toma un curso en la escuela.

esto seria una muestra. Tomar cinco calificaciones de los últimos diez cursos. y del 16 al 20 no reciben beca. Por tal motivo existen métodos para poder establecer o calcular de acuerdo a la situación cuál es el tamaño de la muestra adecuado. Pero con el uso de la estadística puede conocer de forma aproximada esta información. Esto no quiere decir que no pueda selecionarse otro tamaño de la muestra. Podríamos tomar un grupo de notas o datos. Pero este trabajo que necesita hacer con los datos de todas las calificaciones anteriores de ese curso. también se podría tomar algunos cursos al azar o aleatoriamente y de ellos algunas calificaciones también aleatoriamente. Si quisieramos conocer que oportunidad tenemos de obtener una beca.certeza hasta finalizar el curso. Tambien puede obtener un porcentaje de cuántos estudiantes obtienen una determinada calificación. Esto representaría una . llevaría muchisimo tiempo y trabajo. que seria la población. Para seleccionar la muestra existen varias maneras de hacerlo o métodos. B. De todas las calificaciones anteriores. El puede tomar las calificaciones (que son los datos) de todos los cursos anteriores y hacer un promedio (que seria la media aritmética). Esto quiere decir por ejemplo que en una clase de 20 estudiantes que estén ordenados por calificaciones en orden descendente: del 1 al 5 se becan por 5 años. Cuanto mayor sea el tamaño de la muestra mayor presición tendrán los resultados. Es muy posible que cuando tenga los resultados ya no le sirvan. de igual forma de acuerdo al total de lumnos del curso obtener su probabilidad de aprobar o no el curso. de forma aleatoria entre todos las notas de los cursos dictados anteriormente o población. Al 25% siguiente (categoría C) una beca por 1 año y al 25% restante (categoría D) no se le otorga ninguna beca. Al 25% que le sigue en calificaciones (categoría B) se le otorga una beca por 3 años. Otro aspecto importante podría ser dividir el grupo de estudiantes en cuatro categorías: A. pues ha terminado el curso y ya conoce con certeza sus calificaciones. También puede obtener un porcentaje de las personas que aprueban o no el curso y así conocer su oprtunidad. Como por ejemplo: tomar solo las del ultimo curso. solo se toman algunas. pues el tamaño de la muestra estará mas cerca del tamaño de la población y cuanto mas pequeña sea el tamaño de la muestra. Asi tendria una idea de cuales son en general los resultados que se obtienen en ese curso. Tomar cinco calificaciones de cada curso. Este está relacionado directamente con la precisión de los resultados que se obtendrán. Un aspecto importante es el tamaño de la muestra. Es allí donde tiene un papel importante la estadística. dejando a la suerte cuales serian las cinco calificaciones a tomar. Al 25% que saque mayores notas (categoría A) se le da una beca por 5 años. Pues supongamos se asignan tres tipos de becas a los estudiantes. Lo que luego le permitiria de acuerdo al número total de estudiantes en ese curso determinar cual sería su probabilidad de obtener una determinada calificación. Esto sería selección aleatoria. estará mas lejos del tamaño de la población por lo que los resultados seran menos precisos. C y D. del 6 al 10 se becan por 3 años. de la siguiente forma. del 11 al 15 se becan por 1 año. solo es mas recomendable.

Stath Graph. además los que están entre el primer cuartil y el segundo son el 25% categoría C. fundamentalmente las frecuencias de cada modalidad o valor. Que no son otra cosa que los valores correpondientes a la escala de calificaciones. Luego determinamos cuales son las calificaciones que establecen a que categoría pertenece el estudiante. condición inexcusable para que una gráfica sea correcta.muestra. La información puede describirse por medio de gráficos a fin de facilitar la lectura e interpretación de las variables medidas. Lotus Smart Suite. etc. Además. o bien en gráficas. 1. Esto es posible hacerlo calculando la Correlación entre las notas de los cursos. esto quiere decir saber si semantiene o no el mismo comportamiento en todos los cursos. Y el primer cuartil es representa la calificación por debajo de la cual hay 25% de estudiantes categoría D. el objetivo de las gráficas es que la información ´impacteµ directamente al lector y que se exprese el ´perfilµ de la distribución. Es decir el tercer cuartil representa la calificación a partir de la cuál están ubicados el 25% de los estudiantes de categoría A. gráfica de series de tiempo. Lo cual es importante para saber si los resultados obtenidos del análisis tienen validez o no. Las distribuciones de frecuencias se presentan en tablas como las anteriores. que no se intente . La representación gráfica se utiliza para facilitar al lector la comprensión de los resultados. Los actuales sistemas computacionales como Excel. pero no debe olvidarse el rigor en aras de la estética: las gráficas deben reflejar fielmente lo que tratan de representar. polígono de frecuencias. el segundo cuartil (igual a la mediana) es igual a la calificación en la cual hay 50 % de los estudiantes por encima y 50% por debajo. en las cuales se producen los cambios para cada categoría. A partir de la distribución de frecuencias se procede a presentar los datos por medio de gráficas.2 Representacion e Interpretacion de graficas Representación Gráfica. segundo cuartil y tercer cuartil. Esto puede de una forma más sencilla permitirle también tener una buena idea de que oportunidad tiene de obtener una determinada beca dentro de este curso. Las gráficas pueden ser tipo histograma. SAS-PC. pero no añade ninguna información sobre la que contendría una tabla de frecuencias. entre otros permiten obtener representaciones gráficas de diversos conjuntos de datos.1. Minitab. Pero además de esto también es importante conocer la regularidad o normalidad de las calificaciones en los cursos anteriores. Esto es equivalente a calcular los cuartiles: primer cuartil. los que están entre el segundo y el tercer cuartil son el 25% de estudiantes categoría B. Por ello la regla fundamental para la construcción de una gráfica es que:Las áreas (o longitudes) han de ser proporcionales a las frecuencias. con carácter general puede recomendarse que el pie de la gráfica explique convenientemente de qué se trata.

en trozos proporcionales a las frecuencias. para caracteres o variables CUALITATIVAS se pueden mencionar: El diagrama de barras o rectángulos. que también pueden aparecer con las barras horizontales y las modalidades situadas verticalmente. por esos puntos sueltos. en los que se representa cada modalidad sobre puntos o regiones de un mapa. como puntos sueltos. Así. ésta suele representarse horizontalmente con los valores negativos a la izquierda del cero y los positivos a la derecha. para variables CUANTITATIVAS los tipos de gráficas más importantes son los siguientes: Para variables discretas. lo que se consigue multiplicando los 360º del círculo por la frecuencia relativa de cada modalidad. en la ´recta de los númerosµ. sin mayor complicación (el rectángulo de una modalidad con frecuencia 7 tendrá altura 7 y así con todas). Si las bases de los rectángulos se dibujan todas iguales. la gráfica adecuada para las variables discretas es el diagrama de segmentos. cada uno de ellos adecuado a un cierto tipo de variables. Este tipo de gráficas es muy útil para comparar los resultados de una variable cualitativa en dos o más muestras. cabe citar los pictogramas. que refleja como sectores de un círculo las frecuencias de cada modalidad. los cartogramas. por lo que podemos clasificar las gráficas atendiendo a estos tipos. consistente en asociar a cada modalidad de la variable un rectángulo cuya superficie refleje su frecuencia: las modalidades se suelen situar en horizontal y la escala de frecuencias absolutas o relativas en vertical. Existen diversos tipos de gráficas. Los rectángulos suelen representarse separados en este tipo de gráficas. par cumplir la regla fundamental antes citada basta tomar como alturas de los rectángulos directamente las frecuencias. el diagrama de segmentos. que los detalles sean lo suficientemente visibles. para cumplir la regla fundamental de proporcionalidad basta hacer al ángulo de cada sector proporcional a la frecuencia. etc. en el que sobre cada valor de la variable se coloca . Las variables discretas toman valores aislados. - Hay otras gráficas menos frecuentes pero igualmente válidas para variables cualitativas. en los que se representa una misma figura para cada modalidad pero con tamaño proporcional a las frecuencias (pictograma por extensión) o una misma figura repetida tantas veces como sea necesario para reflejar la frecuencia de cada modalidad (pictograma por repetición).representar demasiada información en una sola gráfica. Por su parte. o los diagramas de superficie. generalmente un rectángulo. Como el radio es constante en un círculo. en los que se divide una figura geométrica. El diagrama de sectores.

a voluntad. de valores o de . y para respetar la continuidad de la variable. Estas variables cubren teóricamente con sus valores a la recta de los números reales. lo que se hace es agrupar los valores en intervalos y gráficamente se representan rectángulos yuxtapuestos cuyas bases descansan sobre la horizontal y cuyas alturas son tales que el área de cada rectángulo sea proporcional a la frecuencia de cada intervalo.1. que se llama polígono de frecuencias. esto se traduce en que casi siempre se maneja un gran número de valores distintos y ello hace poco adecuado para estas variables un diagrama de segmentos. Es lo mismo usar para ello frecuencias absolutas o relativas. de ellas trata otro apartado. - 1. A veces estos histogramas son llamados erróneamente diagramas de barras. de manera que ´infinitamenteµ junto a un valor se encontraría otro y no se producen ´saltosµ entre ellos. Las distribuciones de frecuencia son necesarias en el paso siguiente para expresar los resultados obtenidos mediante tablas estadísticas. ya que las dos clases de frecuencias son a su vez proporcionales por la propia definición de frecuencia relativa.3 Elementos fundamentales Los elementos fundamentales de la descripción de una variable son los que siguen en los apartados siguientes. a veces este polígono (que matemáticamente no es tal. En la práctica.1. dispersión y posición. puede dibujarse una línea quebrada que una los extremos superiores de los segmentos. Finalmente. lo que nos obligará a distinguir los tipos básicos de ellas. así se consigue que la abscisa (horizontal) refleje los valores y que la ordenada (vertical) exprese las frecuencias de la variable. porque tienen un tratamiento distinto en todo lo que sigue. como si se hubieran borrado los segmentos verticales. es decir. o al menos de un cierto intervalo. se hará hincapié en que lo que se estudia son en realidad las variables. Las gráficas estadísticas dan una información similar a la de las tablas. lo que se tiene como información de una variable en una muestra es un número finito n de datos. que se pueden resumir de esta forma: En primer lugar.4 Distribucion de Frecuencias Sea cual sea el tipo de variable. el resumen de la información se realiza mediante las medidas de centralización. 1. Junto con el diagrama de segmentos.verticalmente un segmento que tiene una longitud proporcional a su frecuencia. sino una ´poligonalµ) se representa sólo. por ello. El polígono de frecuencias también puede usarse junto con: El histograma o histograma de rectángulos. por ello podemos hacer el diagrama con frecuencias absolutas o relativas. pero de forma más directa. que es la gráfica adecuada para representar variables cuantitativas continuas.

con dos enfoques: . la proporción de veces que aparece esa modalidad o valor entre todos los datos de la muestra. si no. el número total de datos es n y.anotaciones sobre qué modalidad (cualitativas) o qué valor (cuantitativas) tiene cada elemento de la muestra. por tanto.074.Frecuencia relativa de una modalidad o valor de una variable es su frecuencia absoluta dividida entre el tamaño muestral. sería una tediosa lista de doscientos grupos sanguíneos: Grupo sanguíneo de una muestra de 200 personas. ello nos conduce al concepto fundamental de frecuencia. . y son la base sobre la que se construye cualquier resumen de los datos. diremos que 148 es la frecuencia absoluta de la modalidad ´superioresµ. Usando como ejemplo el grupo sanguíneo en una muestra de doscientas personas. diremos que la frecuencia relativa de la modalidad AB es 148/2000 = 0. ModalidadesFrecuencia absoluta O 85 Frecuencia relativa (%) 0. si la frecuencia absoluta 148 del ejemplo anterior corresponde a una muestra de 2000 personas. se debe resumir para que el lector pueda comprender bien los resultados. lo que se entiende mejor (la frecuencia relativa es la parte del total de datos que corresponde a cada valor o modalidad). salvo cuando el tamaño de muestra n sea muy pequeño. Naturalmente. Es muy habitual expresar las frecuencias relativas como porcentajes (multiplicándolas por cien) y entonces la frecuencia relativa del ejemplo sería 7. la tabla siguiente sirve para resumir lo que.5%) . ya que las absolutas suman n y estamos dividiendo entre n. la suma de las frecuencias absolutas de todas las modalidades o valores debe ser igual al tamaño muestral n. y de ahí su importancia. si en una muestra de la variable ´nivel de estudiosµ aparecen 148 personas con nivel de estudios ´superioresµ. Las frecuencias absolutas y relativas son aplicables a cualquier tipo de variable. además. a este conjunto de datos se le llama distribución y. es decir. Un primer y obligado paso de ese resumen de datos es el simple recuento de las repeticiones de un mismo valor o modalidad. dan lugar a conceptos muy importantes. pese a su simplicidad. Es claro que la suma de las frecuencias relativas de todas las modalidades o valores debe ser 1.4 % y la condición de la suma sería que deben sumar 100 %.Frecuencia absoluta es el número de veces que una modalidad o un valor de una variable aparece entre los datos de una muestra. como el de proporción.425 (42.

que son la suma de las frecuencias del valor o modalidad que se considere y de todos los anteriores.0% 77. dos. con las frecuencias absolutas. que son el número de visitas (ninguna.240 (24. y puede incluir también las llamadas frecuencias acumulativas. relativa 0 210 42.8% 100. y usando como ejemplo las que se recogen en la tabla.3. Visitas mensuales a una biblioteca de una muestra de 500 usuarios inscritos Valores Frec. absol. las frecuencias acumulativas no son definibles en el ejemplo del grupo sanguíneo.42 ó 42% es la frecuencia relativa del valor 0 de la variable.6% 3 24 4.6% 2 68 13.5%) 0. puede haber frecuencias acumulativas absolutas o relativas. que es una variable cualitativa pura.265 (26. En este segundo ejemplo.1.0%) 1. esta frecuencia absoluta 210 supone el 42% de 500.6% 91.0% 1 178 35. una. Veamos un ejemplo donde sí lo son.acumulativa 42.2% 96. Así. acumulativa 210 388 456 480 494 500 Frec.A B AB Totales 53 48 14 200 0.070 ( 7. relat.0%) 0. y en todo caso sólo tienen sentido con variables cuantitativas o cualitativas ordinales.000 (100%) Una tabla como esta se denomina distribución de frecuencias.8% 5 6 1. etc. No se deben confundir los valores de la variable. podemos observar que las frecuencias acumuladas del primer valor coinciden con las 210 y Frec.0% .2% Totales 500 100% Por lo que se refiere a las frecuencias acumuladas o acumulativas (es lo mismo). es decir. absoluta Frec.8% 4 14 2.4 y 5) en la muestra.2.0% 98. el número n de datos es 500 y la variable toma seis valores distintos (0. por lo que 0.) de cada persona a la biblioteca en ese mes. cuya tabla se encuentra a continuación. que son el número de personas cuyo número de visitas es uno determinado: que 210 sea la frecuencia absoluta del valor 0 quiere decir que de entre las 500 personas consideradas en el estudio 210 no han ido ninguna vez a la biblioteca en ese mes. de una variable cuantitativa discreta. que el valor de la variable es "cero" para ellas. por ejemplo. ya que hay que poder fijar cuales son los valores o modalidades ´anterioresµ.

lo que las haría inútiles por incomprensibles. que en una muestra hay 32 personas que miden entre 160 y 164 cm. por ejemplo. 1. se hacen agrupaciones de varios valores ( por ejemplo. 161. y gracias a los avances de la Informática que permiten almacenar muchos valores y trabajar con ellos rápidamente.1. para realizar cálculos sobre la variable. una pérdida de información con respecto a lo que sería una tabla detallada. 162. por las diferentes mediciones que se hacen en un proceso. Además. mientras que para tablas y gráficas es frecuente usar intervalos. En el caso de las variables continuas. sino que su utilidad queda reducida a la mejor comprensión de las tablas y a la elaboración de gráficos. el número de valores distintos que puede tomar la variable es infinito. se pueden encontrar tablas construídas agrupando los valores en intervalos cuando hay muchos valores entre el mínimo y el máximo. que es. respectivamente. 163 y 164 se pueden agrupar en el intervalo 160-164). Esto provoca que a menudo las tablas tuvieran que ser muy extensas. las frecuencias se dan para cada intervalo. pero no para cada valor de la variable. es demasiado grande y nuestra mente no logra resumirlos en forma tal que le trasmitan un conocimiento exacto de ese . podemos saber. ya que se han sumado todas las frecuencias absolutas y relativas. Todo ello significa que las ganancias en comprensión al hacer intervalos se corresponden necesariamente con pérdidas de información (se pierde el detalle) y por ello para los cómputos numéricos se usan los datos originales de uno en uno. por tanto. las estaturas 160.42% ya comentadas para ese valor. a partir del segundo renglón sí tenemos acumulación (388=210+178 y 77. y en la práctica puede ser bastante grande: piénsese que si medimos. pero no cuántas de ellas miden en particular 163 cm. En las tablas así. es muy conveniente que los intervalos tengan todos la misma longitud.. el concepto importante es entonces el de marca de clase o valor medio del intervalo. Por esta razón. por ejemplo. hay. para el tercer valor se suman tres sumandos y así sucesivamente.. Para evitarlo. teóricamente. por ejemplo. con muchísimos renglones. 162 en el caso citado del intervalo 160-164. lo que es lógico porque no hay ningún valor anterior con cuyas frecuencias sumarlas. de esta forma.6% = 42.6%).0% + 35.5 Organización de la información Porque la cantidad de información que muchas veces se tiene. con clases. Nótese que las últimas frecuencias acumuladas tienen que coincidir con el número de datos válidos total (en este ejemplo 500) y con el 100%. la estatura en centímetros de una muestra de personas adultas podemos tener fácilmente sesenta o setenta valores distintos. como hasta hace pocos años. las tablas con intervalos ya no se usan.

. 2) POLÍGONO DE FRECUENCIAS. leyendo y releyendo la información bruta sin que pueda llegar a conocer las características fundamentales del proceso en estudio. Si los datos se ORGANIZAN. Los gráficos más utilizados en Estadística son: 1) HISTOGRAMA. Mediante un gráfico se puede observar visualmente el comportamiento de un proceso. GRAFICACIÓN: presentar gráficos de los datos que han sido tabulados.proceso. Los gráficos son utilizados en Estadística porque un gráfico dice más que mil palabras. Una persona puede pasar. 3) OJIVA. horas y horas. PARÁMETROS: utilizar unos pocos datos representativos del proceso. se hace fácil conocer el comportamiento de un proceso. Hay tres maneras de ORGANIZAR la información: TABULACIÓN: presentar los datos del proceso en una tabla o cuadro.