You are on page 1of 122

ORGANIZACIN, CLASIFICACIN E INTERPRETACIN DE LOS DATOS COMO GUA PARA EL INGENIERO INDUSTRIAL

Departamento de Ingeniera Industrial Vicerrectorado Luis Caballero Mejas UNEXPO - Caracas - Venezuela Profesora Raquel Centeno Silva

INDICE
INDICE DE FIGURAS INDICE DE TABLAS PRLOGO I.
A) B) I).II).C) I).II).III).IV).V).D) E) I).II).III).F) G)

3 6 7 8 9 16 16 16 17 17 17 19 20 23 24 31 31 32 35 37 37 40 41 41 41 42 57

CONCEPTOS BSICOS SOBRE ESTADSTICA IDEAS SOBRE LA IMPORTANCIA, APLICACIN Y ORIGEN DE LA ESTADSTICA. CLASIFICACIN DE LA ESTADSTICA ESTADSTICA DESCRIPTIVA ESTADSTICA INFERENCIAL TRMINOS COMUNES EMPLEADOS EN ESTADSTICA UNIVERSO POBLACIN MUESTRA VARIABLES Y SU CLASIFICACIN UNIDAD ESTADSTICA MEDIDAS Y MEDICIONES RECOLECCIN DE DATOS INVESTIGACIN ESTADSTICA OBSERVACIN DE LA POBLACIN FUENTES DE DATOS ESTADSTICOS RESUMEN EJERCICIOS PROPUESTOS DISTRIBUCIONES DE FRECUENCIA SERIES ESTADSTICAS SERIES TEMPORALES SERIES ATEMPORALES DISTRIBUCIONES DE FRECUENCIA REPRESENTACIN GRFICA DE LAS DISTRIBUCIONES DE FRECUENCIA

II.
A) I).II).B) C)

D) E) F)

ANLISIS DE LAS DISTRIBUCIONES DE FRECUENCIA RESUMEN EJERCICIOS PROPUESTOS FORMAS TABULARES DE PRESENTAR INFORMACIN DESCRIPCIN DE LAS TABLAS ESTADSTICAS CLASIFICACIN DE LAS TABLAS ESTADSTICAS TABLAS DE REFERENCIA TABLAS ANALTICAS O DE RESUMEN TABLAS EN UN SOLO SENTIDO TABLAS DE CLASIFICACIN CRUZADA TABLAS DE MLTIPLES CLASIFICACIONES CONSIDERACIONES PARA OBTENER INFORMACIN DE LAS TABLAS ESTADSTICAS RESUMEN EJERCICIOS PROPUESTOS FORMAS GRFICAS DE PRESENTAR INFORMACIN TIPOS DE GRFICAS DIAGRAMAS LINEALES DIAGRAMAS DE BARRAS GRFICOS CIRCULARES PICTOGRAMAS CARTOGRAMAS RESUMEN EJERCICIOS PROPUESTOS

65 73 74 79 81 84 84 85 86 88 89 90 91 91 94 97 97 103 110 112 114 115 116 117 118

III.
A) B) I).II).III).IV).V).C) D) E)

IV.
A) I).II).III).III).IV).B) C)

AGRADECIMIENTOS V. REFERENCIAS BIBLIOGRFICAS

INDICE DE FIGURAS
FIGURA N 1 MAPA CONCEPTUAL DE LA ESTADSTICA FIGURA N 2 MODELO BSICO PARA LA ESTADSTICA INFERENCIAL FIGURA N 3 POBLACIONES A PARTIR DE UN UNIVERSO FIGURA N 4 SELECCIN DE UNA MUESTRA A PARTIR DE UN UNIVERSO FIGURA N 5 SELECCIN DE UNA MUESTRA A PARTIR DE UNA POBLACIN FIGURA N 6 TIPOLOGA DE LAS VARIABLES EN ESTADSTICA FIGURA N 7 NIVELES DE MEDICIN FIGURA N 8 BOSQUEJO DE UNA TABLA DE CONTEO FIGURA N 9 REPRESENTACIN DE UNA TABLA DE CONTEO LLENA FIGURA N 10 EJEMPLO DE UNA TABLA DE FRECUENCIAS FIGURA N 11 REPRESENTACIN GRFICA DE LAS FUNCIONES DE FRECUENCIA Y DISTRIBUCIN FIGURA N 12 PROBLEMAS CON LOS LMITES DE CLASE FIGURA N 13 COMPARACIN DE LOS MTODOS EMPRICOS FIGURA N 14 ORGANIZADOR GRFICO PARA FACILITAR LA CONSTRUCCIN DE DISTRIBUCIONES AGRUPADAS DE FRECUENCIAS 55 46 47 52 15 17 18 19 19 23 26 43 44 44

FIGURA N 15 RESOLUCIN DE UN EJEMPLO DE CONSTRUCCIN DE DISTRIBUCIONES DE FRECUENCIAS AGRUPADAS EMPLEANDO EL ORGANIZADOR GRFICO FIGURA N 16 SENSIBILIDAD DE UN HISTOGRAMA AL NMERO DE CLASES 56 60
3

FIGURA N 17 COMPARACIN DE LA FORMA DE LOS HISTOGRAMAS DEL EJEMPLO 60 FIGURA N 18 HISTOGRAMA DEL NIVEL DE CO EN EL AIRE CON FRECUENCIAS AGRUPADAS EN SEIS CLASES FIGURA N 19 DIAGRAMA DE TALLO Y HOJAS PARA LA CONCENTRACIN DE CO EN AIRE FIGURA N 20 POLGONO Y OJIVAS PARA LA CONCENTRACIN DE CO EN AIRE 62 63 61

FIGURA N 21 ILUSTRACIN DEL RANGO PERCENTIL ACOTADO ENTRE DOS VALORES 67 FIGURA N 22 DIAGRAMA DE PARETO PARA EL CONSULTORIO ODONTOLGICO 73

FIGURA N 23 ESQUEMA DE LAS PARTES FUNCIONALES DE UNA TABLA ESTADSTICA 82 FIGURA N 24 ESQUEMA DE TABLAS CLASIFICADAS EN UN SOLO SENTIDO FIGURA N 25 CARACTERSTICAS DE UNA TABLA DE CLASIFICACIN CRUZADA FIGURA N 26 ESQUEMA DE UNA TABLA DE CLASIFICACIN CRUZADA MLTIPLE FIGURA N 27 ELEMENTOS QUE COMPONEN UN GRFICO FIGURA N 28 BOSQUEJO DE LA CONSTRUCCIN DE UN DIAGRAMA LINEAL FIGURA N 29 VENTAS DE LAS COMPAA TVB FIGURA N 30 INFLUENCIA DE LOS EJES EN LOS DIAGRAMAS DE LNEA FIGURA N 31 EVOLUCIN DE LAS VENTAS DE LA EMPRESA TVB SEGN EL SEGMENTO DE MERCADO 102 87 88 89 95 98 99 100

FIGURA N 32 VENTAS TOTALES Y POR SEGMENTO DE MERCADO DE LA EMPRESA TVB, PERODO (1992-2002) 103

FIGURA N 33 COMPRA DE MATERIA PRIMA PARA RECICLAR POR LA EMPRESA TVB 106 FIGURA N 34 CAMBIOS PORCENTUALES DEL AO 2001 RELATIVO AL AO 2000 DE LA PRODUCCIN DE LA EMPRESA TVB, SEGN EL TIPO DE PRODUCTO FIGURA N 35 NMERO DE RDENES DE PEDIDO RECIBIDAS, ENTREGADAS E INSATISFECHAS, EMPRESA TVB AO 1997 108 107

FIGURA N 36 NMERO DE RDENES PRODUCIDAS POR LA EMPRESA TVB EN EL AO 1997 FIGURA N 37 COSTO DE PRODUCCIN UNITARIA DE CONDENSADORES TIPO A, EMPRESA TVB (AO 1997) FIGURA N 38 CONSTRUCCIN DE UN DIAGRAMA DE PASTEL 109 111 109

FIGURA N 39 DISTRIBUCIN DE LOS INGRESOS POR VENTAS SEGN PRODUCTO DE LA EMPRESA TVB, AO 2001 112

FIGURA N 40 COMPARACIN DE LA DISTRIBUCIN DE LOS INGRESOS POR VENTAS SEGN PRODUCTO DE LA EMPRESA TVB, AOS SELECCIONADOS FIGURA N 41 PICTOGRAMA DEL COSTO DE PRODUCCIN UNITARIA DE CONDENSADORES TIPO A EMPRESA TVB (AO 1997) FIGURA N 42 DENSIDAD POBLACIONAL EN VENEZUELA POR ENTIDAD FEDERAL 113 113 115 112

INDICE DE TABLAS
TABLA N 1 PPM DE CO EN AIRE TABLA N 2 LISTADO DE IDENTIFICACIN DE LAS CLASES NOMINALES TABLA N 3 FRECUENCIAS EN LA MEDICIN DE LA CONTAMINACIN DEL AIRE TABLA N 4 TABLA DE FRECUENCIAS Y PORCENTAJE ACUMULADO DE LA CONCENTRACIN DE CO EN AIRE TABLA N 5 FRECUENCIA DE RESPUESTAS NO ACEPTABLE TABLA N 6 DISTRIBUCIN DE FRECUENCIAS ORDENADAS PARA ANLISIS DE PARETO 72 69 71 56 57 57

PRLOGO
En la actualidad una de las habilidades ms importante que debe caracterizar al profesional de la ingeniera industrial es la bsqueda de la optimizacin de respuestas asertivas en el proceso de toma de decisiones, la cual debe ir acompasada por una excelente presentacin de reportes de carcter tcnico basados en informacin cuantitativa. Este proceso de consolidacin de respuestas es slo posible en la medida que el profesional se desarrolle vasta y profundamente en la estadstica. No obstante, mi experiencia docente apunta en sentido contrario a la afirmacin sealada, de hecho, es curioso observar en los estudiantes una actitud aptica y pasiva, y a menudo de rechazo, la cual se manifiesta en el alto porcentaje de retirados y repitientes, elemento acrecentado por la dificultad de asistencia regular que evidencian la mayora de los alumnos. Asimismo, el desconocimiento por parte de los estudiantes de la importancia y aplicacin de las tcnicas estadsticas, especialmente las relativas a la organizacin, clasificacin e interpretacin de la informacin, en conjunto con el vaco detectado en la bibliografa recomendada en los cursos de estadstica para ingenieros, han brindado la oportunidad al autor de presentar en un instrumento exhaustivo, en forma de texto, que permita al estudiante la identificacin con la herramienta estadstica como factor coadyuvante en la comprensin, instrumentacin e interpretacin de los fenmenos que atienen a los procesos relacionados con el campo de la ingeniera industrial. El texto se realiz con el propsito de concretar una herramienta autodidctica que promueva la responsabilidad del estudiante en gestionar sus propios aprendizajes, construyndolos, compartindolos y valorndolos. Este enfoque se considera nuevo en cuanto a la concepcin del aprendizaje, ya que se encuentra influenciada por las tendencias cognoscitiva y constructivista, lo que le permite al lector ejecutar un aprendizaje auto dirigido al mismo tiempo utilizar el material como una herramienta de apoyo auxiliar a las actividades de aula.

I. CONCEPTOS BSICOS SOBRE ESTADSTICA


Todo aquel que da los primeros pasos en cualquier campo del conocimiento debe procurar identificar el lxico, origen, aplicaciones y conceptos bsicos del rea, para poder comunicarse de manera efectiva y tener una idea clara de lo que le espera. Para los ingenieros industriales el campo de la estadstica es prioritario, porque est vinculado a la mayora de sus actividades profesionales, tal como descubrir al leer este captulo. La estadstica es una ciencia de abolengo, desde su nacimiento ha estado vinculado al Estado y, consecuentemente, al poder. El marco referencial estadstico es una habilidad fundamental de pensamiento que convierte a quin lo posee en un mejor ciudadano y en un profesional ms efectivo. Mediante el estudio de este captulo se pretende que Usted sea capaz de:

1. Definir que es estadstica reconociendo su importancia y aplicabilidad para el ingeniero. 2. Explicar que se quiere decir con estadstica descriptiva y estadstica inferencial. 3. Distinguir entre universo y poblacin, identificando muestras de estos grupos a travs de situaciones planteadas. 4. Identificar la unidad estadstica reconociendo las diferencias cuando est referida al universo, la poblacin o la muestra. 5. Definir una o ms variables explicativas de una unidad estadstica dada distinguiendo entre variables cualitativas y variables cuantitativas. 6. Distinguir entre una variable discreta y una variable continua. 7. Definir los trminos mutuamente excluyente y colectivamente exhaustivo. 8. Expresar el concepto de medida describiendo sus alcances y haciendo nfasis en las diferencias entre las escalas de medicin: nominal, ordinal, de intervalo y de razn y sus limitaciones operacionales basadas en el anlisis de las medidas de diferentes variables. 9. Expresar el concepto de dato estadstico, explicndolo brevemente. 10. Distinguir entre las fuentes primarias y fuentes secundarias de recoleccin de datos. 11. Seleccionar el mtodo ms conveniente para recolectar los datos en una situacin dada.

a) I DEAS SOBRE E STADSTICA .

LA

I MPORTANCIA , A PLICACIN

O RIGEN

DE

LA

Herbert George Wells, historiador y escritor ingls, coment hace un siglo que El pensamiento estadstico ser un da tan necesario para el ciudadano eficiente como la capacidad de leer y escribir. En la actualidad y despus de reflexionar acerca de los resultados de la revolucin industrial y de los desafos que representa la competitividad y la globalizacin a las organizaciones, se dira que el pensamiento estadstico es necesario tanto para ser un buen ciudadano como para tomar decisiones acertadas en cualquier mbito organizacional. Las aplicaciones estadsticas son necesarias en cualquier actividad que pueda desarrollar una persona, es ms, la experiencia docente del autor permite concluir que el pensamiento estadstico es primordial en el desempeo profesional de los ingenieros industriales, considerando que la toma de decisiones es su actividad principal. De hecho, el conocimiento cabal de la estadstica y la probabilidad es un poderoso auxilio para que los ingenieros diseen nuevos productos y sistemas, optimicen los existentes y para que evalen, desarrollen y mejoren los procesos de produccin. La estadstica ha elaborado ciertas tcnicas ajustadas a las peculiaridades de los distintos campos de aplicacin. En el mbito de las ciencias sociales (administracin, economa, educacin, sociologa, etc.) se han desarrollado, entre otros, los nmeros ndice (p.e. ndice de precios al consumidor1 (IPC), ndice Dow Jones2, etc.), las series de tiempo (son una coleccin de datos medidos cronolgicamente a lo largo de intervalos uniformes, por ejemplo: el precio por barril de petrleo exportado durante cada uno de los doce meses del ao 2003, el nmero total de alumnos inscritos en la UNEXPO por semestre desde el ao 2000 hasta la fecha, etc.), las tcnicas de anlisis factorial. Las tcnicas estadsticas para el diseo de experimentos son muy empleadas en las ciencias fsicas como biologa. En ingeniera, las aplicaciones de las tcnicas estadsticas abarcan un rango de mayor amplitud que incluye, entre otras: el diseo de experimentos para situaciones reales, el anlisis de riesgo enfocado en la gerencia y control de proyectos, la teora de colas para evaluar y mejorar la prestacin de servicios, la programacin dinmica estocstica y las cadenas de Markov para estudiar la evolucin de los sistemas en el tiempo, etc.

Es un indicador utilizado para conocer el impacto inflacionario midiendo la variacin de los precios a los cuales un consumidor adquiere cantidades determinadas de un grupo de productos seleccionados entre los extremos de un intervalo de tiempo de inters; habitualmente, la extensin del intervalo puede ser mensual, trimestral, semestral o anual. 2 Este indicador pondera los valores de las cotizaciones en la Bolsa de Valores de Wall Street para un grupo de acciones seleccionadas y se emplea para definir tendencias sobre el estado de la economa, al comparar los valores extremos del ndice en un intervalo dado de estudio, frecuentemente de un da de duracin. 9

Particularmente, dentro del campo de la ingeniera industrial destaca, sobre otros usos, las tcnicas estadsticas de control de calidad tales como: la estimacin de ndices de capacidad de procesos y los grficos de control, ya que la calidad, entre otros atributos, impacta profundamente la productividad, la competitividad y por ende la rentabilidad del negocio. Un proceso que mantiene un estndar elevado de calidad es inversamente proporcional tanto al volumen de materia prima desperdiciada como a la cantidad de horas hombre empleadas en detener y poner nuevamente a punto las lneas de produccin; adems los productos de calidad generan muchos ms clientes satisfechos y por lo tanto, leales. El impacto de las bondades del control de calidad, en la manufactura de cualquier producto o servicio, han generado un incremento en el inters que la industria ha puesto en la estadstica, perneando su influencia a todas las reas de conocimiento que coexisten en la empresa, sean ellas ingeniera, investigacin y desarrollo de nuevos procesos y productos, mercadeo o gerencia. El impacto ms significativo de la estadstica, como una herramienta objetiva para la gerencia cientfica, es el resultado de la conexin entre el anlisis de datos cuantitativos y los problemas de toma de decisiones. Las tcnicas de la estadstica descriptiva resumen la informacin disponible para la toma de decisiones, por ejemplo, el ingeniero supervisor de una lnea de produccin puede revisar los registros diarios de productos defectuosos y encontrar que ayer fue de un 3% mientras que hoy alcanz 5%, sin embargo, la teora estadstica va ms all y es necesaria para conocer si el incremento en la proporcin de tems defectuosos es una seal de deterioro en el proceso productivo o es simplemente el resultado de la variabilidad normal en el da a da de las operaciones. Est claro que las decisiones que se tomarn sern distintas al responder esa fundamentalsima interrogante; en el primer caso se implementarn acciones remediales urgentes, mientras que en el segundo no se actuar al nivel de influencia del supervisor, puesto que una inconformidad con resultados estadsticamente normales implicara acciones de mayor envergadura, tales como, una inversin en adiestramiento de los operarios, un rediseo de la lnea, etc. El aspecto ms relevante de una situacin como la descrita est en la necesidad de tomar una decisin en un entorno de incertidumbre, caracterizado por la variabilidad de las caractersticas analizadas y por la disponibilidad de informacin incompleta. Los mtodos estadsticos permiten, no slo tomar decisiones racionales y eficientes en dichas circunstancias, sino adems, fijar en un nivel preestablecido los riesgos de tomar decisiones incorrectas al confiar en informacin incompleta. La piedra angular sobre la que se cimientan la mayor parte de los conocimientos requeridos en las diversas aplicaciones enunciadas es la comprensin de la variabilidad y para comprender esta
10

manifestacin se requiere un slido pensamiento estadstico y un manejo adecuado de los mtodos estadsticos para la descripcin del fenmeno; por ello y dado que, cada momento en la naturaleza o en una organizacin es nico e imperan diferentes condiciones, todo colectivo que existe en la vida real muestra variabilidad y demanda de los ciudadanos para acostumbrarse a manejar el pensamiento estadstico y darle a los sucesos cotidianos la importancia de su magnitud relativa; sto es tan relevante que regularmente aparecen en prensa y otros medios de comunicacin, en artculos contenidos en revistas de difusin cientfica y en conversaciones profesionales y acadmicas, estudios estadsticos para cuya lectura crtica la mayora de los ciudadanos no estn capacitados, es ms Utts (2003) afirma: He encontrado siete tpicos incluidos en cualquier curso elemental de estadstica que son comnmente mal entendidos por los ciudadanos, incluyendo los articulistas que presentan estudios estadsticos al pblico. De hecho investigadores que presentan sus resultados en revistas arbitradas y reuniones cientficas interpretan mal varios de ellos La teora general de la estadstica es aplicable a cualquier campo cientfico en el cual se realicen observaciones, de hecho Deseda (1988) afirma: No existen ciencias cuyos fenmenos no pueden ser estudiados estadsticamente. Esta razn es la que provoca que la estadstica est incorporada en diversidad de planes de estudio tanto a nivel de pregrado como de postgrado y, cabe preguntarse: en que difieren los cursos de esta asignatura cuando se dictan para ingenieros, administradores, psiclogos, o educadores?, la respuesta es trivial e inmediata, los contenidos que se imparten son, esencialmente, los mismos; no obstante como los intereses de los profesionales formados en cada rea son dismiles, las aplicaciones y por lo tanto los ejemplos y ejercicios deben constituir la nica diferencia. Una definicin que subraya la utilidad de la estadstica fue propuesta por Cobb y Moore (1997): La estadstica es una disciplina metodolgica; existe no por s misma sino para ofrecerle a otros campos del saber un conjunto coherente de ideas y herramientas para tratar con datos. Las primeras aplicaciones de la estadstica fueron los asuntos de gobierno (recabar y presentar informacin); luego las utilizaron las compaas de seguros y los empresarios de juegos de azar (anlisis de riesgos y probabilidad); despus siguieron los comerciantes y los industriales (toma de decisiones), los educadores y cientficos sociales (formulacin de hiptesis). En la actualidad resulta difcil indicar profesiones que no empleen la estadstica, en parte, porque la asertividad de las decisiones que se toman est estrechamente entrelazada con la informacin disponible y gran parte de ella existe en forma numrica; por ello es fundamental disponer de mtodos y
11

herramientas que permitan procesar dicha informacin para sacar conclusiones vlidas dentro de un determinado nivel de certidumbre. La estadstica surge en parte de la interaccin entre la matemtica y las necesidades de anlisis de datos en diversas ciencias aplicadas; sin embargo se ha sugerido que la estadstica no es una rama de la matemtica sino una disciplina independiente, con su propio y nico origen, interrogantes y contenido [Bessant & MacPherson, 2002]. Tanto el trmino como la disciplina de la estadstica comparten un largo y enigmtico pasado, a pesar de que existen diversos autores interesados en la historia de la estadstica [Hald, 1990], [Pearson, 1978] y [Stigler, 1986]; no se ha logrado consenso acerca de su origen preciso; muchos mencionan las antiguas encuestas conducidas con propsitos fiscales o militares. Se sabe que, por ejemplo, los censos3 quinquenales de personas y propiedades en la Repblica Romana se sealan como precursores de la estadstica descriptiva. Ms an, se sabe que 2000 a 2500 aos antes de Cristo, los chinos y los egipcios efectuaron censos que eran simples inventarios elementales. Etimolgicamente, se ha descubierto que la palabra estadstica presenta una raz italiana, cuyo significado era el ensamblaje de informacin y hechos de inters para el estadista (statista) o pertenecientes al Estado (stato). Paralelamente, Portus, (1998) considera fundador de la estadstica a Godofredo Achenwall (1719-1772), economista alemn y profesor en la Universidad de Leipzig, quin escribi sobre el descubrimiento de una nueva ciencia que llam estadstica (palabra derivada de Staat que significa gobierno) y que defini como el conocimiento profundo de la situacin respectiva y comparativa de cada estado. El y sus seguidores estructuraron los mtodos estadsticos que se orientaron a investigar, medir y comparar las riquezas de las naciones. Una definicin en concordancia con esta idea es la siguiente: Estadstica en su acepcin ms comn, no es ms que una coleccin de datos numricos ordenados y clasificados segn un determinado criterio [Lobez & Casa, 1969]. Llegado a este punto resulta interesante acotar que tambin existi durante el siglo XVII una rama del conocimiento llamada Statistik, que concerna con los temas del estado y la historia constitucional, una especie de hbrido no numrico del oficio del estadista, que naturalmente no desemboc en la acepcin comn del trmino. Uno de los argumentos que se opone a considerar estas ideas pioneras como gnesis de la disciplina, se centra en que comenzar la historia de la estadstica haciendo referencia a los esfuerzos del mundo antiguo para registrar la informacin acerca de los Estados, es fallar en la comprensin tanto de la base del enfoque estadstico como de la naturaleza de su mtodo. De

Del latn censare, que significa valuar o tasar. 12

hecho, los mtodos estadsticos fueron ampliamente utilizados en astronoma desde 1830; sin embargo, aplicaciones similares no se hicieron un lugar comn en las ciencias sociales hasta el siglo X, a pesar de que se le acredita a Quetelet (1796-1874) varias contribuciones al desarrollo de la matemtica de las ciencias sociales durante el siglo XIX; de ellas, el aspecto central de la fsica social de Quetelet fue su nocin del hombre promedio (Lhomme moyen) que fungi como invencin metodolgica para suavizar las variaciones aleatorias y revelar regularidades que podran ser usadas como bases para un estudio social comparativo, ms vinculadas a este enfoque estn las definiciones propuestas por Haber & Runyon, (1972) La estadstica puede ser considerada como un mtodo para tratar datos numricos es un instrumento que se orienta a la recoleccin, organizacin y anlisis de datos numricos o de observaciones y por Yule & Kendall, (1954) La estadstica es la ciencia que trata de la recoleccin, clasificacin y presentacin de los hechos sujetos a una apreciacin numrica como base a la explicacin, descripcin y comparacin de los fenmenos. El anlisis descriptivo de las tasas de mortalidad y las causas de muerte, realizado por Graunt, en el Londres del siglo XVII, publicado en 1662, est considerado como uno de los primeros ejemplos de lo que se denomin Aritmtica Poltica y que en la actualidad se llama estadstica, definida por Pearson como: la aplicacin de la teora matemtica a la interpretacin de las observaciones masificadas. El cambio de enfoque, desde la mera enumeracin de hechos al razonamiento acerca de lo que los datos representan, son los albores de la estadstica inferencial, de hecho Cowles sugiere una definicin funcional: Ir ms all de los datos, realizar inferencias y esbozar conclusiones con un mayor o menor grado de certeza, en una forma ordenada y consistente es el objetivo de la estadstica moderna aplicada; fundamentalmente de acuerdo con esta aproximacin estn las siguientes definiciones: Consideraremos la estadstica como un conjunto de mtodos y tcnicas aplicables a realidades cuantificables, con el objeto de obtener indicadores que permitan diagnosticar dichas realidades [Deseda, 1988], Estadstica es el sistema que estudia los mtodos cientficos para recopilar datos, analizarlos, agruparlos y presentarlos en cuadros o grficos para su interpretacin [Portus, 1998] y Estadstica es la ciencia de aprender a partir de los datos [Kettering, 2000]. Existen autores que no logran consenso en un concepto nico y prefieren emplear una coleccin de acepciones; por ejemplo Leach, (1979) plantea: Generalmente se considera que la estadstica tiene dos funciones. Una es describir conjuntos de datos; la otra es ayudar a hacer inferencias. Los prrafos anteriores revelan dos significados distintos para el trmino estadstica, el primero de ellos concerniente a la coleccin de informacin numrica y no numrica acerca del Estado,
13

mientras que en un sentido ms moderno el trmino incluye tanto aspectos descriptivos como deductivos en el tratamiento de datos, pero con un nfasis en las conjeturas en oposicin del amontonamiento de datos. Tambin resulta evidente que el desarrollo y la aparicin de los mtodos estadsticos estn soportados en el trabajo de matemticos pioneros en la combinacin de observaciones y el uso de modelos probabilsticos en la inferencia, tal como se manifiesta en la definicin propuesta por Canavos, (1987): La estadstica es el estudio de los fenmenos aleatorios; sin embargo, la estadstica se distingue de la matemtica en que los estadsticos interpretan los nmeros en un determinado contexto. Tal vez lo ms interesante que se constata al revisar la contribucin filosfica de los distintos autores y el devenir histrico de la estadstica es que la difusin del pensamiento estadstico y sus tcnicas a diversos campos evidencia las mltiples influencias interdisciplinarias que le han dado forma al carcter nico de esta disciplina. Quizs el aprendizaje ms reiterado en esta resea histrica fue apuntado por Moore, (2000) al sealar que a pesar de que la disciplina ha evolucionado en forma y funciones, persisten dos caractersticas clave: datos e inferencia. No obstante, es extremadamente importante sealar que la inferencia por si sola es una funcin inocua, al menos en el contexto actual, porque no se infiere por conjeturar sino para tomar decisiones, para actuar. Ms cnsonas con este nfasis estn las definiciones de Spiegel, (1991): La estadstica estudia los mtodos cientficos para recoger, organizar, resumir y analizar datos, as como para sacar conclusiones vlidas y tomar decisiones razonables basadas en tal anlisis., Montgomery & Runger, (1996): El campo de la estadstica tiene que ver con la recopilacin, presentacin, anlisis y uso de datos para tomar decisiones y resolver problemas. y Lind, et. al., (2001): La ciencia de reunir, organizar, presentar, analizar e interpretar datos para ayudar a tomar mejores decisiones Leda la informacin precedente, se puede enunciar la siguiente definicin de estadstica que estar vigente a lo largo de lo expuesto en este texto:
Es tads tica es e l es tudio de los dive rsos m todos y tc nicas pa ra l a reco lecci n , o rgani zaci n y prese nta cin de da tos y s u a pli ca cin pa ra la c abal i nterp retaci n de e llos co nvi r tin dol os e n i nfo rmacin , co n la c ual se realiza n infe rencias y se e xtraen co nclusio nes cuyo nivel de ce rtidumb re puede co noce rse lo cual pe rmite to ma r me jore s decisiones .

A menos que los datos cuantitativos sean precisos, presentados apropiadamente, y correctamente analizados, la informacin numrica puede ser peligrosamente engaosa; es por esta razn que la estadstica como una metodologa concerniente a la recoleccin, presentacin y el anlisis de datos numricos es tan importante.

14

El clculo de medidas descriptivas que resuman grandes cantidades de datos estadsticos es un paso importante en la toma de decisiones basada en dichos datos; pero para que esas medidas estadsticas sean tiles a la gerencia deben ser analizadas de forma que se comprenda completamente su significado para un problema particular. Una vez propuesta una definicin de estadstica que compila la naturaleza distintiva de sus orgenes y los vnculos e influencias en otros campos del saber, en fin su identidad, significado y propsito, es una exigencia resumir las razones por las que es importante estudiar estadstica, ellas son: a) abundan los datos en todas partes, b) las tcnicas estadsticas son usadas por otros para tomar muchas decisiones que afectan nuestra vida y c) sea cual sea su futura lnea de trabajo tomar decisiones que estarn basadas en datos y sern mejores si domina el pensamiento estadstico. En sntesis, cada vez ms la estadstica viene a ser una herramienta insuperable e insuplantable en el manejo de la informacin, como consecuencia de que los sucesos que ocurren de manera comn o extraordinaria vienen descritos por un mayor nmero de elementos o componentes, y esta expansin de datos est cada da ms extendida en virtud de la proliferacin de elementos electrnicos de almacenamiento masivo de informacin. Podra ser til tratar de representar lo aprendido hasta aqu en una figura:

FIGURA N 1 MAPA CONCEPTUAL DE LA ESTADSTICA 15

b)

C LASIFICACIN

DE LA

E STADSTICA

Hemos descubierto a travs de la lectura de la seccin precedente que los dos objetivos fundamentales de la estadstica son la descripcin de datos y la produccin de inferencias a partir ellos; ello conduce a una categorizacin de la estadstica en: estadstica descriptiva o deductiva y estadstica inferencial o inductiva.

i).- Estadstica Descriptiva


La estadstica descriptiva es el conjunto de mtodos cuantitativos para organizar, resumir y presentar datos de manera informativa para obtener conclusiones sobre los mismos, sin que sobrepasen los conocimientos que proporcionan esos datos, es decir las conclusiones obtenidas a partir de las observaciones recopiladas no trascienden sobre un conjunto mayor de datos. Tiene por objeto fundamental describir y analizar las caractersticas del conjunto de datos para derivar explicaciones acerca de las peculiaridades de dicho conjunto y sobre las relaciones existentes con otros grupos de datos. Los procedimientos que se emplean permiten visualizar los datos, es decir, cuanto difieren los valores de los datos que conforman el conjunto observado, empleando algunas representaciones grficas que ilustran los datos o bien se emplean cuadros o tablas que permiten que el conjunto de datos se convierta en informacin legible. As mismo, se provee de medios que resuman las caractersticas ms importantes de los datos. La principal ventaja de la estadstica descriptiva es que al disponer de todos los datos objeto de anlisis no existe incertidumbre respecto a las determinaciones establecidas.

ii).- Estadstica Inferencial


La inferencia estadstica es el conjunto de tcnicas que se utilizan para establecer un juicio sobre todo un colectivo mediante un metdico procesamiento de un subconjunto de los datos contenidos en l. Las conclusiones que se obtienen sobrepasan los lmites de los conocimientos aportados por los datos en s mismos, debido a que no se examina al grupo entero, las inferencias no son del todo exactas y debe determinarse las condiciones bajo las cuales la generalizacin es vlida, precisando la probabilidad de que la inferencia sea correcta y esa incertidumbre, asociada a las conclusiones obtenidas, se mide empleando tcnicas estadsticas. En virtud de que al realizar estadstica inferencial se extrapola desde lo particular hacia lo general, el procedimiento que se sigue es inductivo y de all el otro nombre que comnmente recibe. La mayor parte de las interrogantes que requieren anlisis inferencial estn enfocadas en los siguientes propsitos: examinar las relaciones entre variables, determinar diferencias entre distintos grupos, predecir la
16

membresa a un grupo dado, probar modelos, predecir resultados y examinar cambios a lo largo del tiempo. La estadstica inferencial y la descriptiva estn estrechamente vinculadas y esta relacin se podra observar en el siguiente diagrama:

FIGURA N 2 MODELO BSICO PARA LA ESTADSTICA INFERENCIAL Adaptado de Dietrich & Schulze, 1999

Los mtodos de la estadstica inductiva son necesarios cuando no se pueden reproducir los resultados con la frecuencia o con el grado de precisin que se desea a causa de influencias

c)

T RMINOS C OMUNES E MPLEADOS

EN

E STADSTICA

Toda disciplina tiene su propia identidad y esa identidad se conforma a partir del lenguaje que se emplea y el significado que se adopta para ciertos trminos que se utilizan comnmente. Al comenzar a estudiar cualquier campo del saber es menester conocer el vocabulario especializado; en nuestro caso precisaremos las siguientes expresiones:

i).- Universo
Es el conjunto total de elementos recolectados que atrae nuestro inters, bien sean ellos personas u otros organismos vivientes, objetos inanimados, hechos, situaciones o abstracciones tales como el tiempo y el espacio.

ii).- Poblacin
Es el conjunto de todos los elementos que pertenecen al universo en consideracin y que presentan una caracterstica comn susceptible de ser estudiada. Ntese que de un determinado universo pueden obtenerse tantas poblaciones como caractersticas compartan y puedan ser observadas, contadas o medidas. Esta distincin entre universo y poblacin corresponde a una
17

interpretacin muy estricta y es un uso ms generalizado en la bibliografa emplear una interpretacin ms amplia, donde se consideran ambos trminos como uno solo. El conjunto de elementos que conforman la poblacin puede resultar finito si el investigador puede someter a medida cada uno de ellos; en cambio si el tamao de la poblacin, entendido como el nmero de elementos que abarca, es tal que con los medios de los que dispone el observador le es imposible valorar cada uno de ellos, considerando que la poblacin bajo estudio es infinita. Cuando se trabaja con datos poblacionales los resultados obtenidos del proceso de anlisis se denominan parmetros y poseen la condicin de ser nicos e invariables.

Universo de Vehculos Volskwagen Escarabajo R N A A A R N N R R A R A A N R N A


982 986 984 983 984 978 982 983 979 980 974 988 977 979 989 975 977 973

Poblacin: Color del VW


108932 214566 67954 111345 99854 209888 73514 44599 111387 212498 143567 177233

Poblacin: Peso del VW


100801 94321 39990 67854 301901 192100

Poblacin: Nmero de Kilmetros Recorridos por el VW


FIGURA N 3 POBLACIONES A PARTIR DE UN UNIVERSO

Apoyndonos en la figura se intentar ilustrar los conceptos de universo y poblacin. A travs de la caracterizacin de los miembros de un universo se pueden obtener tantas poblaciones como caractersticas distintas se deseen describir; tal como se ha mencionado previamente, en el ejemplo se han seleccionado tres variables de un universo finito: una cualitativa, observando el color de cada elemento del universo se distingue una poblacin finita denominada Color del Volkswagen. Otra variable cuantitativa discreta permite contar el nmero de kilmetros
18

recorridos por cada uno de los Volkswagen que integran el universo y obtener una segunda poblacin finita. Por ltimo, la medicin de una variable cuantitativa continua permite determinar otra poblacin llamada Peso de los Vehculos Volkswagen.

iii).- Muestra
Segn lo explicado en el inciso anterior, cuando el tamao del universo o de la poblacin lo amerita el investigador debe conformarse con estudiar una parte o porcin de ellos que sirve para representarla. Este subconjunto de elementos definidos sobre la base del universo especfico o de la poblacin determinada se denomina muestra. Es importante destacar, que la manipulacin de datos muestrales arroja resultados que se denominan estadsticos. Dado que la reproduccin de un dato individual casi nunca puede lograrse los estadsticos necesariamente variarn conforme cambien los datos que se seleccionan para la muestra. Esto significa que el valor real tiene cierta probabilidad de ser ligeramente menor o mayor al que estima un estadstico. Este rango debe reportarse junto con la evaluacin de cualquier valor estadstico y se denomina intervalo de confianza.

FIGURA N 4 SELECCIN DE UNA MUESTRA A PARTIR DE UN UNIVERSO

De seguido su representacin en trminos de poblacin y muestra: Rojo Amarillo Naranja Rojo Amarillo Rojo Amarillo Rojo Naranja Amarillo

Naranja Amarillo Naranja Amarillo Amarillo Amarillo Rojo Rojo Rojo Naranja

Poblacin Color de los Vehculos VW

Muestra Color de los Vehculos VW

FIGURA N 5 SELECCIN DE UNA MUESTRA A PARTIR DE UNA POBLACIN

19

En las figuras anteriores se aprecian dos tipos de muestra, una de ellas referida a los elementos que conforman el universo, y la otra tomada a partir de los datos estadsticos de los colores que conforman el conjunto poblacional seleccionado particularmente para este caso. En ambas circunstancias, se han seleccionado 5 elementos de un total de 15 unidades estadsticas, cuya manipulacin permitir extrapolar conclusiones acerca del universo poblacin si la muestra en cuestin es representativa. Para que la muestra sea representativa y, consecuentemente, las conclusiones que se establezcan sean vlidas, deben tomarse ciertas precauciones que van ms all del espectro de este trabajo, la ms importante es asegurar que cada elemento del universopoblacin a estudiar tenga la misma probabilidad de ser incluido en la muestra. No obstante las precauciones que se tomen las afirmaciones hechas a partir de datos muestrales siempre tendrn un grado de incertidumbre asociado a ellas. Si dos muestras son representativas, las conclusiones generadas a partir de la mayor de ellas son ms coincidentes con la realidad que las desprendidas de la otra muestra. En conocimiento de que se comete un error al extrapolar conclusiones a partir de una muestra, cabra preguntarse Por qu tomarla si se puede haber caracterizado a todos los elementos? La respuesta a la interrogante planteada se puede despejar si reflexionamos sobre dos aspectos que no emergen al observar la figura: a) qu sucede si el universo poblacin de inters no tuviera 15 unidades estadsticas sino 125.000?, y b) si la variable de inters fuese, por ejemplo, la resistencia del chasis al esfuerzo mecnico sera razonable deformar todos los vehculos para concluir acerca del universo poblacin? Qu utilidad tendra la informacin recabada? Ambos planteamientos ilustran las razones fundamentales para realizar muestreo; en ciertos casos el tamao del universo poblacin es tal que no resulta factible la inversin de recursos y tiempo para observarlos a plenitud y en otros casos los ensayos forzosamente destruyen al elemento lo cual no permitira su uso o venta posterior. Ninguna de las dos situaciones es razonable en el mbito empresarial, por ello, es preferible que las conclusiones a las que se lleguen contengan un grado de incertidumbre conveniente que haya sido definido a priori.

iv).- Variables y su Clasificacin


Es intuitivo asumir que dentro de un colectivo las caractersticas particulares que pueden someterse al anlisis y que son compartidas por los elementos de una muestra, poblacin o universo, no se presentan con la misma intensidad ni forma en cada uno de ellos y por ende se les puede asignar distintos valores, razn por la cual dichas caractersticas se denominan variables. Para el estudio de las variables, es necesario distinguir entre los valores posibles y los valores
20

observados, entendidos los primeros como todos los que tericamente puede exhibir una unidad estadstica y los segundos como aquellos obtenidos a travs de la observacin, conteo o medicin del colectivo con el que se est experimentando. Si el experimento en cuestin consiste en registrar el nmero que aparece cuando se lanza un dado al aire diez veces, los valores observados pueden ser: 3 veces uno, una vez dos, dos veces cuatro y cuatro veces cinco; no obstante, los valores posibles para esta experiencia son los seis representados en cada una de las caras del dado. Si los datos se obtienen estudiando una caracterstica que puede ser expresada mediante datos numricos por medicin o conteo constituyen variables cuantitativas; ejemplos de este tipo de variables lo forman el nmero de personas esperando a ser atendidas en una taquilla, el tiempo que tarda en ajustarse una maquinaria para comenzar a elaborar puertas de Astra despus de haber fabricado guardafangos de TrailBlazer, el saldo disponible en la cuenta corriente de una empresa o la vida til de una lmpara fluorescente. Las variables cuantitativas se subdividen en variables discretas y variables continuas. Son variables discretas las que slo toman un determinado nmero de valores correspondientes a nmeros enteros, tales como el valor que se obtiene al lanzar un dado, el nmero de obreros requeridos para operar una lnea de produccin a su mximo nivel, el nmero de alumnos inscritos en Inferencia Estadstica I el semestre anterior o el nmero de tanqueros cargados en Azuay los das lunes. Las mediciones obtenidas de una variable continua pueden, en principio, tomar cualquier valor tericamente posible entre dos valores dados; sto significa que los nmeros en que se transforman los datos continuos pueden ser enteros o no; ejemplos de variables continuas puede ser: el dimetro interno de las tuberas de acero comercial catlogo 40 de 1 producidas en el turno nocturno en Sidetur, la presin de operacin de la unidad de desulfonacin de la Refinera de Guaraguao, el tiempo de conexin a Internet para descargar un video, el peso de los clavos contenidos en un paquete, etc. Una propiedad importante de los datos continuos es que no es posible obtener dos valores exactamente iguales; si dos de los clavos que se pesaron exhibieran una masa de 4,5 g sera una seal de que el aparato de medicin no es lo suficientemente sensible; con una balanza ms sofisticada4 debe ser posible diferenciar entre los dos pesos. En el caso de los datos discretos es factible observar empates que no sean el resultado de un conteo deficiente, sino que significa valores exactamente iguales, por ejemplo el nmero de inscritos en las secciones uno y dos de la

Con una balanza analtica como la del laboratorio de qumica cuya precisin como recordarn es de hasta diezmilsimas de gramo uno de los clavos podra pesar 4,4968 g y el otro 4,5251 g, valores para los cuales el instrumento usado en primera instancia registrara 4,5 g. 21

asignatura estadstica y probabilidades en un semestre cualquiera puede ser, en ambos casos, 38 alumnos. Es interesante destacar nuevamente que a pesar de que las limitaciones de precisin en los instrumentos de medicin usados por el hombre interrumpen los valores posibles de la variable continua; sin embargo ello no las hace discretas, en todos los casos lo que define a las variables continuas no es el nmero que se observa, sino la escala terica subyacente. La distincin no es meramente filosfica porque los mtodos de procesamiento e interpretacin de los datos estn vinculados al tipo de variable bajo estudio, tal como se aclarar ms adelante. En general, dos son las formas de reunir datos acerca de las variables: las enumeraciones o recuentos que dan lugar a datos discretos y las mediciones a datos continuos. La exactitud en las medidas depende de las limitaciones propias del instrumento particularmente su apreciacin y de la pericia de quien lo emplea. La magnitud de un valor medido, cualquiera que este sea, se encuentra en algn valor del rango centrado en la medida con radio igual a la apreciacin del instrumento. Aclarado el punto, es conveniente recordar que los valores de las observaciones de variables discretas estn perfectamente definidos porque ninguna forma de contar dar un valor diferente, mientras que para las variables continuas se pueden realizar sucesivos afinamientos de los valores medidos aumentando la resolucin en la escala del instrumento de medicin.

Todas las caractersticas que definen a los elementos de una poblacin o una muestra no se ajustan a la descripcin de las variables cuantitativas, en particular si estas caractersticas son no numricas, de forma tal que cada elemento bajo anlisis slo pueda configurarse como poseedor o no de dicha caracterstica; se est en presencia de lo que se designa como variable cualitativa o atributo.

Cuando se estudian datos representados mediante variables cualitativas suele ser objeto de atencin cuantos de ellos o en que proporcin caen en cada categora. Ejemplos de variables cualitativas pueden ser sexo, estado civil, ausencia de defectos en los productos de una lnea de montaje, modelos de vehculos que se ensamblan en una fbrica, y el tipo de preguntas que se tratan de responder son: Cuntos hombres estudian ingeniera industrial en el Vicerrectorado Luis Caballero Mejas de la UNEXPO?, Qu proporcin de docentes solteros dictan asignaturas del rea de matemticas?, Cul es el porcentaje de botellas sin etiqueta que se despacharon desde la Planta de Polar en San Joaqun el mes pasado?, Cuntos Chevrolet Corsa
22

fueron comercializados en el Programa del Vehculo Familiar el ao 2002?, etc. Se resume la clasificacin de las variables mediante el siguiente esquema:

FIGURA N 6 TIPOLOGA DE LAS VARIABLES EN ESTADSTICA

Cada una de las formas de descripcin de las variables cualitativas y cada uno de los valores de medicin o enumeracin de las variables cuantitativas, se conocen en estadstica con el nombre de variantes, categoras o clases, siendo este ltimo el ms popular de los tres sinnimos.

v).- Unidad Estadstica


Es el sujeto en particular sobre el cual se est observando, contando o midiendo la variable, es decir cada uno de los elementos contenidos en la muestra o en el universo poblacin objeto de anlisis. Se desarrollarn algunos casos a manera de ejemplos clarificadores de los trminos definidos hasta ahora:
E J E M P L O : De las 24.000 botellas de Seven Up que salen, durante el turno de la maana, del

proceso de lavado en la Embotelladora de Pespsi Cola ubicada en Caucagua se realiza un estudio tomando 240 botellas al azar, encontrndose que existe un defecto (astillas) en 5 de ellas, dos defectos (astillas y sucio externo) en 3 de ellas y en el resto no se perciben defectos. Identifique: a) poblacin, b) muestra, c) variable indicando su tipo, d) valores posibles, y e) unidad estadstica.
RESOLUCIN:

a) b) c) d) e)

Las 24.000 botellas de Seven Up. Las 240 botellas seleccionadas aleatoriamente. Numero de defectos (variable cuantitativa discreta). Tiene tres valores posibles: cero defectos, un defecto y dos defectos. La botella de Seven Up.
23

E J E M P L O : La fbrica de Kraft Foods en Barquisimeto est sometiendo a un control de calidad

riguroso el peso de los empaques de galletas Oreo de 4 servicios; para ello se selecciona la produccin de un da y se le somete al proceso de control. Identifique: a) poblacin, b) muestra, c) variable indicando su tipo y d) unidad estadstica.
RESOLUCIN:

a) b) c) d)

La produccin de galletas Oreo en empaques de 4 servicios. La produccin de 1 da de galletas Oreo en empaques de 4 servicios. El peso (variable cuantitativa continua). El paquete de de 4 servicios.

E J E M P L O : El Ministerio de Produccin y Comercio desea presentar un informe acerca de la

calidad de los modelos beneficiados con el Programa del Vehculo Familiar (Accent, Brisa, Corsa, Energy, Fiesta y Terios); para ello entrevista a un grupo de cincuenta y cinco compradores del 2002 que fueron atendidos por garanta para saber cul modelo posean. Las respuestas se discriminaron en los siguientes modelos: Chevrolet Corsa (26 propietarios), Ford Fiesta (11 propietarios), Chrysler Brisa (4 propietarios) y Toyota Terios (14 propietarios). Identifique: a) poblacin, b) muestra, c) variable indicando su tipo, d) valores posibles, e) valores observados y f) unidad estadstica.
RESOLUCIN:

a) b) c) d)

Los propietarios de vehculos del Programa Familiar comprados en el 2002. Los 55 propietarios entrevistados. Modelo de vehculo (variable cualitativa) Cada uno de los seis modelos beneficiados por el Programa de Vehculo Familiar en el 2002: Accent, Brisa, Corsa, Energy, Fiesta y Terios.

e) f)

Los cuatro de los que se obtuvieron respuestas: Brisa, Corsa, Fiesta y Terios. El propietario de un vehculo beneficiado con el Programa Familiar.

d)

M EDIDAS

M EDICIONES

La observacin de valores o caractersticas se desarrolla a travs de un proceso de medicin. Se entiende por medicin la accin de asignar nmeros a ciertos elementos para cuantificar una propiedad; esta operacin implica comparar las variables con escalas de valores establecidas. Dicho nmero debe simultneamente representar la magnitud o intensidad de la caracterstica que se desea medir, as como ser susceptible de anlisis mediante su manipulacin en concordancia con ciertas reglas. La relacin que se establece entre las observaciones y los nmeros asignados
24

no siempre es evidente, por lo cual es preciso establecer el alcance o significacin de dicha asignacin antes de proceder al anlisis de los mismos por medio de manipulaciones u operaciones algebraicas, con la finalidad de obtener nueva informacin acerca del objeto que se est estudiando. La reflexin acerca del alcance de la asignacin numrica provoca que se distinga entre cuatro niveles de medicin, los cuales se diferencian entre s por la forma en que se adecuan a las propiedades de los nmeros y, por tanto, se diferencian en las operaciones que se puedan hacer con los nmeros asignados. Matemticamente hablando, los nmeros pueden clasificarse, de acuerdo a su uso, en: cardinales, ordinales y nominales. Un conjunto de nmeros que carecen de propiedades aritmticas se conocen como nmeros nominales y su misin es identificar algo mediante el smbolo numrico; ejemplos de este uso se encuentran en cualquier cdigo de clasificacin numrica, entre otros: las cdulas de identidad, los valores expuestos en las caras de un dado, el nmero de camiseta de los atletas de un equipo deportivo. Por el papel que representan estos nmeros no tiene sentido sumarlos, multiplicarlos e inclusive ordenarlos5. Sin embargo, se sabe que los nmeros son un cuerpo algebraico que cumple con la propiedad de orden que se enuncia a continuacin:
D E F I N I C I N : [Portus, 1998] Todo par de nmeros a y b cumple con una y slo una de las

relaciones siguientes: a<b a=b a>b Un conjunto de nmeros usados para abstraer la naturaleza de los objetos teniendo en cuenta exclusivamente el orden que ocupa, gracias a la propiedad que se defini previamente, se denominan nmeros ordinales. Casos tpicos, entre otros, resultan de sealar la posicin que ocup un piloto en cierto Gran Premio de Frmula 1 o designar el orden de atencin en una cola para el servicio de charcutera de un supermercado. Los nmeros adems del orden, pueden usarse para expresar cantidades, tales como: 20 centmetros, 20 grados centgrados, 20 kilogramos, 20 segundos, etc., en cuyo caso se conocen como nmeros cardinales y las variables representadas por ellos son apropiadas para aplicarle operaciones aritmticas.

Ntese que un jugador con el nmero 8 en un equipo de ftbol puede desempearse como defensa, medio campista o delantero; no es el ms joven no el mayor de ellos; el mejor no tiene el nmero ms bajo ni el ms alto; el nmero representa un cdigo para registrar la actuacin individual (amonestaciones, goles, etc.). En el caso de la cdula de identidad, an cuando los nmeros pueden ser ordenados, no tiene ni siquiera relacin con la edad de la persona, por que el correlativo asignado depende de la entidad federal de registro y no sucede al nacer, por lo que depende de la edad en que la persona fue identificada por primera vez. 25

Los niveles o formas en que se puede medir o clasificar una variable dependen de la naturaleza de la variable de forma tal que el conjunto de nmeros que sean asignados le sean representativos. Hay cuatro niveles de medicin en estrecha relacin con la clasificacin del conjunto numrico utilizado, por lo tanto, estos niveles indican los clculos que se pueden realizar para resumir y presentar los datos y las pruebas estadsticas que pueden llevarse a cabo. Dichos niveles, ordenados por el nivel de informacin que aportan de la observacin, son: nominal, ordinal, de intervalo y de razn, tal como se ilustra en Figura N 7 plasmada de seguido:

FIGURA N 7 NIVELES DE MEDICIN

Para la medicin o clasificacin de variables cualitativas se utilizan escalas nominales, dado que como se ha discutido previamente en este captulo, las observaciones de estos datos slo pueden ser clasificadas o contadas y no existe un orden particular para las distintas clases. Pueden ser tan simples como cuando ofrecen slo dos categoras o valores posibles, en cuyo caso, a las variables se les conoce como variables dicotmicas, el gnero es un ejemplo adecuado, si observamos a los estudiantes de ingeniera industrial de la UNEXPO-Caracas podemos discriminarlos segn su gnero, contando cuantas son del sexo femenino y cuantos son del sexo masculino. Estas categoras son mutuamente excluyentes, lo que significa que un individuo no puede pertenecer a
26

ambas simultneamente; adems las categoras empleadas son colectivamente exhaustivas porque todo estudiante que conforme la poblacin se puede clasificar en alguna de ellas. Los casos donde los valores posibles no estn ntidamente identificados desde un comienzo se suelen tratar incluyendo una categora denominada otros, por ejemplo si usted est interesado en construir un modelo para evaluar la necesidad de comprar un horno para pintar las piezas metlicas puede ser relevante determinar el nmero de das al ao que el horno es til; para ello una posibilidad es asignarle a la variable clima las categoras: i) soleado y seco, ii) soleado y hmedo y iii) otros climas, en virtud de que si llueve, existe una neblina fra o nieva son exactamente igual de perjudiciales para la pintura fuera del horno. Esta coleccin de categoras es colectivamente exhaustiva y mutuamente excluyente, dado que a cada uno de los das de operacin puede asignrsele una y slo una de las categoras propuestas; todos los eventos que pertenecen a una categora tienen una caracterstica igual (el mismo tipo de clima) y el nmero de ellos que pertenecen a una misma categora se llama frecuencia. Adems, las categoras no pueden ser ordenadas lgicamente, es decir, es indistinto que la primera de ellas sea soleada y seca o soleada y hmeda. Con los datos medidos mediante escalas nominales se pueden realizar pocos indicadores estadsticos, tales como: determinar la frecuencia (contar el nmero de elementos en una categora) con lo cual podemos calcular el porcentaje respecto al total de observaciones y establecer la categora modal (estipular la categora que presenta mayor frecuencia). Si una escala es susceptible de interpretarse en forma jerrquica, se convierte en una escala ordinal; una escala cuya medicin se efecta a nivel ordinal es una escala nominal para la cual existe la caracterstica especial que se ordena por rango; algunas aplicaciones pueden ser: clasificar los trabajadores segn el nivel de experticia en la preparacin de una estampadora para cambiar entre la produccin de una pieza y otra, que pueden agruparse en: alta, intermedia y baja; las respuestas a una pregunta de apreciacin de opcin mltiple: Cmo considera Ud. que funciona el proceso de inscripcin? (5) (4) (3) (2) (1) Excelente Bien Regular Mal Muy Mal

En estos casos podemos concluir que una apreciacin de cuatro puntos (bien) es mejor que una de dos puntos (mal); sin embargo, no podemos considerar que la opinin que se expresa como bien es dos veces mejor que la expresada con mal, a pesar de que un valor es el doble del otro. Ntese
27

que el uso del nivel de medicin ordinal exige orden entre las categoras antes de iniciar cualquier medicin y, por el mismo hecho de poder ordenar todas sus categoras, permite sumariar los datos mediante el clculo de las medidas estadsticas de posicin. El siguiente nivel de medicin es el nivel de intervalo; este nivel tiene todas las caractersticas del nivel ordinal, pero, adems la diferencia entre dos valores cualesquiera es de longitud constante y utiliza como cero un valor arbitrario que no significa la ausencia de la caracterstica. Quizs, el caso ms representativo de este nivel de medicin son las escalas habituales de temperatura. Un termmetro que marque 0C no representa la ausencia de energa sino que hace fro, adems diferencias iguales entre dos temperaturas estn representadas por diferencias iguales en los nmeros asignados, sin importar la posicin que ocupen en la escala. En este nivel de medicin el orden de las observaciones se efecta en concordancia con la cantidad de caracterstica que posean; las variables que se miden en este tipo de escala son cuantitativas y pueden calculrsele todas las medidas estadsticas a excepcin del coeficiente de variacin. El nivel de medicin ms alto es el nivel de razn, el cual tiene todas las caractersticas del nivel de intervalo, pero adems, el valor cero significa ausencia de la caracterstica y la relacin entre dos nmeros tiene sentido; por ello, las cantidades medidas con escalas de razn pueden compararse estableciendo proporcionalidades y el cociente entre dos datos que exhiban la misma intensidad en la caracterstica es independiente de la unidad de medida. Cuando la variable en estudio se mide a nivel de razn es susceptible de analizarse con todos los indicadores estadsticos; este tipo de variables se encuentra generalmente en las ciencias fsicas. Un buen ejemplo puede ser el peso de una persona; la balanza slo arroja un valor de cero en ausencia de masa y adems se cumple que; 5 kilogramos 11,0232 libras = = 2,5 2 kilogramos 4,4093 libras En cambio, un nivel de medicin de intervalos no mantiene las proporciones al cambiar de unidad de medida por ubicar el cero de manera arbitraria, por ejemplo:

100 C 212 F =4 = 2,7533 25 C 77 F


EJEMPLO:

Identifique en cada uno de los siguientes casos propuestos la variable y su tipo, y el

nivel de medicin que se est empleando: a) el cdigo de barras de los nuevos productos ingresados al almacn de un supermercado, b) los rangos que detentan en el ejrcito 100 encuestados, c) el precio de venta, en , de cada uno de los productos de una comercializadora, d) la distancia entre los ejes de 35 vehculos ensamblados por Mack de Venezuela, e) el peso de una
28

muestra de 59 baldosas tipo A elaboradas por Balgres, f) las profesiones de los egresados de la UCV en el ao 2002, g) la diferencia en el valor de la electronegatividad de Pauling de una muestra 7 no metales al compararlas con la del Carbono, h) el turno en que fueron manufacturadas 300 griferas de lujo en Fundicin Pacfico, i) el nmero de defectos de las 50 piezas incluidas en una muestra de la produccin de una suplidora de muebles modulares, j) la localizacin geogrfica de las cooperativas textileras beneficiadas con el Programa de Uniformes Escolares para el ao 2002, k) la temperatura, medida en Kelvin, a la que trabajaron los hornos de SIDOR en cada una de las ltimas 72 horas, y l) el nmero de horas mensuales dedicadas a mantenimiento en la Refinera El Palito en el ltimo semestre.
RESPUESTAS:

La mayora de las respuestas son directas y se resumen a continuacin en forma

tabular. Los casos polmicos se comentan al final de la tabla de respuestas Variable a) El cdigo de barras b) El rango en el ejrcito c) El precio de venta en d) La distancia entre ejes e) El peso f) Profesin g) La diferencia de electronegatividad h) El turno de manufactura i) El nmero de defectos j) Localizacin geogrfica k) La temperatura en Kelvin l) El nmero de horas Tipo de Variable Cualitativa Cualitativa Nivel de Medicin Nominal Ordinal

Cuantitativa Continua De Razn Cuantitativa Continua De Razn Cuantitativa Continua De Razn Cualitativa Cualitativa Cuantitativa Discreta Cualitativa Cuantitativa Discreta Nominal Nominal De Razn Nominal De Razn Cuantitativa Continua De Intervalo

Cuantitativa Continua De Razn

Entre los casos dignos de comentarios estn el: b, f, g, k y l. Los rangos del ejrcito son una escala nominal pero demuestran una posicin jerrquica, por lo tanto se establece un orden relativo a la autoridad de cada entrevistado. Las profesiones presentan un inconveniente interesante: al clasificar a los graduandos, algunos de ellos pueden exhibir ms de una titulacin, por ejemplo, ingeniero y abogado; esta particularidad puede llevar a pensar que los datos no pueden ser clasificados en categoras mutuamente excluyentes y, por ende, la variable profesiones no tendra asociado ningn nivel de medicin por violar esta condicin, que como se muestra en la Figura N 7 es comn a todos las escalas de medicin. Este inconveniente aparente es subsanado de forma inmediata cuando se entiende que un individuo que se haya graduado de abogado, ostentando previamente el ttulo de ingeniero, lo que hace es conformar una nueva
29

categora y, por lo tanto, existira un nivel de medicin, con la peculiaridad de que no se sabe a priori el nmero de categoras; en virtud de que las combinaciones de dos o ms profesiones elevara sustancialmente el nmero de categoras, podra considerarse establecer una categora tal como mltiples profesiones, con lo cual todos aquellos con por lo menos dos titulaciones se clasificaran en ella. La escala de electronegatividad de Pauling es en s una escala arbitraria, es decir, el cero carece de significado; pero en particular el conocimiento de sto no es necesario para establecer que el nivel de medicin, en el caso ejemplificado, es de intervalo, en virtud de que en el enunciado se establece una comparacin o diferencia con un elemento particular; en todos los casos en que sto sucede un dato cuya diferencia sea de 0,8 unidades, por ejemplo, no representa necesariamente el doble de uno con diferencia de 0,4 unidades porque el elemento de comparacin representa un
valor que es cero al establecer la diferencia pero que no es ausencia de la propiedad. Para

ilustrar lo que explicado previamente, coloquemos unos valores de electronegatividad segn la escala de Pauling. El Carbono tiene una electronegatividad de 2,6; el Nitrgeno una de 3,0; y el Oxgeno un valor de 3,4; y los tres se ajustan a lo expresado en el enunciado, veamos: ENC = ENitrgeno - ECarbono = 3,0-2,6 = 0,4 EOC = EOxgeno - ECarbono = 3,4-2,6 = 0,8
E OC 0,8 = =2 E NC 0,4
E O 3,4 = = 1,133' E N 3,0 E OC E O E NC E C

(1) (2) (3)

(4)

(5)

La relacin que se establece en (5) indica que esta escala no es de nivel de razn pues no conserva las proporciones; sto sucedera tambin si consideramos, por ejemplo, la diferencias de alturas respecto a un patrn o las diferencias en volmenes de venta respecto a un ao base. En el caso de la temperatura, a pesar de que se coment durante la exposicin de los niveles de medicin como un nivel de intervalo, es un hecho conocido que la escala Kelvin no es arbitraria y el cero en ella representa el cero absoluto, es decir, ausencia de energa. El ltimo de los casos que merece un comentario deliberado se refiere a las horas de mantenimiento; la confusin puede presentarse porque las horas son unidades de tiempo y el tiempo es una variable continua; sin embargo, est claro que el caso en cuestin, tal como est enunciado, tiene un propsito
30

enumerativo, es decir funciona como un contador y no es una medida de tiempo en el sentido que comnmente se le atribuye.

e)

R ECOLECCIN

DE

D ATOS

El propsito de esta seccin es familiarizar al lector con algunas de las fuentes principales de datos estadsticos e indicar alguna de las prcticas que deben ser observadas para que los datos recolectados en estudios estadsticos sean confiables. Como se ha sealado hasta ahora, el primer paso en un proceso estadstico es la obtencin de datos para que sean procesados, convirtindolos as en un insumo til para el anlisis y la toma de decisiones; el procesamiento abarca lo relativo a la ordenacin y presentacin de la data. Por ser el dato el principal insumo de los procesos estadsticos y el protagonista de la estadstica descriptiva, es necesario ocuparse brevemente del proceso de recoleccin.

i).- Investigacin Estadstica


Las investigaciones estadsticas son frecuentemente asociadas con las encuestas, de hecho estas ltimas se han convertido en una de las fuentes primordiales de datos estadsticos tiles para que gerentes pblicos y privados seleccionen acertadamente entre las diversas opciones de las que disponen. Realizar una operacin orientada a la recopilacin de informacin original sobre un universo poblacin es una tarea complicada que requiere de una planificacin y conduccin competente para obtener datos precisos; en muchos casos la complejidad y envergadura de la investigacin exige la colaboracin de equipos interdisciplinarios altamente especializados, tal como sucede en la elaboracin de los censos de poblacin de una nacin. En otras oportunidades la labor investigativa puede referirse a la medicin sistemticamente organizada de los resultados de mltiples experimentos estadsticos, entendindose como tales los estudios de un situacin creada en la que la poblacin es inexistente o mejor dicho hipottica; el objeto del experimento es establecer, por mtodos estadsticos, algunas caractersticas de la poblacin si sta existiera. Por ejemplo, los experimentos biolgicos, farmacolgicos, psicolgicos y mdicos donde se evala el efecto o impacto de alguna intervencin bajo ciertas condiciones que varan a voluntad del investigador. Por ltimo, las investigaciones pueden ser tan simples como la recopilacin de datos estadsticos obtenidos de informaciones provenientes de fuentes oficiales a nivel institucional o de publicaciones de organismos altamente especializados en estas materias. Todos los profesionales en contacto con datos estadsticos deben conocer ampliamente los problemas enfrentados su recopilacin para poder evaluar la influencia de esas limitaciones cuando sean
31

usados, a razn de lo cual se pretende dar una orientacin sobre algunos de los aspectos bsicos en el planteamiento de una investigacin, las cuales abarcan las siguientes fases:
) Objeto de la investigacin: comprende la respuesta a la pregunta: qu se investigar?,

precisando adicionalmente en qu condiciones, con qu medios, en que momento y en cul sitio se llevar a cabo.
) Unidad de investigacin: corresponde a la unidad estadstica y significa el elemento del

universo poblacin que origina la informacin, debe ser clara en su definicin, fcilmente identificable y mesurable.
) Recoleccin de la observacin: es la fase de observacin del universo poblacin que

permite obtener los valores de la variable que la definen.


) Procesamiento de la informacin: consiste en ordenar la informacin, filtrarla eliminando

posibles errores y analizarla mediante los mtodos y normas de la estadstica.


) Publicacin: es la etapa final de entrega de la informacin despus de revisada, ya sea para

uso propio o ajeno. Esta fase requiere que los datos se presenten adecuadamente. Al disear el plan de la investigacin, es decir, al organizar las actividades que son necesarias desarrollar para lograr el objetivo propuesto, deben definirse cada una de las actividades, prever posibles obstculos, y establecer los requerimientos de recursos y tiempo para llevarlas a cabo.

ii).- Observacin de la Poblacin


Muchos de los datos estadsticos que se requieren en una organizacin son datos internos, es decir, datos acerca de la produccin, venta y otras operaciones propias de la empresa. Esos datos internos se compilan en infinidad de registros bsicos que se realizan en las empresas, por ejemplo: el nmero de personas que solicit ayuda al Help Desk, la temperatura del horno en intervalos regulares de tiempo durante la jornada de operacin, las ausencias y horas extras laboradas por el personal, el costo de la materia prima y el momento de su recepcin, las caractersticas fsicas, qumicas o estructurales de la produccin, las comisiones y las ventas de cada departamento, etc. Por la naturaleza de los ejemplos citados, es intuitivo descubrir que los registros internos se llevan a cabo durante la ejecucin de las operaciones y que estos insumos se presentan en forma de reportes, de los cuales destacan los financieros y los de operacin. Estos ltimos son quizs los ms relevantes para el desempeo profesional de un ingeniero industrial, porque no slo contienen informacin en unidades monetarias, sino que versan sobre aspectos tales como: unidades manufacturadas, compras de material, gastos de mantenimiento, unidades defectuosas, fallas en maquinarias y operarios, tiempos de ejecucin de actividades rutinarias,
32

reportes de verificacin de estndares de calidad en materias primas y productos terminados, tiempo de espera para cumplir con pedidos, horas extras, volumen de trabajo en proceso (WIP6), disponibilidad de productos en inventario, tiempos de entrega de los proveedores de bienes y servicios, condiciones de operacin de las maquinarias, etc. Asimismo, los reportes se recaudan en una base temporal, pudiendo ser: diaria, mensual, trimestral, semestral o anualmente, dependiendo de su impacto en los resultados de la empresa y la frecuencia con que son llevadas a cabo las actividades que los originan. Muchos de estos reportes sirven para comparar con las metas empresariales lo que permite aplicar correctivos cuando es necesario o prever la atencin de nuevas actividades o mercados; por ello, pueden estar estandarizados o responder a requerimientos especiales y especficos demandados por los ingenieros, administradores y gerentes. La mayora de los datos y reportes internos en formato electrnico estn a la disposicin de quienes los necesitan para decidir, prcticamente con inmediatez, debido a los potentes y minuciosamente diseados sistemas de informacin tan comunes hoy en da. Adems de estos datos tambin son necesarios otros que escapan del alcance de la actividad interna de la empresa, particularmente buscados en la actualidad; son datos acerca de otras compaas similares para comparar el desempeo (benchmarking). Estos datos se obtienen de reportes y publicaciones, impresas o electrnicas, elaboradas por organizaciones

gubernamentales, asociaciones industriales, gremiales o comerciales, empresas especializadas en la recopilacin de informacin y el desarrollo de estudios estadsticos. Esta situacin permite identificar una de las formas ms comunes de diferenciar a los datos estadsticos segn su fuente. Cuando se utiliza un informe que contiene datos que fueron originalmente recopilados y publicados por cualquier ente distinto a quien lo publica, se habla de la utilizacin de fuentes secundarias u observacin indirecta; en cambio, si los que publican el reporte tambin acopiaron los datos se identifican como datos estadsticos de fuentes primarias o de observacin directa. Muchas publicaciones son fuentes primarias de algunos datos y secundarias de otros. Las fuentes primarias presentan ventajas respecto a las secundarias en aspectos como la presentacin y la cantidad de informacin, debido a que suelen mostrarse de forma ms completa y detallada, incluyendo explicaciones acerca de los mtodos utilizados en la recoleccin, lo que se convierte en un auxilio para la evaluacin e interpretacin de los datos. Adems, siempre existe la posibilidad de que aparezcan en una fuente secundaria errores que no existan en los
6

Se le conoce por sus siglas en ingles Work in Process, y significa la cantidad de pedidos ya comenzados y an no 33

datos originales, principalmente asociados al proceso de trascripcin7 e intercambio de datos. Estos errores en trascripcin, procesamiento y presentacin de los datos no son exclusivos de las fuentes secundarias, de hecho, el trabajo de trascripcin es una labor fundamental y muy delicada en el momento de coleccionar los datos, aunado a la imposibilidad de descartar que en su compendio se hayan empleado tcnicas inapropiadas de obtencin y la diversidad de datos de distintas fuentes que se compilan en las fuentes secundarias las hacen muy convenientes; de hecho este es el tipo de observacin que se usa al resolver los ejercicios y ejemplos de este texto. El profesional debe prestar mucha atencin al momento de evaluar la precisin y pertinencia de los datos estadsticos consultados o recabados para cualquier anlisis. Como se ha sealado hasta ahora, para recolectar los datos de un estudio estadstico, es necesario observar al universo poblacin que reviste inters, ya se ha expuesto el principal criterio para clasificar la tarea observadora. Sin embargo, existen otros juicios igualmente vlidos para clasificar las distintas formas de observacin, enumeracin y medicin del objeto a estudiar. Dependiendo de la concepcin del problema se puede establecer una tipologa en atencin no slo con la fuente, sino considerando tambin la periodicidad y la cobertura. Atendiendo a la fuente las observaciones se clasifican en directas e indirectas; segn la periodicidad puede ser continua, peridica o circunstancial; y en relacin con la cobertura pueden separarse en exhaustiva, parcial o mixta. A continuacin se desarrollan un poco las clasificaciones recin introducidas:
 Observacin Continua: es aquella que se lleva a cabo de un modo permanente, por ejemplo,

los registros contables de una empresa.


 Observacin Peridica: es la que se ejecuta en perodos de tiempo constantes; normalmente

la base temporal puede ser diaria, semanal, mensual, trimestral, anual, etc. El resultado de este tipo de observacin produce series estadsticas denominadas series de tiempo cronolgicas, sobre las cuales se realizan extensas actividades de investigacin por su relacin con los pronsticos.

terminados en un momento de tiempo determinado. 7 Muchos se preguntarn quin se va a poner a pasar los datos existiendo disquetes, CDs y mail? la respuesta es trivial, existen casos en que ello sigue siendo necesario por que los datos que se necesitan slo existen en un material impreso y la segunda razn est vinculada a que el intercambio electrnico no est exento de problemas de corrupcin de la informacin en el proceso de transferencia, ni de vulnerabilidad de la integridad de la data por errores del operario del software. 34

 Observacin Circunstancial: en este caso responde a una necesidad momentnea y

especfica que requiere una evaluacin espordica, por ejemplo, el nmero de pacientes diagnosticados con fiebre amarilla en el Estado Zulia en agosto de este ao. En lo relativo a la cobertura puede aclararse que:
 Observacin Exhaustiva: se denomina cuando la actividad se realiza sobre la totalidad de

los elementos que conforman el universo-poblacin; un ejemplo adecuado son los censos que elabora el Instituto Nacional de Estadstica (INE8). En virtud de que esta operacin se ejecuta cada diez aos, es tambin una observacin peridica; ms an por ser una encuesta que es administrada y publicada por el mismo organismo corresponde a una observacin directa. Es importante resaltar que cada investigacin estadstica podr ser clasificada a partir de todos y cualquiera de los criterios sealados.
 Observacin Parcial: como se argument anteriormente la observacin de los universos

poblaciones es poco prctica y no siempre factible. Por lo tanto, es ms comn centrar la investigacin en una muestra, dado que en este caso el investigador se fija en slo una parte de las unidades estadsticas, se clasifica como observacin parcial.
 Observacin Mixta: cuando un estudio se hace sobre una serie de caractersticas, es natural

que todas ellas no revistan igual atractivo. Una alternativa para enfrentar estos estudios, de forma que la informacin recabada justifique su costo, consiste en la adecuada combinacin de la observacin exhaustiva con la parcial, de tal manera que las caractersticas que se consideren no bsicas se observen mediante una muestra.

iii).- Fuentes de Datos Estadsticos


La existencia de publicaciones contentivas de datos estadsticos se remonta a principios de siglo. Como se ha explicado previamente en el texto, desde sus orgenes la estadstica ha estado vinculada a la recopilacin de informacin acerca de las actividades del estado y sus habitantes; entonces es natural que en todas partes del mundo funcionen organizaciones gubernamentales vinculadas a la recoleccin de datos estadsticos. La actividad de recaudar datos con distintas finalidades no est limitada al espacio de lo pblico; debido a los intereses particulares que demandan cierto tipo de informacin se conocen una basta cantidad de empresas cuya actividad est referida a la realizacin de estudios estadsticos particulares y a la comercializacin de bases de datos que renan estadsticas de inters general. Existen miles de fuentes impresas donde se

Anteriormente, responda al nombre de Oficina Central de Estadstica e Informtica (OCEI). 35

informan datos estadsticos recolectados peridicamente; lo ms comn es que esta literatura se presente en entregas mensuales o en tomos anuales. A pesar de ello, no siempre es una tarea sencilla disponer de los datos estadsticos abiertos al pblico, dependiendo del inters especfico de quin requiere los datos; lo ms oportuno es consultar una fuente de datos primarios estndar en la que sea razonable esperar que dichos datos aparezcan, en particular, si el objetivo es un estudio de seguridad industrial y se demandan datos acerca del nmero de accidentes laborales en las industrias manufactureras venezolanas con incapacitacin temporal, lo ms sensato es acudir a los registros del Ministerio de Trabajo y Desarrollo Social. Dada la extensin, facilidad y cotidianidad con la que se utiliza Internet como herramienta de bsqueda y publicacin de informacin sobre los diversos tpicos, se har nfasis en las posibilidades que brinda dicha herramienta. Entre otras facultades, Internet permite acceder a las pginas de organizaciones gubernamentales. En el mbito local se dispone de: 1.- http://www.bcv.org.ve/c2/indicadores.asp: Es la pgina de informacin estadstica del Banco Central que presenta los datos fundamentales acerca de aspectos econmicos del pas. 2.- http://www.ine.gov.ve/ine/indexine.asp: Es la pgina del Instituto Nacional de Estadsticas y permite el acceso online a diversos datos, principalmente demogrficos y econmicos. A nivel mundial, se obtienen con relativa facilidad datos acerca de Estados Unidos de Amrica en pginas como: 3.- http://lib.mansfield.edu/govstats.html: Pgina Web de la biblioteca "North Hall" de la Universidad de Mansfield; contiene datos estadsticos de varias reas socioeconmicas norteamericanas, documentos gubernamentales y trabajos de referencia, adems de un link para informacin internacional distribuidos en diez pginas individuales. 4.- http://devdata.worldbank.org/data-query/: Esta pgina del Banco Mundial permite observar 53 series estadsticas para los aos 1998-2002 de casi todos los pases del globo; algunas de ellas bien interesantes para diagnosticar la economa, tecnologa y desarrollo industrial de los pases. 5.- http://faculty.babson.edu/turner/fish/finecn.htm: Es una pgina que rene una serie de vnculos que dan acceso a una diversidad de datos econmicos reales recopilados por instituciones de gran prestigio internacional.
36

6.- http://globaledge.msu.edu/ibrd/busresmain.asp?ResourceCategoryID=10: Desde aqu se puede acceder a pginas con datos compilados por la CIA, British Petroleum, UNESCO, Banco Mundial y otras de reconocida validez por su solvencia profesional. Adems, cuenta con un servicio buscador. Como se puede apreciar en esta pequea muestra, existe una gran y diversa disponibilidad de datos estadsticos en lnea. Conectndose con servicios de bsqueda de pginas Web, esta lista se extendera ampliamente; queda de ustedes aprovechar los recursos que oferta el ciberespacio.

f) R ESUMEN
Este captulo le permiti conocer el origen, concepto, aplicacin e importancia de la estadstica adems de aclarar la mayor parte de los trminos que emplear de aqu en adelante. Conocer e identificar variables y sus niveles de medicin le permitir aplicar los conceptos que se desarrollarn en el siguiente captulo, adems, entender la naturaleza del colectivo en estudio, le significar comprender el alcance de la informacin que obtiene y las conclusiones que esboza. Se le dio a conocer fuentes de donde poder extraer datos estadsticos para realizar anlisis que soporten conclusiones que le interesen, se espera haber incentivado su curiosidad por conocer datos reales y ubicar fuentes confiables de aquellos pertinentes a su especialidad profesional. Sin embargo, en opinin del autor lo ms importante debe ser que usted reflexione ante su forma de observar el mundo y se de cuenta de las caractersticas importantes de los colectivos, que juzgue adecuadamente las informaciones que lea y escuche en trminos de su variabilidad y su validez estadstica, todo ello har de sus decisiones, acciones cada vez mejor tomadas y justificadas.

g)

E JERCICIOS P ROPUESTOS

1.- Se realiz un estudio acerca del tipo de transporte utilizado para ir al trabajo por sus residentes. La informacin obtenida de encuestar una muestra de ellos es la siguiente:
TIPO DE TRANSPORTE Auto Particular Taxi Metro Auto por Puesto Autobs Otros No. DE RESIDENTES 41 22 42 52 37 25
37

a) Cul es la poblacin? b) Cul es la muestra? c) Cul es la variable y de qu tipo es? d) Cul es la unidad estadstica? e) Cul es la escala de medicin utilizada?

2.- En cada caso indique, cul es la variable, el tipo y la escala de medicin: a) El nmero de catastro de los terrenos ubicados en Prados del Este. b) El volumen de los recipientes de los detergentes. c) El nmero de defectos de los lpices fabricados en Berol. d) El nmero de glbulos rojos por centmetro cbico de sangre de los pacientes del Hospital Vargas.

3.- El laboratorio de control de calidad de una empresa realiza un test de rapidez de accin de un pesticida de jardn, en 50 plantas infectadas. Los resultados fueron observados cada hora, habindose obtenido los siguientes datos del nmero de plantas totalmente libre de plagas despus de los lapsos que se indican: 3 horas, 3 plantas; 4 horas, 7 plantas; 5 horas, 10 plantas; 6 horas, 16 plantas; 7 horas, 9 plantas; 8 horas, 5 plantas. a) Cul es la poblacin? b) Cul es la muestra? c) Cul es la variable? d) De qu tipo es la variable? e) Cul es la escala de medicin utilizada?

4.- Se realiza un estudio en 120 hogares de la clase media de la ciudad X, para conocer el tipo de aceite o grasa usada en la cocina. Los resultados son los siguientes: oliva, 3 hogares; crtamo, 65 hogares; ajonjol, 21 hogares; maz, 14 hogares; compran aceite a granel sin especificar tipo, 7 hogares; grasas de origen animal, 11 hogares; grasas de origen vegetal, 6 hogares. a) Cul es la poblacin? b) Cul es la muestra? c) Cul es la variable? d) De qu tipo es la variable? e) Cuntas clases tiene la variable? f) Qu tipo de escala se ha utilizado en la clasificacin de la variable?

38

5.- Se efecta un censo de capacidad de las fbricas textiles existentes en el Municipio A, de acuerdo con el nmero de telares instalados en cada fbrica. Los resultados del censo son los siguientes: 3 telares: 7 fbricas; 4 telares: 2 fbricas; 5 telares: 8 fbricas; 6 telares: 6 fbricas; 7 telares, ninguna fbrica; 8 telares: 5 fbrica; 9 telares: 1 fbrica; 10 telares: 3 fbricas. a) Cul es la poblacin?; cul es la muestra?; c) cul es la variable?; d) de qu tipo es la variable?; e) cuntas clases tiene la variable?; f) qu tipo de escala se ha utilizado en la clasificacin de la variable?.

6.- En cada caso indique: a.- cul es la variable, y de qu tipo; b.- cul es la unidad estadstica; c.cul es la escala de medicin utilizada. a) Espectculo preferido por los habitantes del Estado Mrida. b) Catastro de los terrenos del Municipio Libertador. c) Peso de los interruptores producidos por la empresa XX, C.A. d) Nmero de expedientes procesados diariamente por la PTJ. e) Serial de las computadoras almacenadas en los depsitos. f) Nombre de las ciudades ms visitadas por los asiticos.

39

II. DISTRIBUCIONES DE FRECUENCIA


Cuando se realiza un experimento estadstico con la finalidad de describir y analizar algn fenmeno en un colectivo de inters, se realizan observaciones sobre los elementos que integran dicho colectivo. Si uno se concentra en determinar las veces en que se repiten cada una de las distintas observaciones, se pueden descubrir caractersticas y patrones que permiten extraer conclusiones importantes. La forma de clasificar y agrupar esas observaciones incide mucho en las conclusiones que se extraen. Una de las actividades fundamentales del ingeniero industrial se denomina anlisis de fallas, la mejor manera de abordarlo es realizando un estudio de la frecuencia de ocurrencia de las fallas, mediante un histograma de Pareto, esta herramienta se le presentar en este aparte. Mediante el estudio de este captulo se pretende que Usted sea capaz de:

1. Expresar el concepto de series estadsticas. 2. Describir cada una de las caractersticas de las series estadsticas. 3. Explicar el concepto de distribucin de frecuencias, destacando sus componentes. 4. Explicar los conceptos de: rango total, intervalo de clase, lmite de clase, lmite nominal,
lmite real, marca de clase, frecuencias: absolutas, relativa, porcentual y acumuladas.

5. Construir distribuciones de frecuencias de una serie estadstica agrupando sus datos ordenadamente segn su magnitud y tipo de variable. 6. Representar grficamente las distribuciones de frecuencias mediante histogramas,
polgonos de frecuencias y ojivas.

7. Calcular frecuencias relativas, frecuencias porcentuales, frecuencias acumuladas,


percentiles y rango percentil.

8. Reconocer la importancia y aplicabilidad de los histogramas de Pareto. 9. Realizar anlisis de Pareto a partir de las distribuciones de frecuencia acumulada.

40

a)

S ERIES E STADSTICAS

Tal como se estableci en el captulo anterior, la estadstica no se ocupa de hechos aislados, sino que tiene como objeto el estudio de los colectivos. Al llevar a cabo un estudio estadstico se observan, cuentan o miden una o ms caractersticas de las unidades estadsticas que conforman el universo-poblacin; estas actividades generan una masa de datos que deben ser organizados para disponerlos en alguna secuencia lgica que facilite su anlisis. Esta coleccin de datos numricos, obtenida durante la investigacin, clasificada y ordenada segn un determinado criterio, se denomina serie estadstica, conocida tambin como distribucin estadstica. La forma en que se observa al colectivo sujeto de estudio permite clasificar a las series estadsticas segn la periodicidad en la observacin, es decir, de acuerdo a la influencia del tiempo en la recoleccin de la data. Este criterio permite tipificar las series estadsticas en: a) series temporales o cronolgicas, y b) series de frecuencias o atemporales. Asimismo las series de frecuencia pueden discriminarse en: cuantitativas, cualitativas, y las series espaciales o geogrficas.

i).- Series Temporales


Son el conjunto de datos que se obtiene al registrar un fenmeno cuantificable de forma reiterada en diferentes momentos equiespaciados en el tiempo. Ejemplos de ellas pueden ser: a) utilidad antes de impuesto de Empresas Polar al 31 de marzo de cada ao en la ltima dcada, y b) cantidad promedio de piezas defectuosas producidas en cada ao por Sanitarios Maracay entre 1995 y 2002. Usted debera notar una sutil pero relevante diferencia que existe entre los ejemplos enunciados; mientras el primero de los citados est referido a un instante de tiempo particular (el ltimo da del mes de marzo), el segundo se refiere a un perodo de tiempo (un ao completo). Visto que es posible realizar cada observacin sucesiva, bien sea a lo largo de un perodo o para un instante particular, urge entonces, especificar la forma en que estn referidos los datos observados.

ii).- Series Atemporales


Son aquellas donde las observaciones se efectan en un mismo instante de tiempo o sobre un perodo en particular. En estas condiciones, y dado que el tiempo durante el cual se cuantifica el fenmeno es el mismo para todas las observaciones, el universo-poblacin que se selecciona proporciona una fotografa de una cierta situacin, es decir, una visin instantnea del patrn establecido por el fenmeno estudiado; ejemplos apropiados pueden ser: a) costo en Bs. del
41

inventario de materia prima perecedera de las empresas afiliadas a la CAVIDEA al primero de diciembre del 2002, b) ventas brutas en Bs. de paales Huggies por zonas de distribucin, y c) nmero de veces que se procesan 6, 7, 8, 9, 10, 11, 12 o 13 transacciones electrnicas diarias por la gerencia de B2B9 de Ford Motors de Venezuela. Una serie estadstica donde sea explcito que los valores dependen del espacio geogrfico, como la del segundo ejemplo, se conoce como serie espacial o geogrfica. Los otros dos ejemplos corresponden o pueden transformarse a lo que se denomina distribuciones de frecuencias, las cuales revisten una gran importancia en los estudios estadsticos y por ello se ahondar en detalles a lo largo del captulo.

b)

D ISTRIBUCIONES

DE

F RECUENCIA

Tal como se ha hecho hincapi hasta ahora, para analizar una variable y explotar la utilidad de la estadstica se hace necesario, en primer lugar, recopilar una cantidad de valores, realizando un experimento estadstico mediante el cual se obtiene una secuencia de observaciones, mayoritariamente representadas por nmeros, que se registran anotndose en el orden en el que suceden. Este registro conforma un conjunto de datos conocidos con el nombre de datos en bruto o no agrupados. Los datos en bruto deben ser ordenados y clasificados para obtener una descripcin informativa de las manifestaciones del colectivo; particularmente til es determinar el nmero de casos en que se presentan cada una de sus clases, es decir, la frecuencia de repeticin de las observaciones en el conjunto, para ello se emplea un arreglo tabular que contiene todas las clases o variantes de la variable y sus frecuencias respectivas. Esta construccin que indica como se agrupan las repeticiones o frecuencias de aparicin de los valores de una variable dentro de clases o categoras es denominada distribucin de frecuencias, trmino que se abrevia normalmente como distribucin. La conversin de datos observados en distribuciones de frecuencia constituye, a menudo, la aplicacin primaria del mtodo estadstico, visto que expresar los hechos observados en forma de distribuciones de frecuencia es el paso inicial en la mayora de las investigaciones. La determinacin de la frecuencia con la que ocurre cada variante puede llevarse a cabo a travs del estudio u observacin de toda la poblacin, en cuyo caso se trata de un censo o de un inventario. Las distribuciones de frecuencia tambin pueden emplearse con datos cualitativos o

Acrnimo proveniente del ingls Business to Business empleado para designar las transacciones nter empresariales realizadas en forma electrnica sin soporte fsico. Las transacciones entre empresas y consumidores, tales como la compra de software, libros, regalos, etc., consultas de cuentas bancarias por Internet se conocen como B2C por Business to Consumers. 42

categricos. En algunas aplicaciones, cuando la variable ha sido clasificada usando una escala
cuyo nivel de medicin es ordinal, la distribucin de frecuencia debe reflejar el ordenamiento natural de las categoras mediante una presentacin que respete una secuencia lgica para maximizar la claridad de la descripcin realizada y con ello su comprensin10. En las aplicaciones cuyo nivel de medicin es nominal el orden de las categoras

es arbitrario y depende del que presente los datos. Para elaborar una distribucin de frecuencias es necesario construir lo que se denomina una tabla de conteo, para ello se siguen estos pasos: 1) Hacer una tabla o lista de dos columnas, tal como esta: Clases Marcas

FIGURA N 8 BOSQUEJO DE UNA TABLA DE CONTEO

2) Determinar por inspeccin del conjunto de datos el valor mnimo y el valor mximo. 3) Definir las variantes o clases como cada uno de los valores posibles de la variable, comprendidos entre el menor y el mayor de los valores observados. 4) Colocar en la primera columna, ordenados de menor a mayor11, cada una de las variantes o clases. 5) Observar, uno a uno, los datos en bruto y registrar con una marca vertical (palito) en la clase que corresponda a cada observacin; para mejorar la visual de las marcas y facilitar el conteo se sugiere agrupar las marcas de cinco en cinco, haciendo el quinto registro tachando los cuatro previos. El resultado debera verse similar a:

10

Si los datos son cuantitativos tambin debe seguirse el ordenamiento natural, habitualmente, en orden ascendente, aun cuando puede hacerse de forma contraria. 11 El orden ascendente es el ms habitual, no obstante es absolutamente vlido emplear el ordenamiento descendiente para estos fines. 43

N de Conexiones Marcas 9 \\ 10 \\\\ 11 \\\\ \\ 12 \\\\ 13 \\\


FIGURA N 9 REPRESENTACIN DE UNA TABLA DE CONTEO LLENA

Normalmente, las tablas de conteo no aparecen en los informes estadsticos; sin embargo, perctese como el encabezado correspondiente a la columna donde se listan las clases se rotula con el nombre de la variable que define a la poblacin en cuestin. Una vez que se cuantifica el nmero de repeticiones de cada variante dentro del conglomerado de datos, se puede establecer la distribucin de frecuencias en un arreglo tabular similar, donde se sustituyen las marcas de conteo por el nmero que las identifica, conocido como frecuencia absoluta. Otra posibilidad muy empleada por su capacidad de sntesis son la denominadas tablas de frecuencia, que pueden incluir cinco columnas, la primera de ellas corresponde al ordenamiento de las clases, en la segunda se registran las frecuencias absolutas en el caso ilustrado en Figura N 9 esta columna contemplara una lista con los nmeros: 2, 4, 7, 5 y 3 las columnas subsiguientes contienen la frecuencia relativa, la frecuencia absoluta acumulada y la frecuencia relativa acumulada. La frecuencia relativa es el valor que se obtiene al dividir la frecuencia absoluta de una clase entre el nmero total de observaciones o tamao de la muestra; la frecuencia absoluta acumulada representa todas las frecuencias correspondientes a los valores de la muestra que son menores o iguales a cierto valor; se calcula sumando el valor de la frecuencia absoluta acumulada anterior con el valor de la frecuencia absoluta de la clase sucesiva; evidentemente para la primera de las clases no existe ningn valor previo y, consecuentemente, la frecuencia absoluta acumulada anterior es nula. La frecuencia relativa acumulada de cada clase es el resultado de dividir la frecuencia absoluta acumulada entre el nmero total de observaciones.
N de Conexiones Marcas Frecuencia Absoluta Frecuencia Relativa Frecuencia Absoluta Acumulada Frecuencia Relativa Acumulada

9 \\ 10 \\\\ 11 \\\\ \\ 12 \\\\ 13 \\\ Totales

2 4 7 5 3 21

2/21=0,0952 4/21=0,1905 0,3333 0,2381 0,1429 1,0000

0+2=2 2+4=6 13 18 21

0+0,0952=0,0952 0,0952+0,1905=0,2857 0,6190 0,8671 1,0000

FIGURA N 10 EJEMPLO DE UNA TABLA DE FRECUENCIAS

44

Hay quienes consideran que una tabla con seis columnas, como la mostrada en la figura previa, facilita el trabajo de construccin de la tabla de frecuencias al incorporar entre las columnas correspondientes a las clases y la frecuencia absoluta, la columna de marcas. Si cierto valor numrico no aparece en una muestra su frecuencia ser cero; por el contrario, si todas las observaciones corresponden a una clase en particular su frecuencia ser el tamao de la muestra
N. A partir de este hecho y la definicin de frecuencia relativa se puede establecer el siguiente

teorema:
T E O R E M A 1:

[Kreysig, 1973] La frecuencia relativa es al menos igual a 0 y a lo ms igual a 1.

En virtud del teorema 1, podemos inferir de forma inmediata que las frecuencias relativas pueden expresarse en porcentajes, una modalidad de uso ms comn al redactar informes analticos, simplemente multiplicndolas por cien. Porcentaje = 100hi Tomando una muestra dada de tamao N que consta de nc clases:
x1, x2,..., xnc

(1)

(nc N)

con sus respectivas frecuencias relativas:


) ) ) h1 , h2 , K , hnc
) Entonces se podr introducir la funcin de frecuencias de la muestra, h (x) , que representa

como estn distribuidos los valores de la muestra: ) ) hk cuando x = x k h (x) = k = 1, 2, L , nc 0 en caso contrario

(2)

En virtud de que las frecuencias no son ms que observaciones y que el conjunto de datos que conforma la muestra son todas las observaciones, forzosamente la suma de todas las frecuencias absolutas de una muestra coinciden con el tamao de la misma, lo cual permite establecer el prximo teorema:
T E O R E M A 2:

[Kreysig, 1973] La suma de todas las frecuencias relativas en una muestra es igual
) ) ) ) ) = h ( x1 ) + h ( x 2 ) + L + h ( x nc ) = 1

a 1, esto es,

h(x
k =1

nc

Lo que permite introducir la funcin de frecuencias relativas acumuladas de la muestra


funcin de distribucin de la muestra: ~ ( x) = H

h (t )
tx

(3)
45

En la ecuacin (3) se establece la relacin entre la funcin de frecuencia y la funcin de distribucin de la muestra, por lo tanto resulta evidente, que a partir de los valores de cualquiera de ellas pueden obtenerse los de la otra. Un aspecto interesante que surge al introducir las funciones definidas en las ecuaciones (2) y (3) es que como toda funcin, stas tienen una representacin grfica en el plano cartesiano, por ende, una forma de visualizar el comportamiento de la muestra; para el ejemplo de la Figura N 10, se tiene:
0,35
0,3333

1,00 0,90 0,80

0,30 0,25 0,20 0,15 0,10 0,05 0,00 8 9 10 11 12 13 14


0,0952

Frecuencia Relativa
0,1905

0,70
0,2381

Frecuencia Relativa Acumulada

0,60 0,50 0,40


0,1429

0,30 0,20 0,10 0,00 8 9 10 11 12 13 14

Nmero de Conexiones

Nmero de Conexiones

(a) Funcin de Frecuencia de la Muestra

(b) Funcin de Distribucin de la Muestra

FIGURA N 11 REPRESENTACIN GRFICA DE LAS FUNCIONES DE FRECUENCIA Y DISTRIBUCIN

Cuando el nmero de clases de la variable es muy grande la funcin de frecuencias y su representacin grfica se complica, provocando confusin en vez de claridad; por ello, puede resultar preferible la construccin de una distribucin o tabla de frecuencias agrupada, es decir, incluyendo en cada clase un rango de mediciones de la variable en vez de un nico valor. Se justifica la agrupacin para obtener una mejor descripcin, visualizacin y explicacin de los hechos. A razn de la simplificacin que ofrece el proceso de agrupamiento, siempre que se convierten los datos originales en una distribucin de este tipo, se pierden detalles sobre los datos iniciales. Sin embargo, esta prdida en la informacin es pequea si se le compara con la facilidad de interpretacin ganada al obtener una visin ms ntida del conjunto, lo que permite la revelacin de patrones y tendencias exhibidos por l. Adems, cuando los valores de la variable se resumen en una tabla de frecuencias agrupadas se pueden obtener caractersticas adicionales de las variables, aplicando ciertas tcnicas estadsticas, tales como las medidas de posicin y dispersin. Antes de comentar como construir una distribucin de frecuencias agrupadas, deben puntualizarse ciertos trminos que faciliten la sistematizacin del procedimiento, la comprensin del mismo y de sus resultados:
46

) Intervalo total: conocido tambin como recorrido o rango de la serie de datos y corresponde a

la diferencia entre el mayor y el menor de los valores observados. IT = xmayor xmenor (4)

) Clases: corresponden al fraccionamiento que se hace del intervalo total y comprenden un

rango de valores de la variable estudiada. La cantidad total de fracciones resultantes de la segmentacin del intervalo total se conoce como nmero de clases (nc) de la distribucin de frecuencias agrupadas.
) Lmites de clase: son los valores extremos del recorrido delimitado por cada clase, de esta

forma todas las clases poseen un lmite inferior (Li) y un lmite superior (Ls). La siguiente ilustracin permitir delinear el problema primordial al establecer los lmites de clase:

FIGURA N 12 PROBLEMAS CON LOS LMITES DE CLASE

En la prctica, al construir una distribucin de frecuencias agrupadas hay que tener cuidado
de que los lmites de las clases no coincidan con valores observados de la variable; ello para evitar cualquier ambigedad con respecto a la clase a que pertenece una observacin en particular. Si fijamos en el primero de los casos que se visualizan, existen problemas al tratar de

clasificar datos cuyos valores observados sean 13 15, debido a que son simultneamente el lmite superior de una clase y el inferior de otra, en consecuencia, se est en presencia de clases que no son mutuamente excluyentes. Sin embargo, esta situacin se presenta sin extraeza en la prctica diaria, resolvindose la claridad de la situacin a criterio del investigador, quien establece un intervalo semicerrado donde, habitualmente, el Li est incluido en el rango de datos
47

y simultneamente todos los datos de la clase son estrictamente menores que el Ls. Esta forma de proceder se identifica como clases con lmites nominales, puesto que la misin de los lmites superiores es funcionar como etiqueta que seala la frontera del intervalo; lamentablemente la ambigedad de clasificacin de los datos en las clases persiste para el lector de la investigacin. Otra opcin para resolver el problema se corresponde con el caso (b) de la figura, en donde se introducen dos lmites adicionales marcados con las letras B y C; en efecto, la expresin de los intervalos de clase as delimitadas son mutuamente excluyentes cuando los datos son discretos. No obstante, para datos continuos se sabe que no hay ruptura real y por ende existe una serie de valores que no pertenecen a ninguna clase. Las clases as definidas no sern colectivamente exhaustivas. La tercera imagen, propuesta en la Figura N 12, funciona tanto para datos discretos como continuos. Para datos continuos es necesario sealar una separacin arbitraria adecuadamente establecida por la precisin de la medicin; cuando se realiza el proceso de registro de los datos de una variable continua se obtienen una serie de valores con alguna separacin entre ellos, es decir, las observaciones discretizan a las variables continuas. Observe que diferenciar entre variable continua y discreta obliga a profundizar en el gnero filosfico y conceptual de la variable propiamente dicha y ampla la disertacin a los valores posibles y observados, punto donde no se ha alcanzado un consenso entre los diversos autores; para evitar ese conflicto se puede utilizar la expresin menor que, en el sentido en que es posible acercarse a un valor tanto cuanto se quiera pero sin llegar al valor en s; este recurso lingstico se logra operativamente utilizando como valor del lmite superior de una clase el valor nominal sustrayndole una unidad en la ltima cifra de apreciacin del instrumento empleado en la medicin. El lmite inferior de la clase subsiguiente ser el lmite superior nominal de la clase previa que ya no puede ser representado en ella. Con lo cual cada observacin pertenecer de manera inequvoca a una nica clase, es decir, se dispondr de clases mutuamente excluyentes y colectivamente exhaustivas. Pueden ahora puntualizarse algunas definiciones importantes y sus correspondientes relaciones matemticas en caso de existir:
) Intervalos de clases: es la distancia que existe entre el lmite superior y el inferior de cada

clase; es frecuente que los trminos intervalo de clase y clase se intercambien, sin embargo es importante resaltar que el intervalo es un atributo de la clase. ic = Ls Li (5)

No es necesario que los intervalos de clase sean iguales, excepto cuando la necesidad radica
en comparar una muestra cualquiera con otra previamente agrupada donde se exige la
48

misma longitud para los intervalos. Elaborar intervalos del mismo ancho es una prctica

comn, tanto por la simplicidad de la construccin de la distribucin y la facilidad de los clculos ulteriores, como por la mejora de la informacin visual en la distribucin de frecuencias. En cuyo caso la amplitud de los intervalos de clase viene dada al conocer el intervalo total y el nmero de clases, segn la expresin:

ic =

IT nc

(6)

En ciertas situaciones pueden ser necesarios intervalos de clase desiguales para evitar un gran nmero de clases vacas o casi vacas; estas circunstancias se suelen manifestar cuando el intervalo total presenta una longitud muy amplia. Un caso particular donde se hace patente esta necesidad sucede en aplicaciones donde existen ciertas observaciones cuyos valores difieren en cuanta del resto. Para estos casos se emplean intervalos de clase que, al menos tericamente, carecen de lmite superior o inferior. Este tipo de intervalos de clase se conocen como intervalos de clase abiertos y ocurren en la primera clase, en la ltima clase o en ambas. En cada aplicacin particular se debe elegir el intervalo ms adecuado para mostrar la informacin deseada.
) Frecuencia absoluta: es el nmero de ocurrencias, dentro de las observaciones, cuyos valores

estn comprendidos entre de los lmites de una clase, y se denota como fi. Anlogamente al caso de las distribuciones no agrupadas, el cociente entre la frecuencia absoluta y el nmero total de datos proporciona la frecuencia relativa (hi)
hi =
nc

fi N
i

(7) (8)

y en virtud del Teorema 2,

h
i =1

=1

Tambin para las distribuciones agrupadas de frecuencias se emplean las frecuencias acumuladas, la absoluta designada como Fi y la relativa denotada con Hi. En ambos casos expresan la suma de las frecuencias absolutas o relativas, respectivamente, de todos los valores de la variable precedentes y la suya propia.
) Marca de clase: es el valor central o punto intermedio del intervalo de clase, razn por la cual

tambin se le conoce como punto medio de la clase. Si se asume que los valores que estn incluidos en el intervalo de clase estn uniformemente distribuidos, entonces la marca de clase (xi) es el valor tpico ms representativo de todos ellos. Se utiliza, bsicamente, como insumo para el clculo de las medidas de tendencia central y de dispersin, as como para la
49

representacin puntual del intervalo de una clase y se determina mediante la semisuma de los lmites de la clase: xi = Li + Ls 2 (9)

La desventaja principal de las distribuciones agrupadas estriba en que la marca de clase puede discrepar de los valores observados de la variable; cuando sto sucede, los clculos derivados a partir de los datos de la distribucin tienen asociado imprecisiones conocidas como errores de agrupamiento. Por ello, los intervalos de clase se deben seleccionar de modo tal que las
marcas de clase coincidan con datos realmente observados.

La cuestin de cundo y cmo se debe presentar una distribucin de frecuencias en forma agrupada slo puede decidirse con la ayuda del criterio que va delineando la experiencia. En trminos generales, son preferibles las distribuciones que no contengan un nmero excesivo de clases y nuevamente, la interpretacin del adjetivo excesivo es relativa y se forma con la experiencia. Si se plantea como alternativa plausible el interrogante bajo las condiciones del tamao del intervalo no escapamos del problema, ya que puede establecerse que si los intervalos son muy pequeos (un nmero muy grande de clases) puede limitar su uso al dejar sin observaciones a algunas de las clases, mientras que si son excesivamente amplios (un nmero muy pequeo de clases) puede ocultar la distribucin real del conjunto de datos diluyendo los detalles. El nmero de clases depende del nmero de observaciones y de la dispersin de los datos y debe aumentar en funcin del nmero de observaciones que conforman la poblacin o la muestra a analizar. La seleccin, bien sea del nmero de clase o del tamao del intervalo,
constituye el problema bsico, al construir distribuciones agrupadas de frecuencias. La experiencia del autor revela que las distribuciones pueden englobarse en un nmero de clases que oscila entre 7 y 15. Yamane, (1974) tambin considera conveniente tener de siete a

quince intervalos, aunque destaca la ausencia de reglas fijas; Canavos, (1987) refuerza este criterio al sealar que en ningn caso el nmero de clases debe ser menor de cinco, y que generalmente no excede de quince. Portus, (1998) es un poco ms flexible al afirmar que la cantidad de intervalos de clase no debe ser mayor de dieciocho ni menor de cinco. Para establecer un nmero adecuado de clases en una aplicacin especfica existen distintas maneras de proceder. Montgomery y Runger, (1996) sealan que se obtienen buenos resultados
si se hace la seleccin del nmero de clases aproximadamente igual a la raz cuadrada del
50

nmero de observaciones12, Mendelhall y Sincich, (1997) establecen una regla emprica en

funcin del nmero de observaciones: Nmero de observaciones N Menos de 25 Entre 25 y 50 Ms de 50 Nmero de clases de 5 a 6 de 7 a 14 de 15 a 20

Existe un estndar DIN13, el nmero 55302 que dispone las siguientes recomendaciones en un entorno de muestras muy grandes: Nmero de observaciones N Hasta 50 Entre 50 y 100 Entre 100 y 1000 Entre 1000 y 10000 Nmero de clases No agrupar mnimo 10 mnimo 13 mnimo 16

Otra opcin determinstica disponible para estimar el nmero de clases lo constituye el Mtodo de Sturges, tal como lo expone Deseda, (1988), una vez conocido el nmero de observaciones consiste en redondear adecuadamente el resultado de aplicar la siguiente frmula: nc = 1 + 3.322 log10 ( N) (10)

Una ecuacin con resultados idnticos al Mtodo de Sturges que est establecida en la norma industrial europea CNOMO [PSA Peugeot, Citren, Renault, 1991] es: 10 log10 (N ) 3 Juran y Gryna (1980) proponen la siguiente ecuacin: nc = 1 + nc = 1,5ln(N) + 0,5 A partir de la ecuacin (12) el autor construye la siguiente tabla de recomendaciones: Nmero de observaciones N Nmero de clases Nmero de observaciones N Nmero de clases Entre 20 y 50 Entre 101 y 200 Entre 501 y 1000 6 8 10 Entre 51 y 100 Entre 201 y 500 Ms de 1000 7 9 Entre 11 y 20 (11)

(12)

Resulta evidente que ante la carencia de una norma taxativa, dos personas distintas pueden
decidir agrupar el mismo fenmeno en un nmero de clases diferente. En caso de mantener
12

Es importante notar que segn el ms flexible de los criterios establecidos en el prrafo precedente, Si N > 400, el nmero de clases permanece fijo en 20. Para el autor esta observacin es vlida a partir de N = 225, donde las clases se mantendrn constantes en 15. 51

alguna duda en cuanto a la cantidad definitiva de clases a utilizar, se recomienda excederse con un nmero de clases sobredimensionado de intervalos reducidos para clasificar las cifras. El razonamiento detrs de esta prctica gravita en que siempre es posible hacer

agrupaciones inmediatas de las frecuencias en intervalos mayores, mediante la unin de los intervalos que se dispusieron originalmente; en cambio, si se opta por pocos intervalos grandes al principio, no pueden ser subdivididos sin realizarse nuevamente todos las cuentas. Cualquier lector podra resultar abrumado ante el abanico de posibilidades existentes para establecer un adecuado nmero de clases; por ello, se presenta la siguiente grfica con intencin de comparar los resultados de las diferentes herramientas:
Mont. & Runger Ajustado Sturges CNOMO Juran

21 Nmero de Clases (nc) 18 15 12 9 6 3 0 10 100 1000 10000

Nmero de Observaciones (N)

FIGURA N 13 COMPARACIN DE LOS MTODOS EMPRICOS

En la Figura N 13 se puede notar como todos los mtodos son proporcionales al nmero de datos que se consideran; sin embargo, la regla emprica propuesta por Montgomery & Runger crece a mayor velocidad que las otras. Una caracterstica relevante que no se observa en la figura, respecto a la regla en cuestin, es que la misma presenta problemas de adaptacin a los criterios generalmente establecidos, dado que puede fijar un nmero de clases menor que cinco (5) o mayor que veinte (20), por ello la curva que representa a esta regla, se rotula como ajustada en virtud de que para valores de N mayores de 400 se fij el nmero de clases como 20, independientemente del resultado que arroja la ecuacin. La coincidencia de la cantidad de clase establecidas por el Mtodo de Sturges y la regla CNOMO es natural si observamos que el coeficiente que afecta el logaritmo es virtualmente el mismo 3,322 y 3,333 respectivamente.

13

Siglas de la oficina de normalizacin alemana (Deutsches Institut fr Normung), cuyas regulaciones son ampliamente utilizadas alrededor del mundo. 52

Tambin resulta interesante percatarse que el resultado obtenido empleando cualquiera de las ecuaciones no es compatible con las tablas de recomendaciones establecidas en la normas DIN las sugeridas por Montgomery & Runger. Una vez pormenorizados los aspectos relevantes de la conversin de datos en bruto en distribuciones de frecuencia, se puede establecer un procedimiento especfico para organizar
conjuntos de datos en distribuciones agrupadas; este ser:

1. Ordene los datos en forma ascendente. 2. Mediante la ecuacin (4) halle el intervalo total. 3. Si no est establecido por el problema, seleccione el nmero de clases, puede hacerlo de forma arbitraria, o empleando cualquiera de los criterios referidos previamente. 4. Aplicando la ecuacin (6) obtenga el intervalo de clase. Si como suele ocurrir el nmero determinado no es un entero redondee al entero superior, en cuyo caso debe ajustarse el rango mediante las expresiones: = ic nc I ajustado T IT Residuo = I ajustado T (12) (13)

El residuo se distribuye entre los dos extremos del rango de la forma ms simtrica que sea posible. 5. Decida si emplear lmites nominales o lmites reales para definir las clases. Si los lmites son nominales puede proceder directamente a establecer las clases; en caso de emplear lmites reales necesitar: 5.1. Fijar el lmite inferior de la primera clase, que concuerde con el menor valor observado, salvo que haya sido necesario restarle alguna proporcin del exceso. 5.2. Obtener el lmite superior de la primera clase incrementando el valor del lmite inferior, en una cantidad que corresponda al intervalo de clase a utilizar, habindole restado la menor unidad de apreciacin del instrumento de medicin. Por ejemplo, si el instrumento es un contador la apreciacin es una unidad; si es una regla estndar la apreciacin es un milmetro; en la balanza analtica de un laboratorio es una diezmilsima de gramo, etc. 5.3. Establezca como lmite inferior de la siguiente clase el valor consecutivo al lmite superior de la clase previa. Halle el lmite superior repitiendo el paso anterior y reitere este procedimiento hasta definir todas las clases. 6. Prepare una tabla de conteo a partir de las clases establecidas (ver Figura N 9). 7. Llene la tabla de frecuencias siguiendo el ejemplo de la Figura N 10.
53

Este algoritmo, tal como todos los de aplicacin prctica que se estudian en este texto, se convierte, para su facilidad, en un organizador grfico. La idea que subyace en ellos es establecer una pauta para lograr el objetivo final mediante la consecucin de todos los objetivos intermedios o prerrequisitos. Consta de seis tipos de elementos: (a) cajas de registro; son cajas con dos zonas, la superior sombreada contiene una instruccin, la inferior vaca es para escribir el resultado de ejecutar la instruccin, (b) cajas de instrucciones; no tienen espacio para registrar informacin porque la extensin de la misma amerita que se registre en una hoja aparte, (c) valos de proceso; son similares a las cajas de instruccin, slo que se refieren a la ejecucin de algn algoritmo expuesto previamente, (d) rombos de decisin; se incluyen cuando existen procedimientos alternativos que dependen de algn criterio cuya aplicacin origina respuestas del tipo si no, (e) ciclos de repeticin; son comentarios con una flecha circular que los interconecta consigo mismos; cuando aparecen indican que el valo de proceso o la caja de instruccin adyacente debe ejecutarse tantas veces como se indique y (f) flechas direccionadas; que indican el camino a tomar desde cualquier parte del diagrama. La forma de leerlos es desde arriba hacia abajo y las
claves son: " Las cajas a las que no les ingresa flecha representan datos del problema que pueden leerse directamente del enunciado, de una tabla o de un grfico. " Para resolver una caja a la que le ingresen flechas se deben haber llenado previamente las cajas donde dichas flechas se originan.

Para la construccin de distribuciones agrupadas de frecuencia el organizador grfico que resume y sistematiza; el procedimiento es:

54

FIGURA N 14 ORGANIZADOR GRFICO PARA FACILITAR LA CONSTRUCCIN DE DISTRIBUCIONES AGRUPADAS DE FRECUENCIAS

Con el objeto de aclarar las tcnicas hasta ahora expuestas, procedemos a desarrollar el ejemplo que se presenta de seguido:

E J E M P L O : Para determinar la calidad del aire en los alrededores de una refinera al noreste de

San Francisco, U.S.A., se midi la concentracin de un contaminante (monxido de carbono CO)


55

en partes por milln (ppm). La muestra fue recogida en un lapso de 31 das consecutivos desde el 16 de abril de 1993 y los valores obtenidos se presentan en la siguiente tabla:
TABLA N 1 PPM DE CO EN AIRE

45 30 38 42

63 43 102 86

99 63 58 34

37 55 58 153

75 58 36 59

43 102 52 30

21 40 141 85

161 86 71

Fuente: http://lib.stat.cmu.edu/DASL/Stories/MeasuringAirPolution.html

Construya una tabla de frecuencias a partir de los datos de la Tabla N 1.


RESOLUCIN:

1) Lo que se har es ir completando la informacin en el orden que lo pide el organizador grfico, al hacerlo se obtendr lo siguiente:

FIGURA N 15 RESOLUCIN DE UN EJEMPLO DE CONSTRUCCIN DE DISTRIBUCIONES DE FRECUENCIAS AGRUPADAS EMPLEANDO EL ORGANIZADOR GRFICO 56

2) Para establecer las clases se comienza desde el nuevo xmin, aadiendo el intervalo de clase ajustado se obtiene el lmite superior de la clase. Como se decidi usar lmites nominales este valor se repite como lmite inferior de la clase siguiente. El procedimiento se repite hasta colocar el valor del nuevo xmax. Con ello se obtiene la tabla que se muestra de seguido:
TABLA N 2 LISTADO DE IDENTIFICACIN DE LAS CLASES NOMINALES

Clase N Lmite Inferior Lmite Superior 1 2 3 4 5 6 7 8


19 37 55 73 91 109 127 145 37 55 73 91 109 127 145 163

3) Luego, slo resta contar el nmero de datos contenidos dentro de los lmites de cada una de las clases establecidas, completando la tabla de frecuencias absolutas, tal como que se puede apreciar a continuacin:
TABLA N 3 FRECUENCIAS EN LA MEDICIN DE LA CONTAMINACIN DEL AIRE
PPM de CO en Aire, Baha de San Francisco, U.S.A., Abril-Mayo 1993

Clase N 1 2 3 4 5 6 7 8

Lmite Lmite Frecuencia Marca de Conteo Inferior Superior Absoluta 19 37 \\\\ \ 6 37 55 \\\\ \\\ 8 55 73 \\\\ \\ 7 73 91 \\\\ 4 91 109 \\\ 3 109 127 0 127 145 \ 1 145 163 \\ 2
DE LAS

c)

R EPRESENTACIN G RFICA

D ISTRIBUCIONES

DE

F RECUENCIA

Como ha quedado de manifiesto, la distribucin de frecuencias ofrece un resumen compacto que facilita la interpretacin de los datos. Comprender lo que los datos revelan requiere del analista una capacidad de visualizacin que le proporcione tendencias y patrones, en otras palabras, representarse la dispersin de los datos e imaginar como estn repartidos. Por ello es til
57

presentar las distribuciones en forma grfica, que suele ser ms persuasiva, mxime cuando se desean comparar los perfiles de dos o ms conjuntos de datos. La conversin de la forma descriptiva tabular de los datos a su presentacin visual se ajusta a un boceto predefinido que se denomina histograma. Un histograma es una representacin en un plano delimitado por dos ejes, uno horizontal, donde se ubican la escala de medicin y se representan las fronteras de clase, y otro vertical, en el cual se sealan las frecuencias absolutas, relativas, porcentuales, y sus versiones acumuladas dependiendo de lo que se desea mostrar; hay quienes prefieren las frecuencias relativas porque la escala del eje vertical vara exclusivamente entre cero y la unidad; la escala vertical es la nica diferencia entre los histogramas. En cualquiera de los casos la frecuencia observada en cada intervalo es representada por un rectngulo, y el rea de cada rectngulo dibujado tiene que ser proporcional a la frecuencia presentada. Para que exista cierta estandarizacin en la impresin visual que proporciona un histograma es habitual ajustar la
longitud del eje vertical de modo que alcance tres cuartos de la longitud del eje horizontal.

Operativamente, sto significa que las condiciones del problema intervalos de clase y nmero de clases determinan el eje de las abcisas y luego se fija la longitud del eje vertical como el 75% de la longitud del horizontal. La propiedad de la proporcionalidad directa del rea de las representaciones grficas de las distribuciones con las frecuencias, hace relucir una de las ventajas al emplear intervalos de clase con idntica amplitud durante la construccin de las distribuciones de frecuencia: si los intervalos de clase son del mismo ancho, la altura del rectngulo coincide numricamente con la frecuencia14. Es aconsejable manejar esta coincidencia con aprensin porque puede conducir a confusiones conceptuales en el sentido de que la altura de los rectngulos indica, realmente, la densidad de frecuencia de cada intervalo de clase en unidades de frecuencia por intervalo
f int

sta, como todas las definiciones de densidad, est referida a una cierta unidad base; en este caso, como todos los intervalos de clase son iguales, se emplea esta longitud como la unidad patrn. Si la frecuencia est conceptualmente representada por el rea del rectngulo la altura ser
efectivamente el valor de la frecuencia si y slo si la amplitud de los intervalos de clase es unitaria. Sin duda un histograma de una distribucin de frecuencias cuyos intervalos de clase son

iguales ser ms fcil de interpretar, en particular, los histogramas que representan las

14

Esta coincidencia se debe a la propiedad distributiva de la multiplicacin, en virtud de que una fraccin a la que se le multiplican numerador y denominador por el mismo nmero no se altera. De hecho, dado que el rea de un rectngulo es la multiplicacin de la base por su altura Si A = b h y A = b h , entonces A1 = b.h 1 = h 1 1 1 2 2 A 2 b.h 2 h 2 58

distribuciones de frecuencia construidas con datos cualitativos o categricos deben dibujarse con clases del mismo ancho. Debe recordarse que cuando los datos son discretos existe una separacin o espaciado entre los intervalos de clase, que al ser representados grficamente conducira a una disyuncin entre los rectngulos que se dibujan. Para evitar este aspecto que tericamente es incorrecto y puede lucir desagradable, se definen y emplean puntos de divisin, calculados como la semisuma de los lmites superior de una clase e inferior de la clase subsiguiente: Lis Lji 2 i = 1,2,L nc 1 , j = i +1

punto de divisin ij =

(14)

donde la clase j es la que aparece a continuacin de la clase i. El arreglo propuesto al aplicar los puntos de divisin es importante porque evita la confusin entre un histograma y un diagrama de barras como se ver ms adelante es una forma de presentar grficamente informacin que permite algunas apreciaciones estadsticas los histogramas son una aplicacin particular de las distribuciones de frecuencias y exhiben determinadas propiedades matemticas que los hacen nicos, por ello, los histogramas siempre
deben ser dibujados sin dejar espacio entre los rectngulos. Cuando se emplean datos

discretos correspondientes a una distribucin de frecuencias no agrupadas, se emplean lneas en vez de rectngulos para la representacin grfica. Asimismo, tal como se indic para las distribuciones, los histogramas estn profundamente afectados por el nmero de intervalos de clase y su amplitud. Esto es particularmente cierto si el conjunto contiene una pequea cantidad de datos, en cuyo caso la apariencia de los histogramas puede cambiar claramente cuando se
modifica el nmero de clases o el ancho de las mismas. Los histogramas ganan estabilidad a medida que aumenta el nmero de datos del conjunto, esta tendencia se consolida cuando existen 75 o ms datos.

Para corroborar esto procedamos a representar el histograma correspondiente a la distribucin de frecuencias agrupadas del registro de partes por milln de monxido de carbono en el aire cercano a una refinera cuyo resultado se present en la Tabla N 2

59

9 8

Nmero de Das

6 5 4 3 2 1 0
19-37 37-55 55-73 73-91 91-109 109-127 127-145 145-163

Nmero de Das

15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 21-56 56-91 91-126 126-161

ppm de CO en Aire

ppm de CO en Aire

(a) Histograma con 8 Clases

(b) Histograma con 4 Clases

FIGURA N 16 SENSIBILIDAD DE UN HISTOGRAMA AL NMERO DE CLASES

El comportamiento que se observa en los histogramas es ms sencillo si tratamos de comparar la forma de ambos debido a que la forma es seal de patrones de conducta de los datos agrupados. Para ello, construyamos una lnea suave que aproximadamente una las marcas de clase lo que se presenta de seguidas:
15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5

Fecuencia

Sturges 4 Clases

Clase Nro.

FIGURA N 17 COMPARACIN DE LA FORMA DE LOS HISTOGRAMAS DEL EJEMPLO

Se puede afirmar de forma inmediata que la forma cambi sensiblemente al reducir el nmero de clases a la mitad. Mientras que el histograma construido a partir del nmero de clases determinado por el Mtodo de Sturges ocho en total presenta una forma ascendente al principio y que rememora una conducta cclica, el histograma de tan slo cuatro clases decrece en forma permanente. Esto lleva a sacar conclusiones distintas en ambos casos, en el segundo de ellos el ingeniero puede considerar que la refinera causa un bajo impacto ambiental en el aire, puesto que la curva es exponencial decreciente y seala que existe elevadas frecuencias en las
60

concentraciones bajas y luego el nmero de repeticiones va decayendo a medida que el nivel de contaminacin aumenta. En cambio el otro seala que se pueden esperar altsimas concentraciones con mucha frecuencia si se toman suficientes mediciones, debido a que la curva comienza a crecer a partir de la penltima clase y podra ser bimodal, es decir exhibir dos valores mximos o ms frecuentes. Como un comentario adicional y anticipando que el lector sea escptico podramos sealar que ninguno de los mtodos que se discutieron para determinar el nmero de clases arrojara cuatro de ellas, dado que se ha sealado como restriccin al determinar el nmero de clases que nunca debe ser menor de cinco. Sin embargo, se coloca est cantidad como un ejemplo acadmico que le permita observar la sensibilidad de los histogramas, donde entre otros aspectos, puede ser interesante que el lector note que no tiene clases vacas; tambin se mencion que la presencia abundante de clases vacas es una seal de una distribucin muy segregada. Para obviar el problema de emplear cuatro clases se podra tratar de comparar con un histograma de seis clases que es el menor nmero recomendado y que para los datos del ejemplo se obtiene empleando el criterio de la raz cuadrada o siguiendo las recomendaciones de Juran y Gryna En este caso lo que observaremos es un histograma con una clase vaca y un perfil exponencial, por lo tanto, todas las conclusiones que se apuntaron cuando se realiz la comparacin del impacto del nmero de clases los histogramas utilizando el ejemplo de la concentracin de CO en aire se mantienen. tal como se ilustra en la Figura N 18
12
12

Frecuencia Absoluta
19-43 43-67 67-91 91-115 115-139 139-163

10

Nmero de Das

10 8 6 4 2 0

ppm de CO en Aire

0 1 2 3 4 5 6

(a) Histograma

Clase Nro.

(b) Perfil del Histograma


FIGURA N 18 HISTOGRAMA DEL NIVEL DE CO EN EL AIRE CON FRECUENCIAS AGRUPADAS EN SEIS CLASES
PPM de CO en Aire, Baha de San Francisco, U.S.A., Abril-Mayo 1993

Una alternativa a los histogramas son los denominados diagramas de tallo y hojas. Esta tcnica de representacin es relativamente simple y presenta una ventaja evidente respecto a los histogramas en el sentido de que no se pierde la informacin de los datos individuales, sin embargo esa
61

ventaja surge a consecuencia de permitir un nmero elevado de categoras. Para realizarlo se requiere: 1. Registrar en una columna ordenada ascendentemente los valores con un lugar decimal menor que la precisin presentada por los datos. 2. Dibujar una lnea vertical a la derecha de los valores registrados. 3. Para cada dato, en orden de aparicin, se selecciona el primer nmero registrado en la primera columna estrictamente menor a l. Se registra el valor decimal, ignorado en el primer paso, a la derecha de la lnea vertical. Una vez ubicadas todos los datos se obtendr una representacin numrica que asemeja a un histograma rotado 90 sobre el origen. El diagrama de tallo y hojas se ilustra para el ejemplo de la contaminacin del aire con CO, que se ha venido desarrollando:
TALLO HOJAS

2 1 3 084760 4 52330 5 858892 6 33 7 51 8 656 9 9 10 2 2 11 12 13 14 1 15 3 16 1


FIGURA N 19 DIAGRAMA DE TALLO Y HOJAS PARA LA CONCENTRACIN DE CO EN AIRE
PPM de CO en Aire, Baha de San Francisco, U.S.A., Abril-Mayo 1993

Existen otras posibilidades a la hora de representar los datos, una de ellas se designa como polgono de frecuencias. El polgono es un grafico donde se representan las frecuencias de clase versus las marcas de clase y se puede obtener conectando por medio de lneas rectas los puntos medios de la parte superior de los rectngulos expuestos en un histograma; en el caso de que
62

exista algn intervalo vaco, la lnea recta correspondiente tocar y/o partir del eje de las abcisas; en particular se les aaden lneas de cierre del polgono contra el eje en puntos situado antes de la primera clase y a continuacin de la ltima clase a una distancia igual a la mitad del intervalo de clase de la serie. Otra caracterizacin grfica til, de un conjunto de datos, es la distribucin de frecuencias acumuladas, normalmente conocida como ojiva. La misma se obtiene al representar en el eje vertical la frecuencia acumulativa de una clase contra el lmite inferior de la siguiente sobre el eje horizontal y uniendo con segmentos de recta todos los puntos consecutivos. Dependiendo del tipo de frecuencia acumulada representada en eje vertical, el polgono obtenido se denominar ojiva absoluta, ojiva relativa u ojiva porcentual. Para el ejemplo de contaminacin ambiental que se ha venido trabajando, estas representaciones se muestran de seguido:
9 8

Nmero de Das

7 6 5 4 3 2 1 0 10 28 46 64 82 100 118 136 154 172

ppm de CO en Aire

(a) Polgono de Frecuencias


32 30 28 26 24 22 20 18 16 14 12 10 8 6 4 2 0 19 37 55 73 91 109 127 145 163 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 19 37 55 73 91 109 127 145 163

ppm de CO en Aire

Porcentaje de Das

Nmero de Das

ppm de CO en AIre

(b) Ojiva Absoluta

(c) Ojiva Porcentual

FIGURA N 20 POLGONO Y OJIVAS PARA LA CONCENTRACIN DE CO EN AIRE


PPM de CO en Aire, Baha de San Francisco, U.S.A., Abril-Mayo 1993

Una de las caractersticas ms interesantes que brinda la Figura N 20 es que permite constatar que las ojivas absoluta y porcentual son idnticas en su forma, el grfico de cada una de ellas slo
63

difiere en la escala que se emplea en el eje vertical. La misma conclusin podra extraerse si se hubiese representado la ojiva relativa. Tambin resulta relevante que se observe como la curva que representa el perfil del histograma con el nmero de clases establecido con el Mtodo de Sturges representado en la Figura N 17, no es ms que el polgono de frecuencias que se observa en la Figura N 20-a trazando segmentos de curvas suaves en vez de rectas para unir los puntos. Curvas similares a la que se represent en la Figura N 17 son de mucha importancia en estadstica y de ellas se hablar con mayor profundidad ms adelante. El uso principal de las ojivas es lo que se conoce como cuantiles. Un cuantil es el valor bajo el cual se encuentra una determinada proporcin de los valores de la distribucin. Se lee en la direccin opuesta en el eje horizontal a la proyeccin de la curva en el punto correspondiente a proporcin deseada, que se ubica mediante el valor respectivo en el eje vertical. Los cuantiles operan como segmentadores de la globalidad de los datos; los ms comunes son:
9 Cuartiles: corresponde a un fraccionamiento en cuatro partes iguales, a saber: primer cuartil

abarca el 25% de los datos, el segundo cuartil un 50%, el tercer cuartil un 75% de los datos y el 100% estarn en el cuarto cuartil.
9 Quintiles: es la segmentacin en cinco partes iguales de 20% cada una, por ende, el primer

quintil alcanza hasta el 20% de cobertura, el segundo, tercero, cuarto y quinto quintil corresponden a 40%, 60%, 80% y 100% de los datos, respectivamente.
9 Deciles: en este caso, la segmentacin es de diez en diez por ciento. 9 Centiles o Percentiles: subdividen el conglomerado en estudio en cien clases distintas,

representando el valor de la variable bajo el cual se encuentra un porcentaje dado. Por ejemplo, empleando el caso representado en la Figura N 20-c se puede leer directamente que el 80% de los das la concentracin del monxido de carbono en el aire fue inferior a 91 ppm. Los datos que se recopilan y cuya frecuencia se representa grficamente pueden ser calificados como una muestra de una poblacin grande; si ella est representada por una variable continua pudieran existir datos en abundancia, entonces es posible, al menos en teora, disminuir paulatinamente el tamao del intervalo de clase y continuar existiendo un nmero razonable de observaciones en cada una de las clases. A medida que la amplitud de los intervalos decrece, el tamao de los segmentos de recta que interconectan las respectivas marcas de clase se reducen, si las figuras resultantes se suavizan, la representacin que se obtiene es una curva llamada curva de frecuencias o polgono de frecuencias suavizado. Del mismo modo puede procederse para
64

obtener una ojiva suavizada, en cuyo caso los errores de aproximacin al suavizar suelen ser menores que cuando se trabaja con polgonos de frecuencia. Las curvas de frecuencia pueden presentar un nico valor mximo, o varios valores que representan mximos locales; el primero de los casos descritos se conoce como curva de frecuencia unimodal, Una curva de frecuencia simtrica presenta un mximo centrado respecto al intervalo total y las frecuencias de las observaciones equidistantes a dicho mximo son las mismas, parecindose a una campana. El ejemplo ms importante de esta curva es la distribucin normal. Cuando el valor modal15 separa las colas en forma de que una es ms larga que la otra se dice que la distribucin es sesgada, si la cola ms prolongada est a la derecha se denomina sesgo positivo, caso contrario, sesgo negativo. Una funcin de frecuencias bimodal se caracteriza por que posee dos mximos. Se encuentran tambin, curvas de frecuencias con ms de dos valores modales representados como mximos locales, en cuyo caso las distribuciones correspondientes se denominan multimodales.

d)

A NLISIS

DE LAS

D ISTRIBUCIONES

DE

F RECUENCIA

Una de las aplicaciones ms importantes de las distribuciones de frecuencia es dar respuesta a interrogantes comunes que nacen de la interaccin diaria con datos; entre ellas se pueden formular preguntas tales como: Cul es el porcentaje de cajeros cuyo tiempo de atencin es menor a 11 minutos?, Cuantos de los bombillos de la muestra ensayada duraron entre 1100 y 1300 horas?, Cul es la resistencia a la tensin por encima de la cual estn 25 de las 100 guayas que conforman la muestra de un ensayo de calidad?, Cul es el precio en el que se realiza el 70% de las ventas de la compaa?, etc. Todas esas preguntas pueden responderse una vez organizados los datos en distribuciones y su aclaratoria, evidentemente, profundiza el anlisis y la comprensin de los datos, lo que conduce a conclusiones y decisiones ms asertivas. Como se mencion en la seccin concerniente a representacin grfica de las distribuciones de frecuencia, el uso primordial de las ojivas son los cuantiles, de los cuales el ms comnmente usado es el percentil. El anlisis como producto de las respuestas a las inquietudes establecidas al inicio del prrafo hace uso del concepto de percentiles y se conoce como anlisis percentlico. Lo que se propone el investigador al realizar un anlisis percentlico no es ms que hallar los valores de la variable debajo de los cuales se encuentran ciertos porcentajes dados de la frecuencia, o bien, conocer el porcentaje de valores que se encuentran por debajo o por encima de un valor
15

el valor modal es el correspondiente al mximo de la curva de frecuencias. 65

especfico de la variable; este porcentaje de valores es lo que se denomina rango percentil. Para obtener este tipo de informacin se dispone de dos vas alternas: mediante la inspeccin de las grficas de ojivas porcentuales o a travs de las distribuciones, en cuyo caso el procedimiento emplea la tcnica aritmtica de la interpolacin lineal de los segmentos de recta que unen a los distintos intervalos de clase; la ecuacin resultante es: f j (r Lji ) 100 P( x < r ) = Faa + , ic N donde: r, un valor dado de la variable para el que se desea determinar el porcentaje de datos menores que l. P(x>r), Faa, fj,
j L i,

(15)

porcentaje de datos para los cuales el valor de la variable es menor que r. frecuencia acumulada anterior a la clase que contiene al valor dado de r. valor de la frecuencia absoluta de la clase j que contiene al valor dado de r. lmite inferior de la clase j que contiene a r. intervalo de clase. nmero total de datos en la distribucin.

ic, N,

Es importante que se reflexione acerca de que con esta ecuacin se puede dar respuesta a cualquiera de las interrogantes planteadas previamente y a cualquiera similar. Si se esta interesado en el porcentaje menor a un cierto valor, la aplicacin es directa. En el caso diametralmente opuesto, es decir, el porcentaje mayor a un cierto valor se puede determinar sabiendo que ambos porcentajes el solicitado y el que se calcula mediante (14) son complementarios, esto es:

P( x > r ) + P( x < r ) = 100% P( x > r ) = 100 P( x < r )

(16)

Si por el contrario el inters radicara en obtener el porcentaje de un rango acotado por ambos extremos, en vez del limitado por un nico valor, ese rango puede determinarse por sustraccin de los valores menores que el extremo inferior a los valores menores al extremo superior, tal como se observa en la siguiente representacin grfica:

66

FIGURA N 21 ILUSTRACIN DEL RANGO PERCENTIL ACOTADO ENTRE DOS VALORES

Por tanto:

P (q < x < r ) = P ( x < r ) P ( x < q ) q < r

(17)

Adems, dado que se conoce el nmero total de observaciones, enumeraciones o mediciones que componen la muestra, si se desea conocer la cantidad absoluta de datos que cumplan con la condicin impuesta, slo basta con recordar que se cumple la siguiente relacin: n ( x < r ) = P( x < r ) N (18)

La nica de las cuestiones formuladas al inicio de esta seccin cuya resolucin no ha sido explcitamente proporcionada, es la relativa a determinar el valor de la variable para el cual se alcanza un determinado porcentaje. Tal como se seal con anterioridad, la ecuacin (15) es la que se emplea para todos los clculos que aqu conciernen; despejando el valor de r se obtiene:
N P( x < r ) Faa j 100 r = Li + ic fj

(19)

No obstante disponer de la expresin anterior, es necesario sealar que para poder usarla con efectividad es menester llevar a cabo el siguiente procedimiento:
" Determinar los porcentajes acumulados para cada clase. " Identificar el intervalo de clase que est delimitado por los porcentajes acumulados que

abarquen al porcentaje buscado. Una vez identificada la clase correctamente ya se dispone de todos los datos exigidos por la ecuacin (19). Se puede ilustrar el juego de ecuaciones presentadas respondiendo algunas preguntas selectas:
67

E J E M P L O : Con el conjunto de datos presentados en la Tabla N 1, responda las siguientes

preguntas: a) Cul es el porcentaje de das con concentraciones de CO menores de 110 ppm?, b) Cuntos das el aire de la zona presenta niveles de contaminacin de CO entre 85 y 110 ppm?, c) Cuntos das se midieron concentraciones por encima de 110 ppm?, d) Qu valor de concentracin acota al 75% de las mediciones?, y e) Qu porcentaje de las mediciones realizadas tienen concentraciones mayores a 85 ppm?
RESOLUCIN:

a).- En este caso r=110 ppm, que est contenido en la sexta clase (j=6) que comprende las concentraciones mayores que 109 y hasta 127 ppm, con lo cual se conoce que la frecuencia acumulada anterior ser Faa = 28, la frecuencia absoluta de la sexta clase f6 = 0, cuyo lmite inferior es 109, la longitud del intervalo de clase es, ic = 18 y el nmero total de mediciones es N = 31, entonces de la ecuacin (15) se obtiene:

0(62 119) 100 P( x < 110) = 28 + = 90,32% 18 31 De donde se determina el nmero de das mediante la ecuacin (18) n ( x < 110) = P( x < 110) 31 = 90,32% 31 = 28 das 100%

b).- Para responder esta interrogante se hace uso de la ecuacin (17) P(85 < x < 110) = P( x < 110) P( x < 85) Debemos determinar previamente con el auxilio de la ecuacin (15) los dos porcentajes requeridos, para 110 ppm ya se obtuvo en la pregunta anterior, entonces faltara para 85 ppm. Los datos son: j = 4, Faa = 21, Li = 73, ic = 18 y N=31, entonces P(x < 85) ser: 4(85 73) 100 P( x < 85) = 21 + = 76,34% 18 31 El valor solicitado vendr dado por:
P(85 < x < 110) = 90,32% 76,34% = 13,98%

c).- En esta oportunidad se halla el porcentaje de das con concentraciones mayores a 110 ppm a partir de la ecuacin (16). Sabiendo, porque se determino en la primera parte, que el valor de P(x<110)=90,32%, se tiene:

P( x > 110) = 100 P( x < 110) = 100% 90,32% = 9,68%


Como se hizo previamente usando la ecuacin (18) se especfica el nmero de das que cumplen con la condicin:
68

n ( x > 110) = P( x > 110) 31 =

9,68% 31 = 3 das 100%

d).- Esta pregunta se responde utilizando la ecuacin (19), que requiere de cierto procedimiento previo. Se hallan los porcentajes acumulados para cada clase, tal como se muestra de seguido:
TABLA N 4 TABLA DE FRECUENCIAS Y PORCENTAJE ACUMULADO DE LA CONCENTRACIN DE CO EN AIRE
PPM de CO en Aire, Baha de San Francisco, U.S.A., Abril-Mayo 1993

% acumulado Clase Frecuencia Frecuencia [fj] Acumulada [Hj] 6 8 7 4 3 0 1 2

H j 100 N
19,35% 45,16% 67,74% 80,65% 90,32% 90,32% 93,55% 100,00%

19-37 37-55 55-73 73-91 91-109 109-127 127-145 145-163

6 14 21 25 28 28 29 31

Con la ayuda de la tabla se puede identificar que la clase que comprende al 75% de los valores es aqulla entre los porcentajes acumulados de 67,74% y 80,65%, es decir la cuarta clase (j = 4), sabiendo entonces que los otros datos son: Faa = 21, Li = 73, ic = 18 y N=31, se puede aplicar ahora la ecuacin (19)
31 75 21 r = 73 + 100 18 = 83,125 ppm 4 e).- Aqu nuevamente emplearemos la ecuacin (16)
P( x > 85) = 100 P( x < 85) = 100% 76,34% = 23,66%

En el clculo se emple el valor de P(x < 85) que se haba calculado en el segundo apartado. Como se mencion previamente, es posible hacer un anlisis percentlico a partir de la respectiva ojiva porcentual; debe recordarse que en una representacin de este tipo el plano est delimitado por un eje de las ordenadas, contentivo de las frecuencias relativas acumuladas expresadas en porcentajes16, y un eje de las abcisas que comprende los valores de la variable. En este caso, si se

16

Es decir, las frecuencias relativas acumuladas multiplicadas por cien. 69

desea obtener el rango percentil de un valor de variable dado, se ubica ste en el eje x y se levanta una perpendicular al eje hasta cortar a la ojiva de porcentajes, desde el punto de corte se traza una lnea horizontal que intercepte al eje de las ordenadas. El valor de la interseccin corresponder al rango percentil para el valor dado. Resulta evidente, que este procedimiento es reversible, en el sentido de que si lo que se requiere es el valor de la variable para que abarca un porcentaje dado de los datos se realiza en sentido inverso el procedimiento descrito. Es interesante indicar que el anlisis percentlico no slo es til cuando se desea comprender y relacionar datos dentro de un mismo colectivo, tal como se hace al dar respuesta a las inquietudes que se propusieron al comenzar la seccin, sino cuando se trata de establecer comparaciones acerca de una caracterstica comn entre dos o ms conjuntos de datos recopilados mediante experimentos diferentes. La condicin imprescindible para lograr este tipo de comparaciones es que en cada colectivo se hayan efectuado la misma cantidad de observaciones, es decir, que tengan la misma base. La comparacin relativa permite obviar el requisito de la base comn; es ms, el anlisis percentlico soporta comparaciones globales y adems, es posible indicar la posicin relativa al grupo al que pertenece la observacin. Otra conclusin interesante que se puede obtener a partir de las distribuciones de frecuencias est vinculada a la jerarquizacin de intereses o actividades, particularmente empleada por los ingenieros industriales en el anlisis frecuencial de fallos. Esta tcnica se conoce con el nombre de anlisis ABC o anlisis de Pareto, en honor al economista italiano Vilfredo Pareto (18481923) quin en 1897 demostr para la distribucin del ingreso per cpita una conclusin que se observa en la mayora de los eventos, conocida como la Ley de Pareto o la Regla del 80/20 que establece que cerca del 20% de las causas son responsables del 80% de los efectos. Un diagrama de Pareto permite separar las pocas causas vitales de las muchas triviales permitiendo establecer prioridades para concentrar las acciones correctivas. El procedimiento para desarrollar un anlisis de Pareto consiste en: (Adaptado de [Crossley, 2000] ) 1. Decidir el objetivo (p.e defectos por tipo, ventas por localidad, etc.). 2. Recolectar los datos en una tabla de conteo (ver Figura N 9). 3. Ordenar las categoras de los datos recolectados en forma descendente segn la frecuencia absoluta. 4. Determinar el porcentaje que representa cada clasificacin respecto al total. 5. Desarrollar una distribucin porcentual acumulada hasta englobar el 100% de los datos.
70

6. Construir un histograma porcentual colocando las categoras en el orden establecido durante la ejecucin del paso 3. 7. Dibujar la curva generada por los datos hallados en el paso 5. Esta curva de conoce como Lnea de Lorenz17 o Curva de Pareto
E J E M P L O : En el desempeo como consultor de empresas de servicio, usted ha sido contratado

para ayudar a un consultorio odontolgico en la mejora del servicio que prestas a sus clientes. Durante la entrevista con los mdicos contratantes se llega a la conclusin de que existen los siguientes asuntos que deben afectar el nivel del servicio: falta de cortesa de los empleados, costo del servicio, explicacin adecuada del procedimiento, decoracin de la oficina, sabor del enjuague bucal, el nivel de dolor del tratamiento, la seleccin de revistas disponibles en la sala de espera, el profesionalismo del personal mdico, la puntualidad en las citas, la limpieza del consultorio, y el acceso al consultorio. Se decide entonces realizar una encuesta a los clientes al concluir sus citas donde se le pide que seale su nivel de aceptacin acerca del funcionamiento de la empresa en cada uno de esos once tems. Usted procesa los resultados elaborando la siguiente tabla:
TABLA N 5 FRECUENCIA DE RESPUESTAS NO ACEPTABLE

Asunto
Falta de cortesa de los empleados Costo de las consultas y tratamientos Explicacin adecuada del procedimiento Decoracin de la oficina Sabor del enjuague bucal Nivel de dolor en el tratamiento Seleccin de revistas en la sala de espera Profesionalismo de los mdicos Puntualidad de las citas Limpieza del consultorio Acceso al consultorio

Nmero de respuestas
10 35 11 3 1 60 8 2 2 6 12

17

M.O. Lorenz grafic en su momento la concentracin de la riqueza usando el porcentaje acumulado de poblacin en un eje y el porcentaje de riqueza en el otro. Dada la similitud de los mtodos de ambos investigadores se suelen intercambiar estos nombres. 71

Como la definicin inicial era muy ambiciosa para tratar de mejorarlos todos, se espera de usted como consultor que le seale a los mdicos contratantes cules de esos factores son en los que ellos deben concentrar su atencin para garantizar mejoras sustanciales.
RESOLUCIN:

La forma de obtener las reas crticas es empleando un histograma de Pareto, por lo tanto se debe rearreglar los datos recolectados en orden descendente de frecuencia y determinar el porcentaje que representa cada rea de forma absoluta y acumulada. Ello se muestra en la siguiente tabla:

TABLA N 6 DISTRIBUCIN DE FRECUENCIAS ORDENADAS PARA ANLISIS DE PARETO

Asunto
Nivel de dolor en el tratamiento Costo de las consultas y tratamientos Acceso al consultorio Explicacin adecuada del procedimiento Falta de cortesa de los empleados Seleccin de revistas en la sala de espera Limpieza del consultorio Decoracin de la oficina Puntualidad de las citas Profesionalismo de los mdicos Sabor del enjuague bucal Totales

Nmero de Porcentaje del Porcentaje acumulado respuestas total de respuestas del total de respuestas
60 35 12 11 10 8 6 3 2 2 1 150 40,0 23,3 8,0 7,3 6,7 5,3 4,0 2,0 1,3 1,3 0,8 100,0 40,0 63,3 71,3 78,6 85,3 90,6 94,6 96,6 97,9 99,2 100,0

Hecho este arreglo se puede concluir que poco ms del 63% de los asuntos que los clientes califican como no aceptable se restringe tan slo a dos de las categoras encuestadas, es decir, el 18% de la lista de once preocupaciones originalmente planteadas. Su consejo a los odontlogos ser que deben enfocar su atencin en procurar disminuir el nivel de dolor que causan en sus pacientes y explorar la posibilidad de reducir sus tarifas. Para exponer a los mdicos su recomendacin puede presentar la informacin grficamente:
72

Nivel de dolor en el tratamiento Costo de las consultas y tratamientos Acceso al consultorio Explicacin adecuada del procedimiento Falta de cortesa de los empleados Seleccin de revistas en la sala de espera Limpieza del consultorio Decoracin de la oficina Puntualidad de las citas Profesionalismo de los mdicos Sabor del enjuague bucal

10

20

30

40

50

60

Nmero de Respuestas "No Aceptable"

FIGURA N 22 DIAGRAMA DE PARETO PARA EL CONSULTORIO ODONTOLGICO

Como puede ver sta tcnica es de gran utilidad cuando se trata de distribuir recursos entre varias opciones, porque promueve la eficacia del gasto, mejorando el desempeo de la organizacin en base a decisiones ms slidamente tomadas.

e)

R ESUMEN

Este captulo ha comenzado a proveerle de recursos tiles y aplicados en su desempeo profesional, se expuso la tcnica fundamental de la estadstica descriptiva: las distribuciones de frecuencia, se le incluy un organizador grfico para enfrentar el reto que le proponen los casos donde debe construir distribuciones de frecuencia agrupadas, adems se resolvi un ejercicio empleando el organizador grfico a manera de ejemplo para obtener su confianza en la herramienta. Todos los contenidos estudiados hasta ahora son bsicos en el desarrollo posterior del trabajo estadstico, porque como afirma Rice (2002): una vez que el propsito, el nmero y tipos de variables, niveles de medicin, seleccin de la muestra, el nmero de grupos, y la forma de las distribuciones es conocida, las tcnicas estadsticas apropiadas para inferir pueden ser determinadas; por ello, se llev a cabo una discusin profusa acerca de la forma de determinar el

73

nmero de clases que deben seleccionarse para agrupar frecuencias en una distribucin, inclusive se presentaron comparaciones grficas y aplicadas entre los distintos mtodos para ayudarlo a obtener experiencia en un rea muy delicada, puesto que influye en la forma de las distribuciones y, consecuentemente, en las conclusiones que se elaboran a partir de ellas. Tambin se presentaron las formas grficas de mostrar distribuciones de frecuencia, por ser estas series estadsticas las ms importantes de las que se ocupa un profesional. Ms adelante se discutir la forma de presentar los datos de otras series estadsticas para poder analizarlos y extraer informacin til de ellos para la toma de decisiones.

f) E JERCICIOS P ROPUESTOS
1.- Con los datos: 15 18 23 25 28 20 17 18 20 23 25 18 20 20 25 28 15 17 23 28 30 23 25 23 20 18 17 20 18 30 23 20 25 30 28 17 20 18 20 23 Construya una distribucin de frecuencias de cinco clases. Determinar los diferentes tipos de frecuencias relativas (absolutas y

acumuladas) y porcentajes (absolutos y acumulados). Adicionalmente, construya: a) histograma de frecuencias absolutas; b) histograma de frecuencias acumuladas; c) polgono relativo; d) ojiva porcentual.

2.- Los jornales por hora (en cientos de Bs.) de los operarios de una industria (redondeados a la unidad) son: 62 58 57 46 45 46 44 50 49 43 51 47 42 43 41 37 40 54 39 30 43 38 52 55 37 41 42 54 38 53 32 52 36 46 42 52 30 37 52 36 40 42 47 43 49 45 50 43 58 46 64 47 46 50 40 44 45 45 57 51

74

a) Elabore un cuadro de datos ordenados. b) Seleccione un tamao de clase conveniente y elabore un cuadro de frecuencias agrupadas. c) Encuentre los lmites reales. d) Halle las marcas de clase. e) Dibuje el histograma correspondiente. f) Dibuje el polgono de frecuencias.

3.- Construya las clases correspondientes a la distribucin que se presenta de seguido: Clases Xi (Marca de Clase) 5 10 15 20 25 fi 12 20 32 18 8

4.- Dibuje hipotticamente (sin datos de distribucin de frecuencias): a) Un polgono relativo. b) Un histograma porcentual. c) Una ojiva absoluta. d) Explique como se leen las grficas dibujadas en los apartes a), b), y c).

5.- Una industria manufacturera de tradicin decide mejorar el rendimiento de sus equipos, para lo cual ha planificado reemplazar los chips de memoria elctricos por electrnicos, y para efectos de un estudio descriptivo del nuevo proyecto con respecto al costo en dlares ($) de dichos chips, el departamento de produccin y finanzas cuenta con la informacin que a continuacin se presenta:
9 18 chips con costo promedio de $ 50. 9 Con costo mnimo de $ 65, 11 chips. 9 El menor costo es de $ 15, a partir del cual se agrupan 68 chips. 9 16 chips con costos menores a $ 35. 9 Con costos de por lo menos $ 25 e inferiores a $ 35, 9 chips.
75

9 El estudio abarca costos de cuando ms $ 85. 9 Chips con costos superiores o iguales a $ 75, 5 chips. 9 Con costos de por lo menos $ 55 y cuando ms $ 85, 21 chips.

Partiendo de la informacin anterior: a) Construya la distribucin de frecuencias relativa de siete clases de igual amplitud. b) Grafique la ojiva absoluta y explquela. c) Determine el % de chips que tienen costos inferiores a $ 73,50. d) Cul es el costo mximo de los 36 chips ms caros? e) Halle en la grfica del punto b) el costo correspondiente al percentil 60%. f) Halle con en la grfica del punto b) el rango percentil de un de $ 72. 6.- En la siguiente distribucin de frecuencias especifique cuales son los inconvenientes que podran presentarse en caso de un anlisis detallado de la informacin:
PRECIOS (Bs.) 1.890 2.110 2.210 2.490 2.805 2.090 2.210 2.500 2.800 3.500 N o. DE ARTCULOS 5 7 9 6 4

7.- Convierta la distribucin de frecuencias siguiente en una distribucin de frecuencias acumulada.


VARIABLE 50 100 150 200 250 300 350 100 150 200 250 300 350 400 N. DE UNIDADES ESTADSTICAS 7 15 30 45 25 10 8

a) Seale para que valor de la variable representa el 50% de las unidades estadsticas

76

b) Cuntas unidades estadsticas se encuentran por debajo del valor 290 de la variable?. Qu porcentaje representan?

8.- A partir de la siguiente informacin, construya la distribucin de frecuencias absoluta y grafique el polgono porcentual:

SALARIO MENSUAL ($) 500 600 700 800 900 600 700 800 900 1.000

N o. DE TRABAJADORES 7/80 20/80 23/80 18/80 12/80

c) Determine cul es el porcentaje de trabajadores que devengan salarios mensuales entre 650 y 850$ d) Cules son los salarios que agrupan: el primer decil, el segundo cuartil y el percentil 70?

9.- Con los datos del ejercicio No. 5 del Captulo I, a) construya una distribucin de frecuencias en orden descendente; b) cul es la 1era Clase?; c) cul es la frecuencia de la cuarta clase?.

10.- Los siguientes se refieren a los espesores en decmetros de un nmero determinado espigas elctricas: 15 18 23 25 28 20 17 18 20 23 25 18 20 20 25 28 15 17 23 28 30 23 25 23 20 18 17 20 18 30 23 20 25 30 28 17 20 18 20 23

e) Construir una distribucin de frecuencias relativa con limites de clases nominales y construya la ojiva absoluta. f) Convierta la distribucin anterior en una distribucin absoluta g) Seale cuantas espigas tienen un espesor mayor de 220 cm.
77

h) Calcule bajo cual espesor estn contenidas el 80% de las espigas

11.- Suponga que se tiene la siguiente distribucin sobre los defectos estructurales en las puertas de un automvil: abolladuras, 4; picaduras, 4; partes ensambladas fuera de frecuencia, 6; partes subajustadas, 21; falta de agujeros/ranuras, 8; partes no lubricadas, 5; partes fuera de contorno, 30 y partes con rebarbas, 3. Construya un diagrama de Pareto e interprete.

12.- Los datos siguientes representan la duracin en horas de una muestra de lmparas incandescentes que fueron sometidas a una prueba de su vida til: 1115 1310 1540 1502 1258 1315 1085 1567 1883 1203 1270 1015 845 1674 1223 375 2265 1910 1018 1452 1890 1782 1522 1792 1000 1820 1940 1120 1055 1764 1330 1608 1535 1781 1750 798 1020 865 2130 1421 1109 1481 1016 1102 1605 706 2215 785 885 2100 1594 2023 1315 1269 1260 1888 910 1730 1102 1578 758 1416 1560 1501 1238 990 1468 1512 1750 1642

a) Construya un diagrama de tallo y hoja para visualizar estos datos. b) Existe evidencia de qu una lmpara sobrevivir ms all de las 2.000 horas? Justifique su respuesta.

13.- Su profesor de Ingls le afirma que en ese idioma las cinco letras ms empleadas son: a, e, o,
h, y s. Como escptico estudiante de Ingeniera Industrial usted decide corroborar esa

informacin. Demuestre o rechace la afirmacin del profesor y justifique el procedimiento empleado. En caso de rechazarla proponga usted cuales letras pueden considerarse las ms frecuentes.

78

III. FORMAS TABULARES DE PRESENTAR INFORMACIN


Existen dos mtodos bsicos para presentar datos cuantitativos, uno de ellos consiste en mostrar los nmeros, propiamente dichos, en lo que se conoce como tablas estadsticas; el otro involucra la interpretacin visual de las magnitudes en lo que se denomina grficos estadsticos. Cada tipo de presentacin posee tcnicas y usos particulares; este captulo se concentrar en exponer las tcnicas y recomendaciones relativas a tablas estadsticas, mientras que el estudio de los grficos estadsticos se posterga hasta el prximo captulo. La finalidad de las tcnicas de representacin es destacar la informacin que se suministra a quienes toman decisiones relativas a los resultados de un experimento estadstico que caracteriza un fenmeno o procedimiento. Si una informacin no es presentada en una forma efectiva quien acceda a ella har caso omiso de la misma, por sta razn los dos captulos que siguen son de vital inters en su vida, tanto acadmica como profesional. Mediante el estudio de este captulo se pretende que Usted sea capaz de:

1. Expresar el concepto de tabla estadstica. 2. Clasificar a las tablas estadsticas de acuerdo al uso y la clasificacin de los datos. 3. Construir tablas estadsticas a partir de datos disponibles. 4. Interpretar la informacin presentada en una tabla estadstica.

79

Los datos que estn contenidos en los registros internos de las organizaciones o que han sido recopilados en un estudio estadstico, deben ser organizados o tabulados, de forma que puedan ser tiles para sus propsitos. Las estadsticas deben ser presentadas en forma efectiva para que los hechos y las relaciones significativas emerjan a partir del volumen de datos en vez de ser ocultados por ellos. La presentacin efectiva es una importante ayuda para clarificar el anlisis y la interpretacin de los datos, por ello es una necesidad ocupar parte de este texto con la exposicin de los procedimientos para la efectiva presentacin de los datos estadsticos. Un profesional que no organice y ajuste sus datos para que sean analizados efectivamente, fallar en descubrir el significado que pudiera estar contenido en esos datos. Adems, el lector de un reporte referido a datos cuantitativos presentados de forma ineficiente, independientemente de la importancia de la informacin que pueda desprenderse de ellos, descartar los hallazgos del mismo, por su incapacidad para entender como fueron deducidos. La necesidad de una presentacin efectiva de los datos estadsticos est vinculada al hecho de que los datos no hablan por si mismos. Cuando un analista emplea cualquiera o ambos de los mtodos de representacin de datos cuantitativos, procura resaltar los rasgos distintivos de una determinada situacin. No debe entenderse que por su propsito la representacin de los datos sustituye en forma alguna a los procedimientos para su agrupacin que se estudiaron previamente; ms bien representan un complemento para que los lectores puedan percibir los hechos ms resaltantes del fenmeno que se estudia mediante dichos datos. En vista de que algunos investigadores han reportado que, por lo general, las personas poseen pocos conocimientos estadsticos [Utts, 2002], es recomendable disear adecuadamente las formas de representacin para que sean lo ms sencillas y comprensibles posibles, y consecuentemente, puedan lograr su cometido. En algunas situaciones, los datos estadsticos que requieren ser presentados, no son lo suficientemente extensos para ocasionar dificultades en la interpretacin, en estos casos los datos se suelen presentar integrados al texto, lo que se denomina presentacin textual. La caracterstica fundamental de la presentacin textual es que los datos no pueden separarse de su contexto verbal inmediato, independientemente de que se arreglen en columnas para permitir una mejor visualizacin. Cuando la cantidad de datos es considerable, este tipo de presentacin le impide al lector hacerse una idea efectiva de su significado, inclusive el lector promedio ignorar esa parte del texto dirigiendo su atencin y lectura al final de los mismos, razn por la cual resulta inconveniente abusar de esta forma de representacin. Sin embargo, cuando se citan muy pocos datos con propsitos ilustrativos, la presentacin textual suele ser la ms indicada porque refuerza
80

la relacin de los indicadores registrados con los argumentos propuestos, tal como se desea al redactar conclusiones o recomendaciones que provienen de un estudio cuantitativo. Un ejemplo de presentacin textual puede ser el siguiente tomado del Informe del Grupo de Trabajo de Energa y Transporte del Consejo Presidencial para el Desarrollo Sustentable (1996):
...El ndice de congestin de carreteras muestra que para el perodo que comienza en 1982 y culmina en 1990 las ciudades con la mayor densidad poblacional presentan la mayor congestin y su mayor incremento; 47 de las 50 ciudades experiment incrementos en la congestin. Los costos de la congestin de trfico en 1990 tambin se midieron, resultando en promedio 200.000 horas de retraso y 860 millones de dlares representados por el tiempo de retraso y los gastos de combustible. En 1999 se espera que al menos la mitad de las millas recorridas sean en congestin severa comparado con un 31% para 1989...

La representacin tabular no es ms que la colocacin de los datos mediante un arreglo lgico en filas y columnas que contemple las especificaciones relacionadas con la naturaleza de dicha informacin, sin embargo, la elaboracin de un cuadro no es tan sencilla y debe planearse cuidadosamente su tamao y la distribucin acorde a la importancia de las series o categoras. Es necesario, adems, ser cuidadoso con la eleccin de las columnas y sus encabezamientos, ya que en ellas se pondrn las relaciones que se desean destacar. La diferencia ms relevante de la presentacin tabular respecto a la representacin textual radica, en que estos arreglos son auto-explicativos, entre otras razones, porque son independientes de su contexto verbal inmediato y se separan de l mediante una identificacin que incluye un titulo y un nmero, adems sealan la fuente de la que se desprenden los datos y las unidades descriptivas. La correcta eleccin de las unidades de medida de las magnitudes es otro aspecto importante porque una buena eleccin de las mismas beneficia la claridad y el tamao del cuadro. En la mayor parte de los casos en que los datos son complicados y/o abundantes, ser conveniente mostrar esos datos distribuyndolos en ms de una tabla estadstica para afianzar la claridad de la presentacin y consecuentemente la interpretacin de la informacin que ellos revelan. Una de las ventajas principales de las tablas estadsticas es que una vez incorporadas, el autor puede referirse a los datos contenidos en ellas varias veces a lo largo del reporte; ms an, las tablas permiten la flexibilidad al poder ser ubicadas en cualquier lugar del reporte para satisfacer las exigencias estticas.

a)

D ESCRIPCIN

DE LAS

T ABLAS E STADSTICAS

Las diferencias existentes entre los distintos tipos de tablas estadsticas no ocasionan mayores distinciones al momento de su elaboracin, es decir, siguen los mismos patrones o normas. Por
81

ello, antes de elaborar una tipologa se preferir distinguir y comentar los elementos que forzosamente deben incluirse al construir un cuadro estadstico. La figura siguiente permite reconocerlos:

FIGURA N 23 ESQUEMA DE LAS PARTES FUNCIONALES DE UNA TABLA ESTADSTICA

Procedamos ahora, a aclarar cada uno de los componentes destacados en la Figura N 23:
D Nmero del cuadro: El objetivo que se persigue al numerar una tabla estadstica es facilitar la

posterior cita de los datos contenidos en ella. La numeracin que se adopta por convencin refleja el orden de aparicin, en reportes muy extensos divididos en captulos, es una buena prctica que dicha codificacin est compuesta por una cifra que seale el captulo y otra que numere la figura, en el orden de aparicin dentro del captulo correspondiente; ambas cifras se separan mediante un punto. Ocasionalmente el nmero se omite si el cuadro es el nico contenido en el reporte.
D Ttulo: El ttulo de un cuadro es muy importante y debe reflejar con claridad lo que

representan los datos contenidos en l. Para ello, se acostumbra que el ttulo responda a las siguientes preguntas acerca de las actividades realizadas para recopilar los datos presentados: qu? , dnde? , cundo? , y cmo se clasificaron?. Es importante resaltar que un ttulo ser adecuado a sus propsitos si la descripcin no es excesivamente extensa, ni extremadamente breve.
D Nota de Encabezamiento: Se emplea solamente cuando es menester revelar pormenores tales

como: las unidades en que estn expresadas las variables, indicar si los datos provienen de una muestra o un universo-poblacin, tambin pueden proveer informacin adicional al ttulo, en aras de limitar la extensin de ste sin omitir detalles relevantes sobre el contenido de la tabla. Puede o no escribirse entre parntesis, lo importante, es que el autor de un reporte que
82

incluya tablas estadsticas debe ser consistente en su presentacin, seleccionando slo una de las alternativas existentes para ello.
D Encabezado: El encabezamiento comprende los ttulos, etiquetas o rtulos, que describen lo

que se representa en cada columna, sea ello series o categoras, en el ltimo caso, si las columnas agrupan datos de clases subsumidas en otra mayor, debe existir un subttulo maestro en la parte superior, abarcando el espacio que ellas ocupan. El encabezado se ubica en la parte superior del cuadro, debajo del ttulo y la nota de encabezamiento si existiese debe ser claro, conciso y estar separado del resto del cuadro mediante lneas horizontales un poco ms gruesas. Se procura que las etiquetas estn escritas en forma horizontal, en vez de vertical, para facilitar su lectura.
D Columna Matriz: Es la columna a la extrema izquierda de la tabla, comprende las etiquetas

que rotulan cada una de las filas y el encabezado de la matriz, es decir, un ttulo explicativo de las categoras o series que se representan de cada fila. Al igual que en el encabezado, cada etiqueta debe ser clara y explcita, de hecho puede ser ms extensas en esta parte porque disponen de mayor espacio til. El profesional debe ser muy cuidadoso cuando la tabla comprende ms de una clasificacin por filas, de modo tal que el lector pueda entender la relacin existente entre cada fila y el esquema global de clasificacin que se desea presentar.
D Cuerpo de la Tabla: El cuerpo del cuadro resume la informacin estadstica que se presenta,

esta integrado por las celdas que se forman al interceptar cada fila con cada columna. Una celda es el contenedor de un dato estadstico individual cuyo significado est indicado por las especificaciones establecidas en las etiquetas de la columna y la fila que se interceptan. Un valor de celda vaco puede interpretarse de muchas maneras, entre ellas, como un error de trascripcin o como ausencia o inexistencia del valor, por ello, es absolutamente necesario que cada celda contenga un dato, si su valor es cero debe colocarse, igualmente si la informacin respectiva no est disponible debe estar indicado con alguna convencin, por ejemplo, las siglas N.D., S.I., etc.
D Notas al Pie: Las notas al pie de las tablas, tal como se mencion anteriormente, se utilizan

para hacer aclaratorias sobre uno o varios elementos contenidos en la misma. En la Figura N 23, la celda 2,2 contiene una marca (una a en negritas) que invita a leer la nota al pie, la informacin que contendra la nota, puede variar entre indicar que el valor es slo estimado, hasta sealar una explicacin si ste variase mucho respecto a los otros valores reportados.
D Fuente: La nota sobre la fuente indica el origen de los datos recopilados en el cuadro. El

objetivo al proporcionar la fuente de los datos es doble, por una parte se reconoce a la persona
83

u organismo que recopilo y/o publico los datos, y por la otra, se le permite, a quienes deseen verificar o ampliar la informacin, acudir a consultar la fuente por ellos mismos. Lo apropiado ser entonces que la fuente sea suficientemente completa como para servir a ambos propsitos. A pesar, de que en la Figura N 23 la nota sobre la fuente de los datos se coloc en la parte inferior de la tabla, ocurre de forma menos frecuente que algunos autores la incluyan en la nota de encabezamiento, debajo del ttulo. En ocasiones, cuando la fuente de los datos se sobrentiende se puede omitir, esta situacin ocurre cada vez que los datos son recopilados por el autor del reporte. Es posible que para algunos lectores exista confusin entre las notas al pie y las notas de encabezamiento, en particular, su relacin con el ttulo del cuadro. Con fines aclarativos puede sealarse que la relacin entre el ttulo y la nota de encabezamiento es muy prxima, mientras que entre el ttulo y las notas al pie suele ser remota debido a que las notas al pie slo se requieren si una porcin muy especfica de los datos en la tabla debe ser explicada; en cambio, las notas de encabezamiento son ms frecuentes por su capacidad para limitar la extensin de los ttulos.

b)

C LASIFICACIN

DE LAS

T ABLAS E STADSTICAS

Existen distintos pareceres para clasificar a los tablas estadsticas, a tal efecto en este texto emplearemos una tipologa relativa a dos criterios no necesariamente excluyentes, ellos son: a) propsito, en cuyo caso se reconocen tablas de referencia y tablas analticas, b) clasificacin de los datos por el cual se tienen tablas clasificadas en un solo sentido, tablas de clasificacin cruzada, y tablas de clasificacin mltiple.

i).- Tablas de Referencia


Estos cuadros tambin denominados tablas de propsito general, depsitos o fuente, son por lo general muy extensas, pudiendo ocupar varias pginas al publicarse. Su objetivo es actuar como un almacn de informacin estadstica que pretende dar informacin detallada que sirva como referencia y no como trmino de comparacin entre las distintas partidas. Deben disearse en forma tal que sea sencillo para el lector localizar cualquier dato particular en la misma, ello se logra, listando las categoras ordenadas por algn criterio preestablecido, entre otros suelen usarse: alfabtico cuando las categoras son textuales, numrico ascendente si estn codificadas, o cronolgicos si se refieren al tiempo. Los cuadros generales o de referencia, por el hecho de que
84

frecuentemente contienen demasiada informacin, no permiten realizar, a partir de ellos, un anlisis sencillo de las relaciones entre las diferentes categoras o series que puedan contener.

ii).- Tablas Analticas o de Resumen


Resultara imprctico informar a quien toma las decisiones solamente sobre los resultados obtenidos de la enumeracin o medicin de la realidad de un colectivo. Tambin es importante dar a conocer sobre las posibles relaciones subyacentes a los datos o brindar respuesta a alguna inquietud especfica sobre el fenmeno que los genera, cuando se requiere satisfacer un propsito investigativo que responde alguna pregunta especfica, por ejemplo: cmo se comparan la condiciones ambientales entre dos das de produccin cuyo nmero de piezas defectuosas difiere notablemente?, se construyen tablas analticas. Los cuadros analticos pueden formarse directamente con los datos obtenidos de los experimentos estadsticos en cuestin o pueden ser producto de la reduccin de uno o de varios cuadros generales o de referencia. Las tablas analticas son de tamao relativamente reducido para poder resaltar en forma clara los datos que se encuentren relacionados. Se trata, en lo posible, que ocupen una sola pgina para permitir que los datos se vean en su totalidad, ya que de lo contrario se dificultara su estudio. Tambin resulta esencial que los datos estn dispuestos en forma tal que se facilite el anlisis de las relaciones importantes, por ejemplo, la mayora de los lectores sienten que es ms fcil relacionar y comparar datos arreglados en columnas en vez de filas [Neter & Wasserman, 1954]. Adicionalmente, resulta evidente que los datos se compararen con mayor facilidad si estn cercanos entre si, es decir, los datos deben en lo posible colocarse de tal forma que las comparaciones se lleven a cabo entre columnas o filas adyacentes. No obstante, existen otros argumentos menos sofisticados que limitan la seleccin de las categoras que se colocan en cada parte del cuadro, entre otras, si la lista de clases es muy extensa o requiere de etiquetas detalladas, imperativamente debe ubicarse en la matriz de la tabla porque es la ubicacin con mayor espacio disponible para rotular. El principio general que debe tomarse en cuenta para que una tabla se convierta en una herramienta efectiva para el anlisis y la toma de decisiones, puede resumirse en que los datos contenidos en un cuadro deben estar dispuestos para favorecer el descubrimiento de las analogas entre las series estadsticas o las categoras resumidas en l. Siempre que no impida la percepcin de alguna relacin relevante, es conveniente ordenar las clases a partir de su tamao u orden de magnitud. En algunas situaciones es necesario considerar ms clasificaciones que las que pueden presentarse efectivamente en una
85

tabla, en cuyo caso, es mejor construir una serie de tablas relacionadas, cada una de las cuales presenta claramente un grupo particular de las relaciones que quieren ser destacadas.

Es una buena y habitual prctica que los cuadros estadsticos incluyan filas y columnas que resuman los datos presentados. Este resumen suele ser una totalizacin, en otras ocasiones puede mostrar algunos clculos estadsticos relevantes como el promedio o la desviacin. El uso adecuado de las columnas y filas de resumen es una caracterstica que exhiben las presentaciones tabulares efectivas, en muchos problemas, ellas constituyen un insumo importante para el anlisis de los datos, en particular cuando se desean destacar proporciones desbalanceadas y posiciones relativas.

La ubicacin de las filas y columnas de resumen dependen del inters del analista en destacar los aspectos generales o los particulares. Si el nfasis se desea en lo general, la fila de resumen debe colocarse arriba y la columna a la izquierda de los datos que resumen; en caso contrario, debe ubicarse la fila posterior y la columna a la derecha de las series resumidas. La razn de esta ubicacin radica en que el lector promedio procesa la informacin de izquierda a derecha y desde arriba hacia abajo, por lo tanto, las ubicaciones sugeridas provocan que el lector fije su atencin primero en lo que se desea subrayar.

iii).- Tablas en un solo sentido

Cuando los datos que se deben mostrar pueden ser discriminados en una sola clasificacin, el cuadro estadstico que los contiene se identifica como un cuadro clasificado en un solo sentido. Este tipo de tablas son las ms sencillas, sin embargo, no estn restringidas a presentar una sola serie estadstica, mientras que ambas series se refieran a datos de la nica clasificacin que se muestra.

El sentido de la clasificacin es indistinto, es decir, las categoras pueden ser las etiquetas de la filas o de las columnas. Las tablas referenciales suelen estar clasificadas en un solo sentido. En la prxima figura se ilustra este criterio y algunas de sus peculiaridades:

86

FIGURA N 24 ESQUEMA DE TABLAS CLASIFICADAS EN UN SOLO SENTIDO

En la figura se puede observar la representacin de una o dos series, en ambos casos, la clasificacin est hecha en un solo sentido porque las nicas categoras son: a) profesores, b) administradores, y c) servicios. Ntese que en este tipo de cuadros solo puede haber resumen en el sentido de la clasificacin, en particular en la Figura N 24, no tendra ningn sentido que aparezca una columna resumen. Tambin es interesante destacar como el ttulo se ajusta para explicar de manera suficiente los datos que se presentan, en la tabla inferior se agreg una nota de encabezado que aclara las unidades en que se presenta la informacin. En los cuadros estadsticos, frecuentemente se utilizan porcentajes, tal como aparece en la parte inferior de la Figura N 24. La finalidad del uso de los porcentajes en los cuadros es facilitar la comparacin, de tal manera que las relaciones que puedan existir se perciban. Cuando se muestran valores porcentuales es indispensable researle al lector la unidad que representa el total. En la figura usada como ejemplo en esta discusin puede observarse que en la fila de resumen el total correspondiente a columna porcentaje suma 100; esto le indica al lector que la base de cada porcentaje es nmero total de empleados. El total de porcentajes se pudo haber omitido, ya que por tener la tabla una sola columna sola clasificacin, resulta evidente a quin se refieren los totales, aun cuando no exista duda en cuanto a quin representa la totalidad es una buena prctica acostumbrarse a totalizar los por cientos siempre, dado que una omisin de este tipo de cuadros ms complejos hace difcil determinar a cul de las partidas estn referidos los
87

mismos. Existen cuadros que slo poseen datos en forma de porcentaje, mientras que otros, como la Figura N 24, vienen expresados tanto en valores absolutos como en porcentajes.

iv).- Tablas de Clasificacin Cruzada


En ocasiones, se aprovecha el espacio que ocupa la tabla para reflejar clasificaciones en ambos sentidos, en vez de series en uno y categoras en el otro, tal como se realiz en la parte inferior de la Figura N 24. Cuando los datos pueden ser clasificados en categoras mutuamente excluyentes, empleando ms de un criterio, los arreglos tabulares exhiben ventajas evidentes. En esos casos cada una de las celdas representa los valores que simultneamente exhiben la caracterstica relativa a la clasificacin horizontal y a la vertical. Las etiquetas de las filas designan las clases acordes a unos de los criterios y las de las columnas respetan el otro, los criterios correspondientes sern escritos en el encabezado de la matriz y en el subttulo maestro, respectivamente. Esta construccin se ilustra en la siguiente figura:

FIGURA N 25 CARACTERSTICAS DE UNA TABLA DE CLASIFICACIN CRUZADA

En la figura se muestra como se clasifican los datos en categoras mutuamente excluyentes, la clasificacin vertical corresponde al criterio sexo de la persona empleada e incluye una columna de totalizacin a la derecha; mientras que la clasificacin horizontal corresponde al criterio ocupacin y se sumarias en la ltima fila. Por ejemplo, la celda 2,2 de la tabla ilustrada representa el nmero de mujeres dedicadas a labores administrativas en la situacin a la que se refiera el cuadro. Las tablas estadsticas de clasificacin cruzada deben contabilizar en las filas y columnas de resumen la totalidad de los datos recopilados, sin embargo, hay casos donde es innecesario, o no es factible presentar los datos de todas las clases individuales en que se representa la variable en cuestin, en situaciones como la descrita es recomendable agrupar las clases irrelevantes segn el objeto del estudio en una fila o columna, segn sea el caso, etiquetada como otros o todos los
88

dems. Si la situacin se presenta en las filas, la fila compuesta se ubica en la parte inferior de la
tabla, mientras que en el caso de una columna compuesta se coloca a la extrema derecha del cuadro.

v).- Tablas de Mltiples Clasificaciones


Otro tipo de tabla que podemos encontrar son las tablas de clasificacin mltiple, donde la multiplicidad se refiere al nmero de secciones que presenta, pudiendo ser dobles o triples, multiplicidades superiores no son frecuentes. Cada seccin corresponde al valor de una variable o categora cuyo anlisis puede ser refinado mediante la agrupacin de los datos que pertenecen a ella en subcategoras ms especficas. Un ejemplo se muestra en la Figura N 26.

FIGURA N 26 ESQUEMA DE UNA TABLA DE CLASIFICACIN CRUZADA MLTIPLE

Es importante que el lector note que la tabla de la figura precedente tiene las siguientes caractersticas, en primer lugar, corresponde a una tabal de clasificacin cruzada, debido a que toda tabla con clasificacin mltiple no puede estar dispuesta en un solo sentido, adicionalmente, se puede constatar que la multiplicidad se verifica en uno slo de ellos: el horizontal. En ocasiones ambos sentidos de clasificacin pueden exhibir ms de una seccin. Otra caracterstica relevante se puntualiza en el hecho de que cada seccin presenta su propia fila de resumen, donde se totalizan en este caso los valores para cada perodo de ocupacin.

89

c) C ONSIDERACIONES E STADSTICAS

PARA

O BTENER I NFORMACIN

DE LAS

T ABLAS

Cuando usted se encuentre en la situacin de tener que leer los datos que se le presentan en forma de cuadro estadstico debera hacerlo siguiendo un proceso delimitado por ciertas guas metodolgicas, entre otras que pueden ser tiles para muchas de las presentaciones tabulares se tienen:
9 Antes de fijarse en los nmeros, uno debe tener claro acerca de lo que la tratan los datos

contenidos en la tabla y del tipo de informacin que puede derivarse de ellos.


9 Observar primero los valores totales o de resumen es una buena costumbre para obtener un

marco general de orientacin.


9 Piense acerca de los datos que usted podra calcular, a partir de aqullos contenidos en la

tabla, y que podran esclarecer la informacin presentada; entre otros estos clculos pueden referirse a totalizaciones, variaciones, porcentajes o proporciones. Una vez culminado la inspeccin de la tabla bajo las consideraciones antes descritas usted debe escribir sus hallazgos, enfatizando lo importante y omitiendo lo trivial. Haciendo referencia a la Figura N 26 puede comenzar con una frase como: ...los datos de los profesores de sexo masculino empleados por menos de cinco aos revelan que.... Siempre debe estarse atento de las unidades a las que se refieren los datos cuantitativos presentados, recordando que muchas veces los nmeros que se muestran en una tabla pueden representar millones, miles o cientos de unidades, en vez de la cifra reflejada en aras de exhibir una presentacin ms elegante. Otra prctica aconsejable consiste en colocar los datos derivados por usted en otra tabla si es el caso que su extensin lo amerita, por ejemplo, si son ms de tres o cuatro. Cuando est redactando sus observaciones existen ciertas precauciones que debe procurar, entre ellas, no debe convertir la tabla y los datos reflejados en ella, en una presentacin textual de los mismos, visto que se perdera su funcionalidad y restara inters a quienes vayan a leer sus argumentos. Tambin es importante que usted no vaya a comenzar a escribir acerca de un dato cualquiera y saltar luego en forma que parezca aleatoria a otros sin ninguna razn aparente; en lo posible, debe tratar de mantener una coherencia en la redaccin que puede en principio soportarse en un eje direccional establecido por las relaciones entre los datos que revela la conformacin, diseo y estructura del cuadro estadstico. Cuando se analiza los datos que se muestran en una tabla debe evitarse asegurar lo que no est demostrado por los datos, si usted desea especular o realizar conjeturas explicativas de los datos debe comenzar la frase con:
90

Posiblemente esto es debido a.... Lo escrito en esta seccin del captulo no pretende ser ms que unas pequeas guas para mitigar la inexperiencia del lector al enfrentar datos presentados en forma tabular, sin embargo cada tabla presenta sus propias dificultades y una de las mejores formas de ganar experiencia radica en leer frecuentemente ejemplos de comentarios de tablas bien elaborados.

d)

R ESUMEN

En este captulo se ha discutido las ventajas de presentar la informacin estadstica en arreglos tabulares autocontenidos, sin embargo tambin se le ha indicado cuando es apropiado presentar los datos en forma textual. Se describieron las partes de un cuadro estadsticos, haciendo nfasis en sus caractersticas y las buenas prcticas para hacerlas lo ms efectivas posibles. Se distingui entre tablas de referencia y tablas analticas discutindose cuando y donde colocar filas y columnas de resumen que permitan aclarar la informacin presentada y extraer conclusiones interesantes. Se le mostr como usar clasificaciones cruzadas y mltiples para abordar realidades complejas de manera eficiente. Adems, se le proporcionaron consejos acerca de cmo descifrar la informacin que se encuentra en una tabla estadstica. Toda esta informacin ser valiosa en su desempeo acadmico y profesional y puede constituir una excelente referencia en un futuro, en el prximo captulo se discutir como hacer ms atractiva la presentacin de ciertos datos relevantes al usar la impresin visual para transmitir la informacin y captar la atencin mediante presentaciones grficas.

e)

E JERCICIOS P ROPUESTOS

1.- Analice el siguiente informe del consumo de energa elctrica en Gigavatios-hora, en Colombia en el ao 1995. Consumo total: 18.709; para uso industrial: 5.671; comercial: 2.195; domstico: 7.816; oficial y alumbrado pblico: 3.027. A partir de estos datos elabore un cuadro que destaque; a) el porcentaje de cada grupo sobre el total; b) la suma de los otros tres.

2.- En una empresa industrial la nmina de pago mensual por estamentos en cierto mes se comport de la siguiente manera: personal de administracin: $ 423.380,00; personal de ventas: $ 560.325,00; personal de produccin: $ 2.360.420. Elabore un cuadro que destaque: a) el porcentaje de cada categora con base en el total de la nmina; b) el porcentaje de la nmina de pago de cada categora y del total con base en el total de ventas que fue de $ 10.775.514,00.

91

3.- Un colegio tiene 1.740 alumnos y para su funcionamiento tiene el siguiente personal por naturaleza: directivo: 1 rector y 2 vicerrectores; de control: 1 inspector jefe y 4 inspectores; docente: 39 profesores y 3 psiclogos; de administracin: 7 empleados; y de aseo y mantenimiento: 9 personas. Elabore un cuadro en el que se muestre: a) por personal, uno por cada tantos alumnos; b) por naturaleza de personal.

4.- A continuacin se le presenta el formato de una tabla estadstica. Sugiera mejoras que deban ser realizadas a dicho formato:
TABLA 1 GASTOS PARA UNA PLANTA NUEVA Y EQUIPOS

(Datos Estadsticos)(a)
Manufactura Actividad Bienes no Perecederos 1952 1949 1950 1951 Gran Total(c) 1949 1950 1951 1952 Bienes Perecederos Minera Ferrocarril Otros Transportes

Otros(b)

a. b. c. d.

En billones de dlares. Otros (d) incluye bienes pblicos, comercio, servicios, finanzas, comunicaciones y construccin. Gran Total de los datos de las filas superiores. No incluye agricultura

Fuente: Washington, D.

5.- Se realizaron una serie de encuestas para determinar el ingreso antes de impuestos para los ejecutivos la empresa TVB durante los aos 1998 y 1999. Estos datos fueron discriminados segn el monto del ingreso en unidades monetarias arrojando las siguientes categoras: por debajo de 1.000, 1.000-1.999, 2.000-2.999, 3.000-3.999, 4.000-4.999, 5.000-7.499, 7.500 y ms) y adems se clasificaron atendiendo al departamento de adscripcin en: Gerencia de Mantenimiento,
92

Gerencia de Sistemas, Gerencia de Ventas, Gerencia de Procura, Gerencia Logstica, Gerencia de Recursos Humanos, Gerencia de Relaciones Pblicas, Gerencia de Produccin y Otras Gerencias. Se le solicita: a) elaborar el formato de un arreglo tabular efectivo que permita registrar para cada departamento el porcentaje de total de los ejecutivos encuestados que ganen cuna cierta cantidad antes de impuestos b) Coloque dentro de la celda apropiada del formato diseado los siguientes datos: En 1998, 11% de los ejecutivos de la Gerencia Logstica ganaron entre 1.000 y 1.999 unidades monetarias antes de impuestos. En 1999, 40% de los ejecutivos de la Gerencia de Ventas ganaron 7.500 unidades monetarias o ms. En 1999, 20% de todos los ejecutivos ganaron entre 5.000 y 7.499 unidades monetarias antes de impuestos. Fuente de los datos: Auditores Externos de la Empresa TVB

93

IV. FORMAS GRFICAS DE PRESENTAR INFORMACIN


A lo largo del texto se ha enfatizado la necesidad de representar los datos estadsticos para poder obtener la informacin que se desprende de ellos, en el captulo anterior se discuti la presentacin textual de la data observando sus debilidades y las fortalezas de organizarlas en cuadros estadsticos para poder obtener una visin de conjunto del fenmeno estudiado. Los datos que se muestran grficamente suelen poner al descubierto hechos esenciales y relaciones que de otra forma pueden pasar desapercibidos, por ello, las representaciones grficas se convierten en un instrumento estadstico de gran utilidad que permite poner el acento en alguna caracterstica en particular en menoscabo de los detalles. Su uso apropiado y oportuno ser primordial en el campo profesional y las caractersticas y las tcnicas que se lo permitan sern explicadas en este captulo, al finalizar su estudio se pretende que usted sea capaz de: 1. Explicar el concepto de grfica estadstica. 2. Describir las caractersticas de cada tipo de grfica estadstica. 3. Construir las representaciones grficas correspondientes a series estadsticas dadas. 4. Interpretar la informacin presentada en una grfica estadstica.

94

Si se acepta que el sistema de representacin visual es uno de los ms desarrollados por el comn de las personas, se estar de acuerdo en que las imgenes valen ms que las palabras cuando se trata de describir una situacin cualquiera. Un grfico o diagrama, es un instrumento para presentar los datos estadsticos en trminos de magnitudes interpretadas visualmente. Las representaciones grficas se convierten en un instrumento estadstico de gran utilidad, a pesar de ello se debe reiterar que en ningn momento los grficos o diagramas son prcticas que puedan considerarse como sustitutivas, sino ms bien complementarias a las tcnicas estadsticas de agrupacin que son el fundamento de la estadstica descriptiva. A pesar del gran valor prctico que se ha argumentado, los grficos poseen ciertas limitaciones que se deben reconocer para poder emplearlos adecuadamente. En primer lugar, las grficas permiten rpidamente obtener una idea de la situacin descrita, pero carecen de la profundidad necesaria para ahondar en detalles. Los datos cuantitativos, por ser observaciones numricas, vienen representados por valores exactos que al ser llevados a una grfica slo pueden, en general, representar un aproximado de dicho valor. Otra limitacin inherente al empleo de grficas es su inconveniencia para representar tantas series estadsticas como puede hacerse en una tabla. Por tanto, es aconsejable que cuando se requiera mostrar una situacin de mltiples experimentos se empleen, en vez de una sola grfica que contenga a todos los datos, una coleccin de grficas donde en cada una de ellas se puedan representar apropiadamente algunos de los grupos de datos, de forma tal que se logre la visualizacin del fenmeno. Otra prctica muy frecuente es acompaar a las grficas estadsticas de un pequeo texto explicativo, donde se redunda en cuanto a los puntos importantes que haya que destacar. Esta redundancia se hace con el propsito de que no pasen inadvertidos los aspectos ms relevantes sobre los que se desea informar a los lectores. En trminos generales una grfica tiene presente los componentes que se despliegan en el siguiente modelo:

FIGURA N 27 ELEMENTOS QUE COMPONEN UN GRFICO 95

Ttulo y Subtitulo: El ttulo se coloca debajo del grfico y debe indicar de manera concisa y completa lo que se presenta en el diagrama, debe registrar el nombre de la serie graficada y adicionalmente puede contener el nombre de la organizacin a la que se refieren los datos y el tiempo en que se llevo a cabo su recoleccin, en ocasiones estas caractersticas opcionales y alguna otra que el autor juzgue relevante se presentan en el subttulo. Identificacin de los ejes: Deben sealarse las unidades en que se expresan los datos y ciertos valores distribuidos uniformemente a lo largo de los mismos. Si el diagrama se puede considerar muy amplio resulta conveniente repetir los valores de la escala en el otro extremo, es decir, arriba y abajo si se presenta un diagrama muy alto de forma horizontal o a izquierda y derecha de uno vertical muy ancho. En el caso en que se presenten diagramas que por su construccin requieran dos escalas, cada una de ellas debe estar plena y notoriamente identificada. Escala: La seleccin de las escalas debe respetar la proporcin entre el ancho y la altura, esta relacin depender de la configuracin y el diseo del reporte en que est incluido el grfico. Lneas de fondo: Para facilitar la interpretacin de los grficos pueden incluirse lneas de un trazado ms fino que el empleado en los ejes. De esta forma se construye una especie de malla en la que el lector puede ubicar alguno de los valores representado que le despierte inters. Cuando se representan los valores mediante curvas o lneas esta malla debe ser omitida si obstaculiza la apreciacin del fenmeno representado, en cuyo caso sirve de gua al lector las marcas de graduacin en los ejes. Marcas de graduacin: Son pequeos segmentos de recta que se trazan perpendiculares a los ejes distribuidos de forma de sealar la ubicacin de algunos de los valores, o bien, el nombre de las categoras que se representan en cada eje. Fuente de los datos: Al igual que se exige para las tablas estadsticas debe incluirse la informacin necesaria para que quien desee ahondar o validar los datos que se representan pueda hacerlo. La fuente de los datos slo se omite cuando es obvia, por ejemplo, si el autor recopil tambin la informacin. Rotulado: Es preferible que todas las etiquetas se coloquen en disposicin horizontal para facilitar la lectura, esta recomendacin slo debe exceptuarse cuando el espacio requerido para ello sacrifique la resolucin de la grfica por las limitaciones de espacio impuestas por el diseo del reporte.

96

a)

T IPOS

DE

G RFICAS

Para representar grficamente las series estadsticas, se pueden usar diferentes tipos de grficas, entre las cuales destacan: a) diagramas lineales, b) diagramas de barras, c) grficas circulares, y d) pictogramas y cartogramas. En lo sucesivo sern descritos cada uno de ellos para poder determinar sus ventajas y desventajas en las diferentes aplicaciones.

i).- Diagramas Lineales


La representacin lineal consiste en expresar en un plano bajo el sistema de coordenadas rectangulares o cartesianas varios pares de valores, conformados por un valor de una de las variables y el otro correspondiente a la otra variable. Cada pareja de estos valores, da lugar a un punto en el plano que representa un estado del fenmeno o sistema bajo estudio. La unin de cada par de puntos mediante segmentos de recta da la representacin lineal de la totalidad del fenmeno o sistema observado durante el experimento estadstico. La convencin que se sigue para ubicar las variables es colocar en el eje de las ordenadas aquella cuyo comportamiento se desea explicar o comparar, el cual se asume que depende de cierta variable independiente ubicada en el eje horizontal18. Los ejes se cruzan en un punto denominado origen que corresponde al par de valores nulos de cada variable, cada eje debe ser dividido en segmentos determinados por una escala que se toma arbitrariamente y que depender del fenmeno que se quiera representar. Es habitual que por razones de proporcionalidad ambos ejes no se expresen en una misma escala, dado que cada variable puede contarse o medirse en rdenes de magnitud distintos. Sin embargo, en ambos ejes los valores representados aumentan a medida que alejamos del origen. La forma de obtener los puntos que sern unidos para representar el diagrama se ilustra en la siguiente figura:

(a) Ubicacin del Primer Punto

(b) Ubicacin del Segundo Punto

18

En aquellos casos donde las dos variables pueden depender mutuamente (dependencia bilateral o interdependencia), se pueden colocar indistintamente una u otra variable en uno cualquiera de los ejes, y la otra variable en el otro eje. 97

(c) Todos los Puntos Ubicados

(d) Trazado de las Lneas de Unin

FIGURA N 28 BOSQUEJO DE LA CONSTRUCCIN DE UN DIAGRAMA LINEAL

En la parte (a) de la figura se representa el proceso de ubicacin del primer punto formado por el par de valores (x1, y1) se comienza trazando una perpendicular al eje x en el valor x1, luego de traza una perpendicular al eje y en el valor y1; la interseccin de ambas perpendiculares, representadas en color azul, sealar el valor del punto. El proceso se repite para cada par de datos que se desean representar hasta obtener lo que se observa en la parte (c) de la Figura N 28, posteriormente y en el orden de representacin impuesto por la variable independiente (eje x) se unen cada par de puntos con un segmento de recta, tal como se aprecia en la parte (d) de la figura, mediante trazado amarillo. Los diagramas lineales se usan frecuentemente para representar series cronolgicas y series de frecuencias cuantitativas. Por su construccin, un diagrama de lneas es especialmente til cuando se desea visualizar la relacin entre dos variables o bien cuando se desea comparar dos o ms series estadsticas. En el rea administrativa, en particular, se emplean frecuentemente para estudiar series cronolgicas porque los diagramas lineales ponen mayor nfasis en las fluctuaciones de la variable en el tiempo en vez de la comparacin entre perodos en especfico. Esta caracterstica de los diagramas lineales permite acentuar la direccin y magnitud de los cambios, lo que obliga a discernir sus causales para tomar las acciones requeridas que refuercen o corrijan los efectos observados. En las representaciones temporales se toma como norma llevar la frecuencia con que se presente la variable al eje vertical, y sobre el eje horizontal colocar la variable tiempo, tal como se observa en la siguiente figura:

98

100 90 80 70 60 50 40 30 20 10 0 1997

Millones de Unidades Monetarias

1998

1999 2000 Aos

2001

2002

FIGURA N 29 VENTAS DE LAS COMPAA TVB

La Figura N 29 permite destacar algunas de las caractersticas de los ejes comentadas previamente, en primer lugar mientras la variable independiente, es decir el tiempo, est expresado en el valor del ao calendario en cuestin, la magnitud del eje de las ordenadas est en millones, variando entre 20 y 95, con lo cual se recalca la disparidad de escalas. Adicionalmente, y tal como se suceder con estas series temporales, el eje de la abcisas no comienza en cero y por lo tanto el punto de cruce de los ejes no es, estrictamente hablando, el origen de sistema de coordenadas. Si en estos casos se comenzara en el origen las lneas quedaran desplazadas muy a la derecha y el tamao total de la imagen relativa al rea de trazado del diagrama sera mnimo. Observemos ahora como el tamao y la escala de los ejes influye en la percepcin que el lector puede hacer sobre un diagrama de lneas, mediante la construccin de una secuencia de diagramas lineales sobre el porcentaje de uso de la capacidad instalada de la empresa TVB en el perodo 1999-2002.

99

(a) Eje y con longitud desproporcionada

(b) Eje y no comienza en cero

MALA CONSTRUCCIN DE LOS EJES EN DIAGRAMAS DE LNEA (c) Eje y comienza en cero (d) Eje y muestra la interrupcin

BUENA CONSTRUCCIN DE LOS EJES EN DIAGRAMAS DE LNEA FIGURA N 30 INFLUENCIA DE LOS EJES EN LOS DIAGRAMAS DE LNEA
Porcentaje de Utilizacin de la Capacidad Instalada de la Empresa TVB (1998-2002)

Tal como se indic previamente, cuando el valor inicial de una de las variables es muy alto se suele interrumpir la escala del eje donde se va a representar tal variable con el objeto de dar una mejor visin de la grfica. Cuando se trunca el eje de las ordenadas se aumentan artificialmente las pendientes de las lneas de unin, tal como se comprueba al observar el recuadro (b) de la Figura N 30. El observador de un diagrama comnmente dirige su atencin a la altura vertical y las pendientes, cuanto ms inclinada sea una lnea se concluye que mayor es la variacin en la relacin entre las cantidades que miden los ejes, pero se puede extraer una conclusin engaosa o mal fundamentada al prestarle poca atencin a las escalas de valores de los ejes. Esta actitud en ocasiones es empleada para crear con las grficas efectos artificiosos de apreciacin a travs de una manipulacin maliciosamente hbil del eje vertical, por ello, cuando la intencin de quien presenta el reporte es destacar los cambios en una serie debe sealar la interrupcin del eje de las ordenadas en forma visible porque est sacrificando la visin de la importancia relativa de esos cambios en trminos de las magnitudes absolutas de los datos. La prctica habitual recomienda emplear una lnea quebrada, tal como se muestra en la parte (d) de la Figura N 30. Otra forma de
100

tergiversar la informacin que se muestra en un diagrama de lneas consiste en elaborarlas, consciente o inconscientemente, sobre unos ejes que no guarden una proporcin adecuada en lo relativo a su longitud, tal como se muestra en el recuadro (a) de la Figura N 30, en este caso al igual que en recuadro (b) se trasmite la sensacin de que la cada en la utilizacin de la capacidad instalada se desmorona vertiginosamente entre el ao 2001 y 2002 debido a que el segmento de lnea que une ambos valores es prcticamente vertical. Del mismo modo el incremento experimentado entre los aos 1999 y 2000 se hace ver muy pronunciado. Para evitar este tipo de deformaciones reiteramos la convencin (citada previamente en la construccin de histogramas) conocida como regla de los tres cuartos de altura. Esta costumbre se fundamenta en fijar como altura del eje vertical o de las ordenadas un valor aproximadamente igual a tres cuartos de la longitud del eje horizontal. En la prctica esto fija la escala puesto que la altura del eje y estar prxima al valor ms alto de la variable dependiente. Esta norma se aplic en las representaciones (b), (c) y (d) de la Figura N 30. Una misma grfica puede mostrar el comportamiento de varias series, cuando se emplean diagramas de lneas en estudios comparativos debe tenerse especial precaucin en la identificacin apropiada de la lnea que representa a cada serie, adems de la forzosa seleccin de una variable independiente en comn, en las series cronolgicas esto implica realizar la comparacin
100 90 80 70 60 50 40 30 20 10 0

de

varias

series

lo

largo

de

un

periodo.

La

Millones de Unidades Monetarias

Nacionales Internacionales

1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002

Aos

Figura N 31 ms abajo muestra las ventas en los dos segmentos de mercado diferenciados de la empresa TVB, desde 1992 hasta 2002. Fcilmente podemos ver que las ventas en ambos segmentos estn creciendo, con el componente nacional por adelante del componente internacional en cada uno de los aos.

101

100 90 80 70 60 50 40 30 20 10 0

Millones de Unidades Monetarias

Nacionales Internacionales

1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002

Aos

FIGURA N 31 EVOLUCIN DE LAS VENTAS DE LA EMPRESA TVB SEGN EL SEGMENTO DE MERCADO

Si en los grficos se dibujan simultneamente varios diagramas, llega un momento en el cual la vista no los puede separar y se suele crear confusin aunque stos se hayan distinguido por colores o por diferentes tipos de trazado, esto constituye la limitacin fundamental al emplear diagramas lineales como herramienta de comparacin. Cuando las series a comparar se pueden considerar como componentes de una totalidad como es el caso de la Figura N 31 puede ser relevante el comportamiento de la totalidad del fenmeno. En estas situaciones se emplean diagramas de lnea segmentados; para su construccin se ubican los puntos correspondientes a la primera serie, luego se representan los de las siguientes series mediante una serie de puntos obtenidos manteniendo el valor de las abcisas y sumando al valor de la ordenada el correspondiente al de la serie anterior, es decir Pj+1 = (xj, yj+yj+1), de esta forma el diagrama se construye por capas que deben ser diferenciadas entre si porque cada una representa un componente especfico del total. Si para tomar cierta decisin privan ms los cambios relativos que los absolutos se pude transformar el diagrama segmentado de forma tal que muestre la distribucin porcentual. Para determinar la distribucin porcentual solo se requiere dividir la magnitud de cada componente entre la suma de las magnitudes de todos ellos y multiplicarlo por cien. La ltima serie que se representa siempre estar mostrada por una lnea horizontal dado que la totalidad de cualquier fenmeno observado corresponde al 100% y por ende no es necesario calcularla. En los casos en que se construyen grficos de lneas segmentados es preferible rellenar, sombrear o colorear el rea delimitada por las lneas para aumentar la claridad de interpretacin. Las caractersticas aqu planteadas se muestran en la siguiente figura:

102

Millones de Unidades Monetarias

Millones de Unidades Monetarias

100 80 60 40 20 0
1992 1994 1996 1998 2000 2002

100% 80% 60% 40% 20% 0%


1992 1994 1996 1998 2000 2002

Nacionales Internacionales

Aos Internacionales Nacionales

Aos

FIGURA N 32 VENTAS TOTALES Y POR SEGMENTO DE MERCADO DE LA EMPRESA TVB, PERODO (1992-2002)

Despus de haber pasado revista a las principales caractersticas de estos diagramas se pueden resumir algunas reglas para el trazado de diagramas lineales: 1. El cero de la escala vertical siempre debe colocarse. Si se hace necesario interrumpir la escala vertical, esto debe mostrarse en forma clara y franca con una lnea quebrada. 2. La curva debe trazarse ms gruesa que las coordenadas para que resalte. 3. Los ttulos deben ser claros y todos los letreros y notas deben colocarse en el sentido de la lectura, si el espacio lo permite se prefiere que sea horizontalmente. 4. Las unidades que se utilizan deben destacarse claramente. 5. La longitud de los ejes debe seleccionarse de modo que la grfica resulte balanceada a lo alto y ancho (regla de los ). 6. Si hay que mencionar puntos particulares de la curva, deben indicarse con notas al pie. 7. Indique siempre la fuente de informacin.

ii).- Diagramas de Barras


Esta forma de representar los datos se utiliza con mucha frecuencia debido a la facilidad de interpretacin que presenta para cualquier lector. Una grfica de barras puede usarse para describir cualquiera de los niveles de medicin: nominal, ordinal, de intervalo o de razn, por ello comnmente se emplean para mostrar distribuciones cuantitativas donde la variable toma pocos valores distintos, tambin para distribuciones de frecuencias cualitativas y por ltimo, suelen ser empleadas para representar series de tiempo. Las grficas de barras pueden acomodar las barras en posicin horizontal o vertical, prefirindose la primera cuando las categoras son cualitativas y cuando las etiquetas que las rotulan son relativamente extensas y las segundas cuando se representan series de tiempo. La magnitud con que viene expresada la variable es determinada por la longitud de las barras y no su amplitud, de hecho las barras deben tener el mismo ancho. Esta caracterstica diferencia radicalmente a los histogramas de las grficas de barra, porque en

103

los primeros las frecuencias (que corresponden al valor de la variable) estn indicadas por el rea de la barra19, adems los histogramas se presentan siempre en forma tal que las categoras estn en el eje de las abcisas y por ende las barras son verticales. Es conveniente, con el objeto de dar una visin objetiva del fenmeno, que las barras tengan una balanceada proporcin, es decir, que no sean ni excesivamente cortas ni anchas, ni demasiado largas y angostas. Se debe dejar un espacio entre las barras que formen la grfica, con la finalidad de facilitar al lector la identificacin de la correspondencia entre las barras y sus etiquetas. Dicho espacio debe estar relacionado con el ancho de las barras para que ellas no estn muy separadas ni que el espacio sea demasiado pequeo; un criterio histricamente utilizado es hacer este espacio igual a la mitad del ancho de las barras. Para elaborar un diagrama de barras se debe completar la siguiente secuencia: 1. Decidir la direccin de las barras evaluando la longitud de las etiquetas y la caracterstica que se va a exhibir. 2. Tomar un sistema de coordenadas rectangulares y colocar en el eje correspondiente (de las abscisas si la presentacin es vertical y de las ordenadas en caso contrario) las etiquetas que muestran los valores que toma la variable y en el eje contrario se expresan las magnitudes a visualizar. Si la presentacin es vertical estos rtulos se acomodan a la derecha, mientras que en la configuracin horizontal se ubican en la parte superior como un encabezado. 3. Construir, tomando como base al eje correspondiente, unas columnas o barras, cuya altura o longitud ser igual a cada una de las distintas magnitudes con que se presenta cada categora o valor de la variable. Resulta ventajoso para la lectura de la grfica que se dibujen lneas correspondientes a los valores de las marcas presentadas en el eje de magnitudes, de forma tal que el rea de trazado de las barras o columnas se ubique sobre una especie de malla, en vez de una superficie blanca. 4. Si el nivel de medicin de los valores de la variable que corresponden a cada barra o columna es nominal, deben arreglarse en forma tal que reflejen su magnitud, bien sea en orden creciente o decreciente, con la finalidad de facilitar las comparaciones entre ellas. 5. Si existe una categora del tipo todas las dems o miscelneos la barra que la represente debe ubicarse al fondo del diagrama o bien la columna debe presentarse completamente a la derecha del mismo, independientemente de que se contrare el inciso
19

Slo en los casos de intervalos de clase del mismo ancho, como la base de cada barra es idntica, la frecuencia y la 104

anterior, puesto que estas categoras representan un conjunto de clases relativamente insignificantes. Tambin se aplica este acuerdo cuando se desea mostrar un valor estndar o de comparacin, por ejemplo, un tiempo promedio de ejecucin cuya barra o columna respectiva ser menor que algunas y mayor que otras. Algunos autores suelen destacar mediante sombreado o coloracin diferencial estas barras o columnas. 6. Tal como se seal, en los diagramas de lnea pueden ofrecerse interpretaciones mal fundamentadas o artificiosas si la escala de magnitudes no comienza en cero. Sin embargo, es factible que existan casos donde los valores estn concentrados en alguna categora en particular, en cuyo caso la longitud de esta barra o la altura de la columna pertinente ser desproporcionada respecto a las dems, inhabilitando las comparaciones que puedan surgir entre las otras categoras. En estas situaciones debe procederse interrumpiendo la barra ms alargada en el valor apropiado para observar a las otras y sealando explcitamente la magnitud que sta representa. Recordemos nuevamente que si se desean presentar magnitudes absolutas se exige la clara identificacin del valor cero para poder realizar comparaciones vlidas por medio de razones o proporciones. Hasta ahora se han expuesto las tcnicas y limitaciones de los grficos de barra, sin embargo slo se ha considerado la construccin de barras o columnas individuales sin segmentar. Estas otras cualidades, agrupacin y segmentacin, amplan la versatilidad y funcionalidad de los diagramas de barras. Se pueden reconocer cuatro posibilidades para los grficos de barras o columnas: a) individuales sin segmentar, b) segmentadas, c) agrupadas, y d) bidireccionales. A continuacin se puntualizarn las diferencias y las posibles aplicaciones. Las grficas de barras o columnas segmentadas se dibujan mediante segmentos de tal manera que cada uno represente las partes componentes de un total y la longitud de la barra o altura de la columna reflejar la suma de las magnitudes de cada componente. Los segmentos deben diferenciarse adecuadamente, para lograr este propsito se suelen sombrear de distintas maneras o gracias a los equipos de impresin modernos se les dan distintos colores. Debido a que los segmentos se apilan en orden de aparicin, todos los segmentos que no emerja directamente de la base de la barra o columna comenzarn en sitios diferentes por lo cual la nica comparacin sencilla de realizar respecto a los componentes entre s sucede con el segmento inicial. Estas

altura de la barra son coincidentes. 105

representaciones son tiles para tratar de descubrir o resaltar proporciones, mientras se mantiene el enfoque en los totales. Cuando lo que reviste inters es la comparacin entre varios componentes de una variable, y simultneamente visualizar la relacin entre las distintas categoras de dicha variable la presentacin ms adecuada consiste en diagramas de barras agrupadas. Las grficas de barras agrupadas consisten en construir, en conjuntos diferenciables, distintas barras o columnas que correspondan a la comparacin de dos series de datos durante varias categoras, pudiendo corresponder cada grupo de barras a distintas partes componentes de un total o ser partes diferentes totales. Tambin se pueden comparar mediante este tipo de grficas, dos o ms categoras en perodos de tiempo distintos. Cuando se usan grficas de barras agrupadas lo usual es no dejar espacio entre dos barras correspondientes a un grupo y dejar un espacio prudencial entre los grupos de las barras; espacio que puede, como se acot para las barras individuales, la mitad del ancho de una de las barras. Las grficas de barras agrupadas no permiten, a diferencia de las segmentadas, la comparacin entre totales. Una ilustracin con fines comparativos de la apariencia de los tipos de grficos de barras que se acaban de precisar se tiene en la siguiente figura:
900 Miles de Unidades Monetarias Cobre Hierro

600

300

0 1994 1995 Aos 1996 1997

(a) Columnas Agrupadas


1200
Miles de Unidades Monetarias
Cobre Hierro

900 600 300 0 1994 1995


Aos

1996

1997

(b) Columnas Segmentadas


FIGURA N 33 COMPRA DE MATERIA PRIMA PARA RECICLAR POR LA EMPRESA TVB 106

Es interesante destacar que la observacin de la parte (a) de la figura muestra la inexacta apreciacin de que la inversin en materia prima reciclada se incrementa en el ao 1996 cayendo ligeramente al ao siguiente, debido a la proporcin que representan las compras de material de cobre respecto al ferroso. En cambio cuando se observan los totales en las columnas segmentadas de la parte (b) se nota el efecto real que es justamente el contrario, una declinacin leve en el 96 y un aumento ligero en el 97. Es interesante destacar que las barras agrupadas mantienen la claridad cuando representan tres, mximo cuatro, modalidades; si las necesidades superan estas limitaciones es mejor emplear grficos lineales para representar las series correspondientes a cada modalidad, adems, Neter y Wasserman, (1954) sostienen que es ms efectivo rotular directamente las barras en vez de suministrar una leyenda. Las barras segmentadas son muy efectivas cuando presentan dos componentes, a partir de all es ms la informacin que ocultan que la que revelan. En las situaciones donde se desean representar cantidades positivas y negativas es til emplear diagramas de barras de dos direcciones. Estos casos pueden ser, entre otros, ganancias y prdidas, porcentajes de cambio en el tiempo, desviaciones alrededor de un estndar, etc. Difieren de los otros diagramas vistos hasta ahora en que las barras se extienden a la derecha y a la izquierda de una base vertical o lnea cero. Debe procurarse que las barras que representan cantidades positivas se ordenen en forma descendente y en sentido contrario las que muestran cantidades negativas, de forma tal que se favorezca la comprensin del diagrama. Barras agrupadas y/o segmentadas tambin pueden exhibirse en dos direcciones, recordando que en la misma medida en que aumenta la elaboracin y el nivel de detalle que se plasma en un diagrama se disminuye su efectividad como transmisor de informacin. La siguiente figura es un ejemplo del uso de diagramas bidireccionales:

Deshumidificadores Aires Acondicionados Neveras Congeladores Chillers


-25 -20 -15 -10 -5 0 5 10 15 20 25

Porcentaje (%)

FIGURA N 34 CAMBIOS PORCENTUALES DEL AO 2001 RELATIVO AL AO 2000 DE LA PRODUCCIN DE LA EMPRESA TVB, SEGN EL TIPO DE PRODUCTO 107

Por ltimo, conviene recordar que los diagramas de barras, como todos los tipos de grficas, tienen por finalidad dar una visin simplificada del fenmeno, por tanto nunca se debe sacrificar la claridad en aras de la cantidad de la informacin presentada, es decir, no es apropiado recargarlos con demasiadas partes componentes o barras agrupadas ya que esto genera grficas muy complejas.

Un diagrama de difcil interpretacin ser inefectivo en su propsito, por ello, es prudente reiterar que un buen grfico quedar balanceado, mostrar un espacio entre las barras, y presentar lneas de fondo. El autor siempre debe evaluar el producto final con criterios estticos y verificar la claridad en la apreciacin visual.

En ocasiones la esencia de la informacin que desea presentarse demanda el uso de diagramas combinados. A continuacin se presentan algunas posibles aplicaciones con la finalidad de propiciar la reflexin acerca de lo necesario que resulta destacar visualmente los aspectos de mayor relevancia, segn lo demande la decisin que debe tomarse en cada situacin:
100 90 80 70 60 50 40 30 20 10 0 Nmero de rdenes

No Completadas

1er trim.

Entregadas

Recibidas

2do trim.

3er trim.

4to trim.

FIGURA N 35 NMERO DE RDENES DE PEDIDO RECIBIDAS, ENTREGADAS E INSATISFECHAS, EMPRESA TVB AO 1997

La Figura N 35 permite a quin evala la relacin con los clientes, no slo saber el comportamiento del volumen de pedidos (rdenes recibidas) que en este caso presenta poca variacin, sino simultneamente saber que la cantidad de rdenes no entregadas se ha estado incrementando durante el ao a causa de una disminucin sostenida de los envos. Otro arreglo permite comparar la produccin actual con la planificada, como se muestra en la siguiente figura:

108

300
Produccin Planeada Acumulada

250 200 150 100 50 0


Producin Real Produccin Real Acumulada

Nmero de rdenes

1er trim.

2do trim.

3er trim.

4to trim.

FIGURA N 36 NMERO DE RDENES PRODUCIDAS POR LA EMPRESA TVB EN EL AO 1997

La Figura N 36 permite al observador ver la brecha existente entre la produccin planificada y lo llevado a cabo realmente, adems de visualizar simultneamente el comportamiento trimestral para poder puntualizar en las causas donde se produjo mayor desvo respecto a las metas. Un ejemplo, donde se compara contra un estndar se ilustra de seguido:
Miles de Unidades Monetarias 55,0 52,5 50,0 47,5 45,0 1er trim. 2do trim. 3er trim. 4to trim.

Costo Estndar

FIGURA N 37 COSTO DE PRODUCCIN UNITARIA DE CONDENSADORES TIPO A, EMPRESA TVB (AO 1997)

En el ltimo de los diagramas, el encargado de tomar las decisiones puede observar que las desviaciones respecto al estndar no son muy pronunciadas, lo cual permite asumir que el valor fijado est bien colocado y puede ser satisfecho por la empresa. Asimismo, se observan fluctuaciones alternativas en el sentido de la variacin de los costos de produccin, pudiendo ahora inferir que al presentarse un trimestre con costos bajos se relajan las condiciones de operacin provocando el aumento sucesivo, desatando medidas restrictivas que inciden en la baja posterior. Una presentacin en conjunto de las dos ltimas figuras permite presumir una relacin entre el nivel de produccin y el costo unitario de cada pieza. Ambas inferencias pueden dar pie a otras investigaciones que permitan afianzar las conclusiones.

109

iii).- Grficos Circulares


Este tipo de grfica se utiliza para presentar los tamaos relativos de las partes componentes de una globalidad, mediante alcuotas superficiales de un crculo proporcionales a las magnitudes de los datos, asemejando las rebanadas de un pastel, por lo que se les denomina con frecuencia diagramas de torta. Una grfica de pastel es especialmente til para describir datos de nivel nominal, ejemplos clsicos de su aplicacin en el contexto industrial seran la representacin de la distribucin de los costos de produccin, la distribucin de los empleados segn algn atributo de inters como formacin profesional, la distribucin de las ganancias o de las ventas de una empresa entre otros. Para construir un diagrama de torta se considera al crculo como la representacin de la totalidad del fenmeno estudiado; por tanto, se requieren representar tantas secciones como partes componentes tenga el fenmeno en estudio. La superficie de cada una de las secciones en que se dividir del crculo deben ser proporcionales a la magnitud de cada componente representado. Para ello, se calculan los grados del arco que corresponden a ciertos valores porcentuales uniformes (p.e. en intervalos del cinco por ciento: 0, 5, 10,..., 95) por medio de una sencilla regla de tres que distribuya los 360 grados proporcionalmente a las cifras20 y se registran en el permetro del circulo manualmente hablando con la ayuda de un transportador. Ahora, si usted desea graficar el 55 por ciento de participacin en el total, trace una lnea desde cero hasta el centro del crculo y despus otra lnea desde el centro hasta el punto de la circunferencia donde registr el valor de 55%. Para representar otras porciones debe proceder en dos pasos, primero agregue al 55 por ciento que ya ubic, la prxima cantidad; supongamos ahora que la siguiente categora en importancia representa un 19 por ciento, el resultado de la suma es 74 por ciento; luego, el rea abarcada entre 55 y 74 por ciento representar la nueva alcuota, en consecuencia, usted deber trazar una lnea desde el centro del crculo hasta el punto del permetro que corresponda al valor 74. Como en la construccin que propusimos se sealaron los valores cada 5%, no se observa una marca para el 74%. Para ubicarla debern marcarse los puntos correspondientes al 1% dentro del sector comprendido entre 70 y 75%. Este procedimiento se reitera hasta agotar los componentes que deben ser representados, ntese que la ltima fraccin queda dibujada automticamente, que en nuestro caso podra representar una clase del tipo todas las dems. Una vez marcada con las lneas radiales la circunferencia, se rellenan de forma distintiva los correspondientes sectores circulares. El mtodo se ilustra en la

20

100% 360 5% x

x=

5% 360 = 18 100%

110

Figura N 38. Como las reas del pastel representan la participacin relativa de cada categora, podemos compararlas rpidamente. Si el ejemplo utilizado significa volumen de ventas, el mayor porcentaje de los ingresos se obtiene de la primera actividad, siendo esta cantidad ms de la mitad del total, y ms del doble de la cantidad otorgada a la categora que le sigue en tamao. Adems existen dos productos o servicios fundamentales y un grupo de pequeo impacto individual pero que genera ms recursos en conjunto que la segunda actividad importante (26% vs. 19%).

(1) Registrar ngulos uniformemente distribuidos en la circunferencia

(2) Trazar las lneas que delimitan al primer sector desde las 12 m

(3) Identificar el porcentaje acumulado (4) Trazar la lnea que delimita el segundo borde de la nueva seccin para la siguiente clasificacin
FIGURA N 38 CONSTRUCCIN DE UN DIAGRAMA DE PASTEL

Pueden puntualizarse otras recomendaciones tiles, entre ellas, sealizar cada sector del crculo con etiquetas arregladas en direccin horizontal en vez de radial; tambin horizontalmente, es adecuado expresar en la grfica los porcentajes que representan las cifras respecto del total para facilitar el trabajo y la comprensin del lector. Como en todas las grficas y diagramas la sencillez es una necesidad fundamental, es prudente emplear pocas categoras para no sobrecargar la figura. Una versin refinada del ejemplo construido en la figura previa podra verse de seguido:

111

26%
Todos los Dems Compresores Refrigeradores

55%

19%

FIGURA N 39 DISTRIBUCIN DE LOS INGRESOS POR VENTAS SEGN PRODUCTO DE LA EMPRESA TVB, AO 2001

Cuando se coloca una secuencia de diagramas circulares, por ejemplo, cuando se desea comparar en el tiempo la evolucin de cierta distribucin, deben emplearse crculos con la misma rea total para evitarle al lector interpretaciones errneas respecto a la magnitud absoluta que ellos representan.
Todos los Dems

Todos los Dems

16%
Compresores Compresores

26%
Refrigeradores Refrigeradores

55%

27%

57%

19%

(a) Ao 2001

(b) Ao 2002

FIGURA N 40 COMPARACIN DE LA DISTRIBUCIN DE LOS INGRESOS POR VENTAS SEGN PRODUCTO DE LA EMPRESA TVB, AOS SELECCIONADOS

La ltima figura mostrada permite inferir como la empresa se est dedicando a fortalecer sus principales rubros de mercado, disminuyendo la importancia relativa de la categora todos los

dems, mientras incrementa sus ingresos a partir de las ventas de la clase refrigeradores,
manteniendo aproximadamente igual el tem compresores.

iii).- Pictogramas
Los diagramas pictricos son representaciones grficas que utilizan smbolos y figuras que por su forma deben sugerir la naturaleza del dato o fenmeno que se quiere representar. Si el estudio se refiere al personal de una empresa, las figuras a utilizar sern humanas. Los pictogramas tienen como objetivo mostrar comparaciones impactantes llamando as la atencin de aquellas personas que por desinters, aversin o desconocimiento de la estadstica no observaran una grfica ms
112

formal. Son usadas como herramientas de comunicacin efectiva debido a su apariencia atractiva. El autor pone de manifiesto su creatividad tratando de trasmitir un hecho o informacin que juzgue relevante para la audiencia ante la cual se presenta. Sin embargo este tipo de diagrama se utiliza muy pocas veces como ayuda al anlisis estadstico serio del fenmeno representado, debido tanto a que los conos empleados en su elaboracin podran operar como distractores, y ms importante an, por la carencia de rigurosidad con que se ajustan a escalas precisas los valores mostrados, tal como corresponde a datos de naturaleza cuantitativa. Si se emplea un pictograma ha de estarse consciente de que quien lo observe siempre le ser problemtico comparar alturas, reas y/o volmenes; por esto, en todo trabajo con pictogramas las diferencias de magnitudes de los datos se revelan empleando un mayor o menor nmero de figuras iguales. Las aproximaciones se hacen por fraccin de figura usando mitades e inclusive cuartas partes de la misma. Las caractersticas a la que ms atencin debe prestrsele al concebir un pictograma pueden resumirse en indicar con absoluta claridad en el encabezamiento del pictograma la cantidad representada por cada figura, las representaciones pictricas se ajustan ms cuando la informacin se puede presentar en forma difana, los conos deben ser utilizados en arreglos naturales que no perturben la comprensin del observador, por ejemplo, si se estn presentando los niveles de produccin de una ensambladora de vehculos automotrices, los grupos de automviles deben mostrarse en filas horizontales y no apilados en columnas. Cualquiera que sea el smbolo grfico a emplear debe ser fcil e inequvocamente reconocible, y tal como se mencion previamente, tienen que ser representativos de aquello a lo que el dato hace referencia.

FIGURA N 41 PICTOGRAMA DEL COSTO DE PRODUCCIN UNITARIA DE CONDENSADORES TIPO A EMPRESA TVB (AO 1997) 113

En la Figura N 41 se ilustra nuevamente lo mostrado en la Figura N 37. En aquel entonces se comparaba con un costo estndar para que el gerente o supervisor de la lnea de produccin se percatara o investigara las fluctuaciones en los costos, entre las decisiones posibles podra incluirse realizar una presentacin a los empleados de la lnea de produccin para conscientizarlos y motivarlos, en este caso la presentacin en forma de pictograma puede ser ms efectiva por su capacidad para llamar la atencin.

iv).- Cartogramas

Los cartogramas son representaciones grficas empleadas para mostrar datos estadsticos cuando por su naturaleza pueden ser clasificados por reas geogrficas. Existen al menos tres modalidades para presentar los datos de una serie geogrfica en un cartograma, la ms simple de todas consiste en oscurecer o sombrear las diferentes zonas geogrficas de acuerdo a la magnitud de las observaciones. Es habitual que cuando se utiliza esta tcnica la intensidad del sombreado ser proporcional al valor de la serie en la regin respectiva, siendo ms oscuro para las magnitudes mayores y aclarndose a medida que el valor disminuye.

Una forma similar al sombreado es representar una cierta cantidad o valor por medio de un punto disponiendo, en cada regin, un nmero de puntos proporcional al valor de la serie en dicha zona. Es importante destacar que con stas tcnicas puede dificultrsele al observador comparar las magnitudes para diferentes regiones, si se codifican mediante sombras muchos niveles de valor diferentes, ser arduo distinguir entre categoras adyacentes en valor, y si se emplean los puntos, ser especialmente difcil captar el valor para aquellas zonas que exhiban los mismos en una elevada cantidad relativa al rea dibujada.

Una forma que procura, pero no logra del todo, facilitar las comparaciones es presentando mapas en los que se inserten barras que denoten la magnitud de la variable medida para cada regin. Sin embargo, son las nicas viables si se desean presentar sobre un mapa series obtenidas en diferentes oportunidades, porque podra incluirse una barra por cada ocasin donde se recopilasen datos. Esta variante permite las comparaciones cronolgicas dentro de cada regin. A continuacin se muestra un ejemplo que ilustra la densidad poblacional en el pas:
114

Fuente: http://www.a-venezuela.com/mapas/map/html/densidadpoblacional.html

FIGURA N 42 DENSIDAD POBLACIONAL EN VENEZUELA POR ENTIDAD FEDERAL

Para concluir y a manera de resumen se puede sealar que no existen reglas absolutas para la construccin de los grficos, ni tampoco puede decidirse de una manera determinstica cual es la forma de presentacin adecuada para cada situacin en particular, lo visto hasta ahora es un promotor para estimular su ingenio cuando usted decida elaborar una presentacin grfica. Adems se pretende haber indicado un conjunto de buenas prcticas y recomendaciones para construir diagramas simples y efectivos. Las representaciones grficas solo pueden ser evaluadas una vez realizadas, apoyndose en su capacidad para trasmitir al observador la informacin que al autor le interesa. Por lo sugestivas y la facilidad de evocacin que logran en la mayora de las personas, las grficas son un instrumento estadstico de gran utilidad. Los datos que proporcionan son aproximados y por esto se debe ser cuidadoso en su elaboracin e interpretacin, adems, en mltiples ocasiones son aplicadas de forma tendenciosa, con o sin intencin; por ello, siempre que vea un diagrama o una grfica, analcela cuidadosamente tratando de descubrir que pretende mostrar el autor y si podra estar sesgado presentando una visin parcializada del fenmeno.

b)

R ESUMEN

En este captulo se discutieron los aspectos ms relevantes acerca de la presentacin grfica de la informacin, en el se presentaron los elementos que debe contener un buen diagrama y se particularizaron las tcnicas para construir diagramas de barras, lneas o crculos, como elementos efectivos para la presentacin y el anlisis estadstico. Adems, se introdujeron los cartogramas y los pictogramas como herramientas para captar la atencin y mejorar la presentacin de un reporte; pero con poca rigurosidad estadstica. Se comentaron algunas de las
115

limitaciones ms importantes de los grficos y los problemas que se presentan al usar indebidamente los ejes. A pesar de su impacto y utilidad debe recordarse que los grficos no son sino aproximaciones de los valores cuantitativos debiendo ser, por tanto, un apoyo complementario y no la base de ningn trabajo estadstico serio. En general le han sido presentados para su informacin y estudio los aspectos de la estadstica descriptiva que atienen a la organizacin, clasificacin, presentacin e interpretacin de la informacin, los contenidos hasta ahora expuestos son la base de todo trabajo estadstico ulterior y, adems, se convierten en una herramienta til para aplicar en otras reas del conocimiento.

c)

E JERCICIOS P ROPUESTOS

1.- Dibuje el diagrama lineal correspondiente a las ventas de un almacn en el semestre enerojunio de un ao. El reporte de contabilidad fue: enero, Bs. 675.532.000,00; febrero, Bs. 563.684.000,00; marzo, 785.322.000,00; abril, Bs. 760.520.000,00; mayo, Bs. 821.230.000,00; y junio, Bs. 890.410.000,00.

2.- Muestre en un pictograma la serie cronolgica correspondiente a la matrcula de la UNEXPO en el ltimo quinquenio.

3.- Elabore un diagrama de barras con las exportaciones de esmeraldas de Colombia en el quinquenio 1991 1995. En millones de dlares FOB: 1991: 142,8; 1992: 179,7; 1993: 399,6; 1994: 422,4; 1995: 452,3.

4.- En una industria el informe de contabilidad muestra que la produccin fue de Bs. 62.600.000,00 y los gastos de: administracin, Bs. 11.160.000,00; materiales y energticos, Bs. 15.650.000,00; salarios y prestaciones, Bs. 18.780.000,00. Elabore a partir de estos datos un diagrama circular.

5.- El departamento de control de calidad de una fbrica que produce un tipo de tornillo de acero especial, preocupado por las desviaciones observadas en el producto, realiza un estudio aleatorio de la produccin de un da midiendo cuidadosamente una muestra. Los resultados obtenidos (en cm.) son los siguientes: 96, 96, 102, 102, 104, 104, 108, 126, 126, 128, 128, 140, 156, 160, 160, 164 y 170. Construya un diagrama apropiado y justifique su seleccin.

116

AGRADECIMIENTOS

A Rut, por su paciencia y amor, por el tiempo que sacrific para el logro de esta meta.

A Manuel Serafin, compaero incansable, amigo a toda prueba y apoyo personal. Gracias por estar conmigo y ser como eres.

117

V. REFERENCIAS BIBLIOGRFICAS
1. Arias, F.G. (1999), El Proyecto de Investigacin: Gua para su Elaboracin. (3ra. ed.) Caracas: Episteme. 2. Bessant, K., y E. MacPherson (2002), Thoughts on the Origins, Concepts, and Pedagogy of Statistics as a Separate Discipline. The American Statiscian, Vol. 56, 22-29. 3. Braselton, S. y B. Decker (1994), Understanding graphic organizers to improve the reading of mathematics. The Reading Teacher, Vol. 48, 276-281. 4. Canavos, G. C. (1987), Probabilidad y Estadstica: Aplicaciones y Mtodos. Mxico: McGraw-Hill. 5. Castillo, H., y R. Romero (2002), Destrezas Bsicas de Enseanza: El Desempeo Docente a travs de la Tcnica de la Microenseanza. Caracas: Universidad Central de Venezuela, Vicerrectorado Acadmico, Sistema de Actualizacin Docente del Profesorado. 6. Chou, Y. (1977), Anlisis Estadstico. Mxico: Interamericana. 7. Coob, G. W. y D. Moore (1997), Mathematics, Statistics, and Teaching. The American Mathematicat Monthly, Nro. 104, 801-823. 8. Crossley, M. (2000), The Desk Reference of Statistical Quality Methods. Milwaukee, WI: ASQ Quality Press. 9. Deseda, L. (1988), Mtodos Estadsticos. Caracas: Nueva Expresin. 10. Dietrich, E., y A. Schulze (1999), Statistical Procedures for Machine and Process Qualification. Milwaukee, WI: ASQ Quality Press. 11. Energy and Transportation Task Force (1996), Energy and Transportation Task Force Report. [Documento en lnea]. Presidential Council for the Sustainable Development, Washington, DC. Disponible: http://clinton4.nara.gov/textonly/PCSD/Publications/TF_Reports/energy-top.html [Consulta: 2003, Agosto 11]. 12. Garfield, J. (2002), The Challenge of Developing Statistical Reasoning. Journal of Statistics Education [Revista en lnea], Vol. 10(3) Disponible: www.amstat.org/publications/jse/v10n3/garfield.html [Consulta: 2003, Mayo 26]. 13. Garfield, J., y B. Chance (2000), Assessment in Statistics Education: Issues and Challenges. Mathematics Thinking and Learning, Vol. 2, 99-125. 14. Ginsburg, H. P. (1977), Childrens Arithmetic. Nueva York: Van Nostrand.
118

15. Gonzlez, H., Meneses, L., Rios C., y M. Fernndez (1983 Reedicin), Estadistica 1: Mdulos 0,1,2,3 y 4. Caracas: Universidad Nacional Experimental Simn Rodrguez, Vicerrectorado Acadmico, Programa de Estudios Universitarios Supervisados. 16. Haber, A., y R. Runyon (1972), Estadstica General. Los Angeles, CA: Fondo Educativo Interamericano. 17. Hald, A. (1990), A History of Probability and Statistics and Their Applications Before 1750. Nueva York: Wiley. 18. Hollis, R. J. (1997), Ideas for Improving Statistics Education. International Journal of Mathematical Eduaction in Science and Technology, Vol. 28, 569-573. 19. Juran, J., y F. Gryna (1980), Quality Planning and Analysis. (3ra. ed.) Nueva York, NY: McGraw-Hill. 20. Kettering, J. R. (1997), Shaping Statistics for Success in the 21st Century. Journal of the American Statistical Association, Vol. 92, 1229-1234. 21. Kreysig, E. (1973), Introduccin a la Estadstica Matemtica: Principios y Mtodos. Mxico: Limusa. 22. Lan, W., Bradley, L. y G. Parr (1993), The Effects of a Self-Monitoring Process on College Students Learning in a Introductory Statistics Course. Journal of Experimental Education, Vol. 62, 26-40. 23. Leach, C. (1982), Fundamentos de Estadstica: Enfoque no Parmetrico para Ciencias Sociales. Mxico: Limusa. 24. Lewes, F. (1986), Where Should We Start?. [Revista en lnea] Teaching Statistics. en The Best of Teaching Statistics Disponible: http://science.ntu.ac.uk/rsscse/ts/bts/lewes/text.html [Consulta: 2003, Mayo 26]. 25. Lind, D., Mason, R., y W. Marchal (2001), Estadstica para la Administracin y Economa. (3ra. ed.) Mxico: McGraw-Hill. 26. Lobez, J., y E. Casa (1969), Estadstica Intermedia. Barcelona: Vincens-Vives. 27. Mendenhall, W., y T. Sincich (1997), Probabilidad y Estadstica para Ingeniera y Ciencias. (4ta. ed.) Mxico: Prentice-Hall Hispanoamericana. 28. Mndez, C. E. (1995), Metodologa: Gua para Elaborar Diseos de Investigacin en Ciencias Econmicas, Contables y Administrativas. (2da. ed.) Bogot: McGraw-Hill. 29. Miller, I., y J. Freund (1970), Probabilidad y Estadstica para Ingenieros. Mxico: Revert.

119

30. Montgomery, D., y G. Runger (1996), Probabilidad y Estadstica Aplicada a la Ingeniera. Mxico: McGraw-Hill. 31. Moore, D. (1997), New Pedagogy and New Content: The Case of Statistics. International Statistical Review, Vol. 65, 123-165. 32. Moore, D. (2000), Undergraduate Programs and the Future of Academic Statistics [Documento en lnea]. Disponible: http://www.amstat.org/meetings/jsm/2000/usei/undergradFuture.pdf [Consulta: 2003, Julio 22]. 33. Neter, J. y W. Wasserman (1954), Fundamental Statistics for Business and Economics. Boston: Allyn & Bacon. 34. Newbold, P. (1997), Estadstica para los Negocios y la Economa. (4ta. ed.) Madrid: Prentice-Hall. 35. Pearson, E. S. (Comp.) (1978), The History of Statistics in the 17th and 18th Centuries: Against the Changing Background of Intellectual, Scientific, and Religious Thought, Lectures by Karl Pearson Given at University College London During the Academic Sessions 1921-1933.Londres: Charles Griffin & Company. 36. Portus, L. (1998), Introduccin a la Estadstica. (2da. ed.) Bogot: McGraw-Hill. 37. Proao, H. (1975), Estadstica Aplicada a la Mercadotecnia: Teora y Casos Prcticos. Mxico: Diana. 38. PSA Peugeot, Citren, Renault (1991), CNOMO Norm E41.36.110.N. Produktionsmittel, Zulassung der Funktionsfhigkeit von Memitteln, Spezifische Prfmittel. 39. Rice, Marti H. (2002), Statistical analyses: making sense of them in the research report. Journal of Neuroscience Nursing, Vol. 34, 105-111. 40. Seldmeier, P. (1999), Improving Statistical Reasoning: Theoretical Models and Practical Implication. Mahwah, NJ: Lawrence Erlbaum. 41. Senge, P., Kleiner, A., Roberts, C., Ross, R., Roth, G., y B. Smith (2000), La Danza del Cambio: los Retos de Sostener el Impulso en Organizaciones Abiertas al Aprendizaje. Bogot: Norma. 42. Sirias, D. (2002), Using graphic organizers to improve the teaching of business statistics. Journal of Education for Busines, Vol. 78, 33-38. 43. Spiegel, M. (1991), Estadstica. (2da. ed.) Mxico: McGraw-Hill.

120

44. Stigler, S. (1986), The History of Statistics: The Measurement of Uncertainty Before 1900. Cambrige, MA: Belknap Press. 45. Utts, J. (2003), What educated citizens should know about statistics and probability. The American Statistician, Vol. 57, 74-80. 46. Walpole, R., y R. Myers (1992), Probabilidad y Estadstica. (4ta. ed.) Mxico: McGrawHill. 47. Yamane, T. (1974), Estadstica. (3ra. ed.) Mxico: Harper & Row Latinoamericana. 48. Yule, Y., y M. Kendall (1954), Introduccin a la Estadstica Matemtica. Madrid: Aguilar.

121

You might also like