Apuntes sobre Estadística

APUNTES SOBRE ESTADISTICA (Borrador para corrección)

Héctor Medina Disla

Santo domingo, D. N. Junio 2010

Elaborado por H. Medina Disla. Junio 2010.

1

Apuntes sobre Estadística

I. INTRODUCCION Estadística: Es una metodología científica que permite recolectar, organizar y procesar datos que proporcionen información que sirvan de base para la toma de decisión. Por ejemplo aplicar una encuesta para conocer la preferencia del electorado, aplicar un tratamiento especial a un grupo de personas y observar el resultado, buscar datos sobre la matrícula estudiantil, u otro tema en particular. En cambio, cuando hablamos de Estadísticas nos referimos a un conjunto de medidas o indicadores que describen el comportamiento de un fenómeno de interés en un momento determinado. Por ejemplo, el porcentaje de lectores que prefieren a un candidato en particular, el tiempo necesario para realizar unas tarea, las unidades producidas diariamente por una empresa, las ventas de una empresa, etc. Es decir que las estadísticas representan el fin u objetivo que buscamos y la Estadística el medio para conseguirlo. 1.1 DIVISION DE LA ESTADISTICA

La Estadística como metodología científica se divide en dos ramas, la Estadística Descriptiva y la Estadística Inferencial Estadística Descriptiva: Es un conjunto de métodos y técnicas que permiten describir un conjunto específico de datos. La Estadística Descriptiva como su nombre lo indica, describe un grupo particular. Sus principales herramientas son. 1) Cálculo de porcentaje y tasas 2) Presentación tabular, (cuadros y tablas) 3) Presentación gráfica 4) Cálculo de medidas de Medidas de Tendencia Central, (promedios) 5) Cálculo de medidas de dispersión o variabilidad 6) Cálculo de números índice. 7) Otras técnicas descriptivas. Estadística Inferencial: Se refiere a un conjunto de métodos y técnicas que permite obtener información acerca de una población completa, con solo estudiar una parte de ella (muestra). La Estadística Inferencial nos permite llevar los resultados obtenidos en una muestra a la población. Sus principales herramientas son: Cálculo de probabilidades, muestreo y distribución muestral, estimación, prueba de hipótesis, análisis de varianza, análisis de regresión y correlación, otras. 1.2. Conceptos y Definiciones

Elaborado por H. Medina Disla. Junio 2010.

2

Apuntes sobre Estadística
1. Población: Es un conjunto de elementos con características parecidas o similares y que son de interés para la realización de un estudio. En términos estadísticos una población se define de acuerdo a lo que se desea investigar o estudiar. Por ejemplo si queremos conocer el rendimiento escolar de los/as niños/as de la educación básica, entonces nuestra población va a estar definida por la cantidad de niños/as inscrito en los curso de la educación básica o si queremos evaluar la calidad de la producción de una empresa, nuestra población estará formada por todas las unidades producidas por la empresa durante el periodo de interés. Muestra: Es un subconjunto de la población que se toma para fines de desarrollar una investigación. Cuando un estudio se hace a partir de una muestra, esta debe ser representativa y significativa. Se dice que una muestra es representativa cuando los elementos que componen dicha muestra contienen las mismas características que los elementos en la población de la cual se tomó dicha muestra, el concepto de representatividad se refiere a los aspectos cualitativos de la muestra. Por ejemplo si quisiéramos conocer la preferencia política de los estudiantes de la UASD una muestra sería representativa si en la misma se incluyen estudiantes de todas las edades, de todas las carreras, de ambos sexo, de todos los centros regionales, etc. de forma tal que al observar la muestra es como si observáramos la población en miniatura. Por su parte el concepto de significación tiene que ver con la cantidad de elementos que conforma la muestra. En este sentido, no existe un número de elementos específico para que una muestra sea significativa, sino, que la cantidad de elementos necesarios para que la muestra sea significativa varía de acuerdo a la características de la población. Si la población a estudiar es muy variable, se requerirá de un mayor número de elementos para que la muestra sea significativa que si la población tiende a ser homogénea, en cuyo caso un muestra pequeña puede ser significativa. 2. Parámetro: Es una medida de referencia la cual se calcula a partir de datos de una población completa. El parámetro se refiere a la medida de una variable en la población. Por ejemplo, cuando se aplican las Pruebas Nacionales y se obtiene el promedio de las calificaciones, esta medida es un parámetro de las calificaciones de los estudiantes. 3. Estimador o Estadígrafo: Es una medida calculada a partir de los datos obtenidos en una muestra y se utiliza para estimar el valor del parámetro, ya que en la mayoría de los casos, se hace difícil y muy costoso conocer el valor real o verdadero de la variable. Por ejemplo cuando se toma una muestra para conocer la preferencia política de la población, los porcentajes que se obtienen a partir de la encuesta son estimadores del porcentaje de real de preferencia de todos/as las votantes.

Elaborado por H. Medina Disla. Junio 2010.

3

¿qué porcentaje de la producción está saliendo defectuoso?. por ejemplo. Thomas J. La Encuesta o Estudios por Muestreo y Los Experimentos. 1. Medina Disla. Madden y Neil H. es decir que las fuentes primarias se utilizan para cubrir una necesidad de información específica. Las fuentes de datos primarias son aquellas en las cuales los datos son generados por quien o quienes realizan la investigación. Los estudios por muestreo tienen las ventajas de que proporcionan información útil y confiable sobre una 1 William Dillon. 1. ¿por qué las personas prefieren un banco en particular para depositar sus ahorros?.Apuntes sobre Estadística 1. Entornos de Marketing” Elaborado por H. ¿Cómo podemos motivar a los/as estudiantes?.3. 4 . es decir que son datos de primera mano. Tiene la desventaja de que resulta muy costoso en términos económicos. Firtle: “La Investigación de Mercados. ¿Cuál es la bebida gaseosa preferida por la población?. Para dar respuestas a estas preguntas debemos recurrir a la búsqueda de datos y en tal sentido debemos de responder a las siguientes preguntas ¿cuáles son las fuentes para obtener datos? O ¿de donde obtendremos datos para dar respuesta a nuestra pregunta? En primer lugar vamos a clasificar las fuentes de datos atendiendo al origen de los datos y en este sentido las fuentes de datos pueden ser primarias y secundarias. Podemos decir entonces que el quehacer de la Estadística se centra en dar respuestas a una serie de preguntas o interrogantes que surgen en un momento determinado sobre un tema en particular. ¿cuál será el nivel de precios para el próximo semestre?. Junio 2010. 2. ¿cuál método de enseñanza es más efectivo para lograr el aprendizaje en los/as estudiantes? y así sucesivamente. El censo tiene las ventajas de que proporciona información sobre una población completa. hechos “a la medida” como lo señala Dillon1. Estudios por Muestreo: Son estudios en los cuales solo se estudia una parte de la población.3 FUENTES DE DATOS Ya se ha dicho que la Estadística es una metodología científica que permite obtener datos que al ser procesados se convierten en estadísticas o indicadores relacionados a una o múltiples variables.1 Fuentes primarias de datos Las principales fuentes primarias de datos son el Censo. es decir una muestra. de tiempo y de materiales. con un bajo margen de error y además permite la ubicación física de cada uno de los miembros de la población. Censo: Es un tipo de investigación en la cual se estudian todos los elementos de una población determinada.

Medina Disla. Tienen las desventajas de que no proporcionan información sobre la ubicación física de de los elementos de una población y de que si no se diseña de manera adecuada puede proporcionar información distorsionada sobre el comportamiento del fenómeno que se está estudiando. 5 . Junio 2010. Las fuentes de datos secundarias pueden ser externas o internas. 3. Reportes de datos externos: es un conjunto de datos que pueden ser de interés para dar respuesta a nuestras interrogantes y que han sido generado por organizaciones o entidades externas a quien realiza la investigación. 2. Los registros externos como fuente de información tienen las ventajas de que son de fácil acceso. Tienen la desventaja de que quien realiza la investigación no dispone de los mecanismos de control para garantizar la calidad y la confiabilidad de los Elaborado por H.Apuntes sobre Estadística población en corto tiempo y además resultan menos costosos que un censo. Experimentos: Son estudios especializados en los cuales un grupo de elementos de la población es sometido a un tratamiento o condición especial y los resultados obtenidos con dicho tratamiento se comparan con los resultados de otro grupo que no ha sido sometido al tratamiento o con los del mismo grupo cuando no ha sido sometido al tratamiento o condición especial. en cambio las fuentes secundarias externas son aquellas en las cuales los datos se encuentran en reportes o publicaciones realizados por entidades ajenas a quien o quienes realizan la investigación. Las fuentes secundarias internas son aquellas en las cuales los reportes son el resultado del registro de las actividades de quien lleva a cabo la investigación.3.2 Fuentes secundarias de datos Las fuentes secundarias son aquellas en las cuales los datos se encuentran publicados en forma de reportes. tienen un costo más bajo que las demás fuentes de datos y además están disponibles en el momento requerido. 1. Registros internos de la organización: son fuentes secundarias de datos y se refieren al conjunto de datos que se origina como resultado del registro continuo y sistemático de las actividades de una organización. Las principales fuentes secundarias de datos son los registros internos de la empresa y los reportes de datos de otras organizaciones o externos. El objetivo principal de los diseños experimentales es conocer el efecto que tiene en la población estudiada la exposición de esta a un tratamiento o condición especial. El grupo sometido al tratamiento recibe el nombre de grupo experimental y el grupo con el cual se comparan los resultados recibe el nombre de grupo de control. 1.

por ejemplo el nivel de ingreso de las personas. etc. Medina Disla. gasto diario de los estudiantes. número de hijos por familia. Variables cuantitativas discontinuas o discretas: son aquellas variables cuantitativas cuyos resultados se expresan en números enteros. no significa que sea discreta. Las variables cuantitativas discontinuas o discretas provienen de un proceso de conteo. estatura de las personas. sin embargo. así como el formato y la cantidad de datos existentes no siempre se corresponde con los requeridos por el investigador. 1. número de estudiantes por aula. etc. por ejemplo. carrera estudiada. Junio 2010. por ejemplo número de asignaturas por estudiante. estatura de las personas. Obsérvese que las variables cuantitativas continuas pueden expresarse en número fraccionarios y las discretas o discontinuas se expresan en números enteros. Variables cuantitativas: son aquellas variables que describen una cantidad en el elemento estudiado. etc. raza.Apuntes sobre Estadística datos incluidos en los reportes. tamaño las aulas universitarias. es decir que no admiten valores decimales. partido político preferido. Las variables se dividen en dos grupos: Cualitativas y Cuantitativas Variables cualitativas: son aquellas variables que describen una cualidad o atributo en el elemento estudiado. sexo de los y las estudiantes. es una Elaborado por H. Las variables cuantitativas discontinuas o discretas. mayormente lo expresamos en número entero. ejemplos de estas variables pueden ser: religión que profesan los dominicanos. estas variables responden la pregunta ¿cuál?. color de la piel. Ejemplos: peso corporal de las personas. etc. estatura de los estudiantes que cursan estadística en este semestre. Estas variables provienen de un proceso de medición. Las variables cuantitativas responden la pregunta ¿cuánto?. aunque en muchas ocasiones expresamos una variable en número enteros.4 VARIABLES Y SU CLASIFICACIÓN Una Variable es una característica que puede variar de un elemento a otro en la población estudiada. número de asignaturas cursadas por los estudiantes por semestre. 6 . etc. número de personas que llega a un restaurante de comida rápida. el gasto en transporte. se dividen en dos categorías: Continuas y Variables cuantitativas continuas: son aquellas variables cuantitativas cuyos resultados pueden expresarse en números fraccionarios o decimales. por ejemplo: número de estudiante por aula. venta diaria de una empresa. por lo que. consumo familiar.

tomando el cero como una percepción de los 2 Wayne W. 4. 7ª. para la edad nos referiremos a los años cumplidos y por lo tanto tendremos medidas numéricas. longitud.…… y par la variable gasto también se registraría el número que representa el monto del gasto diario. Junio 2000. de la medición de los niveles de tolerancia. volumen o cualquier otra medida de interés. 150.5 MEDICION Y ESCALA DE MEDICIÓN Daniel2 señala “cuando la mayoría de las personas escuchan o leen la palabra medición piensan en actividades tales como usar cintas métricas para determinar la longitud. los niveles de preferencia por un servicio o un producto. así por ejemplo. de la siguiente manera ♂ para los masculinos y ♀ para las femeninas De igual forma para la variable número de asignaturas de registraría el número que representa la cantidad de asignaturas inscrita. el sexo. pues el resultado admite valores fraccionarios. Editora McGraw-Hill. percepción sobre los servicios de la biblioteca. Medina Disla. por ejemplo. 1. Daniel & James C. M para los masculinos y F para las femeninas o un símbolo para diferenciar cada sexo. 19. pero el número de asignaturas cursada por ejemplo solo se expresa en número enteros pues no admite valores fraccionarios. etcétera. (23. 100. 6. pero de igual forma podríamos asignarle una letra. ……. 60. el número de asignaturas cursadas el gasto diario. anchura o circunferencia de algún objeto. 7 . En el ámbito de la Estadística cuando nos referimos a medición llegamos un poco más profundo. 180. así por ejemplo hablamos de la medición de la personalidad. 35. las asignaturas más preferidas y muchas otras variables. Por ejemplo si estamos realizando una investigación sobre las características de la población estudiantil podremos incluir variables como la edad. 5. pesar un objeto o persona. para la variable sexo podríamos asignarle un número por ejemplo uno para masculino y dos para femenino o viceversa. En cada una de estas variables tendremos una medición en cada uno de los elementos estudiados.). 3. puede dársele una definición más científica que la acostumbrada” En efecto la medición va más allá de determinar cantidad. sin embargo. Terrell: “Estadística para Administración y Economía” Tomo I.. Elaborado por H. Junio 2010. 21. y la variable relacionada con la percepción sobre los servicios de la biblioteca podemos asignarle una calificación desde cero a cinco. y determinar el volumen de alguna sustancia como cuando un cocinero mezcla las cantidades de ingredientes específicas de una receta. letra o símbolo) a una variable.Apuntes sobre Estadística variable continua. A la palabra medición. Edición. Para el desarrollo de este curso enteremos por Medición al proceso mediante el cual se le asigna un numeral (número.…..

cada numeral representa un tramo jerárquico. de preferencia o de importancia. etc.Apuntes sobre Estadística servicios como muy malos y cinco una percepción de que los servicios son excelentes. Escala de Razón o Proporción: Es una escala cuantitativa cuya característica principal es que el proceso de medición de inicia a partir de un cero absoluto. Junio 2010. Medina Disla. En este tipo de escala. Lo que se quiere señalar es que hay diferente forma en como podemos establecer la medición para una variable. el número asignado a las placas de los vehículos oficiales. Escala de Medición: Es la forma en como se mide una variable. coeficiente inteligente. los números asignados a los integrantes de un equipo béisbol. para que la persona estudiada nos diga en orden de preferencia cuales son las asignaturas preferidas. es decir que la escala de medición es el proceso mediante el cual se le asigna un numeral a cada variable. Ej. importancia o de preferencia. pudiendo entonces establecer una definición para la escala de medición. podríamos establecer un registro en orden de importancia. Para la variable relacionada con las asignaturas más preferidas. es decir. es decir que el punto a partir del cual se empieza a medir es arbitrario. ordinal. Tanto la escala ordinal como la nominal se usan en la medición de variables cualitativas. Existen cuatro tipos de escala de medición: nominal.: los códigos asignados a los cargos en una empresa. Escala Nominal: Es aquella escala de medición en la cual los numerales asignados a cada valor o atributo no representa ningún orden de jerarquía. preferencia de un producto según su orden de importancia. 8 . la intensidad de un temblor de tierra. Escala Ordinal: Es aquella escala en la cual los numerales se asignan a cada variable de acuerdo a un orden de jerarquía. es decir que hay diferente tipo de escala para medir una o múltiples variables. es que no parte de un cero absoluto. de intervalo y de razón o proporción. Ej. la matrícula estudiantil. Escala de Intervalo: Es una escala cuantitativa cuya característica principal. que la presencia del cero como medida de la variable significa la Elaborado por H. sucesivamente. de importancia o preferencia. etc. En este tipo de escala la presencia del cero como de medida de la variable no representa ausencia de la variable. Ej. En este tipo de escala los numerales solo se utilizan para identificar los valores o atributos de cada variable. el segundo para la segunda más preferida y así.: Las escalas usadas para medir la temperatura. etc. en tal sentido podríamos establecer el primer lugar para la más preferida.: los numerales o códigos asignados a las variables cualitativas.

2. tamaño de las personas. ventas de una empresa. entre otros) y se 3 Ver a Lincoln L. 1. el establecimiento de los objetivos: general y específicos. Planeación: Es la fase en la cual se definen los aspectos administrativo y operativos de la investigación. distancia recorrida diariamente.6 PASOS DE UNA INVESTIGACIÓN ESTADÍSTICA Cuando nos planteamos una interrogante sobre un tema en particular. diseño de la investigación. Chao: “Estadística para las Ciencias Administrativas. peso corporal. observación. alcance de la investigación. Medina Disla. A continuación se hace una descripción breve de cada uno de estos. procesamiento y análisis y presentación de resultados. este proceso de búsqueda de datos conlleva la realización de una investigación la cual requiere de cinco pasos fundamentales3: planeación. Editora McGraw-Hill Elaborado por H. 9 .Apuntes sobre Estadística ausencia de esta. población de estudio. consumo familiar. etc. A este tipo de escala corresponden la mayoría de las variables con que trabajamos a diario. 1. Esta fase comprende entre otras actividades. unidades producidas. Figura no.” Tercera Edición. Diseño del estudio: En esta fase se define y se diseña el instrumento de recolección de datos (cuestionario. presupuesto necesario. recolección de datos. ejemplo. distancia recorrida. entrevistas. cronograma de actividades y plan de análisis o resultados esperados. 1: Pasos de una investigación Planeación Diseño del Estudio Análisis y presentación Recolección de datos Procesamiento Aunque estos pasos pueden y varían atendiendo a los criterios del investigador en términos generales estos pasos representan el proceso lógico de una investigación aunque reciban diferentes nombres. Junio 2010. nos vemos en la necesidad de buscar datos que nos proporcionen las informaciones necesarias para dar respuesta a dicha interrogante.

La digitación es el proceso mediante el cual los datos son introducidos al computador con el fin de que el procesamiento sea más eficiente. La edición por su parte es un proceso de verificación. Análisis y presentación de resultados: Es la fase es la cual se analizan los resultados obtenidos. inferencias muestrales. En esta fase la persona a cargo de la investigación y su equipo de trabajo se lanzan al terreno para recolectar los datos que una vez procesados darán respuestas a los objetivos de la investigación. De esta forma la población estaba definida. el trabajo final de un grupo de estudiantes fue medir el rendimiento. verificación del cumplimiento de las metas en cuanto a la cantidad y calidad. 10 . Esto se hace con la finalidad de facilitar el proceso de digitación. es decir. La fase de procesamiento de los datos conlleva cuatro actividades esenciales previas: Limpieza y organización de los datos. así como dar respuestas a los objetivos planteados en la fase de planeación. 5. así como las medidas o indicadores estadísticas que permiten describir el comportamiento de la población estudiada. Medina Disla.Apuntes sobre Estadística define además. 3. Junio 2010. En el semestre 2006-1 de la UASD. (tomando para ello el promedio de las calificaciones) de un grupo de estudiantes tanto en las escuelas públicas como en las escuelas privadas. estableciendo descripción de la población estudiada. digitación y edición. Veamos un ejemplo relacionado con el proceso de investigación. Recolección de datos: Es la fase que requiere de más tiempo y consiste en la aplicación del instrumento de recolección de datos definido en el diseño del estudio de acuerdo a la metodología establecida. En la fase de procesamiento y además se dan a conocer los resultados obtenidos en la investigación. codificación. Procesamiento de datos: Es la fase en la cual se obtienen los cuadros y tablas. La codificación por su parte es la actividad que permite asignar un código numérico a cada respuesta del instrumento de recolección de datos. 4. entre otras. La limpieza y organización de los datos se refiera al proceso mediante el cual se verifican la calidad de los datos obtenidos. se enumeran los instrumentos de recolección de datos utilizados. con la edición de los datos verificamos que se haya digitado lo que realmente se ha respondido en el instrumento de recolección de datos. la metodología a seguir para la aplicación del instrumento de recolección de datos. comparaciones y asociaciones entre variables. Elaborado por H. así como los objetivos del trabajo de investigación.

Edad ______ 3. El cuestionario utilizado como instrumento de recolección de datos se muestra en la figura número dos de la página siguiente. el presupuesto era pequeño y no predeterminado. sino que el numeral asignado es una escala nominal. Junio 2010. procediendo a completar el instrumento de recolección de datos diseñado A continuación se presenta una muestra del instrumento de recolección de datos completado durante la tercera fase del estudio.Apuntes sobre Estadística Como se podrán imaginar. Calificación en Naturales _____ La metodología consistió en tomar una muestra de treinta estudiantes de la escuela pública y treinta de la escuela privada. Elaborado por H. Nótese que los cuestionarios no están numerados y si lo estuvieran no representan una jerarquía o importancia. Calificación en Sociales ______ 10. ese no es el caso ahora. Condición del estudiante: 1. Con quien vive el estudiante _____________________________ 5. Nombre y apellidos del estudiante __________________________ 2. el cual se muestra en la figura número dos y la metodología consistió en tomar una muestra de estudiantes de las escuelas públicas y otra muestra en colegios privados. Sexo: 1. Masculino 2. Tipo de escuela: 1. El instrumento de recolección de datos fue un cuestionario. 11 . Repitiente 6. Calificación en Español ______ 9. pero bueno. Por conveniencia las respuestas se han subrayado de forma que se puedan identificar fácilmente. Medina Disla. Figura no. Privada 2. pero tengan por seguro que aquellas personas que no pasaron de curso se lo encontraron más costoso. Pública 2. Promovido 7. La fuente de datos utilizada fue el registro de cada estudiante en la escuela. Instrumento de recolección de datos utilizado en el estudio Universidad Autónoma de Santo Domingo Estudio sobre el rendimiento escolar Formulario de recolección de datos 1. 2. Calificación en Matemáticas ______ 8. Femenino 4.

Calificación en Matemáticas 70 8. Calificación en Naturales 65 2. Calificación en Sociales 76 10. Nombre y apellidos del estudiante Vicente Mejía 2. Calificación en Matemáticas 80 8. Edad 13 años 3. Condición del estudiante: 1. Con quien vive el estudiante: Con padre y madre 5. Calificación en Sociales 82 10. Nombre y apellidos del estudiante Rodolfo Peña 2. Calificación en Sociales 64 10. Pública 2. Promovido 2. Con quien vive el estudiante ambos padres 5. Femenino 4. Calificación en Sociales 72 10. Con quien vive el estudiante: con la madre 5. Promovido 7. Calificación en Sociales 78 10. Nombre y apellidos del estudiante Paola Moción 2. Calificación en Español 75 9. Medina Disla. Nombre y apellidos del estudiante Raúl Arias 2. Condición del estudiante: 1. 12 . Edad 9 años 3. Calificación en Español 70 9. Pública 2. Repitiente Universidad Autónoma de Santo Domingo Estudio sobre el rendimiento escolar Formulario de recolección de datos 1. Junio 2010. Repitiente 7. Sexo: 1. Masculino 2. Repitiente 6. Edad 10 3. Nombre y apellidos del estudiante Ashley Ciprián 2. Masculino 2. Pública 2. Femenino 6. Calificación en Naturales 80 2. Calificación en Matemáticas 85 8. Con quien vive el estudiante con la madre 5. Sexo: 1. Femenino 4.Apuntes sobre Estadística Figura no. Sexo: 1. Tipo de escuela: 1. Calificación en Matemáticas 65 8. Tipo de escuela: 1. Con quien vive el estudiante Tía 5. Privada 6. Calificación en Español 69 9. 3: Instrumentos de recolección de datos completados Universidad Autónoma de Santo Domingo Estudio sobre el rendimiento escolar Formulario de recolección de datos 1. Repitiente 7. Calificación en Naturales 71 Universidad Autónoma de Santo Domingo Estudio sobre el rendimiento escolar Formulario de recolección de datos 1. Condición del estudiante: 1. Promovido 2. Tipo de escuela: 1. Edad 12 3. Privada 4. Tipo de escuela: 1. Privada 4. Condición del estudiante: 1. Condición del estudiante: 1. Privada 6. Masculino 2. Calificación en Español 80 9. Calificación en Español 78 9. Calificación en Sociales 65 10. Edad 15 3. Pública 2. Condición del estudiante: 1. Sexo: 1. Femenino Universidad Autónoma de Santo Domingo Estudio sobre el rendimiento escolar Formulario de recolección de datos 1. Privada 6. Sexo: 1. Tipo de escuela: 1. Masculino 2. Promovido 7. Privada 4. Repitiente 6. Nombre y apellidos del estudiante: Yordi González 2. Repitiente Elaborado por H. Promovido 7. Masculino 2. Calificación en Naturales 70 2. Tipo de escuela: 1. Calificación en Naturales 78 2. Femenino 4. Femenino Universidad Autónoma de Santo Domingo Estudio sobre el rendimiento escolar Formulario de recolección de datos 1. Calificación en Matemáticas 67 8. Calificación en Naturales 69 Universidad Autónoma de Santo Domingo Estudio sobre el rendimiento escolar Formulario de recolección de datos 1. Calificación en Matemáticas 69 8. Sexo: 1. Pública 2. Edad 11 3. Con quien vive el estudiante: con ambos padres 5. Calificación en Español 68 9. Promovido 7. Masculino 2. Pública 2.

Edad 11 años 3. Calificación en Matemáticas 77 8. Sexo: 1. Nombre y apellidos del estudiante Cándida Beatriz 2. Privada 6. ya que el instrumento diseñado tiene cada pregunta pre-codificada. Calificación en Matemáticas 77 8. Femenino Universidad Autónoma de Santo Domingo Estudio sobre el rendimiento escolar Formulario de recolección de datos 1. Masculino 2. Los códigos Elaborado por H. Pública 2. Tipo de escuela: 1. 13 . la recolección de datos. Nombre y apellidos del estudiante Helena Parache 2. Promovido 7. Calificación en Naturales 91 2. Masculino 2. Femenino 4. Masculino 2. para luego obtener los cuadros y tablas. Privada 4. Tipo de escuela: 1. nos dedicamos a cuarta fase. Edad 13 años 3. Calificación en Matemáticas 88 8. Pública 2. así como las medidas estadísticas que nos permitan dar respuestas a los objetivos planteados. Calificación en Español 90 9. Calificación en Matemáticas 83 8. Repitiente 6. ya que en el instrumento esta es una pregunta abierta. Promovido 7. Calificación en Sociales 81 10.Apuntes sobre Estadística Universidad Autónoma de Santo Domingo Estudio sobre el rendimiento escolar Formulario de recolección de datos 1. Calificación en Sociales 89 10. Calificación en Sociales 89 10. Junio 2010. Tipo de escuela: 1. Masculino 2. Nombre y apellidos del estudiante Charly Cepeda 2. Calificación en Naturales 65 2. Condición del estudiante: 1. Femenino 4. digitación y edición. Promovido 7. Condición del estudiante: 1. Calificación en Naturales 78 2. Con quien vive el estudiante ambos padres 5. Condición del estudiante: 1. Repitiente Universidad Autónoma de Santo Domingo Estudio sobre el rendimiento escolar Formulario de recolección de datos 1. Medina Disla. Repitiente Una vez agotada la tercera fase. Calificación en Español 72 9. Sin embargo. Pública 2. Privada 6. por ejemplo. Para la codificación. es recomendable establecer un código numérico para las posibles respuestas. En el caso que nos ocupa para la organización podemos por ejemplo asignar un número a cada instrumento completado. Privada 4. Con quien vive el estudiante ambos padres 5. Edad 11 años 3. el trabajo se reduce significativamente. recordando que esta fase incluye la organización. Femenino Universidad Autónoma de Santo Domingo Estudio sobre el rendimiento escolar Formulario de recolección de datos 1. Sexo: 1. Calificación en Naturales 85 2. Edad 10 años 3. Repitiente 6. Calificación en Sociales 83 10. de igual forma a los y las estudiantes de escuelas públicas se le asigna el número uno y los y las de colegios privados el número dos. Condición del estudiante: 1. Sexo: 1. Con quien vive el estudiante con ambos padres 5. para el sexo se le asigna el número uno a los de sexo masculino y el dos a las de sexo femenino. Con quien vive el estudiante con una tía 5. en el caso de la pregunta relacionada a con quien vive el o la estudiante. Calificación en Español 78 9. Sexo: 1. Promovido 7. Calificación en Español 90 9. Pública 2. Nombre y apellidos del estudiante Manuel Fontana 2. Tipo de escuela: 1. codificación. el procesamiento de los datos.

3. 6. Calificación en Naturales 71 1. 5.Apuntes sobre Estadística asignados son: el número uno para los y as que viven con ambos padres. el dos para los y las que viven solo con la madre. 14 . Privada Condición del estudiante: 1. Privada Condición del estudiante: 1. Repitiente 7. Medina Disla. se ha elegido el Excel por la disponibilidad y facilidad del mismo) Elaborado por H. 2. Calificación en Sociales 72 10. Calificación en Matemáticas 69 8. (padre y madre). 4. Un ejemplo se muestra a continuación con los dos primeros instrumentos Figura no. Junio 2010. Femenino Con quien vive el estudiante: 1 Tipo de escuela: 1. 2 Nombre y apellidos del estudiante Raúl Arias Edad 12 Sexo: 1. 3. 5. el tres para los y las que viven solo con el padre y el cuatro para los y las que viven con otro familiar. Para la digitación se podría colocar los datos en una matriz. Calificación en Español 75 9. Universidad Autónoma de Santo Domingo Estudio sobre el rendimiento escolar Formulario de recolección de datos No. Calificación en Español 69 9. 4: instrumentos de datos completados y codificados Universidad Autónoma de Santo Domingo Estudio sobre el rendimiento escolar Formulario de recolección de datos No. Calificación en Matemáticas 67 8. 4. Calificación en Naturales 69 Como se muestra en la figura anterior. Masculino 2. Promovido 2. Pública 2. 6. Repitiente 7. 1. Pública 2. colocando cada variable en las columnas y cada fila para los elementos estudiados. Calificación en Sociales 64 10. a la derecha aparece el número asignado al instrumento y en la pregunta de con quien vive el o la estudiante se ha asignado como respuesta el número uno ya que en ambos casos los estudiantes viven con ambos padres. Femenino Con quien vive el estudiante: 1 Tipo de escuela: 1. En este caso vamos a utilizar la hoja de cálculo de Excel para la digitación como se muestra en la figura número cinco. La importancia de asignar un código numérico es que el proceso de digitación se hace más eficiente y se cometen menos errores. Promovido 2. 1 Nombre y apellidos del estudiante Rodolfo Peña Edad 15 Sexo: 1. 2. Masculino 2. (Es preciso aclarar que existen numerosos programas en los que se puede hace la digitación.

pero sobre este particular volveremos a tratarlo en los capítulos siguientes. 15 . Para hacerlo existen cinco formas que describiremos brevemente a continuación: Elaborado por H.7 PRESENTACIÓN DE RESULTADOS Una vez que se ha completado el proceso de investigación con el análisis de los resultados. 1. se procede a obtener los cuadros y tablas. así como las medidas estadísticas que nos permitan dar respuesta a los objetivos del trabajo de investigación. el paso siguiente consiste en presentar dichos resultados a la entidad interesada. 5: Ilustración de la digitación en Excel El proceso de edición de los datos sería imprimir los datos digitados y luego verificar si el proceso de digitación se ha hecho correctamente.Apuntes sobre Estadística Figura no. Junio 2010. Una vez que se ha realizado el proceso de digitación y edición de los datos. Medina Disla.

Índice de contenido: en esta parte del informe se establece o describe la ubicación física de cada una de las partes contenidas en el informe.1 Hoja y/o carta de presentación: en esta parte se presenta de manera formal los resultados de la investigación. Conclusiones: las conclusiones representan el juicio extraído de los resultados de la investigación.2 2. así como el cálculo de medidas estadísticas. 2. gráfico. Medina Disla. sin embargo.3 2. ONG`s. muchas organizaciones. Recomendaciones: se refiere al conjunto de sugerencias o curso de acción que se sugieren seguir a partir de los resultados de la investigación. Resumen ejecutivo: como lo indica su nombre. Presentación oral: Cuando los resultados de la investigación se presentan en forma de discurso. Por ejemplo. Presentación escrita: Es aquella en la cual los resultados de una investigación se presentan en un informe en forma de texto. partidos políticos. es un resumen que contiene los principales resultados de la investigación. La presentación oral tiene la ventaja de que es fácil de preparar y su costo es bajo. Se refieren a los puntos a los cuales llega quien o quienes realizan el estudio después de analizar de manera detallada los resultados obtenidos. requieren de una mayor formalidad y de un esfuerzo mayor. entre otras) convocan a una rueda de prensa o a un encuentro con el objetivo de dar a conocer los resultados de una investigación determinada.5 2.Apuntes sobre Estadística 1. (empresas. Un informe con los resultados de una investigación consta de seis partes esenciales. descripción textual. Cuerpo del trabajo: En esta parte se describen de manera detallada todos los resultados de la investigación. presenta la desventaja de que quien recibe la información va olvidando los primeros datos en la medida en que se avanza con el suministro de información.4 2. La presentación de los resultados de una investigación presentados en un informe. Junio 2010. 2. Las conclusiones dan respuestas a las interrogantes establecidas y a los objetivos planteados en la fase de planeación. tablas. Su objetivo fundamental es describir el comportamiento de la población estudiada de manera rápida y precisa sin adentrarse en detalles. 2. incluye la presentación de cuadros. 16 .6 Elaborado por H.

de leyes.Apuntes sobre Estadística 2. copia del o los instrumentos de recolección de datos utilizados. 3.2.1 La columna principal. fotografías. 3) Presentación tabular: es aquella es la que los resultados de una investigación se presentan en forma de cuadros o tablas. copias de artículos. solo con observar el cuadro. 9 25 34 % 26. La importancia de la presentación gráfica es que permite observar el comportamiento de una variable sin entrar en detalles.2 Nota aclaratoria: se utiliza para especificar cualquier detalle o aclaración referente a los datos incluidos en el cuadro. Cuerpo o armazón: es un arreglo matricial. La importancia de la fuente es que al informar sobre el origen de los datos descrito en la tabla.5 100. entre otros. por ejemplo cuadros. de alguna manera. Elaborado por H. El cuerpo o armazón está compuesto de dos partes: 3.1 Título: en este se detalla de manera clara. sección XX 3. 17 . Cuadro No: Sexo de los estudiantes de Est-XXX. 3.5 73. 3.2 Las columnas secundarias. es las cuales se describen los valores relacionados a cada valor o atributo de la variable.7 Anexos: en esta parte del informe se incluye toda información que sea relevante para el estudio que se realiza y que por alguna razón no se incluyó en el cuerpo del trabajo. 4) Presentación gráfica: es aquella en la cual los resultados de una investigación se presentan en forma de gráfico. en el cuadro que se muestra a continuación se podría incluir una nota aclaratoria para indicar que solo se incluyen a los estudiantes que asistieron ese día a la clase o que incluye a otros “colados” de otra sección SEXO MASCULINO FEMENINO TOTAL Fuente: Clase 17/01/2004 No. en la cual se describe la variable o las variables a presentar en el cuadro. cronograma de actividades. permite. Un cuadro o tabla estadística se compone de tres partes esenciales y una opcional. Por ejemplo. Medina Disla. (arreglo de filas y columnas) en el cual se detallan los datos especificados en el título. El título es de vital importancia a fin de edificar a la persona interesada sobre la información que se presenta en el cuadro o la tabla de que se trate. evaluar la calidad y confiabilidad de los mismos.2.0 de la que se trate. Junio 2010. precisa y lo más corto posible los datos incluidos en el cuadro.3 Fuente: es la parte del cuadro en la cual se específica el origen de los datos presentados en dicho cuadro.

Medina Disla.5% MASCU LIN O F EMEN IN O Fuente: clase del 7/01/2004 Por ejemplo. al observar un recibo de la facturación de la electricidad. observamos como ha variado el consumo.Apuntes sobre Estadística Se x o d e l o s e s t u d i a n t e s d e Es t -x x x . es decir: título. Comparación mensual de su consumo 700 600 500 400 300 200 100 0 Abr May Jun Jul Ago Se p Oct Nov Dic Ene Fe b Mar Abr Una presentación gráfica contiene los mismos elementos que un cuadro o tabla. 18 . Junio 2010. si se ha consumido más o se ha consumido menos. s e c c i ó n 00 26. cuerpo. Elaborado por H. se muestra un gráfico como el que vemos a nuestra derecha.5% 73. 5) Presentación Mixta: es aquella en la cual quien o quienes realizan la investigación utilizan para la presentación de los resultados del estudio dos o más formas de presentación de datos. fuente y nota aclaratoria.

0 81.8 71. Este procedimiento no nos proporcionará mucha información sobre las características relevantes de la variable.5 72. ORGANIZACIÓN Y PRESENTACIÓN DE LOS DATOS 2.8 70. 19 .8 61.8 70.0 85.0 67.1 ORGANIZACIÓN SIMPLE El objetivo fundamental de la organización de los datos es conocer el comportamiento y las características de las variables estudiadas. sin una organización de los datos se hace un tanto difícil el análisis de los mismos.8 76.0 79.3 65.8 77.0 66.3 71.8 67.0 61.5 82.8 66.8 69.5 84.8 67.5 77.5 70.3 71.5 69.5 88.5 63.5 72.0 60.0 91.0 67. sin una organización esto se hace poco aplicable.8 75.8 69.8 77.8 67.3 80. Supongamos que tenemos los datos relacionados con el rendimiento académico de 133 estudiantes y los mismos se muestran en el recuadro siguiente: 82.0 71.0 91.8 88.5 87.5 70.3 85.3 84.5 63.5 88.0 69.0 70.3 81.3 77.5 63.0 83.5 84.8 68.8 81.8 72.0 68.8 78.0 82.8 92.3 88.8 78.8 80.3 58. para conocer sus características es organizando los mismos en orden ascendente como se ilustra a continuación.5 77.0 79.5 Como se puede observar. etc.8 64.0 62.5 82.0 84.0 81.3 73.8 71.8 84.0 85.8 70. Una forma sencilla de iniciar una exploración de los datos.8 79.3 67.0 86.8 56. Elaborado por H.0 71.0 68.5 78.8 71.5 67.3 89.3 88.3 76.5 63.5 81.Apuntes sobre Estadística II.5 93.3 70.8 87.8 90.8 84.0 82.3 82. Junio 2010. nos permite conocer por ejemplo cual es el rendimiento mayor y el menor y permite además observar si existe un valor que se repita con una frecuencia mayor que los demás. tenemos datos suficientes como para dar un diagnóstico sobre el rendimiento de los y las estudiantes.3 67.8 65.5 60.5 69.0 69.5 81. Medina Disla.0 78.5 61.8 72.0 73.0 81.3 61.8 90.5 70.8 68.3 71.8 67.8 70.8 81.8 71.5 83.5 73.0 83.8 61.0 95.8 85.0 66. sin embargo.3 72.0 72.3 64.0 62.5 72.5 64.0 66.0 56.5 69.

5 70. 20 .8 71.5 61.0 77.8 66.3 61.5 70.8 82.5 77. (arreglo de filas y columnas) donde se presenta los valores o atributos de una variable y su respectivas frecuencias. por ejemplo.5 70.0 82.8 64.0 85.3 91. diseño experimental y aquellos que provienen de fuente secundarias que no han sido agrupados o condensados.0 67.8 88.0 72.5 80. se define como el número de veces que se repite un dato u observación.0 85.5 88.5 71.8 92.0 70.0 85.3 67.0 73.0 67.8 81.8 91. 2.8 73.5 72.8 72.3 84.3 81.5 81.0 puntos y así sucesivamente.8 89.8 90.0 puntos.5 78.0 75.2 DISTRIBUCIONES DE FRECUENCIA Los datos que provienen de un censo.0 78.5 78.8 66.3 70. La Frecuencia.3 84.8 65. ya sea para una o para múltiples variables.0 76.8 83.5 86.8 70.3 81.3 80.5 84. al observar el sexo de 50 estudiantes de un curso de Estadística.0 67.0 81.8 68.8 90.5 68.3 70.8 81.0 69.8 58.0 63.5 66.0 66.0 62.3 83. se presentan en la mayoría de los casos en una Distribución de frecuencia.8 70.0 71.5 Ahora podemos fijarnos una idea más acabada sobre el rendimiento de los y las estudiantes de las escuelas públicas y privadas. Una distribución de frecuencia es un arreglo matricial. que solo cinco de los 133 estudiantes estudiados tienen un rendimiento superior a 90. como por ejemplo la revisión de un expediente clínico.8 69.8 75.0 82.0 76.8 71.3 61.0 60.3 69.3 68.8 64.3 72.3 81.0 63.0 82.0 79.5 83.8 63.0 88. Medina Disla. Por ejemplo.0 71.3 65.0 84.0 69.0 61.5 82.5 64. en términos estadísticos. observamos que más de un tercio tiene un rendimiento promedio inferior a los 70.0 71.8 78.3 87. se observaron los datos que se presentan en la tabla siguiente Elaborado por H.8 77.5 84.0 71.8 77.5 67.Apuntes sobre Estadística 56.5 56.5 63.8 73.8 69.0 72.8 72.8 68.3 82.5 84.5 71.5 69.8 72. Antes de entrar en detalles sobre los diferentes tipos de distribuciones de frecuencias.5 79. vamos a definir el concepto de frecuencia y los diferentes tipos de frecuencias.0 67.3 71.8 67.0 81.8 78.8 79.8 62.8 67.5 70. una encuesta por muestreo.3 87.0 60. Junio 2010.5 88.5 69.8 67.5 88.5 61.8 85.8 77.

(fr o %): consiste en expresar la frecuencia absoluta simple.Apuntes sobre Estadística Tabla 1: Sexo de 50 estudiantes de un curso de Estadística M F M F F F F F F F F F F F M F M F F F M F M F F F F M F F F F F F F M F M F F F F F F F F M F F M Para estos datos. en el cuadro anterior el dato masculino tiene una frecuencia absoluta simple de 11. (fi) como una proporción con aspecto al total de frecuencia. 2. 2.3. 21 .3 Frecuencia relativa simple. la relativa simple. (fi): se define como el número de veces que se repite un dato u observación.4 Clase: Es un rango de valor en el cual se incluye un conjunto de datos que para fines de análisis se consideras homogéneos. (FRA o % acumulado): Expresa la frecuencia absoluta acumulada. (FA) como un porcentaje con respecto al total de frecuencia y representa la proporción de elementos que se encuentran por debajo de un valor determinado. Veamos un ejemplo sobre como se obtienen las diferentes frecuencias que conforma una distribución de frecuencia. (FA): consiste en la suma continua y subsecuente de la frecuencia absoluta simple. el dato masculino. La frecuencia absoluta acumulada expresa la cantidad de elementos que se encuentra por debajo de un valor específico. 2. Elaborado por H. Comúnmente se le denomina con el nombre de frecuencia. 2. la absoluta acumulada y la absoluta relativa acumulada. que es su frecuencia. b) Dividiendo cada frecuencia absoluta acumulada entre el total de frecuencia. 2.3.3 TIPOS DE FRECUENCIA Existen cuatro tipos de frecuencias: la absoluta simple.4 Frecuencia relativa acumulada. Para la ilustración vamos a tomar la calificación obtenida por 50 estudiantes en una prueba parcial de Estadística. La FRA se puede obtener de dos formas: a) Sumando de manera continua y subsecuente la frecuencia relativa simple. los datos se ilustran en la tabla número dos a continuación. Por ejemplo. 2. (M) se repite 11 veces por lo tanto esa es su frecuencia y el dato femenino.3. (F) se repite 39 veces. Junio 2010. Medina Disla. mientras que el dato femenino presenta una frecuencia absoluta simple de 39.3.1 Frecuencia absoluta simple.2 Frecuencia absoluta acumulada.

Junio 2010.0 – 20.0 TOTAL El segundo paso es determinar la cantidad de estudiantes que cae dentro de cada una de estas categorías o clases.0 – 15. sencillamente se cuenta en la tabla dos. las calificaciones menores de 12 puntos. la cuarta clase está compuesta por los/as estudiantes que obtuvieron entre 16 y menos de 18 puntos y la quinta clase. Medina Disla. la primera columna queda como se ilustra a continuación: Calificación ≤ 12. Al observar los datos sueltos de la tabla dos. De esta forma.Apuntes sobre Estadística Tabla 2: Calificación obtenida por 50 estudiantes de Estadística en una prueba parcial 14 13 17 16 12 14 14 18 16 12 19 8 10 13 19 15 16 14 17 10 10 14 16 16 8 12 16 10 9 17 13 16 19 13 6 14 12 19 17 18 9 18 13 11 14 12 15 15 11 16 Para ordenar estos datos. en este caso la calificación obtenida.9 18. Para determinar la cantidad de datos en cada categoría o clase se puede hacer contando de manera directa cada valor o a partir de un proceso de conteo detallado. la cantidad de calificaciones que está dentro de cada uno de los límites de cada categoría o clase.9 16. la tercera los/as estudiantes que obtuvieron entre 14 y menos de 16 puntos. lo primero que vamos a hacer es colocar en la primera columna la variable. se clasifica en cinco categorías. la primer. hay 11 estudiantes. los/as que obtuvieron menos de 12 puntos. con calificación Elaborado por H. un punto o un símbolo en cada categoría cada vez que aparece un valor que se corresponda con esta. la segunda los/as estudiantes que obtuvieron entre 12 y menos de 14 puntos. colocando una raya. está formada por aquellos/as estudiantes que obtuvieron entre 18 y 20 puntos. Para esto.0 – 13.0 12.9 14. pero como puede tomar múltiple valores. en la primera categoría.0 – 17. 22 .

9 18.9 16. igual cantidad.9 16.0 – 13.0 fi 11 10 10 12 7 % 22.0 – 17. Junio 2010.0%. la cuarta frecuencia relativa es [(12/50) x 100]= 24.0 – 20.0 20. entonces se multiplica por 100.0% y así sucesivamente. la tercera frecuencia relativa es [(10/50) x 100]= 20.0 – 17.9 14.0 20.0 – 20. se obtienen las demás frecuencias.9 18. siete estudiantes con calificación entre 18 y 20 puntos.0%.0% y la quinta y última frecuencia relativa de esta distribución es [(17/50) x 100]= 14. 10 estudiantes con calificación entre 14 y menos de 16 puntos. por lo que la tabla quedaría como se ilustra a continuación: Calificación ≤ 12.0% El resultado de calcular cada una de la frecuencia relativa se muestra en la tabla siguiente: Calificación ≤ 12. la segunda frecuencia relativa es [(10/50) x 100]= 20. por ejemplo se obtiene al dividir cada frecuencia absoluta entre el total de frecuencia.0 – 15.0 12. De igual forma se observa que hay 10 estudiantes con calificación entre 12 y menos de 14 puntos.0 TOTAL A partir de esta frecuencia absoluta simple. De igual forma se observa que hay 12 estudiantes con calificación entre 16 y menos de 18 puntos y finalmente.0 – 15. La primera frecuencia relativa es [(11/50) x 100]= 22. La frecuencia relativa.0 Elaborado por H. Si esta frecuencia se desea expresar como un porcentaje. En la segunda columna de la distribución se coloca la frecuencia de cada clase o categoría.0 fi 11 10 10 12 7 50 12.0 – 13. 23 .9 14.0 24.Apuntes sobre Estadística menor a 12 puntos. Medina Disla.0 TOTAL 50 100.0 14.

Medina Disla. la frecuencia absoluta acumulada de la primera clase o categoría es igual a frecuencia absoluta simple. El procedimiento de acumular el porcentaje simple.0 – 20. Este porcentaje puede obtenerse de dos formas.0 24.9 14.0 20. la frecuencia absoluta acumulada de la primera clase es igual a 12.0 FA 11 21 31 43 50 12. El resultado de las sumas se muestra en la tabla siguiente: Calificación ≤ 12. o se acumula la el porcentaje simple o se divide cada frecuencia absoluta acumulada entre el total. el porcentaje acumulado de la primera clase o Elaborado por H.0 100. De esta forma la frecuencia acumulada de la tercera clase es igual a la frecuencia acumulada de la segunda clase más la frecuencia absoluta simple de la tercera clase. En términos generales.Apuntes sobre Estadística De igual forma. esto es (31 + 12)= 43 y la frecuencia acumulada de la quinta clase o es igual a la frecuencia acumulada hasta la cuarta clase más la frecuencia simple de la quinta clase. la frecuencia absoluta acumulada de una clase o categoría en particular es igual a la frecuencia acumulada hasta la clase anterior más la frecuencia absoluta simple de la clase o categoría de que se trate.0 fi 11 10 10 12 7 50 % 22. Para nuestro ejemplo.0 14.9 18.0 – 15.0 – 17. El porcentaje acumulado de la primera clase es igual porcentaje simple de la misma. simplifica los cálculos. para nuestro ejemplo. la frecuencia acumulada de la cuarta clase es igual a la frecuencia acumulada hasta la tercera clase más la frecuencia absoluta simple de la cuarta. a partir de la frecuencia absoluta simple se obtiene la frecuencia absoluta acumulada. Junio 2010. en este caso (21 + 10)= 31. 24 . Así.0 – 13.9 16. La frecuencia absoluta acumulada en la segunda clase o categoría es la suma de la frecuencia acumulada en la primera clase más la frecuencia absoluta simple de la segunda clase.0 20. El procedimiento se sigue de manera similar hasta determinar la frecuencia acumulada para cada clase o categoría. Esta frecuencia es el resultado de sumar las frecuencias absoluta simple de cada clase. es decir (43 + 7)= 50. es decir (11 + 10)= 21.0 TOTAL Una vez que se ha determinado la frecuencia absoluta acumulada el siguiente paso es calcular la frecuencia relativa acumulada o porcentaje acumulado.

Cuadro No : Calificación de 50 estudiantes de un curso de estadística en una prueba parcial Calificación fi % FA FRA ≤ 12.9 16. procedimiento se sigue de manera similar hasta determinar la porcentaje acumulado para cada clase o categoría.0 – 15. Al igual que en la frecuencia absoluta acumula.0 42.0 + 20.0)= 62. el porcentaje acumulado de la cuarta clase es igual al porcentaje acumulado hasta la tercera clase más el porcentaje simple de la cuarta. se elimina la columna del conteo. es decir (86.0 62. 25 . esto es (62.0 fi 11 10 10 12 7 50 % 22. es decir (22.0% y el porcentaje acumulado de la quinta clase o es igual al porcentaje acumulado hasta la cuarta clase más el porcentaje simple de la quinta clase.9 18. (si se ha incluido).0 – 17.0 – 20.9 18. Junio 2010.0 12.0 – 15.9 16.0 11 10 10 12 7 50 22.0 100.0 11 21 31 43 50 22. y se coloca la fuente de los datos.0 20.0 20.0 62.0 + 24.0 24.0 100.0%.0 24.0 14.0 20. El porcentaje acumulado en la segunda clase o categoría es la suma del porcentaje acumulado en la primera clase más el porcentaje simple de la segunda clase.0 – 13. El resultado de las sumas se muestra en la tabla siguiente: Calificación ≤ 12.0%.0 – 20.0 + 20.0 100. De esta forma la porcentaje acumulado de la tercera clase es igual al porcentaje acumulado de la segunda clase más el porcentaje simple de la tercera clase. poner el título.0 – 17.0%.9 14.0 86.0 FA 11 21 31 43 50 FRA 22.0 12.0 42.0)= 86. es decir.0 TOTAL Una vez que han calculado las frecuencias se procede a completar el cuadro de manera adecuada.0 100.0 20.0)= 100.0)= 42.0 TOTAL Fuente: Tabla 2 Elaborado por H.0%.0 – 13. en este caso es (42.0 + 14.Apuntes sobre Estadística categoría es igual a 22.0 86. Medina Disla.0 14.9 14.

tres. número de asignaturas cursadas por los estudiantes de la UASD. la cuales se utilizarán de acuerdo al tipo de datos que estemos tratando. como se muestra en el ejemplo siguiente: Cuadro No. Ejemplo: Se les preguntó a cincuenta profesores sobre el número de estudiantes reprobados que tenía en su curso. 2.7 11. número de cursos realizados por los empleados y empleadas de una empresa. Ejemplos de estas variables son número de hijos/as por familia. uno.5.5.5 TIPOS DE DISTRIBUCIÓN DE FRECUENCIA Para agrupar los datos existen tres tipos de distribución de frecuencia. Medina Disla. Junio 2010.0 2. el procedimiento se simplifica.3 100.2 Distribución Frecuencia Simple o Tipo I: es un tipo de distribución de frecuencia que se utiliza para presentar una variable cuantitativa discreta.: Personas con quienes viven los/as estudiantes de las escuelas públicas y de la privadas Con quien vive Ambos padres Con la madre Con el padre Otro familiar Total Fuente: Estudio de mayo del 2006 fi 106 15 5 7 133 % 79.Apuntes sobre Estadística 2. cuatro y cinco. Para organizar los datos en una distribución de frecuencia simple o tipo I colocamos los diferentes valores de Elaborado por H. entre otros. Es decir se utiliza para variables cuantitativas discretas que toman pocos valores diferentes. 26 . cuyo rango de valor sea menor o igual de diez.3 3.8 5. los datos son: Tabla 3: Número de estudiantes reprobados/as por curso 3 5 3 2 1 4 5 4 4 2 3 4 5 4 1 5 3 5 2 4 2 3 2 3 2 2 4 1 4 3 2 2 2 3 1 3 2 1 0 1 El dato menor que aparece en los datos es el valor cero y el mayor es el cinco de forma tal que esta variable en esta muestra toma seis valores diferentes: cero.1 Distribución de frecuencia para datos cualitativos: cuando se tienen datos cualitativos. dos. pues solo se requiere colocar las diferentes categorías de la variable y la frecuencia asociada con dada una de ellas.

0 86. lo que.5 2 11 27.0 42.5.9 16.0 TOTAL Fuente: Tabla 2 2.Apuntes sobre Estadística la variable en la primera columna y luego se cuenta el número de veces que se repite cada dato. como se muestra en la distribución de frecuencia siguiente: Cuadro No. 27 .0 11 10 10 12 7 50 22.0 Total 40 100.0 24.0 – 13.0 – 17.5 1 6 15.0 14. Siempre que se trate de datos cuantitativos continuos se hace necesario el uso de este tipo de distribución.0 100. cuyo rango de valor sea mayor de diez.0 11 21 31 43 50 22. “proporcionar información sobre las características de las variables estudiadas” Un ejemplo de este tipo de distribución de frecuencia se muestra a continuación Cuadro No : Calificación de 50 estudiantes de un curso de estadística en una prueba parcial Calificación fi % FA FRA ≤ 12.0 20.9 18.0 62.5 1 2.5 4 8 20.0 – 20.5 40 100.3 Distribución Frecuencia con Clase o Tipo II: Este tipo de distribución se utiliza para variables cuantitativas continuas y para aquellas variables cuantitativas discretas.5 27 67.0 100.9 14. de tener los diferentes valores con sus respectivas frecuencias se podría tener tantas clases como valores individuales se tenga.0 35 87.0 Fuente: Encuesta a 40 profesores noviembre 2006 2. 0 1 2. Elaborado por H. La razón para ello es que los datos cuantitativos continuos pueden diferir uno del otro por milésima de datos.0 20.0 7 17.0 12.0 3 9 22.5 18 45.6 Pasos para construir una distribución de frecuencia con clase. Junio 2010.5 5 5 12. perdiéndose de esta manera la esencia de la agrupación de los datos.0 – 15. % FA % Acum. Medina Disla.: Cantidad de estudiantes reprobados/as por curso # de estudiantes fi .

Marzo 1926 Elaborado por H. Calcular el rango de la variable: El rango de una variable se define como la diferencia entre dato mayor y el dato menor y el mismo indica los diferentes valores posibles que puede tomar la variable RV = Xmayor . Este procedimiento ayuda a que quien lea u organice la información no tenga dudas sobre donde colocar por ejemplo el 40. 4 Herbert A. si una clase va de 30 a 40. Junio 2010. 28 . Establecer los límites de cada clase: para establecer los límites de cada clase o intervalo. Medina Disla. como el 40 no va incluido en esa clase lo aconsejable es establecer como limite superior el resultado de la suma disminuido en una unidad. lo que nos daría una clase con los siguientes límites.322x log n) A partir de esta fórmula se obtiene un intervalo de igual dimensión para todas las clases lo que facilita el análisis. además de que este procedimiento facilita un mayor entendimiento del comportamiento de los datos.Xmenor 2.Apuntes sobre Estadística Los pasos que se presentan a continuación son solo una guía de cómo organizar los datos en una distribución de frecuencia con clase. Sturges: “The Choice of a Class Interval”. así. 30 a 39. la siguiente clase iniciaría con 40 y de esta forma los valores del límite superior de una clase y el inferior de la siguiente no van a ser iguales. esto es. los siguientes pasos son una buena guía y estos pasos son: 1. n representa el total de datos o tamaño de la muestra 1  (3. por ejemplo. Una forma de obtener el intervalo de cada clase es a partir de la regla sugerida por Sturges4 la cual establece que el ancho o intervalos de clases en una distribución de frecuencia puede aproximarse a partir de la siguiente fórmula: Ï RV . puesto que la forma de presentar los datos muchas veces depende de lo que se quiera mostrar en la distribución. 3. Pero cuando no se tiene una idea de cómo agrupar los datos. Es importante tener en consideración que los límites se deben establecer de forma excluyentes. se inicia con el dato menor y se le suma el intervalo y así se continúa hasta llegar al dato mayor observado. que los valores en los límites no deben ser iguales. Journal of the American Statistical Association. Calcular el intervalo o ancho de la clase: El intervalo o ancho de la clase es la diferencia que existe entre el límite inferior y el límite superior de cada clase y el mismo se puede obtener por tanteo o se puede establecer de acuerdo a los objetivos de quien está presentado la información.

3221 3. Ï  RV 1  ( 3 .322  1.Xmenor RV = 50 – 20 RV = 30 2. Los datos que se muestran a continuación representan las edades de un grupo de 40 personas que asistieron al estreno de una película 21 40 22 26 24 21 20 22 33 31 22 24 29 28 23 39 35 20 43 38 26 26 50 35 26 21 47 20 25 33 45 46 44 32 26 20 32 41 38 25 A partir de los datos desarrolle las siguientes preguntas: a) b) c) d) Construir una distribución de frecuencia Determinar el porcentaje de personas que tiene menos de 30 años Interprete el resultado de la frecuencia relativa simple de la tercera clase Interprete el resultado de la frecuencia relativa acumulada de la quinta clase. 322  log n ) Ï  30 30 30 30     4. Realizar el conteo y establecer las frecuencias: El conteo consiste es determinar cuantos valores de la variable pertenecen a cada clase o intervalo Ejemplo: 1. como se muestra a continuación: Elaborado por H. Rango de la variable: RV = Xmayor .322  log 40 ) 1  (3.Apuntes sobre Estadística 4.75  5 1  (3 . Establecer los límites de cada clase: recordemos que para la primera clase se suma el intervalo al dato menor y así sucesivamente. 29 .3221 6. Medina Disla.6021) 1  5. Junio 2010. e) ¿Qué porcentaje de las personas que asistieron al curso de estadística tiene menos de 38 años? Iniciamos con los cinco pasos para construir una distribución de frecuencia con clase: 1.

Apuntes sobre Estadística EDAD 20-24 25-29 30-34 35-39 40-44 45-50 Obsérvese que la primera clase inicia con el 20 que es el dato menor y termina en 24 ya que el intervalo de la distribución es de cinco.0 Fuente: Encuesta hecha a los/as asistentes al cine Elaborado por H. si tomamos los valores de la primera columna observamos que estos son: 21. el tercer valor es 22 y corresponde a la primera clase porque este valor está entre 20 y 24 y el cuarto valor es el 26 y pertenece a la segunda claro porque este valor esta entre 25 y 29 que son los límites de esta clase. 40. Este procedimiento se sigue hasta incluir todos los valores de la variable en la clase o intervalo correspondiente. 21. Por último establecemos la frecuencia de cada de una de las clases. Medina Disla.5 22.5 12.: Edad de las personas que asistieron al estreno de la película.5 55.5 12.0 FA 13 22 27 32 36 40 % Acum.5 80.0 67.5 10. EDAD 20-24 25-29 30-34 35-39 40-44 45-50 Total fi 13 9 5 5 4 4 40 % 32. Junio 2010.0 100. 23 y 24 que son los cinco valores del intervalo. tomando en consideración los límites de cada clase.0 100. 4. Un procedimiento recomendado es hacer un conteo.0 10. 30 .0 90. 32. El lector podrá preguntarse porque la primera la clase no termina en 25 que es resultado de sumar el intervalo al dato menor y la respuesta es que el 20 como dato menor va incluido en el intervalo de la clase y si contamos teneos 20. Así por ejemplo. 22. 22 y 26 por lo que el primer valor corresponde a la primera clase porque es un valor que esta entre 20 y 24. El resultado de dicho proceso se muestra a continuación: Cuadro No. el segundo valor corresponde es el 40 y corresponde la quinta clase que va de 40 a 44.

que el 90.0% y el mismo indica que el 90.5% Ejercicios para el aula 1. El resultado de la frecuencia relativa acumulada de la quinta clase es 90. es decir 72. También se puede decir.5% de las personas que asistieron al estreno de la película tienen entre 30 y 34 años. d) Interprete el resultado de la frecuencia relativa acumulada de la quinta clase. El tamaño de un grupo de viviendas. e) Interpretar el resultado de la frecuencia relativa simple de la tercera clase. Elaborado por H.0% de las personas que asistieron al estreno de la película tienen 44 años o menos. e) ¿Qué porcentaje de las personas que asistieron al estreno de la película tiene menos de 38 años? Como el 38 no aparece en ninguno de los límites. Junio 2010. 26 20 20 36 25 17 33 29 6 19 40 28 28 17 26 32 20 20 22 6 8 18 30 31 30 19 20 4 5 19 34 32 a) Construir una distribución de frecuencia. Medina Disla. b) ¿Qué por ciento de las viviendas tienes un tamaño inferior a los 25 m 2? c) ¿Qué por ciento de las viviendas tiene un espacio mayor a 30 m2? d) Interpretar el resultado de la cuarta clase de la frecuencia relativa acumulada. 31 .Apuntes sobre Estadística b) Determinar el porcentaje de personas que tiene menos de 30 años: Como se muestra en la tabla anterior menor a 30 años hay un 55. expresado en ciento de m 2. se hace necesario determinar en los datos sueltos cuantas personas tienen menos de 38 años y esta cantidad la dividimos entre el total y se multiplica por 100 para determinar el porcentaje. luego el porcentaje de persona con menos de 38 años es de (29/40)*100. c) Interprete el resultado de la frecuencia relativa simple de la tercera clase: La tercera clase es la que va de 30 a 34 y el resultado indica que el 12. se muestra en la tabla siguiente.0% que son las personas que tienen entre 20 y 24 años y las que tienen entre 25 y 29 años.0% de las personas que asistieron al estreno de la película tienen menos de 45 años. Para este caso tenemos un total de 29 personas con menos de 38 años.

02 2. b) Interpretar el resultado de la frecuencia relativa simple de la tercera clase.71 2.00 2. 1.00 3.42 3. b) ¿Qué porcentaje de padres de familia. Indeciso 16. se muestra en los datos siguientes.47 3. 5) El área de estudio de un grupo de 30 estudiantes se presenta a continuación. Economía 14.50 3. Computación Elaborado por H. d) ¿Qué porcentaje de estudiantes tiene un índice de calificación menor a 3. 7.06 2. El ingreso quincenal.53 3.25 3. Computación 23. 24 39 44 38 38 16 22 32 29 28 27 60 48 10 31 23 30 12 27 17 21 24 37 18 42 a) Organice los datos en una distribución de frecuencia con un intervalo de RD$10. c) Interpretar el resultado de la frecuencia absoluta acumulada de la cuarta clase. Administración 17. 4. Administración 27. 6. Mercadeo 15. Administración Economía Contabilidad Contabilidad Mercadeo Economía Mercadeo 11. 2.75 3. tiene menos de 15 años de educación? c) ¿Qué porcentaje de padres de familia tiene 12 años de educación? 4.60 a) Construir una distribución de frecuencia con cinco clases. Economía 25. Mercadeo 24. Indeciso 26.00 puntos? 3. La escolaridad de 35 padres de presenta como sigue. Los datos que se presentan a continuación representan el índice de calificación de un grupo de estudiantes de preparatoria.Apuntes sobre Estadística 2.09 3. Indeciso 12. Economía 21. 14 16 13 14 16 12 16 16 13 12 15 12 13 14 16 12 15 16 familia (expresado en años de educación) se 12 16 18 13 14 12 12 15 12 16 15 14 14 16 13 17 17 a) Organice los datos en una distribución de frecuencia. 32 .85 2. 5.96 2. Junio 2010. 3.05 3.G. Administración 22. Indeciso 13.22 3.20 3. en cientos de RD$ de un grupo de empleados de la empresa K. b) ¿Qué porcentaje de los empleados ganan menos de $20? c) ¿Qué porcentaje gana entre 30 y 40? d) Interpretar el resultado de la frecuencia relativa simple de la segunda clase. Medina Disla.00 2. 2.00 3.

Economía 18. Medina Disla. Junio 2010. Calcular el porcentaje de estudiante por área de estudio. Mercadeo 19. Indeciso 20. Construir una distribución de frecuencia. b. Administración 9.Apuntes sobre Estadística 8. Elaborado por H. Mercadeo a. Computación 28. 33 . Mercadeo 29. Mercadeo 10. Economía 30.

C52 Total Y2 C13 C23 . C53 Total Y3 . 2. Y3. esto es debido a que estamos presentando solo dos variables. . Es decir que se debe tomar en consideración las variables a incluir en el cuadro de doble entrada. La variable que se coloca en la primera fila generalmente es aquella que tienen un mayor número de categorías. X1. el cuadro tendría la forma siguiente: Yi Xi X1 X2 X3 X4 X5 TOTAL Y1 Y2 Y3 TOTAL Total X1 Total X2 C11 C21 . se debe tomar en cuenta si estas son continuas o discontinuas). X2. de igual forma ayuda a buscar patrones de interacción siempre que la frecuencia de cada celda represente un número significativo con respecto al total. X4 y X5 y que la variable Y tiene tres categorías. . Y1. (cualitativa o cuantitativa y en el caso de las variables cuantitativas. de forma tal que se forme una celda común para cada una de las categorías de las variables incluidas.7 TABULACIÓN CRUZADA También se le llama tabla de doble entrada y se utiliza para presentar dos o más variables en un solo cuadro. 34 . La Tabulación Cruzada proporciona una descripción básica de la interrelación que hay entre las variables que se tabulan en el cuadro. Junio 2010.1 TABULACIÓN CRUZADA PARA DOS VARIABLES Para la construcción de un cuadro de doble entrada con dos variable.Apuntes sobre Estadística 2. X3. Y2. Medina Disla. se coloca una de las variables en la primera columna o columna principal y la otra variable en la primera fila. Total X5 Total general El cuadro indica dos renglones para el total. Suponga además que la variable X tiene cinco categorías. C51 Total Y1 C12 C22 . si queremos presentar estas dos variables en un solo cuadro. así. digamos X e Y. . Para realizar un cuadro de doble entrada se sigue el mismo procedimiento que para construir una distribución de frecuencia con una variable. .7. Para ilustrar lo que se ha dicho. en el total de la última fila representa el Elaborado por H. suponga que estamos interesados en conocer la relación que existe entre dos variables.

El tercer estudiante es sexo masculino y tiene una calificación de 72 puntos. Junio 2010. Masc. Fem Fem Fem Masc. Masc. Masc. En las celdas que se forman. Masc. masculino y femenino. Fem Calif. Fem Masc. Por ejemplo. Ejemplo: Se evaluó el sexo y la calificación final de treinta estudiantes de una escuela primaria para conocer la relación entre la calificación en matemáticas y el sexo de los/as estudiantes. Luego de esta clasificación el cuadro queda como se ilustra a continuación: Como se muestra en el cuadro siguiente. Fem Fem Masc. y la calificación en matemática es continua y su rango es mayor de 10 por lo tanto hay que hacer una distribución con clases. (calificación matemática) y una cualitativa. Calif. los estudiantes con menos de 70 puntos. Los datos se muestran en la tabla siguiente. una variable cuantitativa. el primer alumno es de sexo masculino y tiene una calificación de 68 puntos. Masc. 70 91 72 70 65 82 68 86 71 82 No. 11 Masc. Masc. 22 23 24 25 26 27 28 29 30 Sexo Masc. (sexo de los/as estudiantes). La variable sexo tiene dos categorías. los que tienen entre 70 y 80 puntos. mientras que el total de la última columna representa el total de cada fila del cuadro. Fem Masc. 68 86 74 72 72 85 66 79 70 72 No. en la columna C12 se colocan los elementos que son comunes a X1 y a Y2 y así sucesivamente. por lo que se coloca en la columna de masculino y en la segunda fila. ya que aquí se deben colocar los estudiantes que tienen entre 80 y 89 puntos. No. 2 3 4 5 6 7 8 9 10 Sexo Fem Masc. 12 13 14 15 16 17 18 19 20 Sexo Fem Masc. 87 76 81 77 77 73 60 60 71 73 1 Masc. El segundo estudiante es una estudiante y tiene una calificación de 86 puntos. Masc. Para ello vamos a dividir esta variable en cuatro categorías. ya que aquí de colocan los que tienen calificación entre 60 y 69 puntos. en la celda C 11. Fem Masc. 35 . se colocarán los datos que tienen las dos características del cuadro.Apuntes sobre Estadística total de cada columna. por lo tanto se coloca en la columna de sexo femenino y en la tercera fila. Medina Disla. los que tienen entre 80 y 90 y los que tienen 90 o más puntos. ya que en Elaborado por H. Calif. Masc. por lo tanto se coloca en la columna de masculino y en la primera fila. se colocan los elementos que son comunes a X1 y a Y1. 21 Fem Para este caso tenemos dos variables.

100 Total Luego del conteo de las frecuencias. El procedimiento se continúa hasta tabular los datos de la tabla como se ilustra a continuación Sexo Calificación 60 . los datos son Masculino /// // Femenino /// ///// / Total ///////////// /// Cuadro No.100 Total Preguntas 1. Medina Disla. 5.Apuntes sobre Estadística esta se colocan los estudiantes con calificación entre 70 y 79 puntos.69 70 .89 90 .79 80 .69 70 . 36 . entre el número de asignatura por sexo. Finalmente incluya un pequeño análisis de la relación entre la edad de los estudiantes y el número de asignaturas cursadas. Elaborado por H. Calificación en matemáticas y sexo de los estudiantes Calificación 60 .89 90 . 3. así como el gasto en transporte por sexo y número de asignaturas cursadas. 4. 2.79 80 . ¿qué porcentaje es femenino? Del grupo femenino ¿qué porcentaje tiene menos de 90 puntos? Que porcentaje de estudiantes tiene entre 80 y 89 puntos Ejercicio: Con los datos que se presentan en la tabla siguiente crear un pequeño reporte indicando la relación entre el rendimiento académico y el sexo de los estudiantes. Junio 2010. Sexo Masculino Femenino 3 3 13 3 2 5 0 1 18 12 Total 6 16 7 1 30 Fuente: Registro de la escuela Determinar el porcentaje de estudiante por sexo Calcular el porcentaje de estudiantes con menos de 80 puntos De los que tienen menos de 90 puntos.

Medina Disla. los que están entre 24 y 27 años y los que tienen de 28 y más años.6 82.7 83. En el caso del número de asignaturas.8 75.5 74. 37 .5 74. Elaborado por H. los que están cursando cuatro asignaturas y los que cursan más de cuatro. Datos personales de 30 estudiantes de Informática No.3 77. los que tienen entre 20 y 23 años. En el caso del gasto en transporte haga una división en categorías.6 74.8 71.3 73. EDAD SEXO # DE ASIG.9 82.3 79.Apuntes sobre Estadística Para el índice académico divida esta variable en tres categorías.6 76.3 81.1 74. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 22 24 23 25 21 25 22 21 28 28 29 25 20 30 28 24 28 24 21 24 35 21 24 22 21 26 25 24 29 25 M F M M M F M F F F M F M F F F F F F M M F M F F F F M M F 3 3 4 5 3 3 3 6 3 4 5 3 4 2 3 4 3 6 4 3 2 4 3 3 4 3 4 5 3 5 80.7 79. INDICE ACAD. 24/02/2007.4 75.3 70.1 70.6 80. los que tienen entre 75 y 80 puntos y los que tienen más de 80 puntos.8 80.4 78. divídala en tres categorías.0 77.7 77.6 20 50 60 30 30 50 40 40 40 40 40 20 40 20 40 40 40 40 20 20 40 40 50 60 30 50 20 80 30 20 FUENTE: ENCUESTA EN EL AULA EST-211 SEC-01.2 76. Junio 2010.3 74.8 73.0 81.7 80.7 70. los que cursan menos de cuatro asignaturas. los que tienen menos de 75 puntos. Para la edad divida esta variable en tres categorías. si lo considera necesario y ser así. GASTO EN TRANSP. divida la variable a su conveniencia.

Junio 2010. Medina Disla.Apuntes sobre Estadística Elaborado por H. 38 .