You are on page 1of 64

Estadística aplicada a la

Educación

ESTADÍSTICA APLICADA A LA
EDUCACIÓN

“Algún
Algún día el pensamiento estadístico será nenecesario como la habilidad para leer o escribir”
(H.G. Wells)

Magíster Agustina Subeldía Coronel

AÑO 2014
Magíster Agustina Subeldía Coronel

1

Estadística aplicada a la
Educación

INDICE
UNIDAD I

INTRODUCCIÓN A LA METODOLOGIA DE LA INVESTIGACIÓN CUANTITATIVA

Metodología cuantitativa................................................................................................................................ 4
Características de la metodología cuantitativa............................................................................................ 4
Fases de la investigación cuantitativa......................................................................................................... .4
Definición del tema de investigación.......................................................................................................... 4
Planteamiento del problema...................................................................................................................... 5
Objetivos del estudio................................................................................................................................. 5
Justificación del estudio............................................................................................................................. 5
Revisión de la literatura – marco teórico.................................................................................................... 6
Diseño metodológico................................................................................................................................ 6
Bibliografía................................................................................................................................................. 6
Cronograma de trabajo.............................................................................................................................. 7

UNIDAD II

INTRODUCCIÓN A LA ESTADÍSTICA

Concepto de la estadística............................................................................................................................. 8
Importancia de la estadística ........................................................................................................................ 8
Funciones de la estadística........................................................................................................................... 8
Nomenclatura estadística.............................................................................................................................. 9
Elementos básicos de la estadística.............................................................................................................. 10
Elaboración de matriz tripartita de datos....................................................................................................... 10
Ejercicios de aplicación 1........................................................................................................................... 10
Variables........................................................................................................................................................ 11
Categorías de las variables......................................................................................................................... 11
Clasificación de las variables....................................................................................................................... 11
Ejercicios de aplicación 2............................................................................................................................. 12
Construcción de indicadores.......................................................................................................................... 14
Razón, relación............................................................................................................................................ 14
Proporción, porcentaje................................................................................................................................. 14
Ejercicios de aplicación 3............................................................................................................................ 15
Índice, crecimiento....................................................................................................................................... 17
Ejercicios de aplicación 4............................................................................................................................ 17
Técnicas de recolección de datos cuantitativos............................................................................................. 19
Cuestionario................................................................................................................................................. 19
Problemas más usuales en los cuestionarios............................................................................................. 19
Fases y diseño de preguntas de un cuestionario........................................................................................ 19

UNIDAD III

POBLACIÓN Y MUESTRA

Concepto de población y muestra...................................................................................................... 21
Principales tipos de muestras...................................................................................................................... 21
Tamaño de la muestra................................................................................................................................. 22
Determinación del tamaño de la muestra probabilística..............................................................................22
Representatividad de la muestra................................................................................................................. 24
Distribución del tamaño de la muestra por afijación proporcional................................................................24
Ejercicios de aplicación 5............................................................................................................................. 25

UNIDAD 4

ORGANIZACIÓN Y PRESENTACIÓN DE DATOS

Construcción de tablas de frecuencias.......................................................................................................... 27
Ejercicios de aplicación 6............................................................................................................................. 29
Elaboración de cuadros estadísticos............................................................................................................. 31
Partes principales de un cuadro estadístico................................................................................................ 31
Ejercicios de aplicación 7............................................................................................................................ 31
Construcción de gráficos estadísticos........................................................................................................... 32
Principales partes de un gráfico................................................................................................................... 32
Principales tipos de gráficos........................................................................................................................ 32
Ejercicios de aplicación 8............................................................................................................................ 36
Magíster Agustina Subeldía Coronel

2

Estadística aplicada a la
Educación

UNIDAD 5

ANÁLISIS DE DATOS

Estadísticas descriptivas............................................................................................................................... 38
Medidas de centralización (media, mediana y moda)..................................................................................38
Ejercicios de aplicación 9............................................................................................................................ 42
Medidas de dispersión (rango, desviación media, varianza, desviación estándar, CV)...............................44
Ejercicios de aplicación 10.......................................................................................................................... 46
Medidas de asociación (correlación, regresión)...........................................................................................48
Ejercicios de aplicación 11.......................................................................................................................... 53
Ejercicios de aplicación 12.......................................................................................................................... 55
Inferencias estadísticas................................................................................................................................. 57
Pruebas de hipótesis..................................................................................................................................... 57
Ejercicios de aplicación 13.......................................................................................................................... 61
ANEXOS........................................................................................................................................................ 63
BIBLIOGRAFÍA.............................................................................................................................................. 64

Magíster Agustina Subeldía Coronel

3

especialmente en el campo de la Estadística. CARACTERÍSTICAS DE LA METODOLOGÍA CUANTITATIVA           Basada en la inducción probabilística del positivismo lógico Medición penetrante y controlada Objetiva Inferencias más allá de los datos Confirmatoria. gráficos. índices. define en qué área del conocimiento quiere llevar a cabo la investigación. Debe documentarse en todo tipo de material referido a su tema. tablas. Se plantea algunas preguntas tales como: ¿Es el tema de interés? ¿Existe información sobre el mismo? ¿Dónde? ¿Qué resultados puede proporcionar la investigación? Debe conocer el objeto de investigación. porcentajes. etc. no se verá en profundidad. Sus resultados estarán reflejados en frecuencias absolutas. deductiva Orientada al resultado Datos "sólidos y repetibles” Generalizable Particularista Realidad estática PREPARACIÓN DEL PROYECTO DE INVESTIGACIÓN DEFINICIÓN DEL TEMA DE INVESTIGACIÓN En esta parte el investigador. Define el título preliminar de la investigación Consulta con expertos que lo ayudará a delimitar el objeto de conocimiento.Estadística aplicada a la Educación UNIDAD 1: INTRODUCCIÓN A LA METODOLOGÍA CUANTITATIVA METODOLOGÍA CUANTITATIVA Es una manera de enfocar los modelos de la investigación basada en un paradigma explicativo. cuando se busca una explicación matemática (cuantitativa) al problema. tasas. Magíster Agustina Subeldía Coronel 4 . Ofrece mucha información pero.

Ejemplo 1: En la actualidad. enumerar. comprobar. El objetivo debe redactarse con un verbo en infinitivo al principio que denote la búsqueda de un conocimien to. clasificar. JUSTIFICACIÓN DEL ESTUDIO ¿Cuáles son los motivos que justifican la realización de esta investigación? Los motivos pueden ser de carácter: Teórico: Es importante señalar en el diseño los principales elementos teóricos sobre los cuales se pretende desarrollar la investigación. describir. Se responden a preguntas tales como:  ¿Cuál es la importancia de este estudio?¿Para qué sirve?  ¿Cuál es su trascendencia para la sociedad?  ¿A quién beneficiará la investigación? ¿Cuál será el aporte?  ¿Qué alcance y limitaciones tendrá?  Se justifica la realización del estudio desde el punto de vista del investigador. se identifica y descri ben los “síntomas o efectos” que se observan y se los relaciona con las “causas” que los producen. establecer. estudiar. observar. registrar. Metodológico: Hace mención al uso de metodologías y técnicas específicas que han de servir de aporte para el estudio de problemas. probar. sugerir. aclarar. obtener. etc. coherente con el problema planteado. acoger. capturar. buscar. aplicar. por ejemplo: determinar. competencia. concentrar. afirmar. percibir. adquirir. definir. adecuar. recolectar. diferenciar. estudiar. generar. comparar. discutir. desarrollar. agotar. recopilar. Currículo. inferir. y más objetivos específicos que conducirán a lograr el objetivo general y que son alcanzables con la metodología pro puesta. debatir. guiar. actualizar. analizar. Por otro lado.Estadística aplicada a la Educación PLANTEAMIENTO DEL PROBLEMA En este apartado se realiza una breve descripción de la situación actual del tema que se va a investigar ubi cándolo en un contexto que lo haga comprensible (yendo de lo general a lo particular). identificar. abatir. intuir. OBJETIVOS DEL ESTUDIO Son los propósitos que se persigue en la INVESTIGACIÓN ¿Para qué y qué se busca con este estudio? ¿Qué quiero hacer en la investigación? ¿Qué es lo que busco conocer? ¿A dónde quiero llegar? Se recomienda formular un solo objetivo general global. elaborar. obtener un título académico o contribuir a la solución de problemas concretos. Efecto o síntoma: Descenso de calidad educativa Causas: Nivel de formación. proponer. en el mercado aparecen diversas instituciones privadas competidoras que ofrecen formaciones similares que con cuotas mínimas se pueden cursar y obtener un título igual o similar a las otorgadas por la Universidad Nacional. desarrollar. el nivel formativo de los estudiantes que ingresan a la Universidad Nacional ha bajado considerablemente con respecto a los años anteriores. Práctico: Se manifiestan en el interés del investigador por acrecentar sus conocimientos. explicar. experimentar. advertir. REVISIÓN DE LA LITERATURA – MARCO TEÓRICO ¿Qué teoría/ informaciones se tiene sobre el tema? ¿Quiénes han investigado ya sobre este tema? ¿Qué antecedentes se tiene sobre el contenido del tema? Magíster Agustina Subeldía Coronel 5 . discutir. afrontar. acopiar. examinar. comprender. comentar. descubrir. La formulación puede hacerse en forma de pregunta/s. ahondar. estructurar. entre otros. reforzar. evaluar.

Con esto se fundamenta teóricamente el trabajo de investigación. ASPECTO O DISEÑO METODOLÓGICO Es la estrategia que se utilizará para cumplir con los objetivos de la investigación. Se atiende lo que los diferentes autores ya escribieron sobre el tema. se describen los procedimientos y técnicas a ser utilizados ¿Cómo se va realizar el estudio? ¿Cuáles son los procedimientos y técnicas que se va a tener en cuenta en la realización del trabajo? Las partes a tener en cuenta son: BIBLIOGRAFÍA Se debe tener en cuenta toda la documentación bibliográfica que se ha consultado en el proceso de elabora ción de la investigación. La presentación del mismo se realiza teniendo en cuenta los reglamentos o normativas vigentes. En este parte se explica la realización del trabajo. Su función es definir el significado de los términos (lenguaje técnico) que se van a emplear durante el proceso de construcción del conocimiento en la investigación.Estadística aplicada a la Educación En la investigación que se va a realizar se debe tomar en cuenta el conocimiento ya existente sobre el tema. Se realiza una definición operacional de los conceptos fundamentales del estudio. Por sobre todas las cosas se debe explicar exactamente el alcance de cada una de las palabras o frases que van a definir el ámbito del trabajo de investigación. Magíster Agustina Subeldía Coronel 6 .

meses.Estadística aplicada a la Educación CRONOGRAMA DE TRABAJO Considera las diferentes etapas del proyecto y el tiempo estimado para cada una de ellas. semanas. que es la representación gráfica de las variables “actividades de las etapas de investigación” y “tiempo de ejecución” (pueden ser en días. año) Magíster Agustina Subeldía Coronel 7 . Para el mismo se utiliza la Gráfica de Gantt.

Estadística aplicada a la
Educación

UNIDAD 2: INTRODUCCIÓN A LA ESTADÍSTICA
¿Qué es la Estadística?
Es la ciencia que tiene por objeto la recolección, clasificación y análisis de conjuntos de datos de observaciones obtenidos en un estudio, para interpretarlos y obtener leyes y relaciones entre ellas, que orienta la toma
de decisiones a partir del análisis e interpretación de observaciones realizadas en forma directa o experi mentalmente”

¿Por qué es importante la estadística?

Permite comprender la bibliografía especializada (libros, estudios e investigaciones) basados en el análisis estadístico.

Constituye una herramienta auxiliar de utilidad inmediata y práctica en el trabajo profesional.

Ayuda a desarrollar una investigación rigurosa, ofreciendo fundamentos lógicos en los que se sustenta la
investigación básica y aplicada.

¿Qué funciones cumple la estadística?
Descriptiva: Se hace una descripción del resumen de los datos mediante el empleo de medidas de cálculos
(%, promedios, desviación estándar y coeficientes de correlación).
Inferencial: Consiste en inferir propiedades de una población sobre la base de una muestra con resultados
conocidos.
Predictiva: Orienta la toma de decisiones con vigencia y efecto en el futuro (estimativo).

Magíster Agustina Subeldía Coronel

8

Estadística aplicada a la
Educación

NOMENCLATURA ESTADÍSTICA
ESTADISTICAS, sinónimo de datos estadísticos, servirá para designar a toda colección sistemática de datos
referentes a un determinado fenómeno.
ESTADÍSTICO, es la persona que se dedica al estudio de la Estadística, es el profesional que analiza esta dísticas, desarrolla métodos y modelos estadísticos y contribuye a la evolución de la ciencia estadística. (Roberto B. Ávila Acosta)
ESTADÍGRAFO es el término utilizado para designar a la persona dedicada a las tareas propias de la estadística, aunque en ocasiones también es frecuente que se utilice para designar a la variable que define una
distribución estadística, de esta forma es común escuchar el término estadígrafo de prueba.
mx.answers.yahoo.com/question, smathdown.blogspot.com
ESTADÍGRAFO es una característica descriptiva global de una muestra .Es la medida de una característica
relativa a una muestra. La mayoría de los estadísticos muéstrales se encuentran por medio de una fórmula y
suelen asignárseles nombres simbólicos que son letras latinas.
http://virtual.uav.edu.mx/tmp/2611217572402.doc
DATO, es el valor o respuesta que adquiere la variable en cada unidad de análisis. Dato es el resultado de la
observación, entrevista o recopilación en general. Los datos son la materia prima de la Estadística.
INFORMACION, es el resultado de los datos procesados de acuerdo a ciertos objetivos. No hay información
sin datos.
VARIABLE, Son características o dimensiones observables, susceptibles de adoptar distintos valores o ser
expresados en varias categorías, tales como edad, ingresos, matrícula, Instituciones, lugar de nacimiento,
ahorros, etc.. Las variables se definen e identifican en función de los objetivos del estudio.
INDICADORES, son elementos característicos que describen una situación permitiendo su análisis. Son re ferentes empíricos que permiten una medición, descripción, ordenamiento de los datos o características en
forma válida y confiable. La validez y confiabilidad del indicador depende de la validez de los datos utiliza dos y de la lógica de su relación o construcción. En este sentido, los llamados índices, tasas, estadígrafos,
medidas de resumen, etc., son indicadores.
POBLACIÓN O UNIVERSO, está referido a cualquier colección finito o infinito de elementos que interesan a
un estudio y poseen alguna característica común observable y pueden ser personas, instituciones, objetos,
familias, animales y otras unidades más complejas. Toda población tiene “N” elementos y una muestra de “n”
elementos, donde n<N.
MUESTRA, es una parte o subconjunto de una población en estudio. Esta constituida de elementos seleccionados de una manera deliberada, con el objeto de investigar las propiedades de su población. La muestra
sólo da información de aquella población de la que ha sido extraída.
PARAMETRO, es un valor obtenido para describir en forma resumida las características pertinentes o más
importantes acerca de una población. Son las medidas de resumen de una población. Una población puede tener muchas características y por tanto muchos parámetros.
ESTADIGRAFO, datos empíricos que se usa con fines descriptivos o analíticos; son medidas de resumen
estadístico de un conjunto de datos. Las medidas de resumen de una muestra se llamarán estadígrafos.
Ejemplo, la media aritmética, mediana, varianza, coeficiente de correlación, etc.
CENSO, consiste en un recuento de todos los elementos en una población y/o una especificación de las dis tribuciones de sus características, basados en la información obtenida para cada uno de los elementos.
ENCUESTA, consiste en la obtención de datos de interés sociológico mediante la interrogación a los miembros de la sociedad. Permite obtener informaciones sobre un amplio abanico de cuestiones a la vez y no
sólo sobre un aspecto o problema definido.
UNIDAD DE ANÁLISIS, es el objeto o elemento indivisible que será estudiado en una población, sobre los
cuales se va a obtener datos. La unidad de análisis no es el fenómeno investigado sino el que genera el fe nómeno y proporciona datos concretos.
Magíster Agustina Subeldía Coronel

9

Estadística aplicada a la
Educación

ELEMENTOS BÁSICOS DE LA ESTADÍSTICA
En el trabajo estadístico existen tres elementos básicos como son: la población o muestra (unidades de
análisis), las variables o características, y los datos. A esto se lo denomina matriz tripartita
1. Los elementos o unidades de análisis (población) que pueden ser personas, instituciones, objetos,
familias, etc. y otras unidades más complejas. Estas unidades tienen una característica en común, en
cuanto constituyen el objeto de estudio de una investigación.
2. Las variables, dimensiones o características que se desea conocer en relación a las unidades de análisis, tales como matrícula, instituciones, etc.
3. Los datos o valores que alcanzan las unidades en las variables estudiadas, son las respuestas o resultados que se obtienen cuando
CUADRO 1
MATRÍZ TRIPARTITA DE DATOS: CARACTERÍSTICAS SOCIODEMOGRÁFICAS DE LOS DOCENTES
DE LA MAESTRÍA EN EDUCACIÓN. AÑO 2012
Unidades de análisis
(Población)

01
02
03
04
05
06
07
08
09
10
11
12

VARIABLES
Edad

Sexo

48
37
28
36
25
38
45
37
48
41
50
35

F
F
F
M
F
F
M
M
F
F
F
F

Estado Civil

Casada
Casada
Casada
Casado
Soltera
Casada
Viudo
Divorciado
Soltera
Casada
Viuda
Separada
Fuente Universidad XXX. Facultad de Postgrado.
Elaboración: Maestría en Educación

Nº de hijos

Años de servicio

4
3
1
3
3
0
2
5
3
5
1
2

21
15
6
15
5
18
25
16
25
17
24
13

EJERCICIOS DE APLICACIÓN 1
1. Establece poblaciones e identifica en él por lo menos tres variables (pueden ser del tipo nominal, ordinal,
razón o intervalar) que puedan ser estudiadas en las mismas. Elabora una matriz tripartita para cada población con 20 unidades de análisis.

Magíster Agustina Subeldía Coronel

10

En conjunto deben ser exhaustivas (cada posible respuesta en una categoría). característica o atributo. habitaciones por vivienda.Estadística aplicada a la Educación VARIABLES Objeto. etc. Ejemplos: sexo. causas de accidentes. estatura de los alumnos. cantidad de docentes por carrera. nómina o lista. sus datos se expresan mediante una palabra. cuando el valor resulta de la operación de contar. procesos o características reciben el nombre de variables en la medida en que su modificación provoca una modificación en otro objeto. profesiones. SEGÚN LA NATURALEZA DE LA VARIABLE a) Variables cualitativas o estadísticas de atributos Cuando expresan una cualidad. es toda variable cuyo valor se obtiene por medición o comparación con una unidad o patrón de medida. lugar de nacimiento. profesiones. es no numérico. Son aquellas que establecen la distinción de los elementos en diversas categorías. Los objetos. Área de parcelas. a) Variables nominales. Discreta. es de carácter numérico. Magíster Agustina Subeldía Coronel 11 . horas trabajadas de los docentes. proceso o característica. Cantidad de jóvenes de una carrera. ingresos monetarios. Femenino 2. Las variables cuantitativas pueden ser discretas y continuas. Se expresa por cualquier número real. CATEGORÍAS DE LAS VARIABLES Cada uno de los grupos de clasificación de una variable recibe el nombre de categoría. Se presenta a continuación las características básicas de los cuatro niveles distinguidos por Stevens. Continua. peso de los alumnos. Masculino CLASIFICACIÓN DE LAS VARIABLES Las variables se clasifican según diversos criterios. tienen carácter cualitativo. o que difiere de un lugar a otro o de un individuo a otro. El dato o valor puede resultar de la operación de contar o medir. Por ejemplo: estado civil. proceso o característica que está presente. producción de maíz. tiempo de servicios. Ej. cuando la variable es susceptible de medirse. etc.   Las categorías deben ser excluyentes entre sí. Hijos por familia. actividad económica. distribuye a la unidad de análisis en dos o más categorías. Ej. etc. o supuestamente presente en el fenómeno medible que un científico quiere estudiar. cantidad de alumnos en la institución de educación superior. número de accidentes por día. etc. Ejemplo 2 Variable: Sexo Categoría 1. lugar de nacimiento. sin implicar algún orden entre ellas. clase. b) Variables cuantitativas Cuando el valor de la variable se expresa por una cantidad. SEGÚN LA ESCALA DE MEDICIÓN. estado civil. su valor está representado solo por números naturales. A continuación se presentan algunas. cantidad de asignaturas por carrera. deportes que practica. que varía (cambia) a través del tiempo. Un conjunto de categorías para una determinada variable constituye la escala de clasificación.

son los efectos o resultados respecto a los cuales hay que buscar su motivo. h. f. j. pero no grados de distancia iguales entre ellas. rango de agresividad. nivel de preferencia. c) Variables de intervalo: Son aquellas que suponen a la vez orden y grados de distancia iguales entre las diversas categorías. El valor de estas variables se expresa con un número real. grado de simpatía. Ejemplo 3 1. 7. d) Variables de razón: tiene las características de la escala de intervalo. cuya asociación. temperatura. accidentes de tránsito. 3. las causas o antecedentes serían las VI y el efecto o conse cuente es la VD. El aprendizaje de los jóvenes (VD) tiene relación con las estrategias de enseñanza del docente (VI). Los años de estudios de la madre (VI) determinan el logro educativo del hijo (VD). SEGÚN LA RELACIÓN ENTRE VARIABLES a) Variables dependientes: Son aquellas que se explican por otras variables. 2. k. e. Las estrategias de enseñanza del docente (VD) depende de su formación pedagógica (VI). están referidas a un orden o jerarquía. donde las categorías expresan una posición de orden. ingresos. g. d. peso. Es la variable que traduce la consecuencia del efecto de una o varias razones o causas de otras variables. EJERCICIOS DE APLICACIÓN 2 2. El analfabetismo (VD) tiene relación con el lugar de residencia (VI) y la expansión del servicio educativo (VI). 5.) Magíster Agustina Subeldía Coronel 12 . c. ¿Cuál es su estatura? ¿Cuál es su peso? ¿Cuál es su ocupación? ¿Cuál es su nombre? ¿Cuántos años tiene? Tiempo empleado para comprar en la librería Cantidad de dinero que se utiliza para adquirir libros Número de materias en las que se inscribió Cantidad de niños de un aula Cantidad de docentes de una institución Sector de una Institución (Público. El volumen de ventas (VD) se explica por la inversión en propaganda (VI). clases sociales. 4. nivel de dolor. desviación Standard (DS) y siempre debiera también incluirse en base a cuantos casos (o sea el n) tienen dichos resultados. producción. Ejemplo: grado de instrucción. Privado. etc. La inversión en la capacitación docente (VI) aumenta el logro escolar (VD). Ejemplo: edad. causas o razón de ser. etc. pero se agrega un punto cero absoluto tal que significa ausencia del atributo y la razón o cociente de dos números es significativo pu diéndose aplicarles todo tipo de instrumental matemático. etc. etc. b) Variables independientes: Son las variables explicativas o predictivas. puntuación obtenida en una escala. 8. ¿En qué escala de medida están basadas las respuestas al siguiente cuestionario? a. número de hijos. 6. relación o influencia en la variable dependiente se pretende descubrir en la investigación. Ejemplos: coeficiente de inteligencia. i.Estadística aplicada a la Educación b) Variables ordinales: Aquellas variables que implican orden entre sus categorías. pero no tienen un origen natural. El número de hijos por familia (VD) tiene relación con el nivel educativo de los padres (VI). En la relación de variables. Las variables independientes (VI) son las que traducen o explican las causas o razones de las variaciones en la variable dependiente (VD). El presupuesto familiar (VD) depende de los ingresos (VI). b. sino convencional. En este tipo de variables es posible describir la información contenida en ellas calculando el promedio. orden de mérito.

Cuadro 2: Cant. ¿cuál de estas mediciones representa una variable. ¿Con qué escala de medición se mide la nacionalidad? ¿A qué tipo de variable. Formule una hipótesis para estas dos variables e indique cuál es la variable independiente y cuál es la variable dependiente. Clasifica cada una de las siguientes variables.Estadística aplicada a la Educación 3. i. En un estudio sobre los estudiantes del último año en una prestigiosa universidad. b. Superior) Grado que cursa Departamentos geográficos del país Zona Edad en años cumplidos Carrera cursada 4. Dé 3 ejemplos de variables según la relación entre variables. Media. En una institución de educación superior se ha realizado una encuesta acerca de la procedencia y nacionalidad de los estudiantes. según su naturaleza correspondería la Procedencia? ¿A qué tipo de variable. 7. se mide su promedio académico y su consumo de alcohol durante el mes anterior. se mide el área de especialización del alumno y su año de escolaridad. Año 2008 a. y cuál una constante? Magíster Agustina Subeldía Coronel 13 . de estudiantes por procedencia según nacionalidad Nacionalidad Total Paraguayos Extranjeros Total 55 35 20 Procedencia Capital Interior 38 17 23 12 15 5 Fuente: Universidad XX. según su naturaleza y escala de medición a. f. g. según su escala de medición correspondería la Procedencia? ¿A qué tipo de variable. En un estudio sobre los estudiantes universitarios del último año. regular o malo el desempeño del profesor de estadística? Estado civil Lugar de residencia 5. 8. h. e. d. Analiza y clasifica las siguientes variables. b. según su naturaleza correspondería la nacionalidad? 6. c. obteniéndose los siguientes resultados. j. c. En dicho estudio. según su naturaleza y escala de medición aa aa aa aa aa Religión que profesan las personas Profesan sí o no la religión católica Considera usted bueno. Zona de residencia Dirección de una persona Número de miembros de una familia Número de libros de texto que se adquieren Niveles de enseñanza (EEB. d.

sociedades.500 PROPORCIÓN (343. La razón de varones y mujeres. MUJERES 343. M 600 1 PROPORCIÓN Y PORCENTAJE PROPORCIÓN: Una proporción (P) es una comparación por cociente de la magnitud de una parte con la del todo.200-600=600. Así. etc.500 PORCENTAJE (343. Ra=1. O de cada 10 estudiantes 6 son mujeres Ejemplo 6: Indica el porcentaje mujeres matriculadas en la enseñanza superior durante 2010. La relación entre varones/mujeres. b. MUJERES 343. 0 P 1 Ejemplo 5: Indica la proporción de mujeres matriculadas en la enseñanza superior durante 2010. referente a la cantidad o magnitud de un conjunto de parámetros o atributos de una sociedad.5% Interpretación: El 59.500)=0. Magíster Agustina Subeldía Coronel 14 . Interpretación: Aproximadamente la sexta parte (0. naciones. Interpreta.) con respecto al concepto o conjunto de variables que se están analizando. Interpretación: Indica que existen 600 varones más que mujeres en dicha Institución. b. RAZÓN Y RELACIÓN RAZÓN: Es la comparación entre dos números que puede calcularse por diferencia RELACIÓN: Comparación entre dos números que puede calcularse por cociente.050/576. Re  V 1200 2   Interpretación: Indica que hay 2 varones para cada 1 mujer. El valor de una proporción (P) siempre se halla entre el cero y la unidad. para convertir una proporción en porcentaje se multiplica dicha proporción por 100. bienes.59 PORCENTAJE: Es la expresión de la proporción en forma de porcentaje (%).Estadística aplicada a la Educación CONSTRUCCIÓN DE INDICADORES INDICADORES: Un indicador social es una medida de resumen.050 MATRÍCULA TOTAL 576.5% de los estudiantes son mujeres. de preferencia estadística. Ejemplo 4: En una institución de nivel medio asisten 1200 varones y 600 mujeres. Calcula a.59) de los estudiantes son mujeres.050 MATRÍCULA TOTAL 576. Interpreta a. Permite ubicar o clasificar las unidades de análisis (personas.500)*100=59.050/576.

INST. Interpreta el resultado obtenido. Interpreta esta relación ¿Qué proporción representan las instituciones del sector Oficial?. Cuadro 5: PARAGUAY.Estadística aplicada a la Educación EJERCICIOS DE APLICACIÓN 3 9. Interpreta el resultado obtenido. 11. El siguiente cuadro presenta la matrícula por nivel del Sistema Educativo. ¿Qué proporción representa la matrícula del nivel Medio. Interpreta Halla la relación de Privado a Oficial. EDUCACIÓN SUPERIOR. Cuadro 4: SISTEMA EDUCATIVO. Interpreta ¿Qué porcentaje representan las instituciones de los distintos sectores?. Interpreta ¿Cuál es la relación entre la matrícula del Departamento Central y Alto Paraná? ¿Cuál es la relación entre la matrícula del Departamento Central y Asunción? ¿Qué porcentaje representa la matrícula del departamento Central? Interpreta ¿Qué proporción representa la matrícula de Asunción? Magíster Agustina Subeldía Coronel 15 . Año: 2011 DEPARTAMENTO Asunción Central Alto Paraná Itapúa a) b) c) d) e) f) MATRÍCULA 5882 4343 1672 1329 Calcula la razón por diferencia entre la matrícula de Asunción y Alto Paraná Interpreta Calcula la razón por diferencia entre la matrícula del Itapúa y Alto Paraná.813 111. Interpreta Calcula la razón entre las instituciones del sector Privado y Subvencionado. MATRÍCULA EN CUATRO DEPARTAMENTOS. Las Instituciones de Educación Superior se clasifican de la siguiente manera: Cuadro 3: Cant. 5 35 12 ¿Cuántas instituciones de Educación Superior existen en el Paraguay? Calcula la razón entre las instituciones del sector Oficial y Privado. Interpreta Halla la relación de la matrícula del Nivel Inicial y la EEB. Año: 2012 NIVEL INICIAL EEB MEDIO a) b) c) d) e) f) MATRÍCULA 100. Interpreta Calcula la razón entre la matrícula del nivel Inicial y la EEB. de instituciones de Educación Superior por sector. SECTOR Oficial Privado Subvencionado a) b) c) d) e) f) CANT. El siguiente cuadro presenta la distribución de la matrícula de la Educación Superior en cuatro departamentos.685 905.066 Calcula la razón entre la matrícula del nivel EEB y MEDIO. Interpreta Halla la relación de la matrícula del Nivel Medio y la EEB. MATRÍCULA POR NIVEL. Interpreta 10. Interpreta ¿Qué porcentaje representa la matrícula de la EEB?.

2 % de la sección “B “que tiene 48 alumnos y el 25. la ganadora del segundo lugar obtuvo 510. 16. las siguientes cuatro recibieron 482. MATRÍCULA POR CARRERA. obteniéndose los siguientes resultados.612 alumnos en la educación superior.3% salió en el año y el resto de alumnos se aplazó. c. Halla la proporción de los que vienen de la capital e interior ¿Qué porcentaje de extranjeros se encuentran en la capital? Halla el porcentaje de paraguayos y extranjeros que provienen de la capital ¿Qué porcentaje de extranjeros provienen del Interior? 13. b. y las restantes 10 participantes alcanzaron un total de 1140 votos. usted descubre que Natalia viene de una familia numerosa. se supo que Natalia ganó con 526 votos. Cuadro 7: UNIVERSIDAD XX. Interpreta c) ¿Qué proporción representa la matrícula de la carrera de Derecho? Interpreta d) ¿Qué porcentaje representa la matrícula de Arquitectura? Interpreta 14. EDUCACIÓN SUPERIOR.3%.4% de la sección “A”. En la fiesta para los concursantes. d. 37. 15. Cuando se anunciaron los resultados para la coronación de la reina. ¿Qué porcentaje se aplazó en el 1° se mestre?. Calcula la cantidad de alumnos aplazados en ese año.Estadística aplicada a la Educación 12. En Asunción en el año 2011 se han matriculado 7. respectiva mente. 325. que tiene 43 alumnos y 29% del 1° “B” que tiene 31 alumnos. y que 28 de sus parientes asisten a la misma universidad y votaron por ella. el 4.6% de la sección “C” que tiene 40 alumnos. se aplazaron en Matemática el 35. Es el regreso de fin de semana y en la universidad se eligió a un rey y a una reina. Año: 2011 CARRERA INFORMÁTICA COMERCIO INTERNACIONAL DERECHO ARQUITECTURA MATRÍCULA 188 151 241 122 a) ¿Cuál es la razón entre la matrícula de Informática y Arquitectura? Interpreta b) ¿Cuál es la relación entre la matrícula de Comercio Int. de los cuales aprobaron el 65. Interpreta ¿Qué relación hay entre paraguayos y extranjeros? Halla la relación capital/interior. se aplazaron el 41.9% del 1° “A”. 200 y 150 votos. ¿Qué cantidad de alumnos del 1er semestre no se aplazó en Matemática? ¿Qué porcentaje se aplazó en Matemática? 17. ¿Qué porcentaje de los 15000 estudiantes votó en la elección? ¿Del total de votos. En una institución de educación superior que tiene tres secciones del 1er semestre. de estudiantes por procedencia según nacionalidad Nacionalidad Total Paraguayos Extranjeros aa aa aa aa aa aa aa Total 55 35 20 Procedencia Capital Interior 38 17 23 12 15 5 ¿Cuál es la razón entre paraguayos y extranjeros?. a. qué porcentaje recibió Natalia? ¿Qué proporción del total de estudiantes representa la familia de Natalia? ¿Fue el apoyo familiar un factor clave en la victoria de Natalia? Magíster Agustina Subeldía Coronel 16 . En una carrera universitaria que tiene dos secciones del 1° semestre. Cuadro 6: Cant. El siguiente cuadro presenta la distribución de la matrícula por carrera. En una institución educativa se ha realizado un sondeo acerca de la procedencia y nacionalidad de los estudiantes. e Informática?. que tiene 45 alumnos. Interpreta.

no una medida. Por consiguiente. Es un indicador de una característica observable.00 720. AÑO 2002 2003 2004 2005 2006 2007 2008 2009 2010 TOTAL 2779 3490 3750 3527 3618 3696 3521 3863 4186 HOMBRE 1684 2004 2046 1868 1840 1894 1824 1920 2193 Magíster Agustina Subeldía Coronel MUJER 1095 1486 1704 1659 1778 1802 1697 1943 1993 17 . se tiene para el año 1994 que: Índice de alumnos  835. se puede calcular los dos tipos de crecimiento. pues el índice es superior al del año base 1994 CRECIMIENTO: Determinadas variables crecen.49% EJERCICIOS DE APLICACIÓN 4 18.331 Interpretación: El resultado indica que en un período de 5 años.492 109. sirven también para predecir el comportamiento de las variables en el futuro.877 687. en su cálculo es funda mental considerar el orden en que se presentan las observaciones a través del tiempo. por lo tanto.331 100.92 798.089 . PERIODO 1989 .758 alumnos Crecimiento relativo de la matrícula  M n  M0) M0 100  835. CUADRO 8: PARAGUAY.1994 MATRÍCULA Índice Cantidad Base 1990=100 656. Crecimiento absoluto de la matrícula =M1994 .089 121. EDUCACIÓN PRIMARIA.90 755. permanecen constantes o decrecen con el paso del tiempo. la matrícula se incrementó en un 21.331) 100 21.49 AÑO 1989 1990 1991 1992 1993 1994 Fuente: MEC.49% 687.089-687.089 100 121.50% 687.981 116. lo más que puede hacer es indicar.Estadística aplicada a la Educación ÍNDICE Y CRECIMIENTO NÚMERO ÍNDICE: Indica la evolución de una serie cronológica. es muy útil para describir y explicar el funcionamiento de los sistemas de la educación en el pasado.24 835. Crecimiento absoluto y Crecimiento relativo o porcentual Ejemplo 7: Considerando el cuadro anterior.687.983 104.331 Lo que indica un crecimiento positivo. MATRÍCULA POR AÑO. Anuarios 1989 a 1994 Considerando como año base 1990. El siguiente cuadro contiene datos históricos de la matrícula de una Institución.331=147. Los crecimientos pueden ser.M1989=835.

calcular para el año 2000 el índice de alumnos VARONES Constrúyase un nuevo cuadro con columnas que muestre los datos en porcentajes por fila. AÑO 1996 1997 1998 1999 2000 a) b) c) d) TOTAL VARÓN 350 348 450 443 448 MUJER 475 462 446 435 450 Considerando 1996 como año base. durante el período 1990 – 1997. AÑO 1996 1997 1998 1999 2000 TOTAL OFICIAL 35 36 45 48 50 PRIVADO 25 28 29 35 38 aa Considerando 1996 como año base. El siguiente cuadro indica el número total de Instituciones y su distribución por SECTOR. Calcula el crecimiento porcentual de la matrícula total.Estadística aplicada a la Educación 2011 a) b) c) d) e) f) g) 4567 2506 2061 Considerando como año base 2005. aa Calcula el crecimiento porcentual de las instituciones. El siguiente cuadro indica el número total de alumnos matriculados en la EEB. AÑO 1990 1991 1992 1993 1994 1995 1996 1997 a) b) c) d) e) TOTAL 454853 452249 467552 478584 493231 504377 518968 530163 URBANA 195533 191215 193722 194702 196685 198555 200781 202783 RURAL 259320 261034 273830 283882 296546 305822 318187 327380 Considerando 1993 como año base. el Índice total de alumnos. su distribución por zona urbana y rural. durante el período 1996 – 2000. Calcula el crecimiento porcentual de la matrícula total en el período 1992-1997 Calcula el crecimiento porcentual de la matrícula por zona entre los años 92-97 Calcula el crecimiento porcentual de la matrícula por zona entre los años 90-94 Analiza los porcentajes obtenidos en el cálculo anterior. Halla el crecimiento absoluto de la matrícula total en el período 2002-2006 Halla el crecimiento porcentual de la matrícula total en el período 2002-2006 Halla el crecimiento porcentual de la matrícula total en el período 2007-2011 Halla el crecimiento porcentual de la matrícula total en el período 2006-2010 Halla el crecimiento porcentual de la matrícula de hombres en el período 2007-2011 Halla el crecimiento porcentual de la matrícula de mujeres en el período 2007-2011 19. por SEXO entre los años 1996/2000 Analiza los porcentajes obtenidos en el cálculo anterior. su distribución por sexo. calcular para el año 2000 el índice de Instituciones por Sector. 20. El siguiente cuadro indica el número total de alumnos matriculados de la Institución “XX”. por SECTOR entre los años 1996/2000 Magíster Agustina Subeldía Coronel 18 . 21. calcular para el año 2010. calcular para el año 1997 el índice de alumnos de la zona urbana. durante el período 1996 – 2000.

que luego derivan en objetivos y/o hipótesis. Problemas más usuales en los cuestionarios1  Preguntas con alto grado de ambigüedad. Además es importante resaltar que es la técnica que se emplea frecuentemente en los trabajos de grados. como son: la entrevista.  Mala secuenciación de las preguntas. para muchos investigadores. Cuando sean necesarias más categorías. en una herramienta de investigación fácil de usar. 1 VI Jornadas Españolas de Documentación – Fases de la encuesta y del diseño de preguntas en un cuestionario Reglas básicas para la elaboración del cuestionario • • • • • • Si se quieren respuestas concretas las preguntas deben ser concretas. tesis. No deben hacerse preguntas que contengan potencialmente las respuestas. El número de categorías de las respuestas es también muy importante. No deben incorporar juicios.piloto  Utilización errónea de escalas de medida. Sin embargo.  Mala estructuración de las preguntas. Con frecuencia en la metodología cuantitativa se hace uso de la estadística para el análisis de las mediciones obtenidas y a partir de ahí se es tablece conclusiones respecto a las hipótesis formuladas. midiendo las variables en un determinado contexto. Las preguntas deben ser neutrales. pues no todos los que la usan tienen un conocimiento suficiente para explotarla adecuadamente convirtiéndose entonces en un medio poco fiable para obtener una información representativa. Raramente son necesarias más de 5 ó 7 categorías en preguntas de actitud o de opinión. el test. opiniones o valoraciones. la cual se transforma en preguntas de investiga ción. La encuesta es un método de investigación compatible con el empleo de varias técnicas e instrumentos de recolección de datos. Se desarrolla un plan para lograr los objetivos y/o las probar estas hipótesis. problema o situación determinada.  Cuestionarios elaborados sin pruebas de validación . El encuestado no debe esforzarse en recordar ante lo que conviene facilitar su memoria.  Cuestionarios con excesivo número de ítems. popular y con resultados directos. se debe advertir sobre los peligros a los que puede llevar su empleo indiscriminado.Estadística aplicada a la Educación TÉCNICAS DE RECOLECCIÓN DE DATOS CUANTITATIVOS En el enfoque cuantitativo generalmente se elige una idea. Magíster Agustina Subeldía Coronel 19 .  Errores en la codificación de las preguntas. Las preguntas que admiten varias respuestas deben ser definidas cuidadosamente. El cuestionario se ha convertido pues. etc. el cuestionario. Se realiza mediante la aplicación de cuestionarios orales o escritos. es preferible desglosar la pregunta en varias con menos categorías cada una. la observación. La técnica más destacada del enfoque cuantitativo es la encuesta. que consiste en la obtención de información relativa a un tema.

de las respues tas a las preguntas. teniendo como finalidad indicar cuándo se deben efectuar las preguntas. Ejemplo 8 Magíster Agustina Subeldía Coronel 20 . en qué orden. Se ha de explicitar el recorrido del cuestionario. y otra información semejante. etc.Estadística aplicada a la Educación • • • El orden del cuestionario deberá ser lógico. que ha de depender del tipo preguntas. El orden de las preguntas no debe afectar a las respuestas.. Las preguntas deben hacerse por temas afines y en orden de dificultad creciente. Las preguntas más sencillas han de ir al principio del cuestionario.

Seleccionar un solo número al azar. Esta constituida de elementos selec cionados de una manera deliberada. El procedimiento es el siguiente: 1. que deberán ser numeradas correlativamente. Determinar el tamaño de la muestra (n). Se utiliza mucho debido a su comodidad y bajo costo. “Construcción y análisis de datos” Magíster Agustina Subeldía Coronel 21 . La diferencia con respecto a la muestra por cuotas es el 1 Según Denis Baranger. objetos. Por ejemplo. Probabilísticas: En las muestras probabilísticas o aleatorias requiere que todos los elementos de una población tengan una probabilidad conocida de ser seleccionados. Establecer la fracción de muestreo f  N n 4. está referido a cualquier colección finita o infinita de elementos que interesan a un estudio y poseen alguna característica común observable y pueden ser personas. que corresponderá a la primera unidad seleccionada. donde n < N.  Por cuotas:1 es aquel en que se busca garantizar la selección de elementos pertenecientes a los diferentes estratos que conforman la población y que dichos elementos puedan ser tenidos en cuenta en las mismas proporciones que ocurren en esa población. Generalmente son los muestreos que se utilizan en los sondeos.  Casual o accidentales: consisten simplemente en tomar los casos casuales hasta alcanzar un cierto tamaño de la muestra. La muestra sólo da información de aquella población de la que ha sido extraída.Estadística aplicada a la Educación UNIDAD 3 .POBLACIÓN Y MUESTRA POBLACIÓN O UNIVERSO. 5. Ejemplo 9:  Las instituciones de una zona  Las instituciones de un departamento  Los jóvenes de una carrera  Los estudiantes de un postgrado  Los docentes de una universidad MUESTRA. entonces sería convenien te hacer una estratificación por grupo etario.  Estratificada: Este tipo de muestreo se hace en base a determinadas variables que se consideran perti nentes para la estratificación de la población.  Sistemática: Se trata de un procedimiento de muestreo que simplifica la selección de las unidades. se quiere conocer las opiniones de los niños de EEB y se supone que las mismas variarán de acuerdo a las edades. También se requiere de un listado completo de los elementos de la población. animales y otras unidades más complejas. El requisito fundamental es tener un listado completo de los elementos de la población. instituciones. por lo que en la práctica se torna difícil trabajar con poblaciones grandes. PRINCIPALES TIPOS DE MUESTRAS No-probabilística: En este tipo de muestreo no hay modo alguno de evaluar estadísticamente los resultados obtenidos a partir de la muestra.  Azar simple: es la muestra donde todos los elementos de la población tienen la misma probabilidad de resultar seleccionados. familias. Se incluirán en la muestra las primeras 100 personas que pasen por una esquina. Por ej. Determinar el tamaño de la población (N) 2. es una parte o subconjunto de una población en estudio. con el objeto de investigar las propiedades de su población. Toda población tiene “N” elementos y una mues tra de “n” elementos. A la primera unidad seleccionada se le suma la fracción de muestreo y se procede sucesivamente hasta completar la muestra. 3.

En estadística. se determina en función a los objetivos del estudio y las características de la población. donde la validez externa se consolida mediante la repetición o reproducción del estudio). o número de estratos totales de la población. Determinación de la muestra probabilística En caso que se desee determinar el tamaño de la muestra para encuestas.  Por Conglomerados (clusters) y en etapas múltiples: Este tipo de diseño se utiliza en general para reducir los costos de recolección de datos. en cambio. En este sentido. necesarios para que los resultados obtenidos sean representativos de la población. es el tamaño de la muestra. en este tipo de muestra se selecciona entre los conglomerados. para los conglomerados cuanto más heterogéneos sean mejor será el resultado. es en cierto modo una estrategia opuesta a la del muestreo estratificado. por todas las consecuencias negativas que puede producir una equivocación. TAMAÑO DE LA MUESTRA Uno de los aspectos a concretar en las fases previas de la investigación. La muestras dirigidas (intencionales) o no probabilísticas. ya que en una muestra estratificada. N: Número total de elementos que conforman la población. correlativamente. z: Valor estandarizado en función del grado de confiabilidad de la muestra calculada. Los conglomerados son unidades de un mismo tamaño. así como de los recursos disponibles (costo. El tamaño de la muestra. En la mayoría de los casos se utiliza cuando no se cuenta con un listado de todos los elementos de la población. hay que tener en cuenta que aumenta el grado de error a diferencia del muestreo estratificado. Mientras que en aquellos estudios que requieren ser expandidos a una población. válidos y confiables. muestras que su ponen la definición de unidades de muestreo en diferentes niveles. generalmente. tiem po. También sirve para el caso en que la población en estudio no sea finita. representa una parte esencial del método científico para po der llevar a cabo una investigación. el tamaño de la muestra es el número de sujetos o elementos que componen la muestra extraída de una población. como los no experimentales descriptivos o correlacionales-causales se deben utilizar las muestras probabilísticas. se recurre a la determinación del tamaño de la muestra probabilística. entre otros). La técnica por conglomerados se integra en diseños de muestra en etapas múltiples. si consideramos trabajar con un 95 % de confiabilidad la muestra seleccionada. Por ejemplo.o probabilísticos). entonces el valor estandaMagíster Agustina Subeldía Coronel 22 . es importante definir el alcance de la investigación de manera a determinar el tipo de mues tra a ser empleado (no probabilísticos -dirigidos o intencionales. generalmente son utilizadas en los estudios exploratorios (aunque también puedan ser utilizados muestras probabilísticas) e investigaciones experimentales (debido a que los experimentos requieren de manejos de grupos no muy grandes. según la apli cación de las siguientes fórmulas. así como se busca que los estratos sean lo más homogéneos posible internamente. los casos se seleccionan dentro de cada estrato. sin embargo. Determinar el tamaño adecuado para una muestra es una elección crucial. (*) Donde deben ser considerados los siguientes elementos de la inferencia estadística: n0: Cantidad teórica de elementos de la muestra. sondeos de mercadotecnia y estudios de investigación.Estadística aplicada a la Educación hecho de que la selección de las unidades se realiza al azar y además que es apta para realizar cual quier tipo de inferencia estadística. n: Cantidad real de elementos de la muestra a partir de la población asumida o de los estratos asumidos en la población.

05 hasta 0.24 95 % ------------.01 hasta un 0.5%-----------.02 hasta 0. por lo que se debe tener en cuenta. Para 20 ≤ N ≤ 29 -----. de alumnos 650 825 365 720 2.1:  Para 3 ≤ N ≤ 10 --------------------. con un margen de error de 3% y con un nivel de confianza de 99%. q: probabilidad de la población que no presenta las características.02 (del 1 al 2 %).44 80%--------------.Se asume Є = 0.1 (un error del 10 %). Para N ≥ 160 --------.01 hasta 0. Determine el tamaño de la muestra de estudiantes a ser utilizada para la evaluación. consiste en reportar los resultados con 95% de confianza y 3 por ciento de rango de error. error en la selección de la muestra. debido a diversos factores subjetivos y objetivos de los individuos u objetos que conforman la población.20 (del 5 al 20 %).05 (un error del 5 %). por lo que este error se puede asumir entre un 1 hasta un 10 %.z = 2. es decir.z = 1.10 (del 5 al 10 %).Se asume q = 0. Comercial Marketing Total de estudiantes = N Magíster Agustina Subeldía Coronel Cant. a decir de Ritchey F. Ejemplo 10: Determinación de tamaño para una muestra probabilística La universidad se encuentra abocada en realizar una evaluación del desempeño docente. Para 80 ≤ N ≤ 159 ---.z = 1.58 (Empleado con frecuencia) 97.Estadística aplicada a la Educación rizado asumir es igual a 1.Se asume q = 0. Asimismo.z = 1.28 Є: Error asumido en el cálculo.05 (del 2 al 5 %). entre otras.z = 1. Muchos autores plantean esta probabilidad entre un 1 hasta un 25 %. se recurre a una muestra que facilite información adecuada. Para 30 ≤ N ≤ 79 ----.  Para N > 10 --------------------.96 (Para dos colas). sondeos de mercadotecnia y estudios de investigación. Carrera Informática Derecho Ing.z = 2. Parámetro mediante el cual se asume qué por ciento o proporción de la muestra no puede presentar las mismas características de la población.Se asume q = 0. A continuación se propone la siguiente tabla: Para 3 ≤ N ≤ 19 ------.Se asume q = 0. q =40%.64 85%--------------. p: Probabilidad de la población que presenta las características. que se asume en valores de probabilidad correspondiente entre un 0.5 (50%) que maximiza el tamaño muestral. para ello desea consultar a los estudiantes. una norma tradicional para determinar las muestras para encuestas. 2001.05 hasta 0.Se asume Є = 0. Algunos valores estandarizados (z) en función de grado de confiabilidad asumido (para dos colas): 99 % ------------.96 (El más empleado) 90 % ------------. Toda expresión que se calcula contiene un error de cálculo debido a las aproximaciones decimales que surgen en la división por decimales. Debido al alto costo que podría ocasionar la aplicación del instrumento a todos los estudiantes y al escaso tiempo con que se cuenta.560 23 . cuando no se conoce esta variable asumir el valor máximo de 50 %. Es la probabilidad que tiene la muestra en poseer las mismas cualidades de la población (homogeneidad) y está determinada por: Como p + q = 1 (Probabilidad máxima) p = 1 – q En caso de no contar con la información respecto a “p” y “q” se recomienda el uso de l valor p = 0. p = 60%. A continuación se presenta la distribución de alumnos por carrera de la Universidad.Se asume q = 0. otros asumen.01 (un 1 %).

p. REPRESENTATIVIDAD DE LA MUESTRA Uno de los primeros pasos en cualquier investigación consiste en la determinación del universo o población. que debe estar comprendido entre un 1 hasta un 10 % (0.. 2.58.4 1. más bien nuestra creencia en su representatividad la que va a depender del plan de muestreo utilizado para seleccionarla. Esto se lleva a cabo mediante la aplicación Magíster Agustina Subeldía Coronel 24 . Una muestra que sea representativa para determinados propósitos.03 a Cálculo de la cantidad real de elementos de la muestra a partir de la población n 1.048 n0 1.775. el problema está en cómo proceder para distribuir ésta de manera equitativa o proporcional con relación a cada estrato constituido..6 q 40% 0. no es la muestra en sí la que es representativa. Uno de los métodos para mejorar la calidad del muestreo es la estratificación de la población.04 1..nivel.4 Cálculo de la cantidad teórica de elementos de la muestra 2 2 a 2. si la población que nos interesa es de gran tamaño.775. y de considerar un adecuado porcentaje (desde un 1 hasta un 20 %) en valores probabilísticos (0.Estadística aplicada a la Educación N 2. 01 hasta 0.de. para.04 1  0.6 0.01 hasta 0.03 p 60% 0... 2) de que la muestra no posee las características de la población.6 0.58 a aza 2 n0 a a . en este caso se recurre a una muestra.693375 1. esta debe ser seleccionada de modo tal de obtener la máxima aproximación a los parámetros poblacionales.23 1.99%. de asumir un determinado porcentaje en el error de cálculo.q a a 0. 3.4  86 ) 0.. Si bien existen procedimientos para evaluar la bondad de una muestra.confianza  3% 0.693375 Tamaño de la muestra de 1 1 2.560 N estudiantes a ser utilizada para la evaluación.560 z 2.04 a a a 0. convendrá tener en cuenta las siguientes consideraciones: 1.. podría resultar sumamente trabajoso obtener informa ción sobre todos sus elementos.10). Para que la muestra sea “representativa” de la población. puede no serlo para otros: no existe la muestra representativa en sí. DISTRIBUCIÓN DEL TAMAÑO DE LA MUESTRA POR ESTRATOS (AFIJACIÓN PROPORCIONAL) Una vez seleccionada la muestra total.775. La idea de representatividad tiene que ver con la posibilidad de que la muestra sea una réplica adecuada de la población en lo que hace a las variables relevantes..04 n 0    1.775.775..04 1.048. Al respecto.4 7.6 0.396 0. La representatividad de una muestra está dada en considerar que la misma fue extraída de una pobla ción con un determinado nivel de confianza (se trabaja preferiblemente con un 95 % de confianza o más). para cualquier propósito.

14 1.26 1.48 273 0. Asimismo se requiere la muestra por carrera.048 Los resultados indican que el instrumento de evaluación será aplicado a: 273 estudiantes de la carrera de Informática.560 1 Carrera Informática Derecho Ing.28 1. 335 de Derecho. A continuación se presenta la distribución de alumnos por carrera de la Universidad.36 335 0. de Proporción de alumnos por alumnos carrera 650 2. Se estratifica la población de acuerdo a las determinadas variables que se consideran pertinentes.El siguiente cuadro presenta la distribución de la matrícula de la carrera de Educación por semestre.560 0. Considerar para el cálculo del tamaño de la muestra. con un margen de error de 4% y un nivel de confianza de 95%. Comercial y 293 de Marketing. totalizando de esta manera una muestra total de 1.28 2. 4. Se calcula la proporción por estrato Se determina el tamaño de la muestra Se multiplica cada una de las proporciones de cada estrato por el tamaño de la muestra. Para determinar el tamaño de la muestra por afijación proporcional se procede de la siguiente manera: 1.048 146.560 0. Se desea hacer un estudio para rescatar la percepción de los alumnos acerca de la carrera de Educación y para ello se requiere de una muestra representativa tanto del total de alumnos como por semes tres.32 365 365 2.26 650 825 825 2. p=q=50%.560 0.048 estudiantes de la Universidad EJERCICIOS DE APLICACIÓN 5 22.44 293 Total de estudiantes para la muestra = n= 1. Carreras Total Informática Derecho Magíster Agustina Subeldía Coronel 20 30 25 .560 0. Ejemplo 11: Distribución del tamaño de la muestra por estrato (Afijación proporcional) Teniendo en cuenta el resultado obtenido en el ejemplo anterior. SEMESTRE 1º 2º 3º 4º 5º 6º 7º 8º 9º 10º MATRÍCULA AÑO 2011 188 151 141 122 103 85 80 75 70 60 23.72 147 0. Distribuir el tamaño total de muestra igual a 1. con un margen de error de 3% y con un nivel de confianza de 99%.048 272.32 1.14 720 365 2. 3. Cant. 2.048 335. El siguiente cuadro presenta la distribución de docentes por carreras de una determinada Universidad. 147 de Ing.048 estudiantes por carrera para realizar la evaluación del desempeño docente. Comercial Marketing Total de estudiantes = N Distribución de la Muestra 0.Estadística aplicada a la Educación de la metodología de la afijación proporcional. Se realizará una encuesta a los docentes y para ello se requiere de una muestra en la que se tendrá en cuenta los siguientes criterios: p = q =50%.048 293.

El siguiente cuadro presenta la distribución de la matrícula de alumnos de la Educación Superior en cuatro departamentos.Estadística aplicada a la Educación Ing. ¿Cómo quedaría distribuida dicha muestra por departamentos? b) Por otro lado. Comercial Marketing 25. si se considera el 17% del total de la matrícula? En este caso. por promoción. Año: 2010 DEPARTAMENTO Asunción Central Alto Paraná Itapúa MATRÍCULA 5848 4343 1672 1329 a) Calcular el tamaño de la muestra probabilística para el total de matriculados de la Educ. El siguiente cuadro presenta la distribución de alumnos de la li cenciatura de C. ¿Cuántos matriculados de Alto Paraná deberán ser seleccionados para la muestra estratificada por departamento? 27. con un margen de error de 4% y con un nivel de con fianza de 99%. p = 70%. ¿Cómo quedaría distribuida dicha muestra por carrera? El siguiente cuadro presenta la distribución de alumnos del 2° curso por carrera. Debido al alto costo que podría ocasionar la aplicación del instrumento a todos los alumnos. de alumnos Año 1998/2000 Año 1999/2001 78 87 Total 165 26. Se desea realizar una encuesta entre la población juvenil de una determinada localidad para determinar la proporción de jóvenes que estaría a favor de una nueva zona de ocio. q =30%. p = 60%. Superior. para ello desea recurrir a una muestra del 25% del total de estudiantes. q =40%. MATRÍCULA EN CUATRO DEPARTAMENTOS. EDUCACIÓN SUPERIOR. te niendo en cuenta los siguientes criterios. Un investigador se encuentra abocado en la tarea de realizar un estudio de percepción de los estudiantes. Comercial Marketing 25 12 24. Determinar el tamaño de muestra necesario para estimar la proporción de estudiantes que están a favor con un error de estimación de 0´05 y un nivel de confianza del 95% Magíster Agustina Subeldía Coronel 26 . de alumnos Informática 133 127 119 126 Derecho Ing. recurre a una muestra en la que se debe tener en cuenta.000. El número de jóvenes de dicha población es N=2. con un margen de error de 5% y con un nivel de confianza de 95%. ¿de cuántos alumnos estaría conformada la muestra.La universidad se encuentra abocada en realizar una evaluación del desempeño docente. de la Educ. Promoción Cant. asimismo requiere que la muestra este distribuida por promoción. Carrera Cant. PARAGUAY.

4 91. En ellas se observa la frecuencia o repetición de cada uno de los valores de la variable. FRECUENCIA RELATIVA ACUMULADA (fra): en un punto determinado.3 8.7 8.3 8. es posible conocer el máximo y el mínimo valor de Xi.7 100. FRECUENCIA RELATIVA o DISTRIBUCIÓN DE PROBABILIDADES (fr): Es el cociente entre la frecuencia absoluta y el número total de casos (Fabs /n).7 16.7 8. etc. es igual a las sumas de las frecuencias relativas anteriores al punto.4 66.7 16.7 33. que presentan la distribución de un conjunto de elementos de acuerdo a las categorías de la variable.Estadística aplicada a la Educación UNIDAD 4 – ORGANIZACIÓN Y PRESENTACIÓN DE DATOS CONSTRUCCIÓN DE TABLAS DE FRECUENCIAS TABLAS DE FRECUENCIA O DE DISTRIBUCIÓN. 51 88 62 73 68 61 90 92 62 61 88 51  Ordena ya sea en forma ascendente o descendente los datos y halla las frecuencias.4 50. FRECUENCIA FRECUENCIA PUNTAJE ABSOLUTA (fa) RELATIVA (fr) 51 61 62 68 73 88 90 92 TOTAL 2 2 2 1 1 2 1 1 12 16. es igual a las sumas de las frecuencias absolutas anteriores al punto. DISTRIBUCIÓN DE FRECUENCIAS: Es una tabla que indica las distintas clases en que los datos se han clasificado y la frecuencia de valores en cada clase. que se obtiene después de realizar la operación de tabulación. R=Xmáx – Xmín Magíster Agustina Subeldía Coronel 27 .3 100 FRECUENCIA ABSOLUTA ACUMULADA faa 2 4 6 7 8 10 11 12 FRECUENCIA RELATIVA ACUMULADA fra 16.3 16. donde Xmax-Xmin constituye el rango o recorrido (R) de la variable.1 58. FRECUENCIA ABSOLUTA ACUMULADA (faa): en un punto determinado.7 83. siendo n el número total de casos. son tablas de trabajos estadísticos. Ejemplo 12: Los datos siguientes corresponden a los puntajes obtenidos en un examen de Estadística de 12 alumnos de la carrera de Ciencias de la Educación.0 Rango o Recorrido: En todo conjunto de valores de la variable Xi. La información estadística se puede presentar en forma: NO AGRUPADA: cuando no hay muchos datos.) TIPOS DE FRECUENCIAS: FRECUENCIA ABSOLUTA (fa): Es el número de veces que se repite un valor. relativas. las tablas presentan los diversos tipos de frecuencia (absoluta.

76. 53. 63. que el número arbitrario de intervalos (m) a ser elegido puede ser cualquiera de esos divisores. entonces: la amplitud (c) o el tamaño del intervalo está dado por: ci  ( R  1) m Para elegir un número arbitrario de intervalos se calcula R+1 y se verifica si este resultado es múltiplo de algún número. 7. 71 72.Estadística aplicada a la Educación Considerando el ejemplo anterior. 88. es decir. 64 65. 3. la amplitud o el tamaño del intervalo (c) será: c 41  1 42  7 6 6 Intervalo de clase 51 . 69. 62.57 51 Límite superior 57 Los intervalos pueden ser: Cerrado: cuando incluyen los extremos del mismo. 78 79. 55. 66. 52. 82. es el menor y el valor que delimita un inter valo de clase. 83. 14. como por ejemplo R+1=41+1=42. entonces. 87. 75. 90. 68. 57 58. Intervalo de clase Cerrado 51 . 67. Intervalo de clase Abierto (51 . 81. 73. 80. 56. 84.57 58 – 64 65 – 71 72 – 78 79 – 85 86 – 92 El intervalo contiene a: 51. Se considera a m=6 como el número arbitrario. 77. 89. El 42 es múltiplo de 2. 61. 6. 60.57 Incluye a 51 y 57 Abierto: cuando se excluyen los extremos del mismo. 74. 91. Intervalo de clase Límite inferior 51 . 85 86. 92 Cada intervalo de clase tiene: Límite inferior y un límite superior. se calcula el Rango Xmáx=92 Xmin=51 R=92-51=41 DATOS AGRUPADOS EN INTERVALOS: cuando hay muchos datos. 54. 70. Ejemplo 13: Los datos siguientes corresponden a los puntajes obtenidos en un examen de matemática 75 88 68 58 82 73 76 87 68 61 88 91 90 92 91 63 62 71 79 65 88 51 56 77 R=92-51=41 El recorrido se puede dividir en un número arbitrario de intervalos de clase (m) o pequeños segmentos. Sí m = número de intervalos.57) No incluye a 51 y 57 Magíster Agustina Subeldía Coronel 28 . 59.

fr. Los datos siguientes corresponden a los puntajes obtenidos en un examen.57 No incluye a 51 e incluye a 57 El punto medio de cada intervalo se llama marca de clase y se denota por yi Intervalo de clase 51 .0 EJERCICIOS DE APLICACIÓN 6 28.57) Incluye a 51 y no incluye a 57 Abierto y cerrado: cuando excluye el límite inferior e incluye el límite superior Intervalo de clase Abierto y cerrado (51 .3 16.0 41. faa y fra) 29. Los datos siguientes corresponden a los puntajes obtenidos en un examen de Estadística. Considera m=7 para el tamaño de intervalo PUNTAJE Intervalo de clase 51 .3 33.3 100 FRECUENCIA RELATIVA ACUMULADA fra 2 6 10 14 16 24 16.7 25. faa y fra) Magíster Agustina Subeldía Coronel 88 51 78 29 .57 58 – 64 65 – 71 72 – 78 79 – 85 86 – 92 TOTAL Marca de clase yi (51+57)/2= 54 (58+64)/2= 61 (65+71)/2= 68 (72+78)/2= 75 (79+85)/2= 82 (86+92)/2= 89 FRECUENCIA ABSOLUTA (fa) 2 4 4 4 2 8 24 FRECUENCIA RELATIVA (fr) FRECUENCIA ABSOLUTA ACUMULADA faa 8. Ejemplo 14: Agrupa utilizando los datos del ejemplo anterior. encontrar la frecuencia de clase. fr. 75 87 74 62 93 78 82 75 94 77 69 74 a) Construye una tabla de frecuencias para datos agrupados en intervalos (fa.Estadística aplicada a la Educación Cerrado y abierto: cuando incluye el límite inferior y excluye el límite superior.7 58. mediante un conteo de los datos. 75 82 68 90 62 88 73 61 93 71 75 87 74 62 93 a) Construye una tabla de frecuencias (fa. Intervalo de clase Cerrado y Abierto 51 .4 66.7 8. 2) Divide el rango en un número arbitrario (m) de INTERVALO DE CLASE del mismo tamaño. es decir.7 16. 4) Determina el número de observaciones que cae dentro de cada intervalo de clase. 3) Halla la MARCA DE CLASE.7 16.7 100.57 58 – 64 65 – 71 72 – 78 79 – 85 86 – 92 yi Marca de clase (51+57)/2= 54 (58+64)/2= 61 (65+71)/2= 68 (72+78)/2= 75 (79+85)/2= 82 (86+92)/2= 89 Método general para hallar la distribución de frecuencias para datos agrupados en intervalos 1) Determina el valor máximo y el mínimo entre todos los datos registrados y así calcular el RANGO: es el valor máximo menos el valor mínimo.

El siguiente cuadro contiene los puntajes de un examen de Matemáticas de dos secciones del Primer Semestre: PUNTAJE Sección “A” 20 – 34 35 – 49 50 – 64 65 – 79 80 – 94 Sección “B” 5 8 5 12 10 40 10 15 8 15 8 56 a) Construye una tabla de frecuencias (faa. Los datos siguientes corresponden a los puntajes obtenidos en un examen de Matemática I. Analiza los resultados 32. fr. Las remuneraciones mensuales (en dólares) de 80 maestros de una institución. son los siguientes: 260 120 255 175 115 145 135 153 190 215 233 190 205 185 160 178 130 230 190 140 125 145 145 164 135 235 160 220 140 230 222 173 220 230 170 185 155 170 170 156 155 265 130 195 170 220 195 170 225 120 105 125 190 165 210 182 230 91 217 92 190 288 135 190 93 115 95 240 233 95 180 177 180 185 190 140 185 120 173 210 a) Considerando el número de intervalos igual a 10. 48 59 56 aa 50 61 61 47 60 64 52 48 70 60 70 69 61 68 55 50 69 54 47 55 60 47 53 55 51 70 60 Construye una tabla de frecuencias (fa. faa y fra). Construye una tabla de frecuencias (fa. fr y fra) para ambos grupos 34. Magíster Agustina Subeldía Coronel 30 . fr. faa y fra) 33. fr. faa y fra) b) analiza los resultados 31. Considera número de intervalos igual a 6.100 20 18 15 15 12 15 10 5 8 7 65 60 a) Construye una tabla de frecuencias (faa. fr y fra) para ambos grupos b) Compara los grupos A y B. En la siguiente tabla se registran los pesos (en Kilogramos) de 30 estudiantes de la carrera de Informática. Considerando el siguiente cuadro: PUNTAJES GRUPO A GRUPO B 51 – 60 61 – 70 71 – 80 81 – 90 91 .Estadística aplicada a la Educación 30. 75 82 68 90 62 88 75 87 74 62 93 78 89 61 75 95 60 79 95 94 78 85 76 65 73 67 88 78 62 76 73 81 72 63 76 75 a) Construye una tabla de frecuencias (fa.

231 29. si lo permite la naturaleza de las variables... AÑO 1996 SECTOR TOTAL % SECTOR Oficial Privado Total 65. pero es la más recomendable...231 29. Dirección. Elabora cuadros que correspondan a los siguientes títulos: a) b) c) d) e) Educación Superior: Matrícula por sector y zona. de datos estadísticos o características relacionadas. PARTES PRINCIPALES DE UN CUADRO ESTADÍSTICO aa aa aa aa aa aa aa aa Número del cuadro. Para diferenciar las variables prin cipal y secundaria....Estadística aplicada a la Educación ELABORACIÓN DE CUADROS ESTADÍSTICOS CUADROS ESTADÍSTICOS. Dirección.. AÑO 1996 PARAGUAY.. según nivel de formación. Educación Superior: Cargos docentes por sexo. EDUCACIÓN INICIAL. Educación Superior: Cargos docentes por zona y sector. con el objeto de ofrecer información estadística de fácil lectura. según departamento y sexo. MEC.433 84. Magíster Agustina Subeldía Coronel 31 . Título Encabezamiento o conceptos... columnas y filas. Anuario Estadístico.687 TOTAL 55.. No es la única forma de presentar datos. según nivel de formación del personal. MEC.8 100. según zona y sexo..2 34.664 Fuente. Educación Superior: Matrícula por edad.. Año 1996 Elaboración. MATRÍCULA POR SEXO. En un cuadro de dos variables o de doble entrada. SEGÚN SECTOR. según sexo. se distinguen una Variable Principal colocada en forma horizontal y una Variable Secundaria colocada en forma vertical.854 13.. EJERCICIOS DE APLICACIÓN 7 35.833 38. SEXO Mujeres 30.664 Fuente. es el arreglo ordenado.433 84. EDUCACIÓN INICIAL. Año 1996 Elaboración... Educación Superior: Matrícula por semestre..600 45. en el título del cuadro se antepone la palabra POR a la variable principal y SEGÚN a la variable secundaria. comparación e interpretación y ser autoexplicativos. MATRÍCULA SEGÚN SECTOR.377 15. Anuario Estadístico.0 Oficial Privado Total 55. Cuerpo Nota de pie o llamadas Fuente Nota de unidad de medidas Elaboración Ejemplo 15: Cuadro 9 Cuadro 10 PARAGUAY.977 Hombres 24.

construido con barras verticales que no guardan separación entre ellas. claridad y veracidad. con el objeto de ilustrar los cambios o dimensión de una variable. es una descripción del contenido del gráfico debe indicar claramente la naturaleza del fenómeno representando. 4) FUENTE de los datos estadísticos representados.34 35 . 2) DIAGRAMAS. En el eje Y (ordenada) se colocan los valores de la variable independiente y en X (abscisa) la variable independiente.94 PUNTAJE FUENTE: Universidad “XX” ELABORACIÓN: Universidad XX. DE ALUMNOS SEGÚN PUNTAJE PUNTAJE 20 .94 fa 5 8 5 12 10 12 12 11 10 fa 10 9 8 8 7 6 5 5 5 4 3 2 1 0 20 . se construyen en el plano rectangular o de coordenadas cartesianas. donde hay dos ejes. X e Y. GRÁFICO Nº 1: CANT. está dado por el propio dibujo del gráfico. son indicaciones donde se precisa la correspondencia entre los elementos del gráfico y la naturaleza de las medidas representadas. PRINCIPALES TIPOS DE GRÁFICOS HISTOGRAMA: Es el gráfico utilizado en las distribuciones agrupadas en clases o intervalos.34 35 . Para construirlo se marcan en el eje “x” (abscisa) los intervalos (las clases) y en el eje “y” (ordenada) las frecuencias (absolutas o relativas). PRINCIPALES PARTES DE UN GRÁFICO 1) TÍTULO. Las cualidades esenciales del gráfico son: simplicidad. etc.49 50 . tasas. Sobre cada intervalo se dibuja una barra proporcional a su frecuencia. Dpto Est Magíster Agustina Subeldía Coronel 32 .79 80 . están representados los datos indicados en el título. puntos o líneas.49 50 .79 80 . Los gráficos de dos variables. y como en el cuerpo del gráfico.64 65 .64 65 . para comparar visualmente dos o más varia bles similares o relacionadas. proporciones. siendo y = f(x). superficies. como en los cuadros. Pueden tener la forma de barras.Estadística aplicada a la Educación CONSTRUCCIÓN DE GRÁFICOS ESTADÍSTICOS Un gráfico o diagrama es una representación pictórica. Facultad XX. de figuras geométricas. de superficie o volumen. 3) ESCALAS Y/O LEYENDAS. Los gráficos de una sola varia ble sirven para fines comparativos de cantidades absolutas.

Magíster Agustina Subeldía Coronel 33 .. con segmentos de recta.49 50 .. PUNTAJE 20 . XX.64 65 . partir de la última frecuencia acumulada. se extiende paralelamente al eje horizontal. PUNTAJE 20 . se levanta un segmento de altura igual a la respectiva frecuencia (absoluta o relativa).79 80 ..49 50 . Se construye ubicando los extremos de los intervalos en el eje “x” y en el eje “y” el valor de las frecuencias acumuladas.. obteniendo una línea poligonal que. OJIVAS Para representar las frecuencias acumuladas (absolutas o relativas) se utilizan las Ojivas o polígonos acumulativos de frecuencias. ELABORACIÓN: ...94 MARCA DE CLASE fa 27 42 57 72 87 5 8 5 12 10 GRÁFICO 2: ALUMNOS SEGÚN PUNTAJE MEDIO fa 12 11 10 9 8 7 6 5 4 3 2 1 0 12 10 8 5 12 27 5 42 57 72 87 102 PUNTAJE MEDIO FUENTE: INST...94 GRÁFICO 3: FRECUENCIA ACUM ULATIV A SEGÚN PUNTAJE MARCA DE CLASE fa 27 42 57 72 87 5 8 5 12 10 faa 5 13 18 30 40 fa a 40 40 35 30 30 25 20 18 15 13 10 5 5 0 20 - 34 35 - 49 50 - 64 65 - 79 80 - 94 PUNTAJE FUENTE: INST. ELA B ORA CIÓN: . los extremos de los segmentos verticales.. En el extremo superior de cada intervalo se levanta un segmento de altura igual a la respectiva frecuencia absoluta.64 65 .34 35 ..79 80 .34 35 .Estadística aplicada a la Educación POLÍGONO DE FRECUENCIAS Para construirlo se calculan los puntos medios (marca de clase) de los intervalos. luego partiendo del extremo inferior del primer intervalo se une. luego se unen los extremos con una línea poligo nal. X X .

000 3.000 D er echo 2. DES ER T O R ES S EG Ú N DEP A RT A M ENT O .000 Inf or mática 4.000 1. A ÑO 2007 C omer cial 7. El ancho de las barras debe ser constante y pueden ser de cualquier tamaño. G R Á F IC O N º 5 : E D U C A C IÓ N S U P E R IO R . Este tipo de gráfico se usa para representar variables relacionadas entre sí BARRAS VERTICALES Sí el gráfico corresponde al de barra vertical. entonces.Estadística aplicada a la Educación LINEAS Este tipo de gráfico relaciona variables entre sí (variable dependiente y variables independientes).000 5.000 A r quitec tur a 6. P E R IO D O 2 0 0 3 . Un gráfico que muestre la distribución de una variable en función del tiempo se llama GRÁFICO DE SUCESIÓN EN EL TIEMPO. G R A F IC O 4 : E V O L U C IÓ N D E L A M A T U N IV E R S IT A R IA .2 0 0 7 16 0 0 0 0 15 8 0 0 0 M a t r ic u la 15 6 0 0 0 15 4 0 0 0 15 2 0 0 0 15 0 0 0 0 14 8 0 0 0 14 6 0 0 0 14 4 0 0 0 2003 2004 2005 2006 2007 AÑOS FUENTE: INST…. A ÑO 2006 G R A F IC O 6 : D E S E R C IÓ N U N IV E R S IT A R IA P O R C A RR ERA . las categorías de la variable independiente son re gistradas horizontalmente y sobre ellas son levantadas columnas de alturas correspondientes a la variable dependiente (frecuencia). BARRAS HORIZONTALES Se diferencia de las barras verticales por la posición entre la variable y la frecuencia. mientras que las barras no se sobrepongan.AÑO 2003-2007 BARRAS El gráfico de barra (o diagrama de barras) se puede representar en forma vertical u horizontal. Magíster Agustina Subeldía Coronel 34 . 0 0 0 D is eño 0 0 DE PART AM ENT O 5 10 15 20 25 30 D e s e r c ió n FUENTE: INST…. Las variables pueden ser ordenadas en forma creciente o decreciente de acuerdo a la frecuencia o alguna otra clasificación.

0 0 0 10 0 . ANUARIO 1993 GRÁFICO DE PILAS Se utiliza para comparar categorías o subcategorías de una variable.Estadística aplicada a la Educación BARRAS COMPUESTAS Este tipo de gráfico sirve para representar un fenómeno dividido en categorías que a su vez se dividen en subcategorías.0 3 9 4 0 . M A T R ÍC U L A P O R A Ñ O .3 9 4 3 9 . G R Á F IC O N º 7 : E D U C A C IÓ N S U P E R IO R . 9 7 9 14 0 . S E G Ú N S E C T O R 16 7 . FUENTE: XXXXX CIRCULAR O DE SECTORES Se utiliza para demostrar una proporción de un todo y solamente cuando la variable está dividida en pocas categorías. cifras absolutas y no relativas. Para su elaboración se utilizan generalmente. 0 0 0 8 0 . es decir. ilustra las partes en un todo.0 0 0 0 19 9 1 19 9 2 19 9 3 AÑO P ú b lic o P r iv a d o FUENTE: MEC.0 0 0 2 0 .0 0 0 3 5 . Las barras pueden estar en posición vertical u horizontal. Para construir un gráfico circular se calculan los ángulos repartiendo 360º en partes directamente proporcionales a cada una de las frecuencias.0 0 0 4 5 . Magíster Agustina Subeldía Coronel 35 .7 19 13 0 . 0 0 0 14 9 . 0 0 0 M A T R ÍC U L A 16 0 . Se construye sobre una escala de frecuencia relativa (de cero a cien). 0 0 0 12 0 . 2 6 2 18 0 .9 15 6 0 . en caso contrario pierde su principal cualidad que es la legibilidad. que pueden ser cifras absolutas o relativas.

En el cuadro se cuenta con la siguiente distribución de alumnos por estatura: ESTATURA (cm) 111 – 120 121 – 130 131 – 140 141 – 150 151 – 160 161 – 170 171 .Estadística aplicada a la Educación Fuente: EJERCICIOS DE APLICACIÓN 8 36.6 a) Construye un histograma para la distribución de alumnos por estatura b) Construye un polígono de frecuencias para la distribución de alumnos por estatura c) Construye una ojiva con las frecuencias absolutas acumuladas 37.5 9.28 29 .42 43 .6 12. durante el período 1996 – 2000. SECTOR OFICIAL PRIVADO 2006 35 25 2007 36 28 2008 45 29 2009 48 35 2010 50 38 A partir de la información proporcionada construye: a) Un gráfico de líneas por sector AÑO TOTAL Magíster Agustina Subeldía Coronel 36 .21 22 .7 48.49 fa 3 5 7 4 3 a) Construye un histograma para la distribución de alumnos por peso b) Construye un polígono de frecuencias para la distribución de alumnos por peso c) Construye una ojiva con las frecuencias absolutas acumuladas 38.180 % 5.7 6.1 7. El siguiente cuadro indica el número total de Instituciones y su distribución por SECTOR. El siguiente cuadro contiene la distribución de alumnos por peso: PESO (Kg) 15 .35 36 .8 9.

41.2 26.1 14.7 72.9 10.9 95.6 65. A las expectativas sociales sobre la intervención del docente en la sociedad. Comercial Derecho Ing.9 61.1 16.3 10.7 53.3 6. El siguiente cuadro se presenta: La formación recibida en la Universidad le permite realizar una buena gestión en el ámbito Administrativo Académico Comunitario Financiero 44. El siguiente cuadro presenta la distribución de alumnos del 2° semestre por carrera. Año 2007 El diseño curricular implementado para su formación profesional responde Al perfil profesional docente que se necesita actualmente.5 63. Totalmente Parcialmente No responde 28. Informática Marketing Total 33 27 19 26 105 Fuente: XXXXX Elaboración: XXXX a) A partir de la información proporcionada construye gráficos que se adecuen a las características de las mismas.4 26.Estadística aplicada a la Educación b) Un gráfico de líneas de la distribución total de instituciones 39. Magíster Agustina Subeldía Coronel 37 . 40.3 Fuente: xxxxx Elaboración: a) A partir de la información proporcionada construye gráficos que se adecuen a las características de las mismas.2 32. A las exigencias del mercado profesional de nuestro país. A las necesidades académicas de la modalidad. CARRERA Total de alumnos Ing.5 Fuente: xxxxx Elaboración a) A partir de la información proporcionada construye gráficos que se adecuen a las características de las mismas. El siguiente cuadro presenta la opinión de egresados profesionales: Egresados profesionales según opinión con respecto a la malla curricular.

.. se define y calcula dividiendo la suma de los valores de la variable entre el número de observaciones o valores. la mediana.25 puntos c) Para calcular la mediana (Me) se procede a:  Ordenar los datos (puede ser en forma ascendente o descendente) 62 77 69 78 Magíster Agustina Subeldía Coronel 73 82 74 87 75 93 75 94 38 . c. Interpretar ¿Cuál es el puntaje más frecuente? a) El puntaje mínimo es 62 y el máximo es 94. Moda (Mo). que determina el lugar o posición donde estará ubicado el valor de la mediana. es decir. los percentiles y la moda. Ejemplo 16 Los datos siguientes corresponden a los puntajes obtenidos en un examen de Administración.ANÁLISIS DE DATOS ESTADÍSTICAS DESCRIPTIVAS MEDIDAS DE CENTRALIZACIÓN Son estadígrafos que describen la posición que ocupa una distribución de frecuencia alrededor de un valor de la variable.. Se ordenan los datos Calcular (n+1)/2. una vez ordenados los datos.. 75 82 a) b) c) d) 87 75 74 94 62 77 93 69 78 73 ¿Cuál es el puntaje mínimo y cuál el máximo? ¿Cuál es la media o el promedio de los puntajes obtenidos por los alumnos? Interpretar Calcular la mediana de los puntajes obtenidos.25 12 12 Interpretación: Los estudiantes han obtenido en el examen de Administración un puntaje medio de 78..Estadística aplicada a la Educación UNIDAD 5 . es el valor más frecuente para una variable. la mediana es igual al promedio de los dos valores centrales. y si se tiene como datos un número: Impar. al que le corresponde mayor frecuencia. n x x  x 2  x 3  . Par.. las cuartilas. b) El puntaje promedio está dado por: X  75  87  74  62  93  78  82  75  94  77  69  73 939  78. comúnmente se lo conoce como promedio. DATOS NO AGRUPADOS Media aritmética. Las medidas de centralización de uso más frecuente son: la media aritmética (promedio). para calcular la mediana se toma como referencia el valor de (n+1)/2 para los datos no agrupados. las decilas. la mediana es igual al valor del término central. b. por 12 alumnos del primer semestre.  x n X  1 n Suma de valores de la variable X  Número de valores i X  i 1 n Mediana (Me). es decir los valores observados se agrupan alrededor de cierto “valor central” o “valor medio”.

30 28 18 a) b) c) d) 24 28 24 28 30 24 22 18 24 30 30 10 22 24 18 30 28 22 22 28 22 28 22 24 30 18 28 Agrupar los datos en una tabla de frecuencias ¿Cuál es la media o el promedio de los puntajes obtenidos por los alumnos? Calcular la mediana de los puntajes obtenidos. Media o promedio ( Y ). Mediana (Me). n Nj 2 entonces Me=Yj (siendo Yj el valor de la variable asociada a Nj)  Si n/2 coincide con algún Ni. m Y n i Y  i 1 Media aritmética.5 2 2 5 75 6 75 7 77 8 78 9 82 10 87 11 93 12 94 75  77 76 2 Interpretación: esto implica que aproximadamente el 50% de los estudiantes han obtenido hasta 76 puntos La mediana está dada por Me  e) En cuanto al puntaje más frecuente es 75.Tablas sin intervalo Son aquellos que están presentados en tablas de frecuencia. i n b. Determinar las frecuencias absolutas acumuladas Ni =faa Calcular n/2:  Si n/2 no coincide con algún Ni. por 30 alumnos de un curso de postgrado. Interpretar ¿Cuál es el puntaje más frecuente? Magíster Agustina Subeldía Coronel 39 . es decir 3. es decir el valor se encuentra entre dos valores de Ni:: N j  1  a. entonces Me  Y j  1  Y j 2 2  ) Ejemplo 17: Los datos siguientes corresponden a los puntajes obtenidos en un examen de Estadística. porque tiene mayor frecuencia. DATOS AGRUPADOS. o sea N j  1  n 1  N j .Estadística aplicada a la Educación  Calcular Posición de la mediana  Posición Puntos 1 62 2 69 3 73 4 74 n  1 13  6.

1  18.7  30. d) En cuanto al puntaje más frecuente es 28.47 30 30 El puntaje promedio de los alumnos es de 24.4  22.6  24.47 puntos.6  28. el valor se encuentra entre dos valores de Ni o sea: 2 n 11  15  N j 17 entonces Me Y 24 .ni 10x1=10 18x4=72 22x6=132 24x6=144 28x7=196 30x6=180 fa=ni 1 4 6 6 7 6  Y .Estadística aplicada a la Educación a) Tabla de frecuencias Puntajes (Yi) 10 18 22 24 28 30 fa=ni 1 4 6 6 7 6 30 b) El puntaje promedio está dado por: Puntajes (Yi) 10 18 22 24 28 30 30 Y  Yi.n i i 734 10. Magíster Agustina Subeldía Coronel 40 . es decir. porque tiene mayor frecuencia (7).6 734  24. c) Para calcular la mediana (Me) se procede a:  Determinar las frecuencias absolutas acumuladas Ni =faa  Calcular n 30  15 2 2 Puntajes (Yi) Yj-1 Yj 10 18 22 24 28 30 n= fa=ni 1 4 6 6 7 6 30 faa=Ni 1 5 11 Nj-1 n 15 17 Nj 2 24 30 n 15 no coincide con ningún Ni. existen 17 alumnos que tienen 24 2 Como N j 1 j puntos o menos.

Magíster Agustina Subeldía Coronel 41 .33 30 30 El puntaje medio de los alumnos es de 24.4  22. c) Para calcular la mediana (Me) se procede a:  Determinar las frecuencias absolutas acumuladas Ni =faa  Calcular n 30  15 2 2 Puntajes (Yi) 10 18 22 Yj-1 23 Yj 24 28 30 n= Como Me  fa=ni 1 4 6 4 2 7 6 30 n 15 2 faa=Ni 1 5 11 15 Nj-1 17 Nj 24 30 coincide con  Ni.n i i 730 10.1  18. Interpretar ¿Cuál es el puntaje más frecuente? a)Tabla de frecuencias Puntajes (Yi) 10 18 22 23 24 28 30 El puntaje promedio está dado por: fa=ni 1 4 6 4 2 7 6 Puntajes (Yi) 10 18 22 23 24 28 30 30 30 Y  Yi. n 15 2 entonces.Estadística aplicada a la Educación Ejemplo 18: Los datos siguientes corresponden a los puntajes obtenidos en un examen de Estadística.6  23.6 730   24. d) En cuanto al puntaje más frecuente de los estudiantes es de 28 puntos.4  24. N j 1  n 15  N j 17 2 entonces 1 Y j  1  Y j )  1  23  24) 23. por 30 alumnos de un curso de licenciatura.5 . 2 2 Interpretación: El 50% de los alumnos tienen puntajes iguales o menores que 23.ni 10x1=10 18x4=72 22x6=132 23x4=92 24x2=48 28x7=196 30x6=180 fa=ni 1 4 6 4 2 7 6  Y . porque tiene mayor frecuencia (7).33 puntos.5 puntos.7  30.2  28. es decir. 30 28 18 a) b) c) d) 23 28 23 28 30 23 22 18 23 30 30 10 22 24 18 30 28 22 22 28 22 28 22 24 30 18 28 Agrupar los datos en una tabla de frecuencias ¿Cuál es la media o el promedio de los puntajes obtenidos por los alumnos? Calcular la mediana de los puntajes obtenidos.

según sector. el puntaje mediano y ¿Cuál es el puntaje más frecuente? 46. 43.Estadística aplicada a la Educación EJERCICIOS DE APLICACIÓN 9 42. X3=14. Los datos siguientes corresponden a los puntajes obtenidos en un examen de Estadística. la mediana y la moda. X4=11. A continuación se presenta. Los datos siguientes corresponden a los puntajes obtenidos en un examen de Administración. 75 88 82 73 68 61 90 93 62 71 88 51 82 75 77 69 75 87 74 62 a) Halla el puntaje promedio. el puntaje mediano y ¿Cuál es la nota más frecuente? 45. El siguiente cuadro presenta: Educación Superior. 59 61 60 48 70 68 69 55 53 70 53 55 68 70 Halla el puntaje: promedio. Los puntajes obtenidos por un alumno en 5 exámenes parciales de estadística son: X1=13. Instituciones por zona. X2=10. mediana y el más frecuente 47.MATRICULA 2007 . la matrícula por semestre de una Institución de educación superior: AÑO 1° 150 160 11 2006 . Los datos siguientes corresponden a los puntajes obtenidos en un examen de Matemática III. X5=10. CALCULA el puntaje promedio en estadística obtenido por el alumno. Año 1997 Sector Oficial Privado ZONA Urbana 21 15 Rural 5 2 Fuente: xx Elaboración: xx a) ¿Cuál es el promedio de instituciones por zona? b) ¿Cuál es el promedio de instituciones por sector? c) Interpreta el valor mediano de las instituciones Magíster Agustina Subeldía Coronel 42 .MATRÍCULA DESERTORES a) b) c) d) e) f) g) h) i) 2° 132 137 10 SEMESTRE 3° 4° 110 102 120 97 9 8 5° 97 90 5 6° 76 90 4 ¿Cuál es el promedio de alumnos matriculados del año 2006? ¿Cuál es la mediana de alumnos matriculados del año 2006? ¿Cuál es la moda de alumnos matriculados del año 2006? ¿Cuál es el promedio de alumnos matriculados del año 2007? ¿Cuál es la mediana de alumnos matriculados del año 2007? ¿Cuál es la moda de alumnos matriculados del año 2007? ¿Cuál es el promedio de alumnos desertores del año 2007? ¿Cuál es la mediana de alumnos desertores del año 2007? ¿Cuál es la moda de alumnos desertores del año 2007? 44. 75 87 74 62 93 78 75 82 75 94 77 69 93 78 74 74 a) Halla el puntaje promedio.

Las remuneraciones mensuales (en dólares) de 30 maestros de una institución. la talla mediana y ¿Cuál es la talla más frecuente? Interpreta la información 50. b) la edad mediana.Estadística aplicada a la Educación 48. Los datos siguientes corresponden a la talla en cms de un grupo de jóvenes. Los datos siguientes corresponden a las edades de un grupo de jóvenes de una institución. 175 188 a) b) c) d) 174 173 168 161 190 193 162 171 188 174 182 175 177 169 175 187 Halla la talla promedio. Interpreta c) ¿Cuál es la edad más frecuente? 49. 25 17 26 19 26 19 25 26 17 18 26 17 174 162 193 178 174 174 a) Halla la edad promedio. La remuneración mensual mediana ¿Cuál es la remuneración mensual más frecuente? Interpreta la información Magíster Agustina Subeldía Coronel 43 . son los siguientes: 260 120 255 a) b) c) d) 190 215 250 130 230 190 135 250 160 220 230 170 155 250 130 225 120 105 230 100 217 103 115 105 250 185 190 Halla la remuneración mensual promedio.

es decir su giere que una o más puntuaciones extremas inflaron la media y la desviación estándar. A mayor dispersión le corresponderá una mayor desviación estándar. De esta manera la varianza queda definida como: n V ( X ) s 2  X j  X) 2 j 1 La varianza es el estadígrafo de dispersión más importante. Si la desviación estándar no es de la mitad de tamaño de la media o menos. pues sólo considera los valores extremos de la distribución DATOS NO AGRUPADOS Desviación media: o desviación promedio de un conjunto de observaciones se define por n X DM  j  X donde X es la media aritmética y j 1 X j  X es el valor absoluto de las desviaciones n de Xj respecto a X .Estadística aplicada a la Educación MEDIDAS DE DISPERSIÓN Son aquellos valores que nos dan una idea de cuan alejados están unos datos de otros. puesto que es la raíz cuadrada positiva de la varianza. mide el grado de dispersión de un conjunto de datos en relación con su media. Los estadígrafos de dispersión de mayor uso son: Rango o recorrido: es un estadígrafo de dispersión muy limitado. que asociado a n la media aritmética se constituyen en los pilares fundamentales de la estadística. Uno de sus usos más comunes es para expresar la desviación estándar como porcentaje de la media aritmética. Interpretación del coeficiente de variación s CV  __ . Coeficiente de variación (CV): Es una medida de variación RELATIVA. Todos los valores deben ser positivos y su media de por tanto un valor positivo. Interpretación de la desviación estándar   Si la desviación estándar es más grande que la media.100 X Magíster Agustina Subeldía Coronel 26% o más Muy Heterogéneo 16% a 25% Heterogéneo 11% a 15% Homogéneo 0% a 10% Muy Homogéneo 44 . Desviación típica o estándar: es uno de los estadígrafos de mayor uso. en el cual las unidades de la variable ya no están elevadas al cuadrado. mostrando una mejor interpretación porcentual del grado de variabilidad que la desviación típica o estándar. El CV pierde utilidad cuando la media se aproxima a cero Es útil para comparar la dispersión de conjunto de datos que tienen distintas desviaciones estándar y distintos promedios. es decir es neces ario tener una idea del grado de concentración o dispersión de las observaciones alrededor de un valor central o de posición. esto probablemente indica un sesgo. s  s2 La desviación estándar. se propuso elevar al cuadrado de la desviación X j  X a fin que sea siempre no negativa. es no negativa. Varianza: En la perspectiva de construir un indicador que dimensione la desviación o distancia promedio de los Xj respecto a X . se debe tener en cuidado al examinar la distribución para analizar la posible existencia de sesgos o valores extremos. al igual que la varianza.

75  78.19 puntos Para el cálculo de la desviación típica o estándar.25  74  78.25)   69  78.3. n Aplicando la fórmula para el cálculo de la varianza: s2  s2   62  2 2 V ( X ) s 2  2 X j  X) 2 j 1 n 2 78.19 La varianza es de 81.2 12 12 Interpretación: Lo que significa que la distancia media entre cada uno de los valores y el valor central es de 7.75  15. b) Calcula la varianza y la desviación típica o estándar.25) 2   77  78. Lo que significa que los puntajes de los estudiantes son homogéneos 45 .25  2 * 3.01 El valor de la desviación típica o estándar es de 9.25) 2  8 12 16.5625  27. se aplica la siguiente fórmula: s  s 2 s  81. n Aplicando la fórmula: DM  DM  X DM  j  X j 1 .100 11.1666 7.75  8.25) 2  2.25)   74  78.75) 2  8.100 .25  1. 75  78.25  0.0625  76.0625  14.5625  217.25)  2.25  77  78.25  78  78.25) 2   4.52% 78.25) 2  1.75 86  7.75) 2  15.25) 2  3. se tiene n 62  78.52% del valor de la media de puntos.25  5.0625  85.75  14.25  9.Estadística aplicada a la Educación Ejemplo 19: Usando los datos correspondientes al ejemplo 16.5625  0.5625  248 s2  12 s 2 81. 62 69 73 74 75 75 77 78 82 87 93 94 Los estudiantes han obtenido en el examen de Administración un puntaje medio de 78.515 11.75) 2 12 264. 25  82  78 12 16. c) Calcula el coeficiente de variación d) Interpreta los resultados a) Calcula la desviación media de los puntajes obtenidos.25  69  78.125  1.25) 2   78  78.25  4.25 puntos a) Calcula la desviación media de los puntajes obtenidos.25  73  78.25  3.75) 2  14.25) 2  5.19 9.25) 2  9.25) 2   0.01 .2 puntos b) Calcula la varianza y la desviación típica o estándar.25)   73  78.01 puntos c) Calcula el coeficiente de variación e Interpreta los resultado Se aplica la fórmula CV  s CV  __ .25 Magíster Agustina Subeldía Coronel El coeficiente de variación indica que la desviación típica o estándar representa el 11.0625  21.5625  18. reemplazando por los valores se tiene: X 9.25  2.

Los datos siguientes corresponden a las edades de un grupo de jóvenes de una institución de educación superior. 59 a) b) c) d) e) 61 60 48 70 68 69 55 53 70 53 55 ¿Cuál es rango de los datos? ¿Cuál es desviación media? ¿Cuál es la varianza y la desviación estándar? Interpreta Calcula el coeficiente de variación Interpreta los resultados 55. 75 88 82 73 68 61 90 93 62 71 88 51 82 75 77 69 75 87 74 62 a) ¿Cuál es rango de los datos? b) ¿Cuál es desviación media? c) ¿Cuál es la varianza y la desviación estándar? Interpreta 54.Estadística aplicada a la Educación EJERCICIOS DE APLICACIÓN 10 51. Los datos siguientes corresponden a los puntajes obtenidos en un examen de Administración. 75 87 74 62 93 78 75 82 75 94 77 69 93 78 74 74 68 70 a) ¿Cuál es rango de los datos? b) ¿Cuál es desviación media? c) ¿Cuál es la varianza y la desviación estándar? Interpreta 53. Los datos siguientes corresponden a la talla en cms de un grupo de jóvenes que asisten a una institución de educación superior. Los datos siguientes corresponden a los puntajes obtenidos en un examen de Romano I. 175 188 174 173 168 161 Magíster Agustina Subeldía Coronel 190 193 162 171 188 174 182 175 177 169 175 187 174 162 193 178 174 174 46 . Los datos siguientes corresponden a los puntajes obtenidos en un examen de Estadística. por 12 alumnos del primer curso. Los datos siguientes corresponden a los puntajes obtenidos en un examen de Matemática I. 25 a) b) c) d) e) 17 26 19 26 19 25 26 17 18 26 17 ¿Cuál es rango de las edades? ¿Cuál es desviación media de las edades? ¿Cuál es la varianza y la desviación estándar? Interpreta Calcula el coeficiente de variación Interpreta los resultados 56. 75 a) b) c) d) e) 87 74 62 93 78 82 75 94 77 69 73 ¿Cuál es rango de los datos? Interpreta ¿Cuál es desviación media? Interpreta ¿Cuál es la varianza y la desviación estándar? Calcula el coeficiente de variación Interpreta los resultados 52.

Estadística aplicada a la Educación a) b) c) d) e) ¿Cuál es rango de la talla? ¿Cuál es desviación media de la talla? ¿Cuál es la varianza y la desviación estándar? Interpreta Calcula el coeficiente de variación Interpreta los resultados 57. Las remuneraciones mensuales (en dólares) de 30 docentes de una institución. son los siguientes: 260 120 255 a) b) c) d) e) 190 215 250 130 230 190 135 250 160 220 230 170 155 250 130 225 120 105 230 100 217 103 115 105 250 185 190 ¿Cuál es rango de los datos? ¿Cuál es desviación media? ¿Cuál es la varianza y la desviación estándar? Interpreta Calcula el coeficiente de variación Interpreta los resultados Magíster Agustina Subeldía Coronel 47 .

Mientras que en el gráfico 2 se observa una relación lineal negativa. es decir.  1  r 1 Si r>0. siempre que se tenga un indicio que entre ellas existe por lo menos cierto grado de dependencia o asociación. entonces existe correlación rectilínea Magíster Agustina Subeldía Coronel 48 . entonces existe “correlación directa positiva” Si r<0. Da das 2 variables X e Y. CORRELACIÓN: Expresa el grado y sentido de la variación concomitante de dos o más series de datos. es decir que a medida que aumentan los años de es tudio.Estadística aplicada a la Educación MEDIDAS DE ASOCIACIÓN Son medidas que se usan para evaluar la asociación entre un evento y un factor de estudio. disminuye el número de hijos. Y como un punto donde se cortan las coordenadas de X e Y: Gráfico 1 Gráfico 2 Como se observa en el gráfico 1 ambas variables presentan una correlación lineal positiva.1  r  0) a Nula (r 0) a Según criterio cuantitativo a Positiva a (variación de las series en el mismo sentido) a a a Negativa a a (variación en sentido contrario) Según criterio cualitativo Diagramas de Dispersión Los Diagramas de Dispersión o Gráficos de Correlación permiten estudiar la relación entre 2 variables. entonces existe “correlación inversa negativa” Si r2=1. analiza la relación entre dos o más variables. 3. Los típicos estadísticos de asociación son la correlación y la regresión. . a medi da que aumenta el valor de la variable Estatura aumenta también el valor de la variable Peso. Se habla de correlación lineal fuerte cuando la nube de puntos se parezca mucho a una recta y será cada vez más débil (o menos fuerte) cuando la nube vaya desparramándose con respecto a la recta. Propiedades de r 1. 2. Clasificación a Perfecta (r 1) a a Imperfecta (0  r  1. En un gráfico de correlación representamos cada par X. Es decir. se dice que existe una correlación entre ambas si cada vez que aumenta el valor de X aumenta proporcionalmente el valor de Y (Correlación positiva o directa) o si cada vez que aumenta el valor de X disminuye en igual proporción el valor de Y (Correlación negativa o indirecta).

St y  A.C )   A  B ). D 2   X . A  C ).D )   B. 0.70 0. 2.D B.C Magíster Agustina Subeldía Coronel 49 . C  D ). B  D )  A. Y  X ) .70  r < 1.Y   Y ) 2 2 2  ) N. 3.Estadística aplicada a la Educación Interpretación de r 1.  XY )  rbp  X p  Xq .20 0.20  r < 0. N 2  1 BISERIAL-PUNTUAL: BISERIAL: n.00  r < 0. X rS 1  SPEARMAN rb  CUADRUPLE: X p  TETRACÓRICO  2  6.40  r < 0. n . pq St  X q p.q .00 existe correlación no significativa (muy débil) existe una baja correlación (débil) existe una significativa correlación (considerable) existe alto grado de asociación (fuerte) ALGUNOS COEFICIENTES DE CORRELACIÓN rxy Pearson (dos variables de razón continuas) rs Spearman (dos variables ordinales) Lineal rbp Biserial-Puntual (una variable continua y otra dicotómica) rb Biserial (una variable continua y otra dicotomizada) Distribuciones Bidemensionales  o Cuadruple (dos variables dicotómicas) rt Tetracórico (dos variables dicotomizadas) Curvilínea Coeficiente “ETA” () FÓRMULAS DE LOS COEFICIENTES DE CORRELACIÓN PEARSON: rxy  n.40 0. 4.

Y   Y ) 2 2 2  18. La fórmula. X n.35245   751) .782 N=18 Sustituyendo estos valores en la fórmula: rxy  n. es decir que la relación entre estas dos variables es significativa.Y   Y ) 2 2 2  Para aplicar la fórmula son necesarios los siguientes cálculos previos: 1 2 X 69 68 Y 29 30 X.  XY )  2   X .  XY )  2  X .4975   253)  2 2  40073 0. Y    X )  . Y  X ) . para medir el grado se utiliza el coeficiente r de Pearson. X Obtenemos n.94 Por tanto. para datos sin agrupar y a partir de puntuaciones directas es: rxy  n.18.n .12782  751.94 42406. la relación entre X (velocidad lectora) e Y (comprensión lectora) es imperfecta positiva y alta para la muestra. n .253  18.975 144 81 400 256 4 4975 12. que fue utilizada en un diseño experimental sobre métodos de enseñanza de la lectura Niño/a 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 Velocidad lectora (X) 69 68 38 50 57 33 30 38 39 22 20 37 62 35 41 50 43 19 Comprensión lectora (Y) 29 30 10 21 24 11 12 08 07 05 03 06 28 12 09 20 16 02 a) Representa la información en un diagrama de dispersión b) ¿Cuál es el grado y el sentido de la relación entre las variables velocidad lectora y comprensión lectora? Como la velocidad lectora y comprensión lectora son variables continuas o de razón.Estadística aplicada a la Educación Ejemplo 20: Los datos siguientes corresponden a las puntuaciones obtenidas por 18 alumnos del 1er G.245 9 10 39 22 7 5 273 110 11 12 13 20 37 62 3 6 28 60 222 1736 14 35 12 420 15 16 41 50 9 20 369 1000 17 43 16 688 18  19 751 2 253 38 12782 900 1444 1521 484 400 1369 3844 1225 1681 2500 1849 361 35245 Y 751 2 7 30 12 360 49 25 9 36  XY 253 2 784 4.56 rxy 0.Y 2001 2040 X2 Y 3 4 5 38 50 57 10 21 24 380 1050 1368 6 33 11 363 4761 4624 1444 2500 3249 1089 2 841 X X 900 100 441 576 121 8 38 8 304 144 64 Y 35. Magíster Agustina Subeldía Coronel 50 .

A 12 alumnos de un centro se les preguntó a qué distancia estaba su residencia del Instituto. Para ello usted debe utilizar el coeficiente de correlación que considere adecuado e interpretar dicho valor en vías de esclarecer el problema en estudio. El número de horas dedicadas al estudio de una asignatura y la calificación obtenida en el examen correspondiente.) 170 72 168 65 186 82 160 58 168 63 155 65 162 58 168 70 170 69 165 62 182 76 156 60 a) Representa la información en un diagrama de dispersión y analiza a través de éste la relación entre los resultados de los exámenes aplicados.4 0.8 2.1 4. Sexo Calificación M 13 Magíster Agustina Subeldía Coronel F 09 F 19 M 15 M 14 F 08 M 07 F 14 F 17 F 11 M 15 F 08 F 20 M 15 51 .5 a) Representa la información en un diagrama de dispersión y analiza a través de éste la relación entre los resultados de los exámenes aplicados. Se obtuvieron los datos que figuran en la siguiente tabla: Distancia (en km) Nota media 0. b) Calcule el coeficiente de correlación más adecuado y razone su elección c) Interprete el resultado del coeficiente obtenido.7 1 4. Los datos siguientes corresponden a la estatura y el peso de 12 alumnos del curso de Estadística Estatura (cms) Peso (Kg.5 4.4 2.5 3.4 4. Se tienen los datos correspondientes a las calificaciones de 12 estudiantes de una institución de educación superior en los exámenes de Matemática y Contabilidad. 59. 62. b) Calcule el coeficiente de correlación más adecuado y razone su elección. estatura y peso? 60.Estadística aplicada a la Educación EJERCICIOS DE APLICACIÓN 11 58. 61. con fin de estudiar si esta variable estaba relacionada con la nota media obtenida.12 4. entre las variables.1 0.5 4.2 2. Se quiere estudiar si existe relación entre los resultados obtenidos en Estadística 1 y el sexo de los estudiantes.3 1.2 3 5 a) Representa la información en un diagrama de dispersión y analiza a través de éste la relación entre los resultados de los exámenes aplicados.3 0. b) Calcule el coeficiente de correlación más adecuado y razone su elección c) Interprete el resultado del coeficiente obtenido.7 0.05 4.5 3.5 3 4.5 3 4. Interprete. b) ¿Cuál es el grado y el sentido de la relación. Matemática Contabilidad 12 13 18 14 09 16 15 08 14 19 12 06 10 20 18 13 17 14 07 17 a) Representa la información en un diagrama de dispersión y analiza a través de éste la relación entre los resultados de los exámenes aplicados.7 3. de ocho personas es: Horas (X) 20 16 34 23 27 32 18 Calificación (Y) 3.5 3.5 3.1 4 0.

Rendimiento académico Bueno Regular Malo 13 14 5 23 13 4 19 1 5 Sector Oficial Subvencionado Privado a) Aplique el coeficiente de correlación adecuado y razone su elección. Los datos siguientes corresponden a la comprensión lectora y la memoria general de 10 alumnos del 1er. b) ¿Cuál es el grado y el sentido de la relación entre las variables nivel de vocabulario previo y el nivel intelectual? Interprete el resultado del coeficiente obtenido 67. Interprete el resultado 64. Grado Madurez lectora Nivel intelectual 18 43 17 30 07 18 12 23 15 19 06 22 07 26 10 20 09 19 04 18 a) Representa la información en un diagrama de dispersión y analiza a través de éste la relación entre los resultados de los exámenes aplicados. Los datos siguientes corresponden a la comprensión lectora y el nivel intelectual de 10 alumnos del 1er. Comprensión lectora Memoria general 29 30 30 20 10 30 21 26 24 37 11 15 12 21 08 27 07 20 05 32 a) Representa la información en un diagrama de dispersión y analiza a través de éste la relación entre los resultados. Se desea determinar el grado de asociación entre el rendimiento académico de 100 estudiantes de la Facultad de Ciencias respecto a la procedencia del sector del grupo de estudiantes seleccionados. b) ¿Cuál es el grado y el sentido de la relación entre las variables madurez lectora y el nivel intelectual? c) Interprete el resultado del coeficiente obtenido.Estadística aplicada a la Educación 63. 65. Los datos siguientes corresponden a nivel de vocabulario previo y el nivel intelectual de 10 alumnos del 1º G Vocabulario previo Nivel intelectual 28 43 27 30 14 18 23 23 24 19 14 22 14 26 18 20 14 19 10 18 a) Representa la información en un diagrama de dispersión y analiza a través de éste la relación entre los resultados. b) ¿Cuál es el grado y el sentido de la relación entre las variables? Magíster Agustina Subeldía Coronel 52 . Grado. Los datos siguientes corresponden a la madurez lectora y el nivel intelectual de 10 alumnos del 1er. b) ¿Cuál es el grado y el sentido de la relación entre las variables nivel de vocabulario previo y el nivel intelectual? Interprete el resultado del coeficiente obtenido 66. Grado Comprensión lectora Nivel intelectual 29 43 30 30 10 18 21 23 24 19 11 22 12 26 08 20 07 19 05 18 a) Representa la información en un diagrama de dispersión y analiza a través de éste la relación entre los resultados de los exámenes aplicados.

El coeficiente de correlación lineal determina si.Estadística aplicada a la Educación REGRESIÓN LINEAL La correlación es útil para medir si la relación que existe entre las variables es aproximadamente lineal o no. cuando la variable independiente "X" vale 0. aquella que viene definida a partir de la otra variable "X" (variable independiente). existe relación entre dos variables. Para definir la recta hay que determinar los valores de los parámetros "a" y "b": La regresión lineal permite calcular el valor de estos dos parámetros. su grado de inclinación. mientras que la regresión sirve para buscar la ecuación matemática que mejor describe la relación entre las variables. consiste en cuantificar la relación que existe entre las variables con el fin de predecir cuáles serán los valores de una variable cuando se conocen los valores de la otra. es decir. definiendo la recta que mejor se ajus ta a esta nube de puntos. Y   X ) 2 Donde. a = intersección del eje y Y = promedio de la variable dependiente X = promedio de la variable independiente b = coeficiente de regresión Ejemplo 21: Los datos siguientes corresponden a las puntuaciones obtenidas por 18 alumnos del 1er G. El parámetro "a" es el valor que toma la variable dependiente "Y". El parámetro "b" o coeficiente de regresión determina la pendiente de la recta. que fue utilizada en un diseño experimental sobre métodos de enseñanza de la lectura Niño/a 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 Velocidad lectora (X) 69 68 38 50 57 33 30 38 39 22 20 37 62 35 41 50 43 19 Comprensión lectora (Y) 29 30 10 21 24 11 12 08 07 05 03 06 28 12 09 20 16 02 Magíster Agustina Subeldía Coronel 53 . la regresión nos permite definir la recta que mejor se ajusta a esta nube de puntos. y es el punto donde la recta cruza el eje vertical. Viene determinado por la siguiente fórmula: b n.  XY )  n X 2  X ). Y a  bX Una recta viene definida por la siguiente fórmula: Donde "Y" sería la variable dependiente. b = coeficiente de regresión (pendiente de la recta de regresión) X = una variable independiente de nivel de intervalo/razón (u ordinal de tipo intervalo) Y = una variable dependiente de nivel de intervalo/razón (u ordinal de tipo intervalo) n = tamaño de la muestra Cálculo del parámetro “a”. Una vez que se concluye la existencia de relación. efectivamente. a Y  b X Donde.

06 Cálculo del coeficiente de regresión “b” b n.001  XY 12. Concluida la existencia de relación entre ambas variables a través del coeficiente de correlación r Pearson. b = coeficiente de regresión (pendiente de la recta de regre  X ) 2 sión) X = una variable independiente de nivel de intervalo/razón u ordinal (Velocidad lectora) Y = una variable dependiente de nivel de intervalo/razón u ordinal (Comprensión lectora) n = tamaño de la muestra Para aplicar la fórmula son necesarios los siguientes cálculos previos: 1 2 X 69 68 Y 29 30 X. es decir que la relación entre estas dos variables es significativa (véase ejemplo 20.57 18 * 35245  564001 634410  564001 70409   X ) 2 Cálculo del parámetro “a” o constante de la ecuación de regresión. La recta se define de la siguiente manera: Y = a + b · X.72  0.Y 2001 2040 X2 3 4 5 38 50 57 10 21 24 380 1050 1368 6 33 11 363 4761 4624 1444 2500 3249 1089 7 30 12 360 8 38 8 304  9 10 11 12 13 14 15 16 17 18 39 22 20 37 62 35 41 50 43 19 751 7 5 3 6 28 12 9 20 16 2 253 273 110 60 222 1736 420 369 1000 688 38 12782 900 1444 1521 484 400 1369 3844 1225 1681 2500 1849 361 35245  X ) Y ) 190. donde rxy 0.57 X .245 2 2 n=18 X 41.  XY )  n X 2  X ) Y ) 18 12782  190003 230076  190003 40073    0. b n.94 ).06  23. la regresión permite definir la recta que mejor se ajusta a esta nube de puntos. los parámetros a y b se determinan de la siguiente manera.  XY )  n X 2  X ) Y ) Donde.72 Sustituyendo estos valores en la fórmula de la ecuación de la recta de ajuste se tiene: Y a  bX  5.Estadística aplicada a la Educación Gráficamente se puede visualizar la existencia de una correlación lineal positiva y alta para la muestra.782  X 35.003  X ) 564. a Y  b X 18.57 41. donde X es la variable independiente (velocidad lectora) e Y (comprensión lectora).72 18.06  0.72 Y 18. es decir Magíster Agustina Subeldía Coronel 54 .7804  5.

Las notas de 10 alumnos en Matemáticas y en Lengua vienen dadas en la siguiente tabla: Magíster Agustina Subeldía Coronel 55 . Se tienen los datos correspondientes a las calificaciones de 12 estudiantes de una institución de educación superior en los exámenes de Matemática y Contabilidad. b) Determina la recta de regresión para las asociaciones significativas. Se busca establecer si hay relación entre el puntaje de la parte teórica del 1er parcial de Estadística y la parte práctica del mismo. b) Si un alumno obtuviera en teoría 5 puntos ¿Cuánto se espera que obtenga en la parte práctica? c) Un alumno que obtuvo una calificación de 2. Matemática Contabilidad aa aa 12 13 18 14 09 16 15 08 14 19 12 06 10 20 18 13 17 14 07 17 Representa la información en un diagrama de dispersión y analiza a través de éste la relación entre los resultados de los exámenes aplicados. la “mejor estimación” de la Comprensión lectora (Y) para cualquier valor de la Velocidad lectora (X). 73. b) Determina la recta de regresión para las asociaciones significativas. 70. Los datos siguientes corresponden a nivel de vocabulario previo y el nivel intelectual de 10 alumnos del 1º G Vocabulario previo Nivel intelectual 28 43 27 30 14 18 23 23 24 19 14 22 14 26 18 20 14 19 10 18 a) Representa la información en un diagrama de dispersión y analiza a través de éste la relación entre los resultados de los exámenes aplicados.72+0. Un investigador quiere conocer la asociación entre el puntaje de razonamiento abstracto y el puntaje de razonamiento espacial.5 3 5 2. Determina la recta de regresión para las asociaciones significativas. en un grupo de 10 personas.5 1 a) Representa la información en un diagrama de dispersión y analiza a través de éste la relación entre los resultados. RA RE 50 32 82 60 64 44 50 38 63 49 81 63 80 59 72 63 72 69 69 63 a) Representa la información en un diagrama de dispersión y analiza a través de éste la relación entre los resultados. Sin embargo. 72.57xVelocidad Lectora Esta ecuación de regresión puede usarse para calcular. Las notas de 10 alumnos en biología y lenguaje BIOLOGIA 2 4 5 5 6 6 7 7 8 9 LENGUAJE 2 2 5 5 5 7 5 8 7 10 a) Representa la información en un diagrama de dispersión y analiza a través de éste la relación entre los resultados de los exámenes aplicados. EJERCICIOS DE APLICACIÓN 12 68. esta asociación debería ser validada mediante pruebas de hipótesis adecuadas.5 1 3 4 2 3.5 puntos en la práctica ¿Cuánto se espera que haya obtenido en la parte teórica? 69. Teórica Práctica 2 2 2.5 2 1. b) Determina la recta de regresión para las asociaciones significativas.Estadística aplicada a la Educación Comprensión lectora = -5.5 1 1. 71.

b) Determina la recta de regresión para las asociaciones significativas. Magíster Agustina Subeldía Coronel 56 .Estadística aplicada a la Educación MATEMÁTICAS 2 4 5 5 6 6 7 7 8 9 LENGUA 2 2 5 6 5 7 5 8 7 10 a) Representa la información en un diagrama de dispersión y analiza a través de éste la relación entre los resultados de los exámenes aplicados.

el término de grados de libertad se emplea para referirse a qué tan flexible es un pro cedimiento estadístico. a no ser que se examine la población entera. mejor. (Ritchey. mientras más grados de libertad se tenga. Nunca se sabe con absoluta certeza la verdad o falsedad de una hipótesis estadística. distorsiones y debilidades potenciales en los procedimientos estadísticos. y no es una cuestión sencilla. es aquella que se establece para ser rechazada o anulada. deben diseñarse de modo que minimicen los errores de deci sión. es decir es la hipótesis que se quiere contrastar. un intento de disminuir un tipo de error suele ir acompañado de un crecimiento del otro tipo. En este sentido. diremos que se ha cometido un error de tipo II. es la hipótesis que se acepta si la hipótesis estadística es rechazada. Formulación de hipótesis en estudios cuantitativos con diferentes alcances ALCANCE DEL ESTUDIO Exploratorio Descriptivo Correlacional Explicativo (Hernández S. Por otra parte si aceptamos una hipótesis que debiera ser rechazada. si la hipótesis de investigación propone: “Los adolescentes le atribuyen más importancia al atractivo físico en sus relaciones heterosexuales que las mujeres”. En ambos casos se ha producido un juicio erróneo. Esto por su puesto sería impractico en la mayoría de las situaciones. 2004) FORMULACIÓN DE HIPÓTESIS No se formulan hipótesis Sólo se formulan hipótesis cuando se pronostica un hecho o dato Se formula hipótesis correlacionales Se formulan hipótesis causales Hipótesis La hipótesis constituye una predicción sobre la relación entre dos variables. Por lo que. Por ejemplo. por que para cualquier tamaño de la muestra. la hipótesis estadística postularía: “Los jóvenes no le atribuyen más importancia al atractivo físico en sus relaciones heterosexuales que las adolescentes”. Grados de libertad Los procedimientos estadísticos (instrumentos de medición y técnica) tienen limitaciones (distorsionan la in terpretación de los datos) que repercuten potencialmente en la valoración exacta de parámetros de población. se toma una muestra aleatoria de la población de interés y se utilizan los datos que contiene tal muestra para proporcionar evidencia que confirme o no la hipótesis. La prueba de hipótesis estadística cuantifica el proceso de toma de decisiones. que afirma que los cambios en la medida de una variable independiente corresponderán a los cambios en la medida de una variable dependiente. Ejemplos “Las características del hogar asociados a la pobreza influyen en el logro educativo de los hijos en grados di ferentes por departamentos geográficos” “La oferta de carreras profesionales de la Universidad XX no satisface la demanda de formación académica profesional de los egresados de nivel medio.Estadística aplicada a la Educación INFERENCIAS ESTADÍSTICAS PRUEBAS DE HIPÓTESIS Una prueba de hipótesis estadística es una conjetura de una o más poblaciones.” “El grado de instrucción académica influye en la probabilidad de abortar” Hipótesis estadística. 2001) Tipos de error y nivel de significancia Si rechazamos una hipótesis cuando debiera ser aceptada diremos que se ha cometido un error de tipo I. En la práctica un tipo de error puede ser Magíster Agustina Subeldía Coronel 57 . Para que las reglas de decisión sean buenas. porque los grados de li bertad son el número de oportunidades de muestreo para compensar las limitaciones. En su lugar. Hipótesis alternativa.

la tarea se vuelve más fácil haciéndonos las siguientes preguntas (Ritchey.Estadística aplicada a la Educación más grave que el otro. por ejemplo. o con más?  ¿Cuál es el tamaño de la muestra. Se tiene una muestra representativa de una sola población 2. Ferris 2001 Magíster Agustina Subeldía Coronel 58 . de manera que los resultados no influyan en nuestra elección. gl=n-2). ordinales o de razón/intervalo?  ¿Estamos tratando con una muestra representativa de una sola población. si bien se usan otros valores. la máxima probabilidad con la que estamos dispuestos a correr el riesgo de cometer un error de tipo I se llama nivel de significancia. En este sentido. Esta probabilidad se denota por .  ¿Cuántas variables estamos observando para esta prueba?  ¿Cuáles son los niveles de medición de las variables?. Nivel de significancia o nivel de error de muestreo Al contrastar una cierta hipótesis. que no siempre es posible. Criterios para la selección de una prueba estadística Muchas veces nos preguntamos acerca de cuáles son las fórmulas estadísticas correctas para un problema particular. a través del coeficiente de correlación r de Pearson. tenemos un 95% de confianza de que hemos adoptado la decisión correcta. En la práctica es frecuente un nivel de significancia de 0. Se tienen dos variables de de intervalo/razón u ordinales 2 Según Ritchey.05 al diseñar una regla de decisión entonces hay unas cinco oportunidades entre cien de rechazar la hipótesis cuando debiera haberse aceptado. Si. se suele especificar antes de la muestra. se escoge un nivel de significancia del 5% ó 0.05 ó 0. se usa para comprobar una hipótesis de que existe relación entre dos variables de intervalo/razón u ordinales (una variable independiente X y una variable dependiente Y) cuando 2: 1.05 lo cual quiere decir que la hipótesis tiene una probabilidad del 5% de ser falsa.01. 2001). sus aplicaciones y fórmulas Nombre de la prueba Estadístico de la prueba Correlación lineal simple y regresión n 2 t r r 1 r2 Correlación rho de Spearman de rangos ordenados Correlación gamma de rangos ordenados Prueba de chi cuadrado de asociación rs 1  G Nº. es decir. la única forma de disminuir ambos a la vez es aumentar el tamaño de la muestra. y debe alcanzarse un compromiso que disminuya el error más grave. En tal caso decimos que la hipóte sis ha sido rechazada al nivel de significancia 0. y/o cuántos grados de libertad están disponibles para la prueba?  ¿Existen circunstancias peculiares a considerar? Pruebas estadísticas. ¿son variables nominales. tipo y nivel de medición de las variables Peculiaridades o suposiciones 1 gl n  2 Dos variables de intervalo / razón u ordinales de tipo intervalo Las variables deben relacionarse linealmente 1 n 10 Dos variables ordinales Requiere pocos rangos empatados 1 No aplica Dos variables ordinales Tolera muchos rangos empatados 1 gl ( f  1)(c  1) Dos variables nominales /ordinales Requiere al menos 5 casos por casilla 6 D 2 n( n 2  1) f f  f  f a a c 2  Tamaño de la muestra/ grados de libertad Nº de muestras O  E ) E i i 2 ANÁLISIS DE CORRELACIÓN Y REGRESIÓN El análisis de correlación y regresión (distribución t.

será mejor 4. y la(s) muestra(s) y el (los) tamaño(s) de la(s) muestra(s). Observe los resultados de la muestra en cuestión y calcule los efectos de la prueba. El valor crítico se determina a partir de la tabla de la distribución t (ver anexo). incluso las variables (X. Frecuentemente se utiliza un nivel de confianza de 95%. los gl n  2 . existe una relación positiva) 2. el enunciado de la hipótesis alternativa depende del planteamiento de la pregunta de investigación y pueden ser. existe una relación negativa)  Una cola en la dirección positiva (es decir. Si H est :  0 es verdadera y repetidamente se extraen muestras de tamaño n de la población en estudio. a mayor tamaño de la muestra menor será el error estándar3) 3. si bien se usan otros valores. y trace un diagrama conceptual. Lo que significa. sus niveles de medición. 3 La ley de los grandes números sostiene que. que hay unas cinco oportunidades entre cien de rechazar la hipótesis cuando debiera haberse aceptado (error tipo I). al que le corresponde un nivel de significancia de 5% (0.   0 . Describa la distribución muestral Se describe la distribución a ser utilizada. Un diagrama de dispersión de las coordenadas de las dos variables se ajusta a un patrón lineal Lista de verificación para los seis pasos de la inferencia estadística (Ritchey. Determine el nivel de significancia ( a ) y especifique el valor crítico de la prueba. menor será el error estándar. seleccione la prueba estadística.05. es decir. Con gl n  2 1 r2 t r = la prueba t para el coeficiente de correlación r de Pearson r = coeficiente de correlación r de Pearson calculado en una muestra n = tamaño de la muestra gl = grados de libertad 5. tenemos un 95% de confianza de que se ha adoptado la decisión correcta.   0 . 2001) Preparación de la prueba Formule la pregunta de investigación. en este caso la distribución t aproximadamente normal. no direccional (es decir.  0 . Seis pasos Empleando el símbolo H para hipótesis 1. cuanto mayor sea el tamaño de la muestra n. la(s) población(es) bajo estudio. se obtiene la t a .  De dos colas. el estadístico de la prueba y el valor p. las r de las muestras se centrarán alrededor de cero con un error estándar inversamente relacionado con el tamaño de la muestra (es decir.05). para una distribución muestral de medias. 4. liste las especificaciones. proporcione observaciones de estadísticos y parámetros. pero generalmente cuanto más grande sea n.Estadística aplicada a la Educación 3. Magíster Agustina Subeldía Coronel 59 . Tome la decisión de rechazo La H est :  0 se rechaza cuando t r  ta . Y). El estadístico de la prueba utilizado es t r r donde n 2 . así p<0. Enuncie la H estadística y la H alternativa El enunciado de la hipótesis estadística es H est :  0 . existe una relación)  Una cola en la dirección negativa (es decir. No existe ninguna restricción en el tamaño de la muestra. valores críticos de t para los niveles de significancia y los grados de libertad especificados. es decir no existe relación entre las variables Mientras que.

sabiendo que se relacionan y se mide con r 2 x100 .57 X n=18.94  Donde rho ( ) es el coeficiente de correlación que se obtendría si el coeficiente de correlación de Pearson se calculara para la población entera. La interpretación de los resultados se hace analizando los cuatro aspectos de una relación     Existencia : describiendo la existencia de la relación entre variables Dirección : que puede ser positiva o negativa. Observaciones : el diagrama de dispersión sugiere una relación lineal. el patrón lineal de la muestra tan sólo puede ser el resultado del error de muestreo.94 y regresión sugieren una relación lineal. Es decir. Población: Niños de 1º grado X = velocidad lectora Y= comprensión lectora ¿Es ? Muestra: 18 niños del 1º grado r=0. que fue utilizada en un diseño experimental sobre métodos de enseñanza de la lectura Niño/a 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 Velocidad lectora (X) 69 68 38 50 57 33 30 38 39 22 20 37 62 35 41 50 43 19 Comprensión lectora (Y) 29 30 10 21 24 11 12 08 07 05 03 06 28 12 09 20 16 02 Preparación para la prueba Tanto el diagrama de dispersión como los datos de coeficiente de correlación rxy 0. Y = comprensión lectora.Estadística aplicada a la Educación 6. En el siguiente diagrama conceptual se visualiza la pregunta de investigación. Interprete y aplique las mejores estimaciones en términos cotidianos. Muestra : 18 niños Procedimiento estadístico : la prueba t para la significancia del coeficiente de correlación r de Pearson. no existe relación entre la velocidad lectora y la comprensión lectora Magíster Agustina Subeldía Coronel 60 . Pregunta de investigación : ¿Existe una relación entre la velocidad lectora y la comprensión lectora en los niños del 1º G? Especificaciones : Variables.94 Y a  bX  5. X = velocidad lectora. Naturaleza : En este punto se interpreta la pendiente de la línea de regresión “b”. los datos y cálculos son rxy 0. ambas son variables de intervalo/razón. Sin embargo. Población : niños del 1º G.72  0. Ejemplo 22: Los datos siguientes corresponden a las puntuaciones obtenidas por 18 alumnos del 1er G. distribución t nos permite probar la hipótesis planteada. Seis pasos 1. Enuncie la H estadística y la H alternativa H est :  0 . se determina por el signo de “r” y “b” Fuerza : es la proporción de la variación en Y explicada por X.

3.94. El valor crítico para a 0.72+0. La interpretación de los resultados se hace analizando los cuatro aspectos de una relación  Existencia : existe una relación positiva entre la velocidad lectora (VI) y la (VD) comprensión lectora en los niños del 1º grado  Dirección : la relación es positiva. (en este caso se supone que si la hipótesis es rechazada tiene una probabilidad del 5% de ser falsa) de una cola. de esta manera la mejor estimación de la relación en la población está dada por.05 4. Y a  bX  5.74  ta 1. Se busca establecer si hay relación entre el puntaje de la parte teórica del 1er parcial de Estadística y la parte práctica del mismo. Si H est :  0 es verdadera y repetidamente se extraen muestras de tamaño 18 de la población de niños de 1º grado.94 0. las r de las muestras se centrarán alrededor de cero con un error estándar inversamente relacionado con el tamaño de la muestra. es t a 1.94 0.94  0 0. con gl n  2 18  2 16 .57xVelocidad Lectora EJERCICIOS DE APLICACIÓN 13 74.05 .94 11.57 son positivos.8836 0. es decir. Se define a 0.57 puntos en la comprensión lectora por punto en la velocidad lectora. 6.5 61 . r=0.1164 1 r 1  0. Describa la distribución muestral La distribución t aproximadamente normal.94 2 100 0.8836 100 88. Interprete y aplique las mejores estimaciones en términos cotidianos.94 (es decir.05. Es decir.94 y b=0.57 X .94 0. Teórica 2 2.746 El diagrama de dispersión revela una relación lineal.02 Error Estándar t r r 5. De una cola 2. es decir que existe una relación positiva entre la velocidad lectora y la comprensión lecto ra.72  0. existe una relación positiva entre la velocidad lectora y la comprensión lectora. Tome la decisión de rechazo Como t r 11 .94 t r 11. un aumento de un punto en la velocidad lectora se relaciona con un aumento de 0. Determine el nivel de significancia ( a ) y especifique el valor crítico de la prueba.  Naturaleza : siendo b=0. n=18 Efecto de la prueba = 0.  Fuerza : r 2 0. es decir Comprensión lectora = -5. ya que r =0. así p<0.46 0.746 . entonces la H est :  0 se rechaza y se acepta la H alt :   0 . efecto = r   0.94  137.Estadística aplicada a la Educación H alt :   0 .36 % de la variación de la comprensión lectora se explica por la velocidad lectora en los niños del 1º grado. Observación y gl 16 .94 ) El estadístico de la prueba n 2 18  2 16 16 0.5 1.5 Magíster Agustina Subeldía Coronel 1.57 en la comprensión lectora.724 2 2 1  0.5 3 2 3 2. A partir de este análisis se puede concluir que la comprensión lectora puede explicarse por la velocidad lectora.

analícelos.5 18 3. Un investigador cree que la inteligencia de los niños. CI Nº hermanos 110 0 115 1 120 1 118 1 110 2 108 2 105 2 104 3 98 3 99 4 98 4 100 5 90 5 93 5 90 6 aa Traza un diagrama de dispersión y analiza a través de éste la relación entre las variables. analícelas.5 16 3 34 4. depende del número de hermanos. Si la hay. Toma una muestra aleatoria de 15 niños y ajusta una regresión lineal simple. Matemática Contabilidad 12 13 18 14 09 16 15 08 14 19 12 06 10 20 18 13 17 14 07 17 a) Traza un diagrama de dispersión y analiza a través de éste la relación entre las variables.8 a) Traza un diagrama de dispersión y analiza a través de éste la relación entre las variables. 75. medida a través del coeficiente intelectual (CI en puntos). b) Calcula el coeficiente de correlación r de Pearson para estas dos variables. Un investigador quiere conocer la asociación entre el puntaje de razonamiento abstracto y el puntaje de razonamiento espacial. así como la ecuación de regresión Y=a+bX c) Prueba la hipótesis de existe relación entre estas dos variables.5 27 4. así como la ecuación de regresión lineal Y=a+bX c) Prueba la hipótesis de existe relación entre estas dos variables. Magíster Agustina Subeldía Coronel 62 .5 22 4. El número de horas dedicadas al estudio de una asignatura y la calificación obtenida en el examen correspondiente. así como la ecuación de regresión lineal Y=a+bX aa Prueba la hipótesis de existe relación entre estas dos variables. así como la ecuación de regresión lineal Y=a+bX c) Prueba la hipótesis de existe relación entre estas dos variables. Si la hay. Se tienen los datos correspondientes a las calificaciones de 12 estudiantes de una institución de educación superior en los exámenes de Matemática y Contabilidad. 76.5 32 4. de ocho personas es: Horas (X) Calificación (Y) 20 3. Si la hay. analícelas. analícelas. aa Calcula el coeficiente de correlación r de Pearson para estas dos variables. así como la ecuación de regresión lineal Y=a+bX c) Prueba la hipótesis de existe relación entre estas dos variables. 78. 77. Si la hay.5 23 3. analícelas. en un grupo de 10 personas. b) Calcula el coeficiente de correlación r de Pearson para estas dos variables. b) Calcula el coeficiente de correlación r de Pearson para estas dos variables.Estadística aplicada a la Educación Práctica 2 1 2 1 4 3. RA RE 50 32 82 60 64 44 50 38 63 49 81 63 80 59 72 63 72 69 69 63 a) Traza un diagrama de dispersión y analiza a través de éste la relación entre las variables.5 5 1 a) Traza un diagrama de dispersión y analiza a través de éste la relación entre las variables. b) Calcula el coeficiente de correlación r de Pearson para estas dos variables. Los resultados aparecen en la siguiente tabla. Si la hay.

Estadística aplicada a la Educación ANEXO Magíster Agustina Subeldía Coronel 63 .

Págs. Estudios y Ediciones R. Richard. H W. Probabilidad y Estadística (1975). • Ávila Acosta. Ferris J. Boixareu. Universitaria. México: Mc Graw-Hill.A– 3ra. L. A. Metodología de la Investigación (2008). Estadística para las Ciencias Sociales. Introducción a la Metodología de la Investigación – “La tesis Profesional” – Guía para elaborar la tesis ..A. Lima Perú: Estudios y Ediciones R. Estadística Elemental – Con 300 problemas resueltos (1996). Editorial Continental S.. • Hernández Sampieri. Tratamiento Estadístico de Datos .Estadística aplicada a la Educación BIBLIOGRAFÍA • Ávila Acosta.Métodos y Programas (1994). Construcción y análisis de datos – Introducción al uso de técnicas cuantitativas en la Investigación Social (1992). • Baranger.Marcombo. 7a. Roberto. México: Cñia. • Ritchey. Morineau. ESTADISTICA PARA ADMINISTRADORES. Editorial Prentice Hall Hispanoamericana.Aplicaciones y Ejemplos (1997). Lima – Perú: Nueva Edición. México: Mc Graw-Hill Magíster Agustina Subeldía Coronel 64 . edición. Probabilidad y Estadística para Ingeniería y Administración (1995). . Argentina: Edit. • Murria y Spiegel. y Fénelon JP. R.. • Lebart. 93-107 • Montgomery. Roberto. (2001). Fernández. Edición. y Baptista P. C. México: Mc Graw-Hill. • Levin.