METODOS PARA OBTENER INFORMACIÓN ESTADISTICA.

Existen muchos métodos para obtener información estadística, sin embargo los
más usados son:
 Registro administrativo
 Experimentos
 Encuestas
REGISTRO ADMINISTRATIVO
Es un método a través del cual, un servicio administrativo obtiene datos para
fines administrativos. Muchas veces estos datos para ser utilizados con fines
estadísticos requieren de adecuación. Ejemplo La Dirección Administrativa de la
Facultad de Ciencias Matemáticas, obtiene los datos correspondientes a la
asistencia de los trabajadores a través del registro administrativo. El registro de la
asistencia diaria del trabajador, le permite al jefe de personal de la Facultad,
conocer el total de asistencias del trabajador, con este resultado, podrán proceder
a pagarle el integro de su sueldo, sí no faltó, o con descuento en caso contrario,
hasta aquí, los datos administrativos han sido útiles administrativamente. Con
fines estadísticos, la información que se obtiene es a nivel de todos los
trabajadores, como por ejemplo, el porcentaje de trabajadores que no faltaron
EXPERIMENTO
Este método permite obtener datos de la variable de interés, tratando de mantener
constante algunas variables y manipulando otras, las cuales se consideran
influyen sobre la variable considerada. Ejemplo: El gerente de producción de una
planta en la cual se fábrica y envasa cereal en cajas de 500 gr. considera sustituir
una máquina antigua que afecta directamente la producción. Cuenta con
información sobre precios y facilidades de pago de 3 proveedores, las cuales son
casi iguales y más aun le permiten probar sus maquinas. Para tomar una decisión
de compra, el gerente de producción decide llevar a cabo un experimento que le
permita determinar la diferencia entre las marcas. Para ello considerara el tiempo
medio que necesitan los obreros para su producción. Como las diferencias entre
los obreros puede influir en la variable de interés, es decir en el tiempo que
emplean en envasar el cereal, se selecciona 15 operarios cuya experiencia,
capacidad y edad sean similares, estas son las variables que se mantienen
constantes y la única variable que va a variar es la marca. Entre la variable de
interés y la variable controlada hay una relación de causa efecto
ENCUESTA
Es un proceso sistemático a través del cual se obtiene los datos de una o
más variables independientes o variables dependientes que no tienen una
relación de causa efecto, de un conjunto de individuos, respecto a una
determinada situación. A partir de estos datos se obtiene la información
estadística buscada. Ejemplo: El resultado, es decir la cantidad de votos
obtenidos por cada uno de los candidatos participantes en las elecciones
presidenciales se obtiene a partir de una encuesta. Esta encuesta es llevada a
Lic. María A. Zacarías Díaz

Página 10

cabo por el Jurado Nacional de Elecciones y toma en cuenta a toda la población
votante, la única variable de interés es preferencia de candidato.
Para obtener la información buscada a través de una encuesta, se requiere de 3
fases, siendo estas:
1. Fase de Planeamiento.
2. Fase de Recolección.
3. Fase de Procesamiento de datos.
1. FASE DE PLANEAMIENTO.
Esta fase involucra una serie de operaciones, pudiendo ser pocas o muchas depende de la
envergadura del problema. Esta primera fase cubre más del 50% de la encuesta y es aquí
donde debe quedar claro qué es lo que se quiere y para qué se quiere.

2. FASE DE RECOLECCIÓN
En esta fase también se requiere una serie de operaciones, es en ésta, que se recolectan
los datos haciendo uso de un cuestionario.

3. FASE DE PROCESAMIENTO DE DATOS.
Operaciones.
a. Crítica
b. Almacenamiento de datos.
c. Métodos para procesar datos

a. Crítica
Generalmente cuando un cuestionario involucra muchas preguntas, puede
ocurrir que hayan preguntas sin respuesta, o con respuesta ilegible, o con
respuesta inconsistente, es en esta operación que se trata de salvar en tanto sea
posible estas ocurrencias.

b. Almacenamiento de datos.
Los datos de los cuestionarios se almacenan en una tabla como la siguiente:
MATRIZ TRIPARTITA
Unidad
Estadística
1
2
.
.
.
N o n

Variable 1

Lic. María A. Zacarías Díaz

Variable 2

.................. Variable K

Página 11

A ésta tabla se le llama matriz tripartita, llamada así, porque involucra los 3 elementos
básicos de la Estadística: la unidad de observación, la variable y dato, la ausencia de
uno de ellos no permitirá obtener la información buscada.
N indica el tamaño del grupo de individuos, se usará esta notación para indicar que el
grupo está constituido por todos los elementos que integran una Población.
“n” indica el tamaño del grupo de individuos, se usará esta notación para indicar que el
grupo está constituido por los elementos que son una parte de la Población, a la cual
llamaremos muestra.
METODOS PARA PROCESAR LOS DATOS DE CADA UNA DE LAS
VARIABLES QUE SE ENCUENTRAN EN UNA MATRIZ TRIPARTITA
En una matriz tripartita se puede encontrar variables categóricas y/o cuantitativas, cada
una de ellas independientemente del tipo de variable que sea, tiene asociada un
conjunto de datos o medidas y cómo lo que se desea es resumir este conjunto de datos,
los métodos que se utilizarán son:
1. Tablas de frecuencia para una variable, dos o más variables.
2. Medidas Resumen o indicadores de Tendencia Central, Dispersión, Asimetría y
Apuntamiento.
TABLA DE FRECUENCIAS
Si bien es importante tener en cuenta el nombre de la variable, sin embargo, en adelante
usaremos su notación. Así:
Sea la variable X, cuyo conjunto de datos lo denotaremos: x1 , x2 ,............, xn o N en este
conjunto de datos buscamos los datos diferentes, los cuales denotaremos por X 1 ,
X2 , ................, Xm , luego contaremos cuantas veces se repite cada dato diferente y a
este resultado le llamaremos frecuencia y lo denotaremos, por f 1, f2, .............. , fm , con
este procedimiento hemos arribado a una tabla como la siguiente:

Xi

fi

X1
X2
.
.
.
Xm

f1
f2
.
.
.
fm

Esta tabla es llamada TABLA DE FRECUENCIAS.
TIPO DE FRECUENCIAS.
1. Frecuencia absoluta
Indica el número de veces que se repite cada dato diferente.
Se denota por: fi , i = 1, 2, 3, ... , m.
Lic. María A. Zacarías Díaz

Página 12

. Propiedades... Zacarías Díaz fi Página 13 ... Esta definida como: Hi = h1 + h2 + . luego: hi = fi / N i = 1. . + fi Propiedades.. Esta definida como: Fi = f1 + f2 + . asociada a ella. Frecuencia relativa acumulada.. TABLA DE FRECUENCIAS PARA VARIABLE CATEGÓRICA.. ... tenemos un conjunto de datos o medidas. i  n( N ) Frecuencia relativa La frecuencia relativa está definida como el cociente de la frecuencia absoluta entre el total de datos... 4.Ejemplo: f2: nos indica el número de veces que se repite el dato diferente X 2. m. luego determinamos el número de veces que se repite cada dato diferente..H m 2.2.. Esta frecuencia se denota por hi.. 3..... 0  hi  1 2... 2.. Sea la variable X.N o h i = fi / n i = 1... María A. . Propiedades.. 2. m i = 1. 1. en este conjunto buscamos los datos diferentes. Este total de datos puede ser total de datos poblacionales que se denota por N o total de datos muestrales que se denota por n.. + hi i = 1.2..... Se denota se denota por H i . Se denota por F i . 1.. arribando así a la siguiente tabla: VARIABLE Lic. Propiedades.. m 2. ...Fm 2. 1. Hm = 1 1. F1  F2  .. fi  0 1..... h i 1 i 1 Frecuencia absoluta acumulada.. n Ejemplo: h1: indica que tanto del total es fi . Fm = Total de datos. f i 1 2. H1  H 2  .

se considera una cierta distancia. . esta distancia se divide en tantas partes iguales como sea la mas alta frecuencia. Zacarías Díaz Página 14 . donde. 2. f1 f2 . Construcción. 1. tenemos un conjunto de datos o medidas. se toma una distancia prudencial entre barra y barra. Toda gráfica construida utilizando este método consiste en utilizar el sistema cartesiano. en el otro eje se considera una distancia igual o los ¾ de la distancia considerada en el eje anterior. asociada a ella. en el eje de las X se considera una cierta distancia y en el eje de las Y los ¾ de la distancia considerada en el eje X. A la altura de cada categoría se trazan rectángulos. Barras simples. .Clase 1 Clase 2 . y la altura viene a ser la frecuencia correspondiente. 3. luego determinamos el número de veces que se repite cada dato diferente. estos rectángulos deben tener el mismo ancho. f1 f2 . . en este conjunto buscamos los datos diferentes. arribando así a la siguiente tabla: Xi fi (VARIABLE) X1 X2 . . Las barras deben estar separadas. Sea la variable X. a TABLA DE FRECUENCIAS ASOCIADA A UNA VARIABLE CUANTITATIVA DISCRETA. esta distancia se divide en tantas categorías o clases como tenga la variable. Se utiliza el Sistema Cartesiano. . María A. Representación Gráfica Regla de los ¾. . en el eje X o en el eje Y. Clase m fm A cada dato diferente se le llama clase o categoría. 2. Xm fm A cada dato diferente se le llama Valor diferente Lic. .

los cuales se han obtenido usando de un instrumento de medición.Se determina la longitud del recorrido. b TABLA DE FRECUENCIAS ASOCIADA A UNA VARIABLE CUANTITATIVA CONTINUA. (ABSOLUTAS O RELATIVAS) Construcción de intervalos de clase 1. x2 . si se construye una tabla de frecuencias utilizando el procedimiento anterior arribaríamos a una tabla de frecuencias donde todas las frecuencias serían igual a 1.. a cada una de estas partes se le llama intervalos de clase.. por lo tanto esta tabla no cumpliría con su objetivo. Zacarías Díaz Página 15 .. a este intervalo se le llama recorrido y se denota por R. máx xi ) 2.. Se utiliza el sistema cartesiano y considerando la regla de los ¾.. R = ( mín xi. El número de intervalos depende de la cantidad de datos.Se determina el número de intervalos.. Si este instrumento fuese de tal precisión entonces todos los datos del conjunto serian diferentes. Si bien la tabla de frecuencias ordena y resume los datos asociados a la variable... pero lo más importante es que tanto la tabla como la gráfica nos muestra el “comportamiento de la variable”.. en el eje X se ubica los valores diferentes y en el eje Y las frecuencias (pueden ser las absolutas o las relativas simples). LR = máx xi .. se denota por m y generalmente oscila entre 5  m  20 Una de las fórmulas a utilizarse es: m = 1 + 3. 2. Cuando se tiene datos para este tipo de variable.. xN o n asociada a ella..Se halla el intervalo en el cual la variable toma sus valores.mín xi 3. La longitud del recorrido se divide en partes.. el de resumir el conjunto de datos. Los intervalos de clase pueden ser de igual o diferente tamaño depende de la naturaleza de la variable y de los datos mismos. que es.Se determina el tamaño del intervalo.. lo que se hace es construir intervalos de clase. TABLAS DE FRECUENCIAS SIMPLE.   Sea la variable X y el conjunto de datos x1 . María A...3log(N) 4. Si todos los intervalos son del mismo tamaño. entonces este se denota por A y se obtiene a partir de A = LR / m Luego los intervalos de clase son: Lic..Gráfica de Bastones 1. 2. luego. A la altura de cada valor diferente se levanta un segmento de recta vertical hasta el valor de la frecuencia correspondiente.

Zacarías Díaz Página 16 . a partir de la segunda parte se ubican los intervalos.. i = 1... Se utiliza el Sistema Cartesiano.X’i – 1 . en el eje X... en el otro eje se considera la distancia que es los ¾ de la distancia considerada en el eje X. . X´m – 1 . María A.X’i fi X’0 -..X´2 . . se considera una cierta distancia. en el eje X.X ´m El i-ésimo intervalo se denota por: X’i . .X’2 .1 + X’ i ) / 2 i = 1.Polígono de Frecuencias. Se utiliza el Sistema Cartesiano. m Finalmente la tabla de frecuencias absolutas simples es: X’i-1 -. m El punto medio de cada intervalo se le llama marca de clase se denota y obtiene de la siguiente manera: Xi = ( X’ i . Construcción: 1.. Se trazan rectángulos cuyo ancho es la amplitud del intervalo y la altura la frecuencia correspondiente.. esta distancia se divide en m + 1 partes.. X’m-1 -....X’i .Histograma Construcción 1. esta distancia se divide en m + 2 partes.X’ m f1 f2 .1 . se considera una cierta distancia.. fm Representación Grafica.X´i X´0 . . .X´1 X´1 . en el otro eje se considera una distancia igual o Lic. 2. . .X’1 X’1 -. esta distancia se divide en tantas partes iguales como sea la más alta frecuencia simple (absoluta o relativa).

. esta distancia se divide en tantas partes iguales como sea la mas alta frecuencia simple (absoluta o relativa) 2. donde a: Cálculo I se representa con 1 Matemática Básica se representa con 2 Introducción a la computación e ingeniería del Software se representa con 3. TABLA DE FRECUENCIAS ACUMULADAS. . Ejemplo 1 La siguiente matriz tripartita contiene los datos de la variable curso más exigente. Se ubican puntos cuya abscisa se el límite superior del intervalo y la ordenada es la frecuencia acumulada correspondiente. en el eje Y las frecuencias acumuladas (Absolutas o Relativas). (ABSOLUTAS O RELATIVAS) X´i-1 . resultando así la poligonal que nos muestra el comportamiento de la variable. cuya abscisa es la marca de clase Xi y la ordenada es la frecuencia simple correspondiente a Xi. Se unen estos puntos mediante segmentos de rectas. Se considera como primer punto aquel cuya abscisa es la marca de clase del intervalo inmediato anterior al primero y su ordenada toma el valor cero. María A.X’i Fi X0’ . Se considera como primer punto aquél cuya abscisa es el limite inferior del primer intervalo y la ordenada con valor cero. Fm Representación Gráfica Ojiva Construcción 1.los ¾ de la distancia considerada en el eje X. . Se utiliza el sistema cartesiano. 3.X1’ X1’ . Se ubican puntos. . 2.Se unen estos puntos mediante segmentos de rectas. Zacarías Díaz Curso más exigente 1 1 1 1 1 Alumnos 43 44 45 46 47 Curso más exigente 2 2 1 1 1 Página 17 . X’m-1 . para los alumnos ingresantes 2009. Alumnos 1 2 3 4 5 Curso más exigente 1 1 1 1 1 Alumnos 22 23 24 25 26 Lic.. como último punto se considera aquel cuya abscisa es la marca de clase del intervalo inmediato posterior al último y su ordenada toma el valor cero. que constituyen la primera promoción de la EAP de Ingeniería del SOFWARE de la UNMSM. en el eje X se ubican los intervalos de clase.X2’ .X´m F1 F2 .

f2 y f3. de esta forma se obtiene. Esta tabla de frecuencias constituye el paso previo para construir el Cuadro estadístico. Zacarías Díaz Página 18 .6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 1 1 1 1 1 1 1 2 2 2 3 1 1 1 1 Tabla de frecuencias. lo que viene a ser la Población. Primera Promoción. Variable: Curso más exigente. UE: Alumno ingresante 2009 a la EAP de Ingeniería de Software. En el conjunto de datos se detecta 3 datos diferentes o valores. Notación: X Conjunto de unidades de observación está constituido por todos los ingresantes matriculados. f 1. es decir que el dato 1 se repite 42 veces. Finalmente. para referirnos a cualquier dato diferente usaremos la notación Xi. María A. se arriba a la siguiente tabla: Xi fi 1 2 3 Total 42 19 1 62 Esta tabla nos muestra que f1 = 42. siendo estos: X1 = 1. Luego se cuenta las veces que se repite cada dato diferente. Tipo de variable: Categórica. cuyo tamaño es: N = 62 El conjunto de datos constituyen los datos poblacionales. el cual debe tener:  Número de tabla  Título  Nota de encabezado Lic. X2 = 2 X3 = 3.

Una de las gráficas asociadas a este cuadro es la GRÁFICA DE BARRAS. 1 Clasificación de los Ingresantes 2009 de la EAPISO de acuerdo al curso más exigente Curso más exigente Cálculo I Matemática Básica Introducción a la computación e ingeniería del software Total Alumno s 42 19 1 62 Fuente: Encuesta “Mayor dificultad Académica de los Ingresantes 2009-Primera promoción” de la EAP de Ingeniería del Software Este cuadro nos muestra cómo se distribuyen los ingresantes 2009. María A. 19 Matemática Básica y 1 Introducción a la computación e ingeniería del software. Todos los ingresantes se matricularon en 6 cursos. Zacarías Díaz Página 19 . Cuerpo  Nota de pie  Fuente de datos Luego el cuadro es: Cuadro Nro. del Software de acuerdo al curso que consideran más exigente Lic. de acuerdo a lo que consideran cual es el curso más exigente. La información que nos proporciona el cuadro es: La Mayoría de los Ingresantes 2009. considera que el curso más exigente es Cálculo I Gráfica. Clasificación de los ingresantes 2009 de la EAP de Ing. es decir: 42 opinan que cálculo I es el curso más exigente.

significa un atraso en el avance académico de los alumnos. lo cual perjudica al alumno. e. Le será útil al Director de la EAP de Ingeniería del Software. a sus padres y al Estado. María A. esta información. Preguntas de la buena formulación de un problema. Dado que estos ingresantes constituyen la primera promoción de esta Escuela o carrera. quienes constituyen los Primeros ingresantes. implementando cursos introductorios para los ingresantes de los años posteriores o asesorías durante el dictado del curso. ¿De cuándo? De Agosto a Noviembre del 2009 h. matriculado en el Periodo Académico 2009 – II. a. porque dentro de esos 42 ingresantes que opinan que cálculo I es el curso más exigente. el hecho que desaprueben. ¿Para qué? Lic.La información que proporciona esta gráfica es la misma que la del cuadro. “La Mayoría de los Ingresantes 2009. ¿De dónde? De la Facultad de Ingeniería de Sistemas de la UNMSM. puede usarse. ¿Qué variable permitirá obtener esa información? Curso más exigente. ¿Qué información desea obtener? La Mayoría de los ingresantes a qué curso de los que se matriculó considera más exigente. Zacarías Díaz Página 20 . f. considera que el curso más exigente es Cálculo I” ¿A quién le será útil esta información? ¿Cómo lo usará? Respuesta. g. matriculados en el Periodo Académico 2009 – II. en consecuencia. ¿Quién desea obtener información? El Director de la Escuela Académico Profesional de Ingeniería del Software. La información que se obtiene debe ser usada o servir para dar solución al problema. b. d. la información. c. habrán ingresantes que han desaprobado y otros no. ¿En quienes se va medir la variable? En todos los Ingresantes 2009. ¿En quién va a medir la variable? En el Ingresante 2009. Formulación del Problema.

UE: Alumno ingresante 2009 a la EAP de Ingeniería de Software. Variable: Número de cursos desaprobados. En el conjunto de datos se detecta 5 datos diferentes o valores siendo estos: Lic. i. lo que viene a ser la Población.Para que se implementen cursos introductorios (antes que se inicien las clases) y/o asesorías paralelas al dictado del curso. Alumnos 1 2 45 4 5 6 7 8 9 31 11 12 13 14 15 16 17 18 61 20 21 # de cursos desaprobados 0 0 2 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 4 0 0 Alumnos 22 23 24 25 26 48 28 29 30 10 32 33 55 35 36 37 38 39 40 41 42 # de cursos desaprobados 1 1 1 1 1 2 1 1 1 0 1 1 2 1 1 1 1 1 1 1 1 Alumnos 43 44 3 46 47 27 49 50 51 52 53 54 34 56 57 58 59 60 19 62 # de cursos desaprobados 1 1 0 2 2 1 2 2 2 2 2 2 1 2 2 2 3 3 0 4 Construcción de la tabla de frecuencias. Primera Promoción. cuyo tamaño es: N = 62 El conjunto de datos constituyen los datos poblacionales. por los alumnos ingresantes del 2009. del Software. Ejemplo 2 Los datos que contiene la siguiente matriz tripartita corresponde a la variable Número de cursos desaprobados. ¿Cómo va obtener la información que busca? A través de una Encuesta. María A. Notación: Y Conjunto de unidades de observación está constituido por todos los ingresantes matriculados. a la EAP de Ing. Tipo de variable: Cuantitativa Discreta. para los ingresantes de los años siguientes. Zacarías Díaz Página 21 .

14 desaprobaron 2 cursos y 2 desaprobaron 4 cursos. f 1. de esta forma se obtiene. f2 … y f5. Zacarías Díaz Página 22 . Luego se cuenta las veces que se repite cada dato diferente. es decir. María A. Cuadro Nro.Y1 = 0 Y2 = 1 Y3 = 2 Y4 = 3 Y5 = 5. del software de acuerdo al número de cursos desaprobados Nro. 23 desaprobaron 1 curso. del Software” Este cuadro nos muestra. de cursos desaprobados 0 1 2 3 4 Total Ingresant es 21 23 14 2 2 62 Fuente: Encuesta “Desempeño Académico de los Ingresantes 2009 a la EAP de Ing. Gráfica. Lic. 21 ingresantes no desaprobó ningún curso. 2 Clasificación de los ingresantes 2009 de la EAP Ing. La gráfica asociada a este cuadro es la GRÁFICA DE BASTONES. hay muchos datos con valores bajos de la variable y pocos datos con valores altos. como se distribuyen los ingresantes de acuerdo al número de cursos que han desaprobado. Se arriba a la siguiente tabla: Yi fi 0 1 2 3 4 21 23 14 2 2 62 Total Esta tabla nos muestra cómo se distribuyen los datos de acuerdo a los valores de la variable.

d. es decir mayor acumulación de los datos se da en valores bajos y baja acumulación en valores altos de la variable. ¿Quién desea obtener información? El Director de la Escuela Académico Profesional de Ingeniería del Software. significa un atraso en el avance académico de los alumnos. valores bajos de la variable se repiten buen número de veces. La información que se obtiene debe ser usada o servir para dar solución al problema. matriculados en el Periodo Académico 2009 – II. por lo tanto son pocos los ingresantes que han aprobado todos los cursos. Zacarías Díaz Página 23 . ¿En quién va a medir la variable? En el Ingresante 2009. matriculado en el Periodo Académico 2009 – II. mostrando un comportamiento asimétrico. lo cual perjudica al alumno. Dado que estos ingresantes constituyen la primera promoción de esta Escuela o carrera.13 %”. que en porcentaje es 66.13 %. Preguntas de la buena formulación de un problema. Le será útil al Director de la EAP de Ingeniería del Software. porque dentro de esos 41. d. La información que nos proporciona tanto el cuadro como la gráfica: la mayoría de los Ingresantes 2009 (41) han desaprobado uno o más cursos. María A. e. ¿Qué variable permitirá obtener esa información? Número de cursos desaprobados en el periodo académico 2009 – I. la información. puede usarse. Formulación del Problema. implementando cursos introductorios para los ingresantes de los años posteriores o asesorías durante el dictado del curso. en consecuencia. el hecho que desaprueben. ¿En quienes se va medir la variable? En todos los Ingresantes 2009. ¿A quién le será útil esta información? ¿Cómo lo usará? Respuesta. “la mayoría de los Ingresantes 2009 (41) han desaprobado uno o más cursos. c. los qué desaprobaron 1 ó 2 cursos ya se atrasaron un ciclo. valores intermedios disminuye su repetición y valores altos se repiten pocas veces. los que desaprobaron 3 o más cursos ya se atrasaron más de un ciclo. quienes constituyen la Primera Promoción. esta información. ¿Qué información desea obtener? La Mayoría de los ingresantes cuántos cursos desaprobó. c. es decir.Esta gráfica nos muestra el comportamiento de la variable. Lic. que en porcentaje es 66. a sus padres y al Estado.

¿De dónde? De la Facultad de Ingeniería de Sistemas de la UNMSM.6 13.1 12.1 12.9 9 8.5 9. Tipo de variable: Cuantitativa Continua.5 13.5 12. María A.2 13. ¿Cómo va obtener la información que busca? A través de una Encuesta.8 10. ¿De cuándo? De Agosto a Noviembre del 2009 h.1 13.4 13.4 10.2 10. Variable: Promedio Ponderado.8 13. Notación: Z Lic.f. Zacarías Díaz Página 24 .6 11.6 14. UE: Alumno ingresante 2009 a la EAP de Ingeniería de Software.4 8.8 13. ¿Para qué? Para que se implementen cursos introductorios (antes que se inicien las clases) y/o asesorías paralelas al dictado del curso.4 12. Primera Promoción.1 7.9 13 12.6 12. para los ingresantes de los años siguientes.9 14.5 12.4 14.2 8.8 11.8 13.8 10. Los datos que contiene la siguiente matriz tripartita corresponden a la variable Promedio Ponderado obtenido por los alumnos ingresantes del 2009. j. del Software. Ejemplo 3.3 12.7 13.42 8.3 13.2 13.6 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 12.8 12 11.1 Construcción de la tabla de frecuencias.5 14.7 9.7 7. a la EAP de Ing.3 13.54 8. Alumnos Promedio ponderado Alumnos Promedio ponderado 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 11. g.1 9.5 11 Alumnos Promedio ponderado 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 11.7 12.4 9.3 11.5 14.5 8.7 12.7 12.3 8.8 12 11.8 12.4 12.65 9 8.

4) [10.2 . etc Cuadro N° 3 Clasificación de los ingresantes 2009 de la EAP Ingeniería del Software de acuerdo a su Promedio Ponderado PROMEDIO INGRESAN PONDERAD TES O [7.4 6 Lic.1.1 4.Conjunto de unidades de observación está constituido por todos los ingresantes matriculados.4) 4 [10. Todo el recorrido de la variable se divide en 7 intervalos de tamaño 1.7) [13. aumenta el valor de la variable aumentan los datos. lo que viene a ser la Población. aumenta el valor de la variable aumentan los datos.8 – 7.6 13.8 .5) [11.1) 1. Zacarías Díaz Página 25 . 7. en consecuencia la tabla que se construya no permitirá resumir el conjunto de datos.3 10.7/ 7 = 1. luego se determina el número de datos que 5.9.8. cuyo tamaño es: N = 62 El conjunto de datos constituyen los datos poblacionales.1 .7 2.3* log10(62) = 6.2) 3 [8.9.4 11.8] Total fi 3 10 4 6 14 16 9 62 Esta tabla de frecuencias muestra cómo se distribuyen los datos a lo largo del recorrido de la variable.1 = 7.3 10.1 . Se construyen los intervalos.3) [9. 7 3.7 14.3) 10 [9. María A. Se arriba a la siguiente tabla de frecuencias. En el conjunto de datos se detecta muchos datos diferentes y con poca frecuencia.8. Tamaño del intervalo: A = 7. Número de intervalos: m = 1 + 3. así: hay pocos datos con valores bajos de la variable.91 . Zi – 1’ Zi ’ [7.6) [12. por lo tanto se hace necesario que se construya una tabla que incluya intervalos de clase.2) [8. Longitud de recorrido: LR = 14. aumenta el valor de la variable disminuyen los datos. Construcción de los Intervalos de clase: Rango = R = (14.2 .5 12. cae en cada intervalo.

10 ingresantes tienen un promedio ponderado entre 8. Polígono de Frecuencias Lic. Gráficas. así: 3 alumnos tienen un promedio ponderado entre 7.6) [12.5) [11.7) [13. etc. Zacarías Díaz Página 26 .7 14.11.2 puntos.2 a menos de 9. María A.5 12.3 puntos.1 a menos de 8.6 13.8] Total 14 16 9 62 Fuente: Encuesta “Desempeño Académico de los Ingresantes 2009 a la EAP de Ing. Histograma. del Software” Este cuadro muestra cómo se distribuyen los ingresantes de acuerdo a su promedio ponderado.

2 8. aumenta el valor del promedio ponderado aumenta la cantidad de ingresantes.6 a 13.El cuadro y las gráficas nos muestran la distribución de los ingresantes de acuerdo a los valores del promedio ponderado.4 10. se incrementa el valor del promedio ponderado disminuye la cantidad de ingresantes. Zacarías Díaz Página 27 . aumenta el valor del promedio ponderado y aumenta la cantidad de ingresantes. Ojiva Zi – 1 - Zi Fi 7. etc La gráfica muestra dos grupos de ingresantes.6 12.3 9.10.8 3 13 17 23 37 53 62 Lic.2 .1 a 8. (comportamiento de la variable). un grupo con pocos ingresantes cuyo promedio ponderado está entre 7.9.8.7 14.7 13.2 puntos y otro grupo con una mayor cantidad de alumnos cuyo promedio ponderado está entre 12.7 puntos.4 11.6 13. María A.1 .5 12.5 11.3 . así: hay pocos ingresantes con valores bajos del promedio ponderado.

. estos ordenamientos da lugar a la siguiente tabla: Lic. María A. así: Variable R Clase 1 Clase 2 . Zacarías Díaz Página 28 .3 puntos Tarea. Formule el problema.Tanto la tabla cómo la gráfica nos muestra la cantidad de datos que toman un valor menor cierto valor de la variable. . Clase p 2. Se obtienen las clases de cada una de las variables. . TABLA DE FRECUENCIAS CON DOS VARIABLES Construcción. 1. Las clases de una de las variables se dispone de modo vertical y la de otra de modo horizontal. . Valide su formulación con las preguntas de la buena formulación. asi: F2 = 13 indica que hay 13 datos que toman valores menores a 9. Clase m Variable S Clase 1 Clase 2 .

f2 . Estas tablas pueden involucrar dos variables cuantitativas o dos categóricas o una categórica y la otra cuantitativa. Relativa Bidimensional. f. . Zacarías Díaz Página 29 . m SJ S2 f12 f22 fi. Indica el porcentaje de datos que se han acumulado hasta la celdilla ij. Absoluta bidimensional. .Tabla Nro. . . Relativa acumulada bidimensional. . f. Ri .. Notación hij 7. donde f i ·   fij j 1 m f. Clase m Variable Clase 1 Clase 2 . ij.. . fm2 . . Indica el porcentaje de datos que hay en la celdilla ij Absoluta acumulada bidimensional.. . : Es el número de datos que toma el valor R i . . donde f· j   f ij j 1 Tipos de frecuencia. 2. p n S j .2 Ri S1 R1 f11 R2 f21 .1 Nota. Notación fij 6. S . . fm p fm . . Notación. Sp f1 p f2 p f1 . Indica la cantidad de datos que hay en la celdilla. . . . María A. Clase p 3.. 2. Lic.. p son los valores diferentes de R y S respectivamente En esta tabla: fi j : Es el número de datos que toman los valores R i y S j p fi . Presentemos la tabla bidimensional antes dada de la siguiente manera: Tabla Nro. Fij 8. j : Es el número de datos que toma el valor S j . Luego se determina el número de datos que cae en cada celdilla. Notación Hij 9. .. .. .2 . j f. 1 Variable R Clase 1 Clase 2 . Indica la cantidad de datos que se han acumulado hasta la celdilla ij. i  1.. j  1. Rm fm1 f.

esto es equivalente a decir que la tabla muestra la clasificación de los individuos de acuerdo a los valores de la variable. .TABLAS MARGINALES. R2 f2 . . también podemos decir que muestra la distribución de los datos de acuerdo a los valores de la variable. . María A. De lo mostrado podemos concluir que a partir de la tabla bidimensional se obtienen las tablas unidimensionales correspondientes a cada una de las variables y a estas se les llama tablas marginales. Si consideramos la primera y última columna de la tabla Nro. 2 obtenemos la siguiente tabla: Ri fi. Observación  Una tabla de frecuencias unidimensional muestra el comportamiento de la variable. Rm fm . . Y esta es la tabla de frecuencias unidimensional correspondiente a la variable R. . R1 f1 . 2 obtenemos la siguiente tabla: Lic. . Sp f. Rm f11 f21 .  Una tabla frecuencias bidimensional generalmente muestra la relación entre dos variables. si solo consideramos la primera y ultima fila.2 . j S1 f. Así mismo.1 Página 30 . . Si consideramos la primera y segunda columna de la tabla Nro. . fm1 f. . . . TABLAS CONDICIONALES. Zacarías Díaz Ri S1 R1 R2 .1 S2 f. p Y esta es la tabla de frecuencias unidimensional correspondiente a la variable S. obtenemos la siguiente tabla: Sj f. .

m se obtiene la distribución de este conjunto de datos de acuerdo a los valores de la variable S. que en el Periodo Académico 2008-I llevaban el curso de Estadística I. Si las tablas condicionales se expresan en términos de la frecuencia relativa y estas se comparan...1 Y en general para cualquier valor de S.E. . USO DE LAS TABLAS CONDICIONALES. .. i = 1.. . . María A. U.. Zacarías Díaz X Z Página 31 . p. a esta tabla se le llama tabla condicional.. . 2 . R . la tabla condicional es: Ri fi S R1 R2 f1 f2 . de un grupo de alumnos de la FISI de la UNMSM. Lic. es decir para cada conjunto de datos que toma el valor R i .2. Haciendo uso de las notaciones anteriores esta tabla podemos presentarla de la siguiente manera: Ri f i S1 R1 R2 f1 f2 . fm R m f .f . y las variables involucradas son categóricas entonces estas tablas nos permite decir si existe o no relación entre las variables consideradas Ejemplo. De la misma manera procedemos para la otra variable. 1 indica el total de datos que toman el valor S 1 y esta tabla nos muestra cómo ese total de datos se distribuye de acuerdo a los valores de la variable R. en este caso tenemos p tablas condicionales. fm j m f· j J = 1. . Los siguientes datos corresponden a las variables. X: Año de ingreso y Z: Ciclo o semestre académico en que se encuentra el alumno. En este caso tenemos m tablas condicionales y en general a partir de la tabla bidimensional se obtienen m + p tablas condicionales. Por lo tanto existen tantas tablas condicionales como valores tenga la variable S. .

Las clases de una de las variables ubicamos a modo de columna y la otra a modo de fila. Z: Semestre en que se encuentra. 2005. Se determina la cantidad de datos que cae en cada celdilla. Para conocer el avance académico de este grupo de alumnos se tendría que construir una tabla de doble entrada o bidimensional. 5. Xi Lic. Sus clases o datos diferentes son. Hallamos las clases de cada una de estas variables. Sus clases o datos diferentes son. Xi: 1999. Zi: 2. María A. Zacarías Díaz Zj Página 32 . 2. X: Año de ingreso. 2003. es decir: 1. 3. 2006 y 2007. lo que genera el cuadro siguiente: Xi Zj 2 3 5 1999 2003 2005 2006 2007 3.1 2007 2 2 2007 2 3 2007 2 4 1999 2 5 2006 2 6 2005 3 7 2007 2 8 2005 3 9 2005 3 10 2005 5 11 2007 2 12 2003 3 13 2007 2 14 2007 2 15 2007 2 16 2007 2 17 2007 2 18 2005 2 19 2007 2 20 2007 2 21 2007 2 ¿Qué se podría decir respecto al avance académico de este grupo de alumnos? Rspta.

asimismo una fila de totales considerando:  SOLO la primera y última columna obtenemos la distribución de los datos de la variable X. Xi Lic. f51 = 13 alumnos. a partir de la tabla bidimensional: Xi 2 1999 Zj 3 5 1 2003 2005 1 2006 1 2007 13 1 3 1 Consideramos. la primera y segunda columna. Si. Tablas Marginales. Considerando toda la tabla podemos concluir.2 1999 3 5 1 3 1 1 2003 2005 1 2006 1 2007 13 Interpretación. que todos los alumnos de ese grupo académicamente están atrasados. unos en mayor medida que otros. María A.  SOLO la primera y última fila obtenemos la distribución de los datos de la variable Z Xi 2 1999 5 1 3 1 4 1 fi . Zj 3 2005 1 2006 1 2007 13 16 j Tablas condicionales. También se puede decir que el 62% de los alumnos que llevan el curso son ingresantes del 2007 y que tienen el atraso de un ciclo. 1 1 5 1 13 21 1 2003 f. Si se añade una columna de totales. Zacarías Díaz Z1 Página 33 . es decir. Nos indica que 13 alumnos ingresantes del año 2007 se encuentran cursando el segundo ciclo de su plan de estudios.

La presentación adecuada de la tabla anterior. María A. obtenemos: Zj X3 2005 2 3 5 1 3 1 La forma correcta de presentar esta tabla es: Zj fZ / X = 2005 2 3 5 1 3 1 Lic.2 1999 1 2003 2005 1 2006 1 2007 13 Total 16 Esta es una tabla condicional. las clases de la variable Z y la tercera fila de la tabla bidimensional. se ve como se distribuyen de acuerdo a su año de ingreso. dado o condicionado a un valor de X. qué de los 16 alumnos que se encuentran en el segundo ciclo. que es una tabla unidimensional. condicionada al primer valor de la variable Z. que muestra la distribución de los datos de la variable X. Ejemplo. Zacarías Díaz Página 34 . Considerando. que muestran la distribución de los datos de la variable Z. es: Xi fx/ z = 2 1999 1 2003 2005 1 2006 1 2007 13 Total 16 Del mismo modo podemos hallar tablas condicionales. es decir.

si: 1. tenemos: 1. es decir. Están tabulados. No están tabulados. Usos. (en su forma original). Ejemplo. Zacarías Díaz Página 35 . María A. Limitaciones. Generalmente se construye la gráfica cuando los datos corresponden a variables categóricas. 2. esto puede lograrse utilizando diferentes colores o sombreados para cada categoría. Construcción. sólo que se debe identificar claramente las componentes dentro de cada categoría.  De los totales entre las categorías de la otra variable. Es similar a la de barras simples. Se construye la gráfica cuando los datos corresponden a variables cuantitativas. Considerando estas presentaciones. se debe tomar en cuenta la forma de presentación de los datos. En los estudiantes de un salón de la Escuela “Los Niños Felices” se midió las variables: Desempeño Escolar: Deficiente Regular Bueno Excelente Estado Nutricional:     1 2 3 4 Deficiente  1  2 Bueno Lic. con excepción de que cada barra ha sido segmentada en sus partes componentes. Gráfica de barras Segmentadas. Esta gráfica se usa para hacer:  Comparaciones de la magnitud relativa de las componentes dentro de cada categoría de una de las variables. Representación gráfica para dos variables categóricas. Esta gráfica es similar a la gráfica de barras simples.  No permite una fácil comparación de las componentes entre modalidades.  No es conveniente utilizar esta gráfica cuando la categoría de un de las variables contiene más de 3 componentes.REPRESENTACIÓN GRÁFICA Cuando se desea presentar gráficamente los datos correspondientes a dos variables. 2.

d. Utilice la tabla de frecuencias adecuada que le ayuda a confirmar la relación entre las variables.Estudiantes Desempeño Estado Estudiantes Desempeño Estado Escolar Nutricional Escolar Nutricional 1 1 1 16 2 1 2 2 1 17 2 2 3 2 2 18 1 1 4 1 1 19 1 2 5 1 1 20 2 1 6 1 1 21 3 2 7 2 1 22 3 2 8 2 1 23 3 1 9 1 1 24 1 1 10 3 2 25 2 1 11 2 2 26 2 2 12 1 1 27 3 2 13 3 2 28 4 2 14 1 2 29 1 1 15 3 1 30 1 2 a. Zacarías Díaz Página 36 . por otro lado. c. María A. ¿En qué difieren sus resultados de las preguntas b y c? Solución. cuando el estado Lic. b. Obtenga las 2 distribuciones de frecuencia marginales e interprételas. a yi 1 2 3 4 xj 1 9 6 2 0 2 3 4 5 1 Interpretación La tabla nos muestra que cuando el estado nutricional es deficiente hay una mayor cantidad de alumnos. Construya la tabla de frecuencias bidimensional y la gráfica asociada a ella e interprete sus resultados. 9. con desempeño escolar malo.

A partir de la tabla bidimensional obtendremos las marginales.08 30. Al comparar estas distribuciones unidimensionales condicionales. por un lado. Zacarías Díaz xj 1 9 6 2 2 3 4 5 f i. de todos aquellos que tienen estado nutricional bueno.69 100 La tabla nos muestra la distribución porcentual de los alumnos.46 7. María A.nutricional es bueno hay una mayor cantidad de alumnos. 12 10 7 Página 37 . de acuerdo a su desempeño escolar. Las gráficas nos muestran las distribuciones condicionales indicadas líneas arriba. y por otro. La grafica nos muestra qué. vemos que sus comportamientos son diferentes en consecuencia decimos que las variables son dependientes. con desempeño escolar bueno. pero de todos aquellos que tienen estado nutricional deficiente.77 38.76 0 100 2 23. 5.94 35.29 11. En conclusión tanto la tabla como la gráfica nos dice que para este grupo de alumnos existe relación entre su desempeño escolar y su estado nutricional b. dentro del grupo de alumnos con desempeño escolar deficiente hay una mayor cantidad de alumnos que tienen estado nutricional deficiente y dentro del grupo de los alumnos con desempeño escolar bueno hay una mayor cantidad de alumnos con estado nutricional bueno. c. yi 1 2 3 4 total xj 1 52. yi 1 2 3 Lic.

lo cual permite un mejor análisis visual que puede servir de base para posteriormente hacer un mayor análisis efectuando algunos cálculos. a esta gráfica se le llama: Nube de puntos o Diagrama de puntos.4 f. María A. xj f. En la pregunta b” nos muestra la distribución de los alumnos de acuerdo a su desempeño escolar pero condicionado a su estado nutricional. X: Hora que llega al salón de clase. e. xi yi 08:20 2 08:20 2 08:15 2 08:10 2 08:30 2 08:10 2 08:10 2 08:15 2 Lic. Zacarías Díaz Página 38 . Consideremos las siguientes variables: Y: Número de veces que llega tarde. Representación gráfica para dos variables Cuantitativas. en cambio la pregunta c” nos muestra la distribución de los alumnos de acuerdo a su desempeño escolar y la distribución de los alumnos de acuerdo a su estado nutricional. 12 10 7 1 30 1 2 Total 17 13 30 Muestra que la mayoría de los alumnos tiene un desempeño escolar en tre malo y regular. J 0 1 1 17 13 30 Las marginales son las siguientes: Distribución de los datos de Y yi 1 2 3 4 Total Distribución de los datos de X f i. J Muestra que la más del 50% de los alumnos tiene un estado de nutrición deficiente. Si el número de datos no es demasiado grande se pueden graficar los datos a través de puntos en el sistema cartesiano. Ejemplo.

 Partes Principales de una Cuadro Estadístico. Zacarías Díaz Total . Lic.08:15 3 08:15 08:10 2 1 4 2 1 3 08:15 08:30 08:35 08:20 Tablas finales o Cuadros Estadísticos Las tablas y gráficas elaboradas hasta esta parte. Numero de tabla Titulo Nota de encabezado VARIABLE S Clase 2 . . . El número de partes puede variar pero generalmente son las siguientes:  Número de tabla  Título  Nota de encabezado  Cuerpo  Nota de pie  Fuente de datos VARIABLE R Clase 1 Clase 1 Clase 2 . María A. son llamadas tablas y gráficas intermedias ya qué las que son incluidas en un informe final son las tablas y gráficas finales o Cuadros estadísticos. Clase p Página 39 .

María A. Según el enfoque 2.494 5 0. Cuadro N° 1 Clasificación de los cursos semestrales de acuerdo a su avance según lo programado en el Silabo. Fuente de datos. Respecto al avance del contenido de los cursos..0. Avance Cursos Porcentual 0.538 1 Lic. De acuerdo a lo Número Programado en de El Silabo cursos Si 14 No 4 Interpretación: Dado que la encuesta se llevó a cabo a mitad de semestre.. Cuadro N° 1 Clasificación de los cursos semestrales de acuerdo al avance Porcentual del Syllabus.516 4 0.428 .0. a partir de la cuadro N° 1 podemos concluir que en la mayoría de los cursos los profesores están dictando de acuerdo a lo que se programado en el Silabo.45 . Zacarías Díaz Página 40 .472 . PRESENTACIÓN Y ANÁLISIS DE LOS RESULTADOS OBTENIDOS PARA DEL PROBLEMA 3. en el Sem 97-I tenemos la siguiente información: Según el enfoque 1. Clase m Total Nota de pie.45 3 0.0.516 .494 .0.472 5 0. que se dictaron en la Escuela Académico Profesional de Estadística.

Zacarías Díaz Página 41 . Lic.6 % salvo 3 cursos en los cuales los profesores están algo atrasados. a partir de la cuadro N° 1 podemos concluir que en la mayoría de los cursos los profesores han avanzado entre 45 % y 51. María A. Respecto a los cursos anuales.Total 16 Interpretación: Dado que la encuesta se llevó a cabo a mitad de semestre. estos no pueden ser presentados en una tabla porque son pocos por lo tanto por observación podemos decir que en la mayoría de los cursos los profesores han superado ligeramente el 25% del contenido lo que indica que el avance está dentro de lo establecido.