You are on page 1of 178

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD

ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA


CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva




UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
UNIDAD DE CIENCIAS BSICAS


AUTOR
MILTON FERNANDO ORTEGON PAVA


100105 ESTADSTICA DESCRIPTIVA
Segunda versin
MILTON FERNANDO ORTEGON PAVA
(Director Nacional)

FRANCISCO CABRERA
(Acreditador)




IBAGU
JULIO 2010


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva




ASPECTOS DE PROPIEDAD INTELECTUAL Y VERSIONAMIENTO


El presente mdulo fue diseado en el ao 2005 por MONICA A. SANTA
ESCOBAR (Primera versin)

El documento tiene como antecedentes : Estadstica bsica aplicada (Ciro
Martinez Bencardino) Curso de Estadstica Elemental para las ciencias aplicadas
(Smith A Stanley). Estadstica Descriptiva (Hernan Bejarano Barrera) .Probabilidad
y Estadstica (Triola Mario F) Estadstica y Probabilidad (Juan de Jesus Romero-
santillana)



Como novedades de este material es la presentacin por unidades, captulos y
lecciones, que permite una fcil ubicacin de temticas especficas, segn el
interes del estudiante. Adems, el componente prctico para los cursos tericos
de Matemticas a lfinal de cada unidad.


Este documento se puede copiar, distribuir y comunicar pblicamente bajo las
condiciones siguientes:
Reconocimiento. Debe reconocer los crditos de la obra de la manera
especificada por el autor o el licenciador (pero no de una manera que
sugiera que tiene su apoyo o apoyan el uso que hace de su obra).
No comercial. No puede utilizar esta obra para fines comerciales.
Sin obras derivadas. No se puede alterar, transformar o generar una obra
derivada a partir de esta obra.
Al reutilizar o distribuir la obra, tiene que dejar bien claro los trminos de la
licencia de esta obra.
Alguna de estas condiciones puede no aplicarse si se obtiene el permiso del
titular de los derechos de autor
Nada en esta menoscaba o restringe los derechos morales del autor.





UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva



INTRODUCCIN


El presente modulo est dirigido a estudiantes de programas de pregrado que
oferta la UNAD, bajo la modalidad de educacin superior a distancia.


El material est estructurado en (Dos unidades) que son las temticas macro del
curso acadmico. .


El contenido de cada una de las partes fue seleccionado, teniendo en cuenta los
saberes mnimos que se esperara debe alcanzar un estudiante de la Universidad
Nacional Abierta y a Distancia en el campo la (Estadstica descriptiva).


La propuesta permite que los estudiantes reconozcan los conocimientos mnimos
del curso en mencin, que le permita resolver situaciones propias del mismo y
adems, abordar posteriores temticas que requieran de stos conocimientos.


Para el mejor aprovechamiento de este material, se recomienda que el estudiante
posea como conocimientos previos: Matemtica Bsica


El modulo se caracteriza porque en cada leccin se presentar ejemplos modelos
del tema en estudio, al final de cada captulo se exponen ejercicios; con respuesta,
que permite a los estudiantes contextualizarse en diversas reas del conocimiento,
con el fin de fortalecer las temticas propias del curso. Al final de cada unidad se
presenta una Autoevaluacin de un nivel medio-alto, las cuales permiten verificar
los alcances de los estudiantes en las temticas analizadas y detectar las
debilidades y as centrarse en stas, con el fin de alcanzar las metas propuestas.


Finalmente, el Material pretende servir como gua de aprendizaje autnomo, se
recomienda apoyar este proceso por medio de lecturas especializadas, ayudas
audiovisuales, visitas a sitios Web y prcticas de laboratorio; entre otros, as lograr
una efectiva comprensin, interiorizacin y aplicacin de las temticas estudiadas.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

CONTENIDO


Pg.

INTRODUCCIN 11


UNIDAD DIDCTICA 1
Conceptos Preliminares Y Medidas De Tendencia Central 14

INTRODUCCIN A LA UNIDAD 16

OBJETIVOS ESPECFICOS 17

1. CONCEPTOS PRELIMINARES Y MEDIDAS DE TENDENCIA CENTRAL 18

1.1. CONCEPTUALIZACIN DE TRMINOS ESTADSTICOS 18
1.1.1. QU ES LA ESTADSTICA? 18

1.1.2. CONCEPTOS BSICOS 19
1.1.2.1 Aleatoriedad Y Representatividad de la muestra 21
1.1.2.2 Muestra aleatoria simple 21
1.1.2.3 Muestra Aleatoria sistemtica 21
1.1.2.4 Muestra Aleatoria Estratificada 22
1.1.2.5 Muestra Aleatoria de conglomerados 22
1.1.2.6.Deter. Poblacin, muestra y tipo de muestreo a utilizar 22

1.1.3. VARIABLES ESTADSTICAS 23
1.1.3.1 variables cualitativas 24
1.1.3.2 variables cuantitativas 24
1.1.3.3 escala de medida de variables 24

1.1.4 CARACTERIZACIN DE UNA VARIABLE CUALITATIVA 26
1.1.4.1 tablas de frecuencias: 26
1.1.4.2 representaciones graficas: 27
1.1.4.2.1 diagramas de barras 27
1.1.4.2.2 diagrama circular: 28
1.1.4.3 moda 29

1.1.5. TABLAS DE CONTINGENCIA: 30

32 1.2 INVESTIGACION ESTADISTICA
1.2.1 PLANEACION 32
1.2.1.1 Definicin del objeto de investigacin 32
1.2.1.2.Unidad de investigacin 33
1.2.1.3.Clase de investigacin 33
1.2.1.4 Las fuentes de informacin 33


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

1.2.2. RECOLECCIN 34
1.2.2.1 Segn la cobertura 34
1.2.2.2 Segn la forma de observacin 34

1.2.3. ORGANIZACIN DE LA INFORMACIN 35
1.2.3.1 Combinacin o arreglo ordenado 35
1.2.3.2 Arreglo de tallo y hojas 36
1.2.3.3 Tabulacin de la informacin 38

1.2.4 TABLAS DE DISTRIBUCION DE FRECUENCIAS 41
1.2.4.1 Distribuciones de frecuencias 41

1.2.5 PRESENTACIN DE LA INFORMACIN 48
1.2.5.1 Componentes de una grfica 48
1.2.5.2 Diagrama de frecuencias 49
1.2.5.3 Histograma de frecuencias 51
1.2.5.4 Polgono de frecuencias 52
1.2.5.5 Ojiva 53
1.2.5.6 Grficos de lnea 55
1.2.5.7 Diagramas de barras 56
1.2.5.8 Diagrama circular 59
1.2.5.9 Pictogramas 60
1.2.5.10 Mapas estadsticos o cartogramas 61

1.3 MEDIDAS DE TENDENCIA CENTRAL O DE POSICION 61
1.3.1 ESTADIGRAFOS 61
1.3.2 MEDIA ARITMTICA 62
1.3.3 MEDIANA 65
1.3.4 MODA 69
1.3.5 OTRAS MEDIDAS DE TENDENCIA CENTRAL 72

ACTIVIDADES DE AUTOEVALUACIN DE LA UNIDAD 1
LABORATORIO EN EXCEL (PRCTICA: DIAGRAMAS ESTADSTICOS)
82
97

BIBLIOGRAFA DE LA UNIDAD 108

UNIDAD DIDACTICA 2

MEDIDAS DE DISPERSIN Y ESTADSTICAS BIVARIANTES 110
INTRODUCCION A LA UNIDAD 111
OBJETIVOS ESPECIFICOS 112
2. MEDIDAS DE DISPERSIN Y ESTADSTICAS BIVARIANTES 114

2.1 MEDIDAS DE DISPERSIN Y ASIMETRIA 115
2.1.1 RANGO O RECORRIDO 115
2.1.2. VARIANZA Y DESVIACIN ESTNDAR 116
2.1.2.1 Desviacin tpica o estndar 118
2.1.3 COEFICIENTE DE VARIACIN Y DESVIACIN MEDIA 119
2.1.3.1. Desviacin media 120

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva


2.1.4 PUNTAJE TPICO O ESTANDARIZADO 122

2.1.5 MEDIDAS DE ASIMETRA Y APUNTAMIENTO 124
2.1.5.1 Asimetra 124
2.1.5.2.Apuntamiento o curtosis 125
2.1.5.3 Lgica Matemtica 127
2.1.5.4 Competencias Comunicativas 128
2.1.5.5 Cultura Poltica 130
2.1.5.6 Estadstica Descriptiva 131
2.1.5.7 Herramientas Informticas 132

2.2 MEDIDAS ESTADSTICAS BIVARIANTES 132
2.2.1 REGRESIN Y CORRELACIN 132
2.2.2 DIAGRAMA DE DISPERSIN 133
2.2.3 REGRESIN LINEAL SIMPLE 134
2.2.4.CORRELACIN 138
2.2.5.REGRESIN MLTIPLE 141

2.3 NMEROS INDICE 144
2.3.1 CONSTRUCCIN DE NMEROS NDICE 145
2.3.2. TIPOS DE NMEROS NDICES 146
2.3.3. NDICES SIMPLES 146
2.3.4 NDICES COMPUESTOS 147
2.3.5. USOS DE LOS NMEROS NDICES 151
2.3.5.1. Calculo del salario y del ingreso 152
2.3.5.2 Poder de compra o poder adquisitivo o valor del dinero 152
2.3.5.3. Porcentaje de desvalorizacin 153
2.3.5.4. porcentaje de variacin y de devaluacin 154

ACTIVIDADES DE AUTOEVALUACION UNIDAD 2

LABORATORIO EN EXCEL PRCTICA: (REGRESIN Y CORRELACIN)
155

165

BIBLIOGRAFA DE LA UNIDAD 172

ANEXOA 174













UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva



LISTA DE TABLAS

Pg.

UNIDAD DIDCTICA 1

Conceptos Preliminares Y Medidas De Tendencia Central

Tabla 1.1 Tablas de contingencia 30
Tabla 1.2 Tabla de Contingencia de Frecuencia Relativas 31
Tabla 1.3 Tabla de Contingencia de porcentajes 31
Tabla 2.1 Nmero de egresados de la UNAD en el perodo 1994-
2004
39
Tabla 2.2. Clasificacin de estudiantes por CEAD en la Zona
Occidente durante el primer semestre de 2005
39
Tabla 2.3. Clasificacin de empleados por cargo 40
Tabla 2.4. Clasificacin de la estatura de los estudiantes de un grupo
de quinto grado
40
Tabla 2.5. Distribucin de frecuencias simple de latidos cardiacos de
30 personas
42
Tabla 2.6. Nmero de intervalos de clases sugerido en funcin del
tamao de la muestra
46
Tabla 2.7. Distribucin de frecuencias agrupadas de la velocidad de
pulsaciones
47
Tabla 2.8. Distribucin de frecuencias absolutas, relativas y
acumuladas ascendentes de la velocidad de pulsaciones
47
Tabla 2.9. Distribucin de frecuencias simple de visita al odontlogo
de nios entre los 6 y 12 aos
50
Tabla 2.10. Egresados de la UNAD en el perodo 2000-2004 55
Tabla 2.11. Ventas por departamento al contado y a crdito en marzo
de 2005
57
Tabla 3.1. Distribucin de frecuencias agrupadas 64
Tabla 3.2. Distribucin de frecuencias agrupadas 66
Tabla 3.3. Distribucin de frecuencias de la asistencia a cine 70
Tabla 3.4. Distribucin de frecuencias agrupadas de la asistencia a
cine
70
Tabla 3.5. Comparacin de la media, mediana y moda 72
Tabla 3.6. Distribucin de frecuencias agrupadas 73
Tabla 3.7. Distribucin de frecuencias agrupadas 77
Tabla 3.8. Resumen de clculos, ejemplo 15.4. 78

UNIDAD 2
Medidas De Dispersin Y Estadsticas Bivariantes

Tabla 4.1. Distribucin de frecuencias de las calificaciones de
estudiantes de Estadstica
118
Tabla 4.2. Distribucin de frecuencias de las calificaciones de
estudiantes de Estadstica
118

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

Tabla 4.3. Distribucin de frecuencias de las calificaciones de primer
semestre en Valledupar
127
Tabla 4.4. Clculo de Z para la distribucin de frecuencias de las
calificaciones de Competencias Comunicativas
129
Tabla 4.5. Clculo de Z para la distribucin de frecuencias de las
calificaciones de Estadstica Descriptiva
131
Tabla 5.1. Relacin de ventas de un producto y la emisin del
comercial en televisin
136
Tabla 5.2. Grado de correlacin lineal 140
Tabla 5.3. Gastos indirectos de produccin 143
Tabla 5.4. Precios y cantidades vendidas en una farmacia en 2003 y
2004
150






































UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva


LISTA DE FIGURAS

Pg.

UNIDAD DIDCTICA 1

Conceptos Preliminares Y Medidas De Tendencia Central

Figura 1.1. Diagrama de Barras Medios de Informacin 28
Figura 1.2 Diagrama Circular medios Comunicacin 29
Figura 2.1. Diagrama de tallo y hojas para los datos de pulsaciones
del ejemplo 8.1.
37
Figura 2.2. Diagrama de doble tallo y hojas para los datos de
pulsaciones del ejemplo 8.1.
38
Figura 2.3. Diagrama de frecuencias absolutas de visita al odontlogo
de nios entre los 6 y 12 aos
50
Figura 2.4. Diagrama de frecuencias absolutas acumuladas de visita
al odontlogo de nios entre los 6 y 12 aos
51
Figura 2.5. Histograma de frecuencias absolutas de la velocidad de
pulsaciones
52
Figura 2.6. Polgono de frecuencias absolutas de la velocidad de
pulsaciones
53
Figura 2.7. Ojiva ascendente de la velocidad de pulsaciones 54
Figura 2.8. Ojiva descendente de la velocidad de pulsaciones 54
Figura 2.9. Ojiva ascendente y descendente de la velocidad de
pulsaciones
55
Figura 2.10. Diagrama de lneas. Egresados de la UNAD en el perodo
2000-2004
56
Figura 2.11. Diagrama de barras agrupadas de las ventas por
departamento al contado y a crdito en marzo de 2005
58
Figura 2.12. Diagrama de barras segmentadas de las ventas por
departamento al contado y a crdito en marzo de 2005
58
Figura 2.13. Diagrama circular para el estado civil de 1250 aspirantes a
empleo
59
Figura 2.14. Pictograma para el nmero de rboles talados en
Argentina, Bolivia y Colombia
60


UNIDAD 2
Medidas De Dispersin Y Estadsticas Bivariantes

Figura 3.1. Distribuciones sesgadas. (a) Sesgada a la derecha; (b)
Sesgada a la izquierda; (c) Simtrica
71
Figura 3.2. Ojiva porcentual ascendente 78
Figura 3.3. Diagrama de flujo para el K-simo percentil 79
Figura 4.1. Curva normal o campana de Gauss 122
Figura 4.2. Curva asimtrica positiva. Polgono de frecuencias de
calificaciones de Lgica Matemtica
128

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

Figura 4.3. Curva simtrica platicrtica. Polgono de frecuencias de
calificaciones de Competencias Comunicativas
129
Figura 4.4. Curva asimtrica negativa. Polgono de frecuencias de
calificaciones de Cultura Poltica
130
Figura 4.5. Curva simtrica leptocrtica. Polgono de frecuencias de
calificaciones de Estadstica Descriptiva
132
Figura 5.1. Grficas de dispersin. (a) lineal; (b) curvilnea; (c) sin
relacin
134
Figura 5.2. Diagrama de dispersin de ventas de un producto y la
emisin del comercial en televisin
136
Figura 5.3. Grficas de dispersin lineal. (a) positiva; (b) negativa 138








































UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva


INTRODUCCIN


La Estadstica es una disciplina que se aplica en muchos campos de la
actividad del ser humano. Es muy frecuente encontrarse en las diferentes
disciplinas del saber con incertidumbres como el pronosticar el crecimiento
poblacional de un pas, el crecimiento econmico de una empresa o el crecimiento
de produccin y venta de un producto especfico, el conocer la efectividad de
diferentes abonos en el campo agrario, el determinar la tendencia de
contaminacin del agua o el aire, la clasificacin de personal en una empresa para
efectos de una buena y sana poltica laboral, etc.

Habitualmente, el propsito de la Estadstica Aplicada es el de sacar
conclusiones de una poblacin en estudio, examinando solamente una parte de
ella denominada muestra. Este proceso, llamado Inferencia Estadstica, suele
venir precedido de otro: la Estadstica Descriptiva, en el que los datos son
ordenados, resumidos y clasificados con objeto de tener una visin ms precisa y
conjunta de las observaciones, intentando descubrir de esta manera posibles
relaciones entre los datos, viendo cules toman valores parecidos, cules difieren
grandemente del resto, destacando hechos de posible inters, entre otros.


En todos los campos de la investigacin se requiere a menudo el uso
racional de los Mtodos Estadsticos. Los procesos de planeacin, control y toma
de decisiones econmicas, administrativas y financieras se basan en resultados
obtenidos mediante el anlisis estadstico de los fenmenos en ellos involucrados.
El acelerado desarrollo de mtodos, tcnicas y tecnologas para el ptimo anlisis
de datos justifica que un profesional disponga de una slida fundamentacin
conceptual para que realice apropiadamente su evaluacin y aporte
sustentaciones a su decisin. Las interpretaciones que generan los datos pudieran
ser errneas para aquellas personas que no cuentan con criterios vlidos para
captar la informacin. Es por ello que con este mdulo se pretende que el
estudiante se adentre a los conocimientos bsicos de la Estadstica Descriptiva.


Enfrentarse con datos de muy diversa ndole es cosa de todos los das en
cualquier prctica del ser humano. Sin embargo, dado la cantidad innumerable de
estos, no siempre se comprende el real alcance de lo que dicen. Como parte de
una base cultural necesaria para desempearse en el mundo de hoy, es requisito
desarrollar una capacidad personal para extraer y describir informacin presente
en un conjunto de datos. Y es precisamente all donde resalta la importancia de la
Estadstica Descriptiva como primer paso en la determinacin de decisiones e
inferencias que pueden concluirse de la variada informacin que nos llega en
forma de datos numricos.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva



Con el presente mdulo, se busca que el estudiante se encuentre en
capacidad de interpretar, discriminar y relacionar los fundamentos bsicos de la
Estadstica Descriptiva, a travs del anlisis de datos tomados de un fenmeno
propio de su disciplina y que describa, examine y sintetice adecuadamente la
informacin mediante mtodos estadsticos sencillos.


El curso acadmico de Estadstica Descriptiva hace parte de la formacin
bsica disciplinar de los programas que oferta la Universidad Nacional Abierta y a
Distancia UNAD. Consta de dos (2) crditos acadmicos, el sistema adoptado
por la UNAD como estndar curricular en la formacin universitaria, y es de tipo
terico, en tanto que busca la identificacin y el reconocimiento de las
problemticas, perspectivas tericas, conceptos, categoras, mtodos y tcnicas
indispensables para la formacin profesional.


Este texto contiene dos unidades didcticas
1
, correlacionadas directamente
con el nmero de crditos acadmicos asignados al curso acadmico. La primera
de ellas, considera los Conceptos Bsicos necesarios para el cumplimiento de los
propsitos y objetivos del curso. En esta unidad se identifican algunos conceptos
estadsticos como poblacin, muestra, variable, dato, etc.; y se reconocen cada
uno de los pasos a seguir para una correcta y acertada investigacin estadstica
como son la planeacin, la recoleccin de la informacin, su organizacin y su
presentacin grfica. En la segunda unidad didctica se reconocen algunas de las
medidas estadsticas ms comunes, tanto univariantes como bivariantes. Entre las
primeras se contemplan las medidas de tendencia central, las medidas de
dispersin y las de asimetra y apuntamiento y, como medidas estadsticas
bivariantes, se trabaja la regresin lineal (simple, ponderada y mltiple), la
correlacin y los nmeros ndice. Como Anexo y complemento a esta segunda
unidad, se incluyen algunos elementos bsicos de la matemtica: la sumatoria y
productoria. Al final de cada tema, encontrar ejercicios de aplicacin que buscan
evaluar el grado de conocimiento adquirido, esta evaluacin ser retroalimentada
en la informacin de retorno que encontrar al final de cada unidad didctica.

Este texto busca aportar las herramientas tericas y prcticas a los
estudiantes para que logren, mediante anlisis cuantitativos, la interpretacin de
diferentes fenmenos propios de su disciplina de formacin y del entorno social,
econmico y poltico. Apunta al manejo estadstico de datos, dar las pautas en la
recoleccin planeada de los mismos y proporcionar un conjunto de tcnicas a

1
Conjunto de conocimientos seleccionados, organizados y desarrollados a partir de palabras clave
tomados como conceptos que los tipifican, en articulacin con las intencionalidades formativas,
destinadas a potenciar y hacer efectivo el aprendizaje mediante el desarrollo de operaciones,
modificaciones y actualizaciones cognitivas y nuevas actuaciones o competencias por parte del
estudiante. EL MATERIAL DIDCTICO. Roberto J. Salazar Ramos. UNAD, Bogot D.C. 2004.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

partir de las cuales se logra presentar, resumir e interpretar datos que pueden
corresponder a una muestra o a un grupo total.


El mdulo no pretende reemplazar las diferentes referencias bibliogrficas
clsicas de la Estadstica, busca entregar los conceptos de un modo ms
didctico, enfocado en el autoaprendizaje y en relacin directa con la Gua de
Actividades referenciada en el protocolo del presente curso. Al final de cada
unidad, el estudiante encontrar las referencias bibliogrficas bsicas, pero no
nicas, para que con ellas refuerce en conceptos y definiciones. Adems,
encontrar una serie de pginas web recomendadas que amplan los temas
tratados. Se trata pues de un material didctico de apoyo para el curso de
Estadstica Descriptiva de la UNAD, como parte de las diferentes y diversas
herramientas didcticas en las que se apoya el aprendizaje autnomo.

































UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva






Unidad Didctica Uno



CONCEPTOS PRELIMINARES Y MEDIDAS
DE TENDENCIA CENTRAL











UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

UNIDAD 1.
CONCEPTOS PRELIMINARES Y
MEDIDAS DE TENDENCIA CENTRAL


























Leccin 1 Que es la estadstica?
Leccin 2 Conceptos Bsicos
Leccin 3 Variables estadsticas
Leccin 4 Caracterizacin de una
variable cualitativa
Leccin 5 Tablas de contingencia
Leccin 6 Planeacin
Leccin 7 Recoleccin.
Leccin 8 Organizacin de la
informacin.
Leccin 9 Tablas de distribucin de
frecuencias.
Leccin 10 Presentacin de la
informacin.
Leccin 11 Estadgrafos.
Leccin 12 Media Aritmtica
Leccin 13 Mediana.
Leccin 14 Moda
Leccin 15 Otras medidas de
tendencia central.
CAPITULO 1.
GENERALIDADES Y VARIABLES
ESTADSTICAS
CAPITULO 2.
INVESTIGACIN ESTADSTICA
CAPITULO 3.
MEDIDAS DE TENDENCIA CENTRAL O
DE POSICIN

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva



INTRODUCCIN A LA UNIDAD



La investigacin estadstica es necesaria para cualquier individuo en el
mundo de hoy, cualquiera que sean sus actividades siempre hay aplicaciones
estadsticas en ellas. Pero cualquier investigacin estadstica requiere seguir unos
pasos y procedimientos establecidos para que esta tenga validez. En esta unidad
se desarrollarn en forma introductoria y general algunos conceptos preliminares
con el fin de utilizar un mismo lenguaje en cuanto se refiere a esta disciplina. De
igual manera, se presentan los elementos iniciales bsicos y necesarios para la
comprensin y aplicacin de la estadstica en cualquier campo.


En el captulo uno se ampliarn algunas definiciones de trminos bsicos de la
estadstica como poblacin, muestra, variable, dato, etc., buscando que el
estudiante los identifique en ejemplos sencillos de la vida diaria. En el captulo dos
se reconocern cada uno de los pasos a seguir para una correcta y acertada
investigacin estadstica como son la planeacin, la recoleccin de la informacin,
su organizacin y su presentacin grfica y en el capitulo III se mencionaran las
medidas de tendencia central y de posicin para lo cual se hace indispensable
recordar algunas nociones aritmticas y algebraicas bsicas en estadstica, es por
esto que se recomienda al lector iniciar el captulo repasando la sumatoria como
propiedad aritmtica fundamental para entender las medidas estadsticas de una
poblacin o muestra. Todo cuanto tiene que ver con sumatoria y productoria
puede ser repasado y consultado en el anexo A, que se encuentra al final del
texto.



















UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

OBJETIVOS ESPECFICOS



- Conocer el significado de la palabra estadstica.

- Diferenciar entre los conceptos de Estadstica Descriptiva y Estadstica
Inferencial.

- Establecer los conceptos de poblacin, muestra, variable, dato y parmetro.

- Identificar las etapas que sugiere una investigacin estadstica.

- Manejar los diferentes mtodos de recoleccin de informacin para la
investigacin estadstica.

- Advertir la importancia de las distribuciones de frecuencias para la
descripcin de datos.

- Aplicar los conceptos de frecuencia, marca de clase y distribucin de
frecuencias a un conjunto de datos estadsticos.

- Construir diferentes tipos de distribuciones de frecuencias para conjuntos
de datos.

- Reconocer algunas caractersticas que debe tener una grfica para que
represente mejor una situacin.

- Representar grficamente distribuciones de frecuencias dadas o
calculadas.
















UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

1. UNIDAD
CONCEPTOS PRELIMINARES Y MEDIDAS DE TENDENCIA
CENTRAL



1.1. CAPITULO 1. GENERALIDADES Y VARIABLES ESTADSTICAS

En un principio se consideraba que la funcin de la estadstica era la descripcin
de las caractersticas de grupo, actividad que la hacia confundir con el papel que
cumple la historia de observar y describir el hecho. En su origen las estadsticas
era histricas ; hoy en da, la estadstica, adems de ser descriptiva, es analtica,
considerndose esta ultima como la funcin mas importante que realiza, ya que
permite obtener conclusiones para un grupo mayor, denominado poblacin,
partiendo de una investigacin realizada en un grupo menor, denominado muestra
cuyos elementos se seleccionan aleatoriamente o al azar.


1.1.1. LECCION 1. Qu es la Estadstica?

Antes de dar a conocer los conceptos de los trminos estadsticos que
lleven a entablar el lenguaje comn que se utilizar en adelante, es necesario
saber qu es la Estadstica y en qu consiste la Estadstica Descriptiva.


Empricamente se sabe que la Estadstica tiene que ver con datos y la
manera en que estos son agrupados. Esto se reconoce en muchos casos de la
vida cotidiana que involucran informacin numrica y el contexto en que esta
informacin es dada a conocer. Aunque tambin puede darse en muchos casos
que, si bien estn relacionados con la estadstica, obedecen a otros fenmenos de
disciplinas relacionadas con pero que no conforman la Estadstica
propiamente dicha.


La Estadstica es un mtodo cientfico de operar con un grupo de datos y
de interpretarlos.


Si bien esta definicin parece un poco ambigua, se ver ms adelante el
marco en que ste mtodo se desarrolla y las leyes que lo rigen. Pero, por ahora,
se deja abierta al cuestionamiento del estudiante la gama de posibilidades que
abarca esta definicin.


La Estadstica, o el mtodo de la estadstica, se divide en dos ramas: la
Estadstica Descriptiva o deductiva y la Inferencia Estadstica o estadstica

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

inductiva. Este curso se dedica a la Estadstica Descriptiva, por lo que se hace
necesario dar a conocer, en trminos generales, en qu consiste la Inferencia
Estadstica.


La Inferencia Estadstica comprende en un todo articulado el mtodo y las
tcnicas necesarias para explicar el comportamiento de un grupo de datos en un
nivel superior de lo que estos datos pueden dar a conocer por s mismos. Es decir,
se puede concluir sobre el grupo de datos sobrepasando los lmites del
conocimiento inicial que estos suministran, examinando solamente una parte de la
poblacin denominada muestra. Es por ello que a la Inferencia Estadstica tambin
se le conoce como Estadstica Analtica.


Si esto es as, qu le corresponde entonces a la Estadstica Descriptiva?
Esta tiene por fin elevar los aspectos caractersticos del grupo de datos pero sin
intentar obtener ms conocimiento del que pueda adquirirse por s mismos. Es por
ello que la Estadstica Descriptiva es el punto de partida del anlisis de un grupo
de datos que involucran una cierta complejidad, o bien puede ser el todo de un
anlisis bsico y limitado del grupo de datos.


1.1.2. LECCIN 2. CONCEPTOS BSICOS

Poblacin es el conjunto de medidas, individuos u objetos que comparten
una caracterstica en comn. La poblacin se basa en cuatro caractersticas:
contenido, tipo de unidades y elementos, ubicacin espacial y ubicacin temporal.
De la poblacin es extrada la muestra..


Muestra es un conjunto de elementos extrados de la poblacin. Los
resultados obtenidos en la muestra sirven para estimar los resultados que se
obtendran con el estudio completo de la poblacin. Para que los resultados de la
muestra puedan generalizarse a la poblacin, es necesario que la muestra sea
seleccionada adecuadamente, es decir, de modo que cualquiera de los elementos
de la poblacin tengan la misma posibilidad de ser seleccionados. A este tipo de
muestra se le denomina muestra aleatoria.

La unidad estadstica es el elemento de la poblacin que reporta la
informacin y sobre el cul se realiza un determinado anlisis.


Los datos son todas aquellas caractersticas o valores susceptibles de ser
observados, clasificados y contados. Estos pueden ser experimentales, cuando
se le aplica un tratamiento especial a las unidades muestreadas; de encuesta,
cuando son tomadas sin ningn tratamiento; clasificados, cuando estn

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

agrupados segn una caracterstica determinada; originales, informacin que no
ha recibido ningn tratamiento estadstico; primarios, cuando son recogidos,
anotados u observados por primera vez; o secundarios, cuando son recopilados
por otra persona o entidad diferente al investigador.


Variable es una caracterstica susceptible de tener distintos valores en los
elementos de un grupo o conjunto. Si la variable tiene la capacidad de tomar
cualquier valor que exista entre dos magnitudes dadas, entonces esta variable
ser continua. Si por el contrario, slo puede tener un valor de entre cierta
cantidad de valores dados, entonces ser discreta.


Parmetro son aquellos valores que caracterizan numricamente a la
poblacin como tal. El parmetro poblacional de inters es nico (media, varianza,
etc.), pero una poblacin puede tener muchas caractersticas o parmetros de
inters. Por el contrario, un estadstico es una magnitud correspondiente a una
muestra aleatoria extrada de la poblacin, por lo que cambiando la muestra
cambiar entonces el estadstico (media muestral, varianza muestral, etc.). En
pocas palabras se puede decir que parmetro es a poblacin como estadstico es
a muestra. Es comn designar los parmetros con letras minsculas del alfabeto
griego y los estadsticos con letras de nuestro alfabeto. En la Unidad Didctica
Dos, se ampliar ms estos dos conceptos.



La Universidad Nacional Abierta y a Distancia UNAD desea establecer cuntos
estudiantes hacen uso de la biblioteca en el CEAD de San Juan de Pasto. El
coordinador zonal de biblioteca es designado para este trabajo y decide hacer la
investigacin el da 14 de mayo de 2005.


- En esta investigacin se considera que el total de estudiantes del CEAD
que hacen uso de la biblioteca es la poblacin en estudio.
- Cada uno de los estudiantes seleccionados para la observacin representa
la unidad estadstica de estudio de la poblacin.
- El da 14 de mayo de 2005 indica la ubicacin temporal.
- El CEAD de San Juan de Pasto, identifica la ubicacin espacial.
- Como el coordinador zonal de biblioteca no puede revisar todo el da
quienes acceden a la biblioteca, decide entonces establecer perodos de
tiempo para realizar el conteo. En otras palabras, selecciona una muestra.
- Identificada la poblacin y la muestra, se ubica la unidad estadstica, en
este caso el objeto de medicin es cada uno de los estudiantes
seleccionados de la muestra.
E EJ JE EM MP PL LO O 2 2. .1 1. .

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

- Y la variable ser el nmero de estudiantes seleccionados de la muestra,
como se puede ver, una variable discreta.
- Despus de esto el coordinador selecciona los datos necesarios para el
estudio, en este caso especfico slo requerir del nmero de estudiantes
que acceden a la biblioteca. Sin embargo, el coordinador zonal puede
adems, tomar otro tipo de datos como sexo, edad, razn por la cual visita
la biblioteca, libros ms consultados, etc.


1.1.2.1 Aleatoriedad Y Representatividad de la muestra

La muestra asociada a un estudio debe ser representativa y aleatoria.
Representativa, pues debe estar formada por un nmero razonable de elementos
y aleatoria porque debe ser escogida al azar, de tal manera que quien realiza el
estudio no pueda influir en la eleccin de los individuos por encuestar.


Cada elemento de la poblacin debe tener la misma oportunidad de ser
seleccionado.

El muestre aleatorio puede ser:



1.1.2.2 Muestra aleatoria simple

Si cada posible muestra de la poblacin, del mismo tamao, tiene igual
probabilidad de ser seleccionada.


1.1.2.3 Muestra Aleatoria sistemtica

Cuando los elementos son seleccionados de una manera ordenada. En este caso,
la poblacin se encuentra organizada por algn cdigo ya sea por fecha, hora,
orden de llegada o algn otro aspecto.



UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

La manera en que se realiza la seleccin depende del nmero de elementos en la
poblacin y el tamao de la muestra.


1.1.2.4 Muestra Aleatoria Estratificada

Cuando la seleccin tiene en cuenta los diferentes grupos o estratos que
conforman la poblacin.


Los elementos de la muestra se seleccionan de cada grupo en forma aleatoria o
por un mtodo sistemtico. Los estudios de la poblacin, basados en muestras
estratificadas usualmente, tienen mayor precisin (o menor error muestral) que
cuando se seleccionan por muestreo aleatorio simple.


1.1.2.5 Muestra Aleatoria de conglomerados

Si para su seleccin se tiene en cuenta el siguiente procedimiento:

En primer lugar, se divide la poblacin en grupos que sea conveniente para el
muestreo. Luego, se selecciona una parte de los grupos al azar o por un mtodo
sistemtico; por ltimo, se toman todos los elementos, o parte de ellos al azar o
por un mtodo sistemtico, de los grupos seleccionados para conformar la
muestra.


Una muestra de conglomerados usualmente, produce un mayor error muestral que
una muestra aleatoria simple del mismo tamao. Si la poblacin no tiene ninguna
organizacin interna, entonces se dice que la muestra puede tomarse de forma
aleatoria simple y todos los individuos de la poblacin tienen la misma probabilidad
de ser seleccionados en la muestra.


El comit cientfico de una reconocida multinacional de medicamentos desea
promover un producto que ha sido efectivo en el tratamiento de la malaria en
varios pases.

Para esto dicho comit decide realizar una campaa en seis hospitales que estn
ubicados en tres de las zonas colombianas donde se ha detectado la enfermedad.


1.1.2.6. Determinar: poblacin, muestra y tipo de muestreo a utilizar

- La poblacin est formada por todas las personas que habitan en Colombia
E EJ JE EM MP PL LO O 2 2. .2 2. .

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

y que han contrado la malaria. La muestra estar formada por los
pacientes seleccionados en los seis hospitales y que adems tienen la
enfermedad.
- Las zonas de mayor registro de contagio en Colombia son la costa pacifica,
la costa atlntica y la Amazona. Dado que la poblacin est dividida en tres
grandes zonas, es posible seleccionar dos hospitales por zona y luego en
forma aleatoria, se puede seleccionar la muestra. Por ello, la muestra ser
tomada de forma estratificada.



Para mejorar el servicio a los usuarios, el director de un hospital realizar un
estudio relacionado con el tipo de sangre que ellos tienen Dada la gran cantidad
de pacientes a los cuales se les presta el servicio, decide encuestar a 400 de los
usuarios que normalmente acuden al hospital en un mes.


Determinar: poblacin, muestra y tipo de muestreo a utilizar

- La poblacin incluye a todos los usuarios que normalmente acuden al hospital
en un periodo de un mes. La muestra estar formada por los 400 usuarios
encuestados.


- En este caso, la caracterstica fundamental del estudio (el tipo de sangre) hace
que no haya una distincin especial en la poblacin, lo cual indica que no se
requiere de una estratificacin. Por ello, la muestra ser tomada de forma
aleatoria simple.


1.1.3. LECCIN 3. VARIABLES ESTADSTICAS

Una variable es una caracterstica que va a sr estudiada en una poblacin.


Una variable es estadstica, si se puede escribir como una pregunta cuyas
respuestas pueden ser tabuladas o clasificadas en determinados rangos, o si
pertenecen a una pregunta cuya respuesta tiene un valor correspondiente a una
escala numrica.

Las variables estadsticas se clasifican en cualitativas y cuantitativas




E EJ JE EM MP PL LO O 2 2. .3 3. .

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

1.1.3.1 VARIABLES CUALITATIVAS

Una variable es cualitativa si en la caracterstica que se va a estudiar se busca
conocer gustos, preferencias u opiniones, etc.; por ejemplo: tipo de sangre,
gaseosa preferida, color de cabello.
Una variable cualitativa es estadstica cuando es posible clasificar los datos
obtenidos de la muestra en clases bien definidas, en las cuales el individuo que
suministra la informacin pueda elegir una de ellas.


Cuando una variable es cualitativa es necesario determinar las posibles
respuestas.


1.1.3.2 VARIABLES CUANTITATIVAS

Una variable es cuantitativa si la caracterstica que se va a estudiar se pude medir
en una escala numrica.


- Si la variable tiene la capacidad de tomar cualquier valor que exista entre
dos magnitudes dadas, entonces esta variable ser continua.


- Si por el contrario, slo puede tener una valor de entre cierta cantidad de
valores dados, entonces ser discreta.


1.1.3.3 ESCALA DE MEDIDA DE VARIABLES

Una escala es la relacin numrica entre la longitud real y la longitud que se
asigna en el plano en el cual se va a representar su grfica.


Las variables cuantitativas pueden ser consideradas en diferentes escalas
teniendo en cuenta las unidades asociadas a la poblacin que se encuentra en
estudio.


Los datos asociados a un estudio deben estar en las mismas unidades, de tal
manera que sea posible asignarles una escala a todos.
La notacin de una escala es de la forma 1 : n, lo cual indica que n unidades de
medida estn representadas en el grfico e una sola.



UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva



Los profesores de Educacin Fsica de un colegio medirn la estatura de los nios
de secundaria en cada uno de los grados.


En este caso, la variable estatura es cuantitativa y continua ya que los datos que
resultan son nmeros reales; es posible considerar las mediciones en centmetros
o en metros. El profesor de educacin fsica puede usar un escala de 1 : 10 en la
cual cada 10 centimetros de ltura estn representados en 1 cm del grfico.


Suponiendo que los estudiantes de primaria tienen alturas entre 100 cm y 140 cm
la representacin grfica de la escala 1:10 es la siguiente:



_


En cada una de las siguientes situaciones, identificar la variable de estudio.
Determinar si es cualitativa o cuantitativa.


1. En un barrio de la ciudad se aplic una encuesta para conocer el consumo, en
centmetros cbicos, del servicio de gas natural.
2. El alcalde de la ciudad quiere revisar la situacin de violencia intrafamiliar en las
familias de estrato 3, 4, 5.
3. El nmero de hermanos de cada jugador del equipo de futboll.
4. En un caf gourmet, se decidi preguntar por el tipo de variedad que ms
consumen sus clientes.


Solucin

1. La variable es consumo de gas. Es cuantitativa y continua
2. La variable es situacin de violencia. Es cualitativa
3. La variable es nmero de hermanos. Es cuantitativa y discreta
4. La variable es variedad de caf. Es cualitativa.


E EJ JE EM MP PL LO O 3 3. .2 2. .
E EJ JE EM MP PL LO O 3 3. .1 1. .

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

1.1.4. LECCIN 4. CARACTERIZACIN DE UNA VARIABLE CUALITATIVA

Caracterizar una variable significa describir su comportamiento en la poblacin,
segn algunos parmetros establecidos. De acuerdo con el tipo de variable
estadstica que se desee estudiar existen distintas tcnicas para caracterizarla.


Una agencia de noticias quiere saber cul es el medio de comunicacin por el cul
se informan las personas, sobe las noticias del pas. Para ello, realiz un estudio a
cuarenta personas a quienes se les pregunt por su medio de informacin de
noticias preferido. Se obtuvo la siguiente lista de datos.



El tipo de variable que se registra en este estudio es cualitativa, puesto que
pregunta por el medio de informacin.


El estudio de una variable cualitativa requiere de la incorporacin de algunos
criterios, de tal manera que al obtener una lista de preferencias, cualidades o
gustos, se pueda analizar su comportamiento en la poblacin. Para caracterizar
una variable cualitativa se utilizan tres herramientas:

- Tablas de frecuencias
- Representaciones grficas
- La moda


1.1.4.1 TABLAS DE FRECUENCIAS:

Una distribucin o tablas de frecuencias es un resumen de los datos en el cual,
cada opcin de respuesta de la variable se relaciona con el nmero de datos
correspondiente.


Una tabla de frecuencias contiene:

E EJ JE EM MP PL LO O 4 4. .1 1. .

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

Clases: que corresponde a opiniones, gustos, preferencias, cualidades o
caractersticas.

Frecuencia: es el nmero de datos que pertenece a cada clase. La frecuencia se
simboliza con f . El conteo de la frecuencia de cada clase se puede registrar
mediante marcas en grupos.

Frecuencia Relativa: es el cociente entre la frecuencia y el nmero total de datos,
se simboliza fr . La frecuencia relativa representa un porcentaje, que se haya
multiplicando por 100 al cociente indicado de la frecuencia relativa.


La siguiente tabla de frecuencias corresponde a los datos de la variable medio de
comunicacin del ejemplo 4.1


Es necesario interpretar la informacin contenida en las tablas de frecuencia, para
deducir cuales son las principales caractersticas de la variable en estudio.


Por ejemplo, en la tabla anterior se puede apreciar que:

- La mayora de personas el 37.5% se informan de las noticias por medio de
la televisin y la menor cantidad un 10,8% se informa haciendo uso de la
internet.
- Hay un 52,5% de personas que se informan de las noticias haciendo uso de
la radio o de la prensa.


1.1.4.2 REPRESENTACIONES GRAFICAS:

Un grfico estadstico es un resumen visual de la tabla de frecuencias. Hay varios
tipos de representaciones grficas para las variables cualitativas: los diagramas de
barras, los diagramas circulares, entre otros.


1.1.4.2.1 Diagramas de barras: un diagrama de barras es una representacin
grfica de los datos asociados a una variable cualitativa.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

La grfica se realiza en sistema de coordenadas cartesianas, en el eje horizontal
se representan las clases correspondientes a la variable y en eje vertical se
representan las frecuencias correspondientes a cada clase.


El diagrama de barras (figura 1.1) correspondiente a la variable medios de
comunicacin de nuestro ejemplo es el siguiente:

FIGURA 1.1

1.1.4.2.2 Diagrama Circular: un diagrama circular es la representacin grfica de
los datos en un crculo. El diagrama circular presenta los porcentajes
correspondientes a cada clase.


En un diagrama circular, la informacin correspondiente a cada clase se
representa usando sectores circulares, por lo cual es necesario hallar el ngulo
correspondiente a cada frecuencia, (ver figura 1.2)















UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

FIGURA 1.2

1.1.4.3 MODA

La moda es el dato que tiene mayor frecuencia, es decir, el dato que mas se
repite.

Para el ejemplo 4.1, la moda corresponde a informarse de las noticias por medio
de la televisin; es decir, si se encuesta a una persona al azar la probabilidad que
se informe por las noticas es alta, ya que corresponde al 37.5% del total.


Hay estudios en los cuales no existe la moda, ya que todas las clases tiene una
misma frecuencia, y hay casos en los cuales existen varias modas, pues varias
clases pueden tener la misma frecuencia.


1.1.5. LECCIN 5. TABLAS DE CONTINGENCIA:

En una tabla de contingencia o tabla cruzada las filas corresponden a las clases
de una variable cualitativa y las columnas corresponden a las clases de la otra
variable cualitativa.


La tabla de contingencia, tambin es una tabla de frecuencias, ya que la
informacin contenida en cada una de las casillas corresponde a la cantidad de
personas o individuos que poseen ambas caractersticas.


En general, la tabla de contingencia ofrece una completa distribucin de la
informacin, ya que tiene en cuenta las diferentes clases que se pueden
establecer para cada una de las variables en estudio.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva



Con el fin de determinar que materias opcionales, en deportes, se podran
proponer a los estudiantes de una universidad, se hizo necesario hacer un estudio
acerca de la actividad fsica que ellos realizan en su tiempo libre, para ello, hizo
una encuesta entre 156 estudiantes de varias carreras y se les pregunt acerca de
su deporte preferido para practicar en tiempo libre. Los resultados se muestran en
la siguiente tabla de contingencia. (ver tabla 1.1)

TABLA 1.1
TABLAS DE CONTINGENCIA

En la tabla de contingencia se observa:

Hay dos variables cualitativas que son gnero y deporte favorito


- Para la variable gnero hay dos clases hombre y mujer
- En la variable deporte preferido hay 5 clases: futbol, baloncesto, voleibol,
atletismo y otros.
- correspondiente, al cruce de las clases de las dos variables en estudio. Por
ejemplo el nmero 38 corresponde al nmero de mujeres que prefieren el
baloncesto.
- Las sumas de filas corresponde a la cantidad de hombres y a la cantidad de
mujeres que participaron en la encuesta, sin discriminar el deporte
preferido. Se puede decir que participaron 72 hombres y 82 mujeres en el
estudio.
- Las sumas de columnas corresponde a la cantidad de personas que
prefieren cada uno de los deportes sin distinguir el gnero. Por ejemplo: hay
38 personas que prefieren futbol, 52 personas prefieren baloncesto, 29
personas prefieren el voleibol, 19 el atletismo y 18 personas prefieren otros
deportes.
- El nmero total de personas que participaron en el estudio debe ser igual
tanto en la suma correspondiente a la variable gnero (vertical), como en la
suma correspondiente a la variable deporte preferido (horizontal). En ambos
casos, la suma es 156 personas.
- A partir de la informacin de la tabla anterior se puede construir la tabla de
E EJ JE EM MP PL LO O 5 5. .1 1. .

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

contingencia de frecuencias relativas , en este caso se debe escribir un
cociente entre la informacin contenida en cada celda y el nmero total de
personas que participaron en la encuesta.


TABLA 1.2
TABLA DE CONTINGENCIA DE FRECUENCIA RELATIVAS


Ya que cada uno de los cocientes mostrados tiene su equivalencia en porcentaje,
se puede construir la tabla de contingencias de porcentajes como se muestra en la
tabla 1.3


TABLA 1.3
TABLA DE CONTINGENCIA DE PORCENTAJES
Un buen anlisis incluye la descripcin de los porcentajes ms altos, los mas bajos
y aquellos que tiene mayor representacin.


- El 24.36% de la personas que fueron encuestadas fueron mujeres que
prefieren practicar el baloncesto
- El 3,85% de los hombres se inclinan por el atletismo y el 1,92% de las
mujeres prefieren el futbol, el cual es el porcentaje mas bajo de la muestra
- El deporte que mas practican independientemente del gnero, es el
baloncesto con un 33.33%.






UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

1.2. CAPITULO 2 .INVESTIGACIN ESTADSTICA

La investigacin estadstica, por sencilla que sea, es una operacin compleja, que
requiere atender mltiples aspectos, y que genera muy variadas funciones.


El resultado depende en gran parte de la finalidad que se persiga, de la naturaleza
de los fenmenos que se desean estudiar y de la facilidad que se tenga para
observar los elementos.


1.2.1. LECCION 6. PLANEACIN

La planeacin de una investigacin estadstica debe abarcar el conjunto de
lineamientos, procedimientos y acciones que conlleven a la resolucin satisfactoria
para la cual se estableci la investigacin. Es por ello que el plan de investigacin
debe fijar concretamente su objeto, el fin que persigue, la fuente o fuentes de
informacin, los procedimientos a seguir y resolver los aspectos logsticos, fsicos
y humanos siguiendo un presupuesto de costos establecido.


La investigacin estadstica puede ser tan sencilla y poco compleja como la
recopilacin ordenada y coherente de datos que se encuentren en instituciones
estatales o privadas que las suministren, o bien pueden ser tan elaboradas y
complejas como lo son los censos poblacionales, los censos agrcolas o
industriales que tengan importancia estratgica para una regin, o inclusive para
un pas. Pero, sea como fuere, la investigacin debe seguir una orientacin en su
planteamiento y resolucin.


A continuacin se presentan algunos aspectos bsicos que se deben seguir
para desarrollar un trabajo as.


1.2.1.1. Definicin del objeto de investigacin

Debe responder el qu, el cmo y establecer el momento correcto para
hacerse, debe tambin restringir el espacio fsico o geogrfico donde se llevar a
cabo. Es este punto el ncleo de la investigacin, es por ello que no puede haber
ambigedad en sus planteamientos y alcances.







UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

1.2.1.2. Unidad de investigacin

Se trata del elemento de la poblacin que origina la informacin. La unidad
o elemento de investigacin debe ser clara, adecuada, mesurable y comparable.


Debe determinarse la naturaleza cuantitativa o cualitativa de esta unidad, es
decir, definir qu aspectos de la unidad de investigacin son cuantitativos
(registrados por medio de nmeros) o cualitativos (recogidos mediante
anotaciones literarias). Tambin ha de considerarse la posibilidad o viabilidad de la
investigacin y si estos aspectos pueden ser conocidos con precisin. De igual
manera, es necesario delimitar esta unidad en el tiempo y en el espacio, y a veces
en el nmero.


1.2.1.3 Clase de investigacin

En la planeacin, debe tambin tenerse en cuenta el tipo de investigacin
que se va a realizar. sta puede ser descriptiva, que consiste en obtener
informacin con respecto a grupos; experimental o controlada, provocada por el
investigador en condiciones controladas, en la que se busca conocer por qu
causa se produce un caso particular; o bien, explicada o analtica, que permite
establecer comparaciones y verificar hiptesis.


1.2.1.4 Las fuentes de informacin

Despus de determinar el qu y el por qu de la investigacin estadstica,
se debe preguntar el dnde conseguir la informacin requerida. Se trata entonces
de definir las fuentes de informacin. Estas pueden ser directas o indirectas.


Una fuente de informacin estadstica directa es aquella en donde el hecho
se produce. Este tipo de fuentes son las mejores, pero no siempre son posibles.
Cuando no sea posible, se emplea una fuente de informacin estadstica
indirecta, aquella donde el hecho se refleja. En muchos casos este tipo de
fuentes son complementarias de las primeras.


Cuando los datos son primarios, ellos pueden provenir de muchas fuentes
como: hechos, informacin cotidiana y fcil de identificar; opiniones, referidos a
lo que la gente piensa respecto a algo; motivos, razones que explican por qu se
acta de una manera u otra. Cuando son secundarios ellos provienen de una
fuente interna, cuando los datos son recopilados por la misma entidad en los
registros bsicos de la misma organizacin, o bien pueden provenir de una fuente

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

externa, cuando los datos se recopilan por otra entidad diferente a la que hace la
investigacin.


1.2.2. LECCION 7 RECOLECCIN

Despus de planeada la investigacin, comienza la recoleccin de los
datos. Esta consiste en un conjunto de operaciones de toma de datos que puede
ser por observacin, por encuesta o tomada de publicaciones y/o fuentes
confiables que han efectuado investigaciones estadsticas. Para esto se
selecciona el mtodo de recoleccin de la informacin acorde a las necesidades
de la investigacin, que se clasifican segn su cobertura y segn su forma de
observacin.


1.2.2.3 Segn la cobertura

Se trata de decidir si se va a estudiar a la poblacin en su totalidad o slo
una parte de ella. Si lo que se desea es atender a una cobertura total, es decir
contar con todos los elementos de las fuentes de informacin, se usa el censo. Si,
en cambio, se hace una enumeracin parcial de las fuentes de informacin, se usa
el muestreo.


Por su menor costo, mayor rapidez y menor nmero de personas que
intervienen en la investigacin, el muestreo es el mtodo ms utilizado. El
muestreo puede ser de dos tipos: muestreo probabilstico o al azar, cuando
cada uno de los elementos tiene la misma probabilidad de ser escogido
obteniendo as una muestra aleatoria; y muestreo no probabilstico, cuando el
investigador selecciona los datos a su propio criterio, de manera caprichosa, por
conveniencia o por cuotas, de manera que las muestras no son seleccionadas
aleatoriamente y los resultados no ofrecen confiabilidad alguna.


1.2.2.4 Segn la forma de observacin

En este mtodo se tiene en cuenta la forma de medicin del dato. Si se
hace de manera que la fuente de informacin se da cuenta de la medicin que
efecta, se dice que se toman los datos por encuesta. stas se pueden realizar
por correo, entrega personal de cuestionario, entrevista, motivacin, telfono, etc.


El otro mtodo de recoleccin de informacin es por observacin, en
donde la medicin se realiza sin que la fuente de informacin se d cuenta del
hecho. Este mtodo se basa en el registro de los eventos que ocurren, por
ejemplo cuando se examina el nmero de estudiantes que entran a la biblioteca

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

con el fin de hacer una consulta referida a las Ciencias Sociales, simplemente se
observa la accin del estudiante al entrar a la biblioteca: si hace o no la consulta
que se investiga. Este mtodo puede ser tambin indirecto cuando la recoleccin
consiste en corroborar los datos que otros han observado.


1.2.3. LECCION 8 ORGANIZACIN DE LA INFORMACIN

Luego de tomar la informacin necesaria en la investigacin que se sigue,
se obtiene una gran cantidad de datos que requieren ser interpretados y sobre los
cuales se busca concluir algo especfico. Para esto se debe depurar y clasificar la
informacin aplicando tcnicas adecuadas.


La organizacin y el resumen de la informacin son dos procesos distintos
que se desarrollan por separado. La organizacin hace referencia al arreglo de los
datos en un formato lgico para su interpretacin. En cambio, el resumen implica
la condensacin de varias mediciones en una forma compacta, ya sea grfica o
numricamente. De ah que se tome primero la forma de organizar la informacin
tomada en una investigacin estadstica.


La informacin estadstica puede organizarse de diversas maneras:
ordenando el conjunto de datos como una combinacin ordenada o en un arreglo
denominado tallo y hojas, otro de los mtodos usados es el uso de tablas y ms
especficamente la tabla de frecuencias. A continuacin se hace un acercamiento
a las diferentes formas de organizar los datos estadsticos tomados en el proceso
de recoleccin de una investigacin estadstica.


1.2.4.1 Combinacin o arreglo ordenado

El slo hecho de tener ordenado un conjunto de datos en forma ascendente
o descendente, permite un rpido anlisis e interpretacin de estos.


Los siguientes datos representan la evaluacin de los latidos cardacos de un
grupo de 30 personas despus de cierta actividad fsica.


82 95 92 62 85 92
82 95 70 85 84 95
91 82 94 76 88 91
87 80 68 58 76 85
110 60 75 88 64 74

E EJ JE EM MP PL LO O 8 8. .1 1. .

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

Es muy poca la informacin que arroja este conjunto de datos cuando se
encuentran sin un tratamiento. A continuacin estos datos son presentados como
una combinacin ordenada en forma ascendente (de menor a mayor):


58 70 80 85 88 94
60 74 82 85 91 95
62 75 82 85 91 95
64 76 82 87 92 95
68 76 84 88 92 110
A partir de esta lista ordenada se pueden concluir varias cosas:

- La ms alta evaluacin de latidos es 110
- La ms baja evaluacin de latidos es 58
- La mitad de la combinacin se encuentra entre 82 y 85
- Hay una predominancia en los latidos con una evaluacin entre 80 y 95
- Hay un vaco entre el valor 95 y el valor 110, es decir hay una cierta
continuidad en los valores entre 58 y 95, pero 110 se encuentra ms alejado
del grupo de datos.
- Hay una evaluacin atpica dentro del grupo de 30 personas, el que registra el
valor 110. Es posible que esta persona tenga perturbaciones cardacas. Sin
embargo, es necesario ampliar la informacin antes de lanzar un juicio
apresurado.


1.2.4.2 Arreglo de tallo y hojas

El arreglo de tallo y hojas es una tcnica que resume de manera simultnea los
datos en forma numrica y presenta una ilustracin grfica de la distribucin.


Se trata de organizar los datos numricos en dos columnas divididas por una lnea
vertical. La primera, denominada tallo, corresponder a las decenas, centenas o
unidades que representan el grupo de datos y en la segunda, llamada hojas, irn
las correspondientes decenas, unidades o dcimas. Para una mejor ilustracin, en
el siguiente ejemplo se continuar con los datos del ejemplo 8.1. Para construir el
correspondiente arreglo de tallo y hojas.



Tomando la serie de datos del ejemplo 8.1., se puede observar que stos tienen
un rango desde los cincuentas hasta los ciento diez. Ellos se pueden presentar
como un arreglo de tallo y hojas en una columna de nmeros del 5 al 11 y
trazando una lnea vertical a su derecha. Estos nmeros representarn el tallo. En
E EJ JE EM MP PL LO O 8 8. .2 2. .

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

la columna de las hojas, se enlistan las unidades (de manera ordenada) de cada
uno de los datos registrados y correspondientes con su respectiva decena.

Figura 2.1.
Diagrama de tallo y hojas para los datos de pulsaciones del ejemplo 8.1.


Tallo Hojas
5 8
6 0 2 4 8
7 0 4 5 6 6
8 0 2 2 2 4 5 5 5 7 8 8
9 1 1 2 2 4 5 5 5
10
11 0


Observe que el diagrama de tallo y hojas al mismo tiempo que ordena los datos de
forma ascendente, permite una visualizacin del comportamiento de estos. Con
este se pueden confirmar muchas de las afirmaciones que se hacan en el ejemplo
8.1.


- La mayora de los registros de latidos cardiacos del grupo de 30 personas se
encuentra entre los ochentas.
- La forma general del conjunto de mediciones es asimtrico.
- Se ve ms claramente el vaco que existe entre los valores 95 y 110, y se
resalta cmo el valor de 110 se encuentra aislado del resto de conjunto de
datos.


Si se quisiera clasificar ms ampliamente los datos, se usa un diagrama de doble
tallo. Que consiste en dividir en dos cada posicin del tallo, en grupos de cinco
hojas. La primera posicin del tallo dispone las hojas 0, 1, 2, 3, 4; y la segunda
posicin dispone las hojas 5, 6, 7, 8, 9.












UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva



Figura 2.2.
Diagrama de doble tallo y hojas para los datos
de pulsaciones del ejemplo 8.1.


Tallo Hojas
5
5 8
6 0 2 4
6 8
7 0 4
7 5 6 6
8 0 2 2 2 4
8 5 5 5 7 8 8
9 1 1 2 2 4
9 5 5 5
10
10
11 0


Observe ahora que esta subdivisin ms fina entrega ms detalles del conjunto de
datos. Qu puede concluir usted?


1.2.4.3 Tabulacin de la informacin

Una de las mejores tcnicas usadas en la estadstica es la elaboracin de
tablas o cuadros. En ellos se plasman las series estadsticas, una sucesin de
datos referentes a un fenmeno observado a travs del tiempo y del espacio.


Una serie cronolgica es aquella donde se analiza un fenmeno a travs
del tiempo en un espacio determinado. Por ejemplo, el nmero de egresados de la
UNAD en el perodo 1994-2004 (ver tabla 2.1.)









UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva




Tabla 2.1.
Nmero de egresados de la UNAD en el perodo 1994-2004


Ao
Nmero de
egresados
1994 338
1995 424
1996 556
1997 971
1998 1358
1999 2119
2000 3328
2001 4357
2002 3400
2003 3697
2004 4774
Total 25322


Una serie espacial es aquella donde se estudia un fenmeno a travs del espacio
en un tiempo determinado. Por ejemplo, el total de estudiantes de la UNAD en la
Zona Occidente en el primer semestre de 2005.


Tabla 2.2.
Clasificacin de estudiantes por CEAD en la Zona Occidente
durante el primer semestre de 2005


CEAD
Nmero de
estudiantes
Medelln 1507
Pereira 1850
La Dorada 350
Turbo 371
Total 4078



UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

Una serie cualitativa es aquella donde se estudia un atributo o caracterstica de
la poblacin investigada, independiente del tiempo y del espacio. Por ejemplo, los
empleados de una empresa clasificados por cargo.


Tabla 2.3.
Clasificacin de empleados por cargo

Cargo Cantidad
Administrador 1
Jefe de produccin 1
Contador 1
Secretaria 2
Supervisor 5
Operario 45
Vigilante 3
Total 58


Una serie cuantitativa es aquella donde se expresa numricamente un atributo o
caracterstica de la poblacin en estudio, independiente del tiempo y del espacio.
Por ejemplo, la estatura en centmetros de un grupo de estudiantes de quinto
grado.


Tabla 2.4.
Clasificacin de la estatura de los estudiantes de un grupo de quinto grado

Estatura
(en centmetros)
Nmero de
estudiantes
125 129 1
129 133 4
133 137 9
137 141 24
141 145 28
145 149 22
149 153 12
Total 100







UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

1.2.5 LECCIN 9 TABLAS DE DISTRIBUCION DE FRECUENCIAS


1.2.4.1 Distribuciones de frecuencias

Una tabla de frecuencias es otro de los formatos que se usan para
organizar y resumir los datos. Para comprender la tcnica de la distribucin de
frecuencias y dominar sus aplicaciones, es necesario manejar algunos conceptos
con suficiente claridad. Y para ello se parte del concepto bsico en la distribucin
de frecuencias: el nmero de veces que un dato se repite de un conjunto de datos
se le denomina frecuencia.


Un conjunto de datos puede organizarse de diferentes maneras. Una de
ellas es construir una distribucin de frecuencias simple, que indica las
frecuencias con que aparecen los datos. Es este el tipo de distribucin de
frecuencias ms utilizado en estadstica, pues permite conocer el comportamiento
de un conjunto determinado de datos y no se ocupa de detalles individuales que,
en muchos casos, poco puede ayudar en la toma de decisiones.




Continuando con la serie de datos del ejemplo 8.1., organice los datos en una
distribucin de frecuencias simple.




















E EJ JE EM MP PL LO O 9 9. .1 1. .

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

Tabla 2.5.
Distribucin de frecuencias simple de latidos cardiacos de 30 personas


Velocidad
de
pulsaciones
Fre-
cuencia
Velocidad
de
pulsaciones
Fre-
cuencia
Velocidad
de
pulsaciones
Fre-
cuencia
58 1 76 2 94 1
59 0 77 0 95 3
60 1 78 0 96 0
61 0 79 0 97 0
62 1 80 1 98 0
63 0 81 0 99 0
64 1 82 3 100 0
65 0 83 0 101 0
66 0 84 1 102 0
67 0 85 3 103 0
68 1 86 0 104 0
69 0 87 1 105 0
70 1 88 2 106 0
71 0 89 0 107 0
72 0 90 0 108 0
73 0 91 2 109 0
74 1 92 2 110 1
75 1 93 0 TOTAL 30

Observe que esta manera de agrupar se vuelve engorrosa cuando se tienen
muchsimos datos. Otra forma de organizar un conjunto de datos es construir una
distribucin de frecuencias agrupadas, que indica las frecuencias con que
aparecen los datos agrupados en lo que se denomina intervalos de clase. Cada
intervalo de clase est limitado por dos valores, llamados lmites de clase (lmite
inferior y lmite superior). La diferencia entre estos lmites en cada intervalo de
clase se denomina ancho, tamao o amplitud del intervalo de clase.


Clase es, entonces, un grupo que presenta una caracterstica comn
cuantificable del conjunto de datos. El valor correspondiente al punto medio de un
intervalo de clase es la marca de clase y su valor es igual a la mitad de la suma
de los lmites de clase del intervalo de clase. Y se interpreta como el valor que
corresponde asignar a cada uno de los elementos del intervalo de clase.


El rango o recorrido es la diferencia entre los valores extremos de todo el
conjunto de datos; en l se encuentran distribuidos todos los datos.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

En la construccin de la distribucin de frecuencias se deben responder a
estos interrogantes fundamentales: Cuntos intervalos de clase crear?, Cul
debe ser el tamao de cada intervalo?, Qu propiedades posee cada intervalo?
Las siguientes pautas resuelven estas inquietudes.



- Hallar el rango (R) o recorrido del conjunto de datos.

- Seleccionar el nmero de intervalos de clase (k). Este nmero depende de la
cantidad de datos disponibles. Una de las tcnicas usadas es la Regla de
Sturges (desarrollada por H. A. Sturges en 1926). Esta regla afirma que el
nmero de intervalos de clase (k), viene dado por:

n k log 322 . 3 1+ =

donde n es el tamao de la muestra. Si de este clculo resulta un nmero
decimal, ste de redondearse al entero superior.


Esta frmula ha sido usada para obtener los nmeros de intervalos de clase
que aparecen en la tabla 2.6. y que permite sugerir el nmero de intervalos de
clase que debe usarse de acuerdo al tamao de la muestra. De esta manera, el
clculo del nmero de intervalos de acuerdo al tamao de la muestra, puede
determinarse bien por la Regla de Sturges o bien por la tabla 2.6.


- Hallar el ancho o amplitud del intervalo de clase (A). Los intervalos de clase
tienen por lo general el mismo ancho, de modo que al fijarse el nmero de
clases se obtiene ste por una operacin aritmtica simple:

k
R
A=


donde R es el rango o recorrido y k es el nmero de clases. Si este cociente no
es un entero, conviene redondear al entero superior. De manera que el rango
es alterado y requiere, por tanto, efectuar un ajuste:

) )( (
*
k A R =
- Con este nuevo rango, se tendr entonces un exceso que deber distribuirse
entre el lmite superior y el lmite inferior. Este exceso es calculado restando el
rango del nuevo rango.

*
R R Exceso =

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

Este valor debe distribuirse lo ms equitativo posible, esto no quiere decir que
sea repartido en partes iguales a los datos extremos, se trata de distribuir el
exceso entre el lmite inferior y el lmite superior de modo que sea considerado
la tendencia general de los datos.


- Formar los intervalos de clase. Se agrega 1 A al lmite inferior de cada clase,
iniciando por el lmite inferior del rango.


- Fijar los lmites reales de cada intervalo de clase. Dado que los intervalos de
clase son mutuamente excluyentes, es decir, no permiten ambigedad en los
lmites cuando estos se repiten como inferior de un intervalo y como superior
en el siguiente intervalo, se determinan los lmites reales de clase. Estos
corresponden al punto medio entre el lmite superior de una clase y el lmite
inferior de la clase siguiente.


En muchos casos se permite que se repita el lmite superior de una clase y el
lmite inferior de la clase siguiente, haciendo la salvedad de cul clase ser
tomada por dicho lmite. En general, es considerado el lmite superior de la
clase como valor de esta.

- Determinar la frecuencia de clase. Contando el nmero de observaciones que
cae dentro de cada intervalo de clase.

- Construir la tabla de distribucin de frecuencias agrupadas.

Tabla 2.6.
Nmero de intervalos de clases sugerido en funcin del tamao de la muestra


Tamao muestral
Nmero de
intervalos de
clase
Menos de 16 Datos insuficientes
16 31 5
32 63 6
64 127 7
128 255 8
256 511 9
512 1023 10
1024 2047 11
2048 4095 12
4096 8190 13

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva


Para los datos del ejemplo 8.1. Elabore una tabla de distribucin de frecuencias
agrupada. Para esto, se seguirn los pasos propuestos:

- Rango = 110 58 = 52

- Nmero de clases. Aplicando la Regla de Sturges:

6 91 . 5 30 log 322 . 3 1 ~ = + = k

Si se usa la tabla 2.6., esta indica que deben usarse 5 clases. Queda a criterio
del investigador la decisin. En este caso se trabajar con el resultado que
arroja la Regla de Sturges.

- Amplitud de los intervalos de clase.

9 67 . 8
6
52
~ = = A


- Como se ha redondeado, debe hallarse el nuevo rango:

54 ) 6 )( 9 (
*
= = R

- Existe pues un exceso de 2, [54 52 = 2]. Este exceso debe distribuirse
quitando 1 al lmite inferior y agregando 1 al lmite superior:

111 1 110
57 1 58
= + =
= =
mx
mn
X
X


Si en el clculo del exceso, este hubiera sido un nmero impar, la distribucin
entre los lmites se calculara considerando hacia dnde se agrupan ms los
datos. En este caso, los datos tienen una mayor tendencia hacia el lmite
inferior de modo que el exceso mayor se repartira en l.

- Intervalos de clase. Se agrega 8 1 9 1 = = A al lmite inferior de cada clase,
iniciando por el lmite inferior del rango. As:

57 + 8 = 65
66 + 8 = 74
75 + 8 = 83
84 + 8 = 92
93 + 8 =101
102+8 =110
E EJ JE EM MP PL LO O 9 9. .2 2. .

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva


- Lmites reales. 56.5, 65.5, 74.5,, 110.5. Que se obtiene de calcular la suma
de cada lmite y dividirlo entre dos. As:


... 5 . 74
2
75 74
5 . 65
2
66 65
5 . 56
2
57 56
=
+
=
+
=
+


- Frecuencias de clase en cada intervalo.


Tabla 2.7.
Distribucin de frecuencias agrupadas de la velocidad de pulsaciones

Intervalos de clase
(Velocidad de
pulsaciones)
Frecuencia
(Nmero de
personas)
56.5 65.5 4
65.5 74.5 3
74.5 83.5 7
83.5 92.5 11
92.5 101.5 4
101.5 110.5 1
Total 30

Al obtener la tabla de distribucin agrupada como en el ejemplo 9.2., son
muchos los interrogantes que continan sin responderse como: Qu porcentaje
del grupo de personas evaluadas presentan pulsaciones entre 74.5 y 83.5? La
tabla 2.7. indica que son 7 personas pero Qu porcentaje es ese? Y, ms an
Qu porcentaje de la muestra presentan, por ejemplo, pulsaciones menores de
92.5?


Cuando se habla de la frecuencia de una clase, se refiere a la frecuencia
absoluta, pero si sta se da en trminos del total de frecuencias se tiene entonces
la frecuencia relativa. Esta se obtiene en porcentaje al dividir la frecuencia de
clase entre el nmero total de frecuencias (o tamao de la muestra).

100 =
n
f
f
r


donde f
r
es la frecuencia relativa de clase, f es la frecuencia absoluta de clase y n
es el tamao de la muestra. En la tabla 2.8. de distribucin de frecuencias

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

agrupadas de los datos del ejemplo 8.1., se calculan las correspondientes
frecuencias relativas de cada intervalo de clase.


Tabla 2.8.
Distribucin de frecuencias absolutas, relativas y
acumuladas ascendentes de la velocidad de pulsaciones


Intervalos de
clase
(Velocidad de
pulsaciones)
Frecuencia
(Nmero de
personas)
Frecuencia
relativa
(%)
Frecuencia
absoluta
acumulada
Ascendente
Frecuencia
relativa
acumulada
Ascendente
56.5 65.5 4 13.3% 4 13.3%
65.5 74.5 3 10% 7 23.3%
74.5 83.5 7 23.4% 14 46.7%
83.5 92.5 11 36.7% 25 83.4%
92.5 101.5 4 13.3% 29 96.7%
101.5 110.5 1 3.3% 30 100%
Total 30 100%


La distribucin de frecuencias acumuladas se construye con el clculo
de la frecuencia absoluta acumulada y la frecuencia relativa acumulada. La
primera es la acumulacin sucesiva en forma descendente o ascendente de las
frecuencias absolutas. Si la frecuencia absoluta acumulada es ascendente, la
primera frecuencia absoluta corresponder a la primera frecuencia absoluta
acumulada. La segunda acumulada se obtiene sumando las dos primeras
absolutas, y as sucesivamente. La ltima frecuencia absoluta acumulada
corresponder al nmero total de frecuencias.


De la misma manera, la frecuencia relativa acumulada es una acumulacin
sucesiva en forma ascendente o descendente de frecuencias relativas. Si es
ascendente, la ltima frecuencia relativa acumulada tendr un valor del 100%. En
la tabla 2.8. se expresan estos tipos de frecuencia tomando los datos del ejemplo
8.1.


Esta tabla arroja informacin tan completa que permite concluir afirmaciones
tales como:


- El 36.7% de las personas evaluadas registran pulsaciones entre el 83.5 y 92.5
y slo el 3.3% registran valores altos, entre 101.5 y 110.5.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

- De las 30 personas, 25 de ellas no superan registros de 92.5 pulsaciones; esto
corresponde al 83.4% del total.


Construya la distribucin de frecuencias absoluta acumulada descendente y
relativa acumuladas descendente con los datos de la velocidad de pulsaciones.
Qu porcentaje de la muestra registra valores superiores a 92.5? A cuntas
personas corresponde? Qu porcentaje registra valores de ms de 75?


1.2.5 LECCIN 10 PRESENTACIN DE LA INFORMACIN

Anteriormente se mencion que la organizacin y el resumen de la
informacin son dos procesos distintos que se ejecutan en forma independiente.
Ya se ha desarrollado todo cuanto tiene que ver con la organizacin de la
informacin, se ver ahora lo que implica el resumen o presentacin de la
informacin. Se trata pues de conocer algunas tcnicas de construccin de
grficas, que es la mejor manera para resumir una investigacin estadstica.


A continuacin, se tratarn las partes ms fundamentales de una grfica y
los aspectos a tener en cuenta para su construccin, luego se presentarn los
distintos tipos de grficas usadas ms comnmente en estadstica entre las cuales
se encuentran el histograma, el polgono de frecuencias, la ojiva, los grficos de
puntos, lineales, de barras y circulares y los pictogramas.


1.2.5.6 Componentes de una grfica

Cuando se disea una grfica, sea esta cual fuere, deben tenerse en
cuenta ciertos aspectos con el fin de mejorar su apariencia y mostrar con claridad
lo que se quiera que ella refleje.


Una grfica siempre debe poseer un ttulo que indique la descripcin del
contenido de ella. En muchas ocasiones, es importante indicar la escala con la
que se trabaja. Es decir, identificar los ejes coordenados (X y Y) e indicar sus
magnitudes correspondientes. La escala se aplica para saber la dimensin del
fenmeno graficado. Otro aspecto importante a tener en cuenta es la fuente de
informacin, que indique de dnde han sido tomados los datos incluyendo el tipo
de publicacin, el ao del registro y otros indicadores que resulten importantes
para la investigacin.


La forma y el tipo de la grfica que se seleccione depende en gran parte del
investigador o de quien la elabora, sin embargo debe tenerse en cuenta para

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

quin va dirigida sta, el lugar de exposicin y otros factores de logstica que
intervienen en la decisin del mejor diseo. Existen ciertos principios generales
que se deben tener en cuenta en el logro de una buena grfica:


- Si en la investigacin se tienen varias grficas, estas deben estar enumeradas
en forma consecutiva.
- Toda grfica debe tener un ttulo que aclare su contenido.
- En los diagramas, las lneas de la ordenada y la abscisa que llevan escala,
deben ser ms gruesas que las dems.
- La mejor grfica es la ms sencilla. Evite saturar la grfica de datos o textos
innecesarios. Haga uso de slo lo estrictamente necesario.
- La grfica no sustituye el cuadro o la tabla, debe ser el complemento.
- Toda grfica debe ir acompaada de convenciones para identificar las
caractersticas que se grafican.
- La lectura de la escala del eje horizontal se hace de izquierda a derecha y la
del eje vertical se hace de abajo hacia arriba.
- La representacin del hecho debe variar slo en una dimensin.
- En toda grfica se debe explicar la fuente de donde fueron obtenidos los datos,
aclarar las escalas, leyendas, notas, llamadas y convenciones que ayuden a
identificar e interpretar las caractersticas presentadas.
- Las grficas nunca preceden al texto.


1.2.5.7 Diagrama de frecuencias

Los diagramas de frecuencia se representan por medio de lneas
verticales, cuya altura est dada por los valores de las frecuencias, ya sean
absolutas o relativas. Si la representacin se refiere a las frecuencias acumuladas
(absolutas o relativas), esta se har por medio de lneas horizontales, ubicando en
el eje vertical los valores de la frecuencia acumulada. Este ltimo diagrama,
denominado diagrama de frecuencias acumuladas, genera una serie de lneas
horizontales que dan la sensacin de los peldaos de una escalera.












UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva



Tabla 2.9.
Distribucin de frecuencias simple
de visita al odontlogo de nios entre los 6 y 12 aos

Edad del nio
(Aos)
Frecuencia absoluta
(Nmero de visitas)
Frecuencia absoluta
acumulada
2 3 3
3 1 4
4 2 6
5 3 9
6 7 16
7 9 25
8 4 29
9 0 29
10 1 30
11 0 30
12 0 30
Total 30


Esta tabla de frecuencias indica las veces que un grupo de 30 nios de 6 a 12
aos de edad visit en los ltimos 6 meses al odontlogo. Construya un diagrama
de frecuencias absolutas y un diagrama de frecuencias absolutas acumuladas.


Figura 2.3.
Diagrama de frecuencias absolutas
de visita al odontlogo de nios entre los 6 y 12 aos

















E EJ JE EM MP PL LO O 1 10 0. .1 1
1 11 10 0. .1 11 10 0. .1 1
0
1
2
3
4
5
6
7
8
9
10
0 2 4 6 8 10 12 14
0
1
2
3
4
5
6
7
8
9
10
0 2 4 6 8 10 12 14
Edad
Frecuencia

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

Figura 2.4.
Diagrama de frecuencias absolutas acumuladas
de visita al odontlogo de nios entre los 6 y 12 aos















En las figuras 2.3. y 2.4. se reflejan los diagramas de frecuencia absoluta y
frecuencia absoluta acumulada, respectivamente.


Obsrvese que a partir de la figura 2.3. rpidamente se puede concluir que los
nios de 7 aos de edad son los que ms han asistido al odontlogo en los ltimos
seis meses de la muestra tomada.


De igual manera se percibe un agrupamiento a la izquierda de los datos, es decir
no es simtrica la grfica. Este tipo de grficos suelen llamarse asimtricos
sesgados a la izquierda.

En la figura 2.4. las dos ltimas lneas horizontales son de mayor tamao que las
dems, esto se debe a que no hay registro de nios que asisten al odontlogo con
edades de 9, 11 y 12 aos.


Se puede ver tambin que estas dos ltimas lneas estn menos separadas que
las otras, pues el salto se debe a que existe un nio de la muestra de 10 aos
que s ha asistido al odontlogo. En cambio, existe un gran salto a los 7 aos,
sabe usted por qu?


1.2.5.8 Histograma de frecuencias

En el caso de las distribuciones de frecuencia agrupada, la forma de
representacin grfica ms comn, se conoce con el nombre de histograma de
frecuencias. Estos se construyen representando los intervalos de clase en la
0
5
10
15
20
25
30
35
0 1 2 3 4 5 6 7 8 9 10 11 12 13
0
5
10
15
20
25
30
35
0 1 2 3 4 5 6 7 8 9 10 11 12 13
Edad
Frecuencia

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

escala horizontal y las frecuencias de clase (absolutas o relativas) en la escala
vertical y trazando rectngulos cuyas bases equivalen a la amplitud de los
intervalos de clase y sus alturas corresponden a las frecuencias de cada clase.


En la figura siguiente se registra el diagrama de frecuencias absolutas del
grupo de datos del ejemplo 8.1. Ntese el origen o punto de partida de la variable
es cero y luego aparece un corte o puente, de manera que permite acortar la
distancia entre el origen y el primer valor de la variable. Esta convencin tambin
puede usarse en el eje vertical u ordenada.


Figura 2.5.
Histograma de frecuencias absolutas de la velocidad de pulsaciones
















1.2.5.9 Polgono de frecuencias

Describe tambin la informacin de la distribucin de frecuencias absolutas
o relativas. Pero se grafican las marcas de clase de cada intervalo, generando una
secuencia de puntos que se unen en segmentos de recta para formar un polgono,
de ah el nombre.


El polgono puede dibujarse sobre el histograma de frecuencias o de
manera independiente. En el primer caso, se unen los centros de las bases
superiores de los rectngulos; en el segundo caso, se unen los puntos de
interseccin de la abscisa, que corresponde a la marca de clase, con la ordenada
correspondiente a la frecuencia relativa o absoluta. La figura 2.6. representa el
polgono de frecuencias de los datos graficados en el histograma de la figura 2.5.


0
2
4
6
8
10
12
56.5 65.5 65.5 74.5 74.5 83.5 83.5 92.5 92.5 101.5 101.5 110.5
Velocidad de pulsaciones
F
r
e
c
u
e
n
c
i
a

(
n

m
e
r
o

d
e

p
e
r
s
o
n
a
s
)
0
2
4
6
8
10
12
56.5 65.5 65.5 74.5 74.5 83.5 83.5 92.5 92.5 101.5 101.5 110.5
Velocidad de pulsaciones
F
r
e
c
u
e
n
c
i
a

(
n

m
e
r
o

d
e

p
e
r
s
o
n
a
s
)

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva


Figura 2.6.
Polgono de frecuencias absolutas
de la velocidad de pulsaciones
















1.2.5.10 Ojiva

Contrario al polgono de frecuencias, la ojiva es una curva suavizada
2
. Las
curvas en estadstica tienen diversas formas: estas se clasifican de acuerdo a la
forma en simtricas y asimtricas siendo estas ltimas sesgadas a la derecha o
a la izquierda; y, segn los mximos o picos que presenten, en unimodales,
bimodales o multimodales.

La ojiva es el grfico de una distribucin de frecuencias acumuladas
(relativas o absolutas) y puede ser descendente o ascendente. Ella permite
presentar en un mismo grfico, diferentes curvas lo que no permite el histograma
de frecuencias. En el eje horizontal se ubican el lmite superior de cada intervalo
de clase y en el vertical, las respectivas frecuencias acumuladas, ya sean relativas
o absolutas. Luego se unen estos puntos en una curva suavizada, partiendo desde
el lmite inferior del primer intervalo. Observe las siguientes figuras, que
representan la ojiva ascendente y descendente de los datos tomados de velocidad
de pulsaciones de una muestra de 30 personas (ejemplo 8.1.)






2
Algunos autores consideran que la ojiva no es una curva suavizada, que est compuesta de
segmentos rectilneos. No se trata aqu de crear una discusin sobre ello pero queda al lector la
decisin si elabora la ojiva como curva suavizada o como la unin de segmentos de lneas. En este
mdulo se trabajar como curva suavizada.
0
1
2
3
4
5
6
7
8
9
10
11
12
50 55 60 65 70 75 80 85 90 95 100 105 110 115 120
Velocidad de pulsaciones
F
r
e
c
u
e
n
c
i
a

(
n

m
e
r
o

d
e

p
e
r
s
o
n
a
s
)
0
1
2
3
4
5
6
7
8
9
10
11
12
50 55 60 65 70 75 80 85 90 95 100 105 110 115 120
Velocidad de pulsaciones
F
r
e
c
u
e
n
c
i
a

(
n

m
e
r
o

d
e

p
e
r
s
o
n
a
s
)

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

Figura 2.7.
Ojiva ascendente de la velocidad de pulsaciones















Figura 2.8.
Ojiva descendente de la velocidad de pulsaciones















Si ambas ojivas se dibujan en un mismo grfico, se obtiene la figura 2.9.
Obsrvese que ellas se cortan en un punto M, este punto se denomina mediana,
concepto que se discutir en la siguiente unidad didctica y que representa el
valor del trmino de la mitad de la distribucin.







0
3
6
9
12
15
18
21
24
27
30
54 58 62 66 70 74 78 82 86 90 94 98 102 106 110
Velocidad de pulsaciones
F
r
e
c
u
e
n
c
i
a

a
b
s
o
l
u
t
a

a
c
u
m
u
l
a
d
a
0
3
6
9
12
15
18
21
24
27
30
54 58 62 66 70 74 78 82 86 90 94 98 102 106 110
Velocidad de pulsaciones
F
r
e
c
u
e
n
c
i
a

a
b
s
o
l
u
t
a

a
c
u
m
u
l
a
d
a
0
3
6
9
12
15
18
21
24
27
30
54 58 62 66 70 74 78 82 86 90 94 98 102 106 110
Velocidad de pulsaciones
F
r
e
c
u
e
n
c
i
a

a
b
s
o
l
u
t
a

a
c
u
m
u
l
a
d
a
0
3
6
9
12
15
18
21
24
27
30
54 58 62 66 70 74 78 82 86 90 94 98 102 106 110
Velocidad de pulsaciones
F
r
e
c
u
e
n
c
i
a

a
b
s
o
l
u
t
a

a
c
u
m
u
l
a
d
a

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva


Figura 2.9.
Ojiva ascendente y descendente de la velocidad de pulsaciones















1.2.5.6. Grficos de lnea

Est compuesta de segmentos de lneas que unen los pares ordenados a
representar. Sirven para describir los cambios o fluctuaciones que sufre un
fenmeno, generalmente durante un tiempo. Pueden ser simples, cuando se
dibuja una sola serie de datos o compuestos, cuando se comparan dos o ms
series de datos, generalmente a travs del tiempo (series cronolgicas).



Tabla 2.10.
Egresados de la UNAD en el perodo 2000-2004

FACULTAD 2000 2001 2002 2003 2004
Ciencias Administrativas 1391 2192 1549 1773 2383
Ciencias Bsicas e Ingeniera 533 603 708 517 830
Ciencias Agrarias 161 147 130 197 280
C. Soc. Humanas y Educ. 1243 1415 1013 1210 1281


La tabla 2.10. indica el nmero de egresados de la UNAD en el perodo 2000-
2004, discriminados por facultad.





E EJ JE EM MP PL LO O 1 10 0. .2 2
1 11 10 0. .1 11 10 0. .1 1
0
3
6
9
12
15
18
21
24
27
30
54 58 62 66 70 74 78 82 86 90 94 98 102 106 110
Velocidad de pulsaciones
F
r
e
c
u
e
n
c
i
a

a
b
s
o
l
u
t
a

a
c
u
m
u
l
a
d
a
M
0
3
6
9
12
15
18
21
24
27
30
54 58 62 66 70 74 78 82 86 90 94 98 102 106 110
Velocidad de pulsaciones
F
r
e
c
u
e
n
c
i
a

a
b
s
o
l
u
t
a

a
c
u
m
u
l
a
d
a
M

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

En el siguiente grfico de puntos, se ve claramente el comportamiento y
fluctuacin en el tiempo de cada facultad respecto a sus egresados.


Figura 2.10.
Diagrama de lneas
Egresados de la UNAD en el perodo 2000-2004

















De all se puede ver cmo en 2004 hubo un aumento considerado en todas las
facultades, de igual forma en 2002 disminuy estrepitosamente el nmero de
egresados en las facultades de Ciencias Administrativas y Ciencias Sociales
Humanas y Educativas, mientras que en Ciencias Bsicas e Ingeniera se daba un
ascenso.


Tambin se puede leer de este tipo de grficos que, independiente de las
fluctuaciones en el tiempo, la Facultad de Ciencias Administrativas es la que
reporta mayor nmero de egresados anuales, seguida de Ciencias Sociales
Humanas y Educativas, Ciencias Bsicas e Ingeniera y por ltimo Ciencias
Agrarias.


1.2.5.7. Diagramas de barras

Es una de las grficas ms usadas para representar tanto caractersticas
cuantitativas como cualitativas. Es muy semejante al histograma de frecuencias,
pero el diagrama de barras no requiere que la informacin est agrupada en tablas
de frecuencias.


Ciencias
Administrativas
Ciencias Bsicas
e Ingeniera
Ciencias Agrarias
Ciencias Sociales
Humanas y Educativas
0
250
500
750
1000
1250
1500
1750
2000
2250
2500
2000 2001 2002 2003 2004 Aos
N

m
e
r
o

d
e

e
g
r
e
s
a
d
o
s

U
N
A
D
Ciencias
Administrativas
Ciencias Bsicas
e Ingeniera
Ciencias Agrarias
Ciencias Sociales
Humanas y Educativas
0
250
500
750
1000
1250
1500
1750
2000
2250
2500
2000 2001 2002 2003 2004 Aos
N

m
e
r
o

d
e

e
g
r
e
s
a
d
o
s

U
N
A
D

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

Las barras son rectngulos con alturas proporcionales a las frecuencias o
magnitudes correspondientes, pueden construirse en forma vertical u horizontal,
sin embargo son ms comunes las verticales; en este tipo de grficos se ubica la
variable o atributo en el eje horizontal y la altura est dada por los valores o
cantidades que toma dicha variable.


El diagrama de barras se puede trabajar para describir una sola
caracterstica de la variable, diagrama de barras simple, o bien describir y
comparar dos o ms caractersticas de ella de forma segmentada o agrupada.
Para diferenciar una caracterstica de otra en la misma barra se recurre a
diferenciarlas usando colores, sombrndolas o rellenndolas con tramas.



La siguiente informacin corresponde a las ventas por departamento, al contado y
a crdito, de un almacn de cadena en la ciudad de Bucaramanga en el mes de
marzo de 2005. Los valores representan las ventas en millones de pesos.


Tabla 2.11.
Ventas por departamento al contado y a crdito en marzo de 2005


Departamento Contado Crdito Total
Alimentos 200 120 320
Ropa 180 110 290
Calzado 150 90 240
Electrodomsticos 300 210 510


Los siguientes diagramas de barras verticales describen las ventas por
departamento del almacn. Obsrvese que tanto la figura 2.11. y 2.12., aunque
sean visualmente diferentes, ofrecen los mismos resultados. Intntelo haciendo los
diagramas de forma horizontal, es clara la informacin? Cul tipo de diagrama
de barras elegira usted para una investigacin? Por qu?


Obsrvese adems, en la figura 2.11., que tambin se puede graficar una barra
ms, la correspondiente al total de ventas, la cual permitira una comparacin
eficiente de las ventas del almacn. Cmo sera esta grfica?




E EJ JE EM MP PL LO O 1 10 0. .3 3
1 11 10 0. .1 11 10 0. .1 1

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva


Figura 2.11.
Diagrama de barras agrupadas de las ventas
por departamento al contado y a crdito en marzo de 2005
















Figura 2.12.
Diagrama de barras segmentadas de las ventas
por departamento al contado y a crdito en marzo de 2005















Construya una tabla de frecuencias relativas para los datos de la tabla 2.11. y con
ella elabore por lo menos dos diagramas de barra diferentes en los que muestre el
porcentaje de ventas de contado y a crdito alcanzadas durante ese mes en el
almacn de cadena para cada uno de los departamentos evaluados. Elabore una
pequea sntesis de los resultados que arrojan las grficas que ha construido.



200
180
150
300
120
110
90
210
0 40 80 120 160 200 240 280 320
Alimentos
Ropa
Calzado
Electro-
domsticos
Millones de pesos
Contado
Crdito
200
180
150
300
120
110
90
210
0 40 80 120 160 200 240 280 320
Alimentos
Ropa
Calzado
Electro-
domsticos
Millones de pesos
Contado
Crdito
200
180
150
300
120
110
90
210
0 50 100 150 200 250 300 350 400 450 500 550
Alimentos
Ropa
Calzado
Electrodomsticos
Millones de pesos
Contado
Crdito
200
180
150
300
120
110
90
210
0 50 100 150 200 250 300 350 400 450 500 550
Alimentos
Ropa
Calzado
Electrodomsticos
Millones de pesos
Contado
Crdito

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

1.2.5.8. Diagrama circular

Es otro tipo de grfico que permite observar los componentes de un total,
como sectores de un crculo. Se utiliza para representaciones grficas de
distribuciones porcentuales. Es una forma efectiva de representar distribuciones
de frecuencias en las que la caracterstica es cualitativa.


Los ngulos de los sectores son proporcionales a los componentes del total.
Se construye subdividiendo los 360 de un crculo, proporcionalmente al nmero o
al porcentaje de cada una de las clases en que se ha dividido la observacin. Una
mayor apreciacin se logra coloreando distintivamente los sectores o dndole una
trama a cada sector.


En una entrevista masiva de una multinacional, asistieron 1250 personas con
expectativas de emplearse. De ellas el 50% eran casados, 25% solteros, 15%
separados y 10% en unin libre. Si se quisiera mostrar en un diagrama circular
estas proporciones, se debe tener en cuenta que los 360 del crculo equivalen al
100%, debe pues plantearse una regla de tres simple:


Donde:
180
100
360 50
=

= X


De la misma manera, el 25% equivale a 90 en el crculo, 15% a 54 y 10% a 36.
Comprubelo. As pues, se grafica el diagrama circular:

Figura 2.13.
Diagrama circular para el estado civil de 1250 aspirantes a empleo











Porcentaje Grados
100% 360
50% X
E EJ JE EM MP PL LO O 1 10 0. .4 4
1 11 10 0. .1 11 10 0. .1 1

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

Este tipo de grficos es inconveniente cuando se tienen varias partes y
cada una representa una pequea proporcin o cuando son muchas las partes
que se van a representar. Si se le quiere emplear en secuencias cronolgicas, se
dibujan crculos de igual radio, tantos como aos, meses o das se quieran
representar en la secuencia, mostrando en cada uno la correspondiente
distribucin porcentual.


1.2.5.9. Pictogramas

Es una forma de representar los datos por medio de smbolos o dibujos
donde cada uno representa la misma informacin con un valor fijo. Los
pictogramas son usados comnmente en el diseo publicitario, ya que se
consideran ms expresivos. As es como se encuentran pictogramas sealando la
poblacin de un pas, donde una figura humana representara un milln de
personas, por ejemplo.


En la siguiente figura se indica por medio de un pictograma los millones de
rboles talados en Argentina, Bolivia y Colombia. Obsrvese que un rbol
representar un milln de rboles talados anuales. Si la cantidad no es exacta, se
presenta una fraccin de la figura.


Figura 2.14.
Pictograma para el nmero de rboles talados en Argentina, Bolivia y Colombia




















Argentina
Bolivia
Colombia
35.4 millones
26.7 millones
37.1 millones
= 1000.000 de rboles
Argentina
Bolivia
Colombia
35.4 millones
26.7 millones
37.1 millones
= 1000.000 de rboles

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

1.2.5.10. Mapas estadsticos o cartogramas

Este tipo de grficos muestra la informacin cuantitativa o cualitativa sobre
bases geogrficas dentro de las cuales se ubican smbolos o figuras como puntos,
barras, crculos, colores, etc. Es muy comn en la prensa o boletines de
informacin, cuando se indica por ejemplo, el informe del estado del tiempo o, en
un mapa de Colombia, se indican con figuras humanas las zonas en conflicto o en
disputa con los diversos grupos armados del pas.


1.3. CAPITULO 3 .MEDIDAS DE TENDENCIA CENTRAL O DE POSICION

Al describir grupos de observaciones, con frecuencia es conveniente resumir la
informacin con un solo nmero. Este nmero que, para tal fin, suele situarse
hacia el centro de la distribucin de datos se denomina medida o parmetro de
tendencia central o de centralizacin.


Cuando se hace referencia nicamente a la posicin de estos parmetros dentro
de la distribucin, independientemente de que esta est ms o menos centrada,
se habla de estas medidas como medidas de posicin. En este caso se incluyen
tambin los cuantiles entre estas medidas.

Entre las medidas de tendencia central tenemos:

- media aritmtica
- media ponderada
- media geomtrica
- media armnica
- mediana
- moda.


Pero antes de iniciar con estos nuevos conceptos, se hace indispensable recordar
algunas nociones aritmticas y algebraicas bsicas en estadstica, es por esto que
se recomienda al lector iniciar el captulo repasando la sumatoria como propiedad
aritmtica fundamental para entender las medidas estadsticas de una poblacin o
muestra. Todo cuanto tiene que ver con sumatoria y productoria puede ser
repasado y consultado en el anexo A, que se encuentra al final del texto.


1.3.1 LECCIN 11. ESTADIGRAFOS

En el capitulo anterior nos dedicamos a estudiar los mtodos que deben ser
aplicados en el proceso de agrupar, organizar y presentar los datos en cualquier
tipo de investigacin estadstica.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

Ahora trataremos de presentar otros mtodos para estudiar o medir el
comportamiento de los elementos que constituyen una poblacin. Si bien es cierto
que los cuadros y graficas describen el fenmeno, no lo hacen en forma
satisfactoria, y por tanto hay necesidad de acudir a ciertas medidas denominadas
parmetros de la poblacin, cuando se hacen sobre el total de sta y
estadgrafos, cuando corresponden a una parte de la poblacin o muestra.. Los
estadgrafos permiten hallar un valor numrico, el mismo que representa a la
muestra.


Teniendo en cuenta la anterior la clasificacin, los smbolos que se refieren a la
poblacin se representan generalmente por letras griegas o por las letras
maysculas de nuestro alfabeto y los que se refieren a la muestra, por letras
minsculas.


Para el anlisis de una variable o de una distribucin unidimensional se
consideran las siguientes clases de medidas:

- Medidas de tendencia central
- Medidas de posicin
- Medidas de dispersin
- Medidas de asimetra y apuntamiento


1.3.2 LECCIN 12 MEDIA ARITMTICA

Es la medida ms conocida y la ms fcil de calcular. Se define como la
suma de los valores de una cantidad dada de nmeros dividido entre la cantidad
de nmeros.
n
X
x
n
i
i
=
=
1

donde:
n = cantidad de elementos
X
i
= valor de cada elemento
x = media aritmtica, o simplemente media


El precio de la bolsa de un litro de leche en diferentes supermercados fue: $1.300,
$1.350, $1.250, $1.400 y $1.325. El valor promedio o media aritmtica es
entonces:


E EJ JE EM MP PL LO O 1 12 2. .1 1
1 11 10 0. .1 11 10 0. .1 1

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

325 . 1 $
5
325 . 1 400 . 1 250 . 1 350 . 1 300 . 1
=
+ + + +
= x

La media aritmtica tiene la propiedad de asignar a cada elemento de la suma el
mismo valor, o sea el valor promedio.


Si se conoce el valor de la media y el nmero n de elementos u
observaciones, se puede conocer el valor de la suma total multiplicando la media
por el nmero de elementos. Esto es:

x n X
n
i
i
=

=1


Las ventas promedio de un almacn durante el primer semestre del ao fueron
$3422.000; hallar el total de ventas de este perodo de tiempo.

Venta total primer semestre = 6 x (3422.000) = $20532.000


Tambin puede suceder que los elementos que se analizan se encuentren
agrupados, en este caso para encontrar el valor de la media aritmtica se debe
realizar la ponderacin de estos elementos agrupados, es decir, encontrar el peso
que le corresponde a cada valor. Esto da lugar a la media aritmtica ponderada.


Un agricultor vende la cosecha de papas de la siguiente forma: 30 sacos a
$256.000, 18 sacos a $264.000 y 25 sacos a $261.500. Cul es el precio
promedio del saco de papa vendida por el agricultor?


Precio promedio saco de papa =
25 18 30
) 500 . 261 ( 25 ) 000 . 264 ( 18 ) 000 . 256 ( 30
+ +
+ +
=$259.856

La media ponderada se halla al realizar el cociente entre la suma de los
productos de los valores por sus respectivos pesos y la suma de los pesos. El
caso general se expresa as:

=
=
=
+ + +
+ + +
=
n
i
i
n
i
i i
n
n n
m
X m
m m m
X m X m X m
x
1
1
2 1
2 2 1 1
. . .



E EJ JE EM MP PL LO O 1 12 2. .3 3
1 11 10 0. .1 11 10 0. .1 1
E EJ JE EM MP PL LO O 1 12 2. .2 2
1 11 10 0. .1 11 10 0. .1 1

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

Siendo X
1
X
2
, X
n
, las cantidades ponderadas y m
1
, m
2
,,, m
n
los pesos o
ponderaciones.


Un caso similar al anterior consiste en la media de una distribucin de
frecuencias agrupadas, donde los pesos o ponderaciones corresponderan a las
frecuencias de los valores de las marcas de clase, recordando que la marca de
clase es el valor promedio de un intervalo de clase. Esta similitud entre la media
de una distribucin de frecuencias agrupadas y la media aritmtica ponderada se
muestra en el siguiente ejemplo.




Dada la siguiente distribucin de frecuencias agrupadas, calcule su
correspondiente media aritmtica:


Tabla 3.1.
Distribucin de frecuencias agrupadas

Intervalo
Marca de clase
X
Frecuencia
f
f .X
16-20 18 4 72
21-25 23 6 138
26-30 28 7 196
31-35 33 5 165
36-40 38 3 114
Total 25 685

4 . 27
25
685
.
= =

f
X f
x


De lo anterior puede verse que:

n
X f
f
X f
x
n
i
i
n
i
i i


= =
=
=
1
1


Dada la importancia que tiene el clculo de la media aritmtica y su
frecuente uso, se hace necesario considerar algunas de sus propiedades:
E EJ JE EM MP PL LO O 1 12 2. .4 4
1 11 10 0. .1 11 10 0. .1 1

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva


- La suma de las desviaciones respecto a la media aritmtica es igual a cero.

Una desviacin es la diferencia que se presenta entre los valores que toma la
variable y un valor constate, en este caso es la media aritmtica. Esta
propiedad, al igual que las dems, es vlida para datos agrupados o no
agrupados. Y en trminos aritmticos ella plantea:

= 0 ) ( x X

Tenga en cuenta que cuando los datos estn agrupados en una tabla de
frecuencias, las desviaciones con respecto a la media deben ponderarse. Si la
distribucin es simtrica no hay necesidad de ponderar.


- La suma de los cuadrados de las desviaciones respecto a la media es siempre
menor que la suma de los cuadrados de las desviaciones con respecto a
cualquier otro valor.
Esto quiere decir que slo la media aritmtica hace mnima la suma de los
cuadrados de las desviaciones en torno a ella. Esta importante propiedad se
retomar ms adelante cuando se estudie regresin lineal y el mtodo de los
mnimos cuadrados para ajuste de curvas.

En sntesis, la media o promedio aritmtico es la medida de tendencia central
ms comnmente usada, adems de ser la nica de las medidas de tendencia
central que permite un tratamiento algebraico. Sin embargo no siempre es
recomendable usarla como un promedio, ya que es muy sensible a los valores
extremos del conjunto de datos. Por otra parte, la media es ligeramente ms difcil
de calcular a mano que las otras medidas que se vern en seguida, puesto que
requiere sumar todo el conjunto de datos, que bien podran ser bastantes, y dividir
entre el nmero de elementos del conjunto.


1.3.6 LECCIN 13 MEDIANA

Se define como el valor que divide una distribucin de datos ordenados en
dos mitades, es decir, se encuentra en el centro de la distribucin.


La mediana se simboliza como Me. Es menos usada que la media
aritmtica. Para su clculo es necesario que los datos estn ordenados. Cuando la
cantidad de datos es impar, fcilmente se identifica la mediana; pero cuando el
nmero de datos es par, la mediana se calcula hallando el valor medio entre los
dos valores centrales y no coincidir con ninguno de los valores del conjunto de
datos.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva



a. Dados los valores: 19, 15, 23, 28, 14, 26, 18, 20, 30, determinar su media.
Lo primero que debe hacerse es ordenar los datos:

14 15 18 19 20 23 26 28 30

Como el nmero de datos es 9, el valor del medio de estos datos es la mediana,
puesto que deja cuatro valores por debajo y cuatro valores por encima. Este valor
es 20.


b. Hallar la media del siguiente conjunto de datos ordenados:

14 15 18 19 20 23 26 28 30 32

Observe que son 10 datos, un nmero par de datos. En este caso se toman los
dos valores del medio y se promedian:

5 . 21
2
23 20
=
+
= Me

Cuando los datos se encuentran agrupados, se calcula el valor de
2
n
y con l se
busca, en las frecuencias acumuladas, el intervalo de clase en donde este se
encuentra o se aproxime mejor. Esta clase recibe el nombre de clase de la
mediana. Identificada la clase de la mediana, se considera que los valores en esa
clase se distribuyen uniformemente de modo que se pueda calcular la mediana
por el mtodo de la interpolacin lineal. En el siguiente ejemplo se describe paso a
paso el clculo de esta medida de tendencia central.



Tomando la tabla 3.1 de distribucin de frecuencias agrupadas del ejemplo 12.4.
de esta unidad didctica, calcular la mediana del conjunto de datos.

Primero se identifica la clase de la mediana (la clase que contiene a la mediana).

5 . 12
2
25
2
= =
n


La clase de la mediana es (26-30), pues el nmero de frecuencias acumuladas es
el valor ms cercano a 12.5.
E EJ JE EM MP PL LO O 1 13 3. .2 2
1 11 10 0. .1 11 10 0. .1 1
E EJ JE EM MP PL LO O 1 13 3. .1 1
1 11 10 0. .1 11 10 0. .1 1

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

Clase de la
mediana

Tabla 3.2.
Distribucin de frecuencias agrupadas









Hay 10 observaciones por
debajo del lmite inferior de la clase
de la mediana.

5 . 2 10 5 . 12 =

El valor de 2.5 se interpola en el ancho o amplitud de la clase de la mediana que
es 4.
Frecuencia
absoluta

Ancho
de clase
7 4
2.5 X

4 . 1
7
4 5 . 2
=

= X

As pues, la mediana se encontrar 1.4 unidades ms del lmite inferior de la clase
de la mediana:

4 . 27 4 . 1 26 = + = Me

En muchas referencias bibliogrficas se expone una ecuacin para el
clculo de la mediana cuando los datos se encuentran agrupados. Ella se deriva
del anlisis hecho en el ejemplo anterior y se describe de la siguiente manera:

k k
k
k
L A
f
F
n
Me +

=
1
2


Donde:
n es el tamao de la muestra o la suma de todas las frecuencias.
F
k-1
es la frecuencia absoluta acumulada de la clase anterior de la clase de la
mediana.
Intervalo
Frecuencia
F
Frecuencia
acumulada
16-20 4 4
21-25 6 10
26-30 7 17
31-35 5 22
36-40 3 25
Total 25

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

f
k
es la frecuencia absoluta de la clase de la mediana.
A
k
es la amplitud de la clase de la mediana.
L
k
es el lmite real inferior de la clase de la mediana.


Determine la mediana de la distribucin de frecuencias agrupadas del ejemplo
13.2., haciendo uso de la ecuacin para su clculo.
Primero, se identifica cada valor:

n = 25
F
k-1
= 10
f
k
= 7
A
k
= 4
L
k
= 26

4 . 27 26 4 . 1 26 4
7
10
2
25
2
1
= + = +

= +

=

Me L A
f
F
n
Me
k k
k
k


Otra manera para hallar la mediana de un conjunto de datos agrupados es
el mtodo grfico. Ya se vio algo cuando se estudiaba la ojiva: al graficar en un
mismo eje coordenado la ojiva ascendente y descendente, el punto donde estas
dos curvas se encuentren corresponde a la mediana de los datos agrupados,
leyendo el valor en el eje horizontal.


Si se trabaja en cambio con la ojiva porcentual, es decir con la distribucin
de frecuencias relativas, la mediana ser el valor de la abscisa cuya ordenada es
el 50%.


Se concluye entonces que la mediana no est afectada por los valores
extremos del conjunto de datos, sean estos grandes o pequeos. No influencian
en lo absoluto como s lo hacen en el clculo de la media. Cuando la distribucin
de los datos es muy simtrica, no hay casi diferencia entre la media y la mediana.
El clculo de la mediana es simple, pero siempre requiere que los datos se
encuentren ordenados, condicin que no requiere el clculo de la media.
Finalmente, se podra decir que la mediana no es una medida muy confiable para
describir el conjunto de datos, pues en su clculo slo intervienen los valores ms
centrales sin tener en cuenta los dems y su comportamiento general.




E EJ JE EM MP PL LO O 1 13 3. .3 3
1 11 10 0. .1 11 10 0. .1 1

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

1.3.7 LECCIN 14 MODA

Se trata del valor ms frecuente en un conjunto de datos. Se considera
como el valor ms representativo o tpico de una serie de valores. Es simbolizada
como Mo. Si dos valores tienen la misma frecuencia se dice que el conjunto es
bimodal. Cuando ms de dos valores ocurren con la misma frecuencia y sta es
la ms alta, todos los valores son modas, por lo que el conjunto de datos recibe el
nombre de multimodal o polimodal.


Cuando los datos se encuentran agrupados la moda es la marca de clase
del intervalo de clase que contiene la mayor frecuencia. Es usual tambin hacer
uso de la siguiente ecuacin para su clculo:

k k
k k
k
L A
f f
f
Mo +
+
=
+

1 1
1


Donde:
f
k-1
es la frecuencia absoluta de la clase anterior en donde se encuentra el dato
ms frecuente.
f
k+1
es la frecuencia absoluta de la clase posterior en donde se encuentra el dato
ms frecuente.
.A
k
es la amplitud de la clase en donde se encuentra el dato ms frecuente.
L
k
es el lmite real inferior de la clase en donde se encuentra el dato ms frecuente.


La moda tambin puede determinarse grficamente, usando un histograma
de frecuencias o un polgono de frecuencias. La barra ms alta o el pico ms alto
corresponde al valor que ms se repite. Generalmente las curvas de frecuencia
presentan un solo pico, pero a veces se encuentran series con dos o ms picos,
es decir puntos que corresponden a una mayor densidad de frecuencias. Esto
sucede cuando se trabaja con grupos de datos heterogneos.




Las siguientes tablas de frecuencias indican el nmero de personas de acuerdo a
su edad que asistieron al estreno de una pelcula.


En la tabla 3.3., donde los datos estn sin agrupar, la moda es 22, valor
correspondiente a la mayor frecuencia que es 5.


E EJ JE EM MP PL LO O 1 14 4. .1 1
1 11 10 0. .1 11 10 0. .1 1

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

En la tabla 3.4., los datos se encuentran agrupados, la moda se encuentra en el
intervalo de clase 19.5 22.5 y corresponde a la marca de clase que es 21.
Adems, usando la ecuacin para el clculo de la moda, se tiene:

21 5 . 19 3
9 9
9
= +
+
= Mo

Obsrvese que aunque sean el mismo conjunto de datos, la moda vara
dependiendo de su tratamiento, es decir, de cmo estos se agrupan.


Tabla 3.3. Tabla 3.4.
Distribucin de frecuencias Distribucin de frecuencias agrupadas
de la asistencia a cine de la asistencia a cine














La moda no es tan usada como la media o la mediana. Para encontrarla se
requiere que los datos estn ordenados. Su clculo es poco preciso debido a que
no se puede expresar en trminos algebraicos.


Se han visto hasta ahora tres medidas de tendencia central: media,
mediana y moda. Determinar cul de ellas usar en un tratamiento estadstico
depende mucho de la informacin que se tenga y del objetivo que se persigue. La
media, a diferencia de la mediana y la moda, presenta una ligera estabilidad en el
muestreo, es por eso que su uso es ms frecuente. Si la distribucin es casi
simtrica, cualquiera de ellas puede usarse y resultarn aproximadamente iguales.
Cuando los datos no estn ordenados, puede resultar ms fcil calcular la media
aritmtica que la mediana. Cuando los datos no estn agrupados, el clculo de la
moda se hace ms preciso. Si la distribucin no es simtrica, es ms
recomendable emplear la mediana o la moda como medidas de posicin.


En cualquier distribucin el valor de la mediana se localiza entre la media y
la moda. Cuando la distribucin es asimtrica a la derecha se cumple que
Intervalos
de clase
Marca
de
clase
Frec.
13.5 16.5 15 2
16.5 19.5 18 9
19.5 22.5 21 13
22.5 25.5 24 9
25.5 28.5 27 9
28.5 31.5 30 1
Total 43
X f X F
14 1 23 4
15 0 24 3
16 1 25 2
17 2 26 4
18 3 27 3
19 4 28 2
20 4 29 0
21 4 30 0
22 5 31 1
Total 43

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

x Me Mo < < ; si en cambio es asimtrica a la izquierda Mo Me x < < . Se dice
entonces, que una distribucin est sesgada si no es simtrica y si se extiende
ms hacia un lado que hacia el otro. Y ser simtrica cuando la mitad de su
histograma es aproximadamente igual a su otra mitad. Los datos sesgados a la
izquierda (sesgo negativo) presentan una cola izquierda ms larga y su media y
mediana se encuentran a la izquierda de la moda. Mientras que los datos
sesgados a la derecha (sesgo positivo) poseen una cola derecha ms larga y su
mediana y media estn a la derecha de la moda (ver figura 3.1.)


Figura 3.1.
Distribuciones sesgadas
(a) Sesgada a la derecha; (b) Sesgada a la izquierda; (c) Simtrica



La relacin de Pearson afirma que la distancia entre la media y la moda es
tres veces la distancia entre la media y la mediana. Esta relacin es utilizada para
calcular cualquiera de ellas, conociendo las otras dos medidas.

x Me Mo Me x Mo x 2 3 ) ( 3 = =
En resumen, se puede entender la media aritmtica como el punto de
equilibrio del conjunto de datos (como el centro de gravedad de un cuerpo); la
mediana como la medida que permite dividir el rea bajo la curva de distribucin
en dos parte iguales y la moda como el pico ms alto de la curva de distribucin.


El cuadro siguiente
3
resume y compara de una manera didctica y prctica
la media, mediana y moda en trminos de ventajas y desventajas para su clculo y
uso en la investigacin estadstica. Ellas tres son las medidas de tendencia central

3
Modificado de Probabilidad y estadstica, Mario F. Triola. Novena edicin. Pearson & Addison
Wesley. Mxico. 2004.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

ms comnmente usadas, en el tema siguiente se estudiarn otras medidas no
menos importantes pero si menos usadas en el tratamiento estadstico.


Tabla 3.5.
Comparacin de la media, mediana y moda

Medida
de
tendencia
central
Qu tan
comn
es?
Existe
siempre?
Toma
en
cuenta
cada
valor?
Se ve
afectada
por los
valores
extremos?
Requiere
que los
datos estn
ordenados?
Ventajas y
desventajas
Media
Es la ms
comn
Si Si Si No
Presenta una
ligera
estabilidad
frente al
muestreo.
Mediana
De uso
comn
Si No No Si
No es muy
confiable para
describir el
conjunto de
datos, pues en
su clculo slo
intervienen los
datos ms
centrales.
Moda
Usada en
ocasiones
Podra no
existir o
haber
ms de
una
No No Si
Es ms
precisa
cuando los
datos no estn
agrupados.


1.3.8 LECCIN 15 OTRAS MEDIDAS DE TENDENCIA CENTRAL

La media geomtrica se utiliza para promediar crecimientos geomtricos
de la variable, o cuando se quiere dar importancia a valores pequeos, o cuando
se quiere determinar el valor medio para un conjunto de porcentajes. Suele
utilizarse en negocios y economa para calcular las tasas de cambio promedio, las
tasas de crecimiento promedio o tasas promedio. Se simboliza Mg y se define
como la raz n-sima de la productoria de los n valores de la variable.


Cuando los datos no son agrupados, la media geomtrica se calcula
hallando el producto de todos los elementos y extrayendo la raz del orden del
nmero de observaciones.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

n
n
n
n
i
i
X X X X Mg = =
I
=
...
2 1
1


Cuando los datos estn agrupados, la media geomtrica se define como la
raz n-sima de la productoria de los valores de la variable (marca de clase)
elevadas cada una de ellas a su correspondiente frecuencia absoluta.

n
n
n
n n
n
n
i
n
i
i i
X X X X Mg = =
I
=
...
2 1
2 1
1


a. Hallar la media geomtrica de 2, 4, 6, 9, 12, 15

53 . 6 760 . 77 15 12 9 6 4 2
6 6
6
6
1
= = = =
I
= i
i
X Mg

b. Hallar la media geomtrica de la siguiente distribucin de frecuencias
agrupadas.
Tabla 3.6.
Distribucin de frecuencias agrupadas

Intervalos de clase Marcas de clase Frecuencias
0.5 1.5 1 2
1.5 2.5 2 5
2.5 3.5 3 8
3.5 4.5 4 5
Total 20

1 . 121 4 3 2 1
4 5 8 5 2
4
4
1
= = =
I
= i
n
i
i
X Mg

La media armnica de un conjunto de datos es el recproco de la media
aritmtica de los recprocos de los nmeros de la serie de datos. Se simboliza Mh
y se define como:

= =
+ + +
=
x
n
Mh
n
x
n Mh
Xn X X
1
1
...
1
1 1 1
2 1


E EJ JE EM MP PL LO O 1 15 5. .1 1
1 11 10 0. .1 11 10 0. .1 1

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

La media armnica es muy influenciable por los valores extremos de la
serie, especialmente los ms pequeos. Se utiliza preferiblemente para conjuntos
de datos que consisten en tasas de cambios, como la velocidad.

Un obrero se gasta 50 minutos en terminar un producto y otro lo hace en 40
minutos. Cul es el tiempo medio requerido para terminar dicho producto?

44 . 44
0225 . 0
1
0225 . 0
2
045 . 0
2
1
40
1
50
1
= = = =
+
= Mh
Mh


44.44 minutos es el tiempo medio requerido.


Los cuartiles, deciles y percentiles son medidas que se utilizan para
determinar los intervalos dentro de los cuales quedan proporcionalmente
repartidos los trminos de la distribucin.


Para calcular los cuartiles se divide la distribucin en cuatro partes iguales,
de manera que cada una tendr el 25% de las observaciones. Los tres puntos de
separacin de los valores son los cuartiles. El cuartil inferior (Q
1
) es aquel valor de
la variable que representa el 25% de las observaciones y a la vez, es superado
por el 75% restante. El segundo cuartil (Q
2
) corresponder a la mediana de la
distribucin. El tercer cuartil (Q
3
) es aquel valor que representa el 75% y es
superado por el 25% restante de las observaciones.


Para calcular estos tres promedios se procede de manera semejante al
clculo de la media aritmtica.


Hallar los cuartiles de la distribucin de frecuencias de la tabla 3.2., del ejemplo
13.2.

Primero se identifica la clase en donde se encuentra el primer cuartil.

25 . 6
4
25
4
= =
n




E EJ JE EM MP PL LO O 1 15 5. .3 3
1 11 10 0. .1 11 10 0. .1 1
E EJ JE EM MP PL LO O 1 15 5. .2 2
1 11 10 0. .1 11 10 0. .1 1

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

El intervalo de clase donde se encuentra el primer cuartil es (21-25), pues el
nmero de frecuencias acumuladas es el valor ms cercano a 6.25.











Hay 4 observaciones por debajo del lmite inferior de la clase del primer cuartil.

25 . 2 4 25 . 6 =


El valor de 2.25 se interpola en la amplitud de la clase del primer cuartil que es 4.

Frecuencia
absoluta

Ancho de
clase
6 4
2.25 X

5 . 1
6
4 25 . 2
=

= X


As pues, el primer cuartil se encontrar 1.5 unidades ms del lmite inferior de la
clase correspondiente:


5 . 22 5 . 1 21
1
= + = Q

El segundo cuartil corresponde al punto medio de la distribucin, esto es la
mediana del grupo de datos.

4 . 27
2
= = Me Q

Para el tercer cuartil se procede de la misma manera.

75 . 18
4
25 3
4
3
=

=
n


Intervalo
Frecuencia
F
Frecuencia
acumulada
16-20 4 4
21-25 6 10
26-30 7 17
31-35 5 22
36-40 3 25
Total 25
Clase del Q
1

Clase del Q
3


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

El intervalo de clase donde se encuentra el tercer cuartil es (31-35) y hay 17
observaciones por debajo del lmite inferior de la clase de este cuartil.

75 . 1 17 75 . 18 =

Frecuencia
absoluta

Ancho de
clase
5 4
1.75 X

4 . 1
5
4 75 . 1
=

= X

El tercer cuartil se encontrar 1.4 unidades ms del lmite inferior de su clase:

4 . 32 4 . 1 31
3
= + = Q


Lo que quiere decir que el 25% de los valores est por debajo de 22.5; el 50%
est por debajo de 27.4 y el 75% est por debajo de 32.4.


Para calcular los deciles se divide el conjunto de datos en 10 partes
iguales, de manera que se obtienen nueve valores que dividen la frecuencia total
en diez partes iguales. El primer decil (D
1
) es igual al valor que supera al 10% de
las observaciones y es superado por el 90% restante y as para cada uno de los
deciles. Su clculo es muy semejante al de los cuartiles.


De igual manera se puede calcular el centil o percentil al dividir en cien
partes iguales la distribucin. El primer percentil (P
1
) es igual al valor que supera al
1% de las observaciones y es superado por el 99% restante y as sucesivamente.
Obsrvese que D
1
=P
10
; D
2
=P
20;
...


El mtodo ms sencillo para identificar tanto cuartiles, deciles y percentiles
es el grfico, haciendo uso de la ojiva porcentual ascendente. Slo requiere
buscar en el eje vertical el porcentaje que se busca y leer en el eje horizontal su
correspondiente valor.


A partir de la ojiva porcentual de la distribucin de frecuencias agrupadas de la
tabla 3.2., determine el valor de: Q
1
, Q
2
, Q
3
, D
1
, D
5
, D
9
, P
5
, P
95
.


E EJ JE EM MP PL LO O 1 15 5. .4 4
1 11 10 0. .1 11 10 0. .1 1

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

Para construir la ojiva, se debe completar la tabla de distribucin de frecuencias
agrupadas.


Tabla 3.7.
Distribucin de frecuencias agrupadas


Con las frecuencias relativas acumuladas se construye la ojiva porcentual
ascendente. Una vez construida, se inicia el proceso de identificar cada valor
pedido, teniendo en cuenta qu porcentaje representa. Es decir, el primer cuartil
representa el 25%, el segundo 50%, el tercero 75%, el primer decil representa el
10%, del quinto es el 50% y el noveno corresponder al 90%, mientras que el
percentil 5 representa al 5% y el 95 al 95%.


Observe en la figura 3.2. que los valores tericos (calculados en ejemplos
anteriores) no son completamente coincidentes. Esto demuestra que el mtodo
grfico no es el ms apropiado para su determinacin, sin embargo es muy til y
sus valores se aproximan al terico entre mejor est graficada la ojiva.
















Intervalo
Frecuencia
absoluta
Frecuencia
acumulada
Frecuencia
relativa
Frecuencia
relativa
acumulada
16-20 4 4 16% 16%
21-25 6 10 24% 40%
26-30 7 17 28% 68%
31-35 5 22 20% 88%
36-40 3 25 12% 100%
Total 25 100%

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

Figura 3.2.
Ojiva porcentual ascendente





















Tabla 3.8.
Resumen de clculos, ejemplo 15.4.

Medida
Porcentaje
que
representa
Valor
terico
calculado
Valor
grfico
obtenido
Q
1
25% 22.5 22.2
Q
2
50% 27.4 26.9
Q
3
75% 32.4 31.8
D
1
10% 18
D
5
50% 27.4 26.9
D
9
90% 35.5
P
5
5% 16.5
P
95
95% 37.9

Ahora intente lo siguiente: determine los valores tericos de las medidas que an
no ha calculado y comprelas con las obtenidas por el mtodo grfico. Son muy
diferentes?


0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
0 5 10 15 20 25 30 35 40 45
Q
1
22.2
Q
2
=D
5
26.9
Q
3
31.8
D
1
18
D
9
35.5
P
5
16.5
P
95
37.9
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
0 5 10 15 20 25 30 35 40 45
Q
1
22.2
Q
2
=D
5
26.9
Q
3
31.8
D
1
18
D
9
35.5
P
5
16.5
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
0 5 10 15 20 25 30 35 40 45
Q
1
22.2
Q
2
=D
5
26.9
Q
3
31.8
D
1
18
D
9
35.5
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
0 5 10 15 20 25 30 35 40 45
Q
1
22.2
Q
2
=D
5
26.9
Q
3
31.8
D
1
18
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
0 5 10 15 20 25 30 35 40 45
Q
1
22.2
Q
2
=D
5
26.9
Q
3
31.8
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
0 5 10 15 20 25 30 35 40 45
Q
1
22.2
Q
2
=D
5
26.9
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
0 5 10 15 20 25 30 35 40 45
Q
1
22.2
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
0 5 10 15 20 25 30 35 40 45
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
0 5 10 15 20 25 30 35 40 45
Q
1
22.2
Q
1
22.2
Q
2
=D
5
26.9
Q
2
=D
5
26.9
Q
3
31.8
Q
3
31.8
D
1
18
D
1
18
D
9
35.5
D
9
35.5
P
5
16.5
P
5
16.5
P
95
37.9
P
95
37.9

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

El clculo de percentiles para datos no agrupados se hace ms sencillo siguiendo
el siguiente tratamiento resumido en el diagrama de flujo
4
de la figura 3.3., que
clarifica el procedimiento para el clculo del k-simo percentil.

Figura 3.3.
Diagrama de flujo para el clculo del k-simo percentil































Se requiere que los datos se encuentren ordenados de manera ascendente.
Luego se determina el valor de la expresin:

n
k
L =
100



4
Modificado de Probabilidad y estadstica, Mario F. Triola. Novena edicin. Pearson & Addison
Wesley. Mxico. 2004.
Hacer arreglo
ordenado (ascendente)
Calcular n
k
L =
100

Donde:
n = nmero de valores
k = percentil en cuestin
Es L un
nmero entero?
Calcule el valor medio entre
el L-simo valor y el siguiente
valor en el conjunto de datos
ordenados.
El valor de P
k
corresponde a
la posicin obtenida del
promedio calculado, contado
desde el dato menor.
Redondee L al
siguiente entero
ms grande
El valor de P
k
es
el L-simo valor,
contado desde
el dato menor.
No
Si

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

Donde:
n es el nmero de valores del grupo de datos
k es el percentil en cuestin


Si el valor de L es un nmero entero, el valor del k-simo percentil estar por el
valor medio entre el L-simo valor y el siguiente valor. Si en cambio, el valor de L
no es un nmero entero, este valor debe ser redondeado al siguiente entero ms
grande y el valor de Pk corresponder a la posicin L-sima.

Tome el arreglo ordenado del ejemplo 8.1., de la Unidad Didctica Uno sobre la
evaluacin de los latidos cardacos de un grupo de 30 personas despus de cierta
actividad fsica y calcule los siguientes percentiles.


58 70 80 85 88 94
60 74 82 85 91 95
62 75 82 85 91 95
64 76 82 87 92 95
68 76 84 88 92 110


a. El valor del percentil 10, P
10

Para esto, se sigue el procedimiento planteado en el diagrama de flujo de la figura
1.3. Los datos se encuentran ordenados de forma ascendente; se procede
entonces a calcular L, es decir el localizador que da la posicin del valor 10.

3 30
100
10
= = L


Despus, se verifica si el valor de L es un entero o no. En este caso, L es entero
as que se sigue hacia abajo en el diagrama de flujo. De manera que el dcimo
percentil est a la mitad entre el valor L-simo (tercero) y el siguiente valor
(cuarto). Es decir, el valor del percentil 10 se ubica entre 62 y 64, que
corresponden al tercer y cuarto valor del grupo de datos ordenados,
respectivamente. Se tiene entonces:

63
2
64 62
10
=
+
= P



E EJ JE EM MP PL LO O 1 15 5. .5 5
1 11 10 0. .1 11 10 0. .1 1

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

b. El valor del percentil 43, P
43

Se calcula el valor de L:

13 9 . 12 30
100
43
~ = = L
Como el valor de L no es entero, se redondea al siguiente entero ms grande. El
valor del percentil 43 es el valor 13 del grupo de datos ordenados contado desde
el dato menor. As:

82
43
= P

c. El valor del percentil 81, P
81

Se calcula el valor de L:

25 3 . 24 30
100
81
~ = = L

Como el valor de L no es entero, se redondea al siguiente entero ms grande.
Observe que no se redondea al entero ms cercano sino al entero mayor. El valor
del percentil 81 es el valor 25 del grupo de datos ordenados contado desde el
dato menor. As:

92
81
= P

d. El valor del cuartil 1, Q
1

Recuerde que Q
1
es igual que P
25
, por lo que se procede a calcular el valor del
percentil 25. Se halla el valor de L:

8 5 . 7 30
100
25
~ = = L

El valor del percentil 25 es el valor 8 del grupo de datos ordenados contado
desde el dato menor. As:
75
25 1
= = P Q










UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

ACTIVIDADES DE AUTOEVALUACION DE LA UNIDAD


A AU UT TO OE EV VA AL LU UA AC CI I N N L LE EC CC CI I N N 1 1. .

1. por qu es til la estadstica en el campo para el cual se est preparando?

2. Elabore un mapa conceptual en donde diferencie claramente los conceptos de
Estadstica Descriptiva e Inferencia Estadstica.

3. La estadstica estudia el comportamiento de fenmenos colectivos y nunca de
una observacin individual Qu le dice este principio?

AUTOEVALUACIN LECCION 2

1. Un equipo de ftbol profesional est compuesto de jugadores y cuerpo
Tcnico.

a. Si se desea conocer el promedio de edad de la seleccin Colombia para
establecer una correlacin entre edad y rendimiento fsico, tiene
sentido registrar la edad del cuerpo tcnico?
b. Si slo se est interesado en el grupo de jugadores, qu datos pueden
extraerse de ellos que tengan relevancia en el aspecto deportivo?
c. Si se toma un jugador y se registra la velocidad con que recorre la
cancha y la cantidad de goles anotados en un campeonato, cul de
estas variables es contina y cul es discreta?


2. En las siguientes situaciones, identifique: poblacin, muestra, unidad
estadstica, dato y variable,

a. En la UNAD la matrcula en un ao es de 10.458 estudiantes distribuidos
en las cuatro facultades. Se desea conocer el nmero de estudiantes
matriculados en la facultad de Ciencias Agrarias.
b. Las temperaturas registradas en la ciudad de Pereira el 29 de junio de
2005 entre las 6 horas y las 18 horas.
c. Se realiza un estudio a 250 hogares en la ciudad de Medelln para
conocer si se hace uso adecuado del Manejo Integrado de Residuos
Slidos (MIRS).


3. En cada caso determine si la muestra seleccionada es representativa y
Determine que tipo de muestreo es el ms adecuado


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

- El gerente de mercadeo de una empresa de mquinas institucionales
propone al departamento tcnico la creacin de un nuevo modelo de
procesador de alimentos para comedores de 100 empresas con ms de
500 empleados.

- Una empresa Colombiana de calzado femenino planea lanzar al
mercado un nuevo estilo de botines. Para esto, pregunto a 600 clientes que
visitan sus almacenes en todo el pas.


AUTOEVALUACIN LECCION 3

1. Determinar si cada una de las siguientes variables es cualitativa o cuantitativa.
En caso de ser cuantitativa, clasificarla en discreta o continua.


a. Velocidad de un automvil en kilmetros por hora.
b. Valor total de acciones vendidas cada da en el mercado de valores.
c. El volumen de gasolina que se pierde por evaporacin durante el
llenado de un tanque de combustible.
d. El nmero de molculas en una muestra de gas.
e. La medida de la cantidad de lluvia cada en una localidad en un mes.
f. Candidatos a la presidencia de la Repblica.
g. Programa de televisin favorito
h. Textura de un producto.


2. La siguiente tabla corresponde a los resultados obtenidos por 20 de las 1000
personas que presentaron un examen de ingls. La muestra es aleatoria y ha sido
seleccionada de manera sistemtica. Los porcentajes fueron redondeados al valor
entero ms cercano

12% 30% 87% 21% 60%
20% 46% 58% 72% 35%
52% 81% 68% 18% 9%
59% 63% 34% 92% 55%

a. A que tipo de variable corresponde este estudio?
b. Esta muestra es representativa?
c. De acuerdo con los resultados observados, es posible deducir cul fue el
rendimiento de la poblacin?
d. Que variaciones hara para que este estudio sea ms significativo?




UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

AUTOEVALUACIN LECCION 4

1. El alcalde de la ciudad tiene un proyecto de comedores comunitarios en el cual
los ciudadanos da bajos recursos puedan acceder a una comida diaria otorgada
por la alcalda .Para ello, se realiz una encuesta en uno de los barrios a un grupo
de 48 familias, a las cuales se les pregunt su estrato econmico, obteniendo los
siguientes resultados.

2 1 1 3 1 2 1 2 1 3 2 1
1 2 1 2 3 2 1 1 2 3 2 2
3 2 2 1 1 1 2 1 2 3 1 2
1 2 3 1 2 2 1 2 1 3 1 2

a. Determinar la variable cualitativa a estudiar.
b. Utilizar cada estrato como una clase de la variable para construir la tabla de
frecuencias correspondiente.
c. Elaborar el diagrama de barras correspondiente a la variable
d. Construir el diagrama circular de la variable.
e. Determinar la moda e interpretarla
f. El alcalde de la ciudad abrir un comedor comunitario en cada barrio donde el
60% a ms de los hogares corresponden a un estrato menor o igual a 2. Se
abrir un comedor comunitario en el barrio?


2. El siguiente diagrama de barras muestra corresponde a la produccin de una
empresa de confecciones durante el mes de junio.








UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

a. Cul fue el nmero total de prendas confeccionadas en junio?
b. cul es el porcentaje de produccin correspondiente a cada una de las
prendas?

AUTOEVALUACIN. LECCION 5

En un estudio realizado a un grupo de 56 estudiantes de la UNAD, se cuestion si
se prepara o no para los exmenes. En cada respuesta se reporto:


S: si siempre hay un repaso, AV: si algunas veces se estudia y N: si nunca se
estudia.
Se registro, adems el gnero del estudiante que participa en el estudio, H:
hombre y M: mujer; los resultados fueron:

Gnero Estudia Gnero Estudia Gnero Estudia Gnero Estudia
H S M AV H AV H N
M AV M S H AV H S
M S H N H AV M AV
H S M AV M AV M S
H AV M AV M AV M S
H N M AV M S H AV
M AV M S M AV M S
M AV M S M S H AV
H S H S H AV M AV
M S M AV M AV M S
H AV M AV M N H N
H N M AV H AV M AV
H N M AV M N H AV
H AV M AV M S M AV

a. Construir la tabla de frecuencias para la variable gnero.
b. Construir la tabla de frecuencias para la variable estudia para los exmenes
c. El profesor de matemticas afirma que si mas de un 80% de las personas
siempre repasan para el examen, el resultado ser favorable?
d. Construir una tabla de contingencia para las dos variables.
e. Construir la tabla cruzada de porcentajes correspondiente. Extraer 3
conclusiones de los datos.
f. Si se decide encuestar a un hombre mas, Que resultados esperaran su
respuestas? Usar la moda para justificar el anlisis.






UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

AUTOEVALUACIN. LECCION 6

1. Sealar el literal ms adecuado para las siguientes observaciones:


La investigacin preliminar permite:

a. Establecer la hiptesis
b. determinar la muestra
c. Coordinar el personal del campo


2. Antes que nada, la investigacin estadstica requiere:

a. Que exista un objetivo
b. Que se hayan trazado planes
c. Que se tenga un problema


3. Que comprende en una investigacin estadstica la etapa de planeacin.


AUTOEVALUACIN. LECCION 7

1. Sealar el literal ms adecuado para las siguientes observaciones:

El costo de una encuesta por correo es generalmente:

a. Igual al de una encuesta por medio de entrevistas personales
b. Mayor al de una encuesta por medio de entrevistas personales.
c. Menor al de una encuesta por medio de entrevistas personales
d. Imposible de medir en relacin con el costo de una encuesta por medio de
entrevistas personales.


2. En el diseo del cuestionario en la etapa de recoleccin de la informacin, las
preguntas ms difciles deben colocarse

a. Al principio, para salir inmediatamente de la parte ms difcil
b. En el centro para que sean precedidas y seguidas por preguntas fciles
c. Al final, luego que se haya establecido un clima de confianza, al comenzar por
las ms fciles hasta llegar a las difciles.





UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

3. Contestar verdadero o falso segn el caso:

a. Un formulario se precodifica para agilizar la codificacin.
b. Un formulario debe llevar una sola clase de preguntas.
c. La recoleccin de datos se puede hacer mediante la observacin
d. Despus de realizar el formulario se define el objetivo de la investigacin
e. Se conoce como fuente primaria aquella que obtuvo inicialmente la informacin
directamente de la persona o entidad.
f. Al disear un cuestionario no es de gran importancia la forma como se hace la
pregunta, siempre que est sea clara.


AUTOEVALUACIN. LECCION 8

1. Los siguientes datos representan las calificaciones en una prueba de
coordinacin fsica aplicada a un grupo de 20 personas despus de haber ingerido
una cantidad de alcohol equivalente a 0.1% de su peso. Organice los datos como
una combinacin ordenada.

69 84 52 93 61 74 79 65 88 63
57 64 67 72 74 55 82 61 68 77
2. Elabore una lista de los valores de datos que aparecen en el diagrama de tallo y
hoja siguiente.


Tallo Hojas
4 0 2 3
5 1 1 8 9
6 2 3 3 7 7 9
7 0

3. En un estudio sobre el crecimiento de los varones se obtuvieron estas
observaciones sobre el permetro craneal en centmetros de un nio al nacer.
Elabore un diagrama de tallo y hojas y haga un breve comentario de los resultados
que este arroja.

33.1 34.6 34.2 35.1 34.2 35.6
34.5 35.8 34.5 34.7 34.3 35.2
33.7 36.0 34.2 33.6 34.6 34.3
33.4 34.9 33.8 34.7 35.2 34.6
33.7 34.8 33.9 34.2 35.1 34.2
36.5 34.1 34.0 36.1 35.3 34.3


4. Los siguientes datos muestran el nmero de huevos en cada uno de los nidos
de 30 tortugas sobre la playa de Florida. Existen dos tipos definidos de tortugas en

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

el rea. Un arreglo de tallo y hojas revela la existencia de dos poblaciones? Lo
har uno de doble tallo?


206 167 175 204 123 138
197 187 193 124 137 141
142 192 197 109 126 127
181 171 163 146 124 184
101 201 133 141 152 132


5. Las siguientes son el nmero de llamadas semanal que recibe un call center.


1959 4534 7020 6725 6964 7428
2802 2462 4000 3378 7343 4189
2412 7624 1548 4801 737 5321
6837 8639 7417 6082 10241 962
5099 6627 4484 5633 4148 6588
6472 8327 8225 6142 12130 9166
5749 1801 4632 9359 8973 849
3894 5847 4327


a. Organice los datos como una combinacin ordenada.
b. Determine el dato mayor y el menor
c. Determine el rango
d. Cuntas clases se necesitan para agrupar estos datos?
e. Cul es la amplitud mnima necesaria por clase para cubrir el intervalo,
si se emplean el nmero de clases hallado en el numeral d?
f. Verifique si es necesario hallar un nuevo rango y hacer el ajuste de
exceso.
g. Determine los intervalos de clase para este conjunto de datos
h. Halle los lmites reales de dichos intervalos.
i. Construya la tabla de frecuencias absoluta, relativa y acumulada
ascendente y descendente.

AUTOEVALUACIN LECCIN 9


1. Los siguientes datos corresponden al total de ventas semanales (en cientos de
dlares) de una tienda de accesorios para dama. Construya una tabla completa de
distribucin de frecuencias agrupadas. Qu concluye?


192.5 192.1 98.7 99.1 99.6
102.3 191.5 93.1 102.8 96.4

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

102.1 97.8 97.6 95.4 94.2
90.5 103.4 92.9 102.5 97.3
99.8 96.3 113.2 98.5 114.1

2. Los siguientes son los nmeros de venados observados en 72 sectores de tierra
en un conteo de vida silvestre. Complete la siguiente tabla de distribucin de
frecuencias.

18 8 9 22 12 16 20 33 15 21 18 13
13 19 0 2 14 17 11 18 16 13 12 6
8 12 13 21 8 11 19 1 14 4 19 16
2 16 11 18 10 28 15 24 8 20 6 7
21 0 16 12 20 17 13 20 10 16 5 10
15 10 16 14 29 17 4 18 21 10 16 9


Intervalo de
clase
Marca de
clase
Frecuencia
absoluta
Frecuencia
relativa
Frecuencia
absoluta
acumulada
ascendente
Frecuencia
relativa
acumulada
ascendente
0 4
5 9
10 14
15 19
20 24
25 29
30 - 34


3. La siguiente es la distribucin de los pesos de 125 muestras de minerales
recolectadas en una investigacin de campo.

Peso en gramos
Nmero de
especimenes
0.0 19.9 16
19.9 39.9 38
39.9 59.9 35
59.9 79.9 20
79.9 99.9 11
99.9 119.9 4
119.9 139.9 1
TOTAL 125

Si es posible, encuentre cuntas de las muestras pesan:
a. Como mximo 59.9 gramos.
b. Ms de 59.9 gramos.
c. Ms de 80.0 gramos.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

d. 80.0 gramos o menos.
e. Exactamente 70.0 gramos.
f. Cualquier valor de 60.0 a 100 gramos.
g. Qu porcentaje pesa menos de 79.9 gramos?
h. Qu porcentaje pesa ms 19.9 gramos?
i. Qu porcentaje pesa exactamente 39.9?

4. La siguiente tabla corresponde a la estatura (en centmetros) de los estudiantes
de un grupo de quinto grado. Complete la tabla de frecuencias agrupadas y a
partir de este, emita conclusiones.

Estatura
(en centmetros)
Nmero de
estudiantes
Frecuencia
relativa
Marca de
clase
Frecuencia
absoluta
acumulada
ascendente
125 129 1
129 133 4
133 137 9
137 141 24
141 145 28
145 149 22
149 153 12
Total 100

AUTOEVALUACIN LECCION 10.

1. Construya un diagrama de frecuencias absolutas y de frecuencias absolutas
acumuladas con los datos reportados en la tabla 2.1., sobre el nmero de
egresados de la UNAD en el perodo 1994-2004.


2. Con la tabla de frecuencia construida en el ejercicio 2.5. del tema 2.3., sobre el
nmero de llamadas semanal que se recibe en un call center, construya un
histograma de frecuencias absolutas, un polgono de frecuencias absolutas y las
respectivas ojivas ascendente y descendente.


3. Un profesor decide registrar el mes de nacimiento de cada uno de los 40
estudiantes del tercer grado. Construya una tabla de frecuencias relativa y un
diagrama de barras para los datos recolectados.

Junio, julio, noviembre, abril, enero, febrero, septiembre, julio, agosto,
septiembre, diciembre, julio, junio, noviembre, mayo, abril, febrero, agosto,
junio, mayo, octubre, agosto, noviembre, enero, junio, abril, septiembre,

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

diciembre, agosto, junio, julio, marzo, diciembre, marzo, junio, noviembre,
septiembre, junio, marzo, noviembre.


4. Construya un diagrama de barras para la tabla 2.2. en donde se clasifica el
nmero de estudiantes por CEAD en la Seccional Occidente durante el primer
semestre de 2005. Elabore tambin un pictograma.


5. La siguiente tabla indica las superficies de los distintos continentes del mundo
en kilmetros cuadrados (km
2
). Represente estos datos en un diagrama circular.


Continente rea en km
2

Asia 44`391.200
frica 30`244.000
Norteamrica 24`247.000
Suramrica 17`821.000
Antrtica 13`338.500
Europa 10`354.600
Oceana 8`547.000

6. Elabore por lo menos dos grficas adecuadas para presentar la siguiente
informacin: Durante 5 meses un escritor escribi una novela de 198 pginas de la
siguiente manera: en el primer mes, 10.5% del total; en el segundo mes, 12.3%
del total; en el tercer mes; 20.8%, en el cuarto mes, 17.4% del total y en el ltimo
mes, el 39% restante.


7. Dibuje en un grfico de lnea las ventas de un almacn en el primer semestre
del ao para sus tres sucursales en el pas. El reporte contable fue:


Cartagena: $3452.000 en enero; $2125.600 en febrero; $2`058.400 en
marzo; $3`032.300 en abril; $4`875.600 en mayo; $5`468.700 en junio.
Medelln: $2301.500 en enero; $2100.600 en febrero; $1`998.400 en
marzo; $2`932.700 en abril; $3`985.100 en mayo; $4`500.700 en junio.
Bogot: $4750.500 en enero; $3400.100 en febrero; $2`985.600 en
marzo; $3`002.700 en abril; $4`923.100 en mayo; $6`130.700 en junio.
Haga un pequeo reporte escrito de las fluctuaciones de venta en las tres
sucursales al administrador del almacn.
El administrador del almacn le solicita conocer las ventas totales mes a
mes y le pide que entregue un informe escrito y grfico de los resultados.
Qu tipo de grafico usara? Elabrelo y escriba un pequeo reporte.



UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva


AUTOEVALACION LECCIN 11

1. Realizar un mentefacto conceptual de las siguientes medidas estadsticas
univariantes
a. Medidas de tendencia central
b. Medidas de posicin


2. Cualquier medida aplicada a las caractersticas de las unidades en la
poblacin se denominada:
a. Parmetro
b. Estimador
c. Estadstico
d. Variable

3. Explique con sus propias palabras que diferencia existe entre estimador y
parmetro

AUTOEVALUACION LECCIN .12

1. En la siguiente serie de nmeros indicar:

$4.000 $4.500 $5.000 $5.000 $8.250
$9.300 $9.700 $12.000 $12.500 $35.000

a. La media
e. Qu valor de esta serie afecta a la media aritmtica?

.2. Calcule la media aritmtica,

a. 6, 5, 7, 6, 5, 4, 7, 4, 6, 8, 7, 6
b.
X f
4 8
5 12
6 11
7 20
8 14
9 10
10 7
n 82


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

c.
Intervalos de clase Frecuencia
39 49 5
49 59 8
59 69 10
69 79 9
79 89 8
89 99 6
99 109 4
Total 50

3. De un grupo de 100 obreros en una fbrica, 40 trabajan en el da y
60 en la noche. Se sabe que el salario promedio de los 100 obreros es
$407.200 y que los del turno del da reciben en promedio $28.000 menos
que los trabajadores nocturnos. Cul es el salario promedio en cada
grupo?

4. Carlos obtiene calificaciones parciales de 65, 83, 80, y 90. En el
examen final recibe una calificacin de 92. Calcule la media ponderada, si
cada uno de los exmenes parciales cuenta el 15% y el examen final
cuenta 40% de la calificacin total.

5. Antes del examen final de Estadstica, un estudiante obtiene
calificaciones de 3.5 en el 20%, 2.0 en el 30%, 4.2 en el 10%. Si la
evaluacin final equivale al 40% restante, que calificacin necesita para
obtener un promedio final de 3.5?

6. En una industria se ha controlado el tiempo que tardan tres obreros
en ensamblar un motor. Uno demora 6 horas, otro 8 horas y un tercero
demora 5 horas. Halle el rendimiento de un obrero tipo, que sirva de base
para anlisis financieros.

7. Un hombre viaja desde Bogot hasta Acacas a una velocidad de 60
km/h. Para evitar la noche en carretera, este decide acelerar a 80 km/h para
llegar de nuevo a Bogot. Cul es la velocidad promedio del viaje
completo?

8. los sueldos de 5 personas en un almacn son $382.000, $365.000,
$358.000, $380.000. Calcular las desviaciones respecto ala media.








UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

AUTOEVALUACION LECCIN 13.

Sealar el literal ms adecuado para la siguiente observacin:
1. La mediana generalmente se define como aquel valor de la variable:

a. Que supera a la mxima frecuencia
b. Que no supera a la mitad de las observaciones
c. Que presenta la mxima frecuencia
d. Que supera la mitad y al ismo tiempo es superado por la mitad de las
observaciones
e. Que presenta el menor grado de frecuencia.


2. En la siguiente serie de nmeros indicar:

$4.000 $4.500 $5.000 $5.000 $8.250
$9.300 $9.700 $12.000 $12.500 $35.000

a. La mediana


3. Calcule la mediana de los siguientes conjuntos de datos:

a. 6, 5, 7, 6, 5, 4, 7, 4, 6, 8, 7, 6

b.
X F
4 8
5 12
6 11
7 20
8 14
9 10
10 7
n 82
c.
Intervalos de clase Frecuencia
39 49 5
49 59 8
59 69 10
69 79 9
79 89 8
89 99 6
99 109 4
Total 50


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

AUTOEVALUACIN LECCIN 14

Sealar el literal ms adecuado para la siguiente observacin:
1.La moda generalmente se define como aquel valor de la variable que:
a. Se ve afectada por valores extremos
b. Ms se repite
c. Tiene la menor frecuencia
d. Supera a la menor de las observaciones
e. Tiene el menor grado de variabilidad

2. En la siguiente serie de nmeros indicar:

$4.000 $4.500 $5.000 $5.000 $8.250
$9.300 $9.700 $12.000 $12.500 $35.000

c. La moda

3. Calcule moda de los siguientes conjuntos de datos:

a. 6, 5, 7, 6, 5, 4, 7, 4, 6, 8, 7, 6

b.
X f
4 8
5 12
6 11
7 20
8 14
9 10
10 7
n 82


c.
Intervalos de clase Frecuencia
39 49 5
49 59 8
59 69 10
69 79 9
79 89 8
89 99 6
99 109 4
Total 50



UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

4. Determinar si en los siguientes conjuntos de observaciones, la moda es nica
(unimodal) , bimodal, o si por el contrario no existe:

a. 2, 4, 7, 7, 7, 9, 10, 10,12, 15
b. 2, 4, 7, 9, 10, 11, 14, 16, 18, 20 10,10,18
c. 2, 4, 4, 4, 7, 9, 10, 10, 10, 18

AUTOEVALUACION LECCIN 15

1. La secretaria de transito decidi realizar una medicin de los ndices de
velocidad en un punto a las afueras de una ciudad. La medicin fue hecha en las
horas en las cuales se presentaba el mayor nmero de accidentes en dicho punto.
Los resultados de la medicin se registran a continuacin

85 112 62 75 84 67 75
92 106 56 85 72 95 103
120 123 77 80 86 91 64
88 90 83 94 99 100 105
76 115 124 91 87 128 93
105 117 123 118 111 128 116
125 94 83 72 77 130 122
126 86 87 90 114 118 71

a. Calcular el nmero de intervalos y construir una tabla de frecuencias que
describa la situacin.
b. Hallar los cuartiles y sacar varias conclusiones del estudio.
c. Hallar: D2, D4, P22 y P94. Interpretar cada resultado.

2. El factor de crecimiento promedio de dinero compuesto con tasa de inters
anual del 10%, el 8%, el 9%, el 12% y el 7% se obtiene determinando la media
geomtrica de 1.10, 1.08, 1.09, 1.12 y 1.07. Calcule el factor de crecimiento
promedio.

3. Para la siguiente tabla de distribucin de frecuencias agrupadas, determine los
tres cuartiles tanto terica como grficamente.

Intervalos de clase Frecuencia
39 49 5
49 59 8
59 69 10
69 79 9
79 89 8
89 99 6
99 109 4
Total 50

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva


AREA:

ESTADSTICA

Escuela de Ciencias Bsicas Tecnologa e
Ingeniera

CIENCIAS BSICAS

CURSO:

Inferencia Estadstica
UNIDAD: Conceptos Preliminares y medidas de Tendencia Central.
CAPTULO: Investigacin Estadstica
LECCIN: Presentacin de la Informacin

NUMERO DE LA PRCTICA 1
NOMBRE DE LA PRCTICA Diagramas Estadsticos
NOMBRE DEL SOFTWARE Excel
Libre: ______x_____ Licenciado: ____________

Aspectos Tericos:
En estadstica denominamos grficos o diagramas a aquellas imgenes que,
combinando la utilizacin de sombreado, colores, puntos, lneas, smbolos,
nmeros, texto y un sistema de referencia (coordenadas), permiten presentar
informacin cualitativa y cuantitativa. La utilidad de los grficos es doble, ya que
pueden servir no slo como sustituto a las tablas, sino que tambin constituyen
por s mismos una poderosa herramienta para el anlisis de los datos, siendo en
ocasiones el medio ms efectivo no slo para describir y resumir la informacin,
sino tambin para analizarla.
La calidad de un grfico estadstico consiste en comunicar ideas complejas con
precisin, claridad y eficiencia, de tal manera que:
- Induzca a pensar en el contenido ms que en la apariencia
- No distorsione la informacin proporcionada por los datos
- Presente mucha informacin (nmeros) en poco espacio
- Favorezca la comparacin de diferentes grupos de datos o de relaciones
entre los mismos.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

A su vez los grficos se integran dentro de un contexto de presentacin, por
ejemplo en papel o proyectados en una pantalla en una presentacin oral, y deben
estar adecuadamente diseados para el soporte al que van destinados.
Aunque como norma general en los grficos cientficos los adornos sobran,
tampoco hay que olvidar que a menudo tambin cumplen una misin esttica,
ayudando de esa forma a una presentacin que quizs sera demasiado rida slo
con texto y nmeros. Pero entonces esa funcin esttica debe ser comprendida y
valorada, quedando perfectamente integrada en el contexto de lo que se presenta,
y no puede ser una disculpa para distorsionar su contenido.

Ejemplo 1: (Diagrama de barras)

El gerente de un banco ha detectado que en el ltimo mes ha bajado el nmero
de clientes por eso solicita a 100 personas que van a una de sus sucursales, que
respondan en una pequea encuesta: cul aspecto consideran que el banco
debe mejorar? Las respuestas fueron las siguientes:

ASPECTOS FRECUENCIA
Atencin 35
Cajeros 15
Horarios 20
Servicio 30


Solucin:

Trasladamos la tabla de frecuencias a una hoja de clculo y la seleccionamos,
damos click en la pestaa insertar columna y elegimos un tipo de diagrama;
seleccionamos un diseo de grafico de la barra de herramientas y damos nombre
a los ejes y al Diagrama.





UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva













UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

En estilo de diseo puede personalizar su diagrama de barras.




Diagrama Circular









UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva







2 EJEMPLO (Histograma de frecuencias-Datos Agrupados)
En La ciudad de Bogot se realizo una encuesta y se registro el peso de los
trabajadores de cierta empresa
Variable: Peso: Cuantitativa-Continua.Los resultados fueron los siguientes:
65,3 70,5 85,6 90,2 - 93,4 110,5 112,4 78,4 95,3 87,8 100,5 120,4 88,8
90,6 98,4- 78,9 89,7 68,2 78,4 - 80,5


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

NOTA: antes de iniciar el proceso se debe verificar si en la pestaa Datos en
Excel aparece (anlisis de datos), de lo contrario se debe aadir como un
complemento, teniendo en cuenta la siguiente ruta:

Click derecho sobre un espacio en blanco en la barra de
herramientas<<Personalizar barra de herramientas de acceso rpido<<
complementos<<Herramientas para anlisis VBA << Ir << seleccionamos
herramientas para anlisis y Aceptar.

Trasladamos los datos a una hoja de clculo y la seleccionamos, damos click en la
pestaa datos anlisis de datos y elegimos Histograma, se abre un cuadro de
dialogo: En rango de entrada seleccionamos los datos y en rango de salida
elegimos una celda de la hoja de clculo (donde aparecer (la tabla de
frecuencias).







UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva


Posteriormente seleccionamos la tabla de frecuencias, para hacer la grafica
damos Click en :INSERTARCOLUMNACOLUMNA EN 3D. sobre una de las
barras del diagrama dar click derecho y seleccionar DAR FORMATO A SERIE DE
DATOS, reducimos el ancho del intervalo a cero, teniendo en cuenta que la
variable estudiada es cuantitativa continua; asi mismo seleccionamos COLOR
DEL BORDE-LINEA SOLIDACOLOR NEGRO.
Finalmente le damos titulo al diagrama y alos ejes.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

3. EJEMPLO. (Polgono de frecuencias)

El departamento mdico de una universidad realiza el registro del peso de los
estudiantes que hacen parte de los equipos que competirn en los juegos
interuniversitarios.
A pesar que los datos han sido aproximados a la libra ms cercana, la variable
relacionada en este caso es CUANTITATIVA - CONTINA.
A continuacin se presenta la tabla de frecuencia para la variable peso:

INTERVALO DE CLASE MARCA DE CLASE ( Xi) FRECUENCIA
103 - 112 107,5 5
113 - 122 117,5 6
123 - 132 127,5 9
133 - 142 137,5 11
143 - 152 147,5 11
153 - 162 157,5 7
163 - 172 167,5 1


Trasladamos los datos a una hoja de clculo y seleccionamos la columna de las
frecuencias para realizar la grafica , damos click en la pestaa INSERTAR
LINEA-y elegimos un tipo , seleccionamos un diseo de grafico de la barra de
herramientas y damos nombre a los ejes y personalizamos el Diagrama.









UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva






CLICK DERECHO SOBRE TITULO DEL EJE---SELECCIONAR DATOS
En seleccionar origen de datos se etiqueta el eje horizontal seleccionando editar y
los datos pertenecientes a la marca de clase.
Se da el titulo al diagrama y a los ejes.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva










UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

Ejercicios:

1. El entrenador del equipo de natacin ha decidido clasificar a sus deportistas
teniendo en cuenta el estilo en el cual su rendimiento es muy alto. A continuacin
se presentan los resultados obtenidos:

Pecho Mariposa Espalda Pecho Pecho Mariposa Libre Pecho
Espalda Libre Libre Espalda Espalda Libre Libre Espalda
Mariposa Libre Mariposa Mariposa Mariposa Espalda Pecho Libre
libre espalda Pecho pecho libre Pecho Espalda libre

a. Elaborar el diagrama de barras correspondiente.
b. Construir un diagrama circular que represente la variable.
c. Escribir dos conclusiones a partir del grafico.

2. Para verificar el efecto de un nuevo pesticida aplicado a un cultivo de caf, se
seleccion una muestra de 42 matas y se les midi su altura en centmetros
despus de 3 meses de haber sido plantadas y regadas con el producto.
Los resultados son los siguientes:

25,4 25,2 42,3 38,7 24 35,5 42,3
18,6 34,7 28 29,1 19,4 30,6 37,5
25,8 32,6 34,3 27,9 31,6 32,8 36
37,7 42,8 29,4 36,2 28,5 38,6 40,5
16,8 21,3 35,4 28 32,9 39,7 20
37,2 38,3 24,3 39 23,6 26,5 31,4

a. Realizar un histograma de frecuencias para la variable: altura.
b. Escribir dos conclusiones a partir del grafico.

3. Una empresa de desechables va a producir un nuevo tipo de envase, para
lquidos. Por tal razn, midi
El volumen de 60 recipientes que se usaron en una nueva prueba de aceptacin


VOLUMEN
(mm
3
)
Frecuencia
0 5 4
5 10 8
10 15 10
15 20 11
20 25 12
25 - 30 15
a. Construir un polgono de frecuencias para la variable Volumen
b. Escribir dos conclusiones a partir del grafico.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

BIBLIOGRAFA DE LA UNIDAD


BEJARANO BARRERA, Hernn (1995). Estadstica Descriptiva. Santa fe de
Bogot: UNISUR.

CHRISTENSEN, Howard B. (1999). Estadstica Paso a Paso. Mxico: Editorial
Trillas.

MARTNEZ BENCARDINO, Ciro (2004). Estadstica Bsica Aplicada. Santa fe de
Bogot: ECOE Ediciones.

MARTNEZ BENCARDINO, Ciro (2003). Estadstica y Muestreo. Santa fe de
Bogot: ECOE Ediciones.

MILTON, J. Susan (1999). Estadstica para biologa y ciencias de la salud. Madrid:
McGraw Hill Interamericana.

PORTUS GOVINDEN, Lincoyn (2001). Introduccin a la Estadstica. Segunda
edicin. Santa fe de Bogot. McGraw Hill.

PORTILLA CHIMAL, Enrique (1980). Estadstica, Primer Curso. Bogot: Nueva
Editorial Interamericana.

SPIEGEL, Murria R. (1991). Estadstica. Serie de compendios Schaum. Mxico:
McGraw Hill.

SMITH, A. Stanley. (1992). Curso de Estadstica Elemental para las ciencias
aplicadas. Primera edicin. Santa fe de Bogot. Editorial Addison Wesley
Iberoamericana.

http://www.educarchile.cl/eduteca/estadistica/

http://www.aulafacil.com/CursoEstadistica/CursoEstadistica.htm

http://www.uaq.mx/matematicas/estadisticas/xu3.html

http://www.ing.unp.edu.ar/estadisitio/estaddes.htm

http://www.elosiodelosantos.com/descriptiva.html

http://thales.cica.es/rd/Recursos/rd98/Matematicas/01/matematicas-01.html
http://148.216.10.83/estadistica/descriptiva.htm

http://www.eneayudas.cl/estentrada.htm

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

http://www.universidadabierta.edu.mx/SerEst/MAP/METODOS%20CUANTITATIV
OS/Pye/tema_11.htm

http://html.rincondelvago.com/estadistica_15.html

http://www.hrc.es/bioest/M_docente.html#tema2

http://personal5.iddeo.es/ztt/Tem/T11_Estadistica_Introduccion.htm




























UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva









Unidad Didctica Dos



MEDIDAS DE DISPERSIN Y
ESTADSTICAS BIVARIANTES










UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva


UNIDAD 2. MEDIDAS DE DISPERSIN
Y ESTADSTICAS BIVARIANTES
























Leccin 16 Rango o Recorrido
Leccin 17 Varianza
Leccin 18 Coeficiente de variacin
Leccin 19 Puntaje tpico o
estandarizado
Leccin 20 Medidas de asimetra y
apuntamiento
Leccin 21 Regresin y correlacin
Leccin22 Diagrama de dispersin
Leccin 23 Regresin lineal simple
Leccin 24 Correlacin
Leccin 25 Regresin multiple
Leccin 26 Construccin de nmeros
ndice
Leccin 27 Tipos de nmeros ndice
Leccin 28 ndices Simples
Leccin 29 ndices compuestos
Leccin 30 Uso de los nmeros indice
CAPITULO 4.
MEDIDAS DE DISPERSIN
CAPITULO 5. MEDIDAS
ESTADSTICAS BIVARIANTES
CAPITULO 6.
NMEROS INDICE

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva



INTRODUCCIN A LA UNIDAD



La Unidad Didctica 1 se dedic a explicar los mtodos que deben aplicarse
en una investigacin estadstica tales como la planeacin, recoleccin,
organizacin y presentacin de ella. Esta unidad tiene como propsito indicar otros
mtodos para medir e interpretar el comportamiento de un conjunto de datos
dados.

Se ha visto que tanto las tablas como las muy diversas formas de graficar la
informacin describen fenmenos de una poblacin o muestra, pero no siempre lo
hacen en forma satisfactoria; es all donde se hace visible la importancia de las
medidas estadsticas bien sean univariantes, en donde interviene una variable, o
bivariantes cuando lo hacen dos.

Esta Unidad Didctica se ha dividido en tres grandes captulos: Medidas
Estadsticas Univariantes que pueden ser medidas de tendencia central vistas en
el capitulo 3, medidas de dispersin y de asimetra, Medidas Estadsticas
Bivariantes y nmeros ndices, obedeciendo al nmero de variables que
intervienen en estos clculos aritmticos. En el primer captulo, se considerarn
las medidas: de dispersin o variabilidad, de asimetra o de deformacin y de
apuntamiento o curtosis.

En los captulos cinco y seis, se estudiar el comportamiento de dos
variables, a fin de determinar si existe alguna relacin entre s y de cuantificar
dicho grado de relacin. Se desarrollarn aqu los conceptos de regresin y
correlacin de dos variables y el concepto y usos de los nmeros ndices.










UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

OBJETIVOS ESPECFICOS


- Ejecutar las operaciones indicadas por la notacin sumatoria y productoria.

- Desarrollar destrezas para calcular algunas medidas de tendencia central.

- Interpretar las medidas de tendencia central y comprender sus aplicaciones.

- Comparar las medidas de tendencia central y seleccionar la ms til segn las
circunstancias.

- Desarrollar destrezas para calcular algunas medidas de dispersin.

- Comparar las medidas de dispersin y seleccionar la ms til para una
determinada aplicacin.

- Reconocer que las medidas de dispersin complementan la descripcin que
proporcionan las medidas de tendencia central.

- Interpretar y utilizar las medidas de dispersin.

- Identificar los tipos de asimetra y apuntamiento en una distribucin de datos.

- Identificar hechos que admitan intuitivamente un comportamiento lineal simple.

- Interpretar y manejar los conceptos de regresin y correlacin.

- Dibujar y aplicar grficos de dispersin.

- Calcular el coeficiente de correlacin entre dos variables.

- Calcular la ecuacin de regresin para dos variables.

- Identificar e interpretar correctamente nmeros ndices.

- Desarrollar destrezas necesarias para elaborar y aplicar nmeros ndices en
circunstancias especficas.








UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

2. UNIDAD

MEDIDAS DE DISPERSIN Y ESTADSTICAS BIVARIANTES


2.1 CAPITULO 4. MEDIDAS DE DISPERSIN Y ASIMETRA

Se vea en el tema anterior la tendencia que tiene un conjunto de datos
dado a agruparse hacia el centro, pero tambin se descubri que los datos
extremos podan estar bastante alejados de esa tendencia central. Medir esa
variacin respecto a los promedios es un clculo importante en el tratamiento
estadstico de datos, medidas a las que se les denomina de dispersin o de
variacin.


La informacin que arrojan las medidas de tendencia central no siempre
proporcionan conclusiones contundentes frente al conjunto de datos. Por ejemplo,
a un profesor de Estadstica poco le dice la media aritmtica al afirmar que el
promedio de los estudiantes tiene el curso en 3.0 ya que no le termina de aclarar
si el grupo completo est muy cerca de esa nota, sea por encima o por debajo de
ella, o si al contrario existe tanta variabilidad en las notas de los estudiantes que
puede ir desde 1.0 hasta 5.0. Se estudiar a continuacin cmo resolver este tipo
de problemas y qu medidas de dispersin usar.


Por ultimo se mencionarn unas nociones bsicas sobre curvas
asimtricas.


2.1.1 LECCIN 16 RANGO O RECORRIDO

Sobre esta medida ya se haba trabajado en la construccin de las tablas
de frecuencia agrupada. Se trata de la diferencia entre el lmite superior y el lmite
inferior de un conjunto de datos. Es la medida de dispersin ms fcil de calcular,
slo requiere que los datos estn ordenados. Pero es poco usada como medida
de dispersin porque se deja afectar fcilmente de los valores extremos de poca
frecuencia.


Un profesor de Estadstica tiene a su cargo dos grupos de 40 estudiantes cada
uno. La siguiente tabla de frecuencias reporta las calificaciones del grupo A y
grupo B de estudiantes, despus de la primera evaluacin. Hay diferencia alguna
entre estos dos grupos?


E EJ JE EM MP PL LO O 1 16 6. .1 1
1 11 10 0. .1 11 10 0. .1 1

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

Lo primero que se hace para verificar diferencias entre ambos grupos es calcular
su media aritmtica.

36 . 4
40
4 . 174
36 . 4
40
4 . 174
= = = = = =

n
fX
x
n
fX
x
B A

0 . 1 0 . 4 0 . 5 0 . 1 0 . 4 0 . 5 = = = = RangoB RangoA



Tabla 4.1.
Distribucin de frecuencias
de las calificaciones de estudiantes de Estadstica


Calificacin
Frecuencia
A B
4.0 1 2
4.1 2 9
4.2 3 7
4.3 16 4
4.4 10 5
4.5 4 4
4.6 3 3
4.7 0 2
4.8 0 1
4.9 0 1
5.0 1 2
Total 40 40

Tanto la media como el rango de ambos conjuntos de datos son iguales. Sin
embargo, ellos se distribuyen de forma muy diferente. Observe que el grupo A es
ms compacto hacia las notas entre 4.5 y 4.0. La nota de 5.0 de un solo
estudiante interfiere muchsimo en el anlisis verdadero del comportamiento
acadmico de los estudiantes del grupo A.


Analice qu tanto cambian los valores de la media y el rango del grupo A de
estudiantes si se elimina la nota de 5.0, observe que un dato extremo hace variar
completamente el conjunto de datos y demuestra que, comparado con otro, el
clculo de la media y el rango son insuficientes para arrojar anlisis certero de
comparacin.

6 . 0 0 . 4 6 . 4 34 . 4
39
4 . 169
= = = = =

RangoA
n
fX
x
A


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

En cambio, las calificaciones del grupo B se distribuyen mejor alrededor de todo el
rango de datos.


Para eliminar la influencia de los extremos en el clculo del rango, es
comn hacer uso del rango intercuartlico que consiste en determinar la
diferencia entre el tercer cuartil y el primero.

1 3
Q Q Q
D
=

El rango semiintercuartlico o desviacin cuartil se obtiene calculando el
rango intercuartlico y dividiendo este entre dos.

2
1 3
2
Q Q
Q
D

=

Ambas medidas son ms confiables como variabilidad comparadas con el
rango, sin embargo presentan inconvenientes para su uso puesto que no
consideran todos los valores de la distribucin y puede ocurrir que los valores
inferiores a Q
1
o superiores a Q
3
estn o muy compactos o muy dispersos sin que
esto afecte a Q
D
y no sea reflejado en su resultado.


De la misma manera, el rango interdecil corresponde a la diferencia entre
el noveno y el primer decil:

1 9
D D D
R
=


2.1.2 LECCIN 17 VARIANZA Y DESVIACIN ESTNDAR

Es una de las medidas ms usadas en estadstica, ella a su vez da origen a
otra mucho ms significativa: la desviacin tpica o estndar. Se define como la
media aritmtica de los cuadrados de las desviaciones respecto a la media
aritmtica. Se simboliza s
2
para la varianza muestral y
2
para la varianza
poblacional.


Para datos no agrupados:

2
2
2
2
2
) (
x
n
X
s
n
x X
s =

=





UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

Para datos agrupados:

2
2
2
2
2
) (
x
n
X f
s
n
x X f
s

=




La varianza indica la desviacin de los datos respecto a la media. Para
comparar dos distribuciones, en cuanto a su variabilidad absoluta, se pueden
utilizar sus varianzas de manera que el resultado indique cul de ellas es ms
homognea o cul es ms heterognea.


Se quiere conocer la verdadera calidad de produccin en dos empresas
fabricantes de tornillos para fuselaje. La siguiente tabla indica las longitudes de
una muestra de tres tornillos tomados al azar. Haga un anlisis de variabilidad de
ambas empresas.


Empresa A 1,95 pulg. 2,03 pulg. 2,02 pulg.
Empresa B 1,70 pulg. 1,80 pulg. 2,50 pulg.

Es fcil calcular que ambas empresas tienen una media de 0 , 2 = x pulgadas. Pero
las muestras difieren mucho en sus tamaos, para visualizar mejor esto se
analizan sus respectivas varianzas. Tenga en cuenta que los datos no estn
agrupados, por lo que se hace uso de la primera ecuacin:

127 , 0 0 , 2
3
50 , 2 80 , 1 70 , 1
001 , 0 0 , 2
3
02 , 2 03 , 2 95 , 1
2
2 2 2
2
2
2
2
2 2 2
2
2
2
=
+ +
= =
=
+ +
= =

x
n
X
s
x
n
X
s
B
A


Observe que la empresa A tiene una variacin mayor respecto a la empresa B en
cuanto a la calidad en la fabricacin de tornillos. Esto quiere decir que la empresa
B vara mucho, en su produccin, el tamao de sus tornillos mientras que la
empresa A mantiene un rango constante en el tamao de los tornillos que
produce.


Las unidades de la varianza son los cuadrados de las unidades de los
datos: pesos cuadrados, alumnos cuadrados, etc., medidas difciles de interpretar.
De all que la varianza de origen a la desviacin tpica o estndar.


E EJ JE EM MP PL LO O 1 17 7. .1 1
1 11 10 0. .1 11 10 0. .1 1

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

2.1.2.1 Desviacin tpica o estndar

Esta medida se obtiene extrayendo la raz cuadrada de la varianza,
tomando siempre el valor positivo. Se simboliza por s en la muestra y en la
poblacin. Esta es la medida de dispersin ms conocida y ms utilizada en el
anlisis de datos estadsticos.

Para datos no agrupados:

2
2 2
) (
x
n
X
s
n
x X
s =

=



Para datos agrupados:

2
2 2
) (
x
n
X f
s
n
x X f
s

=






Despus de estudiar los conceptos de varianza y desviacin estndar, se est en
capacidad de hacer un anlisis mucho ms riguroso de la variabilidad de las
calificaciones de los estudiantes de Estadstica del ejemplo 16.1.


Tabla 4.2.
Distribucin de frecuencias
de las calificaciones de estudiantes de Estadstica


Calificacin
Frecuencia
X
2

fX
2

A B A B
4.0 1 2 16 16 32
4.1 2 9 16,81 33,62 151,29
4.2 3 7 17,64 52,92 123,48
4.3 16 4 18,49 295,84 73,96
4.4 10 5 19,36 193,6 96,8
4.5 4 4 20,25 81 81
4.6 3 3 21,16 63,48 63,48
4.7 0 2 22,09 0 44,18
4.8 0 1 23,04 0 23,04
4.9 0 1 24,01 0 24,01
5.0 1 2 25 25 50
Total 40 40 223,85 761,46 763,24
E EJ JE EM MP PL LO O 1 17 7. .2 2
1 11 10 0. .1 11 10 0. .1 1

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

Para el grupo A se tiene:

164 . 0 0269 . 0 36 . 4
40
46 . 761
2 2
2
= = =

=

x
n
X f
s
A



Y para el grupo B de estudiantes, se tiene:

267 . 0 0714 . 0 36 . 4
40
24 . 763
2 2
2
= = =

=

x
n
X f
s
B



La varianza del grupo B es mayor que la del grupo A, se dice entonces que los
datos del grupo B tiene mayor variabilidad que los del grupo A; en otras palabras,
en el grupo B hubo mayor estabilidad en las notas alrededor de su media: 4.36.

Es importante tener en cuenta las siguientes propiedades de la desviacin
estndar:


- La desviacin estndar es una medida de variacin de todos los valores con
respecto a la media.
- El valor de la desviacin estndar siempre es positivo y slo es igual a cero
cuando los valores de los datos son iguales.
- Si el valor de la desviacin estndar es muy grande, este indica mayor
variacin en el grupo de datos.
- El valor de la desviacin estndar puede incrementarse drsticamente cuando
se incluye uno o ms datos distantes.
- Las unidades de la desviacin estndar son las mismas de los datos originales
(pulgadas, centmetros, etc.)


2.1.3 LECCIN 18 COEFICIENTE DE VARIACIN Y DESVIACIN MEDIA

Las medidas de dispersin que se han estudiado son medidas absolutas y
se expresan en las mismas unidades con las que se mide la variable. Cuando se
comparan dos o ms conjuntos de datos con unidades de medida de observacin
diferentes, no es posible compararlas con estas medidas absolutas. Si las
unidades de observacin de los conjuntos de datos son iguales, estos pueden
compararse usando cualquiera de estos estadsticos (como en el ejemplo anterior)
pero siempre y cuando la media aritmtica sea la misma, de lo contrario estas
apreciaciones no aportarn una buena conclusin sobre las series que se
comparan.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

Para efectuar comparaciones entre series de observaciones distintas, en
estadstica se usa el coeficiente de variacin y as se puede determinar cul
serie tiene mayor o menor variabilidad relativa.


% 100 =
x
s
CV


Cuando el coeficiente de variacin es muy alto se dice que la media
aritmtica no es lo suficientemente representativa en la distribucin.


2.1.3.1 Desviacin media

Se define como la media aritmtica de las desviaciones respecto a la
media, tomadas en valor absoluto
5
. Es una de las medidas ms fciles de calcular
y por ello, muy usada. Ella toma todos los valores de la variable y es menos
afectada que la desviacin estndar por los valores extremos. Su valor siempre
ser menor que la desviacin estndar.

Para datos no agrupados:

n
x X
DM


=


Para datos agrupados:

n
x X f
DM


=


Cuanto mayor sea el valor de la desviacin media, mayor ser la dispersin
de los datos; sin embargo este valor no proporciona una relacin matemtica
precisa con la posicin de un dato dentro de la distribucin y, puesto que se toman
los valores absolutos, mide la desviacin de una observacin sin determinar si
est por encima o por debajo de la media aritmtica.



5
Recuerde que el valor absoluto de un nmero indica siempre su valor positivo. Por ejemplo:
2 2 =
; 2 2 = . Si requiere repasar este tema, se recomienda trabajar en los mdulos de
Matemticas Bsicas o lgebra, Trigonometra y Geometra Analtica de la UNAD o cualquier otro
texto de matemticas bsicas.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

De la misma manera que la desviacin estndar, a la desviacin media
puede calculrsele el coeficiente de desviacin media:

% 100 =
x
DM
CVM



Los siguientes datos corresponden a los salarios de 10 empleados (en miles de
pesos) de dos empresas de alimentos. Calcular los coeficientes de variacin y de
desviacin media.


Empresa A: $420 $680 $690 $720 $720 $720 $730 $740 $740 $760
Empresa B: $415 $480 $510 $650 $700 $700 $730 $735 $750 $760


Empresa A:
Media aritmtica: 692 = x
Varianza: 8716
2
= s
Desviacin estndar: 36 , 93 = s
Desviacin media: 2 , 57 = DM
Coeficiente de variacin: % 49 , 13 % 100
692
36 , 93
= = CV
Coeficiente de desviacin media: % 27 , 8 % 100
692
2 , 57
= = CVM


Empresa B:
Media aritmtica: 643 = x
Varianza: 14396
2
= s
Desviacin estndar: 98 , 119 = s
Desviacin media: 86 , 104 = DM
Coeficiente de variacin: % 66 , 18 % 100
643
98 , 119
= = CV
Coeficiente de desviacin media: % 31 , 16 % 100
643
86 , 104
= = CVM


El CVM es menor que el CV debido a que la desviacin media es menor que la
desviacin estndar.

Estos resultados llevan a las siguientes conclusiones:
E EJ JE EM MP PL LO O 1 18 8. .1 1
1 11 10 0. .1 11 10 0. .1 1

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

- El salario promedio de los 10 empleados de la empresa A es de $692.000,
mientras que en la empresa B el salario promedio es de slo $643.000.
- En la empresa B los salarios varan grandemente respecto al media: en 14396
miles de pesos cuadrados, que en trminos de la desviacin estndar esto es
$119.980. En cambio, en la empresa A la variacin es de $93.360.
- El coeficiente de variacin y el coeficiente de variacin media de la empresa B
son menores a los coeficientes calculados para la empresa A, esto indica la
variacin relativa de los salarios en ambas empresas.


2.1.4 LECCIN 19 PUNTAJE TPICO O ESTANDARIZADO

Cuando se tiene una distribucin simtrica, su polgono de frecuencias
revelar una forma de campana muy comn en estadstica. Esta curva es llamada
curva normal, de error, de probabilidad o campana de Gauss. En ella la media
aritmtica se localiza en la mitad de la distribucin. En el eje horizontal se ubican
los valores que toma la variable y en el vertical la frecuencia absoluta o relativa. El
rea bajo la curva tendr un valor del 100%

Figura 4.1.
Curva normal o campana de Gauss





El puntaje tpico o estandarizado o variable normalizada, es una medida
de dispersin muy utilizada como variable estadstica en este tipo de distribucin,
denominada distribucin normal. El puntaje estandarizado mide la desviacin de
una observacin con respecto a la media aritmtica, en unidades de desviacin
estndar, determinndose as la posicin relativa de una observacin dentro del
conjunto de datos. Por lo general se simboliza por Z, pero cuando el tamao de la
muestra es menor de 30, se simboliza por t.


s
x X
Z

=


Por ser adimensional, el puntaje Z es til para comparar datos individuales
de distribuciones que tienen distintas unidades de medida, as como diferentes

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

medias y desviaciones estndar. Dentro de sus propiedades, las ms importantes
son que su media es cero y su desviacin estndar y varianza es uno.

Al terminar el semestre, un grupo de 150 estudiantes de primer semestre de
Regencia de Farmacia del CEAD de Medelln obtuvieron los siguientes resultados
en el puntaje final de los cursos Lgica Matemtica y Estadstica Descriptiva:


- Lgica Matemtica: puntuacin media de 3.9 y varianza 3.2.
- Estadstica Descriptiva: puntuacin media de 3.7 y desviacin estndar 1.7.

a. En cul curso hubo mayor dispersin absoluta? En cul hubo mayor
dispersin relativa?
b. Si un estudiante obtuvo como nota final en Lgica Matemtica 3.8 y en
Estadstica Descriptiva 3.5. En cul curso fue su puntuacin relativa
superior?


a. Para determinar la dispersin absoluta, basta con hacer una comparacin
entre sus desviaciones estndar. Observe que en los datos suministrados, ya se
tiene el valor de la desviacin estndar de las calificaciones de Estadstica
Descriptiva en cambio, se tiene la varianza de las calificaciones de Lgica
Matemtica. Recuerde que la desviacin estndar es la raz cuadrada de la
varianza.


Para Lgica Matemtica: 79 . 1 2 . 3 2 . 3
2
= = = s s
Se tiene entonces que en Lgica Matemtica hubo una mayor dispersin absoluta,
pues 1.79>1.7, aunque no es mucha la diferencia.


Para saber en cul hubo mayor dispersin relativa, se recurre al coeficiente de
variacin:
Para Lgica Matemtica: % 9 . 45 100
9 . 3
79 . 1
= = CV
Para Estadstica Descriptiva: % 46 100
7 . 3
7 . 1
= = CV
En Estadstica Descriptiva hubo una mayor dispersin relativa 46%>45.9%


b. Para el clculo de la puntuacin relativa, se hace uso del puntaje
estandarizado. Es decir, se requiere estandarizar las calificaciones convirtindolas
en puntuaciones Z.
E EJ JE EM MP PL LO O 1 19 9. .1 1
1 11 10 0. .1 11 10 0. .1 1

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

Lgica Matemtica: 06 . 0
79 . 1
9 . 3 8 . 3
=

=
s
x x
Z
Estadistica descriptiva 12 . 0
7 . 1
7 . 3 5 . 3
=

=
s
x x
Z

Estos valores de puntuacin Z negativos indican que ambas calificaciones se
encuentran por debajo de la media. Este es un principio del puntaje estandarizado:
Siempre que un valor sea menor que la media, su puntuacin Z correspondiente
ser negativa.


Estos resultados afirman entonces que el estudiante con calificaciones de 3.8 en
Lgica Matemtica y 3.5 en Estadstica Descriptiva, est por debajo del promedio
del grupo en ambos cursos.


Dado que -0.06 se encuentra ms cera a 0 (la media de la variable estandarizada),
se dice que la puntuacin relativa del estudiante fue superior en Lgica
Matemtica.


2.1.5 LECCIN 20 MEDIDAS DE ASIMETRA Y APUNTAMIENTO

Despus de conocer cmo vara un grupo de datos respecto a su media e
identificar otras medidas de variacin, se trabajar a continuacin unas nociones
bsicas sobre curvas asimtricas. En cursos ms avanzados, como Probabilidad,
este tema se profundiza ms, pero para los objetivos que se trazan en este curso
basta con las nociones que se desarrollan a continuacin.


2.1.5.1 Asimetra

Ya se ha mencionado algo sobre los efectos de la asimetra respecto a la
media, mediana y moda (ver seccin 1.1.4.3. de la Unidad Didctica uno). En una
distribucin simtrica se tiene que:

Mo Me x = =


En las distribuciones asimtricas la media se corre en el sentido del
alargamiento o sesgo por efecto de las frecuencias y de los valores extremos de
la variable; la mediana tambin se corre pero menos que la media ya que en ella
slo influyen las frecuencias; en tanto que la moda no es influenciada ni por las
frecuencias ni por los valores extremos (ver figura 3.1. de la presente Unidad

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

Didctica). La distribucin es asimtrica positiva cuando presenta un
alargamiento o sesgo a la derecha y:

x Me Mo < <

Ser asimtrica negativa cuando presenta un alargamiento o sesgo a la
izquierda y:

Mo Me x < <


Las asimetras positivas son las ms frecuentes que las sesgadas hacia la
izquierda, porque con frecuencia es ms fcil obtener valores excepcionalmente
grandes que valores excepcionalmente pequeos. Ejemplo de ello es la
distribucin de valores en los consumos de servicios pblicos, las calificaciones en
pruebas, los sueldos, etc.


Se reconocen, entre otras, las siguientes medidas para calcular el grado de
la asimetra:

- Coeficiente de Pearson. Asimetra en funcin de la media y la moda. Vara
entre 3 y es 0 en la distribucin normal.

s
Me x
As
s
Mo x
As
) ( 3
=

=


- Media cuartil de asimetra o media de Bowley. Vara entre 1 y es 0 en la
distribucin normal.

1 3
2 3 1
2
Q Q
Q Q Q
As

+
=

Si 0 = As la distribucin es simtrica.
Si 0 > As la distribucin es asimtrica positiva.
Si 0 < As la distribucin es asimtrica negativa.


2.1.5.2 Apuntamiento o curtosis

Las curvas de distribucin, comparadas con la curva de distribucin normal,
pueden presentar diferentes grados de apuntamiento o altura de la cima de la
curva. Esta agudeza en la cima se observa en la moda.



UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

Si la curva es ms plana que la normal se dice que la curva es platicrtica;
si es ms aguda que la normal, recibe el nombre de apuntada o leptocrtica. Si la
distribucin es normal, la curva se conoce tambin como mesocrtica.


La curtosis es la medida de la altura de la curva y esta dada por:

4
4
s n
f Z
Ap
i i


=




Si 3 = Ap la distribucin es normal o mesocrtica.
Si 3 > Ap la distribucin es apuntada o leptocrtica.
Si 3 < Ap la distribucin es achatada o platicrtica.


Otra medida de curtosis que se emplea est basada en el rango
semiintercuartlico y los percentiles 10 y 9:

) ( 2
10 90
1 3
10 90
2
P P
Q Q
P P
Q
Ap
D

=


En el siguiente ejemplo se explicarn mejor las medidas de asimetra y
apuntamiento.



El coordinador acadmico del CEAD de Valledupar desea conocer el rendimiento
acadmico de los estudiantes de primer semestre en el 2005, en los cursos de
Lgica Matemtica, Competencias Comunicativas, Cultura Poltica, Estadstica
Descriptiva y Herramientas Informticas. Para esto selecciona una muestra de 55
estudiantes de los distintos programas que se ofrecen en el CEAD. La siguiente
tabla, arroja los resultados de la investigacin realizada por el funcionario.










E EJ JE EM MP PL LO O 2 20 0. .1 1
1 11 10 0. .1 11 10 0. .1 1

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

Tabla 4.3.
Distribucin de frecuencias
de las calificaciones de primer semestre en Valledupar


Calificacin
Lgica
Matemtica
Competencias
Comunicativas
Cultura
Poltica
Estadstica
Descriptiva
Herramientas
Informticas
0,0 1 3 2 1 1
0,5 4 3 2 1 2
1,0 7 5 3 2 3
1,5 9 6 4 4 7
2,0 9 7 6 11 9
2,5 8 7 8 14 11
3,0 6 7 9 12 9
3,5 4 6 9 6 7
4,0 3 5 7 3 3
4,5 2 3 4 1 2
5,0 2 3 1 0 1
Total 55 55 55 55 55


En la tabla siguiente se reporta un resumen de las medidas estadsticas por cada
uno de los cursos (comprubelo!):


Medida
Lgica
Matemtica
Competencias
Comunicativas
Cultura
Poltica
Estadstica
Descriptiva
Herramientas
Informticas
x 2.25 2.5 2.75 2.53 2.5
Me 2.0 2.5 3.0 2.5 2.5
Mo 1.5 y 2.0 2.0, 2.5 y 3.0 3.0 y 3.5 2.5 2.5
2
s 1.45 1.84 1.45 0.76 1.12
s 1.20 1.36 1.20 0.87 1.06
1
Q
1.5 1.5 2.0 2.0 2.0
2
Q
2.0 2.5 3.0 2.5 2.5
3
Q
3.0 3.5 3.5 3.0 3.4


2.1.5.3 Lgica Matemtica ( Asimtrica Positiva)

Se observa que x Me Mo < < , lo que indica que la distribucin es asimtrica
positiva. Para confirmarlo se hace uso del coeficiente de Pearson y la media de
Bowley: En este caso se trabajar con la media de Bowley, pues la distribucin
tiene dos modas y no permite un resultado seguro con el coeficiente de Pearson.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

0 33 . 0
5 . 1 3
) 2 ( 2 3 5 . 1 2
1 3
2 3 1
> =

+
=

+
=
Q Q
Q Q Q
As

El polgono de frecuencias de las calificaciones de Lgica Matemtica confirma los
resultados.

Figura 4.2.
Curva asimtrica positiva
Polgono de frecuencias de calificaciones de Lgica Matemtica
















La curva lleva a concluir que la mayora de los estudiantes estn por debajo de la
media en el curso de Lgica Matemtica y son pocos los estudiantes que la
superan.


2.1.5.4 Competencias Comunicativas (Simtrica)

Se observa que x Me Mo = = , lo que indica que la distribucin es simtrica. Para
confirmarlo se hace uso del coeficiente de Bowley, pues la distribucin tiene tres
modas y no permite un resultado seguro con el coeficiente de Pearson.

0
5 . 1 5 . 3
) 5 . 2 ( 2 5 . 3 5 . 1 2
1 3
2 3 1
=

+
=

+
=
Q Q
Q Q Q
As

El polgono de frecuencias de las calificaciones de Competencias Comunicativas
confirma los resultados.



1
2
3
4
5
6
7
8
9
10
0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0
Calificacin
F
r
e
c
u
e
n
c
i
a
1
2
3
4
5
6
7
8
9
10
0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0
Calificacin
F
r
e
c
u
e
n
c
i
a

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

Figura 4.3.
Curva simtrica platicrtica
Polgono de frecuencias de calificaciones de Competencias Comunicativas
con el coeficiente de Pearson.



















Para determinar el grado de apuntamiento o curtosis, se debe determinar el
puntaje tpico o estandarizado de cada clase y luego aplicar la frmula que lo
calcula. En la siguiente tabla se indican estos valores.


Tabla 4.4.
Clculo de Z para la distribucin de frecuencias
de las calificaciones de Competencias Comunicativas


Calificacin f Z
i i
f Z
4

0,0 3 -1,838235294 34,2551328
0,5 3 -1,470588235 14,0309024
1,0 5 -1,102941176 7,39910869
1,5 6 -0,735294118 1,7538628
2,0 7 -0,367647059 0,12788583
2,5 7 0 0
3,0 7 0,367647059 0,12788583
3,5 6 0,735294118 1,7538628
4,0 5 1,102941176 7,39910869
4,5 3 1,470588235 14,0309024
5,0 3 1,838235294 34,2551328
Total 55 0 115,133785

1
2
3
4
5
6
7
8
9
10
0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0
Calificacin
F
r
e
c
u
e
n
c
i
a
1
2
3
4
5
6
7
8
9
10
0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0
Calificacin
F
r
e
c
u
e
n
c
i
a

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

3 62 . 0
36 . 1 55
13 . 115
4 4
4
< =

=

Ap
s n
f Z
Ap
i i



Por lo tanto, la curva es simtrica platicrtica o achatada.

Estos resultados indican que la mayora de los estudiantes en Competencias
Comunicativas estn en el rango de la media del curso, adems sus notas son
muy homogneas alrededor de la media.


2.1.5.5 Cultura Poltica (Asimtrica Negativa)

Se observa que x Me Mo > > , lo que indica que la distribucin es asimtrica
negativa. Para confirmarlo se hace uso de la media de Bowley, pues la distribucin
tiene dos modas y no permite un resultado seguro con el coeficiente de Pearson.


0 33 . 0
0 . 2 5 . 3
) 0 . 3 ( 2 5 . 3 0 . 2 2
1 3
2 3 1
< =

+
=

+
=
Q Q
Q Q Q
As

El polgono de frecuencias de las calificaciones de Cultura Poltica confirma los
resultados.

Figura 4.4.
Curva asimtrica negativa
Polgono de frecuencias de calificaciones de Cultura Poltica

















Esto quiere decir que las calificaciones de la mayora de los estudiantes del curso
Cultura Poltica estn por encima de la media.

1
2
3
4
5
6
7
8
9
10
0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0
Calificacin
F
r
e
c
u
e
n
c
i
a
1
2
3
4
5
6
7
8
9
10
0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0
Calificacin
F
r
e
c
u
e
n
c
i
a

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

2.1.5.6 Estadstica Descriptiva

Se observa que x Me Mo = = , lo que indica que la distribucin es simtrica. Para
confirmarlo se hace uso del coeficiente de Pearson y la media de Bowley:


0 03 . 0
87 . 0
5 . 2 53 . 2
~ =

=
s
Mo x
As

0
0 . 2 0 . 3
) 5 . 2 ( 2 0 . 3 0 . 2 2
1 3
2 3 1
=

+
=

+
=
Q Q
Q Q Q
As


Para determinar el grado de apuntamiento o curtosis, se debe determinar el
puntaje tpico o estandarizado de cada clase y luego aplicar la frmula que lo
calcula. En la tabla siguiente tabla se indican estos valores.


Tabla 4.5
Clculo de Z para la distribucin de frecuencia
de las calificaciones de Estadstica Descriptiva

Calificacin f Z
i i
f Z
4

0,0 1 -2,908045977 71,516306
0,5 1 -2,333333333 29,6419753
1,0 2 -1,75862069 19,1301647
1,5 4 -1,183908046 7,85835926
2,0 11 -0,609195402 1,51502275
2,5 14 -0,034482759 1,9794E-05
3,0 12 0,540229885 1,02210536
3,5 6 1,114942529 9,27173856
4,0 3 1,689655172 24,4519547
4,5 1 2,264367816 26,289837
5,0 0 -1,352941176 0
Total 55 -4,571331981 190,697484

3 05 . 6
87 . 0 55
70 . 190
4 4
4
> =

=

Ap
s n
f Z
Ap
i i


Por lo tanto, la curva es simtrica leptocrtica o apuntada.
Esto indica que las calificaciones de Estadstica Descriptiva de la muestra de 55
estudiantes estn muy cerca de la media y que existe adems, un pico en 2.5,
sealando una alta frecuencia en esta calificacin.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

Figura 4.5.
Curva simtrica leptocrtica
Polgono de frecuencias de calificaciones de Estadstica Descriptiva
















2.1.5.7 Herramientas Informticas

Se observa que x Me Mo = = , lo que indica que la distribucin es simtrica. Para
confirmarlo se hace uso del coeficiente de Pearson:
0
06 . 1
5 . 2 5 . 2
=

=
s
Mo x
As

El polgono de frecuencias de las calificaciones de Herramientas Informticas
confirma los resultados. La curva es simtrica mesocrtica o normal. Verifquelo y
construya la grfica.


2.2 CAPITULO 5 MEDIDAS ESTADSTICAS BIVARIANTES

Hasta ahora se ha estudiado el anlisis de una sola variable, calculando los
estadsticos de muestras que permiten describir e interpretar la distribucin de esa
variable. En este captulo se estudiar el comportamiento de dos variables:
distribuciones bivariantes, con el fin de determinar si existe alguna relacin entre
las variables, que bien pudieran ser ambas discretas o continuas, o tambin una
de ellas discreta y la otra continua. En este captulo se desarrolla el tema de la
Regresin y Correlacin lineal y los Nmeros ndice.


2.2.1 LECCIN 21 REGRESIN Y CORRELACIN

En muchos casos se requiere conocer ms que el comportamiento de una
sola variable, se requiere conocer la relacin entre dos o ms variables como la
relacin entre produccin y consumo; salarios y horas de trabajo; oferta y
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0
Calificacin
F
r
e
c
u
e
n
c
i
a
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0
Calificacin
F
r
e
c
u
e
n
c
i
a

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

demanda; salarios y productividad; la altura de un rbol y el dimetro de su tronco;
el nivel socioeconmico de una persona y su grado de depresin; etc.


Muchos de estos comportamientos tienen una tendencia lineal, aunque hay
muchos otros que lo hacen de forma curva, en este curso slo se trabajar sobre
variables con correlacin lineal. A continuacin se describir brevemente en qu
consiste un diagrama de dispersin y cules son los criterios que deben tenerse
en cuenta para hallar la mejor lnea o lnea de tendencia del comportamiento de
las variables.


La palabra regresin la utilizamos para significar la estimacin de una
variable en funcin de otro valor conocido, correspondiente a la otra variable.

Decimos que la mejor lnea que se ajusta a un conjunto de puntos es
aquella en donde la suma de los cuadrados de las diferencias entre los valores
reales y los estimados es mnima.


Para determinar el grado de correlacin entre las variables, no basta con
calcular la varianza explicada, pues existe el coeficiente de determinacin o
coeficiente de correlacin al cuadrado; sin embargo, frecuentemente se utiliza un
coeficiente de correlacin rectilneo, r siendo este un valor entre -1 y 1.


Si el coeficiente de correlacin r es igual o menor que uno, nos indica que
tanto la covarianza, como los coeficientes angulares, son negativos y por tanto la
recta ser descendente, por ser la pendiente negativa. Adems si es igual a -1,
nos indica que existe una perfecta correlacin en otras palabras, cada valor de la
variable deber ser exactamente igual al estimado, y por tanto la varianza residual
es igual a cero, y la varianza explicada igual a la varianza total.


2.2.2 LECCIN 22 DIAGRAMA DE DISPERSIN

Una distribucin bidimensional o bivariante puede representarse
grficamente en un plano cartesiano, ubicando en el eje horizontal o abscisa los
valores de la primera variable denominada X y en el eje vertical u ordenada, los
valores de la segunda variable, Y. De manera pues que se grafican tantas parejas
ordenadas como observaciones hayan de las variables.


A este conjunto de puntos o nube de puntos se le denomina diagrama de
dispersin, dado que los puntos se ubican de forma dispersa en el plano
cartesiano.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

X
Y
X
Y
X
Y
X
Y
X
Y
X
Y
En muchos casos el slo diagrama de dispersin indica una tendencia de
agrupacin de los puntos, que puede ser lineal (hacia arriba o hacia abajo),
exponencial, curvilnea o poligonal.


Parte del anlisis estadstico que hace el investigador es determinar cul es
la mejor lnea o curva que representa a ese conjunto de datos. El mejor ajuste se
hace cuando se elabora bien la grfica, se conoce la distribucin y se va
adquiriendo experiencia en su clculo y determinacin.


Figura 5.1.
Grficas de dispersin
(a) lineal; (b) curvilnea; (c) sin relacin










(a) (b) (c)


2.2.3 . LECCIN 23 REGRESIN LINEAL SIMPLE

La regresin examina la relacin entre dos variables restringiendo una de
ellas respecto a la otra, con el objeto de estudiar las variaciones de la primera
cuando la otra permanece constante. La regresin es un mtodo que se emplea
para pronosticar o predecir el valor de una variable en funcin de los valores
dados de la otra (o de las otras, cuando se trabaja ms de dos variables).


Se trata pues de una dependencia funcional entre las variables. Cuando se
trata de dos variables, una (la X) ser la variable independiente mientras que la
otra (la Y) ser la variable dependiente. Se habla as de una regresin de Y sobre
(o en funcin de) X.


Cuando se considera, despus de una inspeccin en la grfica de
dispersin, que una lnea recta es la mejor curva que se ajusta al conjunto de
puntos se procede entonces a emplear el mtodo de la regresin lineal simple.
La mejor lnea es aquella que hace mnima la suma de los cuadrados de las
diferencias entre los puntos dados y los obtenidos mediante la lnea ajustada o

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

estimada. Es por eso que a este mtodo tambin se le conoce como el mtodo de
los mnimos cuadrados. La ecuacin de la recta estimada est dada por:


bX a Y + =



Donde:
:

Y Variable dependiente (la que se va a predecir)


: a Intercepto de la variable Y
: X Variable independiente
: b Pendiente de la recta


En esta ecuacin hay dos valores desconocidas: a y b, que deben
determinarse aplicando el criterio de los mnimos cuadrados, buscando as la
mejor recta que se ajuste a los datos. Se tiene entonces:


( )
n
X b Y
a
X X n
Y X XY n
b




=

=
2 2


Donde:
b : Pendiente de la recta
a : Intercepto de la variable Y
X : Valores de la variable independiente
Y : Valores de la variable dependiente
n : Tamao de la muestra


Algunos autores calcular los valores de a y b en trminos de las medias de
de los conjuntos de datos con las siguientes dos ecuaciones:

x b y a
x X
y Y x X
b =

2
) (
) )( (



Donde:
X : Valores de la variable independiente
x : Media del conjunto de datos de la variable X
Y : Valores de la variable dependiente
y : Media del conjunto de datos de la variable Y


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva



El departamento de publicidad de una industria alimenticia desea saber si existe
una relacin entre las ventas y el nmero de comerciales de televisin transmitidos
por da. Para ello, toma una muestra aleatoria de siete ciudades. La siguiente tabla
muestra los resultados obtenidos.

Tabla 5.1.
Relacin de ventas de un producto y la emisin del comercial en televisin

Ventas
Cientos de unidades por mes
Comerciales
Nmero transmitido por da
8,4 9
5,2 6
7,1 8
10 11
12,9 12
12,1 13
14,4 14

Para conocer el tipo de relacin que puede existir entre estas dos variables, el
primer paso es determinar es si el diagrama de dispersin efectivamente insina
una tendencia lineal.

Figura 5.2.
Diagrama de dispersin de ventas de un producto
y la emisin del comercial en televisin












El diagrama confirma la sospecha, se procede ahora a determinar la ecuacin de
la recta que ms se ajusta. Para ello se hace uso del mtodo de los mnimos
cuadrados
6
.

6
Puede usarse cualquiera de las ecuaciones propuestas, la decisin la toma el investigador. En
este ejemplo se presenta el clculo con las dos ecuaciones de modo que el estudiante tenga
criterio para decidir cmo hacer sus propios clculos.
E EJ JE EM MP PL LO O 2 23 3. .1 1
1 11 10 0. .1 11 10 0. .1 1
0
2
4
6
8
10
12
14
16
0 2 4 6 8 10 12 14 16
Ventas, cientos de unidades por mes
N

m
e
r
o

d
e

c
o
m
e
r
c
i
a
l
e
s

t
r
a
n
s
m
i
t
i
d
o
s

p
o
r

d

a
0
2
4
6
8
10
12
14
16
0 2 4 6 8 10 12 14 16
Ventas, cientos de unidades por mes
N

m
e
r
o

d
e

c
o
m
e
r
c
i
a
l
e
s

t
r
a
n
s
m
i
t
i
d
o
s

p
o
r

d

a

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

bX a Y + =



Donde:

( )
n
X b Y
a
X X n
Y X XY n
b




=

=
2 2


X
Ventas
Y
Comerciales
XY X
2

8,4 9 75,6 70,56
5,2 6 31,2 27,04
7,1 8 56,8 50,41
10 11 110 100
12,9 12 154,8 166,41
12,1 13 157,3 146,41
14,4 14 201,6 207,36
70,1 73 787,3 768,19


( )
85 , 0
32 , 463
8 , 393
) 1 , 70 ( 19 , 768 7
) 73 )( 1 , 70 ( 3 , 787 7
2 2 2
= =


=

=


X X n
Y X XY n
b

92 , 1
7
415 , 13
7
) 1 , 70 85 . 0 ( 73
= =

=

=

n
X b Y
a

De modo que la ecuacin de la recta ajustada est dada por:

92 , 1 85 , 0

+ = X Y

Si se quisiera hacer el clculo con la segunda ecuacin planteada, se debe
determinar primero las medias de cada conjunto de datos.

01 . 10
7
1 . 70
= = =

n
X
x 43 . 10
7
73
= = =

n
Y
y

En la siguiente tabla se resumen todos los clculos necesarios para determinara la
ecuacin de la recta ajustada. Se tiene entonces:

85 , 0
1887 , 66
2571 , 56
) (
) )( (
2
= =

x X
y Y x X
b

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva


92 , 1 ) 01 , 10 )( 85 , 0 ( 43 , 10 = = = x b y a

La ecuacin de la recta ajustada est dada por:

92 , 1 85 , 0 + = X Y



X
Ventas
Y
Comerciales
x X y Y ) )( ( y Y x X
2
) ( x X
8,4 9 -1,61 -1,43 2,3023 2,5921
5,2 6 -4,81 -4,43 21,3083 23,1361
7,1 8 -2,91 -2,43 7,0713 8,4681
10 11 -0,01 0,57 -0,0057 0,0001
12,9 12 2,89 1,57 4,5373 8,3521
12,1 13 2,09 2,57 5,3713 4,3681
14,4 14 4,39 3,57 15,6723 19,2721
70.1 73 0,03 -0,01 56,2571 66,1887


2.2.4 LECCIN 24 CORRELACIN

La correlacin entre dos variables busca determinar el grado de relacin
que existe entre ellas dos. Ella se calcula con los coeficientes de correlacin.


Los coeficientes de correlacin son nmeros que varan entre +1 y -1. Su
magnitud indica el grado de asociacin entre las variables, si es 0 indica que no
existe relacin alguna y los valores extremos +1 y -1 indican una correlacin
perfecta positiva o negativa respectivamente.

Figura 5.3.
Grficas de dispersin lineal
(a) positiva; (b) negativa








(a) (b)


Se dice que existe una correlacin lineal positiva entre dos variables, si al
aumentar o disminuir los valores de la variable independiente aumentan o
X
Y
X
Y
X
Y
X
Y

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

disminuyen los de la variable dependiente. En un grfico de dispersin, la nube de
puntos tiene forma ascendente y por tanto la recta que se ajusta tendr una
pendiente positiva. En cambio, cuando al aumentar los valores de la variable
independiente disminuyen los valores de la variable dependiente, o viceversa, se
dice que la correlacin lineal es negativa. En este caso la nube de puntos
descender de izquierda a derecha y la pendiente de la recta ajustada ser
negativa (ver figura 5.3.)


Para determinar el coeficiente de correlacin, es necesario conocer primero
el error estndar del estimado de la recta ajustada. Se trata pues de medir el
grado de confiabilidad de la ecuacin de la recta estimada. El error estndar
indicar la dispersin o la variabilidad de los valores observados alrededor de la
lnea de regresin y se calcula a partir de la siguiente ecuacin:

2
) (
2

=

n
Y Y
Se



Donde:
Se: Error estndar del estimado
Y : Valores de la variable dependiente
Y

: Valores estimados de la ecuacin


n : Tamao de la muestra

Esta ecuacin implica demasiadas operaciones, por lo que suele utilizarse
un mtodo ms breve:

2
2


=

n
XY b Y a Y
Se
Una vez obtenido el error estndar del estimado, es necesario medir qu
porcentaje de la informacin es recogida o explicada por el modelo de regresin
escogido. Se trata pues, de determinar las variaciones de la variable dependiente
mediante el coeficiente de determinacin (R
2
).

2
2
2
1
y
s
Se
R =


Donde:
2
R : Coeficiente de determinacin, 1 0
2
s s R
2
Se : Varianza del error estimado.
2
y
s
: Varianza de la variable dependiente Y.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

Cuando el
2
R es cercano a 1, se dice que el modelo de regresin lineal
ajustado tiene un alto grado de confiabilidad, si al contrario este se acerca a 0 su
grado de confiabilidad es muy bajo y se recomienda no utilizar el modelo de
regresin estimado.


En la prctica es ms frecuente usar r , denominado el coeficiente de
correlacin lineal. Siendo
2
R r = . El coeficiente de correlacin lineal r, es
tambin conocido como coeficiente de Pearson. Ya se mencionaba que el
coeficiente de correlacin lineal oscila entre +1 y -1, se puede entonces interpretar
el grado de correlacin partiendo de los siguientes lmites de referencia:

Tabla 5.2.
Grado de correlacin lineal


Interpretacin Valores de r (+) Valores de r (-)
Correlacin perfecta = 1 = -1
Correlacin excelente 0.90 < r < 1 -1 < r < -0.90
Correlacin aceptable 0.80 < r < 0.90 -0.90 < r < -0.80
Correlacin regular 0.60 < r < 0.80 -0.80 < r < -0.60
Correlacin mnima 0.30 < r < 0.60 -0.60 < r < -0.30
No hay correlacin 0 < r < 0.30 -0.30 < r 0
Tomado de Estadstica Bsica Aplicada; Ciro Martnez Bencardino.



Determinar el error estndar de la recta ajustada en el ejemplo 23.1.

57 . 0
2 7
) 3 . 787 )( 85 . 0 ( ) 73 )( 92 . 1 ( 811
2
2
=


=

n
XY b Y a Y
Se


Se calcula as, el coeficiente de determinacin y el coeficiente de correlacin
lineal. Para ello se determina
2
y
s
, la varianza de la variable dependiente Y.

07 . 7 43 . 10
7
811
2 2
2
2
= = =

y
n
Y
s
y


96 . 0 919 . 0
07 . 7
57 . 0
1 1
2
2
2
2
= = = = = R r
s
Se
R
y


E EJ JE EM MP PL LO O 2 24 4. .1 1
1 11 10 0. .1 11 10 0. .1 1

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

Con los resultados obtenidos se puede asegurar que la ecuacin de la recta es
una muy buena estimacin de la relacin entre las dos variables. El R
2
afirma
adems que el modelo explica el 91.9% de la informacin. Y el valor de r confirma
adems el grado de relacin entre las variables: el nmero de ventas del producto
est directamente relacionado (en un 96%) con los comerciales de televisin que
se emiten diariamente.


Ahora, si el gerente de ventas de la empresa quisiera aumentar el nmero de
ventas del producto a 2000 mensuales, Cuntos comerciales estima el
departamento de publicidad de la empresa que debe emitir diariamente?


Se trata simplemente de reemplazar en la ecuacin estimada, la variable
independiente por el valor que se pretende y as obtener el valor de la variable
dependiente (nmero de comerciales). As:


19 92 . 18 92 . 1 ) 20 )( 85 . 0 ( 92 . 1 85 . 0 ~ = + = + = Y X Y




El departamento de publicidad requerir de 19 comerciales de televisin
diariamente para que el nmero de ventas ascienda a 2000 unidades mensuales.


2.2.5 LECCIN 25 REGRESIN MLTIPLE

Cuando se emplea ms de una variable independiente para evaluar una
variable dependiente es conveniente utilizar un mtodo de regresin mltiple,
que consiste en el mismo procedimiento de una regresin lineal simple: describir la
ecuacin de regresin, determinar el error de estimacin y analizar la correlacin
entre las variables.


A continuacin se desarrollarn estos conceptos suponiendo dos variables
independientes. Para ms variables independientes, slo basta con seguir los
mismos pasos.



La ecuacin de regresin est dada por:

2 2 1 1
X b X b a Y + + =



Donde:

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

:

Y Variable dependiente.
: a Intercepto de la variable Y.
: ,
2 1
X X Valores de las dos variables independientes.
: ,
2 1
b b Pendientes asociadas con cada variable independiente, respectivamente.

Los valores de las tres constantes numricas se obtienen resolviendo el
siguiente sistema de ecuaciones:




+ + =
+ + =
+ + =
2
2 2 2 1 1 2 2
2 1 2
2
1 1 1 1
2 2 1 1
X b X X b X a Y X
X X b X b X a Y X
X b X b na Y


Una vez obtenida la ecuacin de regresin, se determina el error estndar
de la estimacin de regresin mltiple:

3 3
) (
2 2 1 1
2 2

=

n
Y X b Y X b Y a Y
Se
n
Y Y
Se



Y el coeficiente de determinacin mltiple, estar dado por:

2
2
2
2 2 1 1 2

+ +
=
y n Y
y n Y X b Y X b Y a
R
Donde:
: Y Valores de la variable dependiente.
: a Intercepto de la variable Y.
: ,
2 1
X X Valores de las dos variables independientes.
: ,
2 1
b b Pendientes asociadas con cada variable independiente, respectivamente.
: y Media de los valores de la variable dependiente.



El jefe de produccin de una empresa manufacturera desea estimar los gastos
indirectos de produccin con base en el nmero de horas de trabajo y en el
nmero de horas mquina. En la siguiente tabla se relaciona la informacin
correspondiente al primer semestre del ao.
El jefe de produccin define:
X
1
: Horas de trabajo (cientos).
X
2
: Horas de mquina (cientos)
Y : Gastos indirectos de produccin (cientos de miles de pesos)

E EJ JE EM MP PL LO O 2 25 5. .1 1
1 11 10 0. .1 11 10 0. .1 1

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

) 4 ( 83 . 6 83 . 1 5 . 7
1211 3756 85 2260
17 . 1204 17 . 13754 85 5 . 2252
2 1
2 1
2 1
b b
b b a
b b a
=
=
+ + =
) 3 ( 1211 3756 85 2260
) 2 ( 3756 11715 265 7032
) 1 ( 85 265 6 159
2 1
2
2 2 2 1 1 2 2
2 1 2 1 2
2
1 1 1 1
2 1 2 2 1 1



+ + = + + =
+ + = + + =
+ + = + + =
b b a X b X X b X a Y X
b b a X X b X b X a Y X
b b a X b X b na Y
Tabla 5.3.
Gastos indirectos de produccin


Mes X
1
X
2
Y X
1
Y X
2
Y X
1
X
2
X
1
2
X
2
2
Y

2

Enero 45 16 29 1305 464 720 2025 256 841
Febrero 42 14 24 1008 336 588 1764 196 576
Marzo 44 15 27 1188 405 660 1936 225 729
Abril 45 13 25 1125 325 585 2025 169 625
Mayo 43 13 26 1118 338 559 1849 169 676
Junio 46 14 28 1288 392 644 2116 196 784
TOTAL 265 85 159 7032 2260 3756 11715 1211 4231







Se resuelve el sistema de ecuaciones:

Ecuacin (1) multiplicada por 85/6 y restada por la ecuacin (3):






Se despeja la variable b
1
de la ecuacin (4):


83 . 1
83 . 6 5 . 7
2
1
b
b

=


Ecuacin (1) multiplicada por 265/6 y restada por ecuacin (2):

) 5 ( 83 . 1 83 . 10 5 . 9
3756 11715 265 7032
17 . 3754 17 . 11704 265 5 . 7022
2 1
2 1
2 1
b b
b b a
b b a
=
=
+ + =


Variable b
1
reemplazada en la ecuacin (5):


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

91 . 0
97 . 73
19 . 67
83 . 1
83 . 1
83 . 6 5 . 7
83 . 10 5 . 9
2 2
2
= = + |
.
|

\
|
= b b
b


b
2
reemplazada en la ecuacin (4):

7 . 0
83 . 1
83 . 6 5 . 7
2
1
=

=
b
b


b
1
y b
2
reemplazada en la ecuacin (1):

31 . 17
6
85 265 159
2 1
=

=
b b
a


Se obtiene as la ecuacin de regresin mltiple:

2 1 2 2 1 1
91 . 0 7 . 0 31 . 17 X X Y X b X b a Y + + = + + =




2.3 CAPITULO 6 NMEROS INDICE

Los nmeros ndice son cifras relativas expresadas en trminos
porcentuales, que sirven para indicar las variaciones que sufre una serie de
valores respecto a una de ellas, tomada como punto de referencia y a la cual se le
denomina base.


Los nmeros ndices no son una medida cuantificable, se trata de un
indicador de variacin en la variable observada. Son indicadores muy utilizados en
el sector econmico por ejemplo, la variacin en los precios de un producto
respecto al ao anterior, la cantidad de unidades vendidas de un producto
respecto al mes anterior, el costo de produccin por unidad de este trimestre
comparado con el inmediatamente anterior, etc.


Si se trata de una serie corta, el perodo base seleccionado ser el primer
valor de la serie; pero si la serie es extensa se debe seleccionar cono perodo
base aquel que haya sido ms estable, es decir, que no presente cambios muy
bruscos debido a factores internos y/o externos. Sin embargo, la seleccin de la
serie base depender de los anlisis que el investigador requiera hacer para sus
variables.



UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

Los nmeros ndice se pueden construir para una sola observacin o para
un conjunto de ellas; en el primer caso, se hablar de ndices simples y para un
conjunto de datos dados, se hablar de ndices compuestos. Estos ltimos se
clasifican a su vez en agregativos y de promedios. Los promedios se clasifican
en aritmticos, geomtricos, medianos, etc., pero en la prctica los ms utilizados
son los aritmticos.


2.3.1 LECCIN 26 CONSTRUCCIN DE NMEROS NDICE

Para calcular un nmero ndice se toma un valor de la serie como base y se
establece un cociente entre el valor de la variable a estudiar y el valor de la
variable base. Este cociente debe expresarse en porcentaje, determinando as el
nmero ndice respecto a la base definida.


Se pueden obtener bases fijas y bases variables para establecer
comparaciones. La base fija es aquella que representa el mismo perodo de
referencia o de comparacin para toda la serie.

% 100
0
0
=
X
X
I
t t


Donde:
t
I
0
: ndice.
0: Perodo base.
t: Perodo que se analiza.
t
X : Precio, cantidad o valor del perodo que se investiga.
0
X : Precio, cantidad o valor del perodo considerado como base.

Los ndices son de base variable cuando a cada observacin se le divide
por el valor de la observacin inmediatamente anterior.

% 100
1
1
=

t
t t
t
X
X
I

Donde:
t
t
I
1
: ndice.
t-1: Perodo base.
t: Perodo que se analiza.
t
X : Precio, cantidad o valor del perodo que se investiga.
0
X : Precio, cantidad o valor del perodo considerado como base.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva


2.3.2 LECCION 27 TIPOS DE NMEROS NDICES

El ndice de mayor aplicacin es el ndice de precios, que mide los
cambios de precios en uno o ms artculos en un perodo determinado respecto a
un perodo base. El ms conocido es el ndice de precios al consumidor, que mide
el cambio de todos los precios respecto a una variedad de artculos que se
consumen; este ndice se emplea para definir el costo de vida.


Un ndice de cantidad mide la variacin de las cantidades de uno o ms
bienes en un perodo dado respecto al perodo base.


El ndice de valor mide los cambios en valor monetario total, es decir,
combina los cambios de precios y cantidad para presentar un ndice ms
informativo.


2.3.3 LECCIN 28 NDICES SIMPLES

Se construyen para una sola observacin y su base puede ser fija o
variable. Cuando se trata de medir la variacin de un fenmeno observado a
travs de una serie de perodos, los ndices simples son los ms adecuados.


Un almacn vende cinco referencias diferentes de un artculo determinado. Los
datos siguientes indican las ventas de ellos en los meses de febrero y marzo.

Mes A B C D E
Febrero 86 395 1308 430 113
Marzo 95 380 1466 469 108

Se desea analizar la variacin del artculo con referencia C en el inventario de
marzo respecto al mes de febrero.

% 112 % 100
1308
1466
= =
febrero
marzo
I

Se considera que el aumento en ventas del artculo con referencia C es del 12%
en el mes de marzo respecto al mes de febrero.


E EJ JE EM MP PL LO O 2 28 8. .1 1
1 11 10 0. .1 11 10 0. .1 1

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

Si se quisiera comparar el total de artculos vendidos correspondiente al perodo
de estudio respecto al total de artculos vendidos del perodo base, se suman
todos los elementos correspondientes al perodo de estudio y se divide entre la
suma de los mismos elementos del perodo base.


% 108 100
113 430 1308 395 86
108 469 1466 380 95
=
+ + + +
+ + + +
=
febrero
marzo
I

Se concluye pues, que las ventas del producto aumentaron en marzo en un 8%
(108-100) respecto a las ventas del mismo en febrero.


Este ltimo ndice calculado en el ejemplo 25.1., se denomina ndice
agregativo (o agregado) simple y se define como:

% 100
1
0
=

t
t
t
X
X
I


2.3.4.1 LECCIN 29 NDICES COMPUESTOS

Se construyen a partir de un grupo de series de tiempo, concernientes a
varios artculos. Se trata de examinar el valor no de un artculo, sino de un grupo
de ellos respecto a otro considerado de ms importancia. Los ndices compuestos
determinan una condicin particular, por ejemplo el costo de vida relativo a
transporte, vivienda, alimentacin, etc. Se habla entonces de calcular un ndice
agregado ponderado.


Son muchas las frmulas para calcular ndices ponderados, los ms
conocidos son los de Laspeyres, Paashe, Fisher, Keynes, Marshall, Edgeworth,
Walsh, Drobisch y Sidgwick. Generalmente en ellos las ponderaciones son las
cantidades o precios. Cuando se van a calcular los ndices de precios en un grupo
de artculos, las ponderaciones son las cantidades, y en el clculo de los ndices
de cantidad las ponderaciones son los precios.


El ndice de Laspeyres de precios es la relacin que existe al comparar
los precios actuales de un grupo de artculos con los precios de esos mismos
artculos considerados en el perodo base, mantenindose constante como
ponderacin las cantidades del perodo base.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

% 100
0 0
0
0
=

Q P
Q P
L
t I
t


Donde:
L: ndice de Laspeyres.
t
t
I
1
: ndice de precios.
t
P : Precio de los artculos en el perodo que se investiga.
0
P : Precio de los artculos en el perodo base.
0
Q : Cantidad de los artculos en el perodo base.


De igual manera se puede representar as el ndice de Laspeyres de
cantidad:

% 100
0 0
0
0
=

Q P
Q P
L
t J
t


Donde:
L: ndice de Laspeyres.
t
t
J
1
: ndice de cantidad.
0
P : Precio de los artculos en el perodo base.
0
Q : Cantidad de los artculos en el perodo base.
t
Q : Cantidad de los artculos en el perodo que se investiga.


El ndice de precios de Paashe es la relacin que existe entre los precios
actuales de un grupo de artculos, con los precios de ellos en el perodo base,
mantenindose constante las ponderaciones que corresponden a las cantidades
de dichos artculos para el perodo que se investiga.


% 100
0
0
=

t
t t I
Q P
Q P
P
t



Donde:
P : ndice de Paashe.
t
t
I
1
: ndice de precios.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

t
P : Precio de los artculos en el perodo que se investiga.
0
P : Precio de los artculos en el perodo base.
t
Q : Cantidad de los artculos en el perodo que se investiga.


Para indicar las variaciones en las cantidades, el ndice de cantidad de
Paashe seala:

% 100
0
0
=

Q P
Q P
P
t
t t J
t



Donde:
P : ndice de Paashe.
t
t
J
1
: ndice de cantidad.
t
P : Precio de los artculos en el perodo que se investiga.
0
Q : Cantidad de los artculos en el perodo base.
t
Q : Cantidad de los artculos en el perodo que se investiga.

El ndice de precios de Fisher es un promedio geomtrico, que se define
como la raz cuadrada del producto del ndice de Laspeyres por el de Paashe.

% 100
0 0 0
0
0
=

t
t t t I
Q P
Q P
Q P
Q P
F
t

Donde:
F : ndice de Fisher.
t
t
I
1
: ndice de precios.
0
P : Precio de los artculos en el perodo base.
t
P : Precio de los artculos en el perodo que se investiga.
0
Q : Cantidad de los artculos en el perodo base.
t
Q : Cantidad de los artculos en el perodo que se investiga.

As mismo, se tiene el ndice de cantidad de Fisher:

100
0 0 0
0
0
=

Q P
Q P
Q P
Q P
F
t
t t t J
t


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

Donde:
F : ndice de Fisher.
t
t
J
1
: ndice de precios.
0
P : Precio de los artculos en el perodo base.
t
P : Precio de los artculos en el perodo que se investiga.
0
Q : Cantidad de los artculos en el perodo base.
t
Q : Cantidad de los artculos en el perodo que se investiga.



Una farmacia reporta la siguiente tabla referente a los precios (en cientos de miles
de pesos) y cantidades vendidas (por empaque) de cinco frmacos comunes en
los dos ltimos aos. Calcular los ndices de precios y de cantidades por los
mtodos de Laspeyres, Paashe y Fisher.


Tabla 5.4.
Precios y cantidades vendidas en una farmacia en 2003 y 2004


ARTCULO
2003 2004
Precio Cantidad Precio Cantidad
A 30 20 25 32
B 18 10 38 5
C 45 12 47 15
D 26 7 40 3
E 35 11 36 12


Para el clculo de cada ndice, se deben determinar todos los valores que
interviene en ellos, en la siguiente tabla se resumen todos los clculos:



Artculo P
2003
Q
2003
P
2004
Q
2004
P
2003
.Q
2003
P
2004
.Q
2004
P
2004
.Q
2003
P
2003
.Q
2004

A 30 20 25 32 600 800 500 960
B 18 10 38 5 180 190 380 90
C 45 12 47 15 540 705 564 675
D 26 7 40 3 182 120 280 78
E 35 11 36 12 385 432 396 420
TOTAL 1887 2247 2120 2223
E EJ JE EM MP PL LO O 2 29 9. .1 1
1 11 10 0. .1 11 10 0. .1 1

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva


Clculo de ndices de precios:

% 35 . 112 % 100
1887
2120
% 100
2003 2003
2003 2004
2004
2003
= = =

Q P
Q P
L
I


% 08 . 101 % 100
2223
2247
% 100
2004 2003
2004 2004
2004
2003
= = =

Q P
Q P
P
I


% 57 . 106 % 100
2223
2247
1887
2120
% 100
2004 2003
2004 2004
2003 2003
2003 2004
2004
2003
= = =

Q P
Q P
Q P
Q P
F
I



Interpretacin: los precios de los productos A, B, C, D y E de la farmacia
aumentaron en un 2.35%, 1.08% y 6.75% segn le mtodo de Laspeyres, Paashe
y Fisher, respectivamente, durante el ao 2004 respecto al 2003.


Clculo de ndices de cantidad:
% 81 . 117 % 100
1887
2223
% 100
2003 2003
2004 2003
2004
2003
= = =

Q P
Q P
L
J


% 106 % 100
2120
2247
% 100
2003 2004
2004 2004
2004
2003
= = =

Q P
Q P
P
J


% 74 . 111 % 100
2120
2247
1887
2223
% 100
2003 2004
2004 2004
2003 2003
2004 2003
2004
2003
= = =

Q P
Q P
Q P
Q P
F
J


Interpretacin: las cantidades vendidas de los productos A, B, C, D y E de la
farmacia aumentaron en un 17.81%, 6% y 11.74% segn le mtodo de Laspeyres,
Paashe y Fisher, respectivamente, durante el ao 2004 respecto al 2003.

2.3.5 LECCIN 30 USOS DE LOS NMEROS NDICES

Los nmeros ndices tienen especial importancia en la vida econmica de
un pas, es comn escuchar trminos como ndice de precios al consumidor (IPC),
ndice de prdida de poder adquisitivo, ndice de importacin o exportacin, etc. A
continuacin se ampliar un poco sobre los ms importantes nmeros ndices.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

2.3.5.1 Calculo del salario y del ingreso

100
($) nominal Salario
SR Real Salario =
IPC

100
($) nominal Ingreso
IR Real Ingreso =
IPC




Un empleado ganaba en diciembre de 2004 $780.000 y en el mes de junio de
2005, aumentaron su salario en $110.000 ms. Los IPC para los mismos meses y
aos fueron: 2532.4 y 3105.2 respectivamente. Se quiere saber si con el reajuste
que le hicieron su salario mejor con relacin al que tena anteriormente.


Se calcula primero el IPC de cada ao respecto al 2004.
6 . 122 100
4 . 2532
2 . 3105
100 100
4 . 2532
4 . 2532
2005
2004
2004
2004
= = = = IPC IPC


Esto quiere decir que los artculos de primera necesidad aumentaron en un 22.6%
para el perodo diciembre de 2004 y junio de 2005. De manera que debe haber un
porcentaje igual o mayor de incremento en el salario nominal para que las
condiciones econmicas sean iguales o mejores para el empleado.

El salario real para junio de 2005 es:

725938 100
6 . 122
890.000
SR = =

Esto quiere decir que el empleado slo est recibiendo el equivalente a $725.938
de los $780.000 que reciba. Aunque gane ms salario, el aumento es injusto. Su
aumento debera de ser mnimo el 22.6% de lo que ganaba en diciembre de 2004,
es decir: $176.280 ms para un salario de $956.280.


2.3.5.2 Poder de compra o poder adquisitivo o valor del dinero

100
IPC
1
PA compra de Poder =
100
I
I
IPA o adquisitiv poder de ndice
t
0
=
E EJ JE EM MP PL LO O 3 30 0. .1 1
1 11 10 0. .1 11 10 0. .1 1

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

Donde:
I
0
: ndice de precios al consumidor, considerado como perodo de referencia.
I
t
: ndice de precios al consumidor, considerado como perodo que se
investiga.



Determinar el poder de compra y el ndice de poder de compra para junio de 2005
respecto a diciembre de 2004.

0.8156 100
122.6
1
PA = =

Esto quiere decir que un peso en diciembre de 2004 equivale a 82 centavos en
junio de 2005. Su valor se ha reducido durante ese perodo en 18 centavos.

81.56% 100
3105.2
2532.4
IPA = =


2.3.5.3 Porcentaje de desvalorizacin

=
t
0
I
I
1 100 acin desvaloriz de %


Determinar el porcentaje de desvalorizacin para los datos del ejemplo 30.2.

% 45 . 18
3105.2
2532.4
1 100 acin desvaloriz de % =

=

De diciembre de 2004 a junio de 2005, la moneda ha perdido un 18.45% de su
poder de compra. Esto quiere decir que en junio de 2005 se necesita ms dinero
para comprar el mismo artculo en diciembre de 2004.
E EJ JE EM MP PL LO O 3 30 0. .3 3
1 11 10 0. .1 11 10 0. .1 1
E EJ JE EM MP PL LO O 3 30 0. .2 2
1 11 10 0. .1 11 10 0. .1 1

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

2.3.5.4 Porcentaje de variacin y de devaluacin

= 1
T
T
100 variacin de %
0
1

=
1
0
T
T
1 100 n devaluaci de %

Donde:

T
0
: Valor de la moneda de referencia.
T
t
: Valor de la moneda que se quiere cambiar.


La devaluacin es entendida como la prdida de valor de una moneda en relacin
a las monedas extranjeras.































UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

ACTIVIDADES DE AUTOEVALUACION UNIDAD 2


AUTOEVALUACIN LECCIN 16

1 En un caf Internet, el rango de tiempo de uso en un mes es de 27 minutos,
si el mayor tiempo de consulta en ese mes dur 1 hora y 12 minutos, halle
el menor tiempo de consulta en ese mes.


2. Calcule el rango intercuartlico y semiintercuartlico de los datos agrupados
en la tabla del numeral 1.9 de los ejercicios del tema 1.1. de esta Unidad
Didctica.

3. Halle el rango de 44las siguientes series:
a. 5 6 3 8 0 1
b. 2.35 3.16 1.20 2.10 5.32 4.8
c. 3 1 0 2 1 0 2 0 3
d. 5.35 6.16 4.20 5.10 8.32 7.8

AUTOEVALUACIN LECCIN 17

1. La junta directiva de uno de los equipos de ftbol de la ciudad decidi comprar
el pase de un jugador para ocupar la posicin de delantero. Para tal fin, el
empresario dueo de los pases presentar a los dos jugadores y mostrar la
cantidad de goles que han anotado en las ultimas cinco temporadas.


El empresario presento la siguiente tabla:


Jugador 1

18 16 14 17 20
Jugador 2

30 20 14 4 17


Por qu la junta decidi contratar el jugador 1?
Justifica tu respuesta utilizando la varianza y la desviacin tpica


2. En una prueba de tiro al blanco de cinco anillos, dos competidores Johan y
Samantha obtuvieron los resultados que se indican a continuacin. Determine,
usando medidas estadsticas, quin es el mejor.



UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

Johan Samantha
1 Tiro de 5 Puntos 4 Tiros de 5 Puntos
8 Tiros de 4 Puntos 9 Tiros de 4 Puntos
14 Tiros de 3 Puntos 7 Tiros de 3 Puntos
5 Tiros de 2 Puntos 5 Tiros de 2 Puntos
1 Tiro de 1 Punto 3 Tiros de 1 Punto
1 Tiro de 0 Puntos 2 Tiros de 0 Puntos


3. Tome los datos de la tabla de distribucin de frecuencias agrupadas del
numeral 1.2.c de los ejercicios del tema 1.1. de esta Unidad Didctica y
determine varianza y desviacin estndar.
4. Tome los datos del ejemplo 2.1., de la Unidad Didctica 1 que representan
la evaluacin de los latidos cardacos de un grupo de 30 personas despus
de cierta actividad fsica. Contine con esos datos para terminar el anlisis
completo de ese fenmeno y ahora calcule varianza, desviacin estndar,
desviacin media.

AUTOEVALUACIN LECCIN 18

1. Un fabricante de bombillas de nen tiene dos tipos de tubos, A y B. Los tubos
tienen unas duraciones medias respectivas de 1.495 horas y 1.875 horas, y
desviaciones estndar de 280 horas y 310 horas respectivamente.


a. Qu tubo tiene la mayor dispersin absoluta?
b. Qu tubo tiene la mayor dispersin relativa?
c. Si se extrajo un tubo de cada tipo y su duracin fue de 1.350 horas y
1.750 horas respectivamente, cul tipo de tubo tiene menor posicin
relativa?


2. El alcalde de la ciudad est considerando la posibilidad de implementar un
peaje de ingreso. Sus asesores han llegado a la conclusin que existen dos
ubicaciones posibles y favorables para ello. El alcalde decide medir el nmero de
automviles que ingresan a la ciudad por cada uno de los puntos durante los
ltimos 15 das. Los resultados se muestran en la siguiente tabla.


Punto 1 Punto 2
430 406
460 153
501 491
423 505
455 467
473 421
4
3
2
5
1
0
4
3
2
5
1
0

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

450 556
481 470
442 348
429 472
439 479
414 403
475 278
452 440
474 234


a. Calcular el valor de la dispersin absoluta para los dos puntos. cul tiene
mayor dispersin?

b. Que punto tiene la mayor dispersin relativa.

AUTOEVALUACION LECCIN 19

1. Dada la serie de puntuaciones 9, 5, 6, 11, 1, 2, 10, 4, hallar el puntaje
estandarizado de cada puntuacin


2. Las estaturas de los hombres adultos tienen una media de 1,75 metros y
una desviacin estndar de 7 centmetros. Calcule las puntuaciones Z que
corresponden a las siguientes personas:
a. Carlos Alberto que mide 156 centmetros.
b. Juan Jos que mide 1,81 metros.
c. Francisco que mide 1,68 metros.


3. En un grupo de estudiantes la estatura promedio es 163,1 cm., con una
desviacin estndar de 9,38 cm. y su peso promedio es de 61,3 kg con
desviacin estndar 11,7 kg. Mauricio mide 1,70 metros y pesa 63 kg,
calcule:
a. La puntuacin estandarizada de cada medida.
b. En cul de las dos medidas hay mayor dispersin absoluta?
c. En cul de las dos medidas hay menor dispersin relativa?

AUTOEVALUACIN LECCIN 20

1. Determine el tipo de asimetra de las siguientes distribuciones con sus
estadgrafos de dispersin:

a. 16 , 189 7 , 189 97 , 189 = = = Mo Me x
b. 4 5 3 , 5 = = = Mo Me x

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

c. 1 , 18 9 , 17 5 , 17 = = = Mo Me x

2. Tomando una distribucin ligeramente simtrica, calcule su moda sabiendo
que su media es 3 y que la diferencia entre la media y la mediana es igual a
-2.


3. Con los salarios semanales de los empleados de una empresa se tienen los
siguientes resultados:

50 , 1217 9672 9725 = = = s Me x

Calcule el coeficiente de asimetra de Pearson.


4. Calcule los coeficientes de asimetra y los coeficientes de apuntamiento de
las siguientes distribuciones correspondientes a la edad de los nios
quemados por plvora reportados en tres centros hospitalarios durante el
mes de diciembre:


X f f F
5 3 3 6
7 19 7 8
9 10 8 11
11 8 9 11
13 7 20 8
15 3 3 6
Total 50 50 50

Construya sus respectivos polgonos de frecuencia y haga un anlisis comparativo
de los resultados obtenidos.

AUTOEVALUACIN LECCIN 21

1. Nombrar tres ejemplos de fenmenos econmicos que puedan ser analizados
mediante la regresin.

2. cul es la razn para que los coeficientes angulares y el coeficiente de
correlacin tengan signos iguales?

3. Que nos indica que el coeficiente angular sea negativo?

4. Son ciertos o falsos las siguientes afirmaciones?


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

a. Un coeficiente de correlacin igual a -1 indica que la lnea de regresin no es la
mejor que refleja las relaciones entre las dos variables

b. El coeficiente de correlacin es un valor menor que -1 y mayor que 1
c. Si r es mayor que 1,la recta ajustada explica ms que suficiente las relaciones
entre las dos variables.

AUTOEVALUACIN LECCIN 22

Dibuje un diagrama de dispersin de cada una de las siguientes situaciones


1. La cantidad de leche producida por una vaca decrece despus de que esta
da a luz. Un veterinario desea expresar esta relacin por medio de una
ecuacin. Los datos reunidos producen los siguientes resultados:


Litros por da 12 11 8 9 8 7
Nmero de das 10 30 40 50 55 65

Sugiere la grfica una asociacin lineal


2. Con los siguientes datos, correspondientes a la produccin X (miles de
unidades) y Y el costo de la produccin de esas unidades (millones de
pesos), se pide:


X (miles de unidades) 2 5 8 10 12 15 17 20
Y (millones de pesos) 4 8 10 11 12 14 15 16


a sugiere la grfica una asociacin lineal?

AUTOEVALUACIN LECCIN 23

1. La cantidad de leche producida por una vaca decrece despus de que esta
da a luz. Un veterinario desea expresar esta relacin por medio de una
ecuacin. Los datos reunidos producen los siguientes resultados:


Litros por da 12 11 8 9 8 7
Nmero de das 10 30 40 50 55 65



UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

Determine la mejor ecuacin que se ajusta a los datos dados. Y verifique si
la ecuacin obtenida se ajusta correctamente.


2. Se desea conocer la relacin que pueda existir entre las alturas en una
muestra de 12 padres y sus hijos. La siguiente tabla refleja los datos
obtenidos (en pulgadas):


Altura del padre 65 63 67 68 62 70 66 68 67 69 71
Altura del hijo 68 66 68 69 66 68 65 71 67 68 70


Determine la mejor ecuacin que se ajusta a los datos dados. Y verifique si
la ecuacin obtenida se ajusta correctamente.

3. Ajustar a una recta los datos de la siguiente tabla tomando:
a. X como variable independiente
b. Y como variable dependiente.


X 3 5 6 8 9 11
Y 2 3 4 6 5 8

AUTOEVALUACION LECCIN 24


1. Una compaa de ahorro y crdito, desea saber cmo son afectadas las ventas
de viviendas por diferentes tasas de inters. Durante ocho meses se
recopil la informacin y se obtuvo el siguiente resultado:


Tasa de inters (%) 7 6.5 5.5 6 8 8.5 6 6.5
Ventas de viviendas 23 38 45 36 16 18 39 41


a. Estimar las ventas en funcin de la tasa de inters.
b. Cuntas viviendas se pueden vender si el inters es del 7.5%?
c. Determinar el error estndar del estimado.
d. Es confiable el modelo?
e. Calcule el tipo de asociacin entre las variables.




UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

AUTOEVALUACIN LECCIN 25

1. Una empresa transportadora de frutas, est interesada en precisar la
relacin que existe entre la distancia a la cual se transporta una carga de
fruta, la temperatura a la cual se mantiene y el porcentaje del despacho que
se daa al llegar a su destino. Se realiz un muestreo para ocho destinos
diferentes y estos son los resultados:

Distancia
(decenas de km)
Temperatura
(C)
Carga daada
(%)
39 8 7
52 6 6
48 7 7
46 12 10
61 9 9
34 6 4
25 10 3
55 4 4


a. Estimar el porcentaje de carga daada en funcin de la distancia y de
la temperatura.
b. Estime el porcentaje de fruta que se podra daar en un viaje de 480
km a una temperatura de 9C.
c. Determine el error estimado.
d. Es confiable el modelo?

AUTOEVALUACIN LECCIN 26

Supongamos los precios de un artculo en el periodo 1983-1988, segn la tabla



AOS

PRECIOS
INDICE % DE VARIACIN
1983=100 1986=100
(A)


(B) A B
1983 200 100 50 - -50
1984 280 140 70 + 40 -30
1985 240 120 60 +20 -40
1986 400 200 100 +100 0
1987 480 240 120 +140 +20
1988 600 300 150 +200 +50


1. Con estos datos calcular los ndices simples de precios con base 1983 y luego
los ndices con base en 1986.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

AUTOEVALUACION LECCIN 27.


Una marroquinera produce bolsos para dama en tres lneas diferentes. Los datos
sobre produccin de bolsos y de tiempo por empleado (en horas) ocupados en la
empresa durante el perodo 2001-2003 son los siguientes:

ARTCULO
Produccin en miles de
docenas
Horas-hombre por docena
2001 2002 2003 2001 2002 2003
A 5 8.3 9.4 6.3 6.2 6.3
B 7.5 10.2 11.8 4.7 4.9 4.6
C 5.5 5.6 4.2 3.2 3.2 3.2

a. Calcule un ndice de cantidad para el ao 2003, empleando como
base el ao 2001 y utilizando como ponderacin los datos sobre
horas-hombre empleadas por docena de bolsos en 2001.
b. Calcule un ndice de produccin de 2002 con base en 2001.

AUTOEVALUACIN LECCIN 28

1. Tomadas las cosechas de ciertos productos agrcolas (en cientos de toneladas),
determinar el ndice agregativo simple para 2004 con base en 2002.


Productos 2002 2004
A 11.158 13.044
B 1.196 1.357
C 1.111 1.326
D 1.460 1.840
E 859 997
F 1.106 870
G 41 59
H 6.686 7.978
I 204 202

2. Calcular el ndice agregativo de las cantidades que resultaron en mal estado
de conservacin, en un grupo de artculos, comprados en el mes de junio de 2008,
respecto a las cantidades compradas en mal estado de conservacin en el mes de
mayo del mismo ao







UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva


ARTICULOS
UNIDAD DE
MEDIDA
CANTIDADES DEFECTUOSAS

MAYO DE 2008

JUNIO DE 2008
A Kg 12 18
B Lts 8 15
C Doc 20 8
D Lbs 14 20
E Unidad 50 70
Total --------- 104 131

AUTOEVALUACIN LECCIN 29

Para los siguientes datos, calcular los ndices de precios y de cantidades por los
mtodos de Laspeyres, Paashe y Fisher.

ARTCULO
2002 2004
Precio Cantidad Precio Cantidad
A 320 15 320 26
B 140 18 200 35
C 80 35 600 54
D 560 28 520 25
E 1120 14 1200 18


2. Con los siguientes datos, referentes a los precios y cantidades ( valores
arbitrarios) par un grupo de artculos dados para dos periodos.


ARTCULO UNIDAD DE
MEDIDA
2007 2008
PRECIO CANTIDAD PRECIO CANTIDAD
A Kg 26,0 10 38,0 8
B Lts 6,0 5 10,0 7
C Lbs 1,0 2 4,0 5
D Doc 6,0 1 15,0 2
E Unidad 3,6 2 2,0 1

Calcular los ndices de Laspeyres, Paasche y Fisher





UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

AUTOEVALUACIN LECCIN 30

Con los siguientes datos:


AOS
SALARIOS
(miles de millones
de pesos)
OBREROS
N
IPC
1991=100
1998 18.0 320 140
1999 20.6 380 148
2000 23.0 400 152
2001 38.0 700 160
2002 51.0 1.000 166
2003 58.0 1.050 168
2004 60.0 1.100 170



Se pide
a. Salarios reales con respecto a 1998.
b. Salarios nominales por obrero.
c. ndices de los salarios reales con base 1998.
d. ndices de los salarios nominales con base 1998.
e. Salarios reales por obrero, con base 1998.
f. ndices de salarios reales por obrero, con base 1998.





















UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

AREA:

ESTADSTICA

Escuela de Ciencias Bsicas Tecnologa e
Ingeniera

CIENCIAS BSICAS

UNIDAD: Medidas de Dispersin y estadsticas bivariantes
CAPTULO: IV
LECCIN: Regresin y Correlacin

NUMERO DE LA PRCTICA 2
NOMBRE DE LA PRCTICA Regresin y correlacin
NOMBRE DEL SOFTWARE Excel
Libre: ______x_____ Licenciado: _____________ (Marque con una X)

Aspectos Tericos:

REGRESIN Y CORRELACIN

En muchos casos se requiere conocer ms que el comportamiento de una sola
variable, se requiere conocer la relacin entre dos o ms variables como la
relacin entre produccin y consumo; salarios y horas de trabajo; oferta y
demanda; salarios y productividad; la altura de un rbol y el dimetro de su tronco;
el nivel socioeconmico de una persona y su grado de depresin; etc.
Muchos de estos comportamientos tienen una tendencia lineal, aunque hay
muchos otros que lo hacen de forma curva. Para determinar el grado de
correlacin entre las variables, no basta con calcular la varianza explicada, pues
existe el coeficiente de determinacin o coeficiente de correlacin; sin embargo,
frecuentemente se utiliza un coeficiente de correlacin rectilneo, r siendo este un
valor entre -1 y 1.
Para estas confrontaciones se utiliza el diagrama de dispersin que es plano
cartesiano en el que se marcan los puntos los puntos correspondientes a los pares
(x,y) de los valores de las variables.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva


El anlisis de Regresin tiene los siguientes usos: el primero es obtener los
estimadores de los parmetros, estimar la varianza del error, obtener los errores
estndares de los parmetros estimados, probar la hiptesis sobre los parmetros,
clculo de valores estimados basados en la ecuacin estimada, estimar el ajuste o
la falta de ajuste del modelo.
El modelo a utilizar es Y = a + bx, a es el intercepto, b es la pendiente de la
funcin, la que nos indica el cambio marginal de Y respecto a X.
Ejemplo
Una empresa de mensajera de entrega puerta a puerta, con el fin de mejorar la
prestacin del servicio desea establecer la relacin que puede existir entre el
tiempo empleado y la distancia recorrida para la entrega de un determinado
producto.

Distancia en
Kilmetros
(x)

825

215

1070

550

480

920

1350

325

670

1215
Tiempo de
entrega ( y)
(das)

3,5

1,0

4,0

2,0

1,0

3,0

4,5

1,5

3,0

5,0

a. Realice un diagrama de dispersin a partir de los datos obtenidos
b. Determine la mejor ecuacin que se ajusta a los datos.

Solucin:

El diagrama de dispersin se obtiene mediante el asistente de grficos.
Trasladamos los datos a una hoja en Excel, seleccionamos la tabla donde estn
los datos <<Insertar<<Dispersin. En estilo de diseo puede personalizar su
diagrama de barras.
Seleccionamos un diseo de grafico de la barra de herramientas y damos nombre
a los ejes y al Diagrama.



UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva









Para hallar la recta de Regresin y la ecuacin que mejor se ajusta a los datos, en
el diagrama de dispersin hacemos click derecho sobre uno de los puntos y
seleccionamos Agregar lnea de tendencia.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva




As obtenemos una ventana, la cual nos permite escoger la lnea de tendencia,
elegimos opcin de lnea de tendencia (Lineal) y seleccionamos:

Presentar ecuacin en el grafico.
Presentar el valor R cuadrado en el grafico.








UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva


De esta manera obtenemos nuestra recta de regresin, la ecuacin que ms se
ajusta a los datos y el coeficiente de determinacin el cual mide la relacin entre
las dos variables.






Anlisis:



Con los resultados obtenidos se puede asegurar que la ecuacin de la recta es
una muy buena estimacin de la relacin entre las dos variables. El R
2
afirma
adems que el modelo explica el 90.05% de la informacin y el valor de r
coeficiente de correlacin lineal confirma adems el grado de relacin (94%)
entre las variables: Distancia y tiempo de entrega de un determinado producto.






UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

EJERCICIOS:

1. Se quiere estudiar la asociacin entre consumo de sal y tensin arterial. A una
serie de voluntarios se les administra distintas dosis de sal en su dieta y se mide
su tensin arterial un tiempo despus.

X (sal) Y (Presin)
1,8 100
2,2 98
3,5 105
4,0 110
4,3 112
5,0 120

a. Realice el diagrama de dispersin y determine el tipo de asociacin entre las
variables
b. Encuentre el modelo matemtico que permite predecir el efecto de una variable
sobre la otra. Es confiable?
c. Determine el porcentaje de explicacin del modelo y el grado de relacin de las
dos variables.
d. Si a un paciente se le administra una dosis de sal de 6,5. Cul es la tensin
arterial esperada?


2. En un nuevo proceso artesanal de fabricacin de cierto artculo que esta
implantado, se ha considerado que era importante ir anotando peridicamente el
tiempo medio ( medido en minutos) que se utiliza para realizar una pieza y el
nmero de das desde que empez dicho proceso de fabricacin. Con ello, se
pretende analizar como los operarios van adaptndose al nuevo proceso
mejorando paulatinamente su proceso de produccin.
Los siguientes datos representan dicha situacin:

X 10 20 30 40 50 60 70
Y 35 28 23 20 18 15 13

a. Realice el diagrama de dispersin y determine el tipo de asociacin entre las
variables
b. Encuentre el modelo matemtico que permite predecir el efecto de una variable
sobre la otra. Es confiable?

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

c. Determine el porcentaje de explicacin del modelo y el grado de relacin de las
dos variables.
d. Que tiempo deber tardarse un empleado cuando se lleven 100 das?

3. Una Nutricionista de un hogar infantil desea encontrar un modelo matemtico
que permita determinar la relacin entre el peso y la estatura de sus estudiantes.
Para ello selecciona 10 nios y realiza las mediciones respectivas.
A continuacin se presentan los resultados:

Estatura
(cm)
121 123 108 118 111 109 114 103 110 115
Peso (
kg)
25 22 19 24 19 18 20 15 20 21

a. Realice el diagrama de dispersin y determine el tipo de asociacin entre las
variables
b. Encuentre el modelo matemtico que permite predecir el efecto de una variable
sobre la otra. Es confiable?
c. Determine el grado de relacin de las dos variables.
d. Cual es el peso que debera tener un estudiante que mida 130 cm?























UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva


BIBLIOGRAFA DE LA UNIDAD



BEJARANO BARRERA, Hernn (1995). Estadstica Descriptiva. Santa fe de
Bogot: UNISUR.

CHRISTENSEN, Howard B. (1999). Estadstica Paso a Paso. Mxico: Editorial
Trillas.

MARTNEZ BENCARDINO, Ciro (2004). Estadstica Bsica Aplicada. Santa fe de
Bogot: ECOE Ediciones.

MARTNEZ BENCARDINO, Ciro (2003). Estadstica y Muestreo. Santa fe de
Bogot: ECOE Ediciones.

MILTON, J. Susan (1999). Estadstica para biologa y ciencias de la salud. Madrid:
McGraw Hill Interamericana.

PORTUS GOVINDEN, Lincoyn (2001). Introduccin a la Estadstica. Segunda
edicin. Santa fe de Bogot. McGraw Hill.

PORTILLA CHIMAL, Enrique (1980). Estadstica, Primer Curso. Bogot: Nueva
Editorial Interamericana.

SPIEGEL, Murria R. (1991). Estadstica. Serie de compendios Schaum. Mxico:
McGraw Hill.

SMITH, A. Stanley. (1992). Curso de Estadstica Elemental para las ciencias
aplicadas. Primera edicin. Santa fe de Bogot. Editorial Addison Wesley
Iberoamericana.

TRIOLA, MARIO F. (2004). Probabilidad y Estadstica. Novena edicin. Mxico.
Pearson Educacin.

http://www.aulafacil.com/CursoEstadistica/CursoEstadistica.htm

http://www.elosiodelosantos.com/regresionlineal.html

http://www.universidadabierta.edu.mx/SerEst/MAP/METODOS%20CUANTITATIV
OS/Pye/tema_12.htm

http://server2.southlink.com.ar/vap/MEDIDAS.htm
http://cosmech.tripod.com/Estadistica/medidas1.htm


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

http://eris.unalmed.edu.co/~cescobar/Bioestadistica/bioestadistica.htm

http://ftp.medprev.uma.es/libro/node42.htm

http://www.eumed.net/cursecon/medir/

































UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

Anexo A

Sumatorias y Productorias



A lo largo de los trabajos en estadstica se encontrarn muchas veces con
la suma de un gran nmero de trminos. Con el fin de utilizar el lenguaje
algebraico que permita realizar simplificaciones, se requiere el uso del smbolo
sumatoria el cual representa la operacin de adicin algebraica sobre una
determinada cantidad de elementos numricos.

Considere las siguientes cantidades: 7, 9, 15, 14, 8, 3, 5, 16. Estos trminos
pueden sumarse de la forma ms comn:

77 16 5 3 8 14 15 9 7 = + + + + + + + = S

Si cada uno de estos trminos numricos es representado por X
i
, donde el
subndice i indica la cantidad relativa de elementos considerados, se puede
expresar la anterior operacin como:

77 ...
8 3 2 1
= + + + + = X X X X S

Ahora, esta operacin puede expresarse de la siguiente forma:

77 ...
8 3 2 1
8
1
= + + + + =

=
X X X X X
i
i


El smbolo griego sigma (), que se lee sumatoria representa, para el caso
ms general, la suma de n trminos cualquiera. Se tiene entonces que:

=
n
i
i
X
1


es la suma de n trminos, donde n es el lmite superior de la sumatoria; i es el
elemento genrico de la sumatoria; i = 1 es el lmite inferior de la sumatoria.

La sumatoria tiene algunas propiedades importantes que deben tenerse en
cuenta:

- La sumatoria de una constante C de 1 a n es igual a n veces la constante.

=
= + + + =
n
i
nC C C C C
1
...

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

- La sumatoria del producto de una constante por una variable es igual a la
constante por la sumatoria de la variable.

= =
= + + + =
n
i
i
n
i
n i
X C CX CX CX CX
1 1
2 1
...

- La sumatoria de los valores de una variable ms una constante es igual a la
sumatoria de la variable ms n veces la constante.

= = =
+ = + + + + + + = +
n
i
n
i
i
n
i
n i
C X C X C X C X C X
1 1 1
2 1
) ( ... ) ( ) ( ) (

- La sumatoria de una constante con lmite inferior diferente a 1 es:
C m n C
n
m i
) 1 ( + =

=



Dados los valores: X
1
= 2, X
2
= 6, X
3
= 1, X
4
= 0, X
5
= 7, X
6
= 7, X
7
= 8, hallar:
a.

=
= + + + + = + + + + =
5
1
5 4 3 2 1
16 7 0 1 6 2
i
i
X X X X X X
b.

=
= + + + + = + + + + =
7
3
7 6 5 4 3
23 8 7 7 0 1
i
i
X X X X X X
c.

=
= + + + + = + + + + =
5
1
2 2 2 2 2 2
5
2
4
2
3
2
2
2
1
2
90 7 0 1 6 2
i
i
X X X X X X

d.

= =
= + + + + = + + + + = =
7
3
7 6 5 4 3
7
3
161 ) 8 7 7 0 1 )( 7 ( ) )( 7 ( 7 7
i i
i i
X X X X X X X

e.
25 ) 5 )( 1 2 6 ( 5
6
2
= + =

= i

f.
| | | | 6 8 14 ) 2 )( 1 2 5 ( 2 ) 2 (
5 4 3 2
5
2
5
2
5
2
= = + + + + = =

= = =
X X X X X X
i i
i
i
i




La productoria indica el producto de determinada cantidad de elementos
numricos. Se utiliza la letra griega pi (), que se lee producto de. De este modo,
el producto de n trminos cualquiera est dado por:

n
n
i
i
X X X X =
I
=
...
2 1
1


E EJ JE EM MP PL LO O A A. .1 1. .

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

donde n es el lmite superior de la productoria; i es el elemento genrico; i = 1 es el
lmite inferior. Este smbolo es usado para calcular la media geomtrica.

Igual que la sumatoria, la productoria tiene propiedades importantes:

- La productoria de una constante C es igual a una potencia, donde la base es la
constante y el exponente es el lmite superior del producto.
n
n
i
C C C C C = =
I
=
...
1


- El producto de una constante C por una variable es igual a la constante
elevada al lmite superior por la productoria de la variable.

=
I I
= =
n
i
i
n
n
i
i
X C CX
1 1


- La productoria de una constante con lmite inferior diferente a 1 es:
1 +
=
=
I
m n
n
m i
C C



Dados los valores: X
1
= 2, X
2
= 6, X
3
= 1, X
4
= 0, X
5
= 5, X
6
= 3, hallar:
a. 0 5 0 1 6
5
2
= =
I
= i
i
X
b.
32 2 2 2 2 2 2
4
4
1
= = =
I
= i

c. | | 0 3 5 0 1 6 2 729 3 3
6
1
6
6
1
= =

=
I I
= = i
i
i
i
X X



E EJ JE ER RC CI IC CI IO OS S A AN NE EX XO O A A

1. Si X
1
= 2, X
2
= 4, X
3
= 5, X
4
= 6 y X
5
= 1, calcular:
a.

=
5
1 i
X b.

=
3
1
2
i
X c.

=
4
2
5
i
X
d.

=
+
5
1
) 2 (
i
X e.

=

5
3
2
) 4 (
i
X f.

=

4
1
2
4
i
X

2. Complete el siguiente cuadro.

E EJ JE EM MP PL LO O A A. .2 2. .

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

OPERADOR DESARROLLO RESULTADO

=
10
1 i
i

=
5
1
2
i
i

=
5
1
10
i


) 1 2 (
5
1
+

= i
i

) 1 2 2 (
3
1
2
+ +

= x
x x

=

5
2
2
) 1 2 (
x
x

=

7
4
2
) 2 (
x
x

=
4
1 x
x
x


2
5
1

= x
x


I
=

4
1
) 4 2 (
i
i


I
=
5
1 i
i


I
=
5
1
8
i


I
=
4
1
3
i
i


I

=
=

+
5
2
5
2
1 2 3
1 2 2
n
n
n
n











UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva

INFORMACIN DE RETORNO DEL ANEXO A


1. a. 18 b. 45 c. 64
d. 28 e. 14 f. 77

2.
OPERADOR RESULTADO OPERADOR RESULTADO

=
10
1 i
i

55

=
4
1 x
x
x

288

=
5
1
2
i
i

55
2
5
1

= x
x

225

=
5
1
10
i

50
I
=

4
1
) 4 2 (
i
i

0
) 1 2 (
5
1
+

= i
i 35
I
=
5
1 i
i

120
) 1 2 2 (
3
1
2
+ +

= x
x x 43
I
=
5
1
8
i

32768

=

5
2
2
) 1 2 (
x
x

164
I
=
4
1
3
i
i

1944

=

7
4
2
) 2 (
x
x 118
I

=
=

+
5
2
5
2
1 2 3
1 2 2
n
n
n
n

5759
57