You are on page 1of 148

Estadstica General 2016

20

15

10

0
11 12 14 16 17 19

1 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
NDICE

I. CAPITULO Qu es la Estadstica? ................................................................................................ 4


1.1 Introduccin .................................................................................................................................. 4
1.2 Qu se entiende por estadstica?.......................................................................................... 4
1.3 Por qu hay que estudiar Estadstica? ................................................................................ 5
1.4 Tipos de estadstica .................................................................................................................... 7
1.5 Elementos que caracterizan a los problemas estadsticos ............................................... 8
1.6 Definiciones bsicas ................................................................................................................... 8
1.7 Clasificacin de las Variables................................................................................................. 10
A. Segn la Naturaleza de la Variable .................................................................................... 10
B. Segn la Escala de Medicin .............................................................................................. 11
ESCALAS DE MEDICIN .................................................................................................................. 21
C. Segn la Relacin Entre Variables .................................................................................... 22
II. CAPITULO Presentacin de Datos ........................................................................................... 24
2.1. Clasificacin y cmputo de datos uni. y bivariables:. ...................................................... 24
A. Codificacin y tabulacin .................................................................................................... 24
B. Presentacin tabular de los Datos: cuadros de distribucin de frecuencias ......... 24
C. Cuadros estadsticos ............................................................................................................ 24
D. Partes Principales de un Cuadro Estadstico ................................................................. 25
2.2. Cuadros de Frecuencias de Variables Discretas ............................................................... 30
A. DISTRIBUCIN DE FRECUENCIAS DE LA VARIABLE CUALITATIVAS: .................. 36
B. REPRESENTACIN GRAFICA DE LA VARIABLE CUALITATIVAS: ........................... 37
D. REPRESENTACIN GRAFICA DE LA CUANTITATIVAS DISCRETAS: ......................... 43
2.3. Cuadros de Frecuencias de Variables Continuas.......................................................... 46
E. DISTRIBUCIN DE FRECUENCIAS, DE LA VARIABLE CUANTITATIVA CONTINUA: .......................... 55
F. REPRESENTACIN GRAFICA DE LA CUANTITATIVAS CONTINUA:.................................................. 60
Grficos Estadsticos........................................................................................................................... 72
Clasificacin De Los Grficos ............................................................................................................ 72
III. CAPITULO Medidas de Resumen ............................................................................................. 87
3.1 Medidas de resumen para variables cualitativas ................................................................ 87
3.2 Razn e ndice. Definicin. Clculo e interpretacin ........................................................ 87
3.3 Medidas de resumen para variables cuantitativas. ........................................................... 99
3.3.1 Medidas de Posicin Centrales (Tendencia Central) ................................................ 99
1. La Media Aritmtica ..................................................................................................................... 99

2 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
2. La Mediana (Me) ........................................................................................................................ 101
3. Moda (Mo) (Valor Modal o Promedio Tpico) ......................................................................... 105
Caractersticas de las Medidas de Posicin Centrales ................................................................ 107

4. Media Geomtrica: X G , G ..................................................................................................... 114

5. Media Armnica: X H , H ........................................................................................................ 118


IV. CAPITULO Estadgrafos de Tendencia No central ............................................................. 121
4.1. Estadgrafos de Tendencia No central ............................................................................... 121
A. Los Cuartiles ......................................................................................................................... 121
B. Para elaborar un diagrama de caja y bigotes es necesario saber:.......................... 123
C. Deciles .................................................................................................................................... 127
D. Percentiles o Centiles ........................................................................................................ 129
V. CAPITULO Medidas de Dispersin ............................................................................................ 132
5.1. Medidas de dispersin ........................................................................................................... 132
A. Recorrido o rango (R)................................................................................................................ 132
B. Recorrido Semi Cuartil (Q) ....................................................................................................... 132
C. Varianza (s2) .......................................................................................................................... 132
D. Desviacin Estndar o Tpica (s) ......................................................................................... 134
E. Coeficiente de Variacin (CV) .................................................................................................. 134
VI. CAPITULO Estadgrafos de Deformacin ............................................................................. 135
Asimetra.- ................................................................................................................................................ 135
A. Relacin Entre La Media, Mediana y Moda .................................................................... 135
B. Distribucin Simtrica ........................................................................................................ 135
C. Importancia de la Asimetra.- ................................................................................................ 136
D. Coeficiente de Asimetra. ................................................................................................... 136
E. Kurtosis o Apuntamiento.- .................................................................................................... 136
VII. CAPITULO Regresin y Correlacin Lineal ......................................................................... 144
Regresin y Correlacin Lineal........................................................................................................ 144

3 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
I. CAPITULO Qu es la Estadstica?

1.1 Introduccin

La importancia de la estadstica en la actualidad, no se pone en discusin. Casi


todos los programas profesionales universitarios incluyen en su currculo, al menos
un curso de estadstica. En muchos pases, inclusive en el Per, la estadstica forma
parte del currculo de la educacin secundaria e inclusive se incluyen algunos
tpicos en la educacin primaria.

La dinmica del mundo moderno, exige que todo ciudadano, para ejercer sus
derechos y comprender su entorno, requiera de una alfabetizacin en estadstica.

1.2 Qu se entiende por estadstica?

Al revisar el texto, vemos que esta parte se encuentra desarrollada posteriormente a


las razones por las que se debe estudiar estadstica, aqu lo hacemos primero, para
iniciar entendiendo lo que significa la Estadstica.

Realice la lectura de este acpite e identifique las ideas principales al respecto. Le


sugiero que subraye las ideas principales que encuentre.
Est de acuerdo en que la idea central se relaciona con el tratamiento de
informacin numrica?

Lo invito ahora a que enuncie su propia definicin sobre la estadstica.

Le parece a usted que podramos definir a la estadstica como la ciencia que nos
proporciona los elementos de juicio necesarios para llegar a tomar decisiones
adecuadas?, si est de acuerdo reflexione sobre las razones que le llevan a estarlo;
si no lo est tambin reflexione sobre la definicin adecuada y regrese al texto para
constatarlo.

De las diferentes formas de enunciar lo que significa la estadstica, realice ahora un


cuadro sinptico en la que se resuman las ideas claves que se observan en
cualquiera de las definiciones encontradas. Para ello lea detenidamente este acpite
que se encuentra en el texto bsico y reflexione sobre los distintos ejemplos que se
han planteado all.

4 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016

1.3 Por qu hay que estudiar Estadstica?


Si se revisa un catlogo de informacin de la universidad, se descubrir que la
educacin estadstica se requiere en muchos Facultades. Por qu pasa esto?.
Cules son las diferencias en los cursos de Estadstica impartidos en una
Facultades de la Universidad. La mayor diferencia son los ejemplos utilizados.
Bsicamente, el contenido del curso es el mismo; Por ejemplo en una Escuela
Profesional de Administracin interesan cosas como las ganancias, horas de trabajo,
y salarios. En un Departamento de Salud interesan los resultados de las pruebas, y
en una Facultad de Ingeniera pueden interesar cuntas unidades son producidas
por una mquina en especial. Sin embargo, las tres reas tienen inters en lo que es
un valor tpico y en la cantidad de variacin existente en la informacin. Es posible
que tambin exista una diferencia en el nivel de matemticas requerido. Un curso de
Estadstica en ingeniera generalmente requiere del Clculo, los cursos de
Estadstica en escuelas de administracin y en la educacin, generalmente ensean
un curso orientado a aplicaciones. Entonces, por qu se requiere estudiar
Estadstica en tantas carreras?.

La primera razn es que en todos lados encontramos informacin numrica. Si se


revisan los peridicos, revistas de informacin, revistas de negocios, publicaciones
de inters general, o revistas de deportes, uno estar bombardeado con informacin
numrica.

Presentamos aqu algunos ejemplos:

Ford reporta que en 2011 sus ventas fueron de $146900 millones (de dlares),
arriba en un 7,2%; sus ganancias fueron de $4400 millones, con ascenso en un
7,0%, y el efectivo neto circulante fue de S/.7200 millones.
Los egresados de postgrado de la Universidad, contaron con un sueldo promedio
inicial de $400 dlares y un 70% de ellos consiguieron trabajo a los tres meses de
la graduacin.
Para los futbolistas que gustan de jugar en campos deportivos, el alquiler de los
campos promediaban S/.500 nuevos soles por semana.

5 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
Cmo podemos determinar si las conclusiones presentadas son razonables?, las
muestras fueron suficientemente grandes?, cmo se seleccionaron las unidades de
la muestra? Para poder ser un consumidor con conocimientos sobre esta
informacin, necesitamos poder leer los cuadros, las grficas y entender la discusin
de la informacin numrica. El entender los conceptos bsicos de la Estadstica ser
de gran ayuda.

La segunda razn para tomar el curso de Estadstica es que las tcnicas estads-
ticas se utilizan para tomar decisiones que afectan nuestra vida diaria. Esto quiere
decir que afectan a nuestro bienestar personal. He aqu algunos ejemplos:

Las compaas de seguros utilizan anlisis estadsticos para establecer las tarifas
de los seguros de casa, automvil, vida y salud. Existen tablas que resumen la
probabilidad de que una mujer de 25 aos de edad viva el ao siguiente, los si-
guientes cinco aos, etc. Las primas del seguro de vida se pueden establecer
basndose en estas probabilidades.
La Agencia de Proteccin al Medio Ambiente est interesada en la calidad del
agua en el Lago Ene. Peridicamente toman muestras de agua para establecer el
nivel de contaminacin y mantener el nivel de calidad.
Los investigadores mdicos estudian las tasas de cura de enfermedades, basn-
dose en el uso de diferentes medicamentos y distintas formas de tratamiento. Por
ejemplo, cul es el efecto de tratar cierto tipo de dao a la rodilla con ciruga o
con terapia fsica? Si se toma una aspirina diaria, se reducir el riesgo de sufrir un
ataque cardiaco?

La tercera razn para tomar el curso de Estadstica es que el conocimiento de los


mtodos estadsticos ayudar a entender por qu se toman ciertas decisiones, y le
aportarn una mejor comprensin sobre la manera en la que lo afectan.
Sin importar el tipo de trabajo que seleccione, encontrar que tiene que enfrentar la
toma de decisiones con la ayuda del anlisis de datos. Para poder realizar una deci-
sin basada en la informacin, necesitar:

1. Determinar si la informacin existente es adecuada o si se requiere informacin


adicional.

6 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
2. Reunir informacin adicional, si es necesario, de tal forma que no hayan resultados
errneos.
3. Resumir la informacin de una forma til e informativa.
4. Analizar la informacin disponible.
5. Sacar las conclusiones y realizar las deducciones necesarias, al tiempo que se
evala el riesgo de llegar a una conclusin incorrecta.

1.4 Tipos de estadstica


Por lo general, el estudio de la estadstica se divide en dos categoras

Estadstica Descriptiva: cuando se recoleccin, clasificacin resumen,


procesamiento y representa un grupo de datos utilizando mtodos numricos y
grficos que resumen y presentan la informacin contenida en ellos. No pretende
ir ms all del conjunto de datos investigados.

Estadstica Inferencial: cuando apoyndose en el clculo de probabilidades y a


partir de datos muestrales, efecta estimaciones, decisiones, predicciones y
otras generalizaciones sobre un conjunto mayor de datos.

Figura N 01

7 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
1.5 Elementos que caracterizan a los problemas estadsticos
La poblacin de inters y el procedimiento cientfico que se emple para tomar la
muestra de la poblacin.
La muestra y el anlisis matemtico de su informacin.
Las inferencias estadsticas que resultan del anlisis de la muestra.
La probabilidad de que las inferencias sean correctas.

1.6 Definiciones bsicas


Poblacin o Universo (N) Est referido a un colectivo finito o infinito de elementos
individuales. Poblacin es un conjunto completo de individuos u objetos que
poseen alguna caracterstica comn observable. Poblacin es el nmero de
elementos que definen la cobertura de un estudio. La poblacin es el universo de
estudio que est integrado por la totalidad de todas las unidades de anlisis. Por
ejemplo

Alumnos de Ingeniera Civil matriculados en ciclo acadmico 2012 en la


Universidad.
Alumnos de IV ciclo de la Escuela Profesional de Ingeniera Civil de la
Universidad.
Ingenieros Civiles Colegiados en el departamento de Cajamarca en el ao 2012.

Muestra (n) Es la parte o subconjunto de una poblacin. La muestra est


constituida de elementos seleccionados de una manera deliberada, con el objeto
de investigar las propiedades de su poblacin. La muestra slo da informacin de
aquella poblacin de la que ha sido extrada.

POBLACIN (N) MUESTRA (n)

Muestreo

Inferencia

Figura N 02

8 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
Unidad de Anlisis o Unidad de Observacin Es el objeto o elemento indivisible
que ser estudiado en una poblacin sobre los cuales se va a obtener datos. La
unidad de anlisis no es el fenmeno investigado sino el que genera el fenmeno y
proporciona datos concretos. Por ejemplo

El tipo de anlisis al que se someter la informacin es determinante para elegir


la unidad de anlisis. Por ejemplo, si el objetivo es dar cuenta de la satisfaccin
del usuario de un servicio mdico, la unidad de anlisis natural es el paciente
atendido, o la persona que se atiende en ese servicio mdico.

La unidad de muestreo corresponde a la entidad bsica mediante la cual se


acceder a la unidad de anlisis. En algunos casos, ambas se corresponden. Por
ejemplo:

Si se desea estimar la prevalencia de dao auditivo en relacin con niveles de


ruido ambiental en una muestra de trabajadores de una fbrica, la unidad de
muestreo puede corresponder a la entidad "sujeto", si se dispone de un registro
detallado de cada sujeto. La unidad de anlisis es por cierto el trabajador de la
fbrica.

Dato. Es el valor o respuesta que adquiere variable la en cada unidad de anlisis.


Dato es el resultado de la observacin, entrevista o recopilacin en general. Los
datos son. materia prima de la Estadstica.

Parmetro. Es una medida usada para describir algunas caractersticas de una


poblacin, y para determinar su valor es necesario utilizar la informacin de la
poblacin completa y por lo tanto, las decisiones se tomaran con certidumbre total.
Por ejemplo:
Media poblacional (), Varianza poblacional (2), Proporcin poblacional (p).

Estadgrafo. Es una medida usada para describir alguna caracterstica de la


muestra y la toma de decisiones contiene un grado de incertidumbre. Por ejemplo:
Media muestral ( ), Varianza muestral ( 2 ), Proporcin muestral (p)

9 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
Variable: Es una caracterstica que puede tomar diferentes valores o atributos. Las
variables son caractersticas observables, susceptibles de adoptar distintos
valores (cuantificado) o ser expresados en varias categoras

Variable Valores o atributo


Rendimiento acadmico 12, 14, 17, 20
Genero Masculino, femenino
Calidad de atencin de un Psimo, malo, regular bueno excelente
restaurante
Peso de alumnos 45,6 Kg. 57,8 Kg. 73,6 Kg
Nmero de hijos 1, 2, 3,

1.7 Clasificacin de las Variables

Podemos considerar muchos criterios de clasificacin como:

A. Segn la Naturaleza de la Variable

a) Variables Cualitativas o Estadsticas de Atributos.

Cuando expresan una cualidad, caracterstica o atributo, tienen carcter cualitativo


sus datos se expresan mediante una palabra es no numrico. Por ejemplo:

Estado civil, los colores, lugar de nacimiento, profesiones, actividad econmica,


causas de accidentes, etc.

b) Variables Cuantitativas.

Cuando el valor de la variable se expresa por una cantidad, es de, carcter


numrico. El dato o valor puede resultar de la operacin de contar o de medir. Por
ejemplo:

Edad nmero de hijos por familia, ingresos, viviendas por centro poblado, niveles
de, desempleo, produccin, utilidades por empresas, etc.,

10 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
Las variables cuantitativas pueden ser: discreta y continua.

b.1. Variable Discreta.


Cuando el valor de la variable resulta de la operacin de contar su valor est
representado slo por nmeros naturales (enteros positivos). Por Ejemplos:

Hijos por familia nmero de accidentes por da, trabajadores por empresa;
poblacin por distritos, habitaciones por vivienda. etc.

b.2. Variable Contina.


Cuando la variable es susceptible de medirse es toda variable cuyo valor se
obtiene por medicin o comparacin con una unidad o patrn de medida. Las
variables continuas pueden tener cualquier valor dentro de su rango o recorrido
por tanto se expresa por cualquier nmero real. Por ejemplos:

Ingresos monetarios, produccin de maz, peso, estatura, tiempo de


servicios, horas trabajadas, niveles de empleo. etc.

B. Segn la Escala de Medicin

a) La escala nominal o categrica


La medicin en su nivel ms dbil existe cuando los nmeros u otros smbolos se
usan simplemente para clasificar un objeto, una persona o una caracterstica.
Cuando se emplean nmeros u otros smbolos para identificar los grupos a los
cuales pertenecen varios objetos, estos nmeros o smbolos constituyen una
escala nominal o categrica. Esta escala se conoce como escala clasificatoria.
Por ejemplo:
Se resumen en preguntas dicotmicas, o aquellas con dos opciones de
respuesta, y de seleccin mltiple, o aquellas con tres o ms opciones de
respuesta. Veamos algunos ejemplos:
Dicotmicas Gnero: Femenino Masculino
Has comprado el producto X? SI NO
Seleccin mltiple En tus prximas compras incluirs el producto X?
SI NO No sabe

11 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
Propiedades Formales
Todas las escalas tienen ciertas propiedades formales, las cuales proporcionan
definiciones casi exactas de las caractersticas de la escala; definiciones ms
exactas que las que pueden darse en trminos verbales. Estas propiedades
pueden ser formuladas de manera ms abstracta de lo que hemos hecho aqu,
por un conjunto de axiomas que especifican las operaciones de la escala y las
relaciones entre los objetos que han sido escalados.
En una escala nominal, las operaciones de la escala dividen a una clase dada en
un conjunto de subclases mutuamente excluyentes. La nica relacin implica- da
es la de equivalencia; esto es, los miembros de cualquier subclase deben ser
equivalentes en la propiedad que est siendo escalada. Esta relacin se simboliza
por el signo familiar de "igual" (=). La relacin de equivalencia es reflexiva,
simtrica y transitiva.
Considrese un conjunto de objetos 1 , 2 , , . . Supngase que el objeto x,
tiene algn atributo verdadero, A (x). Entonces, para cualquier par de atributos en
el conjunto
A (xi ) = A (xj ) si x y x estn en la misma clase
A (xi ) A (xj ) si x y x estn en diferentes clases
Una escala nominal es un sistema de clasificacin de los objetos L(x) tal que
L ( x i ) = L (x i ) si y slo si A (xi ) = A (xi )
L(x ) L (x ) si y slo si A (x ) A (x )

Operaciones Admisibles
Ya que en una escala nominal la clasificacin puede estar igualmente bien
representada por cualquier conjunto de smbolos, se dice que la escala nominal
es "nica hasta una transformacin de uno a uno". Los smbolos que designan las
variadas subclases en la escala pueden ser intercambiados si esto se hace de
manera cabal y consistentemente. Por ejemplo:
Cuando se emiten nuevas placas para automviles, el cdigo que previamente
perteneca a una ciudad puede ser intercambiado con el de otra ciudad. La
escala nominal podra preservarse si este cambio se ejecutara cabal y
consistentemente en la emisin de todas las placas.
Ya que los smbolos que designan los variados grupos de una escala nominal
pueden ser intercambiados sin alterar la informacin esencial en la escala, el
nico tipo de estadsticos descriptivos admisibles son aquellos que pueden ser

12 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
incambiables por tal transformacin: la moda, la cuenta de frecuencias, etc. En
ciertas condiciones, podemos probar hiptesis considerando la distribucin de
casos entre las categoras, usando pruebas no paramtricas tales como la ji
cuadrada o una prueba basada en la distribucin binomial. Estas pruebas son
adecuadas para da- tos escalados nominalmente debido a que se enfocan sobre
la frecuencia en las categoras, es decir, sobre datos enumerativos. En suma,
cuando los datos en una escala nominal, podemos rotular las categoras "1", "2",
"3",.., en cualquier orden que el Vamos. En una muestra podemos contar el
nmero de "1", el nmero de "2", etc. (Estas son cuentas de frecuencia) Podemos
calcular el porcentaje de "1" en la muestra, el porcentaje de "2", etc. (Esta es la
distribucin de frecuencia relativa.) Y podemos registrar qu categora tiene la
frecuencia ms grande. (sta es la moda.) Pero en general, no podemos "sumar"
las categoras "1" y "2" para formar la categora "3", ya que podramos violar las
suposiciones de un sistema de clasificacin nominal. En captulos posteriores
estudiaremos diferentes tcnicas estadsticas adecuadas para datos categricos o
escalados nominalmente.

b) La escala ordinal o de rangos


Puede suceder que los objetos en una categora de una escala no sean tan slo
diferentes de los objetos en otras categoras de esa escala, sino que tambin
exista algn tipo de relacin entre ellos. Las relaciones tpicas entre las clases
son: ms alto, ms preferido, ms difcil, ms perturbador, ms maduro, etc. Tales
relaciones se denotan por medio del smbolo >, el cual en general significa "mayor
que". En referencia a escalas particulares, > puede ser usado para designar que
es preferido a, es ms alto que, es ms difcil que, etc. Su significado especfico
depende de la naturaleza de la relacin que define la escala.
Dado un grupo de clases de equivalencia (esto es, dado una escala nominal), si la
relacin > se sostiene entre algunos pero no todos los pares de clases, tenemos
una escala parcialmente ordenada. Si la relacin > se sostiene para todos los
pares de clases, de manera que es posible un rango completo ordenado de
clases, tenemos una escala ordinal. Por ejemplo:
Grado de Instruccin: Primaria Secundaria Superior
Intensidad del dolor: Leve Moderado Intenso

13 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
Propiedades Formales
Axiomticamente, la diferencia fundamental entre una escala nominal y una
ordinal es que esta ltima incorpora no slo la relacin de equivalencia (=), sino
tambin la relacin "mayor que" (>). Esta ltima relacin es irreflexiva, asimtrica
y transitiva.
Considrese un conjunto de objetos 1 , 2 , , . Supngase que existe alguna
relacin en el atributo verdadero entre los objetos de cada categora, adems de
la equivalencia dentro de las categoras. Esto es,

A (xi ) = A (xj ) si x y x estn en la misma clase


A (xi ) A (xj ) si x y x estn en diferentes clases
Una escala nominal es un sistema de clasificacin de los objetos L(x) tal que
L ( x i ) = L (x i ) si y slo si A (xi ) = A (xi )
L(x ) L (x ) si y slo si A (x ) A (x )
L(x ) > L (x ) si y slo si A (x ) > A (x )
Es decir, la funcin de clasificacin ordena los objetos en el mismo modo en que
de hecho estn ordenados los atributos.

Operaciones Admisibles
Ya que cualquier transformacin que preserve el orden no cambia la informacin
contenida en la escala ordinal, se dice que la escala es "nica hasta una trans-
formacin monotnica". Una transformacin monotnica es aquella que preserva
el orden de los objetos. Esto es, no importa qu nmeros demos a un par de
clases o a los miembros de esas clases, siempre que les sea asignado un nmero
mayor a los miembros de la clase que es "mayor que" o "ms preferida".
(Naturalmente, se pueden usar nmeros menores para las clases "ms
preferidas". As nos referimos generalmente a una ejecucin excelente como
"primera clase", y a ejecuciones progresivamente inferiores como "segunda clase"
y "tercera clase". Siempre que seamos consistentes, no importa si se usan
nmeros mayores o menores para denotar "mayor que" o "ms preferido".) Por
ejemplo:
En el ejrcito un cabo usa dos bandas en su manga y un sargento usa tres.
Estas insignias denotan que el sargento > el cabo, y el smbolo > denota "mayor
rango que". Esta relacin podra ser igualmente bien expresada si el cabo usara
cuatro bandas y el sargento siete.

14 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
Vale decir, una transformacin que no cambia el orden de las clases es
completamente admisible ya que no implica prdida alguna de informacin.
Cualesquiera o todos los nmeros que se aplican a las clases en una escala
ordinal pueden ser cambiados de cualquier forma que no altere el orden (rango)
de los objetos. Puede aplicarse cualquier transformacin montnica y an
preservarse las propiedades de la escala, esto es, preservar la relacin entre los
objetos.
El estadstico ms, apropiado para describir la tendencia central de las
puntuaciones en una escala ordinal es la mediana, ya que en relacin con la
distribucin de puntuaciones, la mediana no es afectada por los cambios en
cualesquiera de las puntuaciones que estn por arriba o por abajo de ella,
siempre que el nmero de puntuaciones por arriba y por debajo permanezca
constante. Con el escalamiento ordinal, las hiptesis pueden ser probadas usando
el gran grupo de pruebas estadsticas no paramtricas que en ocasiones se
llaman estadsticos de rango o estadsticos de orden.

c) La escala de Intervalo
Cuando una escala tiene todas las caractersticas de una escala ordinal y cuando
adems tienen sentido las distancias o diferencias entre cualesquiera dos
nmeros de la escala, se ha logrado una medicin considerablemente ms fuerte
que la ordinal. En tal caso, la medicin ha sido lograda en el sentido de una
escala de intervalo. Esto es, si nuestro mapeo de varias clases de objetos es tan
preciso que conocemos cun grandes son los intervalos (distancias) entre todos
los objetos de la escala, y estos intervalos tienen significado sustantivo, entonces
hemos logrado una medida de intervalo. Una escala de intervalo est
caracterizada por una unidad comn y constante de medida que asigna un
nmero a todos los pares de objetos en el orden establecido. En esta clase de
medicin, la razn de cualesquiera dos intervalos es independiente de la unidad
de medida y del punto cero. En la escala de intervalo, el punto cero y la unidad de
medida son arbitrarios. Por ejemplo
Medimos la temperatura en una escala de intervalo. De hecho, comnmente se
usan dos diferentes escalas: Celsius y Fahrenheit. Al medir la temperatura, la
unidad de medida y el punto cero son arbitrarios; son diferentes en ambas
escalas. Sin embargo, las dos escalas contienen la misma cantidad y la misma
clase de informacin. Esto es as debido a que estn linealmente relacionadas.

15 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
Es decir, una lectura en una escala puede ser transformada en la lectura
equivalente de la otra por medio de una transformacin lineal.
9
F = C + 32
5
Donde
F = nmero de grados en la escala Fahrenheit
C = nmero de grados en la escala Celsius
Se puede mostrar que las razones de las diferencias de temperatura (intervalos)
son independientes de la unidad de medida y del punto cero. Por ejemplo, el
punto de "congelacin" ocurre en 0 en la escala Celsius, y el punto de "ebulli-
cin" ocurre en los 100. En la escala Fahrenheit, la "congelacin" ocurre en los
32 y la "ebullicin" en 212. Algunas otras lecturas de la misma temperatura en
las dos escalas son las siguientes:

Celsius 18 0 10 30 100
Fahrenheit 0 32 50 86 212

Ntese que la razn de las diferencias entre las lecturas de temperatura en una
escala, es igual a la razn entre las diferencias equivalentes en la otra escala. Por
ejemplo,
En la escala Celsius la razn de las diferencias entre 30 y 10, y 10 y 0 es (30
10) / (10 0) = 2. Para las lecturas comparables en la escala Fahrenheit, la
razn es (86 50) / (50 32) = 2. En ambos casos las razones son las
mismas; a saber, 2. En otras palabras, en una escala de intervalo, la razn de
cualesquiera dos intervalos es independiente de la unidad usada y del punto
cero, siendo ambos arbitrarios.

Muchos cientficos de la conducta aspiran a crear escalas de intervalo, y en pocas


ocasiones tienen xito. Sin embargo, generalmente lo que es tomado como xito
son suposiciones no probadas que el constructor de la escala voluntariamente
cree. Una suposicin frecuente es que la variable que est siendo escalada est
normalmente distribuida entre los individuos a los que se evala con base en esta
suposicin, el constructor de la escala manipula las unidades de la escala hasta
que se encuentre la supuesta distribucin normal de las puntuaciones de los
individuos. Naturalmente, el procedimiento es slo tan bueno como la intuicin del
investigador al elegir la distribucin que supone.

16 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
Otra suposicin que se hace a menudo para crear una escala de intervalo aparen-
te es la suposicin de que las respuestas "afirmativas" de las personas en
cualquier reactivo son exactamente equivalentes a responder de manera
afirmativa en cualquier otro reactivo. Esta suposicin se hace para satisfacer el
requisito de que una escala de intervalo debe tener una unidad de medida comn
y constante. En escalas de habilidades o de aptitudes, la suposicin de
equivalencia consiste en que dar la respuesta correcta a cualquier reactivo es
exactamente equivalente (en la cantidad de habilidad mostrada) a dar la
respuesta correcta a cualquier otro reactivo.

Propiedades Formales
Axiomticamente, se puede mostrar que las operaciones y relaciones que dan
origen a la estructura de una escala de intervalo son tales que las diferencias en
la escala son isomrficas a la estructura de la aritmtica. Los nmeros pueden ser
asociados con las posiciones de los objetos en una escala de intervalo tal que las
operaciones de la aritmtica pueden ser significativamente ejecutadas con las
diferencias entre los nmeros.
Al construir una escala de intervalo no slo se deben especificar equivalencias,
como en la escala nominal, y relaciones "mayor que", como en la escala ordinal,
sino tambin se debe ser capaz de especificar la razn entre dos intervalos
cualesquiera.

Considrese un conjunto de objetos 1 , 2 , , Supngase que los atributos


verdaderos de los objetos existen en alguna relacin unos con otros, adems de
sus equivalencias dentro de las categoras. Esto es:
A (x ) = A (x ) si x y x estn en la misma clase
A (x ) A (x ) si x y x estn en diferentes clases
y A (x ) > A (x ))si x excede a x en la "cantidad" que tiene del atributo
Entonces, una escala de intervalo es un sistema clasificatorio de los objetos L (x)
que tienen las propiedades de una escala ordinal y, adems
( ) = ( ) + >

Ntese que en este caso, la diferencia entre los atributos de los dos objetos es
proporcional a la diferencia entre las asignaciones de clasificacin:

(, ) () = [ ( ) ( )]

17 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
Operaciones Admisibles

Cualquier cambio en los nmeros asociados con las posiciones de los objetos
medidos en una escala de intervalo debe preservar no slo el orden de los
objetos, sino tambin las diferencias relativas entre los objetos. Esto es, la escala
de intervalo es "nica hasta una transformacin lineal". As, como hemos
sealado, la informacin proporcionada por la escala no es afectada si cada
nmero se multiplica por una constante positiva y despus se le suma a este
producto una constante, esto es, () = + . (En el ejemplo de la
temperatura, c = 9/5 y b = 32.)

Ya hemos notado que en una escala de intervalo el punto cero es arbitrario. Esto
es inherente al hecho de que la escala est sujeta a transformaciones que
consisten en agregar una constante a los nmeros que constituyen la escala.

La escala de intervalo es la primera escala verdaderamente "cuantitativa" que


hemos encontrado. Todos los estadsticos paramtricos comunes (medias,
desviaciones estndar, correlaciones producto-momento, etc.) son aplicables a
los datos en una escala de intervalo. Si de hecho se ha logrado una medida en
una escala de intervalo y si se han encontrado adecuadamente todas las
suposiciones del modelo estadstico paramtrico (dadas en la seccin "El modelo
estadstico"), entonces el investigador puede utilizar pruebas estadsticas
paramtricas tales como la prueba t o la prueba F. En tal caso, los mtodos no
paramtricos no aprovechan toda la informacin contenida en los datos de
investigacin. Puede notarse que una escala de intervalo es una condicin
necesaria, pero no suficiente, para usar una prueba estadstica paramtrica que
incluya la distribucin normal.

d) La escala de razn
Cuando una escala tiene todas las caractersticas de una escala de intervalo y,
adems, tiene un punto cero verdadero en su origen, se llama escala de razn.
En una escala de razn, la razn de cualesquiera dos puntos es independiente de
la unidad de medida. Por ejemplo
Medimos la masa o el peso en una escala de razn. La escala de onzas y libras
tiene un punto cero verdadero, al igual que la escala de gramos. La razn entre

18 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
cualesquiera dos pesos es independiente de la unidad de medida. Por ejemplo,
si de- terminamos los pesos de dos objetos diferentes no slo en libras sino
tambin en gramos, encontraremos que la razn de los dos pesos en libras es
idntica a la razn de los dos pesos en gramos.

Aunque es difcil identificar ejemplos significativos en las ciencias sociales y de la


conducta, los contraejemplos abundan. Consideramos dos. Notamos
anteriormente que las calificaciones se miden en una escala ordinal. Considrese
a dos estudiantes, uno de los cuales recibe una A y el otro una C; y supngase
que las asignaciones numricas fueron 4 y 2, respectivamente. Aunque la razn
de las dos calificaciones es dos (4/2 = 2), no tiene sentido decir que el estudiante
con una A posee el doble de "algo" del estudiante que recibe la C. (El estudiante
puede obtener el doble de ciertos puntos, pero no es claro si esto tiene algn
significado sustantivo en conocimiento, habilidad o perseverancia.) Finalmente, en
el caso de la temperatura, considrese un cambio en la temperatura de 100 a 30
C. No podemos decir que el incremento representa que el calor se increment al
triple. Para ver esto, ntese que el cambio en la temperatura es equivalente a un
cambio de 500 a 86 F. Debido a que las razones de las temperaturas en las dos
escalas son claramente diferentes, la razn no tiene sentido interpretable alguno.

Propiedades Formales

Las operaciones y relaciones que dan origen a los valores numricos en una
escala de razn son tales que la escala es isomrfica a la estructura de la
aritmtica. Por tanto, las operaciones de la aritmtica son permisibles con los
valores numricos asignados a los objetos, as como a los intervalos entre los
nmeros, como en el caso de la escala de intervalo.

Las escalas de razn, que se encuentran ms comnmente en las ciencias


fsicas, se logran slo cuando son operacionalmente posibles de alcanzar todas
las siguientes cuatro relaciones: 1. equivalencia; 2. mayor que; 3. razn conocida
entre cualesquiera dos intervalos, y 4. razn conocida entre cualesquiera dos
valores de la escala.

19 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
Considrese un conjunto de objetos x1 , x2 , , xN . Supngase que el atributo
verdadero de los objetos existe con alguna relacin entre cada uno de ellos,
adems de la equivalencia dentro de las categoras. Esto es
A (x ) = A (x ) si x y x estn en la misma clase
A (x ) A (x ) si x y x estn en diferentes clases
y A (x ) > A (x ) si x excede a x en la "cantidad" que tiene del atributo

Entonces, una escala de razn es un sistema clasificatorio de los objetos L (x) si


(1) = (, ) >
( ) ( )
, =
( ) ( )
y la razn de las clasificaciones asignadas es igual a la razn de los atributos
verdaderos.
Operaciones Admisibles

Los nmeros asociados con los valores de la escala de razn son nmeros "ver-
daderos" con un cero verdadero: slo la unidad de medida es arbitraria. As, la es-
cala de razn es nica hasta la multiplicacin por una constante positiva. Esto es,
las razones entre cualesquiera dos nmeros se preservan cuando los valores de
la escala son todos multiplicados por una constante positiva y, adems, tal
transformacin no altera la informacin contenida en la escala.
Cualquier prueba estadstica paramtrica puede usarse cuando se han logrado
medidas de razn y se encuentran las suposiciones adicionales concernientes a
la distribucin. Ms an, existen algunos estadsticos que se aplican slo a datos
que descansan en una escala de razn; debido a la fuerza de las suposiciones
que sub- yacen a la escala, la mayora de estas pruebas son pararntricas.

20 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016

ESCALAS DE MEDICIN

Tipo Variables Categricas Variables numricas

Naturaleza CUALITATIVAS CUANTITATIVAS


(0) NOMINAL Ningn
Escala (1) ORDINAL Un atributo (2) INTERVALO Dos atributos (3) RAZN Tres atributos
atributo
Atributos de la
Orden Distancia Origen Orden Distancia Origen Orden Distancia Origen Orden Distancia Origen
escala
Posee categoras a las Posee categoras Tiene intervalos
Tiene intervalos iguales y
que se asigna un nombre ordenadas, pero no constantes entre valores;
medibles, pero no tiene un
Caracterstica sin que exista ningn permite cuantificar la adems de un origen real.
origen real. Puede asumir
orden implcito entre distancia entre una El cero significa la
valores negativos.
ellas. categora y otra. ausencia de la variable.

Ejemplos Gnero Estado Civil Instruccin Intensidad Temperatura Hora del da Peso. Hijos

Soltero Primaria Leve -10 C 00 Horas 00.00 Kg Uno


Masculino
Valor Final Casado Secundaria Moderado 0C 10 Horas 10.24 Kg Dos
Femenino
Conviviente Superior Severo 20 C 20 Horas 20.00 Kg Tres

Continuas: Provienen de medir


Dicotmicas: Tienen solamente dos categoras Ejemplos
Se pueden representar con nmeros enteros o fraccionarios
de Ordinal Dicotmica: Nuevo - Continuador
Vivo Fallecido
Entre dos valores siempre existe un nmero intermedio
Observaciones
Sano Enfermo
Discretas: Provienen de contar
Politmicas: Tienen ms de dos categoras.
Solamente pueden ser representados con nmeros enteros

21 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
C. Segn la Relacin Entre Variables
a) Variables Dependientes
Son aquellas que se explican por otras variables, son los efectos o resultados
respecto a los cuales hay que buscar su motivo, causas o razn de ser, Es la
variable que traduce la consecuencia del efecto de una varias razones o causas.

b) Variables Independientes
Son las variables explicativas o predicativas, cuya asociacin, relacin o
influencia en la variable dependiente se pretende escribir en la investigacin. Las
variables independientes son los que traducen o explican las causas o razones
de las variaciones en la variable dependiente. Simplificando, en la relacin de
variables, las causas o antecedentes seran las variables independientes (VI) y la
causa o consecuente es la variable dependiente (VD). Ejemplos: En el caso ms
simple, para la relacin d dos variables.
El presupuesto familiar (VD) depende de los ingresos (VI).
El volumen de ventas (VD) se explica por la inversin en propaganda (V).
El nmero de hijos por familia (VD) tiene relacin con el nivel educativo de los
padres (VI).
c) Variables Intervinientes o interferentes
Son aquellas que coparticipan con la variable independiente condicionando el
comportamiento de la variable dependiente. En el caso de la relacin entre
presupuesto familiar (VD) y los ingresos (VI), algunas variables intervinientes
serian la conducta de consumo, la edad de los miembros de la familia, etc.

Elementos de una Variable


La identificacin y definicin de variables es la tarea ms delicada de toda
investigacin y del trabajo estadstico. En consecuencia, para tener xito en la
seleccin de variables, es recomendable distinguir las siguientes cinco
caractersticas.
Un nombre o denominacin. de la variable.
Alguna definicin o conceptualizacin.
Un conjunto de categoras. que es definida por el investigador. Las
categoras no son nicas.
Procedimientos para categoras las unidades de anlisis.
Algunas medidas de resumen o indicadores.

22 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
Ejemplo 1:
a) Nombre : Estado civil o conyugal.

b) Definicin: Es la situacin de la persona empadronada en relacin con las leyes


y costumbres del pas.
c) Categoras:
01) Sol tero (a).
02) Casado (a).
03) Conviviente.
04) Viudo (a).
05) Divorciado (a).
06) Separado (a).
d) Categorizacin: Cul es su estado civil o conyugal?
e) Medidas de Porcentajes
Resumen Tasa de nupcialidad que indica la frecuencia de matrimonios, etc.

Ejemplo 2:
a) Nombre : Ingresos
b) Definicin Son los recursos monetarios netos incluyendo todas las
Bonificaciones que percibe una persona por su ocupacin principal y secundaria
durante el perodo de referencia de la encuesta.
c) Categoras : Puede proponerse en forma de niveles o simplemente intervalos.
Niveles de ingreso: alto, medio, bajo
Intervalos: Por ejemplo 8 intervalos
Menos de 4000; 4001 l 8000; 8001 a 12000; 1 2001 a 1 6000; 16001 a 20000:
20001 a 25000; 25001 a 30000; 30001 y ms soles.
d) Categorizacin: Cul fue su ingreso total en el ltimo mes?
e) Indicadores : Ingreso promedio.
Dispersin de los ingresos. etc.

23 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
II. CAPITULO Presentacin de Datos
2.1. Clasificacin y cmputo de datos uni. y bivariables:.
A. Codificacin y tabulacin
La codificacin facilita la tabulacin y el conteo. (obtencin de una buena
informacin)
La codificacin de las respuestas da lugar a categoras o modalidades.
Es recomendable que los cuestionarios tengan las alternativas de respuesta pre
codificadas.
Si el cuestionario tiene preguntas abiertas (respuesta libre), estas previamente
debe ser clasificadas en categoras.
B. Presentacin tabular de los Datos: cuadros de distribucin de frecuencias
Es necesario agrupar los datos y presentarlos en cuadros y diagramas sencillos.
Un cuadro de frecuencias, son cuadros que indican la distribucin de un conjunto
de datos en clases o categoras y muestran el nmero de elementos y la
proporcin de cada uno de los valores de la variable.
Un cuadro de frecuencias, permite una buena ayuda para formularse
interrogantes acerca de los datos.
Un cuadro de frecuencias, es un punto de partida en la bsqueda de un modelo
terico para analizar la distribucin de los datos.
En la cuadro se observa la frecuencia o repeticin de cada uno de los valores de
la variable.
Las observaciones o recopilaciones de datos denotaremos la variable por X y los
datos originales: 1 , 2 , , . donde Xi representan la i sima observacin de
la variable con (i = 1, 2, 3, 4,..., N). Es decir que:
X1 = dato de la primera observacin
X2 = dato de la segunda observacin
X3 = dato de la tercera observacin

.
XN = dato de la N sima observacin
C. Cuadros estadsticos
En una investigacin, despus que los datos han sido recogidos, revisados y
almacenados en una base de datos, se procede a la presentacin de los
resultados en forma tabular o grfica y al anlisis estadstico de la informacin.
La facilidad de su construccin y el rpido efecto en la transmisin de los
contenidos, han hecho de los cuadros estadsticos los recursos idneos para la

24 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
presentacin de los resultados de las investigaciones en todas las reas
cientficas.
La presentacin tabular y el grfico no son competidores, sino ms bien
elementos que se complementan. Los grficos deben agregarse a los cuadros o
distribuciones de frecuencias para llamar la atencin y despertar el inters por
los datos que se presentan, as como para reforzar las argumentaciones o
conclusiones a las que se haya llegado. Como un principio muy conveniente,
debe adoptarse el de que en ningn caso puede considerarse que el grfico
sustituye a la presentacin tabular. La prctica seguida por algunas personas, de
presentar grficos omitiendo los cuadros que contienen la informacin bsica,
debe ser evitada y combatida por inconveniente y por limitar la calidad y la
utilidad de las publicaciones y estudios. Slo en casos de verdadera excepcin,
como cuando se trata de propaganda o de artculos meramente divulgadores,
podra aceptarse la prctica comentada.
Objetivo
Un cuadro estadstico tiene como objetivo presentar datos numricos ordenados,
en filas y columnas, de acuerdo a ciertos criterios de clasificacin.

Ventajas
Los cuadros permiten presentar en forma resumida y ordenada muchos datos
Es un instrumento que clasifica, resume y comunica informacin estadstica
Facilita el anlisis de los datos
Su fcil comprensin, permite que sea utilizado por muchas personas
Todo cuadro estadstico debe explicarse por s mismo, sin necesidad de texto o
figuras anexas, y debe ser sencillo y claro
D. Partes Principales de un Cuadro Estadstico
En general, un cuadro estadstico completo, tal como el Cuadro N 01, por ejemplo,
puede tener ocho partes:

1. Nmero del cuadro. 2. Ttulo. 3. Encabezamiento o conceptos.

4. Cuerpo. 5. Nota de pie o llamadas. 6. Fuente.


7. Nota de unidad de medida. 8. Elaboracin.

25 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
2 Es el cdigo o elemento de
TABLA N 01 1 identificacin que permite
ubicar el cuadro en el interior
Es la descripcin de un documento
resumida del contenido
del cuadro. La redaccin
del ttulo debe ser breve,
claro y completo, de POBLACIN TOTAL ECONMICAMENTE ACTIVA DE 15 AOS Y MS, DEL DEPARTAMENTO DE
modo que se puedan
deducir sin ambigedad Que Donde
qu tipo de informa.
Debe indicar CAJAMARCA: POR NIVEL EDUCATIVO SEGN RAMAS DE ACTIVIDAD. CENSO DE POBLACIN 2009

1. QUE
2. DONDE Donde Como Cuando
3. COMO
4. CUANDO Descripcin de las filas y 7 Expresa en qu unidades
columnas del cuadro (Distribucin porcentual) estn las variables

estadstico
3 PEA de N i v e l d e Educacin
15 aos
Ramas de Actividad y ms Sin Sup. No Superior
Primaria Secundaria No Especificado
Nivel* Univer. Univer.

TOTAL 100,0 5,89 42,11 35,87 5,67 8,66 1,80

1. Agricultura, Caza, Selvicultura y


100,0 14,97 64,05 15,59 0,70 1,30 3,40
Pesca
2. Explotacin de Minas y Canteras. 100,0 0,75 41,13 39,59 5,79 12,63 0,11 4

3. Industrias Manufactureras. 100,0 3,60 43,57 41,60 2,94 6,70 1,59


0,98 Es el
4. Electricidad, Gas y Agua. 100,0 0,00 21,95 48,29 8,29 20,49
contenido
5. Construccin. 100,0 4,78 64,36 24,99 1,05 3,54 1,28 numrico
del cuadro
6. Comercio, Restaurantes y Hoteles. 100,0 6,95 45,04 39,66 2,06 4,39 1,91
7. Transportes, Almacenamiento y
100,0 1,34 45,18 46,87 2,28 3,15 1,18
Comunicaciones.
8. Establecimientos Financieros,
Seguros, Bienes Inmuebles y 100,0 0,64 11,60 48,71 9,28 29,25 0,52
Servicios a las Empresas
9. Servicios Comunales, Sociales y
100,0 2,10 26,56 43,35 11,46 15,22 1,30
Personales.
10. Actividades No bien especificadas. 100,0 9,35 44,70 34,99 3,55 4,97 2,43
11. Buscan trabajo por primera vez. 100,0 1,94 25,75 56,97 6,70 7,94 0,71
* Incluye PEA con educacin inicial o pre escolar
Fuente: INE Resultados definitivos de los Censos Nacionales IX de Poblacin y IV de Vivienda
Elaborado: Statistic MAH.

5) NOTA DE PIE O LLAMADAS, se usa para aclarar algunos trminos o siglas, y tambin para indicar qu
elementos estn o no incluidos en algunos de los conceptos del cuadro.
6) FUENTE, es la indicacin al pie el cuadro, que sirve para nombrar la publicacin, entidad, estudio o fuente
de donde se obtuvieron los datos utilizados para construir el cuadro. La identificacin de la fuente permite,
si fuera el caso, comprobar la informacin o para obtener informacin complementaria.
Hay dos tipos de fuentes: i) primaria, cuando se obtiene directamente de la unidad de anlisis o cuando se
recurre a los propios formularios de una encuesta: ii) secundaria, cuando se recurre a documentos
boletines o cuadros estadsticos publicados.
7) Nota Unida de Medida se escribe debajo del ttulo, se usa cuando se abrevia la escritura
8) ELABORACIN, es una indicacin que se coloca debajo de la fuente, y sirve para mencionar el
responsable, que utilizando datos originales o de la fuente elabor el cuadro estadstico final: indica la
responsabilidad de la publicacin del cuadro. A veces resulta til indicar la fecha de elaboracin.
QUE : Poblacin Total Econmicamente Activa De 15 Aos Y Ms
DONDE : Del Departamento Cajamarca
COMO : Por Nivel Educativo Segn Ramas de Actividad
CUANDO : Censo de Poblacin 2009.

26 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
CUADRO 04

PACIENTES SEGN NMERO DE LEUCOCITOS /mm3.


HOSPITAL REGIONAL DE CAJAMARCA - CAJAMARCA - 2007.

Nmero de Porcentaje de
Nmero de
Leucocitos Pacientes
Pacientes (ni )
(miles)1/ ( hi % )
5.0 - 5.9 3 5.5
6.0 - 6.9 10 18.2
7.0 - 7.9 11 20.0
8.0 - 8.9 13 23.6
9.0 - 9.9 10 18.2
10.0 - 11.0 8 14.5
Total a/ 55 100.0
- Nota de pie. a/. Muestra aleatoria sistemtica.
1/. Datos expresados en miles.
- Fuente. H.R.C

E. Caractersticas:

1. La cuadro estadstica debe ser lo ms simple posible.


2. Si se utilizan smbolos, abreviaturas, etc., deben explicarse detalladamente en
notas de pie de pgina.
3. Deben ser incluidas las unidades especficas de medida que corresponden a los
datos.
4. Debern consignarse los totales.
5. Si los datos no son originales debe quedar explcita la fuente de donde se ha
tomado.
6. Cuando se utilizan escalas cualitativas hay que tener cuidado si se desea
comparar datos de una cuadro con otra, ya que en los criterios de clasificacin de
la variable puede que el entendimiento nuestro de un concepto no coincida
totalmente con el de otro investigador.
7. Una cuadro estadstica puede ser completada con las frecuencias acumuladas,
frecuencias relativas (porcentajes, promedios o razones), etc.

F. Tipos de cuadros.
En su forma ms general los cuadros pueden dividirse en simples y
compuestas.
a) Cuadros Simples. Clasifican un fenmeno segn una nica variable. Ejemplo

27 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
Cuadro 04.
b) Cuadros Compuestos. Son las que recogen los datos de dos o ms variables,
cada una de ellas con sus correspondientes criterios de clasificacin. Dentro de los
cuadros compuestos las que se utilizan con mayor frecuencia son: Las cuadros
dobles y las Maestras.

c) Cuadros Dobles. Resumen informacin clasificadas segn 2 variables, y estas se


denominan: Cuadros de contingencia y cuadros de correlacin.

d) Cuadro de Contingencia. Cuando ambas variables son cualitativas o mixtas.


Ejemplo. El cuadro siguiente muestra una distribucin bidimensional (Cuadro de
contingencia)

CUADRO 05
REACCIN A LA VACUNACIN CONTRA EL SARAMPIN Y LA RUBOLA EN UNA
MUESTRA DE 288 NIOS DE CAJAMARCA -1994.

Vacunados contra Vacunados contra rubola


T O T A L
sarampin Reaccin Positiva Reaccin Negativa
Reaccin positiva 76 72 148

Reaccin negativa 120 20 140

T O T A L 196 92 288

La interpretacin a esta cuadro sera la siguiente: de una muestra de 288 individuos,


76 tuvieron reacciones positivas a las dos vacunaciones, 20 individuos tuvieron
reaccin negativa a ambas pruebas, 120 individuos tuvieron reaccin positiva ante la
vacuna contra la rubola, pero negativamente ante la vacuna contra el sarampin, y
72 nios tuvieron reaccin negativa a la vacuna contra la rubola y positiva en la
vacuna contra el sarampin.

CUADRO DE CORRELACIN. Cuando ambas variables son cuantitativas. Por


ejemplo

28 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
CUADRO 06

MUJERES EN EDAD FRTIL SEGN GRUPO ETREO Y NMERO DE HIJOS


NACIDOS VIVOS - HOSPITAL REGIONAL DE CAJAMARCA - CAJAMARCA 2007

Nmero de Hijos Nacidos Vivos


GRUPO ETREO
5y T O T A L
(Aos Cumplidos) 0 1 2 3 4
+
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49
T o t a l

2. Cuadro Maestra. En este tipo de cuadros todos los criterios de clasificacin de


cada una de las variables son sometidos a una clasificacin cruzada. Esto da
lugar a una perspectiva mucho ms amplia, ya que nos permite obtener datos
de una nica variable o de cualquier combinacin de las variables que entran
en juego en la cuadro.
Ejemplo. El cuadro muestra la composicin por edad, sexo y trabajo de un
grupo de personas con Tuberculosis pulmonar en Cajamarca (Esquema)
durante 2007.

CUADRO 07

PERSONAS CON TBC SEGN EDAD, CONDICIN LABORAL Y SEXO - DISTRITO DE


CAJAMARCA - 2007

TRABAJADORES NO TRABAJADORES T O T A L
EDAD Hombr Mujere Hombr Mujere Hombr Mujer
Total Total Total
es s es s es es
15 19
20 24
25 29
.
.
.
50 54
55 59
60 +
TOTAL

29 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016

Nota: Con este tipo de cuadros podemos extraer datos de las personas que padecen
Tuberculosis en un determinado intervalo de edad (A), tambin del total de
personas que no trabajan y han contrado la TBC (B), y del total de mujeres, ya
sean trabajadoras o no, que tienen tuberculosis (C).

2.2. Cuadros de Frecuencias de Variables Discretas


Para este tipo de variables cuyo valor slo se puede expresar por nmero enteros
positivos, los datos que caen dentro de cada clase.
Elementos de un cuadro de Frecuencia

Frecuencias Absolutas o Repetidas (fi o ni).- Es el nmero de veces que se repite


un determinado valor de la variable.

Frecuencia Relativa (hi ).- Es el cociente de:

ni
hi Frecuencia absoluta o Repeticiones
n
Nmero de Observaciones

CUADRO N 7.8
NUMERO DE NACIMIENTOS EN EL DEPARTAMENTO DE LAMBAYEQUE,
POR PROVINCIAS 2004
Nmero de
Provincias Porcentaje de Nacimientos
Nacimientos

Lambayeque n1 = 325 n
h1 1
325x100 34,43
n 944

Chiclayo n2 =330
n
h2 2
330x100 35,96
n 944

Ferreafe n3 = 289
n
h3 3
289x100 30,61
n 944
Total n = 944 100,00

30 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
Ejemplo con variables cualitativas
Ejemplo. El restaurante "Hay Que Rico" en la ciudad de Chiclayo, usa un cuestionario
para conocer la opinin de sus clientes sobre el servicio, la calidad de los alimentos, los
ccteles, los precios y el ambiente del restaurante en el mes de julio del 2005. Cada
caracterstica se valora en una escala: notable (O), muy bueno (V), bueno (G), mediano (A)
y malo (P). Elabore un cuadro estadstico
G O V G A O V G O V A G
V O P V O G A O O O G O
V V A G O V P V O O G O
O V O G A O V O O G V A

Aplicacin de la funcin de Excel en la Elaboracin de Tablas con variables cualitativas

Figura N 03 Ingreso de los datos

Paso.- 1 Se ubica en la celda A1 (Calidad) Insertar se selecciona tabla dinmica

Figura N 04 Seleccin de la tabla dinmica

31 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016

Paso.- 2 En la ventana de Crear tabla dinamica se elije donde se desea colocar el


informe de la tabla dinamica

Figura N 05 Crear tabla dinamica

Paso.- 3 En la ventana de lista de campos de la tabla dinmica se selecciona la variable


Calidad en Etiqueta de la fila y de columnas y en valores

Figura N 06 Seleccionar campos para agregar al informe

32 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
Paso.- 4 Insertamos un grfico un dinmico de barras

Figura N 07 Insertar grafico

Paso.- 4 Presentacin del grfico de barras de la variable calidad

Grafico N 01: Grafico de Barras de la variable calidad

33 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
Ejemplo:
En un estudio de mercado para determinar la aceptacin de un centro comercial Shopping Plaza
por departamentos ubicada en la ciudad de Cajamarca, se eligi una muestra de 35 clientes para
conocer sus impresiones. Los resultados son los siguientes:
Gasto Ingreso Nmero Forma de
Cliente Razn de visita
semanal Mensual de hijos Pago
1 Oferta permanente 66.00 1200 2 Efectivo
2 Guardera 72.50 1500 1 Crdito
3 Tarjeta de crdito 79.10 2100 3 Crdito
4 Oferta permanente 82.70 2000 3 Efectivo
5 Guardera 55.30 1500 1 Efectivo
6 Parking amplio 100.10 2200 2 Crdito
7 Aire acondicionado 35.30 1450 3 Efectivo
8 Tarjeta de crdito 60.40 1310 1 Crdito
9 Aire acondicionado 57.20 1150 2 Efectivo
10 Parking amplio 140.00 2320 0 Crdito
11 Tarjeta de crdito 69.10 1350 2 Efectivo
12 Parking amplio 73.10 1640 1 Crdito
13 Guardera 75.30 1680 3 Crdito
14 Aire acondicionado 30.00 1100 0 Efectivo
15 Parking amplio 95.20 1850 2 Efectivo
16 Guardera 65.30 1410 1 Efectivo
17 Tarjeta de crdito 68.00 1580 3 Crdito
18 Parking amplio 115.30 2110 0 Efectivo
19 Parking amplio 130.20 2180 2 Crdito
20 Aire acondicionado 48.40 1640 3 Crdito
21 Guardera 86.00 1840 2 Crdito
22 Parking amplio 102.20 1950 3 Efectivo
23 Oferta permanente 50.10 1230 2 Efectivo
24 Tarjeta de crdito 101.20 2000 2 Crdito
25 Parking amplio 102.20 2810 3 Crdito
26 Oferta permanente 58.10 1530 4 Efectivo
27 Tarjeta de crdito 90.30 1980 2 Crdito
28 Parking amplio 119.10 2900 4 Crdito
29 Oferta permanente 125.10 2680 3 Efectivo
30 Tarjeta de crdito 70.20 1970 2 Crdito
31 Parking amplio 118.40 2560 3 Crdito
32 Oferta permanente 110.10 2180 4 Crdito
33 Tarjeta de crdito 84.30 1980 3 Efectivo
34 Oferta permanente 77.20 2050 2 Crdito
35 Oferta permanente 104.20 2500 4 Crdito

34 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
Se copia (Ctrl + C) y se pega (Ctrl + V) al Minitab las 35 observaciones

Figura N 08: Pantalla del Minitab ingresado los datos

35 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
A. DISTRIBUCIN DE FRECUENCIAS DE LA VARIABLE CUALITATIVAS: Realizamos
la tabulacin de la variable Razn de visita procedemos a ejecutar en el Minitab

MINITAB: Tabla de frecuencias

1. Paso 1 .- Estadsticas/Tablas/cuenta de variables individuales

Figura N 09 Estadsticas/Tablas/cuenta de variables individuales

2. Paso 2.- En la ventana cuenta de variables individuales se selecciona la variable


Razn de Visita. Mostrar Conteos/Porcentajes/ Conteos acumulados porcentajes
acumulados. Aceptar

Figura N 10 Ventana cuenta de variables individuales


Resultado del procesamiento en Minitab

36 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016

Figura N 11 Cuenta de la variable Razn de visita

B. REPRESENTACIN GRAFICA DE LA VARIABLE CUALITATIVAS: Realizamos la


tabulacin de la variable Razn de visita procedemos a ejecutar en el Minitab

1. Grafico Circular.- Se trabaja con los valores de las frecuencias Absolutas (n i)


frecuencias relativas (hi) como la variables seleccionada es variable cualitativa
(Razn de Visita)

Paso 1 .- Grfica/Grfica Circular

Figura N 12 Grfico circular en minitab

37 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
Paso 2 .- En la ventana de Grafica circular se selecciona Variables Categrica:
Razn de visita

Figura N 13 Grafica Circular

Paso 3 .- En la ventana de Grafica circular se selecciona Etiquetas


Seleccionar la pestaa Etiqueta de divisin de la grfica circular con: Nombre de
categora/ Porcentaje /Dibujar una lnea de la etiqueta a la divisin

Figura N 14 Etiqueta de divisin de la grfica circular

38 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016

Grfica circular de Razn de visita


Categora
A ire acondicionado
Aire acondicionado Guardera
11.4%
Oferta permanente
Tarjeta de crdito
22.9% Park ing amplio
Tarjeta de crdito

Guardera
14.3%

Park ing amplio Oferta permanente


28.6% 22.9%

Grfico N 02 Grfico Circular de Razn de visita

2. Grfico de Barras.- En el eje horizontal representa los valores o las categoras y


en el eje vertical se presentan los valores de las frecuencias Absolutas (ni)
frecuencias relativas (hi) como la variables seleccionada es variable cualitativa
(Razn de Visita)

Paso 1 .- Grfica/Grfica de barras

Figura N 15 Grfico barras en minitab

39 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
Paso 1 .- En la ventana Grfica de barras
Las barras representan: Conteos de valores nicos
Barras simples/ Aceptar

Figura N 16: Grfica de barras

Paso 2.- En la ventana Grfica de barras Conteo de valores nicos, simples se


selecciona la variable categrica: Razn de visita y se selecciona Opciones de
grficas

Figura N 17: Grfica de barras Conteo de valores nicos, simples

40 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
Paso 3.- En la ventana Grfica de barras Opciones de grficas
Ordenar grupos de X principal por Y descendente/Aceptar

Figura N 18: Grfica de barras Opciones

Paso 4.- En la ventana Grfica de barras Conteo de valores nicos, simples se


selecciona Etiquetas
En Etiquetas de datos se selecciona Usar etiquetas de valor y /Aceptar/Aceptar

Figura N 19: Grfica de barras Etiquetas

41 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016

Grfica de Razn de visita


10
10

8 8
8

6
Conteo

4
4

0
Parking amplio Oferta permanente Tarjeta de crdito Guardera Aire acondicionado
Razn de visita

Grfico N 03 Grfico de barras Razn de visita

C. DISTRIBUCIN DE FRECUENCIAS DE LA VARIABLE CUANTITATIVAS


DISCRETAS: Realizamos la tabulacin de la variable Nmero de hijos procedemos a
ejecutar en el Minitab

1. Paso 1 .- Estadsticas/Tablas/cuenta de variables individuales

Figura N 20 Estadsticas/Tablas/cuenta de variables individuales

42 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
2. Paso 2.- En la ventana cuenta de variables individuales se selecciona la variable
Nmero de hijos. Mostrar Conteos/Porcentajes/ Conteos acumulados porcentajes
acumulados. Aceptar

Figura N 21 Ventana cuenta de variables individuales

Resultado del procesamiento en Minitab

Figura N 22 Cuenta de la variable Nmero de hijos

D. REPRESENTACIN GRAFICA DE LA CUANTITATIVAS DISCRETAS: Realizamos la


tabulacin de la variable Nmero de hijos procedemos a ejecutar en el Minitab

1. Grfico de Barras.- Se trabaja con los valores de las frecuencias Absolutas (n i)


frecuencias relativas (hi) como la variables seleccionada es variable discreta
Nmero de hijos

43 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
Paso 1 .- En la ventana Grfica de barras
Las barras representan: Conteos de valores nicos
Barras simples/ Aceptar

Figura N 23: Grfica de barras

Paso 2.- En la ventana Grfica de barras Conteo de valores nicos, simples se


selecciona la variable categrica: Nmero de hijos y se selecciona Opciones de
grficas

Figura N 24: Grfica de barras Conteo de valores nicos, simples

Paso 3.- En la ventana Grfica de barras Opciones de grficas


Ordenar grupos de X principal por Y descendente/Aceptar

44 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016

Figura N 25: Grfica de barras Opciones

Paso 4.- En la ventana Grfica de barras Conteo de valores nicos, simples se


selecciona Etiquetas
En Etiquetas de datos se selecciona Usar etiquetas de valor y /Aceptar/Aceptar

Figura N 26: Grfica de barras Etiquetas

Salida de Minitab
Grfica de Nmero de hijos
12
12
11

10

8
Conteo

6
5

4
4
3

0
2 3 1 4 0
Nmero de hijos

Grfico N 04 Grfico de barras Nmero de hijos

45 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
2.3. Cuadros de Frecuencias de Variables Continuas
Los sueldos mensuales en dlares de 60 empleados de la empresa Z.S.A., son los
siguientes:

440 560 335 587 613 400 424 466 565 393

453 650 407 376 470 560 321 500 528 526

570 430 618 537 409 600 550 432 591 428

440 340 558 460 560 607 382 667 512 492

450 530 501 471 660 470 364 634 580 450

574 509 462 380 518 480 625 507 645 382

Construir un cuadro de Frecuencias se aplica el procedimiento siguiente:


Poblacin: Empleados de la empresa Z.S.A (n = 60)
Variable: X = sueldo mensual en dlares.
Datos: Xi = sueldo mensual en dlares
Xi (i =1, 2, 3,.....,60) n =60 trabajadores
Determinamos el mximo y mnimo de Xi, el sueldo ms alto (Xmax) y el sueldo mnimo
(Xmin).
X38 = Xmax = 667 X17 = Xmin = 321
1. Recorrido(R): Xmax Xmin = 667 321 =346
2. Elegimos el nmero de Intervalos (m). Se puede considerar 5 15 intervalos
Si aplicamos:
Para calcular el nmero de clases de un cuadro de frecuencias podemos usar las
siguientes expresiones frmulas:
a) Raz cuadrada =

b) Regla de Sturges m = 1 + 3.322 Log(n)


m = 1 + 3.322 Log(60)

m = 7 intervalos

()
c) Regla de Stockes = +1
(2)

46 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
3. Determinar la amplitud de los intervalos (C)

X max X min 667 321


ci 49,4285.......
m 7
Se puede redondear a 50

4. Construir los intervalos. Como Ci = 50, el recorrido se divide en 7 intervalos o


segmentos, cuyo extremos son:
I1 I2 I3 I4 I5 I6 I7

320 370 420 470 520 570 620 670

Utilizaremos un concepto matemtico de intervalo abierto (parntesis) y de intervalo


cerrado (corchete). Donde (Li-1 Li] significa que est abierto por la izquierda y
cerrado por la derecha, es decir que en cada intervalo no est incluida el extremo
inferior (Li-1) pero si lo est el extremo superior (Li).
Forma de expresar:
Intervalo de clase
(Li-1 Li]
320 370

370 420

420 470

470 520

520 570

570 620

620 670

Punto medio de cada intervalo, es la MARCA DE CLASE se denota con y i donde


320 370
y1 345
2

470 520
y4 495
2

620 670
y7 645
2

47 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016

5. Elementos de una cuadro de frecuencia, en toda cuadro de frecuencia se


identifica los siguientes elementos:

a) Frecuencia absoluta (ni): Se denomina frecuencia absoluta del valor xi de la


variable X, el nmero de veces ni que se repite ese valor.

b) Frecuencia relativa (hi): Se denomina frecuencia relativa del valor xi de la variable


X la relacin por cociente entre el nmero de veces que aparece el valor xi y el
ni
nmero total de valores de la variable (N). hi
n

c) Frecuencia absoluta acumulada (Ni): Se denomina frecuencia absoluta


acumulada del valor n i a la suma de las frecuencias absolutas de los valores de la

variable X anteriores o iguales a n i . Su valor es N i ni con j = 1......i

d) Frecuencia relativa acumulada (Hi): Es la frecuencia absoluta acumulada dividida


Ni
por el nmero total de valores de la variable. Su valor es Hi = .
N
De todas estas definiciones se extraen las siguientes deducciones:
La suma de las frecuencias absolutas sin acumular es igual al nmero total de los (

n i ,= N)

La ltima frecuencia relativa acumulada es el total de elementos (n).


La suma de todos las frecuencias relativas acumular es igual
La ltima frecuencia relativa acumulada es la unidad

La distribucin de frecuencias de una variable suele presentarse ordenadamente


mediante la tabla de frecuencias siguiente:

48 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016

Marca Frecuencias
Intervalos Frecuencia Frecuencias Frecuencias Relativas
de Absolutas
de clases Absolutas Relativas Acumuladas
clase Acumuladas

<Li-1 Li] xi ni Ni hi Hi

n1 N1
<L 1 L 2 ] x1 n1 N1=n1 h1= H1=
N N

n N
<L2, L3] x2 n2 N2 = n1+n2 h2= 2
H2= 2
N N

n N
<L3, L4] x3 n3 N3 =n1+n2+n3 h3= 3
H3= 3
N N

. . . . . .
. . . . . .
. . . . . .

nk Nk
<Lk-1, L k] xk nK Nk = n1+...+nK=n hk = Hk = =1.00
N N

Total n ni =n hi =1

Los Intervalos pueden ser de la


siguiente manera:
<Li-1 Li] <Li-1 Li>
[Li-1 Li> [Li-1 Li]

Lectura de la informacin debe considerar los Signos y Smbolos siguientes:


() No existe el fenmeno que trata
(0) La cantidad no alcanza a la mitad de la unidad tomada como base
() Informe no disponible.

49 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
Aplicacin de la funcin de Excel en la Elaboracin de Tablas
Se ingresa los datos sobre el sueldo mensual en dlares de 60 empleados de la empresa
Z.S.A., en una columna desde la celda A1 hasta la celda A61.

Determinamos el mximo y mnimo de Xi, el sueldo ms alto (Xmax =MAX(A2:A61) =


667 y el sueldo mnimo (Xmin =MIN(A2:A61). = 321

1. Rango Recorrido(R): Xmax Xmin = 667 321 =346


Restamos la Celda A2 menos la Celda A3

2. Elegimos el nmero de Intervalos (m). Se puede considerar 5 15 intervalos


Si aplicamos:

Para calcular el nmero de clases de un cuadro de frecuencias podemos usar las


siguientes expresiones frmulas:
a) Regla de Sturges m = 1 + 3.322 Log(n)
m = 1 + 3.322 Log(60)= 6.907

=1+3.322*LOG(CONTAR(A2:A61))
Para redondear a un entero superior se utiliza la siguiente funcin
=MULTIPLO.SUPERIOR(D7,1)

50 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
m = 7 intervalos

3. Determinar la amplitud de los intervalos (C)

X max X min 667 321


ci 49,4285.......
m 7
Se divide el rango y el nmero de Intervalos =D5/E7. Tambin redondear a un
entero superior =MULTIPLO.SUPERIOR(D9,1) Se puede redondear a 50

4. Construir los intervalos. Como Ci = 50, el recorrido se divide en 7 intervalos o


segmentos, cuyo extremos son:

Utilizaremos un concepto matemtico de intervalo abierto (parntesis) y de intervalo


cerrado (corchete). Donde (Li-1 Li] significa que est abierto por la izquierda y
cerrado por la derecha, es decir que en cada intervalo no est incluida el extremo
inferior (Li-1) pero si lo est el extremo superior (Li).
Forma de expresar:

I1 I2 I3 I4 I5 I6 I7

320 370 420 470 520 570 620 670

En el primer intervalo I1 en el lmite inferior la observacin mnima se le resta una

observacin porque es intervalo abierto (321 1 = 320), para el lmite superior al valor

obtenido en el lmite inferior se suma la amplitud (se fija la amplitud con F4)=E16+$E$9

En el segundo intervalo I2 en el lmite inferior es =F16, para para el lmite superior

=E17+$E$9

51 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016

5. Elementos de una cuadro de frecuencia, en todo cuadro de frecuencia se


identifica los siguientes elementos:

a) Frecuencia absoluta (ni): Se denomina frecuencia absoluta del valor xi de la


variable X, el nmero de veces ni que se repite ese valor.

Para calcular la Frecuencia absoluta en Excel se tendr que activar Archivo


Opciones Complementos Ir Herramienta para anlisis

Se selecciona el Rango de entrada desde la celda A2 hasta A61 y el Rango de


Clase F:16 hasta F22

52 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016

Por lo tanto las frecuencias quedan determinadas de la siguiente manera

b) Frecuencia relativa (hi): Se denomina frecuencia relativa del valor xi de la variable


X la relacin por cociente entre el nmero de veces que aparece el valor xi y el
n
nmero total de valores de la variable (N). hi i
n
Se divide H16/$H$23

c) Frecuencia absoluta acumulada (Ni): Se denomina frecuencia absoluta


acumulada del valor n i a la suma de las frecuencias absolutas de los valores de la
variable X anteriores o iguales a n i . Su valor es N i ni con j = 1......i

d) Frecuencia relativa acumulada (Hi): Es la frecuencia absoluta acumulada dividida


N
por el nmero total de valores de la variable. Su valor es Hi = i .
N

53 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016

Figura:

54 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
E. DISTRIBUCIN DE FRECUENCIAS, DE LA VARIABLE CUANTITATIVA CONTINUA: Se trabajara con
la variable Gasto semanal en la tienda VENDO

Calculo previos para tabular la variable

Paso 1.- Hallar el rango o amplitud de los datos

Rango = Observacin mayor Observacin menor

Rango = 140.0 30.0 = 110.0

Clculos del Rango con el Minitab

Figura N 19: Calculo del Rango

Figura N 20: Calculo de las observaciones mnimas, mximas y el rango

55 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016

Figura N 21: Calculo del Rango

Pas 2.- Hallar el nmero de Intervalos (m) Dos maneras:


a) Por la experiencia del investigador, usualmente
5 m 15

b) Por la frmula de Sturges


m = 1 + 3.322 log
(n)
m =1 + 3.322 log (35) = 6.12939 6 Intervalos

Seleccionamos Calc para calcular nmero de clases

Figura N 22: Clculo de Nmero de Intervalos

56 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
Paso 3.- Hallar la amplitud de los intervalos (C)
110
= = 18.33 18.4 Redondeo por exceso
6 Igual # decimales que los datos

Paso 4.- Hallar los intervalos de clase


Li-1 = lmite inferior de la clase i
Li = lmite superior de la clase i
Frecuencias
Frecuencia
Intervalos de clases Absolutas
Absolutas
Acumuladas
[Li-1 Li> ni Ni
[ Observacin menor L 2 > n1 N1=n1
[L2, L3> n2 N2 = n1+n2

[L3, L4> n3 N3 =n1+n2+n3

. . .
. . .
. . .
Lk-1, L k> nK Nk = n1+...+nK=n
Total n ni =n

Los intervalos son los siguientes:


[Li-1 Li>
[L1 = obs. menor = 30.0 L1 = L1 +IC = 48.4>
[L2 = 48.4 L2 = 66.8>
[L3 = 66.8 L3 = 85.2>
[L4 = 85.2 L4 = 103.6>
[L5 = 103.6 L5 = 122.0>
[L6 = 122.0 L7 = 140.4>

Paso 5- Tabulacin de los datos (conteo de datos)


Frecuencia Frecuencia
Gasto mensual Frecuencia Frecuencia
acumulada acumulada
[Li-1 Li> absoluta ni relativa hi %
absoluta Ni relativa Hi %
[ 30.0 48.4> 2 5.71 2 5.71
[ 48.4 66.8> 8 22.86 10 28.57
[ 66.8 85.2> 10 28.57 20 57.14
[ 85.2 103.6> 7 20.00 27 77.14
[103.6 122.0> 5 14.29 32 91.43
[122.0 140.4] 3 8.57 35 100.00

Nota: Creamos una nueva variable denominada Gastos en la columna C8


Paso 6- Tabulacin de los datos (conteo de datos) con Minitab. Seleccionamos Datos/
Codificar/ Numrico a numrico

57 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016

Figura N 23: Codificar de Numrico a numrico

Pas 6- En la ventana Cdigo Numrico a numrico se ingresan los valores de los


intervalos mencionando a que intervalo corresponde:

Figura N 24: En la ventana Cdigo Numrico a numrico se ingresan los valores

58 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
Pas 7- Mostrar los intervalos con sus respectivos frecuencias absolutas y relativas.
Seleccionamos Estadsticas/Tablas/Cuentas de variables individuales seleccionamos C8:
Gastos en la ventana de variables. Tambin Conteos/Porcentajes/Conteos acumulados y
porcentaje acumulados.

Figura N
24: Cuentas de variables individuales

Figura N 25: Cuentas de variables: Gastos

59 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
F. REPRESENTACIN GRAFICA DE LA CUANTITATIVAS CONTINUA: Realizamos la
tabulacin de la variable Gasto semanal procedemos a ejecutar en el Minitab

Calculo previos para tabular la variable


1. Histogramas Se utilizan para variables continuas o para variables discretas, con un gran
nmero de datos, y que se han agrupado en clases.
Paso 1.- Seleccionamos Grfica/Histograma

Figura N 25: Seleccionar Histogramas

Paso 2.- En la ventana Histograma seleccionamos simple/Aceptar

Figura N 26: Ventana Histogramas

60 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
Paso 3.- En la ventana Histograma simple en la ventana de Variables grficas:
Gasto semanal

Figura N 27: Histograma simple

Paso 4.- Se selecciona Escala selecciona Tipo de escala Y

Figura N 28: Histograma Escala

61 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
Paso 5.- En la ventana Histograma Escala/tipo de escala Y/Porcentaje

Figura N 29: Histograma Escala

Paso 6.- Se ejecuta doble click en el Histograma en el eje de X

Histograma de Gasto semanal


25

20
Porcentaje

15

10

0
30 45 60 75 90 105 120 135
Gasto semanal

Grfico N 03: Histograma de Gasto semanal

62 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2016
Paso 7.- En la ventana Editar Escala se seccionamiento: Tipo de
intervalo/Punto de corte. En Definicin de intervalo/posiciones de punto
medio/punto de corte: 30:140.4/18.4/Aceptar

Amplitud del
intervalo

Observacin
Observacin
Mnima
Mxima

Figura N 30: Histograma Escala

Histograma de Gasto semanal


30

25

20
Porcentaje

15

10

0
30.0 48.4 66.8 85.2 103.6 122.0 140.4
Gasto semanal

Grfico N 04: Histograma de Gasto semanal

2. Histogramas Se construye con cada punto medio o marca de clase (Xi) de cada
63 Dr. Miguel Angel Macetas Hernndez
Estadstica General 2016
intervalo se levanta un segmento de altura igual a la respectiva Frecuencias
Absolutas (ni hi).

Paso 1.- Se copia la marca de clase y frecuencia relativa

Se agrega una clase: Frec. Rela


39.2 18.4 =20.8 h = 0.00

Se agrega una clase:


Frec. Rela
131.2 + 18.4 = 149.6
h = 0.00

Figura N 31: Marca de clase y Frecuencia Relativa

Paso 2.- Seleccionamos Grfica/ Grfica de dispersin

Figura N 31: Grfica de dispersin

64 Dr. Miguel Angel Macetas Hernndez


Estadstica General 2012
Paso 3.- En la ventana Grfica de dispersin con lnea de conexin

Figura N 32: Grfica de dispersin

Paso 4.- En la ventana Grfica de dispersin con lnea de conexin:


Se agrega en la Variables Y: Frec. Rela y Variables X: Marca de Clase

Figura N 32: Grfica de dispersin con lnea de conexin

Pas 5.- En la Grfica de Frec. Rela vs Marca de Clase


Doble Crick en eje de Y en la frecuencia Relativa se muestra la venta Editar escala

65 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012

Grfica de dispersin de Frec. Rela vs. Marca de clase


30

25

20
Frec. Rela

15

10

20 40 60 80 100 120 140 160


Marca de clase

Grfico N 05: Polgono de frecuencia de Gasto semanal

Pas 6.- En la venta Editar escala en el Rango de escala/Mnimo =0/ Aceptar

Figura N 32: Editar escala

66 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012

Grfica de dispersin de Frec. Rela vs. Marca de clase


30

25

20
Frec. Rela

15

10

0
20 40 60 80 100 120 140 160
Marca de clase

Grfico N 05: Polgono de frecuencia de Gasto semanal

3. Polgonos Acumulativos de Frecuencias (Ojiva). Aquellos que se desarrollan mediante la


marca de clase que tiene coincidencia con el punto medio de las distintas columnas del
histograma. En el momento de la representacin de todas las frecuencias que forman parte
de una tabla de datos agrupados, se genera el histograma de frecuencias acumuladas que
posibilita la diagramacin del polgono correspondiente.

Paso 1.- Seleccionamos Grfica/Histograma

Figura N 33: Seleccionar Histogramas

67 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
Paso 2.- En la ventana Histograma seleccionamos simple/Aceptar

Figura N 34: Ventana Histogramas

Paso 3.- En la ventana Histograma simple en la ventana de Variables grficas: Gasto


semanal

Figura N 35: Histograma simple

68 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
Paso 4.- Se selecciona Escala selecciona Tipo de escala Y

Figura N 36: Histograma Escala

Paso 5.- En la ventana Histograma Escala/tipo de escala Y/Porcentaje

Figura N 37: Histograma Escala

Pas 6.- Doble Click en eje de Gasto mensual donde se presenta la ventana Editar escala

69 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012

Histograma de Gasto semanal

100

80
Porcentaje acumulado

60

40

20

0
30 45 60 75 90 105 120 135
Gasto semanal

Grfico N 06: Polgono de frecuencia Acumulada

Pas 7.- En la ventana de Editar Escala/Tipo intervalo/Punto de corte


Posiciones de punto medio/punto de corte: 30:140.4/18.4 Aceptar

Figura N 38: Ventana de Editar Escala

70 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012

Histograma de Gasto semanal

100

80
Porcentaje acumulado

60

40

20

0
30.0 48.4 66.8 85.2 103.6 122.0 140.4
Gasto semanal

Grfico N 06: Polgono de frecuencia Acumulada

4. Diagrama de Tallos y hojas: Permite obtener simultneamente una distribucin de


frecuencias de la variable y su representacin grfica. Para construirlo basta separar en cada
dato el ltimo dgito de la derecha (que constituye la hoja) del bloque de cifras restantes (que
formar el tallo).

Paso 1.- Seleccionamos Tallo y Hoja.

Figura N 38: Seleccionar Tallo y Hoja

71 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
Grficos Estadsticos

Primero definir lo que es un grfico o diagrama en estadstica.

Un diagrama es una especie de esquemtico, formado por lneas, figuras, mapas,


utilizado para representar, bien datos estadsticos a escala o segn una cierta
proporcin, o bien los elementos de un sistema, las etapas de un proceso y las
divisiones o subdivisiones de una clasificacin. Entre las funciones que cumplen los
diagramas se pueden sealar las siguientes:

Hacen ms visibles los datos, sistemas y procesos


Ponen de manifiesto sus variaciones y su evolucin histrica o espacial.
Pueden evidenciar las relaciones entre los diversos elementos de un sistema o de
un proceso y representar la correlacin entre dos o ms variables.
Sistematizan y sintetizan los datos, sistemas y procesos.
Aclaran y complementan las cuadros y las exposiciones tericas o cuantitativas.
El estudio de su disposicin y de las relaciones que muestran pueden sugerir
hiptesis nuevas.

Algunos de los diagramas ms importantes son el diagrama en rbol, diagrama de


reas o superficies, diagrama de bandas, diagrama de barras, diagrama de bloques,
diagrama circular, diagrama circular polar, diagrama de puntos, diagrama de tallo y
hoja diagrama, histogramas y grficos de caja y bigote o boxplots.

Clasificacin De Los Grficos

Los grficos podemos clasificarlos en la siguiente forma:

A. Grficos de coordenadas ortogonales.


Con divisiones equidistantes: Cronodiagrama, historiograma, histograma y
polgono acumulativo, grfico en Z, grfico en escalera, grfico de banderola,
grfico mixto (La Banda Flaman), curva de frecuencia, estereograma, grfico
de Gantt, grfico de barras, etc
Con divisiones semi-equidistantes: Cuadriculado logartmico y semi-
logartmico.

72 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
B. Grficos de coordenadas seudo-ortogonales.
C. Grficos de coordenadas no ortogonales.
Grficos de coordenadas polares, grfico en espiral, grfico triangular
equiltero, etc.
D. Grficos sin coordenadas.
De superficies: Grficos de sectores, grficos geomtricos diversos.
De volmenes: Cubo, esfera, etc.
De figuras (pictrico).
Cartograma de sealizacin y densidad.

73 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
E. GRFICOS DE LA DISTRIBUCIN DE FRECUENCIAS
Ordenadas

Las frecuencias (ni, hi, Ni, Hi) siempre son cantidades no negativas ( 0), por lo tanto el
grafico de las frecuencias sean para variables discretas como para variables
Abscisas continuas, se construye en el primer cuadrante del plano cartesiano o rectangular. En
eje de las abscisas (horizontal) se indican los valores de la variable (sean puntos o
intervalos), y en el eje de las ordenadas (vertical) se anota el valor de la respectiva
frecuencia.

i. Frecuencias de variable Discreta


La representacin grfica de las (ni hi) se hace mediante el Diagrama de Frecuencia.
Par el efecto, en el eje horizontal se representan los valores Y i, y en el eje verticales
representa los valores de las frecuencias (n i hi)
ni
2
0
1
Frecuencia Absolutas

8
Frecuenc Frecuen
1
5 Opinin ia cia
1 de los absoluta Relativa
1 1
2 Clientes ni hi %
0 0 A 6 12,5
G 10 20,8
6
5 O 18 37,5
P 2 4,2
2 V 12 25,0
0 Total 48 100,0
A G O P V
Opinin de los Clientes

Al considerar las frecuencias absolutas acumuladas o relativas acumuladas, la


representacin grfica se hace mediante el GRFICO ACUMULATIVO DE
FRECUENCIAS. En el eje horizontal se colocan los valores de la Marca de Clase (Xi), y en
el eje vertical los valores Ni Hi, a continuacin, a partir de cada extremo de los segmentos
se traza tramos horizontales formando una escalera como se aprecia en el siguiente grafico
Intervalo Frecuenci
Frecuen
s de Marca as
cia 45
clases de Absolutas
Absolut
clase Acumula
Frecuencias Absolutas

40
(Li-1 L i as
Xi das 35
] ni
Ni
Acumuladas

30
16 27 21,5 3 3 25
27 38 32,5 5 8 20
38 49 43,5 10 18 15
49 60 54,5 3 21 10
60 71 65,5 8 29 5
71 82 76,5 7 36 0
82 93 87,5 4 40 0 20 40 60 80 100
Total 40
Marca de Clase

74 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
18
18
16

Frecuencia Absoluta
12
En el caso de Grficos de 14
12 10
Barras, en el eje horizontal
10
representa los valores de Yi, y 8
6
en el eje vertical se presentan 6
los valores de las frecuencias 4 2

Absolutas (ni hi) 2


0
A G O P V
Opinin de los Clientes
Frecuen Frecuen Convierten
Opinin En
cia cia hi %
de los Grad
absoluta Relativa A Grados
Clientes os
Para los Grficos de Sectores ni hi %
Circulares Pastel, se A 6 12,5
360 x12,5 45.0
convierten los valores de 100
360 x 20,8
12.5%
las frecuencias Absolutas 25.0%
G 10 20,8 74.9
(ni hi) a grados mediante 100 20.8%
O 18 37,5 135.0
360 xh i % P
V
2
12
4,2
25,0
16.3
91.8
4.2%

100 Total 48 100,0 37.5%


ii. Frecuencias de variable Continua
En el caso ms general, las variables continuas se agrupan en cuadros de frecuencias
con intervalos, por lo tanto se trata de representar grficamente intervalos en el eje
horizontal.

La representacin grfica de las frecuencias (absolutas o relativas) se hace mediante


el Histograma de Frecuencias, que est constituido por un conjunto de rectngulos,
cuya base es igual a la amplitud de un intervalo y la altura igual a la respectiva
frecuencia. Para construir el histograma de frecuencias, se indican en el eje horizontal

ni
Intervalo Frecuen
s de cia
10 Absoluta
clases
Frecuencia Absolutas

s
8 (Li-1 L i ]
ni
16 27 3
6
27 38 5
4 38 49 10
49 60 3
2
60 71 8
0 71 82 7
0 16 27 38 49 60 71 82 93 82 93 4
Lmite inferior
Total 40

Otro grfico que se usa para representar las frecuencias es el Polgono de Frecuencias,
que se construye como sigue: en cada punto medio o marca de clase (Xi) de cada intervalo
se levanta un segmento de altura igual a la respectiva frecuencias Absolutas (ni hi), luego
une los extremos con una lnea poligonal, resultando el Polgono de Frecuencias. Para
completar los extremos, se extiende el polgono en media amplitud de cada extremo.

75 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
Intervalo Frecuen 12
Marca
s de cia
de
clases Absoluta 10
clase

Frecuencia Absoluta
s
(Li-1 L i ] Xi
ni 8
10.5 0
6
16 27 21,5 3
27 38 32,5 5 4

38 49 43,5 10
2
49 60 54,5 3
60 71 65,5 8 0

71 82 76,5 7 0 10.5 21.5 32.5 43.5 54.5 65.5 76.5 87.5 98.5

82 93 87,5 4 Marca de clase

98.5 0
Total 40

Por su parte, las frecuencias acumuladas (Absolutas o Relativas) se grafican mediante los
Polgonos Acumulativos de Frecuencias (Ojiva). De igual manera, en el eje horizontal
se ubican los extremos los intervalos y en el eje vertical lo valores de N i, Hi. En el extremo
superior de cada intervalo se levanta un segmento de altura igual a la respectiva frecuencia
absoluta, luego partiendo del extremo inferior del primer intervalo se une, con segmentos
de recta, los extremo de los segmentos verticales, obteniendo una lnea poligonal que, a
partir de la ltima frecuencia acumulativa, se extiende paralelamente al eje horizontal,
obtenindose la grfica del Polgono Acumulativo de Frecuencias
Frecuencia
Frecuenci
Marca s Absolutas
Intervalos a 45
de clase Acumulada
de clases Absolutas
s 40
<Li-1 Li]
Xi
ni 35
Ni
Frecuencias Absolutas

30
16 27 21,5 3 3
Acumuladas

25
27 38 32,5 5 8
20
38 49 43,5 10 18
15
49 60 54,5 3 21
60 71 65,5 8 29 10

71 82 76,5 7 36 5

82 93 87,5 4 40 0
Total 40 0 16 27 38 49 60 71 82 93

Intervalo
Grfico N 3.3: Diagrama de dispersin
Aos Demanda de cobre en China de Clase
Demanda de cobre refinado en China
1990 505 (miles de toneladas mtricas)
2000
1991 600 1800
1992 850 1600
Demanda de cobre en China
(variable dependiente = Y)

1993 1000 1400

1994 770 1200

1000
1995 1125
800
1996 1240 600
1997 1260 400

2008 1380 200

1999 1550 0
1990

1991

1992

1993

1994

1995

1996

1997

1998

1999

2000

2001

2002

2003

2000 1660
Aos (variable independiente = X)
2001 1750
2002 1840
2003 1900

76 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
CLASIFICACIN DE LAS OBJETIVO DEL GRAFICO
VARIABLES MOSTRAR
TAMAO DISTRIBUCIN DE ASOCIACIN ENTRE
ESCALA DE
DEL FRECUENCIAS VARIABLES (DOS O
MEDICIN
RECORRIDO (UNA VARIABLE) MAS)
BASTONES
1

0
1 2 3 4
D
T
I
S O BARRAS SIMPLES BARRAS AGRUPAS
30

C
D
25

20 8

R 15

10
7

A 5
5

E 0
1 2 3 4
4

T S 1

0
1 2 3 4

A
SECTOR CIRCULAR BARRAS
S
100

90
COMPUESTAS
80

70

60

50

40

30

20

10

0
1 2 3 4

I 40
HISTOGRAMA 32
CORRELACIN
N 30

T 30
28

C E 20
26

R 24

O V 10
22

20

N A 0
18

L 16,0 18,0 20,0 22,0 24,0 26,0 28,0 30,0 32,0


16
0 10 20 30

T O
I
O
N
POLGONO DE
U R
A FRECUENCIAS LINEAL
A Z
60
60

50 50

S O 40 40

N 30 30

20 20

10 10

0 0
1 2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 7 8 9

77 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
F. VENTAJAS Y DESVENTAJAS DE LOS GRFICOS

Ventajas de los grficos.

a) Sntesis.- Un cuadro con cifras es difcil de estudiar requiriendo a menudo un


penoso trabajo analtico para poder descubrir las informaciones que contiene.
Por el contrario, mediante un grfico el investigador hace aparecer las
principales caractersticas de una serie estadstica.

b) Descubrimiento.- El grfico permite descubrir hechos esenciales, que


pasaran desapercibidos al simple examen de los cuadros numricos.

c) Control.- Permite descubrir anomalas de clculo o tipogrficas, que no son


fciles de hallar en los cuadros.

d) Comparacin.- Si el anlisis de los datos de una serie en un cuadro, es una


labor delicada, la confrontacin de los datos de dos series lo es ms todava.
En cambio, los grficos permiten un conjunto de comparaciones a simple vista.

e) Bsqueda de las regularidades.- Los grficos permiten hallar fcilmente la


regularidad de los movimientos de las series cronolgicas. Tambin permite
destacar la alternancia o repeticin de ciertos fenmenos.

El Grfico es un instrumento de investigacin cientfica.

Desventajas de los grficos

a) Ocultamiento.- El grfico oculta una cierta cantidad de informacin. En este


sentido es menos preciso que un cuadro.

b) Deformaciones.- Por fallas deliberadas o no en la construccin, puede


introducir importantes deformaciones de los hechos. Un dibujante poco
escrupuloso puede exagerar o reducir, mediante un mal uso de las escalas y
de los trazos, la importancia de un fenmeno. Tal cosa puede ocurrir en
grficos para fines polticos, econmicos o publicitarios.

78 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
Construir Una Pirmide Poblacional
Elaborar una pirmide poblacional a partir de datos
1. Abre una nueva hoja de clculo Excel para introducir los datos.
2. Escribe en la primera fila el ttulo de la tabla de Datos: Per 2011.
3. Introduce los grupos de edad en la primera columna:
En la cabecera de la columna escribe: Edad
A continuacin escribe los grupos de Edad: 0-4, 5-9, ..., 80 y ms
Al final de la columna escribe: Total

4. En las siguientes columnas escribe los datos, en el siguiente orden: Hombres,


Mujeres.
Nota: Los datos de que aparezcan en la columna izquierda de la pirmide
(Hombres) deben ser representados con nmeros negativos. Simplemente inserta el
signo - antes de cada valor o crea una nueva columna y multiplica la poblacin
masculina por 1.
5. Ya que estas trabajando con grandes poblaciones, debes ajustar la escala de la
figura, expresando los datos en miles. Puedes hacer esto dividiendo cada celda de
datos por 1.000.

6. Tambin puedes transformar los datos de los distintos grupos de edades en porcentaje
respecto a la poblacin total. En una nueva columna divide el valor del grupo de edad entre
el total de la poblacin.
Creacin del Grfico
1. Selecciona todos los datos -excepto el ttulo y la fila Total- haciendo clic con el ratn y
arrastrando a lo largo de los datos de la tabla (A3:C22).
2. Haz clic en el botn Asistente para grficos.
Paso 1. Elige Tipo de grfico: Barras, y selecciona el subtipo Barra agrupada.
Pulsa el botn Siguiente.
Pas 2. Vers la pirmide. Deja los datos como estn y pulsa Siguiente.
Pas 3. Escribe el ttulo de tu grfico (p.e., Per 2001). Deja los otros cuadros en
blanco, y pulsa el botn Siguiente.
Pas 4. Selecciona el botn En una hoja nueva (llama a esta hoja como desees) y
pulsa el botn Finalizar.
3. Ya tienes tu pirmide. Es hora de mejorar su apariencia:

Arreglar las barras. Haz doble clic en una de las barras del grfico. En el cuadro de
dilogo Formato de la serie de datos, selecciona la pestaa Opciones. Configura
79 Mg. Miguel Angel Macetas Hernndez
Estadstica General 2012
Superposicin a 100 y pulsa Ancho del rango a 0 y pulsa el botn OK. No
cambies nada ms. Las barras del grfico deben aparecer juntas, sin agujeros.
Arreglar el eje vertical (desplazar las etiquetas de edades hacia la izquierda). Haz
doble click en los datos del eje vertical. En el cuadro de dilogo Formato de ejes,
elige la pestaa Tramas y configura los botones de marca de graduacin a Ninguno
y el botn de rtulos a Inferior.
Arreglar el eje horizontal (eliminar los valores negativos del eje hombres). Haz
doble clic sobre los datos del eje horizontal. En la pestaa Nmero selecciona
Categora: Personalizada y escribe en Tipo: 0;0.
Aplica cualquier otro formato para mejorar la apariencia de la pirmide: colores de
las barras, tamao y tipo de fuentes y ttulos, eliminacin de rejilla y fondo...

Edades Hombres Mujeres Totales Edades Hombres Mujeres


0-4 1266429 1203652 2470081 0-4 -5.5 5.2
5-9 1352926 1298331 2651257 5-9 -5.9 5.6
10-14 1269705 1243519 2513224 10-14 -5.5 5.4
15-19 1154745 1145976 2300721 15-19 -5.0 5.0
20-24 1072826 1097428 2170254 20-24 -4.7 4.8
25-29 918063 958505 1876568 25-29 -4.0 4.2
30-34 857675 894850 1752525 30-34 -3.7 3.9
35-39 768107 816358 1584465 35-39 -3.3 3.5
40-44 691549 729825 1421374 40-44 -3.0 3.2
45-49 561907 592190 1154097 45-49 -2.4 2.6
50-54 449661 471292 920953 50-54 -2.0 2.0
55-59 296106 319847 615953 55-59 -1.3 1.4
60-64 238627 261898 500525 60-64 -1.0 1.1
65-69 177284 204213 381497 65-69 -0.8 0.9
70-74 139265 163512 302777 70-74 -0.6 0.7
75-79 92800 113044 205844 75-79 -0.4 0.5
80 - + 136901 95194 232095 80 - + -0.6 0.4
Totales 11444576 11609634 23054210 Totales -49.6 50.4

80 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
Pirmide Poblacional

Mujeres Hombres
80- +

75-79

70-74

65-69

60-64

55-59

50-54

45-49

40-44

35-39

30-34

25-29

20-24

15-19

10-14

5-9

0-4
8.0000 6.0000 4.0000 2.0000 0.0000 2.0000 4.0000 6.0000 8.0000

Fuente: Instituto Nacional de Estadstica e Informtica

81 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
Ejercicios de variables cualitativas
1. Construye una tabla de distribucin de frecuencia, haz una grfica de barras y un
diagrama de pastel para una muestra de compras de refresco segn la preferencia
de 50 personas:
Coke Classic Diet Coke Pepsi-Cola Pepsi-Cola Sprite
Pepsi-Cola Diet Coke Diet Coke Dr. Pepper Pepsi-Cola
Coke Classic Sprite Pepsi-Cola Coke Classic Coke Classic
Dr. Pepper Coke Classic Pepsi-Cola Coke Classic Coke Classic
Pepsi-Cola Coke Classic Coke Classic Coke Classic Dr. Pepper
Coke Classic Coke Classic Pepsi-Cola Coke Classic Pepsi-Cola
Coke Classic Diet Coke Pepsi-Cola Coke Classic Pepsi-Cola
Diet Coke Dr. Pepper Diet Coke Diet Coke Pepsi-Cola
Sprite Coke Classic Coke Classic Coke Classic Dr. Pepper
Sprite Coke Classic Coke Classic Pepsi-Cola Sprite

2. Segn Nielsen Media Research, los cinco programas de TV ms vistos a las 8:00 P.M.
del 14 de octubre de 2012 fueron Congo, The X-Files, Holliday in Your Heart, Ellen
Foster y Unhappily Ever After. La lista siguiente es una encuesta entre 50
espectadores.
Unhappily Ellen Congo X-Files Congo Ellen Ellen X-Files

Ellen Ellen X-Files Ellen Holliday X-Files X-Files

Congo Holliday Congo Ellen Congo Holliday X-Files

Ellen Ellen X-Files X-Files X-Files Ellen Holliday

Ellen Ellen Holliday Holliday Ellen Unhapily X-Files

Holliday X-Files X-Files Ellen Congo Holliday Ellen

Holliday Ellen Holliday X-Files Congo Congo Holliday

a) Traza una grfica de barras y un diagrama de pastel?


b) De acuerdo con la muestra, qu programa tiene la mayor parte del mercado?

3. Se pidi a los alumnos de primer ao del Colegio de Administracin en la Universidad


que indicaran su campo preferido, y se obtuvieron los siguientes datos.
Campo Alumnos

Administracin 55

Contabilidad 51

Finanzas 28

82 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
Mercadotecnia 82

Haz una grfica de barras y el diagrama de pastel.

4. En el censo de 1960 (Direccin General de Estadstica de la Secretara de Comercio


y Fomento Industrial) se encontr que la distribucin del material predominante en los
muros o paredes de las casas era como se muestra en la tabla:

Nmero de
Material de los muros Proporciones Porcentajes
viviendas

Adobe 3 184 0.499 49.9

Tabique 1 547 0.242 24.2

Madera 558 0.087 8.7

Embarro 495 0.078 7.8

Mampostera 171 0.027 2.7


Bloque de material ligero 76 0.012 1.2

Otros 349 0.055 5.5

Total 6 380 1.000 100.0

Traza un diagrama de pastel.

5. A continuacin vemos datos de una muestra de 55 miembros del Saln de la Fama


de Bisbol, en Cooperstown, Nueva York, para cada posicin en el campo. En cada
caso se indica la posicin principal del jugador: lanzador(P), receptor (H), primera
base (1), segunda base (2), tercera base (3), parador en corto (S), jardinero izquierdo
(L), jardinero central (C) y jardinero derecho (R).
L P C H 2 P R 1 S S 1 L 2 P

R P P P P R C S L R P C L C

P P R P 2 3 P H L P 1 C P P

P P S 1 L R R 1 2 H S 3 H

b) Construye una grfica de pastel y otra de barras.


c) Qu posicin tiene ms miembros en el saln de la fama?
83 Mg. Miguel Angel Macetas Hernndez
Estadstica General 2012
d) Qu posicin tiene menos miembros?

6. Los empleados de Electrnica Moderna tienen un sistema de horario flexible.


Pueden comenzar su jornada de trabajo a las 7:00, 7:30, 8:00, 8:30 o 9:00. Los
datos siguientes representan una muestra de las horas de entrada que
seleccionaron.

7:00 8:30 9:00 8:00 7:30 7:30 8:30 8:30 7:30 7:00

8:30 8:30 8:00 8:00 7:30 8:30 7:00 9:00 8:30 8:00

a) Haz una grfica de barras y un diagrama de pastel.


b) Qu opinas acerca de las preferencias de los empleados en el sistema de
horarios flexible?

7. .Durante los primeros 11 meses de 1997, los coches Honda Accord, Chevy Cavalier,
Toyota Camry, Honda Civic y Ford Taurus fueron los coches nuevos ms vendidos
en USA. Se presentan los datos de 50 compras de automvil en Cleveland, Ohio.

Taurus Civic Civic Taurus Accord Civic Accord Camry Camry

Taurus Civic Cavalier Cavalier Taurus Accord Cavalier Taurus Taurus

Camry Civic Cavalier Cavalier Camry Accord Camry Cavalier

Camry Camry Camry Civic Camry Camry Accord Civic

Civic Accord Cavalier Cavalier Accord Camry Tauru Taurus

Cavalier Taurus Accord Civic Accord Taurus Accord Camry

Traza un diagrama de pastel y di: Cul es el coche que ms se vende?

8. Cada una de las 500 empresas Fortune se clasifica como perteneciente a uno de
varios giros industriales. A continuacin vemos una muestra de 20 empresas con
su correspondiente ramo industrial.

Compaa Ramo Compaa Ramo

IBP Alimentos Borden Alimentos

84 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
Intel Electrnica McDonnell Douglas Aeroespacial
Coca-Cola Bebidas Norton International Prod. Qumicos
Unin Carbide Prod. Qumicos Quaker Oats Alimentos
General Electric Electrnica Pepsico Bebidas
Motorola Electrnica Maytag Electrnica
Kellogs Alimentos Textron Aeroespacial
Dow Chemical Prod. Qumicos Sara Lee Alimentos
Campbells Soup Alimentos Harris Electrnica
Ralston Purina Alimentos Eaton Electrnica

Elabora una distribucin de frecuencias que muestre la cantidad de empresas en


cada ramo industrial y traza una grfica de barras.

9. Para realizar su ndice de Confianza Comercial, la revista Fortune encuest a 50


altos ejecutivos financieros preguntndoles sus polticas financieras actuales de
presupuesto de capital y publicidad. En Noviembre de 2011, los encuestados
describieron sus polticas como sigue: Agresiva 57%, Cautelosa 29%, Indecisa 14%.
Traza una grfica de barras y una de pastel que describan las polticas de
dichos ejecutivos.

10. Cuando se les pidi clasificar la destreza que se requiere para obtener una alta
calificacin en un nuevo juego de computadoras como principiante, aprendiz,
competidor, maestro o experto, 44 evaluadores respondieron de la manera siguiente:
experto, maestro, maestro, competidor, experto, maestro, maestro, maestro,
experto, aprendiz, maestro, maestro, maestro, maestro, experto, maestro,
competidor, maestro, maestro, principiante, experto, competidor, maestro, maestro,
experto, experto, maestro, maestro, maestro, competidor, competidor, experto,
maestro, experto, experto, experto, competidor, maestro, maestro, experto,
competidor, maestro, maestro y experto. Construye una tabla que indique las
frecuencias correspondientes a estas clasificaciones de destreza que se
requiere para obtener una alta calificacin.

11. En la siguiente tabla se muestra la estructura de la fuerza de trabajo en el Per, por


sectores de actividad para los aos 2009, 2010 y 2011
85 Mg. Miguel Angel Macetas Hernndez
Estadstica General 2012
Actividad 2009 2010 2011
Agropecuaria 65.4 58.3 54.3
Minero, metalrgico y petrolero 1.8 1.2 1.2
Electricidad 0.2 0.3 0.4
Manufacturero 9.0 11.8 13.8
Construccin e instalacin 1.8 2.7 3.6
Transporte 2.5 2.5 3.2
Comercio 9.4 8.3 9.1
Otras 9.9 14.9 14.3
Total 100.0% 100.0% 100.0%
Base de % (miles de habitantes) 5857 8273 11 202
Construye un diagrama de barras y un diagrama de pastel.

86 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
III. CAPITULO Medidas de Resumen
3.1 Medidas de resumen para variables cualitativas
En trabajos de investigacin frecuencia se utilizan variables cualitativas, bien por su
naturaleza, o por la escala empleada. Por supuesto, una vez que la informacin se
recogi, es necesario calcular alguna medida de resumen cuyo resultado es un
indicador que deber analizarse en un momento posterior.

En este tema te presentamos las medidas de resumen para variables cualitativas que
se utilizan con mayor frecuencia en los estudios que realizas en el nivel primario de
atencin de salud.

3.2 Razn e ndice. Definicin. Clculo e interpretacin


Por razn puede entenderse:
Una razn es la relacin por cociente que se establece entre las unidades de anlisis
que pertenecen a un grupo o categora (a) y las unidades de anlisis que pertenecen

a otra categora (b) de la misma variable. Su expresingeneral es:



sa es la definicin? No te desanimes, es una medida de fcil comprensin. Te la
explicaremos con un ejemplo:

Supongamos que de los 600 recin nacidos (RN) de un hospital en cierto perodo, 300
presentaron los ojos oscuros (OO), en tanto que slo 100 los tenan claros (OC).
Aplicando la expresin general, la razn OO/OC es
a RN con OO 300
R= = = =
b RN con OC 100

La razn ojos oscuros/ojos claros es de 3; o lo que es lo mismo, 3:1.

Pero, qu significa este resultado? Expresa que hay tres recin nacidos con ojos
oscuros por cada recin nacido de ojos claros en ese hospital y en ese perodo.

Fjate que el numerador y el denominador son disjuntos, es decir, no se interceptan,


no estn contenidos uno en el otro. Ello te ayudar a establecer las diferencias con
las medidas de resumen que estudiars a continuacin.

Si multiplicas el resultado obtenido por 100, entonces el nuevo nmero se denomina


ndice, de tal suerte que en el ejemplo anterior el ndice sera 300. En otras palabras,

87 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
en el hospital de referencia, en el perodo estudiado, por cada 100 bebs de ojos
claros hay 300 de ojos oscuros.

Proporcin y Porcentaje. Definicin. Clculo e interpretacin


Una proporcin.- Es la relacin por cociente que se establece entre las
unidades de anlisis que pertenecen a un grupo o categora (a) de una variable y el

total de las unidades de anlisis estudiadas (a + b). Su expresin general es . Si
+
se multiplica su resultado por 100, se obtendr el porcentaje

Seguiremos utilizando el ejemplo anterior. Lo recuerdas? Por supuesto que s. Pues


bien, determinemos la proporcin de nios con ojos oscuros (300) en la poblacin de
recin nacidos (400):
300 3
= = = =
+ 400 4
Alternativamente, puedes calcular el porcentaje:
3 00
100 = 100 = 100 = 75.0%
400
Nota: Usamos la P con fines ilustrativos, pues la proporcin carece de simbologa.
Los resultados anteriores significan que tres de cada cuatro recin nacidos tienen los
ojos oscuros; o que el 75 por ciento de los recin nacidos tiene los ojos oscuros (y,
obviamente, el 25% los tiene claros).

No te resultan familiares estas nuevas medidas, o sea, la proporcin y el porcentaje?


Ya debes estarte preguntando la diferencia que existe entre stas y la distribucin de
frecuencias relativas que ya estudiaste. Nada ms claro: no es que sean parecidas,
son exactamente las mismas, pero restringidas a variables cualitativas.

Observa que el porcentaje te permite analizar el aporte, el peso especfico o la


importancia relativa de cada categora respecto al total.

Tasas

Siempre que necesites medir el riesgo de que acontezca cierto fenmeno en una
poblacin determinada, dispones de un indicador valioso y nico: las tasas

88 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
Una tasa.- Es una relacin por cociente que expresa el riesgo de que ocurra cierto
evento en una poblacin y perodo determinados. Est compuesta por tres elementos,
a saber

=

Veamos cules son esos elementos:
El numerador contiene al nmero de veces que ocurri determinado fenmeno en
un rea geogrfica y en un perodo determinado.
El denominador indica el nmero de habitantes de la poblacin en la cual puede
ocurrir el fenmeno.
k es un mltiplo de 10 cuyo uso est justificado por el hecho de que habitualmente
el resultado del cociente es un nmero fraccionario, y al multiplicarlo por una
potencia de 10 se facilita enormemente la lectura y comprensin del indicador.

Esta es una medida que expresa el riesgo de ocurrencia del evento estudiado en el
numerador en la poblacin involucrada, en el tiempo y lugar establecidos.
Las tasas que ms importancia revisten para nuestro desempeo en el campo de la
Salud son las siguientes:

Tasas de importancia Relevante en Salud


Tasas relacionadas con la natalidad
Tasas relacionadas con la mortalidad
Tasas relacionadas con la morbilidad

Una particularidad realmente til de las tasas es que puedes calcularlas tanto para la
totalidad de la poblacin, como para parte de ella (por ejemplo, para el grupo de edad
de cinco a nueve aos, para los estudiantes, para los residentes del rea rural, y as
por el estilo); por otra parte, puedes calcular las tasas para todas las causas, o
solamente para una de ellas (o un grupo de ellas). De este modo, tendrs calculadas
tasas brutas, crudas, generales o globales si se tratara de tasas que involucren a toda
la poblacin o al total de causas; al tiempo que habrs calculado tasas especficas si
incluan a una parte de la poblacin o a una causa o grupo de ellas.

As las cosas, estars en plena facultad de hallar tasas brutas de mortalidad, de


natalidad, o bien especficas por edad, por sexo, por edad y sexo a la vez, entre

89 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
muchas otras. Teniendo a tu disposicin los datos adecuados, podrs hallar una tasa
tan especfica como desees.

Existe en punto cardinal en el manejo de las tasas: la poblacin expuesta al riesgo en


cuestin. Como ya sabes, este es el denominador de la ecuacin, y de su correcta
determinacin depende la fidelidad del clculo. Nunca sern suficientes las medidas
que tomes para asegurarte que ests empleando el dato acertado. No creas que es
muy difcil saber que ests errado o en lo cierto, el problema radica en que muchas
veces se pasa por alto este detalle de forma involuntaria.

Probablemente te habrs preguntado: Bueno, y qu tanto problema con el


denominador?
Ah! Es que ah radica el quid de la cosa. Recuerda que calculas una tasa para medir
el riesgo de ocurrencia de un evento o fenmeno en una poblacin, pero no en
cualquier poblacin, sino en la poblacin expuesta a ese riesgo. Esto quiere decir que
slo podrs calcular la tasa de mortalidad por cncer de tero en las mujeres de cierta
ciudad, puesto que sera imposible calcularla en los hombres; del mismo modo que no
puedes calcular la tasa de morbilidad por cncer de pulmn de los habitantes de Per
en 2009, utilizando para ello a los habitantes del Per en el ao 2009.
Satisfecha tu inquietud?

Tambin haz de saber que las poblaciones estn sometidas a constantes cambios en
lo que a su nmero atae, determinados por los nacimientos y defunciones y por
los movimientos migratorios (emigracin e inmigracin), que provocan que no sea la
misma a lo largo de todo el ao. De ah que, por convenio, se tome la poblacin
existente a mediados del perodo 11 o poblacin media para el clculo de las tasas.

Por otra parte, debes tener especial cuidado al calcular tasas para poblaciones
pequeas, como la que usualmente manejan los Consultorios, pues suelen volverse
inestables, ya que cualquier evento mueve mucho la tasa, y a veces no guarda
relacin el resultado obtenido con la magnitud del evento acontecido.

Bueno, ya estamos en condiciones de particularizar en las tasas ms relevantes en la


prctica diaria.

90 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
Tasas relacionadas con la natalidad

El estudio de la natalidad est relacionado con el nmero de nacimientos ocurridos en


una poblacin y tiempo determinados, as como la distribucin que siguen de acuerdo
con ciertas caractersticas. Como ves, todo gira en torno a la medicin de la misma, y
una de las formas de conseguirlo es utilizando las tasas.

Ahora nos tropezamos con una contrariedad: la poblacin expuesta al riesgo es muy
difcil de definir, ya que tener un hijo no involucra a toda la parte femenina de la
poblacin, y va ms all, pues otros factores de ndole psicosocial actan en tal
decisin. Por estas razones, vers que se han buscado soluciones alternativas a esta
situacin.

Tasa bruta de natalidad

Comencemos por la tasa bruta de natalidad. La misma expresa cmo se comportan


los nacimientos en un rea y tiempo determinados. Su clculo es sencillo:
( )
= 1000

Por ejemplo, la tasa cruda de natalidad de Per en 2008 fue:
Total de nacidos vivos en Per durante 2008: 151 08012
Total de habitantes en Per durante 2008: 11 122 308.
151080
= 1000 13.6
11122308

Bien, ya tienes el nmero calculado. Pero, es suficiente con eso? Claro que no,
necesitas saber qu significa, a fin de manejarlo apropiadamente. En primer lugar,
debes informar el resultado de la siguiente forma: La tasa bruta de natalidad de Per
en 2008 fue de 14 nacidos vivos por cada 1000 habitantes, ello significa que durante
2008 en Cajamarca nacieron como promedio 14 nios por cada 1 000 habitantes.

Esta tasa tiene el inconveniente de no tomar en cuenta a las personas realmente


expuestas al evento, pero por su sencillez y facilidad de comprensin es la
medida ms generalmente utilizada.

91 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
De ahora en adelante nos limitaremos a ensearte cmo calcular e interpretar el
indicador. Continuemos entonces.

Tasa general de fecundidad

Este indicador mide la natalidad, pero tomando en cuenta solamente a la poblacin


femenina en edad reproductiva o frtil (15 a 49 aos). El hecho de que se restringe el
denominador no inyecta especificidad a la tasa, pues contina siendo una mezcla de
diversos grupos de edades con situaciones diversas; amn de que se mueve a la par
de la tasa cruda de natalidad. Se calcula de la siguiente forma:

= 1000

As, la tasa de Cuba en 2008 fue:
151080
= 1000 49.4
3055907

Interpretacin: En Per, durante 2008, nacieron como promedio 49 nios por cada
1000 mujeres en edad frtil (15 a 49 aos).

Tasa de fecundidad especfica por edad


Esta es una tasa especfica, que usualmente se calcula para grupos quinquenales
comprendidos entre 15 y 49 aos.

= 1000

19476
1549 = 1000 56.3
345942
Interpretacin: Durante 2008 en Per nacieron como promedio 56 nios por cada
1000 mujeres de 15 a 49 aos de edad.

Tasas de mortalidad

La medicin de la mortalidad tiene como fin conocer el nmero de defunciones


ocurridas en cierta poblacin durante un perodo dado, a la vez que se estudia su
distribucin relacionndolas con diversas caractersticas de dicha poblacin.

Entrando en la materia que nos ocupa, te decimos a continuacin las tasas que
podrs calcular.
92 Mg. Miguel Angel Macetas Hernndez
Estadstica General 2012

Tasa bruta de mortalidad

Esta tasa expresa el riesgo que tienen todos los habitantes de cierta poblacin, en un
momento dado, de morir por cualquier causa.

= 1000

En 2008, en nuestro pas esta tasa fue:
77558
= 1000 7.0
11122308
Esto significa que en 2008, en Per fallecieron como promedio 7 personas por cada
1000 habitantes.

Tasa de mortalidad por edad


Ahora te presentamos una tasa de mortalidad especfica, que solo mide el riesgo de
morir que tienen las personas del grupo de edad analizado. Su clculo se logra
restringiendo el denominador a las personas de la edad deseada, e incluyendo en el
numerador a los fallecidos en esa edad.

= 1000

Por ejemplo, en 2008, en Per, la tasa de mortalidad en personas de 60 aos y ms
fue:
52558
60 + = 50 50
1440127
Tasa de mortalidad por sexo
El clculo de esta tasa es muy similar a la anterior, con la diferencia de que te
restringes a un sexo en particular. Expresa el riesgo de morir de las personas de ese
sexo en esa poblacin, en el perodo especificado. Para calcularla, sustituye el
numerador por el total de defunciones del sexo analizado, y el denominador por el
total de habitantes de ese sexo en el lugar y momento deseados.

= 1000

En nuestro pas, durante 2008 la tasa de mortalidad del sexo femenino fue:
34692
= 1000 6
5550426
Interpretacin: en Per, en 2008 fallecieron como promedio 6 mujeres por cada 1000
fminas.

93 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
Tasa de mortalidad por causa
Anlogamente, puedes conocer el riesgo a que estn sometidos los habitantes de
cierto lugar, en un momento definido, de morir por una causa de muerte dada. Ahora
el numerador est formado por las defunciones debidas a la causa en cuestin,
mientras que el denominador incluye al total de poblacin.


= 1000

En Per, durante 2008 la tasa de mortalidad por enfermedades del corazn fue:
21467
. = 1000 193.
11122308

Interpretacin: en Per, en 2008 fallecieron como promedio 193 personas por


enfermedades del corazn por cada 100 000 habitantes

Tasa de mortalidad infantil


Arribamos a un punto de suma importancia al analizar la situacin de salud de una
comunidad. Este indicador es una especie de diana hacia la cual se dirigen los ojos de
todo aquel que, avezado o no, se tome inters en el estudio de las caractersticas de
una poblacin.
Es un indicador que toma como poblacin expuesta al riesgo a los nacidos vivos en
perodo estudiado, y se calcula de la siguiente forma:
1
= 1000

A partir del triunfo revolucionario, este indicador ha mostrado una tendencia
descendente, llegando a alcanzar en los dos ltimos aos cifras inferiores a 8,
incluyndose de esta forma entre los pases de ms baja tasa a escala mundial. En
2008, la tasa cubana fue:
1070
= 1000
151080
Ello significa que en 2008, en Cuba fallecieron como promedio 7 nios por cada 1000
nacidos vivos.

Este indicador tiene la singularidad de que puede descomponerse en varios


indicadores, que miden con ms especificidad el comportamiento de la mortalidad en
el menor de un ao. Estos componentes son los siguientes:

94 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
1. Tasa de mortalidad neonatal precoz
Al calcular esta tasa conocers el riesgo de morir de los bebs con menos de
siete das de nacidos. Su clculo estriba en sustituir el numerador de la TMI por
las defunciones ocurridas en recin nacidos de menos de siete das en el perodo
y lugar estudiados. En 2008 tuvimos una TMNP de 2.9 por 1000 NV. De este
modo, puedes decir que en Per, durante 2008, fallecieron como promedio 3
nios de menos de 7 das por cada 1000 nacidos vivos.
2. Tasa de mortalidad neonatal tarda
Conforme calculaste el riesgo de muerte de los bebitos menores de siete das,
puedes conocer tambin el de siete en adelante y menores de 28 das, cerrando
as el diapasn en la etapa neonatal de la vida. Slo tienes que sustituir el
numerador de la tasa anterior por las defunciones de nios de 7 - 27 das en la
poblacin de tu inters, durante el perodo que necesites.
Para nuestro pas la TMNT en 2008 fue de 1.4 por cada 1000 nacidos vivos, lo
que quiere decir que en 2008, en Per falleci como promedio 1 nio de 7 a 27
das por cada 1000 nacidos vivos.
3. Tasa de mortalidad posneonatal
Ahora determinars el riesgo de muerte de los nios mayores de 28 das y
menores de un ao. Con slo sustituir el numerador de la TMI por las defunciones
acaecidas en los bebs de 28 das a 11 meses, 29 das y 23:59 horas, habrs
cumplido tu cometido.
El que el denominador, de los tres componentes de la mortalidad infantil, sea el
mismo le imprime a estas tasas una peculiaridad: se puede obtener la mortalidad
infantil mediante la simple suma de sus componentes, o lo que es lo mismo, los
componentes de la mortalidad infantil son sumables.
En Per, durante 2008, tuvimos una TMP de 2.8 por 1000 NV. Dicho sea con
otras palabras: en 2008, en Per fallecieron como promedio 3 nios mayores de
28 das y menores de un ao por cada 1000 nacidos vivos.

Tasa de mortalidad perinatal


Esta es una tasa especial que mide el riesgo de morir en los momentos cercanos al
nacimiento.
Se calcula de la siguiente forma:
+
=
+

95 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
Donde:
DFT: defunciones fetales tardas (edad materna igual o superior a las 28
semanas, o peso fetal de 1000 gramos o ms).
DNP: defunciones neonatales precoces (defunciones en el menor de siete das).
NV: nacidos vivos

Tasa de mortalidad materna


Aqu tienes otro de los indicadores ms celosamente cuidados por todo el personal de
salud, bien sabes de ello. La lgica aspiracin de todo pas interesado realmente en
exhibir indicadores de salud ejemplares, es mantener esta medida en niveles bajos,
juntamente con la tasa de mortalidad infantil, entre otros. Su clculo comprende algo
que puede inducir extraeza: el denominador est formado por los nacidos vivos del
lugar y tiempo escogidos. Al analizarlo con detenimiento vers que resulta lo ms
indicado, ya que brinda una estimacin mejor del riesgo puesto que este indicador
solamente toma en cuenta las defunciones maternas producidas por complicaciones
del embarazo, parto o puerperio (entendido como los 42 das siguientes al parto).


= 1000

La TMM fue de 47.7 por 100 000 NV en 2008 para nuestro pas. Esto quiere decir que
por cada 100 000 nacidos vivos, murieron en promedio 48 mujeres por causas
directamente relacionadas con el embarazo, parto y puerperio durante 2008 en Per.

Tasas de morbilidad
La morbilidad, entendida como el patrn de enfermedades que sufren los habitantes
de alguna regin, puede ser estudiada numricamente mediante las tasas de
morbilidad. Ellas son la tasa de incidencia, la tasa de prevalencia y la tasa de
letalidad.

La tasa de incidencia (TI) mide el riesgo que tiene una persona que habita en un lugar
y tiempo determinados, de contraer o adquirir cierta enfermedad, visto esto en funcin
del tiempo. Por su lado, la tasa de prevalencia (TP) mide el riesgo de tener la
enfermedad, o sea, de estar enfermo; y la tasa de letalidad (TL) expresa la gravedad
de la enfermedad.

96 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
Casos nuevos en lugar y tiempo X
TI = x 10 000
Poblacin total en lugar y tiempo X

Casos nuevos + casos viejos en lugar y tiempo X


TP = x 10 000
Poblacin total en lugar y tiempo X

Fallecidos por enfermedad i en lugar y tiempo X


TL = x 10 000
Enfermos por enfermedad ien lugar y tiempo X

Comparacin de tasas
En ocasiones, pretendemos comparar los riesgos de morir, de enfermar, etc. entre
distintas poblaciones o entre distintas categoras o clases de una variable. Para ello,
lo ms conveniente es utilizar la tipificacin, bien por el mtodo directo o por el
indirecto; tcnicas que no se expondrn en este curso, pues se abordarn en cursos
posteriores. Esta tcnica solo sirve para comparar, sus resultados no miden en modo
alguno el riesgo de ocurrencia de los eventos estudiados en la poblacin

Resumen
En este tema estudiaste que:
MEDIDAS RESUMEN VARIABLES CUALITATIVAS 41
1. Las medidas de resumen para datos cualitativos ms frecuentemente utilizadas
son las razones, las proporciones y las tasas.
2. Cada uno de esos indicadores tiene diferente interpretacin. As, los ms
refinados son las tasas, pues expresan el riesgo de ocurrencia del evento
consignado en su numerador.
3. Debes tener cuidado al calcular las tasas para poblaciones pequeas, por
ejemplo, en el Consultorio Mdico de la Familia, porque suelen ser inestables.
4. Las tasas pueden dividirse en generales y especficas.
5. En el mbito sanitario, las tasas ms usadas son las de natalidad, mortalidad y
morbilidad.

97 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
Ejercicios
Un grupo de investigadores recogi algunos datos relacionados con la poblacin
cubana del ao 2008, con el objetivo de confeccionar indicadores que reflejaran la
situacin del pas.
Debido a un virus informtico, se estrope parte de la informacin almacenada. A
continuacin te mostramos los datos que se pudieron recuperar. A partir de los
mismos, podras ayudarnos a completar las partes faltantes? Para ello, calcula e
interpreta los indicadores solicitados.
Informacin recogida por los investigadores
Nacidos vivos bajo peso: 10 145
Poblacin total: 11 122 308
Nacidos vivos: 151 080
Defunciones totales: 77 558
Total de hombres: 5 571 882
Total de consultas mdicas y estomatolgicas: 100 819 793
Fallecidos de 15 a 49 aos: 10 057
Total de mujeres: 5 550 426
Fallecidos menores de un ao: 1 070
Fallecidos de la provincia Guantnamo: 2 722
Casos diagnosticados por enfermedad meningoccica: 44
Fallecidos mayores de 28 das y menores de 12 meses: 417
Poblacin de Guantnamo: 508 864
Hombres fallecidos por tumores malignos: 9 126
Total de nacidos vivos en Sancti Spritus: 5 642
Mujeres fallecidas: 34 692
Fallecidos menores de 7 das: 435
Poblacin de 15 a 49 aos: 6 117 424
Fallecidos mayores de 7 das y menores de 27 das: 218
Nacidos vivos de la provincia Guantnamo: 7 939

98 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
3.3 Medidas de resumen para variables cuantitativas.
3.3.1 Medidas de Posicin Centrales (Tendencia Central)
Se calcula una medida de tendencia central cuando se necesita un valor nico que
resuma una serie de datos; por ejemplo: si se presentara la informacin de
ingresantes a Universidad en el ao 2012, se puede decir que la edad mediana de los
postulantes fue de 18 aos.

1. La Media Aritmtica
Es la medida de tendencia central con la cual probablemente est usted ms
familiarizado es la media aritmtica; se conoce tambin como media o promedio; se
representa como x y se conoce como "x barra"; la frmula para calcularla es:
1.1. Para Datos Sin Agrupar

media x
x i

Se lee as: la media es igual a la suma de las xs dividido por n.


Ejemplo Datos Sin Agrupar
En un brote de hepatitis A, 6 personas iniciaron sntomas 24 a 31 das despus de la
exposicin. Calcule el promedio del perodo de incubacin en ste brote; los perodos
de incubacin para las personas afectadas (Xi) fueron:
29, 31, 24, 29,30 y 25
Pas Uno Para calcular el numerador sume las observaciones individuales
x = 29+31+24+29+30+25= 168
Paso Dos para calcular el denominador cuente el nmero de las observaciones: n = 6

Paso Tres Para calcular la media divida el numerador sumatoria de las


observaciones) entre el denominador (nmero de las observaciones).

29 31 24 29 30 25 168
media x 28 das
6 6
Entonces, el promedio del perodo de incubacin del brote es 28 das

Aplicacin de la funcin de Excel en la Media Aritmtica Para Datos Sin Agrupar


Se ingresan los datos de los das de incubacin desde la celda A1 hasta la A6 y se la
funcin PROMEDIO(A2:A6)

99 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012

1.2. Para Datos Agrupados


Marca de Clase

Frecuencia absoluta

media x
xini Total de Observaciones
n

Frecuenci
Intervalos Marca de
a
de clases clase xi ni
Absolutas
(Li-1 Li] xi ni
16 27 21,5 3 64,5
27 38 32,5 5 162,5
38 49 43,5 10 435
49 60 54,5 3 163,5
60 71 65,5 8 524
71 82 76,5 7 535,5
82 93 87,5 4 350
Total 40 2235

64,5 162,5 435 163,5 524 535,5 350 2235


media x 55,875
40 40

100 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
Interpretacin: El puntaje promedio en el rendimiento de la lnea de accin
educativa de Lenguaje de una muestra de 40 alumnos es 55,875.

1.3. Propiedades de la Media. Aritmtica.


Sean: x e y : variable
k : constante
M [] : Operador Media Aritmtica.
a) M [k] = k
b) M [x + k] = M[x] + k
c) M[kx] = kM[x]
d) M [x y] = M[x] M [y]
e) M[x - ] = 0
f) f) M ((X M)2) es mnimo si K = X
La media aritmtica es un indicador de posicin sensible a valores extremos.

2. La Mediana (Me)
Otra medida de tendencia central es la mediana; como se ver es especialmente til
cuando los datos estn sesgados.

Mediana significa a la mitad y la mediana es el valor a la mitad de una serie de datos


que han sido colocados en orden. Especficamente, la mediana es el valor que divide
una serie de datos en dos mitades con una mitad de las observaciones mayores que
sta y la otra mitad menores a la mediana.

Para Datos Sin Agrupar

Ejemplo Al tener los siguientes datos de presin arterial sistlicas: 110, 120, 122, 130,
180 Mm. de Hg.
En este ejemplo, hay dos observaciones mayores y dos menores que 122, luego
entonces, la mediana es 122 Mm. de Hg., el valor de la 3 observacin. Al obtener la
media (132) sta sera mayor que 4 de los 5 valores.

Cmo Identificar la Mediana de Datos Individuales

Paso Uno Ordene los datos de menor a mayor o viceversa


Paso Dos Encuentre el rango medio con la siguiente frmula

n 1
101 Mg. Miguel Angel Macetas Hernndez
2
Estadstica General 2012
Rango mediano =

a. Si el nmero de observaciones (n) es impar el rango medio cae en una


observacin.
b. n es par el rango medio cae entre dos observaciones.

Paso Tres Identifique el valor de la mediana

a. Si el rango medio cae en una observacin especfica (n = impar) la mediana es


igual al valor de sta observacin.
b. Si el rango medio cae entre dos observaciones (n = par) la mediana es igual
al promedio (media aritmtica) del valor de estas observaciones.

Ejemplo con Nmero Impar de Observaciones:


n=5 13, 7, 9, 15, 11

1. Ordenar de mayor a menor: 7, 9, 11, 13, 15 o viceversa: 15, 13, 11, 9, 7.


2. Encontrar el rango mediano
n 1 5 1 3
Rango mediano 2= 2

Entonces, el rango medio cae en el valor de la 3 observacin.


3. Identificar el valor de la mediana que es igual al valor de la tercera observacin
n = 11

Ejemplo con nmero par de Observaciones:

n = 6: 15, 7, 13, 9, 10, 11

1. Ordenar los datos 7, 9, 10, 11, 13, 15


2. Encontrar el rango medio
n 1 6 1 3,5
Rango mediano 2= 2

Entonces, el rango medio cae entre el valor de la 3 y la 4 observacin.

102 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
3. Identificar el valor de la mediana que es igual al promedio de la 3 y 4
observacin
11 10
10 ,5
Mediana =2

En contraste con la media, la mediana no est influenciada por valores


extremos.

Aplicacin de la funcin de Excel en la Mediana Para Datos Sin Agrupar

Se ingresan los datos desde la celda A1 hasta la A6 y se la funcin MEDIANA(A2:A6)

Para Datos Agrupados


Para calcular la mediana (Me) a partir de una tabla de frecuencias debe
determinarse las frecuencias absolutas acumuladas N i, que permite conocer hasta
que el valor de la variable o intervalo se tienen acumulado el 50% de n;
Se Calcula con la Siguiente Frmula:

n
2 N j1
Me L ji c j
nj

Donde

103 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
n = nmero total de datos u observaciones
n
Nj = es una Ni inmediata superior a
2
Nj-1 = es una Ni inmediata inferior a
Lj-1 = extremo inferior del Intervalo Mediano
IMe = es el intervalo que corresponde a Nj
nj = es el nj que le corresponde al Intervalo Mediano
Cj = amplitud del intervalo mediano

Ejemplo
Calcular el puntaje de rendimiento mediano en la lnea de accin educativa de
Lenguaje de una muestra de 40 alumnos de un determinado centro educativo
Paso Uno
n 40
Aqu n = 40 luego 20 se compara con los N i se obtiene que 20,
2 2
observando en la tabla este valor no coincide con algn N i, est entre 18 y 21,
n
es decir: 18 < 20 < 21 N j1 Nj
2

Frecuencias
Intervalos de Frecuencia
Absolutas
clases Absolutas
Acumuladas

(Li-1 Li ] ni Ni
I1 16 27 n1 = 3 N1 = 3
I2 27 38 n2 = 5 N2 = 8
I3 38 49 n3 = 10 N3 = 18 Nj-1

IMe= I4 49 60 n4 = 3 N4 = 21 Nj
Lj-1 I5 60 71 n5 = 8 N5 = 29
nj
I6 71 82 n6 = 7 N6 = 36
I7 82 93 n7 = 4 N7 = 40
Total 40
Reemplazar los valores obtenidos en la frmula de Me:

40
2 18
Me 49 11 56,33
3

Me 56,33

104 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
Interpretacin, significa que 20 alumnos tienen calificacin iguales o inferiores a
56,33 puntos, y los 20 alumnos restantes (el otro 50%) tienen una calificacin superior
a 56,33 puntos

3. Moda (Mo) (Valor Modal o Promedio Tpico)


La moda es el valor que ocurre ms frecuentemente en una serie de datos

1.3.1. Para Datos Sin Agrupar


Ejemplo:
a) El conjunto: 0, 0, 1, 1, 1, 1, 2, 2, 2, 3, 4, 6 tiene la Mo = 1
b) El conjunto: 4, 8, 12, 15, 26, 35 no tiene moda
c) El conjunto: 1, 3, 5, 5, 5, 7, 7, 9, 9, 9, 11 tiene dos modas, 5 y 9 es una distribucin
Bimodas.

Aplicacin de la funcin de Excel en la Moda Para Datos Sin Agrupar

Se ingresan los datos desde la celda A2 hasta la A12 y se la funcin


MODA.VARIOS(A2:A12)

1.3.2. Para Datos Agrupados


Cuando los datos se agrupan en una tabla de distribucin de frecuencias, el
modo es el punto medio o marca de clase que contiene la mayor frecuencia.

105 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
Se Calcula con la Siguiente Formula

d1 10 5
Mo L j1 C i Mo 38 11 42,5833
d1 d 2 10 5 10 3

Donde
Lj-1 = Lmite inferior del Intervalo Modal
Cj = Amplitud del intervalo Modal
d1 = nj nj1
d2 = nj nj+1

Ejemplo
Calcular el puntaje de rendimiento ms frecuente en la lnea de accin
educativa de Lenguaje de una muestra de 40 alumnos de un determinado
centro educativo

Frecuencia
Intervalos de Clases
Absolutas
(Li-1 Li ] ni
I1 16 27 n1 = 3
I2 27 38 n2 = 5 nj-1

IMo= I3 38 49 n3 = 10 nj

Lj-1 I4 49 60 n4 = 3 nj+1

I5 60 71 n5 = 8
I6 71 82 n6 = 7
I7 82 93 n7 = 4
Total 40

Reemplazando los valores obtenidos en la formula:


10 5
Mo 38 11 42,5833
10 5 10 3

Interpretacin La Moda indica que la calificacin ms frecuente en los 40


alumnos es 42,5833 puntos, o tambin la mayora de los alumnos tienen una
calificacin aproximados a los 42,5833 puntos.

106 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012

Caractersticas de las Medidas de Posicin Centrales

Media Aritmtica
1. Es una medida totalmente numrica o sea slo puede calcularse en datos de
caractersticas cuantitativas.
2. En su clculo se toman en cuenta todos los valores de la variable.
3. Es lgica desde el punto de vista algebraico.
4. La media aritmtica es altamente afectada por valores extremos.
5. No puede ser calculada en distribuciones de frecuencia que tengan clases
abiertas.
6. La media aritmtica es nica, o sea, un conjunto de datos numricos tiene una
y solo una media aritmtica.

Mediana
1. En su clculo no se incluyen todos los valores de la variable.
2. La Mediana no es afectada por valores extremos.
3. Puede ser calculada en distribuciones de frecuencia con clases abiertas.
4. No es lgica desde el punto de vista algebraico.

Moda
1. En su clculo no se incluyen todos los valores de la variable.
2. El valor de la moda puede ser afectado grandemente por el mtodo de
designacin de los intervalos de clases.
3. No est definida algebraicamente.
4. Puede ser calculada en distribuciones de frecuencia que tengan clases abiertas.
5. No es afectada por valores extremos.

107 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
EJERCICIOS PROPUESTOS
1. Una empresa grande de equipos deportivos est probando el efecto de dos planes
publicitarios sobre las ventas de los ltimos 4 meses. Dadas las ventas que se ven
aqu, cul programa de publicidad parece producir el crecimiento promedio ms
alto en ventas mensuales?

Mes Plan 1 Plan 2


Enero 1657,0 4735,0
Febrero 2008,0 5012,0
Marzo 2267,0 5479,0
Abril 3432,0 5589,0

2. Los estadsticos del programa de Meals on Wheels (comida sobre ruedas), el cual
lleva comidas calientes a enfermos confinados en casa, desean evaluar sus
servicios. El nmero de comidas diarias que suministran aparece en la siguiente
tabla de frecuencia. Calcular la media, mediana y la moda e intrprete.

Nmero de comidas por da Nmero de das

0-5 3

5 - 10 6

10 - 15 5

15 - 20 8

20 - 25 2

25 - 30 3

3. Bill Karl compr 20 acciones a $ 15 cada una, 50 acciones a $20 cada una,100
acciones a $30 cada una y 75 acciones a $35 cada una. Cul es el precio
promedio por accin?.

4. Dado el siguiente cuadro estadstico con ancho de clase constante igual a 20.
Determine la media de los datos.

108 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
Li Ls Xi ni Ni X i ni
880
1950
35 1800
13
200)
4 70

5. En el curso de Estadstica I; se tiene las notas de los alumnos distribuidas segn el


siguiente histograma de frecuencias, entonces la nota promedio del curso es:

16
14
Nmero de Alumnos

12
10
8
6
4
2
0
4 6 8 10 12 14
Notas
6. En una encuesta sobre los ingresos anuales en miles de soles de un grupo de
familias se obtuvo la siguiente informacin:

Li Ls ni
10 30 20
30 50
50 70
70 - 90 20
Adems, x 54 y n2 / n3 1 / 5 , calcular el nmero de familias con ingreso no
menos de 50 mil soles.

7. Dada la siguiente distribucin de frecuencias, calcular el valor de n sabiendo que


la moda es 60 y pertenece al tercer intervalo.

Li Ls ni
16 32 6

109 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
32 48 n
48 64 8
64 80 3n
80 - 96 3

8. Dada la siguiente distribucin de frecuencias, calcular el valor de n sabiendo que



la mediana vale 61.6 y que pertenece al quinto intervalo.

Li Ls ni
20 30 3
30 40 1
40 50 2
50 60 6
60 70 n

9. El salario promedio mensual pagado a los trabajadores de una compaa es de 200


dlares. Los salarios promedios mensuales pagados a hombres y mujeres de la
compaa son 210 y 150 respectivamente. Determinar el porcentaje de hombres y
mujeres que trabajan en la compaa.

10. Las ganancias diarias de los establecimientos de un centro comercial se presentan


en una tabla de frecuencias con 6 intervalos de clase y se sabe que: la mnima
ganancia es de $6, el rango es 36, el promedio de ganancias diarias es $25.14, el
50% de los establecimientos ganan ms de 25.58 dlares diarios, H2=0.15,
N2=120, h3=0.25, H5=0.93, n4=304, n2=2n1. Reconstruir la distribucin de todas las
frecuencias y hallar la ganancia ms frecuente y la ganancia promedio.

11. Una compaa minera tiene 100 trabajadores. Para los nombrados el haber
mximo es 450 dlares y el mnimo 60 dlares. Hay un 5% de eventuales (en
prueba) que trabajan ad-honorem o perciben compensaciones inferiores a $60.
Quince trabajadores nombrados perciben haberes inferiores a $250 y el 85% ganan
haberes inferiores a $400. Con esta informacin, calcule las medidas de tendencia
central posibles.

110 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
12. La siguiente distribucin muestra la produccin diaria de un pozo de petrleo (en
barriles) durante n das. Halle la medida de tendencia central ms adecuada y
explique por qu su uso.

Produccin Porcentaje
Menos de 206 20 %
206 214 25%
214 222 18%
222 230 15%
230 238 13%
Ms de 238 9%

13. Un grupo de 200 estudiantes con estatura inedia de 60.96 pulg. se divide en dos
grupos, un grupo con una estatura media de 63.4 pulg. y el otro con 57.3 pulg.
Cuntos estudiantes hay en cada grupo?.

14. En una clase hay 35 estudiantes varones con una edad media de 17. 5 aos y 15
estudiantes mujeres las que en promedio son 12% ms Jvenes. Cul es la edad
media de la clase?.

15. Las temperaturas registradas en una ciudad, en grados Fahrenheit (F), fueron: 51,
60, 58, 62, 57, 49, 52, 62, 61 y 63. Determinar la Media en grados centgrados (C)
sabiendo que: C=(5/9)(F-32).

16. De una muestra de tamao tres se sabe: la suma de los cubos de las tres
observaciones es 1971, la media aritmtica es 7 y la mediana es 6. Calcular el
valor de cada una de las observaciones.

17. Cien estudiantes divididos en cuatro grupos A, B, C y D dan un examen y obtienen


un promedio general de 72 (calificacin centesimal). Los puntajes medios de los
grupos A, B, C son 75, 62 , 80, respectivamente. Los registros del grupo D se
extraviaron; pero se sabe que en el grupo A estn el 40% del total de alumnos, en
el grupo B un cuarto del total, en el grupo C haban 15 alumnos ms que en el
grupo D. Determinar el promedio del grupo D.

111 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
18. En una empresa el sueldo promedio por trabajador es de 360 dlares mensuales,
los trabajadores manuales constituyen el 40% del total y reciben el del monto
dela planilla, cunto recibe en promedio cada trabajador manual?.

19. Los costos de fabricacin, en soles, de diez objetos son los siguientes: 9.35, 9.46,
9.20, 9.80, 9.77, 9.00, 9.99, 9.36, 9.50, 9.60, si el precio de venta de cada objeto es
3 veces su costo de fabricacin menos 5 soles, calcular la utilidad media por objeto.

20. De las edades de cuatro personas, se sabe que la media es igual a 24 aos, la
mediana es 23 y la moda es 22. Encuentre las edades de las cuatro personas.

21. Para calcular el suministro de agua que una ciudad requiere mensualmente, se
escogen 15 familias de la ciudad, resultando los siguientes consumos en metros
cbicos; 11.2, 21.5, 16.4, 19.7, 14.6, 16.9, 32.2, 18.2, 13.1. 23.8, 18.3, 15.5, 18.8,
22.7, 14.0. Si en la ciudad hay 5,000 familias, cuntos metros cbicos de agua se
requieren mensualmente si el consumo promedio por familia permanece igual?.

22. El sueldo promedio de 200 empleados de una empresa es S/400. Se proponen dos
alternativas de aumento: a) S/. 75 a cada uno, b) 15% de su sueldo ms 10 soles a
cada uno. Si la empresa dispone a lo ms de S/. 94,000 para pagar sueldos, cul
alternativa es ms conveniente?.

23. Al calcular la media de 125 datos, result 42. Un chequeo posterior mostr que en
lugar del valor 12.4 se introdujo 124. Corregir la media.

24. De una central telefnica salieron 70 llamadas de menos de 3 minutos


promediando 2.3 minutos, 40 llamadas de menos de 10 minutos pero no menos de
3 minutos, promediando 6.4 minutos, y 10 llamadas de al menos 10 minutos
promediando 15 minutos. Calcular la duracin promedio de todas las llamadas.

25. Cuatro fbricas A, B, C y D, producen un mismo objeto. La fbrica B produce el


doble de C, la D 10% menos que la C y la A el 60% menos que la B. Los costos de
produccin (en dlares) por unidad de estas fbricas son respectivamente: 0.2, 0.3,
0,2, y 0.5. Calcular el precio medio de venta si se quiere ganar el 20% por unidad.

26. El sueldo medio de los obreros de una fbrica es de $286.


112 Mg. Miguel Angel Macetas Hernndez
Estadstica General 2012
a) Que porcentajes de hombres y mujeres trabajan en la fbrica si sus sueldos
medios respectivos son $300 y $260?.

b) Si el 60% de los obreros tienen menos de 30 aos y percibe el 20% del total de
los sueldos, cunto es el sueldo medio de los obreros de al menos 30 aos?

27. En una empresa donde el sueldo medio es de $400 se incrementa un personal


igual al 25% del ya existente con un sueldo medio igual al 60% de los antiguos. Si 3
meses ms tarde se incrementan cada sueldo en 20%, ms 30$, cunto es el
nuevo salario medio?.

28. Al tabular las calificaciones de un examen se obtuvieron las siguientes notas: 07,
08, 09, 10, 11, 12, 13, 14, 15, 16, 17 y las frecuencias del nmero de alumnos
respectivas: 1, 1, 1, 1, 1, 6, 8, 16, 18, 20, 2. Cunto es la media, la mediana y la
moda de las notas?, qu valor escogera como el promedio?.

29. Los sueldos en una empresa varan de $300 a $800 distribuidos en forma simtrica
en 5 intervalos de igual amplitud, con el 15%, 20%, y 30% de casos en el primer,
segundo y tercer intervalo respectivamente. Calcule los diferentes indicadores de
tendencia central.

113 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
4. Media Geomtrica: X G , G
La media geomtrica proporciona una medida precisa de un cambio porcentual
promedio en una serie de nmeros.
Se utiliza con ms frecuencia para calcular la tasa de crecimiento porcentual
promedio de series de datos, a travs del tiempo.
Es una medida de tendencia central por lo general menor que la media aritmtica
salvo en el extrao caso en que todos los incrementos porcentuales sean iguales,
entonces las dos medias sern iguales.
Se le define como la raz ensima del producto de n valores. Cuando los datos
son bastantes o cantidades grandes, para facilitar el clculo se lo debe simplificar
pero sin alterar su naturaleza, para lo cual se puede utilizar los logaritmos de base
10.
CLCULO DE LA MEDIA GEOMTRICA:
a) Datos Originales:
1
n
X G n x1 , x2 ,...xn Xi
n

i 1
b) Datos agrupados
l
m
. Xi ni
n
X G x , x ...x
n n1
1
n2
2
nm
m
i 1
Aplicando logaritmos tenemos:

1 m
XG ni log Xi log Xi
n i 1
Entonces:

X G 10 log x
La media geomtrica se utiliza los datos tienen crecimiento geomtrico: poblacin, montos de
capital, produccin
1.3.3. Propiedad:
XG < X

114 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012

Ejemplo
La media geomtrica es til en el clculo de tasas de crecimiento; por ejemplo, si el
crecimiento de las ventas en un pequeo negocio son 3%, 4%,8%,9% y 10%, hallar la media
de crecimiento.
5
= (3)(4)(8)(9)(10) = 6.128
Respuesta: 6.128%

Utilizando logaritmo
3 + 4 + 8 + 9 + 10 3.9365
= = = 0.7873
5 5

= 0.7873

= 6.128

Empleando Excel se calcula insertando la funcin MEDIA.GEOM.

115 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
Calcular la tasa de crecimiento promedio a la que ha variado las ventas de cierto producto
con base a la siguiente tabla:

Mes Enero Febrero Marzo Abril Mayo Junio

Ventas 500 550 600 700 800 850

Solucin:
Es necesario calcular el porcentaje que las ventas de cada mes representan respecto de los
obtenidos el mes anterior.

Porcentaje del
Mes Ventas
mes anterior
Enero 500
Febrero 550 550/500=1,100
Marzo 600 600/550=1,091
Abril 700 700/600=1,167
Mayo 800 800/700=1,143
Junio 850 850/800=1,063
Calculando la media geomtrica se obtiene:

5
= (1100)(1091)(1167)(1143)(1063) = 1.112

Restando 1 para convertirlo a un incremento mensual promedio da 1,112-1 =0,112, o un


incremento promedio de 11,2% para el perodo de 6 meses.

Comprobacin:

Mes Ventas Ventas calculadas con G


Enero 500
Febrero 550 500 x 1.112 = 556,000
Marzo 600 556 x 1.112 = 618,272
Abril 700 618,272 x 1.112 = 687.518
Mayo 800 687,518 x 1,112 = 764.52
Junio 850 764.52 x 1.112 = 850.146

Se puede observar que el valor de 850.146 calculado con la media geomtrica es


semejante al valor de venta real de 850, por lo tanto el valor calculado para la media
geomtrica est correcto.

116 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
Para Datos Agrupados en Tablas de Frecuencias
Se emplea la siguiente ecuacin:

=

Donde:
ni = frecuencia absoluta de cada dato xi

Ejemplo
Calcular la media geomtrica para las siguientes calificaciones de Estadstica:

xi ni
4 5
6 8
8 9
9 10
10 8
Solucin:
Se llena la siguiente tabla, realizando los clculos respectivos:

xi ni log x i log x i ni

4 5 0.602 3.010
6 8 0.778 6.225
8 9 0.903 8.128
9 10 0.954 9.542
10 8 1.000 8.000
Total 40 34.906

Se aplica la siguiente ecuacin para obtener la respuesta.


34.906
Log G = = 0.873
40

G = antilog 0.873 = 7.458

117 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
5. Media Armnica: X H , H
La media armnica se define como el recproco de la media aritmtica de los
recprocos

PROPIEDADES

Es un promedio que se utiliza para el clculo del costo promedio y todo tipo de variables
expresadas en tasas o porcentajes. como por ejemplo: velocidad/distancia,
productividad/tiempo, etc
La media armnica no est definida en el caso de la existencia en el conjunto de
valores nulos.
Cuando la unidad constante o unidad de evaluacin es igual a la unidad del numerador
de una razn,
se usa el promedio armnico, y si es igual a la unidad del denominador se usa el
promedio aritmtico.

CLCULO DE LA MEDIA ARMNICA:


a) Datos Originales:
n
XH n
1
Xi
i 1

Ejemplo:
La velocidad de produccin de azcar de tres mquinas procesadoras son 0,5, 0,3 y 0,4
minutos por kilogramo. Hallar el tiempo promedio de produccin despus de una jornada de
4800 minutos del proceso

Solucin:
Como en la razn minutos/kilogramos (min/kg) cada mquina trabaja 4800 min, la razn
contante es el tiempo de trabajo (4800 min), es decir la contante es la unidad del numerador,
por lo tanto se debe emplear el promedio armnico
3
= = 0.383
1 1 1
+ +
0.5 0.3 0.4

118 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
Empleando Excel se calcula insertando la funcin MEDIA.ARMO

b) Datos Agrupados:

Se emplea cualquiera de las siguientes ecuacion


n
XH n
ni

i 1 Xi

Propiedad:
XH < XG < X

Ejemplo:
En la siguiente tabla se presentan los datos sobre el tiempo en horas que se demoran en
realizar la misma obra determinados obreros. Calcular el tiempo promedio que se demora en
realizar la obra un obrero tipo (un obrero promedio).
Tiempo Obreros
4 4
5 5
6 7
7 2
9 2

119 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
20 20
= = = 5.44
4 5 7 2 2 463
+ + + +
4 5 6 7 9 126
Para Datos Agrupados en Intervalos
Se emplea la siguiente ecuacin
n
XH n
ni

i 1 Xi

Ejemplo:

En la siguiente tabla se presentan los datos sobre el tiempo en minutos que se demoran
para resolver una prueba de Estadstica determinados estudiantes. Calcular el tiempo
promedio que se demora en resolver la prueba un estudiante tipo.

Tiempo Estudiantes
[40-50) 4
[50-60) 8
[60-70) 10
[70-80) 7
[80-90] 11

Solucin:
Realizando los clculos respectivos se obtiene:

ni xi ni/xi
[40-50) 4 45 0,089
[50-60) 8 55 0,145
[60-70) 10 65 0,154
[70-80) 7 75 0,093
[80-90] 11 85 0,129
Total 40 0,611

Aplicado la ecuacin se obtiene:

40
= = 65,47
0.611

120 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
IV. CAPITULO Estadgrafos de Tendencia No central

4.1. Estadgrafos de Tendencia No central


La medida de posicin no central son valores cuyas posiciones en las series ordenadas
de los datos permiten dividir a estos en grupos, cada grupo contiene igual nmero
(porcentaje). A estas medidas se conocen con el nombre genrico de cuantiles. Los
cuantiles ms importantes son los cuartiles

A. Los Cuartiles
Para Datos No Agrupados
La posicin o ubicacin de los cuartiles se encuentra aplicando la siguiente ecuacin:

= +
[ ]

Donde
n = Nmero total de datos
K = Nmero del cuartil
Ejemplo
Encuentre los cuartiles dada la siguiente distribucin, y represntelos grficamente
mediante un diagrama de caja y bigotes: 6, 9, 9, 12, 12, 12, 15 y 17
Solucin:
Para calcular los cuartiles se ordena los datos de menor a mayor

6 9 9 12 12 12 15 17
1 2 3 4 5 6 7 8
Aplicando la ecuacin para el cuartil uno se obtiene:
= ()()+ = .
[ ]

Como la posicin del cuartil 1 es 2.5, su valor es el promedio de los datos segundo y
tercero
+ +
= . = = =

O tambin la posicin 2.5 dice que el cuartil 1 est ubicado al 50% del trayecto
comprendido entre el segundo dato, que es 9 y el tercer dato que es 9, es decir, Q1=
9+0.5 (9-9) = 9
Interpretacin: Este resultado indica que el 25% de los datos es inferior a 9

121 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012

En Excel se calcula insertando la funcin CUARTIL.INC

Aplicando la ecuacin para el cuartil dos se obtiene:

+ +
= ()()+ = . = = =
[ ]
O tambin la posicin 4.5 dice que el cuartil 2 est ubicado al 50% del trayecto
comprendido entre el cuarto dato, que es 12 y el quinto dato que tambin es 12, es
decir,
Q2= 12+0,5(12-12) = 12
Interpretacin: Este resultado indica que el 50% de los datos es inferior a 12
Aplicando la ecuacin para el cuartil tres se obtiene:
+ +
= ()()+ = . = = = .
[

]
O tambin la posicin 6,5 dice que el cuartil 2 est ubicado al 50% del trayecto
comprendido entre el doceavo dato, que es 12 y el quinceavo dato que 15, es decir,
Q3= 12+0,5(15-12)

Q3= 12+0.5 (3)=12+1,5=13,5


Interpretacin: Este resultado indica que el 75% de los datos es inferior a 13,5

122 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
B. Para elaborar un diagrama de caja y bigotes es necesario saber:
Un diagrama de caja y bigotes es una representacin grfica que ayuda a visualizar
una distribucin de datos: caja desde Q1 a Q3 (50% de los datos), y bigotes el
recorrido (distancia desde valor mnimo hasta el valor mximo).
Para elaborar un diagrama de caja se procede de la siguiente manera:

a) Se marca los valores de la serie de datos sobre el eje horizontal o vertical.


b) Se ubica sobre el eje el valor mnimo, primer cuartil, mediana o segundo cuartil,
tercer cuartil y el valor mximo.
c) Se construye un rectngulo (caja) paralelo al eje, de longitud desde Q 1 a Q3 y
anchura arbitraria.

De acuerdo al ejemplo ilustrativo se tiene:


Valor mnimo = 6
Q1 = 9
Q2 = 12
Q3 = 13,5
Valor mximo = 17

123 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
Datos agrupados
Los cuartiles son estadgrafos de posicin que dividen al total de las observaciones,
debidamente ordenados o tabulados, en cuatro partes de igual tamao.
Para calcular los cuartiles se utiliza la siguiente formula
jn
4 N J 1
Q j L i 1 C j
nj

Donde
Lj-1 = Lmite inferior del Intervalo del Cuartil
Cj = Amplitud del intervalo Cuartill
j = El nmero de Cuartil j = 1, 2 y 3
n = Nmero total de observaciones o datos.
Nj = Es un inmediato superior a jn
4
Nj-1 = Es una Ni inmediata inferior a jn
4
nj = Es el nj que le corresponde al Intervalo

a) Primer Cuartil (Q1)


Calcular el puntaje de rendimiento mediano en la lnea de accin educativa de
Lenguaje de una muestra de 40 alumnos de un determinado centro educativo

Paso Uno
jn

1x 40 10
Aqu n = 40 y j =1 luego 4 4 se compara con los N i se obtiene que 10,
observando
En la tabla este valor no coincide con algn N i, est entre 8 y 10, es decir: 8 < 10 <
18

Frecuencias
Intervalos de Frecuencia
Absolutas
clases Absolutas
Acumuladas

(Li-1 Li ] ni Ni
I1 16 27 n1 = 3 N1 = 3
Nj-1
N2 = 8
I2 27 38 n2 = 5
Nj
IQ1= I3 38 49 n3 = 10 N3 = 18
nj
Lj-1 I4 49 60 n4 = 3 N4 = 21

I5 60 71 n5 = 8 N5 = 29

I6 71 82 n6 = 7 N6 = 36

I7 82 93 n7 = 4 N7 = 40
Total 40
124 Mg. Miguel Angel Macetas Hernndez
Estadstica General 2012

Reemplazando los valores obtenidos en la frmula:


10 8
Q1 38 11 40,2
10

Interpretacin Que el 25% del total de alumnos, es decir 10 de ellos tienen una puntuacin
inferior o igual a 40,2 puntos, y los 30 restantes, o sea el 75% de trabajadores, tienen un
puntaje superior a 40,2 puntos.

b) Segundo Cuartil (Q2)


Calcular el puntaje de rendimiento mediano en la lnea de accin educativa de
Lenguaje de una muestra de 40 alumnos de un determinado centro educativo
Paso Uno
Aqu n = 40 y j =2 luego jn

2x 40 20 se compara con los N i se obtiene que 20,
4 4
observando

En la tabla este valor no coincide con algn Ni, est entre 18 y 21, es decir:
18 < 20 < 21

Frecuencias
Intervalos de Frecuencia
Absolutas
clases Absolutas
Acumuladas

(Li-1 Li ] ni Ni

I1 16 27 n1 = 3 N1 = 3

I2 27 38 n2 = 5 N2 = 8

I3 38 49 n3 = 10 N3 = 18 Nj-1

IQ2= I4 49 60 n4 = 3 N4 = 21 Nj

Lj-1 I5 60 71 n5 = 8 N5 = 29
nj
I6 71 82 n6 = 7 N6 = 36

I7 82 93 n7 = 4 N7 = 40

Total 40

Reemplazando los valores obtenidos en la frmula:


2x 40
4 18
Q 49 11 56,33
2
3

125 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012

Interpretacin Que el 50% del total de alumnos, es decir 20 de ellos tienen una puntuacin
inferior o igual a 56,33 puntos, y los 20 restantes, o sea el 50% de trabajadores, tienen un
puntaje superior a 56,33 puntos.

c) Tercer Cuartil (Q3)


Calcular el puntaje de rendimiento mediano en la lnea de accin educativa de
Lenguaje de una muestra de 40 alumnos de un determinado centro educativo
jn

3 x 40 30
Paso Uno 4 4

Aqu n = 40 y j =3 luego se compara con los N i se obtiene que

30, observando en la tabla este valor no coincide con algn N i, est entre 29 y 36, es
decir:
29 < 30 < 36

Frecuencias
Intervalos de Frecuencia
Absolutas
clases Absolutas
Acumuladas

(Li-1 Li ] ni Ni

I1 16 27 n1 = 3 N1 = 3

I2 27 38 n2 = 5 N2 = 8

I3 38 49 n3 = 10 N3 = 18

I4 49 60 n4 = 3 N4 = 21

I5 60 71 n5 = 8 N5 = 29 Nj-1

IQ3= I6 71 82 n6 = 7 N6 = 36 Nj
Lj-1 nj
I7 82 93 n7 = 4 N7 = 40
Total 40

Reemplazando los valores obtenidos en la frmula:


3 x 40
4 29
Q 71 11 39,57
3
7

Interpretacin Que el 75% del total de alumnos, es decir 30 de ellos tienen una puntuacin
inferior o igual a 39,57 puntos, y los 10 restantes, o sea el 25% de trabajadores, tienen un
puntaje superior a 39,57 puntos.

126 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
C. Deciles
Definicin
Son cada uno de los 9 valores D 1, D2, D3, D4, D5, D6, D7, D8, D9 que dividen a la
atribucin de los datos 10 partes iguales.
El primer decil es igual al dcimo percentil (D 1=P1), el segundo decil es igual a
veinteavo percentil (D2=P20), y as sucesivamente.

Para Datos No Agrupados


La posicin o ubicacin de los deciles se encuentra aplicando la siguiente ecuacin

= +
[ ]

Donde
n = Nmero total de datos
K = Nmero del cuartil
Ejemplo

Ejemplo:
Calcular el quinto decil de la siguiente distribucin: 6, 9, 9, 12, 12, 12, 15 y 17

Solucin:
Para calcular los deciles se ordena los datos de menor a mayor.

6 9 9 12 12 12 15 17
1 2 3 4 5 6 7 8
Aplicando la ecuacin para el quinto decil se obtiene:
+ +
= ()()+ = . = = =
[ ]
O tambin la posicin 4,5 dice que el decil 5 est ubicado al 50% del trayecto
comprendido entre el cuarto dato, que es 12 y el quinto dato que tambin es 12, es
decir,
D5= 12+0,5(12-12) = 12
En Excel se calcula de la siguiente manera:

127 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
Como D5 es igual a P50 se introduce la funcin PERCENTIL.INC

Datos Agrupados en Tablas de Frecuencia


Se emplea la misma ecuacin utilizada en el clculo de los deciles para datos sin
agrupar.
Para Datos Agrupados en Intervalos
Se emplea la siguiente ecuacin:
jn
10 N J 1
D j Li 1 C j
nj

Donde
Lj-1 = Lmite inferior del Intervalo de clase del decil
Cj = Amplitud del intervalo Decil
j = El nmero de Decil j = 1, 2, 3,,9
n = Nmero total de observaciones o datos.
Nj = Es un inmediato superior a jn
10
Nj-1 = Es una Ni inmediata inferior a jn
10
nj = Es el nj que le corresponde al Intervalo

128 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
D. Percentiles o Centiles
Son cada uno de los 99 valores P1, P2, P3,..P99 que dividen atribucin de los
datos en 100 partes iguales.
Datos No Agrupados
La posicin o ubicacin de los percentiles se encuentra aplicando la siguiente
ecuacin:

= +
[ ]

Donde:
n = nmero total de datos
k = nmero del percentil

Ejemplo:
Calcular los percentiles de orden 20 y 33 del peso de diez personas que pesan (en
kg) 80, 78, 65, 73, 65, 67, 72, 68, 70 y 72
Solucin:
Se ordena los datos de menor a mayor se tiene:

65 65 67 68 70 72 72 73 78 80

x1 x2 x3 x4 x5 x6 x7 x8 x9 x10
1) Clculo del percentil de orden 20 se obtiene:
+ +
= ()()+ = . = =
[ ]
En Excel se obtiene un valor aproximado insertando la funcin PERCENTIL.INC

129 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
Clculo del percentil de orden 33 se obtiene:
+ +
= ()()+ = . = = = ,
[ ]
Datos Agrupados en Tablas de Frecuencia
Se emplea la misma ecuacin utilizada en el clculo de los percentiles para datos sin
agrupar.
c) Para Datos Agrupados en Intervalos
Se emplea la siguiente ecuacin:
jn
100 N J 1
Pj Li 1 C j
nj

Donde
Lj-1 = Lmite inferior del Intervalo de clase del Percentil
Cj = Amplitud del intervalo Percentil
j = El nmero de Percentil j = 1, 2, 3,,99
n = Nmero total de observaciones o datos.
Nj = Es un inmediato superior a jn
100

Nj-1 = Es una Ni inmediata inferior a jn


100

nj = Es el nj que le corresponde al Intervalo

130 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
EJERCICIOS
1. Las edades de 50 de los directores ejecutivos de las mejores corporaciones de la
nacin reportadas aparecen en la siguiente tabla de frecuencias. Calcule e
interprete la media, la mediana y la moda. Adems, calcule e interprete: Q 1, Q2, D10,
D60, P15, P90.

Edades Frecuencias

50 y menos de 55 8

55 y menos de 60 13

60 y menos de 65 15

65 y menos de 70 10

70 y menos de 75 3

75 y menos de 80 1

2. La siguiente informacin corresponde al consumo mensual en combustible


destinado a calefaccin, expresado en miles de $, en una muestra aleatoria de
hogares de un barrio de Santiago, durante los meses de invierno:

Consumo N de casos
($miles)
46 17
68 26
8 10 14
10 12 9
12 14 11

a. Qu consumo deja bajo s al 25% de los consumos ms bajos?


b. Qu consumo deja sobre s al 15% de los consumos ms altos?
3. La siguiente distribucin corresponde a la recaudacin de impuestos de 40
contribuyentes. (Recaudacin de impuestos en miles de pesos).

a) Cul es la recaudacin correspondiente a


[L i 1 L i ] xi ni
cuartil 1? Interprtela.
50- 70 60 2
b) Cul es la recaudacin correspondiente al
70- 90 80 15
90 - 110 100 8 Percentil 65? Interprtela.
110 - 130 120 12 c) Bajo qu recaudacin estn el 20% de las
130 150 140 3 recaudaciones menores?
d) Sobre qu recaudacin est el 20% de las
131 Mg. Miguel Angel Macetas Hernndez
recaudaciones mayores?
e) Qu orden de percentil representa la
Estadstica General 2012

V. CAPITULO Medidas de Dispersin

5.1. Medidas de dispersin


Las medidas de dispersin permiten calcularla representatividad de una medida de
posicin, para lo cual ser preciso cuantificar la distancia de los diferentes valores de
la distribucin respecto a dicha medida. A tal distancia es a lo que, en trminos
estadsticos, denominaremos variabilidad o dispersin de la distribucin. Las medidas
de dispersin tienen como finalidad estudiar hasta qu punto, para una determinada
distribucin de frecuencias, las medidas de tendencia central o de posicin son
representativas como sntesis de toda la informacin de la distribucin. Medir la
representatividad de una medida de posicin equivale a cuantificar la separacin de
los valores de la distribucin respecto a dicha medida. Entre los estadgrafos de
Dispersin de mayor uso se tiene:
A. Recorrido o rango (R)
El recorrido do un conjunto de observaciones es simplemente la diferencia entre el
mayor y menor valor de la variable.

En datos no agrupados:

R = Xmax Xmin

B. Recorrido Semi Cuartil (Q)


La desviacin cuartil de un conjunto de datos est definido por

Q3 Q1
Q
2

Donde Q1 y Q3 son el primer y tercer cuartil de los datos. A veces se usa el


"Recorrido Intercuartil Q3 Q1". El recorrido semi-intercuartil o desviacin cuartil,
da una idea de la dispersin del 50% de los datos centrales.

C. Varianza (s2)
Es el estadgrafo de dispersin ms importante. y expresa el grado de dispersin
de las observaciones respecto a la media aritmtica. Se denota por s 2; V(X); V(Y);
2; etc.
La varianza se define como:
"La varianza es la media o promedio del cuadrado de las desviaciones de la
variable respecto a su media".
132 Mg. Miguel Angel Macetas Hernndez
Estadstica General 2012
La expresin de la definicin, tambin se escribe:

x x n xn
2

x n
2

s 2
i i 2 i i

n 1 s2
i i
n
n 1

Propiedades de la varianza:
Sean:
X : variables
k : constante
V( ): Operador varianza
a) V (X) 0
b) V (k) = 0
c) V (x + k) = V(x)
d) V (kx) = K2 V(X)
Si tenemos una muestra tamao n la dividimos en r sub muestras determinando en
cada una de ellas sus respectivas medias, entonces la media total se determina por la
formula siguiente:
r n

S 2 ni (X 1 X t )ni
XT i 1
i 1

n n

Intravarianza + Intervarianza

[Li-1 Li) Xi ni xi n i x i2ni


0,2 7,2 3,7 3 11,1 41,07
7,2 14,2 10,7 5 53,5 572,45
14,2 21,2 17,7 8 141,6 2506,32
21,2 28,2 24,7 5 123,5 3050,45
28,2 35,2 31,7 10 317 10048,9
35,2 42,2 38,7 4 154,8 5990,76
42,2 49,2 45,7 5 228,5 10442,45
Total 40 1030 32652,4

32652,4
1030
2

s2 40 157,1769
40 1

133 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
D. Desviacin Estndar o Tpica (s)
La desviacin estndar o tpica, se define como la raz cuadrada de la varianza

V X s

157,1769 12,5370221
Es uno de los estadgrafos de dispersin de mayor uso, en si cual las unidades de
la variable ya no estn elevadas al cuadrado. La desviacin estndar, al igual que
la varianza, es no negativa (s 0), puesto que es la raz cuadrada positiva de la
varianza. A mayor dispersin le corresponder una mayor desviacin estndar.

NOTA: En general, los estadgrafos de dispersin se usa para comparar dos o ms


distribuciones o poblaciones. A mayor dispersin o heterogeneidad entre los
valores o elementos de una poblacin, le corresponde un valor mayor para
el estadgrafo de dispersin.
E. Coeficiente de Variacin (CV)
Est definido por la expresin:
S
CV 100
x

El valor se expresa en trminos porcentuales. Una regla emprica, cuando el CV


< 33% los datos no presentan dispersin en los datos recolectados los datos
son ms homogneos

CV
12,537100 48,68746446%
25,75

Datos presentan dispersin


0%<CV<5%, Altamente representativa.
5%<CV<10%, Representativa de su serie.
10%<CV<15%, moderadamente representativa
15%<CV<30%, Bajo grado de representatividad.
CV>30%, No tiene ningn grado de representatividad

134 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
VI. CAPITULO Estadgrafos de Deformacin

Asimetra.-
Es el grado de deformacin de la curva representativa de una distribucin de frecuencias
con respecto a la vertical que pasa por la abscisa de la media aritmtica; se mide a
travs del Coeficiente de Asimetra.
A. Relacin Entre La Media, Mediana y Moda
La distribucin de frecuencias de un conjunto de datos puede ser simtrica o
asimtrica.

B. Distribucin Simtrica
Una distribucin es simtrica cuando su grafica semeja una de las tres curvas:

Me = X = Mo Mo X = Me Mo X = Me

Curva hipottica Curva hipottica en Curva hipottica


Normal U Rectangular
Curva Unimodal Curva Bimodal Curva sin moda
Me = X = Mo X = Me X = Me

Distribucin Positivamente Asimtrica


Es una distribucin donde los valores extremos son observaciones mayores. La
grafica es semejante a la siguiente curva hipottica.

Curva Positivamente Asimtrica (o Curva

con Sesgo Positivo).

Curva Unimodal

Mo < Me < X
Mo X
Me
Distribucin Negativa Asimtrica
Es una distribucin donde los valores extremos son observaciones menores. La
grafica presenta una prolongacin hacia la izquierda, como la siguiente curva
hipottica. Curva Negativa Asimtrica (o Curva con

Sesgo Negativo).

Curva Unimodal

X
Mo Mo > Me > X

135 Mg. Miguel Angel MacetasMe


Hernndez
Estadstica General 2012
Relacin Emperica Entre Media, Mediana y Moda
Cuando la distribucin es casi simtrica, se puede utilizar la frmula de la moda
emprica dad por: Moda = 3(Mediana) 2(Media)

Mo = 3 Me 2 X

C. Importancia de la Asimetra.-
El conocimiento de la asimetra es importante por el hecho de que la teora estadstica
se basa a menudo en el supuesto de una distribucin normal. Por lo tanto una medida
de asimetra de una distribucin es necesario para preservarnos de las consecuencias
de esta suposicin (La condicin necesaria de una distribucin normal es que sea
simtrica).

D. Coeficiente de Asimetra.
Consideramos varias frmulas para el clculo de la medida de asimetra:
Coeficiente de Asimetra en base a Momentos.

1 ( xi - x ) ni
m 3

AS =
n s3

Primero y segundo coeficiente de asimetra de PEARSON


X Mo
A. AS1 ; Denominado primer coeficiente de Parson.
S
3(X Me)
B. AS 2 ; Denominado segundo coeficiente de Pearson.
S
Coeficiente de Asimetra cuartlico o de ARTHUR BOWLEY
Q 3 2Q 2 Q 1
AS
Q 3 Q1
Decisin:

As=0, entonces la distribucin es simtrica.


As<0, entonces la distribucin es asimtrica (-)
As>0, entonces la distribucin es asimtrica (+)

E. Kurtosis o Apuntamiento.-

136 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
Es la mayor o menor altura de la curva representativa de una distribucin de
frecuencias en el punto o abscisa correspondiente a la media aritmtica.

137 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012

D. Leptocrtica

D. Mesocrtica (Normal )

D. Platicrtica

KURTOSIS EN FUNCIN DE MOMENTOS:


( -x )
m 4
K = 1 xi 4 ni = M 42 ; x : media
ns M2
Decisin:
K=3, Entonces la distribucin posee una curva mesocrtica (Normal).
K<3, Entonces la distribucin posee una curva platicrtica.
K>3, Entonces la distribucin posee una curva leptocrtica.

KURTOSIS EN FUNCIN DE CUARTILES Y PERCENTILES.


Q3 Q1
K
2P90 P10

Donde:
Los percentil P90 y P10 se calcula con la Lj-1=Limite inferior del Intervalo del Percentil
siguiente frmula:
Cj =Amplitud del intervalo Percentilico
rn
100 N J 1 r = El nmero de Percentill r = 1,2,3,,99
Pr L i 1 C j n = Nmero total de observaciones o datos.
nj
Nj = Es un inmediato superior a jn
100

Nj-1= Es una Ni inmediata inferior a


Decisin:
K=0.263, la distribucin es mesocrtica.
nj = s el nj que le corresponde al Intervalo

K<0.263, la distribucin es platicrtica.


K>0.263, la distribucin es leptocrtica.

138 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
Ejemplo. Calcular el grado de asimetra y kurtosis de la distribucin del nivel de glucosa de los
60 varones adultos evaluados. Los clculos son organizados en la tabla, de modo
que reemplazando datos en frmula se tiene:

Distribucin del Nivel de Glucosa de 60 varones adultos

(Li-1 Li] xi n Xini X2ni ( X i X) 3 n i ( X i X) 4 n i


35 45 40 5 200 8000 -158773.1481 5027816.358
45 55 50 7 350 17500 -71199.0741 1542646.605
55 65 60 11 660 39600 -17467.5926 203788.5802
65 75 70 14 980 68600 -64.8148 108.0246914
75 85 80 8 640 51200 4629.6296 38580.24691
85 95 90 7 630 56700 43134.2593 790794.7531
95 105 100 4 400 40000 90981.4815 2577808.642
105 115 110 4 440 48400 225314.8148 8637067.901
Total 60 4300 330000 116555.556 18818611.111
8

(x
1
i ) 3 ni
116555 .56
Coeficiente Asimetra = = = 0.2799,
n 3 60 * (19.076) 3
8

(x
1
i ) 4 ni
18818611 .1111
Coeficiente Kurtosis = = = 2.3686
n * 4
60 * (19.076) 4
Por tanto se puede afirmar que la distribucin emprica es:
Aprox. Simtrica, puesto que AS = 0.28 0
Platicrtica, puesto que K = 2.37 < 3.
Entonces se puede concluir que dicha distribucin difiere ligeramente de la normal.
2.4. Aplicaciones de las medidas en datos univariados

Ejemplo 1. Los siguientes datos constituyen las vidas tiles en horas. de una muestra
aleatoria de 60 bombillas de luz de 100 watts.
807 811 620 660 817 732 747 823 844 907
660 753 1050 918 857 867 675 880 878 890
881 872 869 841 847 833 829 827 822 811
766 787 923 792 803 933 947 717 817 753
1056 1076 958 970 776 828 831 781 1088 1082
832 863 852 788 980 889 1030 897 755 891
a) Clasifique convenientemente con Anchos de Clase iguales y trace el Polgono de
Frecuencias Absolutas.
b) Una vez clasificadas; determine el porcentaje de bombillas cuyas vidas tiles oscilan
entre 700 y 1000 horas.
c) Encuentre los lmites que sub-clasifiquen las bombillas en tres categoras con referencia
a su duracin.
El 15 % ms durables en la categora A
El 15 % menos .durables en la categora C.
El resto en la categora B

Solucin
Clculos previos para elaborar la tabla

139 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
Recorrido (R) =1088 620 = 468
Elegimos el nmero de Intervalos (m) =1 + 3,322 log(60) = 6,9070
Tomamos m = 6 intervalos
Determinar la amplitud de los intervalos (C)
468
C= = 78
6
a) Clasifique convenientemente con Anchos de Clase iguales

CUADRO N 01
DISTRIBUCIN DE DATOS CONSTITUYEN LAS VIDAS TILES EN HORAS. DE UNA
MUESTRA ALEATORIA DE 60 BOMBILLAS DE LUZ DE 100 WATTS.
Marca Nmero Frecuencia Frecuencia
Vida til en horas Frecuencia
de de Acumulada Relativa
Relativa
clase Bombillas Simple Acumulada
[Li-1 Li>
xi ni Ni hi Hi
[620 698> 659 4 4 0,0667 0,0667
[698 776> 737 7 11 0,1167 0,1833
[776 854> 815 23 34 0,3833 0,5667
[854 932> 893 15 49 0,2500 0,8167
[932 1010> 971 5 54 0,0833 0,9000
[1010 1088> 1049 6 60 0,1000 1,0000
Total 60 1,0000

El Polgono de Frecuencias Absolutas.


Para graficar el polgono de frecuencias se realiza algunos clculos

Vida til en horas Marca de Nmero de


clase Bombillas
[Li-1 Li> xi ni
581 0
[620 698> 659 4
[698 776> 737 7
[776 854> 815 23
[854 932> 893 15
[932 1010> 971 5
[1010 1088> 1049 6
1127 0
Total 60

GRAFICO N 01
POLGONO DE FRECUENCIA DE LA VIDA TIL EN HORAS DE UNA MUESTRA
ALEATORIA DE 60 BOMBILLAS DE LUZ DE 100 WATTS

140 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
25

Nmero de bombillas
23
20
15 15
10
5
7 6
5 4
0 0 0
581 681 781 881 981 1081
Vida promedio en horas de bombillas de luz de 100 watts.

b) Una vez clasificadas; determine el porcentaje de bombillas cuyas vidas tiles oscilan
entre 700 y 1000 horas.
Vida til en horas Nmero de Frecuencia Frecuencia
Bombillas Relativa Relativa
[Li-1 Li> ni hi hi %
[620 698> 4 0,0667 6,667
[698 776> 7 0,1167 11,667
[776 854> 23 0,3833 38,333
[854 932> 15 0,2500 25,000
[932 1010> 5 0,0833 8,333
[1010 1088> 6 0,1000 10,000
Total 60 1,0000 100,000
Calculamos el nmero de observaciones pedido:
2(11,66667)
698 a 776 11,66667 78 11,6667 = = 0,2991453
78
698 a 700 x 2 x
Para encontrar el valor 698 a 700 = 11,6666667 0,2991453 = 11,3675214
68(8,3333)
932 a 1010 8,3333 78 8,333 = =
78
7,2649526
932 a 1000 x 68 x
Para encontrar el valor 700 y 1000 horas. = 11,368 + 38,333 + 25,000 + 7,265 =
81,966%
El 15 % ms durables en la categora A
Basta calcular el percentil 15 y el percentil 85
94
15 = 698 + 78 ( ) = 753,7
7
51 49
85 = 932 + 78 ( ) = 963.2
5
Ejemplo 2. En la siguiente distribucin de frecuencias relativas calcular:
a) Las desviacin cuartillita
b) Discutir el sesgo y la kurtosis
Tiempo 0 3 3 6 6 9 9 12 12 15 15 18
hi 0,04 0,06 0,40 0,38 0,10 0,02
Solucin
Tiempo Xi hi Hi xi h i xi2 hi
0 3 1,5 0,04 0,04 0,06 0,09
3 6 4,5 0,06 0,10 0,27 1,215
6 9 7,5 0,40 0,50 3,00 22,5
9 12 10,5 0,38 0,88 3,99 41,895
12 15 13,5 0,10 0,98 1,35 18,225

141 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
15 18 16,5 0,02 1,00 0,33 5,445
Total 1 9 89,37

Directamente de la tabla: media aritmtica x xi hi 9



Varianza S 2 xi2 hi X 89,37 9 2 8,37
2

Desviacin estndar S = 2,89309523

142 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
a) Las desviacin cuartillita
0,250,10
1 = 6 + 3 ( 0,40 ) = 7,125
10,9747,125
= = 1,9245
2
0,75 0,50
3 = 9 + 3 ( ) = 10,974
0,38
b) Discutir el sesgo y la kurtosis
0,50,10 0,10,04
= 6 + 3 ( )=9 1 = 3 + 3 ( )=6
0,40 0,06
0,90,88 0,34
9 = 12 + 3 ( ) = 12,6 = 6 + 3 (0,34+0,02) = 8,83
0,10

3( ) 3(9 9)
= = =0
2,893
No podemos concluir que la distribucin sea simtrica. En efecto, como la media est a la
derecha de la moda la distribucin es sesgada a la derecha y usando el primer Coeficiente
de Pearson tenemos:
9 8.83
= = = 0.059
2.893
Como Sk > 0 la distribucin es ligeramente sesgada a la derecha
Q 1,9245
= = = 0,29
D9 D1 12,6 6
Como es K>0.263, puede considerarse la distribucin que es Leptocrtica

Ejemplo 3. Al investigar el nivel socioeconmico en los valores: Bajo (B), Medio (M), Alto
(A),
20 familias dieron las siguientes respuestas:
M, B, B, M, A, B, B, M, M, B, M, B, B, A, M, B, M, A, M, B.
Construir la distribucin de frecuencias y trazar su grfica.
Nivel Frecuencia Frecuencia
socioeconmico Absoluta Relativa
Medio 8 40,0
Bajo 9 45,0
Alto 3 15,0
Total 20 100
10 9
8 Alto
Nmero de Familias

8 15% Medio
6 40%
4 3
2
0
Medio Bajo Alto Bajo
Nivel Socioecnomico 45%

143 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
VII. CAPITULO Regresin y Correlacin Lineal

Regresin y Correlacin Lineal


Son dos herramientas para investigar la dependencia de una variable dependiente Y en
funcin de una variable independiente X. Y = f(X)
Y = Variable dependiente que se desea explicar o predecir, tambin se llama regresor o
respuesta
X = Variable independiente, tambin se llama variable explicativa, regresor o predictor
Regresin lineal - La relacin entre X y Y se representa por medio de una lnea recta
Regresin curvilinea - La relacin entre X y Y se representa por medio de una curva.

La ecuacin de la recta es la siguiente:


Y b 0 b 1 X e .........Con.base.en.la. poblacin
Y b0 b1 X e...........Con.base.en.datos.de.la.muestra
*
Y b0 b1 X ................Modelo.de.regresin .estimada

El trmino de error es la diferencia entre los valores reales observados Y i y los valores
estimados por la ecuacin de la recta. Se trata de que estos sean mnimos, para lo cual
se utiliza el mtodo de mnimos cuadrados.
Se trata de minimizar la suma de todos los errores o residuos:
Las frmulas resultado de la minimizacin de lo cuadrados del error se aplicarn en el
siguiente ejemplo por claridad. Se tienen los siguientes supuestos:

1. Los errores o residuos se distribuyen normalmente alrededor de la recta de regresin


poblacional
2. Las varianzas de los errores son las mismas en todos los valores de X
(Homoscedasticidad) en caso contrario se tiene (Heteroscedasticidad)
3. Los errores o residuos son independientes: No se muestra algn patrn definido.

144 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
El coeficiente de Correlacin r desarrollado por Carl Pearson es un indicador de la
fuerza de la relacin entre las variables X y Y, puede asumir valores entre -1 y 1 para
correlacin negativa y positiva perfecta respectivamente. Por ejemplo si se encuentra
que la variable presin tiene una correlacin positiva con el rendimiento de una caldera,
se deben buscar soluciones al problema mediante acciones asociadas con la variable
presin; de lo contrario, sera necesario buscar la solucin por otro lado.

Se identifican tres medidas de desviacin como sigue:

Ejemplo: Se sospecha que el tiempo requerido para hacer un mantenimiento preventivo


est relacionado con su nmero. Calcular el coeficiente de correlacin y graficar. Los datos
de tiempo tomados para n = 25 servicios se muestran a continuacin:

X Servicios Y Tiempo (Xi-X)*(Yi-Y) (Xi-X) 2 (Yi-Y)2 Yest Error


2 9.95 119.076672 38.9376 364.1533 10.9199 0.9408
8 24.45 1.099872 0.0576 21.0021 28.3362 15.1022
11 31.75 7.499472 7.6176 7.3832 37.0443 28.0292
10 35.00 10.502272 3.0976 35.6075 34.1416 0.7369
8 25.02 0.963072 0.0576 16.1026 28.3362 10.9969
4 16.86 51.612672 17.9776 148.1771 16.7253 0.0181
2 14.38 91.433472 38.9376 214.7045 10.9199 11.9721
2 9.60 121.260672 38.9376 377.6337 10.9199 1.7422
9 24.35 -3.558928 0.5776 21.9286 31.2389 47.4563
8 27.50 0.367872 0.0576 2.3495 28.3362 0.6991

145 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
4 17.08 50.679872 17.9776 142.8694 16.7253 0.1258
11 37.00 21.989472 7.6176 63.4763 37.0443 0.0020
12 41.95 48.568672 14.1376 166.8541 39.9470 4.0121
2 11.66 108.406272 38.9376 301.8142 10.9199 0.5477
4 21.65 31.303072 17.9776 54.5057 16.7253 24.2523
4 17.89 47.245472 17.9776 124.1620 16.7253 1.3564
20 69.00 470.014272 138.2976 1,597.3771 63.1686 34.0052
1 10.30 135.625472 52.4176 350.9178 8.0172 5.2111
10 34.93 10.379072 3.0976 34.7770 34.1416 0.6216
15 46.59 118.686672 45.6976 308.2553 48.6551 4.2646
15 44.88 107.127072 45.6976 251.1337 48.6551 14.2512
16 54.12 194.676672 60.2176 629.3676 51.5578 6.5649
17 56.63 241.751472 76.7376 761.6054 54.4605 4.7068
6 22.13 15.462272 5.0176 47.6486 22.5307 0.1606
5 21.15 25.540272 10.4976 62.1385 19.6280 2.3164
206 725.82 2,027.7132 698.5600 6,105.9447 220.0926
X Y Sxy Sxx Syy = SST SSE
X
promedio Y Promedio Xi-X)*(Yi-Y) (Xi-X)^2 (Yi-Y)^2

Sxy Sxx Syy

Si todos los puntos estuvieran completamente sobre la recta la ecuacin lineal sera
y = a + bx. Como la correlacin no siempre es perfecta, se calculan a y b de tal forma que
se minimice la distancia total entre puntos y la recta. Los clculos tomando las sumas de
cuadrados siguientes se muestran a continuacin:

Sxy = 2027.71
Sxx = 698.56
Syy = 6105.94

Las ecuaciones para el clculo manual son las siguientes:

b1 b1
( Xi X )(Yi Y ) S XY = 2.902704421
( Xi X ) 2
S XX

146 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012

b0 b0
Y b X
i 1 i
Y bX = 5.114515575
n

Las sumas de cuadrados son:

SST (Yi Y ) 2 6,105.9447

SSE (Yi Yi ) 2 (Yi (bo b1 * X i )) 2 220.0926

SSR SST SSE 5,885.8521

El coeficiente de determinacin r2 y el coeficiente de correlacin r se calculan a


continuacin:

SSE ( SST SSE) SSR


r2 1 = 0.9639
SST SST SST

El coeficiente de determinacin indica el porcentaje de la variacin total que es explicada


por la regresin.

r r 2 = 0.9816

El coeficiente de correlacin proporciona el nivel de ajuste que tienen los puntos a la lnea
recta indicando el nivel de influencia de una variable en la otra. El factor de correlacin r es
un nmero entre 1 (correlacin negativa evidente) y +1 (correlacin positiva evidente), y r
= 0 indicara correlacin nula.

El coeficiente de correlacin r = 0.98 por lo cual tenemos suficiente evidencia estadstica


para afirmar que el tiempo de atencin est relacionado con el nmero de servicios
atendidos.

147 Mg. Miguel Angel Macetas Hernndez


Estadstica General 2012
EJERCICIOS:
1. La energa consumida en un proceso depende del ajuste de mquinas que se realice,
realizar una regresin cuadrtica con los datos siguientes y responder las preguntas.
Cons_energa Ajuste Mq.
Y X
21.6 11.15
4 15.7
1.8 18.9
1 19.4
1 21.4
0.8 21.7
3.8 25.3
7.4 26.4
4.3 26.7
36.2 29.1
a. Trazar un diagrama de dispersin
b. Obtener la ecuacin de regresin lineal y cuadrtica y comparar
c. Estimar el consumo de energa para un ajuste de mquina de 20 con regresin
cuadrtica
d. Obtener los intervalos de prediccin y de confianza para un ajuste de mquina de 20
e. Obtener el coeficiente de correlacin y de determinacin

2. En base al porcentaje de puntualidad se trata de ver si hay correlacin con las quejas
en una lnea area. Las quejas son por cada 100000 pasajeros.
%puntos Quejas a. Trazar un diagrama de dispersin
Aerolnea X Y b. Obtener la ecuacin de regresin lineal
A 81.8 0.21 c. Estimar las quejas para un porcentaje de
B 76.6 0.58 puntualidad de 80%
C 76.6 0.85
d. Obtener los intervalos de prediccin y de confianza
D 75.7 0.68
E 73.8 0.74 para una altura de 63"
F 72.2 0.93 e. Obtener el coeficiente de correlacin y de
G 70.8 0.72 determinacin
H 68.5 1.22

148 Mg. Miguel Angel Macetas Hernndez