You are on page 1of 38

Luis Pajuelo Gonzáles

-------------------------------------------------------------------------------------------------------------------------------
Capitulo 1
MODULO I
INTRODUCCIÓN A LA ESTADÍSTICA
A medida que aumenta la complejidad de nuestro mundo y nos internamos por los
senderos reales y virtuales del nuevo milenio, se hace más difícil tomar decisiones
informadas e inteligentes. Con frecuencia, estas decisiones han de tomarse con un
conocimiento imperfecto de la situación y un grado considerable de incertidumbre, sin
embargo, las soluciones pertinentes son esenciales para nuestro bienestar e incluso para
nuestra supervivencia. Estamos epuestos a la presión constante de problemas
económicos galopantes y angustiantes, en casi todos los países desarrollados,
subdesarrollados y tercermundistas, un sistema fiscal engorroso, coercitivo e injusto y
oscilaciones ecesivas del ciclo económico.
!odo nuestro tejido socioeconómico esta amena"ado por una contaminación ambiental
eponencialmente creciente, por una deuda p#blica opresiva y criminal, por un índice de
delincuencia que se incrementa sin cesar día a día como consecuencia de la perdida de
valores morales y por unos intereses impredecibles que coadyuvan a incrementar la ya
casi infinita brecha entre los países desarrollados y los países pobres de Asia,
$atinoam%rica y &frica.
'uestro periodo de %ito en este planeta, relativamente, breve no es ninguna garantía de
supervivencia futura. A menos que se encuentren soluciones viables a estos apremiantes
problemas. En ra"ón de lo anteriormente epuesto, es necesario contar con herramientas
altamente confiables que nos permitan tomar decisiones acertadas y eficaces para poder
resolver los problemas prioritarios que podrían enmarcarse posiblemente de acuerdo al
criterio ()*+) ,el ()- de todos los problemas se deben al +)- de las causas.. ./e ahí
que sea fundamental que todos los futuros profesionales que pretendan dirigir
correctamente los destinos de la humanidad, aprendan y se sirvan de los m%todos
estadísticos para minimi"ar la probabilidad de error en la toma de decisiones en esta era
llamada del conocimiento, que actualmente cuentan con todas las ayudas de #ltima
generación que a trav%s de ecelentes soft0are permiten agili"ar todo el trabajo
estadístico. Es altamente recomendable que a la par con la formación humanística que
1
Luis Pajuelo Gonzáles
-------------------------------------------------------------------------------------------------------------------------------
se imparte en nuestra universidad, se actualice las t%cnicas pedagógicas y se introdu"can
en los contenidos programáticos y curriculares de los diferentes programas, la
obligación que los docentes y estudiantes utilicen los diferentes soft0are que se
consiguen en el mercado, que le permitan estar actuali"ados con las tecnologías de
puntas.
1.1. IMPORTANCIA DE LA ESTADÍSTICA
!odos los campos de la investigación científica seria, se pueden beneficiar del análisis
estadístico ya que las t%cnicas estadísticas se pueden utili"ar en casi todos los aspectos
de la vida. 2e dise3an encuestas para recopilar información previa al día de elecciones y
así predecir el resultado de las mismas. 2e seleccionan al a"ar consumidores para
obtener información con el fin de predecir la preferencia con respecto a ciertos
productos y*o servicios.
$os responsables de la toma de decisiones sobre la política económica, asesores
presidenciales, ministeriales y de otros altos cargos p#blicos, tienen en la estadística una
herramienta muy valiosa. $os economistas consideran varios índices de la situación
económica durante cierto periodo y utili"an la información para predecir la situación
económica futura. 4nicamente con la ayuda del análisis estadístico pueden tomarse
decisiones inteligentes en relación con los tipos tributarios, programas sociales, gastos
de defensas, políticas laborales, inversiones prioritarias.
Es fundamental para los empresarios, en su b#squeda incansable del beneficio, donde
las actividades de control total de calidad, minimi"ación de costos, combinación de
productos 5 eistencias y multitud de aspectos empresariales se pueden gestionar con
eficacia mediante procedimientos estadísticos contrastados. $os ingenieros muestrean
las características de calidad de un producto, juntos con otras variables controladas del
proceso para facilitar la identificación de las variables que están mas relacionadas con
dicha calidad.
En la investigación de mercados, la estadística representa una ayuda inestimable para
determinar si es probable que un nuevo producto y*o servicio tenga %ito. 2u utilidad es
evidente tambi%n para los asesores financieros que han de evaluar las oportunidades de
inversión a trav%s de las bolsas de valores. Contadores, directores de personal y
fabricantes se benefician igualmente del análisis estadístico.
+
Luis Pajuelo Gonzáles
-------------------------------------------------------------------------------------------------------------------------------
6ncluso los investigadores m%dicos, sicólogos, siquiatras y muchos profesionales del
sector de la salud y del comportamiento, que preocupados por la eficacia de nuevos
medicamentos, reali"an eperimentos para determinar su efecto bajo ciertas condiciones
ambientales controladas en los humanos y en los animales para la determinación del
m%todo apropiado para curar ciertas enfermedades, encuentran en la estadística un
aliado imprescindible.
En t%rmino generales la estadística se puede utili"ar para mejorar el rendimiento en el
trabajo y en muchos aspectos de la vida diaria ya que es una guía universal para lo
desconocido.
1.2. CONCEPTOS BÁSICOS EN LA ESTADÍSTICA
Estadsti!a
Es una ciencia que requiere del conocimiento matemático y que nos permite recopilar,
organi"ar ,clasificar, agrupar., presentar, describir y anali"ar datos a fin de reali"ar
generali"aciones validas o tomar eficientes decisiones.
Estadsti!a D"s!#ipti$a
7resenta un conjunto de m%todos que nos permite recolectar, presentar los datos en
tablas o cuadros y gráficos, describir y anali"ar mediante el caculo de las medidas de
resumen8 sin intentar inferir nada que vaya más allá de los datos como tales.
Estadsti!a I%&"#"%!ial
7resenta un conjunto de m%todos que nos permite reali"ar generali"aciones válidas en
una población con un nivel de confiabilidad sobre los resultados obtenidos en una
muestra.
Po'la!i(%
Es un conjunto de individuos, objetos o eventos que contienen una o más características
comunes observables de naturale"a cuantitativa o cualitativa. 2u tama3o com#nmente se
denota por 9':.
/esde el punto de vista agronómico;
$os elementos considerados en la población podrían ser días, animales, semillas,
plantas, personas o localidades de una cierta región.
<
Luis Pajuelo Gonzáles
-------------------------------------------------------------------------------------------------------------------------------
U%idad d" o's"#$a!i(%) u%idad "stadsti!a o u%idad d" a%*lisis) es el individuo,
objeto o evento de una población, de quien se obtiene información. $a unidad debe ser
adecuada al tipo de investigación y debe poseer características claras y entendibles que
permitan mediciones y comparaciones.
Dato) $alo# o's"#$ado o si+pl"+"%t" o's"#$a!i(%) es el resultado de medir una
característica de una unidad de análisis.
Pa#*+"t#o) es un n#mero o una medida de resumen que describe a una característica de
la población, tal como la media poblacional ( ) µ
o la varian"a poblacional ( )
+
σ
.
Ta+a,o d" la Po'la!i(%) por el n#mero de elementos que la componen la población se
clasifica en finita o infinita.
$a po'la!i(% es &i%ita cuando tiene un n#mero limitado de elementos y es i%&i%ita caso
contrario. En la práctica una población finita que tiene un gran n#mero de elementos se
le considera una población infinita.
Mu"st#a
Es un sub conjunto o parte de una población seleccionada de acuerdo a un plan de
muestreo, de tal manera que sea representativa. El tama3o de la muestra se suele denotar
por 9n:.
Estadsti!o o "stad-#a&o) es un n#mero o una medida de resumen que describe a una
característica de la muestra, tal como la media muestral ( )
X
o la varian"a muestral
( )
+
s
.
1... /ARIABLES ESTADÍSTICAS
=asgo, característica o propiedades medibles, observables con variabilidad que poseen
los elementos de una población o de una muestra. >na variable puede ser cualitativa o
cuantitativa. Así, por ejemplo, si ? denota el n#mero de semillas germinadas en un
conjunto de bandejas.
@
Luis Pajuelo Gonzáles
-------------------------------------------------------------------------------------------------------------------------------
ESCALA DE MEDIDA. Es un patrón o conjunto de criterios claramente definidos que
permite asignar, sin ambigAedades, valor a una variable. El concepto de valor incluye,
además de n#meros, letras, letras y n#meros, palabras, etc.
/ARIABLE CUALITATI/A0 Es aquella que su medición se puede epresar
normalmente por medio de una palabra o palabras y no de n#meros.
7or ejemplo, el estado civil, la nacionalidad, el seo, la profesión, la ra"a, el color de la
piel de los profesores de la >'2.
$as variables cualitativas pueden ser 'i%o+ial"s o +ulti%o+ial"s. 2e pueden hacer
observaciones solas en dos categorías sobre una variable cualitativa binomial, por
ejemplo, hombre o mujer, buenas o malas, rico o pobre, ausente o presente, empleado o
desempleado.
2obre una variable !ualitati$a +ulti%o+ial se pueden hacer observaciones en más de
dos categorías, por ejemplo, en puestos de trabajo, colores, idiomas, nacionalidades,
religiones, etc.
Las $a#ia'l"s !ualitati$as pu"d"% s"# %o+i%al"s u o#di%al"s.
NOMINAL. 2irven #nicamente para identificar la diferencia o semejan"a, así como el
criterio para asignar el n#mero u el código, por ejemplo para saber el color del pelo de
una persona, la orientación de los vientos ,'orte, 2ur, Este, Beste., color del tegumento
de las semillas, etc.
ORDINAL. 7ermite distinguir diferencia o semana"a y jerarquía, además asigna el
n#mero a una variable que sirve sólo para ordenar, por ejemplo como el puesto que
ocupa un atleta en una carrera, el grado de ataque de una virosis vegetal ,severo,
moderado o leve..
/ARIABLE CUANTITATI/A; Es aquella que su medición se epresa
num%ricamente. 7or ejemplo, las eportaciones de caf%, las ventas de acero, el ingreso
per cápita, la producción de autos, el decomiso de cocaína, las hectáreas fumigadas, etc.
Las $a#ia'l"s !ua%titati$as pu"d"% s"# dis!#"tas o !o%ti%uas.
C
Luis Pajuelo Gonzáles
-------------------------------------------------------------------------------------------------------------------------------
/ARIABLE DISCRETA; Es aquella que solo puede tomar determinados valores por
lo general, n#meros enteros, por ejemplo, el numero de hijos de una familia, numero de
empleados de una empresa, numero de vacas en una hacienda, el n#mero de días hasta
la germinación del C)- de las semillas de una bandeja, numero de colonias de
microorganismos sobre plantas enfermas, numero de frutos de un árbol, el n#mero de
ma"orcas en plantas de maí", etc.
/ARIABLE CONTINUA0 Es aquella que toma cualquier valor dentro de un intervalo
dado. 7or muy cerca que est%n dos observaciones siempre es posible hacer otra
medición que caigan dentro de esas dos. $os valores de una variable continua provienen
de las mediciones y de los pesajes. 7or ejemplo, las eportaciones en dólares del
espárrago, etc.
DATO0 U% !o%1u%to d" datos "s u%i$a#iado) 'i$a#iado o +ulti$a#iado si !o%ti"%"
u%a) dos) o +as d" dos $a#ia'l"s.
E% la Ta'la 10 2e muestra una base de datos donde se pueden observar los diferentes
componentes ,unidad elemental, tipos de variables, datos, muestra, etc...
TABLA 1
BASE DE DATOS DE LOS EMPLEADOS DE LA EMPRESA
M"tal!o%sulti%- I%-"%i"#ia Ltda.
D
Luis Pajuelo Gonzáles
-------------------------------------------------------------------------------------------------------------------------------
Ejercicios
1.2. MUESTREO
$os m%todos estadísticos proponen diferentes tipos de muestreo, aunque en general
pueden dividirse en dos grandes grupos; m%todos de muestreo probabilísticas y m%todos
de muestreo no probabilísticas.
M3todos d" +u"st#"o p#o'a'ilsti!as
$os m%todos de muestreo probabilística son aquellos que se basan en el principio de
equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma
probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente,
todas las posibles muestras de tama3o 9n: tienen la misma probabilidad de ser elegidas.
2olo estos m%todos de muestreo probabilística aseguran la representatividad de la
muestra etraída y son, por tanto, los más recomendables. /entro de los m%todos de
muestreo probabilística se encuentran los siguientes tipos;
Muestreo aleatorio simple
El procedimiento empleado es el siguiente; 1. se asigna un n#mero a cada individuo de
la población, y +. a trav%s de alg#n medio mecánico ,bolas dentro de una bolsa, tablas
de n#meros aleatorios, n#meros aleatorios generados con una calculadora u ordenador,
etc.. se eligen tantos sujetos como sea necesario para completar el tama3o de muestra
requerido. Este procedimiento, atractivo por su simple"a, tiene poca o nula utilidad
practica cuando la población que se esta manejando es muy grande.
Muestreo aleatorio sistemático
E
Luis Pajuelo Gonzáles
-------------------------------------------------------------------------------------------------------------------------------
Este procedimiento eige, como el anterior, numerar todos los elementos de la
población, pero en lugar de etraer 9n: n#meros aleatorios solo se etrae uno. 2e parte
de ese numero aleatorio i, que es un numero elegido al a"ar, y los elementos que
integran la muestra son los que ocupan los lugares i, iFG, iF+G, iF<G,..., iF,n51. G, es
decir se toman los individuos de G en G, siendo G el resultado de dividir el tama3o de la
población entre el tama3o de la muestra;
GH'*n. El numero i que se emplea como punto de partida será un n#mero al a"ar entre 1
y G.
El riesgo se este tipo de muestreo esta en los casos en que se dan periodicidades en la
población ya que al elegir a los miembros de la muestra con una periodicidad constante
,G. se puede introducir una homogeneidad que no se da en la población. 2upóngase que
se esta seleccionando una muestra sobre listas de 1) individuos en los que los C
primeros son varones y los C #ltimos mujeres8 si se emplea un muestreo aleatorio
sistemático con GH1) siempre serán seleccionados o solo hombres o solo mujeres8 no
podría haber una representación de los dos seos.
Muestreo aleatorio estratificado
!rata de obviar las dificultades que presentan los anteriores, ya que simplifica los
procesos y suele reducir el error muestral para un tama3o dado de la muestra. Consiste
en considerar categorías típicas diferentes entre si ,estratos. que poseen gran
homogeneidad respecto a alguna característica ,se puede estratificar, por ejemplo, seg#n
la profesión, el municipio de residencia, el seo, el estado civil, etc... $o que se
pretende con este tipo de muestreo es asegurarse de que todos los estratos de inter%s
estarán representados adecuadamente en la muestra. Cada estrato funciona
independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o
el estratificado para elegir los elementos concretos que formaran parte de la muestra. En
ocasiones, las dificultades que plantea son demasiado grandes, pues eige un
conocimiento detallado de la población ,tama3o geográfico, seos, edades.....
La dist#i'u!i(% d" la +u"st#a "% &u%!i(% d" los di&"#"%t"s "st#atos s" d"%o+i%a
a&i1a!i(%) 4 pu"d" s"# d" di&"#"%t"s tipos0
Afijación simple: a cada estrato le corresponde igual n#mero de elementos muestrales.
(
Luis Pajuelo Gonzáles
-------------------------------------------------------------------------------------------------------------------------------
Afijación proporcional: la distribución se hace de acuerdo con el peso ,tama3o. de la
población en cada estrato.
Afijación óptima: se tiene en cuenta la previsible dispersión de los resultados, de modo
que se consideran la proporción y la desviación típica. !iene poca aplicación ya que no
se suele conocer la desviación.
Po# "1"+plo) se esta interesado en estudiar el grado de aceptación que la implantación
de la reforma educativa ha tenido entre los padres de un municipio. A tal efecto se
selecciono una muestra de D)) padres de familia. 2e conoce por los datos del Iinisterio
de Educación que de los 1)))) ni3os escolari"ados en la básica, E))) acuden a colegios
p#blicos y <))) a colegios privados. Como el inter%s es que en la muestra est%n
representados todos los tipos de colegio, se reali"a un muestreo estratificado empleando
como variable de estratificación el tipo de colegio.
2i se emplea una afijación simple serian <)) ni3os de cada tipo de centro, pero en este
caso parece mas ra"onable utili"ar una afijación proporcional pues hay bastante
diferencia en el tama3o de los estratos. 7or consiguiente, se calcula la proporción para
cada uno de los estratos respecto de la población, para poder reflejarlo en la muestra.
Colegios p#blicos; E)))*1)))) H ).E)
Colegios privados; <)))*1)))) H ).<)
7ara conocer el tama3o de cada estrato en la muestra se multiplica la proporción por el
tama3o muestral.
Colegios p#blicos; ).E)D)) H @+) padres de familia
Colegios privados; ).<)D)) H 1() padres de familia
Muestreo aleatorio por conglomerados
$os m%todos presentados hasta ahora están pensados para seleccionar directamente los
elementos de la población, es decir, que las unidades muestrales son los elementos de la
población. En el muestreo por conglomerados la unidad muestral es un grupo de
elementos de la población que forman una unidad, a la que se denomina conglomerado.
$as unidades hospitalarias, los departamentos universitarios, una caja de determinado
producto, etc. son conglomerados naturales. En otras ocasiones, se pueden utili"ar
J
Luis Pajuelo Gonzáles
-------------------------------------------------------------------------------------------------------------------------------
conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando los
conglomerados son áreas geográficas suele hablarse de Kmuestreo por áreasK.
El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero
de conglomerados ,el necesario para alcan"ar el tama3o muestral establecido. y en
investigar despu%s todos los elementos pertenecientes a los conglomerados elegidos.
Po# "1"+plo) en una investigación se trata de conocer el grado de satisfacción laboral
de los empleados de una cadena de almacenes8 se toma una muestra de E)) empleados.
Ante la dificultad de acceder individualmente a estos empleados, se decide hacer una
muestra por conglomerados.
2abiendo que el n#mero de empleados por almac%n es aproimadamente de <C, los
pasos a seguir serian;
• =ecoger un listado de todos los almacenes.
• Asignar un n#mero a cada uno de ellos.
• Elegir por muestreo aleatorio simple o sistemático los +) almacenes ,E))*<C H +).
que proporcionaran los E)) empleados que se necesitan.
Linalmente, ante lo compleja que puede llegar a ser la situación real de muestreo es muy
com#n emplear lo que se denomina muestreo polietápico. Este tipo de muestreo se
caracteri"a por operar en sucesivas etapas, empleando en cada una de ellas el m%todo de
muestreo probabilística mas adecuado.
M3todos d" +u"st#"o %o p#o'a'ilsti!as
A veces, para estudios eploratorios, el muestreo probabilística resulta ecesivamente
costoso y se acude a m%todos no probabilísticas, aun siendo conscientes de que no
sirven para reali"ar generali"aciones, pues no se tiene certe"a de que la muestra etraída
sea representativa, ya que no todos los sujetos de la población tienen la misma
probabilidad de ser elegidos. En general, se selecciona a los sujetos siguiendo
determinados criterios procurando que la muestra sea representativa.
Muestreo por cuotas
!ambi%n denominado en ocasiones KaccidentalK. 2e asienta generalmente sobre la base
de un buen conocimiento de los estratos de la población y*o de los individuos más
KrepresentativosK o KadecuadosK para los fines de la investigación. Iantiene, por tanto,
semejan"as con el muestreo aleatorio estratificado, pero no tiene el carácter de
aleatoriedad de aquel. En este tipo de muestreo se fijan unas KcuotasK que consisten en
1)
Luis Pajuelo Gonzáles
-------------------------------------------------------------------------------------------------------------------------------
un n#mero de individuos que re#nen determinadas condiciones, por ejemplo; +)
individuos de +C a @) a3os, de seo femenino y residentes en una misma ciudad. >na
ve" determinada la cuota, se eligen los primeros que se encuentre que cumplan esas
características. Este m%todo se utili"a mucho en las encuestas de opinión.
Po# "1"+plo) una universidad desea estudiar la incidencia de las drogas en la
adolescencia. $o que debería hacer seria; conocer por los informes del Estado cuales
son los centros educativos mas afectados por el problema, fijar un numero de sujetos a
entrevistar, proporcional a cada uno de los estratos ,cuotas. y, finalmente, dejar en
manos de los responsables del trabajo de campo a que sujetos concretos se deberá
entrevistar.
Muestreo opinático o intencional
Este tipo de muestreo se caracteri"a por un esfuer"o deliberado de obtener muestras
KrepresentativasK mediante la inclusión en la muestra de grupos supuestamente típicos.
Es muy frecuente su utili"ación en sondeos preelectorales de "onas que en anteriores
votaciones han marcado tendencias de voto.
Muestreo casual o incidental
2e trata de un proceso en el que el investigador selecciona directa e intencionadamente
los individuos de la población. El caso mas frecuente de este procedimiento es el utili"ar
como muestra los individuos a los que se tiene fácil acceso ,los profesores de
universidad emplean con mucha frecuencia a sus propios alumnos.. >n caso particular
es el de los voluntarios.
Bola de nieve
2e locali"a a algunos individuos, los cuales conducen a otros, y estos a otros, y así hasta
conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se
hacen estudios con poblaciones KmarginalesK, delincuentes, sectas, determinados tipos
de enfermos, egresados de una institución, etc.
Asp"!tos 3ti!os d"l +u"st#"o
En la actualidad se eiste una tendencia a la proliferación de investigaciones que se
apoyan en encuestas8 no todas son buenas, significativas o importantes, y no todas son
%ticas. /ebe intentarse distinguir entre un dise3o de encuesta deficiente y un dise3o
carente de %tica.
11
Luis Pajuelo Gonzáles
-------------------------------------------------------------------------------------------------------------------------------
$as consideraciones %ticas surgen con relación a cuatro tipos de errores potenciales que
pueden ocurrir cuando se dise3an encuestas que utili"an muestras probabilísticas
aleatorias; error de cobertura o sesgo de selección, error o sesgo de no respuesta, error
de muestreo y error de medición. El error de cobertura o sesgo de selección se convierte
en un problema %tico, solo si se ecluyen a propósito grupos específicos de individuos
del marco de población, para obtener resultados sesgados, que indican una oposición
más favorable para los intereses del investigador.
/e igual manera, el error o sesgo de no respuesta se convierte en un problema %tico,
solo si es menos probable que grupos o individuos específicos respondan a una
encuesta, y si el investigador la dise3a a propósito con el fin de ecluir grupos o
elementos. El error de muestreo se convierte en un problema %tico, solo cuando los
resultados se presentan, a propósito, sin referencia al tama3o de muestra o al margen de
error, de modo que el investigador puede promover un punto de vista que de otra
manera seria insignificante.
El error de medición se convierte en un problema %tico en cualquiera de las siguientes
situaciones;
• >n investigador puede elegir preguntas orientadas que guían las respuestas hacia
una dirección específica.
• >n investigador, mediante actitudes y tono de vo", puede crear un efecto deliberado
de halo o puede guiar las respuestas en cierta dirección.
• Alguien que responde, pero no esta de acuerdo con la encuesta, puede proporcionar
información falsa a propósito.
1.5. PRESENTACION DE DATOS
DISTRIBUCION DE 6RECUENCIA
>na distribución de frecuencia es un m%todo para organi"ar, clasificar y resumir datos.
!ambi%n se conoce con el nombre de distribución de frecuencia a una tabulación de
datos en clases, intervalos de clase o categoría8 con la frecuencia correspondiente a cada
una, a fin de reali"ar una especial descripción y análisis.
7ara elaborar los cuadros o tablas de la distribución de los datos se debe, antes que todo
6dentificar las características que se investigaron, ya que esto permite una mejor
1+
Luis Pajuelo Gonzáles
-------------------------------------------------------------------------------------------------------------------------------
clasificación de lo observado, estas características se refieren a las Cualitati$as 4
Cua%titati$as.
Co+po%"%t"s d" u%a Dist#i'u!i(% d" 6#"!u"%!ias
6#"!u"%!ia a'soluta si+pl") representa el n#mero de veces que se repite la clase,
intervalo de clase o categoría. 2e denota por
i
f
.
6#"!u"%!ia a'soluta a!u+ulada) se obtiene sumando las frecuencias absolutas
simples, y siempre nos da un acumulado igual al tama3o de la muestra. 2e denota por
i
F
.
6#"!u"%!ia #"lati$a si+pl") representa la proporción de unidades de análisis en la
clase, intervalo de clase o categoría y resulta de dividir cada una de las frecuencias
absoluta simples por el tama3o de la muestra. 2e denota por
i
i
f
h
n
· .
6#"!u"%!ia #"lati$a a!u+ulada) resulta de la acumulación de las frecuencias relativas
simples, esta frecuencia siempre tiende a la unidad. 2e denota por
i
H
.
% 0 !ama3o de la muestra, es el n#mero de observaciones.
i
x 0 $a variable, es cada uno de los diferentes valores que se han observando o
tambi%n puede ser la marca de clase.
DISTRIBUCIÓN DE 6RECUENCIA POR INTER/ALOS
Como se ha visto, un conjunto de observaciones normalmente cuantitativas continuas o
discretas con valores grandes, puede hacerse más comprensible y adquirir mayor
significado, lograrse una mayor síntesis, tabulando o agrupando los datos. 7ara agrupar
a un conjunto de observaciones, se selecciona un conjunto de intervalos, contiguos, que
no se traslapen, tales que cada valor en el conjunto de observación puede colocarse en
uno, de los intervalos de clase. $os pasos a seguir para la construcción de intervalos son
los siguientes;
aso I: Hallar el Rango o Recorrido de los Datos (R)
$a diferencia entre el dato mayor y el dato menor se llama RECORRIDO o RAN7O
de los datos. Esto es;
aso II: Hallar el número de Intervalos (m)
1<
R = Dato mayor – Dato menor
Luis Pajuelo Gonzáles
-------------------------------------------------------------------------------------------------------------------------------
$a pregunta es Mcuántos intervalos van a incluirseN /emasiado o poco no es
conveniente debido a que hay p%rdida de información. 7or otra parte, si se usan
demasiados intervalos, no se logra objetivo de la síntesis.
>na de las formas para obtener el %8+"#o d" i%t"#$alos es aplicando la regla de
STUR7ES, con la cual se obtiene una aproimación aceptable sobre el n#mero de
intervalos necesarios para agruparlos. Esto es;
/onde % nos representa el tama3o de muestra o n#mero de datos considerados, esta
regla de STUR7ES no se considera como final, sino sólo como una guía. El n#mero de
intervalos especificado por medio de esta regla debe aumentarse o disminuirse seg#n
convenga y el beneficio de una presentación clara.
aso III: Hallar la Amplitud del Intervalo (A)
Aunque a veces es imposible, por lo general, los intervalos deben tener amplitudes
iguales. 7uede determinarse esta amplitud 9A: dividiendo el recorrido 9R: entre el
n#mero de intervalo 9+:. Esto es;
Como regla, este procedimiento proporciona una amplitud que no es conveniente usarla.
>na ve" más, debe aplicarse el buen juicio y seleccionar una amplitud ,por lo com#n,
próima a la dada por la ecuación. que sea más conveniente.
Consideramos el siguiente E1"+plo 1;
1@
m = 1 + 3,33log(n)
A ; R < +
Luis Pajuelo Gonzáles
-------------------------------------------------------------------------------------------------------------------------------
Solu!i(%0
a. 6dentificar la unidad de análisis, variable de estudio, clasificación de la variable, el
lugar y tiempo.
U%idad d" a%*lisis 0
/a#ia'l" d" "studio 0
Clasi&i!a!i(% d" la $a#ia'l" 0
Lu-a# 0
Ti"+po 0
b. Construir la distribución de frecuencias y sus respectivos gráficos.
Ra%-o 0 = H /ato máimo O /ato mínimo
= H 1D O D,< H J,E
N8+"#o d" I%t"#$alos 0 m H 1 F <,<<log,n.

mH1 F <,<<log ,1)).
m H 1 F <,<<P+

m H E,DD

D, E ó (
A+plitud d"l I%t"#$alo 0
R
A
m
· ⇒
A H J,E*( H 1,+
Construyendo la !abla de frecuencias con datos agrupados en intervalos;
Ta'la =1
$ongitud en centímetros de la espiga del trigo ,variedad Q. fundo 2anta =osa, 2anta O
+)1@.

Intervalos
R 1 i

− 5 i

.
Marcas de
clase
Frecuencias
absolutas
Frecuencias
relativas
Frecuencia
porcentual
i
!
i
f
i
F
i
h
i
H
i
h P1))-
6,3 – 7,5 6,9 13 13 0,13 0,13 13%
7,5 – 8,7 8,1 15 28 0,15 0,28 15%
8,7 – 9,9 9,3 15 3 0,15 0,3 15%
9,9 – 11,1 10,5 25 68 0,25 0,68 25%
11,1 – 12,3
12,3 – 13,5
13,5 – 1,7
1,7 – 16,0
11,7
12,9
1,1
15,35
1
9
5

82
91
96
100
0,1
0,09
0,05
0,0
0,82
0,91
0,96
1,00
1%
9%
5%
%
!otal
n"100 1,00 100%
F#$%!$& I%$I
P#"s"%ta!i(% -#*&i!a0 En distribución de frecuencias por intervalos de clase los
gráficos a presentar son; >isto-#a+a de frecuencias y Pol-o%o de frecuencias
1C
Luis Pajuelo Gonzáles
-------------------------------------------------------------------------------------------------------------------------------
7#*&i!o =1
$ongitud en centímetros de la espiga del trigo ,variedad Q. fundo 2anta =osa, 2anta O
+)1@.
S62!BT=AIA
L>E'!E; !abla )1
7#*&i!o =2
$ongitud en centímetros de la espiga del trigo ,variedad Q. fundo 2anta =osa, 2anta O
+)1@.
DISTRIBUCIÓN DE 6RECUENCIA POR CLASES
>n conjunto de observaciones normalmente cuantitativas discretas con valores
peque3os, puede hacerse más comprensible, adquirir mayor significado, lograrse una
mayor síntesis, tabulando o agrupando los datos. 7ara agrupar a un conjunto de
observaciones, se selecciona las clases o valores num%ricos contiguos, tales que cada
valor en el conjunto de observación puede colocarse en uno, de las clases.
E1"+plo 2. >n eperimento consistió en contar el n#mero de flores por planta de una
muestra de C) plantas. $os valores resultantes del conteo fueron los siguientes;
2e pide;
A. Bbtener la tabla de frecuencias para ese conjunto de datos. 6nterpretar la tabla.
U. Elaborar la gráfica.
Solu!i(%
U%idad d" a%*lisis 0 La pla%ta
/a#ia'l" d" "studio 0 'umero de flores
1D
Luis Pajuelo Gonzáles
-------------------------------------------------------------------------------------------------------------------------------
Clasi&i!a!i(% d" la $a#ia'l" 0 cuantitativa discreta
Lu-a# 0
Ti"+po 0 +)1@
A. Bbtener la tabla de frecuencias para ese conjunto de datos. 6nterpretar la tabla.
Ta'la =2
'#mero de flores en las plantas en el fundo 2anta =osa, 2anta, +)1@.
%' de
Flores(
i
!
Frecuencias
absolutas
Frecuencias
relativas
Frecuencia
porcentual
i
f
i
F
i
h
i
H
i
h P1))-
0 1 5 0,08 0,08 8%
1 1 13 0,13 0,21 13%
2 3 25 0,20 0,1 20%
3 6 0 0,25 0,66 25%
50 0,17 0,83 17%
5 56 0,10 0,93 10%
6
7
8
9
10
9
8
7

3
60 0,07 1,00 7%
!otal n"50 1,00 100%
F#$%!$& Fundo )anta *osa, )anta
U. Elaborar la gráfica.
P#"s"%ta!i(% -#*&i!a0 En distribución de frecuencias por clases el gráfico a presentar se
denomina Basto%"s
7#*&i!o =.
DISTRIBUCIÓN DE 6RECUENCIA POR CATE7ORIAS
>n conjunto de observaciones normalmente cualitativas con categorías nominales u
ordinales, puede hacerse más comprensible, adquirir mayor significado, lograrse una
mayor síntesis, tabulando o agrupando los datos. 7ara agrupar a un conjunto de
observaciones, se selecciona las categorías contiguas, tales que cada valor en el
conjunto de observación puede colocarse en uno, de las categorías.
E1"+plo ..
1E
Luis Pajuelo Gonzáles
-------------------------------------------------------------------------------------------------------------------------------
2e efect#a una encuesta sobre el nivel de estudios de personas que reciben planes jefes y
jefas de hogar de la Ciudad de 'vo. Chimbote, mar"o +)1+. $as observaciones
obtenidas son las siguientes;
N? NI/. EST
1 Estudios 7rimarios
+ Estudios 7rimarios
< 2in Estudios
@ Estudios 7rimarios
C Estudios 7rimarios
D 2in Estudios
E Estudios 2ecundarios
( Estudios 2ecundarios
J Estudios 2ecundarios
1) 2in Estudios
11 Estudios 7rimarios
1+ 2in Estudios
1< Estudios 7rimarios
1@ Estudios 2ecundarios
1C Estudios 2ecundarios
1D Estudios >niversitarios
1E 2in Estudios
1( Estudios >niversitarios
1J Estudios 2ecundarios
+) Estudios 7rimarios
+1 Estudios 7rimarios
++ Estudios 7rimarios
+< Estudios >niversitarios
+@ Estudios 7rimarios
+C Estudios 7rimarios
+D 2in Estudios
+E Estudios 2ecundarios
+( Estudios 2ecundarios
+J Estudios 7rimarios
<) Estudios 7rimarios
2e pide;
A. Bbtener la tabla de frecuencias para ese conjunto de datos. 6nterpretar la tabla.
U. Elaborar las gráficas.
Solu!i(%
U%idad d" a%*lisis 0 Vefe o Vefa del hogar
/a#ia'l" d" "studio 0 'ivel de estudios
Clasi&i!a!i(% d" la $a#ia'l" 0 Cualitativa ordinal
Lu-a# 0 'uevo Chimbote
Ti"+po 0 Iar"o, +)1+
U. Bbtener la tabla de frecuencias para ese conjunto de datos. 6nterpretar la tabla.
Ta'la =.
1(
Luis Pajuelo Gonzáles
-------------------------------------------------------------------------------------------------------------------------------
'ivel de estudios del jefe o jefa de hogar en la ciudad de 'vo. Chimbote O Iar"o,
+)1+.
%ivel de
$studios
Frecuencias
absolutas
Frecuencias
relativas
Frecuencia
porcentual
i
f
i
h
i
h P1))-
)in estudios 6 0,20 20%
+ri,aria 13 0,3 3%
)ecundaria 8 0,27 27%
#niversitario
s
3 0,10 10%
!otal n"30 1,00 100%
F#$%!$& $ncuesta aplicada
U. Elaborar las gráficas.
P#"s"%ta!i(% -#*&i!a0 En distribución de frecuencias por categorías los gráficos a
presentar se denominan Ba##as 4 S"!to# !i#!ula#.
7#*&i!o =2
'ivel de estudios del jefe o jefa de hogar en la ciudad de 'vo. Chimbote O Iar"o,
+)1+.
UA==A2
20%
3%
27%
10%
0%
10%
20%
30%
0%
50%
)in estudios +ri,aria )ecundaria #niversitarios
NIVEL DE ES!DI"S
F#$%!$& !abla 03
7#*&i!o =5
'ivel de estudios del jefe o jefa de hogar en la ciudad de 'vo. Chimbote O Iar"o,
+)1+.
)$-!.* -I*-#/0*
1J
Luis Pajuelo Gonzáles
-------------------------------------------------------------------------------------------------------------------------------
NIVEL DE ES!DI"S
)ecundaria
27%
#niversitarios
10%
)in estudios
20%
+ri,aria
3%
F#$%!$& !abla 03
E1"#!i!ios p#opu"stos
1. /etermine qu% tipo son las siguientes variables. 2i son variables cualitativas ,nominal
u ordinal. o cuantitativas ,discretas o continuas..
a. Iarca de automóvil.
b. /uración de un compacto ,segundos..
c. '#mero de temas de un compacto.
d. 'ivel educacional ,básica, media, universitaria..
e. !emperatura al mediodía en !alara ,grados Celcius..
f. Estado civil ,soltero, casado, divorciado, viudo..
g. Cantidad de lluvia en un a3o en 6quitos ,mm<..
h. 7eso de los coches.
i. '#mero de coches vendidos de las diferentes marcas
+. !enemos las resistencias de la tensión de D) muestras de aleación Aluminio5$itio.
Elaborar la !abla de /istribución de Lrecuencias. /ibujar el Sistograma y 7olígono
de Lrecuencia. Aplicar los estadísticos de; posición, variación, simetría. Aplicar los
estadísticos de apuntamiento. MWue concluye >d. despu%s de todo esoN
1)C ++1 1(D 1+1 1(1 1() JE 1C@ 1C< 1E@ 1+) 1D( 1DE 1@1 ++(
1JJ 1(1 1C( 1ED 11) 1<1 1C@ +)( 1C( 1<< +)E 1() 1J) 1J< 1<<
1+< 1<@ 1E( ED 1DE 1(@ 1<C 1@D +1( 1)1 1E1 1DC 1C( 1DJ 1JJ
1C1 1D< 1@C 1E1 1@( 1C( 1D) 1EC 1@J (E 1D) +<E 1C) 1JD +)1
<. >n fabricante de neumáticos ha recabado, de los diferentes concesionarios,
información sobre la cantidad de miles de Gilómetros recorridos por un modelo
concreto de esos neumáticos hasta que se ha producido un pincha"o o un reventón
del neumático. $os concesionarios la han proporcionado los siguientes datos;
+)
Luis Pajuelo Gonzáles
-------------------------------------------------------------------------------------------------------------------------------
C+ C) <( C+ E@ D1 <D CE @J DD ED <E ED DJ D1 DD D+ @ @+ D+ C1 (<
<@ <( C1 EC CJ @( DE @+ D1 C( E@ D1 CD (D J1 C@ ED DJ (@ @1 C) D1
(D @C CD CD @E DE
2e pide;
a. Construir una taba de frecuencias para esos datos tomando como n#mero de
intervalos el que proporciona la fórmula de 2turgess. 6nterpretas la tabla.
b. /ibujar el histograma y polígono de frecuencias porcentuales.
@. En una >niversidad se ha reali"ado una encuesta a +)) alumnos de la Escuela de
6ngeniería. El <+- afirma que esta muy contento con la universidad, el @)- esta
contento, el +<- no esta contento, y el resto muy descontento.
a. Lorma la tabla de frecuencias absolutas, relativas, y eplique si crees que la
universidad lo esta haciendo bien.
b. Elabore sus gráficos.
C. Ejercicios
a. /% cuatro ejemplos de variables cualitativas.
b. 7roponer dos ejemplos de cada una de los dos tipos de variables cuantitativas.
c. Ienciones variables que permitan estimar el efecto de la crisis económica
mundial sobre la economía del 7er#.
d. 2e desea comparar la calidad de vida de varias ciudades del 7er#. 7roponer seis
variables que podrían utili"arse para el estudio. MWu% tipo de variable es cada
una de ellasN
D. !omar cuarenta observaciones de una variable cualitativa
a. Calcular las frecuencias absolutas.
b. Sallar las frecuencias relativas.
c. /ibujar el diagrama de barra.
d. Cuál es la clase o ,clases. modal.
e. MWu% conclusiones pueden etraerse de este estudioN
1.@. MEDIDAS ESTADÍSTICAS
MEDIDAS DE TENDENCIA CENTRAL
+1
Luis Pajuelo Gonzáles
-------------------------------------------------------------------------------------------------------------------------------
$as medidas de tendencia central son valores de resumen que determinan
aproimadamente el centro de un conjunto de datos de una muestra o población. Estas
medidas son; Iedia Aritm%tica, Iediana y Ioda.
A: M"dia A#it+3ti!a
D"&i%i!i(% 10 9Datos %o a-#upados o %o ta'ulados:
Es la suma de todos los valores observados de una variable cuantitativa, dividido por el
n#mero de datos.
M"dia a#it+3ti!a po'la!io%al 9
µ
: M"dia a#it+3ti!a +u"st#al 9 x :

"
x
i ∑
· µ
n
x
x
i ∑
·
/onde;
i
x
; Xalores observados en una población o muestra.
'; !ama3o de la población.
n ; !ama3o de la muestra.
D"&i%i!i(% 20 9Datos a-#upados o ta'ulados:
Es la suma de todos los productos entre la marca de clase o valor num%rico y la
frecuencia absoluta simple, dividida por el n#mero de datos.
M"dia a#it+3ti!a po'la!io%al 9
µ
: M"dia a#it+3ti!a +u"st#al 9 x :

i i
! f
"
µ·


i i
! f
#
n
·

/onde;
i
!
; Iarca de clase de cada intervalo o valor num%rico de cada clase.
Uso d" la +"dia a#it+3ti!a
$a media aritm%tica es recomendable utili"ar en datos cuantitativos que tienen
tendencia aritm%tica, es decir en datos cuya variabilidad es peque3a.
D"s$"%ta1a d" la +"dia a#it+3ti!a
• $a media aritm%tica se afecta por valores etremos, en casos de datos no agrupados.
++
Luis Pajuelo Gonzáles
-------------------------------------------------------------------------------------------------------------------------------
• $a media aritm%tica se afecta por intervalos que no tienen definidos sus límites
inferior o superior, en caso de datos agrupados por intervalos.
E1"+plo 10 $a utilidad neta por la muestra de pedidos distribuidos por la empresa
Wuemalapata fueron los siguientes;
a. 1J.EC, +).C, 1C.), <1.+, +C.1, +(.), 1E.<, <+.C
b. JC.C, 1).D, 1@.), +E.E, ++.(, +).1, 1C.J, J.)
Calcular e interpretar la media aritm%tica.
SOLUCIÓN0
a:
1J, EC +), C 1C, ) ... <+, C
(
i
x
x
n
+ + + +
· ·


+<, DE X ·
I%t"#p#"ta!i(%0 $a utilidad neta promedio por pedido es aproimadamente +<,DE
nuevos soles.
b.
JC, C 1), D 1@, ) ... J, )
(
i
x
x
n
+ + + +
· ·



+D, JC X ·
I%t"#p#"ta!i(%0 $a utilidad neta promedio por pedido es aproimadamente +D,JC
nuevos soles.
E1"+plo 20 $a utilidad neta de una muestra de C) pedidos distribuidos por la empresa
Wuemalapata se presenta en la siguiente tabla;
Calcular e interpretar la media aritm%tica.
SOLUCIÓN0
Paso 10 Sallar las marcas de clase de cada intervalo
Paso 20 Iultiplicar cada marca de clase por su respectiva frecuencia absoluta simple
Paso .0 2umar los productos
Paso 20 =eempla"ar en la formula
R>tilidad neta.
i
f
)C O 1)
1) O 1C
1C O +)
+) O +C
+C O <)
<) O <C
<C 5 @)
<
1)
E
1C
C
(
+
+<
Luis Pajuelo Gonzáles
-------------------------------------------------------------------------------------------------------------------------------
E, C < 1+, C 1) ... <E, C + 1)()
C) C)
i i
! f
x x x
#
n
+ + +
· · ·



+1, D # ·
I%t"#p#"ta!i(%0 $a utilidad neta promedio por pedido es aproimadamente +1,D nuevos
soles.
E1"+plo .0 El n#mero de paquetes del pedido registrado en una muestra de D),
distribuidos por la empresa Wuemalapata se presenta en la siguiente tabla;
Calcular e interpretar la media aritm%tica.
SOLUCIÓN0
Paso 10 Iultiplicar cada clase por su respectiva frecuencia absoluta simple
1#tilidad neta2
i
!
i
f
i
!
i
f
05 – 10
10 – 15
15 – 20
20 – 25
25 – 30
30 – 35
35 3 0
7,5
12,5
17,5
22,5
27,5
32,5
37,5
3
10
7
15
5
8
2
22,5
125
122,5
337,5
137,5
260
75
'Y de paquetes
i
!
i
f
1
+
<
@
C
D
E
D
J
+)
1C
C
<
+
+@
Luis Pajuelo Gonzáles
-------------------------------------------------------------------------------------------------------------------------------
Paso 20 2umar los productos
Paso .0 =eempla"ar en la formula
1 D + J ... E + +)1
D) D)
i i
! f
x x x
#
n
+ + +
· · ·



<, <C < # · ≈
I%t"#p#"ta!i(%0 El n#mero promedio de paquetes por pedido es aproimadamente <.
B: M"dia%a
Es un valor generalmente denotado por M") que divide a un conjunto de datos
recopilados de una variable cuantitativa o cualitativa ordinal en dos partes iguales,
previamente ordenados en forma creciente o decreciente.
Cal!ulo d" la +"dia%a
Datos %o a-#upados o %o ta'ulados
7ara obtener el valor de la mediana en datos no agrupados se debe cumplir por lo menos
los siguientes pasos;
Paso I0 Brdenar en forma creciente o decreciente los datos.
Paso II0 Bbservar si el n#mero de datos es par o impar.
Paso III0 =eempla"ar en las formulas
%' de pa4uetes
i
!
i
f
i
!
i
f
1
2
3

5
6
7
6
9
20
15
5
3
2
6
18
60
60
25
18
1
+C
Luis Pajuelo Gonzáles
-------------------------------------------------------------------------------------------------------------------------------
¹
¹
¹
¹
¹
'
¹
+
·
+

,
_

¸
¸ +
par n si
X X
impar n si X
$e
n n
n
K K ,
+
K K ,
1
+ +
+
1
Datos a-#upados o ta'ulados 9sola+"%t" "% i%t"#$alos:
2e debe cumplir tambi%n por lo menos los siguientes pasos;
Paso I0 Brdenar en forma creciente o decreciente los intervalos.
Paso II0 Sallar
+
n
que indica la posición de la mediana.
Paso III0 /eterminar la primera frecuencia absoluta acumulada ,
i
F
. que supera
+
n
a
fin de determinar el intervalo que contiene la mediana.
Paso I/0 6dentificar todos los componentes de la formula en el intervalo que contiene la
mediana y reempla"ar.
A
f
F
n
$e
i
a
I
P
+
1
1
1
]
1

¸


+ ·
/onde;
I

; $ímite inferior del intervalo que contiene la mediana.
+
n
; Iitad de la muestra
a
F
; Lrecuencia absoluta acumulada anterior a la frecuencia absoluta acumulada
,
i
F
. del intervalo que contiene la mediana.
i
f
; Lrecuencia absoluta simple del intervalo que contiene la mediana.
A ; Amplitud del intervalo que contiene la mediana.
/"%ta1as d" la +"dia%a
• $a mediana a diferencia de la media aritm%tica no depende de los valores, sino del
n#mero de datos, en consecuencia no se afecta por valores etremos.
+D
Luis Pajuelo Gonzáles
-------------------------------------------------------------------------------------------------------------------------------
• $a mediana a diferencia de la media aritm%tica no depende de todos los intervalos,
sino de un intervalo que contiene la mediana, en consecuencia generalmente no se
afecta por intervalos que no tienen límite inferior o superior definido.
E1"+plo 10 $a utilidad neta por la muestra de pedidos distribuidos por la empresa
Wuemalapata fueron los siguientes;
a. 1J.EC, +).C, 1C.), <1.+, +C.1, +(.), 1E.<, <+.C
b. JC.C, 1).D, 1@.), +E.E, ++.(, +).1, 1C.J,
Calcular e interpretar la mediana.
Solu!i(% 9a:0
Paso I0 Brdenar en forma creciente los datos.
1C,) 1E,< 1J,EC +),C +C,1 +(,) <1,+ <+,C
Paso II0 Bbservar si el n#mero de datos es par o impar.
n H ( par
Paso III0 =eempla"ar en las formulas
* + * + 1 @ C
+), C +C,1
+ + +
n n
x x x x
$e
+
+ + +
· · ·
++,( $e ·
I%t"#p#"ta!i(%0 El C)- de los pedidos tienen una utilidad neta de a lo más ++,( nuevos
soles y el C)- restante superior a este.
2olucionar la parte ,b. estimado alumno.
E1"+plo 20 $a utilidad neta de una muestra de C) pedidos distribuidos por la empresa
Wuemalapata se presenta en la siguiente tabla;
Calcular e interpretar la mediana5
Solu!i(%0
Paso I0 Brdenar en forma creciente los intervalos.
1#tilidad neta2
i
f
i
F
05 – 10
10 – 15
15 – 20
20 – 25
25 – 30
30 – 35
35 3 0
3
10
7
15
5
8
2
3
13
20
35
0
8
50
+E
Luis Pajuelo Gonzáles
-------------------------------------------------------------------------------------------------------------------------------
Paso II0 Sallar
C)
+C
+ +
n
· · que indica la posición de la mediana.
Paso III0 /eterminar la primera frecuencia absoluta acumulada ,
i
F
. que supera
+
n
,
entonces la primera frecuencia absoluta acumulada que supera a
+
n
es
@
F
H <C al cual
le corresponde el intervalo R+) O +C., donde se ubica el valor de la mediana.
Paso I/0 6dentificar todos los componentes de la formula en el intervalo que contiene la
mediana y reempla"ar.
+C +)
+
P +) PC
1C
a
I
i
n
F
$e A
f
1

1

· + · +
1
1
¸ ]
$e ; 21)@A
I%t"#p#"ta!i(%0 El C)- de los pedidos tienen una utilidad neta de a lo más +1,DE
nuevos soles y el C)- restante superior a este.
E1"+plo .0 El n#mero de paquetes del pedido registrado en una muestra de D),
distribuidos por la empresa Wuemalapata se presenta en la siguiente tabla;
Calcular e interpretar la mediana.
Solu!i(%0
%' de pa4uetes
i
x
i
f
i
F
1
2
3

5
6
7
6
9
20
15
5
3
2
6
15
35
50
55
58
60
+(
Luis Pajuelo Gonzáles
-------------------------------------------------------------------------------------------------------------------------------
Paso I0 Brdenar en forma creciente las clases.
Paso II0 Sallar
D)
<)
+ +
n
· · que indica la posición de la mediana.
Paso III0 /eterminar la primera frecuencia absoluta acumulada ,
i
F
. que supera
+
n
,
entonces la primera frecuencia absoluta acumulada que supera a
+
n
es
<
F
H <C al cual
le corresponde la clase num%rica <8 siendo este el valor de la mediana, es decir;
$e H <
I%t"#p#"ta!i(%0 El C)- de los pedidos tienen a lo más < paquetes y el C)- restante
superior a este.
C: Moda
Es un valor que generalmente se denota por, Mo, y que define como;
El valor cuantitativo o cualitativo nominal que más veces se repite.
El valor cuantitativo o cualitativo nominal más frecuente.
El valor cuantitativo o cualitativo nominal más com#n.
$a moda a veces no eiste y si eiste a veces es #nica o m#ltiple.
Cal!ulo d" la +oda
Datos %o a-#upados o %o ta'ulados
'o eiste formula alguna, se obtiene por simple observación, teniendo en cuenta la
definición de moda.
Datos a-#upados o ta'ulados 9sola+"%t" "% i%t"#$alos:
2e debe identificar por lo menos los siguientes pasos;
Paso I0 Sallar la mayor frecuencia absoluta simple, el cual se denotará como
frecuencia absoluta simple modal ,
$o
f
.
Paso II0 /eterminar el intervalo que contiene la moda.
Paso III0 6dentificar todos los componentes de la formula en el intervalo que contiene la
moda y reempla"ar.
A
d d
d
$o
I
P
+ 1
1
1
]
1

¸

+
+ ·
+J
Luis Pajuelo Gonzáles
-------------------------------------------------------------------------------------------------------------------------------
p $o
a $o
f f d
f f d
− ·
− ·
+
1
/onde;
I

; $ímite inferior del intervalo que contiene la moda.
1
d
; 7rimer incremento.
+
d
; 2egundo incremento.
$o
f
; Lrecuencia absoluta simple modal del intervalo que contiene la moda.
a
f
; Lrecuencia absoluta simple anterior a la frecuencia absoluta simple modal.
p
f
; Lrecuencia absoluta simple posterior a la frecuencia absoluta simple
modal.
A ; Amplitud del intervalo que contiene la moda.
E1"+plo 10 $a utilidad neta por la muestra de pedidos distribuidos por la empresa
Wuemalapata fueron los siguientes;
a. 1J.EC, +).C, 1C.), <1.+, +C.1, +(.), 1E.<, <+.C
b. JC.C, 1).D, 1@.), 1).D, ++.(, +).1, ++.(, ++,(
Calcular e interpretar la moda.
Solu!i(% 9a:0
'o eiste moda, dado que ninguno se repite más que otro.
E1"+plo 20 $a utilidad neta de una muestra de D) pedidos distribuidos por la empresa
Wuemalapata se presenta en la siguiente tabla;
Calcular e interpretar la moda.
Solu!i(%0
Paso I0 Sallar la mayor frecuencia absoluta simple,
$o
f
H 1C
Paso II0 El intervalo que contiene la moda es; R+) O +C..
1#tilidad neta2
i
f
05 – 10
10 – 15
15 – 20
20 – 25
25 – 30
30 – 35
35 3 0
3
10
7
15
5
8
2
<)
Luis Pajuelo Gonzáles
-------------------------------------------------------------------------------------------------------------------------------
Paso III0 6dentificar todos los componentes de la formula en el intervalo que contiene la
moda y reempla"ar.
1
1 +
(
P +) PC
( 1)
I
d
$o A
d d
1
· + · +
1
+ +
¸ ]
$o ; 22)22
1
+
1C E (
1C C 1)
$o a
$o p
d f f
d f f
· − · − ·
· − · − ·
I%t"#p#"ta!i(%0 $a utilidad neta más frecuente de entre todos los pedidos registrados es
aproimadamente ++,++ nuevos soles.
E1"+plo .0 El n#mero de paquetes del pedido registrado en una muestra de D),
distribuidos por la empresa Wuemalapata se presenta en la siguiente tabla;
Calcular e interpretar la moda.
Solu!i(%0
7or simple observación y aplicando el concepto de moda se tiene; $o H <
I%t"#p#"ta!i(%0 El n#mero de paquetes más frecuente de entre todos los pedidos
registrados es aproimadamente <.
E1"#!i!ios p#opu"stos
1. 7ara lan"ar un nuevo producto al mercado, una empresa estudia el tiempo de
publicidad, en segundos, empleando en los medios audiovisuales por otra empresa
que produce un producto similar.
%' de pa4uetes
i
x
i
f
1
2
3

5
6
7
6
9
20
15
5
3
2
<1
Luis Pajuelo Gonzáles
-------------------------------------------------------------------------------------------------------------------------------
6uraci7n %' de 0nuncios
0 3 20 3
20 3 25 17
25 – 30 13
30 – 0 9
0 3 60 8
a. MCuál es la duración media aproimada de los anunciosN MEs representativaN
b. MCuál es la duración más frecuenteN
c. MA partir de que valor un anuncio es de los veinte más largosN
d. Estudiad la forma de la distribución.
e. 2i cada segundo cuesta mil cuatrocientas pesetas, Mcuál es el gasto aproimado
que reali"a la otra empresa en la publicidad de ese productoN
+. $a distribución del importe de las facturas por reparación de carrocería ,en miles de
ptas.. de una muestra de () vehículos en un taller, viene dad por la siguiente tabla;
I,porte %' de ve89culos
0 3 60 10
60 3 80 20
80 3 120 0
120 3 180 10
a. Calcular el importe medio. Estudiar la representatividad en esta medida.
b. Calcular la mediana y estudiar su representatividad.
c. MCuál es el importe más habitualN
d. MWu% interpretación tiene en este caso los decilesN Calcular el tercer decil.
e. MCuál es el importe mínimo pagado por las EC reparaciones más baratas.
f. Estudiar la concentración del importe de las facturas.
1.A. MEDIDAS DE DISPERSIÓN
DE6INICIÓN
$as medidas de dispersión son valores de resumen que determinan aproimadamente la
variabilidad o el grado de separación de los datos respecto de su medida central, que
generalmente es la media aritm%tica. Estas medidas son; Xarian"a, /esviación estándar
y Coeficiente de variación.
A: /a#ia%Ba
D"&i%i!i(% 10 9Datos %o a-#upados o %o ta'ulados:
<+
Luis Pajuelo Gonzáles
-------------------------------------------------------------------------------------------------------------------------------
Es la suma de las separaciones o distancias al cuadrado de todos los valores
num%ricos observados respecto de su media, dividido por el n#mero de datos menos
uno.
/a#ia%Ba +u"st#al 9
+
% :

( )
1
+
+


·

n
x x
%
i
/onde;

i
x
; Xalores num%ricos observados en una muestra.
x ; Iedia aritm%tica
' ; !ama3o de la población.
n ; !ama3o de la muestra.
D"&i%i!i(% 20 9Datos a-#upados o ta'ulados:
Es la suma de las separaciones o distancias al cuadrado de todos los valores num%ricos
observados respecto de su media, multiplicado por su frecuencia absoluta simple y
dividido por el n#mero de datos menos uno.
/a#ia%Ba +u"st#al 9
+
% :
( )
+
+
P
1
i i
! # f
%
n

·


/onde;

i
! ; Iarca de clase de cada intervalo o valor num%rico de cada clase.
P#opi"dad"s d" la $a#ia%Ba
• $a varian"a es un n#mero no negativo y viene epresado en unidades cuadráticas.
• $a varian"a puede calcularse tambi%n en distribuciones de frecuencias de intervalos
de amplitud diferente, siempre que puedan determinarse las marcas de clase.
• $a varian"a se afecta por valores etremos, ya que depende de todos los datos.
B: D"s$ia!i(% "st*%da#
D"&i%i!i(%0 Es la raí" cuadrada positiva de la varian"a y nos indica C!ua%toD es la
variabilidad. 2e denota por 92:. Esto es;
<<
Luis Pajuelo Gonzáles
-------------------------------------------------------------------------------------------------------------------------------
+
% % ·
P#opi"dad"s d" la d"s$ia!i(% "st*%da#
• $a desviación estándar es un n#mero no negativo y viene epresada en las mismas
unidades en las que vienen epresados los datos.
• $a desviación estándar puede calcularse tambi%n en distribuciones de frecuencias de
intervalos de amplitud diferente, siempre que puedan determinarse las marcas de
clase.
• $a desviación estándar se afecta por valores etremos, ya que depende de todos los
datos.
C: Co"&i!i"%t" d" /a#ia!i(%
D"&i%i!i(%0 Es una medida de dispersión relativa ,libre de unidades de medida., que
se define como la desviación estándar dividido por la media aritm%tica.
Com#nmente se denota por 9CX:. Esto es;
1)) P
X
%
&' ·
• El coeficiente de variación es una medida #til para comparar la variabilidad de
dos o más series de datos que tengan igual o distintas unidades de medida, con
igual o distinta media aritm%tica.
• El coeficiente de variación permite tambi%n indicar la alta ,heterog%nea. o baja
dispersión ,homog%nea. de una serie de datos bajo el siguiente criterio;
2i CX Z 1C-, la serie de datos presenta baja dispersión ,o es homog%nea.
2i CX ≥ 1C-, la serie de datos presenta alta dispersión , o es heterog%nea.
E1"+plo 10 $a utilidad neta por la muestra de pedidos distribuidos por la empresa
Wuemalapata fueron los siguientes;
a. 1J.EC, +).C, 1C.), <1.+, +C.1, +(.), 1E.<, <+.C
b. JC.C, 1).D, 1@.), +E.E, ++.(, +).1, 1C.J, J.)
Calcular e interpretar la varian"a, desviación estándar y coeficiente de variación.
Solu!i(% 9a:0
/a#ia%Ba
7ara hallar la varian"a se necesita primero calcular la media aritm%tica muestral, esto es;
<@
Luis Pajuelo Gonzáles
-------------------------------------------------------------------------------------------------------------------------------
1J, EC +), C 1C, ) ... <+, C
(
i
x
x
n
+ + + +
· ·

X
H +<,DE
( )
+
+ + +
+
,1J, EC +<, DE. ,+), C +<, DE. ... ,<+, C +<, DE.
1 ( 1
i
x x
%
n

− + − + + −
· ·
− −

+
% H @+,<E
+
soles
D"s$ia!i(% "st*%da#
% ;
+
%
; @+, <E
% ; @)51 sol"s
I%t"#p#"ta!i(%0 $a variabilidad o grado de separación de cada utilidad del pedido
respecto de su promedio es aproimadamente D,C1 soles.
Co"&i!i"%t" d" $a#ia!i(%
D, C1
P1)) P1))
+<, DE
%
&'
X
· ·
&' H +E,C)
I%t"#p#"ta!i(%0 $a variabilidad relativa indica que las utilidades de los pedidos son
altamente dispersos, toda ve" que el CX H +E,C)- [ 1C-.
Solu!i(% 9':
7ara el estudiante o lector, resu%lvalo y refleione lo fácil que es.
E1"+plo 20 $a utilidad neta de una muestra de C) pedidos distribuidos por la empresa
Wuemalapata se presenta en la siguiente tabla;
Calcular e interpretar la varian"a, desviación estándar y
coeficiente de variación.
Solu!i(%0
/a#ia%Ba
Sallando primero la media aritm%tica
R>tilidad neta.
i
f
)C O 1)
1) O 1C
1C O +)
+) O +C
+C O <)
<) O <C
<C 5 @)
<
1)
E
1C
C
(
+
<C
Luis Pajuelo Gonzáles
-------------------------------------------------------------------------------------------------------------------------------
E, C < 1+, C 1) ... <E, C + 1)()
C) C)
i i
! f
x x x
#
n
+ + +
· · ·

#
H +1,D
( )
+
+ + +
+
P
,E, C +1, D. < ,1+, C +1, D. 1) ... ,<E, C +1, D. +
1 C) 1
i i
! # f
x x x
%
n

− + − + + −
· ·
− −

+
<1(@, C
@J
% ·


+
D@, JJ % ·
D"s$ia!i(% "st*%da#
+
D@, JJ % % · ·



(, )D % ·
I%t"#p#"ta!i(%0 $a variabilidad o grado de separación de cada utilidad del pedido
respecto de su promedio es aproimadamente (,)D soles.
Co"&i!i"%t" d" $a#ia!i(%
(, )D
P1)) P1))
+1, D
%
&'
X
· ·
CX H <E,<1-
I%t"#p#"ta!i(%0 $a variabilidad relativa indica que las utilidades de los pedidos son
altamente dispersos, toda ve" que el CX H <E,<1- [ 1C-.
E1"+plo .0 El n#mero de paquetes del pedido registrado en una muestra de D),
distribuidos por la empresa Wuemalapata se presenta en la siguiente tabla;
Calcular e interpretar la media aritm%tica.
'Y de paquetes
i
x
i
f
1
+
<
@
C
D
E
D
J
+)
1C
C
<
+
<D
Luis Pajuelo Gonzáles
-------------------------------------------------------------------------------------------------------------------------------
Solu!i(%0
/a#ia%Ba
1 D + J ... E + +)1
D) D)
i i
! f
x x x
#
n
+ + +
· · ·



<, <C < # · ≈
( )
+
+ + +
+
P
,1 <, <C. D ,+ <, <C. J ... ,E <, <C. +
1 D) 1
i i
! # f
x x x
%
n

− + − + + −
· ·
− −

+
11J, DC
CJ
% ·


+
+, )< % ·
D"s$ia!i(% "st*%da#
+
+, )< % % · ·


% H 1,@+
I%t"#p#"ta!i(%0 $a variabilidad o grado de separación del n#mero de paquetes en cada
pedido respecto de su promedio es aproimadamente 1,@+.
Co"&i!i"%t" d" $a#ia!i(%
1, @+
P1)) P1))
<, <C
%
&'
X
· ·
CX H @+,<J-
I%t"#p#"ta!i(%0 $a variabilidad relativa indica que el n#mero de paquetes por pedido
son altamente dispersos, toda ve" que el CX H @+,<J- [ 1C-.
D: M"didas d" Asi+"t#a
D"&i%i!i(%0 Es una medida que determina la deformación de una serie de datos con
respecto a un eje vertical.
D" la #"la!i(% "%t#" la +"dia a#it+3ti!a) +"dia%a 4 +oda se puede obtener la
asimetría de un conjunto de datos. Esto es;
2i $o $e X · · , los datos se distribuyen sim%tricamente.
2i $o $e X < < , los datos tienen asimetría negativa.
2i X $e $o < < , los datos tienen asimetría positiva.
Co"&i!i"%t" Asi+"t#a d" P"a#so%
<E
Luis Pajuelo Gonzáles
-------------------------------------------------------------------------------------------------------------------------------
D"&i%i!i(%0 2e define como el cociente de < veces de la diferencia entre la media y
la mediana sobre la desviación estándar. Esto es;
( )
%
$e X
As

·
P <
I%t"#p#"ta!i(%0
2i As H ) los datos se distribuyen sim%tricamente
2i As [ ) los datos se distribuyen asim%tricamente o sesgado positivamente
2i As Z ) los datos se distribuyen asim%tricamente o sesgado negativamente
E1"+plo 120 Calcular e interpretar el coeficiente de asimetría de la utilidad neta de una
muestra de C) pedidos distribuidos por la empresa Wuemalapata y presentado en la tabla
por intervalos.
Solu!i(%0
( )
<P # $e
As
%

·
7or resultados anteriores se tiene;
#
H +1,D
(, )D % ·
$e H +1,DE
=eempla"ando en la formula;
< ,+1, D +1, DE.
(, )D
x
As

·


As ; E =)=2@
I%t"#p#"ta!i(%0 $a utilidad neta de los pedidos distribuidos muestra un ligerísimo
sesgo o asimetría hacia la i"quierda o negativa.
E1"+plo 20 Bbtenga los coeficientes de asimetría de los restantes ejemplos anteriores
Mes sencilloN
<(