You are on page 1of 117

?

ESTAASVTCA
illétodos y Z\pficaciones

Iidütin Galinclo

I'¡3O CII:N CIA EDITOI3ES


20ll
Capítulo 1

Análisis Exploratorio de Datos

Nuestra fe en Dios. El resto debe produc'ir datos.


Anónimo

En cualquier actividad de Ia ciencia, la técnica, Ios negocios o de la vida cotidiana, que dé como
resultado una serie de mediciones, se obtiene más información que las simples cifras recolectadas. El
cómo conseguir la información, su análisis e interpretación se puede realizar de muchas maneras, pero
primero se debe tener una idea clara de las características más importantes de los datos obtenidos.

Los datos pueden ordenarse en tablas; sin embargo, éstas no muestran su comportamiento global.
Su representación gráfica ayuda a captar fácilmente tendencias y establecer modelos probabilísticos.
Conjuntamente con el empleo de métodos numér'icos sencillos, se puede presentar datos, resumir in-
formación y dar una respuesta rápida del comportamiento global de Ias unidades de donde provienen
dichos datos.

En este capítulo examinaremos varios de estos métodos, que son aquellos que frecuentemente aparecen
en los paquetes computacionales de estadística.

1.1. Introducción

En primer lugar, demos una definición de la ciencia Estadística que recoge mucho de lo que ella realiza.

La Estadística es la ciencia cuyo objetivo es reunir una información cuantitativa concerniente a


individuos, grupos, series de hechos, etc. y deducir de ello, gracias al análisis de estos datos. unos
significados precisos o unas previsiones para el futuro.

1.1.1. División de la EstadÍstica

Para su mejor estudio, a Ia EstadÍstica se Ia divide en dos grandes ramas: la Descriptiva y la Inferencial.

La Estadíst'ica Descriptiua -también conocida como Anó.lisis Erploratori,o de Datos- consiste, sobre
:odo, en la presentación de datos en forma de tablas y gráficos. Está diseñada para resumir o describir
los datos sin factores adicionales; esto es, sin intentar inferir nada que vaya más allá de los datos, como
:ales.
Capitulo 7. AnáIísis Exploratorio de Datos

se deriva de mur:stras, de observ¿rciones hechas sólo ¿rcerca de una parte de


La Esto,dística I'nferencial
un conjunto numeroso de elementos y esto irnplica qrre su análisis requiere de generalizaciones que van
más allá de Ios datos. Como consecnerrcia, la caracter'ística más importante del reciente crecimiento
de la Estadística ha sido un cambio err el énfasis de los métodos que describen a métodos que sirven
para hacer generalizaciones. La Estadística Inferencial investiga o analiza una población partiendo de
la información obtenida a través de muestras.

!.L.2. Algunos problemas que resuelve la Estadística

Para aplicar los métodos estadísticos a la información disponible, es necesario tener presente los tipos
de problemas que esta ciencia resuelve.

Descripción de datos. El primer problema que, históricamente, aborda la Estadística es la des-


cripción de datos. Supongamos que se han tomado ciertas mediciones, que pueden ser los gastos de
alimentación en las familias, la producción de las máquinas de un taller, o las preferencias en un grupo
de votantes. Se trata de encontrar procedimientos para resumir Ia información contenida en los datos.

Análisis de muestras. Es frecuente que, por razones técnicas o económicas? no sea posible estudiar
los elementos de una población. Por ejemplo, para determinar Ia opinión de la población ante las
elecciones solo se investiga a un grupo pequeño, ya que es imposible consultar a todas las personas
en capacidad de votar. Análogamente, se acude a una muestra para estudiar la rentabilidad de un
proceso de fabricación o para de terminar el nivel de ocupación de la población.

La Estadística se utiliza para elegir una muestra representativa y para hacer inferencias respecto a la
población a partir de lo observado en la muestra. Este es el procedimiento aplicado para, por ejemplo:

Decidir si un proceso industrial funciona o no adecuadamente, de acuerdo a las especificaciones.

Estudiar la relación entre consumo de tabaco y cáncer.

. hzgar respecto a la demanda potencial de un producto, mediante un estudio de mercado.

Orientar la estrategia electoral de un partido polltico.

Interpretar una prueba de inteligencia.

Medición de relaciones. Los gastos en alimentación de una familia dependen de sus ingresos, pero,
es imposible determinar con exactitud cuál será el ga.sto de una familia de ingresos dados. Entonces,
no existe una relación exacta, sino estadística. Determinar y medir estas relaciones es importante
porque, debido a los errores de medición, las relaciones que observamos entre variables fÍsicas, sociales
o técnicas son, casi siempre, estadísticas.

Preguntas como: ¿Depende la calidad de un producto de las condiciones de fabricación y transporte?


¿Cómo se relaciona el rendimiento escolar con variables familiares o sociológicas? ¿Cuál es la relación
entre desocupación e inflación?, se responden en términos estadísticos.

Predicción. Muchas variables económicas y físicas tienen cierta inercia en su evolución y aunque
sus valores futuros son desconocidos, el estudio de su historia es informativo p¿rra prever su compor-
tamiento futuro. Este es el mecanismo que se emplea para prever la demanda de un producto, la
temperatura en un horno industrial o las magnitudes macroeconómicas.
7.2. Definiciones básicas

1.1.3. Obtención de información


Cuando se examina un proceso o un fenómeno podemos producil una variada información, entonces
es preciso determinar cuál es la de interés para Ios fines que tengamos y cómo conseguirla; así mismo,
se debe tener una idea del número de observaciones que son necesarias para disponer de informaciórr
confiable.

Para la obtención de información estadÍstica se emplean dos formas bien diferenciadas: los métodos
de muestreo y los experimentos diseñados.

Una investigación por muestreo es un estudio cuya finalidad es la recolección de datos y en el que
el investigador no tiene control sobre las condiciones o los individuos participantes. Ejemplos de
muestreos son los censos, las encuestas electorales o de consumo de un producto.

Un experimento es cualquier proceso o estudio en el que se realiza una recolección de datos donde el
investigador, usualmente, tiene control sobre algunas de las condiciones bajo las cuales el experimento
tiene lugar. Por ejemplo, en el desarrollo de un nuevo medicamento, en la preparación de una nueva
aleación de acero para usar en los automóviles, es necesario realizar experimentos para comparar su
efectividad con otros previamente existentes.

L.2. Definiciones b:ísicas

Las que antes indicamos son las principales aplicaciones de la Estadística, cuando esta ciencia se
utiliza para analizar procesos o fenómenos naturales a profundidad. Pero este no es nuestro caso, por
el momento, nosotros podemos pensar que la EstadÍstica es la ciencia de <<deducir hechos a partir de
datos y de figuras>>.

Aquí surgen varias ideas importantes en todo análisis estadístico: la unidad muestral,la población (o
uniaerso) y la muestra.

Definición (de unidad muestral o experimental) Una unidad es una persona, animal, planta o
cosa que es examinada por un investigador; es el objeto básico sobre el cual el estudio o experimento
se lleva a cabo.

Por ejemplo, una persona, un mono, un plato de semillas, un grupo de facturas.

Definición (de población o universo) Una población es una colección completa de personas,
animales, plantas o cosas de las cuales se desea recolectar datos. Es el grupo entero al que queremos
describir o del que deseamos sacar conclusiones.

Definición (de muestra) Es un grupo de unidades seleccionadas de la población de acuerdo con


un plan o regla, con el objetivo de obtener conclusiones sobre la población de la cual proviene.

EI núrmero de unidades que constituyen la muestra se denomina tamaño muestral.

Generalmente, se selecciona una muestra porque la población es demasiado grande para estudiarla
enteramente. La muestra debe ser representativa de la población general, lo que se logra mediante
una selección al azar de las unidades. También, es importante que el investigador defina, completa
y cuidadosamente, la población antes de recolectar una muestra, incluyendo una descripción de los
miembros a ser seleccionados.

A continuación damos varios ejemplos:


4 Capítulo 7. Análisis Exploratorio de Datos

7. la estructula demográfic4, pol edad, de lti población ecuatoriana. El universo


Se desea establecel
Io forman los datos de nacimientos existentes en las ofi.cinas clel Registro Civil. Una mr-restra
puede ser tomada considerando las persolas cuyo apellido comienza con ia letra A.

2. En un estudio se quiere conocer el <<rating>> de sintonía de los canales de teievisión de una


ciudad. La población está constituida por los hogares que poseen televisor y una muestra Ios
hogares de 40 manzanas distribuidas en la ciudad.

3. Una dueña de almacén desea estimar el gasto medio de compra de sus clientes en su almacén
en el último año. La población es todas las facturas de compra en el indicado periodo. Una
muestra de ciento veinte facturas seleccionadas aleatoriamente, serviría para tener una idea del
gasto medio de los clientes.

En los ejemplos anteriores solo se enunciaron posibles muestras para las distintas poblaciones, sin
importar que tan buena pudiera ser ésta.1

I-.3. Datos y escalas de medición


A Ias mediciones o valores obtenidos en un estudio estadístico se los denomina datos provenientes de
una variable estadística.

1.3.1. Tipos de datos


Los datos pueden ser:

1. Cualitativos (Descriptivos o categóricos): Cuando ellos describen caracterÍsticas que no son


medibles; por ejemplo, el sexo de un animal, el color de los zapatos, la profesión de una persona.

2. Cuantitativos (Numéricos): Cuando ellos describen caracterÍsticas que son medibles; por ejem-
plo, la temperatura del ambiente, el número de hijos de un matrimonio, el salario de una persona.
A su vez, las variables cuantitativas se clasifican en discretas y en continuas.
Datos discretos. Un conjunto de datos se denomina discreto si los valores u observaciones
que pertenecen a él son distintas y separadas; es decir, ellas pueden ser contadas (1, 2,3, ...).
Ejemplos de datos discretos son: el número de clientes que ingresa a un almacén en un día, el
número de años que vive una persona.
Datos continuos. Un conjunto de datos se denomina continuo si Ios valores u observaciones que
pertenecen a él pueden tomar cualquier valor en un intervalo considerado. Ejemplos de datos
continuos son: el tiempo que se demora en ejecutarse un programa en la computadora, el peso
de una persona.

L.3.2. Escalas de medición

Definición (de escala de medición) Una escala de medición es un instrumento de medida con
el que se asignan valores a las unidades estadÍsticas.

I
La elección apropiada de las muestras se explicará en profundidad en el CapÍtulo 13
7.4. Característ,icas de los datos

Escala nominal' Un conjrrnto de clatos cstá mecliclo en esca,l,a nomin,al si a los vaiorcs que pertcnccen
a é1 se lcs puedc asignar un código, en la forma cle nn nrimero, clonde los núrmeros
sor simpleme¡te ula
cticlueta' Los datos en escala nominal ptteclen ser contados, pcro no pueden ser orclen¿clos o medi¿os.

Por ejemplo) elr Lln registro de pclsonas, los hornbres pueden ser codificados como 0 y las mujeres
como 1; el estado civil de un indirriduo puede codifi.carsc como "1" si es casado y como ,,2,'
si no lo es.
Escala ordinal. IJn conjunto de clatos cstá medido <:n esca,la ord.inal si a los valores qne per.tenecen a
él se les puede asignar un orden o asociar una escala. Los datos en escala ordinal pueden
ser contados
y ordenados, pero no pueden ser medidos.
Las categorías, para un conjunto ordinal, deben tener un orden natural; por ejemplo, suponga que
a
ur grupo de personas se les pide que clasifiquen la calidad de la señal de las emisiones de radio, en
una escala de 5 a 1, que representan excelente, buena, regular, mala y pésima. Un puntaje de
b indica
mejor señal que un puntaje de 4. Así, los datos resultantes son ordinales.

Escala de intervalo. Un conjunto de datos está medid o en escala d,e interualo si los valores que
pertenecen a él pueden tomar cualquier valor dentro de un intervalo finito o infinito, con
la particula-
ridad de que existe un <<cero relativo>>. Los datos en escala de intervalo pueden ser contados, ordenados
y son válidas las operaciones de adición y sustracción) pero no las de multiplicación y división.

Ejemplos de datos en escala de intervalo son: la temperatura medida en grados centígrados (donde
hay un cero elegido arbitrariamente), los puntajes obtenidos en una pruebalaonae un puntaje
de cero
no significa que quien lo obtuvo no sabe nada).

Escala de razón. Un conjunto de datos está medido en escala d,e razón si los valores que pertenecen
a él pueden tomar cualqnier valol dentro dc un intcrvalo finito o infi.nito, con Ia particula'idad
de que
existe un <<cero absoluto>>. Los datos en escala de intervalo pueden ser coritados, ordenados y
son
válidas las operaciones de adición, sustracción, multiplicación y división.

Ejemplos de datos en escala de lazón son: la temperatura medida en grados Kelvin (doncle
hay un
cero absoluto), la estatura de una persona, cl tiempo de vida úrtil de una máqnina.

1.3.3. Valoresatípicos

Un valor atípico -también denominado valor inusual o valor extremo- en un conjunto de datos,
es
t una observación que es lejana, en valor, del resto de datos; es clecir, es un d.ato inusualmente
grande
o innsnalmente pequeño, cotriparado con Ios dern¿is.

Un valor atípico ¡>uede ser el rcsultado de un error en una medición, en cuyo caso distorsiona Ia
interpretación de los datos al tetrer una influencia excesiva sobre los cálculos a partir
de la muestra.
Si el valor atípico cs un lesultado genuino es importante, porque podría indicar nn
compoltamicnto
S extremo del proceso en estudio. Por esta razón, toclos los valores atípicos deben
ser exarni¡ados
) cuidadosamente antes de rcalizar un análisis formal y no se los debería eliminar
sin una.justificación
pre\¡1a.

L.4. Características de los datos

Todo conjunto de datos presenta ciertas características que perrniten, en rlna pr.imera
aproximación,
deducir el comportirmiento dcl proceso del cr-ral fueron obteniclos. Las tres principales
características
son: la localización, la dispersión y la simetría.
Capítulo 7. AnáIisis Exploratorio de Datos

o tr ocalización. La krcaliz¿tción <le nn conjrrnto clc clatos cs la Posición lelatir'¿r cltic cllos lllesentan.
En gc'rrcr:rl, se rrricle ¿L la localiz¿rción lror cl valcil que tiene el pLrnto mr:clio clel corrjurrto c.1e clatos.
Por cljernplo, r,:rr la rnedici<in cl<r la r¡st¿rttu'¿r rl<,r lrrr grlipo de personirFj) l¿)s medicioncs est¡rr'án
entre los trcirrta centírnetlos (clc los rcciérr naciclos) y los cLos mctlos veinl,e centíne-
localiza,cl¿¡.s
tros (clc los adultos muy altos), si se srrl>one qucl esta,turas rxayorcs no se prcsentar, y se pirede
caracterizal a todos ellos con una estatura prornedio de 1.70 mctros.
La iclea de localización fr-ic introcluci<la por R. A. Fisher er 7922.

Dispersión. Los valores obtenidos en url¿ mnestra no son todos iguales. La valiación cntre
estos valoles sc denomnzt dispe'rsión. Cu¿rndo sc mide la dispersión sc desea dctectar el grado
de disemirración de los valores individuales alrededor del centro de ias observaciones.
En los procesos de manufactura o de medición) una alta precisión está asociada con una baja
dispersión.
El concepto de dispersión fue introdr.rcido por F. Galton (en 1886) y por W. Lexis (en 1887) e
identificado como aqrrel en el que se reflejan las cliferencias entre las mediciones) provenientes de
una misma fuente o tomadas en condiciones semejantes.

Simetría y asimetría. Un conjunto de datos es sirnétrico cuando los valores de los datos están
distribuidos en la misma forma por encima y por debajo de su punto medio.
Los datos simétricos:

1. Son fáciles de interpretar, pLles los dal;os c¡re están por encima y por debajo del pr.rnto medio
pueden sel considelaclos con un misrrio critcrio;
2. Pelmitcn la fácii detección de valores atÍpicos;
d. Adrniten la comparación con conjurrtos de datos similales, en tér'minos de la dispersión.

Figula 1.1: Forma csqucrnática cle clatos simétricos y asimétricos.

La asimctría cn un conjrtnto cie datos es el ¿lgrtrpaniiento que ellos Jrresentan a un lado de su centro
Los valores situados a un lado de la rnitacl clc los datos ticnclen a estar rnás alejados qrre 1os \¡¿rlores
clue se enclrerrtran cn ei otro l¿rdo.

1"5. Distribución de f,recuenaias

La distribuci,ónde ,f'rec'u,en"cias cs Lrrre herrarnicnta que se emplea para resurnir', mediantc una tabla,
nurnerosos d¿tos dc rnancra qlle sc ponga de maniliesto l¿ loc¿rlización y Ia clispersión de l¿rs ol¡serva-
cloLcs.
7.5. Distríbución de frecuencias

Con ltna tabla de frccuencia,s se puedcn resurnir- da,tos ctrtegór'icos, nominales u ordiuales. Si los clatos
son continrros se pr-rede lesumillos l.ln¿r \rez qlle se los ha dividido cn grupos serrsiltlcs.

Si se dispone (le un núrrnelo alto dc obsclvacioues) r¿, se procede ¿r cstablccel cr,rántas vcccs se rcpite
cada nrta de ellas, pala cletelrninar sn frecu,en,ci,u o,bsolutct, n". A par:til dc esta información bá,sic¿r se
puede obtencl o1,la, que es converriente poncrla etl nna tabla.

Par'¿r la confección de ltna tabla, de distribución dc frecuencias es lecomcrrdablc segu.ir los sigrrientes
Pasos:

Procedirniento.

1. Se ordenan los datos tr7) :[2) . . ., rk en ur]a columna, de forma ascendentc, poniendo a continuación
k
sus frecuencias absolutas n1, TL2¡ ...¡ n¡. Nótese que D rLi: n.
i:r
2. Luego se forma una tercera columna en la que se pone Ia frecuenc'ia relat'iua; que resulta de
dividir la frecuencia absoluta n¿ para el núrmero total de observaciones: /¿ - 3. Xo es más que
TL
la proporción de aparecimiento de cada observación.

3. Pueden, también, calculalse dos columrlas correspondientes a las fi'ecuencias acumuladas, tanto
absoluta como relativa, que resultan de sumar las frecuencias de todas las observaciones ante-
riores hasta la considerada inclusive. Muchas veces, a las frecuencias relativas se las pone como
porcentajes, en lugar de números flaccionarios.

Una tabla de distribución de frecuencias tiene cl siguiente aspecto:

Valor de la Frecuencia Fbec. absoluta FYecuencia Flec. relativa


variable (r¿) absoluta (n¿) acumulada (¡/,) relativa (/') acumulada (8,)
rI TL1 l/r : nr ft Ft: ft
tr2 n2 Nz: Nt * nz Jz Fz: Ft t fz

rk TLI, l/¡:l/¡-1 *n¡ fr F*:Fn:I.fn


Total n 1

Ejemplo. En nna fábrica de muebles de rnaclera, se contlolóe1 tiempo (en minutos) neccsario para
completar un trabajo cle armado de ciertos anaqueles. Se obturrieron las siguientes mediciones del
tiempo empleado por los obreros:

32.9 JJ.4 33.9 tao JJ.J 32.8 J.).1 .1.). i ) J,]..) 33.5
Dt ¡<
.)r).J 33.6 1') n .),). I 33.6 óó.4 33.6 33.8 33.9 t')
.)J. J
o

at o Dt( tto ,]to


33.6 r),).rl 34.4 JJ.I) JÓ.4 ÓJ -L t)ú.! 33.6
,ta 2q7 ot 1 .1.).) .lc r
JJ.r) JJ. I 33.8 33.0 JJ. / r)r).1 ,),). t) r)r).,)
to .'), - ,/ 1 '?a r) ,¡) .\ 1D Á
33.8 .),1. ') L)J.+
Á
J.J. / J+.1 J¿i.- 33.6 32.9 JJ.t
32.9 33.9 33.8 c.t o
.ltr-L
tD t
r).).r) 33.9 34.0 ,1.).J ,u q
.),)-i
tt 1
JJ. l-
33.1
.)Á
J+.1 1 '),)
JJ.A 33.6 óJ. i) JJ. / óó. i 1'),4 a.)
.).).,)
.) .)t Á
!)().+
^

34.0 il :'t3.0 tD OD D
óó. DD
rlJ.+ r',
,1,1. ,),).4^ JJ.J JÓ.+ 33.6 33.6 /
.)t r '12 r) ,j.l 1
r)r).J 33.6 33.0 JJ.1 33.6 JJ.U 33.6 33.1 33.8
,),
J.J. / ,-),1., ) 33.8 JJ.
1
1 .),)..) 33.0 .).) ,.) 33.4 ÓJ. iJ 33.0
Capitulo 7. Análisis Exploratorio de Datos

La sigr-riente taJrla rrnrestra l¿i clistril¡rrción cle flecrrerrci¿ts dc clatos illrliviclrt¿rlns (crr 17 r':rl,rres).

Tierrrpcr f,tecuencia F\'ec. ¿rbsoluta Fl"ecuencia F!'cc. rel¿rtiva


(rnin) absoluta (n¿) acurmrlada (;\) rela.tiva ( l¿ ) acurnulada (,F,)
,t:.1 I t 0.01 0.01
32.8 I 2 0.01 0.02
e
32.9 5 003 0.05
33.0 5 10 0.05 0. 10
,t 1I 0.09 0.19
r)J. 9 19
aD o q 28 0.09 0.28
JJ.J 10 38 0.10 0.38
JJ.4 t2 50 0.12 0.50
I4 64 0.14 0.64
33.6 13 77 0.13 0.77
.)¿). r 8 85 0.08 0.85
33.8 6 9r 0.06 0.91
33.9 4 95 0.04 0.95
34"0 2 97 0.02 0.97
34.t 2 99 0.02 0.99
tÁ a 0 99 0.00 0.99
34.3 0 99 0.00 0.99
34.4 1 r00 0.01 1.00
Total r00 1.00

Sc ha presentado una distribución de frccuencias para 100 datos individuales, pero la tabla pr-rede
Ilegar a scr exterlsa; y si bicn prescnta la, información resunicla, puede ser conveniente resumirla aúrr.
rrrtis, c;r'eando cl¿rses. La agrr-rpac:ión cle clatos cn cl¿rscs sirnplificir Ia presentación y el estuclio cle la
distribución) allnqlle se pierden algunos rleta,lles.
A continuaciórr sc enLlnleran los ptrsos a scguir para constrllir una clistribr-rción de fiecnenci¿rs cle dat,os
agmpatlos en cl¿rses:

Decida el número de clases (ft). La siguienl,e talrl¿r puccle clar rura olientación adccuada cn
Ia rnayor'ítr de los casos.

Número de Número de clases


observaciones recomendado
20-50 6
51 - 100 7
101 - 2U0 B

201 - 500 o
501 - 1000 10
rnás clc 1000 t|-20
Calcule la iongitud de ia clase. La longitrrcl clc la cl¿lsc cs igual a Ia obsclrración rnayol menoil
dividido por cl nLilrrero de clases. Rcdonclcc este rcsulLado pala obtenel rrn rrúrnrero
li1 ttrcnor,
cor)venicnte) que tenga el mismo níurelo de decimales qlre los d¿rtos.
/nráx - frnín
.4
k

,) Construya las clases indicando los cxtremos de Ias misrnas. Cor¡ro ayllda parzr cálculos
J)ostcIioICS:

a) El extremo inferior' (16) plimera clase será cl lírrrrero ilrnediatarnentc rnerror- a1 r'alor'
de 1a
mÍnimo, quc tierle rrn clecirn¡rl rnás y qlle terlnrna cn cnco-
7.5. Distribución de frecuencias

b) f,os restantes extremos de las clases se obtienen ailadiendo repetidarnente la longitud de


clase al extrenro cle c1¿rse anterior, hasta cnbrir todo el rango cle valolcs.
L, : Li-t I A, .j : i,2,...,k.
4 Marque cada observación dentro de la clase que le corresponda. Determine la frecuencia
absoluta, 7r,¿, corr€spondiente a cada clase.

5. Calcule las columnas restantes. IJna vez que tiene la frecuencia absoluta, proceda a calcular
las frecuencias lelativa y acumuladas) como se explicó anteriorrnente.

Observación. El número de intervalos puede variar del inicialmente estimado al redondear el valor
de la longitud del intervalo y que se cumpla el paso 3 a).

Ejemplo. (Continuación.) Construir una distribución de frecuencias por clases de los datos de las
mediciones del tiempo necesario para armar anaqueles.

Solución: De acuerdo a la tabla los datos se distribuirán en k:7 clases. Los máximos y los mínimos
son:
r^5* -- 34.4, rmí. : 32.7, rmáx - trni. : L.7,

1n
longitud de la clase : ::: :0.24,
7

que se redondea a A:0.2.


Fijemos los extremos de los intervalos: el extremo inferior debe ser el número inmediatamente menor al
valor mínimo, que termina en 5 y tiene un decimal más que los datos; es decir, Lo:32.65. Luego, Ios
extremos siguientes se determinan sumando, sucesivamente, 0.2 al extremo inferior hasta sobrepasar
el máximo valor de las observaciones:
L1 : Lo * A: 32.65 * 0.2 : 32.85
L2 : Lt * A: 32.85 * 0.2 : 33.05
:

Ls : Le -l A:34.25 *0.2:34.45

Finalmente, se determinan las frecuencias de cada clase.

A continuación se muestran los resultados.

Tiempo FYecuencia FYec. absoluta -tYecuencia Flec. relativa


(min) absoluta (n¿) acumulada (.11,) relativa (/¿) acumulada (fl)
JZ.ti5 - J2.E5 2 0.02 0.02
32.85 - 33.05 10 0.08 0.10
33.05 - 33.25 r8 28 0.18 0.28
33.25 - 33.45 22 50 0.22 0.50
33.45 - 33.65 27 77 0.27 0.77
33.65 - 33.85 t4 91 0.14 0.91
33.85 - 34.05 97 0.06 0.97
34.05 - 34.25 99 0.02 0.99
34.25 - 34.45 100 0.01 r.00
Total 100 1.00

Nótese que por efecto del redondeo en Ia longitud del intervalo ha dado un total de 9 clases. Queda
para el Iector realizar el mismo ejercicio redondeando la longitud de Ia clase a 0.3.
10
Capítulo 7. Análisis Exploratorio de Datos
1.6. Representaciones gráficas
de los datos
una rnanera rntly eficiente cle co'oce.
gráficamente' ya que permite
el corn¡lo.ta'riento de un conjunto
dar rtna descripciin a. cre datos es re¡rrese'tar.lo
-"r,lr" rápida y ráit de entender. La importancia
i: ::rff ;Tfi:,::l il:T:T.5 f*13¡,T# l.:, :ll" : ".o an ¿,isis ". t J.t i"o de b e ir acomp añado

1.6.1. Diagrama de puntos


un di'aqrama d'e puntos es una
forma de resumir datos cuantitativos,

;'":T::1,1J*?ll""Til*'q,,:T: ffiñJ: il#;' en ra que cad.a observación


si se disponu a"'lo,"r,os datos, se
cada punro
El diagrama de puntos deja apreciar:

1' Larocarización general de ras


observaciones.
2. La dispersión de las observaciones.

3' La presencia de observaciones


inusuales o valores atípicos.

se aconseja utilizar este diagrama


para representar hasta
un máximo de 20 0bservaciones
individuales,
ffi :JJ.:ffi .H;.:".rTT:i :::il'Ji :* ::,,'*x;:::.: *. i;;#;, s e p ue d en combi
n ar

lli"t-,;,TJrij:"ffi"#::;HX'uu au ru"' i","n,",."iuJl'TT:#il"l'?;:X[::?l".;;


iT;':
cuando se construye un.diagrama de puntos se
deben toma¡ dos decisiones.
La primera es determinar
;i,:JffffJil,:HTJ;:::il;.1*:: ;:;**:."","11fT1,,"*u,0" ;.;l;; ,í,*u
"."u,u
apropiada que
Para datos nominales u ordinales,
un diagrama de puntos es.simirar
barras reemplazadas por a un gráfico de barras, con
una serie de puntos. Para ras
a un histograrl&, con ros iatos contin,os, un diagiama
rectangurás ieemplazado, de puntos es similar
oorl.,-riior. (vcase r" ,'"*io" r.o.a¡
#:;::i:;"tü;1:"::"t'"T"1il mediciones (en milímetros) de ros días de lruvia en er verano de 2006

6'4 4'0 3'2 4'6 3'2 8.2 6.0 0-2


4.6 5.2 0.6 2.0 11.8 16.4 3.2.
El diagrama de puntos está
dado en la Figura 1.2.

i'if?sii u.,n*
Figura 1.2: Diagrama de puntos.

En el diagrama observamos que:


7,6. Representaciones gráficas de los datos 11_

1. Los datc¡s están agnrpados ccrca del valor 3, antes que, digamos B o 10.

2. Las observaciones sc cxtiencleu en ah'ecledor clc 17 uriidacles) con Llua concentración entre 0 y 8.
o
a 3. EI valor 16.4 puede ser calificado de atípico, porque se clcuentra alejado del grupo principal de
o datos.

L.6.2. Diagrama de tallo y hojas


El diagrama de puntos tiene algunas desventajas: es difícil regresar de los puntos a los datos y puede
hacerse confuso si se tiene un número alto de datos. Entonces, es conveniente utilizar otras herramien-
;e
to
tas para realizar su representación gráfica.

El diagrama de tallo g hojas, que es una técnica semigráfica que se emplea para ilustrar las principales
características de los datos (localización, dispersión y simetría). Además, tiene la ventaja de presentar
Ios valores de los datos. Por la forma en que se construye, se debe emplear para un conjunto de hasta
100 datos.

Mediante un ejemplo, veamos cómo se realiza el diagrama, p6o a paso.

Consideremos los siguientes datos:

08 19 77 01 07 09 05 16
13 04 15 02 00 o4 01 12
es)
tar A los datos los clasificaremos considerando las decenas; así tendremos dos grupos, uno que empieza
trá con 0 y otro que empieza con 1. Ellos forman el tallo, al colocarlos de manera vertical:
)o
0
rar 1

lue
A continuación, para cada observación anotamos el segundo dígito (de las unidades) a la derecha de
la barra vertical, que vienen a constituir las hojas. La primera observación 08 da
las
üar
0
1
006
Al agregar la segunda observación 19, da

0 8
1 9

Y así, se van añadiendo las observaciones hasta obtener:

0 8L79542041
1 976352

Los valores que forman las hojas pueden reordenarse de menor a mayor, así:

0 0LI2445789
1 235679
12 Capítulo 7. Análisis Exploratorio de Datos

Podemos crear dos categorías en cada una de las decenas, en las cuales los dígitos de las unidades del
0 al 4 formen un F,rupo y los dígitos del 5 a 9 foimen otro; de esta manera se tiene:

t) r42047
0 8795
1
to
¿¿
1 9765

Cuando los datos constan de más de dos cifras, se deben escoger los rangos para las agrupaciones
que se realizarán;luego aI llcnar las hojas se separan mediante una coma para evitar confusiones. Si
disponemos de los siguientes datos:

qD
DJ 55 79 106 188 47 118 248
47 58 82 113 208 60 88

Se pueden realizar dos diagramas de tallo y hojas:

0 33,47,47,55,58, 60, 79, 82, 88


1 06, 13, 18, BB
2 08, 48

que está agrupado por centenas. El siguiente diagrama está agrupado en intervalos de 50:

0 33,47,47
0 55,58,60, 79, 82,88
1 06, 13, 18
1 88
2 08, 48
2

Asimismo, se pueden usar diagramas múltiples para comparar dos conjuntos de datos, para ello se
coloca un tallo común y las hojas de un conjunto se ponen a la izquierda del tallo y las hojas del
segundo conjunto a la derecha del tallo, de la siguiente manera:

4371 1 44
ft 9888655 1 5779
310 2 0L23344
99875 2 678
311 3 03
.) 5
4

Se observa que los datos de la izquierda están más agrupados en los valores bajos, con un rango mayor
y fuerte asimetría; mientras que el conjunto de la derecha es muy simétrico y con menor dispersión.

También, se emplean estos diagramas para representar datos con decimales; por ejemplo, si tenemos
los datos:

1.3 0.8 1.6 2.0 r.7 7.2 0.5 1.9 0.6 2.2 0.5 1.6.
7.6. Representaciones gráficas de los datos 13

El cliaglanra rcsrrltalte <rs:

0. 5568
1. 236679
2. 02

1.6.3. Gráfico de sectores y gráfico de barras


Los gráficos de sectoles y de barras son dos formas de ¡lrcsentar gr-tlficamente datos categóricos.
Supongamos que los datos aparecen resumidos en una tabla como Ia siguierrte:

FYecuencias Fbecuencias
Categorías
absolutas (n¿) relativas (/¿)
Ct u f,
Cz n2 fz

Cn ;, ir
Total n, 1

Un gráfico de sectores es un círculo dividido en segmentos, donde el área de cada uno de los sectores
es proporcional a la frecuencia relativa de esa categoría. El ángulo central de la categoría es igual a
fi x 360".
Junto a cada uno de los sectores que constituyen el gráfico, se suele indicar el nombre, el número de
elementos y el porcentaje de cada categoría.

También, se puede resumir datos cualitativos mediante rn gró.fi,co de baryas. En éstos, los datos
se exhiben mediante rectángulos, del mismo ancho, cada uno de los cuales representa una categorÍa
particular. La longitud (y por lo tanto el área) de cada rectángulo es proporcional al número de casos
en la categoría que representa.

Si los datos son nominales, las categorÍas se pueden colocar en cualquier orden; pero si los datos son
ordinales, las categorías deben estar ordenadas.

Los gráficos de barras se pueden presentar de manera horizontal o vertical y usualmente hay un espacio
entre los rectángulos. Junto a cada uno de los segmentos que componen el gráfico se coloca el nombre
el número de elementos y el porcentaje de cada grupo.
Con el gráfico de barras se distinguen las principales caracterÍsticas de los datos, como aquellas causas
que son más importantes o que más frecuentemente se presentan en un proceso. También, tiene la
ventaja de que se pueden realizar gró,,ficos de barras agntpadas, que consiste en representar sobre el
mismo gráfico más de dos variables -siempre que estén medidas en las mismas unidades-, permitiendo
realizar comparaciones,

Ejemplo. En una empresa financiera, los empleados disponen de computadortrs portátiles de distintas
marcas. Un resumen del número de máquinas, de acuerdo a su respectiva marca, se presenta en el
siguiente cuadro.

Marca Número de % Marca Número de %


respuestas respuestas
Toshiba 135 42 Lenovo 43 13
Dell 76 23 No sabe 19 6
HP 53 16
t4 Capítulo 7. AnáIisis Exploratorio de Datos

Representar mediante gráficos de sectores y de barras.

Solución: Los gráficos se encuentran err Ia Figura 1.3.

Toshiba

Toshiba Dell HP Lenovo No sabe

Figura 1.3: Gráficos de barras y de sectores.

L.6.4, Histograma

Un histograrna es un conjunto de rectángulos, cada uno de los cuales representa un intervalo de


agrupación. Sus bases son iguales al intervalo de clase empleado en la distribución de frecuencias
y las alturas son proporcionales a la frecuencia absoluta,fi,¿ o relativa /¿ de la clase.

El histograma es apropiado para datos continuos, medidos con una misma escala y se lo emplea
cuando un diagrama de tallo y hojas es tedioso de construir. Igualmente, puede ayudar a detectar
observaciones atípicas y cualquier brecha entre los datos.
Ejemplo. (Continuación.) El histograma correspondiente a la tabla de distribución de frecuencias
de los tiempos de ensamblaje de anaqueles se presenta a continuación.

Figura 1.4:

1.6.5. PolÍgono de frecuencias y ojiva

Un polígono de frecuenci¿s es un gráfico que se obtiene uniendo con segmentos de recta los puntos que
tienen proporcionalmente como abscisa a la marca de clase y como ordenada la frecuencia respectiva.
Se cierra en ambos extremos en las marcas adyacentes con frecuencia cero.
7.7. Ejercicios 15

La ojiua es un polígono de frecuencias acumuladas; es decir, en las abscisas se colocan los límites
superiores de cada intervalo de clase y en Ias ordenadas se coloca la frecuencia acumulada (absoluta o
relativa) de la clase. La ojiva es útil para:

1. Calcular el número o el porcentaje de observaciones que corresponden a un intervalo determinado


de Ia variable.

2. Calcular los percentiles de la distribución de los datos.

Ejemplo. (Continuación.) El polígono de frecuencias y la ojiva, correspondientes a la tabla de


distribución de frecuencias de los tiempos de ensamblaje de anaqueles se presenta a continuación.

Figura 1.5: Polígono de frecuencias y ojiva.

Una vez que se ha confeccionado una tabla de frecuencias y se ha realizado Ia representación gráfica
correspondiente, es necesario disponer de valores que permitan describir y compara¡ los conjuntos de
datos, mediante números que indiquen su posición, su variabilidad y su forma. Ésto se realiza con las
llamadas medidas estadísticas o simplemente estadísticos.

L.7. Ejercicios
1. Dé ejemplos (preferentemente de su propio campo) de poblaciones y muestras.

2. Para cada uno de los distintos tipos de datos: discretos (categóricos, ordinales y nominales) y
continuos, enuncie al menos dos ejemplos. Justifique sus respuestas.
3. En una encuesta de opinión acerca de las preferencias de bebidas gaseosas, por sus colores: negro
l
(N), blanco (B) V R (rojo), 20 consumidores dieron las siguientes respuestas:
i

N, B, B, N, R, B, B, N, N, B, N, B, B, R, N, B, N, R, N, B.
I
Construya el gráfico de sectores circulares.

4. Los siguientes datos corresponden al porcentaje de alumnos de cuarto grado de escuela, clasifi-
cados según su rendimiento académico en la materia lenguaje.

Calificación %
Insuficiente 53
Regular 26
tre
Bueno 15

ta. Muy bueno 5


Sobresaliente 1
16 Capítulo 7. Análisis Exploratorio de Datos

a) ¿,Con quó tipo d<; datos est¿i ustcd tlalra,jauclo? Explique.


b) Retrlir:e los gr'áficos cle pastel y dc barrtr,s clc los d¿rtos.

c) ¿.Qué porcenta.jc de los alurnrros cle cuarto graclo tien<:u urr renclirnierrto <<bucno>> o mejor
que bueno?

E
i). En Ia siguiente tabla se describe diferentes razas d<r perros, según varias caracterÍsticas obser-
vadas.
R,aza Tamaño Peso Velocidad Agresividad Función
basset 11 I 2 2
boxer' 22 2 2 I
bauceron 32 2 2 r)

bulldog 11 I 1 1

caniche 11 2 1 1

chiguagua 11 1 1 1

cocker 2I 2 2 1

colley 32 3 1 1

doberman 32 3 2 3
dogo 33 3 2 ,
r)

fox hound 32 3 2 2
galgo 32 3 1 2
labrador 22 2 1 2
mastin 32 3 2 3
pekinés 11 1 1 I
podenco 22 2 1 2
pointer 32 3 1 2
san bernardo 33 1 2 3
teckel 11 1 1 1

teI'ranor¡a 22 1 1 3

donde la codificación es la siguiente:

Tamaño: 1 tamaño pequeño; 2 tamaño mediano; 3 tamaño grande.


Peso: 1 peso pequeño; 2 peso mediano; 3 peso grande.
Velocidad: 1 velocidad leve;' 2 velocidad mediana; 3 velocidad grande.
Agresividad: 1 agresividad leve; 2 agresividad grande.
Función: 1 compariía;2 caza;3 utilidad.
a) ¿A qué tipo de datos pertenece cada caracterÍstica definida en la tabla?;
b) Para cada variable, realice el gráfico de pastel o el gráfico de barras;
c) Compare los distintos gráficos y deduzca cuáles variables están relacionadas. Explique su
respuesta.

6. Se tiene la siguiente información acerca de la composición del cuerpo humano.

Figura 1.6: Distribución de materiales en el cuerpo y distribución de las proteinas.


7.7. Ejercicios t7

¡,Qué porcentaie del peso total del cuerpo humano corresponde al peso total de la piel?

7. Se registró Ia distancia diaria (en km) que el representante comercial de una empresa recorre
para visitar a sus clientes:

8.2 13.3 10.1 11.5 13.5 7.6 r0.4


4.6 10.5 72.6 13.0 t2.0 4.3 7.7
5.9 10.0 10.8 13.1 14.1 5.0 t2.0
6.5 L2.7 15.0 10.4 t3.2 8.3 13.6

a) Realice un diagrama de puntos para los datos;


b) Realice un diagrama de tallo y hojas;
c) Determine la tabla de frecuencias;
d) Dibuje el histograma;
e) Compare este último con los diagramas de puntos y de tallo y hojas.
8. La inversión anual, en miles de dólares, de una muestra de 40 pequeñas empresas fueron:

36 19 29 37 33 22 29 31 2L 35
2042534 24 27 27 24 26 31
27 77 31 10 28 15 41. 30 18 39
46 26 12 23 18 33 25 28 23 28
a) Elabore una distribución de frecuencias con 7 intervalos de clase;
b) Realice el diagrama de tallo y hojas;
c) Determine el porcentaje de empresas con una inversión entre 14 mil y 20 mil dólares.

9. Los ingresos mensuales de una muestra de pequeños comerciantes se tabularon en una distribu-
ción de frecuencias simétrica de 5 intervalos de clase de igual amplitud, resultando como ingreso
mÍnimo 125 dólares, marca de clase del cuarto intervalo: 300. Si el 8 % de los ingresos son
menores que 165 dólares y el 70 % de los ingresos son menores que 275 dólares. ¿Cuál es el
porcentaje de los ingresos que son superiores a 285 dólares?

10. Se tiene la siguiente tabla acerca de las edades de los obreros de cierta empresa:
No. de
Edades
obreros
22-27 L4
27 -32 17
32-37 25
37-42 10
42-47 I4

Encuentre el porcentaje de obreros cuyas edades están comprendidas entre 35 y 40 años.

11. La siguiente tabla muestra la distribución de las notas en un examen.

Nota No. alumnos


0-5 7
5-10 18
10-15 i5
r5-20 10

¿Qué porcentaje tuvieron una nota comprendida entre 8 y 17?


18 Capítulo 7. AnáIisis Exploratorio de Datos

12 Al clasifical las no+"as cle 0 a 100 cn un exarnen,se obtuvo una distribución simét,rica, con 5
intervalos de clase de iglral ancho. Si el 10% desaprotró con rnenos de20, rnientra-s qurcel 40o/o
obtlrvo notas comprendidas entre 40 y 60, ¿,qrré porcentaje de alurrinos obtuvo una nota rnenor
de 60?

13. En la tabla se indi,can los tiempos de espera en las ventanilias de un banco.

Tiempo (rnin) Frec. absoluta Frec. relativa


03 32
3-6 0.30
6-9
9-12 8 005
12- 15 0.10

Halle el tamaño de Ia muestra y complete la tabla de distribución de frecuencias.

14. Los pesos de n artículos se ordenaron en una tabla de distribución de frecuencias de 7 intervalos
de igual ancho de clase, donde: mín : 50 g, máx : 120 g.

Además, ft : fz, fs: fs, fs t fa I fz :0.36, n1-l nz I n3 -r n4 -_- 560 y U. :64.

a) Determine el valor de n;

b) ¿Cuántos de estos artículos tendrán un peso mayor o igual a 60 g y menor a 110 g?

15. Halle el tarnaño de la muestra y reconstruya Ia siguiente tabla simétrica de distribución de


frecuencias.
Frec. relativa
Intervalo Frec. absoluta Frec. relativa
acumulada
10- t2 7
12- 0.24
0.52
5
18-20

16. La tabla muestra la distribución del ingreso familiar mensual de 80 familias.

Frec. absoluta
Intervalo Frec. absoluta Frec. relativa
acurnulada
640 - 680
680 - 720 48 60
720 - 760 0.r25
760 - 800 0.075
800 - 840

Determine el número de familias que tienen un ingreso menor a 800 dólares mensuales.

17. Dado el siguiente histograma de frecuencias relativas. ¿Cuántas observaciones hay en el rango
[c, /], si el total de la rnuestra es de 400? 2(
7.7. Ejercicios 1_9

Figura 1.7:

i8. En el siguiente gráfico se muestra el consumo de energÍa en una fábrica.

¿Qué porcentaje del consumo diario se utiliza desde las 19h hasta las 24h?

19 En la siguiente ojiva se representan los porcentajes de personas que componen un grupo de


personas) según su edad.

100

55
45
25
10
12 17

Figura 1.9:

Determine qué porcentaje de personas tienen edades comprendidas entre 10 y 15 años.

go
20. Dada la ojiva correspondiente a los gastos en servicios de los hogares de una ciudad.
20 Capítulo 7. Análisis Exploratorio de Datos

/D

Figura 1.10:

Reconstruya la tabla de distribución de frecuencias.

1.8. Medidas de localización

Cuando se dispone de un conjunto de observaciones, es de interés encontrat el valor en torno al cual


se agrupan la mayorÍa de ellas o el centro de las mismas. Las medidas descriptivas que permiten
especificar estos valores se denominan medidas de localización o md,idas de tendencia central.

Existe una amplia variedad de medidas de localización; nos concentraremos en las m¿ís empleadas: el
promedio, la mediana, la moda, la media geométrica y la media armónica.

1.8.1. La media muestral o promedio

Definición (de promedio o media aritmética) El promedio, notado como 7, de un conjunto


de n mediciones 21, r2t...,,rn es igual a la suma de sus valores dividido entre n; es decir,
n

rt*rz*.'.*rn Drn
i=l
&-
n

. Si las observaciones están agrupadas en una tabla de frecuencias de datos individuales como la
siguiente:
Observación Flec. absoluta
rI fLy
I2 n2

rk nk

donde n¿ es la frecuencia absoluta de la observación ,ri, el promedio se calcula por

k
Dnn'n
¿:t
&
sa
I: ---=-,
n
COn n: z_rn.
d:l
7,8. Medidas de localización 2L

. Si los datos se presentan en una tabla de frecuencias, agrupados por clases:


Clase LIC LSC Punto medio Frec. absoluta
1 l1 5t rl Tr1

2 I2 S2 r2 TL2

k t"¡ 9p ;r rLk

se calcula el punto medio cle cacla clase rromo iri :; l¿ I s¡' ' '
Q,:1,2,, .. , k) y el promedio es
k
I
i1
rr,¡ r¡ k

t con 7¿:l n¿.


n
i:7

Ventajas e inconvenientes del empleo del promedio:

1. Se expresa en Ias mismas unidades que la variable.


2. En su cálculo intervienen todos los valores de la distribución.
ual
ten 3. Es el centro de gravedad de toda la distribución, representando a todos Ios valores observados.

4. Es único.
;EI 5. Su principal inconveniente es que se ve afectado por la presencia de valores atípicos.

Ejemplos

1. Calcular el sueldo promedio de diez personas que ganan (en dóIares):


170 r72 168 165 173 t78 180 165 767 172.

Soluci,ón: Se dispone de n : 10 observaciones sin agrupar, entonces


11*rzl..'*rn
&-
n,
170 + 172 +168 + 165 + 173 + 178 + 180 + 165 + 767 + r72
10
: I7L.

2. Calcular la estatura promedio de 46 señoras, cuyas medidas se dan a continuación.


ro la
1 It 1 ta
Estatura 1.45 1.48 1.50 t,du 1,55 L,(, f 1.60 i.63 1.65
t
Flecuencia 2 4 5 B 72 7 4 t) 1

Solución: Como las mediciones están agrupados en una tabla de datos individuales, aplicamos
Ia fórmula que considera la frecuencia de cada una de ellas.
Téngase presente que el número de clases €s k : 9 y el tamaño de la muestra es n: 46.
I
I n'¡r¡
r:i:l
n,
2x I.45*4 x 1.48+... +3 x 1.63 * 1 x 1.65
46
r.545.

Los 46 señoras examinadas tienen una estatura promedio de 1.545 metros.


22 Capítulo 7, AnáIisis Exploratorío de Datos

3. En una cooperativa de ahorro y crédito se realizó Ia tabla de frecuencias de Ios montos de los
ahorros de sus socios (en dóIares), según se presenta en la tabla,

Desde Hasta Fbecuencia


0 100 72
100 200 28
200 30 46
300 400 77
400 500 186
500 600 224
600 700 209
700 800 r22
800 900 53
900 1000 19

Calcular el promedio de los ahorros de los socios de la cooperativa.


Soluci'ón: Los datos están agrupados en 10 clases. En primer lugar encontraremos el punto
medio de cada clase y los pondremos en la tabla:

Desde Hasta Punto medio (z¿) Flecuencia (n¿)


0 100 50 72
100 200 150 28
200 30 250 46
300 400 350 7r
400 500 450 186
500 600 550 224
600 700 650 209
700 800 760 722
800 900 850 53
900 1000 950 19

Ahora, empleamos Ia fórmula que considera la frecuencia de cada una.


10
Tenemos que k : 10 y D n¿:970. Por tanto,
i:1
10

D'¿*n
Á t--l
TL

12 x 50*28 x 150+.,. +53 x 950* 19 x 950


970
: 555.155.

El ahorro promedio de los cooperados es de b5b.16 dólares.

1.8.2. La mediana
La mediana fue por primera vez utilizada, como una medida de localización, por A. A. Cournot en
1843 y redescubierta por F. Galton en L882, año desde el cual su empleo se ha generalizado.

Definición (de mediana) La mediana de un conjunto de datos xr, z2: .. ., rn es el valor que se
encuentra en el punto medio, cuando se ordenan los valores de menor a mayor.
1.8. Medidas de localización 23

Se la nota como Q2 o Med y tiene la propiedad de que a cada lado del valor se encuentra el 50 % de
las observaciones.

Si disponemos de un conjunto de datos individuales, para el cáIculo de Ia mediana se procede de


Ia siguiente manera:

1. Se ordenan las n observaciones rt,12,. ..,rn de manera creciente.


2. Si el número de observaciones es impar, entonces n:2rnl1, La mediana es la observación
que se encuentra en eI lugar m * I. AsÍ, si disponemos de r¿ : 29 observaciones ordenadas
de manera creciente, m : 14 es decir, Ia mediana es la observación que se encuentra en el
lugar14*1:15.
3. Si el número de observaciones es par, entonces n:2m. La mediana es igual a la suma de
las observaciones que se encuentran en los lugares m y rn * 1, dividido para dos. Así, si el
número de observaciones es de n : 30, entonces rn: 15; Ia mediana es el promedio de Ias
observaciones que se encuentran en los lugares 15 y 16.

Si los datos están resumidos en una tabla de distribución de frecuencias de datos individuales.

1. Ordene las observaciones de manera creciente, con sus respectivas frecuencias acumuladas.
2. Calcule I2"v red.ondee al entero más cercano. Determine en Ia columna de Ia frecuencia
acumulada a qué dato pertenece, comparando el valor obtenido con el valor de la frecuencia
acumulada que es igual o inmediatamente superior; éste valor es la mediana.

Si los datos están resumidos en una tabla de distribución de frecuencias por clases, la mediana
se determina por interpolación, asÍ:

1. Establezca en qué intervalo está el valor mediano. Para ésto, se determina la primera
n
clase cuya frecuencia acumulad.a se
a mayor o igual a Dicho intervalo se denomina clase
5.
med'iana.
2. La mediana se calcula con la fórmula
n,
; - nl-r
Med,: L¡_t-r
donde: =-A,
,L¿-1 es el límite inferior de la clase mediana.
At-r es la frecuencia acumulada del intervalo inmediatamente anterior al intervalo de la
mediana.
n¿ esla frecuencia absoluta de la clase mediana.
A es Ia longitud de la clase de Ia mediana.
La interpretación gráfica del cálculo de la mediana se encuentra en la Figura 1.11.

Nótese que la mediana de un conjunto de datos no necesariamente pertenece a éste. La propiedad


fundamental de la mediana es dividir al conjunto de observaciones en la mitad.

Ventajas e inconvenientes del empleo de Ia mediana:

1. Es la medida m¿is representativa en el caso de variables que solo admitan la escala ordinal.

2. Es fácil de calcular.

.). En Ia mediana solo influyen los valores centrales y es insensible a la presencia de valores atÍpicos.

4. En su determinación no intervienen todos los valores de Ia variable.


24 Capítulo 7. AnáIisis Exploratorio de Datos

L¡¡ MC L¡
lal
Figura 1.11: Interpretación geométrica del cálculo de la mediana.

Ejemplos

1. Determinar la mediana de los siguientes datos:

5.5 6.9 7.0 3.0 4.8 4.t 3.2 4.3 5 5 6.5 4.3.

Soluci,ón: Se tienen n : IL observaciones, por Io que Tn : 5, entonces Ia mediana está en el


lugar 5*1. Ordenemos los datos

3.0 3.2 4.7 4.3 4.3 4.8 5.5 5.5 6.5 6.9 7.0.

La mediana es la observación que se encuentra en el sexto lugart Qz:4.8.


2. (Continuación.) Calcular Ia mediana de los sueldos de diez personas que ganan (en dólares):

t70 r72 168 165 L73 178 180 165 167 L72.

Solución: Se tiene n: 10 observaciones, que ordenadas dan


1,
165 165 767 168 r70 772 772 773 178 180.
I
Por lo tanto, la mediana es el promedio entre las observaciones quinta y sexta: fi
I
^ 770+172
er: *
i:171. ET

la
3. (Continuación.) Calcular la mediana de la estatura de 46 señoras, cuyas medidas son:

Estatura Fbecuencia FYecuencia


(r¿) absoluta (n¿) acurnulada (¡lr)
7.45 2 2
1.48 4 6
1.50 5 11
1.53 8 19
1.55 T2 31
r.57 nl 38
1.60 4 42
r)
1.63 J 45
1.65 1 46
7.8. Medidas de localización 21:

Soluci,ón: Las mediciones están agrupados en una tabla de datos individuales y el tamañ0,d,9,1,1i
muestra es n: 46. , . .iJ,ríiri,!
Calculamos 2 : ZZ y vemos en Ia columna de Ia frecuencia acumulada que hay los valoles 19 y
2
31, que cumplen que 19 < 23 < 31.
i"r;i'r;'irt:;'/
Así, Ia mediana es el valor cuya frecuencia acumulada es 31; es d,ecir, Q2: 1.55-.i "
4. Para la liquidación del impuesto a Ia renta, en una pequeña empresa, se calcularon lcs'ingbesoS
anuales (en dólares) de todos los empleados. La tabla de distribución de frecuencias es la
siguiente: ,i'¡_l-
Número de Fbecuencia
Ingreso anual
personas (n¿) acumulada (Nr)
,,,r.1 t,
2400 - 3000 3 3
3000 - 4200 20 23
,,r,; r ¡ix llri.il
4200 - 5400 35 58
5400 - 7250 25 83
7250 - 9000 15 98
9000 - 12000 2 100

Solución: Los datos están dados en una tabla de frecuencias por clases con r¿: 100.

i-nel Entonces, ?2:50; por tanto, la mediana se encuentra en el intervalo (a200;5¿00)';'de!t'nánera


que A: 5400 - 4200: 1200.
Ahora, tenemos que

* - *n-,
Med: L;I*TO
!{-es): : 4200 + tO:"rrg¡ :5L25.7. 'i rr,','i;trÍ :'.i r1i',¡'¡1,\q;?.
35
t;i ir1¡;({ l:
La mediana del ingreso anual de los empleados de la empresa oist25'.1¿lil*áJ]
'" -- 1--.\' lrii:Lli-'rr "i'j ..'ilrrrrrri
r

'rli;rl.lirll;l

1.8.3. La rnoda r"i I

Definición (de moda) L" moda de un conjunto de ddüob'es aquel valor que tiene la mayor
frecuencia absoluta.

Se la nota como Mo. Hay ocasiones en las cuales los datos pueden tener dos o más modas, o no puede
existir, cuando todos los datos tienen igual frecuencia. Para su determinación es útil construir una
tabla de frecuencias de los datos.

. Si los datos están resumidos en una tabla de distribución de frecuencias por clases, la m'6dr
"e
determina mediante la fórmula: ii ,,'t:) i, ri ) lfl;'{

I = :,(' i,¿ ;i,


Mo:L¿¡* dt,O' trz, O
t li) il);jii-),1fli ii lfrli/.

donde:
tr¿-1 es el límite inferior de la clase modal.
d1 es la diferencia entre la frecuencia de la clase modal y la frecuencia de la clase anterior.
d,2 es la diferencia entre la frecuencia de la clase modal y la frecuencia de Ia clase siguiente.

A es la longitud de la clase de la mediana. , r ¡;iri:,rt ¡;,I


Capítulo 7. AnáIisis Exploratorio de Datos

Aunque la icle¿r de <<valol rn¿1s fiecuente>> es mny trrrtigurr, no fue ernpleacla en estaciística, dc rn¿lnela
forrnal, hasta c¡re Ia po¡lrlirlizó K. Pe¿u'son en 1894.

Ventajas e inconvenientes del empleo de la moda:

1. Es fácil de calcular e interpletar.

2. Es la única medida de Iocalización que ptiede obtenerse en Ias variables de tipo cualitativo.

3. En su determinación no intervienen todos los valoles de la distribución.

Ejemplos

1. Supóngase que las notas de un examen de estadística fueron las siguientes:

9.4 8.1 9.0 5.6 7.0 9.0 6.5 9.0 3.8 7.0.

Soluc'ión: La moda de este conjunto es Mo:9.0, que es el valor que más veces se repite.

2. Calcular la moda de los siguientes datos:

Observación 2.7 4.5 6.0 8.7 9.2


Fbecuencia 5 6 .) 2 4

Solución: La mayor frecuencia es 6, correspondiente al valor 4, por lo tanto Mo:4.

3. Para la liquidación del impuesto a la renta, en una pequeña empresa, se calcularon los ingresos
anuales (en dólares) de todos los empleados. La tabla de distribución de frecuencias es la
siguiente:
Número de
Ingreso anual
personas (n¿)
2400 - 3000 3
3000 - 4200 20
4200 - 5400 35
5400 7250 25
7250 - 9000 15
9000 - 12 000 2

Solución: La clase modal es el tercer intervalo, ya que tiene la mayor frecuencia (hs : 35).
I
: 50; por tanto, la mediana estará el el intervalo
Entonces,,2I (4200; 5400), de manera que
dr :35 -20:15, d¿:35 - 25:10 y A:5400 - 4200:7200. l
:
Ahora, tenemos que

A[o : L¡.--t* ,O' ,O


d't -l d'z
: 4200+,,,15,.1200 : 4920. I
15+10
i,
La moda del ingreso anual de los empleados de la empresa es 4920 dólares. :-
7.8. Medidas de Iocalizaciót't 27

1.8.4. La media geornétrica

Definición (de media geométrica) La media geornét,rica, notaclzr corno .{lG, clc urr conjunto dc
n, meclicion€s r1, 12:.. ., nr es igrral a Ia taíz r¿-ésirna de su ltroclucto; es decir,

AIG: Vqxrrx-xrk.

Si las obselvaciones están agrupadas en una tabla de fi'ecuencias de datos individuales,

MG: {r:7, x...xr'tlt.


"";,
Si las observaciones están agrupadas en una tabla de frecuencias por clases, la expresión es la
misma, pero utilizando el punto medio de Ia clase z¿.

El empleo más frecuente de la media geométrica es el de promediar variables tales como porcentajes,
:asas, números Índices; es decir, en los casos en los que se supone que la variable presenta variaciones
acumulativas.

Ventajas e inconvenientes del ernpleo de la media geométrica:

1. En su cálculo intervienen todos los valores de Ia distribución.


2. Los valores extremos tienen menor influencia que en la media aritmética.

3. Es úrnica.

1. Su cálculo es más complicado que el de la media aritmética y solo se la puede calcular cuando
todos los valores son positivos.
50s
;la
Ejemplo. Calcular la media geométrica de la estatura de cinco personas que miden (en metros):

t.70 r.72 1.68 1.65 r.73.


Solución: n:5 observaciones; por tanto,
Se dispone de

MG : (r¡x12x-xrn
: otT
11.70 x I.72 x 1.68 x 1.65 x I.73: 1.696.

La media geométrica de las citadas estaturas es 1.696 m.

1.8.5. La rnedia armónica


que
Definición (de media armónica) La media armónica, notada como NI H, de un conjunto de n
mediciones rrt r2t . . . , rt. es el recíproco de la media aritmética de los recíprocos de esos n valores;
es decir,

Su empleo no es aconsejable en distribuciones de variables con valores pequeños. Se suele utilizar para
promediar variables tales como productividades, velocidades, tiempos, rendimientos, cambios, etc.
28 Capítulo 7. AnáIisis Exploratorio de Datos

Ventajas e inconvenientes del empleo de la media armónica:

1. En su cálculo intervienen todos los valores de Ia distribución.


2. Su cálculo no tiene sentido cuando algún valor de la variable toma valor cero.

3. Es única.

Ejemplo. Calcular la media armónica de la estatura de cinco personas que miden (en metros):

1.70 t.72 1.68 1.65 r.73.

Solución: Se dispone de n:5 observaciones; por tanto,

11111 : 1.696.

L.70 I.72 1.68 1.65 r.73


-_r-r-_r-_L-
La media armónica de las citadas estaturas es 1.696 m.

1.8.6. Percentiles, cuartiles y quintiles


Antes de finalizar esta sección, es conveniente referirnos a varios términos que son de uso común
en la prríctica estadística: los cuartiles, Ios quintiles y los percentiles. Estas medidas estadísticas
corresponden a lo que se denomina medidas de posición no central.

A un conjunto de datos ordenado se lo puede dividir en un número fijo de partes iguales; cuando se lo
divide en cien partes se tienen los percentiles.

Definición (de percentiles) Los percentiles son cada uno de los 99 valores que dividen a la
distribución de los datos en 100 partes iguales.

A los percentiles se les nota como P¡. Con ellos se puede encontrar regiones donde se acumulan los
datos; así, el 30 % de los datos están por debajo del trigésimo percentil.

Para su cálculo se procede de Ia siguiente manera:

. Si los datos no estrín agrupados o están en una tabla de datos individuales, se efectúa la siguiente
descomposición:
nk
: j *r,
100
donde:
j es la parte enter u a" !.
100

r es la parte fraccionaria a. *.
100
Entonces, se tiene que
si r:
"+-,
rj+L, sir>0.
o;
7.8. Medídas de localización 29

Si los rl¿rtos i:sttirr rr¿Jrup¿rclos crr c:lascs, sc c:¡rlctila ruccli¿rnt<r

,tk, _
l{r.
"
I'A,:LA-ta 1oo ',1,
,

7Lk'

rlor rcler:

,L¿ 1 es cl lírrrite inferior del intervalo ñ (cuva fi'ecucrrcia ¿rcurnulada es la primera mayor o igr.ral
tt,A:
a _).
100'
lü-l cs la fi'ecuencia acumulada hasta .L¡-1.
n¡ es la frecuencia absohrta del intervalo h.
A es la longitud del intervalo h.

Ejemplos

1. Calcular los percentiles de orden 20 y 33 de la estatura de diez personas que miden (en cm):
165 165 167 168 170 L72 r72 r73 178 180.

Solu,c'ión: Tenemos eue n: 10.

. Par-a P2g, k :20


nk
: j *r
100
10x20 : 2+0
100
Entottces,r':0y j:2;
P¡,

Pzo

. Para P33, li; : 33


10 x33 :3+0.3.
n los 100
Entonces, r:0.3 y j:3.
P¡ : rj+t
PS¡ : r¿:168.
úente
2. (Continuación.) Calcular el percentil de orden 86 de los ingresos anuales de los empleados de
Lrna enlpresa.

Número de FYecuencia
Ingreso anual
personas (n¿) acumulada (¡/r)
2400 3000 3 ,)

3000 - 4200 20 23
4200 - 5400 35 58
5400 - 7250 25 83
7250 9000 15 9B
9000 - 12000 2 100

Soht,ción: Teuemos qlte ?¿ : 100.


30 Capítulo 1. Análisis Exploratorio de Datos

Parzr,l)66. k :86 y n,k: 100 x 86 : 86.


100
- 100
-
EI intcrrr¿rio h cloncle se cricu<rutrrr P5¡; cs (7250, 9000) y Lt-t:7250.
Tarnlriétt, sc tierre qr,tc ly'¡,-1 :83, r¿*.:15 y A:9000 -72;.¡0:1750
Con estos datos, obtenemos:

'k n,.
,I)A, . - 100 -
L¡-I
nk
D-
rSri 72t¡o +
tLUv |
uu - 83 trrn
15
: 7600.
--'l

Dos casos particulares, y muy utilizados, resultan cuando al conjunto de datos se Io clivide en cuatlo
o cinco partes iguales, que corresponden a los cuartiles y a los quintiles, respectivamente.

Definición (de cuartiles) Son valores que dividen a la distribución de los datos en 4 partes, cada
una de las cuales engloba eI25% de los mismos.

Los cuartiles son 3:

. El cuartil inferior (Qr), qre deja a su izquierda el 25% de los ctatos v se curnple eue Qr : P2ó.

. El cuartil medio (Qz), qre deja a sr.r izquierda el 50 % de Ios datos, coincide con la mediana y se
cttmple que Q2 : Pso.

. El cuartil superior (Q3), que deja a su izquierda el 75 % de los datos y se cumple eue Qe - Pzó.

AsÍ, para el cálculo de los cuartiles solo se deberá tener en cuenta que ellos son los percentiles de orden
25, 50 y 75, respectivamente (Figura 1.12).

500Á 500

mln Qt Qt Q¡ max

Figura 1.12: Disposición de los cuartiles en un conjunto de datos.

Definición (de quintiles) Los quintiles son valores que dividen a la distribución de Ios datos en
cinco grupos, cada uno de los cuales contiene el 20% de las observaciones.

Los quintiies son 4:

. El primer quintil (qr), q.t" deja a su izquierda el 20% de los datos y se cumple que qr - P2o.

¡ El segundo quintil (qz), qrr" deja a su izquierda el 40% de los datos y se cumple eue 9z - P4o.

. El tercer quintil (qs), qn" deja a su izquierda el 60% de los datos y se cumple que qB - Poo.
r El cuarto quintil (g¿), qr" deja a su izquierda el 80% de los datos y se cumple que q4 - P80.
7.8. Medidas de localización 31

Ejernplos

1. (Continuación.) Dctcrrniuar los cuartilcs infcliol y su¡rcliol cle las estaturas de 46 señoras,
cuyas ntedid¿rs son:

Estatura Fbecuencia Frecuencia


(r¡) absoluta (n¿) acumulada (¡i,)
r.45 2 2
1.48 4 b
1.50 5 11
1.53 E 19
1.55 72 31
L.57 7 3B
1.60 4 42
1.63 .)
,,1 l

1.65 1 46

Sohtción: Tenemos que n : 46.

. Para el cuartil inferior, Q1 : P25, por tanto, k:25 y


nk ,
Pz¡. i00
lr
46x25 :
)'se
11 + 0.5.
100

De manera que, r: 0.5 y


Pn.
p¡, : r j+t
rrden
PZs : rn: I.53.

. Para el cuartil superior, Q¿ : Pzs, k :75 y


nk
100
tlr
46x75
35 + 0.5.
100

Es decir, r: 0.5 y

P¡, * l-rt
Pzs : rsa : 1.57.

2 (Continuación.) Determinar Ios cuartiles inferior y superior de los ingresos anuales de los
empleados de una empresa.

Número de FYecuencia
Ingreso anual
personas (r¡) acumulada (Nr)
2400 - 3000 t) J
3000 4200 20 23
D'lu.
4200 - 5400 Jd
DT
58

P+0.
5400 - 7250 25 83
7250 - 9000 15 9B

'60. -
9000 12000 2 100

D-^
EU' Solu,ción: Tenemos que n : 100.
32 Capítulo 7. AnáIisis Exploratorio de Datos

109ri.25
. Cuartil inferior: Qt : Pz;, k::25 J, Y: : Z¡.
100 100
El irrtelr'¿rlo l¿ doncle se enc:uentra Q1 es @200;5a00) y Lt-t:4200.
Tambiérr, se tiene que N¡- t : 23,nt :
35 y A :54U0 - 4200 : 1200.
Entonces, lesrrlta que:
t'/t
- Ar,.-,
P¡, : Lt-tI loonk "'¿
t<_t?
Pzs : 4200 +'",;;'" 1200
Ji)
: 4268.6.

:75 tO?ñtt : tt.


Cuartil superior: Qs: Pzs, k t #:
El intervalo h donde Lxt:540A.
se encuentra P75 es (5a00; 7250) y
También, se tiene que N¡-1 : 58, n¡ :25 y A :7250 - 5400 : 1850.
Con estos datos, obtenemos:
nb
- e-t,
P¡ : Ln-t-t rá nk
: 75;58raso
Pzs b4oo+
25
: 6658.

1.9. Medidas de dispersión

Luego de determinar Ia localización de las observaciones, es conveniente medir su grado de clispcrsión


alrededor del centro. Las medidas que permiten especificar esta característica se denomínan n¿edidas
de dispersión.

Estas medidas deben tener la propiedad de que si los datos están ampliamente extendidos, la medida
será alta; y cuando los datos se encuentren muy agrupados, será baja.

Existen varias medidas de dispersión, nosotros vamos a analizar la desviación estándar, el rango y el
rango intercuartil.

1.9.1. La desviación estándar


llna vez que se ha calculado el promedio de las mediciones, un indicador de su variabilidad es la
desviación de cada medición particular corr respecto al promedio, r¿- r. Pero ésta da r.rna información
válida para cada medición y no para toda la muestra. Para tal efecto se emplea la desviación estándar,
medida de dispersión fue introducida por K. Pearson en 1894.

Definición (de desviación estándar o desviación típica) La desviación estándar, notada como
s, de nn corljunto de n mediciones 11, 12, ...¡ 2,, es la raíz cuadrada de la suma de los cuadrados
de Ias desviaciones de las mediciones, respecto al promedio z, di'l'idida entre n - 1; es clecir,

n-I D,@,
i:l
7.9. Medidas de dispersión 33

\ótese que la desviación estándal es siempre positiva y sus nnicladcs de medicla son las rnisnrrrs clrLt:
aquellas que corresponden a los datos originales.

Para su cálculo tambiéu se cnrplea la fórnrula equivalente

- n \r)'
n-I

De la misma manera que para Ia media aritmética se consideran los siguientes casos:

' Si las observaciones están agrupadas en una tabla de frecuencias de datos individuales:

Observación FYec. absoluta


Il TL1

r2 n2

x) te ;o
la desviación estándar se calcula por

k
DnnrT
i:I
- n(T)2 k
o s: con n:, ni.
n-7 i:r

ión ' Si los datos se presentan en una tabla de frecuencias, agrupados por clases:
úas
Clase LIC LSC Punto medio Flec. absoluta
1 ly Sl I1 TL1

ida 2 l2 S2 I2 n2

: : : :

rel k l¡" Sk rk nk

s se calcula por

k
Ln¿rí - nlI)'
O /-\ñ
k
¡la o 8: i:l
con n: \-nr.
ión -itn¿(r¡-r)2
i:7 n-I /-¿;-l

ilar,

Ventajas e inconvenientes del empleo de la desviación estándar:

l. Se expresa en Ias mismas unidades que los datos originales.

2. En su cálculo intervienen todos los valores de la distribución y por ello puede ser complicado.

3. Es única.

4. Se ve muy afectada por la presencia de valores atípicos.


34 Capítulo 7. Análisis Exploratorio de Datos

Ejemplos

1. (Continuación.) Calcular la clesviación estárrdar cle los srreldos cle diez l)crsonrrs que ganan
(en dólares):
r70 t72 168 165 173 178 180 165 167 t72.

Solu,ción: Previamente se habÍa calculado el promedio 7: L7I. Con ésto, resulta que:

*i@n-,¡'
(170 - t7L)2 + (I72 - I7r)2 +...+ (167 - tTL)2 + O72 - LTr)2
10-1
1.

Esos sueldos tienen una desviación estándar de 5.1 dólares.

2. (Continuación.) Calcular la desviación estándar de Ia estatura de 46 señoras, cuyas medidas


son:
Estatura t.45 1.48 1.50 1.53 1.55 L.57 1.60 1.63 1.65
Frecuencia 2 4 5 8 t2 7 4 3 1

Solu,c'ión: Anteriormente se determinó que :46, k - 9 y r:1.545.


71.

Para realizar el cálculo, obtengamos el valor a. f nor'n,


i:t
k

D"nr? :2(t.+s)2 + 4(t.458)'+'" + 3(1'63)2 + 1(1.65)2 : 109.9615


i:1
Entonces, se tiene que

Dn *?-n@)2 ffi
o:, , :.@:0.04627.
n-r
D-
n-l V ¿o-t
La estatura de las señoras analizadas tiene una desviación estándar de 4.6 cm.

3. (Continuación.) Calcular la desviación típica de los montos de ahorros de los socios de una
cooperativa de ahorro y crédito:

Desde Hasta Punto medio (r¡) FYecuencia (ni)


0 100 50 12
100 200 150 28
200 30 250 46
300 400 350 77
400 500 450 186
500 600 550 224
600 700 650 209
700 800 750 r22
800 900 850 53
900 1000 950 19

Solución: Antes se determinó que n : 970, k : 10 y V -- 555.155.


7.9. Medidas de dispersión 35

Calculemos lzr siguiente sumatona:

I,,r r,l : 12(rtQ2 + 28(150)2 +'. . + b3(850)2 + 19(950)2 : 330025000


'i-7

De manera que la desviaciórr típica es

k
D ro"? - "(")2
,i.:1

n-7
:V/33002ffiéro-i :riYü¡'

tlonjuntamente con la desviación estándar se suele definir la uarianza muestral de un conjunto de


ratos, notada s2, como Ia suma de los cuadrados de las desviaciones respecto a su promedio, dividido
:or el uno menos que el número de observaciones en el conjunto de datos y se calcula mediante

las "ln: {'o - 7)2


" ;\f ,;-1

r,9.2. EI rango y el rango intercuartil

Definición (de rango o recorrido) El rango de n mediciones es igual a la diferencia entre los
'.'alores mayor y menor de las mismas:

Rango : T..'áx

Ei rango se puede utilizar para hallar una aproximación de la desviación estándar mediante las si-
--rrientes relaciones :

R.anso
s = --É-) para n 176, para 16 q 7¿ ( 100,
1/n
R,anso
para100<n(400, para n > 400.
"=--,

Ventajas e inconvenientes del empleo del rango:

1. En su cálculo solo intervienen los dos valores extremos de Ia distribución y por ello se ve muy
afectado por Ia presencia de valores atípicos.

2. trs fácil de calcular.

Definición (de rango intercuartil) EI rango intercuartil, notado por RIQ, de un conjunto de
latos es igual a Ia diferencia entre ios cuartiles superior e inferior; es decir,

RIQ: Qs - Qt.

Las definiciones de los cuartiles superior e inferior y del rango intercuartil fueron dadas por F. Galton
en 1882.
36 Capítulo 7. AnáIisis Exploratorio de Datos

Ventajas e inconvenientes del empleo del rango intercuartil:

1. Es fh<:il cle calcul.¿rr'.

2. Se vc Poco afect¿rcio por la Plerselcia dc r,¿r.lores atípicos.

3. En su deterrninación no intclvierre l¿r tot¿iliclad cle los clatos.

Ejemplo. (Continuación.) Calcular' la desviación estárrd¿rl de l¿r cst¿rtur¿r clc 46 señoras, cllvas
meclidas sc reslrmen en la siguierrtc t¿tbl¿r:

Estatura r.45 r.48 r.50 1.53 1.55 1.57 1.60 r.o.) 1.65
Fbecuencia 2 4 Ir 8 12 7 4 3 1

Solución: Antes se dcterminó que Q1 :1.53 Y Qs:I.57. Además, zmí':7.45y r,'á*:1.65.


Entonces,

Rango Tmáx - fnrín : 1.65 - I.45 : 0.20.


RIQ Qs - Qt : 1.57 - 1'53 : 0.04.

Además, podemos calcular una aproximación de la desviación estándar de los datos:

Rango 0.20
sFr : 0.05.
4 4

Como se ver el valor aploximado cs bastante cercano al exacto, calcuiado con la fórmula respectiva.

1.9.3. El coeficiente de variación


Definición (de coeficiente de variación) El coeficiente de variación, notado y>ot CV, es ig-ual
a la desviación estándar- dividid¿r por la medi¿r, rrritmética; es riecir,
s
CT':1
T

Esta rnedicl¿r se utiliz¿r l)¿lra conlp¿r'¿rr las rnccliciones de tun¿r misrna magnitrici rc¿liz¿rri¿r cn distintas
unidades o por distintos individuos.

Si u.rr conjurrto de cl¿rtos es honrog(rneo, CV < 1; si Cf/ > 1.5. los dzrtos poclrían ser hctclogóncos.

Ventajas e inconvenientes dei empleo clel coeficiente de variación:

1. Es urr¿r medida ¿rdimensioual.

2. En sn cálculo interviencn toclas las obscrvaciones. pr-rclicnclo ser nluv iufluido pol valoles atípicos.

3. Puede ser difícil de interpretar.

4. Picrde su significtrdo si el prorredio es iguai a cero.


7.7A. Medidas de fornta Dta
JI

Ejernplo. (Continuaciórr.) C¿rlcrrl¿rr r:l c:oerficrierrtc clc r'¿rriaciórr clcrl srrclclo clc cliez pcrsorr¿rs clllc
-irr¿1rr (crL ckilzrrcs) :

170 rT2 168 165 r73 r78 180 165 167 r72.

: :,1 uc,i¡ir¿: Pleviarrx:rrtc s<t It¿rbía cirlculaclo clur: r: 177 1' ,s - 5.1. Con ésto, r'esulta que:

5'1 :0.02982.
CV:! T - 777

--omo
el valor de coeficiente es muy ba.jo, los datos son homogéneos.

1.10. Medidas de forma

-{asta ahora, heruos arralizado la localización y la dispersión cle una distribución, pero necesitamos
. r'locer más sobre el comportamiento de los datos. En esta sección, analizaremos las medidas de
-,)
- )inla'.

- as medidas de forma de ttna distlibución se clasifican en dos grllpos: medidas dc asinietr'ía y medidas
-- cttrtosis.

1.10.1. Asirnetrra

coet'íczente d,e a,s'intetría, dc nrra variable midc cl grado de asimetr'ía de la distribuciórr r,le sus datos
tolno ¿r sti meclia. Es aclirncnsional v se definc corno srg=Lre:

\-1.r, _ ,):t ln,


/_-' ' '
I
,i.:
As: t

,s3

--,--.
crtl,o,s cle nn¿L variable cstárr coltstituidas por los r.alores alejaclos de la medía (r,a.1oles cxtrcmos).
--:,a l'¿rriable es ¿l,sinií:tric¿r si srr
col¿ ;r nn 1¿rclo cs rnás larga que sr1 col¿r al otro y sinrétric¿r si amb¿rs
-es solr igual cle largas.

si As > 0. la clistribui:ión ser¿i asiurótiic¿r a l¿r clcrccli¿r. La cola a la clerech¿r es más lirrga que 1a
cola a la izquierrl:r.

. si As - 0la distlilncicin ser'á sirnéttic¿r. AnLbas colas son igual dc luugirs.

. si As < 0 la clistribrrciórt ser¿i ¿rsirnétlica a ltr izcluicrcla. La cola a lur izqnierd¿l es más lrrrgir que
la cola a I¿r clelech¿r.
rEn la definición cle las trreclicl¿rs rte ti¡rma no hal,'unidac.l cle criterios cntre los especi:rlista,s, por lo clrLc hay una amlrlia
r i cclacl
38 Capítulo 1. AnáIisis Exploratorio de Datos

L,lO.2. Apuntamiento o curtosis


EI coeficiente de apuntamiento o curtosis de una variable sirve para medir el grado de concentración
de los valores que toma en torno a su media. Se elige como referencia una variable con distribución
normal, de tal modo que para ella el coeficiente de apuntamiento es cero.

ir", - *)n l,
i:t ,
Ap: e4 -J.

Según su apuntamiento, una variable puede ser:

Leptocúrtica, si Ap ) 0; es decir, es más apuntada que Ia normal. Los valores que toma la
variable están muy concentrados en torno a su media y hay pocos valores extremos.

Mesocúrtica, si Ap:0; es decir, es tan apuntada como la normal.

Platicúrtica, si Ap ( 0; es decir, es menos apuntada que la normal. Hay muchos valores extremos,
Ias colas de la variable son muy pesadas.

Figura 1.13: Curtosis de curvas simétricas.

Ejemplo. (Continuación.) Calcular los coeficientes de simetría y apuntamiento de los sueldos de


diez personas que ganan (en dólares):

t70 172 168 165 r73 178 180 165 t67 172.

Solución: Previamente se había calculado que 7 : l7l y s : 5.1. Además,

i@n-e)'
i:7 (170 - 171)3 + 072 -171)3 + .
+ (167 - i71)3 + O72 - t7D3
10
55.8.

i{,n-n)n
i:l - LTDA + $72 - I7I)4 +. . . + (167 - LTD4 + G72 -
(170 I7D4
n 10
1191.
7.77. Otras representaciones gráfrcas 39

- ntOnCeS,

In
\-.
T).

\ r; - ( T\'' lr¡,
1J"
'i-I 55.8
)11
As: t
so (5.1)3
0.42r.

ir", - ,)n l,
i:t 1191
Ap: s4
-J-
t
(5.1)n -.)
-t.239.
Ia
-,cs datos son levemente asimétricos, con asimetría hacia la derecha; también, son platicúrticos,
;,,rsible presencia de valores atípicos.

x) 1.11. Otras representaciones grÍificas


-
os gráficos analizados anteriormente no requieren realizar cálculos de medidas estadÍsticas. Los
==áficos que a continuación se presentan, sí los emplean; por tanto, son más poderosos al realizar un
'-nálisis.

1.11.1. Diagrama de balanza


FI di,agrama de balanz¿ fue introducido en el año 2000, como una herramienta que muestra, en un
lismo gráfico, la forma de los datos, su valor central y su variabilidad al representar el promedio, el
:-ínimo, el máximo y Ia desviación estándar de los datos.

?ara su construcción se procede de la siguiente manera:


de
1. Se calcula el promedio, la desviación estándar, el mínimo y el mríximo del conjunto de datos que
se analiza.

) Sobre una recta se ubican los valores del promedio, el mínimo y el máximo. Los segmentos que
unen el promedio con el mÍnimo y con el máximo se denominan brazos de Ia balanza.

3 Sobre la misma recta se ubican dos puntos -uno a la izquierda y otro a Ia derecha de la media-,
a una distancia igual a la desviación estándar.

I Debajo del valor del promedio se dibuja un triángulo.

EI diagrama queda así:

x .x+.s

Figura 1.14:
40 Capítulo 7. AnáIisis Exploratorio de Datos

El rliagrarri¿r clc. brrl¿rnzir st: iritc:r'plet¿r clc 1a sigrricrrtc luirrrcr'¿r:

1 Si los cl¿tos solL sinrírtlic:os, r:l valor del plonreclio se sitú¿r r¡rr r:l <:c:rrtLo rlci grálico.

2 Si los d¿rtc¡s est¿ilr agrrrptrdos en torno ¿ri ccntlcl. los l¡r¿-Lzos rlr: l,r bal¿rnz¿ ser'¿ilr cortos; pr"u cl
contrzlricl, si ir"rs tlat,os estiirr dispclsos eu tor-rr<l ¿r.l coutlor lt-,s lrr'¿rzos clc l¿r bal¿rnza s<)r'¿'rir liilgos.

,) Si nno dc los rlos bl¿rzos clc 1¿r b¿rlarrz¿ es muchr¡ rl¿rs largo c¡rc r:l otlo, nos inclica (llre los (l¿1tos
sorl asirr)étricos y clue hay posible prcsencia cle r'¿rloles atípicos en l¿s obselv¿ciones.

Puede ser irtil combin¿rr' (solrre el mismo gr'áfico) con un cliagrzrma clc prrni;os pzrra visualiz¿rl Ia, Irillr(:lr'&
en que se distlibuycn ias observaciones.

Ejemplo. Realizal el diagrama de balanza de los siguientes datos:

5 5 5 5 1010202027 35
39 55 55 60 60 60 68 75 90 90

Soluci,ón,: Estos datos tieneu las siguientes carac;ter'ísticas:

rnírr:5, rnáx:90, r:39.7, s:29.3

Entonces,

:L
-S 39.729.3:10.4.
-
T *s 39.7+29,3:69.0.

El ciizrglirlr¿r <lc balarrz¿r ¡ie nuÉrstl¿t it crorrtirn.r¿rcirjn:

st0 28 3ü 4C 5S 60 1fi 80 gCI

Figura 1 .15;

Scgirrt sc obscrvit crr i'i giálico, el prornedio no se encuentra crr cl centro del ralgo. entonces sc dr:drrc<:
quc los cltrtcs sotr asirtrétricros. Arlcrriás, lcs br'¿rzr¡s cie i¿r b¿l¿rnza rro ticrierr ig'ral longitnri, lo <1rri.r ri<rrtot¿r
la posrble plcserrcia cle vakrrcs atípicos elr cl ex1 r'errro clcrecho.

1.11"2. Diagrarna de ca.ja

El rli,o,qt'ant,a" de c:o,.jo, fr-re irrtroduciclo r:n 1977, pol JoLrn \\I. Tuliey conLo lur¿l herranrierrtzr quc rrurcslr'tr,
er Lrn misuro gr:ific:o, l¿r foltna de los clatos, sn r'¿r,lol ccntlal y srr rrariabilicl¿rcI irl rcprr:sentar i¿r rne<li¿rrra.
los crr¿rtilc¡s) el r'¿1rlgo intercualtil y el rango c1e las observacicxrcs.

Para su constlucción se procede de la sigr.riente rn¿Inera:

l. Soble lrn¿ líne¿l holizontal se loc¿rliz¿rn l¿ mcdiana. Ios cuartiles inferior y supr:rior ¡'los clatos
nrínilro I'm¿ixirno.
7.77. Otras representaciones gráfrcas 4L

,l
Se constrrtye rtna ca..ja angosta qlre une a Qt y Qz; a continu¿rción, se clivicle estar caja cn clos
mecliatrte una línea qne pase por Qz.

t
.J. Finalrnente, se ttazan las uallas, que son dos rectas, una desde cada extremo de la ca.ja, hacia el
valor rnínimo y hacia el valor máximo de los datos.

:n la Figura 1.16 se mnestra un diagrama de caja.

I trt I
min Qt Qz Qr max

Figura 1.16: Diagrama de caja.

;--n diagrama de caja es especialmente útil para examinar la simetrÍa de los datos, la presencia de
-"-:lores atípicos y para comparar dos conjuntos de muchos datos.

Ejemplos

1. (Continuación.) Trazar el diagrama de caja correspondiente a los datos de la estatura de 46


señoras, cuyas medidas son:

Estatura r.45 1.48 1.50 1.53 1.55 L.57 1.60 1.63 1.65
Flecuencia 2 4 5 8 12 7 4 3 1

Solución: Antes se determinó que Qr : 1.53, Qz : L.55, Qs : t.57, rrnín: I.45 y z¡16* : 1.65.

El diagrama de caja es el siguiente:

. -lttc:cr
, lr rt¿i

I I

t.4s 1.55 r.60 1.65

: .tliI) Figura 1.17:


.l(lIJ¿Ir

Como se observa, los datos son bastante simétricos, con una fuerte concentración en torno al
centro y -puesto que las vallas son largas- con la posible presencia de valores atípicos (el mínimo
y el máximo).
clirlos
Se recogieron los datos de los ingresos mensuales de 200 hombres y 250 mujeres, que realizan
42 Capítulo 7. Análisis Exploratorio de Datos

tlab:r.jos rro c:¿llificaclos, olrtcniéudosc ltr sigtticttto tabl¿:

Ingreso flombres Mujeres


180 10
190 5 55
200 20 75
270 ')ri)
.f 25
AN
220 40
230 75 45
240 20

Comparar los ingresos de los dos grupos mediante sus diagramas de caja.
Solución: Se tiene la siguiente tabla que resume las medidas descriptivas reqtteridas:

mIn Qt Qz Qs max
Flombres i90 270 220 230 240
Mujeres 180 190 200 220 230

Con todos estos elementos, los diagramas de caja son

240

230

22O
o
ut
fl
s zro
tr
200

190

'180

Sexo

Figura 1.18:

En el diagrama correspondiente a las mujeres, observamos que la mediana no se encuentra en Ia


mitad de la caja, denotando una asimetrÍa, con fuerte concentración hacia valores bajos. Como
Ias vallas son cortas, podemos inferir que no hay presencia de valores atípicos.
En el diagrama que corresponde a los hombres, se observa que Ia mediana está en Ia mitad de la
caja, indicando que Ios datos son simétricos. Como la valla inferior es más larga qr-re la superior,
rros indica que rlrl valor de 190 es atípico para los hombres.
De acuerdo a las posiciones de los diagramas, se observa que) en general, las mujeres tienen
ingresos menores. Tarnbién, se aprecia que los ingresos de los hombres están más concentrados
alrededor de la rnediana qne los de las mujeles, denotando que aquellos son más homogéneos.

L.1-2. Ejercicios
i. Una persona está rnanejando un carro en una autopista a 70 km/h y nota que el número de autos
a los que pasa es igual al número de autos que a ella le pasan. Los 70 km/h son el promedio, la
mediana o la moda de las velocidades de los autos en la carretera. ¿Por qué?
7.72. Ejercícios 43

2. Dadas r¿ : 8 nrccliciones: 4, 2, 6. 5, 7, 5, 4, 6.

Deterrnine: rr) f; lr) l¿r niecliarr¿r; c) ,s; cl) el lango; e) la asimetría; f) Ia cr-rrtosis.
3 Dadas n : I mediciones: 5, 8, 8, 4, 4, 9, 7, 5, 4.

Deterrnine: a) 7, b) la mediana; c) s; d) el rango; e) el RIQ; f) la asimetría; f) curtosis.

1. En 1904, Cushny y Peebles publicaron en el artículo <The action of optimal isomers>> (Journal
of Physiologg), un estudio sobre el efecto de dos isómeros de Ia molécula hidrocinamida hidro
bromida en prodrtcir sueño. Se presentó la variación en el núrmero de horas de sueño por noche
al usar las dos versiones de Ia droga:

Paciente Dextro Levo


1 +0.7 +1.9
2 -1.6 +0.8
.) -0.2 +1.1
4 -L2 +0.1
5 -0.1 -0.1
6 +3.4 +4.4
7 +3.7 +5.5
8 +0.8 +1.6
I +0.0 +4.6
10 +2.0 +3.4

a) Realice un diagrama de puntos para cada uno de los dos tipos de drogas y comparárelos.
¿Cuál de los dos isómeros es más efectivo en producir aumento en las horas de sueño?
b) Realice un diagrama de tallo y hojas con los datos.
c) Calcule el promedio, la mediana y la desviación estándar de los datos de las dos drogas.
¿Cuál es más efectiva? Explique.

¿. Un inversor tiene ahorros repartidos en 3 depósitos con 2000, 5000 y 10000 dólares, respectiva-
mente. Si el primero le rinde un 5To anual, el segundo un 4To anual y el tercero un 2To anual.
¿Cuál es el tipo de interés que recibe?
tenla
En una empresa se registró la edad (en años completos) de sus empleados, resultando la siguiente
Como
tabla:
31 49 36 39 56 29 57 4t 40 51
Idela 45 61 40 39 47 27 36 37 16 37
)ertor, 51 18 29 42 38 62
34 31 28 25
36 40 46 37 49 25 2r 39 35 37
trenen 56 35 48 44 42 43 49 22 25 28
trados
teos.
a) Determine el número de clases que se debe utilizar en la distribución de frecuencias;
b) Construya la tabla de frecuencias y el histograma;
c) ¿Qué porcentaje de los empleados es menor que 50?;

: autos
d) ¿Qué porcentaje de los empleados es mayor que 35.5?
dio, la
7. En una bodega de venta de licores se registró las principales. características de 25 marcas de
44 Capítulo 7. AnáIisis Exploratorio de Datos

rn'hiskys:
No. de Precio Proporción Tiempo de Nota de
Categoría
whisky de venta de malta añejarniento calidad
.,
I 70 20 1 5 J

2 60 20 1 5 2
, 65 20 1 7.5 2
4 74 25 I I2 2
5 70 25 I t2 3
6 ,J 30 1 5 0
7 70 30 1 8 0
8 55 30 I 5 2
9 93 J,l 2 6.5 I
tt
Jd 2 8 3
10 62
tt
JJ 2 8.5 3
11 87
T2 78 35 2 8.5 2
13 83 40 2 8 4
t4 90 40 2 5.5 2
15 110 40 2 T2 1

16 113 40 2 8.5 1

t7 96 40 , T2 dt
18 82 45 2 12
,
d

19 r27 45 2 8.5 4
20 160 100 3 L2 3
2I 90 100 3 12 4
22 86 100 3 12 2
23 100 100 3 10 3
q
24 100 i00 3 11 d

25 95 100 3 T2 0

a) Identifique el tipo de dato que representa a cada una de las variables;


b) Realice un diagrama de talloy hojas para el precio de venta y ei tiempo de añejamiento;
c) Calcule el promedio, la moda y la mediana del precio, la proporción de malta y el tiempo
de añejamiento;
d) Encuentre la desviación estándar, el RIQ V el coeficiente de variación del precio, la propor-
ción de malta y el tiempo de añejamiento;
e) Calcule los coeficientes de asimetría y de apuntamiento del precio, la proporción de malta
y el tiempo de añejamiento;
f) Realice un gráfico de barras de Ia categoría y de la nota de calidad.

8. Calcule el promedio, la mediana y la moda de las edades de 25 personas:


32 33 34 31 32 31 34 32 34 32 31 34 31
31 32 32 34 34 32 33 34 33 33 34 31
9. Dados los datos y sus frecuencias:

Halle: a) e; b) Mo; c) s; d) el rango.


10. Dados los datos v sus frecuencias:

Halle: a) Qz; b) 7; c) s; d) RIQ.


7.72. Ejercicios 45

il. Sc rcirlizti rttta irrr'<rstigaciírn sobtc cl prccic'r rlc zapzrlos <lcportivos. clcr sirnilarets <:¿rr¿rctetrístic¿rs
crr rlivrtlsos ¿tllutr:ctttts clc l¿r trirrrl¿rcl, ob1<:nií:rrr[os<t los sigrricnt<:s cL¿ttos (cl<ilarcs):

50 4:l 39 43 40 38
,)-
r),J oi
,¡l
.)-
r) I
.)o
r)i
49 43 39 44 40 38 33 26 36 30
49 43 39 44 4U 38 33 27 36 30
+t 41 39 45 40 37
.).)
,),)
,)a
,l ') E
,)r)
J)^
.)t,

46 47 38 46 40 37 32 28 35 28

a) Determine la dislribución de frecuencias inclivicluales de los datos;


b) Elabore la distribución de frecueuci¿rs con datos agnrpaclos l)or clases;
c) A partir de la distribución obtenida, trace el histograma.

-2. A continuación se dan los resultados de la estatrrra de 100 estudiantes:

Esratura (en cm) | 155 160 165 170 \75 180 185
No. de eslrrdiantes I 10 14 26 28128
Halle:

a) Ia estatura promedio y Ia desviación estándar;


b) la media armónica y la media geométrica;
c) Ia mediana y eI RIQ.

A partir de la siguiente distribuciórr de liecuencias,

o;

lpo

ror- Encuentre:

rlta a) los cuartiles inferior y superior y la mediana;


b) Ia media armónica;
c) la media geométrica.

-=. La siguiente tabla muestra la temperatura nocturna (en "C) clr.rrantc 200 días:

Intervalo Flecuencia Intervalo Frecrrencia


qA
21 12-14 I4
4-- b 16 74 16 20
6-B 15 16 18 22
8-10 26 18 20 1E
l0 12 OD
L¿ 20 22 :,-)

a) Deterrrile: cl plomedio, Ia mecliana y los cuartiles inferior y superior;


b) Constmya el cliagrama de ca.ja de los datos.

Los siguientes datos se obtuvieron de una encuesta sobre las condiciones de vida, en el área nrral
dc los cantones dc Zapotillo y N{zrcará y corresponden al núrrnero de hornbres y de rnujeres que
Capítulo 7. AnáIisis Exploratorio de Datos

intcgran las f¿rmilias encuestadas.

Hombres \4ujeres Hornbres X4ujercs Hombres X4ujercs Homblr:s \tlujercs


4 2 2 2 7 4
c .) t
5 4
1 .) t) .) 2 2
2 , 2 4 4 4
1 4 4 6 5 4
4 4 b 7 2 4
I 7 4 2 5 2
t
2 .) 2 d 4 J
8 3 5 4 4 1

a) Realice un diagrama de puntos de los datos, clasificados por sexo;

b) Realice la tabla de frecuencias y el histograma de los datos, según el sexo de los encuestados;

c) Construya el diagrama de caja de los datos;

d) Interprete y compare los resultados obtenidos en a), b) y c);

e) Determine el número total de miembros en cada familia. Con estos nuevos datos trace eI
diagrama de puntos, el diagrama de tallo y hojas, la tabla de frecuencias, el histograma y
el diagrama de caja. Interprete lo obtenido.

16. Las siguientes temperaturas fueron tomadas al medio día en Quito (en 'C) durante una semana:

22, 24, 2r, 24, 20, 22, 19.

a) Calcule el promedio y la desviación estándar de dichas temperaturas;


b) Para transformar los grados Celsius (c) en grados Fahrenheit (/) ." usa la ecuación / :
1.Bc * 32. Determine el promedio y Ia desviación estándar de las temperaturas en grados
Fahrenheit;
c) Encuentre alguna relación entre los promedios y las varianzas calculados en a) V b).

17. En una investigación sobre la razón por Ia que frecuentemente habÍan colas muy largas en las
cajas de un banco, se obtuvo información del tiempo (en minutos) requerido para atender a los
clientes. Se tomaron 50 mediciones en una caja, las cuales se dan a continuación:

6.0 5.9 4.0 3.1 1.9 5.3 2.7 5.2 2.9 5.2
4.8 4.8 5.1 6.0 4.2 4.4 5.3 7.4 4.4 4.1
5.2 2.8 4.7 1.8 5.1 5.8 2.9 5.7 3.8 5.8
3.6 4.4 2.0 2.8 4.8 3.1 1.5 5.9 3.6 4.6
3.7 4.5 3.9 2.3 5.5 5.3 5.8 2.4 5.5 3.7

a) Calcule la desviación estándar y su aproximación a partir del rango;


b) Determine (,' * s), (r I2s) y (e + 3s);
c) Determine el número de observaciones que se encuentran en cada uno de los intervalos;
d) Construya el diagrama de caja de los datos y compare con los resultados de la parte b).
¿Qué observa?
7.72. Ejercicios 47

18. La siguientc tabla muestra los tiempos de duración (en minutos) de las versiones en DVD de 22
películas dirigidas por Alfred Hitchcock:

Película Tiempo Película Tiempo


The Birds 119 Dial M fbr Murder 105
Family Plot 120 Foreign Correspondent 120
Frenzy 116 I Confess f08
The Man Who Knew Too Much 120 X4arnie 130
North by Northwest 136 Notorious 103
The Paradise Cane 116 Psycho 108
RearWindow 113 Rebecca 132
Rope 81 Shadow of a Doubt 108
Spellbound 111 Strangers on a Train 101
To Catch a Thief 103 Topaz 126
Under Capricorn Il7 Vertiso 128

ios;
a) Construya un diagrama de tallo y hojas de los datos;
b) Calcule la mediana de los tiempos;
c) Calcule los cuartiles inferior y superior. Use esta información para detectar algún valor
:e el y
atípico para trazar el diagrama de caja;
ray
d) Determine el promedio y la desviación estándar;
e) Represente los datos mediante un diagrama de balanza. ¿Cuáles datos influyen más en los
valores calculados?
f) Calcule los coeficientes de asimetría y de apuntamiento.

19. Las notas de un examen de 6 alumnos son: 6, 5, 9, 19, 3 y 18. Un alumno aprueba si su nota es
mayor o igual que el promedio y que Ia mediana de las notas. ¿Qué porcentaje de los alumnos
aprobaron el examen?
+-
J-
ados 10. Un automóvil ha recorrido los 832 km que separan Loja de Esmeraldas, permutando regularmente
las 5 llantas (incluida la de emergencia) para que todas tengan igual desgaste. ¿Cuál es el
recorrido promedio de cada llanta?

11. El kilometraje que marca un auto, luego de 4 años de uso, es 100 mil kilómetros. Si el dueño
r las lo compró nuevo y lo hace descansar 1 dÍa, luego de usarlo 4 días seguidos, ¿cuál es el recorrido
a los promedio diario de los días manejados, considerando años de 365 días?

')2. De 400 alumnos de un colegio, cuya estatura promedio es 165 cm, 150 son mujeres y su estatura
promedio es 160 cm. ¿Cuál es la estatura promedio de los varones?

13 Se tiene cuatro números. AI añadir el promedio de tres de ellos al número restante, se obtienen
los números 17, 2I, 23 y 29. Si se excluye al mayor de estos números) ¿cuál es el promedio de
los tres restantes?

)/ El promedio de 53 números es 600. Si se eliminan 3 números consecutivos, se observa que el


nuevo promedio aumenta en 5To. ¿Cuál es el mayor de dichos números consecutivos?

25. Calcule la mediana de las siguientes temperaturas:


6:

e b). Temp. ("C) 20.5 20.0 19.5 19.0 18.5 18.0 t7.5
No. días 2 4 3 13 3 4 2
48 Capítulo 7. Ar¡álisis Exploratorio de Datos

26 Calculi: I¿r mecliatr¿r v I¿r urocla <lc krs sigrri<lrtcs clatcls

Iutclr¡¿rlo I'r'ccucucia
10 - 2i) 3
.)
20 -30 'J
30 - 4i) 12
40 50 B
50 60 5

27. Los sueldos en una emprcsa son las siguierrtes:

1 gelente: 10 000
1 secretaria: 650
3 empleados: 500 (cada uno)
2 ayudantes: 400 (cada uno)
1 conserjc: 300

¿Cuál es la medida de localización más representativa?

28 En una reunión hay 50 varones con una edad media de 20.5 años y 25 mu.jeres, las que en
promedio ,or, ] miís jóvenes qne los \¡arones. Halle el núrmero entero más próximo a la edacl
'10
media de las personas de dicha leunión.

29. Un ftrmador dice que su vicio empezó con un cigarrillo en la primera sernana, 2 en la segunda,
4 en la tercera, 8 en la cuarta, y así sucesivamente; hasta fumar casi 2 ca.jetillas diarias de 20
cigarrillos cada una, en promedio.

a) ¿,A cuántas semanas de habcl empezado ocnrrió ésto?;


b) ¿Cuántos cigarr-illos diarios, cn prornedio, fumó hasta la primera ser)ana que llegó al nláximcr
de su consumo?

30. Si cada uno de los 28 millones de habitantes de cierto país come) el promedio, 12 kg de pescadcr
al año, entre conservas enlatadas y pescado fresco, siendo este rubro 4 veces el de conserva.
¿Cuántas toneladas de pescado fresco se consumen? en promedio, por año?

31. En una muestra de 20 empresas florÍcolas se obtuvieron los siguientes datos sobre el núrnero de
empleados y sus ingresos anuales, en miles de dólares:

No. dc Ingresos anlrales


empleaclos 50 - 100 100 - 250 250 - 1000
10 30 6 2 0
30 s0 i 1 0
50 - 100 0 0 10

Calcule:

a) el ingreso medio anual de las ernprcsrrs;


b) el número de empleados promedio.

32. De los datos de rrna tabla de distribución de frecuencias, con 5 intervalos de clase ;r ancho de
clase cornítn, se observó que: Qz:24, x:¡ : l$, 13 :24, nB : 2'n,r, n5 : )71r. ¿.Qué porcerrtaje
del total sor nrenores de 30?
7.72. Ejercicios 49

cuánto es igual la suma de cifras dc la media aritmética de la siguiente serie de números'/

r¿ cifr¿rs n cifr¿rs r¿ <rifi¿ls r¿ cifr¿rs

34. La siguiente tabla muestra la distribución de sueldos de 210 trabajadores de una empresa.
Sueldo Trabajadores
600 700 100
700 800 20
800 - 900 60
900 1000 20
1000 1100 10

a) Halle Ia moda de los sueldos;


b) Debido al aumento de Ia productividad, los sueldos sufrieron un incremento del 70%o y,
adicionalmente, un aumento de 50 dólares. Halle el nuevo sueldo promedio.

35. En una muestra de 1000 trabaiadores, se registró sus sueldos en una tabla de frecuencias:
Sueldo Trabajadores
ue en 0 400 150

, edad
400 - 800 300
800 - 1200 200
1200 - 1600 250

¡rnda,
1600 2000 100
de 20
a) Calcule la moda de los datos;
b) ¿Qué porcentaje de los trabajadores tiene sueldos comprendidos entre el promedio y la
mediana?

irimo 36 En la siguiente ojiva se muestran los sueldos de Ios traba.jadores de un organismo estatal.

scado
lser\¡4.

rero de

Figura 1.19:

Halle la diferencia entre el promedio y Ia mediana.

37 En Ia sección de pediatría de un hospital, Ios niños atendidos se clasifi.caron según su edad,


obteniendo la siguiente tabla:
Frec. absoluta Frec. relativa
Edad Frec. absoluta Frec. relativa
acumulada acumulada
03 0.2
rcho de 3-6 20
centaje 6-9 0.85
9-12 80
50 CapÍtulo 7. Análisis Exploratorio de Datos

Calcrrle el pronrr:clio, la rnecliarr¿r v la clesvi¿rciól estánclar cle la cclacl de los niuos ¿rtcndirlos.

38 Err la sigr.rierite tabla se rnuestr'¿r i¿r clistlilncióu ck: frecnencias clc l¿rs vcntas rc¿rlizad¿ls pol' lc¡s

60 locales de uu ccntro comelcial popr-tlal de Ia ciudad cle Quitrt.

Punto Frec. absoluta


Frec. relativa
medio (r¿)

Si Ios intervalos tienen igual longitud, halle el promedio, la mediana y la desviación estándar de
Ias ventas.

39 En Ia siguiente tabla se muestra la distribución de frecuencias de los pesos de 100 personas:

Peso Frec. relativa


Frec. absoluta Frec. relativa
(t e) acumulada
0-24 0.18
24-48 26
48-72 0.78
72-96

Calcule la mediana del peso de estos individuos.

40 La siguiente tabla incompleta muestra Ia distribución de frecuencias de los dcpósitos bancarios


realizados por 50 clientes, siendo el ancho de clase es constante e igual a 200.

Punto Frec. absoluta Frec. absoluta Frec. relativa


Intervalo
medio (r¿) ("0) acumulada (l/r) (f)
9
0.22
I 100 t2

7
0.06

Luego de completar la tabla, calcule:

a) ¿cuántos clientes realizaron depósitos menores a 1000 dólares?;


b) ¿qué porcentaje de clientes realizaron depósitos entre 1200 5' 1600 dólares?;
c) el promedio, la mediana y la moda de los depósitos.
Capítulo 2

El Concepto de Probab¡l¡dad

Las preguntas más importantes de Ia uida son, para la


tnaAor parte, realmente solo problemas de probabili,dad
Pierre Simon Laplace

-r la naturalezay en la vida cotidiana se presentan fenómenos cuyo resultado se determina antici-


-.damente mediante la aplicación de ciertas leyes o fórmulas; por ejemplo, los resultados de mediciones
:-rmétricas, los cálculos financieros o ciertos procesos físicos.

-enrbién existen fenómenos cuyo resultado no puede ser anticipado con cetteza, sino que existe una
:tbabi,Iidad de que un cierto resultado se dé; por ejemplo, la ganancia que obtendrá un inversionista
-=-pués de dos años, el tiempo que sobrevivirá un cónyuge a la muerte de su pareja o el número de
;-ros eu€ pasan por una esquina durante una hora determinada. Es evidente que nadie puede dar
-, resultado certero con anticipación a los tres euentos considerados, entonces si se da una respuesta,
-:'iste una incertidumbre en el resultado.

?ara dar una explicación matemática a aquellos resultados que aparecen en experiencias en que está
-r'olucrado el azar, se desarrolló la teoría de probabilidades.

2.L. Reseña histórica


-
a presencia del hueso de astrágalo de oveja, que constituye el antecedente inmediato del dado, en las
=-<cavaciones arqueológicas más antiguas, parece confirmar que los juegos de azar tienen una antigüedad
-: más de 40mil años. En Ia India, en el Rig-Veda (aproximadamente 1000 años a.C.), se menciona un
;:ego de dados como un intento de medir la probabilidad. En Grecia, Sófocles atribuye a Palámedes
-= invención del juego de dados, durante el sitio de Tloya. Así, en casi todas las culturas antiguas
= posible encontrar referencias que nos indican que el estudio de los fenómenos aleatorios (dados,
-Jresencia de lluvia, el clima, etc.) fue muy importante.

=n el Renacimiento se produjo un abandono progresivo de explicaciones teológicas, lo que condujo a


';¡a reconsideración de los experimentos de resultado incierto, y los matemáticos italianos del siglo
\VI empezaron a interpretar los resultados de experimentos aleatorios simples. Por ejemplo, Cardano,
:n 1526, estableció, por condiciones de simetría, la equiprobabilidad de aparición de las caras de un
jado. Por su parte, Galileo (1564 - 7642), respondiendo a un jugador que le preguntó por qué es
n¿ís difícil obtener 9 tirando tres dados que obtener 10, razonó que de las 216 combinaciones posibles

51
52 Capítulo 2. El Concepto de Probabilidad

ccluiplobables, 25 coticltrcett a 9 y 27 a 10. Galileo publicó estos rcsult¿rcios en un tlat¿rclo liarnaclo


C o n,si, d, eraz'i, o ne. s o'p'ra,'il q i,r t, oco d,e,t, d,o,rli.

El desarrolio clel an¿ilisis rnatenrático los juegos dc azal se produjo dur¿rnte los siglos XVI y XVII.
c,le
Algunos autores consideran como origen del cálculo de probabilidades la lesolución del prolrlema de los
puntos en la correspondencia entre Pascal y Fermat en 1654. El problema planteado a estos autores
por Chevalier de Meré, fue cónro debería repartirse el dinero cle las apuestas, depositado en la mesa,
si los jugadores se ven obligados a finalizar la partida sin que existiera un ganador. Aunque ningur<-r
de estos dos matemáticos publicó al respecto, sí lo hizo Huygens en su tratado Ratioci,n'iis 'in In,do alae
(Razonamientos relativos al juego de dados). Su escrito tiene Ia trascendencia de ser el primer liblo
de probabilidades de la historia.

Durante el siglo XVIII, el cálculo de probabilidades se extendió a problemas físicos y de seguros


marítimos. El factor principal de su desarrollo fue el conjunto de problemas de astronomía y de
física que surgieron ligados a la constatación empírica de la teoría de Newton. Un primer problerna
fue el tratamiento de los errores de medición: se disponía de varias medidas independientes de una
determinada magnitud física y se presentaba el interrogante de cómo combinarlas para obtener un
resultado más preciso. Daniel Bernoulli (1700 - 1782) proporcionó la primera solución al problema de
calcular una cantidad desconocida a partir de un conjunto de mediciones de su valor que) por el error
experimental, presentan variabilidad.

Pierre Simón Laplace (I749 - 7827), introdujo la primera definición explícita de probabilidad y desar-
rolló la ley normal como modelo para describir la variabilidad de los errores de medida. En esta época
también hubo importantes contribucfones de matemáticos como Legendre (1752 - 1833) y Gauss (1777
- 1855) para tratar de realizar predicciones del comportamiento de ciertos fenómenos.
Durante el siglo XIX, los matemáticos y astrónomos continuaron ampliando la teorÍa, de manera que
a mediados de este siglo ya existían Ias herramientas que permitieron su consolidación como una rama,
científica. A pesar de ello, la aplicación de estos principios se restringÍa a Ia Física y la Astronomía.

Una descripción axiomática de la idea de probabilidad fue dada en 1933, por A. N. Kolmogorov. Ello
constituyó la base de la moderna teoría, tal como hoy la conocemos. Con ésto, se consiguió elaborar
modelos complejos y aplicar las probabilidades a muchas ciencias y campos de Ia vida.

En las últimas décadas, el empleo de la teoría de probabilidades en las modernas ciencias naturales,
en las ciencias sociales y en ramas de aplicación, como la ingeniería, el cálculo actuarial o la economía
ha crecido enormemente y su conocimiento es una necesidad imprescindible.

Antes de iniciar el estudio de la probabilidad, revisemos los principales conceptos del análisis combi- E
natorio.
_I--

: .

2.2. Fundamentos de análisis combinatorio

Primero, definamos eI factori,al de un número entero positivo z¿ como el producto

n!:nx(n-1) x x2xl. con0!:1

Ahora, consideremos un conjunto finito compuesto por n elementos diferentes: {a1,a2,...,a,-}. Se


desea formar una colección constituida por k elementos (k I El número de estos subconjuntos
").
depende de si los conjuntos son ordenados o no. Las colecciones ordenadas se llaman uariaciones y
las no ordenadas combinaci,ones.
2.2. Fundantentos de análisis contbinatorio 53

Definición (de variación) Se clenornin¿r variaci(rrr a c¿r.cla nrro cle los irrrcgJ,os orclcrr¿rrlos clc /'
lenreutos, tornaclos cle otlo cle n r:lernentos (k ( n). cle rnanel'¿l cluc estos arrcrglos rlificrcrL cn algúur
.-enientr.i o en el orden de colocación.

r- rrúrrnero cle r'¿rri¿rciones de A; elementos qne pueden obtenelsc a partir: de rin coujlurto rl<r it, clcrrtcutos,
--.lotado por Vf,, es igual a
Wn:-
,nl
'n (n-A:)!

Definición (de combinación) Se denomina combinación a cada uno de los subcorr.juntos de k


.-ementos, tomados de otro de n elernentos (A: ( n), sin tener eu cttenta el ordcn de los rnismos, de
--.anera que no pueden haber dos combinaciones con los mismos elernentos.

:- número de combinaciones de k elementos que pueden obtenerse a partir de un conjunto de n


.-:mentos, denotado por Cf., es igual a

nl.
kt(n - k)t'

{ Cf se le denomin a coef.ciente bi,nomi,al.

E.jemplo. Encontrar el núrmero de variaciones y de combinaciones de dos elementos que se pueden


-.'tener a partir del conjunto {a,b,c}.

-:'lución: Se tiene n : 3 y lr : 2.

V! : .--
3! : 6 :
a) Se pueden formar
(3-2)! ;1 6 variaciones, qlle soII:

(a, b), (b, a), (a,r), (c,a), (b,c), (c,b).

'o) Se pueden formar 3! :


^2
"3 - 2(3 - 2)! ^-L
2.r 3 combinaciones:

{o,b}, {o,"}, {b,r}.

Definición (de permutación) Una permutación de n elementos es cada una de las variaciones
r: los n elementos distintos.

=- número de permutaciones de n elementos es igual a

Pn: n!'

Ejemplo. Encontrar Ias permutaciones que se pueden forurar a paltir del conjunto {a,b,c}.
I 'iuc'ión: Son P3 : 3! : 6 permutaciones; éstas son:

(a,b,c), (a,c,b), (r,o"b), (c,b,a), (b,c,a), (b,a,c).

-dirora, consideremos dos conjuntos de rn y n elementos, respectivamente:

A: {at,a2,.".,a,r} y B : {h,bz,...,brr}.
54 Capítulo 2. El Concepto de Probabilidad

Parejas. Con los n¿ elementos <.lc A y los tr elerucntos cle B cs posible forrn¿rl nt,xTt ptrlejirs (rt,¡,lt¡,)
<¡rr: contcngan lln cleniento rle c:¿rd¿r con.jrrnto.

Ejemplo. En uu¿r f¿ibrica cle calz¿rc,lo se confcccir¡n¿rn 4 Lnodcl<¡s de zapatos lttlla. clirmas, en 6 tztrrrarius
cliferentes. Por lo tanto, se pr-reden fabricar 4 x 6 : 24 distintos tipos de zapatos.

Gencralicemos estc concepto a arreglos mírltiplcs.

Arreglos múltiples. Consideremos los conjuntos A: {at,a2,...,a,rr} de n¿ elementos, B :


{ú,b2,...,b,r}dcnelementos,yasísucesivamentehastaG:{g,g2,...,g"}deselementos. Con
ellos es posible formar rnxn x...x s arreglos (a¡,b¡,...,gr) que contienen un elemento dc cada
corr.lunto.

Otra forma de ver este concepto es considerar un procedimiento A que se puede realizar de m maneras;
un procedimiento B de n maneras; y así sucesivamente, hasta un procedimiento G de s rnaneras.
La acción consistente en realizar el procedimicnto A, seguido del procedimiento B, hasta llegar al
procedimiento G; se puede efectuar de m x n x - -' x s maneras diferentes.

Ejemplo. Suponga que se clasifica a un grupo de estudiantes universitarios según su sexo, estado
civil y la carrera que estudian. El sexo puede ser masculino o femenino; el estado civil puede ser
soltero, casado o divorciado; y, digamos que hay 7 carreras. Entonces, hay un total de 2 x3 x7 : 42
clasifi.caciones diferentes.

Anteriormente, se examinó las permutaciones de elementos de un conjunto, pero sin repetición; si ahora
queremos determinar las permutaciones con repetición, bastará considerar en los arreglos múltiples el
mismo conjunto.

Definición (de perrnutación con repetición) llna permutación con repetición, de k elementos
obtenidos a paltir de un conjunto de n elementos, es un arreglo de k elementos ordenados en el que
los elementos pueden repetirse arbitrariamente.

El número de permutaciones con repetición es igual a

P,\, : nk

Ejemplo. Con los elementos del conjunto A: {a,b,c}, ¿cuántas permutaciones con repetición, de
dos elementos, se pueden formar?

Soluc'ión: Se van a formar parejas considerando dos veces el conjunto A, por Io tanto se tiene n:
y k :2; entonces, hay un total de 32 : 9 permutaciones con repetición; ellas son:
(a, a), (a,b), (a,c), (b,o), (b,b), (b, c), (c,a), (c,b), (c,c).

2.3. Eventos y espacios muestrales

Examinemos un ejemplo: el lanzamiento de un dado una sola vez. Como resultado de la prueba se
pueden producir diferentes resultados: <<sale dos>>, <<sale cinco)>, <<€l número que aparece es par>>, etc.
Esto nos conduce a definir \os euentos.
Definición (de evento) Se llama evento, notado como (r, a cualquiera de los resultados posibles
de un experimento u otra situación que involucre incertidumbre.

Los eventos se clasifican en: elementales, aquellos que constan de un solo resultado: r compuestos,
que consisten de más de un resultado. Por ejemplo, <<sale dos>> es un evento elemental: mientras
2.4. Defrnición axiotnática de la probabilidad bl)

llre <<cl nrimcro qrre aparece es pal>> es un evento conpuesto, l)orque cstá conformado de Los cventos
-lementales <(sale dos>>, <s¿rle c;uatro>> y <<sale seis>.

,Jbselvernos que todo cvento relacionado con una pn,reba se pr"rede desclibir en términos de evertos
.lenrenta,les.

Definición (de espacio muestral) La colección de todos los eventos elementales, notirdo por Q,
-e denomina espacio muestral:

A: {rl o es evento elemental}.

lntonces, un evento no es más que un subconjunto del espacio muestral O.

Señalemos que el concepto de espacio muestral fue introducido por Gaiileo para resolver el problema
-e por qué en el lanzamiento de tres dados "10" y "11" aparecen más frecuentemente qr-re "9" y "72" .
?ara resolverlo listó todos los casos posibles.
-,
olviendo al ejemplo, si consideramos el número de puntos que aparecen al arrojar un dado, tenemos:

Espacio muestral: Q : {1, 2,3,4,5,6}.

A-- { el número que sale es par }: {2,4,6}.


-''rmo los eventos se asocian a conjuntos, es natural pensar que sus operaciones tienen algún significado
rmo eventos.

::an A y B dos eventos de O, en el siguiente cuadro se presentan 1as equivalencias entre las proposi-
--rnes de las teorías de probabilidades y de conjuntos y en la Figura 2.1 se encuentran los diagramas
-r Venn correspondientes.

lnterpretación en la teoría Interpretación en la teoría


Notación
de conjuntos de probabilidades
Elemento o punto Evento o suceso
0 Conjunto de puntos Espacio muestral (suceso seguro)
0 Conjunto vacío Evento imposible
.4r B Unión de conjuntos Por lo menos uno de los eventos A o B ocurre
-4. B Intersección de conjuntos Ambos eventos A y B ocurren
.4\B Diferencia de conjuntos A ocurre y B no ocurre
-4':CI\A Conjunto complementario No ocurre A
A)B:A Conjuntos disjuntos A y B se excluyen mutuamente (incompatibles)
,4C B A es subconjunto de B Si A ocurre, también B

:s claro que estos conceptos se extienden a cualquier sucesión de eventos.

:
2.4. Definición axiomática de la probabilidad
Lna probabilidad provee una descripción cuantitativa de la posibilidad de ocurrencia de un evento
;,articular y se puede pensar que es su frecuencia relativa, en una serie larga de repeticiones de una
-rrueba, en la que uno de los resultados es el evento de interés.
s

IS Formalmente, la probabilidad de un evento ,4 se define como una función que cumple:


56 Capítulo 2. EI Concepto de Probabilidad
i

ii

Figura 2.1: Interpretación de los conjuntos como eventos: a) Ocurre eI evento A. b) Ocurre A u ocurre
B (A U B). c) Ocurre A y ocurre B (An B). d) Si A ocurre, también B (A e B). e) Eventos
incompatibles (A ) B :0). f) No ocurre A (ocurre A").

. A1. Para todo evento A: 0 < Pr(A) S 1.

. A2. Pr(Q) : r.
. A3. Si A y B son incompatibles: Pr(A U B) : Pr(,a) + Pr(B).

De aquí, no es difÍcil demostrar que en general se cumple la relación:

Pr(A u B) : Pr(A) + erla¡ - Pr(Á. B) (2.1)

conocida como fórmula de Ia probabilidad para Ia unión.

Ejemplos

1. Dados los eventos A, B y C del espacio muestral f). Expresar mediante las operaciones entre
conjuntos los eventos:

a) Tan solo ocurre A.


b) Si ocurre A, no ocurre B.
c) Por lo menos dos de los eventos ocurren.

Solución:

a) Puede ocurrir A, y simultáneamente no ocurre B y no ocurre C; es decir que el evento es


r E AA B" NC".
b) Si no ocurre B entonces ocurre B"; es decir que <<si ocurre A, también ocurre -8">>, el evento
esc€ AcB".
c) Ocurrirán (Ay B) o (Ay C) o @ V C) o (Ay B y C), pero el último evento está contenido
en los tres primeros. El resultado es: Í € (,4n B)U(AnC) U (BnC).

2. Demostrar que:

a) Pr(Á") - 1- Pr(A).
2.5. Cálculo de probabilidades :)t

b) Si A C B errtorices PL(A) < PL(ll).

Soht,ción,:

a) 0: A¿A' (conAyA"disjuntos), entoncesi)or A3.. PL(O) :Pl(A) +Pr(A") vpolA2.,


Pr(O) : 1; corr lo que se obtiene: 1 : Pr'(A) + Pr(Á") v el lesultaclo es inrnediato.
b) Si A C B entonces B: AO(A' tl.B) siendo Ay (A ttB) incompatibles; por lo tanto, por'
A3. Pr(B) : Pr(A) + Pr(4" n B).
Por ,A1., Pr(A n B) > 0, entonces Pr(B) > Pr(A).

.A. continuación damos varias definiciones de mucha utilidad:

1. Dos eventos son igualmente probables si Pr(,4) : Pr(B).

2. El evento A es mós probable que B si Pr(A) > Pr(B).

3. Euento c'ierto.- Es el que siempre aparece en la realización de un experimento, su probabilidad


es igual a 1.

4. Euento zmpos'ible.- Es aquel que jamás puede ocurrir, su probabilidad es igual a 0.

2.5. Cálculo de probabilidades


-\l realizar el cálculo de Ias probabilidades es necesario distinguir de qué tipo de espacio muestral
Cisponemos; ellos pueden ser: fi.nito, infinito numerable o continuo.

2.5.L. Espacios muestrales finitos


Si consideramos el evento A: {rtru)2¡...,o¿}, su probabilidad está completamente determinada si
conocemos sus valores en cada elemento Pr({r,,,1}), Pr({a.'2}), . . ., Pr({c,.'¡,}); entonces,

k
Pr(A) : DPr({a.'¿}). (2.2)
i:t

Un caso particularmente importante se presenta cuando todas las probabilidades Pr(c.r) son iguales.

Si convenimos en designar Card(A) el número k de elementos del conjunto ,4 y Card(O) el número l/


de elementos del espacio muestral; entonces,

Casos favorables de A
Pr(A) :
Casos posibles
Card(A) k
Carcl(A) ¡/

Es decir, la probabilidad de un evento aleatorio A es igual a Ia rel¿rción cntre el núrmero de everrtos


eiementales favorables (cuando A sucede) y el nirmero total de eventos elementales del espacio mues-
rral. Esta definición es satisfactoria en ploblemas referentes a jr,regos de azan',loterías o experimentos
sencillos.
58 Capítulo 2. EI Concepto de Probabilidad

En el ejemplo clel lanzamicrtto cle rrn dado cortsicleremos el evcnto A <<salc rtn nrimero ¡rar>>:

O : {1, 2,3,4,5,6}, Card(O) : 6,


A : {2,4,6}, Card(A) :3.

Pr(A) :ffi
Card(A)
:-:-31
62
En los siguientes ejemplos, consideraremos espacios mnestrales finitos y aplicaremos los conceptos de
análisis combinatorio al cálculo de probabilidades.

Ejemplos

1. En un estante hay 2 libros de historia y 3 de biología. ,Ll azar, se toma un libro y luego se toma
un segundo libro. Encontrar la probabilidad de que un libro de biología sea seleccionado: a) la
primera vez; b) ambas veces.
Soluci,ón:

a) Por defi.lición, O : {11r, Hz,Bt,Bz,Bs}.


Sea A el evento <<escoger un libro de biología>>; es decir, A: {Bt,Bz,Bs}. Por tanto,

Pr(A)
'-' :9'1!9 :I
Card(f^)) 5'
b) Que ambas veces se seleccione un libro de biología significa:
. que la primera elección es un libro de biologÍa, entonces se tiene 3 casos favorables; y
. que la segunda elección también sea un libro de biología, entonces hay 2 casos favorables.
Así, el número de casos favorables es igual a 3 x 2 : 6.
El número de casos posibles, de todas las parejas sin repetición, es 5 x 4 :20.
Entonces, la probabilidad buscada es
63
u- 20 10'

2. En la final de un concurso escolar de matemática participan 6 alumnos, de los cuales 3 pertenecen


al colegio A. Si se premia a los dos primeros con regalos diferentes, ¿cuál es la probabilidad de
que los alumnos del colegio A obtengan los 2 premios?
Soluciórt: El conjunto f) está constituido por las parejas que se pueden formar con los 6 parti-
cipantes. El número total de parejas es Vfr : fr : tO.

Sea el evento B: <<ganan los alumnos del colegio A>>.

El número de casos favorables en el cual 2 de los 3 alumnos del colegio A ganan los premios es:
V3 : o. Luego,
Pr(B) :*:0.,
3. Entre 100 fotografías de un sobre se encuentra la foto buscada. Del sobre se extraen aI azar 70
fotos. Hallar la probabilidad de que entre ellas resulte la foto necesaria.
Solución: Ei espacio muestral Q está formado por los conjuntos de 10 elementos que pueden
formarse a partir de 100: Card(A) : Cl8o.
2.5. CáIculo de probabilidades 59

El núrmero de resultados favorables que nos interesa es igual al total de formas como pueden
escogerse 9 fotos de las 99 restantes; es d'ecir, Card(A) : CBg'
La probabilidad buscada es
CP^
:eÉ';:10. 1
Pr(A)

4, En el Consejo Universitario cada una de las 10 facultades está representada por el decano y
el subdecano. Se nombra una comisión de 10 miembros elegidos aI azar. Determinar Ia pro-
babilidad de que:
de
a) una determinada facultad esté representada;
b) todas Ias facultades estén representadas.

Solución:
)ma
a) Considerando el evento complementario A': facultad dada no está representada>>, y
<<una
i) la
calculemos su probabilidad. Hay 20 representantes, 18 de ellos no son de la facultad
en

cuestión, por Io tanto existe" C18 casos favorables'


EI número de comisiones diferentes de 10 miembros que se pueden formar con los 20 miem-
bros es C|$, entonces
r_rlq g
Pr(a") :;ifr : s,
finalmente,
Pr(A) -1-*:# x0.7632.

b) EI número de maneras diferentes en que pueda estar un representante de cada facultad en la


s'Y
comisión es 210. La probabilidad del evento B: <<todas las facultades están representadas>>
bles.

Pr(B) : 0.00554.
#ry
Se arrojan dos dados. Hallar la probabilidad del evento ¡: {al menos en uno de los dos dados
salen más de dos puntos).
Solución: EI espacio muestral puede describirse como
reCen
rd de
cl: {(i, j)li, j: L,2,...,6},
j
donde el evento elemental (i,j) corresponde a los ¿ puntos aparecidos en un dado y los puntos
rarti-
aparecidos en el otro. Consecuentemente, Card(Q) : 36.
Designemos como 81 el evento consistente en que en el primer dado salen más de dos puntos y
con B2 el evento análogo para el segundo dado:

Bt : {U,j)l i-_ 3,4,5,6; i :1,2,-..,6},


Bz : {(i, j)l i -- L2,. . . ,6; i :3,,4, 5,6}

u10 por lo tanto, card(B1) : card(Bz) :21. Puesto qrue B1l\82: {(i, i)l i,i :3,4,5,6}, entonces
Card(B1 ¡ B) :42 :16. Ahora bien,

: :'! : ?, y ¡Bz):#:Í
Leden
Pr(81) Pr(Bz) Pr(81
36
60 Capítulo 2. El Concepto de Probabilidad

Dc la fór'rnula dc probtrbilidacl para la nrriórr se obtiene:


Pr(A) : Pr(l]1 ¿ Bz): Pr(Br) + PL(82) - Pr(81 ¡ Bz)
2248
: 5-5-9:b
Se recomienda que el lector resuelva este ejercicio rnediante el ernpleo del evento complernentario.

2.5.2. Espacios muestrales infinitos numerables


Sea f) : {cur, u)2¡...run,...} un espacio muestral infinito numerable; entonces, resulta que

ie,1i,,,)) :1,
i:l

luego, si A es un evento de Q, su probabilidad se calcula por

Pr(A) : t Pr({a.'¿}).
u¡,€A

Para el cálculo de las probabilidades, generalmente, se utilizan series numéricas infinitas.

Ejemplo. Juan y Andrés juegan tenis con la misma habilidad. Deciden jugar una secuencia de sets
hasta que uno de ellos gane 2 sets seguidos. Halle la probabilidad de que se necesite jugar número
par de sets para terminar el juego.

Solución: Sean los eventos: J: <<gana el set Juan>> y A: <<gana el set Andrés>>.

Segúrn el enunciado, el espacio muestral está conformado por los siguientes eventos elementales:

rL Empieza Juan ganando Empieza Andrés ganando


1. JJ * AA
2. JAA AJJ
3. JAJJ * AJAA
4. JAJAA AJAJJ
5. JAJAJJ * AJA.IAA

El evento B: jugará hasta que uno de ellos gane 2 sets consecutivos>> es la unión de los eventos
<<se
que están señalados con una estrella (*) en el espacio muestral.

Se tiene que

Pr(AA) :
1
Pr(JJ) +
i'
Pr(JAJJ)+ Pr(AJAA) : 1
=.
8

Las restantes probabilidades,on l,32', l12g'etc'


Entonces, la probabilidad de B está dada por la suma

Pr(B) : [Pr(JJ) + Pr(AA)] + [Pr(JAJJ) + er(e;eA)] +...


1111
_ _ _
_l_ _l_ _-!- -.
1
:
2'8'32'128 -
-.t-
')2tt-l
_.1_ _l_

-
2.5. Cálculo de probabilidades 61

La srrlrr¿ cle est¿ selie geornritrir;¿r es igual a ?, ,r,,r'Io clrrc Pr(B) : ?.


33

2,5.3. Espacios rnuestrales continuos


Sttpongamos c¡te sc tienc rtna" figura ¡rltrna f) v <lcntro de ella sc encucrrtr'¿1 otr¿r figura A (Figura 2.2).
Sobre Ia figura Q se h¿r rrr¿rlC¿rdo uu pttnto al azar'. Suponiendo <1ue la prolrabilidtrcl clc que el punto
':aiga en A es ¡rropolcional al ¿ilea de Ia figula y no de su forrna o posicid-rn, la prolrabiliclad de quc el
'¿r-ttlto caiga en la figu'a A cs:
Ár-ca de A
l'r'(-4) :
Area de f)

O -.

ItS Figura 2.2: Interpretación geométrica de Ia probabilidad.


)ro

En general, si A es un evento cle un espacio mnestral continuo O, tal que su rnedicla (longitud, ',rotrr*"r.,
,iempo, etc.) existe; entonccs, su probabilidad cs

\{edida cle ,4
Pr(A):
\tledida de O'

Ejemplos

1, Sobre un plano se trazaron circunferencias concéntricas de radios 5 cm y 10 cm, respectivamente.


Halle Ia probabilidad de que un punto marcado aI azar en ia circunferencia mayor caiga también
en el anillo forrnado por las dos circunferencias (Figura 2.3).

Figura 2.3:

Sol:uciór¿: El ár'ea del círculo lnayol es ,5: I02rcm2: 100ir<'rrr2.


El área del anillo comprendido entre las dos circunferencias es igual a la diferencia entre las dos
áreas: 7: (702n - 52n) cm2 : 75tr cnt2; entonces,

T
:s:loo;"-t:o'75'
75r cttt2
Pr(A)
62 Capítulo 2. El Concepto de Proba'bilidad

2. Sr:¡L l) :
{(:r;. !l) I () <:t; I 1; il í :l I ii (i,';grui.2"4) ci i:sirir.<:io irirrstliil ,i,:r rrrr fcririrrrcro akrirtoli¡r
v sitP<ttticrttlo c.irrr: io<lrl prulto <l<r (l'¡itrrr,'l;r ¡risrir¿r ¡rlolrrrlrilirltlrl ilc sLl 1r".r¡LtLo clL r;rrerL1a.

Jr

il 4 x
,,4n8 E
117

Figura 2.4:

Detclrninar' la probabilidacl de los evcntos:

.d) A: {(r,y)/0 I r < tl2; 0< y < t};


lr) B : {(",y)10 ( r { 1; 0 < y < lla);
c) An B;
d) A¿ B.
Solttctór¿:

a) Árca O: 1 x 1 : 1.
cle

Áre.r cle A:! * t: 1. eutr¡nces pr(.,{) - !12 :!.


22 1:
l,) Árcu de B - * j,,,,rto,,,", Pr(1J) :+ =
' 1: i
:; :
I " I: j,
.,) Ár'ea rt: A B pr.(A n B)
"r,tou.", *
cl) Por la fór'inula dc la uniórr,

Pr(A u a) : Fr(,a) + Pr(B) - Fr(Á n IJ)


111ir
2488

2.8" ;i!e::cir:ios

Análisis cornbinatorio

l" Culcuie lcis siguierri,cs (iocúcitintcs bilorrri¿lcs Cf,: n) Ci; b) C1]; r) Ci:
2. C.lc.le Vf eri l<,rs sigrricrrtcs c¿r:jos: ,r) Vl; lr) V!; ,r) V3; cl) \¡.].

3. Dctcrtrtirc r:1 tttirnclo tle lrr:ilruiar.:i'rn('s ( lr rilr,,,,l.iiurt' ¡lg 1¡ r)]r:rrrr:irr r

it) rt,:3 1r) n :4 c) rt:5: 'l)'t t


:(t
4. Dci,clttiilrt cL rrirrrcro <1r: ¡rarr:iils fllrtrarl,Ls i;r-,i los crlctrretrtos rlc los,
2.6. Ejercicios t-).)

a) Carrl(,'l) I Clar <l(13)-.) C:) CaLcl(,'l)- 8, CaLri(lJ) : lj;


b) CaLrt(A) f,
,). Car rl(ll) I ,t) Card(.,1) : 1ij. Clald(t:¡ - 5.
-
Cr-rántcls alrcglos se prrerlcu forrn¿u corr los eleurcntos de los cou.lrurtos cuv¿r cardin¿rlicl¿rd sc in<lica:

a) Card(A) : 4; Card(13) : 2 Crrrd(C) - 5.


b) Card(A) :5; Ctrrcl(B) :7; Carcl(C) :4; Card(D) : 5.

6. Cnántas palejas con rclposicrón pueden formar-se con conjuntos crtya c¿rlclina.lidad es:

a) n:3; b) rz:5; c)rt:T; d) rr,:8.

l. Ftxure todas las combinaciones y valiacioncs qlre se pnerlen obtener a parl,ir de los cortjuntos:

a) A: {a,,e,'i,o,z} cn grLlpos de tres elementos;


b) B : {I,2,3,4, 5,6} en grupos de tres elementos.

8. Para los conjuntos indicaclos forme todas las pa,r'ejas sin reposición y parejas con reposición:

A: {a,e,i,o,u}; b) B: {I,2,3,4,5,6).
^)
r;¡r cortrruc uv.r-iu!ar--- -, .--:. eiirr-'131. ql.- -.-:ii¡r::-,i', , $:rL)iici y [1 silllg:r'ente; debe elegi' un
presidente y r-rn vicepresiderr c. ¿De cuántas maneras se pueclerr elcgrr esr,e par dc fiutcrorr¡ilios
si el presidente debe ser nn ;:iente?

Ul hospital cuenta con 21 ci r.ijanos (ion ri)s, ,,'-¡.ies hay que folrnar ter-uas para re¿lizar guardias.
¿.Cuánttrs ternas sc pueclen f:rrnar?

Un amigo le quiere regalar a ¡tro 3 cliscos y los quiele clegir cntre los 10 que más Ie gustan. ¿.Dc
cuántas marreras pucde hace¡'lo?

') Al c,iirs, r'ccolclando quc éstas


marc:ar urr núrniero telcfónico lula persona olvidó las trcs írltimas
sorr difclentes, J.as malcó al azar-. Halle la probabilic.lad de que se haya marcado las cifras
correct¿ts.

De entre 9 empleados se deben selecciorrar a 3 para viajar a 3 Jrlar,'¿s A, B y C fuera dc la


ciuclad. Cacla empleado irá a una planta. ¿De cuántos modos se puede iracer la selección de los
ernpleaclos que via.jarán?

Eu cl ejcrcrcio ¿rntelior considéresc qrre los 3 enrpleirclos \¡an a ir ¿l l¿ misrna planta. ¿.D<: curintas
rnaneras se puede hacer la seleccicin?

Si cn el ejelcicio antcrior, cle los 9 ernplcaclos, 7 son homl>res. ¿Cuál es Ia probabilidacl de


entrc los tr<ls cscr-lgiclos'/
scle¿cciorra: cx¿rcta,rnentc r.rrrtr nrr-¡er

_)
¿.Cuárrtos nrirneros de 6 cifras pucderr haccrse con los dígitos {I,2,3.4, 5, 6}:

rr) sin rcstlicción algrrua'/; b) sin rcpctil ling;'.url cifra?; c) maStolcs c¡rc 500000?

Sicte pcrson¿rs h¿1n soiicitado empleo para lleuar dos r.acantcs. ¿De cuárrtos modos se puerclen
llcrrar l¿ts vat:¿rrrtcs si:

rr) la pr:irncr¿l i)crlsou¿l selcccionacl¿r tecibr,r nr¿:tyor salario que la s,)grul(ia?;


b) no hay clifer'<lrrci¿l cntre las r¡acan1 cs'/
64 Capítulo 2. EI Concepto de Probabilidad

18. i',Cttárrtos partidos sc .jucgatt cII ull cirruptxrrrato. crrr cl qrre prrlticipan 20 cqrripos y en el quc
.iuegan toclos contla to<[os. rul{) crr c¿rsa V otlo <lc visil ¿rlrte?

19. Etr tttr lestattrarttr: cie cotnicla rtipicla se inclir:a al clicrrtc (lrrc sri harnbrrlgr-resa. a rnás del pan 1,
la catne, puede ir cou todo lo siguiente r¡ sin ello: sals¡r clc tornatc, nrostaza, rnayollesa) lechuga,
cebolla, tomate o queso. ¿.Crt:intos tipos difercnt<,rs <1r: hirrnburguesas son posibles?

20. La producción de una rnáqnina cronsta de 4 f¿rses. Ilirl' 6 líneas cle montajc pala la primera fase,
3 para la segunda, 5 para l:t telcrerir, y 5 para la irltirrr¿r. Detelmine de cnántas forrnas distintas
se puede montar Ia máquina en este proceso de producciórr.

21. Eu un plano hay 15 puntos de los cuales rro hay tles que sean colineales. ¿Cr-riintas rectas
determinan?

22. ¿Cuántos triángulos determinan los vértices de un polígono regular de 9 lados?


23. Una heladería tiene 16 sabores disponibles. ¿De cuántas formas se pueden pedir 6 helados si:

a) no se elije el mismo sabor más de una vez?;


b) se puede pedir un mismo sabor hasta 6 veces?;
c) un sabor no se puede pedir más de 5 veces?;
d) la mitad debe ser de fresa?
24. Un entrenador de fúrtbol debe seleccionar a 11 jugadores de entre los que había conúocado
anteriormente para Ia concentración. Si puede hacer su selección de 72376 maneras, ¿.cuántos
jugadores estuvieron preserrtes en Ia concentración? (Se supone que ningirn .jugador tiene un
puesto fijo de juego.)

25 En un Ienguaje de computación, un identificador consta de una Ietra o de una letra seguida de


hasta siete símbolos, qrte ptteden ser letras o dígitos. (En este lenguaje son indistinguibles las
letras mayúsculas y minúrscrrlas, hay 26 letras y 10 dígitos.) ¿',Cuántos identificadores diferentes
se pueden utilizar en el lenguaje de computación?

26. En cualquier set de un partido de tenis, el oponente X puede vencer al oponente Y de siete
maneras. (Con el marcador 6 - 6, se juega uu desernpate: tie breaker) El primer tenista que
gane tres sets obtiene la victoria. ¿De cuántas maneras se pueden registrar los resultados si:

a) X gana en cinco sets?;


b) para ganar el partido se necesita jugar como mínimo tr.es sets?

27. ¿De cuántos modos se pucden poner 5 anillos diferentes en los dedos de una narlo. omitiendo el
pulgar?
Definición de probabilidad
28 Sean Q un espacio muestral y A, B y C eventos cualesquiela) exprese las siguientes afirmaciones
conro uniones e intersecciones de A, B y C y de sus conrplementos.

a) Ninguno de los eventos ocurre; c) No ocurre más que un e\-ento:


A, B, C
b) Por Io menos uno de los eventos A, B, C d) Ocurlert exactanlellte cios eveutos;
ocnrre; e) Ocrrrren no más de dos e\-entos.

29. Con el empleo de Ia definición de probabilidad, dernuestre:


2.6. Ejercicios

a) Pr(0) : o; c) Pr(A u B) < Pr(A) + Pr(B);


b) Pr(AuB) : Pr(A) +Pr(B) -Pr(Ana); cl) Pr(A) : Pr(-4nB) +Pr'(AnB').

aj 30. Se arrojan dos dados, sean A el evento <<la suma de las caras es impar>>, y B el evento <<sale por
Io menos un tres>>. Describa los eventos A a B, Atl B, A l\ 8". Encuentre sus probabilidades
si se supone que los 36 eventos elementales tienel igual probabilidad.
i€,
AS 31. Se consideran dos eventos A y B, tales que Pr(A) : 1 r PrlB) : 1. Determine el valor de
3" 2
Pr(A'O B) en los siguientes casos:

a) A y .B son incompatibles; b) A C B; c) Pr(A n B) : :1


8

:32. Se consideran dos eventos Ay B, con Pr(A) : 0.375, Pr(B) : 0.5 y er(AnB) :0.125. Calcule:

a) Pr(Á") y Pr(B"); c) Pr(Á" ) B");


b) Pr(A u B); d) Pr(Á" n B) y Pr(A. Bc).

'),). Sean A y B dos eventos tales que Pr(A) :0.9 y Pr(B) :0.8. Demuestre quePr(AnB) > 0.7.

34. Un experimento aleatorio consiste en arrojar una moneda y un dado a la vez y observar el
resultado. Escriba el espacio muestral del experimento.
rdo
tos ,JD Una empresa tiene dos tiendas distribuidoras, una en el norte y otra en el sur de la ciudad. De
utl Ios potenciales clientes, se sabe que el 30% solo compra en la tienda norte, el 50% solo compra
en la tienda sur, el 10 % compra indistintamente en las dos tiendas y el 10 % de los consumidores
no compra en ninguna de las dos. Sean los eventos A: <<el cliente compra en la tienda norte>> y
de B: <<el cliente compra en la tienda sur>>. Calcule las probabilidades (e interprételas):
las
tes a) Pr(A); d) Pr(A n B); g) Pr[(A n B)"];
b) Pr(,A u B); e) Pr(A \ B);
ete c) Pr(B"); f) Pr(Á" ñ B"); h) Pr(A u B').
lue
: 36. En la intersección de una autopista, los automóviles pueden girar a Ia derecha (D) o a la izquierda
(1) Desde un puesto de observación se registra el sentido de la maniobra de los tres primeros
vehículos.

a) ¿Cuál es el espacio muestral del experimento?;


rel b) Sea A el suceso <<a lo más uno de Ios coches gira a la derecha>>, B: <<todos los vehÍculos
giran en Ia misma dirección>> y C: <<exactamente uno de los coches gira a la derecha>>.
¿Qué relación existe entre Ios sucesos B y C?;
c) Enuncie y halle los elementos de los sucesos B', BUC, A)8, AcaB".

Cálculo de probabilidades
.)/. Un gerente de compras desea hacer pedidos a proveedores diferentes, a los que nombra corno A,
B y C. Todos los proveedores son iguales en lo que respecta a la calidad por lo que escribe cada
letra en un papel, rnezcla los papeles y selecciona a ciegas a uno de ellos. Se hará el pedido al
vendedor que salga seleccionado. Calcule las probabilidades de los eventos:
66 Capítulo 2. El Concepto de Probabilidad

a) SC scloc:r:iorr<i itl plovrtr:clor' /l; c) cl proverr:clor ,,1 rro sc sclc<:cion¿r


l,) s(l s<rlc<:r:ioLra ttl 1>r'ovccrlr.rt A c¡ ():

Sttpong:t quo cll ttn soLt(:o itr lrrolrirlrilicl¿tcl rlc galiar prirner prcrrric-r.,,
f v
38 c1 1a,1" girnzrr cl
3^Si 1a
:. 3
r.cgLttLc[,r ¡rt.'tnio,'s
¡i irrolrabilirl¿rr1 r[c B¿ur¿:r1 ¿rl nretrros rrrro clc los rlr¡s ltlcrnios es ;-l . ;.r:irlcrrlc
la probabilicl¿rcl clc garr¿rl solo rrrro dc los rlos plenrios'/

39 Sc enr'í¿rtt 3 oficios a 3 personas diferrentcs. Sin ernb¡rr'Élo, una secret¿ria distr'¿rícla levrir:lvc los
oficins v sc pttccle consitlelal clttc los lnalr(ló ¿rl ¿z¿1r. Si tur¿r coirrcidencria <rs el hcchri rle rlrrc rrna
persona recil-,a el oficio correcto. cak:ule la probabilidad de que haya:

a) ninguna coincidcricia;
b) exactarrrente rrna coincidencia.
40 La fábrica errsarnbladora ha dcterminado que Ia demanda clel arrto Honda Civic es igual para
cada uno de los colores azul, blanco, verde y rojo. Se haceu tres pedidos sucesivos de autos de
ese rnodelo. Deterrnine la probrrbilidad rle que:

a) se piclan uno azul, uno blanco y uno rojo;


b) se piclan dos azules;
c) se pida por lo menos rrno vcrde;
d) exactarnente cios rle los cluc se pidicron tengan el rnisnro color.

4I Lr-icgo dc las 1>ntel)¿ls tr)¿I a ocupar un puesto a los 6 aspir;r.rrtes se lcs clasifica de a<rrrerclo al 1>untaje
obtenido. Los rcsrtlt¿r<los uo le llegtrn al empleador pol lo quc él contlat¿r a clos aspirantes al
azar'. ¿,Cuál cs ia ltrobabili<lad tle quc haya contratado a los dos aspirantes me,jor c¿rlificados?
r)
,1
Un pacltrete cle 6 focos tienc 2 rrnidacles clefectuosas. Si se cscogen 3 focos para su uso, calcrrle
la probabilidad cle qr-re ninguno tenga clef'cctos.

43 En ttna caja hay 20 fotografías en la cual htry 6 mal tomadas. ¿,Cuál es la probabilid¿rd de
selecciorrar 2 fotografías clefectuosas'/

44. Entre 100 artículos de ttn lote hay 5 <iefectuosos. Halle Ia probabilidad de que entre 10 altículos
escogidos aI azar, no sc tenga más cle un artículo defectnoso.

45 Un distribuiclor de electrodomésticos recibe un euvío de 20 pianchas, cie las cu¿rles hay 3 defcc-
tuosas. Para conocer si el lote está buerro pmeba 6 aparatos. trl distribuidor aceptar¿i el lote
si cltcttetitra a lo rnás ltn aparato dcfec:tnoso cntrc los prolrados. ¿Cuál cs l¿t pl'ollabili<lad cle
rechazar el envío'/

46. De un áttft-rrir, quc contietre 100 boletos. se extr¿err tres bolctos ganadores. ;.Crrá1 cs la lrrob:r-
biliclad de que gane una persona que conrlrró:

a) 4 boletos?; lr) solo un bolcto?

47. Entt'e 1as 80 t:stacioncs de sen,ir:io qrrc hay ell nnA cindarl, 10 errtrcgan un¿r ca:i-i'la,l merrol clue
la que el cliente compr¿r. tlu inspect,or clc la Dirccción de Hiclrocarbrrros r-i..it:r aie¿rtori¿rmente
cinco de ellas para velificar si la cantidad'n'enrlid¿r cs correct¿t. ¿,CLrál es la p:'',rt,airrliclad rle que
descubra al nenos una fiaudulenta?

48. En el juego del <<cuarenta>> se reparten 5 cartas, al azar, a cada jugador. a palil' ,Le rrn mazo de
40 cartas. ¿,Cuál es la probabilidad de que un jugador tenga:
2.7. Independencia y condicionalidad 67

¿r) urr as) rur dos, un trr:s, un cuatLo y un c:irrro, clel rnisnio pnlo'/;
l,) 4 c¿u'tas <lel rnismo pirlo'/;
t:) rrua <<rorrcla>>; cs rlecir', 3 calt¿.rs rle ia rnisrna clelornil¿lci<in (as, clos, etc.)?

i9 En nrr closet hay 6 pales cle z¿rpatos. Se escogcn 4 zapatos al azar. Encuentre la probabilidad
rle de qnc haya pol io rnenos lrn par de zapatos errtre los 4 zapatos escogidos.

50 Err los países europeos existe una forma muy popular de lotería, llamada Lotto, que consiste en
OS seleccionar'6 números de una cartilla que contiene 44 núrmeros (del I aI 44). El día del sorteo
na se seleccionan 6 bolas al azar y sin reposición. Una persona gana el premio principal si los
6 números sorteados coinciden con los seleccionados; también se puede ganar prernios si 4 o 5
núrmeros sorteados coinciden. Determine la probabilidad de:

a) ganar el premio principal; b) ganar al menos un premio.

rra 51. Una persona presiona, aI azar, 8 cifras en una calculadora. ¿Cuál es la probabilidad de los
de eventos siguientes:

a) ,4.: <todas las cifras sean distintas>?;


b) B: <<el producto de las 8 cifras es un número par>>?;
c) C: <<las 8 cifras forman un conjunto creciente>?;
d) D: <<la suma de las cifras es igual a 3>>?
i2. En un círculo de 20 cm de radio se encuentra un círculo menor de radio 10 cm. Halle la
aje probabilidad de que un punto marcado aI azar en el círculo mayor caiga también en el círculo
,al menor.
,
=.)
.1.J. Dentro de un cancha de baloncesto, cuyas dimensiones son 20 m por 12 m, se encuentran dos
ule charcos que tienen forma de círculos, de 8 y 5 m de diámetro respectivamente. ¿Cuál es la
probabilidad de que una pelota lanzada a la cancha caiga dentro de uno de los charcos?
de .J+
=1 Dentro de un rectángulo de base 10 cm y altura 6 cm se encuentra un círculo que es tangente
a 3 de los lados. Si se marca un punto al azar dentro del rectángulo, calcule la probabilidad de
Llos
que el punto no se encuentre dentro del cÍrculo.

Dentro del rectángulo limitado por las rectas , : -L,, :;, A : -7, A : l, se tiene el
bc- gráfico de la función trigonométrica seno. Sobre el rectángulo cae una gota de tinta. ¿Cuál es
ote la probabilidad de que Ia gota de tinta haya caído dentro del área comprendida entre el eje r y
de la curva A: sel:x? (Observación: Suponga que el área, de Ia mancha de tinta es despreciable.)

2.7. Independencia y condicionalidad

Fn la teoría de probabilidad un concepto muy útil es el de independencia de eventos, que significa que
-a ocurrencia de uno de los eventos no da información sobre si otro evento ocurrirá o no; es decir, Ios
lue -r-entos no influyen uno sobre otro.
nte
lue
Definición (de independencia) Dos eventos A y B se llaman independientes si la probabilidad
de que ambos ocurran es igual al producto de las probabilidades de los dos eventos individuales.
Es decir,
,de Pr(A n B) :Pr(A) x Pr(B).
Capítulo 2. El Concepto de Prcbabilidad

Esta dcfinición se puede extender a cualquier núrmero de eventos.

Observación.- Si A y B son independientes, se puede dernostrar que sus respectivos complementos


son independientes; es decir, que se cumple:

Pr(An B'): Pr(A) x Pr(g").


Pr(A n B) : Pr(A') x Pr(B),
Pr(A" n B') : Pr(A') x Pr(g").

No se debe confundir los conceptos de eventos independientes y de mutuarnente incompatibles (dis-


juntos).

Ejemplos

1. Sea Q: [0,1]x [0,1] y dados los eventos: A: {(r,a)10 S r 5ll2; 0 < y < I}, B : {(",A)10 <
r 1I;0 <y <Il ). Probar si A y B son independientes.

Figura 2.5:

Soluc'ión: Según la Figura 2.5 se tiene que Pr(A) : 1


\/4 :
PrlB) l.
1
entonces
i,
Pr(A) x Pr(B) :+" 11
48'

Por otro lado, antes se calculó que Pr(A n B)


I
Como se cumple que Pr(A n B) : Pr(A) x Pr(B), entonces los eventos A y B son independientes.
2. En una máquina, para la señalización de emergencia se han instalado dos indicadores que fun-
cionan independientemente. La probabilidad de que el indicador funcione durante una avería es
de 0.95 para el primero y 0.9 para el segundo. Hallar la probabilidad de que durante una avería
solo funcione un indicador.
Soluctón: Sean A: {funciona el primer indicador} y B: {funciona el segr,rndo indicador}.
El evento f, : {funciona solo un indicador} puede expresarse como C : (-{ i B')U (A l\ B).
Calculemos cada una de ellas:

Pr(AnB") : Pr(A) xPr(B') :(0.95)(1 -0.9) :0095.


Pr(A'n B) : Pr(A') x Pr(B) : (1 - 0.95)(0.9) : 0.045.
2.7. Independencia y condicionalidad 69

Pcu lo trutto.
Pr(C) : Pr'(,4 a 13") * Pr(4" . 13) :0.095 + 0.045 : 0.14.

Tles bicllogos, irr<lepcnclierrtcrncutc uno clel otlo, nriclielon el c:<¡rrtcniclo <,1<'l suero c1t tlll¿l tttttestra.
La proba.bilidacl cle <¡-re cada uno comet¿r Lln el'ror eu I¿r lcctur:r dol apzrlato cs igutrl a 0.1, 0.15 y
0.2, r'r:s¡rectivarrrente. Hallal la probabilidad de que cll ttna s<,rla rnecliciótt pol lo meros ttno de:
Ios investig¿rclores coureta Lrrl erlor.
Soluc,ió,n,: Se¿r el evento ¿: {por lo menos uno de los investigaclolcs coniete urr crror}, el
complerrento es A" : {ninguno de los investigadores comete un error}.
Caicul¿rrernosPr(4"), considerando que las medicioltcs son evctttos inclcpendientcs.
(dis- Sean p¿ la probabilidad de que el i-ésimo investigador cometa un error (i: I,2,3), entonces

Pr(A') : (1 -pr)(t-pz)(I-pz)
: (1 - 0.1)(1 - 0.15)(1 - 0.2) :0.612.
/0< Resulta que Pr(A) - 1- 0.612 : 0.388.

r-n concepto estrechamente relacionado con la independencia es el de condicionalidad de eventos, que


.e lo puede enunciar de la siguiente manera: <<se tiene fijo un cierto evento B, se desea conocer cuál
- la probabilidad de que ocltrra un evento A, sabiendo que ocurrió B>>.
?or ejemplo, suponga que usted va a almorzar al mismo Iugar todos los viernes y que su almuerzo
- sirve en 15 rninutos (evento A) con probabilidad 0.9. Sin embargo, daclo que usted nota que e1
_rstaurante está excepcionalmente lleno (evento B, fijo), la probabiliciad de clue sirvan su almuerzo en
-5 minutos pnede reducirse a 0.7. Ésta es la probabilidad condicional de ser servído en 15 mirr.utos,
rado qne el restartrante está excepcionalmente lleno.

Definición (de probabilidad condicionada) Consicleremos un espacio tnttestral Q y un evento


3 e Q tal que Pr(B) 10. La probabilidad condicional de que un evento A octtrra, en el supuesto
:,-re B ha ocurlido) se representa por Pr(AlB) (que se lee <<probabilidad de A, dado B>>), se define

Pr(AlB):HF

Ejemplos

-. En nn estudio sociológico sobre Ia fidelidad en el matrimonio sc obtu'u,o el siguiente modelo


probabilístico, calificando al hombre y a Ia mujer como fiel (,F) o iufiel (/).
entes.
Mu.jer
e fun- Hombre F I
lrÍa es F 0.22 0.24
avería I 0.31 0.23

r). a) ¿.Cuál es Ia probabilidad condicional de qtte ttrr esposo seir fiel, clirclo qr-re sll esposa es fiel?
b) ¿'.Cuál es Ia probabilidad de ctrr-te ttl)a esposa sea fiel, claclo
(luc srr csposo es infiel'/
n B).
Sol'u,ción; Corrvengarnos en la siguiente not¿ciórr de los ercrrtos:
.f1F: Hornbre fi.el, 111: Hombre iuficl,
,41F: N{u.ler fiel, 11,/1: \4Lr.jer infiel.
70 Capítulo 2. El Concepto de Probabilidad

a) Dcseamos calcular
PI(II I-IAI F) : f'r(II F. n{F)
Pr(r1F)
De 1a tabla se obi:ierrcr cllle

trL(i1F . AI F) ¡),
Pr(n1F) 0.22 + 0.31 :0.53.
Con ésto,
0.22
Pr(111¡lrt{F) : : 0.415.
0.53
b) Calculcmos
n HI)
Pr(A,I FIH i) : Pr(MF
Pr(H/) )

con
Pr(MFnf{f) :0.31 y PI(III): 0.31 + 0.23 : 0"54.

Entonces,
g'31
pr.(,41 FIHI\:
' 0.54
:0.bT4.

2. En un taller trabajan 7 hornl)res y 3 mujcles. Se escogen al azar 3 personas. Hallar la proba-


bilidad de que todas las pcrsonas selcccionadas sean hombres.
Solución: Designemos los siguienfes eventos:
A: el primcr selcccionado es hombre,
B: el scgundo seleccionado es hombr-e,
C: el tercer selecciorraclo es honiirre.

* La probabiliclad cle que el primelo s<-.¿r


\/
hombre es Pr(A) - :10
u La probabiliciad de <+re el seguriclo sea hombre a cc¡ndición de qrre el primelo f.,e hornbre
ES:

Pr(BlA\:9:?
__\_r--l
9 3
u La pI'r¡babilidad de que el tercero sea hombre sabir:rrdo que los dos primeros t¿rnrbién lo son,
es la probabiiidacl dc C dado A y B:

:'r(C An : !.
ll),E
tr-ir pr"obabiiid¿rci buscacla tlc clrrc las i,lcs i)crson¿rs escc.rgiclirs sean holrlrres es

?, (,{ I B. C): PL(,,t) x P: (13lri) x Pr(Cl4 i', ::


B)'1(l,i: : I:

2.8. Frob¡abilidad coxmpleta y fénrutula de Bayes

La probabilid¿rd clc: A, que puccic ocrrriir sclo ¿rl ¿lll¿rlecel uno rl,:.'. . .1 ,,< r-trLrtuarnerLtr:
Lttt cvonto
f:xclltt¡'g¡¡iss B t, 82, .. , 8,, (Figura 2.6), talcs (llre sli uniórr es el espacio rri,r.:j r.- j ,'1 (lada por

Pr (A) : I'r(131)Pr(,,t1-ts1) * Iri(82)Fr(Al1l2) + .."+ I'r,!,, i - : (2 3)


lt
\- n,.r /? ' nr / 1'|¡r \
1r'.\L.tt_
2.8. Probabilidad cornpleta y fórtnula de Eayes 77

donde Pr(81) + Pr(82) + .. . + Pr(B,,) : 1.

La igualdad (2.3) se clenornirra la fór'rnttl,a dc la prolttt,bi,lidad com,pleta.

Figura 2.6: Partición del espacio muestral fl.

Supongamos que el evento A puede ocurrir a condición de que aparezca uno de los eventos Bt, Bz,
..., Bn. Si A ya ocurrió, la probabiiidad (condicional) del evento B¿ es igual a

Pr(B6lA) :ffi:g;ffi
Pr(AnB¡) Pr(B¡)Pr(AlB¡)

i:I

Fsta ieualdad se denomina fórmtil,a de Bayes.

?ara e1cálculo mediante la fórmula de Bayes puede resultar conveniente disponer las probabilidades
:t rn diaqrama de ó"'rbol como el siguiente'.
A
Pr(81)Pr(Al81)
A'
Pr(81)Pr(A'lB1)
A
Pr(82)Pr(AlB2)
Ac
Pr(82)Pr(A'lB2)
A
Pr(8,)Pr(AlB")
Pr(8")Pr(A'lB")
rsta dispctsiciórr de los datos facilita la rcaiización de los cálculos ya que
únicamente se debe realizar
-na slrma de los resultados en las ramas de interés

Ejer.:rIos

l. En una oficina hay 6 computador¿rs de marca y 4 ciones. La probabiliclad de que al utilizar una
mác1lrina, ósta encienda correctameirte es 0.95 para las de marca y 0"8 para las clones. Un em-
pleado utiliza aI azar una computadora, hallar la probabilidad dc que se encienda correctamente.
.4oluci,ón: Definamos los eventos:

.3)
A: el empleado ul,iliza una máquina de marca,
B: el crnpleado utiliza una máquina ción,
C: la máquina enciende correctarnente.
72 Capítulo 2. EI Concepto de Probabilidad

Sc ticrrc,
4
PL(A) :*:,,0, Pr(ll) :r0:,,.n.
Pr(ClA): 0.95, Pr(ClB): 0 8.

Si reprcsent¿rmos las probabilicladcs crr un ditrglama cle árbol se tiene:


C
PL(A) Pr(ClA) : (0 6)(0.e5)

Pr(B) Pr(ClB) : (0.4)(0.80)

Por la fórmula de la probabilidad completa,

Pr(C) : Pr(A)Pr(ClA) + Pr(B) Pr(ClB)


: 0.6 x 0.95 * 0.4 x 0.8 : 0.89.
2. Dos máquinas envasan gaseosa de manera automática, resultando que la primera envasa el doble
qrre la segunda. La primera máquina envasa el 60% de las botellas con Ia cantidad exacta y
la segunda el84%. Una botella tomada del transportador resultó llena con Ia cantidad exacta.
Hallar la probabilidad de que haya sido envasada por:
a) la primera máquina; b) Ia segunda máquina.
Sohtción: Designenos por eventos:
A: la botella está llena con la canticlad exacta;
81: Ia botella ha sido envasacla por Ia primera rnáqr-rina;
82: la botella ha sido envasada por la segunda rnáquina.

a) Se tiene
Pr(81) : j,2I Pr(82) : :.
La probabilidad condicional de que la botella contenga la cantidad exacta, si ha sido en-
vasada por Ia primera máquina es

Pr(AlB1) :0.6.

La probabilidad de clue la botella contenga la cantidad exacta, si ha sido envasada por la


segunda máquina, es
Pr(AlB2): 0.84.

Por tanto, la probabilidad de que la botell¿r tomada aI azar contenga la cantid¿d exacta es

PL(A) : Pr(81)PL(Al81) +Pr(82)Pt(AlBz)


: 21
5x0.6+j"0.84:0.68.
La probabilidad del evento <<se escogió nna botella con Ia canticlad e\acta llcna<ta por la
plimera máquina>> es igr-ral tr
2
Pr (81) Pr(Al81) _ =3 X 0.6 _ ri-,
rLl
Pr(.ts114):
Pr(A) 0.68 i;
2.8. Probabilidad cornpleta y fórmula de Bayes 73

1-,) Ltr prcibttbilidtrd del cr¡cnto <se escogió un¿r botcll¿r r:on la cantidad exacta llcuada poi' Iir
segurrcla má<¡rirrir>> es

Pr'(82) Pr(AlI]2)- o'84


Pr(BzlA): ''
'l i "
- " o.o, -
T

É 17.

Este resultado tarnbién se puede calcular eurpleando cl concepto dc evento cornl lerlentario.

Err trna ciudad, el 25% de los habitantes son ancianos, el 35 % adultos y ei 40 % sorr liños. Se
sabe que la glipe afecta al5% cle Ios ancianos, al4To de los adultos y al2% de los rriños.

a) Calcular la probabilidad de que un habitante, seleccionado aleatoriamente, tenga gripe.


b) Si un habitante tiene gripe, ¿cuál es Ia probabilidad de que éste sea anciano o niño?

Solución: Designemos los eventos:


A: el habitante es anciano. D: el habitante es adulto.
l/: el habitante es niño. G: la persona tiene gripe.

oble a) Si utilizamos el diagrama de árbol tenemos:


tay
G
cta. Pr(.4) Pr(GlA) : (0.25)(0.05)

Pr(D) Pr(clD) : (0.35)(0.04)

Pr(N) Pr(GlN) : (0.40)(0.02)

Ahora, basta sumar los resultados parciales en las ramas para obtener el resultado deseado:

Pr(G) : Pr(A)Pr(GlA) +Pr(D)Pr(clD) +Pr(r/)Pr(clr/)


: 0.25 x 0.05 + 0.35 x 0.04 + 0.4 x 0.02: 0.0345.

La probabilidad de que un habitante de la ciudad tenga gripe es del3.45r/o.


¡r Ia b) Por la fórmula de Bayes:

: Pr(A)Pr(GlA) _ 0.25 x 0.05 t25


Pr(,alc)
ta es
Pr(G) 0.0345 345'
Pr(r/lc) : Pr(.nü)Pr(Gl.nr) _ 0.40 x 0.02 80
Pr(G) 0.0345 345
Consecuentemente,

or l¿r
Pr(,4u¡/lG) : Pr(AlG) +Pr(.n/lc)
r25 80
345+3*:0'594'
La lrlobabilidad de que si urt habitante tiene gripe, éste sea anciano o rriiro, es clel 59.4%.
74 Capítulo 2. EI Concepto de Probabilidad

4 EI 35'/r, clc los ct'óclitos clttrt rtt<-ltger rtrr banc<l es par¿r vivicncla, eI 50%, ltara pr.ochrc:cióu y el r'esto
(r()llsittlllo. R,cstrlt¿rrr lltot()sos r:l 20(X, tk: krs cl'írtlit,cts
l)¿r1 ¿i ltrua vivic¡r,la, el l5%, rlc los clérlitgs
lrillrr ¡>r'orlrrcrción y t>l 70c,4, r[c Ios cr'éditos I)¿i,t'a c:orrsurr]o.

a) Dr:tcrrnine la probabilidad de quc uu crédito elegido al azar', sc pague a tieurpo.


1;) La plobabilidad de que urr crédito c¡-re ha resnlt¿rdo en rnora) haya siclo otorgaclo para Ia
ploducción.

Solución: Designemos los eventos:


1/: el crédito es para vivienda. P: cl crédito es para producción.
C: el crédito es para consumo. A,[: e] crédito está en mora.

a) Tengamos presente que el evento <<el crédito se paga a tiempo> es el complemento del
evento <el crédito está en mora>; entonces, buscamos Pr(M.).
Por la fórmula de la probabilidad total,

Pr(M) : Pr(MlV) Pr(y) +Pr(MlP)Pr(P) +Pr(MlC)Pr(C)


: 0.2 x 0.35 + 0.15 x 0.5 * 0.7 x 0.15 :0.25.

De manera que Pr(M") : t - Pr(M) - 1 - 0.25 : 0.75.


b) Por la fórmula de Bayes,
Pr(P)Pr(MlP)
Pr(PlM)

2.9. Ejercicios
1. Sean A y B dos eventos con Pr(A) # 0 V Pr(B) 10. Demuestre que

Pr(A n B) : Pr(B)Pr(,alr) : Pr(/) Pr(BlA).


2. DemuestrequesiAyBsoneventosindependientesysiAeBentonces,pr(B) :lopr(A) :0.
,
.). Se consideran los eventos Ay B tales que Pr(,4) : pr(a) : p.(A aB):i.catcule:
]; ];
a) Pr(AlB); c) Pr(A"lB); e) Pr(,4'lB"):
b) Pr(BlA); d) Pr(B"lA); f) Pr(8" --l').
4. Srrponga que un punto es elegido aleatoriamente en el cuadrado unitario. Si se conoce que el
pttntoestáenelrectángulolimitado porgl - 0,A:I,tr:0y r:]. autteslaprobabilidad
"
cle que el punto esté en el triángulo limitaclo por y:i,,*:IU,*.:
l,
5. Sea Q: {(r,a)/0 <r 1I;0<g < 1} el espacio rnuestral de un fenónrerro aleatorio. Calcule
Ia probabilidad de los eventos:

a) A:{(",ü101r <t; 0<a<Ll2};


b) B: El triángulo limitado por las rectas r:0;A:0; g:I - t:
2.9. Ejercicios 75

.StO c) ¿.Son indepcndicntes los cvenlos A v B?


tOS
En el crrach¿rdo uniclacl ser cr¡rrsi<leran los siguientcs cventos:
A: El triángulo lirnitado por z:0, A: L, A: x: +713.
B: E1 triángulo limitado por r :0, a :0, !,/ : 7 - r.
rla
a) Halle PL(B \ A), Pr(BlA) y Pr(A I B'');
b) Pruebe si A y B son independientes
Un inspector debe seleccionar a un trabajadol cle entre 4 aspirantes numerados del 1 al 4. La
selección Ia lleva a cabo mezclando los números y tomando uno aI azar. Sean: A el evento <<se
seleciona al trabajador 1o al 2>>; B, el evento <(se selecciona al trabajador 1o al 3>>; y C, el
del evento <<se selecciona el trabajador 1>. ¿Son independientes: Ay B?;b) Ay C?
")
Se lanzan dos dados, ¿cuál es la probabilidad de que en los dos dados salga el 3, si se sabe que
la suma es 6?

En una biblioteca hay B libros de literatura de ciencia fi.cción, 3 de los cuales son de Isaac Asimov.
La bibliotecaria toma al azar 2 libros. Determine la probabilidad de que ambos libros resulten
ser de Isaac Asimov.

10 La Empresa de Correos ha determinado que el 70% de los paquetes enviados al exterior no llegan
a su destino. Dos libros se pueden enviar separadamente o en un solo paquete. Para cada una
de las dos formas de envío postal, encuentre:

a) la probabilidad de que ambos libros lleguen a su destino;


b) la probabilidad de que al menos un libro llegue a su destino.
11. Suponga que el 5% de todos los hombres y el 0.25 % de todas las rnnjeres sufren daltonismo.
Una persona escogida al azar resulta ser daltónica. ¿Cuál es la probabilidad de que esta persona
sea un hombre? (se considera que la cantidad de hombres y mujeres es igual).

t2. El 35% de los créditos de un banco es para vivienda, el 50%o para industrias y el 15 % para
consumo. Resultan morosos eI 20To de los créditos para vivienda, el 15% de los créditos para
industrias y el 70 % de los créditos para consumo. Calcule Ia probabilidad de que se pague un
crédito elegido al azar.
1t
1J En una exhibición de arte hay 12 pinturas de las cuales 10 son originales. Un visitante selecciona
una pintura al azar y decide comprarla después de escuchar la opinión de un experto sobre la
autenticidad de la pintura. El experto está en lo correcto en 9 de cada 10 casos, en promedio.

a) Dado que el experto decide que la pintura es auténtica, icuál es la probabilidad de que él
no se equivoque?;
b) Si el experto decide que Ia pintura es una copia, entonces el visitante la devuelve y escoge
Le el
otra, ¿cuál es Ia probabilidad de que Ia segunda pintura escogida sea original?
dad
14. Hay una epidernia de cólera (C). Consideramos como uno de los sÍntomas la diarrea (D), pero
este síntoma se presenta también en personas con intoxicación (1) , e incluso en algunas que no
tengan nada serio (N). Las probabilidades son:
cule
Pr(DlC): 0.99; Pr(Dl1) : 0.5; Pr(Dl,n/) : 0.004

Se dan los siguientes porcentajes: el 27odela población tiene cólera y el 0.5% intoxicación. Si
una persona tiene diarrea calcule la probabilidad de que tenga cólera.
76 Capítulo 2. EI Concepto de Probabilidad

15. Urta pru<tlril cl vitrts del SIDA eu la sangle cl¿ el cliagnóstico correcto coll urra pro-
l)¿tl¿r rlctct:t¿rt
babilicl¿rcl rlcl 9ll %. Sogrin clatos módicos) lrrio clc carla 2 000 habitantes cl<ll país. en prornr:clio, es
poltaclol rlrtl virtts. Da<lo qrte la pnrebzr fire positivtr I)ar¿r una persorl¿1) 1',clr¿il es la proira.lriliclacl
cle que cll¿r, r'e¿lnrcrrte tcnga Ia enfermed¿rd?

16. Utra emplesa financiera opera en las tles regiones del país: Costa, Sierra y Arnazonía. El 50 %
de las opeLaciones se realizan en la Costa, el 40 To er Ia Sierra y el resto en la Amazonía. Se
ha estimaclo, derlrido a la larga experiencia, el porcentaje de clientes qne no pagan sus deudas en
cada una cle las regioues. Para Ia Costa es del I%o, para la Sierra deI 2To y para la Amazonía
del 8 %. Si la empresa tiene 1000 clientes, determine cuántos pagan sus deudas puntualmente.

17. Una encuesta revela que el 70% de la población tiene estudios secundarios, de los cuales eI 72%c
no tiene trabajo. Del 30 '70 q:ue no tiene estudios secundarios , eI 25 % no tiene traba.jo. Calcule:

a) El tanto por ciento de la población que no tiene trabajo;


b) La probabilidad de que una persona elegida al azar tenga estudios secundarios entre las que
no tienen trabajo.

18. De 200 aspirantes a un cargo se conoce Ia siguiente tabla respecto a experiencia en funciones
similares y la formación académica necesaria

Con formación Sin formación


Con experienc a 16 32
Sin experienc a 24 128

Halle las probabilidades de encontrar una persona:

a) con experiencia y con folmación; d) sin formación dado que no tiene experien-
b) con experrencra; cia.
c) con experiencia dado que tiene formación;

19. En una investigación sobre el crédito bancario a trabajadores agrícolas se obtu\¡o el siguiente
modelo, en el que se califica al campesitto como propietario o no propietario del terreno que
cultiva y si mantiene o no mantiene deudas con los bancos.

Propietario
Deudor SI NO
SI 12 28
NO 20 64

Calcule la probabilidad de quc:

a) un campesino mantenga deudas con Ia banca;


b) un campesino sea dueño dei terreno que cultiva;
c) un carnpesino sea propietario, dado que no es deudor;
d) un campesino sea deudor, dado que es propietario del terreno.

20 A 100 empleados se les hizo un examen para determinar su destreza mar,'.,:-- C''ralenta clc los
ernpleados er¿n hombles. Scsenta de los empleados pasaron el exameli 1., _: .. ¡ ¡.lcanzaron rur¿l
2.9. Ejercicios 77

ro- calific¿rcióu rriayot que cicrto rrivcL Pledetr:r'ruil¿rdo cle a¡rr'<x,'eclrarnictrtci. L¿r cl¿rsific¿-Lción entre
CS
hornll'ers y rnujer-cs fue Ia sigrrielrte:
[¿cl
Honrlrr.cs (11) N{u,lcres (,4'1)
Pasaron (P) '24 36
)% No pasarou (.Ay') r6 24
Se
ien Sr-rponga que se selecciona al azar un eurpleado dc los 100 que hicielon el examen.
lnía
Lte. a) Calcule la probabilidad de que el empleado Laya ptrsado y sea hornbre;

2%
b) Calcule la probabilidad de que el emplead., sea hombre dado ctrtrc pasó el examen;

ule: c) ¿Son independientes P y H?;


d) ¿Son independientes P y M?

q.ue
2I. Los empleados de la compañía Crrz del Sur se encuentran distribuidos en 3 divisiones: Admi-
nistración, Operación de Planta y Ventas. La siguiente tabla indica el núrmero de empleados en
cada división, clasificados por sexo.

ones Mujeres (M) Hombres (-F1)


Administración (A) 20 30
Operación (0) 60 r40
Ventas (V) 100 50

Si se elige un empleado al azar,

a) ¿cuál es la probabilidad de que sea mujer?, ¿y de que trabaje en ventas?;


b) ¿cuál es la probabilidad de que sea hombre y trabaje en la división de Administracíón?;
c) ¿cuál es la probabilidad de que trabaje en la Operación de Planta si es mujer?;
d) ¿,cuál es la probabilidad de que sea mujer si trabaja en Ia división de Ventas?;
e) ¿Son los sucesos V y H independientes? ¿y los sucesos Ay M?

úente 22. Dada la siguiente tabla que indica el comportamiento respecto del hábito de fumar en un grupo
) que de 100 estudiantes que fueron averiguados.

Hábito
Sexo No fuma Fuma Ex-fumador TOTA
Hombre 16 10 24 50
Mujer 30 16 4 50
TOTAL 46 26 28 100

a) Encuentre las distribuciones de las variables <<sexo>> y <hábito de fumar>>;


b) Encuentre las probabilidades de los eventos: <<la persona fuma>> y <<la persona fuma, dado
que es mujer>>;
c) ¿Son independientes los eventos <<ser rnujer>> y <<fumar>>? ¿Por qué?

23. Del total de socios de un b, son hornbre, u ? .on profesionales. Además,


"lt I *0" las mu.jeres
J
soll lro ¡rrofcsiorrtrlcs. S" a? azal' uu ,r'ri"rntrr'3 a"l .tut-,,
"lig"
de los a) calcule la probabilidacl de que sea hornbre y profesional;
lt Lul¿r b) calcule la probabilidad de qne sea hombre, dado que es profesional;
'"' r ii-- -I. - -. ar ¡

78 Cipítuto 2. El Concepto de Probabilidad

c) Deterrline si sott irrdcpendierttes los evcntos <sel mujcr>> y <<no ser'profesional>>.

24 Ertttt¿tfábric;a. el 707o clcloscmpleadossonlojanos. Decntrcloslo.jtrnos, cl 50%sonhombrcs,


mientras qr.re de los no lojanos, sólo son hombres el 207o.

a) ¿Qué porcentaje de empleados no lojanos son mujeres?;

b) Calcule la probabilidad de que un empleado de Ia oficina sea mujer;


c) Fernando trabaja en dicha oficina. ¿Cuál es la pfobabilidad de que sea lojano?

25. En un paÍs hay 4 partidos políticos que se dividen la opinión pública. Se sabe que:

El 35% de la población adhiere al partido I.


EI SI% adhiere al partido II.
El28% adhiere al partido III.
El6% adhiere al partido IV.

Entre los adherentes al partido I, un 36 % corresponde a personas con ingresos inferiores a dos
salarios mínimos. Entre los adherentes al partido II, esa proporción es del 52'/o. Para el partido
III es un 42V0, y para el partido IV es 11%. Si se elige una persona al azar y resulta tener un
ingreso mayor a dos salarios mínimos, calcule la probabilidad que sea adherente al partido I.

26. La señora Sonia se fue de viaje y encargó a su hijo, Pablo, que riegue el rosal. La probabilidad
El rosal está en un estado inseguro:
", ].
de que Pablo olvide regar el rosal durante su ausen"iu
3
si se riega tiene igual probabilidad de secarse que de no secarse) pero solamente tiene un 0.25 de
probabilidad de no secarse si no se riega. Después del viaje Sonia encuentra el rosal seco, ¿cuál
es Ia probabilidad de que Pablo no lo haya regado?

27. Se estima que sólo un20To de los que compran acciones en Bolsa tienen conocimientos bursátiles.
De ellos el 80 % obtienen beneficios. De los que compran acciones sin conocimientos bursátiles.
sólo un 10% obtienen beneficios. Se desea saber:

a) El tanto por ciento de los que compran acciones en Bolsa que obtienen beneficios;
b) Si se elige al azar una persona que ha comprado acciones en Bolsa y resulta que ha obtenido
beneficios, ¿cuál es la probabilidad de que tenga conocimientos bursátiles?

28. En un supermercado el 70 % de las compras las realizan las mujeres; de las compras realizadas
por estas, el 80 % supera los 20 dólares, mientras que de las compras realizadas por hombres sólo
el 30% supera esa cantidad.

a) Elegido un comprobante de compra al azar, ¿cuál es la probabilidad de que supere los 2C


dólares?;
b) Si se sabe que el comprobante de compra no supera las 20 dólares, ¿cuál es la probabilidac
de que Ia compra haya sido hecha por una mu.jer?

29. En una universidad existen tres facultades: A, B y C. En A hay matriculadas 150 chicas y 5[
chicos; en B, 300 chicas y 200 chicos; y en C, 150 chicas y 150 chicos.

a) Calcule la probabilidad de que un estudiante, elegido al azar, sea chico;


b) Si un estudiante elegido al azar resultara ser chico, ¿cuál es su facultad más probable?
)r-i;!:..r-rnr.- -;t j\--ii-r5v:--r- i_--: -:-=-rr-- l-
-.'

-i-
2.9. Ejercicíos

30. E¡tr.e los cinco rrs¡tirantes a un calgo cle geleute, a <los se ios considera excelentes y a los riernás
se les consicler'¿r bucnos. Para una entrevista se escoge al azal a dos de los cinco. Calcule l¿r,
probabiiidacl de que se esco.ia:

a) a los dos excelentes;

b) por lo menos a uno de los excelentes;


c) a los dos excelentes dado que se sabe que por lo menos uno de los seleccionados es excelente.

31 Se dispone de dos métodos A y B para enseñar una destreza manual. El índice de reprobados es
del 20 To para el método A y 10 To para el método B. Sin embargo, el método B es más caro por
Io que solo se le usa el 30 % del tiempo y el A el otro 70 %. A un trabajador se le adiestra con
uno de los d.os métodos, pero no puede aprender en forma correcta. ¿Cuál es Ia probabilidad de
que se le haya adiestrado con el método A?

32 En los exámenes de ingreso a una universidad cada candidato es admitido o rechazado de acuerdo
a si él ha aprobado o reprobado la prueba. De los candidatos que realmente son capaces' el 80 %
pasa la prueba; y de Ios que no son capaces, el 25To pasan Ia prueba. Dado que el40% de los
dos candidatos son realmente capaces, encuentre Ia proporción de estudiantes capaces que ingresan
ido a la universidad.
un
JJ Según datos de investigaciones genéticas se ha establecido que: los padres de ojos claros y los
hijos de ojos claros constituyen el 5To de las personas estudiadas; los padres de ojos claros y loB
dad hijos de ojos oscuros el 7.9 %o; los padres de ojos oscuros y los hijos de ojos claros el 8.9 %; los
padres de ojos oscuros y los hijos de ojos oscuros eI78.2Vo. Halle la probabilidad de que:
uro:
5de a) el hijo sea de ojos oscuros, si el padre es de ojos oscuros;
cuál
b) el hijo sea de ojos claros, dado que el padre es de ojos claros.

,iles. :l-1 Como un acto de buena vecindad Dios y Satanás acordaron un intercambio cultural entre el
:iles, Cielo y el Infierno. Demonios del Infierno van a vivir en el Cielo, mientras que ángeles del Cielo
van a vivir en el Infierno. Los demonios tienden a no decir la verdad más frecuentemente que los
ángeles. Los demonios mienten el 80 % de las veces y los ángeles mienten el20% de las veces (¡en
estos días es difícil encontrar ángeles buenos!). Después del intercambio, la proporción entre los
demonios y ángeles en el Cielo es 2:3. Mi amigo José murió y fue al Cielo. Él encuentra a una
rnido
persona en la calle y Ie pregunta donde encontrar un baño para hombres. Desafortunadamente,
Ios demonios y los ángeles no se pueden distinguir por su aspecto físico. Deseamos determinar:
:adas
; sólo
a) ¿Cuál es la probabilidad de que Ia respuesta haya sido una verdad a la pregunta de José?
b) Dado que la respuesta fue una mentira, ¿cuál es la probabilidad de que haya sido dada por
un demonio?
os 20
.)=
)'J Una compañía de tarjetas de crédito encuentra que cada mes el 50% de quienes poseen la tarjeta
ilidad cubren totalmente sus deudas.

a) Si se seleccionan dos usuarios al azar, ¿cuál es la probabilidad de que ambos paguen total-
;y50 mente su deuda ese mes?;
b) Si se selecciona un cliente al azar, ¿cuál es la probabilidad de que dicha persona pague
totalmente sus deudas en dos meses consecutivos?
c) ¿En qué hipótesis se apoyó para responder a los dos apartados anteriores? ¿Le parece que
ef alguna de ellas no es razonable?;
80 Capítulo 2. El Concepto de ProbabíIidad

<1) Urr cxarrrerr rn¿is <1et¿rllaclo der los rcgistlos cle la conipañía rnuestr'¿r quc el 90 % cle los clicutcs
que l)agau t<it¿.rllneut,e un¿r cLr<lrrt¿l nrensual tarnbién lo hacen al mes siguiente v <1uc sólcr
eI 70%, clc los cluc l)o l)ag¿]lr tot¿r.lrnente en llrl rnes cttl-¡ren totalmente srr dcrrcl¿ al mes
siguierrte. Calculc, cn este c¿so. la probabilidad pedida en b).
e) Con las hipótesis de d), calcule la probabilidad de que un cliente seleccionado al azar no
pague totalmente ningr-rna cle las dos cuentas rnensuales consecutivas;
f) Calcule Ia probabilidad de que sólo pague una de las dos cuentas.

36 Basándose en varios estlrdios, una compañía ha clasificado, de acuerdo con Ia posibilidad de


crrcorrtrar petróleo, las formaciones geológicas en 3 tipos. La compañía pletende perforar tr.n
pozo en un determinado lugar, al que le asignan las probabilidades de 0.35, 0.40 y 0.25 para
los tres tipos de formaciones, respectivamente. De acuerdo con la experiencia, se sabe que el
petróleo se encuentra en Lrn 40% de las formaciones de tipo I, en un 20% de las de tipo II y en
un 30 % de las de tipo III. Si tras perforar el pozo, la compañía descubre a su pesar que allí no
había petróleo, determinar Ia probabilidad de que ese lugar se corresponda con una formación
del tipo II.

37. El cardinal de un espacio muestral finito es rn. Los eventos A y B son independientes y cumplen
que:

Pr(A) +Pr(B):p y Pr(A n q :+


Halle la cardinalidad de A.

38. Demuestre que si se tienen Bt, Bzr..., B, eventos mutuamente excluyentes, tales que su unión
es el espacio muestral, ertonces se tiene que

fi,:r e'1an¡a) : t.
Capítulo 3

Variables Aleatorias, Esperanza y Varianza

(Jna uariable aleatoria es el alma de una obseruación


(Jna obseruación es el nacimiento de una uariable aleatoria
D. G. Watts, (1991)

:- este capítulo introduciremos el concepto de l'ariable aleatoria, que nos facilitará


Ia realización del
.-álisis de las principales características de los experimentos aleatorios y permitirá definir las Ieyes de
::,,babilidad que ellos siguen, de manera muy general'

3.1. Variables aleatorias


de una
- resultado de una prueba aleatoria no siempre es un número; por ejemplo, en el lanzamiento
de los eventos Ie podemos
-:,neda los resultados son <<cara>> y <<escudo>>. Sin embargo, a cada uno
que rigen Ia probabilidad.
-.rciar un número y sobre ellos aplicar las leyes
l.-,nsideremos la definición clásica de función real, donde la cantidad y se llama función
del número
: si a tod.o valor z de la variable independiente, le corresponde un valor 3r de la variable dependiente'
j- esta idea la extendemos, se define una función donde la variable independiente no sea un número
:=¿l sino que, en nuestro caso, sea un espacio muestral'

Definición (de variable aleatoria) Se llama variable aleatoria a cualquier función definida en
':: espacio muestral f) con recorrido en un subconiunto finito o infinito de R.

- decir, Ia función

X:Q --) R
u F-f X(r)

--,nd,e a es un evettto) es Ltna variable aleatoria' Figura (3'1)'

81
82 Capítulo 3. Variables Aleatorias, Esperanza y Varianza

Figrira 3.1:

Ya hemos estado trabajando con variables aleatolias sin leferirnos cxplícitarncnte a ellas; por ejernplo,
al arrojar un dado son posibles seis casos. Designando por o¿ ei evento element¿l consistente en saiir
¿ puntos, tenemos:
CI : {cuf ,u)2,u)Srw4rrr'5rw6}.

Lavariable aleatoria X(rn): i identifica al núrmero z de puntos obtenidos al lanzar cl dado, se define
así:

X(rt) : 1, corresponde al evento elemental {aparece un punto},


X(rz) : 2, corresponde al evento elemental {aparecen dos puntos},
X(rs) : 3, corresponde al eveuto elemental {aparecen tres puntos},
X(rs) : 4, corresponde al evento elemental {aparecen cuatro puutos},
X(rs) : 5, corresponde al evento elemental {aparecen cinco puutos},
X(ra) : 6, corresponde al evento elemental {aparecen seis puntos}.

Al arro,jar una rnoneda tenerlos dos eventos: C: <<sale cara>> o -E: <<sale escudo>>; definimos la variable
aleatoria X, que cuenta el número de caras aparecidas en una serie de lanzamientos, de la siguiente
manera:

x(r) : 1, si <<sale cara>>;

x(r) : 0, si <<sale escudo>>.

La definición de la variable aleatoria depende del fenómeno a investigar.


Notación. Para evitar una escritura engorrosa, a los cu tales que X(cr-,) : ú se los notará como X : t.
La probabilidad Pr({o I X(r) : ¿}) se pondrá como Pr(X : ú). De manera análoga se escribirá
la Pr({c..'/ X(u) e (o,b]}) como Pr(n < X < b). Y así para cualquier intervalo convenierrtemente
defiuido.

Las variables aleatorias se clasificanten d'isc'retas y co'nti,rtuas, de acuerclo a los v¿lores qne ellas tomen.

3.1.1. Variables aleatorias discretas


Definición (de variable aleatoria discreta) La variable aleatoria en cLr\ro recorrido el conjrlrrto
de los pr-rntos que tieuen probabilidad estrictarnente positiva es finito o infinito nunrerable se llarna
valiable aleatoria discreta.

Si el recorrido de la variable aleatoria X es el conjunto de números {rr,rr,....x,....}, ." tiene que


Pr{X:z¿}>0.
3.7. Variables aleatorias 83

\rkrtniis, ti p,, : Pr'(X : x:¿). cs lir ytt'tillzrlrilirl¿rrl <lc tlrtc X tonrc <rl vtlol ru¡, sc ctuttplc <¡ue

'PI +'P)+ "' -1-


1),, l "' - 1.

rn ottas palablas, X os disc:r'cta si rrna unirlarl rkr ur¿ls¿r clc plobabilicl¿rd cst¿i <listribrricla sobre el e.ie
-=al, cc'rrLcerrtránclose rrri¿l rn¡rs¿r I)ositi\'¿1 err cacla prrut,o <le c:ielto c:on.jrrnto finito o infinito nrrrnerable y
.:- los restaltes purrtos uo l)¿ry lnas¿r.
-,-¿r'iables
aleatorias discretas sorr usualmente (pelo no rrecesariamente) conteos de ciertos elementos'
- -,r ejemplo, el nirmero de hi.jos de una familia, el rniulcro de ventas realizadas por Lrn almacén, etc.

- la vez qlre se ha determinado las probabilidades ¿isociadas a cada uno de los rralores de nna variable
-:atoria discreta, es ritil ponerlas en forma dc una distribu.ci,ón de probabilidad, que es una tabla con
:,,ios sus posibles valores y sus correspondientes probabilidades, como la siguiente:
f 1 2 n
Pr(X : r) Pt PZ P,,

Ejemplos

- Consideremos la prueba consistente en arrojar tres monedas. Tenemos qr.re

a : {{ccc}, {cc E}, {c E E}, {E E E}}.


Si X es la variable aleatoria que cuenta el nirmero de escudos resultantes, X puede tomar los
valores 0, 7, 2 y 3. De rnanera que

Po : :0) : PL({CCC}): 1
Pr(X
8'
t
J
Pt : Pr(X: 1) : PL({CCE}): g'
3
Pz : Pr(X : 2) : Pr({C EE}) :
8'
Ps : Pr(X : 3) : Pr(iE EEI) : 1
-:.
8

Se tiene que su ley de probabilidad es

T 0 1 2 3
Pr(X : r) 1/8 318 318 r18

y se cumple que
1331
Po*h-lPz+Pt : B + d + S + g : 1

Consideremos la sigrriettte plueba: se dispara corr nna pistola a un blanco situado a cierta dis-
tancia. Nos interesa analizal los eventos uJ¿: <<rlúmero de balas empleadas por un tirador hasta
(lne se da en el lrlarrco por prirnelavez>,.
Definimos la variable aleatoria X: <<núrnero de balas gastadas>>:

EI corrj nnto de posibles valores que puede tc¡mar Ia variable aleatoria es { 1, 2,3, . . .} .

Este es un conjunto infinito numerable, pues no se conoce un máximo para el número de balas
empleadas que pudiera ser extremadamente grande para una persona con muy mala puntería-;
es decir, X es una variable aleatoria discreta definida sobre un conjunto infinito numerable.

Más adelante se demostrará que también se cumple que i p¡: I col p¿: Pr{X : ¿}.
i:r
84 Capítulo 3. Variables Aleatorias, Esperanza y Varianza

Definición (de función de distribución) Sea X una variable aleatoria discreta, la función leal
-F tal que
VÚ e R, F(t): Pr(X < ú)

se denomina función de distribución de Ia variable aleatoria X.

Propiedades

1. La función F es creciente, con : 0V : 1.


,fT.".F(¿) ,ffL,P(t)
2. F(¿) : Pr(x S t) :
Prp¡
3. Pr(a< X<b):F(b) -f.(o).
4. Pr(o ( X <b): F'(b) - F(") *Pr(X: a)'

Observación. La probabilidad Pr(X: a) se calcula mediante Pr(X: a): F(a) - F(o_), donde
F("-) es el límite, por la izquierda, de la función de distribución en el punto a. Este concepto tiene
importancia para el cálculo de las probabilidades en los puntos donde ,F tiene saltos.

Ejemplos

1. Continuando con el ejemplo del lanzamiento de tres monedas, se tiene que


1
F(0) : Po: ,-,
F(1) : po+pr:j*::;,
F(2) : potpttpz:*.:*: :;,
F(3) : po:-pt-rpz+o.::*3*3** :t
Con esto, Ia función de distribución es

0, si ú<0;
Il8, si 0(ú<1;
F(t) : Il2, si L<t<2;
718, si 2(ú<3;
1, si ú23.
Los gráficos de las funciones de probabilidad y de distribución se dan en la Figura 3.2:

F(t)
0.4 I F
H
0.3 0.75
0.2 0. H
0.1
o€

Figura 3.2:
3.1. Valial-¡ies aleatorias 8Ír

Elr rrrL¿r lltrr<:l-,ir rkt c:¿tli<l¿r<l rk. ttrr ltLorltt, l,r sl tillrr'(lllr'{'n tLrt [o1<: tlt¡ l') Piczas lr¿n'!i ].,1[tttttt.
t¡ .1 rlcf<r<:tlros¡rs. L)rr cl rkrP;uliunollt() rlc <:r¡rrtlol tlt' r:irlir[¿rrI st: lr¡rrr¿t tur¡t nrttcsl t¿l tlc ]] lriczits
Clorrstlrril l¿r lct'rkr l¿r r'¿rriirlrlc alc¿rtoLi¿r <<L¡rirrrr:Lo rl<r lrir:z;ts lrlrcLr,lsr,.
Sol,tLr:irin,: La r'¿ilialrlr: a,lc¡rtolia crL crLcstirilr prr<rrlc torrrar'krs r'¿rlolr.s 0. 1.2 \¡,J: rIctr:nnirolnos
srrs prol)¿rl )ilir [¿<ics.

El llrill<:r'<.1 r[c srrbc:onjrrrrtos cl<l 3 c]crnerrtos rilrtcrrilrlcs rlc rrrr c;ou,jrtrtto <[c 12 clrlurcrrtos cs C:fr.
que es Card(O).

r Si X:0, cutolrccs tocl¿rs las Piczas sou dcfcctuosas, lr¿iv C[ lorrnirs clc <:scogctlirs.
. Si ,Y : 1, crrtorrc:es 1 es lrucrr¿r y 2 sorr clefcctrros¿rs. c\istcu Cl f.rlrn,rs cle csc:ogt:t l:rs Piclzirs
buen¿ls v Cl de cscoger las clefectnosas) crrton(ies lr¿v C¡C; forur¿ts clc: cornlrilr¿rr l¿rs lrttett¿rs
y las defectuosas.
. Si X : 2,ltay C! conjuntos de las piezas buen¿rs y C] dc dcfcctuosas) p¿rr'¿-r, rrn total cle
Cl|6C| formas cle combinarlas.
. Si X: 3, hay C! cornbinaciones de piezas bueuas.

Entclnces,

Pr(X: O) : g: *, Pr(r : 1) : 9A9? ::.


ciz 55'
Pr(X: \:W:#, Pr(X:t):#:#
Lo qrre se lesune etr slr clistlibucirirt cle probabilicl;rcl:
A; loll l2l3

Para clefinir urr¿r variablc ale¿rtoriir no cs nccesario cxhil.¡il urr fcrtcirrrcrto ¿rleat<lrio pat'ticttltrr',
es suficiente clar ulla función cle probabilictad o cle clistlibucicln r¡re cr-rrnpla las plopic<l¿rclcs
enunciad¿rs.

3. La funcióu cle distribución de una


"'ariable
aleatori¿r Y se clefine rnocli¿rute:

si l,<-3;
si -3<ú<0;
si 0(t<2;
si ú>2,
Coustruil Ia tal-¡la de clistribución de probabilidacl clc )'.
Sol'ució¡t: De acuerdo a la definición de la ftrncióu cle clistribuciórr ¡roclenlos \'ol cluc l¿r r-¿rri¿rblc
aleatoria torn¿r los valoles -3,0 y 2.

/(-3) : Pr:(Y: -3) : F(-3) - F(-¡-) : + -,, :;,


,i(0) : Pr(Y:0) :r(0) -F.(0-):;- j:j,
.f (2) : Pr.()', : 2) : F(2) - F(2-) : 1 j: j
De rn¿tt¡cr¿r <¡te lrr t¿rbl¿-L clc clistlil¡trci<in cle ¡rt'olrtrl riliclacl cs

r l-rlo l2
Pr()':trlIl2 lll4lIl4
86 Capítulo 3. Variables Aleatorias, Esperanza y Varianza

4. Un¿r variable ¿rleatoria X está dcfinida medi¿rnte lir siguierrte lcy de plobabilidacl

Jr l rlzl¡ | qI s

a) Determinar F(r).
b) Graficar f(r)y F(r).
c) Hallar: Pr(X:1), Pr(X < 1), Pr(X < 1), Pr(1 < X < 2), Pr(1 < X < 2), Pr(1 < X <2).

Soluci,ón:

a) Evidentemente, f'(r) :0pararlI,ahora


oSi11r12, F(r): pr : 0.3.
o Si2(r(3, F(r) : pt -f pz: 0.5.
¡ Si3{r14, F(r):pL+p2*ps:0.6.
¡ Si41r15, F(r) : h I p2* ps + p+ : 0.75.
o Sir)5, F(r) : h I p2 * ps + p+ I ps : I.
Es decir,
0, sir<1;
0.3, si 1( r 12;
F(r): 0.5, si2(r13;
0.6, si3<r14;
0.75, si4(r{5;
1, sir)5.
b) Los gráficos son:

Pr
F
0.
0. H
H
0.1 H
0.1 H

Figura 3.3:

c) Se tiene:

Pr(X: f) : F'(1) - F(1-) : 0.3 - 0: 0.3,


Pr(X < 1) : .P(1) : 6.3,
Pr(x < 1) : F(1) - Pr(X : 1) : 0.3 - 0.3 : 0,
Pr(l <X<2): F(2) - ¡'(1) : 0.5 - 0.3 :0.2,
Pr(1 < X<2) : F(2) -F(1) +Pr(X : 1) : - 0.3 + 0.3 :
0.¡ 0.5,
Pr(1 < X <2) : F(2) - F(1) - Pr(X : 2) :0.2 - 0.2 : 0.
3.7. Variables aleatonas 87

3,1.2. Variables aleatorias continuas

Definición (de variable aleatoria continua) La variable aleatoria ouyo recorrido es un intervalo
inito o infinito de R se llama variable aleatoria corrtinua.

También, se dice que Lrna variable aleatoria X es continua si para todo valor real r se tiene que

Pr(X: z) :0.
- sualmente, lasvariables continuas representan mediciones; por ejemplo, la estatura de una persona,
-l tiempo que se demora un programa en buscar un registro en una base de datos, la cantidad de
:¿ngre que tiene un animal.

Definición (de función de distribución) Sea X una variable aleatoria continua, Ia función real
F tal que
V¿ € R, F(t): Pr(X < ú)
=e denomina función de distribución de la variable aleatoria X.

Fropiedades

F es creciente, con .Iím F(ú) :


/+-oo
0y . lím
- l-*m F(t) : 1.

l. Pr(a< X <b):Pr(¿<X <b) :Pr(¿ < X < b) :Pt(a <X < b) :f'(b) - F(").

Definición (de función de densidad) La función de densidad de una variable aleatoria continua
-'t es una función real / que cumple:

)
") f (r) 0 Para cualquier valor z.

b) /A f@)dr:r.
c) Para cualquier intervalo A: lo,b], se tiene que

Pr(A) :Pr(¿<X<b) : f {') o'


.l.o

-,
-amos cómo estárr relacionadas las funciones de distribución y de densidad. (Ver Figura 3.4)

Teorema. Si F y son las funciones de distribución y de densidad de la variable aleatoria


/
:.spectivamente, ellas están ligadas mediante las igualdades

F(r):
l"*r@ot y f (*): F'(r).
88 Capít,tttra 3. Varían¡Jes Aleadorias, Espet'anza I \-ariattza

f {t}

Figura 3.4: Rel¿ición cntr-c las firncion<:s clc clclsidaci y c1e clistrilruc:iórr.

Tengamos presente qtte para el cálculo de plobabilid¿rdes se emplea la siguiente equivalencia:

¡b
Pr(a<X<q: I I(r)dr:F(b) -F(").

En las valiables aleatorias continuas es suficiente indicar la función de densidad o Ia función de dis-
tribución para que la variable aleatoria qr-rede completamente definida.

Ejemplos

1. Un¿r variable aleatoria X está defirricl¿r mediante Ia función de distribución

p¿lrir z < -1;


3 1
jt par¿r -1(r(;i
1t
uara .r: ) -.
' -3
/ 1\
Hall¿rr la probabilidaci cle clue la varial¡le aleatoria X torne un valor en el t'
interva ('' j/
Solr¿c'ión: La probabilidad de que X tome un valol en (a,b) es Pr(a < X <b): F(b) - F(").
Sia:0.b:1obt"r,"rnu,
ó

"'(0.".1)

2 L¿r fiurción de densidacl de una vali¿rble aleatoria está clada por /(z) : (\.e-s:L cn el intern,alc
(0,-) v f @): 0 fitera cle cste itttetvalo. Hallar' el v¿rlor de la constante cv para que /(z) as-
clefilricl¿r sc¿l unA función <le densid¡ld.

Sol.rt,ci,ón: Primero verifi<lrremr)s clue ./(r) > 0.


. En (-oo,0l no Lay ploblem¿l Pucs /(r) : 0.
3.7. Variables aleatorias

. En (0, oo) se debe tener f (") >- 0, es decir (\e-3* ) 0. Pero Vr € (0, rc), e t" > 0; entouces,
se dobe tener que a ) 0.

Ahora, verifiquemo. or,"


' /'* f (r)ctr:
.l-o."'
1, o
"". .lo/'- .,e-3*d.r: l.
La integral
/.ó f
o" -3"d, o
.lo "_J*d.r: lj"
: l'* .,
,lo* L3
-o.
3 [o-lJ
:T. a.

Consecuentemente, : tt entonces a : 3.
Í
Dada la función de densidad de la variable aleatoria continua X:
( o, sic(o;
f(*): { cosr, si0(r<rf2;
r dis-
I o, sir>rf2.
a) Hallar la función de distribución F'(r).
b) Determinar: pr (t = *. ;), e, (x ,;),"'(; <x <
#)
Solución:

a) Utilizando la fórmula F(z) : d,t:


.l:*JQ)
o Si r < 0, "f(r) :0, de manera que
rr
F(r): l_*Odt:0.
o Si 0 1r 1r12, f (x): cosrü, ento ces

F(r) : I¡o Oat+ |fE costdt:senr.


'(n). J-a Jo
o Si r > 7r/2, f (r) :0.,
n/2
F(r): 0dú: senr - 1.
l_*tü+ Io"/'costd,t* I_,, 0

La función de distribución es:

( o, sir(o;
F(r):l ';" ', si o < '<X,
I r, six>[.
b) Para calcular las probabilidades emplearemos Ia función de distribución.
r Pr(a < X <b) :F(b) - F("). Si ¿: I y U:[,
erval<¡ 6" 3
(r) así
: -"(á)
"'(á=".á) "(á)
: *" (á) : rfr1
2 -5
'"" (á) -
: 0.36603.
90 Capítulo 3. Variables Aleatorias, Esperanza y Varianza

o Pr(X ) n) : 1- Pr(X . o) : 1- F(a).


,4Si o: 1'

"("'i) : '-'(;)
1-sen/1):
\ 4/
r-Jt2
_ 0.29289.
r 17tr
e Pr(a < X < b) : F'(b) - F(o), con ¿¿: vb-_.
3" t2

t.(;/ r s*<;) 112¡\


:'(#) -.(;)
:1-sen(;) :t-+
: 0.13397.

4. La función de densidad de una variable aleatoria ? está dada por f (t) : t-f, y /(¿) : O
"n(1,2)
fuera de este intervalo. Hallar las probabilidades:

a) Pr(0<?<1.8); c) Pr(? t 1.¡);


b) Pr(1.2<T<1.5); d) Pr(1.4<7<3).

Solución: Para el cálculo de las probabilidades utilizaremos la función de densidad.

a) Pr(0<?<1.8):

Pr(O<7<1.8) : l" Iudt:,loftüot*.1, f(t)


"I.8 rl 11 8
dt

: lo' * .1," (, - ;) dt: t iQ' -


oo, o ql,',"

: j lltt al' - 1.8) - o) : o.zz.


b) Pr(1.2<?<1.5):

Pr(1.2<?<1.5) : l' r 1.5


f{ua'
: l,',' (' -;) " : LQ'-',1,;
: ] lltr sl' - 1 b) - ((1.2)' - t.z)) : 0.255.

c) Pr(T > 1.5):

Pr(? > 1.5) : 1-Pr(?<1b) -1- ([:_odt+ ,,)


[," (t-;)
,-;U'-t) r-
] frrr ul'- r.s) - (1'- 1)]
l,':
t-f,O.rrl:o62b
3.2. Distribuciones de funciotres de variables aleatorias 91

,t) Pr(r.4<7<3):
r.1 r ¿

PL(1.4 <I < 3) : I fUl,tL: .lIt.¿ J()rt ),Lt


.l t.¿

_ t)',n+o
[,'^('-;)"* 1,'o
1.. ..

ilt'-2)-({r+)2- 72.

5. Hallar la función de densidad /(r) de una variable aleatoria cuya función de distribución es

'17

4'

Soluctón: Utilicemos la relación f (") : F'(").


):0
. Si r : 0, entonces /(r) : F'(r) : 0.
< 0, F(r)
. Si 0 1r 1I, ,@): sen 2r, entonces f (r): F'(r):2cos2r.
+
. Si r ,\,4' 16¡:1, entonces /(r) : F'(r):0.
Es decir,

f (r): { zcoszr' si 0 < 'lTn,


|. 0, caso contrario.

6. La vida útil de un elemento electrónico está dada por la función de densidad

( !"-,,r, si ú > o;
f (t): \ 0, '2

|. en Io demás;

donde ú es el tiempo (en horas). Calcular la probabilidad de que un elemento dure más de tres
horas, dado que ya ha estado en uso m¿is de dos horas.
Solución: Nos interesa Pr(? > 3lf > 2), que según Ia fórmula de la probabilidad condicional se
tiene:
Pr(?>3lT>rl :#fi;
porque Ia intersección de los eventos (7 > 3) y (T > 2) es el evento (" > 3). Entonces,

l'* | -rtz
Pr(? > s) _ ./r rt :- "-t1," _ e-rlz:
Pr(I > 2) -
0.606.
[* !"-* r'
.lz 2

3.2. Distribuciones de funciones de variables aleatorias

Sea g una función real cuyo dominio contiene el recorrido de la variable aleatoria X, podemos definir
-l-na nueva variable aleatoria Y mediante
y: g(X),
92 Capítulo 3. Variables Aleatorias, Esperanza y Varianza

lo que quiere decir que, si la variable aleatoria X está definida según

X:O ---r ACR


u r-+ X(r)

y9por
gtB ------+ R conAe B
r r---' g(r)

la variable aleatoria Y se define por

Y : Q ------+ R
ul-----' Y(u): s6@)).

Si conocemos la ley de distribución F¡ de X, vamos a determinar la ley de distribución Fy de Y.

¡ Si X es variable aleatoria discreta,

Pr(I/: A):Pr(X : n¡),

donde A¡: g(r¿).

¡ Si X es una variable aleatoria continua. Supongamos que g es una función continua y estricta-
mente creciente en todo el eje real; entonces, existe la función inversa de g que la llamaremos l¿.
Ésta también es continua y estrictamente creciente, por lo que

A: g@) si, y solo si r: h(A).

Examinemos la definición de Fy:

Fv(t): Pr(Y < ú) : Pr(e(X) ! t).

Aplicando la función inversa a los dos miembros de la desigualdad del argumento de la última
expresión se obtiene
Pr(e(X) (ú) :Pr(X<h(¿)) : Fx(h(t)).
Luego, se tiene la siguiente equivalencia entre las funciones de distribución de X y de Y:
Fv(t): ¡k(h(¿)).

Si las funciones F¡ y h son derivables, se pueden derivar ambos miembros de la igualdad anterior,
empleando la regla de Ia cadena:

Fi@ : Fk(h(t)) .h'(t).


Ello nos conduce a la siguiente relación entre las funciones de densidad:

fv(t) : f x(h(t)) . h' (t).

Observación. Si la función g no es monótona en el intervalo de los posibles valores de X,


hay que dividir este intervalo en subintervalos tales que g sea monótona v aplicar el resultado
anterior.
3.2. Distribuciones de funciones dc valiables aleaúorias 9:]

Ejern¡rlos

1. Da<[a l¿l [rrrrc:iót¡ <lc <listlilrrr<:ión F¡ clc l¿r vari¿tll]cr ¿rlc¿rtoli¿t -\. hall¿rl l¿.rs ftttt<:i<.¡trcs rl<r rlisl tilrrrt iritr
<lc rkrusiclir<l d<l \" : u,X * b,
r' pala: a) rr, ) 0; lr) tr, < 0.
Soht.r:i.titt:

a) Sca \" : aX *b, o > 0. Tenenros:

Fv'(¿) : Pr(Ylú) :Pr(aX+b<¿)


: n'(" =+):r"(?)
Aclernás,
g(t) : at t b, h(L) : +, h'1t¡ : !,
También,
!t.(t):;r"(?)
b) Si y : aX *b, con a ( 0, resulta que g(ú) : at* b, que es continua, pero estrictamente
decreciente; sin embargo, podemos hallar Ia ftrnción de distribución de Y rnediante su
definición:

Fy(t) : Pr(Y<ú) :Pr(¿X+b<t)


: p,(x>¿-ü)-1-p,(x.4)
a) a)
\ \
a-
h.
: r - Fx"\ fL!)
a / +p, \ x: '-')
(
e' /
.

La función de densidad es

ft.o): Fí,(ü: -!,r* (")


Corrsidere la variable aleatoria Y : X2. Hallar su función de distribrrción.
Solu,ciór¿: Aquí, 9(r) : 12, función que no es stt'ictamente crecie¡te. Por clefinición tenemos:
Fv(t): Pr(Y ( ú) : Vr(Xz < t).
. Si ¿ < 0, el evento <<X2 ú>> es vacío; por tanto, Pr(X2 < ú) : 0, lo que implica que
Fl,(¿) :0.
r Siú20,

: -r/t).
Si F.v es coutiuua SC

<0;
>0.
Si lr.v <s rl<lrivable er rlcusiclad:

<0;
>0.
94 Capítulo 3. Variables Aleatorias, Esperanza y Varianza

3. Detelntinar la ley de distribución de la variablc aleatoria Y : X2, si X está definid¿r ruerliarrte:

x I -s I -21 o | 2

Sol'ución: Como Ia variable aleatoria es discreta, basta aplicar la relación Pr(Y : A¿) : Pr(X :
ri), a cada uno de Ios valores que toma Y : X2. Entonces, tenemos que

v2 l(-¡)rl(-z)rlo, lz,

Es decir,
Y lglq lol+

Como el valor Y : 4 se repite 2 veces, unificamos sus probabilidades y la tabla queda así:

4. Hallar la función de distribución de la variable aleatoria Y : e-X, si X está definida mediante

( 0, si ú<-1;
¡k(ú):{ +,sisiú>1.
-1<ü<1;
( t,
Solución: Se tienen las siguientes igualdades:

Fv(t) : Pr(Y < ú) : Pr ("-* < t)


: Pr(X > -lnú) - 1- Pr(X < -lnú)
: 1-f¡(-lnú).
Por otro lado,

0, si -lnt<-I;
F¡(- lnü) :{ -lnú*1 si - 1< -lnú <
2' 1;

1, si -lnt>L.

:t 0,
-lnú*1
1,
2'
siú>e;
si e-l 1t 1 e:
si ú < e-1.

Por tanto,
1, siú>e:
+ lnú
- 1- Fx? lnú) :
1
Fv(t)
2
sie-'1t1e:
0, siú<e-1.
3.3. Ejercicios 95

3.3. Ejercicios
1. Irrclique si las siguierrtes variables aleatolias son discretas o corrtiuuas y su rarrgo cle <lefinición:

a) El núrrnero de bytes defectuosos en el disco duro de una computadora de 100 Gb;


b) La distancia de lanzamiento de Ia jabalina por un atleta;
c) EI nirmero de goles que anota un equipo de fiitbol en Lln partido;
d) La cantidad de dinero, en dólares, ganada (o perdida) por un apostador;
e) trl tiempo de nso diario de una computadora;
f) El tiempo de espera del autobús en una parada;
g) El núrmero de años que sobrevive una persona a la muerte de su cónyuge;
h) La variación en el tiempo de sueño de una persona sometida a un tratamiento.
2 Indique al menos tres variables aleatorias discretas y tres variables aleatorias continuas. Especi-
fique su rango de definición.

,l Se arroja un dado y se designan por ¿ : {el número de los puntos aparecidos es par} y por
6 : {el número de los puntos aparecidos se divide por 3}. Para los dos eventos, halle Ia Iey de
distribución y grafíquelas.

4. Determine Ia función de distribución de la variable aleatoria X que está definida por la ley que
se presenta en la tabla.
-2 rt
rl4 213 rlL2
¡. Un escritor ha lanzado al mercado una nueva novela. La probabilidad de que Ia novela sea muy
exitosa es 0.6, de que sea medianamente exitosa es 0.3 y de que sea un fracaso es 0.1. Los bene-
ficios esperados son: si la novela es muy exitosa, 100 mil dólares; si la novela es moderadamente
existosa, 50 mil dólares; y, si es un fracaso, 10 mil dólares. Forme la ley de distribución de los
beneficios esperados por el escritor.

6 Una agencia automotriz recibe un embarque de 20 automóviles nuevos; entre éstos, 2 tienen defec-
tos. La agencia debe seleccionar, aleatoriamente, 3 automóviles de entre los 20 para venderlos.
Forme la ley de distribución de la variable aleatoria <<número de carros defectuosos entre los
escogidos>>.

7 IJn apuesto príncipe visita a un rey que tiene cuatro hijas casaderas, con la intención de integrarse
en la familia. Las probabilidades que tiene el príncipe de ser aceptado por cada una de las
princesas son 0.6, 0.8, 0.2 y 0.4. El príncipe pide la mano de cada una de ellas de forma
consecutiva y se casa con la primera que acepte. Sea X la variable aleatoria definida como
X:i si se casa con Ia i-ésima hija (i - 1,.. .,4) y X:0 si todas le rechazan. Calcule la ley
de probabilidad de X y su función de distribución.

8 Una chapa para puertas consta de tres piezas mecánicas. Suponga que las probabilidades de que
Ia primera, la segunda y la tercera piezas cumplan con las especificaciones son 0.95, 0.98 y 0.99,
respectivamente. Determine la distribución de probabilidad del número de piezas que cumplen
las especificaciones en una chapa.

9. Sea X una variable aleatoria discreta cuya función de probabilidad es p(r) : :1,2,3,4,5.
#,r
a) Encuentre el valor de & para que la función p(r) sea la función de probabilidad de X;
b) CalculePr(l < X34).
C)a¡>ítulo 3. Vari¿tltl¡:s Aleatorias, Esperattza y Varianza

l(. l,¡r lr¡:¡.'i,irr ,lr'¡rrol,irlrilirl:r<1 ./'cl<: rulr r'¡uiirl¡lc ¿rl<r¿tloti¿r -f <:s rrttl¿t s¿rh'o cn lr.rs lrtttrtos /.:0. f .i'
'1. lirr cl[r,¡ l()nr¿r lr)s vitl()los:

.l'(0) : 4,":. /(l) :'k:- 1011. .[(2) : 4r:- I.


l)iu ir nlr cictlcl \'¿tlot' (lc r'.

;r) l)t,t<:rrrrire c.l valot ,lc c:


lr) (':rk'rrlo: PL(X < l). Pr(-X < 2). t'r'((l < .{ < 3).

il. t':r,r r''u'ialllc ¿r,leatoli:r -Y se dicc <¡ur: sigrr<: lrr lcy cle B<rnfot'cl si se cttrnple qtte

Pr'(x : ft) : ¡.,*,0 (t . i) , k: r,2,...,s.


a) \'irrifir¡ue que es rtrra firnciórr rle ¡rt'oba,bilidad;
b) Calcrrle la probalrilicl¿rd ctc obtcner utitnero impares;
c) Grati<¡rrc la funciórr de ¡rrobabilidad.
t'2. Urra r'¿rinble ¿leatoria )'se dcfine l)¿lra un errtero positivo fijo c (a > 1) cualquiera mediante

I'r(Y : A) : ;\- i, k : a*r,a*2,...


rt) \'i.r'ifit¡rre que cs utut funcióu de probabilidad;
lr) l)crrrucstl'e cluc Pr()' > tr) : !* pat'tr A; : e, (L* 1, ...i
r:) Fije u¡r valor ¡>ara <'l ¡rtrr-árnctrrr (¿ !'gl'aficlue la fuución de probabilidacl.

1:l Iirr,r r''rti,tlll<,akt¿rtori¿r cli¡t't'cta X cst¿i clefinida segittt la ley


Pr(.f : A;):p(l -p)r', A; :0. 1,2,.. .y p€ (0, 1).
rr )
\i,r ilir¡rre clue es ull¿l función clc probalrilidir<t:
lr) l)r:rcrrrrine la ftrnción de distribttciótr;
r') (';rk'ttlc: Pr(X > 2), Pr(X > ). Pr(.f, < 3).
11. l)rr<l¿s l¿s funciones de derrsidad /, errcuerrtre el valor de la constante c de tal manera que ellas
t:st r':rr l¡ien definidas.

a) /(c) : ;," - t,' ::::.ffii,,


{
b) ./(r) - 1- cll- rl. si 0 ( r( 2;

,:) /(t ) =
{iZ;:, :i ;: l]
15. Dncla la fttttcióu de distlillrrt:ititr rk: r¡¡¡:¡ r'¿tt'ia,lrlc ale¿rtori¿ .{:
0. si z(0;
L 14. si 0lr(1;
F(.r:) =
t l:J. si | 3r <2;
:r fr.t. si 2(1t14;
(t: -').)/3. si 4l:r. ( 5;
l. si ;u)5.
C)al<:r tlc lits ¡rt'o! r;.l,rriid¿ul<ts:
3.3. Ejercicios 97

lr a) Pr(l . X. S)' c) Pr(O.X.¡)'


b) Pr(2<X<+); d) Pr(a<x<6).

16. Se tiene la función de distribución de una variable aleatoria definida por

0, si r<-J2;
Il8, si -J2<r10;
215, si 0(r1I;
Il2, si t <, < J2;
314, si t/2<r<512;
1, si r>512.
Determine la función de probabilidad asociada y grafíquela.

77. La función de densidad de una variable aleatoria X está definida mediante


( o, si r<I;
te
(r):
fr\/ I sr"r,3", si + .0" =+t
[0, .iit;'
a) Halle la función de distribución .F;
b) Determine: Pr(X :0.2), Pr(X < rl4),Pr(X > n13),Pr(nlL2 < X < n).
5 Una variable aleatoria X tiene distribución continua F, siendo
( o. si ú(o:
FQ): I ct, si 0< t<I;
t 1, si ú>1.
a) Determine la constante c y halle la función de densidad /;
b) Calcule las probabilidades Pr(X: Il3),Pr(X < ll3), Pr(lxl <ll4).
9 Considere una variable aleatoria continua Z con densidad de probabilidad
( (t+b)zb, si z € [0, o];
: ellas /('):{ o, siz(lo,al.
a) Calcule los valores de los parámetros a y b sabiendo que p, (Z 1) : 1,
\ -2)
= 8',
b) Encuentre la función de distribución de Z.

Una variable aleatoria X tiene por función de distribución a

10, sir<-2;
F(r):l ar+b, si -2Sr<2;
I t, sir>2.
a) Determine los valores de a y b; c) Halle: Pr(X
b) Encuentre la densidad /; Pr(lxl > 1.2).

El tiempo en minutos que una persona espera un autobús es una variable aleatoria cuya función
de densidad viene dada por las fórmulas: /(¿) : j ouru 0 < ú < t, f(t) : o.ru I < t < 4,,
(t):0 I
para los demás valores de ú. Calcule Ia probabilidad de que el tiempo de espera sea:
f
98 Capítulo 3. Variables Aleatorias, Esperanza y Varianza

a) rnayor qu<l nn minr.rto; c) rnayor que tres mirrutos.


b) rnenor que clos miuutos;

22 Los registros de ventas diarias de una empresa que comercializa computadoras muestran que
venderán 0, 1 o 2 computadoras de acuerdo a Ia siguiente tabla:
No. de ventas 0t1t2
Probabilidad

a) Determine la distribución de probabilidad de X, el número de ventas;


b) Calcule la probabilidad de que al menos se realice una venta en el día.
23. Un blanco circular de radio 1 se divide en 5 anillos,circulares por medio de 5 discos concéntricos
1234
-, -;,;, i t t. Un jugador lanza un dardo al blanco, si el dardo alcanza el anillo
de radios: -.

circular comprendido entre los círculos de radios : y tl]. '\'"-v'L)L\v'
(k:0.7.2.3.4), tiene k puntos y
o 5
gana 5 - ,k dólares. Determine las distribuciones de probabilidad:

a) del puntaje del jugador; b) de Ia ganancia del jugador.

24. Una empresa alquila el tiempo de cómputo de un tipo especial de computadora a una universidad.
La empresa debe planear su presupuesto, por lo que ha estudiado el tiempo de empleo de Ia
computadora. El tiempo semanal de alquiler (en horas) sigue la función de densidad dada por:

si o( t<4;
*U'n-U'
f(t):{ 0,
[ caso contrario.

a) Determine la función de distribución del tiempo de empleo de la computadora;


b) Calcule la probabilidad de que el tiempo de uso de la computadora, en una semana, sea
mayor que 2 horas;
c) EI presupuesto de la empresa solo cubre 3 horas de tiempo semanal de uso de la computa-
dora. ¿Con qué frecuencia se rebasará ese límite de presupuesto?;
d) ¿Cuánto tiempo de alquiler se debe presuponer por semana si esta cifra solo se puede rebasar
con una probabilidad de 0.1?

25. La cantidad de pan (en cientos de kilogramos) que vende una panaderÍa en un día es una variable
aleatoria con función de densidad
cÍ, si 0Sr13;'
c(6-r), si 3l r16;
0, caso contrario.

a) Encuentre el valor de c;
b) ¿Cuál es la probabilidad que el número de kilos de pan que se vende en un día sea: (i) más
de 300 kg?, (ii) entre 150 y 450 kg?;
c) Denote por A y B los eventos definidos en (i) e (ii), respectivamente. ¿Son independientes
Av B?

26. La cantidad (en gramos) de fertilizante químico que una planta puede recibir es una variable
aleatoria cuya función de densidad es

f srla z;
(r): { ff, - si r € [o' 8];
f
0,[ caso contrario.
Ejercicios 99

a) Halle la probabilidad de que Ia planta reciba merlos de 3 gramos;


b) Si la planta n)Ltere si recibe nl¿is dc 6 g, ¿,cuál es la ltlobabilida<l de qne la planta muela por
exceso de fertilizante?;
c) Si se trata de establecel para Ia cantid¿rd de fertilizante utilizada, ¿cuál es Ia
Lrna norrrla
c¿ntidad máxima recomendada utilizar para qne solo se sobrepase esta cantidad el 35 % de
las veces?

l;. Se extrae una bolita al azar de un bolillero que contiene 3 bolitas numeradas de 1 a 3. Llarnamos
X al número de la bolita extraída. Una vez conocido el valor de X, extraemos una nueva bolita
alazardeotrobolilleroquecontiene4-XbolitasnumeradasdeXa3(porejernplo: siX:2,
la segunda bolita se extrae de un bolillero que contiene dos bolitas con los números 2 y 3).
Llamamos Y al número de la bolita extraída en el segundo bolillero.

a) Calcule Pr(Y : 3lX : 1);


b) Calcule Pr(Y :3);
c) ¿Son X yY independientes? Justifique;
d) Halle la distribución de probabilidad de Y.

-1. Una variable aleatoria X tiene densidad

f(n\:Ir'siz€[o'1];
\"¿/-lo, sizl[0,t].
a) Si Y - X2, halle la función de distribución de Y;

b) catcule las probabilidades: < x2 <i) r . t . :)


"'(+ "' (á
-i. Una variable aleatoria Z tiene función de densidad
(L
si z e
f Q): i'
l 0, (
[-1' 1];

[ si z [-1,1].
Halle Ia ley de la variable T : -52.
i.'. IJna variable aleatoria X tiene función de densidad

rf") : (! sir€l-z,Z);
I o1 si n ( l-2,21.
Halle la probabilidad Pr(X2 < 1).

Una variable aleatoria Y está distribuida según Ia ley

5,
sig€l-t,Z];
0, caso contrario.

Halle Ia función de densidad de la variable U : Y2.


-') Una variable aleatoria X tiene densidad f x(") : s-t, si r ) 0. Encuentre las funciones de
distribución y de densidad de la variable aleatoria Z : e-x.

Una variable aleatoria X tiene función de distribución Fy(r) - 1 - e-o', si r ) 0. Halle las
funciones de densidad de:
100 Capítulo 3. Variables Aleatorias, Esperanza y Varianza

{Y:f7; b) Z :1tnt.

En las secciones precedentes vimos que una variable aleatoria queda definida por su función de dis-
tribución, pero muchas veces solo se desea tener una idea del comportamiento general de las variables
aleatorias, sin dar detalles de su distribución de probabilidad; para tal propósito, examinaremos dos
características teóricas de las variabtes aleatorias: la esperanza y la varianza, que son dos parámetros
que miden la Iocalización y la dispersión de Ios valores que toma la variable.

3.4. La esperartza maternática

La esperanza matemática -o simplemente esperúnz&- de una variable aleatoria X, se simboliza por


E(X) y su definición es la siguiente:
Definición (de esperanza de una variable aleatoria discreta) Sea X una variable aleatoria
discreta, la esperanza es un número real que se calcula según:

1. Si X toma un número finito de valores rr¡ 12, ..., rn con probabilidades h:Pr(X : rt),
pz : Pr(X : r2), . . ., pn: Pr(X - ,n)t

E(x) : f,o*rr.
l^-1

2. SiX toma un número infinito de valores rr, 12, .. . con probabilidades p¡ : Pr(X : rk),
k:I,2,-..; oo
E(X) : ln*"r.
/c: f

Definición (de esperanza de una variable aleatoria continua) X


una variable aleatoria
Sea
continua, cuya función de densidad es /(r), la esperanza es un número real que se calcula según:

E@:
l: rf (r) dr.

A la esperanza también se la denomina media poblacional o ualor esperado de la variable aleatoria y


se la suele notar como p.

Observación. Si /(r) toma valores distintos de cero en un intervalo [a., b], Ia esperanza se calcula
como
Fj(x): rf (r)d,r.
L
La esperanza posee varias propiedades, independientes del tipo de la variable aleatoria. A continuación
vamos a enunciarlas y demostrar algunas de ellas, en el caso de una variable aleatoria continua, los
otros dos casos quedan como ejercicio para el lector.

Propiedades

1. La esperanza de una eonstante es el valor de la constante:


E(c) :6, cconstante.
3.4, La esperanza rnatertática 101

D en¿ostt'o,ciór¿:

E(c) : I t'.[ (r) rlr : ,t Ir@ .l'(t') tl,.r :


[@
(:' L : c.
.l _- ./ _m

dis-
2. Aditividad. La esperanza de la suma de dos variables aleatorias es igual a la suma de la^s
bles
esperarrzas de los dos surnandos:
dos
tIoS E(x+Y) :E(X) +E(Y).
3. Un factor constante c se puede sacar del símbolo de la esperanza matemática:

E(cX) : cE(X).

Demostración:
l'c. f@
E(cX) : (r) O, : (r) dx : cE(X).
.l_*crf " .l_*rf
4. Sea g una función real, la esperanza de la variable aleatoria Y : S(X) está definida por

E(Y) : E(g(x)) : [* s@)f (r)d,r.


J_a
En particutar si g(r) : 12 se tiene

E (x,) : l:,2¡q,¡d,.
5. Si X y Y son dos variables aleatorias independientes
E(xv) : E(x)E(r).
Observaciones:

1. Por las propiedades 2. y 3., si Y: aX t b, entonces

E(Y):aE(x) +b.
1 2. Si la función de densidad es simétrica respecto a Ia recta
3.5)
r: rr¿, entonces E(X) : rn. (Figura
rria y

ücula

aclon
a, los

Figura 3.5: Función de densidad simétrica respecto a la recta n : TrL.

Dos variables aleatorias con la misma esperanza pueden tener distribuciones diferentes. Para diferen-
-iarlas es lecesario introducir otra característica teórica que informe sobre la dispersión de su posibles
r-alores.
LO2 Capítulo 3. Variables Aleatorias, Esperanza y Varianza

3.5. La varianza

L¿r iclea de <lspelanza no ittclica cótuo cst¿i clistlibuicl¿ Ia m¿ts¿r en torrro ¿ su <l<ntro; ósto sc explrcs¿)
rrrecli¿rnte la Ia valiable ale¿rtoria X, que se nota Var(X) o o2.
uari,an,zo, de

Definición (de varianza) La varianz¿t de nn¿t variable aleatoria X es rrn núrmero no negrrtivo que
se calcula por:
Var(X) : E(X -E(X))',
o, equivalentemente, por
Var(x) :E(x2) - (E(x))''

Segúrn el tipo de variable aleatoria, se calcula de la siguiente manera:

1. Para una variable aleatoria discreta que toma un número finito de valores rtt r2t .) trn con
probabilidades p1 : Pr(X : rt), pz:Pr(X : rz), ..., pn: Pr(X : r,-)i

var(x) :ilrr-E(x))2pn o var(x) :ir*r\- (E(x))2.


k:t k:L

2. Para una variable aleatoria discreta que toma un número infinito de valores rr, 12, .. . con
probabilidades p¡ : Pr(X : rk), k : L,2,. ..:

Var(X) : !["r - E(X))2pt o - (E(x))'.


lc=1

3. Para una variable aleatoria continua con función

var(x) : - E(x))'f (r) d.r o r) dr - (E(x))'z


|lO
Observación. Al igual que en la esperanza, si /(z) está definida en [a, b]:

var(x) : l'o@- E(x)12/ @)d,r.


.la

La varianza da la idea de cuán ampliamente dispersos se encuentran, en torno de la media, los valores
que toma Ia variable aleatoria:

1. Una mayor varianza indica que Ios valores tienden a estar más alejados de la media.

2. Una menor varianza indica que los valores tienden a estar más concentrados alrededor de la
media.

Defrnición (de desviación estándar) La desviación estándar de una variable aleatoria X es


igual a Ia raíz cuadrada de la varianza:

o:\@.
3.5. La varianza 103

Propiedades

]. L¿r variarLz¿r de un¿r, corrst¿rrrte es cero. Es decir, para tocla constante c:

Var(c) : g, c constante.

Den¿ostración:

var(c) : V - E(c)]2 f (r) dr : V - c]2 ¡@) ar


[* [*
: l'* o¡qr¡d"r:0.
_*
.l

2. Un factor constante c se puede sacar del símbolo de la varianza, elevándolo al cuadrado:


Var(cX) : c2Var(X).
Dernostración:

var(cx) : l* O" - E(cx))2 f (r) d,r :


17r", -
cnr.)12 f (r) d"r
/'oo
: I "'1" - e(x)l/(r) dr : c2yar(X).
J-* '

3. Aditividad. La varianza de la suma de dos variables aleatorias independientes es igual a la


suma de las varianzas de los dos sumandos. Es decir, si X y Y son independientes

Var(X +Y) : Var(X) + Var(Y).


D emostración: En efecto,

Var(X + Y) : E[(X + Y) - E(X +Y\2


: E[(x - E(x))+ (r - E(y))]2
: Var(X) + Var(Y) + 2Bl(x - E(x))(y - E(y))l
Como las variables X y Y son independientes, también lo son las cantidades X - E(X) y
Y - E(Y), por lo tanto,
E[(x - E(x))(y - E(y))] : EIX - E(x)l .Ely - E(r)l : s.

En consecuencia, Var(X + y) : Var(X) + Var(Y).

,lbservación. De las propiedades 1- y 2. se verifica que

Var(oX + b) : a2 Yar(X).

Fj,emplos

de la
-. La variable aleatoria discreta X está definida según Ia ley

x I -41 6 10
p10.2 10.3 0.5

Hallar la esperanza y la varianza de: a) la variable aleatoria X; b) Ia variable aleatoria Y :


0.5x +2.
Solución:
LO4 Capítulo 3. Variables Aleatorias, Esperanza y Varianza

3
a) E(X) : D : -4 x0.2 +6 x 0,3 * 10 x 0.5 : 6.
A:1 "xp*,
Calculemos E(X2):

n62): I ,?,p*,: (-q2e.2) + (6)2(0.3) + (10)2(0.b) :64.


k:1

Entonces,
Var(X) : P(X2) - (E(x))2 :64 - (6)2 :2a.
b) Vamos a aplicar las propiedades de la esperanza y la varianza para calcularlas:

E(v) : E(0.5X +2) :0.5E(X) + E(2)


: 0.5x6*2:5.
Var(Y) : Var(O.5X + 2) : (0.5)2 Var(X)
: 0.25 x 28 -- 7.
2. En una rifa se venden 300 boletos, a un dólar cada uno. El primer premio es 100 dólares, el
segundo premio es 50 dólares y hay otros cinco premios de 10 dólares. ¿Cuál es la ganancia
esperada de una persona que compra un boleto?
Soluci,ón: Sea X la cantidad ganada por un boleto premiado; entonces, X sigue la siguiente ley

xl 1oo I so I ro I o
p | 1/Boo | 1/3oo I sTaoo I zoaTaoo
Así,

293
E(X) rooxfr*5ox #.rox.*I+ox 300
0.67.

Como la persona paga 1 dólar por el boleto, Ia ganancia (total) esperada es E(G) : 0.67 - 1-
-0.33 dólares; es decir, una pérdida.
3. Una persona quiere abrir una puerta y tiene 5 llaves, de las cuales solo una corresponde a la
cerradura. La persona va eligiendo al azar y probando abrir Ia puerta. Calcular la esperanza y
la varianza del número de intentos si separa las llaves que probó anteriormente.
Solu,ción: Como cadavez separa las llaves utilizadas, cada llave tiene la misma probabilidad de
abrir la cerradura; por lo que la variable aleatoriaX: <<número de llaves utilizadas>), sigue la
siguiente ley:
xl1 I 213 I 4l b

Entonces,

515
E(x): D*ou:;I/c:3,
l--1 t- r

515
E(x') : Dk'rr:;tk2:rr,
l': I [:1
Var(X) : lI - 32 :2.
3.5. La varianza 105

4. Una variable aleatori¿r X toma solarnente dos valores rt- y r2t tales que 12 > r1. La probabilidad
de que X tome el valor zl es 0.6. Hallar la ley c¡re sigr.re X, si la esperanza rnatemática y la
varianza son conocidas: E(X) :1.4 y Var(X) :0.24.
Sol'uci,ón: Esclibamos Ia ley de X:

Explesemos la esperanza y Ia varianza en función de 11 y 12:

E(X) : 0.6rr + 0.412 : 1.4.

La ley de X2 es

Entonces,
E(X') :0.6r? + g.arl
v
Var(X) : n(X2) - [E(X)]2 : 0.6r? + g.arl - r.42 : 0.24

De aquÍ, se obtiene el sistema de ecuaciones

I o.aq t olq:1.4
\ o.o"l -t o.4r| :2.2

Resolviendo eI sistema se obtienen dos pares de soluciones:

It : l, 12:2 y z1 : 1.8, rZ:0.8.


Puesto qLLe 12 ) 21, hallamos Ia ley de clistribución de X:

.6 t.4
(,1. z

a) Hallar Ia esperanza y Ia varianza de lealtoria


ble ale X que tiene función de distribución:

si Ít<, -1;
F(r) : si -1l<r 3;
si r,) ' .).

b) Se deflne la variable aleatoria Y : rrsJU CSIper anza y su varlalza.


Hal lar
Soluczón:

a) Hallamos 1a función de densidad

(r): si -1(r(3;
f
caso contrario.

De manera que

E(x) : (,)l_,
rf
1)
o":
e (x') :
[_,
r2r@ (i) r"
106 Capítttlo 3. Variables Aleatorias, Esperanza y Varianza

Pot lo t¿urto,
v.u(-K) : p (x') - (E(x))2 :: - r' :: .)
J

b) Tenerrros la vari¿rblc ¿le¿rtor-i¿r Y :5X *2, cuyzr. función de densiclad no la corrocerno$. pero
podenos enrplezrr' las propiedacLes cle Ia esperanza y de Ia varianza:
E(Y) : :5E(X)+E(2) :5 x It2:7,
E(5X +2)
Var(Y) : Var(5X + 2) :25 Var(X) :25 x * : +
.) .)

b. Una valiable aleatoria X está definicla por slr densidad J'@):r+l2 el intervalo (0, 1), fuela
"n
de este intervalo f (r):0. H¿llar la esperanza matemática de la variable aleatolia Y : X3.
Soluctón:

E(v) : rs f @) o, : ,t (, **) o,
.lo'
,)ar:1" *1 4l '

)"- ls 2 a)o
u--.40I3
7. Determinar la esperanza y lti ', ' a valiable aleatoria 7 cr.rya fnnción de distlibrrción
csF(ú) -1-e2t,t>0.
Soluczón: La función de deusidad es:,/(/) : F'(t):2"-2t, ú > 0; y 0, caso contr¿rrio.
Calculemos Ia esperarrzn:
fx
tr(x) : /.oo
2re-2''d,r.
.l_,"r.tb)nt: .lo
Irrtcgrando por partes, ponicriclo rL: :1. rl,u : e-2'cl,r; pol lo tanto: ilu,: dn, Lu : _
'r"-r',
: -rc2 l-*1 l'n
2'
l'*
.lo r".,,rh
ln'2.1u "-r."rl,
,"-" l* 1 __r,.1-
z io-4c l.

;'^'^
Entonces,
E(X): , lo*
,"-'2'rL*:r(i) - I
Necesitamos el cálculo cle E(X2):

E(x') : [:,2 ¡q,¡a, :, .lo* ,2. 2"


tlr

Integrando por partes, clos veces. se llega a

2 ln ,,', "r!, = ?:!


4 2
Io
La varialza buscada es

var(X) : E (X,)
1 tt/1\2 1
- (tr(.Y))2
o \ol
\o /
¡
"
S.S. La varianza
Etr ttlt slll)crlriercacro se r¡o,,.1,. ,,-.-
ro7
-.
crescrir,e ; ;;;;'.,". .:ff:fii:::;1ij,."":J1,*,:,i:"..T;"^,jj,f,:i,,ililTjc arcaroria quc

.f(r):[;*'sjo<'<5o;
I o, caso contrario.
a) ;.Crrál es Ia c¿nt jdact
de calnc quc se esr)
Ü¡l)el'a vender diariamente
llién, halle ia desviació" en el supermercaclo?
Tam_
"r*0""..oq
b) Si la ganancia en el producto
se expresa
-r"4vvu por
ganancia esperada. vvL la ecuación
r'L ccuaclÓn C:
).

fi¡X2 + 10. Calcrile Ia


Soltt,ción:

a) Calcularemos l¿
de la variable aleatoria
efectúra ,ro"r.lr,lifjlllza como er indicador
de las ventas que
",

E(x): ['o
to " Gil o*: # fo,o
,, o,

,hl#]; :3333
Así' el supernrercatro
espe.aría
-- vender
Calcrrlernos E (X2): 'v'uL 33.33 kg diarios cre car'e.

La r.ar.iarrza es

Val(X) : - (E(x))2:1250 _ (33.33)2


: ?(x'z)
138.89.
La desviación estándar
€s d:
b) Entonces, vC(D : i,/138.80 : 11.79 kg.

-\v'/ :
E(c) n(2.-, \
"rl*o" *'o):
.r

IEE (x2) +to


:
1E(1250) + I0 :24.29.
Por' la 'r'enta cre la cirrle, cr supermer-caclo
csr)era ganar 24.2g
crórares diarios.
-- uontinu¿ción, se cla
ulr ejernltlo de valiable
- r ál<.rrlo dc ia alcato
cs
valiatrza dc cs ro iltfinito cle valores.
e¡nl>
::tc¡1¡.¡l¿1¡¡ c1
dc análisis ma
-= s,rrn,inie*;';;;; artificios qrre
leatorias geont
ruatollas ]::? ¡l"empleado
rétodo
::ométricas,
métricas: geom ruLoclo em¡rle,rdo por
¡rttrlttetládes lrásicas .lu
las sci ics
satrr ar r icgo. F i I 992 ¡, -Et.f.l[]11".¡[.o,,.
of Georrre ric: Xloue¡ts, ,,
Tl¿e Atuerial¡t
Stattstician, 46, 10g-10g
r08 Capítulo 3. Variables Aleatorias, Esperanza y Varianza

P,_1
Propiedad 1. Va € (0,1), , It,
41,-
l.;:0 | - (L

Plopieclad 2. Ya € (0,1), i lr - a,)ak : a'''.


k:r¿

9. Una variable aleatoria X toma valores I,2,3,. . .) con probabilidades

I (1 -P)A
po,:-ñ7, h:I,'2,..,;
L- 1.' P€ (0,1).

Determinar sll esperanza y su vattatza'


Soluc'ión:

: io-,k:i(-#) (r -P)k ¡
E(x)
A=1 A:1 '
: l-r) i,'- :- (*)
\ I'p)3' ir, -or*
\nP/7_o
p)k

Si p € (0, 1), entonces I - p e(0, f) y aplicando la propiedad 1:

E(x) : (#) r-i-r:-(#) (")


p¿rr-a el c¿ilculo d.e la varianza varrios a calculal E (X'), usando Ia notación Q: l- p; pol tanto

: ( *t) É*n-:(-#) ',i'ronr


Veamos a qué es igual la surnatoria:
oo oo oo oo

Dt rnr :\nar +lnuk + lrek + '

k:7 k:r k:2 lc:3

Por la propiedad 2, se tiene que

: L-p
Dttono
: ct + q2 + q3 +... - Dnr
k:1 k:r

Consecuenternente, E (X') queda como

E(x,) :-(#) (;)+: I-p


p2 in;r

: /. r,\\ ¿

'P)
3.6. Función generadora de rnornentos 109

3.6" F\rnción generadora de momentos

Los momentos de una variable aleatoria son númelos que representan algunas calacterísticas de la
jistribución de probabilidad asociada. Bajo ciertas condiciones el conjunto de momentos determinan
ie manera única a la ley de probabilidad.

Definición (Mornentos) Sea X una variable aleatoria y sea r¿ un número natural. Cuando existe,
el nútrnero pr:E (Xk) es el k-ésimo momento de X.

f ntonces, tenemos que Ia media p es el primer momento de la variable aleatoria; es decir, F: lJt.

-isociada a cada variable aleatoria podemos encontrar una función que permite calcular sus rnomentos.
fsta función tiene Ia propiedad de que, al igual que la función de distribución, caracteriza de manera
:rica a la ley de probabilidad de la que proviene

Definición (Función generadora de momentos) La función generadora de momentos (f.g.m)


ie la variable aleator"ia X es la función

M(t):E("t"),
iefinida para valores reales de ú tales que la esperanza existe.

- . función generadora de momentos se utiliza tanto para variables aleatorias discretas como continuas.
alrt o

Ejemplos

- Encontrar l¿ función generadora de momentos de la variable aleatoria cuya función probabilidad


CS

x I -4 I 6 I 10
p 102 | 0.3 | 0.5
Solución: Resulta que

I[(t) : E("t"):|pr"tr
k
: 0.2 e-at * 0,3 e6¿ f 0.5 e1o¿

Hallar la función generadora de momentos de una variable aleatoria cuya función de densidad es

rI si
r, ' I
f\L;): \ -.
4 -1<r(3;
[ 0. caso cont rario.

Solttciór¿: Tenernos que

M(t) : E ("'') : lt f @) o' :


l:, "t'!d,, : t:
^!)¿
-(
4t
^- L

,et' 4

r- siguiente resu.ltado nos indica córno se pueden obtener los momentos de cualquier orden con el
:-:rpleo de la f.g.m.
110 Capítulo 3. Variables Aleatorias, Esperanza y Varianza

Teorema. Sea X con furrción generaclora de rnomentos,4f (rl), con derivadas continuas dc cualquier
orden; entonces,
.,_
I-Ik-L qlxu):
j-nt,,,l
tr,,,=o
\-'/- dj",

Es decir, el k-ésimo momento de una variable aleatoria se calcula como la derivacla de orden k de la
f.g.-., evaluada en cero.
Observación. Se tiene que E(X) : Ft y Var(X) : Fz - F?.

Ejemplos

1. Hallar la varianza de la variable aleatoria cuya función probabilidad es

x I -4 I 6 I r0
p10.2 10.3 10.5

Soluc'ión: Antes calculamos que il{(ú) : 0.2 e-4t * 0.3 e6¿ * 0.5 e10ú; por tanto,

.1
: _0.8e-at * 1.8e6¿ * belo¿
aual
t,)
o.-
AI ft) : 3.2e-at * 10.8e6¿ f 50e10Ú.
dt2

Entonces,

ltt :
ftnup¡: -0.8e-a(o) + 1.8"u(o) -¡ 5"10(0) : 6,

ltz : #* ro, : 3,2e-_4(o) + 10.8e6(0) f b0e10(0) : G4.

Por tanto, Var(X) : p2 - u?:64 - (6)2 :29.


2. Hallar la varianza de la variable aleatoria cuya función de densidad es

(l
I@):l q,'si -1<r(3;
[ 0,
conrrario. caso

Solución,: Ya calculamos que


eJL _ e-L
M(t):

Por tanto,

!u,rt (3t-1)e3¿*(1-t)e-r
dt ¡t2
+t,
(st' - 6t + 2) e3t - - l:
.-)
',:r
#,u,
3,7. Ejercicios 111

¿2
Puesto que 1,1(ú) no está definida para l, : 0. para hallar M (0) aplicaremos la
*r*r|, ,ljz
regla de L'Hospital; entonces,

¿2

trt : 4*g: Iím ñ ((st-1)e3¿+(t+t)e-¿) -1,


CN f+0
*Lurn*l
¿3

ttz : #*ror: ls w(Q* - 6t + ?r"" - (t2 + zt + 2) et) :- 56


24
@tó) ors

Por lo tanto,
Var(X) : pz- Lr?: 56.4
243

3.7. Ejercicios
l. Halle la esperanza y la varianza de las variables aleatorias discretas definidas por

xl-0.7t10.24 10.61 Yt 2 t 4 t 5 I 6
pl 0.2 10.5 10.3 p 10.3 10.1 10.2 10.4
Se escoge aleatoriamente un número de conjunto $ : {-1;0; 1}. Sea X el número escogido.
Encuentre su valor esperado, La varianza y la desviación estándar de X.

¿Existe una variable aleatoria X que cumple qLre E(X - 2) :8 y que E ((X + 1)2) : 120?

Si X es una variable aleatoria con E(X) : 50 y Var(X) : 15. Encuentre:

a) E (x2); c) Var(-X); e) E(3x + 10);


b) E(-x); d) o(-2x); f) Var(3x + 10).
Sean X, Y y Z tres variables aleatorias independientes, cada nna con media p, y varianza o2.

a) Encuentre la esperanzay la varianza de,S: X -lY 1- Z;


b) Encuentre Ia espera\za y la varianza de ? : 3X;
c) Calcule la esperanza y Ia varianza d.e A: \IjA,
3
d) Encuentre la esperanza de 52 y de A2.
SeaX una variable aleatoria definida en el intervalo l-1;11 y sea f x(") su función de densidad.
Encuentre P(X) V Var(X) si:

a) Jx\r): r;
I b) fy(r):lrl. c)fx@):t-lzl. d) f x@) :t '.
Encuentre la esperanza y desviación estándal de las variables aleatorias definidas mediante las
leyes:

f 0. si r ( l;
.) r(,) :{ +, si 1(.c14;
t,I sir>4.
t12 Capítulo 3, Variables Aleatorías, Esperattza y Varianza

(o sir!1;
l:lr): {L2-r'
,
t2 - si11.r.<2;
b)

I t. sir)2.
c) r,-..:l I Zr. si z e (0. l):
/(rt o. sir((0, 1).
d) ' ))' * Br - l2). si r € (-5. -3):
..\ <Í - *frt
f¡,(t:):
--
I O, caso contrario.

(t. si re [1,2]:
e) f(r):1 '
I o, si zl11.2l.
(Determine primero el valor de c.)

8 Una variable aleatoria X toma los valores 4, 6 y o con probabilidades Pr(X - 4) : 0.5, Pr(X :
6) : 0.3 y Pr(X : a) : p. Si se sabe que 1a esperanza de X es igual a 6, halle los valores de p
ya.
q Halle la varianza de una variable aleatoria Z q:ue solo puede tomar dos valores, el uno el doble
del otro, con la misma probabilidad, si se sabe que E(Z) :0.9.

10 I-a variable aleatoria discreta X tiene solamente dos posibles valores: rr y fr2, además 11 1 12.
La probabilidad de que X tome el valor 11 es igual a 0.2. Halle Ia ley de distribución de X.
conociendo la esperanza E(X) :2.6 y la desviación estándar o : 0.8.

11. Una variable aleatoria X puede tomar tres valorest r,1 : -I, 12:0 y 13:1. Si se conocen las
esperanzas matemáticas E(X) :0.1y E(X') :0.8, enci-r.entre las probabilidades Pt,Pz yp¡, de
los I'alores rt, 12 y 13) respectivamente.

12. La variable aleatolia X tiene ítnicamente tres posibles'u.alores rr:1,:x2 y x3 (rt < rz <'J4).
Las probabilidades de que X torne los valores rr y 12 son respectivamente iguales a 0.3 ¡,'
A.2. Determine la ley de distribución de X, conociendo Ia esperanza E(X) :2.2 y la varianza
Var(X) :0.76.
i3. La variable aleatoria X tiene función d e distribución

0, parar12l
F(r) : arlb, para21r14;
1, parar>4.
a) I{alle e1 valor de las constantes cr y b;

b) Determine su función de densidad;


c) Halle 1as probabilidades: Pr(1 < X < 3) y Pr(X ,2.5);
d) Encuentre su esperanza y sr-l varlanza.

74. Suponga que se escoge un núrmero real X en el intervato [2; 10] con urra función de densidad de
Ia forma f (r) : Cz, donde C es una constante.

a) Halle el valor de C;
b) Calcule Pr(D), donde ¡1 : 13;71;
c) Encuentre Pr(X > 5), Pr(X < 7) y Pr(X2 - 72X * 35 > 0):
d) Encuentre la espera\za y la varianza de X.
3.7. 4jercicios 113

15. Uu cstudiante rinde ttnil plr-reba consisterrte en 2 probleuras de elección múrltiple. La primcra ticrrc
3 posiblcs resprtest:rs y la scgurrda 5. El estrrcliante cscoge las 2 r'espuestas al ¿rz¿rr. Encuentl-e:

a) La ley qr,re ciescribe cl núrmero de respuestas cortcctas X del estucliantc;


b) El nírmero esperado, E(X), de respr-restas correctas;
c) La valianza. Vur (.Y).

6 tlna organizac:íón benéfica realiza una rifa para conseguir fondos. cn la que sc vendieron 10000
boletos, a 4 dólales cada uno. E1 prerrio es un antomóvil de 12 000 dólares. Si un ciudadarro
compra 2 boletos, ¿cuál es la ganancia esperada del comprador de los boletos?

IJna persona participa en un concurso de la televisión. Le hacen una pregunta con 5 respuestas
(solo una es verdadera) si acierta, gana 10 000. Si falla le vuelven hacer otra pregunta con tres
posibles respuestas de las cuales solo una es verdadera. Si acierta, gana 1000 y si falla se le
vuelve hacer otra pregunta con solo dos respuestas si acierta, entonces no gana nada y si falla
pierde 500. El juego termina cuando la persona acierta c después de fallar la tercera pregunta.

a) Indique cuái es el espacio muestral;


b) Calcule la probabilidad de que dé una respuesta correcta;
c) Halle la ganancia esperada;
d) Halle la esperanza y la varianza de Ia variable aleatoria que describe el número de preguntas
realizadas al concursante.

Se asegura un vehículo de 50 000 dólares por su valor total, pagando una plima de C. Si la
probabilidad de robo en un año es de 0.02, ¿cuál es el valor de la prima que debe cobrar la
compañía de seguros, si espera ganar 200 dólares?

9 Si Roberto termina sus estudios en Junio, podrá disfrutar de una beca para poder realizar un
curso de especialización con todos los gastos pagados. Si aprueba en Septiembre, la beca sólo le
cubrirá el 40% de los gastos. Si no consigue aprobar, también realizará el curso pero abonando
50000 dólares, que es 1o que cuesta. Roberto sabe que la probabilidad de aprobar en Junio es
sólo de un 10%, mientras que la de aprobar en Septiembre es de:un 4ATa.

a) Halle la distribución de probabilidad del costo del curso de especialización;


b) Determine el valor esperado de dicha variable.

:0, Una agencia que renta autos tiene disponibles 4 carros todo terreno, para alquilarlos. El precio
de alquiler de cada carro es 60 dólares diarios. En un estudio de mercado el propietario ha
determinado el siguiente modelo probabilÍstico sobre la demanda de estos autos:

Demanda Probabilidad
0 0.05
1 0.10
2 0.20
c
r) 0.25
4 0.20
5 0.15
() 0.05

Además, en el mismo estudio ha encontrado que sus gastos diarios son: 20 dólares por alquiler
del local y 15 por pago a ul empleado.
lL4 Capítulo 3. Variables Alcatarias, Esperanza y Vatiai;za

a) C¡rlcttltt r:l tLítrrtelo csp<:r'aclo dc carlc-'s tocl,r tellerro <¡re la agencia alqr-',il.rrri urr rlÍa (;Lralquiera;
l,) CalcrLl<-r ltr girrrnirciir cli¿rli¿ csperad a:
,') Caicule Ia <l¡:sviación cst¡inclal cle lii gzrrranr;iir

'21 Urr poltafolio r-lc invcrsi<irr sig-ue r:l .,iguicltc: (iselr€r1ir lrlolrabilístic:o:

Cornpañía Ganancia Probabilidad , Cornpañía Ganancia Probabilidad


0.0r02 F 250 0.2r23
0.0346 G 350 0.1542
0.0860 H 450 0.0860
0.rs42 I 55t) 0.0346
0.212:1 .I 650 0.0156

Calcule Ia esperanza y la dcsviación cstJrndar de la ganancia de una invcrsión en este portafolio.

22.Uncírculoderaclio1eszonificaclcen10"írculoscorcélrtricosd.eradios "' 10
10' 10"
lanza un dardo sobre el círculo, si éstc cac en la zona ccmprerdida ertre los cír'culos de radios
i^"lJellar:zad.organa10-idólalcs, i:0,l,...,g.SeaXlacantidaddedineroganaclo,
i0 10
a) Halle Ia ley de la variable aleatolia X;
b) Calcule su esperanza y su varianza.

23. EI espesor del recubrimiento de unos cables tiene funciórr de densidud ry, corr 100 l1rn <:r <
'r'¿
2ao ¡tm.
a) Determirre la media y la varianza del espesor del recublimiento;
b) Si el costo del recubrimiento es de 0.5 délares por micrómetro de espesor, ¿,cuál es el costo
medio por recubrir los cables?

24. Un supermercado tiene una dcmanda dialia variable X de la cantrdad de caile que vende, de
tal manera que X (medida en cientos de krlogramos) tiene una funcrón cie densidad
(
f@):1oq1r'. sio( r<4'
|. 0, caso contrario.

a) Calcule eI valor esperado de Ia cantidad de carne demandada y su desviación estárrdar;


b) Si la ganancia está dada por Y :2X - 0.5. Calcule Ia ganancia esperada y su varianza,
25. La longitud de ciertos gusanos se distribuye según la función dc densidad

¡z - 1)(3 - 'c)' si 1 ( '¿'( 3:


I@): I ¿@
L 0, c¿rso contrarirt.

a) Calcule la esperanza y la varianza dc la longitud clc los gnsanos:


b) Si para un estudio se considerarán aqrrellos eje:nplares clue ierrr¿r.n una longitud entre 1.7
cmy 2.4 cm, calcule el porcentaje cle gusanos que tienen es1-a calacter'ística.

26. El tiempo de uso diario de la red Internet en Lrna oficina tiene p,-r1 :r,;r-ción cie densidad (medida
en horas) a
( gr2(g - ,\
f("):{'-ñr-' sio(¡(s:
0, [ carco conira:- .
3.7. Ejercicios r-15

a) Calcrrle cl v¿rlot eslrclaclo y la virriarrza rlcl tieurpo <.lialio clc rlso de l¿r lecl Intelnel,.
lt) El tictlitct cle ttso ilc Irrtcrrrcl' crlcsta 2 clólares pol hora. C¿Llcule el v¿r,lor esperiiclo v lzl
clesviat:ióu estárrdat ck:l costr¡ scur¡-n¿ri (cn 5 clÍas laLorablcs) por el citilrio rrso.

La lcy cle 1tloltabiliclacl rlue rlesclibc la clistarrr'lia (cn inctros) a Ia. <¡-re un atlet¿r lanza la,jabirlina
CS

[. *t ,.,, (+) . si :¿ c [0, lon2];


,[(t'¡: { 20zr \10n/
I O. caqo corrtr.flrio.

a) Halle la probairilicl¿rd de qLre rula jal;alir'a lanz¡id¿r llcgue a nna dist¿rncia mayor quc 60 m;
b) Determinc el valor esperado dc Ia distancia a la que llr:ga la jabalina;
c) Halle Ia varianza y la desviación estándar de la distancia cubielta por la jabalina.
:3 Dcmuestre quc la ebperanza y la valianza de Ia variable aleatoria discreta definida por

Pr(X : k) :pqk, h : 0,1,2,...


con q: L -p,r.ieren claclas por E(X) :! y Var(X) : +.
pp'
I Sea X una variable aleatoria discrcta que pucde tomar valores enteros, definicla por

Pr(X: r¡-l a' Pata'r_-1;


I ft - a)2n', ?' :0.7,2,,..
para

para elgún a cn (0,1).

a) Pruebe que la función de probabilidad está bien definida.


b) Demuestre que E(X) : g
:'-. Sean X y Y dos variables aleatorias independientes. Si X toma los valores 3, 1y 2 con pro-
babilidacles que son los 3 términos de una progresión aritmética cuya diferencia es j; mientras
tanto, Y tonta los valores 2,7 y 0 con probabilidades que forman una progresión geométrica de
I
razón.r. Calcule la esperanzade XY +2Y - X.
:'- . Dadas las variables aleatorias independientes X y Y, cuyas funciones de densidad son:

: : { t^' ..-l]l ''


rx(,)
{3:' LJ"'"ik*," rv(v)
[ 0, caso contlario.

Calcule:

a) E(x t Y); b) E(2x - 3Y + 5); c) Yar( X -2Y -3).


Las variablcs aleatorias X1, X2, . . . , X,, son independientcs e igualmente distribuiclas, tales que

Pr(X¿- 1) : Pr(X¿: -f) : *,


Pr(Xn : O) : *, i: I,2,...,fr.
z

Halle la esperanza matemática y la varianzadela variable aleatoria Sn: Xrt Xz*... * Xr.
116 Capítulo 3. Variables Aleatorias, Esperanza y Varianza

33. Las variablcs aleatolias X1 , X2, . .. , Xrr,Y,Yz,. . . ,Y,, son independicntes. Pongamos

Sr,: Xt t Xz + "'I Xr,,,

7,, - X1Y1 I X2Y2+ -. . + X,,Y,,.

Halle E(,5,,,), E(7',), Var(.9,,) y Var(T,,) si

E(X¡,) : a, Var(X¡) : s2

Pr(Y¿ :1) :p, Pr(Y¿ -0) : q:l-It, k:I,2,'..,n.


:14. Para las variables aleatorias que tienen las siguientes Ieyes, encuentre Ia función generadora de
momentos v, mediante esta función, halle la esperanza y la v rtanza".
¡1
d) /(") : I ;. si z € 1-2,4):
I o. si r ( (-2,4).
Yl2l4l5 I 6 ( e-3'. siz)0
e) /(r) :
b)
p 1 0.3 1 0.1 1 0.2 10.4 I o, sir<o
si tt"tI'
c)
p 10.2 10,5 10.3
t) f(r):f[. tsen3r'
0, caso contrario.

35. Sean XyYdos variables aleatorias independientes e idénticamente distribuidas con f.g.-. M(t)
Demuestre qtte My¡y(t): Mx(t)llv(t) y qlue My-Y(t): Mx(t)M\'(-t)-

36. sea X con f.g.m. Mx(t), y sean a y b dos constantes. Demuestre que Moy¡6(t):"'btwx(ot).

You might also like