Professional Documents
Culture Documents
Estaasvtca: Illétodos
Estaasvtca: Illétodos
ESTAASVTCA
illétodos y Z\pficaciones
Iidütin Galinclo
En cualquier actividad de Ia ciencia, la técnica, Ios negocios o de la vida cotidiana, que dé como
resultado una serie de mediciones, se obtiene más información que las simples cifras recolectadas. El
cómo conseguir la información, su análisis e interpretación se puede realizar de muchas maneras, pero
primero se debe tener una idea clara de las características más importantes de los datos obtenidos.
Los datos pueden ordenarse en tablas; sin embargo, éstas no muestran su comportamiento global.
Su representación gráfica ayuda a captar fácilmente tendencias y establecer modelos probabilísticos.
Conjuntamente con el empleo de métodos numér'icos sencillos, se puede presentar datos, resumir in-
formación y dar una respuesta rápida del comportamiento global de Ias unidades de donde provienen
dichos datos.
En este capítulo examinaremos varios de estos métodos, que son aquellos que frecuentemente aparecen
en los paquetes computacionales de estadística.
1.1. Introducción
En primer lugar, demos una definición de la ciencia Estadística que recoge mucho de lo que ella realiza.
Para su mejor estudio, a Ia EstadÍstica se Ia divide en dos grandes ramas: la Descriptiva y la Inferencial.
La Estadíst'ica Descriptiua -también conocida como Anó.lisis Erploratori,o de Datos- consiste, sobre
:odo, en la presentación de datos en forma de tablas y gráficos. Está diseñada para resumir o describir
los datos sin factores adicionales; esto es, sin intentar inferir nada que vaya más allá de los datos, como
:ales.
Capitulo 7. AnáIísis Exploratorio de Datos
Para aplicar los métodos estadísticos a la información disponible, es necesario tener presente los tipos
de problemas que esta ciencia resuelve.
Análisis de muestras. Es frecuente que, por razones técnicas o económicas? no sea posible estudiar
los elementos de una población. Por ejemplo, para determinar Ia opinión de la población ante las
elecciones solo se investiga a un grupo pequeño, ya que es imposible consultar a todas las personas
en capacidad de votar. Análogamente, se acude a una muestra para estudiar la rentabilidad de un
proceso de fabricación o para de terminar el nivel de ocupación de la población.
La Estadística se utiliza para elegir una muestra representativa y para hacer inferencias respecto a la
población a partir de lo observado en la muestra. Este es el procedimiento aplicado para, por ejemplo:
Medición de relaciones. Los gastos en alimentación de una familia dependen de sus ingresos, pero,
es imposible determinar con exactitud cuál será el ga.sto de una familia de ingresos dados. Entonces,
no existe una relación exacta, sino estadística. Determinar y medir estas relaciones es importante
porque, debido a los errores de medición, las relaciones que observamos entre variables fÍsicas, sociales
o técnicas son, casi siempre, estadísticas.
Predicción. Muchas variables económicas y físicas tienen cierta inercia en su evolución y aunque
sus valores futuros son desconocidos, el estudio de su historia es informativo p¿rra prever su compor-
tamiento futuro. Este es el mecanismo que se emplea para prever la demanda de un producto, la
temperatura en un horno industrial o las magnitudes macroeconómicas.
7.2. Definiciones básicas
Para la obtención de información estadÍstica se emplean dos formas bien diferenciadas: los métodos
de muestreo y los experimentos diseñados.
Una investigación por muestreo es un estudio cuya finalidad es la recolección de datos y en el que
el investigador no tiene control sobre las condiciones o los individuos participantes. Ejemplos de
muestreos son los censos, las encuestas electorales o de consumo de un producto.
Un experimento es cualquier proceso o estudio en el que se realiza una recolección de datos donde el
investigador, usualmente, tiene control sobre algunas de las condiciones bajo las cuales el experimento
tiene lugar. Por ejemplo, en el desarrollo de un nuevo medicamento, en la preparación de una nueva
aleación de acero para usar en los automóviles, es necesario realizar experimentos para comparar su
efectividad con otros previamente existentes.
Las que antes indicamos son las principales aplicaciones de la Estadística, cuando esta ciencia se
utiliza para analizar procesos o fenómenos naturales a profundidad. Pero este no es nuestro caso, por
el momento, nosotros podemos pensar que la EstadÍstica es la ciencia de <<deducir hechos a partir de
datos y de figuras>>.
Aquí surgen varias ideas importantes en todo análisis estadístico: la unidad muestral,la población (o
uniaerso) y la muestra.
Definición (de unidad muestral o experimental) Una unidad es una persona, animal, planta o
cosa que es examinada por un investigador; es el objeto básico sobre el cual el estudio o experimento
se lleva a cabo.
Definición (de población o universo) Una población es una colección completa de personas,
animales, plantas o cosas de las cuales se desea recolectar datos. Es el grupo entero al que queremos
describir o del que deseamos sacar conclusiones.
Generalmente, se selecciona una muestra porque la población es demasiado grande para estudiarla
enteramente. La muestra debe ser representativa de la población general, lo que se logra mediante
una selección al azar de las unidades. También, es importante que el investigador defina, completa
y cuidadosamente, la población antes de recolectar una muestra, incluyendo una descripción de los
miembros a ser seleccionados.
3. Una dueña de almacén desea estimar el gasto medio de compra de sus clientes en su almacén
en el último año. La población es todas las facturas de compra en el indicado periodo. Una
muestra de ciento veinte facturas seleccionadas aleatoriamente, serviría para tener una idea del
gasto medio de los clientes.
En los ejemplos anteriores solo se enunciaron posibles muestras para las distintas poblaciones, sin
importar que tan buena pudiera ser ésta.1
2. Cuantitativos (Numéricos): Cuando ellos describen caracterÍsticas que son medibles; por ejem-
plo, la temperatura del ambiente, el número de hijos de un matrimonio, el salario de una persona.
A su vez, las variables cuantitativas se clasifican en discretas y en continuas.
Datos discretos. Un conjunto de datos se denomina discreto si los valores u observaciones
que pertenecen a él son distintas y separadas; es decir, ellas pueden ser contadas (1, 2,3, ...).
Ejemplos de datos discretos son: el número de clientes que ingresa a un almacén en un día, el
número de años que vive una persona.
Datos continuos. Un conjunto de datos se denomina continuo si Ios valores u observaciones que
pertenecen a él pueden tomar cualquier valor en un intervalo considerado. Ejemplos de datos
continuos son: el tiempo que se demora en ejecutarse un programa en la computadora, el peso
de una persona.
Definición (de escala de medición) Una escala de medición es un instrumento de medida con
el que se asignan valores a las unidades estadÍsticas.
I
La elección apropiada de las muestras se explicará en profundidad en el CapÍtulo 13
7.4. Característ,icas de los datos
Escala nominal' Un conjrrnto de clatos cstá mecliclo en esca,l,a nomin,al si a los vaiorcs que pertcnccen
a é1 se lcs puedc asignar un código, en la forma cle nn nrimero, clonde los núrmeros
sor simpleme¡te ula
cticlueta' Los datos en escala nominal ptteclen ser contados, pcro no pueden ser orclen¿clos o medi¿os.
Por ejemplo) elr Lln registro de pclsonas, los hornbres pueden ser codificados como 0 y las mujeres
como 1; el estado civil de un indirriduo puede codifi.carsc como "1" si es casado y como ,,2,'
si no lo es.
Escala ordinal. IJn conjunto de clatos cstá medido <:n esca,la ord.inal si a los valores qne per.tenecen a
él se les puede asignar un orden o asociar una escala. Los datos en escala ordinal pueden
ser contados
y ordenados, pero no pueden ser medidos.
Las categorías, para un conjunto ordinal, deben tener un orden natural; por ejemplo, suponga que
a
ur grupo de personas se les pide que clasifiquen la calidad de la señal de las emisiones de radio, en
una escala de 5 a 1, que representan excelente, buena, regular, mala y pésima. Un puntaje de
b indica
mejor señal que un puntaje de 4. Así, los datos resultantes son ordinales.
Escala de intervalo. Un conjunto de datos está medid o en escala d,e interualo si los valores que
pertenecen a él pueden tomar cualquier valor dentro de un intervalo finito o infinito, con
la particula-
ridad de que existe un <<cero relativo>>. Los datos en escala de intervalo pueden ser contados, ordenados
y son válidas las operaciones de adición y sustracción) pero no las de multiplicación y división.
Ejemplos de datos en escala de intervalo son: la temperatura medida en grados centígrados (donde
hay un cero elegido arbitrariamente), los puntajes obtenidos en una pruebalaonae un puntaje
de cero
no significa que quien lo obtuvo no sabe nada).
Escala de razón. Un conjunto de datos está medido en escala d,e razón si los valores que pertenecen
a él pueden tomar cualqnier valol dentro dc un intcrvalo finito o infi.nito, con Ia particula'idad
de que
existe un <<cero absoluto>>. Los datos en escala de intervalo pueden ser coritados, ordenados y
son
válidas las operaciones de adición, sustracción, multiplicación y división.
Ejemplos de datos en escala de lazón son: la temperatura medida en grados Kelvin (doncle
hay un
cero absoluto), la estatura de una persona, cl tiempo de vida úrtil de una máqnina.
1.3.3. Valoresatípicos
Un valor atípico -también denominado valor inusual o valor extremo- en un conjunto de datos,
es
t una observación que es lejana, en valor, del resto de datos; es clecir, es un d.ato inusualmente
grande
o innsnalmente pequeño, cotriparado con Ios dern¿is.
Un valor atípico ¡>uede ser el rcsultado de un error en una medición, en cuyo caso distorsiona Ia
interpretación de los datos al tetrer una influencia excesiva sobre los cálculos a partir
de la muestra.
Si el valor atípico cs un lesultado genuino es importante, porque podría indicar nn
compoltamicnto
S extremo del proceso en estudio. Por esta razón, toclos los valores atípicos deben
ser exarni¡ados
) cuidadosamente antes de rcalizar un análisis formal y no se los debería eliminar
sin una.justificación
pre\¡1a.
Todo conjunto de datos presenta ciertas características que perrniten, en rlna pr.imera
aproximación,
deducir el comportirmiento dcl proceso del cr-ral fueron obteniclos. Las tres principales
características
son: la localización, la dispersión y la simetría.
Capítulo 7. AnáIisis Exploratorio de Datos
o tr ocalización. La krcaliz¿tción <le nn conjrrnto clc clatos cs la Posición lelatir'¿r cltic cllos lllesentan.
En gc'rrcr:rl, se rrricle ¿L la localiz¿rción lror cl valcil que tiene el pLrnto mr:clio clel corrjurrto c.1e clatos.
Por cljernplo, r,:rr la rnedici<in cl<r la r¡st¿rttu'¿r rl<,r lrrr grlipo de personirFj) l¿)s medicioncs est¡rr'án
entre los trcirrta centírnetlos (clc los rcciérr naciclos) y los cLos mctlos veinl,e centíne-
localiza,cl¿¡.s
tros (clc los adultos muy altos), si se srrl>one qucl esta,turas rxayorcs no se prcsentar, y se pirede
caracterizal a todos ellos con una estatura prornedio de 1.70 mctros.
La iclea de localización fr-ic introcluci<la por R. A. Fisher er 7922.
Dispersión. Los valores obtenidos en url¿ mnestra no son todos iguales. La valiación cntre
estos valoles sc denomnzt dispe'rsión. Cu¿rndo sc mide la dispersión sc desea dctectar el grado
de disemirración de los valores individuales alrededor del centro de ias observaciones.
En los procesos de manufactura o de medición) una alta precisión está asociada con una baja
dispersión.
El concepto de dispersión fue introdr.rcido por F. Galton (en 1886) y por W. Lexis (en 1887) e
identificado como aqrrel en el que se reflejan las cliferencias entre las mediciones) provenientes de
una misma fuente o tomadas en condiciones semejantes.
Simetría y asimetría. Un conjunto de datos es sirnétrico cuando los valores de los datos están
distribuidos en la misma forma por encima y por debajo de su punto medio.
Los datos simétricos:
1. Son fáciles de interpretar, pLles los dal;os c¡re están por encima y por debajo del pr.rnto medio
pueden sel considelaclos con un misrrio critcrio;
2. Pelmitcn la fácii detección de valores atÍpicos;
d. Adrniten la comparación con conjurrtos de datos similales, en tér'minos de la dispersión.
La asimctría cn un conjrtnto cie datos es el ¿lgrtrpaniiento que ellos Jrresentan a un lado de su centro
Los valores situados a un lado de la rnitacl clc los datos ticnclen a estar rnás alejados qrre 1os \¡¿rlores
clue se enclrerrtran cn ei otro l¿rdo.
La distribuci,ónde ,f'rec'u,en"cias cs Lrrre herrarnicnta que se emplea para resurnir', mediantc una tabla,
nurnerosos d¿tos dc rnancra qlle sc ponga de maniliesto l¿ loc¿rlización y Ia clispersión de l¿rs ol¡serva-
cloLcs.
7.5. Distríbución de frecuencias
Con ltna tabla de frccuencia,s se puedcn resurnir- da,tos ctrtegór'icos, nominales u ordiuales. Si los clatos
son continrros se pr-rede lesumillos l.ln¿r \rez qlle se los ha dividido cn grupos serrsiltlcs.
Si se dispone (le un núrrnelo alto dc obsclvacioues) r¿, se procede ¿r cstablccel cr,rántas vcccs se rcpite
cada nrta de ellas, pala cletelrninar sn frecu,en,ci,u o,bsolutct, n". A par:til dc esta información bá,sic¿r se
puede obtencl o1,la, que es converriente poncrla etl nna tabla.
Par'¿r la confección de ltna tabla, de distribución dc frecuencias es lecomcrrdablc segu.ir los sigrrientes
Pasos:
Procedirniento.
1. Se ordenan los datos tr7) :[2) . . ., rk en ur]a columna, de forma ascendentc, poniendo a continuación
k
sus frecuencias absolutas n1, TL2¡ ...¡ n¡. Nótese que D rLi: n.
i:r
2. Luego se forma una tercera columna en la que se pone Ia frecuenc'ia relat'iua; que resulta de
dividir la frecuencia absoluta n¿ para el núrmero total de observaciones: /¿ - 3. Xo es más que
TL
la proporción de aparecimiento de cada observación.
3. Pueden, también, calculalse dos columrlas correspondientes a las fi'ecuencias acumuladas, tanto
absoluta como relativa, que resultan de sumar las frecuencias de todas las observaciones ante-
riores hasta la considerada inclusive. Muchas veces, a las frecuencias relativas se las pone como
porcentajes, en lugar de números flaccionarios.
Ejemplo. En nna fábrica de muebles de rnaclera, se contlolóe1 tiempo (en minutos) neccsario para
completar un trabajo cle armado de ciertos anaqueles. Se obturrieron las siguientes mediciones del
tiempo empleado por los obreros:
32.9 JJ.4 33.9 tao JJ.J 32.8 J.).1 .1.). i ) J,]..) 33.5
Dt ¡<
.)r).J 33.6 1') n .),). I 33.6 óó.4 33.6 33.8 33.9 t')
.)J. J
o
34.0 il :'t3.0 tD OD D
óó. DD
rlJ.+ r',
,1,1. ,),).4^ JJ.J JÓ.+ 33.6 33.6 /
.)t r '12 r) ,j.l 1
r)r).J 33.6 33.0 JJ.1 33.6 JJ.U 33.6 33.1 33.8
,),
J.J. / ,-),1., ) 33.8 JJ.
1
1 .),)..) 33.0 .).) ,.) 33.4 ÓJ. iJ 33.0
Capitulo 7. Análisis Exploratorio de Datos
La sigr-riente taJrla rrnrestra l¿i clistril¡rrción cle flecrrerrci¿ts dc clatos illrliviclrt¿rlns (crr 17 r':rl,rres).
Sc ha presentado una distribución de frccuencias para 100 datos individuales, pero la tabla pr-rede
Ilegar a scr exterlsa; y si bicn prescnta la, información resunicla, puede ser conveniente resumirla aúrr.
rrrtis, c;r'eando cl¿rses. La agrr-rpac:ión cle clatos cn cl¿rscs sirnplificir Ia presentación y el estuclio cle la
distribución) allnqlle se pierden algunos rleta,lles.
A continuaciórr sc enLlnleran los ptrsos a scguir para constrllir una clistribr-rción de fiecnenci¿rs cle dat,os
agmpatlos en cl¿rses:
Decida el número de clases (ft). La siguienl,e talrl¿r puccle clar rura olientación adccuada cn
Ia rnayor'ítr de los casos.
201 - 500 o
501 - 1000 10
rnás clc 1000 t|-20
Calcule la iongitud de ia clase. La longitrrcl clc la cl¿lsc cs igual a Ia obsclrración rnayol menoil
dividido por cl nLilrrero de clases. Rcdonclcc este rcsulLado pala obtenel rrn rrúrnrero
li1 ttrcnor,
cor)venicnte) que tenga el mismo níurelo de decimales qlre los d¿rtos.
/nráx - frnín
.4
k
,) Construya las clases indicando los cxtremos de Ias misrnas. Cor¡ro ayllda parzr cálculos
J)ostcIioICS:
a) El extremo inferior' (16) plimera clase será cl lírrrrero ilrnediatarnentc rnerror- a1 r'alor'
de 1a
mÍnimo, quc tierle rrn clecirn¡rl rnás y qlle terlnrna cn cnco-
7.5. Distribución de frecuencias
5. Calcule las columnas restantes. IJna vez que tiene la frecuencia absoluta, proceda a calcular
las frecuencias lelativa y acumuladas) como se explicó anteriorrnente.
Observación. El número de intervalos puede variar del inicialmente estimado al redondear el valor
de la longitud del intervalo y que se cumpla el paso 3 a).
Ejemplo. (Continuación.) Construir una distribución de frecuencias por clases de los datos de las
mediciones del tiempo necesario para armar anaqueles.
Solución: De acuerdo a la tabla los datos se distribuirán en k:7 clases. Los máximos y los mínimos
son:
r^5* -- 34.4, rmí. : 32.7, rmáx - trni. : L.7,
1n
longitud de la clase : ::: :0.24,
7
Ls : Le -l A:34.25 *0.2:34.45
Nótese que por efecto del redondeo en Ia longitud del intervalo ha dado un total de 9 clases. Queda
para el Iector realizar el mismo ejercicio redondeando la longitud de Ia clase a 0.3.
10
Capítulo 7. Análisis Exploratorio de Datos
1.6. Representaciones gráficas
de los datos
una rnanera rntly eficiente cle co'oce.
gráficamente' ya que permite
el corn¡lo.ta'riento de un conjunto
dar rtna descripciin a. cre datos es re¡rrese'tar.lo
-"r,lr" rápida y ráit de entender. La importancia
i: ::rff ;Tfi:,::l il:T:T.5 f*13¡,T# l.:, :ll" : ".o an ¿,isis ". t J.t i"o de b e ir acomp añado
i'if?sii u.,n*
Figura 1.2: Diagrama de puntos.
1. Los datc¡s están agnrpados ccrca del valor 3, antes que, digamos B o 10.
2. Las observaciones sc cxtiencleu en ah'ecledor clc 17 uriidacles) con Llua concentración entre 0 y 8.
o
a 3. EI valor 16.4 puede ser calificado de atípico, porque se clcuentra alejado del grupo principal de
o datos.
El diagrama de tallo g hojas, que es una técnica semigráfica que se emplea para ilustrar las principales
características de los datos (localización, dispersión y simetría). Además, tiene la ventaja de presentar
Ios valores de los datos. Por la forma en que se construye, se debe emplear para un conjunto de hasta
100 datos.
08 19 77 01 07 09 05 16
13 04 15 02 00 o4 01 12
es)
tar A los datos los clasificaremos considerando las decenas; así tendremos dos grupos, uno que empieza
trá con 0 y otro que empieza con 1. Ellos forman el tallo, al colocarlos de manera vertical:
)o
0
rar 1
lue
A continuación, para cada observación anotamos el segundo dígito (de las unidades) a la derecha de
la barra vertical, que vienen a constituir las hojas. La primera observación 08 da
las
üar
0
1
006
Al agregar la segunda observación 19, da
0 8
1 9
0 8L79542041
1 976352
Los valores que forman las hojas pueden reordenarse de menor a mayor, así:
0 0LI2445789
1 235679
12 Capítulo 7. Análisis Exploratorio de Datos
Podemos crear dos categorías en cada una de las decenas, en las cuales los dígitos de las unidades del
0 al 4 formen un F,rupo y los dígitos del 5 a 9 foimen otro; de esta manera se tiene:
t) r42047
0 8795
1
to
¿¿
1 9765
Cuando los datos constan de más de dos cifras, se deben escoger los rangos para las agrupaciones
que se realizarán;luego aI llcnar las hojas se separan mediante una coma para evitar confusiones. Si
disponemos de los siguientes datos:
qD
DJ 55 79 106 188 47 118 248
47 58 82 113 208 60 88
que está agrupado por centenas. El siguiente diagrama está agrupado en intervalos de 50:
0 33,47,47
0 55,58,60, 79, 82,88
1 06, 13, 18
1 88
2 08, 48
2
Asimismo, se pueden usar diagramas múltiples para comparar dos conjuntos de datos, para ello se
coloca un tallo común y las hojas de un conjunto se ponen a la izquierda del tallo y las hojas del
segundo conjunto a la derecha del tallo, de la siguiente manera:
4371 1 44
ft 9888655 1 5779
310 2 0L23344
99875 2 678
311 3 03
.) 5
4
Se observa que los datos de la izquierda están más agrupados en los valores bajos, con un rango mayor
y fuerte asimetría; mientras que el conjunto de la derecha es muy simétrico y con menor dispersión.
También, se emplean estos diagramas para representar datos con decimales; por ejemplo, si tenemos
los datos:
1.3 0.8 1.6 2.0 r.7 7.2 0.5 1.9 0.6 2.2 0.5 1.6.
7.6. Representaciones gráficas de los datos 13
0. 5568
1. 236679
2. 02
FYecuencias Fbecuencias
Categorías
absolutas (n¿) relativas (/¿)
Ct u f,
Cz n2 fz
Cn ;, ir
Total n, 1
Un gráfico de sectores es un círculo dividido en segmentos, donde el área de cada uno de los sectores
es proporcional a la frecuencia relativa de esa categoría. El ángulo central de la categoría es igual a
fi x 360".
Junto a cada uno de los sectores que constituyen el gráfico, se suele indicar el nombre, el número de
elementos y el porcentaje de cada categoría.
También, se puede resumir datos cualitativos mediante rn gró.fi,co de baryas. En éstos, los datos
se exhiben mediante rectángulos, del mismo ancho, cada uno de los cuales representa una categorÍa
particular. La longitud (y por lo tanto el área) de cada rectángulo es proporcional al número de casos
en la categoría que representa.
Si los datos son nominales, las categorÍas se pueden colocar en cualquier orden; pero si los datos son
ordinales, las categorías deben estar ordenadas.
Los gráficos de barras se pueden presentar de manera horizontal o vertical y usualmente hay un espacio
entre los rectángulos. Junto a cada uno de los segmentos que componen el gráfico se coloca el nombre
el número de elementos y el porcentaje de cada grupo.
Con el gráfico de barras se distinguen las principales caracterÍsticas de los datos, como aquellas causas
que son más importantes o que más frecuentemente se presentan en un proceso. También, tiene la
ventaja de que se pueden realizar gró,,ficos de barras agntpadas, que consiste en representar sobre el
mismo gráfico más de dos variables -siempre que estén medidas en las mismas unidades-, permitiendo
realizar comparaciones,
Ejemplo. En una empresa financiera, los empleados disponen de computadortrs portátiles de distintas
marcas. Un resumen del número de máquinas, de acuerdo a su respectiva marca, se presenta en el
siguiente cuadro.
Toshiba
L.6.4, Histograma
El histograma es apropiado para datos continuos, medidos con una misma escala y se lo emplea
cuando un diagrama de tallo y hojas es tedioso de construir. Igualmente, puede ayudar a detectar
observaciones atípicas y cualquier brecha entre los datos.
Ejemplo. (Continuación.) El histograma correspondiente a la tabla de distribución de frecuencias
de los tiempos de ensamblaje de anaqueles se presenta a continuación.
Figura 1.4:
Un polígono de frecuenci¿s es un gráfico que se obtiene uniendo con segmentos de recta los puntos que
tienen proporcionalmente como abscisa a la marca de clase y como ordenada la frecuencia respectiva.
Se cierra en ambos extremos en las marcas adyacentes con frecuencia cero.
7.7. Ejercicios 15
La ojiua es un polígono de frecuencias acumuladas; es decir, en las abscisas se colocan los límites
superiores de cada intervalo de clase y en Ias ordenadas se coloca la frecuencia acumulada (absoluta o
relativa) de la clase. La ojiva es útil para:
Una vez que se ha confeccionado una tabla de frecuencias y se ha realizado Ia representación gráfica
correspondiente, es necesario disponer de valores que permitan describir y compara¡ los conjuntos de
datos, mediante números que indiquen su posición, su variabilidad y su forma. Ésto se realiza con las
llamadas medidas estadísticas o simplemente estadísticos.
L.7. Ejercicios
1. Dé ejemplos (preferentemente de su propio campo) de poblaciones y muestras.
2. Para cada uno de los distintos tipos de datos: discretos (categóricos, ordinales y nominales) y
continuos, enuncie al menos dos ejemplos. Justifique sus respuestas.
3. En una encuesta de opinión acerca de las preferencias de bebidas gaseosas, por sus colores: negro
l
(N), blanco (B) V R (rojo), 20 consumidores dieron las siguientes respuestas:
i
N, B, B, N, R, B, B, N, N, B, N, B, B, R, N, B, N, R, N, B.
I
Construya el gráfico de sectores circulares.
4. Los siguientes datos corresponden al porcentaje de alumnos de cuarto grado de escuela, clasifi-
cados según su rendimiento académico en la materia lenguaje.
Calificación %
Insuficiente 53
Regular 26
tre
Bueno 15
c) ¿.Qué porcenta.jc de los alurnrros cle cuarto graclo tien<:u urr renclirnierrto <<bucno>> o mejor
que bueno?
E
i). En Ia siguiente tabla se describe diferentes razas d<r perros, según varias caracterÍsticas obser-
vadas.
R,aza Tamaño Peso Velocidad Agresividad Función
basset 11 I 2 2
boxer' 22 2 2 I
bauceron 32 2 2 r)
bulldog 11 I 1 1
caniche 11 2 1 1
chiguagua 11 1 1 1
cocker 2I 2 2 1
colley 32 3 1 1
doberman 32 3 2 3
dogo 33 3 2 ,
r)
fox hound 32 3 2 2
galgo 32 3 1 2
labrador 22 2 1 2
mastin 32 3 2 3
pekinés 11 1 1 I
podenco 22 2 1 2
pointer 32 3 1 2
san bernardo 33 1 2 3
teckel 11 1 1 1
teI'ranor¡a 22 1 1 3
¡,Qué porcentaie del peso total del cuerpo humano corresponde al peso total de la piel?
7. Se registró Ia distancia diaria (en km) que el representante comercial de una empresa recorre
para visitar a sus clientes:
36 19 29 37 33 22 29 31 2L 35
2042534 24 27 27 24 26 31
27 77 31 10 28 15 41. 30 18 39
46 26 12 23 18 33 25 28 23 28
a) Elabore una distribución de frecuencias con 7 intervalos de clase;
b) Realice el diagrama de tallo y hojas;
c) Determine el porcentaje de empresas con una inversión entre 14 mil y 20 mil dólares.
9. Los ingresos mensuales de una muestra de pequeños comerciantes se tabularon en una distribu-
ción de frecuencias simétrica de 5 intervalos de clase de igual amplitud, resultando como ingreso
mÍnimo 125 dólares, marca de clase del cuarto intervalo: 300. Si el 8 % de los ingresos son
menores que 165 dólares y el 70 % de los ingresos son menores que 275 dólares. ¿Cuál es el
porcentaje de los ingresos que son superiores a 285 dólares?
10. Se tiene la siguiente tabla acerca de las edades de los obreros de cierta empresa:
No. de
Edades
obreros
22-27 L4
27 -32 17
32-37 25
37-42 10
42-47 I4
12 Al clasifical las no+"as cle 0 a 100 cn un exarnen,se obtuvo una distribución simét,rica, con 5
intervalos de clase de iglral ancho. Si el 10% desaprotró con rnenos de20, rnientra-s qurcel 40o/o
obtlrvo notas comprendidas entre 40 y 60, ¿,qrré porcentaje de alurrinos obtuvo una nota rnenor
de 60?
14. Los pesos de n artículos se ordenaron en una tabla de distribución de frecuencias de 7 intervalos
de igual ancho de clase, donde: mín : 50 g, máx : 120 g.
a) Determine el valor de n;
Frec. absoluta
Intervalo Frec. absoluta Frec. relativa
acurnulada
640 - 680
680 - 720 48 60
720 - 760 0.r25
760 - 800 0.075
800 - 840
Determine el número de familias que tienen un ingreso menor a 800 dólares mensuales.
17. Dado el siguiente histograma de frecuencias relativas. ¿Cuántas observaciones hay en el rango
[c, /], si el total de la rnuestra es de 400? 2(
7.7. Ejercicios 1_9
Figura 1.7:
¿Qué porcentaje del consumo diario se utiliza desde las 19h hasta las 24h?
100
55
45
25
10
12 17
Figura 1.9:
go
20. Dada la ojiva correspondiente a los gastos en servicios de los hogares de una ciudad.
20 Capítulo 7. Análisis Exploratorio de Datos
/D
Figura 1.10:
Existe una amplia variedad de medidas de localización; nos concentraremos en las m¿ís empleadas: el
promedio, la mediana, la moda, la media geométrica y la media armónica.
rt*rz*.'.*rn Drn
i=l
&-
n
. Si las observaciones están agrupadas en una tabla de frecuencias de datos individuales como la
siguiente:
Observación Flec. absoluta
rI fLy
I2 n2
rk nk
k
Dnn'n
¿:t
&
sa
I: ---=-,
n
COn n: z_rn.
d:l
7,8. Medidas de localización 2L
2 I2 S2 r2 TL2
k t"¡ 9p ;r rLk
se calcula el punto medio cle cacla clase rromo iri :; l¿ I s¡' ' '
Q,:1,2,, .. , k) y el promedio es
k
I
i1
rr,¡ r¡ k
4. Es único.
;EI 5. Su principal inconveniente es que se ve afectado por la presencia de valores atípicos.
Ejemplos
Solución: Como las mediciones están agrupados en una tabla de datos individuales, aplicamos
Ia fórmula que considera la frecuencia de cada una de ellas.
Téngase presente que el número de clases €s k : 9 y el tamaño de la muestra es n: 46.
I
I n'¡r¡
r:i:l
n,
2x I.45*4 x 1.48+... +3 x 1.63 * 1 x 1.65
46
r.545.
3. En una cooperativa de ahorro y crédito se realizó Ia tabla de frecuencias de Ios montos de los
ahorros de sus socios (en dóIares), según se presenta en la tabla,
D'¿*n
Á t--l
TL
1.8.2. La mediana
La mediana fue por primera vez utilizada, como una medida de localización, por A. A. Cournot en
1843 y redescubierta por F. Galton en L882, año desde el cual su empleo se ha generalizado.
Definición (de mediana) La mediana de un conjunto de datos xr, z2: .. ., rn es el valor que se
encuentra en el punto medio, cuando se ordenan los valores de menor a mayor.
1.8. Medidas de localización 23
Se la nota como Q2 o Med y tiene la propiedad de que a cada lado del valor se encuentra el 50 % de
las observaciones.
Si los datos están resumidos en una tabla de distribución de frecuencias de datos individuales.
1. Ordene las observaciones de manera creciente, con sus respectivas frecuencias acumuladas.
2. Calcule I2"v red.ondee al entero más cercano. Determine en Ia columna de Ia frecuencia
acumulada a qué dato pertenece, comparando el valor obtenido con el valor de la frecuencia
acumulada que es igual o inmediatamente superior; éste valor es la mediana.
Si los datos están resumidos en una tabla de distribución de frecuencias por clases, la mediana
se determina por interpolación, asÍ:
1. Establezca en qué intervalo está el valor mediano. Para ésto, se determina la primera
n
clase cuya frecuencia acumulad.a se
a mayor o igual a Dicho intervalo se denomina clase
5.
med'iana.
2. La mediana se calcula con la fórmula
n,
; - nl-r
Med,: L¡_t-r
donde: =-A,
,L¿-1 es el límite inferior de la clase mediana.
At-r es la frecuencia acumulada del intervalo inmediatamente anterior al intervalo de la
mediana.
n¿ esla frecuencia absoluta de la clase mediana.
A es Ia longitud de la clase de Ia mediana.
La interpretación gráfica del cálculo de la mediana se encuentra en la Figura 1.11.
1. Es la medida m¿is representativa en el caso de variables que solo admitan la escala ordinal.
2. Es fácil de calcular.
.). En Ia mediana solo influyen los valores centrales y es insensible a la presencia de valores atÍpicos.
L¡¡ MC L¡
lal
Figura 1.11: Interpretación geométrica del cálculo de la mediana.
Ejemplos
5.5 6.9 7.0 3.0 4.8 4.t 3.2 4.3 5 5 6.5 4.3.
3.0 3.2 4.7 4.3 4.3 4.8 5.5 5.5 6.5 6.9 7.0.
t70 r72 168 165 L73 178 180 165 167 L72.
la
3. (Continuación.) Calcular la mediana de la estatura de 46 señoras, cuyas medidas son:
Soluci,ón: Las mediciones están agrupados en una tabla de datos individuales y el tamañ0,d,9,1,1i
muestra es n: 46. , . .iJ,ríiri,!
Calculamos 2 : ZZ y vemos en Ia columna de Ia frecuencia acumulada que hay los valoles 19 y
2
31, que cumplen que 19 < 23 < 31.
i"r;i'r;'irt:;'/
Así, Ia mediana es el valor cuya frecuencia acumulada es 31; es d,ecir, Q2: 1.55-.i "
4. Para la liquidación del impuesto a Ia renta, en una pequeña empresa, se calcularon lcs'ingbesoS
anuales (en dólares) de todos los empleados. La tabla de distribución de frecuencias es la
siguiente: ,i'¡_l-
Número de Fbecuencia
Ingreso anual
personas (n¿) acumulada (Nr)
,,,r.1 t,
2400 - 3000 3 3
3000 - 4200 20 23
,,r,; r ¡ix llri.il
4200 - 5400 35 58
5400 - 7250 25 83
7250 - 9000 15 98
9000 - 12000 2 100
Solución: Los datos están dados en una tabla de frecuencias por clases con r¿: 100.
* - *n-,
Med: L;I*TO
!{-es): : 4200 + tO:"rrg¡ :5L25.7. 'i rr,','i;trÍ :'.i r1i',¡'¡1,\q;?.
35
t;i ir1¡;({ l:
La mediana del ingreso anual de los empleados de la empresa oist25'.1¿lil*áJ]
'" -- 1--.\' lrii:Lli-'rr "i'j ..'ilrrrrrri
r
'rli;rl.lirll;l
Definición (de moda) L" moda de un conjunto de ddüob'es aquel valor que tiene la mayor
frecuencia absoluta.
Se la nota como Mo. Hay ocasiones en las cuales los datos pueden tener dos o más modas, o no puede
existir, cuando todos los datos tienen igual frecuencia. Para su determinación es útil construir una
tabla de frecuencias de los datos.
. Si los datos están resumidos en una tabla de distribución de frecuencias por clases, la m'6dr
"e
determina mediante la fórmula: ii ,,'t:) i, ri ) lfl;'{
donde:
tr¿-1 es el límite inferior de la clase modal.
d1 es la diferencia entre la frecuencia de la clase modal y la frecuencia de la clase anterior.
d,2 es la diferencia entre la frecuencia de la clase modal y la frecuencia de Ia clase siguiente.
Aunque la icle¿r de <<valol rn¿1s fiecuente>> es mny trrrtigurr, no fue ernpleacla en estaciística, dc rn¿lnela
forrnal, hasta c¡re Ia po¡lrlirlizó K. Pe¿u'son en 1894.
2. Es la única medida de Iocalización que ptiede obtenerse en Ias variables de tipo cualitativo.
Ejemplos
9.4 8.1 9.0 5.6 7.0 9.0 6.5 9.0 3.8 7.0.
Soluc'ión: La moda de este conjunto es Mo:9.0, que es el valor que más veces se repite.
3. Para la liquidación del impuesto a la renta, en una pequeña empresa, se calcularon los ingresos
anuales (en dólares) de todos los empleados. La tabla de distribución de frecuencias es la
siguiente:
Número de
Ingreso anual
personas (n¿)
2400 - 3000 3
3000 - 4200 20
4200 - 5400 35
5400 7250 25
7250 - 9000 15
9000 - 12 000 2
Solución: La clase modal es el tercer intervalo, ya que tiene la mayor frecuencia (hs : 35).
I
: 50; por tanto, la mediana estará el el intervalo
Entonces,,2I (4200; 5400), de manera que
dr :35 -20:15, d¿:35 - 25:10 y A:5400 - 4200:7200. l
:
Ahora, tenemos que
Definición (de media geométrica) La media geornét,rica, notaclzr corno .{lG, clc urr conjunto dc
n, meclicion€s r1, 12:.. ., nr es igrral a Ia taíz r¿-ésirna de su ltroclucto; es decir,
AIG: Vqxrrx-xrk.
El empleo más frecuente de la media geométrica es el de promediar variables tales como porcentajes,
:asas, números Índices; es decir, en los casos en los que se supone que la variable presenta variaciones
acumulativas.
3. Es úrnica.
1. Su cálculo es más complicado que el de la media aritmética y solo se la puede calcular cuando
todos los valores son positivos.
50s
;la
Ejemplo. Calcular la media geométrica de la estatura de cinco personas que miden (en metros):
MG : (r¡x12x-xrn
: otT
11.70 x I.72 x 1.68 x 1.65 x I.73: 1.696.
Su empleo no es aconsejable en distribuciones de variables con valores pequeños. Se suele utilizar para
promediar variables tales como productividades, velocidades, tiempos, rendimientos, cambios, etc.
28 Capítulo 7. AnáIisis Exploratorio de Datos
3. Es única.
Ejemplo. Calcular la media armónica de la estatura de cinco personas que miden (en metros):
11111 : 1.696.
A un conjunto de datos ordenado se lo puede dividir en un número fijo de partes iguales; cuando se lo
divide en cien partes se tienen los percentiles.
Definición (de percentiles) Los percentiles son cada uno de los 99 valores que dividen a la
distribución de los datos en 100 partes iguales.
A los percentiles se les nota como P¡. Con ellos se puede encontrar regiones donde se acumulan los
datos; así, el 30 % de los datos están por debajo del trigésimo percentil.
. Si los datos no estrín agrupados o están en una tabla de datos individuales, se efectúa la siguiente
descomposición:
nk
: j *r,
100
donde:
j es la parte enter u a" !.
100
r es la parte fraccionaria a. *.
100
Entonces, se tiene que
si r:
"+-,
rj+L, sir>0.
o;
7.8. Medídas de localización 29
,tk, _
l{r.
"
I'A,:LA-ta 1oo ',1,
,
7Lk'
rlor rcler:
,L¿ 1 es cl lírrrite inferior del intervalo ñ (cuva fi'ecucrrcia ¿rcurnulada es la primera mayor o igr.ral
tt,A:
a _).
100'
lü-l cs la fi'ecuencia acumulada hasta .L¡-1.
n¡ es la frecuencia absohrta del intervalo h.
A es la longitud del intervalo h.
Ejemplos
1. Calcular los percentiles de orden 20 y 33 de la estatura de diez personas que miden (en cm):
165 165 167 168 170 L72 r72 r73 178 180.
Pzo
Número de FYecuencia
Ingreso anual
personas (n¿) acumulada (¡/r)
2400 3000 3 ,)
3000 - 4200 20 23
4200 - 5400 35 58
5400 - 7250 25 83
7250 9000 15 9B
9000 - 12000 2 100
'k n,.
,I)A, . - 100 -
L¡-I
nk
D-
rSri 72t¡o +
tLUv |
uu - 83 trrn
15
: 7600.
--'l
Dos casos particulares, y muy utilizados, resultan cuando al conjunto de datos se Io clivide en cuatlo
o cinco partes iguales, que corresponden a los cuartiles y a los quintiles, respectivamente.
Definición (de cuartiles) Son valores que dividen a la distribución de los datos en 4 partes, cada
una de las cuales engloba eI25% de los mismos.
. El cuartil inferior (Qr), qre deja a su izquierda el 25% de los ctatos v se curnple eue Qr : P2ó.
. El cuartil medio (Qz), qre deja a sr.r izquierda el 50 % de Ios datos, coincide con la mediana y se
cttmple que Q2 : Pso.
. El cuartil superior (Q3), que deja a su izquierda el 75 % de los datos y se cumple eue Qe - Pzó.
AsÍ, para el cálculo de los cuartiles solo se deberá tener en cuenta que ellos son los percentiles de orden
25, 50 y 75, respectivamente (Figura 1.12).
500Á 500
mln Qt Qt Q¡ max
Definición (de quintiles) Los quintiles son valores que dividen a la distribución de Ios datos en
cinco grupos, cada uno de los cuales contiene el 20% de las observaciones.
. El primer quintil (qr), q.t" deja a su izquierda el 20% de los datos y se cumple que qr - P2o.
¡ El segundo quintil (qz), qrr" deja a su izquierda el 40% de los datos y se cumple eue 9z - P4o.
. El tercer quintil (qs), qn" deja a su izquierda el 60% de los datos y se cumple que qB - Poo.
r El cuarto quintil (g¿), qr" deja a su izquierda el 80% de los datos y se cumple que q4 - P80.
7.8. Medidas de localización 31
Ejernplos
1. (Continuación.) Dctcrrniuar los cuartilcs infcliol y su¡rcliol cle las estaturas de 46 señoras,
cuyas ntedid¿rs son:
1.65 1 46
Es decir, r: 0.5 y
P¡, * l-rt
Pzs : rsa : 1.57.
2 (Continuación.) Determinar Ios cuartiles inferior y superior de los ingresos anuales de los
empleados de una empresa.
Número de FYecuencia
Ingreso anual
personas (r¡) acumulada (Nr)
2400 - 3000 t) J
3000 4200 20 23
D'lu.
4200 - 5400 Jd
DT
58
P+0.
5400 - 7250 25 83
7250 - 9000 15 9B
'60. -
9000 12000 2 100
D-^
EU' Solu,ción: Tenemos que n : 100.
32 Capítulo 7. AnáIisis Exploratorio de Datos
109ri.25
. Cuartil inferior: Qt : Pz;, k::25 J, Y: : Z¡.
100 100
El irrtelr'¿rlo l¿ doncle se enc:uentra Q1 es @200;5a00) y Lt-t:4200.
Tambiérr, se tiene que N¡- t : 23,nt :
35 y A :54U0 - 4200 : 1200.
Entonces, lesrrlta que:
t'/t
- Ar,.-,
P¡, : Lt-tI loonk "'¿
t<_t?
Pzs : 4200 +'",;;'" 1200
Ji)
: 4268.6.
Estas medidas deben tener la propiedad de que si los datos están ampliamente extendidos, la medida
será alta; y cuando los datos se encuentren muy agrupados, será baja.
Existen varias medidas de dispersión, nosotros vamos a analizar la desviación estándar, el rango y el
rango intercuartil.
Definición (de desviación estándar o desviación típica) La desviación estándar, notada como
s, de nn corljunto de n mediciones 11, 12, ...¡ 2,, es la raíz cuadrada de la suma de los cuadrados
de Ias desviaciones de las mediciones, respecto al promedio z, di'l'idida entre n - 1; es clecir,
n-I D,@,
i:l
7.9. Medidas de dispersión 33
\ótese que la desviación estándal es siempre positiva y sus nnicladcs de medicla son las rnisnrrrs clrLt:
aquellas que corresponden a los datos originales.
- n \r)'
n-I
De la misma manera que para Ia media aritmética se consideran los siguientes casos:
' Si las observaciones están agrupadas en una tabla de frecuencias de datos individuales:
r2 n2
x) te ;o
la desviación estándar se calcula por
k
DnnrT
i:I
- n(T)2 k
o s: con n:, ni.
n-7 i:r
ión ' Si los datos se presentan en una tabla de frecuencias, agrupados por clases:
úas
Clase LIC LSC Punto medio Flec. absoluta
1 ly Sl I1 TL1
ida 2 l2 S2 I2 n2
: : : :
rel k l¡" Sk rk nk
s se calcula por
k
Ln¿rí - nlI)'
O /-\ñ
k
¡la o 8: i:l
con n: \-nr.
ión -itn¿(r¡-r)2
i:7 n-I /-¿;-l
ilar,
2. En su cálculo intervienen todos los valores de la distribución y por ello puede ser complicado.
3. Es única.
Ejemplos
1. (Continuación.) Calcular la clesviación estárrdar cle los srreldos cle diez l)crsonrrs que ganan
(en dólares):
r70 t72 168 165 173 178 180 165 167 t72.
Solu,ción: Previamente se habÍa calculado el promedio 7: L7I. Con ésto, resulta que:
*i@n-,¡'
(170 - t7L)2 + (I72 - I7r)2 +...+ (167 - tTL)2 + O72 - LTr)2
10-1
1.
Dn *?-n@)2 ffi
o:, , :.@:0.04627.
n-r
D-
n-l V ¿o-t
La estatura de las señoras analizadas tiene una desviación estándar de 4.6 cm.
3. (Continuación.) Calcular la desviación típica de los montos de ahorros de los socios de una
cooperativa de ahorro y crédito:
k
D ro"? - "(")2
,i.:1
n-7
:V/33002ffiéro-i :riYü¡'
Definición (de rango o recorrido) El rango de n mediciones es igual a la diferencia entre los
'.'alores mayor y menor de las mismas:
Rango : T..'áx
Ei rango se puede utilizar para hallar una aproximación de la desviación estándar mediante las si-
--rrientes relaciones :
R.anso
s = --É-) para n 176, para 16 q 7¿ ( 100,
1/n
R,anso
para100<n(400, para n > 400.
"=--,
1. En su cálculo solo intervienen los dos valores extremos de Ia distribución y por ello se ve muy
afectado por Ia presencia de valores atípicos.
Definición (de rango intercuartil) EI rango intercuartil, notado por RIQ, de un conjunto de
latos es igual a Ia diferencia entre ios cuartiles superior e inferior; es decir,
RIQ: Qs - Qt.
Las definiciones de los cuartiles superior e inferior y del rango intercuartil fueron dadas por F. Galton
en 1882.
36 Capítulo 7. AnáIisis Exploratorio de Datos
Ejemplo. (Continuación.) Calcular' la desviación estárrd¿rl de l¿r cst¿rtur¿r clc 46 señoras, cllvas
meclidas sc reslrmen en la siguierrtc t¿tbl¿r:
Estatura r.45 r.48 r.50 1.53 1.55 1.57 1.60 r.o.) 1.65
Fbecuencia 2 4 Ir 8 12 7 4 3 1
Rango 0.20
sFr : 0.05.
4 4
Como se ver el valor aploximado cs bastante cercano al exacto, calcuiado con la fórmula respectiva.
Esta rnedicl¿r se utiliz¿r l)¿lra conlp¿r'¿rr las rnccliciones de tun¿r misrna magnitrici rc¿liz¿rri¿r cn distintas
unidades o por distintos individuos.
Si u.rr conjurrto de cl¿rtos es honrog(rneo, CV < 1; si Cf/ > 1.5. los dzrtos poclrían ser hctclogóncos.
2. En sn cálculo interviencn toclas las obscrvaciones. pr-rclicnclo ser nluv iufluido pol valoles atípicos.
Ejernplo. (Continuaciórr.) C¿rlcrrl¿rr r:l c:oerficrierrtc clc r'¿rriaciórr clcrl srrclclo clc cliez pcrsorr¿rs clllc
-irr¿1rr (crL ckilzrrcs) :
170 rT2 168 165 r73 r78 180 165 167 r72.
: :,1 uc,i¡ir¿: Pleviarrx:rrtc s<t It¿rbía cirlculaclo clur: r: 177 1' ,s - 5.1. Con ésto, r'esulta que:
5'1 :0.02982.
CV:! T - 777
--omo
el valor de coeficiente es muy ba.jo, los datos son homogéneos.
-{asta ahora, heruos arralizado la localización y la dispersión cle una distribución, pero necesitamos
. r'locer más sobre el comportamiento de los datos. En esta sección, analizaremos las medidas de
-,)
- )inla'.
- as medidas de forma de ttna distlibución se clasifican en dos grllpos: medidas dc asinietr'ía y medidas
-- cttrtosis.
1.10.1. Asirnetrra
coet'íczente d,e a,s'intetría, dc nrra variable midc cl grado de asimetr'ía de la distribuciórr r,le sus datos
tolno ¿r sti meclia. Es aclirncnsional v se definc corno srg=Lre:
,s3
--,--.
crtl,o,s cle nn¿L variable cstárr coltstituidas por los r.alores alejaclos de la medía (r,a.1oles cxtrcmos).
--:,a l'¿rriable es ¿l,sinií:tric¿r si srr
col¿ ;r nn 1¿rclo cs rnás larga que sr1 col¿r al otro y sinrétric¿r si amb¿rs
-es solr igual cle largas.
si As > 0. la clistribui:ión ser¿i asiurótiic¿r a l¿r clcrccli¿r. La cola a la clerech¿r es más lirrga que 1a
cola a la izquierrl:r.
. si As < 0 la clistribrrciórt ser¿i ¿rsirnétlica a ltr izcluicrcla. La cola a lur izqnierd¿l es más lrrrgir que
la cola a I¿r clelech¿r.
rEn la definición cle las trreclicl¿rs rte ti¡rma no hal,'unidac.l cle criterios cntre los especi:rlista,s, por lo clrLc hay una amlrlia
r i cclacl
38 Capítulo 1. AnáIisis Exploratorio de Datos
ir", - *)n l,
i:t ,
Ap: e4 -J.
Leptocúrtica, si Ap ) 0; es decir, es más apuntada que Ia normal. Los valores que toma la
variable están muy concentrados en torno a su media y hay pocos valores extremos.
Platicúrtica, si Ap ( 0; es decir, es menos apuntada que la normal. Hay muchos valores extremos,
Ias colas de la variable son muy pesadas.
t70 172 168 165 r73 178 180 165 t67 172.
i@n-e)'
i:7 (170 - 171)3 + 072 -171)3 + .
+ (167 - i71)3 + O72 - t7D3
10
55.8.
i{,n-n)n
i:l - LTDA + $72 - I7I)4 +. . . + (167 - LTD4 + G72 -
(170 I7D4
n 10
1191.
7.77. Otras representaciones gráfrcas 39
- ntOnCeS,
In
\-.
T).
\ r; - ( T\'' lr¡,
1J"
'i-I 55.8
)11
As: t
so (5.1)3
0.42r.
ir", - ,)n l,
i:t 1191
Ap: s4
-J-
t
(5.1)n -.)
-t.239.
Ia
-,cs datos son levemente asimétricos, con asimetría hacia la derecha; también, son platicúrticos,
;,,rsible presencia de valores atípicos.
) Sobre una recta se ubican los valores del promedio, el mínimo y el máximo. Los segmentos que
unen el promedio con el mÍnimo y con el máximo se denominan brazos de Ia balanza.
3 Sobre la misma recta se ubican dos puntos -uno a la izquierda y otro a Ia derecha de la media-,
a una distancia igual a la desviación estándar.
x .x+.s
Figura 1.14:
40 Capítulo 7. AnáIisis Exploratorio de Datos
1 Si los cl¿tos solL sinrírtlic:os, r:l valor del plonreclio se sitú¿r r¡rr r:l <:c:rrtLo rlci grálico.
2 Si los d¿rtc¡s est¿ilr agrrrptrdos en torno ¿ri ccntlcl. los l¡r¿-Lzos rlr: l,r bal¿rnz¿ ser'¿ilr cortos; pr"u cl
contrzlricl, si ir"rs tlat,os estiirr dispclsos eu tor-rr<l ¿r.l coutlor lt-,s lrr'¿rzos clc l¿r bal¿rnza s<)r'¿'rir liilgos.
,) Si nno dc los rlos bl¿rzos clc 1¿r b¿rlarrz¿ es muchr¡ rl¿rs largo c¡rc r:l otlo, nos inclica (llre los (l¿1tos
sorl asirr)étricos y clue hay posible prcsencia cle r'¿rloles atípicos en l¿s obselv¿ciones.
Puede ser irtil combin¿rr' (solrre el mismo gr'áfico) con un cliagrzrma clc prrni;os pzrra visualiz¿rl Ia, Irillr(:lr'&
en que se distlibuycn ias observaciones.
5 5 5 5 1010202027 35
39 55 55 60 60 60 68 75 90 90
Entonces,
:L
-S 39.729.3:10.4.
-
T *s 39.7+29,3:69.0.
Figura 1 .15;
Scgirrt sc obscrvit crr i'i giálico, el prornedio no se encuentra crr cl centro del ralgo. entonces sc dr:drrc<:
quc los cltrtcs sotr asirtrétricros. Arlcrriás, lcs br'¿rzr¡s cie i¿r b¿l¿rnza rro ticrierr ig'ral longitnri, lo <1rri.r ri<rrtot¿r
la posrble plcserrcia cle vakrrcs atípicos elr cl ex1 r'errro clcrecho.
El rli,o,qt'ant,a" de c:o,.jo, fr-re irrtroduciclo r:n 1977, pol JoLrn \\I. Tuliey conLo lur¿l herranrierrtzr quc rrurcslr'tr,
er Lrn misuro gr:ific:o, l¿r foltna de los clatos, sn r'¿r,lol ccntlal y srr rrariabilicl¿rcI irl rcprr:sentar i¿r rne<li¿rrra.
los crr¿rtilc¡s) el r'¿1rlgo intercualtil y el rango c1e las observacicxrcs.
l. Soble lrn¿ líne¿l holizontal se loc¿rliz¿rn l¿ mcdiana. Ios cuartiles inferior y supr:rior ¡'los clatos
nrínilro I'm¿ixirno.
7.77. Otras representaciones gráfrcas 4L
,l
Se constrrtye rtna ca..ja angosta qlre une a Qt y Qz; a continu¿rción, se clivicle estar caja cn clos
mecliatrte una línea qne pase por Qz.
t
.J. Finalrnente, se ttazan las uallas, que son dos rectas, una desde cada extremo de la ca.ja, hacia el
valor rnínimo y hacia el valor máximo de los datos.
I trt I
min Qt Qz Qr max
;--n diagrama de caja es especialmente útil para examinar la simetrÍa de los datos, la presencia de
-"-:lores atípicos y para comparar dos conjuntos de muchos datos.
Ejemplos
Estatura r.45 1.48 1.50 1.53 1.55 L.57 1.60 1.63 1.65
Flecuencia 2 4 5 8 12 7 4 3 1
Solución: Antes se determinó que Qr : 1.53, Qz : L.55, Qs : t.57, rrnín: I.45 y z¡16* : 1.65.
. -lttc:cr
, lr rt¿i
I I
Como se observa, los datos son bastante simétricos, con una fuerte concentración en torno al
centro y -puesto que las vallas son largas- con la posible presencia de valores atípicos (el mínimo
y el máximo).
clirlos
Se recogieron los datos de los ingresos mensuales de 200 hombres y 250 mujeres, que realizan
42 Capítulo 7. Análisis Exploratorio de Datos
Comparar los ingresos de los dos grupos mediante sus diagramas de caja.
Solución: Se tiene la siguiente tabla que resume las medidas descriptivas reqtteridas:
mIn Qt Qz Qs max
Flombres i90 270 220 230 240
Mujeres 180 190 200 220 230
240
230
22O
o
ut
fl
s zro
tr
200
190
'180
Sexo
Figura 1.18:
L.1-2. Ejercicios
i. Una persona está rnanejando un carro en una autopista a 70 km/h y nota que el número de autos
a los que pasa es igual al número de autos que a ella le pasan. Los 70 km/h son el promedio, la
mediana o la moda de las velocidades de los autos en la carretera. ¿Por qué?
7.72. Ejercícios 43
2. Dadas r¿ : 8 nrccliciones: 4, 2, 6. 5, 7, 5, 4, 6.
Deterrnine: rr) f; lr) l¿r niecliarr¿r; c) ,s; cl) el lango; e) la asimetría; f) Ia cr-rrtosis.
3 Dadas n : I mediciones: 5, 8, 8, 4, 4, 9, 7, 5, 4.
1. En 1904, Cushny y Peebles publicaron en el artículo <The action of optimal isomers>> (Journal
of Physiologg), un estudio sobre el efecto de dos isómeros de Ia molécula hidrocinamida hidro
bromida en prodrtcir sueño. Se presentó la variación en el núrmero de horas de sueño por noche
al usar las dos versiones de Ia droga:
a) Realice un diagrama de puntos para cada uno de los dos tipos de drogas y comparárelos.
¿Cuál de los dos isómeros es más efectivo en producir aumento en las horas de sueño?
b) Realice un diagrama de tallo y hojas con los datos.
c) Calcule el promedio, la mediana y la desviación estándar de los datos de las dos drogas.
¿Cuál es más efectiva? Explique.
¿. Un inversor tiene ahorros repartidos en 3 depósitos con 2000, 5000 y 10000 dólares, respectiva-
mente. Si el primero le rinde un 5To anual, el segundo un 4To anual y el tercero un 2To anual.
¿Cuál es el tipo de interés que recibe?
tenla
En una empresa se registró la edad (en años completos) de sus empleados, resultando la siguiente
Como
tabla:
31 49 36 39 56 29 57 4t 40 51
Idela 45 61 40 39 47 27 36 37 16 37
)ertor, 51 18 29 42 38 62
34 31 28 25
36 40 46 37 49 25 2r 39 35 37
trenen 56 35 48 44 42 43 49 22 25 28
trados
teos.
a) Determine el número de clases que se debe utilizar en la distribución de frecuencias;
b) Construya la tabla de frecuencias y el histograma;
c) ¿Qué porcentaje de los empleados es menor que 50?;
: autos
d) ¿Qué porcentaje de los empleados es mayor que 35.5?
dio, la
7. En una bodega de venta de licores se registró las principales. características de 25 marcas de
44 Capítulo 7. AnáIisis Exploratorio de Datos
rn'hiskys:
No. de Precio Proporción Tiempo de Nota de
Categoría
whisky de venta de malta añejarniento calidad
.,
I 70 20 1 5 J
2 60 20 1 5 2
, 65 20 1 7.5 2
4 74 25 I I2 2
5 70 25 I t2 3
6 ,J 30 1 5 0
7 70 30 1 8 0
8 55 30 I 5 2
9 93 J,l 2 6.5 I
tt
Jd 2 8 3
10 62
tt
JJ 2 8.5 3
11 87
T2 78 35 2 8.5 2
13 83 40 2 8 4
t4 90 40 2 5.5 2
15 110 40 2 T2 1
16 113 40 2 8.5 1
t7 96 40 , T2 dt
18 82 45 2 12
,
d
19 r27 45 2 8.5 4
20 160 100 3 L2 3
2I 90 100 3 12 4
22 86 100 3 12 2
23 100 100 3 10 3
q
24 100 i00 3 11 d
25 95 100 3 T2 0
il. Sc rcirlizti rttta irrr'<rstigaciírn sobtc cl prccic'r rlc zapzrlos <lcportivos. clcr sirnilarets <:¿rr¿rctetrístic¿rs
crr rlivrtlsos ¿tllutr:ctttts clc l¿r trirrrl¿rcl, ob1<:nií:rrr[os<t los sigrricnt<:s cL¿ttos (cl<ilarcs):
50 4:l 39 43 40 38
,)-
r),J oi
,¡l
.)-
r) I
.)o
r)i
49 43 39 44 40 38 33 26 36 30
49 43 39 44 4U 38 33 27 36 30
+t 41 39 45 40 37
.).)
,),)
,)a
,l ') E
,)r)
J)^
.)t,
46 47 38 46 40 37 32 28 35 28
Esratura (en cm) | 155 160 165 170 \75 180 185
No. de eslrrdiantes I 10 14 26 28128
Halle:
o;
lpo
ror- Encuentre:
-=. La siguiente tabla muestra la temperatura nocturna (en "C) clr.rrantc 200 días:
Los siguientes datos se obtuvieron de una encuesta sobre las condiciones de vida, en el área nrral
dc los cantones dc Zapotillo y N{zrcará y corresponden al núrrnero de hornbres y de rnujeres que
Capítulo 7. AnáIisis Exploratorio de Datos
b) Realice la tabla de frecuencias y el histograma de los datos, según el sexo de los encuestados;
e) Determine el número total de miembros en cada familia. Con estos nuevos datos trace eI
diagrama de puntos, el diagrama de tallo y hojas, la tabla de frecuencias, el histograma y
el diagrama de caja. Interprete lo obtenido.
16. Las siguientes temperaturas fueron tomadas al medio día en Quito (en 'C) durante una semana:
17. En una investigación sobre la razón por Ia que frecuentemente habÍan colas muy largas en las
cajas de un banco, se obtuvo información del tiempo (en minutos) requerido para atender a los
clientes. Se tomaron 50 mediciones en una caja, las cuales se dan a continuación:
6.0 5.9 4.0 3.1 1.9 5.3 2.7 5.2 2.9 5.2
4.8 4.8 5.1 6.0 4.2 4.4 5.3 7.4 4.4 4.1
5.2 2.8 4.7 1.8 5.1 5.8 2.9 5.7 3.8 5.8
3.6 4.4 2.0 2.8 4.8 3.1 1.5 5.9 3.6 4.6
3.7 4.5 3.9 2.3 5.5 5.3 5.8 2.4 5.5 3.7
18. La siguientc tabla muestra los tiempos de duración (en minutos) de las versiones en DVD de 22
películas dirigidas por Alfred Hitchcock:
ios;
a) Construya un diagrama de tallo y hojas de los datos;
b) Calcule la mediana de los tiempos;
c) Calcule los cuartiles inferior y superior. Use esta información para detectar algún valor
:e el y
atípico para trazar el diagrama de caja;
ray
d) Determine el promedio y la desviación estándar;
e) Represente los datos mediante un diagrama de balanza. ¿Cuáles datos influyen más en los
valores calculados?
f) Calcule los coeficientes de asimetría y de apuntamiento.
19. Las notas de un examen de 6 alumnos son: 6, 5, 9, 19, 3 y 18. Un alumno aprueba si su nota es
mayor o igual que el promedio y que Ia mediana de las notas. ¿Qué porcentaje de los alumnos
aprobaron el examen?
+-
J-
ados 10. Un automóvil ha recorrido los 832 km que separan Loja de Esmeraldas, permutando regularmente
las 5 llantas (incluida la de emergencia) para que todas tengan igual desgaste. ¿Cuál es el
recorrido promedio de cada llanta?
11. El kilometraje que marca un auto, luego de 4 años de uso, es 100 mil kilómetros. Si el dueño
r las lo compró nuevo y lo hace descansar 1 dÍa, luego de usarlo 4 días seguidos, ¿cuál es el recorrido
a los promedio diario de los días manejados, considerando años de 365 días?
')2. De 400 alumnos de un colegio, cuya estatura promedio es 165 cm, 150 son mujeres y su estatura
promedio es 160 cm. ¿Cuál es la estatura promedio de los varones?
13 Se tiene cuatro números. AI añadir el promedio de tres de ellos al número restante, se obtienen
los números 17, 2I, 23 y 29. Si se excluye al mayor de estos números) ¿cuál es el promedio de
los tres restantes?
e b). Temp. ("C) 20.5 20.0 19.5 19.0 18.5 18.0 t7.5
No. días 2 4 3 13 3 4 2
48 Capítulo 7. Ar¡álisis Exploratorio de Datos
Iutclr¡¿rlo I'r'ccucucia
10 - 2i) 3
.)
20 -30 'J
30 - 4i) 12
40 50 B
50 60 5
1 gelente: 10 000
1 secretaria: 650
3 empleados: 500 (cada uno)
2 ayudantes: 400 (cada uno)
1 conserjc: 300
28 En una reunión hay 50 varones con una edad media de 20.5 años y 25 mu.jeres, las que en
promedio ,or, ] miís jóvenes qne los \¡arones. Halle el núrmero entero más próximo a la edacl
'10
media de las personas de dicha leunión.
29. Un ftrmador dice que su vicio empezó con un cigarrillo en la primera sernana, 2 en la segunda,
4 en la tercera, 8 en la cuarta, y así sucesivamente; hasta fumar casi 2 ca.jetillas diarias de 20
cigarrillos cada una, en promedio.
30. Si cada uno de los 28 millones de habitantes de cierto país come) el promedio, 12 kg de pescadcr
al año, entre conservas enlatadas y pescado fresco, siendo este rubro 4 veces el de conserva.
¿Cuántas toneladas de pescado fresco se consumen? en promedio, por año?
31. En una muestra de 20 empresas florÍcolas se obtuvieron los siguientes datos sobre el núrnero de
empleados y sus ingresos anuales, en miles de dólares:
Calcule:
32. De los datos de rrna tabla de distribución de frecuencias, con 5 intervalos de clase ;r ancho de
clase cornítn, se observó que: Qz:24, x:¡ : l$, 13 :24, nB : 2'n,r, n5 : )71r. ¿.Qué porcerrtaje
del total sor nrenores de 30?
7.72. Ejercicios 49
34. La siguiente tabla muestra la distribución de sueldos de 210 trabajadores de una empresa.
Sueldo Trabajadores
600 700 100
700 800 20
800 - 900 60
900 1000 20
1000 1100 10
35. En una muestra de 1000 trabaiadores, se registró sus sueldos en una tabla de frecuencias:
Sueldo Trabajadores
ue en 0 400 150
, edad
400 - 800 300
800 - 1200 200
1200 - 1600 250
¡rnda,
1600 2000 100
de 20
a) Calcule la moda de los datos;
b) ¿Qué porcentaje de los trabajadores tiene sueldos comprendidos entre el promedio y la
mediana?
irimo 36 En la siguiente ojiva se muestran los sueldos de Ios traba.jadores de un organismo estatal.
scado
lser\¡4.
rero de
Figura 1.19:
Calcrrle el pronrr:clio, la rnecliarr¿r v la clesvi¿rciól estánclar cle la cclacl de los niuos ¿rtcndirlos.
38 Err la sigr.rierite tabla se rnuestr'¿r i¿r clistlilncióu ck: frecnencias clc l¿rs vcntas rc¿rlizad¿ls pol' lc¡s
Si Ios intervalos tienen igual longitud, halle el promedio, la mediana y la desviación estándar de
Ias ventas.
7
0.06
El Concepto de Probab¡l¡dad
-enrbién existen fenómenos cuyo resultado no puede ser anticipado con cetteza, sino que existe una
:tbabi,Iidad de que un cierto resultado se dé; por ejemplo, la ganancia que obtendrá un inversionista
-=-pués de dos años, el tiempo que sobrevivirá un cónyuge a la muerte de su pareja o el número de
;-ros eu€ pasan por una esquina durante una hora determinada. Es evidente que nadie puede dar
-, resultado certero con anticipación a los tres euentos considerados, entonces si se da una respuesta,
-:'iste una incertidumbre en el resultado.
?ara dar una explicación matemática a aquellos resultados que aparecen en experiencias en que está
-r'olucrado el azar, se desarrolló la teoría de probabilidades.
51
52 Capítulo 2. El Concepto de Probabilidad
El desarrolio clel an¿ilisis rnatenrático los juegos dc azal se produjo dur¿rnte los siglos XVI y XVII.
c,le
Algunos autores consideran como origen del cálculo de probabilidades la lesolución del prolrlema de los
puntos en la correspondencia entre Pascal y Fermat en 1654. El problema planteado a estos autores
por Chevalier de Meré, fue cónro debería repartirse el dinero cle las apuestas, depositado en la mesa,
si los jugadores se ven obligados a finalizar la partida sin que existiera un ganador. Aunque ningur<-r
de estos dos matemáticos publicó al respecto, sí lo hizo Huygens en su tratado Ratioci,n'iis 'in In,do alae
(Razonamientos relativos al juego de dados). Su escrito tiene Ia trascendencia de ser el primer liblo
de probabilidades de la historia.
Pierre Simón Laplace (I749 - 7827), introdujo la primera definición explícita de probabilidad y desar-
rolló la ley normal como modelo para describir la variabilidad de los errores de medida. En esta época
también hubo importantes contribucfones de matemáticos como Legendre (1752 - 1833) y Gauss (1777
- 1855) para tratar de realizar predicciones del comportamiento de ciertos fenómenos.
Durante el siglo XIX, los matemáticos y astrónomos continuaron ampliando la teorÍa, de manera que
a mediados de este siglo ya existían Ias herramientas que permitieron su consolidación como una rama,
científica. A pesar de ello, la aplicación de estos principios se restringÍa a Ia Física y la Astronomía.
Una descripción axiomática de la idea de probabilidad fue dada en 1933, por A. N. Kolmogorov. Ello
constituyó la base de la moderna teoría, tal como hoy la conocemos. Con ésto, se consiguió elaborar
modelos complejos y aplicar las probabilidades a muchas ciencias y campos de Ia vida.
En las últimas décadas, el empleo de la teoría de probabilidades en las modernas ciencias naturales,
en las ciencias sociales y en ramas de aplicación, como la ingeniería, el cálculo actuarial o la economía
ha crecido enormemente y su conocimiento es una necesidad imprescindible.
Antes de iniciar el estudio de la probabilidad, revisemos los principales conceptos del análisis combi- E
natorio.
_I--
: .
Definición (de variación) Se clenornin¿r variaci(rrr a c¿r.cla nrro cle los irrrcgJ,os orclcrr¿rrlos clc /'
lenreutos, tornaclos cle otlo cle n r:lernentos (k ( n). cle rnanel'¿l cluc estos arrcrglos rlificrcrL cn algúur
.-enientr.i o en el orden de colocación.
r- rrúrrnero cle r'¿rri¿rciones de A; elementos qne pueden obtenelsc a partir: de rin coujlurto rl<r it, clcrrtcutos,
--.lotado por Vf,, es igual a
Wn:-
,nl
'n (n-A:)!
nl.
kt(n - k)t'
-:'lución: Se tiene n : 3 y lr : 2.
V! : .--
3! : 6 :
a) Se pueden formar
(3-2)! ;1 6 variaciones, qlle soII:
Definición (de permutación) Una permutación de n elementos es cada una de las variaciones
r: los n elementos distintos.
Pn: n!'
Ejemplo. Encontrar Ias permutaciones que se pueden forurar a paltir del conjunto {a,b,c}.
I 'iuc'ión: Son P3 : 3! : 6 permutaciones; éstas son:
A: {at,a2,.".,a,r} y B : {h,bz,...,brr}.
54 Capítulo 2. El Concepto de Probabilidad
Parejas. Con los n¿ elementos <.lc A y los tr elerucntos cle B cs posible forrn¿rl nt,xTt ptrlejirs (rt,¡,lt¡,)
<¡rr: contcngan lln cleniento rle c:¿rd¿r con.jrrnto.
Ejemplo. En uu¿r f¿ibrica cle calz¿rc,lo se confcccir¡n¿rn 4 Lnodcl<¡s de zapatos lttlla. clirmas, en 6 tztrrrarius
cliferentes. Por lo tanto, se pr-reden fabricar 4 x 6 : 24 distintos tipos de zapatos.
Otra forma de ver este concepto es considerar un procedimiento A que se puede realizar de m maneras;
un procedimiento B de n maneras; y así sucesivamente, hasta un procedimiento G de s rnaneras.
La acción consistente en realizar el procedimicnto A, seguido del procedimiento B, hasta llegar al
procedimiento G; se puede efectuar de m x n x - -' x s maneras diferentes.
Ejemplo. Suponga que se clasifica a un grupo de estudiantes universitarios según su sexo, estado
civil y la carrera que estudian. El sexo puede ser masculino o femenino; el estado civil puede ser
soltero, casado o divorciado; y, digamos que hay 7 carreras. Entonces, hay un total de 2 x3 x7 : 42
clasifi.caciones diferentes.
Anteriormente, se examinó las permutaciones de elementos de un conjunto, pero sin repetición; si ahora
queremos determinar las permutaciones con repetición, bastará considerar en los arreglos múltiples el
mismo conjunto.
Definición (de perrnutación con repetición) llna permutación con repetición, de k elementos
obtenidos a paltir de un conjunto de n elementos, es un arreglo de k elementos ordenados en el que
los elementos pueden repetirse arbitrariamente.
P,\, : nk
Ejemplo. Con los elementos del conjunto A: {a,b,c}, ¿cuántas permutaciones con repetición, de
dos elementos, se pueden formar?
Soluc'ión: Se van a formar parejas considerando dos veces el conjunto A, por Io tanto se tiene n:
y k :2; entonces, hay un total de 32 : 9 permutaciones con repetición; ellas son:
(a, a), (a,b), (a,c), (b,o), (b,b), (b, c), (c,a), (c,b), (c,c).
Examinemos un ejemplo: el lanzamiento de un dado una sola vez. Como resultado de la prueba se
pueden producir diferentes resultados: <<sale dos>>, <<sale cinco)>, <<€l número que aparece es par>>, etc.
Esto nos conduce a definir \os euentos.
Definición (de evento) Se llama evento, notado como (r, a cualquiera de los resultados posibles
de un experimento u otra situación que involucre incertidumbre.
Los eventos se clasifican en: elementales, aquellos que constan de un solo resultado: r compuestos,
que consisten de más de un resultado. Por ejemplo, <<sale dos>> es un evento elemental: mientras
2.4. Defrnición axiotnática de la probabilidad bl)
llre <<cl nrimcro qrre aparece es pal>> es un evento conpuesto, l)orque cstá conformado de Los cventos
-lementales <(sale dos>>, <s¿rle c;uatro>> y <<sale seis>.
,Jbselvernos que todo cvento relacionado con una pn,reba se pr"rede desclibir en términos de evertos
.lenrenta,les.
Definición (de espacio muestral) La colección de todos los eventos elementales, notirdo por Q,
-e denomina espacio muestral:
Señalemos que el concepto de espacio muestral fue introducido por Gaiileo para resolver el problema
-e por qué en el lanzamiento de tres dados "10" y "11" aparecen más frecuentemente qr-re "9" y "72" .
?ara resolverlo listó todos los casos posibles.
-,
olviendo al ejemplo, si consideramos el número de puntos que aparecen al arrojar un dado, tenemos:
::an A y B dos eventos de O, en el siguiente cuadro se presentan 1as equivalencias entre las proposi-
--rnes de las teorías de probabilidades y de conjuntos y en la Figura 2.1 se encuentran los diagramas
-r Venn correspondientes.
:
2.4. Definición axiomática de la probabilidad
Lna probabilidad provee una descripción cuantitativa de la posibilidad de ocurrencia de un evento
;,articular y se puede pensar que es su frecuencia relativa, en una serie larga de repeticiones de una
-rrueba, en la que uno de los resultados es el evento de interés.
s
ii
Figura 2.1: Interpretación de los conjuntos como eventos: a) Ocurre eI evento A. b) Ocurre A u ocurre
B (A U B). c) Ocurre A y ocurre B (An B). d) Si A ocurre, también B (A e B). e) Eventos
incompatibles (A ) B :0). f) No ocurre A (ocurre A").
. A2. Pr(Q) : r.
. A3. Si A y B son incompatibles: Pr(A U B) : Pr(,a) + Pr(B).
Ejemplos
1. Dados los eventos A, B y C del espacio muestral f). Expresar mediante las operaciones entre
conjuntos los eventos:
Solución:
2. Demostrar que:
a) Pr(Á") - 1- Pr(A).
2.5. Cálculo de probabilidades :)t
Soht,ción,:
k
Pr(A) : DPr({a.'¿}). (2.2)
i:t
Un caso particularmente importante se presenta cuando todas las probabilidades Pr(c.r) son iguales.
Casos favorables de A
Pr(A) :
Casos posibles
Card(A) k
Carcl(A) ¡/
En el ejemplo clel lanzamicrtto cle rrn dado cortsicleremos el evcnto A <<salc rtn nrimero ¡rar>>:
Pr(A) :ffi
Card(A)
:-:-31
62
En los siguientes ejemplos, consideraremos espacios mnestrales finitos y aplicaremos los conceptos de
análisis combinatorio al cálculo de probabilidades.
Ejemplos
1. En un estante hay 2 libros de historia y 3 de biología. ,Ll azar, se toma un libro y luego se toma
un segundo libro. Encontrar la probabilidad de que un libro de biología sea seleccionado: a) la
primera vez; b) ambas veces.
Soluci,ón:
Pr(A)
'-' :9'1!9 :I
Card(f^)) 5'
b) Que ambas veces se seleccione un libro de biología significa:
. que la primera elección es un libro de biologÍa, entonces se tiene 3 casos favorables; y
. que la segunda elección también sea un libro de biología, entonces hay 2 casos favorables.
Así, el número de casos favorables es igual a 3 x 2 : 6.
El número de casos posibles, de todas las parejas sin repetición, es 5 x 4 :20.
Entonces, la probabilidad buscada es
63
u- 20 10'
El número de casos favorables en el cual 2 de los 3 alumnos del colegio A ganan los premios es:
V3 : o. Luego,
Pr(B) :*:0.,
3. Entre 100 fotografías de un sobre se encuentra la foto buscada. Del sobre se extraen aI azar 70
fotos. Hallar la probabilidad de que entre ellas resulte la foto necesaria.
Solución: Ei espacio muestral Q está formado por los conjuntos de 10 elementos que pueden
formarse a partir de 100: Card(A) : Cl8o.
2.5. CáIculo de probabilidades 59
El núrmero de resultados favorables que nos interesa es igual al total de formas como pueden
escogerse 9 fotos de las 99 restantes; es d'ecir, Card(A) : CBg'
La probabilidad buscada es
CP^
:eÉ';:10. 1
Pr(A)
4, En el Consejo Universitario cada una de las 10 facultades está representada por el decano y
el subdecano. Se nombra una comisión de 10 miembros elegidos aI azar. Determinar Ia pro-
babilidad de que:
de
a) una determinada facultad esté representada;
b) todas Ias facultades estén representadas.
Solución:
)ma
a) Considerando el evento complementario A': facultad dada no está representada>>, y
<<una
i) la
calculemos su probabilidad. Hay 20 representantes, 18 de ellos no son de la facultad
en
Pr(B) : 0.00554.
#ry
Se arrojan dos dados. Hallar la probabilidad del evento ¡: {al menos en uno de los dos dados
salen más de dos puntos).
Solución: EI espacio muestral puede describirse como
reCen
rd de
cl: {(i, j)li, j: L,2,...,6},
j
donde el evento elemental (i,j) corresponde a los ¿ puntos aparecidos en un dado y los puntos
rarti-
aparecidos en el otro. Consecuentemente, Card(Q) : 36.
Designemos como 81 el evento consistente en que en el primer dado salen más de dos puntos y
con B2 el evento análogo para el segundo dado:
u10 por lo tanto, card(B1) : card(Bz) :21. Puesto qrue B1l\82: {(i, i)l i,i :3,4,5,6}, entonces
Card(B1 ¡ B) :42 :16. Ahora bien,
: :'! : ?, y ¡Bz):#:Í
Leden
Pr(81) Pr(Bz) Pr(81
36
60 Capítulo 2. El Concepto de Probabilidad
ie,1i,,,)) :1,
i:l
Pr(A) : t Pr({a.'¿}).
u¡,€A
Ejemplo. Juan y Andrés juegan tenis con la misma habilidad. Deciden jugar una secuencia de sets
hasta que uno de ellos gane 2 sets seguidos. Halle la probabilidad de que se necesite jugar número
par de sets para terminar el juego.
Solución: Sean los eventos: J: <<gana el set Juan>> y A: <<gana el set Andrés>>.
Segúrn el enunciado, el espacio muestral está conformado por los siguientes eventos elementales:
El evento B: jugará hasta que uno de ellos gane 2 sets consecutivos>> es la unión de los eventos
<<se
que están señalados con una estrella (*) en el espacio muestral.
Se tiene que
Pr(AA) :
1
Pr(JJ) +
i'
Pr(JAJJ)+ Pr(AJAA) : 1
=.
8
-
2.5. Cálculo de probabilidades 61
O -.
En general, si A es un evento cle un espacio mnestral continuo O, tal que su rnedicla (longitud, ',rotrr*"r.,
,iempo, etc.) existe; entonccs, su probabilidad cs
\{edida cle ,4
Pr(A):
\tledida de O'
Ejemplos
Figura 2.3:
T
:s:loo;"-t:o'75'
75r cttt2
Pr(A)
62 Capítulo 2. El Concepto de Proba'bilidad
2. Sr:¡L l) :
{(:r;. !l) I () <:t; I 1; il í :l I ii (i,';grui.2"4) ci i:sirir.<:io irirrstliil ,i,:r rrrr fcririrrrcro akrirtoli¡r
v sitP<ttticrttlo c.irrr: io<lrl prulto <l<r (l'¡itrrr,'l;r ¡risrir¿r ¡rlolrrrlrilirltlrl ilc sLl 1r".r¡LtLo clL r;rrerL1a.
Jr
il 4 x
,,4n8 E
117
Figura 2.4:
a) Árca O: 1 x 1 : 1.
cle
2.8" ;i!e::cir:ios
Análisis cornbinatorio
l" Culcuie lcis siguierri,cs (iocúcitintcs bilorrri¿lcs Cf,: n) Ci; b) C1]; r) Ci:
2. C.lc.le Vf eri l<,rs sigrricrrtcs c¿r:jos: ,r) Vl; lr) V!; ,r) V3; cl) \¡.].
6. Cnántas palejas con rclposicrón pueden formar-se con conjuntos crtya c¿rlclina.lidad es:
l. Ftxure todas las combinaciones y valiacioncs qlre se pnerlen obtener a parl,ir de los cortjuntos:
8. Para los conjuntos indicaclos forme todas las pa,r'ejas sin reposición y parejas con reposición:
A: {a,e,i,o,u}; b) B: {I,2,3,4,5,6).
^)
r;¡r cortrruc uv.r-iu!ar--- -, .--:. eiirr-'131. ql.- -.-:ii¡r::-,i', , $:rL)iici y [1 silllg:r'ente; debe elegi' un
presidente y r-rn vicepresiderr c. ¿De cuántas maneras se pueclerr elcgrr esr,e par dc fiutcrorr¡ilios
si el presidente debe ser nn ;:iente?
Ul hospital cuenta con 21 ci r.ijanos (ion ri)s, ,,'-¡.ies hay que folrnar ter-uas para re¿lizar guardias.
¿.Cuánttrs ternas sc pueclen f:rrnar?
Un amigo le quiere regalar a ¡tro 3 cliscos y los quiele clegir cntre los 10 que más Ie gustan. ¿.Dc
cuántas marreras pucde hace¡'lo?
Eu cl ejcrcrcio ¿rntelior considéresc qrre los 3 enrpleirclos \¡an a ir ¿l l¿ misrna planta. ¿.D<: curintas
rnaneras se puede hacer la seleccicin?
_)
¿.Cuárrtos nrirneros de 6 cifras pucderr haccrse con los dígitos {I,2,3.4, 5, 6}:
rr) sin rcstlicción algrrua'/; b) sin rcpctil ling;'.url cifra?; c) maStolcs c¡rc 500000?
Sicte pcrson¿rs h¿1n soiicitado empleo para lleuar dos r.acantcs. ¿De cuárrtos modos se puerclen
llcrrar l¿ts vat:¿rrrtcs si:
18. i',Cttárrtos partidos sc .jucgatt cII ull cirruptxrrrato. crrr cl qrre prrlticipan 20 cqrripos y en el quc
.iuegan toclos contla to<[os. rul{) crr c¿rsa V otlo <lc visil ¿rlrte?
19. Etr tttr lestattrarttr: cie cotnicla rtipicla se inclir:a al clicrrtc (lrrc sri harnbrrlgr-resa. a rnás del pan 1,
la catne, puede ir cou todo lo siguiente r¡ sin ello: sals¡r clc tornatc, nrostaza, rnayollesa) lechuga,
cebolla, tomate o queso. ¿.Crt:intos tipos difercnt<,rs <1r: hirrnburguesas son posibles?
20. La producción de una rnáqnina cronsta de 4 f¿rses. Ilirl' 6 líneas cle montajc pala la primera fase,
3 para la segunda, 5 para l:t telcrerir, y 5 para la irltirrr¿r. Detelmine de cnántas forrnas distintas
se puede montar Ia máquina en este proceso de producciórr.
21. Eu un plano hay 15 puntos de los cuales rro hay tles que sean colineales. ¿Cr-riintas rectas
determinan?
26. En cualquier set de un partido de tenis, el oponente X puede vencer al oponente Y de siete
maneras. (Con el marcador 6 - 6, se juega uu desernpate: tie breaker) El primer tenista que
gane tres sets obtiene la victoria. ¿De cuántas maneras se pueden registrar los resultados si:
27. ¿De cuántos modos se pucden poner 5 anillos diferentes en los dedos de una narlo. omitiendo el
pulgar?
Definición de probabilidad
28 Sean Q un espacio muestral y A, B y C eventos cualesquiela) exprese las siguientes afirmaciones
conro uniones e intersecciones de A, B y C y de sus conrplementos.
aj 30. Se arrojan dos dados, sean A el evento <<la suma de las caras es impar>>, y B el evento <<sale por
Io menos un tres>>. Describa los eventos A a B, Atl B, A l\ 8". Encuentre sus probabilidades
si se supone que los 36 eventos elementales tienel igual probabilidad.
i€,
AS 31. Se consideran dos eventos A y B, tales que Pr(A) : 1 r PrlB) : 1. Determine el valor de
3" 2
Pr(A'O B) en los siguientes casos:
:32. Se consideran dos eventos Ay B, con Pr(A) : 0.375, Pr(B) : 0.5 y er(AnB) :0.125. Calcule:
'),). Sean A y B dos eventos tales que Pr(A) :0.9 y Pr(B) :0.8. Demuestre quePr(AnB) > 0.7.
34. Un experimento aleatorio consiste en arrojar una moneda y un dado a la vez y observar el
resultado. Escriba el espacio muestral del experimento.
rdo
tos ,JD Una empresa tiene dos tiendas distribuidoras, una en el norte y otra en el sur de la ciudad. De
utl Ios potenciales clientes, se sabe que el 30% solo compra en la tienda norte, el 50% solo compra
en la tienda sur, el 10 % compra indistintamente en las dos tiendas y el 10 % de los consumidores
no compra en ninguna de las dos. Sean los eventos A: <<el cliente compra en la tienda norte>> y
de B: <<el cliente compra en la tienda sur>>. Calcule las probabilidades (e interprételas):
las
tes a) Pr(A); d) Pr(A n B); g) Pr[(A n B)"];
b) Pr(,A u B); e) Pr(A \ B);
ete c) Pr(B"); f) Pr(Á" ñ B"); h) Pr(A u B').
lue
: 36. En la intersección de una autopista, los automóviles pueden girar a Ia derecha (D) o a la izquierda
(1) Desde un puesto de observación se registra el sentido de la maniobra de los tres primeros
vehículos.
Cálculo de probabilidades
.)/. Un gerente de compras desea hacer pedidos a proveedores diferentes, a los que nombra corno A,
B y C. Todos los proveedores son iguales en lo que respecta a la calidad por lo que escribe cada
letra en un papel, rnezcla los papeles y selecciona a ciegas a uno de ellos. Se hará el pedido al
vendedor que salga seleccionado. Calcule las probabilidades de los eventos:
66 Capítulo 2. El Concepto de Probabilidad
Sttpong:t quo cll ttn soLt(:o itr lrrolrirlrilicl¿tcl rlc galiar prirner prcrrric-r.,,
f v
38 c1 1a,1" girnzrr cl
3^Si 1a
:. 3
r.cgLttLc[,r ¡rt.'tnio,'s
¡i irrolrabilirl¿rr1 r[c B¿ur¿:r1 ¿rl nretrros rrrro clc los rlr¡s ltlcrnios es ;-l . ;.r:irlcrrlc
la probabilicl¿rcl clc garr¿rl solo rrrro dc los rlos plenrios'/
39 Sc enr'í¿rtt 3 oficios a 3 personas diferrentcs. Sin ernb¡rr'Élo, una secret¿ria distr'¿rícla levrir:lvc los
oficins v sc pttccle consitlelal clttc los lnalr(ló ¿rl ¿z¿1r. Si tur¿r coirrcidencria <rs el hcchri rle rlrrc rrna
persona recil-,a el oficio correcto. cak:ule la probabilidad de que haya:
a) ninguna coincidcricia;
b) exactarrrente rrna coincidencia.
40 La fábrica errsarnbladora ha dcterminado que Ia demanda clel arrto Honda Civic es igual para
cada uno de los colores azul, blanco, verde y rojo. Se haceu tres pedidos sucesivos de autos de
ese rnodelo. Deterrnine la probrrbilidad rle que:
4I Lr-icgo dc las 1>ntel)¿ls tr)¿I a ocupar un puesto a los 6 aspir;r.rrtes se lcs clasifica de a<rrrerclo al 1>untaje
obtenido. Los rcsrtlt¿r<los uo le llegtrn al empleador pol lo quc él contlat¿r a clos aspirantes al
azar'. ¿,Cuál cs ia ltrobabili<lad tle quc haya contratado a los dos aspirantes me,jor c¿rlificados?
r)
,1
Un pacltrete cle 6 focos tienc 2 rrnidacles clefectuosas. Si se cscogen 3 focos para su uso, calcrrle
la probabilidad cle qr-re ninguno tenga clef'cctos.
43 En ttna caja hay 20 fotografías en la cual htry 6 mal tomadas. ¿,Cuál es la probabilid¿rd de
selecciorrar 2 fotografías clefectuosas'/
44. Entre 100 artículos de ttn lote hay 5 <iefectuosos. Halle Ia probabilidad de que entre 10 altículos
escogidos aI azar, no sc tenga más cle un artículo defectnoso.
45 Un distribuiclor de electrodomésticos recibe un euvío de 20 pianchas, cie las cu¿rles hay 3 defcc-
tuosas. Para conocer si el lote está buerro pmeba 6 aparatos. trl distribuidor aceptar¿i el lote
si cltcttetitra a lo rnás ltn aparato dcfec:tnoso cntrc los prolrados. ¿Cuál cs l¿t pl'ollabili<lad cle
rechazar el envío'/
46. De un áttft-rrir, quc contietre 100 boletos. se extr¿err tres bolctos ganadores. ;.Crrá1 cs la lrrob:r-
biliclad de que gane una persona que conrlrró:
47. Entt'e 1as 80 t:stacioncs de sen,ir:io qrrc hay ell nnA cindarl, 10 errtrcgan un¿r ca:i-i'la,l merrol clue
la que el cliente compr¿r. tlu inspect,or clc la Dirccción de Hiclrocarbrrros r-i..it:r aie¿rtori¿rmente
cinco de ellas para velificar si la cantidad'n'enrlid¿r cs correct¿t. ¿,CLrál es la p:'',rt,airrliclad rle que
descubra al nenos una fiaudulenta?
48. En el juego del <<cuarenta>> se reparten 5 cartas, al azar, a cada jugador. a palil' ,Le rrn mazo de
40 cartas. ¿,Cuál es la probabilidad de que un jugador tenga:
2.7. Independencia y condicionalidad 67
¿r) urr as) rur dos, un trr:s, un cuatLo y un c:irrro, clel rnisnio pnlo'/;
l,) 4 c¿u'tas <lel rnismo pirlo'/;
t:) rrua <<rorrcla>>; cs rlecir', 3 calt¿.rs rle ia rnisrna clelornil¿lci<in (as, clos, etc.)?
i9 En nrr closet hay 6 pales cle z¿rpatos. Se escogcn 4 zapatos al azar. Encuentre la probabilidad
rle de qnc haya pol io rnenos lrn par de zapatos errtre los 4 zapatos escogidos.
50 Err los países europeos existe una forma muy popular de lotería, llamada Lotto, que consiste en
OS seleccionar'6 números de una cartilla que contiene 44 núrmeros (del I aI 44). El día del sorteo
na se seleccionan 6 bolas al azar y sin reposición. Una persona gana el premio principal si los
6 números sorteados coinciden con los seleccionados; también se puede ganar prernios si 4 o 5
núrmeros sorteados coinciden. Determine la probabilidad de:
rra 51. Una persona presiona, aI azar, 8 cifras en una calculadora. ¿Cuál es la probabilidad de los
de eventos siguientes:
Dentro del rectángulo limitado por las rectas , : -L,, :;, A : -7, A : l, se tiene el
bc- gráfico de la función trigonométrica seno. Sobre el rectángulo cae una gota de tinta. ¿Cuál es
ote la probabilidad de que Ia gota de tinta haya caído dentro del área comprendida entre el eje r y
de la curva A: sel:x? (Observación: Suponga que el área, de Ia mancha de tinta es despreciable.)
Fn la teoría de probabilidad un concepto muy útil es el de independencia de eventos, que significa que
-a ocurrencia de uno de los eventos no da información sobre si otro evento ocurrirá o no; es decir, Ios
lue -r-entos no influyen uno sobre otro.
nte
lue
Definición (de independencia) Dos eventos A y B se llaman independientes si la probabilidad
de que ambos ocurran es igual al producto de las probabilidades de los dos eventos individuales.
Es decir,
,de Pr(A n B) :Pr(A) x Pr(B).
Capítulo 2. El Concepto de Prcbabilidad
Ejemplos
1. Sea Q: [0,1]x [0,1] y dados los eventos: A: {(r,a)10 S r 5ll2; 0 < y < I}, B : {(",A)10 <
r 1I;0 <y <Il ). Probar si A y B son independientes.
Figura 2.5:
Pcu lo trutto.
Pr(C) : Pr'(,4 a 13") * Pr(4" . 13) :0.095 + 0.045 : 0.14.
Tles bicllogos, irr<lepcnclierrtcrncutc uno clel otlo, nriclielon el c:<¡rrtcniclo <,1<'l suero c1t tlll¿l tttttestra.
La proba.bilidacl cle <¡-re cada uno comet¿r Lln el'ror eu I¿r lcctur:r dol apzrlato cs igutrl a 0.1, 0.15 y
0.2, r'r:s¡rectivarrrente. Hallal la probabilidad de que cll ttna s<,rla rnecliciótt pol lo meros ttno de:
Ios investig¿rclores coureta Lrrl erlor.
Soluc,ió,n,: Se¿r el evento ¿: {por lo menos uno de los investigaclolcs coniete urr crror}, el
complerrento es A" : {ninguno de los investigadores comete un error}.
Caicul¿rrernosPr(4"), considerando que las medicioltcs son evctttos inclcpendientcs.
(dis- Sean p¿ la probabilidad de que el i-ésimo investigador cometa un error (i: I,2,3), entonces
Pr(A') : (1 -pr)(t-pz)(I-pz)
: (1 - 0.1)(1 - 0.15)(1 - 0.2) :0.612.
/0< Resulta que Pr(A) - 1- 0.612 : 0.388.
Pr(AlB):HF
Ejemplos
r). a) ¿.Cuál es Ia probabilidad condicional de qtte ttrr esposo seir fiel, clirclo qr-re sll esposa es fiel?
b) ¿'.Cuál es Ia probabilidad de ctrr-te ttl)a esposa sea fiel, claclo
(luc srr csposo es infiel'/
n B).
Sol'u,ción; Corrvengarnos en la siguiente not¿ciórr de los ercrrtos:
.f1F: Hornbre fi.el, 111: Hombre iuficl,
,41F: N{u.ler fiel, 11,/1: \4Lr.jer infiel.
70 Capítulo 2. El Concepto de Probabilidad
a) Dcseamos calcular
PI(II I-IAI F) : f'r(II F. n{F)
Pr(r1F)
De 1a tabla se obi:ierrcr cllle
trL(i1F . AI F) ¡),
Pr(n1F) 0.22 + 0.31 :0.53.
Con ésto,
0.22
Pr(111¡lrt{F) : : 0.415.
0.53
b) Calculcmos
n HI)
Pr(A,I FIH i) : Pr(MF
Pr(H/) )
con
Pr(MFnf{f) :0.31 y PI(III): 0.31 + 0.23 : 0"54.
Entonces,
g'31
pr.(,41 FIHI\:
' 0.54
:0.bT4.
Pr(BlA\:9:?
__\_r--l
9 3
u La pI'r¡babilidad de que el tercero sea hombre sabir:rrdo que los dos primeros t¿rnrbién lo son,
es la probabiiidacl dc C dado A y B:
:'r(C An : !.
ll),E
tr-ir pr"obabiiid¿rci buscacla tlc clrrc las i,lcs i)crson¿rs escc.rgiclirs sean holrlrres es
La probabilid¿rd clc: A, que puccic ocrrriir sclo ¿rl ¿lll¿rlecel uno rl,:.'. . .1 ,,< r-trLrtuarnerLtr:
Lttt cvonto
f:xclltt¡'g¡¡iss B t, 82, .. , 8,, (Figura 2.6), talcs (llre sli uniórr es el espacio rri,r.:j r.- j ,'1 (lada por
Supongamos que el evento A puede ocurrir a condición de que aparezca uno de los eventos Bt, Bz,
..., Bn. Si A ya ocurrió, la probabiiidad (condicional) del evento B¿ es igual a
Pr(B6lA) :ffi:g;ffi
Pr(AnB¡) Pr(B¡)Pr(AlB¡)
i:I
?ara e1cálculo mediante la fórmula de Bayes puede resultar conveniente disponer las probabilidades
:t rn diaqrama de ó"'rbol como el siguiente'.
A
Pr(81)Pr(Al81)
A'
Pr(81)Pr(A'lB1)
A
Pr(82)Pr(AlB2)
Ac
Pr(82)Pr(A'lB2)
A
Pr(8,)Pr(AlB")
Pr(8")Pr(A'lB")
rsta dispctsiciórr de los datos facilita la rcaiización de los cálculos ya que
únicamente se debe realizar
-na slrma de los resultados en las ramas de interés
Ejer.:rIos
l. En una oficina hay 6 computador¿rs de marca y 4 ciones. La probabiliclad de que al utilizar una
mác1lrina, ósta encienda correctameirte es 0.95 para las de marca y 0"8 para las clones. Un em-
pleado utiliza aI azar una computadora, hallar la probabilidad dc que se encienda correctamente.
.4oluci,ón: Definamos los eventos:
.3)
A: el empleado ul,iliza una máquina de marca,
B: el crnpleado utiliza una máquina ción,
C: la máquina enciende correctarnente.
72 Capítulo 2. EI Concepto de Probabilidad
Sc ticrrc,
4
PL(A) :*:,,0, Pr(ll) :r0:,,.n.
Pr(ClA): 0.95, Pr(ClB): 0 8.
a) Se tiene
Pr(81) : j,2I Pr(82) : :.
La probabilidad condicional de que la botella contenga la cantidad exacta, si ha sido en-
vasada por Ia primera máquina es
Pr(AlB1) :0.6.
Por tanto, la probabilidad de que la botell¿r tomada aI azar contenga la cantid¿d exacta es
1-,) Ltr prcibttbilidtrd del cr¡cnto <se escogió un¿r botcll¿r r:on la cantidad exacta llcuada poi' Iir
segurrcla má<¡rirrir>> es
É 17.
Este resultado tarnbién se puede calcular eurpleando cl concepto dc evento cornl lerlentario.
Err trna ciudad, el 25% de los habitantes son ancianos, el 35 % adultos y ei 40 % sorr liños. Se
sabe que la glipe afecta al5% cle Ios ancianos, al4To de los adultos y al2% de los rriños.
Ahora, basta sumar los resultados parciales en las ramas para obtener el resultado deseado:
or l¿r
Pr(,4u¡/lG) : Pr(AlG) +Pr(.n/lc)
r25 80
345+3*:0'594'
La lrlobabilidad de que si urt habitante tiene gripe, éste sea anciano o rriiro, es clel 59.4%.
74 Capítulo 2. EI Concepto de Probabilidad
4 EI 35'/r, clc los ct'óclitos clttrt rtt<-ltger rtrr banc<l es par¿r vivicncla, eI 50%, ltara pr.ochrc:cióu y el r'esto
(r()llsittlllo. R,cstrlt¿rrr lltot()sos r:l 20(X, tk: krs cl'írtlit,cts
l)¿r1 ¿i ltrua vivic¡r,la, el l5%, rlc los clérlitgs
lrillrr ¡>r'orlrrcrción y t>l 70c,4, r[c Ios cr'éditos I)¿i,t'a c:orrsurr]o.
a) Tengamos presente que el evento <<el crédito se paga a tiempo> es el complemento del
evento <el crédito está en mora>; entonces, buscamos Pr(M.).
Por la fórmula de la probabilidad total,
2.9. Ejercicios
1. Sean A y B dos eventos con Pr(A) # 0 V Pr(B) 10. Demuestre que
En una biblioteca hay B libros de literatura de ciencia fi.cción, 3 de los cuales son de Isaac Asimov.
La bibliotecaria toma al azar 2 libros. Determine la probabilidad de que ambos libros resulten
ser de Isaac Asimov.
10 La Empresa de Correos ha determinado que el 70% de los paquetes enviados al exterior no llegan
a su destino. Dos libros se pueden enviar separadamente o en un solo paquete. Para cada una
de las dos formas de envío postal, encuentre:
t2. El 35% de los créditos de un banco es para vivienda, el 50%o para industrias y el 15 % para
consumo. Resultan morosos eI 20To de los créditos para vivienda, el 15% de los créditos para
industrias y el 70 % de los créditos para consumo. Calcule Ia probabilidad de que se pague un
crédito elegido al azar.
1t
1J En una exhibición de arte hay 12 pinturas de las cuales 10 son originales. Un visitante selecciona
una pintura al azar y decide comprarla después de escuchar la opinión de un experto sobre la
autenticidad de la pintura. El experto está en lo correcto en 9 de cada 10 casos, en promedio.
a) Dado que el experto decide que la pintura es auténtica, icuál es la probabilidad de que él
no se equivoque?;
b) Si el experto decide que Ia pintura es una copia, entonces el visitante la devuelve y escoge
Le el
otra, ¿cuál es Ia probabilidad de que Ia segunda pintura escogida sea original?
dad
14. Hay una epidernia de cólera (C). Consideramos como uno de los sÍntomas la diarrea (D), pero
este síntoma se presenta también en personas con intoxicación (1) , e incluso en algunas que no
tengan nada serio (N). Las probabilidades son:
cule
Pr(DlC): 0.99; Pr(Dl1) : 0.5; Pr(Dl,n/) : 0.004
Se dan los siguientes porcentajes: el 27odela población tiene cólera y el 0.5% intoxicación. Si
una persona tiene diarrea calcule la probabilidad de que tenga cólera.
76 Capítulo 2. EI Concepto de Probabilidad
15. Urta pru<tlril cl vitrts del SIDA eu la sangle cl¿ el cliagnóstico correcto coll urra pro-
l)¿tl¿r rlctct:t¿rt
babilicl¿rcl rlcl 9ll %. Sogrin clatos módicos) lrrio clc carla 2 000 habitantes cl<ll país. en prornr:clio, es
poltaclol rlrtl virtts. Da<lo qrte la pnrebzr fire positivtr I)ar¿r una persorl¿1) 1',clr¿il es la proira.lriliclacl
cle que cll¿r, r'e¿lnrcrrte tcnga Ia enfermed¿rd?
16. Utra emplesa financiera opera en las tles regiones del país: Costa, Sierra y Arnazonía. El 50 %
de las opeLaciones se realizan en la Costa, el 40 To er Ia Sierra y el resto en la Amazonía. Se
ha estimaclo, derlrido a la larga experiencia, el porcentaje de clientes qne no pagan sus deudas en
cada una cle las regioues. Para Ia Costa es del I%o, para la Sierra deI 2To y para la Amazonía
del 8 %. Si la empresa tiene 1000 clientes, determine cuántos pagan sus deudas puntualmente.
17. Una encuesta revela que el 70% de la población tiene estudios secundarios, de los cuales eI 72%c
no tiene trabajo. Del 30 '70 q:ue no tiene estudios secundarios , eI 25 % no tiene traba.jo. Calcule:
18. De 200 aspirantes a un cargo se conoce Ia siguiente tabla respecto a experiencia en funciones
similares y la formación académica necesaria
a) con experiencia y con folmación; d) sin formación dado que no tiene experien-
b) con experrencra; cia.
c) con experiencia dado que tiene formación;
19. En una investigación sobre el crédito bancario a trabajadores agrícolas se obtu\¡o el siguiente
modelo, en el que se califica al campesitto como propietario o no propietario del terreno que
cultiva y si mantiene o no mantiene deudas con los bancos.
Propietario
Deudor SI NO
SI 12 28
NO 20 64
20 A 100 empleados se les hizo un examen para determinar su destreza mar,'.,:-- C''ralenta clc los
ernpleados er¿n hombles. Scsenta de los empleados pasaron el exameli 1., _: .. ¡ ¡.lcanzaron rur¿l
2.9. Ejercicios 77
ro- calific¿rcióu rriayot que cicrto rrivcL Pledetr:r'ruil¿rdo cle a¡rr'<x,'eclrarnictrtci. L¿r cl¿rsific¿-Lción entre
CS
hornll'ers y rnujer-cs fue Ia sigrrielrte:
[¿cl
Honrlrr.cs (11) N{u,lcres (,4'1)
Pasaron (P) '24 36
)% No pasarou (.Ay') r6 24
Se
ien Sr-rponga que se selecciona al azar un eurpleado dc los 100 que hicielon el examen.
lnía
Lte. a) Calcule la probabilidad de que el empleado Laya ptrsado y sea hornbre;
2%
b) Calcule la probabilidad de que el emplead., sea hombre dado ctrtrc pasó el examen;
q.ue
2I. Los empleados de la compañía Crrz del Sur se encuentran distribuidos en 3 divisiones: Admi-
nistración, Operación de Planta y Ventas. La siguiente tabla indica el núrmero de empleados en
cada división, clasificados por sexo.
úente 22. Dada la siguiente tabla que indica el comportamiento respecto del hábito de fumar en un grupo
) que de 100 estudiantes que fueron averiguados.
Hábito
Sexo No fuma Fuma Ex-fumador TOTA
Hombre 16 10 24 50
Mujer 30 16 4 50
TOTAL 46 26 28 100
25. En un paÍs hay 4 partidos políticos que se dividen la opinión pública. Se sabe que:
Entre los adherentes al partido I, un 36 % corresponde a personas con ingresos inferiores a dos
salarios mínimos. Entre los adherentes al partido II, esa proporción es del 52'/o. Para el partido
III es un 42V0, y para el partido IV es 11%. Si se elige una persona al azar y resulta tener un
ingreso mayor a dos salarios mínimos, calcule la probabilidad que sea adherente al partido I.
26. La señora Sonia se fue de viaje y encargó a su hijo, Pablo, que riegue el rosal. La probabilidad
El rosal está en un estado inseguro:
", ].
de que Pablo olvide regar el rosal durante su ausen"iu
3
si se riega tiene igual probabilidad de secarse que de no secarse) pero solamente tiene un 0.25 de
probabilidad de no secarse si no se riega. Después del viaje Sonia encuentra el rosal seco, ¿cuál
es Ia probabilidad de que Pablo no lo haya regado?
27. Se estima que sólo un20To de los que compran acciones en Bolsa tienen conocimientos bursátiles.
De ellos el 80 % obtienen beneficios. De los que compran acciones sin conocimientos bursátiles.
sólo un 10% obtienen beneficios. Se desea saber:
a) El tanto por ciento de los que compran acciones en Bolsa que obtienen beneficios;
b) Si se elige al azar una persona que ha comprado acciones en Bolsa y resulta que ha obtenido
beneficios, ¿cuál es la probabilidad de que tenga conocimientos bursátiles?
28. En un supermercado el 70 % de las compras las realizan las mujeres; de las compras realizadas
por estas, el 80 % supera los 20 dólares, mientras que de las compras realizadas por hombres sólo
el 30% supera esa cantidad.
29. En una universidad existen tres facultades: A, B y C. En A hay matriculadas 150 chicas y 5[
chicos; en B, 300 chicas y 200 chicos; y en C, 150 chicas y 150 chicos.
-i-
2.9. Ejercicíos
30. E¡tr.e los cinco rrs¡tirantes a un calgo cle geleute, a <los se ios considera excelentes y a los riernás
se les consicler'¿r bucnos. Para una entrevista se escoge al azal a dos de los cinco. Calcule l¿r,
probabiiidacl de que se esco.ia:
31 Se dispone de dos métodos A y B para enseñar una destreza manual. El índice de reprobados es
del 20 To para el método A y 10 To para el método B. Sin embargo, el método B es más caro por
Io que solo se le usa el 30 % del tiempo y el A el otro 70 %. A un trabajador se le adiestra con
uno de los d.os métodos, pero no puede aprender en forma correcta. ¿Cuál es Ia probabilidad de
que se le haya adiestrado con el método A?
32 En los exámenes de ingreso a una universidad cada candidato es admitido o rechazado de acuerdo
a si él ha aprobado o reprobado la prueba. De los candidatos que realmente son capaces' el 80 %
pasa la prueba; y de Ios que no son capaces, el 25To pasan Ia prueba. Dado que el40% de los
dos candidatos son realmente capaces, encuentre Ia proporción de estudiantes capaces que ingresan
ido a la universidad.
un
JJ Según datos de investigaciones genéticas se ha establecido que: los padres de ojos claros y los
hijos de ojos claros constituyen el 5To de las personas estudiadas; los padres de ojos claros y loB
dad hijos de ojos oscuros el 7.9 %o; los padres de ojos oscuros y los hijos de ojos claros el 8.9 %; los
padres de ojos oscuros y los hijos de ojos oscuros eI78.2Vo. Halle la probabilidad de que:
uro:
5de a) el hijo sea de ojos oscuros, si el padre es de ojos oscuros;
cuál
b) el hijo sea de ojos claros, dado que el padre es de ojos claros.
,iles. :l-1 Como un acto de buena vecindad Dios y Satanás acordaron un intercambio cultural entre el
:iles, Cielo y el Infierno. Demonios del Infierno van a vivir en el Cielo, mientras que ángeles del Cielo
van a vivir en el Infierno. Los demonios tienden a no decir la verdad más frecuentemente que los
ángeles. Los demonios mienten el 80 % de las veces y los ángeles mienten el20% de las veces (¡en
estos días es difícil encontrar ángeles buenos!). Después del intercambio, la proporción entre los
demonios y ángeles en el Cielo es 2:3. Mi amigo José murió y fue al Cielo. Él encuentra a una
rnido
persona en la calle y Ie pregunta donde encontrar un baño para hombres. Desafortunadamente,
Ios demonios y los ángeles no se pueden distinguir por su aspecto físico. Deseamos determinar:
:adas
; sólo
a) ¿Cuál es la probabilidad de que Ia respuesta haya sido una verdad a la pregunta de José?
b) Dado que la respuesta fue una mentira, ¿cuál es la probabilidad de que haya sido dada por
un demonio?
os 20
.)=
)'J Una compañía de tarjetas de crédito encuentra que cada mes el 50% de quienes poseen la tarjeta
ilidad cubren totalmente sus deudas.
a) Si se seleccionan dos usuarios al azar, ¿cuál es la probabilidad de que ambos paguen total-
;y50 mente su deuda ese mes?;
b) Si se selecciona un cliente al azar, ¿cuál es la probabilidad de que dicha persona pague
totalmente sus deudas en dos meses consecutivos?
c) ¿En qué hipótesis se apoyó para responder a los dos apartados anteriores? ¿Le parece que
ef alguna de ellas no es razonable?;
80 Capítulo 2. El Concepto de ProbabíIidad
<1) Urr cxarrrerr rn¿is <1et¿rllaclo der los rcgistlos cle la conipañía rnuestr'¿r quc el 90 % cle los clicutcs
que l)agau t<it¿.rllneut,e un¿r cLr<lrrt¿l nrensual tarnbién lo hacen al mes siguiente v <1uc sólcr
eI 70%, clc los cluc l)o l)ag¿]lr tot¿r.lrnente en llrl rnes cttl-¡ren totalmente srr dcrrcl¿ al mes
siguierrte. Calculc, cn este c¿so. la probabilidad pedida en b).
e) Con las hipótesis de d), calcule la probabilidad de que un cliente seleccionado al azar no
pague totalmente ningr-rna cle las dos cuentas rnensuales consecutivas;
f) Calcule Ia probabilidad de que sólo pague una de las dos cuentas.
37. El cardinal de un espacio muestral finito es rn. Los eventos A y B son independientes y cumplen
que:
38. Demuestre que si se tienen Bt, Bzr..., B, eventos mutuamente excluyentes, tales que su unión
es el espacio muestral, ertonces se tiene que
fi,:r e'1an¡a) : t.
Capítulo 3
Definición (de variable aleatoria) Se llama variable aleatoria a cualquier función definida en
':: espacio muestral f) con recorrido en un subconiunto finito o infinito de R.
- decir, Ia función
X:Q --) R
u F-f X(r)
81
82 Capítulo 3. Variables Aleatorias, Esperanza y Varianza
Figrira 3.1:
Ya hemos estado trabajando con variables aleatolias sin leferirnos cxplícitarncnte a ellas; por ejernplo,
al arrojar un dado son posibles seis casos. Designando por o¿ ei evento element¿l consistente en saiir
¿ puntos, tenemos:
CI : {cuf ,u)2,u)Srw4rrr'5rw6}.
Lavariable aleatoria X(rn): i identifica al núrmero z de puntos obtenidos al lanzar cl dado, se define
así:
Al arro,jar una rnoneda tenerlos dos eventos: C: <<sale cara>> o -E: <<sale escudo>>; definimos la variable
aleatoria X, que cuenta el número de caras aparecidas en una serie de lanzamientos, de la siguiente
manera:
Las variables aleatorias se clasificanten d'isc'retas y co'nti,rtuas, de acuerclo a los v¿lores qne ellas tomen.
\rkrtniis, ti p,, : Pr'(X : x:¿). cs lir ytt'tillzrlrilirl¿rrl <lc tlrtc X tonrc <rl vtlol ru¡, sc ctuttplc <¡ue
rn ottas palablas, X os disc:r'cta si rrna unirlarl rkr ur¿ls¿r clc plobabilicl¿rd cst¿i <listribrricla sobre el e.ie
-=al, cc'rrLcerrtránclose rrri¿l rn¡rs¿r I)ositi\'¿1 err cacla prrut,o <le c:ielto c:on.jrrnto finito o infinito nrrrnerable y
.:- los restaltes purrtos uo l)¿ry lnas¿r.
-,-¿r'iables
aleatorias discretas sorr usualmente (pelo no rrecesariamente) conteos de ciertos elementos'
- -,r ejemplo, el nirmero de hi.jos de una familia, el rniulcro de ventas realizadas por Lrn almacén, etc.
- la vez qlre se ha determinado las probabilidades ¿isociadas a cada uno de los rralores de nna variable
-:atoria discreta, es ritil ponerlas en forma dc una distribu.ci,ón de probabilidad, que es una tabla con
:,,ios sus posibles valores y sus correspondientes probabilidades, como la siguiente:
f 1 2 n
Pr(X : r) Pt PZ P,,
Ejemplos
Po : :0) : PL({CCC}): 1
Pr(X
8'
t
J
Pt : Pr(X: 1) : PL({CCE}): g'
3
Pz : Pr(X : 2) : Pr({C EE}) :
8'
Ps : Pr(X : 3) : Pr(iE EEI) : 1
-:.
8
T 0 1 2 3
Pr(X : r) 1/8 318 318 r18
y se cumple que
1331
Po*h-lPz+Pt : B + d + S + g : 1
Consideremos la sigrriettte plueba: se dispara corr nna pistola a un blanco situado a cierta dis-
tancia. Nos interesa analizal los eventos uJ¿: <<rlúmero de balas empleadas por un tirador hasta
(lne se da en el lrlarrco por prirnelavez>,.
Definimos la variable aleatoria X: <<núrnero de balas gastadas>>:
EI corrj nnto de posibles valores que puede tc¡mar Ia variable aleatoria es { 1, 2,3, . . .} .
Este es un conjunto infinito numerable, pues no se conoce un máximo para el número de balas
empleadas que pudiera ser extremadamente grande para una persona con muy mala puntería-;
es decir, X es una variable aleatoria discreta definida sobre un conjunto infinito numerable.
Más adelante se demostrará que también se cumple que i p¡: I col p¿: Pr{X : ¿}.
i:r
84 Capítulo 3. Variables Aleatorias, Esperanza y Varianza
Definición (de función de distribución) Sea X una variable aleatoria discreta, la función leal
-F tal que
VÚ e R, F(t): Pr(X < ú)
Propiedades
Observación. La probabilidad Pr(X: a) se calcula mediante Pr(X: a): F(a) - F(o_), donde
F("-) es el límite, por la izquierda, de la función de distribución en el punto a. Este concepto tiene
importancia para el cálculo de las probabilidades en los puntos donde ,F tiene saltos.
Ejemplos
0, si ú<0;
Il8, si 0(ú<1;
F(t) : Il2, si L<t<2;
718, si 2(ú<3;
1, si ú23.
Los gráficos de las funciones de probabilidad y de distribución se dan en la Figura 3.2:
F(t)
0.4 I F
H
0.3 0.75
0.2 0. H
0.1
o€
Figura 3.2:
3.1. Valial-¡ies aleatorias 8Ír
Elr rrrL¿r lltrr<:l-,ir rkt c:¿tli<l¿r<l rk. ttrr ltLorltt, l,r sl tillrr'(lllr'{'n tLrt [o1<: tlt¡ l') Piczas lr¿n'!i ].,1[tttttt.
t¡ .1 rlcf<r<:tlros¡rs. L)rr cl rkrP;uliunollt() rlc <:r¡rrtlol tlt' r:irlir[¿rrI st: lr¡rrr¿t tur¡t nrttcsl t¿l tlc ]] lriczits
Clorrstlrril l¿r lct'rkr l¿r r'¿rriirlrlc alc¿rtoLi¿r <<L¡rirrrr:Lo rl<r lrir:z;ts lrlrcLr,lsr,.
Sol,tLr:irin,: La r'¿ilialrlr: a,lc¡rtolia crL crLcstirilr prr<rrlc torrrar'krs r'¿rlolr.s 0. 1.2 \¡,J: rIctr:nnirolnos
srrs prol)¿rl )ilir [¿<ics.
El llrill<:r'<.1 r[c srrbc:onjrrrrtos cl<l 3 c]crnerrtos rilrtcrrilrlcs rlc rrrr c;ou,jrtrtto <[c 12 clrlurcrrtos cs C:fr.
que es Card(O).
r Si X:0, cutolrccs tocl¿rs las Piczas sou dcfcctuosas, lr¿iv C[ lorrnirs clc <:scogctlirs.
. Si ,Y : 1, crrtorrc:es 1 es lrucrr¿r y 2 sorr clefcctrros¿rs. c\istcu Cl f.rlrn,rs cle csc:ogt:t l:rs Piclzirs
buen¿ls v Cl de cscoger las clefectnosas) crrton(ies lr¿v C¡C; forur¿ts clc: cornlrilr¿rr l¿rs lrttett¿rs
y las defectuosas.
. Si X : 2,ltay C! conjuntos de las piezas buen¿rs y C] dc dcfcctuosas) p¿rr'¿-r, rrn total cle
Cl|6C| formas cle combinarlas.
. Si X: 3, hay C! cornbinaciones de piezas bueuas.
Entclnces,
Para clefinir urr¿r variablc ale¿rtoriir no cs nccesario cxhil.¡il urr fcrtcirrrcrto ¿rleat<lrio pat'ticttltrr',
es suficiente clar ulla función cle probabilictad o cle clistlibucicln r¡re cr-rrnpla las plopic<l¿rclcs
enunciad¿rs.
si l,<-3;
si -3<ú<0;
si 0(t<2;
si ú>2,
Coustruil Ia tal-¡la de clistribución de probabilidacl clc )'.
Sol'ució¡t: De acuerdo a la definición de la ftrncióu cle clistribuciórr ¡roclenlos \'ol cluc l¿r r-¿rri¿rblc
aleatoria torn¿r los valoles -3,0 y 2.
r l-rlo l2
Pr()':trlIl2 lll4lIl4
86 Capítulo 3. Variables Aleatorias, Esperanza y Varianza
4. Un¿r variable ¿rleatoria X está dcfinida medi¿rnte lir siguierrte lcy de plobabilidacl
Jr l rlzl¡ | qI s
a) Determinar F(r).
b) Graficar f(r)y F(r).
c) Hallar: Pr(X:1), Pr(X < 1), Pr(X < 1), Pr(1 < X < 2), Pr(1 < X < 2), Pr(1 < X <2).
Soluci,ón:
Pr
F
0.
0. H
H
0.1 H
0.1 H
Figura 3.3:
c) Se tiene:
Definición (de variable aleatoria continua) La variable aleatoria ouyo recorrido es un intervalo
inito o infinito de R se llama variable aleatoria corrtinua.
También, se dice que Lrna variable aleatoria X es continua si para todo valor real r se tiene que
Pr(X: z) :0.
- sualmente, lasvariables continuas representan mediciones; por ejemplo, la estatura de una persona,
-l tiempo que se demora un programa en buscar un registro en una base de datos, la cantidad de
:¿ngre que tiene un animal.
Definición (de función de distribución) Sea X una variable aleatoria continua, Ia función real
F tal que
V¿ € R, F(t): Pr(X < ú)
=e denomina función de distribución de la variable aleatoria X.
Fropiedades
l. Pr(a< X <b):Pr(¿<X <b) :Pr(¿ < X < b) :Pt(a <X < b) :f'(b) - F(").
Definición (de función de densidad) La función de densidad de una variable aleatoria continua
-'t es una función real / que cumple:
)
") f (r) 0 Para cualquier valor z.
b) /A f@)dr:r.
c) Para cualquier intervalo A: lo,b], se tiene que
-,
-amos cómo estárr relacionadas las funciones de distribución y de densidad. (Ver Figura 3.4)
F(r):
l"*r@ot y f (*): F'(r).
88 Capít,tttra 3. Varían¡Jes Aleadorias, Espet'anza I \-ariattza
f {t}
Figura 3.4: Rel¿ición cntr-c las firncion<:s clc clclsidaci y c1e clistrilruc:iórr.
¡b
Pr(a<X<q: I I(r)dr:F(b) -F(").
En las valiables aleatorias continuas es suficiente indicar la función de densidad o Ia función de dis-
tribución para que la variable aleatoria qr-rede completamente definida.
Ejemplos
"'(0.".1)
2 L¿r fiurción de densidacl de una vali¿rble aleatoria está clada por /(z) : (\.e-s:L cn el intern,alc
(0,-) v f @): 0 fitera cle cste itttetvalo. Hallar' el v¿rlor de la constante cv para que /(z) as-
clefilricl¿r sc¿l unA función <le densid¡ld.
. En (0, oo) se debe tener f (") >- 0, es decir (\e-3* ) 0. Pero Vr € (0, rc), e t" > 0; entouces,
se dobe tener que a ) 0.
Consecuentemente, : tt entonces a : 3.
Í
Dada la función de densidad de la variable aleatoria continua X:
( o, sic(o;
f(*): { cosr, si0(r<rf2;
r dis-
I o, sir>rf2.
a) Hallar la función de distribución F'(r).
b) Determinar: pr (t = *. ;), e, (x ,;),"'(; <x <
#)
Solución:
( o, sir(o;
F(r):l ';" ', si o < '<X,
I r, six>[.
b) Para calcular las probabilidades emplearemos Ia función de distribución.
r Pr(a < X <b) :F(b) - F("). Si ¿: I y U:[,
erval<¡ 6" 3
(r) así
: -"(á)
"'(á=".á) "(á)
: *" (á) : rfr1
2 -5
'"" (á) -
: 0.36603.
90 Capítulo 3. Variables Aleatorias, Esperanza y Varianza
"("'i) : '-'(;)
1-sen/1):
\ 4/
r-Jt2
_ 0.29289.
r 17tr
e Pr(a < X < b) : F'(b) - F(o), con ¿¿: vb-_.
3" t2
4. La función de densidad de una variable aleatoria ? está dada por f (t) : t-f, y /(¿) : O
"n(1,2)
fuera de este intervalo. Hallar las probabilidades:
a) Pr(0<?<1.8):
,t) Pr(r.4<7<3):
r.1 r ¿
_ t)',n+o
[,'^('-;)"* 1,'o
1.. ..
ilt'-2)-({r+)2- 72.
5. Hallar la función de densidad /(r) de una variable aleatoria cuya función de distribución es
'17
4'
( !"-,,r, si ú > o;
f (t): \ 0, '2
|. en Io demás;
donde ú es el tiempo (en horas). Calcular la probabilidad de que un elemento dure más de tres
horas, dado que ya ha estado en uso m¿is de dos horas.
Solución: Nos interesa Pr(? > 3lf > 2), que según Ia fórmula de la probabilidad condicional se
tiene:
Pr(?>3lT>rl :#fi;
porque Ia intersección de los eventos (7 > 3) y (T > 2) es el evento (" > 3). Entonces,
l'* | -rtz
Pr(? > s) _ ./r rt :- "-t1," _ e-rlz:
Pr(I > 2) -
0.606.
[* !"-* r'
.lz 2
Sea g una función real cuyo dominio contiene el recorrido de la variable aleatoria X, podemos definir
-l-na nueva variable aleatoria Y mediante
y: g(X),
92 Capítulo 3. Variables Aleatorias, Esperanza y Varianza
y9por
gtB ------+ R conAe B
r r---' g(r)
Y : Q ------+ R
ul-----' Y(u): s6@)).
¡ Si X es una variable aleatoria continua. Supongamos que g es una función continua y estricta-
mente creciente en todo el eje real; entonces, existe la función inversa de g que la llamaremos l¿.
Ésta también es continua y estrictamente creciente, por lo que
Aplicando la función inversa a los dos miembros de la desigualdad del argumento de la última
expresión se obtiene
Pr(e(X) (ú) :Pr(X<h(¿)) : Fx(h(t)).
Luego, se tiene la siguiente equivalencia entre las funciones de distribución de X y de Y:
Fv(t): ¡k(h(¿)).
Si las funciones F¡ y h son derivables, se pueden derivar ambos miembros de la igualdad anterior,
empleando la regla de Ia cadena:
Ejern¡rlos
1. Da<[a l¿l [rrrrc:iót¡ <lc <listlilrrr<:ión F¡ clc l¿r vari¿tll]cr ¿rlc¿rtoli¿t -\. hall¿rl l¿.rs ftttt<:i<.¡trcs rl<r rlisl tilrrrt iritr
<lc rkrusiclir<l d<l \" : u,X * b,
r' pala: a) rr, ) 0; lr) tr, < 0.
Soht.r:i.titt:
La función de densidad es
: -r/t).
Si F.v es coutiuua SC
<0;
>0.
Si lr.v <s rl<lrivable er rlcusiclad:
<0;
>0.
94 Capítulo 3. Variables Aleatorias, Esperanza y Varianza
x I -s I -21 o | 2
Sol'ución: Como Ia variable aleatoria es discreta, basta aplicar la relación Pr(Y : A¿) : Pr(X :
ri), a cada uno de Ios valores que toma Y : X2. Entonces, tenemos que
v2 l(-¡)rl(-z)rlo, lz,
Es decir,
Y lglq lol+
Como el valor Y : 4 se repite 2 veces, unificamos sus probabilidades y la tabla queda así:
( 0, si ú<-1;
¡k(ú):{ +,sisiú>1.
-1<ü<1;
( t,
Solución: Se tienen las siguientes igualdades:
0, si -lnt<-I;
F¡(- lnü) :{ -lnú*1 si - 1< -lnú <
2' 1;
1, si -lnt>L.
:t 0,
-lnú*1
1,
2'
siú>e;
si e-l 1t 1 e:
si ú < e-1.
Por tanto,
1, siú>e:
+ lnú
- 1- Fx? lnú) :
1
Fv(t)
2
sie-'1t1e:
0, siú<e-1.
3.3. Ejercicios 95
3.3. Ejercicios
1. Irrclique si las siguierrtes variables aleatolias son discretas o corrtiuuas y su rarrgo cle <lefinición:
,l Se arroja un dado y se designan por ¿ : {el número de los puntos aparecidos es par} y por
6 : {el número de los puntos aparecidos se divide por 3}. Para los dos eventos, halle Ia Iey de
distribución y grafíquelas.
4. Determine Ia función de distribución de la variable aleatoria X que está definida por la ley que
se presenta en la tabla.
-2 rt
rl4 213 rlL2
¡. Un escritor ha lanzado al mercado una nueva novela. La probabilidad de que Ia novela sea muy
exitosa es 0.6, de que sea medianamente exitosa es 0.3 y de que sea un fracaso es 0.1. Los bene-
ficios esperados son: si la novela es muy exitosa, 100 mil dólares; si la novela es moderadamente
existosa, 50 mil dólares; y, si es un fracaso, 10 mil dólares. Forme la ley de distribución de los
beneficios esperados por el escritor.
6 Una agencia automotriz recibe un embarque de 20 automóviles nuevos; entre éstos, 2 tienen defec-
tos. La agencia debe seleccionar, aleatoriamente, 3 automóviles de entre los 20 para venderlos.
Forme la ley de distribución de la variable aleatoria <<número de carros defectuosos entre los
escogidos>>.
7 IJn apuesto príncipe visita a un rey que tiene cuatro hijas casaderas, con la intención de integrarse
en la familia. Las probabilidades que tiene el príncipe de ser aceptado por cada una de las
princesas son 0.6, 0.8, 0.2 y 0.4. El príncipe pide la mano de cada una de ellas de forma
consecutiva y se casa con la primera que acepte. Sea X la variable aleatoria definida como
X:i si se casa con Ia i-ésima hija (i - 1,.. .,4) y X:0 si todas le rechazan. Calcule la ley
de probabilidad de X y su función de distribución.
8 Una chapa para puertas consta de tres piezas mecánicas. Suponga que las probabilidades de que
Ia primera, la segunda y la tercera piezas cumplan con las especificaciones son 0.95, 0.98 y 0.99,
respectivamente. Determine la distribución de probabilidad del número de piezas que cumplen
las especificaciones en una chapa.
9. Sea X una variable aleatoria discreta cuya función de probabilidad es p(r) : :1,2,3,4,5.
#,r
a) Encuentre el valor de & para que la función p(r) sea la función de probabilidad de X;
b) CalculePr(l < X34).
C)a¡>ítulo 3. Vari¿tltl¡:s Aleatorias, Esperattza y Varianza
l(. l,¡r lr¡:¡.'i,irr ,lr'¡rrol,irlrilirl:r<1 ./'cl<: rulr r'¡uiirl¡lc ¿rl<r¿tloti¿r -f <:s rrttl¿t s¿rh'o cn lr.rs lrtttrtos /.:0. f .i'
'1. lirr cl[r,¡ l()nr¿r lr)s vitl()los:
il. t':r,r r''u'ialllc ¿r,leatoli:r -Y se dicc <¡ur: sigrr<: lrr lcy cle B<rnfot'cl si se cttrnple qtte
,:) /(t ) =
{iZ;:, :i ;: l]
15. Dncla la fttttcióu de distlillrrt:ititr rk: r¡¡¡:¡ r'¿tt'ia,lrlc ale¿rtori¿ .{:
0. si z(0;
L 14. si 0lr(1;
F(.r:) =
t l:J. si | 3r <2;
:r fr.t. si 2(1t14;
(t: -').)/3. si 4l:r. ( 5;
l. si ;u)5.
C)al<:r tlc lits ¡rt'o! r;.l,rriid¿ul<ts:
3.3. Ejercicios 97
0, si r<-J2;
Il8, si -J2<r10;
215, si 0(r1I;
Il2, si t <, < J2;
314, si t/2<r<512;
1, si r>512.
Determine la función de probabilidad asociada y grafíquela.
10, sir<-2;
F(r):l ar+b, si -2Sr<2;
I t, sir>2.
a) Determine los valores de a y b; c) Halle: Pr(X
b) Encuentre la densidad /; Pr(lxl > 1.2).
El tiempo en minutos que una persona espera un autobús es una variable aleatoria cuya función
de densidad viene dada por las fórmulas: /(¿) : j ouru 0 < ú < t, f(t) : o.ru I < t < 4,,
(t):0 I
para los demás valores de ú. Calcule Ia probabilidad de que el tiempo de espera sea:
f
98 Capítulo 3. Variables Aleatorias, Esperanza y Varianza
22 Los registros de ventas diarias de una empresa que comercializa computadoras muestran que
venderán 0, 1 o 2 computadoras de acuerdo a Ia siguiente tabla:
No. de ventas 0t1t2
Probabilidad
24. Una empresa alquila el tiempo de cómputo de un tipo especial de computadora a una universidad.
La empresa debe planear su presupuesto, por lo que ha estudiado el tiempo de empleo de Ia
computadora. El tiempo semanal de alquiler (en horas) sigue la función de densidad dada por:
si o( t<4;
*U'n-U'
f(t):{ 0,
[ caso contrario.
25. La cantidad de pan (en cientos de kilogramos) que vende una panaderÍa en un día es una variable
aleatoria con función de densidad
cÍ, si 0Sr13;'
c(6-r), si 3l r16;
0, caso contrario.
a) Encuentre el valor de c;
b) ¿Cuál es la probabilidad que el número de kilos de pan que se vende en un día sea: (i) más
de 300 kg?, (ii) entre 150 y 450 kg?;
c) Denote por A y B los eventos definidos en (i) e (ii), respectivamente. ¿Son independientes
Av B?
26. La cantidad (en gramos) de fertilizante químico que una planta puede recibir es una variable
aleatoria cuya función de densidad es
f srla z;
(r): { ff, - si r € [o' 8];
f
0,[ caso contrario.
Ejercicios 99
l;. Se extrae una bolita al azar de un bolillero que contiene 3 bolitas numeradas de 1 a 3. Llarnamos
X al número de la bolita extraída. Una vez conocido el valor de X, extraemos una nueva bolita
alazardeotrobolilleroquecontiene4-XbolitasnumeradasdeXa3(porejernplo: siX:2,
la segunda bolita se extrae de un bolillero que contiene dos bolitas con los números 2 y 3).
Llamamos Y al número de la bolita extraída en el segundo bolillero.
f(n\:Ir'siz€[o'1];
\"¿/-lo, sizl[0,t].
a) Si Y - X2, halle la función de distribución de Y;
[ si z [-1,1].
Halle Ia ley de la variable T : -52.
i.'. IJna variable aleatoria X tiene función de densidad
rf") : (! sir€l-z,Z);
I o1 si n ( l-2,21.
Halle la probabilidad Pr(X2 < 1).
5,
sig€l-t,Z];
0, caso contrario.
Una variable aleatoria X tiene función de distribución Fy(r) - 1 - e-o', si r ) 0. Halle las
funciones de densidad de:
100 Capítulo 3. Variables Aleatorias, Esperanza y Varianza
{Y:f7; b) Z :1tnt.
En las secciones precedentes vimos que una variable aleatoria queda definida por su función de dis-
tribución, pero muchas veces solo se desea tener una idea del comportamiento general de las variables
aleatorias, sin dar detalles de su distribución de probabilidad; para tal propósito, examinaremos dos
características teóricas de las variabtes aleatorias: la esperanza y la varianza, que son dos parámetros
que miden la Iocalización y la dispersión de Ios valores que toma la variable.
1. Si X toma un número finito de valores rr¡ 12, ..., rn con probabilidades h:Pr(X : rt),
pz : Pr(X : r2), . . ., pn: Pr(X - ,n)t
E(x) : f,o*rr.
l^-1
2. SiX toma un número infinito de valores rr, 12, .. . con probabilidades p¡ : Pr(X : rk),
k:I,2,-..; oo
E(X) : ln*"r.
/c: f
E@:
l: rf (r) dr.
Observación. Si /(r) toma valores distintos de cero en un intervalo [a., b], Ia esperanza se calcula
como
Fj(x): rf (r)d,r.
L
La esperanza posee varias propiedades, independientes del tipo de la variable aleatoria. A continuación
vamos a enunciarlas y demostrar algunas de ellas, en el caso de una variable aleatoria continua, los
otros dos casos quedan como ejercicio para el lector.
Propiedades
D en¿ostt'o,ciór¿:
dis-
2. Aditividad. La esperanza de la suma de dos variables aleatorias es igual a la suma de la^s
bles
esperarrzas de los dos surnandos:
dos
tIoS E(x+Y) :E(X) +E(Y).
3. Un factor constante c se puede sacar del símbolo de la esperanza matemática:
E(cX) : cE(X).
Demostración:
l'c. f@
E(cX) : (r) O, : (r) dx : cE(X).
.l_*crf " .l_*rf
4. Sea g una función real, la esperanza de la variable aleatoria Y : S(X) está definida por
E (x,) : l:,2¡q,¡d,.
5. Si X y Y son dos variables aleatorias independientes
E(xv) : E(x)E(r).
Observaciones:
E(Y):aE(x) +b.
1 2. Si la función de densidad es simétrica respecto a Ia recta
3.5)
r: rr¿, entonces E(X) : rn. (Figura
rria y
ücula
aclon
a, los
Dos variables aleatorias con la misma esperanza pueden tener distribuciones diferentes. Para diferen-
-iarlas es lecesario introducir otra característica teórica que informe sobre la dispersión de su posibles
r-alores.
LO2 Capítulo 3. Variables Aleatorias, Esperanza y Varianza
3.5. La varianza
L¿r iclea de <lspelanza no ittclica cótuo cst¿i clistlibuicl¿ Ia m¿ts¿r en torrro ¿ su <l<ntro; ósto sc explrcs¿)
rrrecli¿rnte la Ia valiable ale¿rtoria X, que se nota Var(X) o o2.
uari,an,zo, de
Definición (de varianza) La varianz¿t de nn¿t variable aleatoria X es rrn núrmero no negrrtivo que
se calcula por:
Var(X) : E(X -E(X))',
o, equivalentemente, por
Var(x) :E(x2) - (E(x))''
1. Para una variable aleatoria discreta que toma un número finito de valores rtt r2t .) trn con
probabilidades p1 : Pr(X : rt), pz:Pr(X : rz), ..., pn: Pr(X : r,-)i
2. Para una variable aleatoria discreta que toma un número infinito de valores rr, 12, .. . con
probabilidades p¡ : Pr(X : rk), k : L,2,. ..:
La varianza da la idea de cuán ampliamente dispersos se encuentran, en torno de la media, los valores
que toma Ia variable aleatoria:
1. Una mayor varianza indica que Ios valores tienden a estar más alejados de la media.
2. Una menor varianza indica que los valores tienden a estar más concentrados alrededor de la
media.
o:\@.
3.5. La varianza 103
Propiedades
Var(c) : g, c constante.
Den¿ostración:
Var(oX + b) : a2 Yar(X).
Fj,emplos
de la
-. La variable aleatoria discreta X está definida según Ia ley
x I -41 6 10
p10.2 10.3 0.5
3
a) E(X) : D : -4 x0.2 +6 x 0,3 * 10 x 0.5 : 6.
A:1 "xp*,
Calculemos E(X2):
Entonces,
Var(X) : P(X2) - (E(x))2 :64 - (6)2 :2a.
b) Vamos a aplicar las propiedades de la esperanza y la varianza para calcularlas:
xl 1oo I so I ro I o
p | 1/Boo | 1/3oo I sTaoo I zoaTaoo
Así,
293
E(X) rooxfr*5ox #.rox.*I+ox 300
0.67.
Como la persona paga 1 dólar por el boleto, Ia ganancia (total) esperada es E(G) : 0.67 - 1-
-0.33 dólares; es decir, una pérdida.
3. Una persona quiere abrir una puerta y tiene 5 llaves, de las cuales solo una corresponde a la
cerradura. La persona va eligiendo al azar y probando abrir Ia puerta. Calcular la esperanza y
la varianza del número de intentos si separa las llaves que probó anteriormente.
Solu,ción: Como cadavez separa las llaves utilizadas, cada llave tiene la misma probabilidad de
abrir la cerradura; por lo que la variable aleatoriaX: <<número de llaves utilizadas>), sigue la
siguiente ley:
xl1 I 213 I 4l b
Entonces,
515
E(x): D*ou:;I/c:3,
l--1 t- r
515
E(x') : Dk'rr:;tk2:rr,
l': I [:1
Var(X) : lI - 32 :2.
3.5. La varianza 105
4. Una variable aleatori¿r X toma solarnente dos valores rt- y r2t tales que 12 > r1. La probabilidad
de que X tome el valor zl es 0.6. Hallar la ley c¡re sigr.re X, si la esperanza rnatemática y la
varianza son conocidas: E(X) :1.4 y Var(X) :0.24.
Sol'uci,ón: Esclibamos Ia ley de X:
La ley de X2 es
Entonces,
E(X') :0.6r? + g.arl
v
Var(X) : n(X2) - [E(X)]2 : 0.6r? + g.arl - r.42 : 0.24
I o.aq t olq:1.4
\ o.o"l -t o.4r| :2.2
.6 t.4
(,1. z
si Ít<, -1;
F(r) : si -1l<r 3;
si r,) ' .).
(r): si -1(r(3;
f
caso contrario.
De manera que
E(x) : (,)l_,
rf
1)
o":
e (x') :
[_,
r2r@ (i) r"
106 Capítttlo 3. Variables Aleatorias, Esperanza y Varianza
Pot lo t¿urto,
v.u(-K) : p (x') - (E(x))2 :: - r' :: .)
J
b) Tenerrros la vari¿rblc ¿le¿rtor-i¿r Y :5X *2, cuyzr. función de densiclad no la corrocerno$. pero
podenos enrplezrr' las propiedacLes cle Ia esperanza y de Ia varianza:
E(Y) : :5E(X)+E(2) :5 x It2:7,
E(5X +2)
Var(Y) : Var(5X + 2) :25 Var(X) :25 x * : +
.) .)
b. Una valiable aleatoria X está definicla por slr densidad J'@):r+l2 el intervalo (0, 1), fuela
"n
de este intervalo f (r):0. H¿llar la esperanza matemática de la variable aleatolia Y : X3.
Soluctón:
E(v) : rs f @) o, : ,t (, **) o,
.lo'
,)ar:1" *1 4l '
)"- ls 2 a)o
u--.40I3
7. Determinar la esperanza y lti ', ' a valiable aleatoria 7 cr.rya fnnción de distlibrrción
csF(ú) -1-e2t,t>0.
Soluczón: La función de deusidad es:,/(/) : F'(t):2"-2t, ú > 0; y 0, caso contr¿rrio.
Calculemos Ia esperarrzn:
fx
tr(x) : /.oo
2re-2''d,r.
.l_,"r.tb)nt: .lo
Irrtcgrando por partes, ponicriclo rL: :1. rl,u : e-2'cl,r; pol lo tanto: ilu,: dn, Lu : _
'r"-r',
: -rc2 l-*1 l'n
2'
l'*
.lo r".,,rh
ln'2.1u "-r."rl,
,"-" l* 1 __r,.1-
z io-4c l.
;'^'^
Entonces,
E(X): , lo*
,"-'2'rL*:r(i) - I
Necesitamos el cálculo cle E(X2):
var(X) : E (X,)
1 tt/1\2 1
- (tr(.Y))2
o \ol
\o /
¡
"
S.S. La varianza
Etr ttlt slll)crlriercacro se r¡o,,.1,. ,,-.-
ro7
-.
crescrir,e ; ;;;;'.,". .:ff:fii:::;1ij,."":J1,*,:,i:"..T;"^,jj,f,:i,,ililTjc arcaroria quc
.f(r):[;*'sjo<'<5o;
I o, caso contrario.
a) ;.Crrál es Ia c¿nt jdact
de calnc quc se esr)
Ü¡l)el'a vender diariamente
llién, halle ia desviació" en el supermercaclo?
Tam_
"r*0""..oq
b) Si la ganancia en el producto
se expresa
-r"4vvu por
ganancia esperada. vvL la ecuación
r'L ccuaclÓn C:
).
a) Calcularemos l¿
de la variable aleatoria
efectúra ,ro"r.lr,lifjlllza como er indicador
de las ventas que
",
E(x): ['o
to " Gil o*: # fo,o
,, o,
,hl#]; :3333
Así' el supernrercatro
espe.aría
-- vender
Calcrrlernos E (X2): 'v'uL 33.33 kg diarios cre car'e.
La r.ar.iarrza es
-\v'/ :
E(c) n(2.-, \
"rl*o" *'o):
.r
P,_1
Propiedad 1. Va € (0,1), , It,
41,-
l.;:0 | - (L
I (1 -P)A
po,:-ñ7, h:I,'2,..,;
L- 1.' P€ (0,1).
: io-,k:i(-#) (r -P)k ¡
E(x)
A=1 A:1 '
: l-r) i,'- :- (*)
\ I'p)3' ir, -or*
\nP/7_o
p)k
: L-p
Dttono
: ct + q2 + q3 +... - Dnr
k:1 k:r
: /. r,\\ ¿
'P)
3.6. Función generadora de rnornentos 109
Los momentos de una variable aleatoria son númelos que representan algunas calacterísticas de la
jistribución de probabilidad asociada. Bajo ciertas condiciones el conjunto de momentos determinan
ie manera única a la ley de probabilidad.
Definición (Mornentos) Sea X una variable aleatoria y sea r¿ un número natural. Cuando existe,
el nútrnero pr:E (Xk) es el k-ésimo momento de X.
f ntonces, tenemos que Ia media p es el primer momento de la variable aleatoria; es decir, F: lJt.
-isociada a cada variable aleatoria podemos encontrar una función que permite calcular sus rnomentos.
fsta función tiene Ia propiedad de que, al igual que la función de distribución, caracteriza de manera
:rica a la ley de probabilidad de la que proviene
M(t):E("t"),
iefinida para valores reales de ú tales que la esperanza existe.
- . función generadora de momentos se utiliza tanto para variables aleatorias discretas como continuas.
alrt o
Ejemplos
x I -4 I 6 I 10
p 102 | 0.3 | 0.5
Solución: Resulta que
I[(t) : E("t"):|pr"tr
k
: 0.2 e-at * 0,3 e6¿ f 0.5 e1o¿
Hallar la función generadora de momentos de una variable aleatoria cuya función de densidad es
rI si
r, ' I
f\L;): \ -.
4 -1<r(3;
[ 0. caso cont rario.
,et' 4
r- siguiente resu.ltado nos indica córno se pueden obtener los momentos de cualquier orden con el
:-:rpleo de la f.g.m.
110 Capítulo 3. Variables Aleatorias, Esperanza y Varianza
Teorema. Sea X con furrción generaclora de rnomentos,4f (rl), con derivadas continuas dc cualquier
orden; entonces,
.,_
I-Ik-L qlxu):
j-nt,,,l
tr,,,=o
\-'/- dj",
Es decir, el k-ésimo momento de una variable aleatoria se calcula como la derivacla de orden k de la
f.g.-., evaluada en cero.
Observación. Se tiene que E(X) : Ft y Var(X) : Fz - F?.
Ejemplos
x I -4 I 6 I r0
p10.2 10.3 10.5
Soluc'ión: Antes calculamos que il{(ú) : 0.2 e-4t * 0.3 e6¿ * 0.5 e10ú; por tanto,
.1
: _0.8e-at * 1.8e6¿ * belo¿
aual
t,)
o.-
AI ft) : 3.2e-at * 10.8e6¿ f 50e10Ú.
dt2
Entonces,
ltt :
ftnup¡: -0.8e-a(o) + 1.8"u(o) -¡ 5"10(0) : 6,
(l
I@):l q,'si -1<r(3;
[ 0,
conrrario. caso
Por tanto,
!u,rt (3t-1)e3¿*(1-t)e-r
dt ¡t2
+t,
(st' - 6t + 2) e3t - - l:
.-)
',:r
#,u,
3,7. Ejercicios 111
¿2
Puesto que 1,1(ú) no está definida para l, : 0. para hallar M (0) aplicaremos la
*r*r|, ,ljz
regla de L'Hospital; entonces,
¿2
Por lo tanto,
Var(X) : pz- Lr?: 56.4
243
3.7. Ejercicios
l. Halle la esperanza y la varianza de las variables aleatorias discretas definidas por
xl-0.7t10.24 10.61 Yt 2 t 4 t 5 I 6
pl 0.2 10.5 10.3 p 10.3 10.1 10.2 10.4
Se escoge aleatoriamente un número de conjunto $ : {-1;0; 1}. Sea X el número escogido.
Encuentre su valor esperado, La varianza y la desviación estándar de X.
¿Existe una variable aleatoria X que cumple qLre E(X - 2) :8 y que E ((X + 1)2) : 120?
a) Jx\r): r;
I b) fy(r):lrl. c)fx@):t-lzl. d) f x@) :t '.
Encuentre la esperanza y desviación estándal de las variables aleatorias definidas mediante las
leyes:
f 0. si r ( l;
.) r(,) :{ +, si 1(.c14;
t,I sir>4.
t12 Capítulo 3, Variables Aleatorías, Esperattza y Varianza
(o sir!1;
l:lr): {L2-r'
,
t2 - si11.r.<2;
b)
I t. sir)2.
c) r,-..:l I Zr. si z e (0. l):
/(rt o. sir((0, 1).
d) ' ))' * Br - l2). si r € (-5. -3):
..\ <Í - *frt
f¡,(t:):
--
I O, caso contrario.
(t. si re [1,2]:
e) f(r):1 '
I o, si zl11.2l.
(Determine primero el valor de c.)
8 Una variable aleatoria X toma los valores 4, 6 y o con probabilidades Pr(X - 4) : 0.5, Pr(X :
6) : 0.3 y Pr(X : a) : p. Si se sabe que 1a esperanza de X es igual a 6, halle los valores de p
ya.
q Halle la varianza de una variable aleatoria Z q:ue solo puede tomar dos valores, el uno el doble
del otro, con la misma probabilidad, si se sabe que E(Z) :0.9.
10 I-a variable aleatoria discreta X tiene solamente dos posibles valores: rr y fr2, además 11 1 12.
La probabilidad de que X tome el valor 11 es igual a 0.2. Halle Ia ley de distribución de X.
conociendo la esperanza E(X) :2.6 y la desviación estándar o : 0.8.
11. Una variable aleatoria X puede tomar tres valorest r,1 : -I, 12:0 y 13:1. Si se conocen las
esperanzas matemáticas E(X) :0.1y E(X') :0.8, enci-r.entre las probabilidades Pt,Pz yp¡, de
los I'alores rt, 12 y 13) respectivamente.
12. La variable aleatolia X tiene ítnicamente tres posibles'u.alores rr:1,:x2 y x3 (rt < rz <'J4).
Las probabilidades de que X torne los valores rr y 12 son respectivamente iguales a 0.3 ¡,'
A.2. Determine la ley de distribución de X, conociendo Ia esperanza E(X) :2.2 y la varianza
Var(X) :0.76.
i3. La variable aleatoria X tiene función d e distribución
0, parar12l
F(r) : arlb, para21r14;
1, parar>4.
a) I{alle e1 valor de las constantes cr y b;
74. Suponga que se escoge un núrmero real X en el intervato [2; 10] con urra función de densidad de
Ia forma f (r) : Cz, donde C es una constante.
a) Halle el valor de C;
b) Calcule Pr(D), donde ¡1 : 13;71;
c) Encuentre Pr(X > 5), Pr(X < 7) y Pr(X2 - 72X * 35 > 0):
d) Encuentre la espera\za y la varianza de X.
3.7. 4jercicios 113
15. Uu cstudiante rinde ttnil plr-reba consisterrte en 2 probleuras de elección múrltiple. La primcra ticrrc
3 posiblcs resprtest:rs y la scgurrda 5. El estrrcliante cscoge las 2 r'espuestas al ¿rz¿rr. Encuentl-e:
6 tlna organizac:íón benéfica realiza una rifa para conseguir fondos. cn la que sc vendieron 10000
boletos, a 4 dólales cada uno. E1 prerrio es un antomóvil de 12 000 dólares. Si un ciudadarro
compra 2 boletos, ¿cuál es la ganancia esperada del comprador de los boletos?
IJna persona participa en un concurso de la televisión. Le hacen una pregunta con 5 respuestas
(solo una es verdadera) si acierta, gana 10 000. Si falla le vuelven hacer otra pregunta con tres
posibles respuestas de las cuales solo una es verdadera. Si acierta, gana 1000 y si falla se le
vuelve hacer otra pregunta con solo dos respuestas si acierta, entonces no gana nada y si falla
pierde 500. El juego termina cuando la persona acierta c después de fallar la tercera pregunta.
Se asegura un vehículo de 50 000 dólares por su valor total, pagando una plima de C. Si la
probabilidad de robo en un año es de 0.02, ¿cuál es el valor de la prima que debe cobrar la
compañía de seguros, si espera ganar 200 dólares?
9 Si Roberto termina sus estudios en Junio, podrá disfrutar de una beca para poder realizar un
curso de especialización con todos los gastos pagados. Si aprueba en Septiembre, la beca sólo le
cubrirá el 40% de los gastos. Si no consigue aprobar, también realizará el curso pero abonando
50000 dólares, que es 1o que cuesta. Roberto sabe que la probabilidad de aprobar en Junio es
sólo de un 10%, mientras que la de aprobar en Septiembre es de:un 4ATa.
:0, Una agencia que renta autos tiene disponibles 4 carros todo terreno, para alquilarlos. El precio
de alquiler de cada carro es 60 dólares diarios. En un estudio de mercado el propietario ha
determinado el siguiente modelo probabilÍstico sobre la demanda de estos autos:
Demanda Probabilidad
0 0.05
1 0.10
2 0.20
c
r) 0.25
4 0.20
5 0.15
() 0.05
Además, en el mismo estudio ha encontrado que sus gastos diarios son: 20 dólares por alquiler
del local y 15 por pago a ul empleado.
lL4 Capítulo 3. Variables Alcatarias, Esperanza y Vatiai;za
a) C¡rlcttltt r:l tLítrrtelo csp<:r'aclo dc carlc-'s tocl,r tellerro <¡re la agencia alqr-',il.rrri urr rlÍa (;Lralquiera;
l,) CalcrLl<-r ltr girrrnirciir cli¿rli¿ csperad a:
,') Caicule Ia <l¡:sviación cst¡inclal cle lii gzrrranr;iir
'21 Urr poltafolio r-lc invcrsi<irr sig-ue r:l .,iguicltc: (iselr€r1ir lrlolrabilístic:o:
22.Uncírculoderaclio1eszonificaclcen10"írculoscorcélrtricosd.eradios "' 10
10' 10"
lanza un dardo sobre el círculo, si éstc cac en la zona ccmprerdida ertre los cír'culos de radios
i^"lJellar:zad.organa10-idólalcs, i:0,l,...,g.SeaXlacantidaddedineroganaclo,
i0 10
a) Halle Ia ley de la variable aleatolia X;
b) Calcule su esperanza y su varianza.
23. EI espesor del recubrimiento de unos cables tiene funciórr de densidud ry, corr 100 l1rn <:r <
'r'¿
2ao ¡tm.
a) Determirre la media y la varianza del espesor del recublimiento;
b) Si el costo del recubrimiento es de 0.5 délares por micrómetro de espesor, ¿,cuál es el costo
medio por recubrir los cables?
24. Un supermercado tiene una dcmanda dialia variable X de la cantrdad de caile que vende, de
tal manera que X (medida en cientos de krlogramos) tiene una funcrón cie densidad
(
f@):1oq1r'. sio( r<4'
|. 0, caso contrario.
26. El tiempo de uso diario de la red Internet en Lrna oficina tiene p,-r1 :r,;r-ción cie densidad (medida
en horas) a
( gr2(g - ,\
f("):{'-ñr-' sio(¡(s:
0, [ carco conira:- .
3.7. Ejercicios r-15
a) Calcrrle cl v¿rlot eslrclaclo y la virriarrza rlcl tieurpo <.lialio clc rlso de l¿r lecl Intelnel,.
lt) El tictlitct cle ttso ilc Irrtcrrrcl' crlcsta 2 clólares pol hora. C¿Llcule el v¿r,lor esperiiclo v lzl
clesviat:ióu estárrdat ck:l costr¡ scur¡-n¿ri (cn 5 clÍas laLorablcs) por el citilrio rrso.
La lcy cle 1tloltabiliclacl rlue rlesclibc la clistarrr'lia (cn inctros) a Ia. <¡-re un atlet¿r lanza la,jabirlina
CS
a) Halle la probairilicl¿rd de qLre rula jal;alir'a lanz¡id¿r llcgue a nna dist¿rncia mayor quc 60 m;
b) Determinc el valor esperado dc Ia distancia a la que llr:ga la jabalina;
c) Halle Ia varianza y la desviación estándar de la distancia cubielta por la jabalina.
:3 Dcmuestre quc la ebperanza y la valianza de Ia variable aleatoria discreta definida por
Calcule:
Halle la esperanza matemática y la varianzadela variable aleatoria Sn: Xrt Xz*... * Xr.
116 Capítulo 3. Variables Aleatorias, Esperanza y Varianza
33. Las variablcs aleatolias X1 , X2, . .. , Xrr,Y,Yz,. . . ,Y,, son independicntes. Pongamos
E(X¡,) : a, Var(X¡) : s2
35. Sean XyYdos variables aleatorias independientes e idénticamente distribuidas con f.g.-. M(t)
Demuestre qtte My¡y(t): Mx(t)llv(t) y qlue My-Y(t): Mx(t)M\'(-t)-
36. sea X con f.g.m. Mx(t), y sean a y b dos constantes. Demuestre que Moy¡6(t):"'btwx(ot).