You are on page 1of 306

y probabilidad

Edgar Possani Espinosa
Preuniversitario
Santillana
El libro Estadfslica y probabilidad fue elaborado en Editorial Santillana
por el siguiente equipo:
EDICI 6N
Sergio G. Lopez Hernandez
REVI SI6N TtCNICA
Silvia Vazquez Gal ina
CORRECCI 6 N DE ESfilO
Ester Alizeri Fernandez
CUIDADO DE lA EDI CI 6 N
Veronica S. Hernandez Robles
OISENO DE INTERIORES
losl: Luis Acosta
DISENO DE PORTADA
Francisco Ibarra J\leza
Yair Caiiedo Camacho
INVESTlGAC16 N I CON OG RAFICA
Paula Arroio Sandoval
I LUSTRACl 6 N
Heidi Puon
Abebrdo Cull.'bra Bahena
lose Luis Acost.}
FOTOGRAFiAS
Rocio Ech:i.varri Rentaria
Heidi Puon
Gabriel Martinez J\leave
Archi\'o Sant illana
Jupiter Images
DI AG RAMACION
Heidi PUOll
Jose Luis Acosta
La preselltacion r disposicion en conjunto y de cada pagilla de Estadistica )' probabilidad son
propiedad del editor. Qlleda estrictamente prohibida la reprodllccion parcial a total de esta obra
par cualquier sistema 0 metodo electronico, incluso el fotocopiado. sin autorizacion eseri ta del
l'ditor.
© 2008 por Edgar Possani Espinosa r Leticia Barreiro Castellanos.
D. R. © 2008 por EDITORIAL SANTI LLANA. S.A. DE C\'.
A\,. Uni\'ersidad 767, 03100, J\lexico, D. F.
ISBN: 978-970-29-2166-0
Primera edicion: abril de 2008
Segunda reimpresioll: marza de 2011
!\Iiembro de la Camara Nacional de la Industria Editorial !\\exicana. Reg. NlLlll. 802
IMPRESO E ~ ~ I E X I   O
Santilla a
Unidad 1. Estadistica descriptiva 8
Introducci6n 10
1 Descripci6n de datos por medio de tablas y graficas 12
Diagrama de tall o y hoja 13
Distr ibllcion de frecuencias 16
Histograma 22
Gnificas circulares y poligonos de frecllencias 30
Frecuencia aCllmlllada y ojiva 32
2 Medidas numericas representativas 34
Int roduccion a la sumatoria 34
Medidas de tendencia central 35
Medidas de variabilidad 40
3 Anillisis de datos bivariados 48
Diagrama de dispersion 48
Repaso 52
Matematicas y otras ciencias 53
Actividades 56
Autoevaluaci6n 60
Ejercicios de refuerzo 63
Unidad 2. Conjuntos y combinatoria 68
Introducci6n 70
1 Fundamentos de la teorfa de conjuntos 71
Fonnas de expresar un conjunto 72
Conjunto finito e infinito 74
Nociones basicas y simbologia 74
Operaciones con conjuntos 78
Dife rencia de conjuntos )' complemento 82
Cardinali dad de conjllntos 86
Cardinali dad y operaciones con conjuntos 90
Santillana fNDICE D E CONTEN I DO 3
r
4
2 La combinatoria
EI principio de la multiplicaci6n
Factorial
Pennutaciones simples y circul ares
Permutaciones con repetici 6n )' variaciones
Combinaciones
EI tria ngulo de Pascal
EI binomio de Newton
Repaso
Matematicas y otras ciencias
Actividades
Autoevaluaci6n
Ejercicios de refuerzo
Unidad 3. Probabilidad
Introducci6n
1 Experimentos y espacio muestral
Espacio muestral equiprobable
2 Eventos
Eventos combinados
3 EI concepto de probabilidad
Propiedades de la probabilidad
Probabilidad condicional
Independencia
4 Variables aleatorias
Valor esperado
Varianza y desviaci6n estandar
Repaso
Matematicas y otras ciencias
Actividades
Autoevaluaci6n
Ejercicios de refuerzo
[NOICE DE CONTENIDQ
97
100
103
106
109
113
117
120
124
126
130
132
133
136
138
139
142
144
145
148
151
155
161
164
168
171
176
178
181
183
185
Sant:'lana
Unidad 4. Estadistica inferencial 188
Introducci6n 190
1 Distribuciones de probabilidad 192
Distribuci6n binomial 192
Distribuci6n normal 197
Aproximaci6n normal de la binomial 204
2 Muestreo 207
Censo 209
Proceso de muestreo 210
Muestreo aleatorio probabilistico 216
Dist ribuci6n muestral y el teorema central del limite 233
La aplicaci6n de cuestionarios 240
3 Regresi6n lineal 245
Covarianza y correlaci6n 247
Estimaci6n de los para metros de una ecuaci6n lineal 253
4 Pruebas de hip6tesis 259
Repaso 267
Matematicas y otras ciencias 272
Actividades 274
Autoevaluaci6n 276
Ejercicios de refuerzo 278
Apendice. Soluciones de ejercicios selectos 282
e Santillana iNDICE DE CONTENIOO 5
E
I objetivo de est a obra es ensenar los fundamentos de la estadistica
y la probabilidad a estudiantes que cursan la materia en el ultimo
al10 de bachillerato. sobre todo -aunque no exclusivamente- a quie-
nes siguen el plan de estudios de la Escuela Nacional Preparatoria
(ENP) de la UNAM.
A 10 largo del Iibro se explican los temas esenciales con objeto de
que la obra resulte util por igual a alum nos inscritos en areas cien-
tificas que a los que han decidido dedi carse a alguna disciplina huma-
nistica.
Para ello se han incluido numerosos ejemplos y ejercicios proce-
dentes de diferentes ambitos. con 10 que se busca fomentar el recono-
cimiento de los aspectos matematicos implfcitos en diversas act ivida-
des. asi como favorecer las habilidades del estudiante relacionadas con
la busqueda. la organizacion. el analisis. la interpretacion y la presen-
tacion de los datos.
En la primera unidad se abordan los conceptos y las herramientas
gnificas fundamentales de la estadistica descriptiva; en la segunda se
explican los temas esenciales de la teoda de conjuntos y la combinato-
ria. en tanto que en la tercera se establecen las bases de la teoda de la
probabilidad para que. final mente. en la cuarta se integre todo 10 ex-
puesto en aplicaciones de la estadistica inferencial como el muestreo y
las pruebas de hipotesis.
Esperamos que esta obra motive el gusto de los estudiantes por la
materia y les permita comprender no solo la utilidad sino. tambien. la
necesidad de contar con bases solidas en estadistica y probabilidad
para su futuro profesional.
Deseamos expresar nuestro agradecimiento a Luis Felipe Gonzalez
Perez. colega nuestro dellnstituto Tecnologico Autonomo de Mexico
(ITAM). por las sugerencias y la orientacion que nos brindo al princi-
pio de la obra.
LOS AUTORES
7
KARL PEARSON
La estadistica es una disciplina de alleja prosapia, ya que desde la anti-
giiedad los romanos obtenian datos para analizarlos y contar asi con
informacion que les resultara provechosa en el momento de tomar de-
cisiones de Estado.
Durante cientos de ailOS se han utilizado tecnicas estadisticas para
organizar, resumir y analizar datos. Hay numerosas herramientas usa-
das con tal proposito: tablas, representaciones graficas, promedios,
porcentajes, indices. Hoy en dia, todas ell as aparecen constantemente
en diarios, revistas y noticiarios radiof6nicos 0 televisivos para descri-
bir al publico, de forma comprensible y eficaz, situaciones 0 procesos
que de otro modo resultarian dificiles de entender.
La estadistica actual es producto del encuentro, en el siglo XIX, de
dos disciplinas: la estadistica antigua y el c:llculo de probabilidades, 10
que permitio el desarrollo de procedimientos para extrapolar conclu-
siones obtenidas a partir de un conjunto de datos a otro conjunto de
observaciones potenciales. Esta rama se conoce como estadistica infe-
rencial, y se considera a Karl Pearson (1857-1936) y Ronald Fisher
(1890-1962) sus fundadores.
Por otra parte, los metodos que organizan y resumen datos consti-
tuyen la rama de la estadistica que llamamos descriptiva, tema del que
nos ocuparemos en esta unidad, en la medida que concierne a un pro-
grama de estudios de bachillerato.
A fin de emplear un lenguaje comun a 10 largo del texto, vale ade-
lantar que en estadistica el conjunto completo de individuos sobre los
que pueden realizarse observaciones de interes se llama poblacion,
mientras que un subconjunto de 1a poblacion se llama muestra.
Tal generalizacion implica un riesgo, puesto que las conclusiones a
que se llega parten de informacion disponible, pero incompleta. De
ahi la importancia de elegir una muestra representativa de la pobla-
K
arl Pearson (Land res, 1857-1936) comenz6 a desarrollar conceptos esta-
disticos en 1890; publico alrededor de 100 artfculos, en su mayorfa apli-
caciones de la estadfstica a la biologfa (crefa en la eugenesia), en los que
introduce conceptos muy conocidos hoy en dia. como desviaci6n estcindar.
En 1911 fundo el primer departamento de estadfstica en el University Colle-
ge London.
10 UNlOAD 1 • ESTAOfsTICA DESCRIPTIVA ClSantlllana
ci6n )' Cltantificar los riesgos asociados con este proceso. Naturalmen-
teo existen metodos para detenninar el tamafio de la muestra )' proce-
dimientos para elegirla; estudiaremos algunos de ellos en la unidad 4.
Imagina que en una universidad se puso en marcha un nuevo siste-
ma de inscripciones por telefono. en el que los estudiantes pueden
elegir cursos y horarios por media de un telefono de tonos. EI consejo
administrativo esta interesado en conocer la opini6n de los alum nos
acerca de la eficacia del sistema. pero encuestar a todos )' cada uno de
ellos resulta muy costoso y supone demasiado tiempo.
Por ello. elegira una muestra de 400 estudiantes. a quienes se pre-
guntanl. entre otras cosas. cuantos intentos requirieron para co nec-
tarse al sistema. cuantos cursos eligieron y en cuanto tiempo termina-
ron la inscripci6n.
EI resultado de esa en cuesta sera un gran conjunto de datos. en cuya
organizaci6n. resumen y anal isis se aplicaran tecnicas de la estadistica
descriptiva.
Luego. con base en la informaci6n de la muestra se empleanin me-
todos de estadistica inferencial para obtener conclusiones acerca de
toda la poblaci6n de estudiantes que utiliz6 el sistema.
Pero no adelantemos visperas (recuerda que estudiaremos estadis-
tica inferencial en la ultima unidad del libro) y empezamos por estu-
diar c6mo se presenta la informaci6n en forma organizada.
o Santillana lntroducci6n
11 _
_ 12
Descripcion de datos por
Los individuos de una poblacion poseen muchos atributos, a los que
designaremos variables, que pueden ser estudiadas. Por ejemplo, en
un grupo de estudiantes una variable es la religion que profesan, otra
su estatura, otra mas su edad }' otra su sexo.
Notemos que hay diferentes tipos de variables; en este caso, la reli-
gion I' el sexo son atributos categoricos 0 cualitativos, pues no es posi-
ble cuantificarlos ni medirlos, de modo que la respuesta que de al res-
pecto cada individuo 10 incluira automaticamente en una categorfa
(digamos, catoli co 0 anglicano; hombre 0 mujer).
Por otra parte, la estatura I' la edad son at ributos nunu!ricos 0 etlan-
titativos, ya que ambos son mensurables: la estatura se puede medir I'
la edad, con tar.
Las variables 0 atributos numericos, a Sli vez, se clasifican en discretos
I' continuos. Un conjunto de datos numerico es discreto si sus valores
posibles son puntos clara mente separados. Un conjunto de datos nume-
rico es continuo si sus valores posibles estan dentro de un intervalo.
Ejemplos
Determinemos de que tipo son los datos siguientes.
1
Se pregunto a un grupo de 10 personas cual marca de mayone-
sa prefiere. EI conjunto de respuestas es:
{MCornesa, Helltap, La sabrosa, MCornesa, La sabrosa,
MCornesa, MCornesa, La sabrosa, Helltap, La sabrosa)
Se trata de un conjunto categorico.
2
En un un centro de soporte tecnico se registro durante 12 ho-
ras el numero de lI amadas telefonicas recibidas cada hora y se
obtuvieron los datos siguientes:
{3,0,4,3, 1,0,6,2,0,0, 1, 2}.
es decir, durante la primera hora se recibieron tres lIamadas, en la
segunda nadie llama, en la tercera 10 hicieron cuatro personas y asf
sucesivamente.
En este caso, se trata de un conjunto numerico y discreto.
UNlOAD 1 • ESTADiSTlCA DESCRIPTlVA © Santillana
Una vez que identificamos de que tipo es el conjunto de datos que se
estudiara, hay varias formas de presentarlo para que muestre informa-
ci6n Mil y se facilite su a",ilisis. Entre elias se cuentan las siguientes:
a Diagrama de tallo y hoja.
b Distribuci6n de frecuencias.
c Histograma.
d Grafica circular.
e PoHgono de frecuencias.
f Frecuencia acumulada y oj iva.
A continuaci6n explicaremos de que se trata cada una de elias.
Diagrama de tallo y hoja
EI diagrama de tallo y hoja es una forma de organizar y desplegar la
informaci6n, con 10 que se facilita el anal isis visual de la distribuci6n
de datos del conjunto.
Para construir un diagrama de tallo y hoja se considera que cada
observaci6n (cada dato registrado) consta de dos partes. Uno 0 mas de
los digitos principales que la componen forman el tallo, en tanto que
el resto constituyen la hoja.
Por ejemplo, si el conjunto de datos consiste en la puntuaci6n obte-
nida en una prueba y los resultados son enteros entre 200 y 800, se
puede elegir el primer digito del lado izquierdo (centenas) como el
tallo y el resto (unidades) como hoja, de modo que si una observaci6n
es 641. su tallo es 6 y su hOja, 4l.
La elecci6n del tallo y la hoja depende de los datos observados
(observaciones) en el conjunto. Si en este todas las puntuaciones se
hallan entre 500 y 599, entonces se pueden elegir los dos primeros
digitos como tallo, p"es de 10 contrario todas las observaciones ten-
drian tallo igual a 5. Asi, si un dato fuera 538 su tallo seria 53 (dece-
nas) y su hoja, 8 (unidades).
Construccion de un diagrama de tallo y hoja
....... _---
Estos son los pasos para elaborar un diagrama de tallo y hoja:
1 Se ordenan los datos de forma ascendente: del menor al mayor.
2 Se eligen uno a mas digitos para formar el tall a y el resto de los
digitos para la hoja.
3 Se enumeran en una columna verti cal los diferentes valores de
tallo observados.
4 Para cada tallo se enumeran, de manera hori zontal y allado dere-
cho del tallo correspondiente, las hojas de todas las observaciones.
5 Se indican las unidades de los tallos y las hoj as.
f.) Santi liana 1. Descripcion de datos por medio de tablas y graficas
13 _
_ 14
£jell/plo
3
Un problema que preocupa a la poblacion es la incidencia del
crimen; por ello, existe una gran cantidad de estudios esta-
dfsticos relacionados con el tema. En la tabla siguiente se presen-
ta el nCllllero de asaltos por cad a 100000 residentes registrados
en los 50 estados de la Union Americana:
Asaltos por cad a 100000 residentes
32.9 53.6 45.7 29.8 53.7
72.9 32.5 33.7 49.7 34.3
40.9 27.3 77.6 29.8 49.5
43.3 39.4 34.0 34.3 51.5
42.6 37.9 44.1 17.8 37.8
46. 2 18.4 32.5 46.8 25.9
27.9 40.4 24.4 47.0 31.0
88.1 29.0 30.0 46.9 64.0
49.9 42,2 62. 2 25.8 23.6
52.4 19.7 31.3 24.7 20.7
En este caso, una buena eleccion de tallo es el digito de las decenas,
de modo que la hOla consistira en las unidades )' las decima,.
Par citar un caso, si la observacion es 32.9, el tall o es 3 )' la hoja,
29. Construimos asf el diagrama de tallo )' hoja:
1 78, 84, 97
2 07, 36, 44, 47, 58, 59, 73, 79, 90, 98, 98
3 00, 10, 13, 25, 25, 29, 37, 40, 43, 43, 78, 79, 94
4 04, 09, 22, 26, 33, 41, 57, 62, 68, 69, 70, 95, 97, 99
5 15, 24, 36, 37
6 22, 40
7 29, 76
Tallo: decenas
8 81 Hoja: unidades y decimas
EI diagrama muestra de inmediato que el menor valor es 17.8 )' el
ma),or, 88.1. Adem,,,, pucde verse que la ma),or parte de las obser-
vaciones se encuentran entre 20 )' 65.
UN l OAD 1 • ESTAOiSTICA DESCRIP';"IVA
En general, un diagrama de tallo y hoja permite identificar la extension
en que se dispersan las observaciones. Si hay observaciones inusual-
mente grandes 0 pequeI'\as, conocidas como datos atipicos, resultan
facilmente identificables. De hecho, es comun que aparezcan en un
renglon adicional, con una leyenda que 10 indique.
Consideremos una muestra de 10 estudiantes cuyos promedios en
un curso de espaI'\ol son:
{6.5, 6.8, 7.3, 7.8, 7.2, 7.7, 5.6, 5.5, 6.4,10).
Como la mayor parte de los datos se encuentran entre 5.5 y 7.8, 10 es
un dato atfpico (OA). Podemos elegir las unidades para el tallo y las
decimas para las hojas y construir el diagrama:
5 5, 6
6 4, 5, 8
Tallo: unidades
7 2, 3, 7, 8, Hojo: decimas
DA: 10
OA indica que el valor del renglon correspondiente es un dato atfpico,
y nos evita agregar renglones para los tallos 8 y 9, que no tendrian
hojas.
Para practicar
Construye un diagrama de tallo y hoja para presentar la informacion
siguiente.
CD Un entrenador de natacion que es responsable de 19 deportistas
registro el tiempo que tarda cada uno de ellos en recorrer 200 me-
tros (m) en estilo libre. A continuacion se presenta una Iista de tiem-
pos, en minutos (min):
6.37 6.64 5.60 6.00 7.05
6.60 6.82 5.95 6.82 7.05
6.27 7.15 4.50 7.04 6.96
6.49 6.50 6.60 5.30
©Santi llana 1.   de datos par media de tablas y graficas
La respuesta de los ejercicios
cuyo numero esta encerrado
en un cfrculo, se encuentran
en el apendice.
15 _
_ 16
2 En la papeleda de don Jorge se regist raron los ingresos diarios du-
rante dos semanas )' los resultados obtenidos se presentan a conti-
nuacion:
2500 2300 2320 2550 2580 1400
2440 2490 2370 2210 2510 1300
(I) En Lin curso de t raducci"n se inscribieron 24 estudiantes de di fe-
rentes edades, las cuales se presentan en la tabla siguiente:
26 29 33 35 42 26
27 30 34 28 41 26
27 31 34 25 42 55
28 33 34 40 40 36
Distribucion de frecuencias
La dist ribuci6n de frecuencias es una tabla ut il para organizar de fo r-
ma compacta conjuntos de datos mu)' grandes. Presenta cada catego-
ria con su frecuencia y frecuencia relativa. Pero tque significan estos
dos conceptos'
Frecuencia y jrecuencia relativa
La frecuencia es el numero de veces que aparece un valor 0 una ca-
tegoda en el conjunto de datos.
Por su parte, la frecuencia relativa es la proporci6n del conj unto
de datos observados en una categorfa; se obtiene dividiendo cad a
frecuencia entre el numero total de observaciones en el conjunto.
Si el conjunto de datos es categ6rico, cada respuesta posible es una
categorfa. La frecuencia relativa se suele interpretar como el porcenta-
je del total de observaciones que pertenecen a la categoda. Por ejem-
plo, si una categoda tiene frecuencia rei at iva igual a 0.25, indica que
25% de las observaciones pertenecen a dicha categorfa.
UNlOAD 1 I ESTAOfsTICA DESCRIPTIVA ~   a n t j l l a n a
Ejemplos
4
Pensemos en un grupo de 72 deportistas que practican algu-
no de estos deportes:
{futbol, basquetbol, ten is, natacion, gimnasia l.
Se pregunta a cada uno de ellos a que deporte se dedica y el con-
junto de datos obtenidos es el siguiente:
F B F F T G B N
B B N F F T T N
G B T B F F T T
F F T B G F G T
F T T B F G N T
F B N F B N T G
N F F F
,
B B T N
T B N F F B B T
F B B T F F B T
En ese conjunto de datos - como supondras- F es futbol; B, bas-
quetbol; T, tenis; N, natacion, y G, gimnasia.
La frecuencia de una categoria se obtiene contando el numero
de veces que esta aparece en el conjunto de datos (por ejemplo,
como se muestra abajo, F aparece 22 veces, y esa es su frecuen-
cia). En este caso, la tabla de distribucion de frecuencias es la si-
guiente:
Categoria Frecuencia Frecuencia relatlva
1 Futbol 22
22
72 = 0.306
2 Basquetbol 18
18
72 = 0.25
3 Tenis 17
17
72 = 0.236
4 Nataci6n 9
9
n = 0.125
5 Gimnasia 6
6
72 = 0.083
CSantil lana 1. Descripcion de datos par media de tablas y graficas 17
_ 18
La frecuencia relativa representa el porcentaje del grupo de atletas
que practica cada deporte. Por ejemplo, 25% de ellos juega bas-
quetbol y 12.5%, natacion.
5
Veamos ahora un conjunto de datos numerico y discreto. Se
registra, para una muestra de 708 conductores de autobus, el
numero de accidentes en los que ha estado implicado cada uno de
ellos durante un periodo de cuatro anos. Observamos que las res-
puestas pueden ser:
{O, 1, 2,3,4,5,6, 7,8,9,10,111,
que es un conjunto de valores discreto; por tanto, cada valor co-
rresponde a una categoria. A continuacion se presenta la distribu-
cion de frecuencias:
Categoria: Frecuencia Frecuencia relativa
Numero de accidentes
a 117
117
708 = 0.165
1 157
157
708 = 0.222
2 158
158
708 = 0.223
3 115
115
708 = 0.162
4 78
78
708 = 0.110
5 44
44
708 = 0.062
6 21
21
708 = 0.030
7 7
7
708 = 0.010
8 6
6
708 = 0.008
9 1
1
708 = 0.001
10 3
3
708 = 0.004
11 1
1
708 = 0.001
En ocasiones, si el conjunto de categorias resulta muy grande es
posible reducirlas agrupando los valores en intervalos, que se lla-
man clases. En este caso, en lugar de tener 12 categorias pod ria-
mos usar las cuatro clases siguientes:
{0-2, 3-5, 6-8, 9-11}
UNlOAD 1 ESTAOfsTtCA DESCRIPTlVA @Santillana
y obtener una distribuci6n de frecuencias con datos agrupados.
como sigue:
Categoria: Frecuencia Frecuencia relativa
Numero de accidentes
0-2 432
4"
708 = 0.61
3 - 5 237
237
708 = 0.335
6 - 8 34
3.
708 = 0.480
9 - 11 5
5
708 = 0.007
Recordemos que el objetivo de las tablas de distribuci6n de fre-
cuencias es resumir la informaci6n; sin embargo. es importante no
perder de vista aspectos relevantes. lo que puede ocurrir si se resu-
men demasiado las categorfas.
En caso de tener un conjunto de datos continuo. e)(iste la des-
ventaja de que no hay categorfas definidas natural mente. como en
los dos casos anteriores. de modo que debemos definirlas de acuer-
do con el conjunto de datos.
6
Consideremos los datos obtenidos a partir de una muestra de
20 autom6viles. Para cada uno de ellos se determin61a eficien-
cia (kil6metros por gal6n de gasolina) y los resultados obtenidos
fueron:
(29.8. 27.6. 28.3. 28.7. 27.9. 29.9. 30.1. 28.0. 28.7. 27.9. 28.5. 29.5.
27.2.26.9.28.4.27.9.28.0.30.0.29.6.29.1).
AI observar detenidamente los datos notamos que el menor de
ellos es 26.9 y el mayor. 30. 1. por 10 que definiremos las c1ases
como intervalos de longitud 0.5. a partir de 26.5 y asi sucesiva-
mente. en intervalos de 0.5 hasta 30.5 (figura 1).
,
T
,
T
,
T
,
T
,
26 27 28 29 30 31
Como cada valor debe pertenecer a una y s610 una c1ase. definimos
cada intervalo c1ase como:
[26.5.27 ).
o Santillana 1. Descripcion de datos par media de tablas y graficas
Fi gura 1
Clases.
19 _
_ 20
10 que significa que si un valor es mayor 0 igual que 26.5 y menor a
27 entonces pertenece a esta clase, es decir, el 27 se encuentra en la
clase [27, 27.5). Ahora detenninamos la tabla de frecuencias de
este modo:
(lases Frecuencia Frecuencia relativa
[26.5,27) 1
1
20 ~ 0.05
[27,27.5) 1
1
20 ~ 0.05
[27.5,28) 4
4
'" 0.2
[28,28.5) 4
4
  ' ~ 0.2
[28.5, 29) 3
3
20 ~ 0.15
[29,29.5) 1
4
20 ~ 0.05
[29.5,30) 4
4
20 ~ 0.2
[30,30.5) 2
2
'" 0.1
EI tamano del intervalo puede variar de acuerdo con el conjunto de
datos, e incluso en ciertos casos pueden definirse intervalos clase
de diferente longitud.
Las frecuencias se usan para responder a preguntas tales como:
I lCuantas observaciones 0 datos corresponden a una clase 0 a una
categoria en particular?
• < Q u < ~ porcentaje de observaciones corresponden a una clase?
En seguida definiremos las frecuencias acumuladas, que sirven para
responder a preguntas como:
• l.Cmlntas observaciones corresponden a las primeras tres c1ases?
Para contestar esta pregunta y otras simi lares se deben sumar las fre-
cuencias correspondientes. De ahi que definimos 10 siguiente.
Frecuencia acumulada y frecuencia relativa acumulada
La frecuencia acumulada es la suma de la frecuencia de una clase
con la frecuencia de las clases anteriores en la tabla.
Por su parte, la frecuencia relativa acumulada es la suma de la
frecuencia relativa de una clase con las frecuencias relativas de las
clases que aparecen antes en la tabla.
UNlOAD 1 • ESTAOiSTlCA DESCRIPTIVA @Santillana
Entonces, a partir de los datos del ejemplo 6 podemos obtener las fre-
cuencias acumuladas como sigue:
(lases Frecuencia Frecuencia acumulada Frecuencia relativa Frecuencia relativa
acumulada
[26. 5,27) 1 1
1
20 = 0.05
[27,27.5) 1 2
1
20 = 0.05
[27.5,28) 4 6
4
20 = 0.2
[28,28.5) 4 10
4
20 = 0.2
[28.5,29) 3 13
3
20 = 0.15
[29,29.5) 1 14
1
20 = 0.05
[29.5,30) 4 18
4
20 = 0.2
[30,30.5) 2 20
2
20 = 0.1
Ahora podemos responder a la pregunta: "cuantos autom6viles tienen
una eficiencia menor a 28' Buscamos en la tabla la frecuencia acumu-
lada y la respuesta es 6. Tambien detenninemos: "que porcentaje de
autom6viles tiene una eficiencia menor a 30? EI 90%.
Para practicar
CD En el consultorio de un nutri61ogo se registr6 el peso en kilogra-
mas (kg) de un grupo de 50 pacientes y los resultados fueron los
siguientes:
55.8 60.9 37.0 69.0 76.0 60.6 43.8 42.3 65.8 91.3
45.9 49.1 45.5 74.5 47.2 61.5 61.2 71.7 44.6 56.0
83.2 40.0 41.7 68.2 40.0 56.3 94 .6 47.3 62.3 36.7
75.3 71.4 65.2 65.0 39.8 78.8 61.8 48.0 58.2 52.6
60.7 77.1 59.1 66.3 87.1 47.1 64.9 69.8 69.3 49.5
a Construye una tabla de frecuencias y frecuencias relativas agru-
pando los datos en clases.
b Caleula ademas las frecuencias acumuladas y las frecuencias re-
lativas acumuladas.
Cl Santillana 1. Descripcion de datos por medio de tablas y grMicas
0.05
0.1
0.3
0.5
0.65
0.7
0.9
1
21 _
_ 22
2 En una pasteleria se pregunt6 a los clientes cual de los postres
incluidos en el menu les gustaba mas: G = gelatina, H = helado,
P = pastel, F = flan. Las respuestas fueron:
{G, H, P, F, F, F, G, G, H, P, P, H, G, F, F, F, H, H, H}
Construye una tabla de frecuencias absolutas, relativas y acumu-
ladas.
CD En una escuela se registra el numero de faltas de sus profesores en
un meso Los resultados del mes pasado fueron:
{Q,2,5,Q,3,Q,2,2,Q,Q,3,Q,Q}.
a iCuantos profesores faltaron menos de tres veces?
b iQue porcentaje de profesores faltaron tres veces 0 menos?
Histograma
Un histograma es una representaci6n gratica de la informaci6n conte-
nida en una tabla de distribuci6n de frecuencias. Generalmente, una
gratica ayuda mas a visualizar la informaci6n que una tabla con valo-
res numericos, ademas de que se nos graba en la mente por mas tiem-
po. Por ello, en estadistica las graficas se emplean con gran frecuencia
y resultan de enorme importancia.
EI histograma de frecuencias consiste en representar con una barra
rectangular cad a frecuencia, en tanto que el histograma de frecuen-
cias relativas representa con una barra rectangular cada frecuencia
relativa.
Por ejemplo, si utilizamos la informaci6n del grupo de deportistas
que presentamos anteriormente:
Categoria Frecuencia Frecuencia relativa
1 Futbol 22
22
n = 0.306
2 6asquetbol 18
18
72 = 0.25
3 Tenis 17
17
72 = 0.236
4 Nataci6n 9
9
72 = 0.125
5 Gimnasia 6
6
72 = 0.083
podemos construir los histogramas de las figuras 2 y 3.
UNlOAD 1 • ESTAOiSTlCA DESCRIPTIVA e Santillana
25
20
 
15 m
·co
c
"
"
u
i"
10
 
5
0 ,
Futbol Basquetbol Tenis Nataci6n Gimnasia
0.35
0.3
0.25
 
m
>
."
m
0.2
-
1i
 
m
·co
c
-
"
0.15
"
u
i"
 
0.1
0.05
0
Futbol 8asquetbol Tenis Natad6n Gi mnasia
C6mo construir un histograma de frecuencias
(0 frecuencias relativas) para un con junto de datos categ6rico
1 En el eje horizontal se marcan las categorias, cuyos nombres se
colocan en intervalos de separaci6n constante.
2 Para cada categorfa se traza un rectangulo con altura igual a su
frecuencia (0 frecuencia relativa). Todos los rectangulos deb en te-
ner el mismo ancho.
3 En el eje vertical se marca la escala de valores.
e Santil lana 1. Descripcion de datos par media de tablas y graficas
Figura 2
Histograma de {recuencias.
Fi gura 3
Histograma de frecuencias
relativas.
23 _
Figura 4
Histograma del numero de
accidentes: {recuencias.
Figura 5
Histograma del numero de
accidentes: frecuencias fe/ativas.
_ 24
Existen algunas diferencias en los hi stogramas para distintos tipos de
conjuntos de datos. Por ejemplo, en el caso de un conjunto discreto,
las barras rectangulares suelen presentarse sin separaci6n entre si,
como se muestra en las figuras 4 y 5.
180
160
- ;-
140
120
-
-
ro
·w
100
c
"

u
"
80
.z
60
-
40
20
nLJ= 0
0 2 3 4 5 6 7 8 9 10 11
Numero de accidentes
0.25
--
0. 2
r-
r-
0.15
r-
0.1
-
0.05
,..,
II .....
, , o
o 1 2 3 4 5 6 7 8 9 10 11
Numero de accidentes
Tambien notemos que el histograma de frecuencias y el de frecuenc ias
relativas son graficas practicamente iguales, excepto por la escala de
valores que aparece en el eje vertical.
UNlOAD 1 I ESTAOfsTICA DESCRIPT1VA e Santiliana
Como construir un histograma de frecuencias
(ofrecuencias relativas) para un con junto de datos discreto
1 En el eje horizontal se marcan los posibles valores.
2 Para cada valor se t raza un rectangulo con alt ura igual a su fre-
cuencia (0 frecuencia relativa). Todos los rectangul os deben te-
ner el mismo ancho y deb en estar centrados en el valor al que se
refieren.
3 En el eje vert ical se mal"Ca la escala de valores.
Cuando se tiene un conjunto de datos continuo hay la posibili dad de
que los intervalos clase tengan diferente longitud, caso en el que es
necesario ajustar las alturas de los rectangulos de forma que la grafica
represente correctamente los datos.
Consideremos la di st ribuci6n de frecuencias correspondiente a
en'ores en el registro del promedio general de calificaciones. La dist ri -
buci6n ti ene intervalos de di fe rente longitud, pues la mayor parte de
los en'ores son cercanos a 0; sin embargo, hay algunos errores mas
significativos:
Intervalo c1ase Frecuencia relativa longitud
[-2.0, -0.4) 0.023 1.6
[-0.4, - 0.2) 0.055 0.2
[ - 0.2, - 0.1) 0.097 0.1
[-0.1, 0) 0. 210 0.1
[0,0.1) 0.189 0.1
[0.1 , 0.2) 0.139 0.1
[0.2, 0.4) 0.116 0.2
[0.4,2.0) 0.171 1. 6
AI const ruir un hi stograma es necesario considerar que la longitud de
los intervalos es distinta; de 10 contrario, no representan! correcta-
mente los datos y se vera como en la figura 6.
0.25
0.2
0.15
0.1
0.05
0
/"-
C Santillana 1. Descripcion de datos par media de tablas y graFicas
Figura 6
Histograma incorrecto de los
errores en el registro de promedio
general de cafificaciones.
25 _
Figura 7
His togromo correcto de 105 errores
en el registro de promedio.
_ 26
Notemos que en esta figura el rectangulo correspondiente al intervalo
[0.4, 2.0} es muy ancho y da la impresi6n de que hay muchos casos con
un error mayor a 0.4, 10 cual es falso. Lo adecuado es que el area del
rectangulo correspondiente a cada clase sea proporcional a la freeuen-
cia rei at iva, es decir, a mayor frecuencia relativa, mayor area y viceversa.
Si consideramos que las longitudes son diferentes, podemos caleu-
lar las alturas de los rectangulos de modo que 51 sean representativos
de los datos, como explicaremos a continuaci6n.
Como construir un histograma de frecuencias
(0 frecuencias relativas) para un conjunto de datos continuo
1 En el eje horizontal se marcan los val ores extremos de los interva-
los clase.
2 Para cada intervalo clase se traza un rectangulo. Si la longitud de
todos los intervalos clase es Ia misma, la altura de cada rectangulo
es igual a la frecuencia (0 frecuencia relativa).
3 Si los intervalos clase tienen diferente iongitud, entonces la escala
vertical no debe marearse con freeueneia (0 frecuencia relativa),
sino que se debe caleular la altura de cada rectangulo de aeuerdo
con la f6rmula siguiente:
Alt
frecuencia rei at iva
ura =
longitud del intervalo
EI area del rectangulo sera proporcional a la frecuencia relativa.
4 En el eje vertical se marca Ia escala de valores que corresponda.
EI hi stograma CotTecto, que corresponde a los datos de la tabla an-
terior, es como el de la figura 7.
2
1.8
1.6
1.4
1.2
1
0.8
0.6
0.4
0.2
o
UNlOAD 1 I ESTA Oi sT ICA DESCR IPT IVA e Santillana
Ejemplos
Construyamos un hi stograma de frecuencias relat ivas para los
conjuntos de datos siguientes.
7
Se pregunt6 a un grupo de 20 alum nos cual de los sigui entes
cursos les gustaria incluir en su programa:
{pintura, musica, poesia).
Las respuestas obtenidas se resumen en la tabla siguiente:
Categoria Frecuencia
Pintura 9
Musica 7
Poesia 4
0.5
0.45
'"
0.4
 
'"
0.35
ei
0.3
'"
0.25
·u
c
0.2
"
u
0.15
l'
 
0.1
0.05
0 , , ,
Pintura Musica Poesia
8
En un estudio del comportamiento infantil se determin6 el
tiempo en minutos que dura un juego en niilOS de cinco anos.
Los resultados se resumieron en la tabla mostrada a continuaci6n:
(lase Frecuencia
[0,5) 54
[5,10) 44
[10,15) 28
[15,20) 21
[20,40) 31
[40,60) 15
[60,90) 16
[90, 120) 5
[120,180) 8
Cl Santillana 1. Oescripcion de datos por media de tablas y graficas
Figura 8
Histograma de cursos culturales.
27 _
Figura 9
Histograma de duracion de
un juego.
_ 28
Para trazar el histograma correspondiente primero calculamos las
frecuencias relativas de cada intervalo. Ademas, como los interva-
los clase son de diferente longitud, debemos calcular tambien las
alturas de las barras, para 10 cual usamos la formula:
Altura =
frecuencia relativa
longitud del intervalo .
Por ejemplo, para el primer intervalo se obtiene la altura: 0.243 / 5 =
0.049; para el segundo 0.198 / 5 = 0.04 Y asi sucesivamente, de modo
que obtenemos la tabla siguiente:
,
Clase Frecuencia Relativa longitud Altura
(0,5) 54 0.243 5 0.049
(5,10) 44 0.198 5 0.04
(10,15) 28 0.126 5 0.025
(15, 20) 21 0.095 5 0.019
(20,40) 31 0.140 20 0.007
(40, 60) 15 0.068 20 0.003
(60,90) 16 0.072 30 0.002
(90,120) 5 0.022 30 0.0007
(120,180) 8 0.036 60 0.0006
Con base en estos datos podemos construir el histograma corres-
pondiente (figura 9).
Tiempo que dura un juego
0.05
.2 0.04
ro
~
~
c
0;
0.03
"0
"0
.=
·M
c
0
0.02

~
ro
  ~
ro
~
"'
om
0
"
... " ,,"
","
UNlOAD 1 • ESTA Of s TI CA DESCR IPT IVA Cl Santillana
Para practicar
CD Un partido politico realizo una encuesta a lin grupo de 245 estlldian-
tes a fin de evaluar a su candidato. Las posibles respllestas son:
• 5-excelente
• 2-regular
• 4-mlly bien
• I-mal
• 3-bien
EI resultado de la encllesta se resume en la tabla de frecllencias si-
guiente:
Evaluation Frecuencia
5 37
4 54
3 100
2 33
1 21
Traza lin histograma de frecuencias.
2 En lIna c1inica se registro el peso en kg de un grupo de 121 recien
nacidos y la informacion se resume en la tabla de frecuencias qlle
siglle:
Peso (kg) Frecuencia
(1.5,2.5) 4
(2. 5,3.5) 48
(3.5,4.5) 62
(4 .5,5.5) 7
Traza un histograma de frecllencias relativas.
e Santiliana 1. Descripcion de datos par media de tablas y gritficas
29 _
_ 30
CD Si observas, la mayor parte de los datos del ejercicio anterior estan
en alguno de los dos intervalos de en media, asf que se construye
una tabla de frecuencias can diferente elecci6n de intervalos como
la siguiente:
Peso (kg) Frecuencia
[1.5,2.5) 4
[2.5,3) 14
[3, 3.5) 34
[3.5, 4) 41
[4, 4.5) 21
[4.5,5.5) 7
a Traza un histograma de frecuencias correspondiente a la nueva
tabla.
b <Cual de los dos histogramas describe mejor los datos? <Par que?
Graficas circulares y poligonos de frecuencias
Veamos otras dos graficas ut il es para representar frecuencias relativas.
A continuaci6n se presenta la tabla del ejemplo de los deportistas:
Categoria Frecuencia Frecuencia relativa Porcentaje
1 Futbol 22
22
72   0.306 30.6%
2 Basquetbol 18
18
72   0.25 25%
3 Tenis 17
17
"   0.236
23.6%
4 Nataci6n 9
9
72   0.125 12 . 5%
5 Gimnasia 6
6
72   0.083 8.3%
GRAFICA CIRC ULAR
Una grafica circular, tambien conocida como grdfica de pastel, se usa
para representar frecuencias relativas de un conjunto de datos cate-
g6rico. Una desventaja que presenta es que s610 resulta util cuando el
numero de categorfas es pequel'io.
U Nl OA D 1 • ESTAOiSTiCA DESCRIPTIVA Ii) Santillana
Como construir una grafica circular para un conjunto
de datos categorico
Una grafica circular 0 de pastel se construye dividiendo un cfrculo
en sectores, de forma que cada sector equivalga al porcentaje de una
categoria. Para cada categoria se calcula el angulo correspondiente
(en grados), de acuerdo con la formula siguiente:
Angulo = Frecuencia relativa x 360°.
Categoria Frecuencia Angulo
relativa
1 Futbol 0.306 0.306 x 360 = 110°
2 Basquetbol 0.25 0.25 X 360 = 90°
3 Tenis 0.236 0. 236 X 360 = 85°
4 Nataci6n 0.125 0.125 X 360 = 45°
5 Gimnasia 0.083 0.083 X 360 = 30°
• Futbol
• Basquetbol
• Tenis
• Nataci6n
• Gimnasia
POLIGONO DE FRECUENC I AS (FRECUENC I AS RELATI VAS)
EI poligono de frecuencias se usa para representar frecuencias relati -
vas de un conjunto de datos numerico.
Como construir un poligono de frecuencias para un conjunto
de datos categorico
EI poligono de frecuencias consiste en una serie de segmentos de
recta que unen los puntos cuyas abscisas son los valores centrales de
cada clase y cuyas ordenadas son las frecuencias (relativas) .
Asf, para construirl o hay que ubicar en el eje y las frecuencias,
dibuj ar los puntos correspondientes y luego unirlos.
o Santillana 1. Oescrip:ion de datos par media de tablas y grMicas
Fi gura 10
GrafteD circular 0 de pastel.
31 _
Figura 11
Pofigono de {recuencias.
_ 32
Veamos el polfgono de frecuencias relativas del ejemplo de eficiencia
de los autom6viles.
Eficiencia de autom6viles
0.25
0.2
0.15
0. 1
0.05
o
26.75 27.25 27.75 28.25 28.75 29.25 29.75 30.25
Frecuencia acumulada y ojiva
Una grafica de frecuencias acumuladas es la ojiva. Se trata de una gra-
fica poligonal en la cual cada punto representa ellfmite superior de la
c1ase en el eje de las abscisas y la frecuencia acumulada en el eje de las
ordenadas; despues se une cada par de puntos consecutivos con un
segmento de recta (figura 12).
UNlOAD 1 • ESTAOfsTICA DES(RIPTlVA ©SantiJIana
1.2
1
0.8
0.6
0.4
0.2
o
27 27. 5 28 28.5 29 29.5 30 30.5
Para practicar
CD Dibuja una grafica circular y un poligono de frecuencias para los
datos de los ejercicios para practicar 3 (paginas 29 y 30). Com para
tus graficas y explica cual de elias es mejor para cada caso.
2 Se pregunto a un grupo de 35 alumnos su estatura en centimetros
(cm) y se obtuvieron los datos siguientes:
152 163 154 170 164 154 166
163 162 168 168 172 170 160
161 158 165 165 151 161 157
160 155 158 158 170 169 168
155 156 162 162 166 168 160
Construye una tabla de frecuencias usando cad a valor posible como
una categoria; traza Ia grafica circular y el poligono de frecuencias
correspondientes. lCual es la desventaja de la grafica circular?
CD Agrupa los datos para tener menos categorias; ademas, dibuja la gra-
fica circular y el poligono de frecuencias correspondientes.
4 Para los datos del ejercicio anterior, dibuja una ojiva de frecuencias
relativas acumuladas.
C>Santiliana 1. Descripcion de datos par media de tablas y grMicas
Fi gura 12
Ojiva de /0 eficiencia
de autom6viles.
33 _
n
i=l
_ 34

l
Medidas numericas
representativas
La descripcion de datos por medio de tablas )' graficas nos brinda un
panorama del fenomeno de donde proceden, 10 que resulta Mil para
realizar un primer am\lisis. Posteriormente se busca describir y carac-
terizar el conjunto de una forma compacta)' precisa.
Para ello se calculan algunas medidas representativas que ofrecen
informacion resumida ace rca del comportamiento de los datos. Exis-
ten dos tipos de medidas representativas principales: de tendencia
central), de variabi lidad 0 dispersion. Antes de explicar cada una de
ellas, conviene repasar el tema de la sumatoria; de otro modo, las for-
mulas }' operaciones relacionadas con las medidas numericas podrfan
resultar incomprensibles.
Introduccion a La sumatoria
La slll11atoria es un simbolo que se utiliza para representar de forma
abreviada una suma que consta de /1 sumandos. EI simbolo es la letra
griega mayuscula sigma:
Entonces, en lugar de escribir una suma como Xl + x
2
+ ... + XI/ pode-
mas abreviarlo as! con la sumatoria:
"
LX"
i = l
expresion que se lee como la suma de x, desde que i vale 1 hasta /1. La
letra i es el in dice de la sumator ia y puede ser sustituida por cualquier
otra, como k, j, etcetera, excepto par la 11, pues esta representa el nll-
mero de sumandos que implica la operacion. Es importante selial ar
que el indice de la sumatoria no siempre comienza en 1, sino que pue-
de empezar en un entero diferente.
Propiedades de La sumatoria
1/ 11 11
1  
;=1 ;=1 ;=1
11 II
2 L (ex,) C LX,.
i = 1 ;=1
UNlOAD 1 • ESTAOfsTICA DESCRIPTIVA r') Santillana
Ejemplo
9
Representemos las sumas siguientes pOl' medio de la suma-
tona:
6
• a
3
+a
4
+a
S
+a
6
= 2:
a
j.
;= 3
8
• 3X
1
+ 3x
2
+ 3x3 + 3x. + 3xs + 3x6 + 3x
7
+ 3xs = 3 L Xi.
;=1
6
• a
3
+ a
4
+ as + a
6
+ b
3
+ b. + hs + b
6
= L (a
i
+ b,).
;=3
Medidas de tendencia central
Como su nombre 10 indica, una medida de tendencia cent ral es la que
describe un valor central para ubicar la localizacion del conjunto de
datos. Las mas populares son la media y la mediana, las cuales explica-
remos aunadas a algunas otras.
LA MEDIA
La media de un conjunto de datos numerico es un promedio que se
obtiene sumando los valores observados y dividiendo entre el mlme-
ro total de observaciones. Si las observaciones provienen de una
muestra la ll amamos media m"estral, en tanto que si proceden de
toda la poblacion reci be el nombre de media poblacional.
Media
La media de una n1uestra numerica Xl' x
2
• .. ,' X
ll
se obtiene median-
te la formula:
"
L Xi
_ ;= 1 X
1
+X
2
+· ·· +X"
x=---=
n 11
y se representa por X .
"Santillana 2. Medidas numericas representativas
35 _
_ 36
£jemplo
1 0
Determinemos a partir de una muestra de 14 fosHes la altura
promedio (media) de un hueso frontal. Para cad a fosH en la
muestra (x; , con i igual al numero de la observacion) se mide el
hueso (en mHimietros, mm) )' se obtienen los datos siguientes:
42 27 25 40 33 31 42 34 35 25 29 30 29 35
EI conjunto observado es una muestra, asi que obtenemos la media
muestral sumando primero los datos que aparecen en la tabla:
42 + 27 + 25 + ... + 35 = 457;
para despues dividir el resultado entre el numero de datos u obser-
vaciones, que es 14, yentonces:
"
LX;
_ ; . 1 457
x = II = 14 = 32.6.
Por ello podemos indicar que la media (la altura promedio en este
caso), un valor representativo de la muestra de fosHes, es 32.6 mm,
es decir, la altura toma valores que varian alrededor de 32.6 mm.
En ocasiones se cuenta COil la informacion ace rca de una poblaci6n
completa )' entonces es posible obtener un promedio de todos los va-
lores, 0 sea, la lIIedia pobiaciollai, que suele simbolizarse con la letra
griega minuscula mu, ~  
Sin embargo. en mllchos casas no se cuenta con informacion sabre
toda la poblacion )' entonces se analiza una muestra de ella, )' usando
algunos resultados de probabilidad es posible obtener conciusiones
acerca de p a partir de la media x de una muestra en particular.
Una desventaja de la media es que puede resultar mu)' afectada
cuando existen datos in usual mente grandes 0 111U)' pequel'los con rela-
cion al resto dentro de un conjunto. C01110 hemos sellalado, este tipo
de datos se lIaman atipicos.
Citemos por caso una muestra de ocho Iibros de ticcion; un alumno
debe elegir cmil de ell os leer, por 10 cual registra el n(lInero de p;\ginas
de cada uno), los resultados son los siguientes:
{247,312, 198,780,175, 286, 293, 258}.
UNlOAD 1 ESTAOfSTI(A DESCRIPTIVA
La media muestral es:
n
2: Xi
  ~ l 2549 ,
x = --- = -- = 3186 paginas
n 8 ' .
Notemos que la media 318.6 es mayor que todos los datos excepto
uno, por 10 cual no parece una medida muy representativa. Si elimina-
mos elmayor valor, que es 780, entonces la media seria 252.7, un valor
mas centrado dentro del conjunto de datos.
Veamos ahora otra medida de tendencia central que no es tan sen-
sible como la anterior en presencia de datos atipicos.
LA MED I ANA
La medialla es el valor que se encuentra justo en medio de los datos,
una vez que estos han sido ordenados de forma ascendente, del menor
almayor. Es evidente que cuando la muestra tiene un numero de datos
impar s610 hay un valor en medio, pero cuando es par existen dos; en
este caso, los promediamos para obtener la mediana.
Mediana
La mediana de una muestra se obtiene ordenando los datos de me-
nor a mayor, inc1uidos los valores que se repiten, de forma que todos
los datos aparezcan en la lista ordenada. Luego,
{
Valor de en medio si el numero de datos es impar.
Mediana =
Promedia de los dos valares de en medio si es par.
Ejemplo
11
Calculemos la mediana para los datos del ejemplo de la altu-
ra del hueso frontal medida (en mm) a una muestra de f6si-
les. En la tabla siguiente se presenta, en el segundo rengl6n, los
datos, yen el tercero los datos ordenados:
42 27 25 40 33 31 42 34 35 25 29 30 29 35
25 25 27 29 29 30 31 33 34 35 35 40 42 42
C Santillana 2. Medidas numericas representativas 37
_ 38
Como el numero de datos es par, hay dos valores en media que son
los valores sombreados en gris, los cuales se promedian (se suman
y dividen entre dos en este caso) para obtener:
31 + 33 32
2 .
La mediana es 32, 10 que nos indica, al igual que la media,  
dar de que valor se encuentra el conjunto de datos.
Recordemos que la media para estos datos es 32.6, asi que, en
este ejemplo, la media y la mediana son valores cercanos y ambos
representan 0 caracterizan el conjunto de datos.
Existen otras medidas de tendencia central, tales como moda. media
arm6nica y rango media, entre otras. La moda es el valor mas
te dentro del conjunto de datos, es decir, aquel que tiene mayor
cuencia y mayor frecuencia relativa. En muchas ocasiones la mada no
es unica, pues puede existir mas de un valor can la misma freeuencia
dentro del canjunto de observaciones.
Por otra parte, es eomun que en algunos estudios estadisticos se
tengan s610 dos categorias 0 dos posibles valores de respuesta; par
ejemplo, hombre 0 mujer, fuma 0 no fuma, tiene 0 no licencia para
conducir. En estas situaciones es conveniente Hamar exito a una de las
dos posibles respuestas, y fracaso a la otra.
Entonees es posible ealcular para una muestra la proporcion de
tos, que representa la proporci6n de respuestas que caen en la  
rLa que Uamamos exito.
Proporci6n
En una muestra can n datos, la proporci6n de exitos, que simboliza-
mas con p. se obtiene como:
numero de exitos en la muestra

n
UNlOAD 1 • ESTAOfSTICA OESCRIPTIVA
0_
Ejemp/o
12
Queremos determinar la proporci6n de fumadores en un
grupo de 15 personas. Las posibles respuestas son:
furnador (exita) 0 no furnador (fracaso) .
Si resulta que nueve personas son fumadoras, entonces la
ci6n de exita es:
Esta es, 60% del grupo es fumador.
Para practicar
(!) A fin de me;orar el servicio en un centro de salud se tom6 una
tra de 15 pacientes, se registr6 el tiempo de espera (en minutos) y se
obtuvieron los datos siguientes:
{40. 35. 35. 10. 30. 5. 25. 10.40. 10. 65. 15. 55. 85. 3D}.
Calcula la media y la mediana para este conjunto de datos. i,Cmil de
las dos medidas crees que representa mejor los datos? GPor que?
2 EI profesor de estadistica ha calificado 19 examenes de los 20
diantes de su grupo y 1a media hasta el momento es 7.0. ;,Cuai es la
calificaci6n minima que debe obtener el ultimo estudiante para que
la media del grupo aumente un punto? i.. Y para que aumente dos
puntos?
® A una muestra de pacientes con meningitis. cuya temperatura fue
registrada, se aplic6 un tratamiento con altas dosis de penicilina.
Despues de tres dias se les tom6 la temperatura nuevamente y el
tratamiento se consider6 exitoso si la temperatura del paciente habia
disminuido. Los resultados fueron (con E, exitoso y F. fracaso):
{E. E. F. E. E, E. F. F. E. E}.
a ;.Cual es la proporci6n de exitas en la muestra?
b Sup6n que se incluyen 15 pacientes mas, tpara cuantos de eli as
debe resultar exitoso el tratamiento, si la proporci6n de exitos en
la muestra completa de 25 pacientes es 0.80?
.510 .... 2. Medidas   representa!ivas 39 •

Fi gura 13
Rectos numericas can puntos
que representan los datos con
que obtuvimos el rango.
_ 40
Medidas de variabilidad
Al describir un conjunto de datos se consideran dos aspectos impor-
tantes: uno es la ubicaci6n de los datos mismos. 10 cual queda descrito
mediante las medidas de tendencia central. y el otro es la extensi6n y
dispersi6n de los datos respecto a su centro. 10 cual se mide con las de
variabilidad. como el ran go. la desviaci6n estandar y la va rianza.
RANGO
Una medida de variabilidad muy sencill a es el fango. que no es sino la
diferencia entre el mayor valor y el menor. De ello puede inferirse que
cuanto mayor sea la extensi6n de los datos mayor sera el rango.
Consideremos tres conjuntos de datos que tienen media = me-
diana = 45. es decir. se encuentran centrados alrededor del mismo
valor; entonces el rango sera:
T
20
T
20
20
{20.40. 50. 30.60. 70}
{47. 43. 44. 46. 20. 70}
{44. 43. 40. 50. 47. 46}
Rango = 70 - 20 = 50
Rango = 70 - 20 = 50
Rango = 50 - 40 = 10.
T
30
30
30
T T
40 50
1" " 1" "1
40 50
T"" I" "T
40 50
T T
60 70
T
60 70
60 70
Al observar los datos podemos concluir que los dos primeros tienen
mayor variabilidad que el tercero; mas atm. el primero tiene mayor
variabilidad que el segundo.
Si calculamos el rango de cada uno de ellos obtenemos que en el
tercer conjunto es de 10 y que en los dos primeros es de 50. Pero hay
menos dispersi6n en el segundo que en el primero. pues la variabi lidad
de un conjunto no s610 depende de la distancia entre los valores mas
alejados. sino tam bien de la distancia de cad a valor al centro.
UNIDAD 1 • ESTADfSTl(A DESCRIPTlVA (l Santi11ana
Si consideramos la media como el centro del conjunto de datos, po-
demos caleular las diferencias 0 desviaciones desde cada valor a ella.
Definiciones
Para una muestra que contiene n valores Xl' x
2
• ... , Xn se obtienen
n desviaciones, que son las diferencias entre cada valor y la media,
esto es:
Ejemp/o
13
Para las muestras que acabamos de citar en un par de parrafos antes caleulamos
las desviaciones, que aparecen en la tabla siguiente:
Muestra 1 Desviaci6n Muestra 2 Desviaci6n Muestra 3 Desviaclon
20 20 - 45 ~ -25 47 47 - 45 ~ 2
40 4 0   4 5 ~   5 43 43 - 45 ~ -2
50 50 - 45 ~ 5 44 44 - 45 ~ -1
30 30 - 45 ~ -15 46 46 - 45 ~ 1
60 60 - 45 ~ 15 20 20 - 45 ~ -25
70 70 - 45 ~ 25 70 70 - 45 ~ 25
Como se observa en el ejemplo anterior, hay desviaciones positivas y
desviaciones negativas. Una desviacion es positiva cuando el valor es
mayor que la media y es negativa cuando es menor. Notemos que la
mayoria de las desviaciones de la muestra 2 son menores que las de
la muestra 1, pues los valores en la primera se encuentran en su ma-
yor parte mas lejos de la media, que es 45.
Si queremos resumir en una medida unica la informacion que
proporcionan las desviaciones, una primera idea es encontrar su
promedio.
No obstante, como puedes notal' en el ejemplo 13, el promedio de
las desviaciones siempre es 0, pOI' eso no puede usarse como medida
de variabi lidad. La razon de que esto ocurra es que la media es un
valor que se situa en el centro de los datos, de modo que las desviacio-
nes positivas y las negativas se anulan entre sf. En el ejemplo, observa
como en el caso de la desviacion 1, la suma resulta en ° (0 25 se anula
con -25; 5 con -5 y 15 con -15).
@Santillana 2. Medidas numericas representativas
44 44 - 45 ~ 1
43 4 3   4 5 ~   2
40 40 - 45 ~ - 5
50 50 - 45 ~ 5
47 47 - 45 ~ 2
46 46 - 45 ~ 1
41 _
_ 42
La forma comun de evitar que se eliminen las desviaciones positi-
vas con las negativas consiste en elevarlas al cuadrado antes de sumar-
las, de manera que todos los valores que se sumen sean positivos. En
la tabla siguiente se presentan las desviaciones y desviaciones cuadra-
das para la muestra 1:
x (x xl (x xl'
20 20 - 45 = -25 625
40 40-45=-5 25
50 50-45 = 5 25
30 30-45 = -15 225
60 60-45=15 225
70 70-45=25 625
Suma 0 1750
Al promediar las desviaciones cuadradas obtenemos una de las medi-
das de variabilidad Im\s importantes: la varianza.
Varianza
La varianza muestraL es un promedio de las desviaciones de la me-
dia; se simboliza con s2 y se obtiene mediante la f6rmula:
"
L (x; - x)2
s2 = ..";,-=,,,,1 __ -:-_
n - 1
(XI - x)2 + (x
2
- x)2 + ... + (x" - x)2
n - 1
La varianza de La pobLaci6n, por su parte, se representa con cr
2
y se
obtiene dividiendo la suma de desviaciones entre n (vale recordar
que la media poblacional se simboliza con 11):
"
L (x; - 11)2
cr2 = -';=:c
l
'--__ _
n
(XI - 11)2 + (X
2
- 11)2 + ... + (X" - 11)2
n
UNlOAD 1 • ESTAOfSTICA DESCRIPTIVA  
Es importante mencionar que si los valores de x estan expresados en
cierta unidad (como minutos, metros, kilogramos, etc.), tanto las des-
viaciones cuadradas como la varianza, que es un promedio de estas, 10
estaran en la unidad cuadrada correspondiente (min
2
, m
2
, kg
2
.. ).
Por ello, si se qui ere tener una medida que este en las unidades ori-
ginales se caleula la raiz cuadrada. La medida resultante se conoce
como desviaciol1 estcil1da r.
Desviacion estcindar
La desviaciol1 estdl1dar muestral es la raiz cuadrada positiva de la
varianza, se simboliza con s y se obtiene mediante la f6rmula:
"
s =
  _X)2 J
___ = (xl - X)2 + (x
2
- X)2 + ... + (X" - X)2
11-1 n-1
La desviacion estcindar de fa pobfacion se representa con cr y se
obtiene como la raiz cuadrada positiva de la varianza poblacional:
cr=
Ejemplo
14
Caleulemos la varianza y la desviacion estandar para la
muestra de f6siles. Recordemos que los datos se obtuvieron
a partir de una muestra de 14 f6siles, a los cuales se les midio la
altura de un hueso frontal (en mm).
@Santillana 2. Medidas numericas representativas
43 _
_ 44
La media muestral que ya habfamos calculado es x = 32.64 mm.
Presentamos las desviaciones y desviaciones euadradas de la altura
del hueso frontal:
Observaci6n Desviaciones Desviaciones cuadradas
(x - xl (x :W
42 (42 - 32.64) = 9.36 87.6096
27 (27 - 32.64) = - 5.64 31.8096
25 (25 - 32.64) = -7.64 58.3696
40 (40 - 32.64) = 7.36 54.1696
33 (33 - 32.64) = 0.36 0.1296
31 (31 - 32.64) = -1.64 2.6896
42 (42 - 32.64) = 9.36 87.6096
34 (34 - 32.64) = 1.36 1.8496
35 (35 - 32.64) = 2.36 5.5696
25 (25 - 32.64) = -7.64 58.3696
29 (29 - 32.64) = -3.64 13.2496
30 (30 - 32.64) = -2.64 6.9696
29 (29 - 32.64) = -3.64 13.2496
35 (35 - 32.64) = 2.36 5.5696
Suma 427.2144
Entonces, la varianza muestral se obtiene como sigue:
"
L(x
i
- X)2
s2 = i ~ l = 4 2 7 ~ ~   4 4 = 32.8626 mm2
n - 1
Y la desviacion estandar es la raf2 de la varianza:
"
L (Xi - x)2
i ~ l _ /427.2144 _ , / 2 _
s= n-1 --y l3 -y32.8626mm-5.73mm,
es deeir, en este ejemplo la varianza es de 32.86 mm
2
y la desvia-
cion estandar de 5.73 mm.
UNlOAD 1 • ESTAOfsTICA DESCRIPTIVA @Santillana
La interpretaci6n de estas medidas se hace por comparaci6n. Una me-
dida par sf misma no nos indica si hay mucha a poca variabilidad, pero
si tenemos dos 0 mas muestras podemos campara!" sus varianzas }'
coneluir cw\! presenta mayor variabilidad.
Al igual que ocurre can la media, la varianza I' la desviaci6n esUin-
dar son medidas muy sensibles a la presencia de observaciones atipi-
cas, ya sea mu)' grandes a muy peque!';as en comparaci6n con el resto
de observaciones en la muestra. De ahf que haya otra medida de varia-
bilidad: el rango interwartil.
A fin de caleular el rango intercuartil primero se determinan dos
valores llamados cuartiles. Como recordaras, la mediana divide el
conjunto de datos ordenados en dos mitades; los cuartiles se encuen-
tran justa en media de cada mitad. En otras palabras, al obtener los
cuartiles el conjunto de datos queda dividido en cuatro partes iguales.
EI wartil inferior es la mediana de la mitael que contiene los datos
de menor valor y el cum·til superiores la median a ele la mitad que can-
tiene los datos con valor mayor en la muestra.
Ejemplo
15
Usemos los datos de la altura del hues a frontal medida (en
mm) a una muestra de f6siles. En el primer rengl6n de la
tabla siguiente se presentan los elatos originales I' en el segundo, los
elatos ordenados de manera ascendente:
42 27 25 40 33 31 42 34 35 25 29 30 29 35
25 25 27 29 29 30 31 33 34 35 35 40 42 42
Como vimos en el ejemplo 11, en este caso se tiene un n(lmero par
de datos, asf que para obtener la mediana se promedian los valores
de las celdas sombreadas, con 10 que se obtiene 32.
A partir de este valor poelemos caleular los cuartiles:
25 25 27 29 29 30 31 33 34 35 35 40 42 42
25 25 27 29 29 30 31 33 34 35 35 40 42 42
29 35
EI cuartil inferior es 29, pues es el data que se encuentra en media
de la mitad inferior; a la vez, el cuartil superior es 35, el data que se
encuentra en meelio de la mitad superior.
2. Medidas numericas representativas
45 _
_ 46
Luego definimos el rango intercuartil como la diferencia entre el
cuartit superior y el inferior: 35 - 29 = 6, de modo que el rango
intercuartit es igual a 6.
Cuartil
EI cuartil inferior (CI) es la mediana de la mitad inferior de la muestra.
Por su parte, el cum·til superior (CS) es la median a de la mitad
superior de la muestra.
(Si la muestra contiene un numero impar de observaciones, la
mediana se incluye en ambas mitades de la muestra.)
A su vez, el rango intercuartil (RI) es la diferencia entre el cuartil
superior y el cuartil inferior:
RI = CS - CI.
En el ejemplo, el rango intercuartil es 35 - 29 = 6. Como en esta mues-
tra no hal' datos atipicos, la desviaci6n estandar, que fue 5. 73, es muy
cercana al rango intercuartil.
£jemplo
16
En un estudio para explicar los efectos del ejercicio y la edad
en algunas funciones circulatorias se obtuvieron datos de
una muestra de 21 corredores masculinos de mediana edad.
Los valores presentados en el diagrama de tallo y hoja corres-
ponden a niveles de oxigeno (mLlkg min) durante una sesi6n de
bicicleta a velocidad constante. Calculemos el rango intercuartil
para estos datos:
12 81
13
14 95
15 83, 97
16
17 90
18 27, 34
19 82, 94
20 62, 88, 93, 98, 99
21 15
22 16, 24
Tallo: unidades
23 16, 56 Hoja: centesfmas
OA: 35.78, 36.73
UNlOAD 1

ESTAD ISTI CA D ESCRI PTIVA «l Santillana
La muestra contiene 21 observaciones, por 10 que la mediana es el valor de en medio:
20.88, y se debe incluir en ambas mitades para caleular los cuartiles. Cada mitad con-
tiene 11 observaciones, un nlunero impar:
Mitad inferior 12.81 14.95 15.83 15.97 17.90 18.27 18.34 19.82 19.94 20.62 20.88
1
1
8.
27
1
Mitad superior 20.88 20.93 20.98 20.99 21.15 22.16 22.24 23.16 23.56 35.78 36.73
122.
16
1
EI cuartil inferior es 18.27 y el superior, 22.16; por tanto, el rango intercuartil es 22.16 -
18.27 = 3.89.
Para practicar

A un grupo de estudiantes se les tomo el tiempo (en minutos) que
tardaron en resolver un acertijo. Los resultados aparecen en la tabla
siguiente:
2.75 2.62 2.74 3.85 2.34 2.74 3.93 4.21 3.88
4.33 3.46 4.52 2.43 3.65 2.78 3.56 3.01
CD Determina el rango de tiempos; ademas, caleula la varianza mues-
tral 52 y la desviacion estandar muestral 5.
2 Determina los cuartiles superior e inferior, asi como el rango inter-
cuartil.
(}) Si los valores 4.33 y 4.52, que son los mayo res en la muestra, se cam-
bian pOI' los valores 5.33 y 5.52, explica como se veria afectado el
rango intercuartil.
@Santillana 2. Medidas numericas representativas
47 _
• •
••

• •



_ 48
is de datos bivariados
Es frecuente que al estudiar una pablacion haya que cansiderar mas
de una va ri able; par citar un casa, en un estudia de sangre se miden,
entre atros, las ni veles de colesterol, insulina, glucasa y trigliceridas.
lnclusa en acasianes tambien se estima la relacion que hay entre las
variabl es.
EI canjunta de datas que contiene a bservacianes de mas de una
va riabl e se llama multivariado. Un casa particular impartante es un
canjunta de abservacianes de das variabl es, x y)" que suele lIamarse
bivariado.
Cada abservacion del canjunta de datas bivariada cansta de un par
de valares. EI primer elementa del par es el valar de x y el segunda, el
valar de y.
Cansideremas un canj unta de datas bivariada en el que ambas va-
ri ables san numeri cas. Una grMica uti! para anali zar este conjunta es
el diagral1Ja de dispersi6n, tambien conacida coma nube de puntas.
Diagrama de dispersion
Para explicar este diagrama imaginemos lo siguiente. Se realizo un es-
tudia para determinar la influencia de la velacidad del vienta en la
pennanencia de una plaga en cierta tipa de planta; para ella se regis-
traran las valares de estas datas: velacidad (en m/ s) y tiempa (en ha-
ras) que permanecio la mitad de la plaga en la planta. En la tabla si-
UNlOAD 1 • ESTADISTICA DESCRIPT1VA SantilklOa
guiente se muestran los datos, que se ordenaron de forma ascendente
respecto al valor de x (que en este caso COlTesponde a la velocidad):
x 0.00 0.06 0.50 0.55 0.75 0.75 0.79 1.00 1.04 1.22 1.64 1.73 1.73
y 0.2 1.8 1.3 0.6 0.5 0.6 3.9 3.3 5.3 5.7 7.0 3.5 6.8
Esta lista de observaciones no proporciona informacion acerca de la
distribucion de las variables y menos aun de la relacion que hay entre
elias. Sin embargo, ya vimos como las graticas ayudan a mirar infor-
macion relevante sabre un conjunto de datos.
Un diagrama de dispersion es una gnifica en la que cada par de va-
lares se representa como un punta en el plano cartesiano. EI eje hori-
zontal se identi fica can los val ores de la variable x y el vert ical, can los
dey.
y = tiempo
8
7


6

5

4



3
2


1

I
0 x = velocidad
0 0.5 1 1.5 2
En el diagrama mostrado en la figura 14 se advierte que:
1 Hay observaciones que tienen el mismo valor en x, pero di stinto
valor en y, par 10 que este ultimo valor no esta determinado sola-
mente par x, sino par ot ros factores.
2 Existe una tendencia de y a crecer cuando x aumenta, es decir, los
valores de tiempo de permanencia mayo res estan asociadas con va-
lares mayores de velocidad: hay una relacion directa entre las varia-
bles.
3 Tal parece que el valor de y pod ria predecirse a partir de x encon-
tra ndo una recta que este suficientemente cerca de los puntas ob-
servados.
iQ Santillana 3. Am'ilisis de datos bivariados
Fi gura 14
Diagramo de dispersion
(in{luencia de fa velocidad del
viento en fa permanencia de una
p/oga en cierto tipo de planta).
49 _
Fi gura 15
Diagramo dispersion de siete
datos (re/aeion entre numero de
agentes de ventos y ventos netos).
_ 50
EjempLo
17
Una empresa que vende productos pOl' catalogo realiz6 un
estudio a fin de determinar la relaci6n que hal' entre el nu-
mero de agentes de ventasl' las ventas netas en cierta localidad. Se
registraron el nllmero de agentes (x) l' las ventas en miles de pesos
(Y), l' se obtuvieron los resultados siguientes:
Agentes (x) 10 11 12 13 14 15 16
Ventas (y) 20 25 32 30 33 34 34
En el diagrama de la figura 15 se advierte que al principio de la se-
rie de datos existe una tendencia de las ventas a crecer cuando
aumenta el nlllnero de agentes, mientras que al final las ventas se
estabilizan alrededor del valor 34.
40
35

• •

30

25

20
15
10
5
o
10 11 12 13 14 15 16 17
Mas tarde se registraron las ventas para 17, 18, 19), 20 agentesl' se
observ6 10 siguiente:
Agentes (x) 10 11 12 13 14 15 16 17 18 19 20
Ventas (y) 20 25 32 30 33 34 34 31 28 24 20
Notemos en la figura 15 que el valor de ventas netas aleanza un
valor maximo en 34 y en adelante la tendencia observada es la
contraria, pues las ventas disminuyen al au mental' el numero de
UN l OAD 1 I ESTAOfSTiCA DESCRIPTIVA C Santillan:,
agentes. Es decir. a mayor numero de agentes menores ventas,
existe una relaci6n inversa desde 17 agentes.
40
35
• •



30



25
• •
20
15
10
5
0
10 12 14 16 18 20 22
Para practicar
CD [nvestiga el tipo de cambio del d61ar durante los ultimos [2 meses:
xes el numero de mes y yes el tipo de cambio. Grafica un diagrama
de dispersi6n para el conjunto de datos y describelo.
2 A fin de determinar la relaci6n que hay entre las horas que una per-
sona ve television a la quincena y su edad, se encuest6 a un grupo
de 10 televidentes y se obtuvieron los resultados siguientes:
Edad (x) 15 19 31 39 41 44 47 48 55 65
Horas (y) 23 52 65 55 32 60 78 59 61 60
Traza un diagrama de dispersi6n con estos datos y describelo.
CI Santillana 3. Analisis de datos bivariados
Figura 16
Diograma dispersion de once
datos (relaeion entre niimero de
agentes de ventos y ventas netos).
51 _
_-+-__ ,Repaso
La presentacion de los datos
En esta unidad, dedicada en buena medida al estudio de la presentaci6n y el
a",!lisis de los datos, explicamos como elaborar:
® Tablas de frecuencias: absolutas, relativas, acumuladas
® GrMicas: hi stogramas, poligonales, circulares, ojivas.
Medidas representativas de un conjunto de datos
Tambien definimos las medidas representativas de un conjunto de datos, las
cuales se dividen en dos grupos: medidas de tendencia central y medidas de
variabilidad 0 dispersion.
® Medidas de tendencia central:
1 Media: se obtiene sumando los datos y dividiendo el resultado entre 1'1, es
decir, entre el numero de datos.
2 Mediana: es el valor que se encuentra en media de un conjunto de datos.
3 Moda: es el valor mas frecuente dentro del conjunto de datos.
® Medidas de variabilidad:
1 Varial1za: se obtiene calculando las diferencias entre cada data y la me-
dia y luego se e1evan al cuadrado tales diferencias y se suman para final-
mente dividir el resultado entre 11 (el numero de datos).
2 Desviaciol1 esttil1dar: es la raiz cuadrada posit iva de la varianza.
3 Ral1go: es la diferencia entre el dato mayor y el dato menor.
4 Rango illtercuartil: es la diferencia entre el cuartil super ior y el inferior. EI
cuartil illferior es la mediana de la mitad inferior de una muestra (con-
sulta tambien la unidad 4). Par su parte, el cum"til sl/perior es la mediana
de la mitad superior de la muestra.
Datos bivariados
_ 52
Finalmente, abordamos el analisis de datos bivariados, que como recordaras,
son conjuntos de datos que contienen dos variables 0 atributos relacionados
entre si. En este tema vimos un tipo de grafica en particular:
® Diagrama de dispersion.
UNlOAD 1 • ESTAOrSTICA DESCRIPTIVA o Santillana
F
inanzas es la rama de la economia que estudia el flujo de dinero
entre individuos, empresas 0 Estados; tambien se conoce popular-
mente como la ciencia de administrar dinero.
En finanzas, la estadistica descript iva es una herramienta funda-
mental, ya que la toma de decisiones se basa en el amilisis de infor-
macion.
En la actualidad, la informaci6n financiera como cotizaci6n de divi-
sas y metales, indices de mercados internacionales, tasas e inflaci6n es
analizada y utilizada tanto por instituciones financieras (bancos, ase-
guradoras, casas de bolsa, etc.) como por particulares interesados en
optimar su situaci6n financiera.
Es comun que dicha informaci6n se presente en tablas y graficas
como las que vimos en esta unidad. Por ejemplo, en la pagina de inter-
net de cualquier banco puede aparecer informaci6n similar a la mos-
trada en la figura 17.
~  
MERCADOS INTERNACIONALES
ACTUAL
1 VAR%
IPC 29087.29 - 0.75
IRT 32508.14
~
DOW IONES
f,435.11
- 0.93
NASDAQ 2344.49 - 1.24
S&P500 1355.37 - 0.87
1
NIKKEI-225 13626.45 1.26
J
BOVESPA 62590.60 1.27
-
CAC-40 4858.65 0.07
DAX30 6962.28 - 0.16
Matematicas y otras ciencias
Figura 17
Informacion {inanciera del
14 de febrero de 2008.
53
54
Analizaremos el comportamiento del tipo de cambio del d6lar esta-
dounidense frente al peso durante el ano 2007:
Mes TIpo de cambia
Enero 11.0155
Febrero 11.1795
Marzo 11.0573
Abril 10.9615
Mayo 10.754
Junia 10.8153
Julio 10.9874
Agosto 11.0455
Septiembre 10.951
Octubre 10.6688
Noviembre 10.9105
Diciembre 10.9295
Primero presentamos la informaci6n en un diagrama de tallo y ho;a,
que nos ayudara a ver en que rango de valores esta la variable, cual es
su distribuci6n y si existen valores atfpicos en el conjunto de datos.
,. 688
540
,: 153
,. 105. 295. 510, 615. 874
155, 455, 573
795
Podemos observar que en el 2007 el tipo de cambio se encuentra en-
tre 10.6688 y 11.1795; la mediana es 10.9510, no hay datos atfpicos y
la mayor concentraci6n de datos esta en el tallo 10.9, es decir, entre
10.9 y 11.
UN l OAD 1 ESTAOfSTICA DESCRIPTIVA
Construyamos ahora una tabla de distribuci6n de frecuencias; para
ello definimos los intervalos de clase y contamos cuantos datos caen
en cada intervalo. La tabla obtenida es la siguiente:
Tipo de cambia
-
Intervalo Frecuencia Frecuenda retativa
[10.5 -10.7) 1 0.083
[10.7 -10.9) 2 0.167
[10.9 -11.1) 8 0.667
[11.1-11.2) 1 0.083
Finalmente. calculemos algunas medidas representativas del conjunto
de datos.
Tendencia
Media = 10.93965
Mediana = 10.95625
Variabilidad
Varianza = 0.0179546
Desviaci6n estandar = 0.1339946
Rango = 0.5107
Rango intercuartil = 0.1363
Matematicas y otras clenclas
Agura 18
Histogramo y pollgono de
frecuencias del tipo de cambia
del ddlar en el afla 2001.
55
r .. a.ndas ProlNlbitidlld
0
,
,
1'·-- --
f::
f::
f:::
f-
117
'"
...
7
,
0.1653
 
'l
'.00<'
1<
" " ," I' ""d. ,,' ... ' , ... "". 7 'X
'-- ,--""----
[ . 1 ....... " ? t3.
...... -- --'----
_.-
_... 0 .,..
  ~
_.-
~ - - --

'"
O. 16Sl
,
'"
0.2211
,   ~
O.12U
,
m 0.1624
"
G. ll 02
"
0.0621
"
0.0191
,
.-
o.OIIn
". 0.01)1'
"
O.0Gf.2
"
0.0014 ..
..
• ) • I
• • • " 11
. ,
.-
..
• • • J • • " "
_ 60
Autoevaluaci6n
0) Un entrenador de atletismo que es responsable de 20 cor redo res registro
el tiempo que tardan en recorrer 500 m. A continuacion se induye una
!ista de tiempos en minutos:
4.37 4.64 4.62 4.02 6.04
4.60 3.82 4.98 4.62 6.02
3.27 5.15 5.51 5.24 5.94
5.49 6.50 5.33 4.40 4.27
Construye un diagrama de talla y hoja para presentar la informaci6n.
2 Organiza los datos del ejercicio 1 en una tabla de frecuencias, que incluya
frecuencias relativas y frecuencias acumuJadas.
CD Calcula la media, la mediana, el rango, el rango intercuartil y la desviaci6n
estandar para los datos del ejercicio 1.
4 Una panaderfa registro sus ingresos diarios durante des semanas; a COI1-
tinuaci6n se presentan los resultados obtenidos:
2700 2500 2520 2750 2780 1600
2640 2690 2570 2410 2710 1500
Construye un diagrama de talla y hoja para presentar la informaci6n.
0) Describe los datos del ejercicio 4 en una tabla de frecuencias.
6 Calcula la media y la desviacion estandar para los datos del ejercicio 4.
o En un grupo de 24 estudiantes de sexto ailo de primaria se registr6 la es-
tatura en m de cada uno de ellos y se obtuvo la tabla siguiente:
1.26 1.29 1.33 1.35 1.42 1.26
1.27 1.30 1.34 1.28 1.41 1.26
1.27 1.31 1.34 1.25 1.42 1.55
1.28 1.33 1.34 1.40 1.40 1.36
Construye un diagrarna de talla y haja para presentar la informacion.
UNlOAD 1 • ESTAOisTICA DESCRIPTIVA eSantillana
8 En el consultorio de un pediatra se registro el peso en kg de un grupo de
40 pacientes de tres a seis meses de edad:
5.580 6.090 3.700 6.900 7.600 6.060 4.380 4.230
4.590 4.910 4.550 7.450 4.720 6.150 6.720 7.170
8.320 4.000 4.170 6.820 4.000 5.630 9.460 4.730
7.530 7.140 6.520 6.500 3.980 7.880 6.180 4.800
6.070 7.710 5.910 6.630 8.710 4.710 6.490 6.980
Construye una tabla de frecuencias y frecuencias relativas agrupando los
datos en c1ases.
® En una universidad se seleccion6 una muestra de 22 estudiantes de
diferentes carreras: A = administracion, P = psicologfa. I = ingenierfa,
D   derecho y M   medicina, y reslllto:
{M, I, I, P, P, p,1, A, A, A, p,1, A, D, D, D, D, P, I, D, A, A).
Construye una tabla de frecuencias absolutas y relativas.
@ Traza una grafica circular para representar los datos del ejercicio 9.
@ En una escuela se registra el numero de cursos reprobados en cada grupo.
Los resultados del mes pasado en uno de elias fueron:
{O, 2, 5, 0, 3, 0, 2, 2, 0, 0. 3, 0, 0, 1,4,5,2,2,3,0,0.0, 1,0.0,5}.
Construye una tabla de frecuencias y frecuencias relativas.
12 En un hospital se realiz6 una en cuesta a un grupo de 235 pacientes a fin
de evaluar el servicio medico. Las posibles respuestas son:
I 5-excelellte • 2-reglllar
• 4-muy bien • I-mal
• 3-bien
EI resultado de la ell cuesta se resume en la tabla de frecllencias que sigue:
Evaluaci6n Frecuencia
5 39
4 54
3 98
2 34
1 10
Traza un histograma de frecuencias.
C Santiltana Autoevaluaci on y ejercicios de refuerzo
61 _
_ 62
@ Se aplic6 una prueba de inteligencia a un grupa de 125 estudiantes y la
informacion obtenida se resume en la tabla de frecuencias:
Puntos Frecuencia
10,50) 7
[50,60) 24
[60,70) 23
[70,80) 44
[80,90) 22
[90,100) 5
Traza un histograma de frecuencias relativas.
14 A fin de mejorar el servicio, en una sucursal bancaria se tama una mues-
tra de 15 usuarios, se registro el tiempo de espera (en minutos) y se obtu-
vieron los datos siguientes:
{20, 16, 16, 10, 10,5,B, 10,20, 10,45,6,35,65, 10).
Calcu[a la media y la mediana para este canjunta de datas. ,Cmil de las
dos medidas crees que representa mejor 105 datos? l.Por que?
15 EI profesar de estad[stica ha calificada 19 examenes de las 20 estudiantes
de su grupo y la media hasta el momento es 7.2. ,-Cmil es la calificaci6n
minima que debe obtener el ultimo estudiante para que la media del gru-
po aumente un punta? t Y para que au mente dos puntas?
16 Una marca de refresco lanz6 una campana publicitaria con el prop6sito de
au men tar sus ventas en 12 ciudades. Considera un exito (£) si aumenta-
ron las ventas en la ciudad y un fracaso (F) si no. Los resultados fueron:
{E, E, F, E, E, E, F, F, E, E, E, F).
a ,-Cual es la proporcion de exitos en la Ilmestra?
b Supan que se incluyen ocho ciudades mas, ,-para cU<lntas de elIas debe
resultar exitosa la carnpana si la proporcion de exitos en la muestra
completa de 20 es O.BO'
@ Para mejorar la vialidad en una zona de la ciudad se registra el tiempo (en
minutos) que tardan en recorrer un tramo de periferico una muestra de
18 conductores a diferentes homs del dfa. Los resultados aparecen en la
tabla siguiente:
6.75 6.62 6.74 7.85 6.34 6.74 7.93 8.21 7.88
6.33 7.46 8.52 6.43 7.65 6.78 7.56 7.01 15.1
Determina el rango de tiempos; ademas, calcula la varianza muestral 52 y
la desviacion estandar muestral 5.
UNlOAD 1 • ESTAOfsTICA DESCRIPTIVA @Santillana
If': Para los dcll'il.'rcicio 16, cielermina los   superior t' inferior,
-lSi cumo d rango intercuJ.nil.
19 Si Ins dos \\llorE's mayon.'s en 1.1 mllt'str,l st;:" cambian pm los y,liores 112 \'
] i:'):2. t'xplic,\ nlmo SC' \'ed.1 afectacio d rango intl.'rtll.util.
'0   d prt:'cio del petroll.'o 1ll1'xic.1no durantt' l'tlt1l110:-O 12 Ill('S('S;
.\' l'S d mimew cll' Illes y y eS eI precio, Grafica un cii;lgrall1<1 de dispersion
p'.lI'a t.,1 coniunto cil' datos y descnbelo,
21 Con objL'to de determinal' ia relacirln entre ei nlUl1l'l'O dl' \'l'CeS qut' st'
consult" a 1.111 medico <11 ailo y ia edad, st' ellcuestl) a 1.111 grupo de 10 pa-
cientl':-O Y st.' obtu\'iewn los resultados siguicl1tl's:
Edad (x) 35 39 41 49 51 54 67 68 75 85
Consultas (V) 3 2 2 3 4 10 11
Traza Ull diagramJ cil' dispersion con estos datos y dl.'snibeln,
Ejercicios de refuerzo
Sl' rl'gislt'l_l t'i lit'lnpo qut.' tarda cad a t'mpieaeio en   1.111 trabajl) y .1
contilluacion Sl' present.1 una !isla de tiempos l'1l minutos:
3.37 3.34 5.30 3.00 4.05
3.30 3.82 5.95 3.82 4.05
3.27 7.15 4.50 7.04 3.93
3.49 3.50 3.30 5.30 3.41
COllst ruye Ull eiiagrama de tall o y hoja para presl'lltar la inforllli.lCion,
2 La liencia de DOIlo.1 Sara registro sus \'entas diarias durantl' dos scmanas y
los resultados obtl'nidos se presentan a continuacion:
4555 4355 4345 4555 4585 1455
4455 4495 4375 4415 4515 1355
Construye un diagrama de taBo y hoja para estos datos,
Autoevaluacion y ejercicios de refuerzo
63 _
_ 64
CD EI nltmero de alumnos que se inscri bieron en cada uno de los 24 cursos
que imparten en un centro deporti vo y cultural son:
4
36 39 33 35 23 26
37 30 32 38 21 36
37 31 32 35 23 55
38 33 32 20 20 36
Construye un diagrama de tallo y hoja.
En un consultorio medico se registro el peso en kg. de un grupo de 50
pacientes:
55.7 60.6 35.0 66.0 56.0 60.6 43.7 44.3 65.7 61.3
45.6 46.1 45.5 54.5 45.4 61.5 61.4 51.5 44.6 56.0
73.4 40.0 41.5 67.4 40.0 56.3 64.6 45.3 64.3 36.5
55.3 51.4 65.4 65.0 36.7 57.7 61.7 47.0 57.4 54.6
60.5 55.1 56.1 66.3 75.1 45. 1 64.6 66.7 66.3 46.5
a Construye una tabla de frecuencias y frecuencias relativas agrupando
los datos en clases.
b Calcula adem as las frecuencias acumuladas y frecuencias relat ivas
acumuladas.
CD Se les pregunto a ciertos cl ientes cual s   b ~ r de helado les gustaba mas.
F = fresa, \I = vain ilia, ell = chocolate, L = limon, las respuestas fueron:
{ V, L, CII, F, F, F, V, \, L, Ch, Ch, L, V, F, F, F, L, L, L}
Construye una tabla de frecuencias absolutas, relat ivas y acumuladas.
Traza una grafica circular que represente estos datos.
6 En un centro telefonico registran el numero de lIamadas recibidas duran-
te cada dia, los resultados del mes pasado fueron:
{10, 12, 15, 10, 13, 10, 12, 16, 16, 10, 13, 10, 10}
a ;.Cuantos dras recibieron menos de 13 lIamadas?
b ;.Que porcentaje de dias se recibieron al rnenos 15 lIamadas?
c Calcula la media y mediana.
d Calcula la varianza, desviacion estandar y rango intercuartil.
U N lOAD 1 • ESTAOfSTICA DESCRIPTIVA e Santillana
(j) Una Universidad realizo una en cuesta a un grupo de estudiantes, con el
fin de evaluar su servicio. Las posibles respuestas son: 5-excelente, 4-muy
bien, 3-bien, 2-regular, I-mal. EI resultado de la en cuesta se resume en la
tabla de frecuencias siguiente:
Evaluaci6n Frecuencia
5 32
4 54
3 95
2 38
1 16
Calcula las frecuencias relativas y acumuladas. Traza un histograma de
frecuencias y una ojiva.
8 En una clfnica se registr6 el peso de un grupo de recien nacidos y la infor-
macion se resume en la tabla de frecuencias siguiente:
Peso (kg) Frecuencia
[1.5, 2.5) 4
[2.5,3.5) 46
[3.5,4.5) 65
[4.5, 5.5) 8
a Traza un histograma de frecuencias relativas.
b Traza una gnifica circular para estos datos.
® Si observas, la mayor parte de los datos estan en alguno de los dos inter-
val os de en media, asf que se construye una tabla de frecuencias con dife-
rente elecci6n de intervalos como la siguiente:
Peso (kg) Frecuencia
[1.5,2.5) 4
[2.5,3) 14
[3,3.5) 44
[3.5,4) 42
[4,4.5) 21
[4.5,5.5) 8
a Traza un histograma de frecuencias correspondiente a la nueva tabla.
b tCual de los dos histogramas describe mejor los datos? tPor que?
eSantiliana Autoevaluacion y ejercicios de refuerzo
65 _
_ 66
10 Dibuja una grafica circular y un poligono de frecuencias para los datos de
los ejercicios 7, 8 Y 9. Compara tus graficas y expliea eual de elias es mejor
para cada easo.
@ Se Ie pregunt6 a un grupo de 35 alumnos de 9 ailos su estatura en ems. y
se obtuvieron los siguientes datos:
132 143 134 150 144 134 144
143 142 148 148 152 150 140
141 138 143 143 131 141 135
140 133 138 138 150 149 148
133 134 142 142 144 148 140
Construye una tabla de frecuencias usando cada valor posible como una
categorfa, dibuja una gnlfica circular y un poligono de freeueneias corres-
pondiente. (,Cual es la.desventaja de la grafica circular?
12 Agrupa los datos del ejercicio 11 para tener menos categorfas, ademas
dibuja una grafica circular y un poifgono de frecuencias eorrespon-
diente.
@ Para los datos del ejercicio 12 traza una ojiva de frecuencias relativas acu-
muladas.
14 Se seleecion6 una muestra de 15 mujeres entre 15 y 35 ailos y se les pre-
gunto el numero de hijos que tienen, las respuestas obtenidas fueron:
{2,3, I, 3, 5, 0, 2, 0, 3, 0,1,2,2,4,3)
Calcula la media y la mediana para este conjunto de datos. i,Cual de las
dos medidas crees que representa mejor los datos? i,Por que?
@ EI profesor de estadistica ha calificado 15 examenes de los 16 estudiantes
de su grupo y la media hasta el momenta es 6.5. i,Cual es la calificaci6n
minima que debe obtener el ultimo estudiante para que la media del gru-
po aumente un punto? i,Para que aumente dos puntos?
16 Se aplic6 un examen de matematicas a un grupo de estudiantes y luego se
les dio un curso intensive durante dos seman as. Se volvi6 a apliear el exa-
men y se considera un exito (E) si el alumno obtiene un mejor resultado
en el segundo examen, fracaso (F) si no. Los resultados fueron:
{E, E, F, E, E, E, F, F, E, E, F, F, E, E, E, E)
a i,Cual es la proporci6n de exitos en la muestra?
U N l OAD 1 I ESTAOisTICA DESCRIPTIVA Santillana
@ Para probar la eficiencia de las maquinas en un taller, se selecciono una
muestra y se tomo el tiempo (en minutos) que tardaron en realizar un
proceso. Los resul tados aparecen en la siguiente tabla:
1.75 1.61 1.75 3.85 1.35 1.75 3.93 5.11 3.88
5.33 3.56 5.51 1.53 3.65 1.78 3.56 3.01
Determina el fango de tiempos, ademas calcula la varianza muestral 52 y
la desviacion estandar Illuestral s.
18 Determina los cuartiles superior e inferior, asf como el rango intercuartil.
@ Si sustituyes los dos mayores valores en la muestra par los valores 6.34 y
6.52, explica, lconlO se verla afectado el rango intercuartil?
20 Con el fin de determinar la relaci6n entre ingreso de una persona y su
escolaridad (l -primaria, 2-secundari a, 3-preparatoria, 4-licenciatura,
5-postgrado), se enClIesto a lin grupo de to empleados y se obtuvieron los
siguientes resultados:
Escolaridad (x) 1 2 3 4 5
Ingreso mensual (y) 2300 5200 6500 15500 22000
Traza un diagrama de dispersion con estos datos y descrfbelo.
C Santillana Autoevaluaci6n y ejercicios de refuerzo
67 _
70
Georg Cantor, motemdtico
aleman, creador de fa teorfa
de conjuntos.
Introduccion
< Cuantos numeros telef6nicos podemos construir con seis dfgitos'
Contar es una de la primeras habilidades que asociamos con el cono-
cimiento matematico; sin embargo, la manera de contestar la pregunta
anterior puede no ser tan evidente. En esta unidad aprendenis los
principios basicos de la combinatoria, que es la teoria que fundamenta
la labor de con teo. Al final de esta unidad podras responder a esta
pregunta y a muchas otras relacionadas con contar, que sera una habi-
lidad basica para comprender los temas expuestos en la unidad 3, de-
dicada a la probabilidad, donde resolveras problemas apoyado en los
conocimientos que adquieras en esta.
<Tendran el mismo tamalio todos los conjuntos infinitos'
Georg Cantor fue el primero en responder a esta pregunta y demos-
trar que no, que no todos los conjuntos infinitos tienen el mismo ta-
malio. Por ejemplo, el conjunto de los numeros naturales (los que usa-
mos para contar) y el de los numeros racionales (los que pueden
expresarse como una fracci6n) son del mismo tamal'lO, pero el de los
numeros reales no.
A Cantor se Ie conoce como el padre de La teoda de conjuntos, que
forma la base para gran parte de las matematicas. En esta unidad pre-
sentamos una breve introducci6n a eli a, la cual servira como punto de
partida para los temas que estudiaremos en las demas unidades.
UNlOAD 2 • (ONJUNTOS Y COMBINATORIA Santillana
Fundamentos de la
de conjuntos __
Considera los est ados de la Republica Mexicana. Ahora enUlllera los
siguientes:
a Aquellos cuyo nOlllbre elllpieza con la let ra C.
b De los que elllpiezan con la letra C, indica los que colindan con
otros paises.
c De los estados del inciso (b), haz una Iista de los que son SureI'IOS.
d De los est ados del inciso (c), considera aquel que colinda con el es-
tado de Yucatan.
\---
Sonora
"Santillana
Chihuahua
'.
Durango
Aguascalientes
Coli
Estados Unidos de America
".
Coahuila
leon.
, • !{J
l .$
'S
.
.' t;

San luis"
Potosi ()
. .
GuanajualQ o·
>;)'l.-  

.(.0 -
_ Tlal!.tala
Michoacan   "", v.
/-" Puebla -<'rae:
. ••• 'l.r",.
O.F. , Guerrero
Morelos . Oaxaca
1. Fundamentos de la teorla de conjuntos
M

Yucatan
J
..§'
<-
If
<Y
labasco
Guatemala
71 _
_ 72
Car/os Linnea, creadar
de Ja laxanom{a moderna.
Para realizar el ejercicio anterior uti lizaste de ma nera naturalla no-
ci6n de conjunto; veamos ahora su defi nici6n formal.
Conjunto
Un conjunto es una colecci6n de objetos que poseen una caracteris-
tica comun. Esos objetos que integran el conjunto se denomi nan ele-
mentos del conjunto.
Para representar 0 denotar los conj untos se suele utili zar letras ma-
yusculas cursivas, y encerrar en llaves 0 corchetes Sll S elementos.
Por ejemplo, si A es el conjunto descrito en el ejercicio anterior, in-
ciso (al, entonces:
A = {Chihuahua, Coahui la, Chiapas, Campeche}.
Campeche es un elemento de A; de hecho, es el uni co elemento del
conjllnto descrito en el inciso (d).
La dasificaci6n de objetos en conjuntos con caracteristicas en co-
mun se uti liza con frecuencia en varias areas del conocimiento. Pense-
mos en Ia taxonomia empleada en biologia para dasificar los diversos
seres vivos. Tanto el tomate como la manzana pertenecen al mismo
rei no, Plantae, ya Ia mi sma d ase, Magnoliopsida, pero se agrllpan en
distintos 6rdenes: Ia manzana en Rosales y el tomate en Solanales.
Formas de expresar un conjunto
La nocian de conjuntos tambien se emplea con frecuencia en mate-
mat icas para agrll par, dasificar y trabajar con objetos como numeros
y figuras. Por ello, se han creado formas especificas de representarios.
UNlOAD 2 I CONJUNTOS Y COMBINATORIA Santillm:..
Sea B = {2, 4,6,8,10). Una forma de describir el conjunto B es con
palabras: "be es el conjunto formado por los nluneros naturales, pares,
menores 0 iguales a diez':
Esta misma idea puede expresarse simb6li camente, es decir, con
simbolos matemaricos:
B = {x I x es un nl,mero par y x :5 10).
que se lee: "be es el conjunto formado por equi s, tal que equi s es un
numero par y equi s es menor 0 igual a di ez':
Entonces, podemos describir un conjunto de dos formas: por ex-
tensi6n 0 por compresi6n. Lo describimos por:
I Extension, si enumeramos sus elementos explicitamente: B = {2, 4,
6,8, 10 ).
I Compresion, si 10 caracterizamos por una propiedad 0 condi ci6n
que relaciona todos sus elementos: B = {x I x es un numero par y
x:5 lO ).
La descripci6n por compresi6n de un conjunto no es unica; otra
descripci 6n valida para el conjunto B del ejemplo anteri or es la si-
guiente:
B = {x I x es divisible entre 2 )' x < 11 ),
Otra manera comun de escribir los conjuntos por compresi6n es enu-
merando solamente algunos de sus elementos y utilizando puntos sus-
pensivos ( ... ) para indicar que el mismo patr6n se repite; por ejemplo,
otro modo de describir el conjunto B por compresi6n es B = {2,
4, ... , 10).
Tambien suele representarse un conjunto medi ante un diagrama
que se denomina de Venn-Euler, como el de la figura 1. donde el con-
junto se representa en el interior de una linea cur va cerrada y los ele-
mentos se ubi can dentro de el.
8
2
6
4
8
10
CSantiliana 1. Fundamentos de la teoria de conjuntos
Figura 1
Oiograma de Venn·Euler
que representa el conjunto B.
73 _
LEONHARD EULER IOHN VENN
I eonhard Euler (1707·1783)
L fue un matematico suizo,
famoso par sus multiples con·
tribuciones a las matematicas
y la fisica. Popularizo la nota·
cion de la tetra 11 para el nLime·
ro que multiplicado par el radio
al cuadrado nos da el area de
un circulo y, en particular, uti·
J
ohn Venn (1834·1923) fue un
filosofo ingles que centraba
su interes en la logica simbolica
y su representacion mediante
diagramas. Fue quien populari·
zolos diagramas para represen·
tar conjuntos.
La diferencia entre los diagra·
mas de Venn y los de Euler es
liz6 diagramas para representar ideas \6gicas como
la pertenencia 0 no de dertcs objetos a un conjunto
especifico.
que los del primero suelen describir todas las intersec·
ciones posibles entre los conjuntos en estudio, en tan·
to que los de Euler no necesariamente las consideran.
_ 74
Conjunto finito e infinito
EI conjunto B de los nellneros pares defi nido anteriorme nte tie ne un
numero {Illito de elementos. En cambia, si definimos C = {x I xes nu-
mera par}. entonces es claro que C es un conjunto que tiene un nume-
ra iI/iiI/ito de elementos.
Hemos vista el usa de los puntas suspensivos en la notacion de con-
juntos. En un conjunto for mado pOI' una cant idad infinita de elemen-
tos los puntas suspensivos se colocan al fi nal:
C = {2, 4, 6, 8, 10, .. ).
Para practicar
CD Da dos desc ri pciones par compresion del conjunto A = {3, 6, 9).
2 Describe por extension todos los nellneros naturales di visores de 3
menores que 20.
® Escribe por extension el conjunto A = {x x natural impar )'
x < 10).
Nociones basicas y simbologia
Si un elemento x pertenece a un conjunto A, entonees general mente se
expresa x E A. 5i no pertenece, se escribe x $. A.
Cuanda nos referi mos a un conj unto solemos hacerlo en cierto con-
texto, el cual esta dado pOI' el problema que se busca resolver 0 el caso
que se anal iza . Puede suceder, par ejemplo, que en clase de Qui mica,
cuando se exponen las propiedades de los gases nobles, nos venga a la
mente Ia tabla periodica de los elementos, en particular la columna 18,
donde se encuentra el conjunto de los gases nobles.
UNlOAD 2 • CONJUNTOS Y COMBINATORIA .till
Considera el conjunto A = {x I - 2 os x os 4 }. Responde: <t E A? En
esta pregunta no es evidente que tEA; la respuesta COlTecta depen-
deni del contexto en que estamos cons iderando A, ya que si s610 tene-
mos en cuenta los nllmeros naturales (N), entonces t no seria un ele-
mento de A; es decir, t fl. A. Sin embargo, si consideramos los numeros
racionales (Q), entonces tEA.
Generalmente utilizamos N como universe cuanda contamos obje-
tos indivisibles (per ejemplo, el numero de alum nos en una clase). No
obstante, cuando empleamos fracciones de la unidad usamos Q como
universo; por ejemplo, cuando compramos medio kilogramo (kg) de
un producto (digamos, t kg de fresas).
Conjunto universo ('U)
EI conjunto universo 0 universal es aquel de donde se seleccionan los
elementos para formar otros conjuntos. Simb6licamente se denota
con la letra 'U. En los diagramas de Venn se representa con un rec-
tangulo.
Con base en la definici6n anterior, el conjunto A quedaria represen-
tado como sigue (figura 2):
'U = conjunto de los naturales (N)
2
1
3
4
A
En la figura 2 se observa que si U es el conjunto de los numeros
naturales, entonces A = {1, 2, 3, 4}, pero si U es el conjunto de los
numeros enteros, entonces A = {-2, -1,0,1,2,3,4}. Por ultimo, si
U es el conjunto de los numeros reales (lR), entonces A seria un con-
junto con un numero infinito de elementos. Observa que la composi-
ci6n de un conjunto depende del universo a partir del cual se define.
Cl Santillana 1. Fundamentos de la teorfa de conjuntos
Figura 2
Conjunto A, dentro del
universo (10, que equiva/e a flo
75 _
_ 76
Considera ahora 'U = { 1, 2, 3, 4, 5, 6} )' sean los eonjuntos B = p, 2}
)' C = {x E 1,1 I x
2
:s 4}. Entonees, C puede eseribirse pOl' extensi6n
como C = {1, 2}, de 10 que se deduee que B )' C contienen los mismos
elementos del universo.
Conjuntos iguales 0 equivalentes (=)
Dos eonjuntos A y B son ;guales 0 equ;valentes si eonti enen los mis-
mos elementos del uni verso. Se representan eon A = B.
POl' otra parte, si dos conjuntos no eonti enen los mismos elemen-
tos se diee que son diferentes, 10 eual se simboli za eon A * B.
De aeuerdo eon 10 anterior, )' dado 'U = {1, 2, 3, 4, 5, 6}, vemos que
B=C.
Conjullto vacio (0)
Un eonjunto es vacio si no contiene elementos. Se representa con el
simbolo 0, de modo que si A es un eonjunto vado, entonees A = 0
o bien,A = {}.
Consideremos ahora los eonjuntos sigui entes y veamos cuales son
los elementos de 1'{ = {1, 2, 3, 4, 5, 6} que los eomponen:
I D = {x E 1'{ I xes mliltiplo de 4}.
I E = {x E 'U I xes mliltiplo de 7}.
I F = {x E ~ [ I x es divisible ent re 2}.
Tras anali zar los conjuntos observamos que D = {4}, E = 0 )'
F = {2, 4, 6}. De estas relaeiones podemos saear en claro 10 siguiente.
Subeonjunto   ~ )
Un eonjunto A es subeol1/unto de otro conjunto B si todos los ele-
mentos de A estan tambien contenidos en B. Se eseribe A ~ B, 10
eual se lee 'A es subeonjunto de B".
Si A ~ B )' B tiene un elemento (0 vari os) que no este contenido
en A, entonees A es un subconjunto propio de B, 10 eual se represen-
ta simb6lieamente como A C B.
POl' otro lado, si A no es subeonjunto propio de B se eseribe A rt B.
Cuando se quiere indiear que A es un subeonjunto de B es indistin-
to expresar A ~ BoB ::::J A. Si un conjunto A no esta contenido en otro
B, se eseribe A r:J, B.
UNIDAD 2 • (ONJUNTOS Y COMBINATORIA till. n
En los conjuntos D, E Y F presentados en panafos anteriores, se ob-
serva que D <:; F; de hecho, como 2 E F Y 2 tf. D, tenemos que F => D
(D es subconjunto propio de Fl. De la definici6n por extensi6n de B
y por compresi6n de C tenemos que B <:; C y que C <:; B; de hecho,
B = C, mientras que D r:t. c.
TEOREMA l. PROPIEDADES DE LOS SUBCONJUNTOS. Ell general,
para eualquier eonjullto A * 0 (A 110 "aciD) se eumplen las propie-
dades siguientes:
I A <:; A.
I A r:t.A.
I A<:;U.
Ahora consideremos los conjuntos G = {L 2, L 1, 2} Y H = {2, I}.
Ambos tienen los mismos elementos; de hecho, para 'U = {1, 2, 3, 4,
5, 6} contienen los mismos elementos de B y de C, por 10 que son
todos iguales: B = C = G = H. En otras palabras: ni el orden ni la re-
petici6n importan en el momento de definir por extensi6n los con-
juntos.
Para practicar
Para los ejercicios que siguen, sean:
I 'U = {1, 3,4, 5, 6, 7, 9),
I A = {x E U I x es par},
I B = {4, 6),
I C = {x E 'U I x es multiplo de 3),
I D = {x E U I x par mayor que 4}.
CD Indica cuales de las afinnaciones siguientes son verdaderas:
a UdA.
b 8 EA.
c BCA.
d D=0.
e B d A.
f 2 tf. A.
2 Con base en las definiciones de subconjunto e igualdad de conjun-
tos, demuestra que si A <:; By B <:; A, entonces A = B.
o Escoge un U para que una afirmaci6n siguiente sea cierta y otra
falsa:
A =B,
con A = {x E N I xes par yx < 3},B = {x E UI x = 2y,x < 3,y E 'U}.
Santillana 1. Fundamentos de la teorfa de conjuntos
77 _
Fi gura 3
Union de conjuntos.
_ 78
Operaciones con conjuntos
Considera los conjuntos A = {x x es un numero par menor que 7} Y
B = {x x es un numero par mayor que 5 y menor que 13}, con 'U = {Z }.
Escritos por extension, los conjuntos A )' B quedan asi:
A = {2, 4, 6} y B = {6, 8,10, 12}.
5i formamos el conjunto C con los elementos de A y los de B obtene-
mos C = {2, 4, 6, 8,10, 12}. Enlonces, C es la union de los conjunlos
A con B.
Union ( U )
La union de un conjunto A con un conjunto B, representada con
AU B, es el conjuntoA U B = {x I x E A 0 x E B}, es decir, la union
es el conjunto que agrupa todos los elementos que pertenecen a A
con todos los que pertenecen a B.
En el diagrama de Venn de la figura 3 se representa gnificamente la
union de estos conjuntos. AI trazar un diagrama como el de la figura
es comllll rellenar con color 0 resaltar el conjunto al que nos referimos
para destacarlo; en este caso, asi se ha hecho con el que represe nta la
union.
"if = numeros enteros AU B
2
8
10
4
12
A B
Ejemplo
1
La Orga nizacion para la Cooperacion y el Desar roll o Econo-
mico (OCDE) es una inst itucion internacional que tiene por
objetivo cOOl'dinar politicas economicas y sociales; su sede est. en
Paris, Francia; se fundo en 1961 con 20 paises y a principios de 2007
contaba con 30 miembros. En la tabla 1 se muestran las naciones
que ingresaron en la OCDE despues de 1961 y antes de 2007.
Sea A el conjunto de Estados que entraron en la OCDE durante
la decada de 1990; B el de los que ingresaron despues de 1980 pero
antes de 2007, y C = {Eslovaquia}. Entonces tenemos que B = A U C,
pero tam bien B = B U C.
UNl OAD 2 • (ONJUNTOS Y COMBINATORIA
Tabla 1 Estados miembros de la O(OE
Ana de ingreso Pais
1964 lapon
1969 Finlandia
1971 Australia
1973 Nueva Zelanda
1994 Mexico
1995 Republica (heca
1996 (area del Sur. Hungrfa. Polonia
2000 Eslovaquia
Los diagramas de Venn correspondientes a estas situaciones
son los que se muestran en la figura 4.
a
b
~ {   paises miembros de la oeDE
Finlandia
Nueva
Zelanda
B
Mexico
Hungria
Republica (heca
Polonia
(orea del Sur
A
'll = paises miembros de la oeDE
Finlandia
Nueva
Zelanda
B
Mexico
Hungria
Republica (heca
Polonia
Corea del Sur
B=AU C
Eslovaquia
C
Australia
B= BU C
C
Australia
Como podemos observar en el ejemplo de los ultimos tres diagra-
mas de Venn (figuras 3 y 4). los conjuntos que van a unirse pueden
tener algunos. ninguno a todos los elementos en comun. Muchas ve-
ces interesa saber cuales son los elementos comunes que tienen los
conjuntos. La operaci6n que nos permite obtener esos elementos se
llama il1tersecciol1.
Santillan ... 1. Fundamentos de la teorfa de conjuntos
Figura 4
Union de conjuntos:
a) B = AU C.
b) B = B U C.
79 _
Figura 5
Intersecci6n de los conjuntos
AyB(A n B).
Figura 6
Intersecci6n de conjuntas:
a) A con B (A n B).
b) Bcoll C(B n C).
_ 80
[nterseccion de conjuntos (n)
La interseccion de un canjunta A can un conjunta B, representada
can A n B, es el conjunta A n B = {x I x E A Y x E B}, es decir, el
canjunta que agrupa tadas los elementos que pertenecen tanto a A
camaaB.
£jemplos
2
Recardemas los canjuntas definidas panafas antes: A = {2, 4, 6)
Y B = {6, 8, 10, 12). La intersecci6n de A can B es An B = {6)
Y su representaci6n mediante una gnifica de Venn es la de la figura 5.
'11 = numeros enteros A n B
2
8
6
10
4
12
A B
3
Retamemas el ejempla de los paises miembros de la OCDE. En
este casa, A n B = A Y B n c = C. En la figura 6 se muestran
ambos casas.
a
b
'11 = paises miembros de la oeDE
Finlandia
Mexico
Hungrfa
Republica Checa
Polonia
Nueva
Zelanda
Corea del Sur
B
A
'11 = palses miembros de la oeDE
Finlandia
Nueva
Zelanda
B
Mexico
Hungrfa
Republica Checa
Polonia
Corea del Sur
UNlOAD 2 • (ONJUNTOS Y COMBINATORIA
  ~   n B
Eslovaquia
C
Australia
C ~ B n C
Eslovaquia
C
Australia
n II
TEOREMA 2. Dados dos conjuntos A y B tales que A   B, tenemos que
A U B = B Y A n B = A. .
En este caso vemos tambien que A n C = 0, es decir, A y C no
ti enen ningun elemento (pais) en comun.
Conjuntos disjuntos
Si A Y B son dos conjuntos tales que A n B = 0, entonces los con-
juntos son disjuntos.
Par otro lado, A U B U C = B. EI teorema sigui ente resume algunas
propiedades importantes de las operaciones de union e interseccion
de conjuntos.
TEOREMA 3. PROPIEDADES DE LA UNI 6N Y LA I N T ERSECCI6N.
Dados Cllalesquiera conjuntos A, By C de un universo 'U se cumplen
las propiedades siguientes:
Ley conmutativa
Leyasociativa
Ley distribut iva
Ley idempotente
Ley de identidad
Ley de dominancia
Ley de absorci6n
AUB = BUA Y AnB=BnA
A U (B U C) = (A U B) U C
A n (B n C) = (A n B) n C
A U (B n C) = (A U B) n (A U C)
A n (B U C) = (A n B) U (A n C)
A U A=A Y AnA = A
AU 0 =A Y An'l'{ = A
An 0 = 0 y AUU='U
A U (A n B) = A Y A n (A U B) = A
Utili za el esquema de la figura 7 para i1ustrar las propiedades enun-
ciadas en el tearema 3.
A B
c
Santillana 1. Fundamentos de la teoria de conjuntos
Figura 7
81 _
Si An B = A, ,que podemos
afirmar sabre A - B?
_ 82
Para practicar
CD Sea 'U el conjunto de letras que forman la palabra mell/orias; sea A
el conjunto fonnado por la letras de la palabra rill/as, B el formado
por la letras de la palabra /IIelilO y C el formado por las letras de
remo. Di cmlles de las afinnaciones que siguen son verdaderas:
a A n (B U A) = (x I x es una letra de la pal abra II/iras).
b Los conjuntos (B n C) y A son di sjuntos.
c A U 'U = (x I x es una letra de la frase "mire si es rosa").
2 Define tres conjuntos A, B Y C * 0 I' comprueba que se cum pI e la
ley distributi va. Despues, dibuja el diagrama de Venn correspon-
diente.
CD Sea A = (x I x es natural y par, x < lD). Define una B = (O, 2,4,6,
12) Y C = (8, 10) I' comprueba la ley asociativa para este caso. Lue-
go dibuja el diagrama de Venn correspondiente.
Diferencia de conjuntos y complemento
Considera el conjunto de los numeros enteros positivos, al que lI ama-
remos T (recuerda que podemos expresarlo como T = (1. 2, 3, 4, 5 ... ))
I' sea R el conjunto de los numero pares positi vos, R = (2, 4, 6, 8,
lD, ... ). Sabemos que los elementos que pertenecen a los numeros en-
teras positi vQS y que no son pares son los numeros impares; si quere-
mos obtener estos elementos debemos, por tanto, quitar a T todos los
elementos que pertenecen a R, con 10 que resultar. el conjunto de en-
teros positi vos impares, al que lIamaremos I: 1 = ( L 3, 5, 7, ... ).
Esta operaci6n se denomina diferelIcia de COl1jlll1tos y se define for-
mal mente a continuacion.
Dijerencia de conjuntos ( - )
Sean A y B dos conjuntos. La diferencia de A menos B es el conjunto
A - B = (x I x E A Y x!i" B).
Sea 'U = ( I, 2, 3, 4, 5, 6, 8, 9); definamos ahora los conjuntos A =
(x I x par, 1 :S x:s 9) y B = (I, 2, 3,4). Entonces, A - B = (6, 8) yel
diagrama de Ve nn que representa esta situaci6n es el de la figura 8.
A veces tambien nos interesa distinguir los elementos que no perte-
necen a un conjunto, pero tomando como referenda al universo. Para
el ejemplo, del conjunto R (numeros pares), si tomamos 1,{ = T(de nu-
meros enteros no negativos), entonces el conjunto que complementa a
R para formar 1,{ es el conjunto de nllmero impares I. As;, I es el com-
plemento de R, 0 bien, R es el complemento de {.
UNlOAD 2 I (ONJUNTOS Y COMB IN ATORIA Santill na
U A- B
5
9
6
1
8
3
A B
Complemento de conjuntos
Sea A un conjunto de U; entonces el complemento de A, representa-
do con A c, se define como A C = U - A.
En el diagrama de la figura 9 se ejemplifica el compl emento BC Los
elementos del universo que no pertenecen a B son 5, 6, 8 Y 9, por 10 que
BC = {5, 6, 8, 9 }, debido a 10 cual en el diagrama de la figura se rellen6
con color todo el cuadrado, excepto el 6valo que representa a B.
B'
5
9
6
1
8
3
A B
EI teorema que sigue relaciona la diferencia con las operaciones de
intersecci6n y complemento.
TEOREMA 4. Sean A y B dos cOl1juntos, el1tol1ces A - B = A nBc.
(figura 10).
A- B 'LI
5 5
9 9
6
8
3
8
A B A
Cl Santillana 1. Fundamentos de la teoria de conjuntos
6
Figura 8
Diferencia de conjuntos:
A- B.
Figura 9
Compiemento de conjuntos Be:.
Figura 10
Oiagramos de Venn para
ejempli{icQrqueA - B = A n B' .
1
3
B
83 _
Fi gura 11
Diagramas de Venn para
(A-B) U (B-A) = A U B-AnB.
-
84
Tenemos las propiedades siguientes de la operaci6n del comple-
mento.
TEOREi\IA 5. LEYES DEL CONJUNTO CQMPLEMENTO. SeaJl A y B
COlljltHtos ell WI 1(1liverso ~ /   enloJlces:
Ley del doble complemento (A')' = A
Leyes inversas A U A' = ~ /   A n A' = 0
Leyes de De Morgan (A U B)' = A' n B' y (A n B)' = A' U B'
Del11ostmcioll de la ley del doble cOlJlpletllento. AI usar la definici6n
del complemento, tenemos que (AC)C = 1.,( - (AC). Con base en el
teorema 1 notamos que (AC)C = 1,,/ n (A), y por las leyes de identidad
tenemos que (AC)C = 1,,/ n A = A, 10 cual demuestra la ley de doble
complemento. I
A partir de los conjuntos con que hemos estado trabajando, es facil
ver que B - A = {I, 3), mientras que A n B = {2, 4) Y A U B = { 1,2,
3,4,6,8). En el diagrama de Venn presentado en la figura 11 se com-
prueba la propiedad siguiente: ,
(A - B) U (B - A) = A U B - An B.
De hecho, esta propiedad relaciona las operaciones de uni6n, intersec-
ci6n y diferencia y se expresa en el teorema 6.
11 (A - B) U (B A)
5
9
6
1
A - B
2
B - A
':,.]
lc
8
4
3
A B
'/1 A U B - A n B
5
9
6
1
2
4
8
"-
3
A B
A n B
UN l OAD 2
I
CON/UNTOS Y COMBINATORIA <" :111
,
TEOREMA 6. Sea17 A y B dos C017jlll1tOS, e17to17ces:
(A - B) U (B - A) = A U B - A n B.
A partir de las reglas de conjuntos ya vistas es posible demostrar
formal mente los resultados. Par ejemplo, demostremos el teo rem a an-
terior.
DelilOstracio17 del teorel11a 6. Sabemos que (A - B) = A nBc, y que
(B - A) = B n AC, por 10 que:
(A - B) U (B - A) = (A nBC) U (B n AC).
Y por las leyes distributivas se obtiene:
(A - B) U (B - A) = (A U (B n AC)) n (BC U (B n AC)) .
Una vez mas, por las leyes distributivas tenemos que:
(A - B) U (B - A) = ((A U B) n (A U AC)) n ((BC U B) n (BC U AC)).
Y por las leyes inversas queda:
(A - B) U (B - A) = ((A U B) n 'U) n ('U n (BC U AC)).
Y por las leyes de dominacion:
(A - B) U (B - A) = (A U B) n (BC U AC).
Y par las leyes de De Morgan tenemos que:
(A - B) U (B - A) = A U B n (A n B)C.
Por tanto:
(A - B) U (B - A) = A U B - A n B.
A esta (Il tima propiedad tam bien suele lI amarsele diferel1cia si17u!trica
de A)' B Y se define como sigue.
Diferencia simetl'ica de conjuntos (A /',. B)
Sean A y B dos conj untos. La diferencia simetrica A /',. B se defi ne
como A /',. B = {x I x E A, x E By x $ An B}.
En el ejemplo anterior, A /',. B = {I, 3, 6, 8}.
Santill ana 1. Fundamentos de la teorfa de conjuntos
85 _
_ 86
Para practicar
(DOi si son ciertas a falsas las afirmaeiones siguientes. justifica tu res-
puesta (ya sea mediante un diagrama de Venn a can las reglas de
conjuntos):
a {A - B) c = B U (U - A).
b {B n A) C U C = {A n CC)C U B.
2 Sea U = {x I x es una letra de la palabra contestar} y sea AC = It, e, s}
y BC = la, I; o}. Encuentra los conjuntos sigui entes y describelos
par compresi6n:
a A-B.
b A nB.
o Considera U el conjunto de los numeros reales. Sea A = I numeros
mayores a iguales a lOa} y B = I numeros menores a iguales a 999}.
Oescribe A - BC, A nBc y AC U BC.
Cardinalidad de conjuntos
Observa estos conjuntos:
• A = la,b,c,d}.
• B = In es un numero natural I a < n < 5}.
• C = {x es un mes del alia I x term ina can la letra 'e'}.
Si los observas can atenci6n notads que todos tienen el mismo nume-
ro de elementos (cuatro). Puedes comprobarJo escribiendo par exten-
si6n los conjuntos B y C: B = 11, 2, 3, 4} Y C = I septiembre, octubre,
noviembre, diciembre}.
En este caso, decimos que todos estos conjuntos tienen cardinali-
dad 4, a que todos tienen la misma cardinalidad que {1, 2, 3, 4}.
Cardinalidad (n)
Sea A un conjunto. La cardinalidad de A, que se representa can
n{A), es el numero de elementos que conti ene A .
Ejemplo
4
SiA = {azul, amarillo, verde, raja, morado}, entonces n{A) = 5.
Otra forma de escribir esto es n{{azul, amarillo, verde, raja,
morado}) = 5.
U NlOAD 2 • CONJUNTOS Y COMBINATORIA CSantiliana
Es indispensable precisar que hacemos al establecer la cardinalidad
de un conjunto, es decir, al contar sus elementos. El proceso es el si-
guiente: si queremos contar los elementos de A = {azul, amarillo, ver-
de, raja. morado L asignamos un (mica numero sucesivo a cada ele-
mento hasta que no queden mas, es decir, hacemos
1 -7 azul, 2 -7 amarillo, 3 -7 verde, 4 -7 rojo, 5 -7 morado
Como hemos terminado con todos los elementos de A )' los hemos
contado solamente una vez, decimos que A tiene cinco elementos.
Para contal' conjuntos Inas grandes seguimos exactamente el misl1lo
procedimiento.
Ejemplos
S
Hay que establecer la cardinalidad de A = {10, 20, 30, ... , 370,
380j.
Para contar los elementos de este conjunto, primero asignamos
un numero sucesivo a cada uno de ellos:
1 -7 10, 2 -7 20, 3 -7 30 k -7380.
Escribimos k pOl·que no sabemos que numero consecutivo debe-
mos asignar a 380. Para determinarlo, notemos que a cad a numero
sucesivo se Ie asigna 10 veces ese numero: es decir, a 1 se Ie asigna
el10 = 10(1); a 2 se Ie asigna el 20 = 10(2); a 3 se Ie asigna el 30 =
10(3), Y asf sucesivamente, hasta que a k se asigna el 380 = lO(k).
Podemos representar esto agregando a nuestro conteo un ren-
glon con la regia que acabamos de encontrar:
1 -7 10, 2 -7 20, 3 -7 30
1 -7 10 . 1, 2 -7 10 . 2, 3 -7 10 . 3
k -7380.
k -7lO· k.
Pero entonces tenemos que 380 = 10 · k, de modo que k = 380/10 =
38. Asf, el conjunto {1O, 20, 30, ... ,370, 380 j tiene 38 elementos, es
decir,
n(A) = 38.
A tiene 38 elementos.
6
Establezcamos ahora la cardinalidad del conjunto S = {2, 4,
6, ... , 200j. Asignamos un numero sucesivo a cada elemento
de S, de la forma siguiente:
k -7200.
CSantiliana 1. Fundamentos de la teoria de conjuntos
87 _
_ 88
Ahora debemos hallar la regia de aSignaci6n: vemos que a l ie asig-
namos el 2 = 2 . 1; a 2 Ie asignamos el 4 = 2 . 2; a 3 Ie asignamos
el 6 = 2 . 3. Y as; sucesivamente. hasta que a k Ie asignamos el
200 = 2 . k:
1 -42. 2 -4 4. 3 -4 6.
1 -42 . 1. 2 -4 2 . 2. 3 -4 2 . 3.
k -4200
k -42 · k.
AI despejar la ecuaci6n 200 = 2 . k obtenemos k = 200/2 = 100.
as; que este conjunto tiene 100 elementos. 0 sea:
n(S) = 100.
7
Con el metodo del ejemplo anterior contemos el numero de
elementos de T = {10. 15.20.25 ..... 210). es decir. los multi-
plos de 5 mayo res 0 iguales a 10 y menores 0 iguales a 210.
En este ejemplo. los multiplos de 5 comienzan con 10 (que es
5 . 2). as; que hacemos la asignaci6n:
2 -4 10. 3 -4 15. 4 -4 20. . ... k -4 500.
<Cminto vale k' Como asignamos a cada numero cinco veces ese
numero. k = 500/5 = 100. Sin embargo. comenzamos en el segun-
do multiplo de 5. as; que n({ 10.15.20.25 ..... 210}) = 100 - 1 = 99.
esto es:
n(T) = 99.
EI conjunto T tiene 99 elementos.
8
Establezcamos la cardinalidad del conjunto V =
85. 87). es decir. los numeros impares de 1 a 87.
{3. 5. 7 •...•
Nuestra aSignaci6n es como sigue:
1 -43. 2 -4 5. 3 -4 7. .... k -487.
En este ejemplo no es tan sencillo determinar la regia de asigna-
ci6n. pero si reflexionamos pOI' unos instantes veremos que a 1 Ie
asignamos el 3 = 2 . 1 + 1; a 2 Ie asignamos el 5 = 2 . 2 + 1; a 3
Ie asignamos el 7 = 2 . 3 + 1. Y as; sucesivamente. Agregamos un
rengl6n con esta regia que acabamos de encontrar:
1 -4 3. 2 -4 5. 3 -4 7.
1 -42· 1 +1. 2 -42 · 2 + 1. 3 -42 · 3 + 1.
k -4 87.
k -42· k +1.
As;' 87 = 2 . k + L y despejando obtenemos: 2 . k = 86. 0 k = 43.
POI' ende. T = {3. 5. 7 ..... 85. 87) es de cardinalidad 43. 0 bien:
11(T) = 43.
UNlOAD 2 • (ONIUNTOS Y COMBINATORIA Santillana
COMO CONTAR CONJUNTOS INFINITOS
Es posible definir la cardinalidad de conjuntos infi nitos mediante una
tecnica similar a la que se us6 en los ejemplos presentados en la sec-
ci6n anterior. Por citar un caso, el conjunto 11= {2, 4, 6, ... ) (todos los
nluneros pares) tiene la misma cardinalidad que WI = {1, 2, 3, ... ) por-
que podemos hacer la correspondencia 1 -4 2, 2 -4 4, 3 -4 6, Y asi su-
cesivamente. De esta forma, estamos contando una y s610 una vez
cada elemento de II y, por tanto, WI = {1, 2, 3, ... ) tiene la misma car-
dinalidad que II = {2, 4, 6, ... ).
Esto resulta sorprendente porque el conjunto de numeros pares es
un subconjunto propio del conjunto de los numeros naturales, perc
ambos tienen la misma cardinalidad. Cuando contamos conjuntos fi-
nitos eso nunca puede suceder: para cualquier subconjunto propio A
de un conj unto finito B, la cardinalidad de A es menor que la de B. Sin
embargo, como acabamos de ver, si es posible con conjuntos infini tos.
En matematicas, no rue sino hasta el siglo xx cuando empez6 a
comprenderse mejor este comportamiento poco intuitive de los con-
juntos finitos.
C Santillana 1. Fundamentos de la teorfa de conjuntos
89 _
_ 90
Para practicar
CD Calcula la cardinalidad de los conjuntos siguientes:
a 1',,[ = {10, 15,20,25,30,35).
b N = {10, 15,20,25, ... , 210).
2 Calcula la cardinalidad de los conjuntos siguientes:
a 0 = {3,5, 7,9,11).
b P = {los numeros impares de 3 a 115).
0 Sea A = {nllllleros enteros multiplos de 3) y B {nllllleros enteros
positivos). Demuestra que A y B tienen la misma cardinalidad.
Cardinalidad y operaciones con conjuntos
En esta seccion veremos como se comportan la union, la interseccion
y el complemento de conjuntos en relacion con la cardinalidad.
COMO CONTAR DIFEREN CI AS DE CONJUNTOS
Si en una biblioteca hay 300 Iibros y de ellos 107 son de matematicas,
{,cuantos li bros no son de esta materia? Claramente, 1a respuesta es
300 - 107 = 293. Podemos expresar esto con notacion de conjuntos
del modo siguiente: si B = {li bros de matematicas) y A = {libros de
geometria), entonces la cantidad que buscamos es
I1(B - A) = I'I(B) - n(A) = 300 - 107 = 293,
es decir, contamos los elementos del conjunto B - A, que son 293.
Ejemplo
9
Se debe hallar la cardinali dad de C = {3, 4, 5, ... , 998). Si obser-
vas con atencion, notaras que si agregaramos a C cuatro ele-
mentos mas, 1,2,999 Y 1000, entonces el conjunto tend ria cardi-
nalidad 1000; por tanto:
n({ 3,4, 5, ... , 998)) = n( {I, 2, ... , 999, 1000)) - n({ 1,2, 999, 1000))
= 1000 - 4
= 996.
UN lOA D 2 • (ONJUNTOS Y COMBINATORIA (£) Santil lana
Lo anterior podemos representario como
{i. 2. 3. 4. 5 • ...• 997.998. 999. 1000}.
996 elementos
El principio que usamos para resolver el ejemplo anterior puede
expresarse como sigue.
TEOREMA 7. Si A C B. entonces n{B - A) = I1{B) - I1(A) (figu-
ra 12).
Ejemplo
1 0
Hay que determinar la cardinalidad de A = {6. 7. 8 •...• 95}.
Para ell o. primero encontramos un conjunto mas grande
que sea faeil de contar. en este caso B = {i. 2. 3 •...• 100). que satis-
face n{B) = 100.
Entonces. B - A = {i. 2. 3. 4. 96. 97. 98. 99. 100). que tiene
nueve elementos. 10 cual expresamos como n(B - A) = 9.
Ahora. al aplicar la f6rmul a del teorema 7 (ciaramente. A C B)
tenemos que 9 = 100 - n(A). Despejamos n{A) para obtener:
n(A) = 100 - 9 = 91.
El conjunto A tiene 91 elementos.
C6MO CONTAR UNIONES E INTERSECCIONES
<Cual es la relaei6n de n{A U B) con n{A) y I1{B)? Digamos que A = {1.
2.3.4.5} Y B = {2. 3. 4. 7}; entonces. I1{A) = 5. n(B) = 4 Y I1{A U B) = 6.
Observa que n{A U B) no es igual a I1(A) + n{B). ya que al hacer la
suma n(A) + n{B) = 5 + 4 = 9 contamos dos veces los elementos que
estan en A n B (figura 13).
1 2
3 7
5
4
A 8
C Santillana 1. Fundamentos de la teorfa de conjuntos
Figura 12
n(8 - A)   n(8) - n(A).
Figura 13
n(A)   5. n(8)   4,
n(A U 8)   6,
n(A n 8)   3.
91 _
_ 92
Si queremos que coincidan las cuentas debemos res tar una vez to-
dos los elementos que se cuentan dos veces, can 10 que llegaremos al
teorema 8.
TEOREMA 8. CARDINALIDAD DE LA UNION Y DE LA lNTERSEC-
CION. Si A Y B 5011 conjlflltos, entol1ces:
J/(A U B) = n(A) + I1(B) - J/(A n B),
de dOJ/de se deduce qlle:
n(A n B) = I1(A) + J/(B) - J/(A U B).
Ejemplos
11
Si A = {5, 3, 10, 1,2) Y B = {10, 1, 5, 11}, tenemos que
n(A) = 5 Y n(B) = 4. Ademas, A U B = {I, 2, 3, 5, 10, 11) Y
A n B = {I , 5, 10}, aSI que 11(A U B) = 6 Y n(A n B) = 3.
Ahara calculamos el lado derecho de la f6rmula del teorema 8.
Tenemos que:
n(A) + n(B) - I1(A n B) = 5 + 4 - 3,
que equivale a contar una vez todos los elementos de A (5), una vez
todos los elementos de B (9: 5 + 4 = 9), Y final mente restar 3, por-
que contamos dos veces los que estan en A n B, can 10 que se ob-
tiene
5 + 4 - 3 = 6,
que es precisamente la cardinalidad de A U B.
12
En un grupo de personas, 75 tienen al menos un hennano
(var6n) y 52, una hermana (mujer). Si ademas sabes que hay
23 que tienen tanto un hermano como una hermana
J
lcuantas per-
sonas en el grupo tienen hermanos varones 0 mujeres?
Si H = {personas que tienen algun hermano var6n) y Nf =
{personas que tienen alguna hermana}, entonces H U J'v[ es el con-
junto de personas que tienen al menos un hermano hombre a mu-
jer. ASI:
J/(H U J'vf) = n(l-f) + n(Nf) - J/(H n Nf) = 75 + 52 - 23 = 106,
es decir, 106 personas del grupo tienen al menos un hermano
hombre a mujer.
UNlOAD 2 • CONJUNTOS Y COMBINATORIA 5; ntillan
13
Se sabe que 200 personas compraron detergente la semana
pasada; 121 compraron detergente liquido y 90 en polvo. Se
precisa saber cuantas personas compraron tanto detergente liqui-
do como en paiva (supongamos que los LlIlicos tipos de detergente
son Irquido y en polvo).
Si L = {personas que compraron detergente liquido} y P =
{personas que compraron detergente en paiva}. entonces busca-
mos I1{L n Pl. Pero par la f6rmu la del teorema 8, la cardinalidad de
la intersecci6n es /I{L n P) = /I{L) + I/{P) - II{L U P) = 121 +
90 - 200 = 11.
en paiva.
Para practicar

CD Si A Y B son conjuntos tales que /I{A) = 8, I1{B) = 7 y I1{A n B) = 5,
i.cuanto vale /I{A U B)?
2 Sup6n que en un grupo de estudiantes hay nueve que juegan futbol,
15 que practican voleibol y s610 tres que juegan tanto futbol como
voleibol. Si todos los integrantes del grupo practican al menos uno
de estos deportes, i.cuantos estudiantes hay en el grupo'
(}) i.Cual es la cardinalidad del conjunto F = {x es un numero natural I x
tiene dos drgitos}7 Usa una diferencia de conjuntos apropiada.
EjempLos adicionaLes de cardinalidad
14
Sup6n que en una escuela se ofrecen tres talleres: uno de
ceramica, uno de tejido y otro de mecanica. Hay 14 estu-
diantes que taman ceramica, 13 que cursan tejido y ocho que asis-
ten a mecanica. Adicionalmente, seis estudiantes taman tanto
ceramica como tejido; dos, ceramica y mecanica; y tres, tejido y
mecanica. 5610 hay un estudiante que cursa los tres talleres.
i.Cuantos estudiantes cursan el taller de ceramica y ningun otro'
i.Cuantos estudiantes ll evan al men as uno de los tres taUeres' i.Cu;ln-
tos estudiantes taman un solo taller'
La primero en 10 que hay que reflexionar es si este problema
puede resolverse. i.Tenemos suficiente informaci6n' Empezamos
dibujando un diagrama para los tres conjuntos: C = {alumnos que
taman ceramica}. T = {alumnos que asisten a tejido} y M = {alum-
nos que cursan mecanica}.
Primero escribimos 1 en la intersecci6n de los tres conjuntos, pues
sabemos que un solo alumna asiste a los tres talleres (figura 14).
o Santi1tana 1. Fundamentos de la teorfa de conjuntos
M
Figura 14
Diagrama para el ejemp/o 14.
Hay un 5010 alumna que cursa
los tres toile res.
93 _
Figura 15
Hay cinco alumnos que curson
dos tolleres (region QlJaranjada).
Figura 16
Las intersecciones muestran
el numero de a/umnos que curson
mas de un taller.
Figura 17 )
Area verde: afumnos que solo
!levan el taller de ceramica.
Figura 18 »
Area cafe: alumnos que lIevan solo
el taller de tejido. Area amarilla:
alumnos que solo cursan mecanica.
_ 94
tCuantos alumnos hay en Ia regi6n anaranjada? Como hay seis
que cursan ceramica y tejido. y s610 uno de ell os cursa los tres ta-
lIeres. en esa regi6n debe haber cinco alum nos (figura 15).
c
M
Ahora hacemos 10 mismo con cada intersecci6n de dos conjun-
tos. y nos queda el diagrama most rado en la figura 16.
c T
M
Despues. calculamos cuantos estudiantes hay en la regi6n verde
de la fi gura 17. Como ya lIevamos 5 + 1 + 1 = 7 elementos con-
tados del conjunto C. y sabemos que hay 14 alumnos en el. en la
regi6n verde debe haber 14 - 7 = 7 elementos.
Hacemos 10 mismo con cada una de las regiones que correspon-
den a los alum nos que s610 toman una c1ase. Por ejemplo. para la
regi6n cafe del di agrama de la figura 18. ya lI evamos contados
8 = 5 + 1 + 2 estudiantes del conjunto T, el cual tiene en total 13
alumnos. asf que en la nueva regi6n cafe debe haber 13 - 8 = 5
alumnos. Hacemos 10 mismo para el conjunto M (figura 18).
M M
UN l OAD 2 • (ONJUNTOS Y COMBINATORIA eSantilJana
Ahora podemos contestar dos de las preguntas pl anteadas al
principio: i.cuantos estudi antes toman el taller de ceramica y nin-
gun otro? Del diagrama most rado en la figura 19 deduci mos que la
respuesta es 7.
M
i.Cuantos estudiantes toman por 10 menos alguno de los tres ta-
ll eres? La region que cOlTesponde a los alumnos que cursan al me-
nos un taller es la union C UT U M (observa el diagrama de la fi gu-
ra 20). que tiene cardinalidad 25 = 7 + 5 + 4 + 2 + 1 + 5 + 1.
i. Cuantos estudiantes toman un solo taller? La region del di agra-
ma que corresponde a esos alumnos es la marcada en rojo en la
fi gura 21. donde hay 7 + 5 + 4 = 16 estudi antes.
Tambien podemos calcul ar la cardinali dad de di stintos conjuntos
definidos por propiedades aritmeti cas. Veamos algunos ejemplos.
15
i.Cuantos numeros de 1 a 50 son multi plos de 2 pero no de
4? Notemos que si A = {mul tipl os de 4 de 1 a 50 } Y B =
{multipl os de 2 de 1 a 50 }. entonces A es subconjunto de B pOl·que
todos los multiplos de 4 10 son tambien de 2. EI numero que quere-
CI Santillana 1. Fundamentos de la teoria de conjuntos
Figura 19
Siete esludiantes toman el taller
de ceramicQ sofa mente.
Figura 20
Para determinar cu6ntos
estudiantes [ urson alguno de /05
tres toile res determinamDs 10
cardinalidad de CU T U M.
Fi gura 21
i as zonas donde no hay
intersecci6n de [onjuntos indican
cucintos alumnos tomon un 5010
taller.
95 _
_ 96
mos calcular es niB - A), pues B - A es justamente el conjunto de
elementos que estan en B (multiplos de 2) y que no estan en A (que
no son multiplos de 4).
Vsemos la formula de diferencia de conjuntos:
II(B - A) = niB) - n(A).
Ahora solo debemos contar B y A. En primer lugar, B = {2, 4, 6,
48,50). Al usar las tecnicas expuestas en la secci6n sobre cardina-
lidad de conjuntos (paginas 87-88), vemos que Il(A) = 25. Por otra
parte, A = {4, 8, 12, 16, ... ,48) (comprueba que, en realidacl, en los
numeros 1, 2, ... , 49, 50, el multiplo de 4 mas grande es 48), y pode-
mos calcular que Il(A) = 12. Por tanto:
n(B - A) = 25 - 12 = 13.
16
iCuantos numeros de 1, 2, 3, ... , 99,100 son multiplos de 3 0
de 47 Ordenemos la informacion: A = {mlHtiplos de 3 en
{I, 2, ... , 100)), es clecir, A = {3, 6, 9, 12, ... ,96,99). Ademas, B =
{mllltiplosde4en {I, 2, ... , 100)),osea,B = {4,8, 12, ... ,96, 100).
Si usamos las tecnicas que hemos aprendido, calculamos n(A) = 33
Y niB) = 25.
EI problema consiste entonces en calcular n(A U B). Como
n(A U B) = n(A) + niB) - Il(A n B),
solo debemos calcular II(A n B). Pero A n B es el conjunto de nll-
meros que son multiplos de 3 y de 4, es decir, es el conjunto de
multiplos de 12. Por tanto, A n B = {12, 24, 36, 48, 60, 72, 84)
(comprueba que en realidad estos son los lll1icos multiplos de 12
entre 1 y 100), asi que
Il(A n B) = 33 + 25 - 7 = 58 - 7 = 51.
Para practicar
CD De los numeros N = {I, 2, 3, ... ,100), icuantos son multiplos de 3 0
de 57
2 Vna persona te dice que en su poblaci6n hay 145 habitantes. De
ellos, 70 tienen licenciatura, 80 son casados, 50 son casados y tienen
licenciatura )' 60 son solteros )' no tiellen licenciatura. Demuestra a
esa persona que SliS calculos estan equivocados.
® Se entrevisto a 100 personas para saber si ven los programas de te-
levision A y B. Resulta que 30 personas ven el A, 45 personas ven B
y 10 ven ambos. "Cuantas personas ven A 0 B? "Cuantas personas
no ven A? "Cuantas personas no ven A ni B?
UNlOAD 2 • CONJUNTOS Y COMBINATORIA S.lntil':tni
La cOlllbinatoria es una rama de las matematicas que estudia la orde-
naci6n 0 disposici6n de objetos segun reglas especfficas. Los siguien-
tes son ejemplos de problemas que se resuelven mediante ella:
I Si tengo cuat ro camisas y tres pantalones, lcmlntas combinaciones
puedo hacer, si cada ulla cO/lSiste exactamente en un palltalon y
una camisa?
I lDe cuantas formas se pueden pagar S10.00 usando monedas de
51.00, 52.00 Y 55.00
7
I leual es la cantidad de placas de autom6vil que pueden formarse si
cada una se com pone con tres letras seguidas de tres numeros
7
I Al terminar las clases, 15 estudiantes caminan de regreso a casa en
cinco grupos de tres alumnos cada uno. Organiza estas caminatas
durante una semana de manera que cada par de estudiantes cami-
nen juntos solo una vez.
Quiza descubriste que aparecen en rojo los objetos que se deben
organizar 0 acomodar, y en cursivas, las reglas para hacerlo. En los
primeros tres problemas se pregunta por el numero de posibles aco-
modos, mientras que en el cuarto se pide que se obtenga un acomodo
particular que satisfaga las reglas dadas. Todos ell os son problemas
tipicos de la combinatoria.
Acomodar objetos puede tener distintos significados. Por ejemplo,
si debemos ordenar las letras A, B, C Y D podemos hacerlo mediante
estas reglas:
I Ordenaciones de los objetos A, B, C y D, que son:
A BCD, ABDC, ACBD, ACDB, ADBC, A DCB,
BACD, BADC, BCAD, BCDA, BDAC, BDCA,
CABD, CADB, CBAD, CBDA, CDAB, CDBA.
I Ordenaciones de dos objetos cualesquiera tomados de A, B, C Y D:
AB, BA, AC, CA, AD, DA, BC, CB, BD, DB, CD, DC
I Ordenaciones con repeticion de dos objetos tomados de A, B, C y D:
e SantiHana
AA, BB, CC, DD, AB, BA, AC, CA,
AD, DA, BC, CB, BD, DB, CD, DC
2. La (ombinatoria
97 _
_ 98
Figura 22
Posibilidades de color
para la wbierta de un libra.
I Ordenaciones de dos objetos, el primero tom ado de A, B )' e)' el se-
gundo de e y D:
AC, AD, BC, BD, ee, CD.
I Combinaciones: escoger tres objetos cualesquiera tomados de A, B,
e)' D, sin importar el orden:
{A, B, e}, {A, B, D}, {A, C, D}, {B, e, D}.
Los distintos problemas de combinatoria requieren usar tipos diferen-
tes de acomodaciones 0 arreglos. Por ejemplo, para el primer proble-
ma descrito arriba, el de camisas )' pantalones, al parecer 10 mejor es
pensar en cornbinaciones, pues no importa el orden en que escojalllos
el pantal6n y la call1isa: la vest illlenta es igual. Lo Illislllo es valida
para el segundo problema. Sin embargo, en el tercero serfa mejor usar
algun tipo de ordenacion, ya que en este caso si importa el orden en
que aparecen las letras y los digitos en una placa de automovi!.
DIAGRAMAS DE ARBOL
Una forma sumamente eficaz de entender gran parte de los problemas
combinatorios consiste en trazar un mapa de todas las posibilidades
que hay para acomodar los objetos planteados.
Citell10s un caso: un encuadernador ofrece dos tipos de cubierta:
dura)' suave, )' para cada una de elias se puede escoger uno de tres
colores: azul, rojo 0 verde. tOe cuantas maneras es posible encuader-
nar un Iibro'
Primero dibujamos las tres opciones de color que se tienen y para
cada una de elias agregamos las dos posibil idades de pasta, dura 0 sua-
ve (figura 22).
As., si seguimos cada camino del "rbol (por ejemplo, rojo y pasta
dura, rojo y pasta suave, azul y pasta suave, etc.) al finai ll egamos a una
encuadernacion distinta. En el diagrama de la figura 22 hemos ejem-
plificado en rojo el camino que corresponde a una encuadernacion
con pasta dura azul. Observa que el nllmero de caminos en el arbol, a
partir de la izquierda (que es el numero de formas de encuadernar un
Iibro), es igual al nllmero de lIodos fina les del arbol.
_
/ Azul
__________ Suave
--------------- D u r a
L-Roio
Suave
Suave
Verde -
Dura
UNlOAD 2 I CONJUNTOS Y COMBINATORIA
, I ,
Ejemplo
l7
Alguien nos propone el juego siguiente: primera, tiramos un
dado (con sus seis lados numerados). Si sale un Munera par,
entonces tiramos una moneda, y si cae sol ganamos. Si obtenemos
un numero impar, entonces ganamos inmediatamente.
a <Cuantos posibles resultados puede tener este juego?
b <De cuantas formas es posible ganar el juego?
De la raiz parten seis f1echas (figura 23), que corresponden a los
seis posibles resultados de la tirada del dado: 1, 2, 3, 4, 5 Y 6. Los
acomodamos de manera que los pares salen en la parte superi or
del arbol y los impares, en la inferior.
Ahora, despues de cada numero par debemos lanzar una mone-
da al aire, con dos posibles resultados: aguila 0 sol.
Las tiradas impares son nodos terminales, pues en estos casos
acaba el juego y no tiramos el volado.
Asi, para cada tirada par del dado agregamos los dos posibles
resultados del volado. Ahora podemos con tar el numera total de
resultados, que es 6 + 3 = 9. Si marcamos con color rajo los resul-
tados en los que ganamos, veremos que son 6.
CSantillan .. 2. La (ombinatoria
Figura 23
Resultados ganadores de un juego
de dodo y moneda.
2   aguila
----a sol
4 < agUi la
sol
6 < agUila
sol
1
99 _
Figura 24
dCu6ntQs combinociones posibles
pueden {ormorse con cuotro
camisos y tres pont%nes?
(a) Hoy cuotro {ormas de escoger
una camisa (b) y para coda una
de elias hay (res pont%nes
posibles. Par tanto, (c) hay doce
combinaciones posib/es.
_ 100
Para practicar
CD Traza un diagram" de arbol para representar todos los posibles re-
sultados del juego siguiente: primero se lanza una moneda al aire. Si
cae sol, entonces se tira un dado, y si sale 5 a 6 ganamos. Pero si en
el primer volado sale aguil a, entonces tiramos un segundo volado y
s610 ga namos si en este vuelve a caeI' aguila.
2 Marca en el di agrama del ejercicio anterior todos los nodos finales
que correspondan a ganar el juego.
o En una urna hay 1 bola blanca, 1 negra y 1 roja. Si se eli ge una bola
al azar y luego se elige ot ra bola de las 2 restantes, representa los
posibles resultados en un diagrama de ar bol.
EI principio de la multiplicacion
Considera este problema, planteado casi al principia del apartado an-
terior: si tengo cuatro camisas y tres pantalones, "cU<lntas combinacio-
nes puedo formar al vestirme, si cada una consiste exactamente en un
pantal6n y una camisa? tCuantas vestimentas distintas hay?
Para hacer una combinaci6n primero escogemos una camisa (hay
cuatro formas de hacerlo, y para cacla elecci6n hay tres pantalones
posibles. Par tanto, hay 4(3) = 12 combinaciones, 10 cual podemos
representar como en el di agrama de arbolmostrado en la figura 24.
EI principio necesario para resolve r este problema es el de la multi-
plicaci6n.
• , -: ..
I ~  
.. ~ ...
(
, ' .... ,.
UNlOAD 2 I (ONJUNTOS Y COMBINATOR I A
Principia de La muLtiplicaci6n
Si hay n formas de llevar a cabo la tarea 1 yin opciones de realizar la
tarea 2. entonces hay n . m maneras de hacer sucesivamente las ta-
reas 1 y 2.
Cabe sel'\alar que en esta definici6n el termino tarea se refiere a un
proceso 0 acci6n que debe efectuarse. como elegir una camisa en el
caso anterior.
EI principio de la multiplicaci6n puede extenderse a cuantas tareas
sea necesario. POl' tanto. si para la tarea 1 hay m, opciones. para la 2.
111
2
, para la 3. 111
3
, Y as! sucesivamente hasta la tarea kcon Inkopciones.
existen In, . 1112 • 111 3 ..... I11k formas de hacer sucesivamente las k
tareas.
Ejemplos
18
Sup6n que en un grupo hay 20 personas. "De cuantas mane-
ras podemos repartir dos premios. el primero y el segundo.
entre ell as' Una misma persona no puede recibir ambos premios.
Primero. hay 20 personas que podemos escoger para recibir el
primer premio. Para cada una de estas opciones. hay 19 personas
que podemos escoger para el segundo premio (son 19 porque ya
repartimos el primer premio y una persona no puede recibir los
dos premios). POl' el principio de la multiplicaci6n.los dos premios
pueden repartirse como sigue:
In, = 20; 1n2 = 19; al sustituir queda: 20(19) = 380.
Hay 380 formas de repartir los premios.
19
Elmenu de com ida corrida en un restaurante ofrece los pla-
tillos que se muestran a la derecha. "Cuantas comidas de
tres platos pueden formarse si s610 es posible elegir una sopa. un
plato fuerte y un postre?
Se puede escoger el primer plato de dos formas; despues. el se-
gundo plato. de cuatro maneras y. finahnente. el tercer plato de tres
fm·mas. POI' ende.
al sustituir queda:
2(4)(3) = 24.
Hay 24 maneras de formal' una comida completa.
C Santillana 2. La combinatoria
Primer pLato
Sopa de tortilla
o consome
Segundo pLato
Pescado 0 pollo
o carne de res
o calabazas
Postres
Pastel 0 flan 0 helado
101 _
_ 102
20
EI c6digo postal mexicano es lm n[lInero de cinco digitos
que sirve para encaminar el correa a diferentes regiones del
pais. Los primeros dos digitos identifican el estado de la Republica
(excepto en el caso del Distrito Federal, donde indican la delega-
ci6n politica) y los otros tres, distintas zonas de cada estado 0 mu-
nicipio. POl' ejemplo, los c6digos postales de Sinaloa comienzan
con los digitos 80, y el c6digo completo del pueblo de Jesus Maria,
en ese estado, es 80309.
Si la Republica tiene 31 estados (pues excluimos el Distrito
Federal), <cuantos c6digos postales pueden formarse?
Para los primeros dos digitos tenemos 31 posibilidades, una pOl'
cada estado. Despues, tenemos 10 posibilidades (s610 existen 10
digitos: 0,1,2,3,4,5,6,7,8,9) para el tercer digito, 10 para el cuar-
to y 10 para el quinto y final. AI ordenar los datos con base en el
principio de la multiplicaci6n obtenemos:
117
1
,2 = 31; 1113 = 10, 117
4
= 10; I1l s = 10.
AI sustituir valores queda:
31(10)(10)(10)= 31000.
Hay 31 000 c6digos postales. Sin embargo, observa que si mas tar-
de fuera necesario crear nuevos c6digos, los estados podrian sub-
dividirse con dos digitos iniciales distintos, como en el caso del
Distrito Federal.
Resuelve los problemas siguientes; especifica cuales son los objetos
que deben combinarse y que reglas se aplican para hacerlo.
CD Dos escuelas van a competir en un torneo de ajedrez. De la escuela
"Rey y Reina" vienen 11 ajedrecistas y de la escuela "La Torre': seis.
<Cwintas partidas pueden fOl'marse, si en una deben enfrentarse
dos jugadores de distintas escuelas'
2 Tres personas lIegan a una habitaci6n donde hay seis sillas. <De
cuantas fonnas pueden sentarse las tres personas en las sillas'
o Mi familia esta compuesta de ocho miembros y tenemos dos auto-
rn6viles. (,De cuantas maneras podemos acomodarnos en los autos
si s610 dos miembros de la familia pueden conducir'
UN l OAD 2 I CONJUNTOS Y CQMBINATORIA ntll a )
FactoriaL
Entre las tortas mas populares que ofrece la fo nda el "EI buen comer"
estan las ahogadas. Se pueden elegir con cuatro tipos de reli eno, tres
tipos de salsa, dos tama.ios y se sin'en en un solo tipo de plato. Si es-
tamos interesados en saber cuantos tipos de tortas ahogadas se ofre-
cen en la fonda, a partir del principia de la multiplicacion tenemos
que hay:
4 . 3 . 2 . 1 = 24,
es decir, 24 posibilidades para elegir una torta.
Notemos que 4 . 3 . 2 . 1 es igual a 1 . 2 . 3 . 4, la multiplicacion de
numeros enteros positivos consecutivos hasta 4.
Imagina ahara que nos interesa la multiplicacion consecutiva de los
primeros 16 numeros enteros positivos. Para describir esta multipli ca-
cion podemos escr ibir 1 . 2 . 3 . 4 . 5 . ... . 16,0 bien
16· 15 . 14· 13· ... . 5·4 · 3 . 2 . 1.
A veces es mas practico uti li zar una notacion reducida para este t ipo
multiplicaciones, para 10 cual podemos apoyarnos en el factorial.
Factorial ( !)
EI factorial de un numero natural n, que se escribe n!, esta definido
par:
n! = n . (n - 1) . (n - 2) . ... . 1, para n 2: 2
I ! = 1
O! = 1
Asi. hay 4! tipos de tortas ahogadas en la fonda "EI buen comer" y la
multipli cacion consecutiva de los primeros 16 numeros enteros posi-
tivos puede escribirse como 16!
Ve en la definicion de factorial que I! = 1 es igual a 0' = 1; estos son
los (mi cos numeros naturales que tienen el mismo factorial. Observa
el calcul o de los sigui entes productos de factor iales:
• 4! ' I! = 24
. 5'·0!= 120
• 4 · 3' = 24
• 4· 3 . 2' = 24.
Notemos que 4' . I! = 4' = 24, Y 5! . O! = 5' = 120. Por otro lado,
tam bien tenemos que 4 . 3' = 24 = 4 ' Se intuye que al multiplicar un
numero natural par el factorial del mismo numero menos uno se ob-
tiene el factorial del numero. Es decir:
C Santillana 2. La combinatoria
103 _
_ 104
TEOREMA 9. Para n1111 11llmerO nalural (/1 2: 1) tenemos que:
n' = 11 . (n - 1)'
Si apl icamos este teorema de manera secuencial a 4 . 3' obtenemos:
4 . 3' = 4(3 ') = 4(3 . 2 ') = 4 . 3 . 2' = 4 . 3 . 2 . l' = 4 . 3 . 2 . 1
que, como ya se habia caleulado en el ejercicio anterior, es 24.
De manera general:
TEOREMA 10. Para 11 y k dos mlmel'OS naturales COI1 11 > k y k 2: 1
tenemos que:
n ' = n . (n - 1) ... . . (n - k + 1) . (n - k)'
k factores
k + 1 facto res
Ejemplos
21 Si 11 = 8 Y k = 3, escribimos
8' = 8 . 7 . 6 . (8 - 3)' = 8 . 7 . 6 . 5' = 8 . 7 . 6 . 120 = 4320.
2 2
Para caleular 9! / (7' . 3 !), podemos caleular el factorial de
cada numero (9!, 7', 3 !), luego mul tipl icar 7' por 3' y dividir
9' por el resul tado, pero esto implicaria hacer mul tipli caciones y
divisiones de numeros con varias cifras (9' = 362880 Y 7' = 50400).
Seria mucho mas faei l proceder como sigue:
9! 9 · 8 ·..:rr
7! . 3! ..:rr. 3 . 2 . 1
9 · 8 72
3 ' 2'1=6=12.
2 3
La simpli ficacion de operaciones puede ser mas drastica
cuanto mayores sean los numeros pOl' considerar; por ejem-
plo, 11' = 39916800, mient ras que 10! = 3628800, pero
.::
1..::1.:... ' -.c ' 2:..:' 11· lB-f'· 2
= = 11 . 2 = 22
10' 1B-f' .
Como se advierte, en los ejemplos anteriores se expande el factorial de
manera conveniente para simplificar los calculos.
UN lOAD 2 I (ONJUNTOS Y COMBINATORIA Sanf. lao",
Sin duda, has visto que no hace falta tomar el nlllnero /1
mlly grande para que /1' sea enorme. En la tabla de la derecha
hemos calculado el factorial de los primeros 21 nllmeros na-
turales.
A partir de las mismas ideas para simplificar calculos con fac-
toriales podemos resolver problemas de este tipo: encuentra el
numero natural /1 que satisface que /1' / (/1 - 2)! = 42.
Veamos que
/1! n{11 - 1)(/1 - 2)!
= = /1(/1 - 1) = 42
(11 - 2)' (/1 - 2) ' '
es decir, necesitamos dos numeros naturales consecutivos 11 y
/1 - 1 que multiplicados entre sf den como resultado 42. Sabe-
mos que 7 . 6 = 42, entonces /1 = 7.
Para practicar
CD Calcula /1 sabiendo que:
a 8' = 8(/1').
(/1+2)'
b (n+1),=4'
2 Simplifica las fracciones siguientes, que implican factorfales:
8'
a
5'
3'9'
b --
8'4'
2532'
c 2531!
Q) Calcula /1 si (10)(/1 + 4)(/1 + 3){n + 2)(/1 + 1) = 10! / I1'
n n!
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
1
1
2
6
24
120
720
5040
40320
362880
3628800
39916800
479001600
6227020800
87178291200
1307674368000
20922789888000
355687428096000
6402373705728000
121645100408832000
2432902008176640000
51 090 942 171 709 400 000
La pablacion mundial est';
cercana a 13! (seis mil mill a-
nes de habitantes), mientras
que el numero de atamos en
el planeta Tierra (aproxima-
damente 1.33 X 1050) est';
cercano a cuatro veces 41!
(0.334 X 1050).
@Santiilana 2. La combinatoria
105 _
_ 106
Permutaciones simples y circulares
Un anagrama es una palabra (0 frase) que resulta del reacomodo de
letras de esa misma palabra (0 frase). Per ejemplo, es posible formar el
anagrama poder con las letras del nombre propio Pedro y viceversa
(supongamos que las letras mayusculas y las minusculas son 10 mis-
mol. Gtro ejemplo es silbm; de donde podemos formar Brasil y libras.
Podemos tambien construir anagramas con las letras de una palabra
sin que nos interese si el resultado es 0 no un vocablo usual: por ejem-
plo, odper y eprod son ambos anagramas de poder. Si consideramos los
anagramas en este ultimo sent ido, <cmlntos podemos elaborar con la
palabra poder?
Deseamos generar una palabra de cinco letras, es decir, hay cinco
espacios que debemos lIenar seleccionado letras que pertenecen al
conjunto {p, 0, d, e, r}.
Podemos lIenar el primer espacio de cinco maneras, con alguna de las
cinco letras de nuestro conjunto ({p, 0, d, e, r n, y una vez que elegimos
la letra del primer espacio nos restan cuatro letras, per 10 que pode-
mos lIenar el segundo espacio de cuatro formas. De acuerdo can este
argumento, tenemos lres maneras de lIenar el tercer espacio y asi con-
secutivamente.
Si aplicamos el principia de la multiplicaci6n tenemos que existen:
5 ·4· 3 . 2 . 1 = 5! = 120
anagramas de la palabra poder. Cada uno de elias corresponde a una
permutaci6n simple de las letras de ese vocablo, como se define a con-
tinuacion.
Pe1'lJ7utacion
Dado un conjunto de 11 elementos, cualquier acomodo de estos en
una fila se denomina perIJJutaciol1 simple del conjunto.
Ademas, tenemos que:
TEOREMA 11. EllltllI/ero de perll/lltaciolles sill/pies de II elell/elltos
distilltos se illdica call P" y estd dado par
P" = II . (II - 1) . (II - 2) . .... 1 = II'
Entonces, la cantidad de pennutaciones de la palabra poder es P
5
= 5' =
120,), la de anagramas de la palabra Brasil es P
6
= 6' = 720.
UN l OAD 2 I (ONJUNTOS Y COMBINATORIA !:.ant: .. ..'t
Ejemp/os
24
EI autobus de la escuela tiene 30 asientos para el mismo nu-
mere de alumnos. <De cmintas maneras pueden viajar los
estudiantes en ei7
Como hay 30 lugares. 30 alumnos pueden sentarse de P
30
= 30 r
maneras.
25
Averiguemos cuantos anagramas del nombre Sergio existen
que empiecen con la letra ·s:
La palabra Selgio consta de seis letras; pOl' ende. tenemos que
lienal' seis espacios. pero estamos exigiendo que el primero este
ocupado poria letra ·s; asf que nos quedan cinco letras para los
cinco espacios restantes; pOl' consiguiente. hay P
s
= 5! anagramas
del nombre Selgio que empiecen con la letra ·s:
26
Hallemos de cuantas maneras es posible colorear un rehilete
de cuatro aspas con los colores azul. amarillo. rojo y verde.
  f e m ~ s que hay cuatro aspas que debemos pintar con cuatro co-
lores. 5i representamos con A el amarillo. con Z el azul. con R el
rojo y con Vel verde. entonces una manera es usar el azul (Z) se-
guido del verde (V).luego el rojo (R) y al final el amarillo (A). como
se muestra en la figura 25; esta combinaci6n puede representarse
poria permutaci6n Z V RA (figura 25a). Otra forma de colorear el
rehilete serfa RZ VA (figura 25b).
a
b
En suma. podemos pintar la primera aspa de cuatro maneras.
con algun color espedfico de los cuatro; la segunda aspa. de tres
formas. con alguno de los col ores aun no utilizados; la tercera. de
dos maneras. y la ultima con el color restante. POl' tanto. si aplica-
mos el principio de la multiplicaci6n podemos pintar el rehilete de
4 r formas. Pero si soplamos al rehilete R Z VA podemos mover las
aspas para obtener la permutaci6n Z VA R equivalente. y soplar un
poco mas para obtener las otras form as similares: VA R Z Y A R Z V
e Santillana 2. La combinatoria
Fi gura 25
aJ RehiletelVRA.
bJ RehiJete R l VA.
107 _
_ 108
De hecho. por cada selecci6n de cuatro calOl'es contiguos exis-
ten cuatro perlnutaciones similares; entonces. las distintas formas
de colorear el rehilete de tal suerte que los calOl'es contiguos sean
diferentes es 4' / 4, Esto recibe el nombre de permLltaciol7 circLllar
de cuatro objetos. como se especifica en la definici6n siguiente,
Permutacion circular
Una pennutaciol7 circular de 17 objetos es cualquier arreglo de esos
objetos en torno a un circulo,
TEOREMA 12, EI mil1lero de perl11l1taciol7es ciratlares de 11 elementos esc
III
- = (/1 - 1)'
/1
Can base en el teorema 12. hay 4' / 4 = 3' = 6 fOrlnas de de pintar lin
rehilete de cllatro aspas, Si tuviese cinco aspas y empleasemos cinco
calOl'es. entonces habria 4' = 24 maneras de colorearlo,
£jempLo
2 7
Piensa en colorear una pinimide cuadrangular con cinco co-
lares. GCuantas maneras hay de hacerlo? La base cuadrada
de la pinimide puede pintarse de cinco fOrlnas )' las cllat ro caras
triangulares. de 3' (permutaci6n circular de cuatro caras). par 10
que hay 5 ' 3' = 30 modos de pinta ria,
GQue sucede si en lugar de una piramide cuadrangular tenemos una
piramide hexagonal (don de la base es lin hexagono) y siete colores
para pintarla? ~
A partir de los mismos argumentos utilizados para la piramide
cuadrangular. hay 7 ' 5! maneras de colorear la piramide.
UNlOAD 2 • CONJUNTOS Y COMBINATORIA ~ ~ n t   t .,:)
Para practicar
CD Ana, Jose, Lucia, Carios, Federico, Gabriel y Marfa se sentaron alre-
dedor de una mesa redonda para siete personas a fin de celebrar el
cumplearlOs de Jose. <De cuantas fonnas podrfan haberse acomo-
dado en ella'
2 Calcula el numero de anagramas que tienen estas palabras:
a escribal1o.
b coraje.
c cel1trifugados.
0 <De cw\ntas maneras podemos colorear un octagono con ocho
colares'
Permutaciones con repeticion y variaciones
Como vimos, el numero de anagramas de una palabra con 11 letras es
igual a 11' < Que sucede si hay alguna letra repetida' Por ejemplo, <cuan-
tos anagramas pueden formarse con la palabra Lola'
En este caso hay menos de 4' = 24 anagramas pot'que en el anagra-
ma alia no se di stingue si fue la primera 0 la segunda T de Lola la que
se us6 para formar la '11'. De hecho, si distinguirnos las dos T con II y
1
2
, tendrfarnos efectivamente 24 anagramas, pero en realidad s610 te-
nemas 12, como se muestra a continuacion:
Anagramas Anagramas en los que distinguimos l
Lola I,ol,a aol,l,
Lalo I,ol,a aol , l,
alia I,al,o 1, I,ao
Alia I,al,o
' 2
i
l
ao
L10a ol,l,a I,oal,
Oall ol,l,a I,oal,
Aoll al, l,o I,aol,
L1ao al,l,o I,aol ,
Loal 1,I, oa ol,al,
Laol
1, IIoa ol , al ,
alai oal, l, al,ol,
Alai oal, l, al,ol,
@Santillana 2. La (ombinatoria 109
-
_ 110
Esto se debe a que tenemos 2 = 2' maneras de ordenar las dos 'I'
para cada anagrama en el que di stinguimos las ' I: asf que para quitar
las repetidas debe mas dividir (el numera de anagramas que sf distin-
guen las 'I') 4' entre 2' (el numero de repeticiones), can 10 que se ob-
tiene 4'/2' = 24/2 = 12 diferentes anagramas de la palabra Lota.
Ahara pcnsemos en la palabra recol1ocemos; de las 11 let ras que la
forman, tenemos repet idas dos veces la 'e' y 'c: y t res la '0: Si distinguie-
ramos las '0' en °
1
, 02}' 03' entollees tendriamos 3! = 6 maneras de
escribir el anagrama COl1ocere11lOs: C0
1
/10
2
CereI110
3
5. CO}lIo
3
CereI110
2
S,
(°311°2 cerelJlo IS, C0
2
110
3
cerelllO I 5, (°3110 I cerell10
2
S, (°211°1 cereJ1l0
3
S;
pera como las '0' no se di stinguen. di vidimos II' (el numero de ana-
gramas en el que distinguimos letras repebdas) ent re 3 '
De esta manera se elimi nan del conteo las 3 ' formas equi valentes de
escribir COIIOcerell lOS.
Recordemos que tambien estan repet idas las letras 'e' y 'c: par 10 que
debemos dividir dos veces entre 2' (una par la 'e' y ot ra par la 'c').
En conclusion: hay (11') / (3' 2' 2') anagramas de la palabra recollo-
ceJJ1Os.
En general. se bene el resultado sigui ente:
TEO R EM A 13. El III/mero de peJ'lmltaciol1es de 11 etell/elltos, dOllde hay
11, etel1leHtos repetidos de UII primer tipo. "2 de 111/ seg1ll/do tipo, ....
y II k de UI1 k-esil11o tipo estd dado POl':
n!
Ejemplo
28 EI numera de anagramas de la palabra estadfstica es:
VAR I AC I ONES
En la biblioteca escolar acaban de recibir 10 Iibros nuevas, pera solo
hay espado para exhibi r cinco en el estante de adquisiciones recientes.
<De cuantas formas puede el bibliotecario exhibir las 10 obras?
Supon que representamos los Iibros con las primeras 10 letras del
abecedario: A. B. C, ...• /. Entonces no es 10 mismo mostrar los Iibros
A, B. D. E. f que B, A. D. E. f. es decir. importa el orden en que estos se
acomoden. Par otro lado. solo tenemos cinco espacios para lIenar se-
leccionando libras del conjunto de 10 li bros nuevas.
UNlOAD 2 • (ONJUNTOS Y COMB1NATQRIA : 1.)1
Podemos lIenar el primer espacio con alguno de los 10 ejemplares
nuevos adquiridos por la biblioteca, es decir, de 10 maneras distintas.
Una vez colocado ese libro, tenemos cuatro espacios libres por lIenar
con las obras aun no colocadas (nueve sobrantes), por 10 que el segun-
do espacio se puede lIenar de nueve fo nnas diferentes. De igualmodo,
el tercer espacio se puede lI enar de ocho modos, el cuarto de siete y el
ult imo de seis maneras distintas. Entonces, por el principio de la mul-
tiplicacion hay 10 . 9 . 8 . 7 = 5040 formas de exhibir las nuevas ad-
quisiciones en ellibrero.
Si fueran n libros en r espacios, todas las posibles formas de acomo-
darlos reciben el nombre de variaciolles, 0 lIariaciones sin repelici6n
de n elementos tomados de r en r.
Variaciones sin repeticion
Las variaciones sin repeticion de n elementos tomados de r en r son
las distintas disposiciones de grupos de r elementos que pueden for-
marse a partir de n elementos cuando el orden en la disposicion es
relevante.
TEOREMA 14. Elm/mero de variaciones sin repeticion simbolizado
por V( n, I) estd dado por:
V(I1, r) = n(n - l)(n - 2) ... (n - r + 1).
Cabe sei\alar que V(n, 11) = n I = p ... Es decir, las variaciones sin repe-
ticion de 11 elementos tomados de 11 en n son iguales a las permutacio-
nes de n elementos. Ademas, para que V(II, r) tenga sentido, II 2: r.
Notemos tambien que:
111
V(I1, r) = 11(11 - 1)(11 - 2) ... (/1 - r + 1) = ( )
11-,-1
Preguntemonos ahora cuantos numeros hay entre 0 y 999. En seccio-
nes anteriores vimos como contar este tipo de conjunto. Otra forma de
CSantillana 2. La combinatoria
111 _
_ 112
hacer cuentas es pensar que queremos lIenar tres lugares con digitos
tomados del conjunto {O, 1,2, ... ,9}. Los tres lugares son: de izquierda
a derecha, el primero es el de las centenas, el segundo el de las decenas
I' el tercero, el de las unidades.
En este caso podemos repetir digitos; por ejemplo, 333 es un nume-
ro que se hall a entre ° I' 999; ademas, el nlilnero ° esta representado
por la selecci6n del digito cero en las centenas, en las decenas I' en las
unidades.
Si consideramos el asunto de esta manera, es [:ici! ve r que podemos
lIenar el espacio de las centenas de 10 maneras diferentes, con alglll1
digito del conjunto {O, 1,2, ... ,9}; el espacio de las decenas de 10 mo-
dos distintos, 10 mismo que el de las unidades.
Por tanto, por el principio de la multiplicaci6n tenemos:
10 . 10 . 10 = 10
3
= 1000 numeros entre ° I' 999.
Variaciones can repeticion
Las distintas disposiciones de longitud r donde nos importa el or-
den, pero donde seleccionamos de un conjunto de 11 elementos, en el
que se permiten repeticiones, se Haman variaciones con repetici6n
de longitud I' tomadas de 11 elementos.
TEOREMA 15. El /JIimel'o de I'al'iaciones can I'epeticiou de longitud I'
tOl'nadns de 11 elemel1tos es igual n 1'1 ".
Ejemplos
2 9
Queremos caleular el nllmero de secuencias que pueden
obtenerse al brar una moneda al aire cinco veces. Para em-
pezar, sabemos que en cada tiro hay dos posibilidades: cara 0 cruz;
nosotros deseamos fijarnos en la secuencia de cinco tiros.
Tenemos entonces:
11=21'1'=5 11' = 2
5
= 32.
Hay 32 secuencias, que es el numero de vari aciones con repetici6n
de longitud cinco tomadas de dos elementos.
30
Ahora queremos caleular cuantos numeros hay entre ° I'
999 que 5610 utilicen los digitos 0, 1,2 I' 7. En este caso,
11 = 4, I' = 3 11" = 4
3
= 64.
Hay 64 nllmeros entre ° I' 999 que 5610 utilizan los digitos 0, 1,2 I' 7.
UNlOAD 2 I (ONJUNTOS Y COMBINATORIA Santi! ..
Para practicar
CD t De cuantas formas puede lIenarse el podio de ganadores de una
carrera de 100 metros, si participan ocho concursantes y s610 se
premia a los primeros tres'
2 tCuantos numeros entre 0 y 9 999 se pueden escribir utilizando so-
lamente los digitos 0, 4, 5, 6 Y 9?
0 tCuantos c6digos postales se pueden obtener con cinco digitos, si
no queremos que empiezen con los numeros 0 ni 2?
Combinaciones
EI club de ajedrez de la escuela tiene 10 miembros, pero s610 es posible
enviar a tres de ellos al torneo estatal. tDe cuantas for mas puede ele-
gi rse a los tres representa ntes de los miembros del club'
Para resolver esta cuenta recordemos que el numero de posibles
representaciones de tres jugadores, considerando el orden en que se
eli jan los representantes, es igual a V(10, 3) = 10 . 9 . 8, el numero de
variaciones de 10 elementos tomados de tres en tres.
Sin embargo, notemos que el orden en que se escojan los jugadores
no es importante. Si representamos con las primeras letras del abece-
dario a los 10 miembros del club (L), entonces L = {A, B, C. .. . , J}. Par
tanto, resulta igual enviar a A, ByE que a E, B y A, pues es el mismo
grupo de representantes.
Existen P 3 = 3! fOrlnas de ordenar a los tres miembros de la repre-
sentaci6n. Par ende, concluimos que hay V(lO, 3) / P3 = (10 . 9 . 8) / 6 =
720 / 6 = 120 diferentes representaciones que pueden enviarse al tor-
neo estatal.
Combinaciones de n en r
Las combinaciones de tamafio r de un conjunto de tamano n son las
posibles selecciones de r elementos diferentes que pueden tomarse
de un conjunto de n elementos, se lI aman combinaciol1es de n en I; y
su numero se calcul a con
C(n, r) 0 bien, (;).
Podemos calcular el numero de combinaciones de n en r como se in-
dica en el teorema presentado a continuaci6n.
TEOREMA 16.
C(n, r) = (") = \1(11, r) = 11 ! .
r r! r!(11 - r)!
CSantiliana 2. La combinatoria
113 _
_ 114
Ejemplo
31
Una baraja de p6qller consta de 52 cartas 0 naipes. los cua-
les se plleden dividir en cuatro palos: treboles. diamantes.
corazones y picas; cad a palo tiene 13 figuras (0 numeros): as. 2. 3.
4 .... 10. J. Q. K.
Si se desea empezar repartiendo cuatro naipes de la baraja. es
decir. distribuir de manera seeueneial y sin remplazo. entonees te-
nemas:
11 = 52. r = 4
V(52.4) = 52(51)(50)(49) =   ~ : .
Hay 52' / 48! formas de haeerlo.
3 2
Ahora deseamos saear euatro naipes y mostrarlos en la
mesa. Una opcion es saear el as de picas (Ap). la Q de eora-
zones (Qe). el J de diamantes (Jd) y el 6 de treboles (6t).
En este easo el orden ya no es relevante. pues la permutaei6n
Ap. Qe. Jd. 6t equivale a Ap. Jd. 6t. Qe. Sabemos que hay P 4 = 4'
permutaeiones equivalentes de estas eartas. las cuales eorrespon-
den a una seleeei6n de euatro naipes de la baraja. Ademas. no hay
reemplazo porque una vez puesto sobre la mesa el naipe no pllede
volver a la baraja. Por ende. las formas de mostrar euatro naipes
equivale al numero de eombinaeiones de 52 en euatro. es deeir.
C(52 4) = (52) = ~ = 52(51)(50)(49) = 270725.
• 4 48'4' 4'
UNlOAD 2 I (ONJUNTOS Y COMBINATORIA Santil ana
3 3
Supongamos que en un examen de matematicas se pide a
los estudiantes que respondan a cinco preguntas de un cues-
tionario de ocho. sin importar el orden en que 10 hagan. Por ende.
el alum no puede responder al examen de
(
8) = = 8(7)(6) = 8(7) = 56
53! 5! 3(2) .
Hay 56 maneras en que el estudiante puede resolver el examen.
3 4
Para practicar cierto juego. el profesor de Educacion fisica
qUlere orgamzar en un grupo un equlpo compuesto por cm-
co nii\as y cinco nil'ios. Si el grupo tiene 36 alum nos. de los cuales
17 son nili as. ,de cuantas maneras puede formar el equipo?
Si son 17 ninas en el grupo. entonces tenemos 19   Si divi-
dimos el proceso de selecci6n en dos etapas. la primera para elegir
a las cinco ninas y la segunda para escoger a los cinco   obte-
nemos:
(
17) d I· . .-
5 maneras e se eCClOnar a CinCO mnas;
(
19) d I · . .-
5 maneras e se ecclonar a CinCO nlllos.
Ahora. por el principio del producto el profesor de Educacion fisi-
ca tiene:
maneras de formar el equipo.
Veamos ahora las combinaciones con repeticion. Empecemos con un
ejemplo sencillo.
Camino a casa Juan. Maria y Emilio se detienen en la heladeria a
comprar una paleta. Si la heladeria cuenta con cuatro sa bores: vainilla.
chocolate. limon y fresa. i.CUantas ordenes (combinaciones) pueden
hacer Juan. Maria y Emilio?
Un posible orden es que los tres se lI even el mismo   es decir.
en este problema se pennite la repeticion. Recordemos que seleccio-
nar tres objetos de un conjunto de tamalio cuatro con repeticion se
puede hacer de 4
3
= 64 maneras.
Pero no estamos interesados en saber quien prefiere un espe-
dfico sino. mas bien. que tipo de paletas se lIevaron. es decir. las posi-
bles elecciones de paletas. En otras palabras: estamos interesados en
calcular las combinaciones tomadas de cuatro en tres con repeticion.
Santillana 2. La combinatoria
115 _
_ 116
Combinaciones con repetician
Las combinaciones de tamai\o r tomadas de un conjunto de tamal'lO
n con repetici6n son las posibles selecciones de ,. elementos (con po-
sibles repeticiones) tomados de un conjunto de n elementos, y se
caleulan mediante:
(n +,. - i)! = (n + r - 1)
r!(n -l)! ,..
Entonces, las posibles ordenes que pueden hacer Juan, Maria y Emilio
son
(
4 + 3 - 1) = (6) = = 20
3 3 3'3' .
Escribe las 20 posibles seleeeiones de diferentes pal etas que pudieron
haber pedido Juan, Marfa y Emilio.
EjempLo
3 5
Una pasteleria ofreee 12 tipos de pasteles y eada dia hornea
20 pasteles de eada tipo. tOe cuantas farmas podemos haeer
una orden de nueve pasteles si somos los primeros en haeer un
pedido ala pasteleria
7
Como en la pasteleria se hornean 20 pasteles del mismo tipo
todos los dias y somos los primeros en haeer un pedido, entonees
tenemos la posibilidad de lIevarnos los nueve pasteles del mismo
tipo, 0 bien una seleeeion de ellos.
Deseamos saber de euantas formas es posible escoger nueve
pasteles de los 12 tipos que hay, es decir
(
12 + 9 - 1) = (20) =   = 167960.
9 9 11'9'
Tenemos 167960 maneras de eseoger los nueve pasteles.
Para practicar
CD tOe euantas fOrlnas pueden mostrarse tres naipes de una baraja de
poquer (inglesa»
2 En un restaurante se ofreeen 10 tipos de menus del dia. Si hay 20
c1ientes sentados para comer, (.cuantas combinaciones pueden or-
denar?
o En una ageneia de automoviles se tienen euatro tipos de modelos de
autos y cinco colares. tOe cwintas maneras se pueden escoger dos
autos diferentes
7
UNlOAD 2 • (ONJUNTOS Y COMBINATORIA   till. nJ
El triiingulo de Pascal
Los numeros de combinaciones C) que hemos vista en las secciones
previas ti enen aplicaciones en todas las ramas de las matemati cas.
Asimismo, ti enen propiedades que durante siglos han fascinado a los
mate maticos profesionales y a los afi cionados. Una de las mas util es
puede obtenerse como sigue:
Escribimos los numeros (   , ~ ) en una piramide 0 tri angul o como en la
fi gura 26a, que hemos continuado hasta el octavo rengl6n. En la fi gu-
ra 26b puedes ver los n(lIneros correspondi entes, que se caleulan como
en las secciones anteriores. Recuerda que como 0' = 1, entonces ~ ) = 1,
e igualmente ( ~ ) = 1, m = 1, m = 1 Y asi sucesivamente.
( ~ ) = r! ( : ~ r)! '
donde n! = n(n - 1)(n - 2) ... 2 . 1.
- -
o
m
o 1
1
m m
1 1
2
m m m
2 1 2 1
3
m m m m
3 1 3 3
4
( ~ ) ( ~ )
m m
(:)
4 1 4 6
5
m m m m m m
5 1 5 10
6
m m m m
(:)
( ~ )
m
6 1 6 15
7
m m m
G)
( ~ )
m m m
7 1 7 21
8
m m m m m m m m m
8 1 8 28
a
C Santillana 2. La combinatori a
Figura 26
Tri6ngulo de Pascal
a) Vafores expresados mediante (;)
b) Numeros correspondientes
a las combinaciones.
1
4 1
10 5 1
20 15 6 1
35 35 21 7 1
56 70 56 28 8 1
b
117 _
Figura 27
_ 118
Observa que aun cuando el calculo del renglon 7 no resulta muy
dificil, si 10 es para los siguientes. Por ejemplo, en el renglon 30 ten-
driamos que calcular numeros como (3,0) = 2035800,10 cual no resul-
ta sencillo; sin embargo, est a ordenaci6n de numeros tiene una pro-
piedad interesante que puede facilitar nuestro trabajo.
En cada renglon, todos los numeros iniciales y finales equivalen a 1
(marcados en gris en la figura 27). Cualquier otro numero de la tabla
(que no sea inicial 0 final) es la suma del que aparece justamente arri-
ba, mas el que esta arriba y a la izquierda.
Por ejemplo, en el region 5 y la tercera columna tenemos un 10. Este
es la suma del numero que esta arriba, 6, mas el numero de arriba a la
izquierda, que es 4 (vease la figura 27, donde estos numeros estan mar-
cados en amarillo). Intenta otras combinaciones y compruebalo en el
triangulo de la figura 26.
-
0 1
1 1 1
2
1 2 1
3 1 3 3 1
4 1 4 6 4 1
5 1 5 10 10 5 1
6 1 6
15
1
2° [ 15
1
6
1 I
o 2 3 4 5 6
Nota que si usamos esta propiedad, lIenar los renglones sucesivos
se torna faci!, pues ahora se trata de sumar dos numeros en lugar de
hacer varias multiplicaciones. Solo nos ralta comprobar que esta pro-
piedad se cumple independientemente del numero de renglones que
tengamos (solo 10 hemos ver ificado hasta el renglon 8). Podemos ha-
cer esta verificacion a partir del teorema siguiente.
TEOREMA 17. Para todos n y r nUl11eros naturales mayores 0 iguales
a 1, tenemos que:
(
") = (11 - 1) + (11 - 1) .
r r r - 1
En terminos del triangulo es faci! entender la formula: si queremos
calcular C') entonces podemos tomar el numero que esta justa mente
arriba, que es ("   1), Y sumarle el que esta arriba a la izquierda, que
(
11 - 1)
es r - 1 .
UNlOAD 2 I (ONJUNTOS Y COMBINATORIA S<lntili<.:na
Ejemplo
3 6
Observa la figura 25. Si establecemos n = 5 )' r = 3, que in-
dican respectivamente el renglon 5 )' la columna 3, entonces
la formula del teorema 17 dice que
m = (5; 1) + ( ~ = D = m + m·
)' daramente vemos que ( ~ ) es el numero que esta arriba de ( ~ ) , )  
que (i) es el numero que esta arriba a la izquierda de ~ ) . En efecto,
observamos que 10 = 6 + 4.
En seguida demostraremos por que 10 que expresa el teorema es cierto
para cualquier n y r.
Demoslracio/l del teorema 17.
,--- ,---
n= O
m
1
n = l
m m
1 1
n =-= 2
m m m
1 2 1
n 3
m m m m
1 3 3
n= 4
m
~ ) ( ~ ) ( ~ )
(:) I 1 4 6
n = S
m m m m m m
1 5 10
n = 6
m m m m
(:)
m m
1 6 15
( = 0 , "" 1 ( = 2 ( = 3 ( = 4 r = S ( = 6
Investiguemos otra propiedad interesante de estos numeros del trian-
gulo de Pascal: si marcamos con color todos los numeros impares,
entonces obtenemos un patron interesante (figura 29) . Por ejemplo,
para los primeros siete renglones obtenemos el triangulo que esta a la
derecha en la figura. Si siguieramos con este proceso hasta el renglon
255, obtendrlamos la imagen que esta a la izquierda. Los primeros siete
renglones son solo una pequena parte (alrededor del vert ice superior)
de la imagen de la izquierda. Reflexiona: <por que aparece este patron
regular en el triangulo de Pascal (considera que sucede cuando sumas
dos numeros pares, uno par y uno impar)' dos impares)?
C Santillana 2. La combinatoria
Figura 28
1
4 1
10 5 1
20 15 6 1
119 _
Figura 29
Observa e/ patron de tri6ngulos
que semejan un fractal, que es una
figura cuyos partes son versiones
reducidas de /0 figura camp/eta.
En el tridngulo coloreado de 255
(eng/ones puedes ver c/aramente
como estd {armada con oiras tres
tridngulos mds pequenos que son
_ 120
versiones reducidos del
tridngu{o grande.
1
1 1
1 2 1
    ~
1 3 3 1
1 4 6 4 1
1 5
10 10
5 1
1 6 15 20 15 6 1
1 7 21 35 35 21 7 1
Para practicar
CD En el tria ngulo de Pascal, caleula la suma de los renglones cones-
pondientes a 17 = 0, 1, 2, ... , 8. <Reconoces los numeros obtenidos'
<Son potencias de algun numero'
2 Escribe el rengl6n septimo del triangulo de Pascal.
® <eual serfa el valor del elemento 4 del rengl6n octavo'
EI binomio de Newton
Tal vez recuerdes de 10 aprendido en cursos de matematicas anteriores
que un bil7omio es una cantidad de la forma x + y [por ejemplo, 3 + 5,
10 - 2 = 10 + (- 2), etc.l. Precisamente, una aplicaci6n muy uti I de
los n(lIlleros cn en el algebra es el caleulo de potencias de un bino-
mio, como (a + b)2 0 (a + b)S
UNI DAD 2 • (ONJUNTOS Y COMBtNATORIA .JSantiliana
£jemplo
37
Demostremos el teorema de Pitagoras para un triangulo
rectangulo de catetos a, be hipotenusa c (figura 30).
a b
b
c
c a
a
c
b
b a
Queremos demostrar que a
2
+ b
2
= c
2
Comenzamos por tra-
zar con roj o el triangulo de hipotenusa c y catetos a y b. Ahora
agregamos otros tres triangulos simi lares (en gri s), rotando el
triangulo original. En la figura 30, la suma de las areas de los cuatro
triangulos es 4(   = 2ab. Ademas, el area del cuadrado central
es c
2
Por tanto, el area total de los cuatro triangulos, mas el cua-
drado central es 2ab + c
2
Por otra parte, como toda esta area es un cuadrado de lados
a + b, su area tambit'n puede calcul arse como (a + b)2 POl' consi-
guiente,
(a + b)2 = 2ab + c
2
Ahora debemos expandir el binomio de la izquierda: (a + b)2 =
(a + b)(a + b) = a
2
+ 2ab + b
2
Entonces, la ecuacion anterior se
escribe como
a
2
+ 2cdf + b
2
=2cdf + c
2
a
2
+ b
2
= c
2
En el ejemplo anterior fue preciso hallar la expansion de (a + b)2 =
a
2
+ 2ab + b2. < Como sera la expansion de (a + b )3? < Y la de (a + b )4,
(a + b)S, etcetera? Podemos responder de inmediato a esta pregllnta
lIsando el triangulo de Pascal expuesto en la seccion anterior.
&.1 Santillana 2. La combinatoria
Figura 30
121 _
_ 122
Sabemos que (a + b)2
(a + b)3. Tenemos que
a
2
+ 2ab + b
2
Cons ideremos ahora
(a + W = (a + b)2(a + b) = (a
2
+ 2ab + b
2
)(a + b)
= (a
2
+ 2ab + b
2
)a + (a
2
+ 2ab + b
2
)b
= a
3
+ 3a
2
b + 3ab
2
+ b
3
Escribamos en la tabla siguiente este resultado [como ejercicio, verifi-
ca en esta tabla la expans ion de (a + b)4]:
Binomio Expansion
(0 + b)1 a + b
(0 + b)' a' + 2ab + b'
(0 + bl' 0
3
+ 3a'b + 3ab' + b
3
(0 + b)' 0' + 4a
J
b + 6a'b' + 4ab
3
+ b'
Nota que hemos ordenado los terminos de acuerdo con la potencia
de a que contienen; pOl' ejemplo, para (a + b)4, el primer termino es
a
4
, luego sigue 4a
3
b, despues 6a
2
b
2
y, finalmente, 4a
1
b
3
(aunque no
suele escribirse la potencia 1) y b
4
(que equivale a aOb
4
).
Los coeficientes de cada uno de estos terminos son 1, 4, 6, 4 Y 1,
respect iva mente. A partir de la tabla anterior podemos anotar en otra
tabla los coeficientes que vamos obteniendo:
1 1
1 2 1
1
1 1
Ciaramente, esos coeficientes son los primeros renglones del triangulo
de Pascal, si excluimos el 1 del vertice super ior. Esto es cierto para bi-
nomios elevados a cualquier potencia.
Para convencernos de elio, consideramos 10 siguiente, que es valido
para /I = 4: primero escribimos
(a + b)4 = (a + b)(a + b) 3
AI expandir el primer factor, queda
(a + b)4 = ala + b) 3 + b(a + b) 3
UNlOAD 2 I CONJUNTOS Y COMBINATORIA S. ntill n i   l
Observa que en ambos sumandos debemos expandir el binomio
(a + b)3 Tomemos el coeficiente de a
4
Claramente. ningun a
4
sale del
segundo sumando. pot'que todos los terminos de este segundo su-
mando estan multiplicados par b. Del segundo sumando. tenemos que
a
4
resulta de multiplicar a pOl' el terminG a
3
de (a + b)3 Par ende.
el coeficiente de a
4
es igual al coeficiente de a
3
en (a + b)3. que es
igual a l.
Pasemos al coeficiente de a
3
b. Podemos obtener a
3
b multiplicando
a pOl' el terminG a
2
b de (a + b)3. en el primer sumando. 0 multiplican-
do b pOl' el terminG a
3
en el segundo sumando. POl' tanto:
coeficiente de a
3
b en (a + b)4 = coeficiente de a
2
b en (a + b)3
+ coeficiente de a
3
en (a + b)3
Sin mucha dificultad. podemos generalizar como sigue:
coeficiente de akb
m
en (a + b)" = coeficiente de ak- Ibm en (a + b),,-I
+ coeficiente de akb
m
-
I
en (a + b),,-I
donde k + m = 17. pues en todos los terminos de un binomio elevado
ala potencia 11. los exponentes de a y b suman 11. Esta ultima ecuacion
expli ca pOl' que los coeficientes de la expansion del binomio estan da-
dos pOl' el triangulo de Pascal: la regia es justa mente la que se usa para
construi rio.
,
Para practicar
CD i.Cual es el coeficiente de a
8
b
3
en la expansion de (a + b)ll?
2 CaJcula la expansion de (a + b)5 usando el triangulo de Pascal para
encontrar los coeficientes respectivos.
CD Encuentra k y p tales que el coeficiente de akb
P
sea igual al coefi-
ciente de ab
3
en la expansion de (a + b)4
CSantiliana 2. La combinatoria
123 _
__ ___ ___________________________ __
Notacion y conceptos basicos de conjuntos
® Para decir que el elemento a pertenece al conjunto A solemos escribir a EA.
® EI conjunto vacio se simboliza con 0.
® EI conjunto universal se representa con U.
® Si todos los elementos de A estan en B, entonces A B.
® La uni6n del conjunto A con B es A U B = {x I x E A 0 x E B).
® La intersecci6n de A con B es An B = {x I x E A Y x E B).
® Dos conjuntos disjuntos cumplen A n B = 0.
® La diferencia A - B son los elementos que estan en A, pero no en B:
A-B={x l xEA
® EI complemento de un conjunto A es AC = U - A.
® La diferencia simetrica A L',B es A L', B = {x I x E A, x E B Y x A n B).
Propiedades de conjuntos
® Si A B, entonces A U B = B Y A n B = A.
® AUB=BUAyAnB=BnA.


® A U A = A Y A n A = A.
® A U 0 = A Y A n U = A.
® An 0=0y AU 'U=1J
® A U (A n B) = A Y A n (A U B) = A.
® A - B = An BC.
® (AC)C = A.
® AUAc ='U, AnAc =0.
® (A U m
c
= AC n BC y (A n m
c
= AC U BC.
® (A - B) U (B - A) = A U B - A n B = A L', B.
(onceptos relacionados con el conteo
_ 124
® La cardinalidad de un conjunto A, /I(A) es el numero de elementos que
contiene el conjunto.
® Si A B, entonces /1 (B - A)= II(B) - II(A).
® EI factorial de un numero natural II, II!, para /I 2: 1. es /1! = II (/I - 1) " con
l' =lyOI=l.
UNIDAD 2 • CONJUNTOS Y CQMBtNATORIA
® Para dos numeros naturales 11 y k tales que 11 > k y k 2: 1, tenemos que
11' = 11 . (11 - 1) ..... (11 - k)'
® EI numero de permutaciones simples de 11 elementos PH es PH = 11', Y cuen-
ta el numero de posibles reacomodos de los elementos en linea.
® EI numero de permutaciones circulares de 11 elementos es (11 - I)!, Y cuen-
ta el numero de acomodos distintos de 11 objetos en torno a un drculo.
® EI numero de permutaciones de 11 elementos donde hay n, elementos repe-
tidos de un primer tipo, n
2
de un segundo, ... , Y n
k
de un k-esimo tipo est"
dado por n! / (n
j
' n
2
! .. · 11k!)'
® EI numero de variaciones sin repeticion V(I1, 1') es \1(11,1') = n' / (11 - r)!, y
cuenta las disposiciones de grupos de I' elementos que pueden formarse a
partir de n elementos cuando el orden en la dis posicion es relevante.
® EI numero de variaciones con repeticion de longitud I' tomados de 11 ele-
mentos es 11 ", y cuenta las distintas disposiciones de longitud I' donde nos
importa el orden, pero donde seleccionamos de un conjunto de 11 elemen-
tos en el que se permiten repeticiones.
® Las combinaciones de n en I; C(11, 1'), son:
C(11 1') = (/) = \1(11,1') = n'
, I' 1" 1"(11-1')"
y cuenta las posibles selecciones de I' elementos que pueden tomarse de un
conjunto de 11 elementos.
® Las combinaciones de tamaiio I' tomadas de un conjunto de tamano 11 con
repeticion son las posibles selecciones de I' elementos (con posibles repeti-
ciones) tom ados de un conjunto de 11 elementos, y se caleulan mediante:
(11 + I' - 1) , = (n + I' - 1).
1"(11-1')' I'
® Sabemos que (n) = ( 11 ).
r n - r
Actividad de repaso
C Santillana
® Recuerda los ejemplos presentados en esta unidad donde se aplicaron las
formulas \1(11,1'), e(l1, 1'), (:' ), entre otras de las enumeradas arriba.
Elabora un mapa conceptual en el que se reiacionen las caracteristicas
del acontecimiento en observacion que queremos contar, usando las pa-
labras clave COI1 orden, sin ordel1, COI1 repeticioll, sil1 repeticiol1, circular,
etcetera.
Propon un nuevo caso en el cual emplees una de elias.
Repaso
125 _
TIpo de celula
sanguinea
AnHgenos
presentes
Anticuerpos
presentes
_ 126
Figura 31
TipoA
antigeno A
(ontra B
U
n grupo sangu{neo es una forma de agrupar ciertas caracteristicas
de la sangre que dependen de los an([genos presentes en la super-
ficie de los gl6bulos rojos y en el suero (figura 31).
Las dos clasificaciones mas importantes para describir grupos san-
guineos en humanos son los antigenos y el factor Rh. Esta clasificaci6n
es fundamental, pues las trasfusiones de sangre entre grupos incom-
patibles pueden provocar una reacci6n inmunitaria que desemboque
en hem61isis, anemia, fallo renal. choque 0 muerte.
Clasificaci6n con base en los antigenos
Hay cuatro tipos de sangre de acuerdo con la presencia de antigenos
en los gl6bulos rojos: tipo A, tipo B, tipo 0 Y tipo AB.
EI tipo de sangre A tiene gl6bulos rojos que expresan antigenos de
tipo A en su superficie y anticuerpos contra los antigenos B en el suero.
EI tipo de sangre B tiene la combinaci6n contraria: gl6bulos rojos
con antigenos de tipo Ben la superficie y anticuerpos contra los anti-
genos A en el suero.
Tipo S Tipo AS TipoO
antfgeno B antfgenos A y B sin antigenos
contra A sin anticuerpos contra A y contra B
UNlOAD 2 I CONJUNTOS Y COMBINATORIA e Santiltana
EI tipo 0 no expresa antfgenos (A 0 B) en la superficie de sus gl6bu-
los rojos (se denomina 0 pOl'que procede de la palabra alemana ohne.
que significa "sin"). pero puede producir anticuerpos contra ambos
tipos. mientras que el tipo AB expresa ambos antigenos en su superfi-
cie y no produce anticuerpos.
Si se definen los conjuntos siguientes:
A = {personas con gl6bulos rojos que expresan antigenos de tipo A}
B = {personas con gl6bulos rojos que expresan antfgenos de tipo B}
es posible clasificar a una persona en uno y s610 uno de los cuatro tipos
de sangre antes mencionados mediante operaciones de conjuntos
como sigue (figura 32):
• TipoA = A - B
• Tipo B = B - A
• Tipo 0 = (A U B)C
• Tipo AB = A n B
Es importante observar que los conjuntos son disjuntos. por 10 que
ninguna persona tiene mas de un tipo de sangre.
A causa de estas combinaciones. el tipo 0 puede ser transfundido
sin problema a cualquier persona con cualquier tipo ABO. y el tipo AB
puede recibir de cualquier tipo ABO.
Clasificaci6n con base en el factor Rh
Los grupos sangufneos Rh (descubiertos pOl' Landsteiner y Wiener en
1940) tienen un interes clfnico similar a los grupos ABO. debido a su
relaci6n con la enfermedad hemolftica del recien nacido (E H R N) Y su
importancia en la trasfusi6n.
TIpoA Tipo B TIpoAB
A A
B B
A- B B- A An B
CSanti llana Matematicas y otras ciencias
Figura 32
TIpoO
B
(AUBl e
127 _
_ 128
zQue es el Rh?
En 1940, Landsteiner encantro atro grupa de antigenas, que se denamina-
ron faetores Rhesus (factares Rh) parque fueran descubiertas durante unas
experimentos con monos Rhesus.
Las personas con facto res Rhesus en la sangre se clasifican como Rh
positivas; aquellas sin los factores se clasifican Rh negativas. Las per-
sonas Rh negativas forman anticuerpos contra el factor Rh si estan
expuestas a sangre Rh positiva.
Por tanto, definimos los conjuntos:
Rh + = {personas con gl6bulos rojos que expresan facto res Rhesus}
Rh- = {personas con gl6bulos rojos que no expresan factores Rhesus}
,-Por que es importante saber que Rh tiene una persona? La presen-
cia de anticuerpos contra los antigenos de la sangre determina las
compatibilidades e incompatibilidades de los grupos sanguineos. La
trasfusi6n de sangre entre grupos compatibles general mente no causa
problemas. En cambio, la trasfusi6n entre grupos incompatibles origi-
na una respuesta inmunitaria contra las celulas que pOl·tan el antigeno
y produce una reacci6n a la trasfusi6n. EI sistema inmunitario ataca las
celulas de la sangre donada y causa su fragmentaci6n (hemolizaci6n).
Hoy en dia, toda la sangre para trasfusi6n es revisada meticulosamente.
,-Cuantos grupos sanguine os se pueden formar en total si se toman
en cuenta las dos clasificaciones expuestas?
Por el principio de la multiplicaci6n, tenemos 4(2} = 8 grupos en
total.
Grupos sanguineos = {O- , 0 +, B- , B+, A - , A +, AB- , AB+}
Compatibilidad
Los donantes de sangre y los receptores deben tener grupos compati-
bles. EI grupo 0- es compatible con todos, por 10 que una persona que
pertenece a el es un donante universal. Por otro lado, una persona
cuyo grupo sea AB + podra recibir sangre de cualquier grupo, y se dice
que es un receptor universal. En la tabla 1 se indican las compatibilida-
des entre grupos sanguineos. Por ejemplo, una persona de grupo A-
podra recibir sangre 0 - 0 A - Y donar a AB+, AB- , A + 0 A - .
UNlOAD 2 • (ONJUNTOS Y COMB1NATORIA OSantillana
Tabla 1 (ompatibilidad entre grupos sanguineos
Donante
AB+




• • • •
AB-
• • •

A+
• • • •
A-
• •
B+
• • • •
B-


0+
• •
0-

iDe cuantas formas se pueden elegir tres grupos sanguineos de ma-
nera que se pueda donar a personas can cualquier tipo de sangre?
(
7) = = 7(6)5! = 7(3) = 21
2 2! 5! 2(1)5!
pues el grupo 0 - debe estar incluido en la selecci6n.
Ejemplos
iDe cuantas formas se pueden elegir tres personas can grupo san-
guinea diferente>
(
8) 8! 8(7)(6)5!
3 = 3! 5! = 3(2)(1)5' = 8(7) = 56
De 56 formas.
iEn cuantas de estas se puede asignar un donante a cad a uno de
tres pacientes can tipo A +, AB+, B- 1
De 42formas.
5i se ti ene un paciente can el ti po de sangre A + que requiere dos
donantes, ide cuantas formas se puede elegir a los donantes com-
patibles?
4(4) = 16,
pues hay cuatro grupos compatibles can A +, que son 0 - , 0 +, A - Y A+'
5i se tienen dos donantes, ide cuantas formas ocurre que ninguno
de elias es compatible can el paciente?
8(8) - 4(4) = 48
De 48 formas.
OSantillana Matematicas y otras ciencias
129 _
_ 132
Autoevaluaci6n
o Considera el conjunto 'U = {numeros enteros de 1 a 12 }. Sean los conjun-
tos A = {3, 6, 9, 12} Y B = {2, 3, 5, 7, 12}. Representa en un diagrama de
Venn y comprueba que se cumplen las afirmaciones siguientes:
a (A U B) C = AC n sc
b An(AUB)=A
2 Describe por extension el conjunto de los continentes.
o Demuestra que si A C B, entonces A n B = A.
4 Sea 'U el conjunto de materias en tu programa academico. Define por COIn-
prensi6n dos subconjuntos de U que sean disjuntos y cuya union sea 'II
CD ,Cual es la cardinalidad del canjunto A = {2, 4, 6, ... , 20}?
6 Sea A = {numeros enteros multiplos de 4} Y B {numeros enteros multi·
plos de 2}. Demuestra que A y B tienen la misma cardinalidad.
e!) Determina la cardinalidad de los conjuntos siguientes: A = {a, b, c, d, eJ).
B = {b, d,!, h, j, I). A n B y comprueba el resultado n(A n B) = n(A) +
I1(B) - I1(A n B).
8 Considera U el conjunto de los numeros reales. Sea A = {numeros ma-
yores a 120} Y B = {numeros menores 0 iguales a 120}. Describe A - BC,
An BCy Ac U BC.
o ,Cual es el coeficiente de a
S
b
3
en la expansion de (a + b)8?
10 En una rifa hay dos premios y participan Maria, Pablo, Rodrigo y Laura.
Ninguno de elias puede ganar ambos pren1ios. tOe cuantas formas se
pueden asignar tales premios? Representa las posibilidades en un diagra-
ma de arbo!.
@ Si se c1asifica a un grupo de estudiantes segun su genera y su grade acade-
mica (1°,2°,3°,4°,5°,6°), ,cuantas c1asificaciones posibles puede haber?
12 En un grupo de cientfficos hay dos maternaticos, tres bi6logos y dos ff-
sicos:
a ;,CUi:lntas formas hay de elegir un grupo de tres cientfficos?
b ,En cuantas de elias hay uno de cada tipo?
@ En un estudio de salud se concluy6 que si se sigueillas siete reglas simples
presentadas a continuaci6n, la vida de un hombre puede extenderse un
promedio de 11 al10s y la de una mujer por siete anos: 1) no fumar; 2) ejer-
cicio regular; 3) consumo moderado de alcohol; 4) 7 a 8 horas de sue no;
5) mantener el peso apropiado; 6) desayunar; 7) no comer entre comidas.
UN l OAD 2 I (ONJUNTOS Y COMBINATQRIA @Santillana
i.De cuantas fonnas puede una persona adoptar cinco de estas reglas:
a Si en el presente la persona incumple las siete?
b Si la persona nunca bebe y siempre se desayuna?
14 Se entrevisto a 200 personas para saber si compran los productos A y B.
Resulta que 130 personas compran A, 45 compran B y 25 compran am-
bos. i.Cuantas personas compran A 0 B? i.Cuantas personas no compran
A? i.Cuantas personas no compran A ni B?
@ i.De cuantas maneras se puede responder en un examen de opcion multi -
ple que cansta de 10 reactivos (preguntas), si cad a una de elias tiene cua-
tro respuestas posibles?
16 Gabriel y Andres juegan a lanzar dos veces una moneda al aire. Si caen
diferentes resultados gana Gabriel y si caen iguales gana Andres. Repre-
senta en un diagram a de 'rbollos posibles resultados de este juego y mar-
ca aquellos en los que gana Gabriel.
@ Encuentra el numero de formas en que seis maestros pueden ser asigna-
dos a cuatro materias, si cada uno de ellos es asignado a no mas de una
materia.
18 Si se quiere c1asificar a un grupo de personas de acuerdo can su genero
(masculino, femenino) y su nivel de estudios (primaria, secundaria, pre-
paratoria, profesional), i.cuantas c1ases se pueden formar?
@ Nueve personas planean un viaje a la playa en tres automoviles donde
cab en dos, cuatro y cinco pasajeros. respectivamente tDe cuantas mane-
ras se pueden transportar?
20 i.De cuantas formas se pueden ordenar cinco cuadernos numerados en
una pila?
Ejercicios de refuerzo
o i.De cuantas form as se pueden acomodar tres novelas, dos Iibros de mate-
rnaticas y uno de qufmica en un estante si
a Se pueden acomodar en cualquier orden?
b Los Iibros de matematicas deben quedar juntos y las novelas tambien?
c Las novelas deben quedar juntas, pero el resto puede quedar en cual-
quier orden?
2 i.Cuantos numeros de tres cifras pueden fonnarse con los dfgitos 4, 5,
6,7,8'
o Se repartir' un total de siete regalos a un grupo de 10 nifios. ,De cu'ntas
[ormas se puede hacer la reparticion si ningun nino puede recibir mas de
un regalo?
4 i.CUantas palabras de cuatro letras se pueden formal' can las letras de la
palabra mariposa?
CD i.Cuantas palabras de tres letras se pueden formal' con cinco consonantes
y tres vocales, de modo que cada palabra empiece y termine can conso-
nante?
C Santillana Autoevaluaci6n y ejercicios de refuerzo
133 _
_ 134
6 En un juego de dados, se sum a el resultado de los dos dados y gana aquel
que obtenga el mayor numero. Si obtienes un 5 y un 1,
a lEn cuantos posibles resultados de tu oponente Ie ganas?
b lEn cuantos pierdes tu.?
C lEn cuantos empatan?
CD Determina el numero de enteros de seis dfgitas (que no comiencen con
cero) en los que:
a Ningun digito se pueda repetir.
b Se puedan repetir los digitos.
8 Una placa en el Distrito Federal se forma con tres letras y tres digitos.
iCuantas placas que contengan una S y un 8 se pueden formar? i.Cuantas
placas que contengan A al inicio se pueden formar?
o Ana y Maria vieran a dos hombres alejarse en autom6vil (rente a una jo-
yeria, justa antes de que sonara una alanna contra robos. Cuando fueron
interrogadas por la policia, las dos j6venes dieron la siguiente informaci6n
acelTa de la placa (que constaba de dos letras seguidas de cuatro digitos).
Marfa estaba segura de que la segunda letra de la placa era una 0 0 una Q.
y que el ultimo dfgito era un 3 0 un 8. Ana dijo que la primera letra de la
placa era una C 0 una G y que el primer digito era definitivamente un 7.
;,Cuantas placas tendra que verificar la poJida?
10 Un cfrculo se divide en oeho partes iguales. Si cada parte se pinta con un
color distinto.l.de cuantas form as diferentes puede que dar coloreado?
@ En un examen, un estudiante debe contestar siete de 10 preguntas sin
importar el orden_tOe cuantas maneras puede responder el examen?
12 Para una rifa se numeran 10 papeJes y se introducen doblados en una
caja. Hay cinco premios y los numeros se van eli giendo al azar, de uno en
uno; el primero que sa le no obtiene premio, el segundo sf y as! sucesiva-
mente hasta repartir los 10 premios. iDe cuantas formas puede el 3 ga-
nar premio?
@ Un comite de 12 personas se elegid entre 10 hombres y 10 mujeres. loDe
cuantas maneras se puede hacer la selecci6n si
a No hay restricciones?
b Debe habel' seis hombres y seis rnujeres?
c Debe haber un numero par de mujeres?
14 Una ficha de domin6 contiene dos numeros del conjunto 0, 1, 2, ... , 6.
loCuantas fichas hay en un juego de dornin6? iEn cuantas de elIas aparece
un 4? loCuantas de elias tienen un nlunero repetido?
UNlOAD 2 • (ONJUNTOS Y COMBINATORIA
@ Cuatro nadadores van a disputar Ia final del camp eo nato mundial. Los
premios son: 1· , medalla de oro; 2· , medalla de plata, y 3·, medalla de
bronce. iDe cuantas maneras pueden ser distribuidas esas medallas?
16 iDe cuantas fannas se pueden elegir siete fichas de domin6 al azar? ;,Cwin-
tas de elias contienen Ia ficha (6, 6), Ia mula de seises?
@ En una urn a hay cinco bolas blancas numeradas de uno a cinco y cinco
bolas negras con la misma numeraci6n. Si se extraen dos bolas simulta-
neamente
a <Cuantos posibles resultados hay?
b <En cuantos de ellos habra una bola blanca y otra negra?
( <En cuantas de elias habra dos del mismo color?
18 En una urna hay cinco bolas blancas numeradas de uno a cinco y cinco
bolas negras can la misma numeraci6n. Si se extraen tres bolas de la urna
del ejercicio anterior,
a tEn cuantas habra una blanca y dos negras?
b <Cuantas en las que las tres bolas sean del mismo color?
@ Una compaiiia de ballet debe elegir a un elenco de cinco bailarines y 12
bailarinas. Si en el grupo hay 24 hombres y 30 mujeres, <de cuantas for-
mas puede hacerlo?
20 Si se tiran dos clados, i,cuantos resultados es posible obtener?
CI Santillana Autoevaluaci6n y ejercicios de refuerzo
135 _
Blaise Pascol (1629-1662),
matem6tico frances en cuyos
trabajos se hallan las simientes de
10 teoda de probabilidades.
138
En numerosas situaciones de la vida diaria existen factores inciertos,
cantidades 0 resultados que no podemos predecir, y a menudo las de-
cisiones que tomamos depend en en gran medida de ellos, 10 que sig-
nifica que siempre hay riesgos que debemos asumir.
Por ejemplo, el profesor de historia realiza un examen sorpresa una
vez al mes y no es posible saber con exactitud que dia sera_ Tu debes
decidir si estudias para cada clase 0 te arriesgas a presentar el examen
sin haberte preparado_ Es posible que los primeros dias decidas no
estudiar, pues consideras "poco probable" que el examen sea tan pron-
to, pero a medida que transcurren los dias aumenta tu conviccion de
que el profesor aplicara el examen_
Por cons iguiente, resulta util medir 0 cuantificar el grado de certeza
o la posibilidad de que ocurra un suceso incierto, pues ella permite
tomar decisiones razonables _
Por otro lado, el azar es un factor que aparece en gran cantidad de
juegos, y los hace mas interesantes 0 divertidos_ Y es en esos juegos
donde los matematicos tuvieron sus primeros exitos en en tender y ex-
plicar el comportamiento del azar.
EI nacimiento de la teoda de probabilidades suele ubicarse en el si-
glo XVII, en los trabajos de los matematicos franceses Blaise Pascal y
Pierre de Fermat. Ambos resolvieron diversos problemas relacionados
con los juegos de apuestas y propusieron varios metodos, hoy funda-
mentales en la teoda de probabilidades_
EI caballero de Mere, un experto jugador, planteo a Pascal el siguien-
te problema de apuestas: el sabia que era ventajoso apostar a obtener al
menos un seis en una serie de cuatro lanzamientos de un dado yargu-
mento que debeda ser igualmente ventajoso apostar por obtener al me-
nos un doble 6 en una serie de 241anzamientos de un par de dados_
Sin embargo, la experiencia no corroboro su suposicion_ En cam-
bio, fue el comienzo de una correspondencia entre Pascal y Fermat,
quienes resolvieron este problema, entre muchos otros, 10 que dio ori-
gen a la teoda de probabilidades_
UN l OAD 3 I PROBABILIDAD e Santillana
Experimentos y
Existen dos clases de sucesos: los que podemos predecir y los que
resultan impredecibles. Los que es posible predecir se lIaman deter-
ministas, en tanto que los que no podemos predecir se denominan
aleatorios.
Considera los sucesos siguientes:
a Un volado.
b El lanzamiento de un dado.
c Una mano de poquer.
d La eleccion al azar de un companero de clase.
e EI sabor de helado preferido (chocolate, vainilla 0 fresa) de una per-
sona desconocida.
Observa que todos ell os tienen algo en comun: su resultado es incier-
to, no es predecible. Se trata, por consiguiente, de sucesos aleatorios.
Con los sucesos aleatorios podemos realizar diversas actividades, en-
tre eli as, experimentos aleatorios.
Experimento aleatorio
Se ll ama experimento aleatorio todo procedimiento cuyo resultado
es imposible conocer 0 pronosticar antes de haberlo realizado.
En los casos enumerados un par de parraros arriba, sin embargo, si es
posible establecer cu,\Ies son sus posibles resultados y expresarlos de
algun modo; por ejemplo, en notacion de conjuntos:
a {aguila, sol}.
b {1, 2, 3, 4, 5, 6}.
c {Todas las posibles fonnas de elegir cinco de las 52 cartas de la ba-
raja inglesa}.
d {Todos los companeros de tu clase}.
e {chocolate, vain ilia, fresa}.
Como puedes observar, en los incisos anteriores se expresan los posi-
bles resultados de los sucesos aleatorios enumerados parrafos atras,
desglosados en la notacion de conjuntos expuesta en la unidad anterior.
Pero <que indican estos resultados? No son sino el espado InLlestral de
cad a uno de aquellos sucesos aleatorios.
C Santiliana 1. Experimentos y espacio muestral
e f---
139 _
Describe experimentos
aleatorios cuyo espacio
muestral no sea fin ito.
_ 140
Espacio muestral (n)
EI conjunto de todos los posibles resultados de un experimento alea-
torio se canace como espacio muestral, el cual se simboliza can la
letra griega omega mayuscula, n.
Si el espacio muestral es un conjunto finito, entonces el numero de
resultados posibles del experimento esta dado par n(n), es decir, par
la cardinalidad del espacio muestral n.
£jemp/os
Describamos el espacio muestral de los experimentos aleatorios
siguientes, es decir, determinemos su cardinalidad.
1
Se lanza dos veces una moneda y se quiere contar cuantas
caya aguila:
espacio muestral = .0. = {O, 1, 2};
/1(.0.) = 3.
Par tanto, la cardinali dad del espacio muestral de este experimento
es 3.
2 Se lanzan dos dados y hay que sumar los puntas obtenidos:
espacio muestral = .0. = (2, 3, 4, ... , 12)'
es decir, /1(.0.) = 11.
3
Se elige al azar una carta de una baraja inglesa. Si representa-
mas con C los corazones, can D los diamantes, can £ las espa-
das y con T los treboles entonces:
.0. = {AC, 2C, 3C, ... , KC, AD, 2D, 3D, ... , KD, AE, 2£, 3E, ... ,
KE, AT, 2T, 3T, ... , KT};
a sea, la cardinalidad del espacio muestral es /1(.0.) = 52.
UN l OAD 3 • PROBABILIDAD @Santillana
4 Se escoge al azar un punto dentro de un circulo de radio 1:
0= {Todos los puntos dentro del circulo}.
En este experimento la cardinalidad del espacio muestral es
n(O) = 00.
S
En un recipiente hay 100 gramos (g) de caramelos y se toman
algunos en el PUll0 para en seguida pesarlos:
0= [O.lOOgj.
Igual que en el ejemplo anterior. en este n(O) = 00.
En algunos casos no resulta sencillo ni inmediato determinar el nume-
ro de elementos que forman el espacio muestral; entonces es necesario
usar las tecnicas de conteo estudiadas en la unidad anterior: el princi-
pio de la multiplicaci6n. las pennutaciones y las combinaciones.
Ejemplos
6
Se hace girar una ruleta de forma circular dividida en tres par-
tes iguales. una de color rojo. otra azul y otra amarilla. Al mis-
mo tiempo. se lanza un dado de cubo. lCuantos elementos tiene el
espacio muestral de este experimento'
Podemos trazar un diagrama de arbol como el de la figura 1 para
representar el espacio muestral. Como se observa. en este experi-
mento n(O) = 18.
C Santiliana
. -[;;] .
fOOl / . _(j .
l.!...!J ~ ...
-- lu,
. _TI' .
r:::I / • - tii •
l l i   ~ __ IT
~
1. Experimentos y espacio muestral
Fi gura 1
Diagramo de drbol del espacio
muestral del ejempJo 6.
141 _
_ 142
7
La final de una competencia interescolar sera disputada por
cinco participantes. Si suponemos que no hay empates y el ex-
perimento consiste en registrar el orden en que aquellos ll egan a la
meta, i. cuantos elementos tiene el espacio muestral?
EI nlllnero de permutaciones de cinco elementos es:
5 ! = 5(4)(3)(2)(1) = 120,
es decir, en este experimento n(O) = 120.
8
Se ext raen cuatro fi chas de un juego de domin6, que consta de
28 fi chas. i.Cmlntos elementos tiene el espacio muestral?
EI numero de formas de elegir cuatro de las 28 fichas es (2:).
Para practicar
CD Considera el experimento de encestar tres canastas en una pnictica
de basquetbol. Describe el espacio muestral y determina su cardi-
nalidad.
2 Imagina que en un grupo de personas hay cinco de ojos castal'ios,
tres de ojos verdes y dos de ojos azules. Si se eli gen dos personas al
azar, describe el espacio muestral y detennina su cardinalidad.
(]) Se escoge al azar a un alum no de tu grupo y se Ie pregunta su peso
(masa). Describe el espacio muestral y su cardinalidad.
Espado muestral equiprobable
Si bien no puede predecirse el resultado de un experimento aleatorio,
Sl puede estimarse la posibilidad que tiene de ocurrir. En muchas si-
tuaci ones aplicas el concepto de probabilidad para indicar el grade de
convicci6n que ti enes respecto a que se presente un resultado. Par
ejempl o, piensas: "Es muy poco probable que apruebe el curso" 0 "es
probable que manana l l u e v a   ~ Esta convicci6n se adquiere ya sea a par-
tir de experi encias en situaciones simiiares, informacion conocida 0
bi en, con base en creencias subjetivas.
Por citar un caso, al lanzar una moneda al aire puede caer aguila 0
sol. Si piensas en una moneda normal, justa (es decir, "no cargada"), es
igualmente posibl e que ocurra una 0 el otro, por 10 que ambas posibi-
lidades son equi probables, es decir, tienen la misma probabi li dad de
presentarse.
UNlOAD 3 • PROBABILIDAD SantiHana
Espacio muestral equiprobable
Un espacio muestral es equiprobable si todos los elementos que 10
forman tienen igual oportunidad de presentarse cuando se realiza
can elias un experimento aleatorio.
Al tirar un dado hay seis resultados posibles y es igualmente probable
que se presente cualquiera de elias. Par tanto, su espacio muestral
tambien es equiprobable.
Ahara imagina un dado que tiene cuatro caras de color blanco y dos
de color azul, sin numeros. Si 10 lanzas, los posibles resultados son
{blanco, azul). pero no todos los elementos son igualmente probables,
pues hay mas caras de color blanco.
Lo mismo ocurre si el experimento consiste en elegir, sin ver, un
caramelo que se halla en una caja donde hay cinco caramelos rojos y
tres verdes. EI espacio muestral es {raja, verde). tEs igualmente pro-
bable coger un caramelo rojo que lIno verde? Es claro que no.
En estos casas el espacio muestral es no equiprobable.








Para practicar
(DEn un grupo de pacientes hay cinco con tipo de sangre A+, siete
can 0 + y dos can B- . Si se eli ge lin paciente al azar, tcual es su es-
pacio muestral? tEs equiprobable? De no serlo, intenta definir un
espacio muestral que sf 10 sea.
2 Si se lanzan dos dados y se suman los puntas obtenidos, tcual es el
espacio muestral? tEs equiprobable? )ust ifica tu respuesta.
o Si eliges 20 personas al azar Y cllentas el numero de mujeres escogi-
das, tcual es el espacio muestral? tEs equiprobable? tPor que?
4 En los casas del dado can caras blancas y azules, y en el de los cara-
melos rajas y verdes expuestos parrafos arriba, tpodrias definir un
espacio muestral diferente, que sf sea equiprobable? tCual seria?
CSantillana 1. Experimentos y espacio muestral
Figura 2
Espacia muestral no equiprobable.
143 _
-
144
... ""·"t05
lmagina un juego en el que hay que alTojar un dado de cubo. Si el re-
sultado es un numero par, ganas; si no, pierdes. <Crees tener la misma
oportunidad de ganar que de perder
7
reel
 
[llJ

• •
• •
 
l£!J
Observa que ganas en tres de los seis posibles resultados y pierdes en
los otros tres. Como todos los resultados posibles tienen la misma
oportunidad de oculTir, entonces tu tienes la misma probabilidad de
ganar que de perder.
Ahora imagina un juego similar, pero esta vez ganas si sale un nu-
mero menor que 3. En este caso ya no tendrias la misma oportunidad
de ganar, pues 5610 hay dos resultados que son men ores que 3 y, en
cambio, hay cuatro que son mayores 0 iguales a 3.
Es importante notar que "numero par" no es uno de los posibles
resultados de tirar un dado, pero Sl es un subconjunto del espacio
muestral, ya que obtener un nlllnero par es 10 l11ismo que obtener cual-
quiera de los resultados {2, 4, 6}. De igual forma, obtener un nl,mero
menor que 3 es 10 mismo que obtener unnumero del conjunto {I, 2}.
Evento
Un evento 0 suceso es cualquier subconj unto del espacio muestral de
un experil11ento aleatori o.
Ejemplo
9
Si tiras dos dados, uno blanco y uno rojo, los posibles result a-
dos serian:
6, 6 6, 5 6, 4 6, 3 6, 2 6, 1
5, 6 5, 5 5, 4 5, 3 5, 2 5, 1
4, 6 4, 5 4, 4 4, 3 4, 2 4, 1
3, 6 3, 5 3, 4 3, 3 3, 2 3, 1
2, 6 2, 5 2, 4 2, 3 2, 2 2, 1
I, 6 I, 5 I, 4 1, 3 I, 2 1, 1
UN l OAD 3 I PROBAB I LIDAD Santillm
Como puedes suponer, el primer numero es el resultado del dado
blanco y el segundo, el del dado rojo. Describamos los eventos si-
guientes:
a EI resultado suma 4.
b EI resultado suma 6.
c EI dado blanco cae en 5.
d Los dos numeros son iguales.
Evento Descripcion
a Resultado suma 4: 1(1, 3), (2, 2), (3, l )}
b Resultado suma 6:  
c Dado blanco cae en 5: ((5, 6), (5, 5), (5, 4), (5, 3), (5, 2), (5, l )}
d Dos n"meras igual es:
Es importante sefialar que si un even to contiene solo un resultado se
llama evellto elemelltal.
Los eventos suelen representarse con letras mayusculas como A, B,
C. etcetera. Y como se trata de conjuntos, pueclen combinarse usando
las operaciones que ya conoces: interseccion, union y complemento
(en slmbolos, n, U y c, respectivamente) .
Eventos combinados
Si A Y B son eventos de un espacio muestral, entonces:
a EI evento A n B ocurre si se presentan ambos.
b A U B ocurre si se presenta A, 0 B, 0 ambos.
c EI evento AC ocurre si no se presenta A.
An B AUB
a b
Si la interseccion de A y B esta vada, se trata de eventos mutuamenle
exc/u),elltes, pues no pueden presentarse almismo tiempo.
C Santiliana 2. Eventos
Fi gura 3
DiDgramas que representan
105 posibles combinociones
de dos eventos.
A
c
145 _
_ 146
Por ejemplo, si se elige a un alumno al azar para representar al gru-
po en un concurso, no puede ser simultaneamente hombre y mujer;
entonces los eventos {el alumno elegido es mujer} y {el alumna elegi-
do es hombre} son mutuamente excluyentes.
Ejemplos
1 0
Una encuesta proporcion6 los datos siguientes de un grupo
de estudiantes en una universidad:
SeXQ Fuma No fuma
Femenino 25 35
Masculino 40 15
Si se elige al azar a un estudiante, determinemos cuales de los
eventos sigui entes son l11utuamente excluyentes:
a Femenino y Juma. No son mutuamente excluyentes, pues hal' 25
estudiantes que tienen ambas caracteristicas.
b Femenino y masculino. Son mutuamente excluyentes.
C Masculino y no Juma. No 10 son, pues hal' 15 estudiantes con
esas dos caracteristicas.
d FUina y 110 Juma. Son mutua mente excluyentes.
11
Consideremos el experimento de extraer una carta de una
baraja inglesa (Ia cual, como quiza sepas, consta de 52 cartas,
13 de corazones, 13 de diamantes, 13 de treboles y 13 de espadas).
Detenninemos el numero de elementos de los eventos cambi-
nados siguientes:
a La carta es de corazones 0 es un cinco. Hal' 13 cartas de carazo-
nes y hal' cuatro cincos. GTe parece bien sumar 13 y 47
No, porque estas contando dos veces el cinco de corazones;
si restas los elementos que estas cantando doble, entonces Sl
tienes el numero de elementos que se hallan en el even to:
13 + 4 - 1 = 16,
es decir, el evento la carta extra fda es de corazones 0 un cinco
tiene 16 elementos.
b La carta es un rey y es de diamantes. S610 hay una carta que cum-
pie las dos condiciones; por tanto, este evento s610 tiene un ele-
mento.
UN l OAD 3 • PROBABILIDAD Cl Santillana
e La carta no es un as. Hay cuatro ases en la baraja, asi que pode-
mos restarlos del numero total de cartas y entonces obtener el
resultado:
52 - 4 = 48.
Este evento consta de 48 elementos.
d La carta es de treboles 0 de espadas. Hay 13 cartas de tn!boles y
13 de espadas; luego, hay 26 maneras de elegir una de treboles 0
una de espadas. <Por que en este caso no tuviste que restar
nada?
Para praetiear
CD 5e hace girar una ruleta circular dividida en ocho partes iguales,
numeradas de 1 a 8. Describe los eventos siguientes y detennina el
numero de elementos que contienen:
a La ruleta se detiene en un numero par.
b La ruleta se detiene en un 5 0 en un numero par.
e La rul eta no se detiene en 4 ni en 2.
2 5e extrae una carta de una baraja inglesa al azar. <Cu<intos elemen-
tos tienen los eventos siguientes?
a La carta es un corazon 0 es un 8.
b La carta no es una espada y es un 6.
c La carta es un rey 0 una reina.
(}) Detennina si los eventos que siguen son mutua mente excluyentes:
a 5e elige un numero al azar entre 1 y 20: A = {el numero es im-
par} y B = {el nUlll ero es menor que 10}.
b En una casi lla electoral votaron 900 personas; 325 de eli as 10 hi -
cieron por el partido A, 375 por el B y el res to por C. 5i se elige un
voto al azar, sea el evento A = {voto para A}, B = {voto para B}
y C = {voto no para A }.
CSantillana 2. Eventos
147 _
..
••• •
_ _ • • ____       ..... e"'-lp ...... t{Lde probabilidad

_ 148

• •
-



Consideremos el caso de un volado; como ya 10 indicamos, es igual-
mente posible que ocmra el resultado aguila a el resultado sol. Par
tanto, Ie asignamos a cada uno la probabilidad 1.
Ahara, si se lanza un dado de cuba hay seis posibles resultados y
todos tienen la misma oportunidad de presentarse, asf que la probabi-
lid ad de cada uno es i.
Asl, en un experimento aleatorio can espacio muestralfil7ito y eqlli-
probable se asigna una probabilidad a cada resultado posible. La pro-
babilidad del resultado i es:
. 1
P(t} = 17(0)'
ya que existen 11(0) resultados y todos son igualmente probables.
Ejemp/os
Calculemos la probabilidad de los eventos elementales siguientes.
12
Si se extrae una carta de la baraja inglesa, que sea un 5 de
corazones. (Recuerda: esa baraja consta de 52 cartas.)
En este caso tenemos que la cardinalidad del conjunto es 52, de
modo que 11(52). Al sustituir valores en la formula para calcular la
probabilidad de este resultado queda:
P{i) =
1
P(5 de corazones) = 52.
Par tanto, la probabilidad de que la carta extra fda sea un 5 de cora-
zones es de .
13
Si el profesor elige al azar a un alumna de tu grupo, que
consta de 25 personas, la probabilidad de que tu seas el ele-
gido es:
1
P(tu seas elegido) = 25'
es decir, en este caso la probabilidad es de 2
1
5 •
14
Si se tiran dos dados, uno blanco y uno raja, calculemos la
probabilidad de que el blanco caiga en 4 y el raja en 5. EI
espacio muestral es el siguiente:
UNlOAD 3 • PROBABIUDAD Santillana
6, 6 6, 5 6, 4 6, 3 6, 2 6, 1
5, 6 5, 5 5, 4 5, 3 5, 2 5, 1
4, 6 4,
5 4, 4 4, 3 4, 2 4, 1
3, 6 3, 5 3, 4 3, 3 3, 2 3, 1
2, 6 2, 5 2, 4 2, 3 2, 2 2, 1
1, 6 1,
5 1, 4 1, 3 1, 2 1, 1
Contiene 36 posibles resultados y solo uno de ell os corresponde a
4 en el dado blanco y 5 en el rojo, entonces:
1
P(el resultado es (4, 5)) = 36'
de modo que la probabilidad de que caiga ese resultado es de ;6'
En general, la probabilidad de un evento A, que se denota PtA), se
obtiene como el n[lInero de resultados en A dividido entre el numero
de resultados en 0, como se indica a continuacion.
Probabilidad de un evento
La definicion de Laplace para la probabilidad de un evento A es:
n(A)
PtA) = n(O)'
La definicion anterior implica que la probabilidad de ° es 1, pues si se
realiza el experimento debe ocurrir alguno de los resultados posibles.
ClSantiliana 3. EI (oncepto de probabilidad
149 _
_ 150
Si un evento tiene probabilidad I, entonces es seguro que ocurra; si
tiene probabilidad 0, es imposihle que se presente.
Ejemplo
15
Consideremos un juego que consiste en tirar dos dados; se
gana si la suma de los puntos obtenidos es 7. <Cual es la pro-
babilidad de obtener la victoria
7
Sea A el evento: la suma de los puntos obtenidos es 7. Entonces:
A = {{I, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)).
Ademas, recuerda que para este experimento hay 36 resultados
posibles; por tanto, la probabilidad de ganar es de ;6 = t, es decir,
en el largo plaza ganas una de cada seis veces que se lanzan los
dados.
La probabilidad puede interpretarse tambien como la proporci6n de
tiempo en que se presenta el resultado si se repite el experimento una
gran cantidad de veces. Esta interpretaci6n se conoce como frecuencia
relativa.
Ejemplo
16
Con los datos del ejemplo anterior, <cual seria la probabili-
dad de ganar si en lugar de 7 los puntos sumaran 5?
EI even to seria:
A = {{I, 4), (2, 3), (3, 2), (4, 1));
su cardinalidad:
n{A) = 4,
y la probabilidad de ganar:
4 1
36 9'
es decir, en ellargo plaza se gana una vez de cada nueve.
UNlOAD 3 • PROBABlllDAD CI Santillana
Para practicar
CD Con base en los datos del ejemplo 15, calcula la probabilidad de
ganar para diferentes valores de la suma. <Cual es el valor mas pro-
bable>
2 Un juego de apuestas consiste en hacer girar una ruleta dividida en
seis partes iguales. Eliges un color y si la ruleta se detiene en el ga-
nas. <Cua! es la probabilidad de ganar?
CD Si se lanzan dos dados, <cual es la probabilidad de que el resultado
contenga dos numeros iguales?
4 En un equipo de futbol de 11 jugadores hay tres que son tus amigos.
Si en la practica se forman dos grupos al azar, uno de cinco y otro
de seis jugadores, <cmil es la probabilidad de que en tu grupo este al
menos uno de tus amigos?
Propiedades de la probabilidad
Piensa en la probabilidad como una medida de cuan posible es que
ocurra un resultado de un experimento aleatorio. Probabilidad 1 sig-
nifica que es seguro y probabilidad 0 que es imposible. Entonces, <que
sentido tend ria una probabilidad negativa?
Propiedades de La probabilidad
Si consideramos que 0. = {i : 1 :5 i :5 n(D.)}. las propiedades carac-
teristicas de la probabilidad son:
1 P(i) 2: 0, la probabilidad es una cantidad no negativa.
2 P(I) + P(2) + ... + P(n(D.)) = 1, es decir, es seguro que ocurra
alguno de los resultados que pertenecen al espacio muestral.
Ejemp/o
17
AI extraer una carta de la baraja inglesa, <cua! es la probabi-
lidad de que sea de espadas 0 sea un seis?
Como vimos en el ejemplo lla, (13 + 4 - 1) es el numero de ele-
mentos en el even to, ya que hay 13 espadas, 4 seises y 1 seis de es-
padas; ademas, hay 52 cartas en total; luego, la probabilidad que
buscamos es:
13+4-1 13 4 1
P(espada 0 seis) = 52 = 52 + 52 - 52'
C Santillana 3. EI conceplo de probabi lidad
151 _
_ 152
es decir, la probabilidad de que la carta extrafda de la baraja sea de
d
. d'"
espa as 0 sea un sels es e 52 = E.
Ademas, observa que:
13
• P(espadas) = 52'
• P(seis) = 5 ~  
. 1
• P(espadas y sels) = 52 .
Par tanto, se cum pie que:
P(espadas 0 seis) = P(espadas) + P(seis) - P(espadas y seis).
Con base en 10 anteriormente expuesto se desprende el teorema si-
guiente.
TEOREMA 1. Si A Y B son eventos cuya intersecci6n es no vacia, en-
lances:
PtA U B) ~ PtA) + P(B) - PtA n B).
Ejemplo
18
Con base en la informaci6n del ejemplo anterior, leUa! es Ja
probabilidad de que la carta sea de treboles a de espadas?
Se tienen 13 treboles y 13 espadas; ademas, no hay cartas que ten-
gao las dos caracteristicas a1 mismo tiempo, par 10 que se trata de
eventos mutuarnente excluyentes. Par ende, la probabilidad que
buscamos es:
13 13 26 13
P(treboles 0 espadas) = 52 + 52 = 52 = 26'
es decir,la probabilidad de que la carta sea de treboles a de espadas
d
"
es e
26
,
Por otra parte, puedes notar que:
13
• P(treboles) = 52'
13
• P(espadas) = 52'
• P(treboles y espadas) = 0 (pues son eventos mutuamente exclu-
yentes).
UNlOAD 3 • PROBABILIDAO .........
As!, se cumple:
P(trcboles 0 espadas) = P(tn!boles) + P(espadas).
En el caso de eventos mutua mente excluyentes se cumple el teorema
presentado a continuaci6n.
TEOREMA 2. REGLA DE LA SUMA. Si A Y B son eventos
te excluyentes, entonces:
P(A U 8) P(A) + P(8).
La probabilidad del eventoAC puede obtenerse a partir de la de A. Por
ejemplo, si el profesor elige a un alumno de tu grupo para que reseile
el tema expuesto en la clase anterior, ;.cual es la probabilidad de que no
seas tu.?
Si n es el numero de estudiantes que hay en tu grupo, entonees se
tiene:
P(tu seas el elegido) =..!.,
n
P(no seas elegido) = P(eualquier otro alumno sea elegido)
n - 1 1
 
n n
es decir,
P(no seas elegido) = 1 - P(tu seas elegido).
Reflexiona en los eventosA y AC. t50n mutuamente excluyentes? Sf 10
son; entonees, por e! teorema 2:
P(A U A') P(A) + P(AC).
Ademas, sabemos que la uni6n de esos eventos es todD el espacio
muestral, por 10 que P(A U AC) = 1, asf que:
P(A) + P(A') 1,
de donde se obtiene el teorema 3.
TEOREMA 3. Para todo evento A, P(AC) = 1 - P(A).
3. El concepto de probabilidad
153 _
_ 154
Par las leyes de De Morgan se obtienen las probabilidades de a) el
complemento de la union, y b) el complemento de la interseccion de
dos eventos como sigue:
a PtA U B) = 1 - P(N n B e) ,
b PtA n B) = 1 - P(N U B e).
Leyes de A. de Morgan:
• (A U B)' = A' n B'. • (A n B)' = A' U B'.
Para practicar
CD En un grupo de alumnos 15% estudia frances, 30% ingles y 10% cur-
sa ambos idiomas.
a < Cmil es la probabilidad de que un alumna elegido al azar no es-
tudie ingles?
b <Cuai es la probabilidad de que estudie ingles a frances?
c <Los eventos estudiar ingles y estudiar frances son mutua mente
excluyentes? <Par que?
2 Si se tiran dos monedas al aire, <cual es la probabilidad de no obte-
ner soles?
Q) En un grupo de 500 votantes, 350 votaron par el partido A, 100 par
el partido B y 50 par el C.
a <Cual es la probabilidad de que un voto elegido al azar no sea deA?
b lLos eventos votar pOl' A Y votar por B son Illutuamente exclu-
yentes? <Cual es la probabilidad de que un voto elegido al azar
sea de A a de B?
c <Los eventos votar par B y no votar par A son mutuamente exclu-
yentes? <Que probabilidad hay de que un voto sea de B a no de A?
U NlOAD 3 • PROBABILIDAD eSantillana
Probabilidad condicional
Imagina que dos jugadores tiran tres volados consecutivos; el primer
jugador gana si cae sol y el segundo si cae aguila; triunfa el jugador
que gana al menos dos de tres volados. <Cual es la probabilidad de
veneer?
Si representamos con G un volado ganado y con P uno perdido,
entonces el espacio muestral es el conjunto:
{GGG, GGP, GPG, GPP, PGG, PGP, PPG, PPP).
EI evento A, ganar el juego, ocurre en los casas:
{GGG, GGP, GPG, PGG),
par 10 que P(A)= ~   t.
Imagina que ya perdiste el primer volado, de modo que te quedan
dos par jugaL <Cual es la probabilidad de que triunfes'
Al comenzar el juego el espacio muestral contenia ocho resultados
posibles, pero ahara que sabes el resultado del primer volado, el espa-
cia muestral se reduce a:
{PGG, PGP, PPG, PPP).
La probabilidad de ganar es ahora de t.
<Par que son diferentes las probabilidades al principio del juego y
despues de un volado' Porque al empezar no cuentas can informaci6n
adicional, mientras que despues del primer volado no puedes ignorar
el hecho de haber perdido uno de los tres de que consta el juego.
Por otra parte, si hubieras ganado el primer volado, tu probabilidad
de salir victorioso habria aumentado a 1.
Recuerda que la probabilidad mide las posibilidades de que ocurra
un even to. Si la probabilidad de un even to A se ve afectada cuando
ocurre otro evento B, la ll amamos probabilidad condicional, y se de-
nota P(A I B), que se lee "Ia probabilidad del evento A cuando ya ocu-
rri6 el evento B':
<C6mo podemos caleular una probabilidad condicional'
Si sabemos que ocurri6 el evento B, entonces el espacio muestral se
reduce como en el ejemplo del juego de volados, y el nuevo espacio
tiene I1(B) elementos. Ademas, los casas donde se presenta A y tam-
bien B son n(A n B), por 10 que la probabilidad que buscamos es:
C$antillana
I1(A n B)
I1(B)
3. EI (oncepto de probabilidad
155 _
_ 156
La siguiente es otca forma de expresarlo.
Probabilidad condicional
La probabilidad condicional es la que tiene un evento despues de
que ocurri6 otro. La probabilidad condicianal de A dado B es:
Ejemplo
   
P(B) .
19
En una ciudad se realiz6 una encuesta sabre el usa de los me-
dias de transporte, y 55% de los habitantes respondi6 que se
desplaza en taxi, 30% respondi6 que tiene autam6vil particular y
20% respandi6 que se transporta en ambos, taxi 0 auto propia.
a Si se sabe que una persona se transporta en taxi, lcual es la
probabilidad de que tenga auto particular?
b Si se sabe que tiene auto particular, lcual es la probabilidad de
que no use taxi?
C tCmil es la probabilidad de que una persona de esa ciudad no se
transporte en taxi ni en auto particular?
Respondamos a estas interrogantes.
a P(auto particular I taxi}
_ P(auto particular y taxi)
- P(taxi)
20/100 20 4
=
55/100 55 11 .
La probabHidad de que una persona que se transporta en taxi ten-
ga ademas auto particular es de \4\ .
b P(no taxi I auto particular)
_ P(no taxi y auto particular)
- P(auta particular)
30/100-20/100 10 1
=
30/100 30 3·
UN l OAD 3 • PROBA81L1DAD o Santillana
La probabilidad de que una persona con auto particular no use taxi
esdd·
c P(ninguno)
= P(no auto y no taxi)
= P(no (auto 0 taxi))
= 1 - P(auto 0 taxi)
La probabilidad de que una persona de esa ci udad no se trans porte
en taxi ni en auto particular es de ;0'
Tambien puedes usar la f6rmula de probabilidad condi cional para en-
contrar la probabilidad de la intersecci6n de los eventos.
En el ejemplo anterior, si quieres establ ecer la probabilidad de que
un habitante de la ci udad use autom6vil particular pero no taxi, des-
pejas y usas el inciso c), de modo que queda:
1 3 1
P(no taxi yauto) = - . - = -
3 10 10 .
En general:
P(A n B) = P(A I B) P(B).
TEOREMA DE BAYES
EI juego de la catafixia consiste en elegir una cabi na de tres que se pre-
sentan cerradas para ocultar su contenido (figura 4). S610 una de eli as
contiene premio. Una vez que eliges, se abre una de las cabinas restan-
tes para mostrar que no contiene premia, y entonces tienes la opci6n
de cambiar la que escogiste. < Te conviene cambiar de cabina 0 quedar-
te con la primera elegida?
<Que es mas probable: ganar si te quedas con tu primera elecci6n 0
ganar si cambias? EI numero 1 indica que la cabina tiene premio y 0
C Santillana
3. EI (oncepto de probabilidad
N
Figura 4
Arbol de posibifidades: 10 cobina
elegida puede ser PaN, etcetera.
157 _
_ 158
que no. Si llamamos a tu primera elecci6n cabina elegida, a la cabina
que se abre cabil1a abierta ya la que resta cabilla restal1te tenemos:
P[ganar si call1bias]
= P[restante = 1]
= P [restante = 1 yelegida = 0] +
P [restante = 1 yelegida = 1]
= P[restante = 1 I elegida = 0] P [elegida = 0] +
P[restante = 1 I elegida = 1] P[elegida = 1]
P [ganar si te quedas con tu elecci6n] = P [elegida = 1] = t.
jEs dos veces mas probable ganar si call1bias'
£jemplo
20
En cierto pais, 12% de los habitantes sufren cierta enferl11e-
dad. Se dispone de un procedimiento para diagnosticarla,
pero no es cOl11pletal11ente confiable, ya que da positivo en 90%
de los casos que la padecen, pero tal11bien en 5% de los casos que
no la sufren. lCual es la probabilidad de que una persona cuya
prueba haya resultado positiva este sana? Primero ordenamos la
informacion.
La probabilidad de padecer la enferl11edad es:
12 3
P(padece la enferl11edad) = 100 = 25 .
La de tener prueba positiva certera:
..   9
P(pOSltlVO I padece la enfermedad) = 100 = 10·
UN l OAD 3 • PROBABILIDAD ©Santillana
Y la de tener prueba posit iva equivocada:
P(positivo 1 no padece la enfermedad) = 1 ~ 0 = 2
1
0'
Entonces:
P(padece la enfermedad y dio positivo) = :0 . ~ 5 = 22;0'
1 22 11
P(no padece la enfennedad y dio positivo) = 20 . 25 250 '
27 11 38
P(positivo) = 250 + 250 = 250'
P(no padece la enfermedad 1 positivo) =
11 / 250 11
38 / 250 = 38'
Por tanto, la probabilidad de que una persona con resultado posi-
tivo no padezca realmente la enfermedad es de i ~  
EI procedimiento anteri or se resume en un teorema demostrado pOI' el
matematico ingles Thomas Bayes.
TEOREMA 4 . TEOREMA DE BAYES.
_ PtA) P(B 1 A)
PtA 1 B) - PtA) P(B 1 A) + PW) P(B 1 AC) '
Este teorema puede generali zarse para los eventos A, , ... , A" si se cum-
pIe que Ai' Ai son eventos disjuntos (es decir, Ai n Ai = 0) para toda
i " j Y su union es .0.; el resultado es el siguiente:
P( . 1 B) = P(A
j
) P(B 1 A j)
A, PtA, ) P(B 1 A,) + P(A
2
) P(B 1 A
2
) + ... + PtA,,) P(B 1 A,,) .
Ejemplo
21
Don Pepe tiene una tienda, donde trabajan tres empl eadas,
Andrea. Bianca y Consuelo. Andrea realiza 50% de los co-
bros. Bianca 30% y Consuelo 20%. Cuando cobra Andrea hay 1 % de
Cl Santiliana 3. EI concepto de probabilidad
159 _
......
'"
........
20%
_ 160
......
prababilidad de que 10 haga mal; cuando 10 hace Bianca, hay 2% de
que cobre mal, y en el caso de Consuelo hay 3% de prababilidad de
que se equivoque.
Un ciiente se quej6 con don Pepe porque Ie cobraran maLtCual
es la prababilidad de que Andrea haya hecho el mal cobra?
Para averiguario consideremos los eventos:
I M = {se hizo un mal cobra},
I A = {el cobra fue hecho por Andrea},
I B = {el cobra fue hecho por Bianca},
I C = {el cobra fue hecho por Consuelo }.
De los eventos anteriores podemos obtener las probabilidades si-
guientes:
PtA) = 0.5, P{B) = 0.3, P{C) = 0.2,
P{M I A) = 0.01, P{M I B) = 0.02, P{M I C) = 0.03,
Con base en el teorema de Bayes, la prababilidad de que Andrea
haya hecho el mal cobra es:
_ PtA) P{M I A)
PtA 1M) - PtA) P{M I A) + P{B) P{M I B) + P{C) P{M I C) .
AI sustituir val ores queda:
(0.5){0.01)
PtA I M) = (O.5)(O.O1) + (0.3)(O.02) + (0.2)(O.03)
0.005
0.005 + 0.006 + 0.006 = 0.2941.
Por tanto, la probabilidad de que Andrea haya hecho mal el cobro
(y sabemos que hubo un cobra equivocado) es de 0.2941.
Para practicar
CD En una peque)'\a ciudad, 20% de los habitantes son jubilados y otro
20% 20% son estudiantes. La musica ciasica Ie gusta a 75% de los jubila-
dos, a 50% de los estudiantes y a 20% del resto de la poblaci6n. Si se
elige una persona al azar, tcual es la prababilidad de que sea jubilada
si se sa be que Ie gusta la musica ciasica?
UNlOAD 3 • PROBABllIDAD 11.0- Santillana
2 En un juego se lanza un dado de cuba tres veces, par turnos, y se
suman los puntas obtenidos. Gana el jugador que obtenga una suma
mayor. Si despues del segundo tiro lIevas 6 puntas y tu contrincante
lIeva 8, <cm\! es tu prababilidad de triunfo?
CD Se elige una carta al azar de una baraja inglesa )' se obtiene un 3 de
treboles. Si se escoge una segunda carta, <cual es la probabilidad de
que sea de diamantes?
Independenci a
Imagina el juego de tirar dos dados de cuba, uno blanco y otro raja.
<Crees que el resultado del dado blanca afecta la prababilidad de que
ocuna un resultado en el dado raja?
Si primero tiras el dado blanco y observas que salia un 1, <cual es la
prababilidad de que al tirar el dado raja tam bien caiga en I?
Como ya conoces el resultado del dado blanco, el espacio muestral
se reduce a:
{(I, 1), {l, 2), (1, 3), ( 1, 4), (1, 5), (I, 6)) ;
par tanto,
. 1
P(raJo = 1 I blanco = 1) = 6'
Ademas, si no se canace el resultado del dado blanco, la probabilidad
de {raja = 1) puede obtenerse a partir del espacio llluestral:
6, 6 6, 5 6, 4 6, 3 6, 2 6, 1
5, 6 5, 5 5, 4 5, 3 5, 2 5, 1
4, 6 4, 5 4, 4 4, 3 4, 2 4, 1
3, 6 3, 5 3, 4 3, 3 3, 2 3, 1
2, 6 2, 5 2, 4 2, 3 2, 2 2, 1
1, 6 1, 5 1, 4 1, 3 1, 2 1, 1
6 1
P(rajo = 1) = 36 = 6'
Si A es el evento {raja = 1) Y B es {blanco = I}, entonces tenemos que
P(A I B) = P(A). Es decir, el resultado de uno de los dados no afecta la
probabilidad de que ocuna un resultado en el otro. Los eventos son
independientes.
3. El concepto de probabilidad
161 _
....
••
, "
,.,
,
_ 162
--
c
Eventos independientes
Dos eventos A y B son independientes si el resultado de uno de eUos
no afecta 1a probabilidad del otra .
La anterior significa que la probabilidad condicional de A dado B es
igual a la probabilidad de A y viceversa:
PtA I B) ~ PtA) y P(B I A) ~ P(B).
Entonees, cuando los eventos son independientes se cumple la regia
del producto.
TEOREMA 5. REGLA DEL PRODUCTO. SiAyBsonindependientes,
PtA n B) = PtA} P(B).
Considera ahara el evento C = {suma de los puntas es 3}. 5i tiras el
primer dado y obtienes un 1, ~ c r e e s que esto afecte la probabilidad del
evento C?
Primera, la probabilidad de C es ic, = I ~   Ahara puedes calcular 1a
probabilidad condicional:
PiC I B) ~ PiC n B) .
P(B) ,
como P(C n B) = ic, y P(B) = t se tiene:
5i observas con atenci6n, notaras que P(C) *- P(C I E), por 10 que los
eventos no son independientes.
£jemp/o
22
Con todo 10 que hemos aprendido ya podemos encarar el
reto del caballero de Mere, aquel que origin6 la teorfa de
probabilidades y que mencionamos al principio de esta unidad.
i.Que es mas probable: obtener al menos un 6 en cuatro tiros de
un dado de cubo U obtener al menos un doble 6 en 24 tiros de un
par de dados?
E1 caballero pens6 en el numero promedio de exitos y era el
mismo en ambos casos:
UNlOAD 3 • PROSABILIDAD
I Un 6 en cuatro tiros:
• Un doble 6 en 24 tiros:
1 2
4· - =-
6 3
1
24·
36
2
3
Sin embargo. observo que perdia mas seguido can la segunda
apuesta. LPor que Debe ser par la probabilidacl ...
P[al menos un 6 en cuat ro tiros] = 1 - P[ningun 6 en cuatro tiros].
Como los tiros son independientes l' la probabilidad de no obtener
un 6 en un tiro es   entonces:
P[ningun 6 en cuatro tiros] = (%)(%)(%)(%) = (%f
Finalmente,
Plal menos un 6 en cuatro tiros] = 1 - (%r = 0.5177.
Por otra parte. la probabilidad de obtener al menos un doble seis
en 24 tiros es:
(
35)2.
1 - P[ning(\I1 doble 6 en 24 tiros] = 1 - 36 = 0.4914.
Par tanto. es mas probable obtener un 6 en cuatro tiros que un 6 en
24 tiros.
,
Para practicar
CD En una estetica. 10% de los clientes son hombres), de ellos 90%
acude para cortarse el cabello. Si se elige a un cliente al azar. Lson
independientes los eventos {el cliente pide corte de cabello) l' {el
cliente es mujer)?
2 En una bolsa de caramelos hal' cinco de fresa. tres de limon), dos
de naranja. LCual es la probabilidad de elegir uno de fresa? Si se
saca uno de fresa. Lcmil es la probabilidad de que al elegir un se-
gundo tambien sea de fresa? LSe trata de eventos independientes?
LPor que?
o Si el evento A tiene P [A] = -l:. el B tiene P [BI = t l' son indepen-
dientes. Lcual es la probabilidad de A U B?
" 3. El concepto de probabilidad
163 _
Tabl a 1
Resultado X
M o
AS 1
SA 1
55 2
_ 164
Imagina que apuestas $5.00 en un volado; si cae aguila, ganas $5.00 Y
si cae sol pierdes $5.00. Tu ganancia, que en caso de ser negativa re-
presenta una perdida, depende del resultado del volado. Como el vo-
lado es un experimento aleatorio (recuerda: 10 es porque es imposible
predecir su resultado), entonces la ganancia es una variable aleataria.
Si la denotamos por X, tenemos que X = 5 es una ganancia de 5 Y
X = - 5 es una ganancia de - 5 0 una perdida de 5, Y entonces la pro-
babilidad de cada uno de estos valores es:
1
P[X=51= - Y
2
Variable aleatoria
1
P[X=-51=2
Una variable aleatoria es un valor numerico asociado a un experi-
mento aleatorio. Suele representarse con letras maYllsculas como
XoY.
Es importante selialar que un valor en particular de X se represen-
ta con x.
Como todo mundo sa be, si lanzas dos monedas al aire Y cuentas el nll-
mero de soles que caen, puedes obtener 0, 1 0 2, como se ve en la tabla 1,
donde A es aguila y 5, sol. Ahora asignamos una probabilidad a cada va-
lor de X. Como el resultado 0 ocurre en uno de los cuatro posibles, tiene
una probabilidad de ocurrir de t. EI resultado 1 ocurre en dos de los cua-
tro posibles resultados del experimento, de ahi que su probabilidad sea
de t = t· Finalmente, el resultado 2 ocurre en uno de los cuatro posibles
resultados y entonces su probabilidad es de t.
A continuaci6n escribimos una tabla que contiene en la primera
columna los valores posibles de la va riable aleatoria X, y en la segunda
la probabilidad asignada a cada uno de ellos:
o
1
2
-'-
4
I
.,
I
..
Al conjunto de valores y sus respectivas probabilidades se Ie conoce
como la distribucioll de probabilidad de X. Es importante selialar que
PIX = xl suele denotarsep(x).
U N l OAD 3 • PROBABlllDAD
Ejemplo
2 3
Encontremos la distribucion de probabili dad de la variable
aleatoria Y, la suma de los puntos que se obtienen al tirar
dos dados de cubo.
Primero recordemos que el espacio muestral del experimento
aleatorio que consiste en ti rar dos dados es el siguiente:
6, 6 6, 5 6, 4 6, 3 6, 2 6, 1
5, 6 5, 5 5, 4 5, 3 5, 2 5, 1
4, 6 4, 5 4, 4 4, 3 4, 2 4, 1
3, 6 3, 5 3, 4 3, 3 3, 2 3, 1
2, 6 2, 5 2, 4 2, 3 2, 2 2, 1
1, 6 1, 5 1, 4 1, 3 1, 2 1, 1
EI espacio muestral contiene 36 posibles resultados. Ahora suma-
mos los puntos en cada uno de ellos:
Resultado 6, 6 6, 5 6, 4 6, 3 6, 2 6, 1
Suma 12 11 10 9 a 7
Resultado 5, 6 5, 5 5, 4 5, 3 5, 2 5, 1
Suma 11 10 9 a 7 6
Resultado 4, 6 4, 5 4,4 4, 3 4, 2 4, 1
Suma 10 9 a 7 6 5
Resultado 3, 6 3, 5 3, 4 3, 3 3, 2 3, 1
Suma 9 a 7 6 5 4
Resultado 2, 6 2, 5 2, 4 2, 3 2, 2 2, 1
Suma a 7 6 5 4 3
Resultado 1, 6 1, 5 1, 4 1, 3 1, 2 1, 1
Suma 7 6 5 4 3 2
Es facil ver que los valores posibles son: {2, 3, 4, 5, 6, 7, 8, 9, 10, 11,
12 }. Para calcular la probabilidad de que OCUlTa uno de ellos debe-
Santillana 4. Variables aleatorias
165 _
Figura 5
Histograma de la distribuci6n del
f){Jmero de veces que puede coer
so/ en dos va/ados. En el eje x
aporecen /05 va/ores posibles de 10
variable Ii la altura de coda borro
es iglla/ a 10 probobilidad de que
anura cada valor.
_ 166
mas contar en cuantos de los 36 posibles resultados ocurre dicho
yalor, )' as! obtenemos:
Y PI Y = yi = p(y)
2
1
36
3
2
36
4
3
36
5
4
36
6
5
36
7
6
36
8
5
36
9
4
36
10
3
36
11
2
36
12
1
36
Recuerda que y son los posibles valores de la variable aleatoria Y.
La distribucion de probabilidad puede representarse graficamente par
media de un histogralila, en el cual para cada valor de x se dibuja una
barra can altura igual a p(x), de forma que resulte facil visualizarla.
EI histograma del numero de sales que pueden salir en dos volados
es como el de la figura 5. En cambia, en la figura 6 se muestra el histo-
grama de la suma de los puntas al tirar dos dados.
Si una var iable aleataria X puede tamar 11 valores: Xl' x
2
, .. , XII'
entances:
p(x
r
) + p(x,) + ... + p(X,,) = 1.
0.5
0.25
o
o 1 2
UNIDAD 3 • PROBABlllDAD
1/6
5/36
-
1/ 9
1/ 12
1/ 18
-
1/ 36
n n
o
, ,
2 3 4 5 6 7 8 9 10 11 12
£jemp/o
24
Se pregunta a los miembros de una familia de cinco perso-
nas si les gusta el pastel de chocolate a no y resulta que a tres
de elias Sl les agrada. Si consideramos el experimento de elegir al
azar a uno de elias, entonces podemos definir una variable aleato-
ria que toma el valor 1 si a la persona elegida Ie gusta el pastel yO
si no Ie gusta.
Detenninemos ahora la distribucion de probabilidad de esta va-
riable. Debemos calcular la probabilidad de que tome el valor 1 y la
probabilidad de que tome el valor 0, ya que estos dos son los valo-
res posibles. La probabilidad de que Sl Ie guste se obtiene como f;
por tanto, la probabilidad de que no Ie guste es t. En resumen, la
distribucion de probabilidad se presenta en la tabla siguiente; en la
figura 7 se muestra el histograma respectivo.
0.7
0.6
0.5
0.4
0.3
0. 2
0.1
o
-
Santillana
x p(x)
o
1
o
2
-,
3
-,
I
4. Variables aleatorias
Figura 6
Histograma de 10 distribuci6n de 10
sumo de puntos de dos dodos.
Figura 7
Histagrama de 10 distribuci6n de
ofici6n por e{ pastel de c11Ocolate
en una familia de cinco miembros.
167 _
_ 168
Las variables aleatorias se clasifican en discretas )' continuas.
Variables aleatorias discretas y continuas
Las variables aleatorias discretas san aquellas que sola pueden ta-
mar valares en un conjunta de puntas c1aramente separadas a aisla-
das, que generalmente resultan de un cantea.
A su vez, las variables aleatorias continuas san las que pueden
tomar valores en un intervalo de los numeros reales, es decir, en un
conjunta infinita de valares que suelen resultar de una medicion;
par ejempla, estatura, pesa, tiempa que dura un procesa, tiempa
que tarda un campetidar en aicanzar la meta.
Tal vez esta al'ude a comprender mejar las variables aleatarias discre-
tas )' continuas: si se eligp un alum no al azar y se Ie pregunta cuantos
aflOS tiene, se trata de una variable cli screta. En cambio, si se Ie pregun-
ta cuanto mide, estamos frente a una variable continua.
Definir la distribucion de una variable aleataria cantinua requiere
de canacimientas de dicula, pues recardemas que el conjunta de va-
lares pasibles de la variable es infinita. Ella reba sa el proposita de la
abra, par la que na la trataremas aqui.
,
Para practiear
CD Se lanza un dada de cuba)' la variable aleataria es 1 si cae 1, 2 a 3;
es 2 si cae 4 a 5, l' es 3 si cae 6. lCual es su distribucion de prababi-
lidad? Traza el histagrama de probabilidades carrespandiente.
2 En un grupa de persanas hal' 15 fumadares l' 30 na fumadares. Si
se elige a una persana al azar l' resulta fumadara la variable vale 1 l'
si na, vale O. Detennina la distribucion de probabilidad l' traza el
histograma correspondiente.
Q) Una persana ve un programa de television cuatro de cada 10 dias.
Si se elige un dia al azarl' se registra si la via, define la variable alea-
taria l' su distribucion de probabilidad.
Valor esperado
En una apuesta, ganas 5100.00 can prababilidad t l' pierdes $100.00
can probabilidad t . Ahara imagina que haces la apuesta repetidamen-
te, tcuanto esperarias ganar 0 percler?
UNlOAD 3 I PROBABILIDAD r., 1
Si piensas en la probabilidad como la proporci6n de veces que ocune
el evento, entonces podrias suponer que en ellargo plaza ganas la mi-
tad de las veces, es decir, tu ganancia vale 100 en una de cada dos
apuestas, y pierdes la otra mitad, es decir, tu ganancia vale -100 en una
de cada dos apuestas. Si repites la apuesta una gran cant idad de veces,
10 que esperarias ganar es:
En otras palabras, en ellargo plaza quedarias a mano. Se trata de una
apuesta justa: si tu contrincante quisiera intercambiar ellugar contigo,
10 aceptarias.
Imagina una apuesta en la que ganas $100.00 con probabilidad t y
pierdes $100.00 con probabilidad t. <Crees que se trate de una apuesta
justa? Si la haces muchas veces, i.cuanto esperarias ganar? Calculemoslo:
2 1 100
100':1 + (- 100)':1 = 3 = 33.33.
Como tel tienes mayor oportunidad de ganar, no intercambiarias el
lugar con tu contrincante, pero es muy probable que no consigas a al-
guien que quiera apostar en tales condiciones, y mucho menos repetir
la apuesta una gran cantidad de veces.
EI valor esperada, tambien conocido como esperanza de una va ri a-
ble aleatoria es un promedia que se obtiene ponderando cada valor de
esta par su probabilidad respectiva.
Valor esperada
EI valor esperada, 0 esperanza de X es una variable aleatoria discreta
que puede tomar los valores {x" .. . , xnl. y se define como:
n
E[X] = x1P(x
1
) + X
2
P(x
2
) + ... + xnp(x
n
) = Lx;P(x;l.
;=1
EI termino valor esperada se debe a que se interpreta como el valor a
que se aproxima el promedio de los valores de la variable aleatoria si el
experimento se repite gran cantidad de veces.
S; ntillana
4. Variables aleatorias
169 _
_ 170
Ejemplo
2 S
Un profesar ha dada un cursa de prababilidad a 500 alumnas
y ha registrada las califi cacianes abtenidas coma se indica en
la tabla 2. <emil es la calificaci6n pramedia de sus est udiantes'
Tabla 2 Registro de calificaciones de 500 alumnos
Calificacion Numero de alumnos
5 80
6 70
7 110
8 130
9 70
10 40
Primera se requiere calcular la probabilidad de abtener cada califi -
caci6n y luega se pandera:
Calificaci6n Probabilidad
,
5
80
500
6
70
500
7
110
500
8
130
500
9
70
500
10
40
500
Sea Y la califi caci6n de un alumna elegida al azar; par tanta:
E[Y] = 5· + 6· 2!L + 7 ·l.!!l + 8· -"" + 9· 2!L + 10· -'!!L = 7 32
500 500 500 500 500 500·
La calificaci6n pramedia es 7.32.
UNlOAD 3 • PROBABILIDAD ;antill<..na
Varianza y desviacion estandar
La I'arianza es una medida de dispersion que se usa para identificar
cuan alejados 0 concentrados se encuentran los valores respecto al
valor esperado.
Una varianza pequefla indica que los valores estan agrupados IllU)'
cerca del valor esperado; par tanto, podrlamos coneluir que el valor
esperado es representativQ de dichos valores, mientras que una va-
rianza grande indica que estan alejados. La varianza tambien nos sirve
para comparar como est"n distribuidos los valores de dos variables
aleatorias diferentes.
Por ejemplo, la calificacion promedio de dos estudiantes, Jorge y
Laura, es 8, par 10 que podrlamos pensar que su desempei\o academi-
co es el mismo. Sin embargo, podemos observar que no es asi. En la
tabla 3 se presentan las calificaciones obtenidas par cad a uno de elias
en cuatro curSDS.
Tabla 3 Calificaciones de dos estudiantes en cuatra asignaturas
(urso Jorge Laura
Espanol 9 9
Matematicas 8 5.5
Sociales 7.5 8.5
Naturales 7.5 9
Como la varianza mide cmin lejanos estan los datos del valor espera-    
do, primero caleulamos el valor esperado para cada alumna:
J
orge = 9 .l + 8 .l + 75 .l + 7.5 .l = (9 + 8 + 7.5 + 7.5) = 8
44·44 4 '
Laura = 9 .l + 5 5 .l + 85 .l + 9 .l = (9 + 5.5 + 8.5 + 9) = 8.
4·4·44 4
Ahara podemos caleular las diferencias entre cad a valor y el valor
esperado:
Jorge laura
9-8 = 1 9 -8= 1
8-8 = 0 5.5 -8 = - 2.5
7.5-8 =-0.5 8.5-8 = 0.5
7.5-8=-0.5 9 -8 = 1
4. Variables aleatorias
171 _
_ 172
Notemos que algunas diferencias son positi vas )' ot ras negativas; las
positivas indican que el valor es ma),or al valor esperado )' las negati-
vas que el valor es menor que el esperado. Sin embargo. en ambos
casos existe una diferencia que deseamos cuantifi car. para 10 cual ele-
vamos al cuadrado cada diferencia )' obtenemos el promedio:
1 1 1 , 1
Jorge = (9 - 8)2 . - + (8 - 8)2 . - + (75 - 8)2 . - + (75 - 8)- . -
4 4' 4' 4
(1 + 0 + 0.25 + 0.25)
= = 0.375.
4
1 , 1 1 1
Laura = (9 - 8)2 . - + (5.5 - 8)- . - + (8 5 - 8)2 . - + (9 - 8)2 . -
4 4' 4 4
(1 + 6.5 + 0.25 + I)
= 4 = 2.125.
Las calificaciones de Jorge tienen una varianza de 0.375. Por otra parte
las califi caciones de Laura tienen una varianza ma),or. de 2. 125. 10 cual
indica que las cali ficacio nes de Jorge estan mas cerca de su promedio
que las de Laura.
Ahora podemos generali zar la definicion de varianza para cualqui er
varible aleatoria discreta.
Varianza
La varianza de una variable aleatoria es igual al valor esperado del
cuadrado de las diferencias entre los valores de la variable y su espe-
ranza. Se caleula mediante la formula:
n
Var[X] = 2>; - E [X])2 p(xJ
;= 1
AI interpretar la vari anza debemos considerar que como se elevan a1
cuadrado las diferencias que ha)' entre el valor de la var iable y su valor
esperado. est a no representa la mi sma unidad que los valores de la
va riabl e. de ahi que se caleule la raiz de la varianza. 11 amada desviaciol/
estdl/dar.
En el ejemplo de las calificaciones de Jorge y Laura. no podriamos
interpretar la varianza como puntos de diferencia. pues en rea Ii dad 10
que mide son puntos al cuadrado; sin embargo. si caleulamos la raiz
cuadrada de las varianzas tendremos que en promedio la diferencia de
calificaciones de Jorge respecto a su valor esperado es 0.6123 puntos y.
en promedio. la diferencia de calificaciones de Laura con relacion a su
valor esperado es 1.4577 puntos.
UN l OAD 3 I PROBABILIDAD
La desviaci6n estandar es tambien una medida de cuan distantes 0
concentrados se encuentran los val ores respecto al valor esperado; no
obstante. a diferencia de la varianza. la desviaci6n estandar representa
la misma unidad que los valores originales.
Desviacion estandar
La desviacion estdndar es la raiz cuadrada del valor esperado de las
diferencias al cuadrado de los valores respecto a su valor esperado.
Se calcula como la raiz cuadrada de la varianza. es decir:
"
DE[X] = L(x
i
- E[X])2 p(x
i
).
i=l
EjempLo
2 6
Un inversionista considera que existen tres posibles esce-
llanos:
• En el primero. la tasa de interes es alta. el obtiene una ganancia
de $1000.00 y tiene una probabilidad de t de presentarse.
• En el segundo. la tasa de interes es media. el obtendria $500.00
pesos y tiene una probabilidad de t de ocurrir.
• En el tercero. la tasa de interes es baja. el s610 obtiene $100.00
pesos y se presenta con una probabilidad de t.
Definamos la distribuci6n de esta va riabl e aleatoria. asi como su
valor esperado. varianza y desviaci6n estandar.
tSantiUana 4. Variables aleatorias
173 _
_ 174
La distribucion de probabilidad aparece en la tabla 4.
Tabla 4 Distribucion de probabilidad
x p(x)
1000
500
100
1
"3
,
"3
1
"3
Recordemos que el valor esperado se calcula multiplicando cada
valor por su probabilidad y luego sumando los resultados; se obtie-
ne de acuerdo con la formula:
"
E[X] = 2:x,p{x;l.
j:=: 1
AI hacer las sustituciones con los valores del ejemplo queda:
1000 -3
1
+ 500 3. + 100. = (1000 + 1000 + 100) = 2100 = 700
3 3 3 3
EI valor esperado es $700.00, es decir, si este esquema de inversion
se repite, a la larga el inversionista espera obtener $700.00 en pro-
medio.
Ahora calculemos la varianza y Ia desviacion estandar. La va-
rianza se calcula con la formula:
"
\lar[X] = 2: {x, - E[X])' p{x;l.
i=l
AI sustituir valores se obtiene:
121
(I 000 -700» ."3 + (SOD -700» ."3 + (100 - 700» ."3 =
(90000 + 80000 + 360000)
3
530
3
000 = 176666.7
La varianza no representa dinero, solo es una medida de cuan leja-
nos del valor esperado se encuentran los valores hallados.
Si deseamos obtener una medida cuya unidad sea dinero, debe-
mos calcular la desviacion estandar por medio de la formula:
"
DE[X] = 2: {x, - E [X])2 p{x,) .
;=1
UNlOAD 3 • PROBABILIDAD Santil:3:n.-
Si sustituimos valores queda:
1 2 1
(1000 -700)2 . - + (500 -700)2' - + (l00 - 700)2 . - =
3 3 3
-' ( 9:...:0,-,0c:c
00
=---,- +--=8c:c
0
-=: 00::..: O=--+-,--=3::..: 60:...: 0:.: 0-,,-,- 0) =
3
J 53°3°00 = V176666.7 = 420.3173
La desviaci6n estandar, 420.3173, indica que los valores se alejan
del valor esperado, en promedio, $420.3173.
Para practicar
CD Un candado con clave secreta tiene tres rueditas numeradas de ° a
9. Olvidas la clave, pero recuerdas que empieza con un 4 y termina
con un 7. Sea X el nLI!11erO de intentos para dar con ella. Determina
el valor esperado de X, as! como su varianza y desviacion estandar.
2 En un juego de dados de cubo ganas $10.00 si sale {6}; ganas 55.00
si sale {5, 4, 3). Y pierdes $15.00 si sale {1. 2}. Define una variable
aleatoria que represente tu ganancia (0 perdida) y determina su dis-
tribuci6n de probabilidad. Calcula su valor esperado. < Te conviene
participar en este juego?
CD Se registraron (en metros, m) las estaturas de los jugadores de un
equipo de baloncesto y se obtuvieron los datos siguientes: {1.75,
1.90, 1.82, 1.88, 1.78}. Calcula el valor esperado, la varianza y la
desviaci6n estandar de esta variable aleatoria.
1.75 m
1.90 m
1.82 m
1.88 m
1.78 m
~ t i l l   l n a 4. Variables aleatorias
175 _
__ +-____                                                          
La probabilidad y sus propiedades
_ 176
En esta unidad estudiamos la probabilidad y sus propiedades, que aho-
ra resumimos:
® La probabilidad del evento A se caleula con la formula:
II{A)
P{A) = 11(0)'
® Si consideramos que 0 = Ii: 1 :s i:S I'I{O)), las propiedades carac-
teristi cas de la probabilidad son:
1 P{i) "" 0, la probabilidad es una cantidad no negativa.
2 P(l) + P(2) + ... + P{n{O)) = 1, es seguro que ocurra alguno de
los resultados que pertenecen al espacio muestral.
® Probabilidad de la union:
PtA U B) = PtA) + P{B) - PtA n B).
® Probabilidad del complemento:
® Resumen de propiedades de la probabilidad:
1 PtA U B) = PtA) + P{B) - PtA n B)
2 P{A
C
) = 1 - PtA).
3 P{B) = PtA n B) + P{A
C
n B).
4 Si A C B, entonces P{B) = PtA) + P{A
C
n B).
De ella se desprende:
PtA U B) = 1 - P{A
C
n BC)
PtA n B) = 1 - P{AC U BC)
® La probabilidad condicional se caleula con:
P{ I B) = PtA n B) .
A P(B) ,
U NlOAD 3 I PROBABILIDAD Santillana
o SantiUana
® Teorema de Bayes:
P A B = PtA) P{E I A)
( I) PtA) P(E I A) + P(AC) P{E lAC) .
® Regia del producto. Si A Y B son independientes,
PtA n B) = PtA) P{B)
® Variables aleatorias (las propias de un experimento aleatorio).
1 EI valor esperado:
"
E[Xl = X1P{X
1
) + x
2
P{x
2
) + ... + x"p{x,,) = L x,P{x,).
;=}
2 Varianza:
"
Var[Xl = L{x, - E[Xl? p{X')'
;= 1
3 Desviaci6n estandar:
"
DE[Xl = L{X,-E[X])2 p{X,).
;= 1
Repaso
177 _
C
omo sabes, en la ciencia politica se aplica la teo ria de probabilida-
des para analizar encuestas. En un articulo de la Revista Mexicana
de Ciencias Politicas y Sociates, editada por la Facultad de Ciencias Po-
liticas y Sociales de la UNAM, se presenta un amilisis del comporta-
miento de divers os grupos sociales en los votos que otorgaron a los tres
principales candidatos en la elecci6n presidencial mexican a de 2006.
Los datos recaudados acerca de los votantes son sexo, edad, ingre-
so, ocupaci6n, escolaridad y religi6n. A partir de esta informaci6n se
pudo conduir que Felipe Calder6n Hinojosa (FCH) obtuvo su mayor
apoyo entre los j6venes, las personas de mayo res ingresos, los profe-
sionales, los empleados de negocios, las personas can educaci6n supe-
rior y los cat6licos.
Por su parte, Andres Manuel L6pez Obrador (AMLO) obtuvo el voto
de personas de ingreso medio, las trabajadoras domesticas, maestros,
comerciantes y vended ores ambulantes, estudiantes y profesionales,
personas con educaci6n superior y personas sin religi6n.
Finalmente, la base electoral de Roberto Madrazo Pintado (RMP)
fueron las personas de menores ingresos, amas de casa, trabajadores
agrlcolas y obreros, aSI como individuos con ninguna a poca escolari-
dad y protestantes.
La fuente de informaci6n de este amilisis es la "Encuesta de salida de
las urnas" publicada por el diario Reforma el dia posterior a la elecci6n.
Usemos aqui algunos datos, los cuales se resumen en las tablas 1,2 Y 3.
Tabla 1 Candidatos favorecidos par el voto, segun el grado de escolaridad del votante
Candidato
AMLO
"MP
FeH
Total
_ 178
72
63
59
194
471
423
518
1412
456
309
481
1246
UNlOAD 3 I PROBABILIDAD
337
144
368
849
433
158
496
1087
1769
1097
1922
4788
Si se elige un votante encuestado al azar, <cmil es Ia probabilidad de
que haya votado par FCH y su escolaridad sea de nivel superior?
496 3
La respuesta es 4 ?88 = 0.10 6.
Si se sabe que un votante encuestado elegido al azar tiene escolari-
dad media, <cual es Ia probabilidad de que su voto haya sido a favor de
AMLO?
En este caso, Ia probabilidad es de ,4;:' = 0.3660.
Tabla 2 Candidatas favarecidas par sexa del vatante
Candidato
AMLO
RMP
FCH
Total
Sexo
Hombres Mujeres Total
1004
572
1001
2577
769
531
923
2223
1773
1103
1924
4800
Si se elige un votante encuestado al azar, <cual es Ia probabilidad de
que su voto no haya sido para RMP? Aplicamos Ia probabilidad del
complemento de un evento yes:
1003
1 - 4800 = 0.7702.
La posibilidad de que un encuestado elegido al azar haya emitido su
voto par Roberto Madrazo es de 0.7702.
<Cual es Ia probabilidad deque sea hombre a haya votado par AMLO?
Aqui explicamos Ia probabilidad de Ia union de eventos, pues ser hom-
bre y votar par AMLO no son eventos mutuamente excluyentes:
2577 1 773 1 004
4800 + 4800 - 4800 = 0.6971.
La probabilidad de ser varon y haber vOlado par Lopez Obrador es,
pOI' tanto, de 0.6971.
Matematicas y otras ciencias
179 _
Tabla 3 Candidatos favorecidos por religion del votante
Candi dato
AMlO
RM P
FeH
Total
_ 180
Reli gion
- - - -- ---- - - - -
(at6li ca Protestante Otra Ninguna Tot al
1436
920
1702
4058
145
100
123
368
58
37
32
127
130
43
62
235
1769
1100
1919
4 788
Si se elige un votante encuestado al azar y se sabe que su voto fue a
favor de FCH, ;.cuil es la probabilidad de que su religi6n sea la cat6lica?
La respuesta es:
1702
1919 = 0.8869.
;.CuaJ es la probabilidad de que profese la religi6n cat6lica y su voto no
haya sido para FCH? En este caso:
1436 + 920
4058 = 0.5806.
La probabilidad de que una persona elegida aI azar abrace el catolicis-
rna y haya votado por FCH es de 0.8869.
;.Cuil es la probabilidad de que una persona profese la religi6n pro-
testante y su voto no haya sido para Calder6n? Aquf tenemos:
145 + 100 = 06658.
368 .
La probabilidad de que un protestante elegido al azar no haya votado
por Felipe Calder6n es de 0.6658.
Como puedes notar, la probabilidad puede brindarnos datos que
describen incluso el comportamiento de fen6menos tan complejos
como una elecci6n.
U NlOAD 3 • PROBABILIDAD
de vari ables aleatorias
Enu . Nwmero .lutorio Dwn,lnd. eo .... DfiYUl nd.
1 0.602036802 40000 0 10000
2 0.40691593 20000 0.2 20000
]
0. 585860471 40000 0.55 40000
4 0.243464015 20000 0.95 SOOOO
5 0.21431 3848 20000
,
0.466872674 20000
7 0. 55 1515864 40000
8 0. 196519478 10000

0.222356846 20000
10 0.515370 119 20000
11 0.70586844 40000
12 0.367352784 20000
13 0.090475665 10000
,.
0. 187045765 10000
15 0.415661518 20000
16 0.069S08611 10000
17 0.492628845 20000
"
0.947566206 40000
"
0.473527495 20000
20 0.853 199248 40000
Autoevaluaci6n
o Considera el experimento aleatorio de preguntar a un grupo de personas
su signa del zodiaco. ;,Cuales son los elementos del espacio muestral de
este experimento y ellal es 5U carclinalidacl?
CD Un experimento aleatorio consiste en ex traer seis piezas de un juego de
domino (que consta de 28 piezas). tDe que tamaiio es el espacio muestral
en este experirnento?
o Supan que tenemos LIlla bombonera con n 1 carameios rajas y 112 c a r a l     e ~
los azules, }' el experimento consiste en extraer un caramelo de ella. Indi -
ca para los cases siguientes si el espacio Illuestral es equiprobable 0 no y
e<plica por que:
9
a III = 3,11
2
= 3"
b Il, = 10, "2 = 5.
C /11=3!,11
2
=6.
d ill> 11
2
"
e III = 11
2
-
11
1
=11
2
+l.
4 Juan tiene cuatra pantalones. des azules. uno negro y otra cafe. y cinco
camisas, dos blancas. dos azules. una amarilla y una raja. Ana }' Marfa
deciden practicar un juego donde predigan el color de la ropa que usara
Juan al principio de la selllana; la que adivine correctamente sera invitada
a comer par la otra.
a Define el experimento aleatorio que nos interesa e indica cual seria su
espacio Illuestral.
b Indica tres eventos en los que Ana invita a comer a Marfa y al mislllo
tiempo Maria invita a comer a Ana.
e ,Cu'l es la mejor apuesta que podrian hacer Ana (0 lVIaria) sabre la
rapa que traera Juan?
(5) Considera el "experimento" de lanzar dos dados, uno rajo y otro azul, y
anetar la suma de los puntos que l11uestran las caras que caen hacia arri-
ba. Indica eual de los eventes siguientes son "elementales'; "excluyentes';
"no excluyentes': "segura': a "imposible":
a II y B. donde II = {Ia suma es 2) Y B = {Ia cara del dado azul tiene
1 punta).
b C = {Ia suma es 13).
e II y D, donde D = {Ia suma es imparl.
d E = {la sum a es menor a 20).
e By D.
CD Considera el experimento anterior y caleula las probabilidades de los
eventos que siguen:
a II.
b II Y B.
e E.
d C.
Santl[1ana Autoevaluaci6n y ejercicios de refuerzo
183 _
Amarilla
_ 184
o Sup6n que lanzamos al aire tres monedas justas (cada una tiene de un
lado una cara y del otro lado una cruz). CaJcula la probabilidad de los
eventos que siguen:
a Salgan tres cruces.
b Salgan dos caras y una cruz.
e Salga la misma figura en las tres monedas.
® Un partido politi co tiene 150 diputados en la Camara correspondiente; de
elios, 100 tienen experiencia legislativa, 50 no la Henen y 30 son plurino-
miales, mientras que el resto son de elecci6n popular. CaJcula la probabi-
lidad de ser:
a Un diputado plurinominal.
b Diputado sin experiencia y de elecci6n popular.
e Un diputado con experiencia a de elecci6n popular (no plurinomi-
nales),
9 Hay 180 alumnos en la Facultad de Biologia en el segundo ano, de los
cuales 120 cursan la materia de quimica, 70 la de genetica y 40 quimica y
genlitica. Caicula la probabilidad de que al escoger un alumno al azar sea:
a Uno que cursa quimica.
b Uno que cursa genetica 0 quimica.
c Uno que cursa qui mica pero no genHica.
10 En Houston, tres de cada 10 habitantes tienen los ojos azules. Si elegimos
cinco personas al azar, ;.cual es la probabilidad de que dos de elias tengan
los ojos de ese color?
11 Sup6n que practicamos un juego donde se tira un dado de cuba 10 veces
consecutivas y se gana si se obtiene un numero mayor a 5 mas de dos
veces.;.Cua[ es 13 probabilidad de ganar?
@ En el marat6n de [a ciudad olimpica Juan tiene una probabilidad de I ~ de
ganar y Ram6n l ~   ;.Cual es la probabilidad de que Juan a Ram6n ga-
nen?
13 5i PtA) = t, PCB) = t, peA n B) = t, caicu[a las probabilidades si-
guientes:
a peA U B).
b P(AC n 8).
c peA I B).
@ En una bolsa se tienen tres bolas: una azul, una roja y una amarilla. 5up6n
que retiras una bola y escribes el color y luego vuelves a meter[a en la
bolsa. 5i se repite este experimento otras dos veces, i.cual es la probabili-
dad de que hayas escrito tres colores diferentes?
15 Juan compr6 pan dulce para la cena familiar: cinco conchas de chocolate,
dos panques y tres donas.
a ;.eua[ es la probabiJidad de que al sacar el pan de [a bolsa, sean dos
conchas seguidas de una dona?
b Sup6n que Juan ya sac6 cuatro panes, uno de ellos un panque, i.cual es
la probabilidad de que la pieza siguiente sea el otro panque?
@ Si peA) = t y PCB) = t, iA es independiente de 8 si tenemos que
peA n B) = liD? Por el contrario, ,como cabria esperar que fuese PtA n B)?
UNIDAD 3 • PROBABILIDAO o Santlilana
17 Supon que se tirall dos dad os de cuba y se ganan dos pesos par cada pun-
ta en la suma de puntas de las caras que quedan para arriba. Contesta:
a lCucH es el valor esperado del juego?
b lCual es la varianza y la desviaci6n estandar?
c i.Como call1bian estos valores si se ganan tres pesos en Jugar de dos?
18 Cinco personas de un grupo traen $200.00, $100.00, $120.00, $300.00 )'
$50.00 en la cartera, respectivall1ente. Sea X la variable aleatoria que re-
presenta la cantidad de dinero obtenida si se elige una de estas cinco per-
sonas al azar. lCual es el valor esperado de X?
@ Fernando y Vanesa apuestan $30.00 en un juego que consiste en lanzar
tres veces una rnoneda al aire y el vencedor es el que acierte dos de tres
volados. Si sabemos que Fernando perdio el primer volado, i.cual es el
valor esperado de la ganancia de Fernando?
20 En la elecci6n de planilla de un colegio de 500 estudiantes se caleula que
tres de cada cinco votaran par la plan ilia A; dos de cada cinco 10 haran par
By uno de cad a cinco se abstendra de votar.i.Cual es el valor esperado del
numero de votos de A? lCual es el valor esperado del numero de votos
totales?
Ejercicios de refuerzo
o Un examen de opcion multiple consta de cinco preguntas can cuatro res-
puestas posibles cada una. Si un alumna responde al azar, i.cual es la car-
dinalidad del espacio muestral de este experill1ento?
2 En el exam en del ejercicio I, ,cual es la probabilidad de que el alumno
acierte todas las respuestas?
o En una cafeteria hay paquetes de cafe y dona; el cafe puede ser americano
a capuchino, en tanto que la dona puede ser glaseada, de chocolate a de
maca. Si se elige un paquete al azar, describe el espacio muestral median-
te un diagrama de arbol )' caleula su cardinalidad.
4 Considera el experimento de sacar una ficha de domin6 y sumar los pun-
tas que muestra. Define el espacio muestral.i.Es equiprobable? Justifica tu
respuesta.
CD Si se saca una ficha de domino, ,cual es la probabilidad de que la suma de
los puntas que tiene sea 4?
6 Se hace girar una ruleta circular dividida en seis partes iguales, numera-
das de 1 a 6. Describe los eventos siguientes y el numero de elementos que
contienen:
a La ruleta se detiene en un numero impar.
b La [uleta no se detiene en 3 ni en 1.
c La ruleta se detiene en 6 0 en un numero menor que 4.
C Santiliana Autoevaluaci6n y ejercicios de refuerzo
185 _
_ 186
o En un recibo telef6nico aparecen Uamadas locales. a celular y de larga
distancia, ordenadas par fecha y hora. EI evento A es que la primera Ha-
mada es local, B la primera Hamada es a celular y Cia primera Hamada no
es local. Determina cuales son mutuamente excluyentes.
8 Se ext rae al azar una carta de la baraja inglesa y los eventos son: A la carta
elegida es un 6 de corazones y B la carta no es un rey. ;.Cuai es la probabi-
Iidad de A n B? tLos eventos son mutua mente excluyentes?
o En una bolsa can 10 caramelos hay tres que son tus preferidos. Si te per-
miten tamar cinco al azar, ;.cual es la probabilidad de que al menos uno
sea de tus predilectos? ,Cual es la probabilidad de que tres de ellos sean
tus preferidos?
10 En un grupo de pacientes 18% requiere tratamiento, 32% precisa cirugfa y
20% necesita ambos metodos de curaci6n. Responde cual es la probabili-
dad de que un paciente cualquiera:
a requiera tratamiento.
b necesite tratamiento 0 cirugfa.
c no requiera tratamiento ni cirugia.
@ Un grupo de hombres adultos presenta tres caracterfsticas: A estar casa-
do, B teller un grade de educaci6n superior y C ser originario del estado
de Puebla. Se sabe que 5% de los hombres del grupo tiene las tres caracte-
r1sticas, 10% dos de elias, 20% tiene una educaci6n superior pero no esta
casado ni es originario de Puebla, 15% es de Puebla mas no es casado ni
tiene un grado de educaci6n superior, y 25% es casado pew no es origina-
rio de Puebla ni tiene educaci6n superior. ;.Cual es la probabilidad de ele-
gil' un hombre que:
a este casado.
b tenga un grado de educaci6n superior y este casado.
c no sea de Puebla 0 no sea casado.
12 Si se tiran dos dados al aire, ,cual es la probabilidad de que el resultado no
sume 5 ni 3?
@ En una tienda hay cuatro empleados: Mario, Luis, Carlos y Octavia. Cada
uno atiende a 25% de los clientes. Mario logra cerrar la venta can 90% de
sus c1ientes; Luis, can 85%; Carlos, can 80%, y Octavia, can 78%. Si un
c1iente hace una cmnpra, ;.cual es la probabilidad de que 10 haya atendido
Luis?
14 En un juego de cartas de la baraja inglesa te reparten una abierta (can los
dibujos hacia arriba) y una cerrada (con los dibujos hacia abajo). Si la car-
ta abierta es un 10 de diamantes, ;.cuai es la probabilidad de que la cerrada
sea tambien de diamantes?
@ Si el evento A tiene probabilidad 1/ 3 Y B, 3/ 5, Y adem as sabemos que son
independientes, ,cual es la probabilidad de su union (A U B).
16 Sean A y B dos eventos cualesquiera. ;.Cuales de las siguientes afirmacio-
nes son verdaderas )' cuaies falsas?
a P(A I B) + p(ACI BC)   1.
b P(A I B) + P(A I BC)   1.
c P(A I B) + p(ACI B)   1.
UNlOAD 3 I PROBABlllDAD
@ En una empresa hay seis subdirectores, tres mujeres y tres hombres. EI
director desea elegir a dos de elIos para realizar un proyecto. Si los escoge
al azar, y sea Yel numero de mujeres en la selecci6n. encuentra la distri-
buci6n de probabilidad de Y, asi como el valor esperado y la varianza de
esta variable aleatoria.
18 Al examinar pozos de agua se encontr6 que 20% de ell os no contiene im-
purezas, 40% contiene la impureza del tipo A y 50% del tipo B. Algunos
contienen ambas. ,Cual es la distribuci6n de probabilidad de la variable
aleatoria que cuenta el numero de impurezas encontradas en un pozo
elegido al azar?
@ En un juego can baraja ganas $15.00 si tu carta es rey a reina y $5.00 si es
un as; en cambio, pierdes $4.00 si es cualquier otra carta. i.eual es tu ga-
nancia esperada?
20 En la tabla 1 aparece la distribucion de probabilidad de la demanda de un
producto. i.eual es la demanda esperada. su varianza y su desviaci6n es-
tanciar?
Tabla 1 Distribuci6n de probabilidad
x p(x)
1000 0.35
500 0.2
100 0.3
5000 0.15
e Santil.ana Autoevaluaci6n y ejercicios de refuerzo
187 _
190
Como se recordara, en la unidad 1 abordamos temas de la estadistica
descriptiva, en tanto que en las unidades 2 y 3 estudiamos los funda-
mentos de esa disciplina: teoria de conjuntos, combinatoria y probabi-
Iidad. En esta unidad expondremos algunas tecnicas populares de la
estadistica inferencial, que es la parte de la estadistica que se dedica,
por un lado, a obtener conclusiones generalizadas ace rca de una po-
blacion a partir de observaciones parciales que se hacen de ella y, por
el otro, a evaluar el riesgo de que tales conclusiones tengan errores
debido a que se basan en informacion parcial.
.\
(\.(\
\(\.4
a.a
a.
O
0.0
0.0
0.0
0.0
0.0
0.
0
0.
0
0 .
0
Lo mismo que en las unidades anteriores, en esta utilizaremos 10 ya
aprendido (sobre teoria de conjuntos, combinatoria, los conceptos de
variable aleatoria, medidas de dispersion y representacion de los da-
tos) para introducir nuevos temas y presentat· aplicaciones concretas.
AI principio de la unidad estudiaremos algunas distribuciones de
probabilidad sumamente utiles: la binomial y la normal; posterionnen-
te veremos una mas: la distribucion uniforme. Expondremos algunas
de las propiedades de estas distribuciones, las cuales nos ayudaran en
el desarrollo de las tecnicas de aplicacion practicas que trataremos en
el resto de la unidad. En particular, veremos:
UNlOAD 4 I ESTAOisTICA INFERENCIAl f'J$antiliana
• Como usar la distribucion normal para aproximar otras distribu-
ciones )' c6mo emplear 1a distribuci6n uniforme para obtener 11(1-
meros aleatorios.
I En que consiste el muestreo, que sirve para obtener informacion
ace rca de una poblacion a fin de realizar inferencias confiables
sin necesidad de encuestar, experimentar 0 recapilar los datos de
cada uno de los individuos que pertenecen a una poblacion en
particular.
• La aplicacion de cuestionarios, donde hablaremos brevemente so-
bre como se realizan encuestas/ cuestionarios para obtener infor-
macion.
• La regresion lineal, que nos permite pronosticar comportamientos
bajo el supuesto de que hay una relacion lineal entre las variables.
• Que son las pruebas de hipotesis, que sin'en para evaluar el riesgo
de cometer errores al aceptar hipotesis sobre fenomenos de interes.
Introduccion
191 _
_ 192
Distribuciones
En terminos generales, una distribuci6n de probabilidad consiste en
enumerar 0 hacer una lista de todos los valores posibles que tiene una
variable aleatoria, junto con la probabilidad de ocurrir que tiene cada
uno de esos valores. Con base en esta definici6n resulta,",! mas faeil
entender las distribuciones binomial y normal, temas que presenta-
mos en seguida.
Distribucion binomial
La distribuci6n binomial es la herramienta empleada para detenninar
la probabilidad de que en una secuencia de /"I experimentos. los cuales
pueden tener dos resultados. haya x numero de exitos.
Por ejemplo. se registra el sexo (F = femenino. M = masculino) de
25 recien nacidos en un hospital. lCual es la probabilidad de que al
menos 15 sean F' lCuantos de ellos podemos esperar que sean M?
Estas y otras preguntas similares pueden contestarse por medio de la
distribuci6n binomial.
Imagina un experimento aleatorio que tiene dos resultados posi-
bles, a los que denominaremos hito y fracaso. Por ejemplo, obtener
solo aguila en un volado, aprobar 0 reproba r un examen, encestar 0 no
una canasta, obtener un 6 0 no al tirar un dado. Si el experimento pue-
de repetirse n veces recibe el nombre de ensayo de Bernoulli.
Ensayo de Bernoulli
Se denomina ensayo de Bernoulli todo experimento aleatorio que
puede repetirse n veces. Sus caracteristicas principales son:
1 EI resultado de cada ensayo es un exito 0 un fracaso.
2 La probabilidad de que se presente un exito es la misma en cada
ensayo y se representa con p. La probabilidad de que se presen-
te un fracaso es la misma en cada ensayo y se representa con
q = 1 - p.
3 Los ensayos son independientes, es decir, el resultado de uno no
tiene efecto en los anteriores ni en los siguientes.
Definimos ahara X como la variable aleatoria que cuenta el nlunero de
exitos en n ensayos de Bernoulli. X es una variable binomial. En el
ejemplo de los recien nacidos, si decimos que el sexo femenino, es
UNlOAD 4 I ESTAOfSTICA INFERENCIAL 10 Santillana
decir, F es un exita, entonees X es el numero de bebes de los 25 recien
nacidos que pertenecen al sexo F.
leual es Ja distribuci6n de una variable binomial? Veamos un
ejempJo.
Ejemplo
l
En una tienda departamental se venden secadoras electricas
(£) 0 de gas (G) . Se sabe que 40% de los c1ientes elige 1a electri-
ca y, por tanto, el resto, 60%, prefiere la de gas. Si se seleccionan
tres d ientes al azar, leuai es 1a probabilidad de que dos de elias
compren la electrica?
Cada cliente elige independientemente de los demas y cada uno
tiene una probabilidad de 0.4 de elegir E. Si suponemos que E es un
exita y G un fracasQ, se tiene que p = 0.4 es P (E), en tanto que q =
1 - 0.4   0.6 es P(G).
Uno de los casos posibles es este: el primer c1iente elige E, el
segundo E y el tercero Gj es decir, tenemos {E, E, G). Esto ocurre
con probabilidad P[ EEG]   P[E[P [E]P[G], pues pDf la inde-
pendencia se aplica 1a regia del producto (pag. 162).
Ahora, para obtener la probabilidad de que dos dientes com-
pren secadora electrica E se analizan los tres casos posibles {EEG,
EGE, GEE} y resulta que la probabilidad que buscamos es igual a la
suma de las probabilidades de estos casos, ya que se trata de even-
tos mutua mente excluyentes. Asi, obtenemos:
P[EEG[   p(P)(1 - p)   (0.4)(0.4)(0.6)   (0.4)2(0.6),
P[EGE]   p(1 - p)(P)   (0.4)(0.6)(0.4)   (0.4)'(0.6),
P[ GEE]   (I - p)(P)p   (0.6)(0.4)(0.4)   (0.4)'(0.6).
Finalmente se obtiene:
P( dos de t res clientes elijan E] =
P[EEG [ + P[EGE] + P[GEE]   3(0.4)2(0.6) .
En general, si p es la probabilidad dt': exito, 1a probabilidad de dos exi -
tos en tres ensayos es:
p(2)   3p2 (1 - p) .
........... 1. Disl riblJeiones de probabilidad
I
193 _
x p(x)
o (0.6)'
1 3(0.4)(0.6)'
2 3(0.4)'(0.6)
3
(0.4)3
_ 194
En el ejemplo anterior se seleccionan tres clientes al azar y x = nume-
ro de clientes de los tres seleccionados que prefieren la secadora elec-
trica (E); entonces x puede ser 0, 1, 2 0 3 y, por tanto, la distribuci6n
de probabilidad del numero de clientes que eligen E consta de estos
cuatro val ores y sus respectivas probabi lidades. En la tabla lateral se
muestra tal distribuci6n.
A continuaci6n detallamos el calculo de las probabilidades de 0, 1 Y
3, pues en el ejemplo 1 ya calculamos la probabilidad de que dos cli en-
tes elijan E:
a La probabilidad de tener 0 exitos en tres ensayos, con p = 0.4, se
obtiene como la probabilidad de tener tres fracasos. Como los ensa-
yos son independientes (el resultado de uno no influye en los de-
mas) se aplica la regia del producto (pag. 162):
p(O) = (1 - p)(l - p)(l - p) = (1 - p)3 = (06)3
b La probabilidad de tener un exito en tres ensayos se obtiene calcu-
lando la probabilidad de los casos posibles: {EGG, GEG, GGE},
donde E representa exito (secadora electrica) y G fracaso (secadora
de gas):
P[EGG] = p(l - p)( l - p) = (0.4)(06)(0.6) = (0.4)(06)',
P[GEG] = (1 - p)p(l - p) = (06)(0.4)(0.6) = (0.4)(06)' ,
P[GGE] = (1 - p)( l - p)p = (0.6)(0.6)(0.4) = (0.4)(06)'
Como los casas son mutuamente excluyentes, se suman y entonces se
obtiene:
p(l) = 3p (1 - p)' = 3(0.4)(0.6)'
Por el ejemplo 1 sabemos que:
p(2) = 3p'(l - p) = 3(0.4)'(0.6).
c La probabilidad de tener tres exitos es p3, pues la unica forma en
que esto ocurre es que el primer cliente, el segundo y el tercero eli-
jan E, y cada uno 10 hace con probabilidad p y de manera indepen-
diente:
p(3) = p3 = (0.4)3.
UNlOAD 4 • ESTAOfSTlCA INFERENCIAL ©Santitlana
En general, si se tienen 11 ensayos y x exitos, el ntimero de casos posi-
bles es   ~ ) , que son las formas de elegir x lugares donde ocmren los
exitos de los 11 que hay en total.
La distribuci6n del numero de exitos en 11 ensayos, X, se ll ama
distribllcioll binomial. En seguida se resume todo 10 expuesto hasta
ahora.
Distribuci6n binomial
Si Xes el numero de exitos en 11 ensayos de Bernoulli, entonces su
distribuci6n es:
p(x) = (:) px (1 - p)" - x.
Asl, X tiene una distribuci6n binomial que se denota por B (n, pl .
tRecuerdas el tri<ingulo de Pascal que estudiamos en la unidad 2? Pues
los coefieientes de la distribuei6n binomial,   ~ ) , conoeidos como co-
eficiel1tes bil1omiales, pueden obtenerse usandolo. Para eneontrar el
eoefieiente 5610 hay que busear el elemento x del rengl6n 11.
C Santillana 1. Distribuciones de probabilidad
195 _
Figura 1
Histograma cuando
n = 6yp = t·
Agura 2
Histogromo cuondo
n = 4yp = i·
_ 196
El histograma cuando n = 6 Y P = t queda como el presentado en
la 6gura 1, en tanto que para n = 4 Y P = t se ve como en la figura 2.
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
0 1 2 3

5 6
0.45
0.'
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
0 1 2 3

Para practicar
CD En un comite hay cinco mujeres y ocho hombres. En cada reuni6n
se elige un miembro al azar para que escriba la min uta correspon-
diente, sin importar quien 10 haya hecho el dia anterior. Describe el
proceso como una variable binomial y determina los panimetros n
y p. ;.Cual es la probabilidad de que en t res dias se haya elegido a una
mujer?
2 En un juego can un dado de cuba se gana si cae 6. ;.Cual es la pro-
babilidad de que en cinco tiros ganes dos veces?
o La probabilidad de que el neumatico de un autom6vil de carreras
sufra una pinchadura en un circuito es de 0.04. Si en la carrera par-
ticipan seis autos, ;.cual es la probabiHdad de que ocurra una pin-
chadura?
UNIOAO 4 • ESTAOrSTICA INFERENCIAL .......
Distribucion normal
Hasta ahora hemos visto ejemplos de variables aleatorias discretas.
Sin embargo, tambien hay variables aleatorias continuas; pOl' citar un
caso, la estatura de una persona elegida al azar.
lmagina el experimento de escoger un punto dentro de un drculo y
luego medir su distancia al centro. EI drculo contiene un numero infi-
nito de puntos y la distancia es una variable continua, que puede valer
de 0 a r, el radio del cfrculo (figura 3).
La probabilidad de que ocurra un resultado en particular de una
variable aleatoria continua es 0, pues se tiene un conjunto infinito de
valores igua!mente pro babies. No obstante, es posib!e calcu!ar la pro-
babilidad de caer dent ro de cierto rango 0 intervalo de valores. Por
citar un caso, si dibujamos un drculo con radio r /2, el area del drculo
original es nr2 y el area del cfrculo pequeno es rr(r/2)2, asi que la pro-
babilidad de que la distancia sea menor 0 igual a r /2 es (figura 4):
Entonces, para variables continuas se define la funci6n de densidad de
X,f(x), la cual satisface las propiedades siguientes (figura 5):
• f(x)   a para todo valor posible de la variable aleatoria.
• EI area bajo la curva de la funci6nf(x) es l.
• EI area bajo la curva entre los valores a y b es P [a ::S: X b).
, b
Una variable continua, Hamada normal, aparece en diferentes situa-
ciones; por ejemplo, fluctuaciones de precios de acciones, promedios
anuales de temperatura, estaturas y pesos (masas corporales) de un
grupo de estudiantes, resultados de un examen, etcetera.
.-
1. Oist ri buciones de probabilidad
,
d
FIgura 3
[(rwlo de radio r y un punto
cualquiera dentro de el.
,
Figura 4
Circulos concentricas con
radia r y radia r /2.
Figura 5
Gra{ica de una {unci6n de
densidad con el6rea bajo la
curva entre a y b sombreada.
197 _
Funcion de densidad
Lafuncion de densidad de una variable aleatoria normal con para-
met ros valor esperado = fl Y desviaci6n estandar = 0 es:
1 1(=)2
f(x) = e - , a .
oV2IT
Suele representarse con N(fl. 0) .
La grafica de una distribuci6n normal se conoce como campana de
Gauss (figura 6) Y tiene las propiedades siguientes:
• Es continua.
I Es simetrica respecto al valor esperado. fl.
• Alcanza un maximo en ~  
I EI eje X es una asintota horizontal.
En general. no es f<lei! calcular el area bajo la curva. pues ello supone el
calculo de una integral. Sin embargo. por fortuna existe una tabla de
valores para la distribuci6n normal cuando fl = 0 Y 0 = 1. La tabla
Fi gura 6 contiene la probabi!idad de que Z sea menor 0 igual que z.
------------------
Campana de Gauss
_ 198
U NlOAD 4 • ESTAOfSTICA INFERENCIAL e Santillana
Tabla 1 Distribuci6n normal estandar (0,1)
Z 0.09 0.08 0.07 0.06 0.05 0.04 0.03 0.02 om 0
- 3.5 0.00017 0.00017 0.00018 0.00019 0.00019 0.0002 0.00021 0.00022 0.00022 0.00023
- 3.4 0.00024 0.00025 0.00026 0.00027 0.00028 0.00029 0.0003 0.00031 0.00032 0.00034
- 3.3 0.00035 0.00036 0.00038 0.00039 0.0004 0.00042 0.00043 0.00045 0.00047 0.00048
- 3.2 0.0005 0.00052 0.00054 0.00056 0.00058 0.0006 0.00062 0.00064 0.00066 0.00069
- 3.1 0.00071 0.00074 0.00076 0.00079 0.00082 0.00084 0.00087 0.0009 0.00094 0.00097
- 3 0.001 0.001 0.0011 0.0011 0.0011 0.0012 0.0012 0.0013 0.0013 0.0013
- 2.9 0.0014 0.0014 0.0015 0.0015 0.0016 0.0016 0.0017 0.0018 0.0018 0.0019
- 2.8 0.0019 0.002 0.0021 0.0021 0.0022 0.0023 0.0023 0.0024 0.0025 0.0026
- 2.7 0.0026 0.0027 0.0028 0.0029 0.003 0.0031 0.0032 0.0033 0.0034 0.0035
- 2.6 0.0036 0.0037 0.0038 0.0039 0.004 0.0041 0.0043 0.0044 0.0045 0.0047
- 2.5 0.0048 0.0049 0.0051 0.0052 0.0054 0.0055 0.0057 0.0059 0.006 0.0062
- 2.4 0.0064 0.0066 0.0068 0.0069 0.0071 0.0073 0.0075 0.0078 0.008 0.0082
- 2.3 0.0084 0.0087 0.0089 0.0091 0.0094 0.0096 0.0099 0.0102 0.0104 0.0107
- 2.2 0.011 0.0113 0.0116 0.0119 0.0122 0.0125 0.0129 0.0132 0.0136 0.0139
-2.1 0.0143 0.0146 om5 0.0154 0.0158 0.0162 0.0166 0.017 0.0174 0.0179
- 2 0.0183 0.0188 0.0192 0.0197 0.0202 0.0207 0.0212 0.0217 0.0222 0.0228
- 1.9 0.0233 0.0239 0.0244 0.025 0.0256 0.0262 0.0268 0.0274 0.0281 0.0287
- 1.8 0.0294 0.0301 0.0307 0.0314 0.0322 0.0329 0.0336 0.0344 0.0351 0.0359
- 1. 7 0.0367 0.0375 0.0384 0.0392 0.0401 0.0409 0.0418 0.0427 0.0436 0.0446
- 1.6 0.0455 0.0465 0.0475 0.0485 0.0495 0.0505 0.0516 0.0526 0.0537 0.0548
- 1.5 0.0559 0.0571 0.0582 0.0594 0.0606 0.0618 0.063 0.0643 0.0655 0.0668
- 1.4 0.0681 0.0694 0.0708 0.0721 0.0735 0.0749 0.0764 0.0778 0.0793 0.0808
- 1.3 0.0823 0.0838 0.0853 0.0869 0.0885 0.0901 0.0918 0.0934 0.0951 0.0968
- 1. 2 0.0985 0.1003 0.102 0.1038 0.1056 0.1075 0.1093 0.1112 0.1131 0.1151
- 1.1 0.117 0.119 0.121 0.123 0.1251 0.1271 0.1292 0.1314 0.1335 0.1357
- 1 0.1379 0.1401 0.1423 0.1446 0.1469 0.1492 0.1515 0.1539 0.1562 0.1587
- 0.9 0.1611 0.1635 0.166 0.1685 0.1711 0.1736 0.1762 0.1788 0.1814 0.1841
- 0.8 0.1867 0.1894 0.1922 0.1949 0.1977 0.2005 0.2033 0.2061 0.209 0.2119
- 0.7 0.2148 0.2177 0.2206 0.2236 0.2266 0.2296 0.2327 0.2358 0.2389 0.242
- 0.6 0.2451 0.2483 0.2514 0.2546 0.2578 0.2611 0.2643 0.2676 0.2709 0.2743
- 0.5 0.2776 0.281 0.2843 0.2877 0.2912 0.2946 0.2981 0.3015 0.305 0.3085
- 0.4 0.3121 0.3156 0.3192 0.3228 0.3264 0.33 0.3336 0.3372 0.3409 0.3446
- 0.3 0.3483 0.352 0.3557 0. 3594 0.3632 0.3669 0.3707 0.3745 0.3783 0.3821
- 0.2 0.3859 0.3897 0.3936 0.3974 0.4013 0.4052 0.409 0.4129 0.4168 0.4207
- 0.1 0.4247 0.4286 0.4325 0.4364 0.4404 0.4443 0.4483 0.4522 0.4562 0.4602
o 0.4641 0.4681 0.4721 0.4761 0.4801 0.484 0.488 0.492 0.496 0.5
CSantiliana 1. Distribuciones de probabilidad
199 _
Tabla 1 (concluye)
Z 0 001 002 003 004 0.05 006 007 008 0.09
o 0.5 0.504 0.508 0.512 0.516 0.5199 0.5239 0.5279 0.5319 0.5359
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.2 0.5793 0.5832 0.5871 0.591 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.648 0.6517
0.4 0.6554 0.6591 0.6628 0.6664 0.67 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 0.6915 0.695 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.719 0.7224
0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549
0.7 0.758 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.8 0.7881 0.791 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 0.8159 0.8186 0.821 2 0.8238 0.8264 0.8289 0.8315 0.834 0.8365 0.8389
1 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.877 0.879 0.881 0.883
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.898 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.9345 0.9357 0.937 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.975 0.9756 0.9761 0.9767
2 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.1 0.9821 0.9826 0.983 0.9834 0.9838 0.9842 0.9846 0.985 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.989
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.4 0.9918 0.992 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.5 0.9938 0.994 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.996 0.9961 0.9962 0.9963 0.9964
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.997 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.998 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
3 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.999 0.999
3.1 0.999 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993
3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995
3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997
3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998
3.5 0.9998 0.9998 0.9998 0.9998 0. 9998 0.9998 0.9998 0.9998 0.9998 0.9998
_ 200
UNlOAD 4 • ESTAOrSTICA I NFERENCIAL ..........
Distribuci6n normal esttindar
La distribuci6n normal estandar es una dist ribuci6n normal con pa-
r<imetros (0, 1) (tabla 1) y tiene la funci6n de densidad siguiente:
Uso DE LA TABLA NCO. 1)
5i Z es una variable aleatoria normal (0, 1), entonces se usa la tabla
para calcular probabilidades como:
P[Z'; al.
5i a es positivo, se busca el numero con deci mas en la fila y la centesi-
rna en la columna y as! se obtiene la probabilidad.
En caso de que se desee saber cual es la probabiHdad de que Z.s -a,
como la funci6n es simetrica se tiene:
P[Z'; -al   1 - P[Z -; al.
-,
Para obtener la probabilidad de que Z > a se usa:
P[Z>al   I-P[Z-;al·
.-..
1. Oistribuciones de probabilidad
Figura 7
Campana de Gauss con e/ area
bajo /a CUNG desde - x hasta a
sambreada.
Figura 8
Campana de Gauss mastranda que
es igua/ el area desde - x hasta
-a y desde a hasta x.
201 _
Figura 9
Campana de Gauss con el drea
hacia la izquierda de b ya fa
derecha de a sombreada.
_ 202
Finalmente, si queremos obtener la probabilidad de que Z se en-
cuentre en un rango de valores [a, bJ se calcula:
P[a OS Z OS b] = P[Z OS bJ - P[Z OS a].
a b
Aunque la tabla es para una distribuci6n normal (0, 1), podemos usar-
la para calcular cualquier probabilidad de una distribuci6n normal si
transformamos los valores de acuerdo con la f6rmul a siguiente:
x   ~
Z= ---,
(J
que se canace como transformaci6n z.
UN l OAD 4 I ESTAOiSTICA lNFERENCIAL ©Santillana
Ejemplo
2
La estatura en centimetros (em) de un grupo de alumnos tiene
una distribucion normal con fl = 168.2 Y (J = 8.5. ,-eual es la
probabilidad de que la estatura de un alumno elegido al azar sea
menor 0 igual que 170 em?
= P[Z'; 0.21] = 0.5832.
'- eual es la probabilidad de que su estatura este en el intervalo [170,
181 J?
Primero, recuerda que la tabla contiene los valores P[Z ,; z];
entonces, si queremos Pta ,; Z ,; b] = P[Z ,; b] - P[Z ,; a]
(figura 10):
a b
P[170,;X,;181] = P[Z< 181- 168.2] _ P[Z< 170 -168.2 ]
8.5 8.5
= P[Z'; 1.5] - P[Z'; 0.21] = 0.9332 - 0.5832 = 0.35.
,-eual es la probabilidad de que su estatura sea menor 0 igual a 156
7
Primero hacemos la transformacion z:
@Santillana
x   ~
z= --;
(J
156 - 168.2
z= 8.5 =-1.44.
1. Distribuciones de probabilidad
Fi gura 10
Gr6fica de campana de Gauss
indican do eldrea 0 10 izquierda de
b, eldrea a 10 izquierda de a y 10
diferencia de ambos.
203 _
_ 204
Figura 11
HistogralT/a y campana
de Gauss.
En seguida, como la funcia n es simetrica se tiene que:
P [Z :S -l.44] = P [Z 2:: 1.44] = 1 - P [Z :S l.44],
y obtenemos:
P[X:S 156] = 1 - P[Z:S l.44] = 1 - 0. 9251 = 0.0749
Aproximacion normal de la binomial
Como hemos vis to, la di stribucian binomial consiste en caleular la
probabilidad del nlllnero de exitos que hay en 17 repeticiones de un
ensayo de Bernoulli. Si 11 es muy grande, por ejemplo 200, el caleulo de
estas probabilidades se vuelve muy complicado y fatigoso. De Moivre
demostra que cuando p = + y 11 es muy grande, la distribucian bino-
mial se aproxima a una distribucian normal (figura ll).
0.2
0.18
0.16
0.14
0.12
0.1
0.08
0.06
0.04
0.02
o
Sin embargo, es pos ibl e probar que, en general, para cualquier valar de
p la distribucian binomial se aproxi ma a una normal con para metros
  = "P, 0
2
= I1p(l - pl. Par ejemplo, observa en la figura 12 el histo-
grama de una binomial con p = 0.3 Y para diferentes valores de 11. En
la grafica se advier te que cuando 11 crece el hi stograma se parece cada
vez mas a la campana de Gauss.
UNlOAD 4 I ESTAOisTICA INFERENCIAL Sitntillana
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
0.25
0.2
0.15
0.1
0.05
o
p ~ 0.3 Y 11 ~ 6
1 2 3 4 5 6 7
p ~ 0.3 Y n ~ 18
1 3 5 7 9 11 13 15 17 19
0.3
0.25
0.2
0.15
0.1
0.Q5
o
0.2
0.18
0.16
0.14
0.12
0.1
0.08
0.06
0.04
0.02
o
p ~ 0.3 Y n ~ 12
1 2 3 4 5 6 7 8 9 10 1112 13
p ~ 0.3 Y n ~ 24
Veamos ahom un ejemplo de la aproximaci6n normal de la binomial.
Figura 12
GropeD con varios histogramas
para distintos vafores de n.
Ejemp/o
3
Considera una binomial, con n = 25 Y p = 0.5. Si calculamos
la probabilidad de obtener, a 10 sumo, 14 exitos entonces:
P[X:S 14J = 0.7878.
Ahora calculamos la probabilidad de que una normal con para me-
tros np = 12.5 Y np(l - p) = 6.25 :s 14:
[
14-12.5]
P[X :S 14J = P Z:s   ~ = P[Z :S0.6J = 0.7257.
V 6.25
CSantiliana 1. Distribuciones de probabilidad
205 _
_ 206
Pero 0.7878 Y 0.7257 no es un dlculo tan aproximado como qui-
sieramos; podemos arreglarlo si en vez de usar el valor 14 emplea-
mos 14.5. Esto se llama correccion por contil1l1idad. Entonces se
tiene:
[
14.5 - 12.5]
P[X s 14.5] = P Z S . ~ = P[Z S 0.8] = 0.7881,
V 6.25
que es una muy buena aproximaci6n.
Podemos generalizar el resultado obtenido en el ejemplo anterior y
establecer la aproximaci6n normal a una distribuci6n binomial 8(11, p)
como sigue.
TEO RE MAl. Si X es WIG 8(11, p) elltollces:
a - 0.5 - lip a + 0.5 - lip
P[asXSb] = P szs ,
\ l lIp{l - p) Vllp(l - p)
dOllde Z es WIG N(O, 1).
Para practicar
CD En una distribuci6n normal   ~ = 10, a = 3), Lcual es la probabi lidad
de que una observaci6n se encuentre en el intervalo [7, 11 )?
2 En una fabrica, la probabilidad de que un articulo resulte defectuo-
so es 0.1. 5i en un dia se producen 200 articulos, Lcual es la proba-
bilidad de que se registren entre 10 y 20 defectuosos? Usa la aproxi-
marion normal.
CD En una tienda se registr6 el precio de 87 articulos y se obtuvieron
los datos siguientes:
Precio 10 20 30 40 50
Numero de articulos 5 18 32 20 12
Detennina los para metros ~ Y (J Y los extremos del intervalo que
contiene al 95%.
UNlOAD 4 • ESTAOisTICA INFERENCIAL Santillan1'l
Como indicamos al inicio de la unidad 1, en estadistica se denomina
pob/aciolJ a todo el conjunto de individuos sobre los que pueden rea-
Iizarse observaciones de interes. Como imaginaras, a veees resulta su-
mamente dificil estudiar toda una poblacion, de modo que con fre-
cuencia suele subdividirsele en subconjuntos, que reciben el nombre
de muestra, sobre la cual se lIeva a cabo el estudio. Despues, partir de
los resultados obtenidos en la muestra se hacen inferencias generaliza-
bles a toda la poblacion de la que se extrajo la muestra.
Ya dij imos que esa generalizacion implica un riesgo, ya que si bien
toma como punto de partida los datos disponibles, no hay que olvidar
que son incompletos (pues proceden de la muestra, no de la pobla-
cion). Debido a ello, en estadistica resulta cardinal elmuestreo, es de-
cir, la eleccion de una muestra representativa de la poblacion.
Y justo la teoria del muestreo proporciona las herramientas necesa-
rias para estudiar matetmiticamente el diseiio y la evaluacion del pro-
ceso de seleccion de una muestra.
Muest;reo
Se denomina muestreo a la seleccion de un subconjunto de elemen-
tos de una poblacion, subconjunto al que lIamaremos muestra, sobre
el que se realizan estudios que tienen como proposito medir cielta
caracteristica y, con base en el resultado, hacer inferencias generali-
zables ace rca de toda la poblacion.
A continuacion veremos un ejemplo de muestreo para una poblacion
pequet;a.
£jemplos
4
Directivos de un hospital decidieron pesar a los cuatro nifios
(en kilogramos, kg) que nacieron en un dia y obtuvieron los
resultados siguientes:
Nino 1 2 3 4
Peso (kg) 2.5 2.4 2.3 2.8
C Santillana 2. Muestreo
207 _
_ 208
Supongamos ahora que tomamos una muestra de tamai'to n = ?
La media de peso para los recien nacidos ese dfa es de 2.5 kg. La
varianza poblacional es 0.035, aproximadamente, y 1a desviaci6n
estandar es de alrededor de 0.1870.
Recordemos que hay seis farmas de seleccionar dos ninos de los
cuatro nacidos ese dia (combinaciones de 4 en 2), las cuales se enu-
meran en la tabla siguiente, junto con el peso promedio de cada
selecci6n:
Diferentes
selecciones
(I,2) {l,3} {l,4} {2,3} {2,4} {3,4}
Peso promedio
de la seleccion
2.45 2.4 2.65 2.35 2.6 2.55
Como vemos en la tabla, si nos basaramos unicamente en el peso
de dos ninos para estimar el peso promedio de los cuatro recien
nacidos algunas veces estariamos por arriba del promedio real (la
media poblacional) y otras veces par debajo. De hecho, para este
caso no obtendrfamos 2.5 kg en ninguna de las selecciones, que
como habras deducido son muestras.
Una forma posible de evaluar el riesgo, es decir, de ponderar en
que medida nos equivocamos al inferir el promedio real utilizando
s610 la informaci6n de la muestra es ver cuanto se desvian las esti-
maciones del promedio real (media poblacional). Si usaramos la
media poblacional (J.L = 2.5), al calcular la desviaci6n estandar de
estas seis estimaciones obtendriamos:
(-0.05)2 + (-0.1)2 + (0.15)2 + (-0.15)2 + (0.1)2 + (0.05)2
6
10 que equivale a: 0.1080.
La desviaci6n maxima del promedio real es de 0.15 y la minima
de 0.05; pode.mos sobrestimar a subestimar hasta en 1596 el pro-
media real en una muestra concreta.
5
Si en vez de dos ahara seleccionamos tres recien nacidos para
estimar el peso promedio tendriamos la situaci6n siguiente:
Oiferentes
{l,2.3} {t.3.4} {t.2.4} {2,3.4)
selecciones
Peso promedio
2.400 2.533 2.566 2.500
de la selecci6n
UN l OAD 4 • ESTAOfSTICA INFERENClAl .........
En este caso vemos que con la seleccion {2,3,4} se estima de ma-
nera exacta el promedio poblacional. La desviacion maxima no es
mayor que 0.10, de modo que no la sobrestimamos ni subestima-
mos en mas de 10%. Ademas, la desviacion estandar de las cuatro
posibles estimaciones de la media poblacional es de 0.0621, aproxi-
madamente.
A part ir del ejemplo anterior, to do parece indicar que al seleccionar
muestras de tamal10 mayor las estimaciones suelen ser mejores y las
desviaciones de la media poblacional tambien disminuyen de manera
considerable.
Censo
lBasta aumentar el numero de elementos que forman la muestra para
lograr buenas estimaciones, 0 hay otras maneras de obtenerlas' Vaya-
mos pOI' partes.
Mide la estatura de tus compal1eros de la clase; para ello, dividelos
en tres subconjuntos del mismo tamal10, aproximadamente, y luego en
un numero mayor, digamos, 10 subconjllntos mas 0 menos delmismo
tamal10. Calcula la media, la varianza y la desviacion estandar de cada
subconjunto y despues contesta estas preguntas:
I lEn que difiere la media y la varianza de cada subconjunto res pee to
del conjunto total (0 sea, de todos los compat1eros de la clase)'
I lEn que difiere 0 coincide tu resllltado con el de otros compal1eros'
(ello de pen de del numero de subconjuntos y de la cantidad de inte-
grantes que hayan incluido en ellos).
A partir de este ejercicio acuden varias pregllntas a nuestra mente;
pOI' ejemplo'lcomo seleccionar a los individllos que se van a medir',
ide que tamano debe ser la muestra para que la estimacion sea buena'
A 10 largo de la unidad iremos respondiendo a estas y otras preguntas
similares. Empecemos pOI' definir que es un censo.
5antillana 2. Muestreo
209 _
_ 210
Censo
A diferencia del muestreo, el estudio estadistico en el que se reline
(comlinmente se dice "Ievanta") la informaci6n de toda la poblaci6n
de interes se llama cel1so.
Un ejemplo tipico de censo es el poblacional, que se lleva a cabo cada
10 a!'lOS en varios paises a sugerencia de la Comisi6n de Estadistica de
las Naciones Unidas y cuyo objeto es reunir cierto tipo de informaci6n
(como la edad, el grado de estudios, la vivienda, etc.) de todos los ha-
bitantes de una naci6n.
Para practicar
CD Sup6n que tenemos un caja con tres bolas numeradas de 1 a 3, es
decir, la poblaci6n P = {1, 2, 3}, Y estamos interesados en saber la
proporci6n de bolas pares que hay en P. Sabemos que para este caso
la proporci6n real es t. Si tomamos una ll1uestra de dos bolas con
remplazo (0 sea, se toma una bola, se ve si es par 0 no, se devuelve
a la caja )' se tama una segunda bola para determinar si es par 0 no,
y la proporci6n de bolas pares es el est imador):
a <Cmlntas posibles ll1uestras podemos obtener y cual es el valor
de la estill1aci6n de bolas pares para esa muestra'
b Si considerall1os que el estimador de la proporci6n de cad a mues-
tra es una variable aleatoria, calcula su media y su varianza y
comparalas con la proporci6n real.
2 Repite el ejercicio anterior pero con una caja con cinco bolas nu-
meradas de 1 a 5; determina los mismos datos en los casos en que
la muestra sea con reemplazo y sin remplazo y compara los resul-
tados.
o Reflexiona: <es posible considerar un censo las votaciones presiden-
ciales en Mexico' <Cual seria la poblaci6n en este caso'
Proceso de muestreo
En los casas examinados en la seccion anterior, pesar a los cliatro re-
cien nacidos en el hospital 0 medir la estatura de los compaIleros de
clase es relativamente sencillo y, par ende, no se dificulta la obtenci6n
UNlOAD 4 I ESTAOISTICA INFERENCIAl Iili. n
del valor de la variable de interes de la poblacion. Adem"s, debido al
tamaflO reducido de la poblacion en cada caso parecerfa que el censo
es 10 mas adecuado en vez de tomar Llna muestra.
Ahora considera las poblaciones siguientes y las caracterfsticas de
interes que se busca medir:
1a Focos de 100 watts producidos por la compal'l;a ACME.
1b Nlllnero de focos de 100 walts defectuosos.
2a Poblaci6n mexicana COil mas de 10 alios y menos de 50 alios de
edad.
2b Numero de diabeticos en esta poblacion.
3a lVlanzanas en venta en un supermercaelo.
3b Nlllnero de manzanas que no son jugosas.
Responde a las preguntas que siguen, relativas a los tres casos:
• <Como podemos medir la caracter;stica b) de cada incis0
7
• Al hacer la medicion, <afectamos a los miembros de la poblacion
7
I tHay alguna razon poria que debamos preferir un l1lu€streo que un
censo?
Para medir lb una opcion consiste en probar cada foco de 100 watts
que produzca la compai1.fa ACJ\'iE, conectandolo a la corriente), regis-
trando los que no sirven. Este proceso tardarfa algunas horas y aunque
supone usaf un poco cada foco, podemos afirmar que 110 afectariamos
a los miembros de la poblacion (los Cocos de 100 watts producidos por
ACME), la cual estaria probablemente en el orden de los miles. Es claro
que en este casa conviene realizar un ll1uestreo, entre otras razones
por el costo y el tiempo menores respecto al censo.
Por otro lado, para meciir 2b quiza tendriamos que hacer un a",ilisis
de sangre 0 un estudio medico mas detallado. Al igual que en lb, se
trata de un proceso que tarda algun tiempo y sin duda resulta muy cos-
to 50, si consideramos que la poblacion que se va a medir rondaria el
orden de los millones. Aunque en este caso el individuo no resultar;a
afectado fisicamente, queda el problema de hallar a los individuos y
asegurarnos que esten dispuestos a que se les realice el examen. Puede
afinnarse que basta preguntaries si son diabeticos, pero incluso asf per-
siste la dificultad planteada por el enorme tamal10 de la poblacion.
Para medir 3b, si sugerimos expl"imir las manzanas para vel" cuan
jugosas son es evidente que afectarfamos de manera sustancial al indi-
viduo y el supermercado se negan! a que se rea lice el estudio en todas
las manzanas que tiene en existencia.
En estas situaciones utilizar una muestra de la poblacion se justifica
por alguna de las razones siguientes:
2. Muestreo
211 _
_ 212
I EI tamal10 de la poblacian.
I EI costo de lIevar a cabo Ia medici6n en un individuo.
I La forma en que se realiza 1a medici6n.
A partir de estos ejemplos no es dificil imaginar otros casos en los
que el muestro resulta cOllveniente, incluso necesario.
ETAPA S DEL PRO CESO DE M UESTREO
En general, el proceso de muestreo se divi de en cinco etapas prin-
cipales:
1 Defi nir los objetivos del muest reo y la poblaci6n de inten's.
2 Especificar el marco muestra!'
3 Establecer el disel10 de muestreo.
4 Poner en malTha el plan de muestreo.
5 Anali zar los datos y los resultados.
A continuacion describimos en que consiste cada etapa.
1 Objetivos del lIl11estreo )' poblacioll de ill teres
En el objetivo delmuestreo se debe especificar la medici6n que se de-
sea hacer, aSI como la poblaci6n sobre la que deseamos rea Ii zari a. Es
importante definir con c1aridad el objetivo para que el disel10 y la
puesta en marcha del muestreo resulten mas sencill os.
Poblacion de intenfs
La poblacion de in teres del muestreo es el conjunto de elementos
acerca de los cuales deseamos hacer una inferencia generali zabl e.
EI estableci mi ento de la poblaci6n de interes est" Inti mamente Iigado
con los objetivos delmuestreo. Supan que un banco esta interesado en
presentar un nuevo tipo de cuenta de inversion y desea saber cuantos
c1ientes pos ibles 0 potenciales estarian interesados en contratar una.
Pese a 10 que podda parecer, no es tan sencillo identificar los "c1ientes
potenciales': ya que se trata de un conjunto que podda formarse, ent re
otras posibilidades, por los c1ientes que tienen una cuenta en ese 0 en
otros bancos, por las personas se hallan dentro de un ra ngo especifico
de ingresos, 0 bien, por una combinaci6n de ambos parametros: por
quienes tienen una cuenta bancaria )' tienen un nivel de ingresos bien
deli mitado.
U NlO AD 4 I ESTAOisTICA lNFERENCIAL
La definicion de la poblacion de inten,s ha de contener la descripcion
de los elementos que senin inciuidos en el estudio, as; como una especi-
ficacion de las mediciones que se realizan\n sobre ellos. De la especifi-
cacion de esta poblacion de interes dependen\ 10 facil, costoso 0 factible
que resulte obtener una Iista de los elementos sobre los que se lIevara a
cabo el muestreo. Esta cuestion nos conduce a la etapa siguiente.
2 Nlarco II1l1estral
Si no se cuenta con la Iista de todas las personas que tienen una cuen-
ta bancaria. una manera de recabar esta informacion serfa Illuestrear
un conjunto de casas, preguntar en cada una de elias si hay alguien que
tenga una y a quienes respondan afinnativamente presentarles la
cuenta nueva y medir el interes que les despierta. En este caso, en vez
de medir directamente a los elementos de la poblacion (personas con
cuenta bancaria), estariamos midiendo una unidad que contiene ele-
mentos de la poblacion de inten,s (casas donde viven personas que
posiblemente tengan cuentas en un banco).
Unidades de muestreo
Las unidades de muestreo son conjuntos disjuntos formados por ele-
mentos de la poblacion de interes y que abarcan la poblacion total.
En tenninos generales, siempre es preferible partir de la lista de todos
los elementos que forman la poblacion, aunque sabemos que ello no
siempre es posible, de ahi que a menudo haya que definir un marco
muestral.
Marco muestral
EI marco muestral es una Iista de los elementos que componen la
poblacion de interes, pero tambien puede ser una Iista de las unida-
des de muestreo de la poblacion.
No en todos los casos es posible contar con un marco muestral que
abarque por completo la poblacion de interes. Por citar un caso, aun-
que el banco nos proporcione su ultima lista de ci ientes, puede ser que
en el momento de lIevar a cabo la medicion esa Iista ya se encuentre
desactualizada (porque algunos ciientes han cancelado su cuenta y
otros nueVDS han abierto una, entre otras razones).
Piensa en otras dos razones comunes pOl' las que un marco mues-
tral no abarque por completo toda la poblacion. tCual seria, por ejem-
plo, un marco muestral para los microbios causantes de Ia gripe? tCual
seria un marco muestral para los votantes en las pr6ximas elecciones
presidenciales?
e Santillana 2. Muestreo
213 _
_ 214
La ideal es tener un marco llluestrai que cubra tolaimcnte la pobla-
ci6n de interes, 0 tan completamente como sea posible para que las
inferencias que se realicen sean 10 Illas exactas posibles. Una \'ez que
contamos con el marco Illuestral el paso siguiente en cI proccso de
l11ucstreo consiste en seleccionar a los elementos que formaran 1a
l11uestra,O sea, elaborar el c1isei1o de llluestreo.
3 Disello de IIllfestreo
EI diselio de muestreo debe especificar la cantidad de elementos que
constituinin la muestra )' el metoda que se emple"ra para elegirlos. En
las secciones que siguen ahondaremos en este tema; por ahara, baste
describir en lineas generales los metodos de selecci6n L1sados mas co-
Il1Lll1mente.
,111Ieslreo fllentorio sill/pie. Es elmctodo basico de selecci6n de los ele-
mentos sabre los que se realizanl el I11UE'streo. Consiste en elegit' una
muestra de la poblaci6n que tenga la misma probabilidad que otras de
ser escogicla para el cstudio. Si ya se Clienta con el marco muestral (a
la lista de los elementos de la poblaci6n de interes), entonces el meto-
da supone elegir de manera "Ieatoria un subconiunto de elementos de
ese marco (de esa lista).
,\llleslreo estmtificndo. A diferencia delmuestreo aleatorio simple, en
este casa se supone que hemos di\'idido la poblaci6n de interes en
grupos, categorias 0 estratos diferentes. Par eiemplo, quiza tengamos
clasificados a los clientes del banco poria zona del pais donde se ubica
su sucursa!' 0 bien par ellfmite de credito autorizado en su tarieta. Se
puede suponer que las preferencias hacia la nue\'a cuenla varian entre
los diferentes estratos. En este caso, la selecci6n de los elementos de la
muestra se realiza aleatoriamente en cada uno de los estratos; Ia can-
tidad de elementos pOI' elegir de cada uno de ell os se hace de tal suerte
que la muestra final sea representativa de la poblaci6n total.
Entre las razones para emplear este metodo se cuentan:
1 Asegura que grupos particulares de la poblaci6n queden represen-
tados de forma adecuada.
2 Brinda mayor precisi6n a tamalios menores de la muestra al usaI' la
informacion adicional que se bene ace rca de los estratos. Esta es
especial mente cierto cuanda las medias}' su \'arianza difieren de
modo signilicati\'o entre los distintos estratos.
}\[lIestreo sistematico. Este metoda empieza Call un elemento aleatorio
en la lista, a partir de el cuenta k   1 elementos que Ie siguen )" escoge
el k-esimo. Esta selecci6n se repite hasta habcr completado el tamaliO
deseado de la Inuestra. Un eicmplo tfpico: cuando en la aduan" no se
UNlOAD 4 • ESTAoiSTtCA tNFERENCIAL
desea revisar el equipaje de todos los pasajeros que cruzan la frontera,
lIna opci6n consiste en revisar las maletas de cad a 30 de elias. Este es
lin metoda cu)'a p"esta en marcha resulta sencilla. Para que la mues-
tra elegida sea representativa se requiere que los elementos de la Iista
no guarden un orden determinado.
Muestreo par cOl1vel1iel1cia. De acuerdo con este esquema, se seleccio-
nan los elementos arbitrariamente sin una estructura en particular.
Par citar un caso, cuando se entrevista a los primeros 11 transeuntes
con cllenta bancaria que atraviesan cielta calle a fin de for mar la mues-
tra. No podemos asegurar nada de antemano sabre las caracteristicas
de la muestra escogida, )' es posible que no sea representativa de la
poblaci6n sobre la que deseamos realizar la inferencia, pero es lin me-
todo barato )' f<lcil de poner en marcha.
Como puede colegirse, la ma),or parte de los metodos de diseno de
muestreo dependen de la independencia )' aleatoriedad en la selecci6n
de los elementos de la muestra con objeto de evaluar adecuadamente
el riesgo de utilizar esta para realizar una inferencia sobre toda la po-
blaci6n de interes.
4 PlIesta ell marcila del plan de lI1uestreo
En el plan de muestreo se describe la forma espedfica en que se va a
realizar la medici6n. Este plan suele incluir una prueba piloto, la orga-
nizaci6n del trabajo de campo)' las decisiones en torno al manejo de
los datos.
Si la medici6n se lIevar:\ a cabo par media de una encuesta )' la
muestra es de tamano considerable, siempre es conveniente hacer una
prueba de menor escala, lIamada prueba pilato. Gracias a la aplicaci6n
de esta prueba es posible anticipar problemas serios que se suscitarian
en la aplicaci6n de gran escala. Si se va a usar un cuestionario, ha)' que
plantear las preguntas de modo que se tenga la menor cantidad de no-
respuestas y los posibles sesgos por contestar incorrectamente.
Es comun que la labor de recabar (Ievantar) la informaci6n se dis-
tribu)'a entre varias personas, par 10 que es importante considerar su
capacitaci6n. Asimismo, conviene establecer un esquema de c6mo se
Santillana 2. Muestreo
215 _
_ 216
manejanin los datos, con especial cuidado en su calidad, sin obviar su
trascripcion, procesamiento y amilisis por medio de computadoras.
5 Allcilisis de los datos y los resultados
Antes de empezar con el amilisis de datos hay que hacer un estudio
preliminar de las mediciones obtenidas con objeto de desechar e ... ·ores
o descartar datos que esten obviamente equivocados. En este sentido,
se tendra que decidir como manejar las posibles no-respuestas. Por
alladidura, el aml li sis de los resultados debe celli rse a los objetivos del
muestreo.
En la unidad 1 nos hemos referido a como se presentan los resulta-
dos de un est udio estadrst ico (en tablas , diagramas, graficas 0 hi sto-
gramas). Al principio del proceso es comun tener un bosquejo del tipo
de reportes esperados como parte del planteamiento de los objetivos,
los cuales deben guiar tanto el est udio como el tipo de tablas, diagra-
mas y graficas con que se expondnin las conclusiones.
Para practicar
CD Explica con tus propias palabras la diferencia entre el muestreo sis-
tematico y el muestro por conveni encia.
2 Supon que se clesea realizar una encuesta para determinar el nume-
ro de pallales desechabl es que usan en promedio las mad res de be-
bes en una ciudad especffica. Sugiere un marco muestral para es ta
situaci6n.
o Respecto a la pregunta anterior, <cuales son las razones principales
por las que se preferirfa un muestreo en lugar de un censo'
Muestreo aleatorio probabilistico
MUESTREO ALEATORIO SIMPLE
Este es el metodo de muestreo basico y el mas conocido. Como hemos
dicho, consiste en seleccionar una muestra de tamallO 11 de una pobla-
cion de tamallO N, con la condicion de que esa muestra tenga la mi sma
probabilidad que otras de ser elegida. Si tenemos la li sta de los elemen-
tos de la poblacion de interes (esto es, el marco muestral), entonces el
me to do consiste en elegir de manera aleatoria 11 elementos de esa li sta
de N elementos.
Recordemos que en el ejemplo del peso de los recien nacidos, en el
que se seleccionaban muestras de tamallO dos, vimos que habra seis
posibles muestras. Ahora, para que cada una tenga la misma posibili -
UNIDAD 4 • ESTAOisTICA INFERENCIAl --antll ana
dad de ser elegida es necesario que la probabilidad de escoger una en
particular sea de t, 10 cual podemos lograr si metemos en un bolsa seis
papeletas numeradas de 1 a 6 y sacamos una al azar.
Una forma equivalente consiste en colocar en la bolsa cuatro pape-
letas numeradas de 1 a 4, donde cada una representa uno de los recien
nacidos; luego se ext rae una papeleta y en seguida, sin remplazarla, se
saca otra para obtener los dos elementos de la muestra aleatoria.
En general, si seleccionamos una muestra de tamal'lO 11 de un pobla-
cion de tamai\o N habra ( ) posibles muestras que pueden elegirse;
para que cada una de elias tenga Ia misma probabilidad de ser seleccio-
1
nada deseamos que todas tengan una probabilidad de   ~ ) .
Ejemplo
6
Determinemos la probabilidad de que un individuo concreto
forme parte de una muestra aleatoria. Puesto que selecciona-
mos al individuo en particular, hay:
(
N-1)
n - 1
formas de escoger a los restantes n - 1 individuos para formar la
muestra, por 10 que la probabi li dad de elegir a un individuo en
particular es:
(
N- 1)
n - 1
(N-l)'n!(N-n)! n
= =
  ~ )
(n -1)!(N-n)!N! N·
En el ejemplo anterior se observa que cuanto mas grande sea el tama-
1'10 de la muestra, mayor es la probabilidad de que un individuo en
particular forma parte de ella.
Cl Santillana 2. Muestreo
217 _
Figura 13
Distribucion uniforme [a, b I
_ 218
< Coincide este resultado teorico con los resultados obtenidos en
clase cuando mediste las estaturas de tus compal1eros'
Para evaluar el riesgo de cometer yen'os en las conclusiones inferi-
das a partir de una muestra se requiere que esta sea tomada de mane-
ra aleatoria )' luego aplicar 10 que hemos aprendido en las unidades
anteriores ace rca de teo ria estad1stica.
Ya hemos propuesto el empleo de una bolsa con papeletas para si-
mular un proceso aleatorio. Otro me to do utilizado en algunas loterias
para obtener numeros al azar es el uso de bolas dentro de una urna.
Otra opcion mas comoda es utilizar una tabla de nellneros aleatorios,
como se explica a continuaci6n.
C6MO UTILIZAR UNA TABLA DE NUMEROS ALEATORIOS
Antes de explicar como usar una tabla de numeros aleatorios, convie-
ne definir distribucion unifonne
Distribllcion llniforme
La distribuciol1 ul1!(orll1e es una distribucion continua definida sobre
el intervalo cerrado la, b]. donde la probabilidad de observar cual -
quier valor entre a )' b es la misma, es decir:
En otras palabras la funcion de clensidad es:
[
_ 1 _ si x E I a, b ].
f(x) = b - a
o en otro caso.
10 cual se muestra en la figura 13. Si una variable aleatoria sigue una
clistribucion uniforme entre a y b se suele escribir que se distribu),e
Ula,bl·
{(xl
I / (b - al -l-
x
a b
U[a,bl
UNlOAD 4 • ESTAOfSTlCA INFERENCIAL
A fin de seleccionar una muestra aleatoria debemos elegir /I elementos
(sin repeticion) de la lista de N individuos en el marco de muestra. En
la tabla 2 se presenta una coleccion de 500 observaciones tomadas de
una distribucion uniforme entre 0 y l. Como usa mas la distribucion
Llniforme, cada una de esas 500 observaciones tiene la misma probabi-
lidad de pertenecer al intervalo [0, 1]; dicho de otro modo, tenemos
500 nllmeros aleatorios entre 0 y 1, todos elias can seis digitos signifi-
cativos. La labia puede emplearse de muchas maneras para seleccio-
nar /I elementos de una lista de N.
La idea consiste en tamar 11 numeros de la tabla que representen a
los /I individuos que formanin la muestra. Como tenemos N elemen-
tos en nuestro marco Illuestral, una posibilidad es elegir una columna
)' un renglon al azar y luego multiplicar ese numero par N, quedarnos
con la parte entera del nlllnero y sumarle 1. Luego se repite este pro-
ceso )' se descartan posibles repeticiones hasta completar los /I ele-
mentos que fOfmaran la muestra.
Ejel11plo
7
Supan que deseamos elegir una muestra de tamaf\o cinco de
una poblacion de 100 individuos. Imagina ahara que elegimos
al azar la tercera columna y el decimo renglon de la tabla 2 (pagina
siguiente). EI numero que se halla en esa posicion es 0.870694; al
multiplicarlo par 100 y quedarnos can la parte entera obtenemos
87 + 1 = 88, a sea, nuestro primer elemento de la muestra seda el
individuo que aparece en la posicion 88 en la lista.
EI numero que sigue al 0.870694 hacia abajo en la columna de la
tabla es 0.335573, asi que el segundo individuo que seleccionada-
mas seda el 34.
Si continuamos de esta forma la muestra de cinco individuos
quedada formada par los individuos 88, 34, 21, 54 Y 2 de la lista del
marco muestral.
c;: nil. 2. Muestreo
219 _
Tabla 2 500 numeres aleateries entre a y 1
0.465871 0.017642 0.402723 0.232064 0.351965 0.726735 0.403321 0.420621 0.728496 0.921499
0.754780 0.999878 0.639975 0.435701 0.367085 0.561808 0.626229 0.990552 0.134357 0.738694
0.904172 0.470501 0.920418 0.477062 0.230033 0.519229 0.896590 0.675367 0.244366 0.241984
0.081832 0.456395 0.417749 0.878451 0.996744 0.955229 0.740728 0.614241 0.078101 0.249774
0.880384 0.877227 0.065697 0.381597 0.919131 0.258196 0.406632 0.349496 0.671303 0.254459
0.056261 0.264908 0.437619 0.045430 0.561420 0.248452 0.750351 0.009789 0.206747 0.868959
0.590233 0.183897 0.609839 0.048756 0.337985 0.105594 0.246771 0.737073 0.537012 0.080405
0.886248 0.506972 0.966439 0.260853 0.096439 0.807239 0.000716 0.351749 0.297457 0.687799
0.051119 0.537348 0.301676 0.709811 0.157101 0.675348 0.127766 0.512997 0.621266 0.793043
0.254744 0.987305 0.870694 0.950870 0.082776 0.698652 0.075442 0.424835 0.566280 0.327826
0.317114 0.503999 0.335573 0.729940 0.977993 0.802514 0.208417 0.351819 0.289416 0.978731
0.785165 0.677354 0.209055 0.969710 0.925137 0.181101 0.018022 0.608812 0.755837 0.075325
0.234963 0.229352 0.538132 0.189060 0.956493 0.956493 0.819856 0.997699 0.274060 0.075539
0.839123 0.418289 0.010725 0.955298 0.607041 0.770624 0.082538 0.484858 0.342538 0.357485
0.673213 0.311700 0.098646 0.044165 0.408044 0.214394 0.364308 0.392452 0.085850 0.649745
0.685313 0.815406 0.474787 0.532617 0.383484 0.606049 0.148167 0.201220 0.009253 0.369457
0.174878 0.177131 0.743637 0.128329 0.710841 0.216821 0.417161 0.222991 0.550942 0.697094
0.367576 0.469297 0.220602 0.464201 0.082629 0.028409 0.845963 0.846045 0.941079 0.518123
0.484793 0.163961 0.853885 0.487451 0.414812 0.533634 0.432811 0.073886 0.003129 0.044935
0.826624 0.460743 0.628718 0.242671 0.801161 0.756779 0.409757 0.053647 0.789715 0.521620
0.814542 0.411083 0.303983 0.776095 0.606108 0.307254 0.332878 0.720990 0.417633 0.946473
0.479442 0.070278 0.520832 0.622805 0.646818 0.127084 0.732524 0.606609 0.252948 0.974212
0.583165 0.182961 0.024163 0.338908 0.293599 0.234387 0.991805 0.457835 0.360253 0.375090
0.814721 0.162506 0.298830 0.705135 0.721422 0.846148 0.621299 0.586625 0.902978 0.309965
0.798758 0.571627 0.522359 0.038947 0.941300 0.989679 0.273945 0.733467 0.116046 0.869372
_ 220
UNlOAD 4 I ESTAOisTICA INFERENCIAl Smtillana
0.363872 0.799242 0.300408 0.822098 0.324889 0.912715 0.363106 0.358774 0.706334 0.088653
0.816429 0.274777 0.744231 0.419470 0.221679 0.332726 0.859806 0.468501 0.591131 0.358505
0.417534 0.471242 0.387897 0.086265 0.035639 0.498943 0.305330 0.753514 0.189327 0.261699
0.102862 0.743332 0.276568 0.627724 0.696143 0.843222 0.634365 0.569651 0.477139 0.641386
0.634649 0.444103 0.007745 0.310398 0.348690 0.267349 0.749967 0.073552 0.500282 0.187703
0.164792 0.108668 0.078485 0.951339 0.694648 0.873440 0.748146 0.941743 0.695783 0.300476
0.060376 0.424386 0.572026 0.702957 0.883971 0.136204 0.610481 0.842555 0.571682 0.466153
0.861913 0.408330 0.926623 0.467416 0.048638 0.617954 0.684900 0.778702 0.494182 0.722763
0.603976 0.214459 0.073589 0.344696 0.731884 0.312128 0.417216 0.030401 0.062141 0.90444 1
0.470461 0.356787 0.308407 0.308407 0.474750 0.227177 0.707790 0.856717 0.031244 0.499816
0.3037787 0.749061 0.652287 0.621517 0.523947 0.385440 0.042438 0.714351 0.058631 0.914906
0.966713 0.311021 0.663521 0.771043 0.807078 0.473391 0.517038 0.768507 0.256272 0.972070
0.446569 0.719896 0.471688 0.378023 0.428225 0.817662 0.580624 0.019709 0.517874 0.048545
0.684679 0.087314 0.140236 0.784255 0.526751 0.343917 0.089132 0.150067 0.215692 0.329278
0.174165 0.243445 0.450965 0.658443 0.250516 0.830377 0.658882 0.769366 0.664699 0.042879
0.625900 0.848288 0.206012 0.531356 0.484272 0.258489 0.054826 0.126622 0.657413 0.085208
0.346748 0.922374 0.167599 0.976919 0.255195 0.416052 0.539237 0.665199 0.721561 0.172577
0.418505 0.546249 0.244573 0.158005 0.764896 0.408330 0.100227 0.249613 0.783781 0.511655
0.454659 0.647219 0.839531 0.605025 0.687054 0.066918 0.984104 0.935957 0.364991 0.039640
0.957463 0.007681 0.838471 0.019997 0.691322 0.525288 0.427326 0.163397 0.008467 0.223992
0.992439 0.806109 0.662726 0.895816 0.474848 0.108677 0.062236 0.915075 0.196395 0.773039
0.645024 0.381488 0.211022 0.754983 0.721542 0.540973 0.687288 0.648071 0.321860 0.927559
0.817883 0.306096 0.556766 0.776351 0.751910 0.050538 0.817277 0.751394 0.404145 0.419378
0.421709 0.588239 0.694160 0.649686 0.157473 0.737179 0.873089 0.131508 0.161918 0.534590
0.742308 0.319456 0.125800 0.896084 0.619789 0.990482 0.128568 0.771298 0.257606 0.640701
e Santillana 2. Muestreo
221 _
_ 222
Cabe se!'ialar que para elegir los nlllneros de la tabla no es indispen-
sable seguir la columna hacia abaja, como se hiza en el ejemplo ante-
rior; podriamos seguirla hacia arriba 0 seguir el rengl6n a la derecha 0
a la izquierda, corna se indica a continuacion.
Ejemplo
8
Volvamos al ejemplo de los recien nacidos en el hospital, don-
de deseamos elegir una muestra de dos individuos de un total
de cuatro. Sup6n que escogemos al azar la segunda columna), el
rengl6n 25 ele la tabla. EI numero en esa posici6n es 0.571627. Al
multiplicarlo por 4, tomar la parte entera y sumarle 1 obtenemos 4,
por 10 que seleccionamos el nii\o cuatro como primer elemento de
la muestra.
Imagina que ahora decidimos seguir el rengl6n a la derecha. EI
siguiente numero aleatorio seria 0.522359, que nos daria otra vez el
numero 4 (que ya est:! en la muestra). Por ello descartamos ese nu-
mere y continuamos en el mismo renglon, 10 que nos lIeva al nllme-
ro 0.038947; almultiplicarlo por 4 y sumarle 1 resulta el nlllnero 1.
Por tanto, el segundo individuo de la muestra seria el ni!'io 1.
As!, tendriamos una muestra aleatoria formada por los recien
nacielos uno y cuatro.
Hay una gran variedad de tablas aleatorias. Roland Fisher)' Frank Yates
publica ron sus famosas Tablas esladfslicas pam la iJII'estigacioll ell &io-
logia, lIledicil1ay agriclIitllm en 1938, un volumen de 90 paginas que
contienen 34 tablas de numeros aleatorios y 29 paginas de instruccio-
nes de su uso y ejemplos de aplicaci6n. A mediados de la dec ada de
1940 la Rand Corporation edit6 un volumen con un mill6n de nllllleros
aleatorios. que en su momento fue la compilacion mas seria de su tipo.
En la actualidad es (omun utilizar los generadores de numeros alea-
torios de las computadoras, incluidos en toda hoja de caleulo; de he-
cho, tambien las caleuladoras cientlficas tienen una tecla, casi siempre
rotulada can las letras RAN a RAND (del ingles aleatorio), que genera
nt'llneros aleatorios.
UNlOAD 4 I ESTAOfsTICA INFERENCIAL
Numeros aleatorios en holas de c41culo
Las hojas de dlculo electr6nicas brindan una gran ventaja en el dl-
culo y posterior manejo de los numeros aleatorios. Para generarlos
usando una de ellas basta escribir la f6rmula correspondiente en la 0
las celdas necesarias, como se muestra en la figura (instrucci6n que
genera numero aleatorio U [0, 1] en Excel). Ahf se observa que la
instrucci6n en Excel para general' un numero aleatorio es = RANDO.
Si tenemos guardada la informaci6n sobre el tamano de la poblaci6n
(celda $B$2 en la figura), s610 tenemos que indicar en la celda la ope-
raci6n usual para seleccionar el individuo. La instrucci6n =TRUNCO
devuelve el menor entero del numero contenido en la celda de refe-
rencia que est. entre parentesis.

9 :RAUDO
10
11
12
13
"
15
16
17
santillan
, ,
,.
2.
33
2. Muestreo
223 _
Figura 14
Colecci6n de cuadros.
_ 224
Realicemos ahora la act ividad siguiente. Considera la poblaci6n de
cuadros que aparece en la figura 14. Calcula de las dos maneras descri-
tas a continuaci6n el promedio del area de las figuras en la poblaci6n:
1 Cada compallero escoge cinco cuadros "tipicos" de los 100 que se
muestran en la figura; esta elecci6n rormara una muestra por con-
veniencia.
2 Cada compallero elige aleatoriamente cinco cuadros de los 100 in-
c1uidos en la figura, para 10 cualutili za la tabla 2 a fin de obtener una
muestra aleatoria simpl e.
D
On
"
14
Compara los resultados del metodo 1 con los del metodo 2; por
ejemplo, traza un hi stograma del agregado de los resultados de todos
los participantes para observar la distribuci6n de las estimaciones de
promedio del area de los cuadros )' la varianza para los dos metodos
propuestos (conveniencia )' aleatorio simple).
UNlOAD 4 I ESTAOisTICA INFER£NCIAl Santjl ....
Lo mas probable es que cuando se utilice la muestra por convenien-
cia se sobrestime el promedio, que es de 7.5 cuadros, aproximadamen-
teo Lo que debemos destacar es que, en cambio, con muestreo aleato-
rio se puede medir el riesgo de equivocarnos y con cOl1veniencia, no.
MUESTREO ALEATORIO SISTEMATICO
Por principio, conviene recordar que el muestreo aleatorio sistematico
consiste en elegir un elemento al azar y luego seguir seleccionando
individuos en la lista saltando un numero fijo k de ellos.
Si deseamos escoger una muestra de tamaflO n de una poblaci6n de
tamaflO N, entonces debemos caleular primero el coeficiente de eleva-
cion k = N /11. EI proceso consiste en eseoger un numero aleatorio
entre 1 y k, al que lIamaremos i, y a partir de el seleceionar los elemen-
tos i + k, i + 2k, i + 3k, ... i + (n - l)k hasta completar los n elemen-
tos de la muestra.
No olvidemos que para que este metodo resulte en una muestra
representativa se requiere que las unidades de muestreo (elementos
por muestrear) esten agrupadas aleatoriamente en el marco muestral
(lista de los elementos en la poblaci6n).
Ejemp/o
9
Sup6n que deseamos obtener una muestra de tamafio cinco
de una poblaci6n de tamafio 50. Para este easo el coeficiente
de k = N = 55
0
= 10. Imagina que escogemos la columna seis
n
rengl6n 31 en la tabla de numeros aleatorios (tabla 2); el numero
que aparece en ese sitio es 0.873440; al multiplieario por 10, tomar
la parte entera del resultado y sumarle 1 nos queda el primer ele-
mento que hemos de elegir: i = 9. Es deeir, el primer elemento de
nuestra muestra es el noveno de la li sta; el segundo elemento serfa
i + 1(10) = 19, el tercero i + 2(10) = 29, el cuarto, 39 y el quinto
y ultimo i + 4(10) = 49. Asf, los cinco elementos de la muestra
serfan los que se hallan en las posieiones 9, 10,29,39 Y 49.
Como vemos, en este casa basta usar un numero aleatorio para
conseguir la l1luestra, en vez de utilizar al menos los n numeros alea-
torios que se requieren en el muestreo aleatorio simple.
Si la lista del marco de muestreo esta ordenada de manera aleatoria,
entonees se puede demostrar que el muestreo aleatorio simple equiva-
Ie al muestreo aleatorio sistematico.
) Santitlana 2. Muestreo
225 _
_ 226
M UESTREO A LEATORIO ESTRATI FICADO
En el muestreo aleatorio estratificado podemos dividir la lista (0 mar-
co muestral) de tamaiio N en t diferentes estratos (0 subconjuntos) .
Sup6n que N" N
2
, ... , Nt son el nl1l11erO de individuos en cada estrato,
esto es, N, es el numero de individuos de la poblaci6n que pertenecen
al estrato i. Entonces ha)' dos proceclimientos para seleccionar la
muestra de tamano /1 de la poblaci6n total: muestreo aleatorio estrati-
ficado constante )' muestreo aleatorio estratificaclo proporcional.
M UESTREO ALEATORIO ESTRATI FICADO CONSTANTE
En este tipo de muestreo se el ige muestrear la misma cantidad (es de-
cir, una cantidad constante) de individuos de cada estrato. Dicho de
otro modo, en cada estrato escogemos /1 / t individuos, una cantidad
constante de cada estrato). Para seleccionar a los indivicluos de cada
estrato realizamos un muestreo aleatorio simpl e intermuestral, es de-
cir, para cada estrato generamos /1 / t numeros aleatorios a fin de esco-
ger a esos individuos dentro del estrato. Naturalmente, para aplicar
este muestreo suponemos que ningun estrato tiene menos de 17 / t in-
dividuos.
Ejemplo
1 0
Sup6n que tenemos tres estratos en la muestra )' que el pri-
mero inclu)'e a 10 individuos, es decir, N, = 10; el segundo
tiene el doble, N
z
= 2N, = 20, Y el tercero tiene el triple N3 =
3N, = 30. Si deseamos obtener una muestra aleatoria de tamano
seis, alutilizar muest reo aleatorio estratificado constante entonces
. , 17 6
eieglnamos t = 3" = 2 individuos de cada estrato. As,:
1 Dentro del estrato 1 escogeriamos ados individuos al azar de los
10. Si en la tabla 2 escogemos el numero en la segunda columna,
quinto rengl6n, 0.877227, )' recordamos 10 aprendido sobre mues-
treo aleatoric simple, multiplicamos ese numero por 10 y la parte
entera mas 1 nos indica que debemos elegir el individuo 9. Si se-
guimos el rengl6n a la derecha, elegiriamos al individuo 1.
UN l OAD 4 • ESTAOfsT1CA INFERENCIAL ) Santillana
2 Dentro del estrato 2 escogeriamos ados individuos al azar de los
20 que 10 forman. Una vez mas, podemos usar la tabla de I1l1me-
ros aleatorios (tabla 2) )' escoger la columna 5, primer rengl6n,
donde aparece el nlllnero 0.351965; al multiplicar por 20 )' to-
mar la parte entera mas 1 entonces elegiriamos al octavo indivi-
duo de la lista del estrato 2. Luego, si seguimos a la derecha en la
tabla lIegamos al numero 0.726735, que tras realizar las opera-
ciones correspondientes nos indica que debemos elegir el ele-
mento 15 de la lista del estrato 2.
3 Dentro del estrato 3 escogeriamos ados individuos al azar de los
30 que 10 componen. Si utilizamos elldtimo rengl6n )' la prime-
ra columna de la tabla 2 tenemos el nUlllero 0.742308, y siguien-
do la columna hacia arriba el nUlllero 0.421709; tras realizar las
operaciones respectivas encontraremos que esos numeros co-
rresponden a los individuos 23 )' 13 dentro del est rato 3.
Observa que si los estratos tienen poblaciones que varian de Illane-
ra significativa, entonces algunos de ell os quedaran sobrerrepresenta-
dos )' otros subrepresentados en la Illuestra. En el ejemplo anterior, si
bien la Illitad de la poblaci6n pertenece al est rato 3, s610 queda
representada en la Illuestra por una tercera parte (i). Por otro lado, el
estrato 1 contiene s610 16%, aproximadalllente, de la poblaci6n, pero
en la Illuestra ocupa Im\s de 30% del tolal. En estos casos suele prefe-
rirse un muestreo aleatorio estratificado proporcional, pues asegura
una representaci6n mas justa.
MUESTREO ALEATORIO ESTRATIFICADD PROPORCIONAL
En elllluestreo aleatorio estratificado se desea que el nlllnero de indi-
viduos pertenecientes a un estrato especifico )' que pasen a formar la
muestra sean represenlativos de la proporci6n de ese estrato respecto
a la poblaci6n tolal. Sabemos que tVi es la proporci6n del estrato i
II
respecto a la poblaci6n total. Si representamos con ", el numero de
individuos del estrato i que conforman la muestra, 10 que deseamos es
que no sea aproximadamente )11, que el numero de individuos del
estrato i en la Illuestra sea proporcional a su numero en la poblaci6n,
)' que   = II, es decir, que las suma de los indi viduos elegidos de
cada estrato sea igual al tamafio de la Illuestra que deseamos obtener.
SantiU nil 2. Muestreo
227 _
_ 228
Ejemplos
11
Consideremos estratos del mismo tamai\o que los del ejem-
plo anterior: N[ = 10, N2 = 20 Y N3 = 30. Sup6n que que-
remos tener una muestra de n = 6. Si hicieramos un muestreo
aleatorio estratificado proporcional escogerfamos aleatoriamente:
I n [ = m) 6 = 1 individuo del primer estrato.
I n
2
=   ~ ~ ) 6 = 2 indi viduos del segundo estrato.
I n3 =   ~ ~ ) 6 = 3 individuos del tercer estrato.
Recordemos que si los elementos del marco muestral estan orde-
nados aleatoriamente, el muestreo aleatorio sistematico equivale al
muestreo aleatorio simple. Por ende, si los elementos de cada es-
trato dentro de lista estan ordenados de manera aleatoria entonces
basta elegir un numero aleatorio por estrato y, a partir de el, com-
pletar de forma sistematica los elementos requeridos de este estra-
to para formar la muestra.
Por ejemplo, el numero aleatorio en el rengl6n 40, octava co-
lumna de la tabla 2 es 0.769366, que nos indica que debemos esco-
ger el elemento 8 de los 10 que constituyen el primer estrato, con
10 que ya elegimos el unico elemento de la muestra en ese estrato.
N
Para el segundo estrato el coeficiente de elevaci6n es k = _ 2 =
2 n2
2
0
= 10. Si seguimos en la misma columna 8 hacia abajo, tendre-
mos el numero aleatorio 0.126622, de modo que el primer elemen-
to que hemos de escoger del segundo estrato es i = 2, mientras que
el segundo elemento es i + k = 2 + 10 = 12, el duodecimo ele-
mento del estrato.
Por ultimo, el coeficiente de elevaci6n para el tercer estrato es
k
N3 30 10 I" , al . I .
= - = -3 = lye slgUiente numero eatono en a mlSITIa
n3
columna es 0.665199, que indica que el primer elemento elegido
en el tercer estrato es i = 7, el segundo 17 (i + k) y el tercero 27
(i + 2k).
12
Observa los datos que se presentan en la tabla 3, donde apa-
recen 100 dientes de una tarjeta de crMito, su sexo, el saldo
en su cuenta y la cantidad correspondiente a alimentos pagados con
la tarjeta. En la primera columna se indica el tipo de tarjeta que
posee el diente, que en este caso nos permite dividir la poblaci6n en
tres estratos, con 1 para representar a dientes con tarjeta basica, 2 a
dientes con tarjeta especial, y 3 a dientes con tarjeta preferente.
UNlOAD 4 I ESTAOfsT1CA INFERENCIAl ~ Santillana
Tabla 3 Tarje!as de credi!o*
Saldo en cuenta Compra en alimentos
Estrato Cliente Sexo
(miles de pesos) (miles de pesos)
1 M 4.378541206 3.886450397
1 2 F 4.014912601 3.321748901
1 3 M 1.429821524 1.202212787
1 4 M 2.828294767 2.71624971
1 5 F 1.39748199 1.343406265
1 6 M 4.841573971 4.499053679
1 7 M 1.752206033 1.717938746
1 8 F 2.723923183 2.0099374
1 9 F 1.15476065 1.090332222
1 10 F 3.788420237 3.242757548
1 11 M 2.664791044 2.113548011
1 12 M 1.686790819 1.456803801
1 13 M 3.886893926 3.586470849
1 14 M 2.88313936 2.200491816
1 15 M 2.389047192 1.909246978
1 16 F 4.295502327 3.659662749
1 17 F 1.159962856 0.825848548
1 18 F 3.565944268 3.302787611
1 19 F 1.340990694 1.168514141
1 20 F 4.042540269 3.547640634
1 21 F 4.717401329 4.206590862
1 22 F 1.034920229 0.740126254
1 23 M 1.627062029 1.233943935
1 24 F 4.162183792 3.958549981
1 25 F 2.659312886 2.468407607
1 26 M 2.085102345 1.829347587
27 F 3.518801261 2.992961567
1 28 F 2.144292346 1.67140609
1 29 M 3.847443732 3.388579753
1 30 F 3.151924338 2.467743732
1 31 M 2.122093592 1.974778686
1 32 F 4.106485453 3.601714985
1 33 F 1.850251427 1.411106973
1 34 M 1.136292424 0.848821654
1 35 F 2.059722511 2.001007301
C Santillana 2. Muestreo 229
-
Tabla 3 (conti nua)
Estrato Cliente Sexo
Saldo en (uenta Compra en alimentos
(miles de pesos) (miles de pesos)
2 36 F 6.637084096 3.624304874
2 37 M 11.70484756 5.356658313
2 38 M 12.20986432 4.467827475
2 39 F 12.97946495 5.333264876
2 40 M 11.22772178 6.359474341
2 41 M 10.40781038 4.794760072
2 42 M 9.007717102 3.050554531
2 43 F 10.69160225 7.446503388
2 44 F 6.127601854 2.821643937
2 45 M 12.07974808 8.442256187
2 46 M 4.107796401 2.602125838
2 47 M 11.57039642 3.804688949
2 48 M 5.765162418 3.17703855
2 49 F 7.562048199 3.220601849
2 50 M 5.777304759 3.366102086
2 51 M 9.811978033 4.370441062
2 52 M 7.338207878 2.752457587
2 53 F 12.44151613 5.388800584
2 54 F 11.03189109 5.41102145
2 55 F 9.104298937 5.536661171
2 56 F 5.221800566 2.240597578
2 57 F 8.20530631 2.96757454
2 58 F 5.215216314 3.287394943
2 59 M 6.54135945 3.607204384
2 60 M 7.593098898 3.519047356
2 61 M 4.726223144 3.266399648
2 62 F 10.13943555 6.39359722
2 63 F 10.29852344 3.226139801
2 64 F 6.700648259 3.116793521
2 65 F 5.96849276 3.190402906
2 66 F 6.469334744 2.85093413
2 67 F 11.23846155 7.594865175
2 68 F 12.83284027 6.04578731
2 69 F 11.22622358 4.146729915
2 70 M 9.643725512 3.717358443
-
230 UNlOAD 4

ESTAOfsTlCA INFERENC1Al -till 11
Tabla 3 (concluye)
Saldo en (uenta (ompra en alimentos
Estrato Cl iente Sexo
(miles de pesos) (miles de pesos)
2 71 M 10.9301935 4.456837666
2 72 M 9.33228121 4.426150245
2 73 F 12.23570622 8.040602492
2 74 F 5.772017869 2.954890052
2 75 F 11.8894305 4.941682083
2 76 F 6.998866237 4.774626322
2 77 M 9.767260437 5.873571005
2 78 M 9.166695991 5.526783469
2 79 M 6.023269393 2.360209084
2 80 F 4.430649183 2.92245653
2 81 M 5.307571003 3.438229433
2 82 F 4.556759869 1.510101712
2 83 M 10.84061672 6.249960022
2 84 M 11.59874776 5.034457161
2 85 M 5.20369571 1.759071058
3 86 F 24.458903 8.369234489
3 87 M 22.66251355 8.353572149
3 88 M 21.05559589 7.976256114
3 89 M 18.2166143 6.492534533
3 90 M 18.73839036 7.38271671
3 91 F 19.05624617 7.29682149
3 92 M 21.74644338 7.54017926
3 93 F 23.11263456 9.190517141
3 94 M 26.22176503 8.718871646
3 95 F 25.22318458 7.892227966
3 96 M 22.75430679 8.158653708
3 97 M 20.95683005 7.237392966
3 98 M 21.21208536 7.062175997
3 99 M 26.81124545 9.042285449
3 100 M 14.73222859 5.756675708
* 1 = tarjeta basica, 2 = tarjeta especial, 3 = tarjeta preferente. F = femenino, M ::: masculino.
Sup6n que deseamos estimar el promedio de gastos con la tarjeta de credito en el
bimestre anterior mediante muestreo aleatorio estratificado de tamano n = 12. En
este caso, N I = 35 (cl ientes con tarjeta tipo 1), N2 = 50 (clientes con tarjeta tipo 2)
y N3 = 15 (clientes con tarjeta tipo 3).
o Santillana 2. Muestreo 231
-
_ 232
Si usaramos muest reo estratifi cado constante entonces esco-
gerfamos cuatro elementos de cada est rato. Una posibilidad para
el primero (tarj eta tipo 1) consiste en acudir a la tabla 2 y escoger
la columna 2 y el sexto renglon; luego, seguir el renglon a la dere-
cha, donde aparecen los numeros aleatorios 0.264908, 0.437619,
0.045430, 0.561420, 10 que nos lI evarfa a seleccionar los ciientes
10, 16, 2 Y 20, respectivamente.
Para el estrato dos (tarj eta tipo 2) podrfamos ir a la tabla yesco-
ger la columna tres, renglon 11, y luego seguir el renglon a la dere-
cha, con 10 que lIegaremos a los numeros aleatorios 0.335573,
0. 729940, 0.977993, 0.802514; ellos nos conducirfan, respectiva-
mente, a seleccionar a los c1ientes 52 (que es el elemento 17 del
estrato 2), 72 (elemento 37 del estrato 2), 84 Y 76.
Por ultimo, si seguimos la primera columna desde el primer
renglon hacia abajo tendremos los numero aleatorios 0.465871,
0.754780,0.904172 Y 0.081832, que nos indica que debemos esco-
ger a los c1ientes 92 (elemento 7 del estrato 3), 97, 99 y 87.
Como queremos est imar el saldo promedio, al sumar el saldo de
estas unidades y dividirlo entre n obtenemos $11 965.54. Sin embar-
go, el saldo real es $8570.65, por 10 que esta muestra 10 sobrestima,
10 que no debe extral'iarnos, ya que los c1ientes con tarjeta tipo 3, que
tienen said os mayores, estan sobrerrepresentados en la muestra.
Por otro lado, si empl eamos muestreo estratificado proporcio-
nal debemos elegir, para el primer estrato, aproximadamente U,;;,)
12 = 4.2 elementos, es decir, n) = 4 individuos; del estrato 2 elegi-
damos "2 = 6 indi vi duos y del estrato 3 alrededor de " 3 = 2 indi -
viduos [= (/';;')12 = 1.8 J.
Una opcion consiste en elegir la columna nueve, elemento 22 de
la tabl a 2 y luego seguir hacia abajo, con 10 que tendremos los nu-
meros aleatorios 0.252948, 0.360253 Y 0.902978. Si suponemos que
la Iista de los c1ientes con base en el tipo de tarjeta (estrato) que se
ordena de modo aleatorio, entonces seleccionamos, para el primer
I I
· . 3 [ k N) 35 8 .
estrato, a c lente numero ya que = - = - = e 1 =
n, 4
8(0.252948) + 1 = 3]. al numero 11 (i + k = 11), al numero 19
(i + 2k) y al 27.
Los c1ientes que escogeriamos con tarjeta tipo 2 serfan el nume-
N2 50
ro 38 [k = - = -6 = 8, i = 3 = 8(0.360253) + 1, tercer individuo
n
2
del estrato 2]. el numero 46 (38 + 8), el 54, el 62, el 70 y el 78.
Por ultimo, para los c1ientes con tarjeta tipo 3 [k = N3 =   ~ = 7 J
escogedamos a los numeros 92 y 99. "3
Con esta muestra proporcional obtenemos $9484.29 como esti-
macion del saldo promedio, cantidad mas cercana al promedio real
que el obtenido anterionnente con muestreo estratificado constante.
UNlOAD 4 • ESTAOrSTICA INFERENCIAL
Hemos explicado varias formas de elegir una muestra. En esta sec-
cion vimos que si se cuenta con informacion adicional que nos ayude
a clasificar a los individuos de la poblaci6n, una muestra aleatoria es-
tratificada proporcional nos permite const ruir una muestra mas re-
presentativa. De las preguntas que planteamos al empezar el tema del
muestreo s610 nos falta contestar el tamaflO que debe tener n para que
nuestras estimaciones no disten demasiado de su valor real poblacio-
nal, tema que trataremos en la proxima seccion.
Para practicar
CD <Cua! es la esperanza de una variable aleatori a unifonne en el inter-
valola,bl'
2 Sup6n que tenemos una lista de 300 personas que forman la pobla-
ci6n de interes. De elias, 200 pertenecen al estrato 1 )' 100 al estrato
2. Obten una muestra de tamaflO" = 12 mediante:
a Muestreo aleatorio simple sobre el total de la poblaci6n.
b Muestreo del estrato 1 mediante un muestreo aleatorio sistema-
tico.
c Muest reo aleatorio estratifi cado proporcional.
0 Si tuvieramos "l = 10, "2 = 30)' "3 = 40 en un muestreo estratifi-
cado proporcional )' N = 2000, <de que tamallo serfa cada uno de
los tres estratos'
Distribucion muestral y el teorema central del limite
Recordemos el ejemplo presentado al empezar el tema del muestreo,
donde escogiamos una muestra de dos recien nacidos para est imar el
peso promedio de la poblaci6n de bebes nacidos en ese dia (cuatro en
total). Para cada muestra calculamos el peso pro media de los nill0s en
esa muestra como se especifica a continuaci6n:
Posibles
muestras
x peso
promedio (en kg)
( 1, 2)
2.45
(1 , 3) (1, 4)
2.4 2.65
(2, 3) (2, 4) (3, 4)
2.35 2.6 2.55
Podemos considerar la acci6n de escoger a los dos recien nacidos un
experimento aleatorio )' calcular su peso promedio como una variable
CSanti1lana 2. Muestreo
233 _
_ 234
aleatoria X. Anteriormente hemos usado X para estimar la media po-
blacional. En la tabla anterior mostramos todos los posibles valores
que puede tomar esta variable aleatoria cuando la muestra selecciona-
da es de tamafio 11 = 2. No olvidemos que todos los bebes tienen la
misma probabilidad de ser elegidos (P[X = xl = t); entonces el valor
esperado del peso promedio de los bebes en la muestra es:
1 6 1
E [X I = "6 ~ Xi ="6 (2.45 + 2.4 + 2.65 + 2.35 + 2.6 + 2.55) = 2.5,
1= 1
que resulta ser igLial a la media poblacional (Jl = 2.5). En la unidad 1
utilizamos la notacion x para representar la media muestral; asi, X = x,
de 10 que conciLlimos que el valor esperado de la media muestral es la
media poblacional, la cLial se representa con el sfmbolo fIx. Este resul-
tado es valido para cLlalqLlier muestra aleatoria, como se indica en el
teorema siguiente.
TEOREMA 2. Ell elmuestreo aleatorio el valor esperado de la media
mllestral es igllal a la media poblaciollal; es decir Jl x = Jl.
Por otro lado, la varianza de la variable aleatoria X = X, que denotamos
pOl' ai, es:
1 6
Var [XI = - ~ (Xi - x)2 = 0.011666
6 ;=1
para II = 2 Y su desviaci6n estandar, representada con ax' seria 0.10801
(como ya habfamos calculado). Sabemos que la desviaci6n estandar
poblacional es aproximadamente a = 0.18708 Y vemos que:
~ ~ = 0.18708 [4="2"=0.10801;
y;; -V ~ \12 \ 1 4-=1
para este caso:
a ~
ax = \0, V ~ .
De la misma forma, para J1 = 3 tenemos que Ox es aproximadamente
0.62 y:
a !S'" - II 0.18708 rs-3
- = =0062
\0, \ iV-I \13 \ 4-1 ..
UNIDAD 4 • ESTAOfSTlCA INFERENCIAL Santillana
Yaqui tambien se cumple que:

a
x
=  
De hecho, esto es cierto en general.
TEOREMA 3. Para lllla 1I1llestra de tamaFIO n tamada aleatorial11ellte
de lIna pablacion de tamalia N (can N > 11), call media y desvia-
cion estalldar a, la desviacioll estandar del prall/edia II1l1estral esta
dada par:

a
x
=  
Veamos ademas que cuando N > 20n entonces:
(J!2
-11
= 1
\ N -l '
esto es, si el tamano de la poblaci6n es al menos 20 veces el de la mues-
tra, entonces la desviaci6n estandar de la media muestral puede caleu-
larse simplemente como:
Para una II fija, a medida que N se vuelve mu)' grande (cuando N tiende
' N-II W,IV-II
a infinilo), \1 tiende a 1. EI terminG recibe el nom-
N-[ N-l
bre de carrecciol1 par pablacion jinda )' ax error estalldar de la media.
Asi, la desviaci6n estandar de la media muestral es siempre mas
pequel1a que la desviaci6n estandar poblacional, como 10 comproba-
mos en el ejemplo reiativo al peso deJo recietLnacidos. Se deja como
ejercicio para ellector demostrarlo tambien para los datos de la tarjeta
de credito (valiendonos de la tabla 3), si sabemos que la desviaci6n
poblacional es de alrededor de 6.6.
Ejemplos
13
Supan que tenemos una poblacion N = 800)' que tomamos
una muestra 11 = 100. Calculemos euanto cambia el error
estandar de la media si reducimos la muestra a la mitad.
r Santillana 2. Muestreo
235 _
_ 236
La mitad de 11 = 100 es 50. as! que deseamos evaluar ax para 111 =
100 Y 112 = 50. Como N = 800 no es mayor que 2011
1
= 2000 ni que
2011
2
= 1000. entonces debemos utilizar la correccion por pobla-
cion fin ita. de donde tenemos que para 11
1
:
a- = ~ ~ = _ a _ ~ 700 = 0.0936a;
, Vn -V ~ v'1Oo 799
en tanto que para 112 :
a ~ a f 7 s  
ax = Vn -V ~ = V5ci -V m = 0.1370 a .
AI dividir estas cantidades. la de 112 entre 11 l' a fin de establecer
cuanto crece el error estandar de la media al disminuir a la mitad
la muestra reconocemos que 0.1370/0.0936 = l.4638; dicho de
otra forma. el error estandar crece aproximadamente l.5 veces al
disminuir el tamano de muestra a la mitad.
14
Ahora consideremos una poblacion de N = 100000 (Ia po-
blacion de la ciudad de Mexico es aproximadamente 200 ve-
ces ese tamai\o) y pensemos en dos muestras. una de tamal'io
"1 = 1000 Y otra 112 = 100 (11 1 es 10 veces mas grande que 11
2
). Para
ambos casos tenemos que N > 2011 con creces. por 10 que para los
dos podemos usar ax = a / \ In. AI dividir el error estandar de la
muestra con tamano "2 entre 11 1 ahora tendriamos:
ViOO = 0.31;
V 1000
en otras palabras. al reducir la muestra de 1000 a 100 el error es-
tandar no aumenta en mas de 32%.
De los ejemplos anteriores podemos colegir que:
• La desviacion estandar de la media muestral siempre es mas peque-
11a que la desviacion estandar poblacional.
• Muchas veces. para poblaciones muy grandes no es necesario elegir
muestras grandes a fin de alcanzar una buena estimacion de la me-
dia poblacional.
No esta de mas notar que no podriamos deducir todos estos resulta-
dos si no escogieramos muestras aleatoriamente. De ah! la importan-
cia de usar muestreo probabiHstico (aleatorio) para la cuantificacion
UNlOAD 4 I ESTAOfSTICA INFERENCIAl Cl Santillana
del riesgo que tomamos al reali zar esti maciones usando informaci6n
parcial de la poblaci6n.
Recordemos que al principio de esta unidad apraximamos la distri-
buci6n bi nomial por medi o de la dist ribuci6n normal. De hecho, el
teorema que sigue nos permite ut ili zar la distribuci6n normal para
aproxi mar la distri buci6n del promedio (media) muestral.
TEOREMA 4. TEOREMA CENTR AL DEL LIMITE. Para cualquier
densidad de una variable aleataria can media f1 Y varianza a
2
fini-
tas, la distribuci6n de la media muestral para una muestra aleata-
ria simple de tamalio n, wando n es grande, sigue una distribuci6n
normal con media f1 Y desviaci6n estdndar a / Vn, es decir:
En otras palabras, el teorema central del limite expresa que si cono-
cemos la media y la desviaci6n estandar de la pobl aci6n podemos
aproximar la distribuci6n de la media muestral medi ante una normal,
10 cual es valido para muestras de tamano n ;0. 30. Este teorema es muy
util porque permite evaluar la confiabilidad (riesgo) de las conclusio-
nes que obtengamos a partir de la muestra, como se ejempli fica a con-
tinuaci6n.
£jemplo
15
Sup6n ahora que la poblaci6n de bebes sobre la que desea-
mos estimar eJ peso promedio al nacer es de N = 100000
(segun datos deII NEGI , el numera de nacimientos regist rados en
eJ 2006 fue de 2 505 939) Y que pOI' estudios que reali za la Organi -
zaci6n Mundial de la Salud (OMS ) la desviaci6n estandar de los
pesos es de 550 gramos.
Si se toma una muestra de 1'1 = 500 ninos y la media muestral
observada fue de 3100 gramos (3.1 kg), <cuan seguras podemos
estar de que eJ peso a la poblaci6n no se aleja mas de 45 gramos de
la estimaci6n muestral
7
En este caso, desconocemos el valor de la media poblacionaJ f1;
sin embargo, pOI' el teorema central del limite sabemos que la dis-
tribuci6n de la medi a muestral es una variable normal con medi a
f1 y desviaci6n estandar ax = a / Vn, pues N = 100000 > 201'1 =
1000. Calcul3ndola explicitamente tenemos que la desviaci6n es-
tandar de la medi a muestral esc
a 550
ax = Vn = \1' 500 = 24.59 g.
C Santiliana 2. Muestreo
237 _
_ 238
Asf. X se distribuye como una normal (I'. 24.59). Por tanto. si qui-
sieramos detenninar la probabilidad de que la media poblacional
difiera en no mas de 45 gram os de nuestra estimacion 10 que ten-
drfamos que caleular es: P [ -45 :5 x - I' :5 45]. pero:
y sabemos que (x - 1') / ax se distribuye como una normal N(O.l).
asf que 10 que queremos caleular es:
[
-45 x - I' 45] [ -45 x - I' 45]
P ax :   ~ :   ax = P 24.59 :   ~ :   24.59 =
P [ - l.82 :5 Z :5 l.82].
Pero P [ - l.82 :5 Z :5 l.82] = P [ Z :5 l.82] - P [Z :5 - l.82 ]. Y si
usamos la tabla de la distribucion normal estandar (tabla 1, pagi-
nas 199 y 200) tenemos que:
P [ - l.82 :5 Z :5 l.82] = P [ Z :5 l.82] - 1 + P [Z :5 l.82] =
2(0.9656) - 1 = 0.9312.
Por tanto. obtenemos una probabilidad de 0.93 y sabemos que la
media de la poblacion no difiere en mas de 45 gramos de 3100
gramos.
Otra forma de ver esto es que solo hay un 0.07 de probabilidad
de que nuestra estimacion difiera en mas de 43 gram os del valor
poblacion.
TEOREMA 5. ESTANDARIZACION DE UNA DISTRIBUCION NOR-
MAL. La transfonnaciol1 Z indica que si X es L1na variable aleato-
ria qLle se distribllye como /Ina normal. con media I' y desviaciol1
estandar a [es decil; X - N( 1'. a)]. el1tol1ces la variable alentorin
Z = (X - fl) / a se distribLiye C0ll10 Lilla 110rmal call media 0)' des-
via cia 11 estcindar J.
Ell otras palabras:
X -Il
Z= -- -N(O 1)
0- , .
. ,
10 qlle 110S perlllite lItilizar la tablas de In distribllciol1 110rmnl es-
tandar (tabln 1. ptigil1ns 199 y 200).
U N l OA D 4 • ESTAOISTICA INFERENCIAl mtil ;,.:
Ejemplo
16
En la regi6n de Amatith\n y Tequila, en el estado de jalisco,
se desea estudiar la producci6n de plantas maduras de agave
en una extensi6n de 110000 hectareas (ha). Para realizar el estudio
se selecciono una muestra aleatoria de 100 ha, la cual dio una pro-
ducci6n promedio de 90 plantas pOl' hectarea.
De acuerdo con sus estudios, el Consejo Regulador del Tequila y la
Camara Nacional de la Industria del Tequila estiman que la desvia-
ci6n estandar de la producci6n es de 10 plantas pOl' hectarea para
la regi6n de jalisco. lCual es la probabilidad de que la producci6n
media pOl' hectarea en la region este entre 88 y 92 plantas>
Como 110000 = N> 20n = 2000, entonces podemos caleular la
desviaci6n estandar muestral del promedio de produccion (por hal:
o 10
0-=--=--= 1
x Vn ViOo '
de 10 que se desprende queP[-2:S" - f1:S 2] = P[-2:S Z:S 2] =
0.9544, con 10 que con una probabilidad de 0.95 el promedio pOl'
hectarea de plantas maduras producidas se halla entre 88 y 92.
En los dos ejemplos anteriores evaluamos el riesgo de equivocarnos
pOl' utilizar una muestra en vez de los datos sobre toda la poblaci6n.
Expresamos ese riesgo con una probabilidad de que nuestra estima-
ci6n sea correcta en un intervalo de valores. Esta evaluacion es posible
gracias al uso de muestras aleatorias (y la teorla que hemos expuesto
hasta ahora en ellibro).
En la pr6xima seccion abordaremos la elaboracion de cuestiona-
rios, que es un metodo utilizado com un mente en las ciencias sociales
para levan tar informaci6n de las poblaciones.
Para practicar
CD Si tomamos una muestra de tamaI'1O 50 de una poblacion de tama-
110200 Y sabemos que la desviaci6n estandar de poblacional es de 5,
lcuanto sera la desviaci6n estandar de la media muestral>
2 EI jefe de guardias de seguridad de un centro comercial quiere saber
cuanto demoran los policias a su cargo en realizar una ronda alre-
dedor dellugar. Para ella decidi6 tomar una muestra de 25 rondas a
10 largo de la semana, 10 que Ie dio un promeclio de 15 minutos. Si
sabe que la desviaci6n estandar es de l.5 minutos, lcual es la proba-
c) Santillana 2. Muestreo
239 _
_ 240
bilidad de que las rondas de la semana no se hayan lIevado menos
de 14 minutos ni mas de 16?
o Una fabr ica de botones produce alrededor de 50000 botones dia-
rios. Sabemos que la desviaci6n estandar del peso de los botones es
de 0.1 gramos. EI inspector de calidad tom6 una muestra de l50
piezas y observ6 un peso promedio de 2 gramos, y desea saber cual
es la probabilidad de que los botones producidos ese dia no dis ten
de dos en mas de 0.025 gramos.
La aplicacion de cuestionarios
Como hemos visto a 10 largo de la unidad, las medici ones para esti-
mar las variables de interes pueden lIevarse a cabo de numerosas for-
mas. Los cuestionarios son una manera en que suelen tomarse estas
medidas.
No todas las preguntas incluidas en un cuestionario tienen que ser
respondidas por el entrevistado; a veces una parte puede ser rellenada
por eI entrevistador, sobre todo cuando suponen informaci6n que se
puede observar.
Los cuestionarios se apli can de diversos modos:
Entrel'ista personal. En este procedimiento un entrevistador aplica
personal mente a los elementos de la muestra una serie de preguntas
preparadas de antemano. La ventaja radica en que el entrevistador
puede aclarar malos entendidos y notar reacciones especificas del en-
trevistado. Se requiere que los ent revistadores esten bien capacitados
para que no induzcan tendencias que no son propias de la muestra;
por ejemplo, debido a que hacen algun gesto 0 ademan, 0 cambian el
tono de la voz al plantear las preguntas.
Entrevista par telefono. Este metodo de aplicaci6n de cuestionarios
suele ser mas barato que el de las entrevistas personales, ya que no
requiere ningun traslado del entrevistador. Sin embargo, los directo-
rios telef6nicos no incluyen todos los teldonos contratados por ele-
mentos (hogares 0 negocios) y no siempre estin actualizados. Ade-
mas, es claro que no todos los elementos tienen telefono y algunos
pueden contar con mas de uno. Par ello, una muestra basada en este
marco puede no ser representativa de la poblaci6n.
ClIestionarios autoaplicados. Estos cuestionarios sue len enviarse por
correa normal, aunque hoy en dfa es mas comun hacerlo por correa
electr6nico 0 colocarlos en paginas especificas de internet. La elabora-
UN l OAD 4 • ESTAOfsTICA INFERENCIAL Santillana
ci6n de este tipo de cuestionarios requiere un diseno cuidadoso para
que estimule la respuesta del entrevistado; de ahi que a menudo impli -
quell alguna recompensa 0 incentivo.
Con objeto de evitar sesgos en las respuestas es recomendable no
tomar como muestra al conjunto de la poblaci6n que respondi6 por
obtener el incentivo, sino hacer la selecci6n de la muestra y proporcio-
nar el incentivo una vez contestado el cuestionario.
Este tipo de cuestionarios es aun Imis barato que el telef6nico por-
que no requiere entrevistador. No obstante, al ser autoaplicado no es
posible aclarar dudas acerca de las preguntas y hay mucho menos ga-
rantia de que el cuestionario se responda por completo.
D I SENO DEL CUESTI ONAR I O
Un cuestionario bien disefiado debe minimizar los errares de medi -
ci6n pracurando que la manera en que se realizan las preguntas no
contamine 0 sesgue los resultados. Este sesgo (0 contaminaci6n) pue-
de deberse a varias razones, entre elias, el orden en que se acomoden
o planteen las preguntas.
Ordel7amiento de las pregul7tas
Muchas veces, el orden en que aparecen las preguntas las coloca en
cierto contexto que puede repercutir en las respuestas. Un ejemplo
tipico es una encuesta realizada en 1948 respecto a actitudes hacia
reporteras comunistas y estadounidenses durante la Guerra fda, la
cual se repiti6 en 1980 y aparece citada en ellibro de Schuman y Pres-
ser, Questiol1s and Al7swers ill Attitude Surveys. Ahi se comparan las
respuestas de las preguntas siguientes, realizadas en distinto orden:
1 i.Cree usted que Estados Unidos de America debeda dejar que re-
pOl·teras de paises comunistas entren en territorio estadounidense
y presenten las noticias des de su punto de vista?
2 i.Cree us ted que un pais comunista como la URSS deba dejar a re-
porteras estadounidenses entrar en su territorio y presentar las no-
ticias desde su punto de vista?
En la en cuesta de 1948, cuando se realiz61a pregunta 1 antes de la
2, 36.5% de los encuestados contest6 positivamente (con un sO a la
primera pregunta y 63.7% positivamente a la segunda; cuando se apli-
c6 el cuestionario en orden inverso, la pregunta 2 antes de la 1, 73. 1 %
contest6 que si a la segunda pregunta y 89.8% que si ala primera (ihubo
un aumento de mas de 50%1).
Como se advierte, el orden en que se plantearon estas preguntas afec-
t6 de manera sustanciallos porcentajes de las respuestas afirmativas.
C Santillana 2. Muestreo
241 _
_ 242
Es COmlll1 que los individuos entrevistados traten de guardar con-
sistenci a en sus respuestas, 10 que expli ca por que al presentat· la pre-
gunta 2 antes que la 1 una vez que habia n contestado positivamente a
la segunda pregunta optaron por un si a la primera.
EI mismo comportamiento se seguia observando, aunque con dis-
tintos porcentajes, en 1980, cuando Schuman), Presser repitieron el
exper imento. Solo que ahora, cuando se plantearon las preguntas en el
orden 1-2 las respuestas fueron 54.7% positivas a la primera pregunta
)' 63.7% a la segunda; al mismo tiempo, observaron 74.6% positivo a la
segunda pregunta )' 8l.9% a la primera cuando las hi cieron en ese or-
den (2-1).
Otro caso en que el orden de las preguntas puede afectar las res-
puestas es cuando aquellas son especificas )' generales sobre temas
relacionados. Por ejemplo:
1 tEsta ria dispuesto a que Ie redujeran el sueld0
7
2 tEsta ria dispuesto a que Ie redujeran el sueldo para darle mas dias
de vacaciones?
Pod ria argumentarse que esperamos encontrar mas gente que apoye
la pregunta 1 si se plantea despues de 2, pues el individuo que contesta
puede poner en contexto la pregunta 1 en funcio n de la 2, ya que la
pregunta 2 es especifica, en tanto que la 1 es general.
Lo que importa destacar en este caso es que las dos preguntas se-
guidas y el orden en que se presenten puede influir en los resultados.
La actitud hacia una pregunta con frecuencia queda determinada 0
afectada por las preguntas vecinas 0 anteriores. Asi, es probable que un
entrevistado tenga mas presente actos de corrupcion gubernamental si
primero se Ie plantearon preguntas sobre casos especificos al respecto.
Tambien es comun que cuando se da una Iista grande de opciones,
el encuestado escoja las ultimas pot'que ha olvidado que decian las
primeras. Por eso es recomendable:
I Ordenar de varias maneras las preguntas del cuestionario, de modo
que se tenga un conjunto de cuestionarios con las mismas pregun-
tas pero en distinto orden, los cuales se aplican\n a diversos subcon-
juntos de la muestra. Ello permite identificar comportamientos ses-
UNlOAD 4 • ESTAOiSTICA INFERENCIAl Santillma
gados )' la posibilidad de neutralizar los efectos que ejerce en las
respuestas el orden de las preguntas.
• Procurar repetir las preguntas), opciones cuanto sea necesario para
que queden claras y esten presentes en la mente del encuestado.
• Estudiar meticulosamente la serie de preguntas y analizar los resul-
tados teniendo en cuenta el efecto que ejerce el contexto en ell os y
mencionarlo al presentar las conclusiones del estudio.
PregLlJltas abiertas cOJltra preguJltas cerradas
Una pregunta cerrada es aquella donde se espera una contestaci6n del
tipo "s;" 0 "no"; una elecci6n de un grupo de posibles respuestas como
"muy satisfecho'; "medianamente satisfecho'; "poco satisfecho'; "nada
satisfecho'; 0 bien, la elecci6n de una 0 varias opciones de una lista,
por ejemplo, una lista de alimentos que se consumen en el desayuno,
como "huevos'; "jugo de naranja'; "cereal'; "Ieche'; "pan'; etcetera, donde
cad a entrevistado puede elegir ninguno, algunos 0 todos.
Por otro lado, las preguntas abiertas son aquellas en las que el entre-
vistado puede expresar su opini6n sin seguir ninguna indicaci6n. Por
ejemplo, ",Que opina de la labor legislativa que realiza su diputado
local?"
La ventaja de las preguntas cerradas es su faci! codificaci6n yanali -
sis. Su desventaja es que el ent revistado puede no identificarse con las
posibles opciones de respuesta y, por ende, el cues tiona rio podda no
reflejar fielmente la realidad del individuo, 0 bien, influir en sus res-
puestas.
Por su parte, las preguntas abiertas permiten al entrevistado ex-
presarse libremente. Si bien pueden representar cierta dificultad a la
hora de analizarse, resultan utiles en estudios preliminares para dar la
lista de posibles respuestas a fin de formar luego un conjunto de op-
ciones dentro de una pregunta cerrada. Tambien apoyan en la gene-
raci6n de cuestionarios cuando el diseflador no esta seguro del tipo 0
rango de respuestas que puede esperar.
Una practica conveniente es incluir algunas preguntas que penni-
tan medir si el entrevistado esta 0 no familiarizado con el tema sobre
el que se Ie cuestiona. Respuestas del tipo "10 desconozco'; "no se apli -
ca'; etcetera, nos permiten identificar esto. Si en la pregunta ",Que
opina de la labor legislativa que realiza su diputado local?" obligamos
al entrevistado a escoger de una serie de respuestas y este desconoce
el trabajo legislativo del diputado, entonces nuestra medici6n no refle-
jaria a Ese individuo.
En general, deben evitarse las opciones de no-respuesta, en especial
cuando las preguntas son 10 suficientemente generales para que cual-
quiera tenga informaci6n y una opini6n al respecto; sobre todo, hal'
que evitarlo en las preguntas vitales en el estudio que se realiza.
Santil: n;: 2. Muestreo
243 _
_ 244
REENTREVISTAS Y VER I FI CAC I ON DE LOS DATOS
Es recomendable seleccionar un subconjunto de la muestra para reen-
trevistarlo a fin de comprobar la labor hecha por los entrevistadores y
evaluar la calidad de la aplicaci6n del cuestionario.
Es comun que los cuestionarios incluyan preguntas para compro-
bar la consistencia en las respuestas. Por ejemplo, si se pide al ent re-
vistado que indique las act ividades que realiza en ciertas horas en un
dra normal, cabe esperar que el tiempo total dedicado a esas activida-
des sume 24 horas. EI entrevistador puede reali zar este tipo de verifi -
cacion y, si es el caso, ratifi carl a 0 rectificarla mientras esta frente al
entrevistado.
La comprobaci6n numerica de la informacion tambien puede lI e-
varse a cabo conforme se aplica el cuestionario. Por citar un caso, si el
ent revistado contesta que tiene 15 hijos, todos ellos menores de seis
al'ios, es obvio que se trata de un dato dudoso, por 10 que hay que ve-
rificarlo.
Tambien es posibl e lI evar a cabo la comprobacion cuando se intro-
ducen los datos en la computadora; por decir algo, nadie espera que el
nombre de una persona sea un numero. Asimisl1lo, pueden hacerse
dlculos rapidos, como comprobar que los porcentajes de distintos es-
tratos en la muestra coincidan. Por ejemplo, si se eligi6 una muestra
con 20% de mujeres y el resultado de la aplicacion de los cuestionarios
es de 60% es evidente que hay un error.
Para practicar
CD Revisa los cuesti onarios del censo poblacional del IN EG I del 2005
en la pagina web de la institucion. Identifica estos elementos:
a Preguntas abiertas y cerradas.
b Preguntas que se plantean directamente al ent revistado y pre-
guntas que lI ena el entrevistador.
c Caracterlsticas del diseI'lo que ayudan a codifi car los resultados
en una computadora y a comprobar errores de medicion.
2 Indica cuol es la diferencia entre una pregunta abierta y una cerrada
y cita un ejemplo de cada una de elias.
CD Disella un cuestionario con seis preguntas cuyo orden creas que
influye en las respuestas. ApJicalo con tus compaiieros de clase y
veri fica si tu suposici6n fue COlTecta.
4 Cita ejemplos 0 investiga que tipo de incentivos suelen ofrecerse
para aumentar el nlllnero de cuestionarios autoaplicados.
UNlOAD 4 I ESTAOfsTICA INFERENCIAl Ii) Santillana
Hasta ahora nos hemos ocupado de medir s610 una caracteristica de
cierta poblaci6n; sin embargo, a menudo en la realidad nos interesa
relacionar mas de una variable, por 10 que se plantean preguntas como
estas: "l.conforme aumenta el PIB per capita en un pais se incrementa
la esperanza de vida?'; "i.a mayor estatura, las personas tienen mayor
peso?" y otras similares. Considera los datos siguientes, donde el peso
se mide en kilogramos (kg) y la estatura en metros (m):
Individuo 1 2 3 4 5 6 7 8 9 10
Peso 85 65 80 56 60 67 78 65 60 92
Altura 1.80 1.61 1.71 1.57 1.65 1.73 1.79 1.67 1.59 1.83
En la figura 15 se muestra el diagrama de dispersi6n correspondiente
a estos datos.
Peso y   (x)
95

85



75

65
• •


55

45
Altura (x)
1.55 1.60 1. 65 1.70 1.75 1.80 1.85
Como se observa en la grafica, parece que, efect ivamente, a mayor al-
tura las personas tienen mayor peso, segun esta muestra de 10 indivi-
duos. Podriamos ir mas lejos y pensar que esa caracteristica puede
representarse mediante una ecuaci6n lineal (una recta) del tipof(x) =
ax + b, donde x es la altura yf(x) el peso (decimos que a es la pendien-
te y b la ordenada al origen). 5i es asi, deseariamos ajustar una recta
que pasara 10 mas cerca posible de los puntos 0 datos que la forman.
@Santillana
3. Regresion lineal
Figura 15
Oiagroma de dispersion que
fe/oeiona el peso con /0 estatura
medidas en 10 individuos .
245 _
Figura 16
Recta de 10 funci6n lineal {(x) =
120x - 132.6 que feladona el
peso con fa altura de 10
individuDS.
Indi viduo 1
Peso 85
Peso estimado* 83.4
Diferencia 1.6
_ 246
Por ejemplo, en la grafica de Ia figura 16 hemos escogido la funcian
lineal j(x) = 120x -132.6, donde xes la altura en metros y j(x) el peso
en kilogramos del individuo (a = 120, b = -132.6).
2
Segun esta ecuacian, cabe esperar que para un altura de 1.80 m el peso
sera de 83.4 kg [ya que j(1.80) = 120(1.80) - 132.6 = 83.4 kg], y para
una altura de 1.65 m tendremos un peso de 65.4 kg. Como se advierte,
para esta seleccian de los para metros a y b la diferencia entre el valor
observado y la estimacian es Ia siguiente:
3 4 5 6 7 8 9 10
65 80 56 60 67 78 65 60 92
60.6 72.6 55.8 65.4 75 82.2 67.8 58.2 87
4.4 7.4 0.2 -5.4 - 8 -4.2 -2.8 1.8 5
'Conf(x) = 120 .. -132.6.
<Hab·a otros valores fijos para a )' b que resulten en una estimacian
mejor?
La ventaja de escoger una funcian (lineal) especifica para establecer
la relacian estriba en que nos pennite pronosticar (realizar una infe-
rencia sobre) el peso correspondiente a una estatura que no se hara
observado. Por ejemplo, la estimacian del peso para una altura de 1.90
seriaj(1.90) = 95.4 kilogramos. Ajustar una funcian lineal a datos de
una muestra es una tccnica muy uti I de la inferencia estadistica.
Es importante sel1alar que no todos los fenamenos guardan una
rel acian lineal como Ia que supusimos en este ejemplo; de ello se des-
prenden dos preguntas:
UNIDAD 4 • ESTAOisTICA INFERENCIAL 'iantill;..nl
• <C6mo se determina si dos variables aleatorias guardan una rela-
ci6n lineal?
• <C6mo se estiman los parametros a y b de Ia ecuaci6n linealf(x) =
ax + b para tener el mejor ajllste de Ia recta a los datos?
En Ia secci6n siguiente contestaremos Ia primera pregunta.
Covarianza y correlacion
En Ia unidad 1 vimos Ia medida de dispersi6n de una variable con res-
pecto a su media. Var (X). Ahora nos referiremos ados medidas que
evaluan Ia relaci6n entre dos variables aleatorias: Ia covarianza y Ia
correlaci6n.
Covarianza
La covarianza entre dos variables aleatorias X y Y. que se representa
con Cov (X. Y). se define par:
Cov(X. Y) = E[(X - IlxHY - IlY)].
donde Ilx = E [X] es Ia media de Ia variable X Y Il y = E [ Y] es Ia me-
dia de Ia variable Y.
De hecho. al desarrollar Cov(X. Y) tenemos:
Cov(X. Y) = E[(X - IlxH Y - IlY)]
= E[XY - Xily - Yllx + Ilx!'y]
= E[XY] - E[X ll y] - E[Yllx] + E[ llx !' y]
= E[XY] - Ill,E[X] - !'xE[Y] + Ilx!'y
= E[XY] - Ily!'x - Ilxlly + Ilxlll'
= E [XY] - Ilyllx
= E[XY] -E[X]E[Y]. (ecuaci6n 1)
eSantili ana 3. Regresion lineal
247 _
_ 248
Si dos variables son independientes, entonces E [XY] = E[X] E [Y],
asi que la covarianza de dos variabl es aleatorias independientes (par la
ecuacion 1 que acabamos de desarrollar) es:
E[XY] = E[XY]- E[X!E[Y] = E[X]E[Y]- E[X]E[Y] = o.
Dicho de otro modo, si dos var iables aleatorias son independientes su
covarianza es cero. De este modo, vemos que 1a covarianza es una
medida para distinguir si dos variables no estan relacionadas probabi-
listi camente.
Otra medida que nos indica la relacion que guardan dos variables es la
correlaci6n.
Corrrelacion
La correlacion de dos variabl es aleatorias X y Y se define como:
Cov(X. Y)
p(X.y) = •
GxGy
donde CfX es la desviacion estandar de la variable X y Cfy es la desvia-
cion estandar de Ia variabl e Y.
Ejemplo
17
Considera dos variables aleatarias X y Y. Si suponemos
que la variable Y = aX + b. calcul emos la correlacion de X
y Y. P (X. Y). Recordemos que E [(X - fl X)2] = Var(X)= C f ~ y en-
tonees:
Cov(X. Y) = E[(X - fl x)(Y - fl y)]
= E[ (X -flx)(aX + b - aE[X] - b)]
= E[ (X -flx)a(X - E[X])]
= aE[ (X - fl X)2] = a C f ~  
UNlOAD 4 • ESTAOISTICA INFERENCIAl ClSantillana
Sabemos que ~ = a
2
a;, pm 10 que ay = lala x' de donde conclui -
mos que:
p(X, Y) = Cov(X, Y)
aXay
aa
2
= __ x_
lala;
a
lal
Si a > 0, entonces p(X, y) = 1; y si a < 0, entonces p(X, y)= -1.
Asi, si la relacion entre dos va riables aleatorias es lineal, p (X, Y)
vale 1 cuando la relacion es positi va, y vale - 1 cuando es negat iva.
Vemos entonces que la correlacion es una medida de la relacion lineal
que guardan dos var iables aleatorias .
De hecho, para cualesquiera dos variables aleatorias X y Y con va-
rianza finita tenemos el teorema siguiente.
TEOREMA 6. Seall X y Y dos variables aleatorias COil variallzafinita,
eJltonces:
- 1 OS p(X, Y) S:l
Por tanto, para cualesquiera dos va riabl es con varianza finita su corre-
lacion siempre estar<i entre -1 y 1, y esperamos una rel acion lineal
confonne p(X, Y) este cercana a 1 0 a- l.
En resumen, para comprobar si dos va ri ables aleatorias gUaI·dan 0
no una relacion lineal basta caleular p (X, I' ). Si:
• p(X, Y) = 1, las variables guardan una relacion lineal positiva.
• p (X, Y) = - 1, las variables guardan una relacion lineal negativa.
• p (X, y) = 0, las vari ables no estan correlacionadas.
• p (X, Y) toma valores en el rango [-1, 1]; confonne p (X, I' ) este
mas cercana a los extremos, la relaci6n sera mas lineal, y habra me-
nos relacion ent re las variable a medida que p (X, Y) se acerque a
cero.
~ Santillana 3. Regresion lineal
249 _
_ 250
Analicemos como estimar p (X, Y) en una muestra de tamallO JJ.
Sabemos que para" datos:
1 "
a; = - 2: (Xi - 01')2 ,
n ;=1
"
Si desarrollamos 2: (Xi - 01') 2 obtenemos:
;=}
1 "
x=- LX;"
11 ;=1
"" "(" ) "
2: (Xi - 01')2 = 2: (xi- 2x
i
x + 01' 2) = 2: Xi - 2X 2: Xi + 2: 01'2
i=1 ;=1 i=1 i= 1 i=1
=2:
X
i- - 2: Xi
" 1 (" )2
i=1 11 ;=1
Par consiguiente, una forma equivalente de calcular a; es:
art = - 2: Xi - 2 2>'.:; .
, I " 1( ")2
11 ;=1 11 ;=1
De manera similar:
2_
1
" 1( ")2
0-- 1 -- ,
}' n 112 .
1= 1 1= 1
Vale recordar (de la ecuacion 1) que Cov(X, Y) = E[XYl- E[Xl E [YJ,
aSI que un modo de estimaria es:
- 2:
X
iJ'i - 2 2: Xi 2:J'i' 1( " ) 1( " )(" )
11 i=\ 11 ;=1 ;=1
entonces, al dividir Cov(X, Y) entre a; ai, y multiplicar esta fraccion
por 1 = ,,2//1
2
nos queda:
(
"2)COV(X, y)
/1
2
a
2
a
2
x y
"(±XiJ'i) - (±Xi)(±Yi)
1=1 1=1 1= 1
n - - J1 -  
(
")(")' (")(")2
1=1 1=1 \ 1= 1 1= 1
de donde conciui mos el resultado siguiente.
UNlOAD 4 • ESTAOfsTICA INFERENCIAL C SantiUana
Estimacion de p (X, Y)
Para una muestra de tamano n podemos estimar el coeficiente de
correlaci6n como sigue:
(
")(")2
n -
(
" ) (" )2
n -
Ejemplos
18
Considera ahora la variable Y = j(X) = -12X + 3, donde X
toma los valores X = x; = 0, ... , 5. Calculernos el coeficiente
de correlaci6n, p. Tenemos los calculos:
X; 0 1 2 3 4 5
y; = f(x;l 3 -9 -21 -33 - 45 - 57
x'
,
0 1 4 9 16 25
y'
,
9 81 441 1089 2025 3249
xjY
j
0 -9 - 42 - 99 - 180 -285
LX; 15
LY;
- 162
L' x; 55
Lyl
6894
LX;Y;
- 615
de donde:
5· (- 615) - (15)· (-162)
P =         = -1,
V 5· (55) - (15)2 V 5· (6849) - (-162)2
que es 10 que esper"barnos, ya que existe una relaci6n lineal estric-
tamente negativa entre X y Y.
OSantill<lna 3. Regresion lineal
251 _
Peso
Altura
(Peso)'
(Altura) ,
19
Calculemos ahara el coeficiente de correlaci6n p para los datos de estatura y
peso:
85 65 80 56 60 67 78 65 60 92
1.80 1.61 1.71 1.57 1.65 1.73 1.79 1.67 1.59 1.83
7225 4225 6400 3136 3600 4489 6084 4225 3600 8464
3.24 2.5921 2.9241 2.4649 2.7225 2.9929 3.2041 2.7889 2.5281 3.3489
Peso x altura 153 104.65 136.8 87.92 99 115.91 139.62 108.55 95.4 168.36
_ 252
LX; 708 LX; 17
LX' ,
51448
L '
x;
29
LX;Y;
1 209.21
de donde obtenemos:
10· (1209.21) (708)· (17)
p =         = 0.9114.
Como vemos. para la muestra de 10 individuos. en vista de que el
coeficiente de correlaci6n p = 0.9114 es muy cercano a 1. es valida
tratar de ajustar una recta a los datos para describir su comporta-
miento. Veamos c6mo obtener los parametros que mejor se ajusten a
una recta.
UN l OAD 4 • ESTAOfsTtCA INFERENCIAL @Santillana
Estimacion de los parametros de una ecuacion lineal
Antes de estimar los parametros a)' b en la ecuacionj(x) = ax + b
debemos aCOl'dar un criterio que permita decidir que hemos de consi-
derar una buena estimacion para ellos.
Minimi zar las diferencias entre los val ores observados (datos de la
muestra) )' los estimados (obtenidos de la funcion, con a )' b constan-
tes) implica encontrar la recta mas cercana a aquellos (figura 16).
Y;
r
(Xi' Vi) (X;, J(x;))
Si a es la pendiente )' b la ordenada al origen, entonces en xk la esti-
macion seraj(xk) = aXk + b )', por tanto, la distancia vertical entre la
observacion (el punto) (Xk' Yk) )' la estimacion es IYk - aXk - bl. Las
diferencias pueden ser positivas 0 negativas, aunque es conveni ente
usar sola mente numeros positivQs. Una opci6n cons iste en cons iderar
el cuadrado de cada diferencia, )'a que tam bien es mas sencill o mane-
jado matematicamente que el valor absoluto (cuadrado) . EI cuadrado
de un numero x, x2, crece de manera considerable a medida que x se
hace mas grande a partir del valor 1. Por ot ro lado, para valores me no-
res que 1 )' cercanos a 0 su valor decrece de forma sustancial.
Para el caso de los pesos)' las estaturas (con a = 120), b = -132.6)
tenemos los calculos siguientes:
Individuo 1 2 3 4 5 6 7
Figura 17
Recta que mejor se aiusto
Q los datos.
8 9 10
Diferencia 1.60 4.40 7.40 0.20 -5.40 - 8.00 -4.20 -2.80 1.80 5.00 0.00
(Diferencia)2 2.56 19.36 54.76 0.04 29.16 64.00 17.64 7.84 3.24 25.00 223.60
©Santillana 3. Regresion lineal
253 _
_ 254
Como se observa, para este caso, aunque la suma de las diferencias
es cercana a 0 la suma de los cuadrados de la diferencia es 223.60; por
tanto, una posibilidad es elegir que se minimice la suma de los cuadra-
dos de las diferencias. Si contamos con un metoda para minimizar la
suma de las diferencias al cuadrado, entonces este metodo va a procu-
rar disminuir las observaciones cliya diferencia respecto a la estima-
cion sea ma),or, que es algo deseable.
En otras palabras, un buen metodo para estimar la pendiente )' la
ordenada al origen es el que minimiza Q, donde Q es la suma de los
cuadrados de las diferencias.
Supon que tenemos n observaciones, es decir, que ajustaremos la
recta en 11 puntas, entonees:
"
 
;=1
)' 10 que deseamos es minimizar Q. EI metodo que minimiza Q recibe
el nombre de lIIetoda de los minimos cuadrados), los estimadores que
minimizan Q son los siguientes:
I Para la pendiente a:
I Para la ordenada al origen b:
(
")(")2
n -
1=1 1=1
Cabe sel'!alar que para determinar estos estimadores se emplean tecni-
cas de Giiculo cu)'a exposicion trasciende el objetivo de la obra, por 10
que no entraremos en los pormenores.
UNlOAD 4 • ESTAOISTICA INFERENCIAL
£jemplos
20
EI Banco Mundial (BM) publica informes anuales sobre los indicadores econo-
micos en todo el orbe, en tanto que la Organizacion Mundial de la Salud (OMS)
publica indicadores de la salud, entre e1los, la esperanza de vida en distintos palses.
Considera los datos mostrados en la tabla 4 acerca del producto interno bruto (PIB) Y
la esperanza de vida:
Tabla 4 P' B Y esperanza de vida en 10 paises, segun el BM y la 0 MS
Pais Mexico Sudan Canada Espana
P' B per capita (dolares) $11 531 .63 $2371.94 $35030.26 $28554.63
Hombres 72 57 78 77
Esperanza de vida
Mujeres 77 62 83 84
Pais China Turqufa Honduras Japon
P' B per capita (dolares) $7659.74 $9072.96 $3667.85 $32385.02
Hombres 71 69 65 79
Esperanza de vida
Mujeres 74 74 70 86
Obtengamos el diagrama de dispersion, calculemos el coeliciente de correlacion y
ajustemos una recta que relacione el PI B per capita y la esperanza de vida de los varo-
nes en estos 10 paises.
EI diagrama de dispersion se muestra en la figura 18.
Esperanza de vida
85
80
75
70



• •


Figura 18
Argentina
$15795.25
72
78
Peru
$6623.53
70
74
65

• Diagrama de dispersion que
re/adona el PIB con fa
esperanlO de vida en 10 poises.
60
55
50
$0
CSantillana

P'B
$5000 $10000 $15000 $20000 $25000 $30000 $35000 $40000
3. Regresion lineal
255 _
_ 256
Para faci litar los calculos tomemos el PI B per capita (X
j
) en miles de dolares, de 10 que
tenemos 10 siguiente:
LX' ,
153 3678 710 50798 11464
EI coeficiente de correlacion en este caso vale 0.8619. La estimacion de la pendien-
te es:
10· (11464) - (153)(710)
10 . (3678) - (153)2 = 0.4627.
mientras que el calculo de la ordenada al origen es:
por tanto, la linea recta ajustada serfa:
(7l0)(3678) - (153)(11464)
10 . (3678) - (153)2
Yj = 0.4627x
j
+ 63.93,
63.93.
donde Yj es la esperanza de vida para los hombres Y Xj es el PI B per capita en miles de
dolares. Si desearamos saber, con base en esta aproximacion, la esperanza de vida para
un pais como Tailandia, que tiene un PIB per capita de $9 330, el ajuste de la recta nos
indicarfa que es 68 = 0.4627(9.33) + 63.93, mientras que el valor real es de 67 afios.
21
Vol vamos al ejemplo de las estaturas y los pesos (masas corporales) de los indi-
viduos. A fin de estimar a y b para el caso de las estaturas (x
j
) y los pesos (y;l
consideremos estos calculos:
LX' ,
16.95 28.8065 708 51448 1209.21
UNlOAD 4 • ESTAOisTICA INFERENCIAl C Santillana
b=

= 120
10 . (28.80) - (16.95)2 '
(708)(28.80) - (16.95)(1209.21)
10. (16.95) - (16.95)2 = -132.6.
que result",l ser las estimaciones que habiamos propuesto al principio de la seccion.
Asi, los para metros que minimizan el cuadrado de los residuos para este caso resul-
tan darnos cero tanto para la suma como para las diferencias.
22
Ajustemos una recta a los datos siguientes, con base en el metodo de minimos
cuadrados:
Xi
10 8 -3 5 6 -1 4 12 -4 1
Yi
35 20 30 10 8 18 25 7 5 3
Veamos estos calculos:
LXi
Lx2
, LYi LYi LXiYi
42.71 405.9241 132 2822 758.71
de donde la recta que se ajusta a estos datos esta dada por Yi = 0.2063x
i
+ 15.316.
Al calcular el coeficiente de correlacion obtenemos:
10 . (758.71) - (42.7l) . (132)
P =   = 0.1004,
V 10 . (405.9241) - (42.71)2 V 10· (2822) - (132)2
de donde advertimos que la relacion lineal de las dos variables Xi Y Yi es baja. De he-
cho, al observar el diagrama de dispersion de los datos (figura 18) no notamos que
sigan una relacion lineal. Alm mas, si nos fijamos en el pronostico (estimacion) para
ClSantiHana 3. Regresi6n lineal 257 ...
Figura 19
En este diagrama de dispersi6n
de (os datos se observa que las
variables Xi Y Yi no siguen una
fe/aeion lineal
_ 258
la observacion Xi = 10.17 = 0.2063(10) + 15.316. observaremos
que dista del valor real Yi = 35 -17 = 18. es decir. mas de una vez
la desviacion estandar de la media de las observaciones.
y,
40
35


30
25

20


15
10




5

Xi
- 6 - 4 - 2 0 2 4 6 8 10 12 14
Siempre podemos ajustar una recta con el metoda de minimos cua-
drados. pero ella no implica necesariamente que sea un buen metoda
para realizar inferencias. Es importante recordar que debemos usar la
correlacion y el diagrama de dispersion a fin de comprobar la validez
del ajuste can objeto de plantear inferencias.
Para practicar
CD Caleula la correlacion lineal de los datos siguientes; conviene ajus-
tar una recta a fin de realizar inferencias. Si es posible realizar tal
ajuste. caleula la regresion lineal; de otro modo. obten el diagrama
de dispersion.
Xi -4.2 0.5 1.0 1.6 - 1.1 2.3 3.2 - 3.0 3.5 - 2.0 2.7 - 3.7
Y
i
18.1 0.3 1.1 2.7 1.8 5.4 12.1 9.1 14.2 5.4 7.8 13.7
2 Caleula la correlacion lineal de los datos siguientes; es conveniente
ajustar una recta a fin de reali zar inferencias. Si es posible realizar
tal ajuste. caleula la regresi6n lineal; de otro modo. obten el diagra-
ma de dispersion.
Xi 28 5 - 32 16 - 11 - 30 - 8 -3 12 - 20 27 37
Y
i
30 3 -11 32 - 16 - 45 -3 - 7 22 - 38 45 45
Q) Por media del metodo de minimos cuadrados. ajusta una recta a los
datos del PI B per capita del ejemplo 20. pero ahara utili za la espe-
ranza de vida de las mujeres C0l110 segunda variable.
UNlOAD 4 • ESTAOisTICA INFERENCIAL Cl Santillana
Juan tiene una moneda y afirma que es una moneda justa, es decir,
espera que allanzarla al aire, la mitad de las veces caiga cara y la otra
mitad, cruz. Angelica Ie propuso probar esta hip6tesis, para 10 que Ie
propuso que lanzara la moneda 10 veces y anotaran el resultado.
<C6mo crees que deban proceder Juan y Angelica: deben aceptar 0
rechazar la hip6tesis con base en el numero de veces que caiga cruz
7
Si reflexionas en ello, notanis que 10 que propone Angelica es tomar
una muestra del comportamiento de la moneda. De hecho, por 10 estu-
diado al principio de la unidad sabemos que al presuponer que la mo-
neda es justa el experimento se distribuye como una binomial B (10,8),
con p = 0.5.
Que el resultado observado del experimento sea cinco caras y cinco
cruces es el evento con mayor probabilidad [p(x = 5) =   =
0.24609375]; obtener seis caras y cuatro cruces tampoco es un evento
raro (probabilidad de 0.205078125).
Cabe recordar que como la distribuci6n es simetrica, la probabili-
dad de este even to (seis caras y cuatro cruces) es igual al de observar
seis cruces}' cllatro caras.
Un even to no tan cOl1lun seda observar ocho caras y dos cruces,
cuya probabilidad es de 0.043945, muy baja, aunque no imposible de
observar. Cabe la posibilidad de que la moneda sea justa y aun asf se
observe una racha de muchas caras. Incluso 10 mismo podemos decir
acerca del resultado 10 caras, que sucederfa con una probabilidad de
0.000976563 > 0 (poco probable, pero no imposible).
Sin embargo, vemos que cuanto mas improbable es el evento obser-
vado mayor es nuestra tendencia a atribuir el resultado a razones no
aleatorias. Debemos entonces preguntar 10 siguiente: <en que condi-
ciones estamos dispuestos a aceptar 0 rechazar la hip6tesis7
Una posibilidad es que Angelica y Juan decidan aceptar la hip6tesis
si la moneda cae de cuatro a seis cruces en to lanzamientos. <Que
significa este intervalo de valores?
Regiones de aceptacion y de rechazo
EI intervalo de valores en que se ace pta una hip6tesis se llama region
de aceptacion, en tanto que el rango de valores donde se rechaza una
hip6tesis se denomina region de I'echazo.
Asi, para el ejemplo de la moneda Juan y Angelica han escogido como
regi6n de aceptaci6n {4, 5, 6} Y como regi6n de rechazo {O, 1, 2, 3} U
{7, 8, 9, 1O}. Como la decisi6n de aceptaci6n 0 rechazo de la hip6tesis
Santillana 4. Pruebas de hipotesis
259 _
Fi gura 20
Grcifico con las regiones de
oceptocion y rechozo establecidos
arbitrariamente.
_ 260
que toman Angelica y Juan se basa en una muestra pueden cometer
dos t ipos de error al utilizar este criterio:
1 La moneda es justa pero la muestra observada da un resultado con
menos de cuatro cruces 0 mas de seis, con 10 que rechazan una hi-
potesis verdadera.
2 La muestra da un valor entre cllatro y seis cruces, pero no es lIna
moneda justa, con 10 que aceptan una hipotesis falsa.
Errores de tipo I y de tipo II
Cuando se rechaza una hipotesis verdadera entonces se comete un
error de tipo I; por el contrario, si se acepta una hipotesis falsa se cae
en un error de tipo II.
Es claro, entonces, que en el ejemplo de Angelica y Juan el caso 1 es un
error de tipo I y el2 es un error de tipo II.
Para calcular la probabilidad de cometer el error de tipo I (rechazar
una hipotesis verdadera), dada la region de aceptacion debemos calcu-
lar la probabilidad de observar menos de cuatro 0 mas de seis cruces,
pues la moneda es justa.
Dicho de otro modo, si consideramos X como una B (10,0.5), debe-
mos calcular:
PIX < 4 J + PIX > 7J = PIX = OJ + PIX = IJ + PIX = 2J
+ PIX = 3J + PIX = 7J + PIX = 8J + PIX = 9J + PIX = 10J
= 2(P[X = 8J + PIX = 9J + PIX = 10])
= 0.343715,
es decir, dada la regi6n de aceptacion (4, 5, 6}. si rechazamos la hipo-
tesis porque la mllestra no cae en ella cometemos un error de tipo I
con lIna probabil idad de 0.343715 (figura 20).
0.3
0 . 246
0. 25
0.2
0. 15
0.1
0.05
o
o 1 2 3 4 5 6 7 8 9 10
UN l OAD 4 • ESTAOfSTICA INFERENCIAL Santillana
En este caso, juan y Angelica establecieron la regi6n de aceptaci6n
de manera arbitraria. Es mas comun establecerla con base en la proba-
bilidad de co meter el error de tipo I. L1amamos a esta probabilidad
/livel de sigllifical1cia.
Los niveles de significancia mas utilizados son 0.01 y 0.05. Se repre-
sentan con la letra griega alfa, a, as[ que los niveles de significancia
mas utilizados son a = 0.05 Y a = 0.01. Estos niveles corresponden a
tener en la regi6n de aceptaci6n el (1 - a) 100% (figura 21).
0.3
0.246
0.25
0.2
0.15
0.1
0.05
0
0 1 2 3 4 5 6 7 8 9 10
Volviendo a nuestro ejemplo del volado. Si el resultado observado de
los Ianzamientos fuese de nueve cruces y una cara tendrfamos que
pensar en Ia probabilidad de que ocurriera un evento tan raro, es decir,
en Ia probabilidad de obtener nueve 0 mas cruces. En este caso, como
Ia distribuci6n es simetrica esta probabilidad es:
PIX = 0) + PIX = 1) + PIX = 9) + PIX = 10)
= 2 (0.010 + Om)
= 0.022.
As[, en un nivel de significancia de 0.05 rechazamos Ia hip6tesis de que
se trata de una moneda justa, pero si utilizamos un nivel de significan-
cia de a = 0.01 entonces 110 podemos rechazar la hip6tesis.
Como se observa, cuanto mas pequei\o sea el nivel de significancia
menos predispuestos estaremos a cometer un error de tipo I; por con-
siguiente, se agranda la regi6n de aceptaci6n. Tambien notamos que al
ampliar dicha regi6n disminuimos Ia regi6n de rechazo y subimos Ia
probabilidad de cometer un error de tipo II.
CSantiliana 4. Pruebas de hipotesis
Fi gura 21
Grcifico de /0 region de rechoza
y oceptoci6n bilateral con uno
distribuci6n binomial (n = 10,
P = 0.5) con 1 - a en el centro
y a l l a loslodos.
261 _
_ 262
La hipotesis que que rem os probar recibe el nombre de hipotesis
nula, y como deseamos evaluar si es verdadera 0 falsa, la contrastamos
con 10 que lIamaremos hipotesis alternativa.
Para el caso de la moneda, la hipotesis nula es que la probabilidad
de obtener cara 0 cruz es p = 0.5, en tanto que la hipotesis alternativa
es que p 1= 0.5. Este tipo de hipotesis alternativa se conoce como alter-
nativa bilateral, pues la region de rechazo consta de dos segmentos (0
lados), como se observa en la figura 21. Veamos otro ejemplo de una
prueba bilateral.
Ejemplo
2 3
Un fabricante de jugos compra naranjas de distintos agricul-
tores a 10 largo del pais. EI fabricante esta obligado a cefiirse
a los estandares, los cuales indican que hay que al1adir 9.14 gramos
(g) de jugo por cada 100 g de azucares.
A fin de no tener que agregar 0 disminuir ese contenido despues
de exprimir las naranjas para la venta al consumidor, el fabricante
sabe, por estudios extensos, que la desviacion estandar en las na-
ranjas nacionales es de 2.1 g. Ademas, nos ha indicado que esta
dispuesto a utilizar un nivel de significancia de 0.01%, pues no
quiere equivocarse demasiadas veces al rechazar los lotes que reci-
be de sus proveedores.
Antes de comprar un nuevo lote de la fruta a un proveedorl
agricultor veracruzano el fabricante decide tomar un muestra de
40 naranjas para medir su contenido de azucares.
Si el promedio de azucares en esa muestra fue de 9 g, tdeberia el
fabricante comprar ellote?
Para esta situacion la hipotesis nula es que el promedio de azu-
car   es de 9.14 g, es decir,   = 9.14; por su parte, la hipotesis alter-
nat iva es que   1= 9.14. Ahora debemos determinar las regiones de
aceptacion y rechazo y ver a cmll de elias pertenece la media de la
muestra observada (x = 9) para poder dar nuestra sugerencia al
fabricante.
Recordemos 10 visto en secciones anteriores referente a la dis-
tribucion de medias muestrales. Como en este caso la muestra es
n = 40 > 30, podemos aproximar con la normalla distribucion de
las medias muestrales; en este ejemplo la desviacion estandar de la
muestra es:
o 2.1
Ox = . r-: = .   = 0.332039154.
V 11 V 40
UNlOAD 4 • ESTAOfsTICA INFERENCIAL €I Santillana
Sabemos que para la distribuci6n normal estandar z, el nivel de
significancia de a = 0.01 corresponde a una observaci6n mayor
que 2.575 0 menor que - 2.575 (figura 22).
0.25
0.2
0.15
0.1
Region de aceptacion
0.05
o
- 2.575
Region de rechazo
2.575
Para este caso, la estandarizaci6n es:
Z=
9 - 9.14
0. 332039
- 0.14
0.332039 = -0.421637021.
y como esta cantidad esta entre - 2.575 y 2.575 no podemos recha-
zar la hi p6tesis; por tanto, debemos aconsejar al fabricante que
acepte el lote de naranjas del productor veracruzano.
Como puedes observar, es muy uti! establecer niveles de significancia
del tipo a = 0.05 Y a = 0.01 para realizar la prueba de hip6tesis de una
media poblaci6n. Basta calcular Z = (x - fl) / (a / V-;;) y ver si este
valor de z esta en el intervalo [-1.96,1.96] para a = 0.05,0 en [ -2.575,
2.575] para a = 0.01 (figura 23).
0.25
0.2
0.15
cr - 1
0.1
cr/2 Region de aceptacion
cr/2
0.05
o
Region de rechazo
e Santillana 4. Pruebas de hipotesis
Figura 22
Grafieo de fa region de rechozo y
aceptacion bilateral para a = 0.01.
Figura 23
Gra{ica de 10 region de rechoza y
aceptacion bilateral.
263 _
0.2\
0.20
0.1\
0.10
0.0\
0
< 110
1 - a
Region de
ace pIa cion
a

Region de rechazo
Gr6{ica de fa region de oceptacion
y rechazo para prueba unilateral
11 < flo·
_ 264
No todas las posibilidades en una prueba de hipatesis son bilaterales;
en ocas iones la region de rechazo es unilateral, como en el ejemplo
que se presenta a continuacion.
Ejemplo
1
EI Departamento de Transporte Pl,blico de una ciudad afirma
que el numero de pasajeros promedio en los microbuses en la
zona sur es de 35. Para renovar la fiota de trans porte urbano el
Departamento decidia permitir la participacian de microbuses
particulares. Una empresa de transporte esta interesada en invertir
y colocar algunos auto buses con objeto de satisfacer la demanda de
transporte en esa zona. Sin embargo, antes ha decidido comprobar
si esa cifra es COlTecta, pues segun sus dlculos, si es menor a 35
pasajeros en promedio no Ie conviene invertir. Para ello ha tomado
una muestra de 50 microbuses y observado que, en promedio, lIe-
van 33 pasajeros, con una desviacian estandar muestral de tres pa-
sajeros. <Debe invertir la empresa de transporte?
La hipatesis nul a es que la media de pasajeros es fl = 35; como
el transportista esta interesado en saber si el numero de pasajeros
es menor que 35, la hipatesis alternativa es fl < 35. Aqui tenemos
una hip6tesis alternativa unilateral izquierda.
De 10 que aprendimos acerca de la distribuci6n normal vemos
que la region unilateral para un nivel de significancia de a = 0.05
es (-OJ, -1.645 J, Y para un nivel de significancia de a = 0.01 es
(-00, -2.33].
Como n = 50 > 30 tenemos que:
X-fl
z=
a/Vn
33 - 35 = -4.71405,
3/VSO
y como esta cantidad se halla en el intervalo (-::c, -2.33], enton-
ces rechazariamos la hipatesis y recomendariamos a la compania
de transporte no invertir.
De igual modo, podriamos tener una hipatesis alternativa unilateral
derecha, como se ilustra en el ejemplo que sigue.
UNlOAD 4 • ESTAOfsTICA INFERENCIAl  
Ejemp/o
2
En la planta de ensamblaje de una compania automotriz se tie-
nen varios procesos, los cuales se busca que se realicen en el
menor tiempo posible. EI ingeniero a cargo del control de calidad
del ensamblaje de puertas quiere comprobar que efectivamente los
robots de ensamblaje colocan una puerta en 45 segundos en pro-
medio. Con tal proposito, ha decidido tomar una muestra de 35
ensambles de puerta (1'1 = 35). Para esta muestra observo que, en
promedio, el proceso de ensamblaje se lIevo 46 segundos (s) con
una desviacion estandar muestral de 4 segundos.
5i el ingeniero esta dispuesto a utilizar un nivel de significancia
de a = 0.05, <coneiuira que, en efecto, el promedio es de 45 se-
gundos
7
En este caso, la hipotesis nula es fl = 45, Y como deseamos evi-
tar promedios de ensamble mayores que 45 s, la hipotesis alterna-
tiva seria ahora fl > 45. As!, para este caso tenemos una hipotesis
alternativa unilateral derecha.
De 10 que aprendimos sobre la distribucion normal tenemos que
la region unilateral para un nivel de significancia de a = 0.05 es
[l.645, co), y para un nivel de significancia de a = 0.01 es [2.33, "').
Puesto que n = 35 > 30 tenemos que:
X-fl 46-45
z = _, = _ = l.47902.
a/vn 4/v35
Como esta cantidad no se encuentra en el intervalo [l.645, co), no
tenemos razon para rechazar la hipotesis, ya que no hay pruebas
de que el tiempo de ensamblaje lIeve 45 s en promedio. Por tanto,
los robots que Uevan a cabo esa tarea por el momento no deben
preocupar a los directivos de la planta.
8 Para practicar
CD En una escuela de ensenanza de ingles hal' un curso especializado
para alumnos interesados en present .. · el examen TOEFL (Test of
English as a Foreign Language, examen de ingles como idioma ex-
tranjero), que suele aplicarse en un gran numero de uni versidades
de habla inglesa como requi si to de admision. AI al'io se evaluan al-
rededor de 250000 examenes TO EFL Y las calificaciones van de 0 a
120. EI promedio mundial es de aproximadamente 80, con una des-
vi.ci6n estandar de 22 puntos.
:.) Santillana 4. Pruebas de hip6tesis
0.2\
0.20
Region de aceptacion Region de
rechazo
0.1\
I-' > llo
0.10
1 - a
0.0\
a
0
Po
Grdfico de fa region de aceptacion
y rechazo para pruebo unilateral
donde 10 hip6tesis nulo es I-' = 1-'0 I
pero I-' > 1-10·
265 _
_ 266
En la escuela se cree que sus estudiantes obtienen calificaciones
ma),ores a 80 puntas. Para comprobarlo se pregunt6 a 45 de sus
alumnos su calificaci6n en su ultimo examen, y estos estudiantes
obtuvieron un promedio de 93 puntas.
Si la escuela quiere considerar un nivel de significancia de a =
0.05, <sera cierto que el promedio de calificaci6n de sus alum nos es
ma),or al promedio mundial?
2 Un laboratorio farmaceutico ha presentado un nuevo medicamen-
to para establecer la presi6n arterial. )' afirma que baja la presi6n
sist6lica un promedio de 19 mm Hg. Recientemente realiz6 una se-
rie de experimentos c1inicos a 55 pacientes can presi6n alta)' esta-
bleci6 que la bajaron 17.8 mm Hg en promedio. Los medicos saben
que para este tipo de medicamentos se espera una desviaci6n es-
tandar de 4.9 mm Hg.
Can base en los resultados de los experimentos c1inicos, <debe el
laboratorio rechazar la hip6tesis nula   = 19), aceptar la hip6tesis
alternativa   '" 19?
CD EI director de una presa hidroelectrica esta interesado en el nivel de
agua en la presa. Para mantener la producci6n ideal de electricidad
necesita un nivel de 15 metros en promedio al aflO. Se tom6 una
muestra de 40 medidas en diferentes dias )' horas que Ie dio, en
pro media, 14.3 metros. Si sabe que la desviaci6n estandar anual es
de 3.4 metros, <Ia presa mantendra la producci6n ideal de electrici-
dad para un nivel de significancia de a = 0.01?
UNlOAD 4 • ESTAOfSTICA INFERENCIAl CSantiliana
____ ______________________________ -r ___
Distribuciones
OSantillana
En esta unidad vimos tres distribuciones de probabilidad importantes: la bino-
mial, la normal y la uniforme.
® La distribucion de probabilidad binomial B (II, p) es:
f(x) = C:) p' (1 p)" - "
donde p es la probabilidad de exito de un ensayo Bernoulli, II el nlunero de
ensayos y x el numero de observaciones de exito de interes cuya probabili-
dad va a calcularse.
® La distribucion de probabilidad de la normal N( 1', 0) esta dada par:
1  
f(x) = e -, 0 ,

donde I' es la media y 0 la desviacion estandar poblacional. Esta funcion
tiene forma de campana. Cuando I' = 0 Y 0 = 1 se trata de la normal estan-
dar y la tabla 1 muestra los valores para la distribucion. La distribucion
normal es la distribucion limite para varias distribuciones, en particular:
, Para la binomial, cuando 11 es grande y donde los para metros de la nor-
mal son I' = lip Y 0
2
= lip (1 pl·
, Para la distribucion de la media muestral de cualqui er variable aleatoria
can media I'x y varianza o} finitas cuando el tamallO de la muestra II es
muy grande. Los para metros de la normal son I' = I'X Y desviacion
estandar cr.) \ 0, .
® La distribucion de probabilidad uniforme Ula, b 1 esta dada par:
1
- 1 - si x E I a, b ].
f(x) = b a
o en otro caso.
donde el rango la, b 1 es la region de valores donde la probabilidac1 es posi-
tiva. Esta distribucion es l,til para generar numeros aleatorios como los
presentados en la tabla 2.
Repaso
267 _
Muestreo
_ 268
® Una poblaci6n es el conjunto de todos los elementos de interes para un
estudio y se Ie miden caracteristicas de interes pOI' medio de un censo.
® Una lIIuestra es un subconjunto de la poblaci6n y se Ie miden caracteristi -
cas de interes pOI' medio de muestreo.
® Las muestras se usan para realizar inferencias acerca de una poblaci6n;
ello pOI' diferentes razones: cuando la poblaci6n es muy grande y es cos to-
so medirla, asi como debido a que la medici6n afecta a los elementos me-
didos.
® La poblacioll de illtenis es el conjunto de elementos ace rca de los que se
desea hacer una inferencia.
® Ellnarco /1l11estral es una lista de los elementos que forman a la poblaci6n
de interes.
® Las eta pas del proceso de muestreo son:
1 Definici6n de objetivos de la muestra y la poblaci6n de interes.
2 Establecimiento del marco de muestreo.
3 Especificaci6n del diseno de muestreo.
4 Puesta en marcha del plan de muestreo.
5 Analisis de los datos y los resultados.
® EI diseflO de la muestra especifica el ncunero de elementos que formaran la
muestra y el metodo que se empleara para seleccionarlos.
® Entre los metodos de selecci6n de muestras se hallan:
• Muestreo aleatorio simple.
• Muestreo sistematico.
• Ivluestreo por conveniencia.
• Muestreo estratificado.
® Para obtener una muestra de tamaflO II de una poblaci6n de tamaflO N me-
diante:
• Muestreo aleatorio simple, tomamos II numeros aleatorios entre [0, 1],
digamos al' ... , a" , multiplicamos cada a; pOI' N Y escogemos a esos
elementos del marco muestral (lista no ordenada de los N individuos de
la poblaci6n).
UNlOAD 4 • ESTAOfSTlCA INFERENCIAL C Santiliana
-----------------------------------------
• Muestreo sistematico: calculamos el coeficente de elevacion k = N / n y
obtenemos Ja parte entera de j, un numero aleatorio entre 1 y k, Y selec-
cionamos los elementos i + k, i + 2k, j + 3k, ... , i + (n - l)k del marco
muestral.
® Para obtener una muestra de tamai'lo n de una poblaci6n de tamafio N cli -
vidida en t estratos, con N
j
• individuos en cada estrato y queremos usar:
• Muestreo estratificado constante: eJegimos aleatoriamente n / t elemen-
tos de cada uno de los t estratos.
• Muestreo estratificado proporcional: elegirnos aproximadamente n j =
(N
j
/ N)n elementos de cada estrato hasta completar la muestra de
tamano n = L!_I nj.
® La esperanza de la media muestral es la media poblacional, en tanto que la
desviaci6n estandar del promedio de una muestra aleatoria se estimar con:
Si N > 20n, entonces se calcula mediante:
donde n es el tamano de la muest ra y N el de la poblaci6n.
Teorema central dellfmite
® Para cualquier densidad de una variable aleatoria con media 11 y varianza 0
2
finitas 1a distribuci6n de la media muestral para una muestra aleatoria sim-
ple de tamano n, cuando n es grande, sigue una distribuci6n normal con
media Il Y desviaci6n estandar 0/ y;" es decir, N(Il, a /Vn). Esto es valida
para muestras de tamano n .2= 30.
Medidas de relaci6n entre dos variables
., La covarianza entre dos variables aleatorias se define como Cov(X, Y) =
£ [(X - ~ x )   Y - ~ y ) ) .
Repaso
269 _
® Una forma de estimar la covarianza entre dos variables aleatorias es:
y vale cera si las variables son independientes.
® La correlaci6n de dos variables aleatorias es:
Cov(X, Y)
p(X, Y) = ,
(JXOy
y podemos estimarla mediante:
ecuaci6n con la que se mide el grado de relaci6n lineal que guardan las dos
variables. Cuanto mas cercano a 1 0 -1 sea la correlaci6n, mayor sera esta
relaci6n lineal.
Regresion lineal
_ 270
® Si deseamos ajustar una linea recta y = ax + b por el metodo de minimos
cuadrados para que relacione lineal mente dos variables aleatorias, X y Y,
entonces los parametras estimadores de la pendiente y el de la ordenada al
origen son, respectivamente:
.
a= y
UNlOAD 4 • ESTAOfsTICA INFERENCIAl C Santillana
Pruebas de hipotesis
CSantiliana
® EI intervalo de valores donde se acepta una hip6tesis se llama region de acep-
tacion, y el intervalo donde se rechaza se denomina region de rechazo.
® Cuando rechazamos una hip6tesis verdadera se dice que se comete un error
de tipo I; si aceptamos una hip6tesis falsa entonces se incurre en un error de
tipo II.
® La probabilidad de cometer un error de tipo I recibe el nombre de nivel de
signijicancia.
® Los niveles de significancia mas utilizados son a = 0.05 Y a = 0.01.
® La hip6tesis que queremos probar se denomina hipotesis nllla, y la contras-
tamos con la hipotesis alternativa.
® Hay dos tipos de hip6tesis nulas: bilaterales y unilaterales.
® Para realizar la prueba de hip6tesis de una media poblacional basta caleular
y observar que:
I Para una hip6tesis altern at iva bilateral 11 '* 110: no se rechaza la hip6tesis
nula si z esta en los rangos [ - 1.96, 1.96 J para a = 0.05 0 [ -2.575, 2.5751
para a = 0.01.
I Para una hip6tesis alternativa unilateral izquierda 11 < 110: se rechaza la
hip6tesis nula para un nivel de significancia de a = 0.05 si z esta en
(_:xl, -1.645J Y para un nivel de significancia de a = 0.01 si esta en
(_C/O, -2.33J.
I Para una hip6tesis alternativa unilateral derecha 11 > 110: se rechaza la
hip6tesis nula para un nivel de significancia de a = 0.05 si z esta en
[1.645,:xl) Y para un nivel de significancia de a = 0.01 si esta en [2.33, (0).
Repaso
271 _
_ 272
L
as estrellas son enormes bolas de plasma que emiten grandes can-
tidades de energia al espacio en forma de radiacion electromagne-
tica, neutrinos y viento estelar. Esta energia es lanzada porIa estrella a
10 largo de su vida y se debe a las reacciones de fusion termonucleares
que se producen en su centro.
Entre otros criterios, las estrellas se c1asifican de acuerdo con su
temperatura, su tamano y su edad. Segun su temperatura, se les asig-
nan distintas letras: 0, B, A, F, G, K, M; segun su tamano, se les dan
numeros romanos de I (supergigantes) a V (enanas). Asi, de forma na-
tural las estrellas forman estratos de la poblacion de interes (en este
caso, todas las estrellas en el espacio).
Hay muchos model os para con tar el numero de estrellas que exis-
ten, pero uno de los problemas principales que tienen es el sesgo debi-
do a la contaminacion luminica. Las dificultadas para superarlos son
inherentes a las diferencias entre la luminosidad y los tamanos de las
estrellas.
En los catalogos estelares (censos de estrellas) las estrellas mas bri-
llantes y pesadas son las que mas aparecen, aunque en promedio son
mas raras. Las estrellas menos luminosas (enanas rojas) parecen ser
las mas comunes. Podemos citar el caso de la estrella mas proxima a
nosotros (4.2 allos luz), la a Centauri C, que no es posible observar a
simple vista desde la Tierra y que com parada con la estrella gigante
  Puppis, que se halla a 1399 anos luz de nuestro planeta, es 400 millo-
nes de veces menos luminosa.
Los astra nomos utilizan las herramientas de la estadistica para tra-
tar de disminuir el sesgo a la hora de estimar estas cantidades. Este es
un ejemplo claro de una variable de interes que no puede medirse
mediante un censo (conteo de todas las estrellas), sino que debe ha-
cerse por medio de un muestreo 0 de herramientas de inferencia es-
tadistica.
En agosto de 20061a NASA (National Aeronautics and Space Admi-
nistration) afilio a jovenes entusiastas a un programa para evaluar la
UNlOAD 4 • ESTAOfSTICA INFERENCIAl o Santillana
contaminacion lumfnica en la atmosfera terrestre a partir de mues-
treos aleatorios de distintas partes del cielo. eon este proyecto espera-
ba estimar el numero de estrellas visibles desde nuestro planeta. Los
muchachos deb fan construir un tubo de 25 a 35 centfmetros (cm) de
longitud y de 4 a 6 cm de dhimetro. Ademas de tomar nota de las me-
didas exactas de su tubo, tenfan que revisar factores atmosfericos y
geograficos como la latitud y longitud de su posicion en la Tierra, la
cercanfa de luces electrica, el porcentaje de cielo observado cubierto
por nubes, entre otros datos. Se les pedfa hacer varias observaciones y
promediar el numero de estrellas vistas. Una vez registrados esos da-
tos debfan publicarlos en internet.
Este proyecto, llamado "Proyecto conteo de estrellas" y sugerido
por el astronauta Steve MacLean, miembro de la tripulacion de la nave
espacial Atlantis, tiene por objeto generar una gran cantidad de mues-
tras de observaciones de estrellas en una parte de cielo limitado (los 4
a 6 cm de diametro del tubo), estimar el promedio de esta observacion
y con ella calcular el total de estrellas observables.
Por ejemplo, si x fue el promedio observado de la muestra y sabe-
mos que el espacio visible puede dividirse en N fragmentos de este
tamano, entonces basta multiplicar x por N, xN, para obtener ese pro-
medio.
EI resultado obtenido por Steve MacLean cuando se hallaba en or-
bita en su nave es que se pueden observar alrededor de 8000 estrellas.
Realiza el mismo experimento con tus companeros de clase. Toma
varias muestras del cielo con el tuba de 28 cm de longitud y 1.25 cm
de diametro, y obten el promedio de tus observaciones. Multiplica esa
cantidad por lOOO y obtendras tu propia estimacion. Naturalmente,
esta varia segun las condiciones del sitio des de donde se tome la mues-
tra, 10 cual dara variabilidad a los resultados obtenidos. ,eual es la
media de las observaciones hechas por tus compalleros de clase? ,eual
es la desviacion estandar7 ,Los resultados obtenidos aceptan 0 recha-
zan la hipotesis de que hay alrededor de 8000 estrellas visibles desde la
Tierra?
I Fuente: archivo historico de la NASA, <http://www.youngeagles.org/
news/archive/2006%20-%2008_29%20-%20How%20Many%20
Stars%20are%20in%20the%20SkL_asp>.
I Pdgina con instructivo para estudiantes: <http://www.nasa.gov/
au d ien ce / fo red ucato rs / sta rcount/ hom e/ >.
I Resultados: <http://www_space.gc.ca/asc/eng/educators/resources/
sta rs / res u I ts_steve. as p>.
CSantiUana Matematicas y otras ciencias
273 _
_ 276
Autoevaluaci6n
o Una zarra astuta propane a un calleja honesto el juego siguiente: tirar un
dado cinco veces y si sale cuatro a mas veces el numero 6, entonces la
zorra pierde y pagani $600.00 al caneja; perc si cae menos de cuatro en-
tonces el conejo pierde y pagani a la zona $10.00. Calcula la probabilidad
de que el conejo gane y la probabilidad de que la zona gane.
2 ,-Sera justa el juego que propane 1a zorra al calleja? ;,Cual seria una apues-
ta adecuada para que ambos esperaran ganar 10 mismo?
0) Calcula la probabilidad de que una variable aleatoria que se distribuye
como una N (2.5, 3) tenga un valor menor a igual que 5.
4 Sup6n que tienes una variable X aleatoria normal con media   = 5 Y des-
viaci6n estandar 40. ,Cuales son los valores de a y b tales que la PIa :5
X:5 b 1 0.9544?
CD EI gerente de una fabrica de bombas eIectricas sabe que la produccion
diaria se distribuye como una normal con media 100 y desviaci6n estan-
dar 8. ,Cua! sera la probabilidad de que la produccion del dia de hoy sea
menor 0 igual que 112?
6 El profesor de nataci6n de un gimnasio sahe que el tiempo promedio que
tarda un alumno en recorrer un circuito alrededor de la piscina es de 1.S
minutos, y esta convencido de que la desviacian estandar es de alrededor
de 0.5 minutos. Si suponemos que la distribuci6n de los tiempos es nor-
mal, i.cual es la probabilidad de que un alumno recorra el circuito en me-
nos de 1 minuto?
(j) i. Cual es la probabilidad de elegir a una muestra especifica de tamai'io
cuatro de una poblacian de tamano 12?
8 Escoge una muestra aleatoria simple de tamai10 10 de los usuarios de tar-
jeta de credito de la tabla 3 y caleula el saldo pro media en la cuenta.
® i.eual es la probabilidad de escoger un individuo en particular en una
muestra de tamano cinco de una poblacion de tamai10 sao?
10 Escoge una muestra aJeatoria estratificada proporcional de tamaii.o 30 de
los usuarios de tarjeta de credito de la tabla 3 y caleula el saldo promedio
en miles de pesos de gasto en alimentos.
@ Supan que tenemos tres millones de clientes en un banco, de los cuales
dos millones tienen autorizado un credito basi co; 800 000, un credito me-
dia, y 200000 un credito alto. Si deseamos tamar una muestra de 300
clientes, i.cwintos de los 300 individuos en la muestra tomarias de cada
UNlOAD 4 • ESTAOrSTICA INFERENCIAl CSantillana
uno de los estratos de c   ~ d i t o autorizado can un muestreo estratificado
constante y uno propordonal?
12 Escoge una muestra aleatoria estratificada constante de tamaii.o 12 utili-
zando muestreo sistematico intermuestral de los usuarios de tarjeta de
credito de Ia tabla 2 y caleula el saldo promedio en miles de pesos de gasto
en alimentos; luego campara can los resultados obtenidos del ejercicio 10.
i.0btienes un mayor gasto? i.Es 10 que esperabas? Justifica tu resultado.
@ i.Cmll es el valor de la covarianza de dos variables aleatorias indepen-
dientes?
14 Calcula la correladon lineal entre el sal do en la cuenta y la compra en
alimentos para el estrato tres de los usuarios de tarjetas de credito de la
tabla 3.
@ Sup6n que tenemos una poblaci6n de 100 elementos y tomamos una
muestra de 30 de ellos. i.Cuanto cambia el error estandar de la media
muestral si disminuimos la Illuestra en una tercera parte?
16 En una compaii.ia cervecera nacional se producen 30000 botellas de cer-
veza diarias. La cervecera sabe, pOl' datos historicos, que la desviaci6n
estandar es de aproximadamente 0.5 m!. EI inspector de cali dad ha deci-
dido to mar una !11uestra de 550 botellas que dieron un promedio de 250
mi y quiere determinar Ia probabilidad de que Ia media de las botellas
producidas ese dia este entre 250.1 y 249.9.
@ Calcula la correladon lineal de los datos siguientes.i.Que tipo de relad6n
lineal presentan?
Xi
2.1 3 2 -3.5 5
- 1
7 -5 4.6
Y
i
1 6 1.5 -5 6 - 1.7 8 -6 5
18 Considera los datos sobre el PIB y esperanza de vida de los 10 paises del
ejemplo 20 y agrega los datos de estos cinco paises adicionales. Caleula
@Santillana Autoevaluaci6n y ejercicios de refuerzo
-1.9 2.1 3
-2.2 1 6
277 _
_ 278
Pais
una nueva regresion lineal para este caso. ;.eomo ha cambiado la correla-
cion lineal?
Botswana Tailandia E.U. Congo Francia
PI B per capita (d6Iares) $13 088.17 $9330.96 $44155.D1 $750.62 $33408.22
Esperanza de vida
Hombres 42 67 75 54 77
Mujeres 41 73 80 55 84
@ Una compai1fa editorial vende un libra de estadistica y sabe que la desvia-
ci6n estandar en sus ventas mensuales de este tipo de obras en cada pun-
to de venta es de 10 libras. La editorial espera que sus ventas mensuales
promedio en cada punto de venta sean de 40 ejemplares. Si estas bajan de
tal cantidad entonces la empresa sabe que es hora de hacer una edici6n
nueva. Para adoptar la decision la editorial tom6 una muestra en 30 pun-
tos de venta y observ6 que se vendieran en promedio 36 ejemplares. Si
suponemos que sus ventas tienen distribucion normal y que la empresa
esta dispuesta a utilizar un nivel de significancia de a = 0.01, ;.deberfa
realizar una nueva edicion 0 no?
20 Un fabricante de alimento para perras vende balsas de croquetas de 12.5
kg Y sabe que la desviaci6n estandar del peso de estas balsa es de aproxi-
madamente 25 gramos. EI fabricante no desea que el peso de las balsas
oscile demasiado par abajo ni par arriba de su peso esperado. Para lIevar
este control ha realizado un muestreo aleatorio de 80 bolsas en los ulti-
mos tres meses y detectado un promedio de 12.54 kg. ;.Sera que a un nivel
de significancia de a = 0.05 el promedio de la producci6n de esos tres
meses es distinto de los 12.5 kilogramos?
Ejercicios de refuerzo
0) Un vendedor de electrodomesticos al cambaceo sabe que en 8% de los
hogares la gente se interesa en recibirlo. Si el dia de hoy ha tocado en 40
casas, ,cmil es la probabilidad de que 10 hayan recibido al menos en cinco
de eUas?
2 Obten una muestra aleatoria simple de tamai10 10 de una poblacion de
300 utilizando la tabla de numeros aleatorios (tabla 2).
o Si Z es una variable aleatoria normal estandar, indica los valores de a y b
para que PI a :5 Z :5 b J = 0.95 Y para que P I a :5 Z :5 b J = 0.99.
UN l OAD 4 • ESTAOisTICA INFERENCIAl
4 Si tiramos una Illoneda justa al aire 10 veces seguidas, ;,cual es la probabi.
Iidad de obtener mas de ocho cruces?
o La panaderia "Aroma de canela" produce donas glaseadas y sabe que la
venta matinal de estas tiene una distribuci6n normal, con media 30}' des-
viaci6n estandar 5. ;, Cual es la probabilidad de que se hayan vendido mas
de 37 donas esta maiiana?
6 Si el coeficiente de elevaci6n es k = 30 a la hora de utilizar un muestreo
aleatorio sistematico y deseamos obtener una muestra de tamalio II = 40,
indica que elementos de una lista de la poblaci6n tomarfas para formal' la
muestra y de que tamalio es la poblaci6n de interes.
0 ;,Cuantas muestras de tamalio 11 = 20 sin remplazo pueden extraerse de
una poblaci6n de tamalio N = 350?
8 Una empresa automotriz tiene 5000 en1pl eados. La directora de recursos
humanos ha decidido aumentar el apoyo para que 105 empleados adquie-
ran autos de la empresa y desea saber la edad de los vehiculos que ya po-
seen. Para ello entrevist6 aleatoriamente a 50 trabajadores y les pregunt6
la antigiiedad de sus autos. Si la desviaci6n estandar nacional es de tres
anos y obtuvo una media de antiguedad de los vehiculos de los empleados
entrevistados de dos alios, lque probabilidad hay de que el promedio de los
autom6viles de todos 105 empleados de la empresa sea mayor a dos alios?
® Una compalifa repartidora de correspondencia expres asegura que entre-
ga 105 paquetes en men 05 24 horas. La compania espera que el promedio
de entrega sea de 19 horas y sabe que la desviaci6n estandar de la entrega
es de cinco hOl·as. La empresa esta interesada en que no se entreguen
demasiados paquetes con retraso. Para comprobar sus tiempos de entrega
decidi6 tarnal' una muestra aleatoria de 45 entregas y observ6 que el tiem-
po promedio de entrega fue de 20 horas y 30 minutos. Si esta dispuesta a
utilizar un nivel de significancia de a = 0.05, lla entrega de los paquetes
se lIeva a cabo en un promedio de 19 horas?
10 Un fabricante de juguetes sabe que la desviaci6n estandar de la cantidad
de pintura azul que utiliza para colorear su producto superavi6n transfor-
mador XZ89 es de 0.5 ml. EI fabricante tom6 und muestra aleatoria de
100 aviones de los 200 000 que produjo el mes anterior y obtuvo que en
promedio utilizo 15 ml de pintura azul en cada uno.;,eual es la probabili-
dad de que el promedio de pintura azul utilizada este ente 14 y 16 ml?
Para resoLver los ejercicios 11 a 14, cOllsidera Los datos 111ostmdos ell In
tabla A acerca de 40 illdividuos.
@ Obten una muestra aleatoria estratificada can base en el sexo (nota que
hay 30 hombres y 10 mujeres), que sea proporcional y de tamalio /I = 12
Y estima el peso y la estatura promedio de los individuos en la poblaci6n
a partir de esa muestra.
CSantillana Autoevaluaci6n y ejercicios de refuerzo
279 _
Tabla A Datos relativos a 40 individuos*
Individuo Sexo Peso Estatura Individuo Sexo Peso Estatura
1 M 65 1.63 21 M 63 1.78
2 M 57 1.62 22 M 58 1.61
3 M 70 1.70 23 M 62 1. 58
4 M 82 1.75 24 F 52 1.55
5 M 60 1.65 25 M 77 1.90
6 F 70 1.62 26 M 79 1.72
7 M 55 1.65 27 M 68 1.63
8 F 50 1.57 28 M 66 1.73
9 M 68 1.67 29 F 58 1.53
10 M 62 1.58 30 M 80 1.65
11 M 70 1.69 31 M 65 1.70
12 M 69 1.63 32 M 73 1.75
13 F 55 1.57 33 F 65 1.58
14 M 54 1.64 34 M 85 1.67
15 F 61 1.62 35 F 71 1.79
16 M 63 1.79 36 F 47 1.52
17 M 65 1.69 37 F 51 1.65
18 M 91 1.63 38 M 66 1.73
19 M 59 1.58 39 M 60 1.65
20 M 76 1.63 40 M 68 1.71
* M := sexo masculino, F = sexo femenino, el peso esta en kilogramos y la altura en metros.
12 Obten una muestra aleatoria estratificada con base en el sexo, que sea
constante y de tamano n = 8 Y luego estima el peso y la estatura promedio
de 1a poblaci6n a partir de esa muestra; campara 10 obtenido con los re-
sultados del ejercicio anterior.
@ Estima la correlacion lineal entre el peso y la estatura de las mujeres en
esta poblaci6n.
14 Calcula 1a covarianza y la correlaci6n lineal entre el peso y la estatura de
los hombres.
@ Las ventas mensuales de una gran tienda de cosmeticos tiene una distri-
bucian normal con media $4 SOD 000 Y desviacian estand.r de $350000.
lCual es la pl'Obabilidad de que en un mes se venda menos de 5 000 ODD?
_ 280
UN l OAD 4 I ESTAOfSTICA INHRENCIAl o SantiUana
16 Una Illuestra aleatoria de agricultores de naranja en Veracruz nos dio las
producciones siguientes, en toneladas: 10.3,7.5,8.9,6.5, 12.
a Encuentra la media y la desviacion estandar de esta muestra.
b Si el ministerio de agricultura asegura que la desviacion estandar en el
estado es de 3.2, lcon que probabilidad el promedio de Ia produccian
por argricultor esta entre 9 y 11 toneladas?
@ Sabemos que en promedio hay un accidente de autom6vil por cada mil
autos que circulan a diario en una ciudad.lCuaI es Ia probabilidad de que
ayer hayan ocurrido menos de 20 accidentes si circularon en total 25 000
autom6viles?
18 Una compania de servicio por telefono afirma que sus clientes no esperan
mas de 70 segundos para que los atienda un operador. Se toma una mues-
tra de 20 lIamadas y Ia media muestral fue de 71.3 segundos y Ia desvia-
cion estandar fue de 4.2 segundos. Usa un nivel de significancia del
a = 0.01 para decidir si se rechaza Ia hipatesis nula de que Ia espera pro-
medio es de   = 70 segundos 0 se ace pta hipatesis alternativa   > 70.
@ EI gerente de "La pizza expres'; una compania que vende pizzas a domici-
lio, esta alarm ado por el aparente alto con sumo de gasolina de sus moto-
cicletas repartidoras. Las especificaciones de esos vehiculos indican 25
kil6metros por Iitro de combustible, en promedio, con una desviaci6n
estandar deb ida a las condiciones de trafico de 8 kilametros. Ha realizado
una muestra aleatoria de 40 viajes y observado que se han hecho 22.3 ki-
16metros por Iitro. Para un nivel de significancia de a = 0.05 ,sera cierto
que las motocicletas estan usando mas gasolina?
20 EI jefe de servicios medicos de un hospital quiere comprobar que el tiem-
po promedio en que se realiza una consulta general. Para ello toma una
muestra aleatoria de 55 consultas y observ6 que el promedio fue de 22
minutos. Si sabe que la desviaci6n estandar para estas consultas es de 5
minutos'lcuaI es Ia probabilidad de que el promedio de las consultas me-
dicas generales en el hospital se hallen entre 18 y 22 minutos?
o Santillana Autoevaluaci6n y ejercicios de refuerzo
281 _
,....
-C
RS
-c
e_
C
:::l
282
Apendice.
Para practicar 1
1 4 5
5 3, 6, 95
6 0, 27, 37, 49, 5, 6, 6, 64, 82, 82, 96
7 04, 05, 05, 15
3 2 5, 6, 6, 6, 7, 7, 8, 8, 9
3 0, I, 3, 3, 4, 4, 4, 5, 6
4 0, 0, I , 2, 2
5 5
Para practicar 2
1
(lase Frecuencia Frecuencia Frecuencia Frecuencia relativa
acumulada relativa acumulada
(30,40) 3 3 0.06 0.06
(40, 50) 14 17 0.28 0.34
(50, 60) 6 23 0.12 0.46
(60,70) 16 39 0.32 0.78
(70,80) 7 46 0.14 0.92
(80,90) 2 48 0.04 0.96
(90,100) 2 50 0.04 1
3 a 10.
b 92.85%.
Para practicar 3
1 Histograma de freclIellcias que muestra la percepcion que tiellen 245 es-
tudiantes acerca de un candidato perteneciente a cierto part ido poiftico.
120
100
80
60
40
20
o ,
1 J
5 4 3 2 1
APENDICE
C Santillana
3 a Histograma del peso en kilogramos de 121 recien nacidos.
45
40
35
30
25
20
15
10
5
o
I
,
11.5,2.5) 12.5, 3)
,
I I
,
13, 3.5) 13.5, 4) 14,4.5) 14.5,5.5)
b EI histograma del ejercicio 3 describe mejor los datos, pues es mas pre-
cisa al describir el peso de la mayo ria de los recien nacidos. Ella se debe
a que los intervalos de la tabla de donde surge el histograma son mas
cercanos a los valores del peso de los bebes.
Para practicar 4
1 Grafica circular y polfgono de frecliencias acerca de la evaluaci6n a un
candidato politico (ejercicio 1 de Para practicar 3):
GnHica circular y poligono de frecuencias acerca del peso en kilogram os
de 121 recien nacidos (ejercicio 3 de Para practicar 3):
C Santillana
Peso (kg)
• 11.5,2.5)
• 12.5,3)
13,3.5)
• 13.5,4)
14,4.5)
• 14.5,5.5)
45
40
35
30
25
20
15
10
5
0
11.5, 2.5) (2.5,3) 13,3.5) 13.5,4) 14,4.5) 14.5,5.5)
Soluciones de ejercicios selectos 283
284
Para practicar 4 [continua 1
3 Agrupando los datos queda la tabla:
(lase Frecuencia Frecuencia acumulada Frecuencia relativa
[150, 155)
[155,160)
4
7
----
[160,165) 11
[165,170) 9
[170,175) 4
0.35
0.30
0.25
0.20
0.15
0.10
0.05
4
11
22
31
35
0.11428571
0.2
0.31428571
0.25714286
0.11428571
Estatura (em)
• (150, 155)
(155,160)
• (160, 165)
• (165,170)
(170,175)
0 -r---,----,----.----,----.
(150, 155) (155,160) (160,165) (165,170) (170,175)
Para practicar 5
1 Media y mediana del tiempo de espera de 15 pacientes en un centro de
salud. Ambas medidas representan bien los datos, pues, como se observa
en la tabla, sus valores son Illuy cercanos entre sf.
Media Mediana
32.6666667 30
3 a 0.7.
b 13.
APENDICE
e Santillana
Para practicar 6
1 Rango, varianza (5
Z
) y desviaci6n estandar del tiempo que lIev6 a estudian-
tes resolver un acertijo.
Rango 5 2 5
2.18 0.50157353 0.70821856
3 EI rango intercuartil no se vera afectado.
Autoevaluacion
1 3 27, 82
4 02, 27, 37, 40. 60, 62, 62. 64, 98
5 15, 24, 33. 49, 51, 94
6 02. 04. 50
3
Media Mediana Rango Rango intercuartil Desviaci6n estandar
4.9415 4.81 3.23 1.1025 0.80903198
5
(lase Frecuencia Frecuencia Frecuencia
relativa acumulada
Menor a 2500 3 0.25
2500·2600 3 0.25
2600·2700 2 0.17
Mayor 0 igual a 2700 4 0.33
7 1.2 5, 6. 6. 6, 7, 7, 8. 8, 9
1.3 0, 1. 3. 3, 4, 4, 4, 5. 6
1.4 O. 0, 1, 2, 2
1.5 5
3
6
8
12
9
(ategoria Frecuencia Frecuencia relativa
A 6 0.27
P 5 0.23
5 0.23
D 5 0.23
M 1 0.05
CSantiUana Soluciones de ejercicios selectos 235
286
Autoevaluaci6n [continua J
10
Carrera
• Administration
PSicologia
• Ingenieria
. Oerecho
• Medicina
11
Cursos reprobados Frecuencia frecuencia relativa
o 12 0.46
1 2 0.08
2
5 0.19
3 3 0.12
4 1 0.04
5 3 0.12
13
0.35
0.30
-
0.25
-
0.20
-
0.1 5
0. 10
o.os
0
U J
(0. 50) (50.60) (60,70) (70.80) (80.90)
17
Rango Varianza muestral Desviaci6n estandar muestral
8.77 3.90745752 1.97672899
19 Rango intercuartil = 1.1325.
J J
(90. 100)
No se ve afectado, plies los cuartiles inferior y superior siguen siendo
los mismos.
APENDICE
C Santillana
21
12
10
B
6
2
o
o 20
Ejercicios de refuerzo
••
40

••
60



80
1 3 00, 27, 30, 30, 34, 37, 41, 49, 50, 82, 82, 93
4 OS, 50, 50
5 30, 30, 95
6
7 04, 15
3 2 0, 0, 1, 3, 3
3 0, 1, 2, 2, 2, 3, 3, 5, 5, 6, 6, 6, 6, 7, 7, 8, 8, 9
DA: 55
5

100
Categoria Frecuencia Frecuencia Frecuencia Frecuencia relativa
F 6
v
Ch 3
l 6
relativa acumulada acumulada
0.32 6
0.21 10
0.16 13
0.32 19
0.32
0.53
0.69
1
Sabores
• Fresa
• Vainilla
Chocolate
• limon
o Santillana Soluciones de ejercicios selectos 287
Ejercicios de refuerzo [continua I
7
Categoria Frecuencia Frecuencia Frecuencia Frecuencia relativa
relativa acumulada acumulada
1 16 0.07 16 0.07
2 38 0.16 54 0.23
3 95 0.4 149 0.63
4 54 0.23 203 0.86
5 32 0.14 235 1
9 a
11
50
45
40
35
30
25
20
15
10
5
o
[1.5.2.5) [2.5. 3) [3.3.5) [3.5.4) [4.4.5) [4.5. 5.5)
b Es mejor este pues muestra con mayor precisi6n la concentraci6n de
datos.
Categoria Frecuencia Frecuencia Frecuencia relativa
relativa acumulada
,
131 1 0.0286 0.0286
132 1 0.0286 0.0572
133 2 0.0571 0.1143
134 3 0.0857 0.2
135 1 0.0286 0.2286
138 3 0.0857 0.3143
140 3 0.0857 0.4
141 2 0.0571 0.4571
142 3 0.0857 0.5428
143 4 0.1143 0.6571
144 3 0.0857 0.7428
148 4 0.1143 0.8571
149 1 0.0286 0.8857
150 3 0.0857 0.9714
152 1 0.0286
OSantil lana Soluciones de ejercicios selectos 289
Ejercicios de refuerzo [continua I
11 (cont.)
Estaturas en centlmetros
131 . 142
. 132 • 143
. 133 144
. 134 148
135 . 149
. 138 . 150
140 . 152
. 141
0.12
/'"
/
0.10
0.08
0.06
0.04
0.02
o
131 132 133 134 135 138 140 141 142 143 144 148 149 150 152
13
0.8
0.6
0.4
0.2
o
131 132 133 134 135 138 140 141 142 143 144 148 149 150 152
15 La calificaci6n minima seria 22.5, 10 cual es imposible.
17
Rango 5 2 5
4.16 2.02309412 1.42235513
19 No se ve afectado.
290 APENDICE
C Santillana
Para practicar 1
1 A = {x ix = 3t, can t natural y t:53}; A = {x ix multipla de 3 y 1 < x < 1O}.
3 A = {l,3,S,7, 9}.
Para practicar 2
1 a Verdadero.
b Falsa, pOl·que 8 f/. U
c Verdadera.
d Falsa.
e Verdadera (de hecha, B = A).
I Verdadero (parque 2 f/. 'U).
3 'U = 1\1, verdadero con B = {2}; 'U = Z, falsa con B = { ... , -6, -4,
- 2,2}.
Para practicar 3
1 a Verdadero.
b Falsa, parque (B n C) n A = {mi.
c Verdadero.
3 B = {x I x es natural par distinto de 8)' menar que 13}. C ={x I x es natu-
ral par y 7 < x < H}.
• Asaciatividad de la union: (B U C) = {O, 2, 4, 6, 8, 10, 12}; (A U B) =
{a, 2,4, 6, 8};A U (B U C)= {a, 2,4, 6, 8,10, 12}; (A U B) U C = {a, 2,
4,6,8,1O,12} .
• Asociatividad de la interseceion: (B n C) = 0 ; (A n B) = {2, 4, 6, 8};
A n (B n C)= 0 ; (A n B) n C = 0.
A U B UC
o
10
12
B A C
Cl Santillana Soluciones de ejercicios selectos
N
"'C
ns
"'C
--
c
:::l
Diograma de Venn de 10 ley
asociativa de 10 union
de tres conjuntos.
291
292
Diagrama de 6rbol pora
representor los resultados
posibJes de un juego
devolado.
Para practicar 4
1 a Verdadero. pOl'que B U (U - A) = (par definicion de complemento) =
B U AC = (por De Morgan) = (BC n A)C = (A n BC)C = (por el teore-
rna 4) (A - B)c.
b Falso. pOl'que (B n A)C U C = (por De Morgan) (BC U AC) U C (Ieyes
asociativas) = BC U (AC U C) = (ley conmutativa) = (AC U C) U BC =
(Ieyes De Morgan) = (A n CC)C U BC * (A n CC)C U B.
3 A - BC = {x E IR I 100 :5 x :5 999 l A n BC = {x E IR I 999 < xl.
AC U BC = (x E IR I x < 100 0 999 < xl.
Para practicar 5
1 a 6.
b 41.
3 Observamos que a cada elemento a E A podemos asignarle s610 un ele-
mento b E B. donde a = 3b. con 10 que concluimos que n(A) = n(B).
Para practicar 6
1 Recordemos que n(A U B) = n(A) + n(B) - n(A n B) = 8 + 7 - 5 = 10.
3 n(F) = 90.
Para practicar 7
1 44 numeros del conjunto N son multiplos de 3 0 de 5.
3 65 personas que ven A 0 B; 70 personas no ven A; 35 no ven A ni B.
Para practicar 8
1
sol
aguila
aguila
1
2
sol
3
4
5
Resultado ganador: •
APENDICE
CSantillana
3
b
n
~ <  
Para practicar 9
1 Los objetos que van a combinarse son los ajedrecistas; se puede elegir el
primer miembro de la escuela "Rey y Reina" de 11 maneras y el segundo
miembro de la escuela "La Torre" de seis farmas, 10 que de acuerdo con el
principio de la multiplicaci6n da un total de 66 posibles partidas.
3 Se van a acomodar los miembros de 1a familia en los dos autom6viles. Si
suponemos que cada vehfculo tiene plazas para cuatro pasajeros, C0l110
dos de los ocho miembros iran manejando. s610 debemos determinar de
cuantas farmas acomodamos a los seis pasajeros que no conducen en las
seis plazas Iibres en los autos.
Para practicar 10
1 a 11 = 7.
b 11 = 23.
3 Jl = 5.
Para practicar 11
1 Pod dan haberse acomodado de 6! formas.
3
8!
7'
C Santillana
Soludones de ejercicios selectos
Diagramo de arbol para
representor los resultados de
extraer dos bolas sin remplazo
de una uma con una bola raja,
una negra y una blanca.
293
294
Para practicar 12
1 8·7·6 = 336 = V •.
3
'
3 8· 10' 10· 10· 10 = 80 000.
Para practicar 13
1 C(52,3) = 22 100. De 22 100 fo rmas.
3 Hay 4 X 5 = 20 tipos de auto y deseamos escoger dos; pOl' tanto, hay
C(20. 2) maneras de escogerlos.
Para practicar 14
1 n = 0: 1; n = 1: 2; II = 2: 4; n = 3: 8; n = 4: 16; n = 5: 32; n = 6: 64; II = 7:
128; n = 8: 256; se trata de potencias de 2, y la formula es 2".
3 56.
Para practicar 15
1 en = C(l1, 8).
3 k = 3, b = 1.
Autoevaluaci6n
1 a (A U B)C = {l, 4, 8,10,11 I.
AC = {I, 2. 4,5,7.8, la, 11 I.
BC = {I. 4, 6, 8, 9, la, 11 I.
AcnBc= {I,4,8,IO,l1l·
b An (A U B) = {3, 6, 9,121 n {2, 3, 5, 7, 6, 9,121 = (3, 6, 9.121.
3 Si A C B, entonces para todo x EAse tiene que x E B; por tanto,
x E A n B y para todo x E A n B se tiene x E A, de donde se desprende
que A n B = A.
5 n = 10.
7 n(A) = 6, tI(B) = 6, tI(A U B) = 9 Y n(A n B) = 3.
APENDICE
C Santillana
9 (n
11 12.
13 a  
b (n
15 40.
17 360.
19 41580.
Ejercicios de refuerzo
1 a 720.
b 6.
c 24.
3 604800.
5 60.
7 a 120960.
b 900000.
9 800.
11  
13 a  
b  
c e2
0
) +   +   + + e2
0
)
15 24.
b 25.
c 20.
19 a 50.
b 10.
CSantillana Soluciones de ejercicios selectos 295
296
--
c
:::l
Para practicar 1
1 Cada canasta puede ser exito E a fracaso F; entonces, n = {EEE, EEF,
EFE, FEE, EFF, FEF, FFE, FFF}; n(n) = 8.
3 EI peso es un numero positivQ en un intervalo de los numeros reales; su
cardinaJidad es co.
Para practicar 2
1 n = {A +,0+, B- }; este espacio muestral no es equiprobabl e. Un espacio
muestral equiprobable serfa n = {A +, A +, A +, A +, A +,0+,0+,0+,0+,
0+,0+,0+, B- , B-}.
3 n = {O, 1,2, ... ,20}; este espacio muestral no es equiprobable.
Para practicar 3
1 a {2,4,6,8}.
b {2, 4, S, 6, 8}.
c {L3,S,6,7,8}.
3 a Los eventos no son mutua mente excluyentes.
b Ay B sf 10 son; A y C tambien 10 son, Bye no 10 son.
Para practicar 4
1 P[2] = ;.; P[3] = ;.; P[4] = ;.; P[S] = ~ ; P[6] = ;.; P[7] = ;.; P[8] = ;.;
P[9] = ~ ; P[lO] = ;.; PIll] = ~ ; P[12] = ;.; 7 es el mas probable.
3 La probabilidad es: 0.08788.
Para practicar 5
1 a 0.7.
b 0.3S.
3
c Los eventos estudiar frances y estudiar ingtes no son mutuamente ex-
cluyentes. ya que su interseccion es no vacia.
150
a 500.
b Sf, los eventos votar por A y votar por B son mutua mente excluyentes.
pues no puedes votar par ambos, y la probabilidad de que un voto ele-
gido al azar sea de A 0 de B es : ~ .
c Los eventos votar por By no votar por A no son mutuamente excluyen-
tes, y la probabilidad de que un voto sea de B a no de A es de ;;;g .
APENDICE
C Santillana
Para practicar 6
1 La probabilidad de que la persona elegida al azar sea jubilada es de 0.41.
3 La probabilidad de que la segunda carta elegida al azar sea de diamantes
13
esde51'
Para practicar 7
1 Si 90% de los c1ientes pide corte, los eventos son independientes, en otro
caso, no 10 son,
3 La probabilidad de A U B es de  
Para practicar 8
1 La distribuci6n de probabilidad de la variable aleatoria es:
y P(y)
1
2
3
3
"6
2
"6
1
"6
EI histograma correspondiente a la tabla anterior es el siguiente:
0.5
D.'
0.3
0.2 -
0.1
0
1 2 3
3 Y = 1 si via el programa, Y = 0 si no 10 vio; entonces la distribuci6n de
probabilidad de la variable aleatoria es:
Para practicar 9
Y P(Y)
o
1
6
10
,
10
1 X puede toma! los valores (O, 1,2, .. . , 10).
3 Valor esperado = 1.826; varianza = 0.003264, desviaci6n estandar
0.057131.
CSantiliana Soluciones de ejercicios selectos 297
298
Autoevaluaci6n
1 n = {acuaria. aries, cancer, capricornio. escorpi6n. geminis. leo, libra.
piscis, sagitario, tauro, virgo}. n(Q) = 12.
3 a Equiprobable.
b No equiprobable.
( Equiprobable.
5 a Elemental, no excluyentes.
b Imposible.
( Excluyentes.
6 a PIA) = ,' •.
b PIA U B) = i..
d No equiprobable.
• Equiprobable.
f No equiprobable.
d Seguro.
• No excluyentes.
( PIE) = l.
d PIC) = o.
7 a La probabilidad de que salgan tres cruces es igual at.
b La probabilidad de que salgan dos caras y una cruz es igual at.
( La probabilidad de que salga la misma figura en las tres monedas es
. I '
Igua a 4"
S a La probabilidad de ser un diputado plurinominal es de  
b La probabilidad de ser un diputado sin experiencia y de elecci6n popu-
,
lares
15
.
( La probabil idad de ser un diputado con experiencia 0 de elecci6n po-
pular (no pluri nominales) es de :;.
12 La probabilidad de que ganen Juan 0 Ramon es de  
14 La probabilidad de que hayas escrito con tres colores es de l
16 No es indpendiente; P(A n B) =  
19 Valor esperado = -15.
Ejercicios de refuerzo
1 n(Q) = 4
5
= 1 024.
3 6.
3
5 , •.
7 A Y B son mutua mente excluyentes; A y C tambien 10 son; B y C no 10 son.
9 PIal menos un preferido) =   y Pltres preferidos) = ,'s',.
11 a 0.50. b 0.15. ( 0.8.
13 0.2552.
11
15 15.
17 ElY) = 1 Y Var[Y) = '·5.
19 -0.3846.

.. Santl'1ana
Para practicar 1
1 Si pensamos en mujer como exito y hombre como fracaso. entonces se
tiene n ~ numero de dras y p ~ [53' p(3) ~ 0.0568.
3 La probabilidad es 0.1956.
Para practicar 2
1 La probabilidad es 0.4719.
3
~ (media) a (desviacion estandar)
31.83908 10.88379
EI intervalo es (10.50,53.17).
Para practicar 3
1 a 9 muestras diferentes .
• Muestras posibles:
1 2 3
1 1, 1 1,2 1, 3
2 2,1 2,2
,
2,3
3 1,3 2,3
,
3,3
I Valor de la estimaci6n de las bolas pares:
1 2 3
1 0
1
0 .,
2
1
1
1
., .,
3 0
1
0
,
.,
b Media muestral:
- 0+-+0+ - +1+-+0+- + 0 ~   ~   .
1( 1 1 1 1) 3 1
92222 93
La varianza es de t . Resulta que la media es igual al proporci6n real, y la
varianza es de t.
C Santiliana Soluciones de ejercidos selectos
q
"'C
ns
"'C
.-
c
:::l
299
300
Para practicar 3 (continua)
3 La poblaci6n de interes en este caso abarca a la poblaci6n mexicana con
cartilla de elector vigente. Se pueden considerar como un ceoso en el sen-
tido que de se miden (0 se pretende medir) las preferencias politicas de
toda la poblacion votante del pais. En estricto sentido tend ria que votar el
100% para ser un censo, ya que un ceso mide a todos los individuos de una
poblaci6n mientras que un muestreo solo a un subconjunto propio de ella.
Para practicar 4
1 En un muestreo sistematico se seleccionan los individuos de una Ii sta 0
marco muestral, eligiendo el primero al azar y luego el individuo k-esimo
hasta completar la muestra deseada. mientras que en elmuestreo pOl' COI1-
veniencia no se sigue ningtin sistema especificQ, solo aqueJlos elementos
que hayamos considerado convelliente muestrear (0 aquelJos que se hayan
encontrado disponibles) hasta completar el tamaflo de muestra deseada.
3 Por el tamaflo de la poblaci6n (demasiado grande para evaluar a cada in-
dividuo), por el costo (moneta rio e inconveniente al individuo) de lIevar
la medici6n en un individuo, y par la forma en que se realiza la medici6n
(que puede modificar 0 afectar al individuo).
Para practicar 5
1
1
b - a'
3 N,   250, N2   750, Y N3   1000.
Para practicar 6
1
5 {2OO=s
(J x VsO "V 200=1:" .
3 La probabilidad es: 0.9998
Para practicar 7
1 No hay una respuesta linica, depende de 10 detallado de las observaciones
realizadas par los estudiantes y profesores en los cuestionarios dellNEGI.
3 No hay una respuesta linica, tambien depende de las decisiones de los
estudiantes y profesor.
APENDICE CSantiliana
Para practicar 8
1 EI coeficiente de correlacion es -0.254952374, parece que no hay una
fuerte relaci6n li neal entre las variables, el diagrama de dispersi6n es:
Y;
20

18
16

14

12

10

8

6
• •
4


2

Xl
- 5 - 4 - 3 - 2 - 1 0 2 3 4
Se observa como parece que el comparti miento es cuadratico y no lineal.
3 La estimaci6n en este caso serfa a = 0.526050357, Y b = 68. 16759013.
Para practicar 9
1 Podemos proponer una prueba de hipotesis unilateral izquierda con la
hipotesis nul a   = 80 Y la alternativa   < 80 (que el promedio de califica-
cion de los alumnos sea menor que 80). Para el nivel a = 0.05 Y dada la
observaci6n (93), tenemos z = 93 -80/ (22 / V45) = 3.936 y, por tanto,
rechazamos la hip6tesis de que sus alumnos obtengan en promedio 80 0
mas en el TOEFL.
3 Esta es una prueba de hipotesis unil ateral derecha, con hip6tesis nula
  = 15 (metros) y la alternativa   < 15 (que el ni vel del agua en la presa
sea menor que 15 m en promedio), para el ni vel ex = 0.01; entonces, pues-
to que se observ6 14.3 tenemos que z = - 1.302 Y como no se encuentra
en el intervalo (-00, - 2.33] no podemos rechazar la hi p6tesis y cabe es-
perar que se mantenga la produccion ideal de electricidad.
Autoevaluaci6n
1 La probabilidad de que el conejo gane es 0.003343621, y de que la zorra
gane es 0.996656379.
C Santillana 5aluci ones de ejercicios selectos 301
302
Autoeva/uacion [continua I
3 La probabilidad es: 0.7967.
5 La probabilidad es: 0.9332.
1
7 La probabilidad es: --.
( ~ )
9 La probabilidad es de ,:.,.
11 Constante: 100 individuos en cada estrato. Proporcional: 200 del primer
estrato (credito bajo), 80 del segundo est rato (credito medio) y 20 del
ultimo estrato (credito alto).
13 EI valor de la covarianza es cero.
15 Disminuir en una tercera parte significa tamar una muestra de 20, al divi-
dir la desviaci6n estandar de la media muestral para una muestra de ta-
mano 30 entre la de tama"o 20 (am bas con la correcci6n por poblaci6n
finita, ya que N no es mayor a 20 veces n) obtenemos que el error estandar
no creee en mas de 1.31 veces al disminuir el tamano de la muestra en una
tercera parte.
17 La correlaci6n lineal es: 0.977444045 y presentan una relaci6n lineal po-
sitiva fuerte.
19 Es una prueba unil ateral < ~ o   don de:
z = x - ~ = 36 - 40 = 2.19089023,
a/v.; 1O/V30
y como -2.33 < -2.1908 no rechazamos la hip6tesis nul a ~ = ~ o Y no
realizamos una segunda edici6n todavfa.
Ejercicios de refuerzo
1 La probabilidad es
5
L ( ~ ) (0.08)X (0 92)40-x .
x= l
3 Para 0.95 a = -1.96, b = 1.96, Y para 0.99 a = -2.575 Y b = 2.575.
5 La probabilidad es 0.0808.
7
(
350)
20 .
APENDICE
CSantiliana
9 Es una prueba unilateral ~ > ~ o   donde:
x - " 20.5 - 19
z = - - ~ = = 2.01246118,
a/Vn 5/V45
y esta cantidad esta en el rango I 1.645, 00) entonces rechazamos la hipo-
tesis nula ~ = ~ o = 19 horas de que la entrega se hace en promedio en
19 horas.
11 Si NI es el estrato de hombres y N
z
es el estrato de mujeres entonces
111 = 8, f/z = 3. Basta con elegir a 8 hombres aleatoriamente de los 30 y a
3 mujeres de las 10. Utilizando la tabla de los numeros aleatorios obtene-
mas las observaciones del estrato M: 2, 7, 10, 16, 18,26,31,40 Y del estra-
to F: 8, 15,29,35 que es una muestra de tamano 12 cuyo peso pro media
es: 64.33 y altura pro media: 1.65.
13 La correlaci6n lineal es 0.631578953.
15 La probabilidad es 0.5557.
17 Como N es muy grande podemos aproximar a la binomial par una nor-
mal can media ~ = tip = 25000(1/1000) = 25, a
Z
= np(l - p) =
25000(.001)(.999) = 24.975, entonces:
PIX ,;; 201 = p[z,;; 20 - 25 -1] = 1 - 0.8413 = 0.1587.
v'24.975
Es decir can una probabiJidad menor que 0.16 hay menos de 20 acci-
dentes.
19 Es una prueba unilateral ~ < ~ o   can:
x - ~ 22.3 - 25
z = --= = -2.134537421,
a/Vn 8/V40
y esta cantidad est. en el rango (-00, - 1.6451; entonces rechazamos la
hipotesis nula ~ = ~ o = 25 Km /I y el gerente puede asegurar que las
motocicletas estan usando mas gasoli na de 10 esperado.
O Santiliana Soluciones de ejercicios selectos 303
Este material se termino de impnmw en marzo de 20! [
en Impresos Lltopohs SA de C.v
Mal'celino Davalos 30. Col. Algarin. c.p, 06880 MexIco OF