La estadistica y el método científico - 1

-
La estadística y el método científico
INTRODUCCIÓN
Se ha preguntado usted alguna vez ¿en qué forma se llega a conocer la verdad? La
mayoría de los estudiantes universitarios estaría de acuerdo en que el descubrimiento de lo
verdadero, ya sea en el mundo, en nosotros mismos o en los demás, constituye una
actividad muy importante !n poco de refle"i#n nos revela que dedicamos gran parte del
tiempo a esa tarea Si estudiamos geografía $ueremos saber lo que es verdadero acerca de
las características geográficas de una regi#n en particular ¿%s la regi#n monta&osa o plana,
agrícola o industrial? Si nos interesa el estudio de la naturaleza humana, queremos saber lo
que es verdadero acerca de los humanos ¿'ealmente poseemos una naturaleza espiritual o
en verdad somos reducibles a simples átomos y moléculas como afirmarían los
reduccionistas? ¿(#mo piensan los humanos? ¿$ué ocurre en el cuerpo para que se produzca
una sensaci#n o un movimiento? (uando siento eno)o, ¿es cierto que e"iste un patr#n
fisiol#gico subyacente *nico? ¿(uál es ese patr#n? ¿Ser profesor es mi verdadero prop#sito en
la vida? ¿%s cierto que los animales piensan? +odríamos continuar citando de manera
indefinida este tipo de e)emplos en virtud de que gran parte de la vida la transcurrimos en la
b*squeda y el hallazgo de la verdad
MÉTODOS D !D"UISICIÓN DL CONOCIMINTO
,esde un punto de vista hist#rico, la humanidad ha empleado cuatro métodos para
adquirir conocimiento- la autoridad, el racionalismo, la intuici#n y el método científico
!#to$idad (uando se utiliza el método basado en la autoridad, algo se considera
verdadero por el solo hecho de que una tradici#n o alguna persona eminente afirma que lo es
.sí, podemos creer en la teoría de la evoluci#n porque nuestros ilustres profesores nos dicen
que es verdadera, o bien, creer que ,ios e"iste porque así lo afirman nuestros padres .unque
este método de conocimiento tiene poca aceptaci#n en la actualidad y a veces conduce a
errores, es indispensable en la vida cotidiana Simplemente aceptamos una gran cantidad de
informaci#n como cierta con base en una autoridad, aunque s#lo sea porque no tenemos ni el
tiempo ni la pericia que se requieren para comprobarlo de primera mano +or e)emplo, yo creo,
tomando como base lo que dicen los e"pertos en física, que los electrones e"isten, pero nunca
he visto ninguno/ o, para hablar de algo más cercano, si el )efe de cirugía me e"plica que el
cigarrillo provoca cáncer, de)aré de fumar porque tengo fe en lo que el médico me dice y porque
no dispongo ni de los medios ni del tiempo necesarios para investigar el tema por mí mismo
Racionalismo %ste método utiliza e"clusivamente el razonamiento para llegar al
conocimiento Supone que si las premisas son válidas y el razonamiento se realiza de manera
correcta, seg*n las reglas de la l#gica, entonces las conclusiones tienen que ser la verdad
%stamos muy familiarizados con el proceso de razonar porque lo utilizamos mucho +or
e)emplo, consideremos el siguiente silogismo-
0odos los profesores de estadística son personas interesantes %l se&or 1 es profesor de
estadística +or lo tanto, el se&or 1 es una persona interesante
Si la primera afirmaci#n es cierta 2¿eso quién lo dudaría?3 y si la segunda afirmaci#n es
verdadera, entonces la conclusi#n también debe ser verdadera 4ablando en serio, es di fícil
que alguien cuestione la importancia del proceso de razonamiento para encontrar la verdad
Sin embargo, e"iste un gran n*mero de situaciones en que, por sí solo, el razonamiento es
inadecuado para encontrarla
+or e)emplo, supongamos que usted observa que 5uan, un amigo suyo, ha estado
deprimido desde hace algunos meses (omo estudiante de psicología, usted sabe que los
problemas psicol#gicos pueden causar depresi#n +or lo tanto, es razonable pensar que 5uan
pueda tener problemas psicol#gicos que le ocasionan esa depresi#n +or otro lado, también
La estadistica y el método científico - % -
sabe que ésta puede ser provocada por una dieta inadecuada 6sta es otra causa posible del
problema %n este caso, e"isten dos e"plicaciones l#gicas razonables para el fen#meno +or lo
tanto, por sí sola la raz#n resulta inadecuada para distinguir entre ellas %ntonces tenemos
que recurrir a la e"periencia ¿%n verdad es deficiente la dieta de 5uan? ¿%l me)oramiento de
sus hábitos alimenticios corregiría la situaci#n? 7 bien, ¿tiene en realidad 5uan problemas
psicol#gicos serios, y el tratamiento adecuado podría aliviar su depresi#n? ,e esta manera
comprobamos que la raz#n pura puede ser suficiente para arro)ar luz en algunos casos,
pero que es claramente inadecuada en otros
(omo veremos, el método científico también utiliza la raz#n para llegar a la verdad,
pero el razonamiento puro es s#lo una parte del proceso .sí, el método científico
incorpora la raz#n, pero no es un sin#nimo de ésta
Int#ici&n %l conocimiento se adquiere también a través de la intuici#n (on ésta
nos referimos a esa inspiraci#n s*bita, esa idea que aclara y salta a la conciencia como un
todo 8o se llega a ella por medio de la raz#n +or el contrario, con frecuencia la idea
parece surgir después que ha fallado el razonamiento consciente . continuaci#n
presentaremos un par de e)emplos-
4e aquí el relato del propio 9etchni:off acerca de cuál fue el origen de la idea de la
fagocitosis- ;!n día, cuando toda mi familia había ido al circo para ver la notable actuaci#n de unos
simios, me quedé solo en casa, con mi microscopio, y me puse a observar la vida en las células
m#viles de una larva transparente de un pez, cuando una nueva idea brill# s*bitamente en mi
cerebro 9e pareci# de pronto que unas células similares podrían intervenir en la defensa del
organismo contra los intrusos .l sentir que había algo muy interesante en este asunto, me sentí
tan e"citado que comencé a andar a grandes zancadas por todo el cuarto, de un lado a otro, e
incluso fui a la playa para ordenar mis ideas; 4adamard cita una e"periencia del matemático
<auss, quien escribi# acerca de un problema que había tratado infructuosamente de resolver a lo
largo de varios a&os- ;=inalmente, hace dos días, tuve é"ito (omo un relámpago, el acerti)o
empez# a resolverse >o no podría decir cuál fue el hilo conductor que me llev# desde lo que sabía
con anterioridad hasta aquello que hizo posible el é"ito;
%s interesante observar que con frecuencia la idea intuitiva surge después que el
razonamiento consciente ha fracasado y cuando el individuo ha de)ado de lado el
problema durante un tiempo .sí, ?everidge cita a dos científicos en los siguientes
términos-
,espe)ando de mi mente todas las ideas que tenía acerca del problema, caminé
vigorosamente por la calle cuando de pronto, en cierto punto que a*n podría localizar, como si
viniera del cielo hacia mí, una idea surgi# en mi cabeza como si una voz me la di)era a gritos
,ecidí abandonar el traba)o y todas las ideas acerca de él y entonces, al día siguiente,
cuando estaba ocupado en una tarea de otra índole, una idea lleg# a mi mente como un
relámpago, y ésa era la soluci#n su sencillez misma me hizo cavilar por qué no se me había
ocurrido pensar en ella antes
. pesar del hecho de que la intuici#n ha sido utilizada como fuente de conocimiento
durante toda la e"istencia de la humanidad, sigue siendo un proceso misterioso acerca
del cual s#lo tenemos una comprensi#n muy rudimentaria
Método científico .unque el método científico utiliza el razonamiento y la intuici#n
para llegar a la verdad, se fundamenta en una evaluaci#n ob)etiva que lo distingue de los
otros métodos %l experimento científico se encuentra en el centro de la ciencia %l método
de la ciencia es bastante directo +or alg*n medio, generalmente un razonamiento deductivo
a partir de la teoría e"istente o una inducci#n a partir de hechos reales o a través de la
intuici#n, el científico llega a una hip#tesis sobre cierta particularidad de la realidad
%ntonces, el investigador dise&a un e"perimento para verificar la hip#tesis de manera
La estadistica y el método científico - ' -
ob)etiva +osteriormente, los datos obtenidos como resultado del e"perimento se analizan
en forma estadística y la hip#tesis es aceptada o rechazada La característica más
importante de esta metodología es que no importa lo que el científico crea que es
verdadero con respecto a la hip#tesis en cuesti#n, pues el e"perimento proporciona una base
para realizar una evaluaci#n objetiva de dicha hip#tesis Los datos del e"perimento obligan a
e"traer una conclusi#n acorde con la realidad, .sí, la metodología científica trae un
;salvavidas integrado; para garantizar que las afirmaciones de veracidad de cualquier tipo,
sobre la realidad, se a)usten a la veracidad demostrada con respecto a los fen#menos
estudiados, antes que las afirmaciones reciban la categoría de verdades científicas
!n aspecto importante de esta metodología es que los datos demostrarán si el
investigador ha mantenido ideas err#neas o no con respecto al ob)eto de estudio %sas ideas
pueden contrastarse entonces con los datos y son verificadas de nuevo La metodología
científica, aunque a veces es muy lenta, posee una característica de autocorrecci#n que, a
largo plazo, tiene una alta probabilidad de llegar a la verdad (omo en este te"to se hace
énfasis en el análisis estadístico y no en el dise&o e"perimental, no podemos dedicar mucho
tiempo al análisis del dise&o de los e"perimentos Sin embargo, estudiaremos algunos dise&os
e"perimentales, en virtud de que están íntimamente relacionados con el análisis estadístico
La estadistica y el método científico - ( -
D)INICIONS
.l analizar éste y otros materiales del libro, utilizaremos ciertos términos técnicos
+resentamos a continuaci#n estos términos y sus definiciones-
*o+laci&n (on)unto completo de individuos, ob)etos o datos que el investigador está
interesado en estudiar %n un e"perimento, la poblaci#n es el grupo más grande de individuos
del cual se pueden tomar los su)etos que participarán en dicho e"perimento
M#est$a Subcon)unto de la poblaci#n %n un e"perimento, por razones econ#micas,
lo usual es que el investigador re*na los datos acerca de un grupo de su)etos de menor
tama&o que la poblaci#n total %se grupo menor es la muestra
,a$ia+le Cualquier propiedad o característica de algún evento, objeto o persona, que
puede tener diversos valores en diferentes instantes, según las condiciones. La estatura, el
peso, el tiempo de reacci#n y la dosis de un medicamento son e)emplos de variables !na
variable debe contrastarse con una constante, la cual, por supuesto, no asume diversos
valores en diferentes instantes !n e)emplo de una constante es el símbolo matemático @/
siempre tiene el mismo valor 2ABC si se e"presa con una precisi#n de dos cifras decimales3
,a$ia+le inde-endiente La variable independiente de un experimento es aquella que es
controlada en forma sistemática por el investigador. %n la mayor parte de los e"perimentos, el
científico está interesado en determinar el efecto que produce una variable, digamos, la variable
., sobre una o más variables +ara esto, el e"perimentador controla los niveles de la variable
. y mide el efecto que produce sobre las demás variables, . la variable A se le llama
independiente debido a que sus niveles son controlados por el investigador, sin importar los
cambios que puedan ocurrir en las demás variables +or e)emplo, un científico podría estar
interesado en el efecto del alcohol sobre el comportamiento social +ara investigar esto es
probable que el e"perimentador vaya modificando la cantidad de alcohol que suministra a
varias personas y mida sus consecuencias sobre la conducta social de éstas La cantidad de
alcohol suministrada es la variable independiente %n otro e"perimento se estudia el efecto
de la privaci#n del sue&o con respecto al comportamiento agresivo . los su)etos de dicho
e"perimento se les priva de distintas horas de sue&o y se observan las consecuencias
resultantes en relaci#n con la agresividad %n este caso, se controla la magnitud de la
privaci#n del sue&o +or lo tanto, ésta es la variable independiente
,a$ia+le de-endiente La variable dependiente en un e"perimento es la que el
investigador mide para determinar el efecto de la variable independiente +or e)emplo,
en el e"perimento que estudia los efectos del alcohol sobre el comportamiento social, la
cantidad de alcohol es la variable independiente %l comportamiento social de los su)etos se
mide para ver si resulta afectado por la cantidad de alcohol consumida .sí, el
comportamiento social es la variable dependiente Se le llama dependi ente porque depende
de la cantidad de alcohol consumida %n la investigaci#n sobre la privaci#n del sue&o y el
comportamiento agresivo, se controla la cantidad de privaci#n del sue&o, y se mide el
comportamiento agresivo de los su)etos La magnitud de la privaci#n del sue&o es la variable
independiente y el comportamiento agresivo es la variable dependiente
Datos 9edidas que se realizan sobre los su)etos de un e"perimento +or lo
general, los datos consisten en las medidas de la variable dependiente o de otras características
del su)eto, como la edad, el se"o, el n*mero de individuos, etcétera Los datos, en la forma
original en que son medidos, se conocen como datos brutos, en bruto u originales
stadística 8*mero calculado a partir de los datos de la muestra, que cuantifica
una característica de dicha muestra .sí, el promedio de un con)unto de datos obtenidos a
partir de la muestra sería una estadística
*a$.met$o 8*mero calculado sobre los datos de una poblaci#n que cuantifica
La estadistica y el método científico - / -
una característica de dicha poblaci#n +or e)emplo, el valor promedio de un con)unto de
datos poblacionales se llama parámetro (onviene observar que una estadística y un
parámetro son conceptos muy similares La *nica diferencia es que la estadística se calcula
sobre una muestra y el parámetro se calcula con respecto a una poblaci#n
!n e)emplo general- modo de presentaci#n y retenci#n
(onsideraremos ahora un e"perimento ilustrativo en el cual aplicaremos los términos
que hemos analizado anteriormente
!n profesor lleva a cabo un e"perimento para determinar si el modo de
presentaci#n influye en el grado en que se recuerda un material +ara este
e"perimento, el investigador utiliza varios pasa)es en prosa que se presentan en
forma visual u oral Se elige a cincuenta estudiantes entre los asistentes a la
universidad en la cual traba)a ese maestro Los estudiantes se dividen en dos grupos
de DE individuos cada uno %l primer grupo recibe una presentaci#n visual de los
pasa)es en prosa y el segundo grupo escucha los pasa)es en una pre sentaci#n oral
.l final de sus respectivas presentaciones, se pide a los su)etos que escriban la
mayor parte del material que sean capaces de recordar Se calcula el promedio de
palabras recordadas por cada grupo y los promedios son comparados para ver si el
modo de presentaci#n tuvo alg*n efecto
%n este e"perimento, la variable independiente es el modo de presentaci#n de los
pasa)es en prosa, es decir, si es oral o visual La variable dependiente es el n*mero de
palabras recordadas La muestra está conformada por los EF estudiantes que participaron en
el e"perimento La poblaci#n es el grupo total de los individuos de los cuales se tom# la
muestra, es decir, todos los estudiantes que asisten a la universidad Los datos son el
n*mero de palabras recordadas por cada estudiante incluido en la muestra %l promedio de
palabras recordadas por cada grupo es una estadística, pues mide una característica de los
datos de la muestra (omo no se hizo medici#n de ninguna característica de la poblaci#n, no
se calcul# ning*n parámetro en este e"perimento Sin embargo, para ilustrar el concepto,
supongamos que toda la poblaci#n hubiera presenciado una presentaci#n visual de los
pasa)es Si entonces calculáramos el n*mero promedio de palabras recordadas por toda la
poblaci#n ese resultado sería un parámetro, pues con él se mediría una característica de los
datos correspondientes a toda la poblaci#n 'esolvamos ahora un problema para practicar la
identificaci#n de estos términos
%specifique usted lo siguiente en el caso del e"perimento que describiremos a
continuaci#n la variable inde-endiente0 la1s2 3a$ia+le1s2 de-endiente1s20 la m#est$a0 la
-o+laci&n4 los datos0 la1s2 estadística1s2 y el1los2 -a$.met$o1s24
!n profesor de ginecología, miembro de una prestigiada escuela de medicina, quiere
determinar si un implante de tipo e"perimental para el control de la natalidad tiene efectos
colaterales sobre el peso corporal y la depresi#n en las mu)eres !n grupo de EFFF mu)eres
adultas, residentes de una ciudad cercana, se han ofrecido como voluntarias para el
e"perimento %l ginec#logo elige a BFF de esas mu)eres para que participen en el estudio
(incuenta de las voluntarias son asignadas al grupo B y las otras EF al grupo D, de manera que
los datos sobre el peso corporal promedio y la depresi#n promedio de cada grupo sean iguales
al principio del e"perimento Las condiciones del tratamiento son las mismas para ambos grupos,
e"cepto porque a las mu)eres del grupo B se les realiza el implante del dispositivo e"perimental
para el control natal, mientras que las mu)eres del grupo D reciben un implante placebo %l
peso corporal y el nivel de depresi#n se miden al inicio y al final de la prueba +ara medir la
depresi#n se utiliza un cuestionario estándar/ mientras más alto sea el punta)e obtenido en
este cuestionario, tanto más deprimida estará la persona .l final del e"perimento el peso
corporal promedio y los niveles de depresi#n promedio de cada grupo se comparan entre sí
para determinar si el implante e"perimental tuvo alg*n efecto sobre estas variables +ara
La estadistica y el método científico - 5 -
proteger a las mu)eres contra un embarazo no deseado, durante todo el e"perimento se utiliz#
también otro método de control natal que no interfería con el implante
SOLUCIÓN
Variable independiente: el implante e"perimental para el control natal, versus el
placebo
Variables dependientes: el peso corporal y el nivel de depresi#n uestra: las BFF
mu)eres que participaron en el e"perimento
!oblaci"n: las EFFF mu)eres que se ofrecieron como voluntarias para el e"peri mento
#atos: los datos individuales del peso corporal y de los niveles de depresi#n de las BFF
mu)eres, al inicio y al final del e"perimento
$stadísticas: la media de los pesos corporales del grupo B al inicio y al final del
e"perimento, la media de los niveles de depresi#n del grupo al inicio y al final de la prueba,
más las mismas cuatro estadísticas correspondientes al grupo D
!arámetro: no se dieron ni se calcularon parámetros para este e"perimento Si el
ginec#logo hubiera medido los pesos corporales de las EFFF voluntarias al inicio de la prueba, la
media de esos EFFF pesos habría sido un parámetro
IN,STIC!CION CINT6)IC! 7 ST!D6STIC!
La investigaci#n científica se puede clasificar en dos categorías- los estudios
observacionales y los e"perimentos reales Las técnicas estadísticas son importantes en
ambos tipos de investigaciones
st#dios o+se$3acionales %n este tipo de investigaci#n, ninguna variable es controlada en
forma activa por el investigador ,entro de esta categoría de investigaci#n figuran- 12 la
o+se$3aci&n nat#$alista0 %2 la estimaci&n de -a$.met$os y '2 los est#dios co$$elacionales
%n la investigaci#n basada en la observaci#n naturalista, uno de los principales ob)etivos
consiste en obtener una descripci#n precisa de la situaci#n que se estudia <ran parte de la
investigaci#n antropol#gica y etiol#gica es de este tipo La investigaci#n de estimaci#n de
parámetros se realiza sobre las muestras para estimar el nivel de una o varias características
poblacionales 2por e)emplo, el promedio o porcenta)e de una poblaci#n3 Las encuestas de
opini#n p*blica, los escrutinios y gran parte de la investigaci#n de mercado pertenecen a esta
categoría %n la investigaci#n correlacional, el e"perimentador se centra en dos o más variables
para precisar si están relacionadas unas con otras +or e)emplo, para determinar si la obesidad
y la alta presi#n sanguínea están relacionadas entre sí en los adultos mayores de AF a&os !n
investigador tendría que medir el nivel de grasa corporal y la presi#n sanguínea de una
muestra de individuos adultos mayores de AF a&os %l e"perimentador analizaría a
continuaci#n los resultados para verificar si e"iste alguna relaci#n entre esas variables- es
decir, tendría que comprobar si los individuos con ba)os niveles de grasa tienen también ba)a
presi#n sanguínea, si en los individuos con niveles moderados de grasa la presi#n sanguínea
es moderada, y si aquellos con altos niveles de grasa registran una alta presi#n sanguínea
8-e$imentos $eales %n este tipo de investigaci#n se intenta determinar silos cambios
registrados en una variable producen cambios en otra (on este tipo de investigaci#n se
controla una variable independiente y se estudia el efecto que ésta causa sobre alguna
variable dependiente Sin embargo, puede haber más de una variable independiente y
dependiente %n el caso más sencillo s#lo e"isten una variable independiente y otra
dependiente !n e)emplo de este caso es el e"perimento ya mencionado en el que se intent#
investigar el efecto del alcohol sobre el comportamiento social %n esa prueba, como el lector
recordará el nivel de alcohol fue controlado por el e"perimentador y se midi# su efecto
sobre el comportamiento social
La estadistica y el método científico - 9 -
MUSTRO !L!TORIO
%n todas las investigaciones antes descritas, los datos son recopilados, por lo general,
a partir de una muestra de su)etos y no sobre toda la poblaci#n en la cual se pretende aplicar
los resultados Lo ideal, por supuesto sería que el e"perimento se realizara sobre toda la
poblaci#n, pero generalmente eso es demasiado costoso y por eso se considera s#lo una
muestra 7bserve que no cualquier muestra sirve 6sta deberá ser una muestra de tipo
aleatorio %l muestreo aleatorio será analizado en el capítulo G +or ahora, basta saber que
este muestreo permite aplicar las leyes de la probabilidad a los datos y, al mismo tiempo,
ayuda a lograr que la muestra sea representativa de la poblaci#n de la cual fue e"traída .sí,
los resultados obtenidos a partir de la muestra deberán aplicarse también a la poblaci#n !na
vez reunidos los datos, éstos se analizan en forma estadística y de ellos se e"traen las
conclusiones adecuadas acerca de la poblaci#n
ST!D6STIC! DSCRI*TI,! IN)RNCI!L
%l análisis estadístico es el tema principal de este libro Lo hemos dividido en dos áreas-
%& estadística descriptiva ' (& estadística inferencial. .mbas implican el análisis de datos Si se
realiza un análisis con el fin de describir o caracterizar un con)unto de datos que ha sido
reunido, entonces estamos en el área de la estadística descriptiva +or e)emplo, suponga que
su profesor de biología acaba de registrar las calificaciones del grupo ,evuelve los
e"ámenes y ahora quiere describir los resultados obtenidos 6l podría calcular el promedio de
la distribuci#n para describir su tendencia central. $s probable que también quiera
determinar su rango para caracterizar su variabilidad. 0ambién podría representar las
calificaciones en una gráfica para mostrar la forma de la distribuci#n (omo todos estos
procedimientos tienen la finalidad de describir o caracterizar los datos ya reunidos,
corresponden al campo de la estadística descriptiva
+or otro lado, la estadística inferencial no se refiere a la simple descripci#n de los datos
obtenidos, sino que abarca las técnicas que nos permiten utilizar los datos muestrales para
inferir o e"traer conclusiones sobre las poblaciones de las cuales fueron obtenidos dichos
datos 6sta es la parte más comple)a del análisis estadístico Hmplica la probabilidad y varias
pruebas de inferencia, como la prueba t de Student y el análisis de varian)a.
+ara ilustrar la diferencia entre la estadística descriptiva y la inferencial, suponga que
estamos interesados en determinar el (H promedio de todos los estudiantes del primer a&o de
su universidad (omo sería demasiado costoso y tardado medir el (l de cada uno de los
alumnos que forman parte de la poblaci#n, consideraríamos el empleo de una muestra
aleatoria de, digamos, DFF estudiantes y les daríamos a cada uno una prueba de (H
0endríamos entonces DFF calificaciones de (l como muestra, ' queremos que éstas nos
sirvan para determinar el (H promedio de la poblaci"n. .unque no podemos determinar el
valor e"acto del promedio de la poblaci#n, podemos estimarlo utilizando los datos de la
muestra )unto con una prueba de inferencia llamada la prueba t de Student Los resultados
nos permitirían hacer afirmaciones tales como- ;0enemos *+, de confianza de que el intervalo
%%+-%(. contiene al (l promedio de la poblaci#n; %n este caso, no s#lo estamos describiendo
las calificaciones obtenidas, como en el caso del e"amen de biología, sino estamos utilizando
las calificaciones de la muestra para inferir un valor correspondiente a toda la poblaci#n +or lo
tanto, estamos en el campo de la estadística inferencial .sí, la estadística descriptiva ' la
inferencia& se pueden definir de la siguiente manera-
La estadística desc$i-ti3a estudia las t/cnicas que se utili)an para describir o caracteri)ar
los datos obtenidos.
La estadística infe$encia: inclu'e las t/cnicas que emplean los datos obtenidos en la
muestra para, a partir de ellos, 0acer inferencias sobre sus respectivas poblaciones.
USO D L! COM*UT!DOR! N ST!D6STIC!
La estadistica y el método científico - ; -
%l uso de las computadoras en la estadística se increment# en gran medida durante la
*ltima década ,e hecho, en la actualidad casi todos los datos de investigaci#n en las
ciencias del comportamiento se analizan mediante programas estadísticos de computadora,
en lugar de hacerlo ;a mano; con una calculadora 6stas son buenas noticias para los
estudiantes, quienes con frecuencia gustan de las ideas, conceptos y resultados de la
estadística, pero detestan los cálculos ;manuales; %l hecho es que los investigadores
también odian los cálculos y, por lo tanto, casi siempre utilizan una computadora para
analizar los con)untos de datos de tama&o considerable Las computadoras tienen la
venta)a de ahorrar tiempo y esfuerzo, minimizar la posibilidad de errores de cálculo, facilitar la
presentaci#n gráfica de los datos y proporcionar un me)or mane)o de grandes con)untos de
éstos . pesar de su gran utilidad, es frecuente que un curso básico de estadística no las
incluya +or lo tanto, he escrito esta edici#n del libro de modo que usted pueda aprender el
contenido estadístico con el material para computadora o sin él
%"isten varios programas de computadora para realizar el análisis estadístico Los más
populares son el Statistical +ac:age for the Social Sciences 2S+SS3, ?iomedical (omputer
+rogramsI+ series 2?9,+3, StatistiHcal .nalysis System 2S.S3, S>S0.0, 9H8H0.? y %"cel
%"isten versiones de S+SS, S.S, S>S0.0 y 9H8H0.? para mainframes y microcomputadoras
Jale la pena dedicar cierto tiempo para aprender uno o varios de estos programas +ara los
estudiantes que desean usar el S+SS con este libro de te"to, he incluido e)ercicios para
computadora en el material adicional, que se encuentra disponible en inglés, en-
httpKKKthomsonlearningcomm" %stos e)ercicios son apropiados para usarse con la edici#n
de S+SS para el estudiante
(uando usted comience a resolver problemas con computadoras, creo que empezará a
e"perimentar la diversi#n y el poder de cálculo que puede aportar esta máquina a su
estudio de la estadística ,e hecho, una vez que haya utilizado una computadora para
analizar datos, es probable que se pregunte- ¿+or qué tengo que hacer todos estos cálculos
comple)os a mano?; +or desgracia, el uso de una computadora para calcular el valor de una
estadística no le ayuda a comprenderla La comprensi#n de la estadística y su me)or uso se
logran a través de la realizaci#n de cálculos a mano +or supuesto, una vez que aprenda todo
lo que pueda a partir de los cálculos manuales, el uso de la computadora para obtener
valores estadísticos parecerá bastante razonable
L! ST!D6STIC! 7 L <MUNDO R!L<
(omo ya he mencionado, uno de los principales ob)etivos de la estadística es ayudar en
la evaluaci#n científica de ciertas afirmaciones .unque usted puede ver esto como un asunto
esotérico y ale)ado de la vida cotidiana, creo que al terminar de leer este libro estará
convencido de que la comprensi#n de la estadística tiene importantes aspectos prácticos
para su é"ito personal en la vida . medida que lea este te"to, espero que sea cada vez más
consciente de la frecuencia con la que somos bombardeados en la vida diaria por; autoridades;
que nos dicen, con base en ;afirmaciones ciertas;, lo que debemos hacer, c#mo debemos vivir,
lo que debemos comprar, lo que debemos valorar, etc %n áreas de verdadera importancia
para usted, espero que comience a preguntarse cosas como- ;¿%stán respaldadas estas
afirmaciones por datos?;
I
,L;¿qué tan confiables son esos datos?;/ ;¿es el azar una e"plicaci#n
razonable para los datos?; Si no e"isten datos, o si éstos se presentan con e"presiones como
;mi e"periencia es que ; en lugar de haber sido obtenidos por medio de e"perimentos bien
controlados, usted comenzará a cuestionarse si debe considerar en serio el conse)o de esa
autoridad
+ara ayudarle a desarrollar el aspecto de la toma de decisiones mediante la estadística,
al final de ciertos capítulos he incluido aplicaciones de la vida cotidiana con el título ;¿(uál es
la verdad?; +ara comenzar, consideremos el siguiente material
%n este capítulo analizamos la forma en que se establece la verdad
0radicionalmente se han utilizado cuatro métodos- la autoridad, la raz#n, la intuici#n y la
La estadistica y el método científico - = -
ciencia %l e"perimento científico es el elemento central de la ciencia 9ediante un
razonamiento o por si intuici#n, el investigador crea una hip#tesis acerca di cierta
particularidad de la realidad . continuaci#n, e científico dise&a un e"perimento a fin de
probar di manera ob)etiva la hip#tesis Los datos del e"perimento se analizan estadísticamente
y la hip#tesis es confirmada o rechazada
La mayor parte de la investigaci#n científica cabe en alguna de estas dos categorías- los
estudios observacionales y los e"perimentos reales La observaci#n natural, la estimaci#n de
parámetros y los estudios correlacionales se incluyen dentro de la categoría de observaci#n
Su ob)etivo principal es brindar una descripci#n precisa de la situaci#n, estimar los
parámetros de la poblaci#n, o determinar si dos o más de las variables están relacionadas entre
sí (omo no e"iste un control sistem1tico de alguna variable ni el e"perimentador al realizar
un estudio de observaci#n, este tipo de investigaci#n no permite determinar si los
cambios en una variable producirán cambios en otra %se tipo de resultado s#lo se puede
determinar a partir de e"perimentos reales
%n los e"perimentos reales, el investigador controla en forma sistemática la variable
independiente y observa su efecto sobre una o más variables dependientes ,ebido a
cuestiones prácticas, los datos se re*nen s#lo sobre una muestra de su)etos y no sobre
toda la poblaci#n %s importante que la muestra sea aleatoria Los datos obtenidos se
analizan después de manera estadística
%l análisis estadístico puede ser descriptivo o inferencial Si el análisis s#lo describe o
caracteriza los datos obtenidos está en el campo de la estadística descriptiva Si el análisis usa
los datos obtenidos para hacer inferencias sobre las poblaciones, está en el campo de la
estadística inferencial %l conocimiento del análisis estadístico tiene importantes
consecuencias prácticas en la vida diaria
*R>UNT!S 7 *RO?LM!S
2ota para el estudiante: usted observará que al final de algunos problemas de éste y
otros capítulos, e"cepto el D, identificará por medio de color un área específica de la psicología
y otros campos afines en los que el problema tiene aplicaci#n +or e)emplo, el problema M parte
b, página BG, es un problema del área de la psicología biol#gica .gregué el letrero ;biol#gica;
al final del problema, omitiendo el término ;psicología; en aras de la brevedad Las áreas
específicas identificadas son psicología cognitiva, psicología social, psicología del desarrollo,
psicología biol#gica, psicología clínica, psicología industrialNorganizacional 2HN73, psicología de
la salud, educaci#n y otras (omo ya afirmé, en el letrero que utilizo omití el término
;psicología; en aras de la brevedad %spero que estos letreros sean *tiles para que su profesor
seleccione los problemas para realizar en casa y que le permitan a usted apreciar la
amplitud de las aplicaciones de este material, además de ayudarle a identificar los
problemas que tal vez le agradaría resolver, aparte de los que le hayan sido asignados
La estadistica y el método científico - 1@ -
ARCICIOSB
,efina cada uno de los siguientes términos-
+oblaci#n Jariable dependiente
9uestra (onstante
,atos %stadística
Jariable +arámetro
Jariable independiente
D ¿(uáles son los cuatro métodos para adquirir el conocimiento? %scriba un párrafo
breve que e"plique los aspectos esenciales de cada uno de ellos
A ¿%n qué difiere el método científico de cada uno de los siguientes métodos?
a 9étodo de autoridad b 9étodo de racionalismo c 9étodo de intuici#n
C %scriba un párrafo breve en el cual compare la observaci#n naturalista con los
e"perimentos reales
E ,istinga entre la estadística descriptiva y la inferencial +roponga e)emplos para
ilustrar los puntos establecidos
M %n cada uno de los siguientes e"perimentos, especifique- B3 la variable
independiente, D3 la variable dependiente, A3 la muestra, C3 la poblaci#n, E3 los datos y M3 la
estadística-
a !n psic#logo de la salud está interesado en saber si la motivaci#n del miedo es eficaz
para reducir la incidencia del consumo de cigarrillos Se eligen CF adultos fumadores entre
los individuos que viven en la ciudad donde traba)a el psic#logo . DF de ellos se les pide
que fumen un cigarrillo, después de lo cual presencian una película cruel acerca de la forma
en que el hábito de fumar provoca cáncer Se muestran imágenes cruentas de pulmones y
otros #rganos enfermos, de fumadores fallecidos en un esfuerzo por inducir el miedo a fumar
en esos su)etos %l otro grupo recibe el mismo tratamiento, e"cepto que ven una película
neutral, no relacionada con el cigarrillo ,urante los dos meses posteriores a la e"hibici#n de
las cintas, el e"perimentador lleva un registro acerca de la cantidad de cigarrillos que fuman
diariamente los participantes Se calcula entonces, para cada grupo, la media de cigarrillos
fumados diariamente a partir de la e"hibici#n de la película, y estas medias son comparadas
para determinar si el filme inductor del miedo tuvo alg*n efecto sobre los fumadores salud
b !n fisi#logo quiere saber si una regi#n particular del cerebro 2el hipotálamo3 está
implicada en la regulaci#n del consumo de comida Se realiza un e"perimento en el cual se
eligen AF ratas de un criadero universitario, las cuales se separan en dos grupos . uno de
estos grupos se le causan lesiones en el hipotálamo, mientras que el otro grupo es lesionado
en un área neutral ,espués de recuperarse de las operaciones, todos los animales tienen
acceso libre al alimento durante dos semanas y se lleva un registro del consumo diario de
cada animal .l final del periodo de dos semanas se determina la media de consumo diario
de alimento para cada grupo +or *ltimo, estas medias son comparadas para ver si las
lesiones en el hipotálamo han afectado la cantidad de alimento consumido, biol#gica
c !n psic#logo clínico está interesado en evaluar tres métodos para tratar la depresi#n- la
medicaci#n, la reestructuraci#n cognitiva y el e)ercicio Se incluye una cuarta condici#n de
tratamiento, un grupo que s#lo estará en espera de tratamiento, para tener un grupo de
control de línea base Se recluta a MF personas deprimidas entre los estudiantes de
licenciatura de una universidad estatal grande, y BE de ellos son asignados a cada método de
tratamiento Los tratamientos se administran durante seis meses, después de lo cual cada
estudiante recibe un cuestionario dise&ado para medir el grado de depresi#n %l cuestionario
La estadistica y el método científico - 11 -
tiene una escala de F a BFF, donde los punta)es mayores indican un mayor grado de
depresi#n Luego se calculan las medias de los valores de depresi#n para los cuatro
tratamientos y se comparan entre sí para determinar la eficacia relativa de cada tratamiento
clínica, salud
d !n psic#logo social está interesado en determinar si los individuos que terminan la
ense&anza media superior y no reciben más educaci#n ganan más que los desertores de dicho
nivel de estudios %ntonces se lleva a cabo una encuesta nacional, en una ciudad grande del
oeste medio, se obtiene una muestra de BFF individuos de cada categoría y se les pregunta
cuál es el salario anual de cada uno de ellos Los resultados se organizan en una tabla y se
calcula la media de los valores de los salarios para cada grupo social
e !n psic#logo cognitivo se interesa en saber c#mo resulta afectada la retenci#n con el
espaciamiento de las sesiones de práctica !na muestra de AF alumnos de séptimo grado es
seleccionada, en una escuela de educaci#n media inferior de la localidad y se divide en tres
grupos de BF estudiantes cada uno . todos los estudiantes se les pide que memoricen una
lista de BE palabras y se les imparten tres sesiones de práctica, de E minutos cada una, para
que lo logren Las sesiones de práctica de los su)etos del grupo B tienen un espaciamiento de
BF minutos/ las del grupo D se espacian DF minutos/ y las del grupo A tienen AF minutos de
espaciamiento . todos los grupos se les somete a una prueba de retenci#n una hora después
de la *ltima sesi#n de práctica Los resultados son registrados como el n*mero de palabras
recordadas correctamente en el periodo de prueba Se calculan y comparan las medias de
los valores de cada grupo (ognitiva
f !na psic#loga deportiva utiliza la visualizaci#n para promover un más alto
rendimiento en los atletas universitarios %stá interesada en evaluar la eficacia relativa de
la visualizaci#n por sí sola, contra la visualizaci#n acompa&ada de una charla apropiada
Se realiza un e"perimento con un equipo de baloncesto estudiantil ,iez miembros del equipo
son seleccionados (inco de ellos son asignados a un grupo que s#lo recibe la visualizaci#n, y
otros cinco se asignan a un grupo de visualizaci#n más charla Las dos técnicas han sido
dise&adas para aumentar la precisi#n en los tiros libres (ada grupo practica su técnica
durante un mes La precisi#n de cada )ugador en los tiros libres es medida previamente y
luego un mes después de que empiezan a practicar esa técnica La diferencia en los puntos se
calcula para cada )ugador y las medias de las diferencias de punta)e de cada grupo son
comparados para determinar la efectividad relativa de las dos técnicas HNF, otra
g !n profesor de mecanografía piensa que el empleo de un orden diferente en las teclas
de una máquina facilitará una escritura más rápida Se elige a DF estudiantes de
secretariado en una escuela de comercio de gran tama&o para participar en un
e"perimento dise&ado para probar esta suposici#n ,iez de estas estudiantes aprenden a
escribir con el teclado convencional Las otras diez reciben su entrenamiento con el nuevo
teclado .l final del periodo de entrenamiento se mide la velocidad de escritura de cada
estudiante, en palabras por minuto Luego se calcula la media de velocidad de escritura
para ambos grupos y se comparan las medias para determinar si el nuevo teclado ha tenido
alg*n efecto %ducaci#n
O Hndique cuáles de las siguientes afirmaciones representan una variable y cuáles una
constante-
a %l n*mero de letras del alfabeto
b %l n*mero de horas que tiene un día
c La hora en que usted come
d %l n*mero de estudiantes que especializan en psicología cada a&o, en la universidad
donde estudia usted
e %l n*mero de centímetros en un metro
f La cantidad de horas que duerme usted cada noche
g Su peso
h %l volumen de un litro
La estadistica y el método científico - 1% -
G Hndique cuáles de las siguientes situaciones corresponden a la estadística descriptiva
y cuáles a la estadística inferencial-
a !n informe anual para accionistas que detalla los bienes de la corporaci#n
b !n profesor de historia que anuncia a su grupo el n*mero de estudiantes que
obtuvieron la má"ima calificaci#n en un e"amen reciente
c %l cálculo de la media de un con)unto de datos de una muestra para caracterizarla
d %l uso de los datos de una muestra en una encuesta para estimar la opini#n de la
poblaci#n
e 'ealizar un estudio de correlaci#n sobre una muestra para determinar si el nivel
educativo y el ingreso de la poblaci#n están relacionados
f !n artículo de un peri#dico informa sobre los salarios promedio de los empleados
federales a partir de los datos reunidos de todos los interesados
P +ara cada una de las siguientes situaciones, identifique los datos de la muestra y los
datos de la poblaci#n-
a !na psic#loga social interesada en el comportamiento de los bebedores investiga la
cantidad de bebidas que se sirven en los bares de una ciudad en particular, cierto viernes,
durante la ;hora feliz; %n la ciudad e"isten DBA bares (omo son demasiados para
revisarlos, ella elige DF y registra el n*mero de bebidas que se sirven en ellos Los datos son
los siguientes-
EF GD CO ME
CF OM MB OD
AE CA ME OM
MA MM GA GD
EO OD OB EG
b +ara que un restaurante especializado en la venta de hamburguesas de BNC de
libra de ba)o costo pueda obtener ganancias, es necesario que cada hamburguesa servida
tenga un peso cercano a FDE de libra Sabiendo esto, el gerente del restaurante está
interesado en la variabilidad de los pesos de las hamburguesas servidas cada día ,urante
cierto día, se han servido CEF hamburguesas (omo tardaría mucho en pesarlas todas, el
gerente decide pesar s#lo BE .sí se obtuvieron los siguientes pesos, en libras-
FDE FDO FDE
FDM FAE FDO
FDD FAD FAG
FDP FDD FDG
FDO FCF FAB
c Se sospecha que una máquina que corta piezas peque&as de acero 2utilizada para
fabricar tornillos3 a una determinada longitud no es confiable %l capataz del taller decide
entonces verificar la producci#n del artefacto %l día de la verificaci#n, la máquina debe
producir piezas de D centímetros La tolerancia aceptable es de
I
FFE centímetros (omo
tardaría mucho en medir las MFF piezas producidas en un día, elige un grupo representativo
de DE .sí obtiene las siguientes longitudes, en centímetros-
DFB BPP DFE BPC DFE
La estadistica y el método científico - 1' -
DFB DFD DFC BPA BPE
DFA BPO DFF BPG BPM
DFE BPM DFF DFB BPP
BPG BPE BPO DFC DFD
d . una psic#loga fisiol#gica que traba)a en la !niversidad de 0acoma le interesa
conocer los ritmos cardíacos diast#licos, en reposo, de todas las estudiantes de dicha
universidad +ara eso toma muestras aleatorias de AF mu)eres )#venes del cuerpo
estudiantil y registra los siguientes ritmos cardíacos diast#licos cuando las estudiantes
están recostadas en una cama Las mediciones se registran en latidosNminuto
MD GE PD GE GG OB
OA GD GC GP PA OE
GB OD PO OG PF GO
OG OC MB MM GA MG
MO GA OE OF GM OD
Si desea encontrar problemas de práctica adicionales totalmente resueltos sobre los
temas que acaba de estudiar, busque (hapter B en la página Keb disponible en inglés en-
http-NN KKKthomsonlearningcomm"
ST!DISTIC! DSCRI*TI,!
La estadística no es un tema sencillo/ requiere el aprendiza)e de conceptos difíciles e imI
plica también la realizaci#n de cálculos matemáticos Sin embargo, me gustaría darle a
usted un conse)o que, en mi opini#n, le será de gran utilidad para comprender este material
,icho conse)o se basa en los muchos a&os que he ense&ado esta materia/ espero que lo tome
muy en serio
La mayoría de los estudiantes de ciencias del comportamiento sienten mucha ansiedad al
emprender un curso de matemáticas o de estadística Sin minimizar la dificultad del tema, no es
necesario sentir tanta ansiedad +ara aprender el material contenido en este libro, usted no
tiene que ser un ;mago; del cálculo o de las ecuaciones diferenciales 4e realizado un gran
esfuerzo para presentar el material de modo que los alumnos que no tengan inclinaci#n alguna
por las matemáticas puedan comprenderlo Sin embargo, no puedo apartarme del todo de las
matemáticas +ara tener é"ito, usted deberá dominar el álgebra elemental y unas cuantas
operaciones matemáticas +ara ayudarle a repasar estos temas, he incluido el apéndice . en el
que encontrará las matemáticas que necesita como previo requisito !sted deberá estudiar ese
material y asegurarse de que puede resolver los problemas incluidos en él Si tiene dificultades
para resolver esos e)ercicios, será muy conveniente que repase el tema en un libro de te"to
básico de álgebra elemental
7tro factor que se debe tener presente es que en estadística se utilizan muchos símbolos
+or e)emplo, para referirnos a la media de una muestra de datos, utilizaremos el símbolo
X

2que se lee 34 barraLL3 (on frecuencia los estudiantes creen que el material es más difícil de
lo que es en realidad e intentan aprender lo que cada símbolo significa !sted puede ahorrarse
muchos dolores de cabeza si comprende los símbolos en su )usta dimensi#n 0rátelos como si
fueran el vocabulario de otro idioma 9emorícelos e intente traba)ar
Q
con ellos desde un punto
de vista conceptual +or e)emplo, cuando vea que el te"to dice
X
, el concepto ;la media de la
muestra; deberá acudir de inmediato a su mente
La estadistica y el método científico - 1( -
0ambién es importante darse cuenta de que el material de la estadística es acumulativo
8o se retrase en sus clases Si lo hace, no podrá comprender tampoco los conceptos nuevos, en
virtud de que no ha dominado los conceptos básicos La situaci#n puede convertirse en una
bola de nieve y, antes que se dé cuenta, usted podría estar retrasado en forma irremediable
'ecuerde que debe hacer todo lo posible por mantenerse al corriente del material presentado
en clase, a medida que el curso vaya avanzando
+or *ltimo, nuestra e"periencia indica que gran parte de la comprensi#n de la estadística
se obtiene con la resoluci#n de muchos problemas . menudo, un problema vale más que mil
palabras (on frecuencia, aunque el te"to del libro sea claro, no entenderá el material hasta
que usted haya resuelto los problemas asociados con el tema +or lo tanto, resuelva muchos
problemas y vuelva a leer las secciones para asegurarse de que lo ha comprendido
%n resumen, creo que si domina el álgebra elemental, traba)a de manera diligente,
aprende los símbolos, estudia el te"to, se mantiene al tanto del material que sea e"puesto en
clase y resuelve muchos problemas, tendrá é"ito .unque usted no lo crea, cuando comience a
percibir por sí mismo la elegancia y la diversi#n inherentes a la estadística, llegará incluso a
disfrutarla
NOT!CIÓN M!TMCTIC!
%n estadística traba)amos por lo general con datos agrupados, resultantes de la medici#n
de una o más variables (on mucha frecuencia, los datos se obtienen a partir de muestras y
en algunas ocasiones se obtienen a partir de poblaciones +ara fines matemáticos, es *til que
ciertos símbolos representen a las variables medidas en el estudio %n todo este te"to
utilizaremos la letra may*scula 1, y a veces la > para representar la2s3 variable2s3 medida2s3
.sí, si estuviéramos midiendo la edad de los su)etos, emplearíamos la 1 para representar la
variable ;edad; Si la variable puede adoptar muchos valores, es importante distinguir entre
ellos %sto se logra agregando un subíndice al símbolo 1 %ste proceso se ilustra en la tabla
DB
La estadistica y el método científico - 1/ -
ta+la %41 La edad de seis su)etos
8*mero
del su)eto
Símbolo
del dato
Jalor del dato,
edad 2a&os3
B 1
B
G
D 1
D
BF
A 1
A
O
C 1
C
M
E 1
E
BF
M 1
M
BD
%n este e)emplo representamos la variable ;edad; mediante el símbolo 4. .demás, 2
representa el n*mero total de datos que hay en la distribuci#n %n este e)emplo, 2 5 6.
(ada uno de los seis datos representa un valor específico de 1 +ara distinguir entre los seis
datos diferentes, se ha agregado un subíndice a 1, que corresponde al n*mero de su)eto que
tiene el valor dado .sí, el símbolo 1
B
corresponde al valor G del dato, 4( al valor BF del dato,
1
A
al valor O, 1
C
a 6, 4+ a BF y 1
M
a BD %n general, podemos referirnos a uno cualquiera de
los datos de la distribuci#n 4 como 4
i
, donde i puede asumir cualquier valor de B a 2, seg*n
el dato que deseemos designar %n resumen-
• 1 o > representan la variable medida
• N representa el n*mero total de su)etos o de datos
• 1
i
es el iIésimo dato, donde i puede variar de B a 2.
SUM!TORI!
!na de las operaciones que se realizan con más frecuencia en estadística consiste en suI
mar todos los datos que pertenecen a una distribuci#n o una parte de ellos (omo no resulta
práctico escribir ;suma de todos los datos; cada vez que se necesita indicar esta operaci#n,
particularmente en ecuaciones, se utiliza una abreviatura simb#lica La letra griega
may*scula sigma 2>I3 indica la operaci#n de sumatoria La frase algebraica que se emplea
para la sumatoria es-
%sta e"presi#n se lee como ;la suma de la variable 1 de i R B a 8S Las notaciones que
aparecen arriba y aba)o del signo de sumatoria indican los datos que deben incluirse en la
operaci#n %l término que aparece aba)o del signo de la sumatoria nos indica el primer dato
que interviene en esta operaci#n, y el término que se encuentra arriba de di cho signo indica
el *ltimo de esos datos .sí, esta frase se&ala que debemos sumar los datos de 1, comenzando
con el primero y concluyendo con el 8Iésimo dato .sí,
(uando la sumatoria se realiza con todos los datos 2de B a 83, es frecuente que la propia
frase con que se designa esta operaci#n se abrevie, omitiendo las notaciones colocadas arriba
y aba)o del signo de la suma, al igual que el subíndice i ,e esta manera,
La estadistica y el método científico - 15 -

%n el e)emplo anterior,
%sta e"presi#n indica que la suma de todos los datos 1 es EA
7bserve que no es necesario que la sumatoria se realice desde B hasta 8 +or e)emplo,
podríamos querer sumar s#lo el segundo, tercero, cuarto y quinto datos 'ecuerde que la
notaci#n aba)o del signo de sumatoria indica d#nde debe comenzar la suma, y el término
indicado arriba de dicho signo nos dice d#nde terminarla .sí, para indicar la operaci#n de
suma del segundo, tercero, cuarto y quinto datos, utilizaríamos el símbolo
'esolvamos algunos problemas de práctica para la sumatoria

%"isten otros dos tipos de sumatorias que veremos con frecuencia en este libro Son Σ1
D
y
2T13
D
.unque se parecen, son distintos y, en general, proporcionan respuestas diferentes %l
símbolo T4
(
2suma de los cuadrados de los datos 4& indica que primero debemos elevar al
cuadrado los datos 1 y luego sumarlos .sí,
La estadistica y el método científico - 19 -

SC!L!S D MDICIÓNB NOMIN!LS0 ORDIN!LS0 D INTR,!LOS 7 D R!DÓN
%n virtud de que la estadística analiza los datos y éstos son resultado de las mediciones,
necesitamos dedicar cierto tiempo al estudio de las escalas de medici#n %ste tema es de suma
importancia pues el tipo de escala de medici#n utilizado para recolectar los datos ayuda a
determinar el tipo de prueba de inferencia estadística que conviene emplear en el análisis de
los datos ,esde un punto de vista te#rico, una escala de medici#n puede tener uno o varios
de los siguientes atributos matemáticos- magnitud, un intervalo igual entre unidades
adyacentes y un cero absoluto %"isten cuatro clases de escalas que se utilizan de manera
com*n en las ciencias del comportamiento- nominal, ordinal, de intervalo y de ra)"n. ,ifieren
en el n*mero de atributos matemáticos que cada una posee
scalas nominales
!na escala nominal representa el nivel mínimo de medici#n y se utiliza con frecuencia
para variables de naturaleza cualitativa y no cuantitativa .lgunos e)emplos de variables
cualitativas son las marcas de zapatos deportivos, los distintos tipos de fruta o de m*si ca, los
días de la semana, la nacionalidad, las creencias religiosas y el color de los o)os .l utilizar una
escala nominal, la variable se divide en sus diversas categorías %stas categorías comprenden
las ;unidades; de la escala y los ob)etos se ;miden; al determinar la categoría a la cual
pertenecen .sí, la medici#n con una escala nominal equivale, en realidad, a clasificar los
ob)etos y a darles el nombre 2de ahí lo de escala nominal3 de la categoría a la cual
pertenecen
+or e)emplo, si a usted le gusta correr, es probable que esté interesado en las diversas
marcas de zapatos deportivos que se ofrecen en el mercado, como ?roo:s, 8i:e, .didas,
Saucony y 8eK ?alance, para mencionar s#lo algunas Los zapatos deportivos son
importantes porque, al correr, cada zapato entra en contacto con el suelo unas GFF veces por
milla %n una carrera de E millas entrará en contacto CFFF veces Si usted pesa BDE libras 2EOE
:g3, produciría un impacto total de AFF toneladas sobre cada pie durante una carrera de E
millas U%so sí que es pesadoV 8o es de sorprender que los corredores sean particularmente
cuidadosos en la elecci#n de su calzado
La variable ;marca de zapatos deportivos; es de tipo cualitativo Se mide en una escala
nominal Las diversas marcas representan s#lo algunas de las posibles categorías 2unidades3
de esta escala Si tuviéramos un grupo de zapatos deportivos y quisiéramos medirlos con
esta escala, consideraríamos cada uno y determinaríamos su marca %s importante observar
que las unidades de una escala nominal son categorías, por lo cual no e"iste una relaci#n de
magnitud entre ellas .sí, no e"iste una relaci#n cuantitativa entre las categorías de 8i:e y
?roo:s 8i:e no es ;más marca; de zapatos deportivos que ?roo:s Simplemente, son marcas
distintas %sto puede quedar más claro si llamamos a las categorías zapatos deportivos B y
zapatos deportivos D, en vez de 8i:e y ?roo:s %n este caso, los n*meros B y D son s#lo
nombres y no poseen una relaci#n de magnitud entre ellos
La estadistica y el método científico - 1; -
!na propiedad fundamental de las escalas nominales es la equivalencia. %sto quiere
decir que todos los miembros de una clase dada son iguales desde el punto de vista de la
variable de clasificaci#n .sí, a todos los pares de zapatos 8i:e se les considera iguales desde
el punto de vista de ;marca de zapatos deportivos;, a pesar de que pueda haber varios
modelos distintos de zapatos 8i:e
!na operaci#n que se realiza con frecuencia )unto con la medici#n nominal consiste en
contar las menciones de cada tipo dentro de cada clase +or e)emplo, si tuviéramos varios
zapatos deportivos y determináramos la marca de cada uno, estaríamos realizando una
medici#n nominal .demás, tal vez nos interesara contar el n*mero de zapatos que
pertenecen a cada categoría .sí, podríamos tener DF zapatos 8i:e, BP Saucony y M 8eK
?alance en total %stas frecuencias nos permiten comparar el n*mero de zapatos dentro de
cada categoría %sta comparaci#n cuantitativa de las cifras dentro de cada categoría no debe
confundirse con la afirmaci#n hecha anteriormente de que no e"iste una relaci#n de magnitud
entre las unidades de una escala nominal +odemos comparar de manera cuantitativa las
cantidades de zapatos 8i:e con las de zapatos Saucony, pero 8i:e no es ;más marca; de
zapatos de lo que es Saucony .sí, una escala nominal no tiene los atributos matemáticos de
magnitud, intervalos iguales o cero absoluto S#lo permite la clasificaci#n de los ob)etos en
categorías mutuamente e"cluyentes
scalas o$dinales
La escala ordinal representa el siguiente nivel de medici#n 0iene un nivel relativamente
ba)o de la propiedad de magnitud (on esta escala ordenamos los ob)etos medidos, tomando
como base si poseen más, menos o la misma cantidad de la variable medida .sí, una escala
ordinal permite determinar si . 7 8, A 5 8 o A 9 8.
!n e)emplo de una escala ordinal es el ordenamiento de los cinco me)ores participantes
en un concurso de oratoria, seg*n su facilidad de palabra %ntre los oradores, la persona con
el rango B fue considerada me)or que la persona que poseía el rango D, quien a su vez fue me)or
que la de rango A La persona de rango A fue estimada como me)or orador que la de rango C,
la cual fue considerada me)or que la persona del rango E %s importante observar que aunque
esta escala permite hacer comparaciones del tipo ;me)or que, igual a o menor que;, no dice
nada sobre la magnitud de la diferencia entre las unidades adyacentes que pertenecen a
dicha escala %n este e)emplo, la diferencia en cuanto a la facilidad de palabra entre las
personas de rango B y D podría ser grande y la que e"iste entre los individuos de rango D y A
podría ser peque&a .sí, una escala ordinal no tiene la propiedad de mantener intervalos
iguales entre las unidades adyacentes .demás, como lo *nico que tenemos son #rdenes
relativos, la escala no dice nada acerca del nivel absoluto de la variable .sí, los oradores de
los cinco primeros lugares podrían tener un alto nivel de facilidad de palabra o un nivel ba)o
%sta informaci#n no se puede obtener de una escala ordinal
7tros e)emplos de escala ordinal son la clasificaci#n de los corredores que participan en
el 9arat#n de ?oston seg*n su orden de llegada, la clasificaci#n de los equipos de f*tbol
americano universitario con base en las calificaciones de la .ssociated +ress, el orden de los
profesores seg*n su capacidad de ense&anza y el orden de los estudiantes seg*n su nivel de
motivaci#n
scalas de inte$3alos
La escala de intervalo representa un nivel superior de medici#n con respecto a la
escala ordinal +osee las propiedades de magnitud e igualdad de intervalos entre las unidades
adyacentes, pero no tiene un cero absoluto .sí, la escala de intervalo posee las propiedades
de la escala ordinal y tiene ;intervalos iguales entre sus unidades adyacentes;/ estos intervalos
indican que e"isten cantidades iguales de la variable medida entre las unidades adyacentes en
la escala
La escala (elsius para medir la temperatura es un buen e)emplo de una escala de
La estadistica y el método científico - 1= -
intervalo 0iene la propiedad de poseer intervalos iguales entre las unidades adyacentes,
pero no tiene un punto correspondiente al cero absoluto La propiedad de intervalos iguales
se percibe por el hecho de que un cambio dado de calor producirá el mismo efecto en la lectura
de temperatura en la escala, sin importar en qué parte de ésta ocurra dicho cambio .sí, la
cantidad adicional de calor que provoca un cambio en la lectura de la temperatura de DW a AW
(elsius producirá también un cambio en la lectura de EBW a EDW o de BFEW a BFMW (elsius %sto
ilustra el hecho de que cantidades iguales de calor están representadas entre las unidades
adyacentes, en toda la escala
(omo en una escala de intervalo e"isten cantidades iguales de la variable entre las
unidades adyacentes de la misma, las diferencias equivalentes entre los n*meros de la escala
representan diferencias de la misma magnitud en la variable .sí, podemos decir que la
diferencia de calor es la misma entre OGW y OEW (elsius que entre DCW y DBW de la misma
escala %sto también implica, desde un punto de vista l#gico, que diferencias grandes entre los
n*meros de la escala representan también diferencias grandes entre la magnitud de la
variable medida, y que diferencias peque&as entre los n*meros de la escala representan
peque&as diferencias en la magnitud de la variable medida .sí, la diferencia de calor entre
GFW y MEW es mayor que la diferencia entre BGW y BEW (elsius, y la diferencia de calor entre PAW
y PBW es menor que la diferencia entre CGW y CFW (elsius %n vista del análisis anterior, podemos
ver que además de determinar si A 5 8, A 7 8 o A 9 8, una escala de intervalo nos permite
determinar si A - 8 5 C - #, A - 8 7 C - # o A-89C-#.
scalas de $aE&n
%l siguiente y má"imo nivel de medici#n es la escal a de ra)"n. 0iene todas las
propiedades de una escala de intervalo y, además, posee un cero absoluto Sin éste no se
pueden calcular las razones con respecto a las lecturas de la escala (omo este tipo de escala
tiene un cero absoluto, con ella se pueden utilizar razones 2de aquí el nombre escala de
ra)"n&.
!n e)emplo adecuado para ilustrar la diferencia entre la escala de intervalo y la de
raz#n consiste en comparar la escala (elsius de temperatura con la escala Xelvin %l cero de la
escala Xelvin es el cero absoluto 2la ausencia completa de calor3 %l cero de la escala (elsius
es la temperatura a la cual se congela el agua %s un punto cero arbitrario que se presenta en
realidad a los DOAW Xelvin La escala (elsius es de intervalo y la escala Xelvin es de raz#n La
diferencia de calor entre GW y PW es igual a la diferencia entre PPW y BFFW sin importar que la
escala sea (elsius o Xelvin Sin embargo, no podemos calcular razones con la escala
(elsius !na lectura de DFW (elsius no es el doble de caliente que BFW (elsius %sto se puede
comprobar al convertir las lecturas (elsius al calor real que representan %n términos de calor
real, DFW (elsius es en realidad DPAWX 2DOAW Y DFW3, y BFW (elsius es en realidad DGAWX 2DOAW
Y BFW3 %s obvio que DPAW no es el doble de DGAW +uesto que la escala Xelvin tiene un cero
absoluto, una lectura de DFW en esta escala es el doble de caliente que una de BFW ,e esta
manera se pueden utilizar razones con la escala Xelvin
7tros e)emplos de variables medidas con escalas de razones son- el tiempo de reacci#n, la
longitud, el peso, la edad y la frecuencia de cualquier evento,
como el n*mero de zapatos 8i:e incluidos en el con)unto de
zapatos deportivos que comentamos con anterioridad (on
una escala de este tipo, usted puede establecer razones y
realizar todas las demás operaciones matemáticas
asociadas por lo general a los n*meros 2es decir, suma,
resta, multiplicaci#n y divisi#n3 Las cuatro escalas de
medici#n y sus características se resumen en la figura DB
8ominal
Las unidades de la escala son categorías Los ob)etos se
miden al determinar la categoría a la cual pertenecen 8o e"iste
una relaci#n de magnitud entre las categorías
La estadistica y el método científico - %@ -
O$dinal
+osee la propiedad de magnitud Se puede ordenar a los ob)etos seg*n que posean más,
menos o igual cantidad de la variable medida .sí, se puede determinar si A 7 8, A 5 8, A 9 8.
8o se puede determinar cuánto mayor o menor es A que 8 en relaci#n con el atributo medido
Inte$3alo y $aE&n
:ntervalo: posee las propiedades de magnitud e intervalos iguales entre unidades
adyacentes Se pueden hacer las mismas determinaciones que en la escala ordinal y,
además, determinar si A - 8 5 C - #, A- 87 C ; # o A-89C-#.
<a)"n: posee las propiedades de magnitud, intervalos iguales entre unidades adyacentes y
un punto cero absoluto Se pueden realizar todas las operaciones matemáticas asociadas por
lo general con los n*meros, incluidas las razones
SC!L!S D MDICIÓN N L!S CINCI!S DL COM*ORT!MINTO
%n las ciencias del comportamiento, muchas de las escalas utilizadas se consideran con
frecuencia como si fuesen de intervalo sin establecer con claridad que la escala, en realidad,
posee intervalos iguales entre unidades adyacentes La medici#n del (H/ las variables
emocionales como la ansiedad y la depresi#n/ las variables de la personalidad 2como la
autosuficiencia, la introversi#n, la e"troversi#n y la dominancia3/ las variables de eficiencia o
logros terminales/ las variables de actitud, entre otras, corresponden a esta categoría (on
todas estas variables es claro que las escalas no son de raz#n +or e)emplo, en el caso del (H,
si una persona ha obtenido un cero en la escala de inteligencia para adultos de Zechsler
2Z.HS3, no podríamos decir que tiene inteligencia nula Se supone que se encontrarían algunas
preguntas que podría contestar el individuo en cuesti#n, de modo que tendría un (l superior a
cero .sí, la prueba Z.HS no tiene un punto cero absoluto y las razones no son adecuadas +or
lo tanto, no es correcto decir que una persona con un (H de BMF es lo doble de inteligente que
alguien con un (l de GF
+or otro lado, parece que podemos hacer algo más que s#lo especificar un
ordenamiento de los individuos !na persona que posee un (l de BFF tiene una inteligencia
más cercana a alguien con un (l de BBF que a otra persona con un (H de MF %sto parece ser
una escala de intervalo, pero es difícil establecer que la escala en realidad posea intervalos
iguales entre las unidades adyacentes 9uchos investigadores consideran tales variables como
si fuesen medidas en escalas de intervalo, en particular cuando el instrumento de medici#n
está bien normalizado, como en el caso del Z.HS %s mucho más discutible considerar como
escalas de intervalos las escalas deficientemente normalizadas que miden variables
psicol#gicas %ste tema surge en particular en la estadística inferencial, donde el nivel de las
escalas puede influir en la selecci#n de la prueba que se usará en el análisis de datos %"isten
dos criterios al respecto %l primero afirma que el uso de ciertas pruebas, como la t de
Student y el análisis de varianza, deben limitarse a los datos que pertenecen a escalas de
intervalo y de raz#n %l segundo criterio no concuerda con lo anterior y afirma que esas pruebas
también se pueden utilizar con datos nominales y ordinales Sin embargo, este tema es
demasiado comple)o para ser considerado aquí
,!RI!?LS CONTINU!S 7 DISCRT!S
ya se defini# la variable como una propiedad o característica de alguna cosa que puede
asumir más de un valor 0ambién distinguimos entre las variables independientes y
dependientes .demás de esto, las variables pueden ser continuas o discretas-
Una variable contin#a es aquella que teóricamente puede asumir
un número infinito de valores entre
,
las unidades adyacentes de
La estadistica y el método científico - %1 -
una escala.
Una 3a$ia+le disc$eta es aquella para la cual no existen valores
posibles localizados entre las cantidades adyacentes de una escala.
%l peso, la estatura y el tiempo son e)emplos de variables continuas +ara cada una de
estas variables e"iste, de manera potencial, una infinidad de valores entre las unidades
adyacentes Si estamos midiendo el tiempo y la unidad mínima que utilizamos es un segundo,
entonces entre B y D segundos e"iste una infinidad de valores posibles- BB segundos, BFB
segundos, BFFB segundos, y así sucesivamente +odemos aplicar el mismo argumento al peso y
a la estatura
%sto no ocurre con una variable discreta %l ;n*mero de hi)os en una familia; es un
e)emplo de variable discreta %n este caso, la menor unidad es un hi)o y no e"isten valores
posibles entre uno y dos hi)os, dos y tres hi)os, etc La característica de una variable discreta
es que cambia por cantidades fi)as sin que haya valores intermedios 7tros e)emplos son- ;el
n*mero de estudiantes en su grupo;, ;el n*mero de profesores en una universidad; y ;el
n*mero de citas que tuvo el *ltimo mes;
Límites $eales de #na 3a$ia+le contin#a
(omo una variable continua puede tener una infinidad de valores entre las unidades
adyacentes de una escala, todas las mediciones realizadas sobre esta variable son
aproximadas. !tilizaremos el peso para ilustrar esto Suponga que comenz# una dieta el día de
ayer, que es primavera, casi verano, y que el clima ideal para ponerse el tra)e de ba&o está ya
muy pr#"imo ,e cualquier modo, usted se pes# ayer en la ma&ana y su peso fue se&alado
por la agu)a de la figura DD Hmagine que la escala de la figura tiene una precisi#n s#lo a la
libra 2o :ilo3 más cercana %l peso registrado fue de BGF libras 2GA :3 %sta ma&ana, cuando
usted se pes# después de un día de hacer dieta, la agu)a lleg# hasta el lugar indicado con
línea interrumpida ¿$ué peso registr# esta vez? +or ser un rasgo muy humano, sabemos que
a usted le agradaría registrar BOP libras/ sin embargo, como futuro científico, usted busca la
verdad a cualquier precio +or eso registra de nuevo BGF libras ¿(uándo podría registrar BOP
libras? (uando la agu)a esté deba)o del punto medio entre BOP y BGF libras ,e manera
análoga, usted seguiría registrando BGF libras si la agu)a estuviera arriba de BGF, pero antes del
punto medio entre BGF y BGB libras +or consiguiente, cada vez que se registre el peso de BGF
libras, eso no quiere decir que sean e"actamente BGF libras, sino que el peso está entre BGF [
FE libras 8o conocemos el valor e"acto del peso, pero estamos seguros de que se encuentra
en el rango de BOPE a BGFE %ste rango especifica los límites reales del peso de BGF libras %l
valor de BOPE es el límite real inferior y BGFE es el límite real superior
La estadistica y el método científico - %% -

+or e)emplo, si la variable en cuesti#n es el peso, la menor unidad es B libra, y registramos
BGF libras, los límites reales están arriba y aba)o de BGF libras por
DB
libra .sí, los límites
reales son BOPE y BGFE libras\ Si la unidad mínima fuese FB libras y no B libra y
registráramos BGFF libras, entonces los límites reales serían BGF [ ]2FB3, es decir, BOPPE y
BGFFE
Cif$as siFnificati3as
%n estadística analizamos datos/ este análisis implica numerosos cálculos matemáticos
(on mucha frecuencia obtenemos un residuo decimal, por e)emplo, después de realizar una
divisi#n (uando esto ocurre, necesitamos decidir la cantidad de cifras decimales que
utilizaremos para el residuo
%n las ciencias físicas, por lo general, se utiliza el mismo n*mero de cifras significativas
que tienen los datos en bruto +or e)emplo, si medimos el peso de cinco su)etos hasta tres cifras
significativas 2BOA, BEM, BMD, BME y BOE libras3 y queremos calcular el promedio de estos pesos,
nuestra respuesta deberá contener s#lo tres cifras significativas .sí,
La respuesta de BMMD se redondea a tres cifras significativas, dando un resultado final de
BMM libras +or varias razones, este procedimiento no se ha seguido en las ciencias del
comportamiento, sino que se ha establecido una tradici#n en la cual la mayor parte de los
valores finales se e"presan con dos o tres cifras decimales, sin importar el n*mero de cifras
significativas de los datos en bruto (omo éste es un te"to para usarse en las ciencias del
comportamiento, hemos optado por seguir esta tradici#n .sí, en este libro daremos la mayor
parte de nuestras respuestas finales hasta con dos cifras decimales %n al gunas ocasiones
habrá e"cepciones +or e)emplo, los coeficientes de correlaci#n y de regresi#n tienen tres cifras
decimales, y los valores de probabilidad se dan a menudo hasta con cuatro cifras decimales, lo
cual es consistente con la tradici#n $s una práctica común reali)ar todos los cálculos
intermedios con dos o más cifras decimales de las que tendrá la respuesta final. .sí, cuando se
le pida que esta *ltima tenga dos cifras decimales, usted deberá realizar los cálculos
intermedios con cuatro cifras decimales por lo menos y redondeará la respuesta final a dos
cifras
Redondeo
(onsiderando que e"presaremos nuestras respuestas finales con dos, y en algunas
ocasiones hasta con tres o cuatro cifras decimales, necesitamos decidir c#mo se determinará
el valor del *ltimo dígito +or fortuna, las siguientes reglas de redondeo son bastante sencillas
y directas-
B ,ivida en dos partes el n*mero que desea redondear- la respuesta potencial y el
residuo La respuesta potencial es el n*mero original y debe llegar solamente hasta el n*mero
deseado de cifras decimales %l residuo es el resto de ese n*mero original
D (oloque un punto decimal antes del primer dígito del residuo, creando de esta
manera un residuo decimal
A Si el residuo decimal es mayor que ], sume B al *ltimo dígito de la respuesta
La estadistica y el método científico - %' -
C Si el residuo decimal es menor que ], de)e el *ltimo dígito de la respuesta sin cambio
alguno
E Si el residuo decimal es igual a ], sume B al *ltimo dígito de la respuesta si dicho
dígito es impar, pero si es par, dé)elo sin cambio alguno
+robemos con algunos e)emplos 'edondearemos los n*meros de la columna de la
izquierda, en la tabla DD, hasta dos cifras decimales
+ara realizar este redondeo, el n*mero se separa en dos partes- la respuesta potencial y
el residuo %n vista de que estamos redondeando a dos cifras decimales, la respuesta potencial
termina en la segunda cifra decimal %l resto del n*mero constituye el resi duo +ara el primer
n*mero, ACFBAEF ACFB constituye la respuesta potencial y AEF es el residuo (omo AEF es
menor que ], el *ltimo dígito de la respuesta potencial permanece sin cambio alguno y la
respuesta final es ACFB +ara el segundo n*mero, ACFBOMB, el residuo decimal 2OMB3 es
mayor que ] +or lo tanto, tenemos que sumar B al *ltimo dígito, con lo cual la respuesta
correcta es ACFD +ara los dos n*meros siguientes, el residuo decimal es igual a ] %l n^mero
CEFCEFF se convierte en CEFC en vitud de que el ^ltimo d_gito de la respuesta potencial es par
%l n^mero CEFEEFF se convierte en CEFM debido a que el ^ltimo d_gito es impar
*R>UNT!S 7 *RO?LM!S
B ,efina los conceptos que aparecen en la secci#n ;0érminos importantes; y proponga
un e)emplo de cada uno
D Hdentifique cuáles de las siguientes variables son continuas y cuáles son discretas- a
La hora del día
a La hora del d_a
b 8*mero de mu)eres en su grupo
c 8*mero de veces que una rata oprime la palanca en una ca)a de S:inner
d %dad de los su)etos en un e"perimento
e 8*mero de palabras recordadas
f +eso del alimento ingerido
g +orcenta)e de estudiantes de su grupo que son mu)eres
h Jelocidad de los corredores en una carrera
A Hdentifique la escala de cada una de las siguientes variables-
a 8*mero de bicicletas que utilizan los estudiantes de primer a&o
b 0ipos de bicicletas utilizadas por los estudiantes de primer a&o
c %l (H de sus profesores 2suponga que utiliza una escala con intervalos iguales3
La estadistica y el método científico - %( -
d %l dominio de las matemáticas, clasificado en las categorías de malo, regular y bueno
e Sensaci#n de ansiedad al hablar en p*blico, calificada seg*n una escala de F a BFF
2suponga que la diferencia en el grado de ansiedad entre las unidades adyacentes de toda
la escala no siempre es la misma3
f %l peso de un grupo de personas sometidas a una dieta
g %l tiempo de reacci#n al escuchar un sonido
h %l dominio de las matemáticas, medido en una escala de F a BFF La escala está bien
normalizada y se puede considerar que tiene intervalos iguales entre las unidades adyacentes
i Las calificaciones de los profesores asignadas por los estudiantes, en una escala de EF
puntos 8o e"iste una base suficiente para suponer que los intervalos entre las unidades
adyacentes son iguales
C !n estudiante mide la asertividad con una escala
de intervalos ¿%s correcto decir que un punta)e de AF en la escala representa la mitad
de asertividad que un punta)e de MF? %"plique
E +ara cada uno de los siguientes con)untos de datos, determine
M 'edondee los siguientes n*meros a dos cifras decimales-
O ,etermine los limites reales de los siguiente valores-
a BF libras 2suponga que la unidad de medida minima es de B libra3
b DE segundos 2suponga que la unidad de medida mínima es de FB segundo3
c BFF gramos 2suponga que la unidad de medida mínima es de BF gramos3
d DFB centímetros 2suponga que la unidad de medida mínima es de FFB centímetro3
e EDAD segundos 2suponga que la unidad de medida mínima es de B milisegundo3
G ,etermine los valores de las siguientes e"presiones-

P %n un e"perimento para medir los tiempos de reacci#n de ocho su)etos se obtuvieron
los siguientes datos, en milisegundos-
La estadistica y el método científico - %/ -
P %n un e"perimento para medir los tiempos de reacci#n de ocho su)etos se obtuvieron
los siguientes datos, en milisegundos-

a Si 1 representa la variable del tiempo de reacci#n, asigne a cada uno de los datos su
símbolo 1, apropiado
b (alcule >I 1 para estos datos
BF 'epresente cada una de las siguientes e"presiones por medio de la notaci#n de
sumatoria Suponga que el n*mero total de datos es BF

BB 'edondee los siguientes n*meros a una cifra decimal-
a BCDA b DADEF c BFFOEF d CBMED e AEACG
BD +ara cada uno de los con)untos de datos correspondientes a los problemas Eb y Ec,
demuestre que T1
D
` 2T13
D
BA . partir de los datos 1
B
R A, 1
D
R C, 1
A
R O y 1
C
R BD, determine usted los
valores de las siguientes e"presiones 2esta pregunta corresponde a la nota DB3

BC 'edondee cada uno de los siguientes n*meros a una cifra decimal y a dos cifras
decimales
a CBCGD
b CBEFB
c CBMEF
d CBPEF
NOT!S
DB 9uchos libros de te"to incluyen un análisis de otras reglas para la sumatoria,
como la sumatoria de una variable más una constante, la sumatoria de una variable por una
constante, etc (omo estos conceptos no son necesarios para comprender el material de este
libro, no los incluimos en el cuerpo principal del te"to, pero hemos presentado aquí ese
material %l conocimiento de las reglas de la sumatoria puede ser muy *til como
antecedente para los cursos de estadística que se imparten en el nivel de posgrado
La estadistica y el método científico - %5 -
ReFla 1 La suma de los valores de una variable más una constante es igual a la suma
de los valores de la variable más 8 veces la constante %n forma de ecuaci#n, se representa
así-
La validez de esta ecuaci#n se puede apreciar mediante la sencilla demostraci#n
algebraica que presentaremos a continuaci#n-
+ara ilustrar el uso de esta ecuaci#n, suponga que queremos calcular la suma de los
siguientes datos con la constante A sumada a cada uno de ellos-
ReFla % La suma de los valores de una variable menos una constante es igual a la
suma de los valores de la variable menos 8 veces la constante %n forma de ecuaci#n

La demostraci#n algebraica de esta ecuaci#n es la siguiente-
+ara ilustrar el uso de esta ecuaci#n, suponga que queremos determinar la suma de los
siguientes datos con la constante D restada de cada uno-

ReFla ' La suma de una constante por el valor de una variable es igual a la constante
multiplicada por la suma de los valores de la variable %n forma de ecuaci#n,

La estadistica y el método científico - %9 -
. continuaci#n demostraremos la validez de esta ecuaci#n-

+ara ilustrar el uso de esta ecuaci#n, suponga que queremos determinar la suma
de C por cada uno de los siguientes datos-
ReFla (4 La suma de una constante dividida entre los valores de una variable es igual a
la constante, dividida entre la suma de los valores de la variable %n forma de ecuaci#n,
. continuaci#n demostraremos la validez de esta ecuaci#n-
Jeamos una vez más un e)emplo para ilustrar el uso de esta ecuaci#n Suponga que
queremos determinar la suma de cada uno de los siguientes datos divididos entre C-
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - %; -
INTRODUCCIÓNB DISTRI?UCIONS D )RCUNCI!S NO !>RU*!D!S
Supongamos que le acaban de devolver su primer e"amen de estadística y que en él
obtuvo una calificaci#n de GM %s natural que sienta interés por saber qué tan bueno fue ese
resultado con respecto a los demás estudiantes !sted tiene muchas preguntas que hacer-
¿cuántos estudiantes obtuvieron GM?, ¿hubo muchas calificaciones más altas que la suya?,
¿cuántas calificaciones fueron más ba)as que la de usted? Las calificaciones en bruto del
e"amen se presentan desorganizadas en la tabla AB .unque en ella aparecen todas las
calificaciones, resulta difícil entenderlas por la forma en la que han sido dispuestas en dicha
tabla !n arreglo más eficiente, y que tiene mayor significado, podría consistir en listar las
calificaciones seg*n su frecuencia de aparici#n %sta lista se conoce como una distribuci"n de
frecuencias.

=na dist$i+#ci&n de f$ec#encias presenta los valores de los datos ' la frecuencia con que se
presentan. .l ser mostrados en una tabla, los valores de los datos se presentan en orden y, por
lo general, el valor del dato más ba)o aparece en la parte inferior de la tabla
Las calificaciones de la tabla AB han sido dispuestas seg*n una distribuci#n de frecuencias
que se presenta en la tabla AD .hora los datos tienen mayor significado %n primer lugar,
resulta fácil observar que hay D calificaciones de GM .demás, cuando sumamos las frecuencias
apropiadas 2f3 podemos determinar cuál es el n*mero de calificaciones mayores que y menores
que GM Se puede ver que hay BE calificaciones más altas y EA calificaciones más ba)as que la de
usted 0ambién es fácil determinar el rango de los datos en una distribuci#n de frecuencias %n
el caso del e"amen de estadística, las calificaciones variaron en un rango de entre CM y PP .
partir de este e)emplo podemos ver que el ob)etivo principal de una distribuci#n de
frecuencias consiste en presentar los datos de una manera que facilite su comprensi#n e
interpretaci#n
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - %= -

D!TOS !>RU*!DOS
(uando se dispone de muchos datos con un rango muy amplio, como en el caso del
e"amen de estadística que estamos considerando, la enumeraci#n de los datos individuales
produce muchos valores cuya frecuencia es cero 2nula3 y el resultado es una presentaci#n en la
que resulta difícil visualizar la forma de la distribuci#n y su tendencia central %n estas
condiciones, los datos individuales se agrupan por lo general en intervalos de clase y se
presentan como una distribuci"n de frecuencias de datos agrupados. La tabla AA muestra las
calificaciones del e"amen de estadística agrupadas en dos distribuciones de frecuencias, una en
la que cada intervalo tiene D unidades de amplitud y la otra con intervalos de BP unidades de
amplitud
.l agrupar datos, uno de los puntos importantes consiste en determinar cuál será la amplitud
de cada intervalo (ada vez que los datos son agrupados se pierde un poco de informaci#n
9ientras más amplio sea el intervalo, más informaci#n se perderá +or e)emplo, considere la
distribuci#n que aparece en la tabla AA con intervalos de BP unidades de amplitud .unque este
amplitud de intervalo produce una presentaci#n suave 2no e"isten frecuencias nulas3, se ha
perdido mucha informaci#n +or e)emplo, ¿c#mo están distribuidas las AG calificaciones en el
intervalo de OM a PC?, ¿están en PC? ¿o en OM? ¿o están distribuidas de manera uniforme en todo
el intervalo? La cuesti#n es que no sabemos c#mo están distribuidas en el intervalo 4emos
perdido esa informaci#n al agrupar los datos 7bserve que mientras más amplio sea el intervalo,
mayor será la ambigaedad
,ebe parecer obvio que mientras menor sea el intervalo, tanto más fielmente se
preservarán los datos originales %l caso e"tremo se presenta cuando la amplitud del intervalo
se reduce a una sola unidad, con lo cual regresamos a la situaci#n de los datos individuales
Sin embargo, cuando el intervalo se vuelve demasiado estrecho, nos encontramos con los
mismos problemas que en el caso de los datos individuales/ a saber, valores cuya frecuencia es
nula y una presentaci#n poco clara en lo referente a la forma de la distribuci#n y su tendencia
central La distribuci#n de frecuencias con intervalos de D unidades de amplitud que aparece en
la tabla AA es un e)emplo en el cual los intervalos son demasiado peque&os
+or la e"plicaci#n anterior podemos ver que, al agrupar los datos, hay que resolver el
dilema entre perder informaci#n y tener una presentaci#n visual significativa +ara lograr lo
me)or de ambas opciones debemos elegir una amplitud de intervalo que no sea ni muy amplia ni
muy estrecha %n la práctica, determinamos de ordinario la amplitud del intervalo dividiendo la
distribuci#n en un total de BF a DF intervalos . lo largo de los a&os se ha demostrado que este
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - '@ -
rango de intervalos funciona bien con la mayor parte de las distribuciones ,entro de este rango,
el n*mero específico de intervalos que se utilice dependerá del n*mero y el rango de los datos
en bruto 7bserve que mientras más intervalos utilice, tanto más estrecho será cada uno de
éstos
%laboraci#n de una distribuci#n de frecuencias de datos agrupados
Los pasos para hacer una distribuci#n de frecuencias para datos agrupados son los
siguientes-
B %ncontrar el rango de los datos
D ,eterminar la amplitud de cada intervalo de clase 2i3
A 4acer una lista con los límites de cada intervalo de clase, colocando en la parte inferior
de la misma al intervalo que contenga el dato más peque&o 2mínimo3
4acer una lista con los límites de cada intervalo de clase, colocando en la parte inferior de la
misma al intervalo que contenga el dato más peque&o 2mínimo3
C (ontar los datos en bruto contenidos en los intervalos de clase correspondientes E
Sumar las cuentas de cada intervalo para obtener la frecuencia del intervalo
.pliquemos estos pasos a los datos de la tabla AB
%. #eterminaci"n del rango.
'ango R ,ato má"imo menos dato mínimo R PP I CM R EA
D #eterminaci"n de la amplitud del intervalo >i&. Supongamos que nos interesa agrupar los
datos en BF intervalos de clase apro"imadamente
(uando i tenga un residuo decimal, deberemos aplicar la regla y redondear i al mismo
n*mero de cifras decimales que aparece en los datos en bruto .sí pues, i se redondea a E
?. La lista de los intervalos. (omenzaremos con el intervalo inferior %l primer paso
consiste en determinar el límite inferior de dicho intervalo 4ay dos requisitos que deben
cumplirse-
a %l límite inferior de este intervalo debe ser tal que el intervalo contenga al dato
mínimo
b Se acostumbra hacer que el límite inferior de este intervalo sea e"actamente
divisible entre i
%n virtud de estos dos requisitos, al límite inferior se le asigna el valor del dato más
peque&o 2o mínimo3 de la distribuci#n si éste es e"actamente divisible entre i Si no lo es,
entonces el límite inferior es asignado al siguiente valor más peque&o que sea e"actamente
divisible entre i %n nuestro e)emplo, el límite inferior del intervalo más ba)o comienza en CE,
ya que la calificaci#n mínima 2CM no es e"actamente divisible entre E3
!na vez que hemos determinado el límite inferior del primer intervalo, ya podemos hacer
la lista de todos los intervalos (omo cada intervalo tiene E unidades de amplitud, el
intervalo inferior abarca de CE a CP .unque podría parecer que este intervalo tiene s#lo C
unidades de amplitud, en realidad tiene E Si tiene alguna duda, bastará que cuente las
unidades 2CE, CM, CO, CG, CP3 .l listar los demás intervalos, debemos cerciorarnos de que los
intervalos son continuos y mutuamente e"cluyentes (on esta e"presi#n 2mutuamente
e"cluyentes3 queremos decir que los intervalos deben ser tales, que ning*n dato podrá
quedar incluido de manera válida en más de un intervalo .plicando estas reglas obtenemos
los intervalos que aparecen en la tabla AC 7bserve que, seg*n la e"posici#n sobre análisis de
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - '1 -
los límites reales presentada en el capítulo D, los intervalos de clase que aparecen en la
primera columna representan límites aparentes Los limite, reales se encuentran en la
segunda columna La forma usual de hacerlo consiste en listar s#lo los límites aparentes de
cada intervalo y omitir de la lista los límites reales Seguiremos esta práctica en los e)emplos
subsecuentes
@. Conteo de los datos. . continuaci#n, introducimos los datos en bruto en los intervalos
de clase adecuados %ste conteo es un procedimiento por el cual se repasa toda la distribuci#n
de manera sistemática, de modo que por cada dato en bruto se escribe una raya vertical )unto
al intervalo que contiene a dicho dato .s_ pues, para PE 2la primera calificaci#n de la tabla
AB3 colocamos una raya en el intervalo PEIPP 4emos seguido este procedimiento con todas las
calificaciones , de este modo obtuvimos los resultados que aparecen en la tabla AC
+. Auma de frecuencias. +or *ltimo, las rayas del recuento se convierten en
frecuencias, al sumar todas las que corresponden a cada intervalo %stas frecuencias se
muestran también en la tabla AC
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - '% -

0ratemos de resolver un problema en plan de práctica . partir de los siguientes PF datos,
haga una distribuci#n de frecuencias de datos agrupados que tenga BD intervalos
apro"imadamente

SOLUCIÓN
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - '' -
14 $ncuentre el rango. 'ango R dato má"imo I dato mínimo R BAG I DD R BBM (.
#etermine la amplitud del intervalo >i&:
?. Baga una lista de los límites de cada intervalo de clase. %n virtud de que el dato
mínimo de la distribuci#n 2DD3 no es divisible de manera e"acta entre i, el límite inferior del
primer intervalo es DF ¿+or qué DF? +orque es el siguiente valor inferior que es e"actamente
divisible entre BF Los límites de cada intervalo de clase aparecen listados en la tabla AE
@. <egistre los datos en bruto en los intervalos de clase adecuados. %sto se llev# a cabo en la
tabla AE
+. Aume los registros de cada intervalo para obtener su frecuencia. %sto se llev# a cabo en la
tabla AE

SOLUCIÓN
1. $ncuentre el rango. 'ango R dato má"imo I dato mínimo R EF I FM R CC
(. #etermine la amplitud del intervalo >i&:
?. Liste los límites de cada intervalo de clase. (omo el dato mínimo en la distribuci#n
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - '( -
>..6& se puede dividir de manera e"acta entre i, ésta se convierte en el límite inferior del primer
intervalo Los límites de cada intervalo aparecen en la tabla AM
@. <cgistre los datos en bruto en los intervalos de clase adecuados. %sto se llev# a cabo
en la tabla AM
+. Aume los registros de cada intervaloC para obtener su frecuencia. %sto se llev# cabo en
la tabla ?E
7bserve que en virtud de que la unidad de medici#n más peque&a en los datos en bruto
es de FB, los limites reales para cualquier dato estbn a I FFE del dato mencionado .sí, los
límites reales para el intervalo CGIEd son COEIEFE
)$ec#encia $elati3a0 f$ec#encia ac#m#lada y dist$i+#ciones de -o$centaGes
ac#m#lados
. menudo se desea e"presar los datos de una distribuci#n de frecuencias como una
frecuencia relativa, como una frecuencia acumulada o como una distribuci#n de
porcenta)es acumulados
• Una dist$i+#ci&n de f$ec#encias $elati3as indica la proporción del
número total de datos que aparecen en cada intervalo.
• Una dist$i+#ci&n de f$ec#encias ac#m#ladas indica el número de datos
que están por debao del l!mite real superior de cada intervalo.
• Una dist$i+#ci&n de -o$centaGes ac#m#lados indica el porcentae de
datos que están por debao del l!mite real superior de cada intervalo.
La tabla AO muestra la distribuci#n de frecuencias de las calificaciones del e"amen de
estadística, e"presadas como frecuencias relativas, frecuencias acumuladas y
distribuci#n de porcenta)es acumulados +ara convertir una distribuci#n de frecuencias
en una distribuci#n de frecuencias relativas dividimos la frecuencia de cada intervalo entre
el n*mero total de calificaciones .sí,
+or e)emplo, para determinar la frecuencia relativa para el intervalo CEICP, dividimos
su frecuencia 2B3 entre la cantidad total de calificaciones 2OF3 disponibles +or
consiguiente, la frecuencia relativa que corresponde a este intervalo es de R BNOF

R FFB
La frecuencia relativa resulta *til porque nos indica la proporci#n de calificaciones que
está contenida en el intervalo
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - '/ -
La frecuencia acumulada para cada intervalo se calcula sumando la frecuencia de
ese intervalo a las frecuencias de todos los intervalos de clase que están deba)o de él
.sí, la frecuencia acumulada para el intervalo MFIMC R C Y C Y D Y B R BB

%l porcenta)e acumulado de cada intervalo se determina convirtiendo las frecuencias
acumuladas en porcenta)es acumulados La ecuaci#n que se usa para esto es
-
+ara el intervalo MFIMC tenemos que-

Las distribuciones de frecuencias acumuladas y de porcenta)es acumulados son *tiles para
determinar percentiles y rangos percentiles
*RCNTILS
Los percentiles son medidas de posici#n relativa Se utilizan asiduamente en la educaci#n
con el fin de comparar el rendimiento de un individuo con el rendimiento de un grupo de
referencia
Un -e$centil o -#nto -$esentid es el valor sobre la escala de medición, debao
del
cual se encuentra un porcentae dado de los datos incluidos en la
distribución" i.
.sí, el se"agésimo punto percentil es el valor sobre la escala de medida, deba)o del cual
está MFc de los datos de la distribuci#n
C.lc#lo de los -#ntos -e$centiles
Suponga usted que estamos interesados en calcular el quincuagésimo punto percentil
para las calificaciones del e"amen de estadística %stas calificaciones han sido presentadas
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - '5 -
en la tabla AG como distribuciones de frecuencias acumuladas y de porcenta)es
acumulados %mplearemos el símbolo
!+.
para representar al quincuagésimo punto percentil
¿$ué entendemos por el quincuagésimo punto percentil? . partir de la definici#n de punto
percentil,
!+.
es el valor de la escala deba)o del cual se encuentra EFc de las calificaciones
(omo quiera que hay en total OF calificaciones en la distribuci#n,
!+.
debe ser el valor deba)o
del cual se encuentran AE calificaciones 2EFc de OF es AE3 .l observar la columna de las
frecuencias acumuladas y desplazarnos de aba)o hacia arriba, vemos que +
+.
se localiza en
el intervalo OEIOP Sin embargo, en este momento no sabemos qué valor de la escala
debemos asignar a +
+.
.

Lo *nico que sabemos es que le corresponde alg*n valor dentro de
los límites reales del intervalo OEIOP, que son OCE y OPE +ara determinar el punto en el cual
se localiza +
so
,

suponemos que todas las calificaciones están distribuidas de manera uniforme
en todo el intervalo
%n vista de que DO de las calificaciones se encuentran deba)o de OCE, tenemos que
desplazarnos dentro del intervalo hasta obtener G calificaciones adicionales 2véase la figura
AB3 +uesto que e"isten BM calificaciones en el intervalo
I
y éste tiene E unidades de
amplitud en la escala, cada calificaci#n del intervalo ocupa ENBM de la unidad +ara obtener
G calificaciones adicionales, tenemos que desplazarnos +D%6

4 G R DE unidades dentro del
intervalo .l sumar DE al límite inferior de OCE, llegamos a +
so

.sí,
!+. R OCE Y DE R OOF
+ara determinar cualquier punto percentil, siga estos pasos-
%. #etermine la frecuencia de los datos que están debajo del punto percentil.
Simbolizaremos esta frecuencia como ; f
p
acumulada;
f
p
acumulada R 2c de los datos que están aba)o del punto percentil3 1 8
f
p
acumulada para + R EFc 1 2 5 2FEF3 x OF R AE
(. #etermine el límite real inferior del intervalo que contiene al punto percentil.
Llamaremos a este límite real inferior 4
L
.

.l conocer el n*mero de datos que están
aba)o del punto percentil podemos localizar el intervalo que contiene al punto
percentil, comparando la fp acumulada con la frecuencia acumulada de cada
intervalo !na vez localizado el intervalo que contiene al punto percentil, podemos
encontrar de inmediato su límite real inferior, 4
L
. %n este e)emplo, el intervalo que
contiene a +
+.
es OEIOP y su límite real inferior, 4
L
es OCE

Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - '9 -
?. #etermine el número de datos adicionales que deben considerarse en el intervalo
para alcan)ar el punto percentil.
+ara el e)emplo anterior,
C #etermine el número de unidades adicionales que debemos despla)ar en el intervalo
para obtener el número de datos adicionales.
7bserve que-
f
i
es el número de datos en el intervalo e
iDf nos proporciona el número de unidades por dato para dic0o intervalo
E #etermine el punto percentil. Logramos esto sumando las unidades adicionales al límite
real inferior del intervalo que contiene al punto percentil
+unto percentil 5 4
L
Y !nidades adicionales
!+. 5 E@.+ F (.+ 5 EE...
+odemos escribir estos pasos en forma de ecuaci#n +or lo tanto,
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - '; -
Si utilizamos esta ecuaci#n para calcular +
+.
obtenemos-
Hntentemos resolver otro problema %sta vez calcularemos !
(.
, es decir, el valor por deba)o
del cual se encuentra (., de las calificaciones
%n términos de frecuencia acumulada, +
(.
es el valor por deba)o del cual se encuentran %@
calificaciones >(., de E. es BC3 +odemos ver en la tabla AG que +
(.
está en el intervalo 6+-6*. %n
vista de que BB calificaciones se encuentran aba)o del valor 6@.+, necesitamos A calificaciones
adicionales (onsiderando que hay E calificaciones en el intervalo y que éste tiene + unidades de
amplitud, debemos movernos
E
" A R (.%@ unidades en el intervalo .sí,
+
(.
56@. +F(. %@566. 6@
0ambién podríamos haber hallado +
(.
en forma directa, utilizando la ecuaci#n para el
punto percentil ,e esta manera,
Hntentemos resolver un problema más %sta vez calcularemos +
OE
que es el valor de
la escala aba)o del cual se encuentra OEc de las calificaciones4
%n términos de frecuencia acumulada, +O
+
es el valor de la escala por deba)o del
cual se localizan EDE calificaciones >f
p
5 E+, acumulado es igual a OEc de OF 2que es EDE
3 . partir de la tabla AG vemos que +
OE
está en el intervalo GFIGC (omo C calificaciones
se encuentran aba)o del límite inferior de este intervalo
necesitamos agregar a OPE el n*mero adecuado de unidades de la escala para
tener EDE I CA R PE calificaciones adicionales (omo e"isten BF calificaciones en el intervalo y
éste tiene E unidades de amplitud, tendremos que desplazarnos
lo
1 PE R COE unidades
en el intervalo .sí pues,
+
O
R OPE Y COE R GCDE
+
OE
también se puede determinar en forma directa, mediante la ecuaci#n para el
punto percentil .sí,

Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - '= -
R!N>OS *RCNTILS
. veces queremos conocer el rango percentil de un dato en bruto +or e)emplo, como la
calificaci#n que usted obtuvo en el e"amen de estadística fue de GM, le podría ser *til conocer
el rango percentil de este valor
l $anFo percentil de un dato es el porcentae de datos que tienen
valores más baos que el dato en cuestión
C.lc#lo de $anFos -e$centiles
%sta situaci#n es e"actamente la opuesta a la anterior, en la que calculábamos un punto
percentil .hora conocemos el dato y necesitamos calcular el porcenta)e de datos que están por
deba)o de él !na vez más, debemos suponer que los datos dentro de la totalidad de cualquier
intervalo están distribuidos de manera uniforme %n la columna de intervalos de clase de la
tabla AP podemos ver que la calificaci#n de GM se encuentra en el intervalo GEIGP %"isten EA
calificaciones que están aba)o de GCE, el límite inferior de este intervalo %n virtud de que
e"isten O calificaciones en el intervalo y éste tiene E unidades de amplitud, hay ONE
calificaciones por cada unidad de la escala %ntre una calificaci#n de GM y GCE, e"isten 2ONE3
2GM I GCE3 R DB calificaciones adicionales +or lo tanto, hay en total EA Y DB R EEB
calificaciones que están por deba)o de GM (omo quiera que la distribuci#n tiene OF
calificaciones, el rango percentil de GM R 2EEBNOF3

1 BFF R OGOB
'esumiremos estas operaciones en la siguiente ecuaci#n-

.l utilizar esta ecuaci#n para determinar el rango percentil de GM, obtenemos

'esolvamos otro problema para practicar ,etermine el rango percentil de EP La
calificaci#n de EP se encuentra en el intervalo EEIEP %"isten A calificaciones que están por
deba)o de ECE %n virtud de que e"isten C calificaciones dentro del intervalo, hay 2CNE3 2EP I
ECE3 R AM calificaciones dentro del intervalo que se encuentran aba)o de EP %n total, hay A Y
AM R MM calificaciones por deba)o de EP .sí pues, el rango percentil de EP R 2MF3 1 %.. R PCA
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - (@ -

Jamos a resolver otro problema de práctica (on la distribuci#n de frecuencias de las
calificaciones agrupadas de la tabla AE, determine el rango percentil de una calificaci#n
de BBO
La calificaci#n de BBO se encuentra en el intervalo BBFIBBP %l límite inferior de este
intervalo es BFPE %"isten M Y O Y BB Y BA Y BE Y BD Y G Y O Y C R GA calificaciones por
deba)o de BFPE +uesto que hay A calificaciones dentro del intervalo y éste tiene BF unidades
de amplitud, e"isten 2ANBF3 2BBO I BFPE3 R DDE calificaciones dentro del intervalo que se
localizan aba)o de la calificaci#n de BBO %n total, e"isten GA Y DDE R GEDE calificaciones que
se encuentran por deba)o de la calificaci#n de BBO .sí pues, el rango percentil de BBO R
2GEDENPF3

1 BFF R PCOD
0ambién podríamos haber resuelto este problema mediante la ecuaci#n del rango
percentil .sí,

>R!)IC!CIÓN D L!S DISTRI?UCIONS D )RCUNCI!S
Las distribuciones de frecuencias se representan a menudo por medio de gráficas y no
en forma de tablas %n virtud de que la gráfica se basa por completo en los datos de una
tabla, no contiene informaci#n nueva Sin embargo, una gráfica presenta los datos de una
manera visual, lo cual frecuentemente facilita la tarea de observar las características
importantes de los datos .l escribir esta secci#n, hemos supuesto que usted está
familiarizado con la elaboraci#n de gráficas +ues bien, aun en este caso, valdrá la pena
repasar unos cuantos puntos importantes-
B !na gráfica tiene dos e)es- uno vertical y el otro horizontal %l e)e vertical es el e)e de
las ordenadas o e)e G, ' el horizontal es el e)e de las abscisas o e)e 4.
D La variable independiente se coloca muy a menudo en el e)e 1 y la variable deI
pendiente en el e)e > .l trazar la gráfica de una distribuci#n de frecuencias, los valores de los
datos se colocan de ordinario en el e)e 1 y la frecuencia de los valores de los datos se registran
en el e)e >
A %s necesario elegir las unidades apropiadas para registrar los datos en los e)es
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - (1 -
C +ara evitar la distorsi#n de los datos, se acostumbra colocar la intersecci#n de los dos
e)es en el punto cero y después se eligen sus escalas, de manera que la altura de los datos
graficados sea más o menos de las tres cuartas partes de la anchura La figura AD muestra la
forma en que la infracci#n de esta regla puede deformar la impresi#n que la gráfica produce
La figura muestra dos gráficas basadas en los mismos datos, a saber, el n*mero de
estudiantes inscritos en una universidad grande durante los a&os BPPFIDFFD %n la parte 2a3
se ha respetado la regla mencionada con anterioridad %n la parte 2b3, la escala
correspondiente al e)e de las ordenadas no comienza en cero y se muestra
considerablemente e"pandida, en comparaci#n con la parte 2a3 Las impresiones que
producen una y otra gráfica son muy diferentes La parte 2a3 produce la impresi#n correcta
de que la poblaci#n estudiantil fue muy estable, mientras que la parte 2b3 distorsiona en gran
medida los datos y produce la impresi#n de que hubo grandes fluctuaciones en la poblaci#n
universitaria
E +or lo general, la intersecci#n de los dos e)es se encuentra en cero, en ambas escalas
(uando no es así, esto se indica simbolizando una ruptura en el e)e correspondiente, cerca
de la intersecci#n +or e)emplo, en la figura AC aparece una ruptura en el e)e horizontal
para indicar que una parte de la escala ha sido suprimida
M (ada e)e debe tener un letrero y el título de la gráfica debe ser breve y e"plícito
.l graficar distribuciones de frecuencias, se utilizan principalmente cuatro tipos de
gráficas- la gráfica de barras, el 0istograma, el polígono de frecuencias ' la curva de porcentajes
acumulados.
La F$.fica de +a$$as
Se acostumbra graficar las distribuciones de frecuencias de los datos nominales u
ordinales por medio de una gráfica de barras %ste tipo de gráfica se ilustra en la figura AA
Se traza una barra para cada categoría y la altura de la barra representa la frecuencia o
el n*mero de miembros de esa categoría (omo no e"iste una relaci#n numérica entre las
categorías de los datos nominales, podemos organizar los diversos grupos en cualquier
orden a lo largo del e)e horizontal %n la figura AA están ordenados de izquierda a derecha,
seg*n la magnitud de la frecuencia de cada categoría 7bserve que, en este tipo de gráfica, las
barras de cada categoría no se tocan entre sí %sto hace a*n más patente la ausencia de una
relaci#n cuantitativa entre las distintas categorías
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - (% -
l HistoF$ama
%l histograma se utiliza para representar distribuciones de frecuencias constituidas por
datos de intervalos o de razones 2proporciones3 Se aseme)a a la gráfica de barras, salvo porque
en el histograma se traza una barra para cada intervalo de clase Los intervalos de clase se
localizan sobre el e)e horizontal, de modo que cada barra de clase comienza y termina en los
límites reales del intervalo La altura de la barra corresponde a la frecuencia del intervalo de
clase representado (omo quiera que sea los intervalos son continuos, las barras verticales se
deben tocarse entre sí, en lugar de estar espaciadas como en las gráficas de barras La figura
AC muestra las calificaciones del e"amen de estadística 2tabla AC3 representadas mediante
un histograma 7bserve que se acostumbra marcar el punto medio de cada intervalo de
clase sobre la abscisa Las calificaciones agrupadas aparecen de nuevo en la figura para
comodidad de usted
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - (' -
l -olíFono de f$ec#encias
%l polígono de frecuencias también se utiliza para representar datos de intervalo o de
raz#n %l e)e horizontal es idéntico al del histograma Sin embargo, en este tipo de gráfica, en
lugar de utilizar barras, se marca en la gráfica un punto que corresponde al punto medio de
cada intervalo, a una altura correspondiente a la frecuencia del intervalo . continuaci#n se
unen los puntos marcados, mediante líneas rectas +or *ltimo, la línea que une los puntos se
prolonga para que corte el e)e horizontal en el punto medio de los dos intervalos de clase
contiguos al primero y al *ltimo de los intervalos donde están contenidos los datos (on esta
manera de cerrar la figura con el e)e horizontal, se forma un polígono del cual recibe su
nombre esta gráfica La figura AE muestra las calificaciones de la tabla AC como un
polígono de frecuencias La principal diferencia entre un histograma y un polígono de
frecuencias es la siguiente- el histograma e"hibe las calificaciones como si estuvieran
distribuidas de manera uniforme en el intervalo, mientras que el polígono de frecuencias
muestra las calificaciones como si todas estuviesen concentradas en el punto medio del
intervalo .lgunos investigadores prefieren emplear el polígono de frecuencias para comparar
la forma de dos o más distribuciones Los polígonos de frecuencias también tienen el efecto
de presentar los datos como si tuviesen una distribuci#n continua, lo cual ocurre en realidad
en muchos casos
La c#$3a de -o$centaGe ac#m#lado
0ambién las distribuciones de frecuencia acumulada y de porcenta)e acumulado pueden
presentarse en forma gráfica S#lo ilustraremos la segunda de ellas, ya que las gráficas son
esencialmente las mismas y las distribuciones de porcenta)es acumulados se emplean más a
menudo !sted recordará que el porcenta)e acumulado para un intervalo de clase indica el
porcenta)e de datos que están por deba)o del límite real superior del intervalo .sí, el e)e
vertical utilizado para la curva de porcenta)es acumulados se presenta en !nidades de
porcenta)es acumulados %n el e)e horizontal, en lugar de dibu)ar los puntos en el punto medio
de cada intervalo de clase, los marcamos en el límite real superior del intervalo La figura AM
muestra las calificaciones de la tabla AO representadas como una curva de porcenta)es
acumulados ,ebe ser evidente que la curva de frecuencias acumuladas tendría la misma
forma, siendo la *nica diferencia que esta *ltima se gráfica en unidades de frecuencias
acumuladas y no de porcenta)es acumulados Los percentiles y los rangos percentiles se
pueden leer directamente a partir de una curva de porcenta)es acumulados La curva de
porcenta)es acumulados recibe también el nombre de ojiva, con lo cual se indica que tiene la
forma de una A
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - (( -
)o$ma de las c#$3as de f$ec#encia
Las distribuciones de frecuencias pueden tener formas muy diversas .lgunas de las
formas que se presentan con más frecuencia están en la figura AO Las curvas se clasi fican,
en general como sim/tricas o asim/tricas 2sesgadas3
Una curva es sim#trica si al doblarla a la mitad sus dos lados coinciden. $i
una curva no es sim#trica, entonces es asim#trica.
Las curvas que aparecen en la figura AO2a3, 2b3 y 2c3 son simétricas Las curvas 2d3, 2e3 y
2f3 son asimétricas Si una curva es asimétrica, puede tener sesgo -ositi3o o neFati3o4
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - (/ -
(uando una curva está sesgada en fo$ma -ositi3a0 la mayor parte de los datos se
concentra en los valores ba)os del e)e horizontal y la curva disminuye hacia el e"tremo de los
valores altos (uando una curva está sesgada en fo$ma neFati3a0 la mayor parte de los datos
se concentra en los valores altos del e)e horizontal y la curva se reduce hacia el e"tremo de los
valores ba)os
La curva de la parte 2e3 está sesgada en forma positiva y la curva de la parte 2f3 está
sesgada en forma negativa
Las curvas de frecuencias son designadas a menudo seg*n su forma .sí, a las curvas de
las partes 2a3, 2b3, 2c3 y 2d3 se las denomina, respectivamente, curvas en forma de campana,
rectangulares o uniformes, en forma de ! y en forma de 5
*R>UNT!S 7 *RO?LM!S
B ,efina cada uno de los conceptos de la secci#n ;0érminos importantes;
D ¿%n qué difiere la elaboraci#n de las gráficas de barras, los histogramas y los polígonos
de frecuencias? ¿$ué tipo de escala es adecuada para cada una?
La tabla siguiente muestra los salarios promedio anuales de varias categorías de
científicos que ostentan doctorados, en %stados !nidos, en DFFD 4aga una gráfica de barras
para representar estos datos, colocando ;Salario anual; sobre el e)e >, y ;(ategoría de
científico; sobre el e)e 1 7rdene las categorías de manera que los salarios decrezcan de
izquierda a derecha
A !n estudiante de posgrado ha reunido datos acerca de MM calificaciones . partir de
estos datos, ha hecho dos distribuciones de frecuencias de datos agrupados, las cuales
presentamos a continuaci#n
¿%ncuentra usted alg*n error en esas distribuciones? %"plique
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - (5 -
M Las siguientes calificaciones fueron obtenidas en un e"amen de letras inglesas por
los miembros de un grupo de segundo grado de una universidad-
a 4aga una distribuci#n de frecuencias para los datos no agrupados 2i R B3
b 4aga una distribuci#n de frecuencias de datos agrupados que tenga BE intervalos
apro"imadamente Liste los límites aparentes y también los reales de cada intervalo
c %labore un histograma para la distribuci#n de frecuencias construida en la parte b
d ¿%s asimétrica o simétrica la distribuci#n? Si está sesgada, ¿lo está en forma
positiva o negativa?
e 4aga un diagrama de tallo y ho)as, en el que el *ltimo dígito sea una ho)a y el primero
sea un tallo Hncluya dos veces los valores en los tallos
f ¿(uál diagrama le gusta más, el histograma de la parte c o el diagrama de tallo y ho)as
de la parte e? %"plique educaci#n
M %"prese la distribuci#n de frecuencias agrupadas obtenida en la parte b del problema E
como una distribuci#n de frecuencias relativas, de frecuencias acumuladas y de porcenta)es
acumulados educaci#n
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - (9 -
O !tilice la frecuencia acumulada obtenida en el problema M y determine-
a. !
E+
b +
CF
educaci#n
G !se otra vez la distribuci#n acumulada y los datos agrupados obtenidos en el
problema M y determine-
a %l rango percentil de una calificaci#n de GB
b %l rango percentil de una calificaci#n de MM
c %l rango percentil de una calificaci#n de GO
ed#caci&n
P %labore un histograma de la distribuci#n de las calificaciones agrupadas del e"amen de
letras inglesas, obtenida en el problema Eb educaci#n
BF Los siguientes datos muestran la cantidad de peso 2en libras3 perdido por cada paciente
de una clínica para el control del peso durante el *ltimo a&o-
a 4aga una distribuci#n de frecuencias de los datos agrupados con BF intervalos
apro"imadamente
b %labore un histograma de la distribuci#n de frecuencias obtenida en la parte a
c ¿%s asimétrica o simétrica la distribuci#n? Si está sesgada, ¿lo está en forma positiva o
negativa?
d 'ealice un diagrama de tallo y ho)as donde el *ltimo dígito sea una ho)a y el primer dígito
sea un tallo 'epita dos veces los valores del tallo e ¿(uál diagrama le gusta más, el histograma
de la parte b o el diagrama de tallo y ho)as de la parte d? %"plique clínica, salud
BB (onvierta la distribuci#n de frecuencias agrupadas de las pérdidas de peso, determinada
en el problema BF, en una distribuci#n de frecuencias relativas y en una distribuci#n de
frecuencias acumuladas clínica, salud
BD !tilice la distribuci#n de frecuencias acumuladas obtenida en el problema BB y
determine-
a +
EF
b +
DE
clínica, salud
BA !tilice una vez más la distribuci#n de frecuencias acumuladas obtenida en el
problema BB y determine-
a %l rango percentil de un dato de CB
b %l rango percentil de un dato de DG clínica, salud
BC 4aga un polígono de frecuencias a partir de la distribuci#n de frecuencias agrupadas
determinada en el problema BF ¿%s simétrica la curva? Si no lo es, ¿tiene sesgo positivo o
negativo? clínica, salud
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - (; -
BE !na universidad peque&a utiliza el sistema de calificaci#n de F a CF, donde CF es la
calificaci#n más alta posible Las calificaciones que aparecen a continuaci#n son los promedios
de las calificaciones de los estudiantes inscritos actualmente en las licenciaturas de psicología de
esa universidad
a 4aga una distribuci#n de frecuencias para los datos agrupados, con BF intervalos
apro"imadamente
b %labore un histograma para la distribuci#n de frecuencias obtenida en la parte a
c ¿%s asimétrica o simétrica la distribuci#n? Si está sesgada, ¿su sesgo es positivo o
negativo?
d 'ealice un diagrama de tallo y ho)as donde el *ltimo dígito sea una ho)a y el primer
dígito sea un tallo 'epita cinco veces los valores de los tallos
e ¿(uál diagrama le gusta más, el histograma de la parte b o el diagrama de tallo y ho)as
de la parte d? %"plique educaci#n
BM +ara las calificaciones agrupadas del problema BE, determine-
a +
EF
b +
DF
ed#caci&n
BO %l promedio de las calificaciones de Sarah es de AB 0omando como base la
distribuci#n de frecuencias de las calificaciones agrupadas obtenidas en el parte a, ¿cuál es el
rango percentil del promedio de las calificaciones de Sarah? ed#caci&n
BG Seg*n la política de la universidad del problema BE, el estudiante debe tener un
promedio de calificaciones de DE o mayor como requisito para que se le otorgue un título en
psicología
a . partir de los datos no agrupados que aparecen en el problema BE, ¿qué porcenta)e de
los estudiantes actuales de psicología necesita me)orar sus calificaciones?
b 0omando como base la distribuci#n de frecuencias obtenida para las calificaciones
agrupadas, ¿qué porcenta)e de los estudiantes necesita me)orar sus calificaciones?
c %"plique la diferencia entre las respuestas a las partes a y b educaci#n
BP 4aga un polígono de frecuencias utilizando la distribuci#n de calificaciones agrupadas
obtenida en el problema BE ¿La curva es simétrica, o tiene sesgo positivo o negativo?
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - (= -
DF %l departamento de psicología de una universidad grande tiene su propio criadero de
ratas con prop#sitos de investigaci#n !n muestreo reciente de EF ratas tomadas del criadero
revel# los siguientes pesos para dichas ratas-
a 4aga una distribuci#n de frecuencias de datos agrupados con BB intervalos
apro"imadamente
b %labore un histograma de la distribuci#n frecuencias obtenida en la parte a
c ¿La distribuci#n es simétrica o asimétrica?
d (onstruya un diagrama de tallo y ho)as en el que el *ltimo dígito sea una ho)a y los
dos primeros dígitos sean un tallo 8o repita los valores de los tallos
e ¿(uál diagrama le gusta más, el histograma o el diagrama de tallo y ho)as? ¿+or qué?
biol#gica
DB (onvierta la distribuci#n de frecuencias de datos agrupados de los pesos de las
ratas obtenida en el problema DF, en una distribuci#n de frecuencias relativas, de
frecuencias acumuladas y de porcenta)es acumulados biol#gica
DD . partir de la distribuci#n de frecuencias acumuladas que obtuvo en el problema
DB, determine-
a +
EA
b. +
OE
biol#gica
DA !tilizando otra vez la distribuci#n de frecuencias acumuladas obtenida en el
problema DB determine-
a %l rango percentil de un dato de DOE
b %l rango percentil de un dato de ABG biol#gica
DC !na profesora está realizando investigaciones sobre las diferencias individuales de
los estudiantes en cuanto a su susceptibilidad para ser hipnotizados (omo parte del
e"perimento, la profesora decide administrar una parte de la %scala de Susceptibilidad
4ipn#tica de Stanford a GE estudiantes
Medidas de Tendencia Cent$al y ,a$ia+ilidad - /@ -
Medidas de Tendencia Cent$al y ,a$ia+ilidad 1*osciIn2
%414 Int$od#cci&n
%n el capitulo anterior hemos visto como se pueden resumir los datos obtenidos del estudio
de una muestra 2o una poblaci#n3 en una tabla estadística o un grafico 8o obstante, tras la
elaboraci#n de la tabla y su representaci#n gráfica, en la mayoría de las ocasiones resulta más
eficaz dcondensarS dicha informaci#n en algunos n*meros que la e"presen de forma clara y
concisa Los fen#menos biol#gicos no suelen ser constantes, por lo que será necesario que )unto a
una medida que indique el valor alrededor del cual se agrupan los datos, se asocie una medida
que haga referencia a la variabilidad que refle)e dicha fluctuaci#n
+or tanto el siguiente paso y ob)eto de este capitulo consistirá en definir algunos tipos de
medidas 2estadísticos o parámetros3 que los sintetizan a*n más
%s decir, dado un grupo de datos organizados en una distribuci#n de frecuencias 2o bien
una serie de observaciones sin ordenar3, pretendemos describirlos mediante dos o tres cantidades
sintéticas %n este sentido pueden e"aminarse varias características, siendo las más comunes-
La tendencia central de los datos/
La dispersi#n o variaci#n con respecto a este centro/
Los datos que ocupan ciertas posiciones
La simetría de los datos
La forma en la que los datos se agrupan
. lo largo de este capitulo, y siguiendo este orden, iremos estudiando Los estadísticos que
nos van a orientar sobre cada uno de estos niveles de informaci#n- valores alrededor de los cuales
se agrupa la muestra, la mayor o menor fluctuaci#n alrededor de esos valores, nos interesaremos
en ciertos valores que marcan posiciones características de una distribuci#n de frecuencias así
como su simetría y su forma
%4%4 stadísticos de tendencia cent$al
Las tres medidas más usuales de tendencia central son-
la media,
la mediana,
Medidas de Tendencia Cent$al y ,a$ia+ilidad - /1 -
la moda
%n ciertas ocasiones estos tres estadísticos suelen coincidir, aunque generalmente no es así
(ada uno de ellos presenta venta)as e inconvenientes que precisaremos mas adelante %n primer
lugar vamos a definir los conceptos anteriores
%4%414 La media
La media aritmética de una variable estadística es la suma de todos sus posibles valores,
ponderada por las frecuencias de los mismos %s decir, si la tabla de valores de una variable 1 es
la media es el valor que podemos escribir de las siguientes formas equivalentes-
Si los datos no están ordenados en una tabla, entonces
!lF#nos incon3enientes de la media
La media presenta inconvenientes en algunas situaciones-
!no de ellos es que es muy sensible a los valores e"tremos de la variable- ya que todas las
observaciones intervienen en el calculo de la media, la aparici#n de una observaci#n e"trema,
harb que la media se desplace en esa direcci#n %n consecuencia, no es recomendable usar la
media como medida central en las distribuciones muy asimétricas
Si consideramos una variable discreta, por e)emplo, el n*mero de hi)os en las familias
espa&olas el valor de la media puede no pertenecer al con)unto de valores de la variable/ +or
e)emplo
X
R B, D hi)os
(onsideramos una variable discreta 1 cuyas observaciones en una tabla estadística han
sido ordenadas de menor a mayor Llamaremos mediana,
Med al primer valor de la variable que de)a por deba)o de si al EFc de las observaciones
Medidas de Tendencia Cent$al y ,a$ia+ilidad - /% -
%n el caso de variables continuas, las clases vienen dadas por intervalos, y aquí la formula
de la mediana se complica un poco más 2pero no demasiado3- Sea 2lieB, lif el intervalo donde
hemos encontrado que por deba)o están el EFc de las observaciones %ntonces se obtiene la
mediana a partir de las frecuencias absolutas acumuladas, mediante interpolaci#n lineal
2teorema de 0hales3 como sigue-
%sto equivale a decir que la mediana divide al histograma en dos partes de breas iguales a
]
+ropiedades de la mediana %ntre las propiedades de la mediana, vamos a destacar las
siguientes-
(omo medida descriptiva, tiene la venta)a de no estar afectada por las observaciones
e"tremas, ya que no depende de los valores que toma la variable, sino del orden de las mismas
+or ello es adecuado su uso en distribuciones asimétricas
%s de cálculo rápido y de interpretaci#n sencilla
. diferencia de la media, la mediana de una variable discreta es siempre un valor de la
variable que estudiamos 2e) La mediana de una variable n*mero de hi)os toma siempre valores
enteros3
!n e)emplo de cálculo de mediana
Sea 1 una variable discreta que ha presentado sobre una muestra las modalidades
Si cambiamos la *ltima observaci#n por otra anormalmente grande, esto no afecta a la
mediana, pero si a la media-
%n este caso la media no es un posible valor de la variable 2discreta3, y se ha visto muy
afectada por la observaci#n e"trema %ste no ha sido el caso para la mediana
Medidas de Tendencia Cent$al y ,a$ia+ilidad - /' -
!n e)emplo de cálculo de media y mediana
7btener la media aritmética y la mediana en la distribuci#n ad)unta
,eterminar gráficamente cuál de los dos promedios es más significativo
+ara ver la representatividad de ambos promedios, realizamos el histograma de la figura DA,
y observamos que dada la forma de la distribuci#n, la mediana es más representativa que la
media
14%4'4 La moda
Medidas de Tendencia Cent$al y ,a$ia+ilidad - /( -
Llamaremos moda a cualquier má"imo relativo de la distribuci#n de frecuencias, es decir,
cualquier valor de la variable que posea una frecuencia mayor que su anterior y su posterior
observaci#n
,e la moda destacamos las siguientes propiedades-
%s muy fácil de calcular
+uede no ser *nica
%4%4(4 Relaci&n ent$e media0 mediana y moda
%n el caso de distribuciones unimodales, la mediana está con frecuencia comprendida entre
la media y la moda 2incluso mas cerca de la media3 %n distribuciones que presentan cierta
inclinaci#n, es más aconse)able el uso de la mediana Sin embargo en estudios relacionados con
prop#sitos estadísticos y de inferencia suele ser mas apta la media
BA stadísticos de *osici&n
Los estadísticos de posici#n van a ser valores de la variable caracterizados por superar a
cierto porcenta)e de observaciones en la poblaci#n 2o muestra3 0enemos fundamentalmente a los
percentiles como medidas de posici#n, y asociados a ellos veremos también los cuartiles, deciles y
cuarteles +ercentiles
+ara una variable discreta, se define el percentil de orden :, como la observaci#n, +:, que
de)a por deba)o de si el :c de la poblaci#n Jgase la figura DC %sta definici#n nos recuerda a la
mediana, pues como consecuencia de la definici#n es evidente que
%n el caso de una variable continua, el intervalo donde se encuentra +: h 2liIB, lif, se calcula
buscando el que de)a deba)o de si al :c de las observaciones ,entro de gl, +: se obtiene seg*n
la relaci#n
Medidas de Tendencia Cent$al y ,a$ia+ilidad - // -
C#a$tiles
Los cuartiles, $B, son un caso particular de los percentiles 4ay A, y se definen como-
Deciles
Se definen los deciles como los valores de la variable que dividen a las observaciones en BF
grupos de igual tama&o 9as precisamente, definimos ,B,,D, , ,P como-
Gem-lo de c.lc#lo de c#a$tiles con #na 3a$ia+le disc$eta
,ada la siguiente distribuci#n en el n*mero de hi)os de cien familias, calcular sus cuartiles
Medidas de Tendencia Cent$al y ,a$ia+ilidad - /5 -
Gem-lo
(alcular los cuartiles en la siguiente distribuci#n de una variable continua-
Soluci#n-
B +rimer cuartel
D Segundo cuartil-
A 0ercer cuartil
%)emplo de cblculo de cuartiles con una variable continua 4an sido ordenados los pesos de
DB personas en la siguiente tabla-
Medidas de Tendencia Cent$al y ,a$ia+ilidad - /9 -
%ncontrar aquellos valores que dividen a los datos en C partes con el mismo numero de
observaciones
Soluci#n- Las cantidades que buscamos son los tres cuartiles- $B, $D y $A +ara
calcularlos, le a&adimos a la tabla las columnas con las frecuencias acumuladas, para localizar
qué intervalos son los que contienen a los cuartiles buscados-
7bsérvese que $D R 9ed %sto es l#gico, ya que la mediana divide a la distribuci#n en dos
partes con el mismo n^mero de observaciones, y $D, hace lo mismo, pues es de)a a dos cuartos
de los datos por arriba y otros dos cuartos por aba)o
Gem-lo
La distribuci#n de una variable tiene por polígono acumulativo de frecuencias el de la figura
DE Si el n^mero total de observaciones es EF-
B %laborar una tabla estadística con los siguientes elementos- intervalos, marcas de clase,
frecuencia absoluta, frecuencia absoluta acumulada, frecuencias relativa y frecuencias relativa
acumulada
Medidas de Tendencia Cent$al y ,a$ia+ilidad - /; -
D (uántas observaciones tuvieron un valor inferior a BF, cuántas inferior a G y cuántas
fueron superior a BB
A ,etermine los cuartiles
Sol#ci&nB
B %n la siguiente tabla se proporciona la informaci#n pedida y algunos cálculos au"iliares
que nos permitirán responder a otras cuestiones
D (alculemos el n*mero de observaciones pedido-
Medidas de Tendencia Cent$al y ,a$ia+ilidad - /= -
%4(4 Medidas de 3a$ia+ilidad o dis-e$si&n
Los estadísticos de tendencia central o posici#n nos indican donde se sit*a un grupo de
puntuaciones Los de variabilidad o dispersi#n nos indican si esas puntuaciones o valores están
pr#"imas entre si o si por el contrario están o muy dispersas
%4(414 RanFo
!na medida razonable de la variabilidad podría ser la amplitud o rango, que se obtiene
restando el valor mías ba)o de un con)unto de observaciones del valor mías alto
%ropiedades del ran&o
%s fácil de calcular y sus unidades son las mismas que las de la variable 8o utiliza todas
las observaciones 2s#lo dos de ellas3/ Se puede ver muy afectada por alguna observaci#n e"trema/
%l rango aumenta con el n*mero de observaciones, o bien se queda igual %n cualquier caso
nunca disminuye
%4(4%4 ,a$ianEa
La varianza, S
D
, se define como la media de las diferencias cuadráticas de n puntuaciones
con respecto a su media aritmética, es decir
%sta medida es siempre una cantidad positiva, con propiedades interesante para la
realizaci#n de inferencia estadística (omo sus unidades son las del cuadrado de la variable, es
mías sencillo usar su raíz cuadrada, que es la que vemos en la siguiente secci#n
%4(4'4 Des3iaci&n tí-ica o est.nda$
La varianza no tiene la misma magnitud que las observaciones 2e) si las observaciones se
miden en metros, la varianza lo hace en metros cuadrados Si queremos que la medida de
dispersi#n sea de la misma dimensionalidad que las observaciones bastara con tomar su raíz
cuadrada +or ello se define la desviaci#n típica, S, como
%4(4(4 Gem-lo de cJlc#lo de medidas de dis-e$si&n
(alcular el rango, varianza y desviaci#n típica de las siguientes cantidades medidas en
metros-
A, A, C, C, E
Medidas de Tendencia Cent$al y ,a$ia+ilidad - 5@ -
Soluci#n- %l rango de esas observaciones es la diferencia entre la mayor y menor de ellas, es
decir, EeA R D +ara calcular las restantes medidas de dispersi#n es necesario calcular
previamente el valor con respecto al cual vamos a medir las diferencias i%ste es la media-
" R 2A Y A Y C Y C Y E3NE R A, G metros
La varianza es-
siendo la desviaci#n típica su raíz cuadrada-
%ropiedades de la varianza y desviación t!pica
.mbas son sensibles a la variaci#n de cada una de las puntuaciones, es decir, si una
puntuaci#n cambia, cambia con ella la varianza La raz#n es que si miramos su definici#n, la
varianza es funci#n de cada una de las puntuaciones
La desviaci#n típica tiene la propiedad de que en el intervalo
Se encuentra, al menos, el OEc de las observaciones Hncluso si tenemos muchos datos y
estos provienen de una distribuci#n normal 2se definirá este concepto mías adelante3, podremos
llegar al PE c 8o es recomendable el uso de ellas, cuando tampoco lo sea el de la media como
medida de tendencia central
%4(4/4 Coeficiente de 3a$iaci&n
4emos visto que las medidas de centralizaci#n y dispersi#n nos dan informaci#n sobre una
muestra 8os podemos preguntar si tiene sentido usar estas magnitudes para comparar dos
poblaciones +or e)emplo, si nos piden comparar la dispersi#n de los pesos de las poblaciones de
elefantes de dos circos diferentes, S nos dará informaci#n ^til ¿+ero qué ocurre si lo que
comparamos es la altura de unos elefantes con respecto a su peso? 0anto la media como la
desviaci#n típica,
X
y S, se e"presan en las mismas unidades que la variable +or e)emplo, en la
variable altura podemos usar como unidad de longitud el metro y en la variable peso, el
:ilogramo (omparar una desviaci#n 2con respecto a la media3 medida en metros con otra en
:ilogramos no tiene ning*n sentido %l problema no deriva s#lo de que una de las medidas sea de
longitud y la otra sea de masa %l mismo problema se plantea si medimos cierta cantidad, por
e)emplo la masa, de dos poblaciones, pero con distintas unidades %ste es el caso en que
comparamos el peso en toneladas de una poblaci#n de BFF elefantes con el correspondiente en
miligramos de una poblaci#n de EF hormigas
%l problema no se resuelve tomando las mismas escalas para ambas poblaciones +or
e)emplo, se nos puede ocurrir medir a las hormigas con las mismas unidades que los elefantes
2toneladas3 Si la ingenier_a genética no nos sorprende con alguna barbaridad, lo l#gico es que la
dispersi#n de la variable peso de las hormigas sea prácticamente nula 2U.unque haya algunas
que sean BFFF veces mayores que otrasV3 %n los dos primeros casos mencionados
Medidas de Tendencia Cent$al y ,a$ia+ilidad - 51 -
anteriormente, el problema viene de la dimensionalidad de las variables, y en el tercero de la
diferencia enorme entre las medias de ambas poblaciones %l coeficiente de variaci#n es lo que
nos permite evitar estos problemas, pues elimina la dimensionalidad de las variables y tiene en
cuenta la proporci#n e"istente entre medias y desviaci#n típica Se define del siguiente modo-
%ropiedades del coeficiente de variación
S#lo se debe calcular para variables con todos los valores positivos
0odo índice de variabilidad es esencialmente no negativo Las observaciones pueden ser
positivas o nulas, pero su variabilidad debe ser siempre positiva ,e ahí que s#lo debemos
traba)ar con variables positivas, para la que tenemos con seguridad que x " j F
8o es invariante ante cambios de origen %s decir, si a los resultados de una medida le
sumamos una cantidad positiva, b j F, para tener > R 1 Y b, entonces (J> k (J1
%s invariante a cambios de escala .sí por e)emplo el coeficiente de variaci#n de una variable
medida en metros es una cantidad adimensional que no cambia si la medici#n se realiza en
centímetros
Ti-ificaci&n
Se conoce por tipificaci#n al proceso de restar la media y dividir por su desviaci#n típica a
una variable 1 ,e este modo se obtiene una nueva variable de media x R F y desviaci#n típica Sl
R B, que denominamos variable tipificada
%sta nueva variable carece de unidades y permite hacer comparables dos medidas que en
un principio no lo son .sí por e)emplo nos podemos preguntar si un elefante es mas grueso que
una hormiga determinada, cada uno en relaci#n a su poblaci#n 0ambién es aplicable al caso en
que se quieran comparar individuos seme)antes de poblaciones diferentes +or e)emplo, si
deseamos comparar el nivel académico de dos estudiantes de diferentes !niversidades para la
concesi#n de una beca de estudios, en principio seria in)usto concederla directamente al que
posea una nota media mías elevada, ya que la dificultad para conseguir una buena calificaci#n
puede ser mucho mayor en un centro que en el otro, lo que limita las posibilidades de uno de los
estudiante y favorece al otro %n este caso, lo mías correcto es comparar las calificaciones de
ambos estudiantes, pero tipificadas cada una de ellas por las medias y desviaciones típicas
respectivas de las notas de los alumnos de cada !niversidad
No conf#ndi$ coeficiente de 3a$iaci&n y ti-ificaci&n
Los coeficientes de variaci#n sirven para comparar las variabilidades de dos con)untos de
valores 2muestras o poblaciones3, mientras que si deseamos comparar a dos individuos de cada
uno de esos con)untos, es necesario usar los valores tipificados 8inguno de ellos posee unidades
y es un error frecuente entre estudiantes de bioestadística confundirlos
%4/4 !simet$ía y a-#ntamiento
Medidas de Tendencia Cent$al y ,a$ia+ilidad - 5% -
Sabemos cmmo calcular valores alrededor de los cuales se distribuyen las observaciones de
una variable sobre una muestra y sabemos cmmo calcular la dispersi#n que ofrecen los mismos
con respecto al valor de central 8os proponemos dar un paso mías allá en el análisis de la
variable %n primer lugar, nos vamos a plantear el saber si los datos se distribuyen de forma
simétrica con respecto a un valor central, o si bien la gráfica que representa la distribuci#n de
frecuencias es de una forma diferente del lado derecho que del lado izquierdo
Si la simetría ha sido determinada, podemos preguntarnos si la curva es mías o menos
apuntada 2larga y estrecha3 %ste apuntamiento habrb que medirlo comparado a cierta
distribuci#n de frecuencias que consideramos normal 2no por casualidad es gste el nombre que
recibe la distribuci#n de referencia3 %stas ideas son las que vamos a desarrollar en lo que resta
del capitulo
%4/414 stadísticos de asimet$ía
+ara saber si una distribuci#n de frecuencias es simétrica, hay que precisar con respecto a
qué !n buen candidato es la mediana, ya que para variables continuas, divide al histograma de
frecuencias en dos partes de igual brea +odemos basarnos en ella para, de forma natural, decir
que una distribuci#n de frecuencias es simétrica si el lado derecho de la gráfica 2a partir de la
mediana3 es la imagen por un espe)o del lado izquierdo 2figura DM3 (uando la variable es
discreta, decimos que es simétrica, si lo es con respecto a la media
,entro de los tipos de asimetría posible, vamos a destacar los dos fundamentales-
'simetr!a positiva- Si las frecuencias mías altas se encuentran en el lado izquierdo de la
media, mientras que en derecho hay frecuencias mas +eque&as 2cola3
'simetr!a ne&ativa- (uando la cola está en el lado izquierdo (uando realizamos un
estudio descriptivo es altamente improbable que la distribuci#n de frecuencias sea totalmente
simétrica %n la práctica diremos que la distribuci#n de frecuencias es simétrica si lo es de un
modo apro"imado +or otro lado, a*n observando cuidadosamente la gráfica, podemos no ver
claro de qué lado están las frecuencias mías altas Se definen entonces toda una familia de
estadísticos que ayuden a interpretar la asimetría, denominados índices de asimetría %l
principal de ellos es el momento central de tercer orden que definimos a continuaci#n
Medidas de Tendencia Cent$al y ,a$ia+ilidad - 5' -
9omento central de tercer orden
Sea 1 una variable cuantitativa > y p h HJ Llamamos momento de orden
p a-
Se denomina momento central de orden p a la cantidad
Los momentos de orden p impar, son siempre nulos en el caso de variables simétricas, ya
que para cada i que esté a un lado de la media, con 2"i e x 3 k F, le corresponde una observaci#n )
del otro lado de la media tal que 2"i e x 3 R e2"i e x 3 %levando cada una de esas cantidades a p
impar, y sumando se tiene que
Si la distribuci#n fuese asimétrica positiva, las cantidades 2"ie x 3
p
, con p Q A impar positivas
estarían muy aumentadas al elevarse a p %sta propiedad nos indica que un índice de asimetría
posible consiste en tomar p R A y elegir como estadístico de asimetría al momento central de
tercer orden .poyándonos en este índice, diremos que hay asimetría positiva si aA j F, y que la
asimetría es negativa si aA k F nndice basado en los tres cuartiles 2>uleo?oKley3 Si una
distribuci#n es simétrica, es claro que deben haber tantas observaciones entre la que de)a por
deba)o de si las tres cuartas partes de la distribuci#n y la mediana, como entre la mediana y la
que de)a por deba)o de si un cuarto de todas las observaciones ,e forma abreviada esto es,
$A e $D R $D e $B
!na pista para saber si una distribuci#n de frecuencias es asimétrica positiva la
descubrimos observando la figura DO3-
$A e $D j $D e $B
+or analogía, si es asimétrica negativa, se tendrá
$A e $D k $D e $B
+ara quitar dimensionalidad al problema, utilizamos como índice de asimetría la cantidad-
%s claro que
%l numero obtenido, .s, es invariante ante cambios de origen de referencia y de escala
Medidas de Tendencia Cent$al y ,a$ia+ilidad - 5( -
Ot$os índices de asimet$ía4
?asándonos en que si una distribuci#n de frecuencias es simétrica y unimodal, entonces la
media, la mediana y la moda coinciden, podemos definir otras medidas de asimetría, como son-
o bien,
,iremos que hay asimetría positiva si .s j F y negativa si .s k F

%)emplo
Las edades de un grupo de personas se refle)an en la tabla siguiente-
Medidas de Tendencia Cent$al y ,a$ia+ilidad - 5/ -
,eterminar la variabilidad de la edad mediante los estadísticos varianza, desviaci#n típica,
coeficiente de variaci#n y rango intercuart_lico %studie la simetría de la variable
Sol#ci&nB
%n primer lugar realizamos los cálculos necesarios a partir de la tabla de frecuencias-
La media es x R D,FMENBEO R BA, BE a&os La varianza la calculamos a partir de la columna
de la
i i
n x
2
como sigue-
S
D
R DO,OCD, DENBEOeBA, BE
D
R A, OG a&os
D
p S R
78 . 3
R B, PC a&os
M#est$eo !leato$io y *$o+a+ilidad - 55 -
M#est$eo aleato$io y -$o+a+ilidad
INTRODUCCIÓN
4emos concluido nuestro análisis de la estadística descriptiva y ya estamos listos para
comenzar a estudiar el área fascinante de la estadística inferencial (on la estadística descriptiva
nuestra preocupaci#n principal era lograr la presentaci#n y descripci#n de los con)untos de
datos de la manera más significativa y eficaz %n la estadística inferencial vamos más allá de la
mera descripci#n de los datos, ya que un ob)etivo básico es el uso de los datos provenientes de
una muestra para hacer una afirmaci#n acerca de una característica de la poblaci#n Se hacen
dos tipos de afirmaciones- una tiene que ver con la actividad conocida como prueba de hip#tesis y
la otra con la estimaci#n de parámetros
%n la prueba de hip#tesis, el investigador recolecta datos de un e"perimento sobre el
con)unto de su)etos de una muestra, en un intento de validar cierta hip#tesis relativa a una
poblaci#n +or e)emplo, suponga que una psic#loga dedicada a la educaci#n cree que un nuevo
método para ense&ar la asignatura de matemáticas a los ni&os de tercer grado, en su distrito
escolar 2poblaci#n3, es me)or que la forma usual de ense&anza %n el e"perimento, ella toma dos
muestras de los alumnos de tercer grado, a una de las cuales se le imparte el nuevo método de
ense&anza y a la otra el método usual (ada grupo presenta el mismo e"amen final .l hacer esta
prueba, la psic#loga no se conforma con s#lo informar que la media del grupo que recibi# el
nuevo método fue mayor que la del otro grupo %lla quiere hacer una afirmaci#n como- ;La
me)oría observada en las calificaciones del e"amen final fue resultado del nuevo método de
ense&anza y no del azar .demás, dicha me)oría no s#lo se aplicaría a la muestra particular
sometida a prueba, sino que aparecería en toda la poblaci#n de estudiantes de tercer grado si se
les ense&ase con el nuevo método; Las técnicas utilizadas en estadística inferencial permiten
hacer afirmaciones de este tipo
%n los e"perimentos para la estimaci#n de parámetros el investigador está interesado en
determinar la magnitud de una característica de la poblaci#n +or e)emplo, a un economista
podría importarle la determinaci#n de la cantidad mensual promedio de dinero gastada el a&o
pasado en alimentos por los estudiantes de bachillerato (on los datos de una muestra y las
técnicas de la estadística inferencial, él puede estimar la cantidad media que gasta la poblaci#n
%l economista podría concluir con una afirmaci#n como la siguiente- ;%"iste una probabilidad
de FPE de que el intervalo qDEFIqAFF contenga la media de la poblaci#n;
Los temas de muestreo aleatorio y de probabilidad son fundamentales para la metodología de
la estadística inferencial %n la siguiente secci#n estudiaremos el muestreo aleatorio %l resto
del capítulo tratará sobre los principios básicos de la probabilidad
MUSTRO !L!TORIO
+ara generalizar de manera válida, a partir de una muestra a toda la poblaci#n, tanto en los
e"perimentos de prueba de hip#tesis como en los de estimaci#n de parámetros, la muestra no
puede ser cualquier subcon)unto de la poblaci#n %s crucial que sea una muestra aleatoria
Una m#est$a aleato$ia es eleFida de la -o+laci&n mediante #n -$oceso con el
c#al se aseF#$a K#e 12 cada -osi+le m#est$a de #n tamaLo dado tenFa la misma
-$o+a+ilidad de se$ eleFida y %2 todos los miem+$os de la -o+laci&n tenFan la
misma -$o+a+ilidad de se$ seleccionados en la m#est$a4
+ara ilustrar esto, consideremos una situaci#n en la que tenemos una poblaci#n con los
datos D, A, C, E y M, y queremos e"traer de manera aleatoria una muestra de tama&o D a partir de
dicha poblaci#n 7bserve que, por lo general, una poblaci#n tendría más datos La hemos
M#est$eo !leato$io y *$o+a+ilidad - 59 -
restringido a cinco elementos para facilitar la comprensi#n de lo que queremos poner de
manifiesto Suponga usted que estamos realizando un muestreo de esta poblaci#n y que tomamos
un dato a la vez, para luego volver a colocarlo con el resto de dicha poblaci#n antes de e"traer
otro %sto se llama muestreo con reemplazo y será analizado posteriormente en este capítulo .
continuaci#n presentamos todas las muestras de tama&o D que podemos obtener de la poblaci#n
aplicando este método de muestreo-
Son DE muestras de tama&o D las que podemos obtener al realizar el muestreo de un
elemento a la vez con reemplazo +ara realizar un muestreo aleatorio, el proceso debe ser tal que
B3 las DE muestras posibles y D3 todos los datos de la poblaci#n 2D, A, C, E y M3 tengan la misma
probabilidad de ser seleccionados en la muestra
La muestra debe ser aleatoria por dos razones La primera es que para que se pueda
generalizar a toda la poblaci#n una característica observada en una muestra, es necesario aplicar
las leyes de la probabilidad Si la muestra no ha sido obtenida mediante un procedimiento con el
cual se garantice que cada muestra posible del tama&o elegido tenga la misma posibilidad de ser
escogida, no podremos aplicar las leyes de probabilidad a esa muestra La importancia que tiene
para la inferencia estadística este aspecto de aleatoriedad y de probabilidad se podrá apreciar
claramente cuando hayamos analizado los capítulos referentes a la prueba de hip#tesis y a las
distribuciones muestrales 2véanse los capítulos BF y BD respectivamente3
La segunda raz#n para la utilizaci#n del muestreo aleatorio consiste en que, para asegurar
la generalizaci#n de una característica de la muestra a toda la poblaci#n, es necesario que dicha
muestra sea representativa de la poblaci#n en cuesti#n !na forma de lograr la representatividad
consiste en elegir la muestra por medio de un proceso que garantice que todos los miembros de la
poblaci#n tengan la misma posibilidad de ser escogidos +or lo tanto, el hecho de requerir que una
muestra sea aleatoria permite aplicar las leyes de probabilidad sobre la muestra misma y, por
ende, que ésta sea representativa de la poblaci#n
%s tentador pensar que podemos lograr la representatividad de una muestra utilizando
métodos distintos al del muestreo aleatorio Sin embargo, con mucha frecuencia el
procedimiento utilizado produce una muestra sesgada 2no representativa3 !n e)emplo de esto es
la famosa encuesta presidencial del Literary ,igest de BPAM, la cual predi)o una victoria aplastante
de Landon 2EO a CAc3 ,e hecho, 'oosevelt gan# con MDc de los votos La predicci#n del Literary
,igest result# ser un error garrafal ¿+or qué? !n análisis posterior revel# que el error se debi# a
que la muestra no era representativa de la poblaci#n votante, sino que era una muestra sesgada
Los individuos fueron elegidos de fuentes tales como el directorio telef#nico, registros de clubes
y listas de propietarios de autom#viles %sos registros e"cluyeron de manera sistemática a
las personas pobres, quienes tal vez no tenían teléfonos ni autom#viles > ocurri# que los pobres
votaron en forma aplastante a favor de 'oosevelt .unque otros métodos de muestreo pudieran proI
ducir una muestra representativa éstos no serían *tiles para la inferencia, pues no podríamos
aplicar las leyes de la probabilidad necesarias para generalizar de la muestra a toda la poblaci#n
Técnicas -a$a el m#est$eo aleato$io
!n estudio profundo de las formas con las cuales se generan las muestras aleatorias está
más allá del ob)etivo de este libro %ste tema puede ser comple)o, en particular al traba)ar con
M#est$eo !leato$io y *$o+a+ilidad - 5; -
encuestas Sin embargo, presentaremos algunas técnicas de uso com*n, )unto con varias
situaciones sencillas, de manera que usted pueda darse una idea de lo que esto implica Suponga
que tenemos una poblaci#n de BFF personas y queremos obtener una muestra aleatoria de DF
personas para un e"perimento !na forma de hacer esto sería enumerar a los individuos de la
poblaci#n del B al BFF, luego tomar BFF pedazos de papel y numerarlos, colocar los papeles en
un sombrero para revolverlos y después elegir uno Jolveríamos entonces a mezclar los papelitos
para elegir otro Luego, continuaríamos este proceso hasta haber elegido DF pedazos de papel
Los n*meros escritos en los pedazos de papel identificarían a los individuos que compondrían la
muestra %n este método de muestreo aleatorio, es crucial que la poblaci#n 2los trozos de papel3
esté bien; revuelta; para garantizar la aleatoriedad
!n procedimiento com*n para producir muestras aleatorias consiste en utilizar una tabla de
n*meros aleatorios, como la que hemos incluido en la tabla 5 del apéndice , %ste tipo de
tablas se hace, por lo regular, mediante un programa de computadora, el cual garantiza que
todos los dígitos 2FIP3 tengan la misma posibilidad de ser elegidos cada vez que se imprima un
dígito
La tabla se puede emplear como una sucesi#n de dígitos simples consecutivos, n*meros de
dos dígitos, n*meros de tres dígitos, etc +or e)emplo, en la tabla 5, página ECM, si comenzamos en
el primer rengl#n y nos movemos en direcci#n horizontal por la página, el orden aleatorio de los
dígitos simples sería A D, P, C, D, Si quisiéramos utilizar n*meros de dos dígitos, entonces el
orden aleatorio sería AD, PC, DP, EC, BM,
(omo los dígitos de la tabla son aleatorios, se pueden utilizar vertical u horizontal mente en
ambas direcciones La direcci#n que se va a usar debe especificarse antes de emplear la tabla/
para mane)arla de manera adecuada, hay que comenzar en forma aleatoria !na posibilidad de
lograr esto es hacer tar)etas con n*meros de rengl#n y de columna, colocarlas en una ca)a,
revolverlas y luego elegir un n*mero para el rengl#n y otro para la columna La intersecci#n del
rengl#n y la columna sería la posici#n del primer n*mero aleatorio Los demás n*meros serían
localizados al desplazarse desde el primer n*mero, en la direcci#n convenida antes de entrar a la
tabla +or e)emplo, suponga que queremos formar una muestra aleatoria de A su)etos de una
poblaci#n de BF su)etos +ara este e)emplo hemos decidido movernos sobre la tabla en direcci#n
horizontal, a la derecha +ara elegir la muestra, primero asignamos a cada individuo de la
poblaci#n un n*mero del F al P Luego entramos en la tabla de manera aleatoria para localizar
el primer n*mero Suponga que el dato es el primer n*mero del séptimo rengl#n, que es igual a
A %ste n*mero designa al primer su)eto de la muestra (omo hemos decidido movernos sobre la
tabla hacia la derecha, los dos n*meros siguientes son E y M ,e esta manera, los individuos que
portan los n*meros E y M completarían la muestra
'esolvamos ahora un problema en el cual la poblaci#n tiene más individuos (on
prop#sitos ilustrativos, supondremos que se desea e"traer un muestra aleatoria de BE su)etos, de
una poblaci#n de BFF +ara variar las cosas un poco, para este e)ercicio deci dimos
desplazarnos verticalmente sobre la tabla, hacia aba)o, en lugar de hacerlo en direcci#n
horizontal, hacia la derecha (omo antes, necesitamos asignar una cifra a cada miembro de la
poblaci#n %sta vez, los n*meros asignados serán del FF al PP en vez de F a P ,e nuevo, entramos
a la tabla de manera aleatoria %sta vez suponemos que el primer dato o primer n*mero de dos
dígitos aparece en la intersecci#n de la columna A con el rengl#n BD %l guarismo de dos dígitos
localizado en esa intersecci#n es OF +or lo tanto, el primer su)eto de la muestra es el individuo a
quien le corresponde el n*mero OF +ara localizar al siguiente su)eto de la muestra, ba)amos
verticalmente en la tabla a partir del OF .sí, el segundo su)eto de la muestra sería el individuo
que tiene el n*mero AA (ontinuaríamos este procedimiento hasta que hayamos seleccionado BE
su)etos %l con)unto completo de n*meros que representan a los su)etos de la muestra sería- OF,
AA, GD, DD, PM, AE,BC,BD,BA, EP, PO, AO, EC, CD y GP .l obtener este con)unto de n*meros, el GD apaI
reci# dos veces en la tabla (omo el mismo individuo no puede estar en la muestra más de una
M#est$eo !leato$io y *$o+a+ilidad - 5= -
vez, no incluimos el n*mero repetido
M#est$eo con o sin $eem-laEo
4asta ahora hemos definido una muestra aleatoria, analizamos la importancia del muestreo
aleatorio y presentamos algunas técnicas para producir muestras aleatorias +ara completar
nuestro estudio, debemos distinguir entre el ;muestreo con reemplazoLL y el ;muestreo sin
reemplazo; +ara ilustrar la diferencia entre estos dos métodos de muestreo, suponga que
queremos formar una muestra de dos datos provenientes de una poblaci#n compuesta por los
n*meros C, E, G y BF !na manera de hacer esto consistiría en e"traer un dato de la poblaci#n,
registrar su valor, y reintegrarlo a la poblaci#n antes de e"traer el segundo elemento .sí, el
primer dato podría ser elegido de nuevo en la segunda e"tracci#n %ste método se llama
muestreo con reemplazo !na segunda alternativa consistiría en e"traer al azar un dato de la
poblaci#n y no reemplazarlo antes de seleccionar el segundo ,e esta manera, cualquier n*mero
proveniente de la poblaci#n podría aparecer en la muestra solamente una vez . este método se
le llama muestreo sin reemplazo
l m#est$eo con $eem-laEo se define como #n método en el c#al cada miem+$o
de la -o+laci&n eleFida -a$a la m#est$a se $einteF$a a la -o+laci&n antes de
selecciona$ al siF#iente miem+$o4
l m#est$eo sin $eem-laEo se define como #n método en el c#al los miem+$os
de la m#est$a no son $einteF$ados a la -o+laci&n antes de selecciona$ a los
miem+$os s#+sec#entes4
*RO?!?ILID!D
La probabilidad se puede estudiar desde dos puntos de vista- B3 a priori o clásico y D3 a
posteriori o empírico . priori significa aquello que se puede deducir usando s#lo la raz#n, sin
recurrir a la e"periencia ,esde el punto de vista a priori o clásico, la probabilidad se define
como-
%l símbolo p2.3 se lee como ;la probabilidad de ocurrencia del evento .; .sí, la ecuaci#n
establece que la probabilidad de ocurrencia del evento . es igual al n*mero de eventos
clasificables como . dividida entre el n*mero de eventos posibles +ara ilustrar el uso de esta
ecuaci#n, veamos un e)emplo relacionado con unos dados La figura GB muestra una
ilustraci#n con un par de dados (ada dado tiene seis caras y ostenta un n*mero distinto de
puntos en cada cara Los puntos varían de uno a seis %stos cubos de apariencia inocente se
utilizan para )uegos de azar/ son la base de muchas desgracias y alegrías, seg*n la dsuerteS del
)ugador
'egresando a la probabilidad a priori, suponga que vamos a arro)ar un dado una vez
¿(uál es la probabilidad de que el dado se detenga con un D 2el lado que tiene dos puntos3 hacia
arriba? (omo e"isten seis n*meros posibles y s#lo uno de ellos es un D, la probabilidad de que
salga un D en una tirada de un dado es-
M#est$eo !leato$io y *$o+a+ilidad - 9@ -
0ratemos de resolver otro problema mediante el punto de vista a priori ¿(uál es la
probabilidad de obtener un n*mero mayor que C en una tirada de un dado? .hora e"isten dos
eventos clasificables como . 2obtener un E o un M3 .sí,

7bserve que logramos resolver los dos problemas anteriores por medio de un razonamiento
sin recurrir a ninguna colecci#n de datos ,ebemos comparar este punto de vista con el enfoque a
posteriori o empírico de la probabilidad . posteri ori significa ;después del hecho;, en el
conte"to de la probabilidad, significa después de haber reunido algunos datos ,esde el punto de
vista a posteriori o empírico, la probabilidad se define como-

+ara determinar la probabilidad de obtener un D al tirar un dado, desde el punto de vista
empírico, tendríamos que considerar el dado real, arro)arlo en muchas ocasiones y contar el
n*mero de veces que se presenta un D 9ientras más veces arro)emos el dado, tanto me)or será
+ara este problema, suponga que lanzamos el dado BFF FFF veces y que el D apareci# en BM FFF
ocasiones La probabilidad de que ocurra un D en un lanzamiento del dado se determina
mediante-

7bserve que, desde este punto de vista, antes de determinar la probabilidad es necesario
tener el dado real y reunir algunos datos %l punto interesante es que si el dado no está cargado
2entonces se dice que es un dado honesto3, al lanzarlo muchas veces la probabilidad a posteriori
se acerca a la probabilidad a priori Si arro)amos el dado una infinidad de veces, las dos
probabilidades serán iguales 7bserve también que si el dado está cargado 2con una distribuci#n
de peso por la cual uno de los lados quede arriba con mayor frecuencia que los demás3, la
probabilidad a posteriori será diferente que la probabilidad a priori +or e)emplo, si el dado
está ;cargado; para que aparezca un MFBD nunca aparecerá +odemos ver ahora que la ecuaci#n
a priori supone que todos los resultados posibles tienen la misma probabilidad de ocurrir +ara
la mayor parte de los problemas de este capítulo y el siguiente aplicaremos el punto de vista a
priori
!lF#nos as-ectos +.sicos $elati3os a los 3alo$es de -$o+a+ilidad
+uesto que la probabilidad es esencialmente una proporci#n su valor fluct*a entre FFF y
BFF Si la probabilidad de que ocurra un evento es igual a BFF entonces es seguro que tal evento
ocurrirá Si la probabilidad es igual a FFF, entonces es seguro que el evento no ocurrirá +or
e)emplo, un dado com*n no tiene O puntos en ninguno de sus lados +or lo tanto, la probabilidad
de obtener un O al arro)ar un dado es igual a FFF %s seguro que no ocurrirá que salga un O +or
otra parte, la probabilidad de que salga un n*mero del B al M es igual a BFF %s seguro que se
obtendrá alguno de los n*meros B, D, A, C, E o M
La probabilidad de ocurrencia de un evento se e"presa como una fracci#n o un n*mero
M#est$eo !leato$io y *$o+a+ilidad - 91 -
decimal +or e)emplo, la probabilidad de elegir al azar el as de espadas en una bara)a com*n es ED
o bien FFBPD\ La respuesta se puede quedar como una fracci#n 2BNED3, pero generalmente se
convierte a su equivalente decimal 2FFBPD3
.lgunas veces, la probabilidad se e"presa como ;posibilidades con respecto a BFF; +or
e)emplo, alguien podría comentar que la probabilidad de que ocurra el evento . es de E
posibilidades en BFF Lo que esta persona quiere decir es que p2.3 R FFE %n ciertas ocasiones, la
probabilidad se e"presa también como las posibilidades a favor o en contra de que ocurra un
evento +or e)emplo, un apostador podría decir que las posibilidades de que =red gane la carrera
son de A a B a su favor %n términos de probabilidades, p2que gane =red3 ANC R FOE Si las
posibilidades fuesen de A a B en contra de que =red triunfe, entonces p2que gane =red3 RBNC R
FDE
C.lc#lo de -$o+a+ilidades
La determinaci#n de la probabilidad de los eventos puede ser comple)a ,e hecho, e"isten
cursos completos dedicados a este tema y son bastante difíciles +or fortuna, para nuestros
prop#sitos s#lo hay que aprender dos reglas fundamentales de la probabilidad- la de la suma y la
del producto %stas reglas proporcionarán las bases necesarias para comprender las pruebas
de inferencia estadística que veremos más adelante en este libro de te"to
(a re&la de la suma
La regla de la suma sirve para determinar la probabilidad de que ocurra alguno de varios
eventos posibles +ara comenzar nuestro análisis, supongamos que s#lo e"isten dos eventos
posibles- . y ? (uando e"isten dos eventos, la regla de la suma establece lo siguiente-
La -$o+a+ilidad de oc#$$encia de ! o ? es iF#al a la -$o+a+ilidad de K#e oc#$$a
. más la probabilidad de que ocurra ? menos la probabilidad de que ocurran
ambos, . y ?
%n forma de ecuaci#n, la regla de la suma establece que-
ec#aci&n Fene$al de la $eFla
- 1! o ?2 M - 1!2 N - 1?2 - - 1! y ?2 de la s#ma -a$a dos e3entos
Jamos a ilustrar la forma en que se utiliza esta regla Suponga que queremos determinar la
probabilidad de sacar un as o un trébol de una bara)a de cartas ordinarias %l problema ha
sido resuelto de dos maneras en la figura GD +or favor, consulte la figura al leer este párrafo %n
la primera de esas maneras, enumeramos todos los eventos que pueden ser clasificados como un
as o un trébol y utilizamos la ecuaci#n básica para la probabilidad %"isten BM formas de obtener
un as o un trébol, por lo cual la probabilidad de sacar un as o un trébol es R BMNED R FAFOO %l
segundo método emplea la regla de la suma La probabilidad de obtener un as es CNED y la
probabilidad de sacar un trébol a la vez es R BANED La probabilidad de logar un as y un
trébol es igual a R BNED Seg*n la regla de la suma, la probabilidad de conseguir un as o un
trébol es R CNED Y BANED o BNED R BMNED R FAFOO ¿+or qué tenemos que restar la probabilidad
de obtener un as y un trébol a la vez? +orque hemos contado el as de tréboles dos veces Si no lo
restáramos, pensaríamos de manera err#nea que e"isten BO eventos favorables siendo que s#lo
e"isten BM
%n este curso emplearemos la regla de la suma en casi todas las situaciones en las que
los eventos sean mutuamente e"cluyentes
Dos e3entos son m#t#amente e8cl#yentes si no -#eden oc#$$i$ al mismo
M#est$eo !leato$io y *$o+a+ilidad - 9% -
tiem-o4 Ot$a mane$a de deci$ esto es K#e dos e3entos son m#t#amente
e8cl#yentes si la oc#$$encia de #no im-ide la oc#$$encia del ot$o4
Los eventos de obtener un B y un D al lanzar un dado son mutuamente e"cluyentes Si el
lanzamiento termina con un B, entonces no puede haber terminado también con un D Los
eventos de e"traer a la vez un as y un rey al sacar una sola carta de un mazo de bara)as
ordinarias son mutuamente e"cluyentes Si la carta es un as, eso impide que la misma sea
también un rey %sto se puede contrastar con los eventos de e"traer a la vez un as y un trébol
al sacar una sola carta del mazo %stos dos eventos no son mutuamente e"cluyentes en virtud de
que hay una carta que es simultáneamente un as y un trébol 2el as de tréboles3
(uando los eventos son mutuamente e"cluyentes, la probabilidad de que ambos eventos
ocurran al mismo tiempo es igual a cero .sí, p 2. y ?3 R F cuando . y ? son mutuamente
e"cluyentes %n estas condiciones, la regla de la suma se simplifica así-
+ractiquemos ahora resolviendo algunos problemas que incluyen situaciones en las que . y
? son mutuamente e"cluyentes

M#est$eo !leato$io y *$o+a+ilidad - 9' -
¿(uál es la probabilidad de elegir al azar un BF o un C al e"traer una carta de una bara)a
ordinaria?
S7L!(Hr8
La soluci#n se ilustra en la figura siguiente (omo deseamos sacar un BF o un C y estos
dos eventos son mutuamente e"cluyentes, la regla de la suma con eventos mutuamente
e"cluyentes resulta apropiada .sí, p2BF o C3 Rp2BF3 Y p2C3
+uesto que hay cuatro BF, cuatro C y ED cartas, entonces p 2BF3 R CNED y p2C3 R CNED +or
consiguiente, p2BF o C3 R CNED R CNED R GNED R FBEAG

.l lanzar una vez un dado que no está cargado, ¿cuál es la probabilidad de obtener un B o
un n*mero par?
S7L!(Hr8
La soluci#n aparece en la figura acompa&ante (omo los eventos son mutuamente
e"cluyentes y el problema pide obtener un B o un n*mero par, podemos aplicar la regla de la
suma para este tipo de eventos .sí, p2B o un n*mero par3 R p2B3 Y p2un n*mero par3 %"iste
una forma de conseguir un B, tres formas de lograr un n*mero par 2D, C, M3 y seis resultados
posibles .sí, p2B3 RBNM, p2un n*mero par3 R ANM y p2B o un n*mero par3 RBNM Y ANM R CNM R
FMMMO

Suponga que va a elegir de manera aleatoria un individuo entre una poblaci#n de BAF
personas %n esa poblaci#n hay CF ni&os menores de BD a&os, MF adolescentes y AF adultos
¿(uál es la probabilidad de que el individuo elegido sea un adolescente o un adulto?
M#est$eo !leato$io y *$o+a+ilidad - 9( -
SOLUCIÓN
La soluci#n aparece en la figura acompa&ante (omo los eventos son mutuamente
e"cluyentes y queremos obtener un adolescente o un adulto, podemos emplear la regla de la
suma correspondiente .sí, p 2adolescente o adulto3 R p2adolescente3 Y p2adulto3 (omo hay MF
adolescentes, AF adultos y BAF personas en la poblaci#n, p2adolescente3 R MFNBAF y p2adulto3
R AFNBAF +or lo tanto, p2adolescente o adulto3 R MFNBAF Y AFNBAF R PFNBAF R FMPDA

La regla de la suma también se puede utilizar en situaciones donde hay más de dos eventos/
s#lo hacemos una sencilla e"tensi#n de la ecuaci#n empleada para esta situaci#n .sí, cuando
e"isten más de dos eventos y todos son mutuamente e"cluyentes, la probabilidad de que ocurra
cualquiera de ellos es igual a la suma de las probabilidades de cada evento . continuaci#n
mostramos la ecuaci#n-
p2.o ?o (ool3Rp2.3Yp2?3Yp2(3YYp2l3
$eFla de la s#ma -a$a m.s de dos e3entos
m#t#amente e8cl#yentes
donde l R es el *ltimo evento
(on mucha frecuencia encontraremos situaciones en las cuales los eventos no s#lo son
mutuamente e"cluyentes, sino también e"haustivos >a hemos definido a los dos primeros, nos
faltan los e"haustivos
!n con)unto de eventos es e8Ha#sti3o si incluye a todos los eventos posibles
+or e)emplo, al lanzar un dado una sola vez, el con)unto de eventos que consisten en obtener
B, D, A, C, E o M es e"haustivo, pues el con)unto incluye a todos los eventos posibles (uando un
con)unto de eventos es e"haustivo y mutuamente e"cluyente, e"iste una relaci#n muy *til %n
estas condiciones, la suma de las probabilidades individuales de cada evento del con)unto debe
ser igual a B .sí,
+ara ilustrar esta relaci#n, consideremos el con)unto de eventos que consisten en obtener B,
D, A, C, E o M al lanzar una sola vez un dado no cargado (omo los eventos son e"haustivos y
M#est$eo !leato$io y *$o+a+ilidad - 9/ -
mutuamente e"cluyentes, la suma de sus probabilidades debe ser igual a B
+odemos ver que esto es cierto, pues p2B3 R BNM, p2D3 R BNM, p2A3 R BNM, p2C3 R BNM, p 2E3 R BNM y
p 2M3 R BNM .sí,
I (uando s#lo e"isten dos eventos y éstos son mutuamente e"cluyentes, se acostumbra
asignar el símbolo + a la probabilidad de que ocurra uno de los eventos y $ a la probabilidad de
que ocurra el otro evento +or e)emplo, si estamos lanzando una moneda, ésta s#lo puede caer
de cara o de cruz y se presentará una situaci#n en la que s#lo hay dos eventos posibles 2cara o
cruz3 en cada lanzamiento, y éstos son mutuamente e"cluyentes 2si es cara, no puede ser cruz y
viceversa3 Se acostumbra asignar + a la probabilidad de ocurrencia de uno de los eventos,
digamos cara, y $ a la probabilidad de ocurrencia del otro evento, cruz %n este caso, si la
moneda no está cargada, entonces, + R BND y $ R BND (omo los eventos son e"haustivos y
mutuamente e"cluyentes, sus probabilidades deben ser iguales a B +or consiguiente,
+ Y $ R BFF c#ando dos e3entos son e8Ha#sti3os y m#t#amente
e8cl#yentes
La $eFla del -$od#cto
.sí como la regla de la suma proporciona la probabilidad de que ocurra cualquiera de
varios eventos, la regla del producto analiza la ocurrencia con)unta o sucesiva de varios eventos
7bserve que la regla del producto analiza con frecuencia lo que ocurre en más de un lanzamiento
o e"tracci#n, mientras que la regla de la suma estudia s#lo uno de dichos lanzamientos o
e"tracciones Si nos interesa la ocurrencia con)unta o sucesiva de dos eventos . y ?, la regla del
producto establece lo siguiente-
La -$o+a+ilidad de oc#$$encia de ! y ? es iF#al a la -$o+a+ilidad de
oc#$$encia de ! -o$ la -$o+a+ilidad de oc#$$encia de ?0 dado K#e !
Ha oc#$$ido4
%n forma de ecuaci#n, la regla del producto es
7bserve que el símbolo p 2?s.3 se lee como ;la probabilidad de que ocurra ? dado que . ha
ocurrido; %sto no significa ? dividido entre . 7bserve también que la regla del producto se
refiere a la ocurrencia de . y ?, mientras que la regla de la suma se aplica a la ocurrencia de .
o ?

.l analizar la regla del producto, es *til distinguir tres condiciones- cuando los eventos son
mutuamente e"cluyentes, cuando los eventos son independientes y cuando los eventos son
dependientes
ReFla del -$od#ctoB e3entos m#t#amente e8cl#yentes4 >a hemos analizado la ocuI
rrencia con)unta de . y ? cuando . y ? son mutuamente e"cluyentes 'ecordará que si . y ?
son mutuamente e"cluyentes, ya que cuando los eventos son mutuamente e"cluyentes, la
ocurrencia de uno impide la ocurrencia del otro La probabilidad de su ocurrencia con)unta es
cero
M#est$eo !leato$io y *$o+a+ilidad - 95 -
p 2. y ?3 R @ $eFla del -$od#cto -a$a e3entos m#t#amente e8cl#yentes
ReFla del -$od#ctoB e3entos inde-endientes +ara comprenderla forma apropiada de aplicar
la regla del producto en esta situaci#n, tenemos que definir primero qué son los eventos
independientes
Dos e3entos son inde-endientes si la oc#$$encia de #n e3ento no tiene
efecto alF#no so+$e la -$o+a+ilidad de oc#$$encia del ot$o4
%l muestreo con reemplazo ilustra muy bien esta situaci#n +or e)emplo, suponga que
vamos a e"traer con reemplazo dos cartas, una a la vez, de una bara)a ordinaria Llamaremos .
la carta e"traída primero y ? a la carta obtenida en segundo lugar %n vista de que . es
reintegrada al mazo de cartas antes de e"traer ?, la ocurrencia de . en la primera e"tracci#n
no tiene efecto alguno sobre la probabilidad de ocurrencia de ? +or e)emplo, si . fue un as, por
el hecho de que fue reintegrado a la bara)a antes de e"traer la segunda carta, la ocurrencia de un
as en la primera e"tracci#n no tiene efecto alguno sobre la probabilidad de la ocurrencia de la
carta elegida en la segunda e"tracci#n Si . y ? son independientes, entonces la probabilidad de
? no resulta afectada por . +or lo tanto, p 2? s.3 R p 2?3 %n este tipo de situaciones, la regla
del producto se convierte en
Jeamos c#mo se emplea esta ecuaci#n Suponga que vamos a e"traer al azar dos cartas con
reemplazo, una a la vez, de una bara)a ordinaria ¿(uál es la probabilidad de que ambas cartas
sean ases?
La soluci#n se ilustra en la figura GA (omo quiera que el problema requiere la presencia de
un as en la primera y la segunda e"tracciones, resulta apropiado aplicar la regla del producto
Supongamos que . es un as en la primera e"tracci#n y ? es un as en la segunda (omo el
muestreo es con reemplazo, . y ? son independientes .sí, p2un as en la primera e"tracci#n y un
as en la segunda e"tracci#n3 R p2un as en la primera e"tracci#n3, p2un as en la segunda
e"tracci#n3 +uesto que e"isten cuatro ases posibles en la primera e"tracci#n, cuatro ases
posibles en la segunda e"tracci#n 2el muestreo se realiza con reemplazo3 y hay ED cartas en la
bara)a, entonces p2un as en la primera e"tracci#n3 R CNED y

p2un as en la segunda e"tracci#n3
R CNED +or consiguiente, p2un as en la primera e"tracci#n y un as en la segunda e"tracci#n3 R
CNED\ CNED R BMNDOFC R FFFEP
Jeamos algunos problemas en plan de práctica
M#est$eo !leato$io y *$o+a+ilidad - 99 -

Suponga que lanzamos una sola vez un par de dados no cargados ¿(uál es la probabilidad
de obtener un D en el primer dado y un C en el segundo?
SOLUCIÓN
La soluci#n aparece en la figura acompa&ante (omo quiera que los dados son independientes
entre sí y en vista de que el problema requiere un D y un C, podemos aplicar la regla del producto
para eventos independientes .sí, p 2un D en el primer dado y un C en el segundo3 R p2un D en el
dado B3 p2un C en el dado D3 %"iste una forma de obtener un D en el primer dado, una de conseguir
un C en el segundo dado y seis resultados posibles para cada dado +or lo tanto, p2un D en el
primer dado3 R BNM, p2un C en el dado D3 RBNM, y p2un D en el dado B y un C en el dado D3 R
BNM2BNM3 R BNAM F FFDOG

Si se lanzan dos monedas una sola vez, ¿cuál es la probabilidad de que ambas cai gan con
la cara hacia arriba? Suponga que las monedas no están cargadas y que una cara o una cruz
es el *nico resultado posible para cada moneda
M#est$eo !leato$io y *$o+a+ilidad - 9; -
SOLUCIÓN
La soluci#n aparece en la figura acompa&ante (omo el resultado para la primera moneda no
tiene efecto alguno sobre el resultado de la segunda, los eventos son independientes %n vista de
que en el problema se requiere una cara con la primera moneda y una cara con la segunda
moneda, podemos aplicar la regla del producto con eventos independientes .sí, p2una cara en la
primera moneda y una cara en la segunda moneda3 R p2una cara en la primera moneda3 p2una
cara en la segunda moneda3 (omo s#lo e"iste una forma de obtener una cara con cada moneda y
hay dos posibilidades en cada moneda 2cara o cruz3, p2una cara en la primera moneda3 R BND y
p2una cara en la segunda moneda3 R BND +or lo tanto, p2una cara en la primera moneda y una
cara en la segunda moneda3 R BND2BND3 R BNCR FDEFF
Suponga que usted e"trae una muestra aleatoria de una bolsa de frutas La bolsa contiene
cuatro manzanas, seis naran)as y cinco duraznos Si selecciona dos frutas, una a la vez, con
reemplazo, ¿cuál es la probabilidad de que obtenga una naran)a y una manzana, en ese orden?
SOLUCIÓN
La soluci#n aparece en la figura acompa&ante (omo las e"tracciones son independientes
entre sí 2el muestreo es con reemplazo3 y como queremos obtener una naran)a y una manzana,
aplicamos la regla del producto con eventos independientes .sí, p 2una naran)a en la primera
e"tracci#n y una manzana en la segunda e"tracci#n3 R p2una naran)a en la primera e"tracci#n3
p2una manzana en la segunda e"tracci#n3 (omo e"isten M naran)as y BE frutas en la bolsa,
p2una naran)a en la primera e"tracci#n3 R MNBE +uesto que la fruta obtenida en la primera
selecci#n se reemplaza antes de e"traer la segunda, no tiene efecto alguno sobre la fruta elegida
en la segunda e"tracci#n (omo hay C manzanas y BE frutas, p2una manzana en la segunda
e"tracci#n3 CNBE +or lo tanto p2una naran)a en la primera e"tracci#n y una manzana en la
segunda e"tracci#n3 R MNBE2CNBE3 R FBFMO
M#est$eo !leato$io y *$o+a+ilidad - 9= -

Suponga que usted e"trae al azar D individuos de una poblaci#n de BBF hombres y mu)eres
4ay EF varones y MF mu)eres en esa poblaci#n %l muestreo es de un individuo a la vez, con
reemplazo ¿(uál es la probabilidad de que la muestra contenga s#lo mu)eres?
SOLUCIÓN
La soluci#n aparece en la figura acompa&ante (omo el problema requiere una mu)er en
la primera e"tracci#n y una mu)er en la segunda e"tracci#n, y como estos dos eventos son
independientes 2el muestreo es con reemplazo3, aplicamos la regla del producto con eventos
independientes .sí, puna mu)er en la primera e"tracci#n y una mu)er en la segunda
e"tracci#n3 R p2una mu)er en la primera e"tracci#n3 p2una mu)er en la segunda e"tracci#n3
(omo hay MF mu)eres y BBF personas en la poblaci#n, p2una mu)er en la primera e"tracci#n3 R
MFNBBF , y p2una mu)er en la segunda e"tracci#n3 R MFNBBF +or lo tanto, p2una mu)er en la
primera e"tracci#n y una mu)er en la segunda e"tracci#n3 R i
MFNBBF 2MFNBBF3 R AMFFNBDBFF R FDPOE
M#est$eo !leato$io y *$o+a+ilidad - ;@ -
La regla del producto para eventos independientes también se aplica en situaciones con más
de dos eventos %n tales casos, la probabilidad de la ocurrencia con)unta de los eventos es igual al
producto de las probabilidades individuales de cada evento %n forma de ecuaci#n-
+ara mostrar el uso de esta ecuaci#n, suponga que en vez de obtener una muestra de D
individuos pertenecientes a la poblaci#n descrita en el problema de práctica GO, se e"trae una
muestra de C personas Salvo esta *ltima condici#n, el problema es el mismo La poblaci#n está
compuesta por EF hombres y MF mu)eres (omo antes, el muestreo es de una persona a la vez, con
reemplazo ¿(uál es la probabilidad de obtener A mu)eres y B hombre, en ese mismo orden? La
soluci#n aparece en la figura GC (omo el problema requiere una mu)er en la primera y segunda y
tercera e"tracciones, y un hombre en la cuarta e"tracci#n, y como el muestreo es con reemplazo,
aplicamos la regla del producto para más de dos eventos independientes %sta regla es similar a la
del producto para dos eventos independientes, s#lo que tiene más factores .sí, p2una mu)er en la
primera e"tracci#n y una mu)er en la segunda e"tracci#n, una mu)er en la tercera e"tracci#n y
un hombre en la cuarta e"tracci#n3 R p2una mu)er en la primera e"tracci#n3 p2una mu)er en la
segunda e"tracci#n3 p2una mu)er en la tercera e"tracci#n3p2un hombre en la cuarta e"tracci#n3
4ay MF mu)eres, EF hombres y BBF personas en la poblaci#n (omo el muestreo es con reemplazo,
p2una mu)er en la primera e"tracci#n3 R MFNBBF , p2una mu)er en la segunda e"tracci#n3 R
MFNBBF p2una mu)er en la tercera e"tracci#n3 R MFNBBF , y p2un hombre en la cuarta
e"tracci#n3 R EFNBBF as_, p2 una mu)er en la primara e"tracci#n y una mu)er en la segunda
e"tracci#n y una mu)er en la tercera e"tracci#n y un hombre en la cuarte e"tracci#n3 R MFNBBF \
MFNBBF \ MFNBBF\ EFNBBF R BFGFNBCMCB R FFOAG
ReFla del -$od#ctoB 3entos De-endientes cuando . y ? son dependientes, la
probabilidad de que ocurra ? resulta afectada por la ocurrencia de . %n este caso, no podemos
simplificar la ecuaci#n para probabilidad de . y ? 0enemos que utilizarla en su forma original
+or consiguiente, si . y b son dependientes,
+2. y ?3 R p2.3p2?s.3 $eFla del -$od#cto de e3entos de-endientes
%l muestreo sin reemplazo proporciona una buena ilustraci#n de los eventos dependientes
M#est$eo !leato$io y *$o+a+ilidad - ;1 -
Supongamos que usted va a e"traer dos cartas, una a la vez, sin reemplazo, de un mazo de
bara)as ordinarias ¿(uál es la probabilidad de que ambas cartas sean ases?
La soluci#n se presenta en la figura GE (onvengamos en que . representa un as en la
primera e"tracci#n y 8 representa un as en la segunda e"tracci#n (omo el muestreo se realiza
sin reemplazo 2la carta obtenida en la primera e"tracci#n es retirada de la bara)a3, la ocurrencia de
A realmente afecta la probabilidad de 8. A y 8 son dependientes entre sí (omo el problema
requiere un as en la primera e"tracci#n y un as en la segunda, y como estos eventos son
dependientes, aplicamos la regla del producto para eventos dependientes .sí, p2un as en la
primera e"tracci#n y un as en la segunda e"tracci#n3 R p2un as en la primera e"tracci#n3p2un as
en la segunda e"tracci#n, en virtud de que se obtuvo un as en la primera e"tracci#n3 +ara la
primera e"tracci#n, hay C ases y ED cartas +or lo tanto, p2un as en la primera e"tracci#n3 RCNED
%n virtud de que el muestreo se realiza sin reemplazo,p2un as en la segunda e"tracci#n después
de haber obtenido un as en la primera e"tracci#n3 RANEB .sí, pues, p2un as en la primera
e"tracci#n y un as en la segunda e"tracci#n3 R CNED2ANEB3 R BDNDMED R FFFCE
Suponga que e"trae al azar dos frutas, una a la vez, de la misma bolsa descrita en el
problema de práctica GM (omo antes, dicha bolsa contiene cuatro manzanas, seis naran)as y cinco
duraznos Sin embargo, esta vez obtendrá la muestra sin reemplazo ¿(uál es la probabilidad de
obtener una naran)a y una manzana, en ese orden?
SOLUCIÓN
La soluci#n aparece en la figura acompa&ante (omo el problema requiere una naran)a y
una manzana, y como el muestreo se realiza sin reemplazo, aplicamos la regla del producto para
eventos dependientes .s_, p2una naran)a en la primera e"tracci#n y una manzana en la segunda
e"tracci#n3 R p2una naran)a en la primera e"tracci#n3p2una manzana en la segunda e"tracci#n
después de haber obtenido una naran)a en la primera e"tracci#n3 %n la primera e"tracci#n hay
M#est$eo !leato$io y *$o+a+ilidad - ;% -
M naran)as y BE frutas +or lo tanto, p2una naran)a en la primera e"tracci#n3 R MNBE %n virtud
de que el muestreo se realiza sin reemplazo,p2una manzana en la segunda e"tracci#n después
de haber obtenido una naran)a en la primera e"tracci#n3 R CNBC +or lo tanto, p2una naran)a en
la primera e"tracci#n y una manzana en la segunda e"tracci#n3 R MNBE 2CNBC3 R DCNDBF R FBBCA
0al como ocurre con la regla del producto para eventos independientes, la regla del producto
para eventos dependientes se aplica también a situaciones en las que intervienen más de dos
eventos %n esos casos, la ecuaci#n adopta la forma siguiente-

*$o+a+ilidad y 3a$ia+les contin#as con dist$i+#ci&n no$mal
4asta este punto, en nuestro análisis de la probabilidad hemos considerado variables discretas,
por e)emplo, el muestreo a partir de una bara)a de cartas o el lanzamiento de un par de dados
Sin embargo muchas de las variables dependientes que es necesario evaluar en los e"perimentos
son continuas, no discretas (uando una variable es continua
%n virtud de que con frecuencia 2aunque no siempre3 estas variables están distribuidas de
manera normal, concentraremos nuestro análisis en las variables continuas con distribuci#n
normal
+ara ilustrar el uso de la probabilidad con variables continuas que tienen una distribuci#n
normal, suponga que hemos determinado los pesos de todas las mu)eres inscritas en el cuarto
semestre de la universidad en la que usted estudia Hmaginemos que se trata de un con)unto de
datos pertenecientes a una poblaci#n cuya distribuci#n es normal, con una media de BDF libras y
una desviaci#n estándar de G libras Si elegimos al azar un dato de esta poblaci#n, ¿cuál es la
probabilidad de que el dato seleccionado sea igual o mayor que BAC?
La poblaci#n se muestra en la figura GG La media de BDF y el dato BAC se localizan sobre el e)e
1 %l área sombreada representa a todos los datos mayores o iguales a BAC (omo el muestreo es
aleatorio, todos los datos tienen la misma posibilidad de ser seleccionados .sí, la probabilidad de
obtener un dato igual o mayor que BAC se determina calculando la proporci#n del total de datos
contenidos en el área sombreada +uesto que los datos están distribuidos de forma normal,
podemos determinar esta proporci#n convirtiendo el dato en bruto en su valor z transformado,
para luego buscar el área en la tabla . del apéndice , .sí, pues,

M#est$eo !leato$io y *$o+a+ilidad - ;' -
,e la columna ( de la tabla .,
%stamos seguros de que el lector reconocerá que este tipo de problema es similar a los que
presentamos en el capítulo E, cuando estudiamos los punta)es estandarizados La diferencia
principal es que, en este capítulo, el problema se formula en términos de probabilidad y no en
términos de la proporci#n o el porcenta)e de los datos, como fue planteado en el capítulo E (omo
quiera que el lector ya se ha familiarizado con problemas de esta índole, no creemos que sea
necesario presentar muchos problemas de práctica Sin embargo, solucionaremos un par de ellos
s#lo para estar seguros (onsideremos la misma poblaci#n de mu)eres universitarias que
estudian el cuarto semestre Si se elige un dato aleatoriamente de la poblaci#n, ¿cuál es la
probabilidad de que éste sea igual o menor que BBF?
SOLUCIÓN
La soluci#n se muestra en la figura acompa&ante %l área sombreada representa todos los
datos que son iguales o menores que BBF +or el hecho de que el muestreo es aleatorio, todos los
datos tienen la misma posibilidad de ser elegidos +ara determinar p 21 k BBF3 debemos
transformar primero el dato en bruto de BBF en su punta)e z . continuaci#n, podemos calcular
la proporci#n de datos contenidos en el área sombreada, con ayuda de la tabla . .sí
Dist$i+#ciones de *$o+a+ilidad - ;( -
Dist$i+#ciones de -$o+a+ilidad
La 0abla AB muestra, para el %stado de <eorgia, la proporci#n, por grupos de edades,
de todos los criminales convictos durante el a&o fiscal de BPOB y sometidos a
custodia de la 5unta %statal de (orrecci#n %n el (apítulo B aprendimos que una
tabla de este tipo es una distribuci#n de frecuencia relativa y en el (apítulo D nos
enteramos de que la probabilidad de un evento se puede interpretar como la
frecuencia relativa de sus ocurrencias %n consecuencia, nos podemos referir a la 0abla
AB como una distribuci"n de probabilidad, materia de estudio del presente capítulo
0ablas como la AB se pueden encontrar frecuentemente en los informes anuales de
las agencias gubernamentales La informaci#n tiene gran interés para una gran variedad
de personas, como soci#logos, legisladores Iy traba)adores sociales además del que
tiene para los empleados y profesionales de la agencia que prepara el informe anual
%n el presente capítulo nos basaremos en lo que se aprendi# sobre al inicio del curso, que
nos hizo comprender me)or c#mo es posible sacar conclusiones sobre una poblaci#n,
e"aminando los datos de una muestra que se e"trae de ella Jamos a estudiar primero
la construcci#n de distribuciones empíricas de probabilidad y, luego, algunas
distribuciones especiales de probabilidad, con variables aleatorias discretas y
continuas

'41 DISTRI?UCIONS D ,!RI!?LS DISCRT!S
n inicio de este manual definimos variable discreta como una variable cuyos valores
están separados por alguna cantidad !n e)emplo de variable discreta consiste en los
valores que obtenemos al contar el n*mero de admisiones en un hospital %n este
e)emplo, la variable puede tener solamente los valores F, B, D, 8o puede haber valores
como, BAAM DBMFE
(on frecuencia resulta conveniente poder idear alg*n mecanismo o regla que nos
permita determinar la probabilidad de que la variable discreta 1 asuma alg*n valor
particular 84
D)INICION
Dist$i+#ciones de *$o+a+ilidad - ;/ -
Cualquier regla o mecanismo que sirva para determinar !>4 5 x&, probabilidad de que la
variable aleatoria 4 tome cada uno de los valores posibles x, se denomina una dist$i+#ci&n
de -$o+a+ilidad4
%sta regla o mecanismo puede ser una tabla, un gráfico o una f#rmula !na f#rmula
que se emplee para calcular !>4 5 "3 se denomina función de probabilidad '
generalmente se denota por f2"3 %s decir, f>x& 5 !>4 5 x&.
Gem-lo '41
Las dos primeras columnas de la 0abla AD muestran la distribuci#n del n*mero de
arrestos anteriores para EFF adolescentes que, durante un a&o, comparecieron ante un
tribunal de menores
I
,enotemos por 1 la variable aleatoria discreta ;n*mero de arrestos anteriores; y por "
los valores que 1 puede tomar !tilizando el concepto de probabilidad de frecuencia
relativa, podemos calcular, para cada ", la probabilidad de que cada 1 tome ese valor
%stas probabilidades, que se denotan por !>4 5 "3, se muestran en la *ltima columna de
la 0abla AD %sta tabla ilustra la forma en que se puede representar una distribuci#n de
probabilidad por medio de una tabla
+odemos utilizar la 0abla AD para saber cuáles son las probabilidades de que un )oven
haya tenido determinado n*mero de arrestos previos .sí, por e)emplo, la probabilidad de
que un )oven escogido al azar en este grupo haya tenido dos arrestos previos es de FBD
%sto mismo lo podemos e"presar en una forma más compacta como !>4 5 D3 R FBD Las dos
características necesarias en una distribuci#n de probabilidad aparecen en la 0abla AD
Son las siguientes-
%n otras palabras, la probabilidad de ocurrencia de cada x debe ser u n número igual o
mayor que F y la suma de todas las probabilidades correspondientes a cada uno de los
valores de 1 tiene que ser igual a B 0omadas en su con)unto, estas dos características
llevan implícito lo que ya hemos aprendido, es decir, que la probabilidad de un evento es un
n*mero comprendido entre F y B
'ecordemos que para que una distribuci#n de probabilidad e"ista deben estar
presentes las dos características que se establecieron anteriormente
(on frecuencia estamos interesados en conocer la probabilidad de que 1 tome un valor
Dist$i+#ciones de *$o+a+ilidad - ;5 -
menor o igual a " (on los datos del %)emplo AB deseamos hallar !>4 H A3, es decir, la
probabilidad de que un adolescente del grupo haya tenido tres arrestos anteriores o
menos Hnformaci#n de este tipo es muy *til para hacer programas de educaci#n y
rehabilitaci#n de delincuentes )uveniles
,%=H8H(H78
La probabilidad de que la variable aleatoria 4 asuma valores menores o iguales a x se llama
funci#n de distribuci#n acumulada de 4 ' se denota por I>x &.
,e esta manera, podemos escribir

.sí, para calcular la probabilidad de que 1 sea menor o igual a un determi nado valor,
digamos a, procedemos de la siguiente manera-
+odemos facilitar el cálculo de !>4 H x& acumulando los valores !>4 R "3 dados en la tabla
de la distribuci#n de probabilidad La 0abla AA muestra los resultados obtenidos al
acumular los valores !>4 5 x& de la 0abla AD %"aminando esta tabla vemos que !> 4 + A3
R FPM
+odemos representar gráficamente las distribuciones de probabilidad y las funciones
de distribuci#n acumulada La apariencia física de estos gráficos es típica cuando la variable
que se estudia es discreta
%n la figura AB 2b3, las probabilidades están representadas solamente por las líneas
horizontales Las líneas verticales no sirven sino para unir las líneas que representan
las probabilidades y por eso no parece que estuvieran flotando en el espacio 4ay que
tener presente que f 2"3 es igual a F para cualquier valor de x que 4 no pueda asumir y
en consecuencia I>x& es igual a F cuando " R F (on base en la =igura ?.% >a&, podemos
determinar que !>4 5 ?& 5 f>?& 5 FFC (on base en la =igura AB 2b3, podemos determinar
que !>4 9 ?& 5 I>?& 5 ..*6.
Dist$i+#ciones de *$o+a+ilidad - ;9 -
Las distribuciones que hemos estudiado hasta ahora en esta secci#n pueden llamarse
distribuciones empíricas, porque se han construido directamente con los datos de un
e"perimento %n el resto de esta secci#n vamos a estudiar una distribuci#n discreta especial-
la distribuci"n binomial. %sta distribuci#n se basa en un proceso determinado, que, cuando es
operativo, produce datos que se distribuyen de acuerdo con una regla bien definida
<eneralmente no estamos en capacidad de decir con certeza que los datos de que
disponemos se han distribuido e"actamente como lo especifica la regla Sin embargo, con
frecuencia vamos a decir que la variable aleatoria en la que estamos interesados está
distribuida en tal forma que su distribuci#ntde probabilidad puede aproximarse por medio de
la regla de esta distribuci#n especial %n consecuencia, vamos a utilizar la regla 2funci#n de
probabilidad3 para calcular probabilidades de interés
La dist$i+#ci&n +inomial
(onsideremos un e"perimento aleatorio que produce, en cada ensayo, *nicamente uno de dos
resultados mutuamente e"cluyentes %)emplos de este tipo de e"perimentos son los que se
enumeran a continuaci#n-
B %l nacimiento de un ni&o Los resultados posibles son- ;hombre; y ;mu)er;
D Se elige al azar un ni&o entre un grupo en el que m ni&os tienen una inteligencia superior al
promedio ' n ni&os una inteligencia igual o inferior al promedio Los resultados posibles son-
;ni&o con inteligencia superior al promedio; y ;ni&o con inteligencia igual o inferior al
promedio;
A Se selecciona al azar un paquete de cereales de los que están en un estante de un almacén
de comestibles que contiene a paquetes de marca A y b paquetes de marca 8. Los
resultados posibles son- ;paquete de cereales de marca A3 y ;paquete de cereales de marca 83.
C !n estudiante presenta un e"amen final Los resultados posibles son- ;aprobar; y
;reprobar;
Los e"perimentos de este tipo, en los que no se puede producir, en cada ensayo, sino uno
de dos resultados mutuamente e"cluyentes se denominan ensa'os de 8ernoulli, en honor al
matemático suizo 5a:ob ?ernoulli 2BMECBOFE3, considerado como uno de los fundadores de la
teoría de la probabilidad +or conveniencia, se suele denominar arbitrariamente uno de los
resultados de un ensayo de ?ernoulli como é"ito 2%3 y al otro como fracaso 2=3 .demás, se
suele denotar por p la probabilidad de que un é"ito ocurra en un ensayo y por 2B Ip3 ) q la
probabilidad de que ocurra un fracaso
.hora consideremos una serie de varios ensayos de ?ernoulli que satisfaga las siguientes
condiciones-
B La probabilidad de un é"ito p permanece constante de un ensayo a otro
D Los ensayos son independientes
<eneralmente tiene importancia poder determinar la probabilidad de que se observen x
n*mero de é"itos cuando se repite un e"perimento n veces ba)o las condiciones que se acaban de
establecer
Supongamos, por e)emplo, que el DF c de los pacientes que se han dado de alta en un
hospital durante los diez *ltimos a&os han sido adolescentes %l encargado de las historias
clínicas, a quien un médico le solicita que retire las historias de tres adolescentes, puede
preguntarse qué probabilidad hay de obtener x 5 A historias de adolescentes 2é"itos3, si n 5 E
historias se sacan al azar Será conveniente que podamos obtener una f#rmula que sirva para
todos los valores de n ' x.
Dist$i+#ciones de *$o+a+ilidad - ;; -
Supongamos que n ensayos de ?ernoulli dieron como resultado n - x fracasos seguidos de "
é"itos %sta secuencia la podemos representar de la manera siguiente-

,e acuerdo con la regla de la multiplicaci#n, la probabilidad de que esta secuencia
particular de resultados se produzca es igual a qqq . . . q ppp ... p 5 q3 - xpx

La probabilidad sería
a*n en el caso en que cambie el orden en que ocurrieron los " é"itos y los n - x fracasos
Si se quiere determinar la probabilidad de que " é"itos sean observados en n ensayos, el
orden en que ocurren los é"itos no tiene importancia %n consecuencia debemos conocer el
n*mero de secuencias posibles de é"itos y fracasos que produzcan e"actamente " é"itos
+odemos calcular este n*mero siguiendo la f#rmula dada en el (apítulo D para encontrar el
n*mero de permutaciones de n cosas, de las cuales x son de un tipo y n-x son de otro tipo
Seg*n esta f#rmula, el n*mero de secuencias deseado es
Si se tiene un valor peque&o para n, resulta bastante fácil enumerar cada una de las secuencias
posibles y se&alarlas con los n*meros B, D, A, , 2"3 (onsidere nos el e)emplo de las historias
clínicas %l n*mero de secuencias de c*neo historias clínicas en las que tres corresponden a
adolescentes, designadas con la % de é"ito y el resto con la = de fracaso, está dado por
+odemos enumerar estas secuencias así-
'esultarían e"actamente " é"itos sobre n ensayos si ocurriera la secuencia 8o B o la
secuencia 8o D o la secuencia
I
8o A, , o la secuencia 8o 2e3 Seg*n la regla de la suma,
entonces, la probabilidad de observar e"actamente x é"itos sobre n ensayos de ?ernoulli es
igual a la probabilidad de la secuencia 8o B m.s la probabilidad de la secuencia 8o % m.s la
probabilidad de la secuencia 8o A, más la probabilidad de la secuencia 8o 21;3 (omo hay
un total de 2z3 secuencias y como la probabilidad de ocurrencia de cada una es igual a q
nI "
\ p
"
, podemos e"presar la probabilidad de que ocurran e"actamente x é"itos en n ensayos
de ?ernoulli mediante la e"presi#n
donde 4 es la variable aleatoria ;n*mero de é"itos; y los valores que 4 puede tomar son " R
F, B, D, A, , n. %l miembro izquierdo de la ecuaci#n se lee ;la probabilidad de que 4 sea
igual a ", dado n ' p3. La ecuaci#n también se puede escribir
Jolviendo nuevamente al e)emplo de las historias clínicas, encontramos, utilizando la
ecuaci#n anterior, que la probabilidad de sacar las historias clí nicas de A adolescentes si n R
E y si la probabilidad de sacar la historia clínica de un adolescente es FDF, es igual a
Dist$i+#ciones de *$o+a+ilidad - ;= -
.hora es posible hacer una lista de los valores que 1 puede tomar )unto a la
probabilidad de ocurrencia de cada valor %n otras palabras, por medio de la ecuaci#n
podemos representar la distribuci#n de probabilidad de 1 en forma tabular, tal como se
puede ver en la 0abla AC
>a sabemos que las dos características necesarias de una distribuci#n de probabilidad
consisten en que cada valor de !> 4 5 x& tiene que ser mayor o igual a F y que la suma de
todos los valores de +21 R "3 debe ser igual a B +ara comprobar que el primer requisito se
satisface en la 0abla AC, obsérvese que p y n son ambos positivos y en consecuencia !>4 5
"3 nunca puede ser negativa +ara comprobar que la segunda condici#n también se satisface,
observemos que las probabilidades !> 4 5 x& son idénticas a los términos de la e"pansi#n
binomial de > q F p&, que se desarrolla de la manera siguiente
y puesto que q Y p R B, tenemos

(omo resultado de esta relaci#n, generalmente nos referimos a la distribuci#n de
probabilidad dada en la 0abla AC, como distribuci"n binomial de probabilidad, o más
sencillamente como distribuci"n binomial.
La distribuci#n binomial es realmente una familia de distribuciones, puesto que para
cada valor diferente de n ' p, que se denominan parámetros de la distribuci#n binomial, se
puede definir una distribuci#n diferente La =igura AD muestra la forma en que varía la
distribuci#n binomial seg*n toman diferentes valores los parámetros p y n Sin tener en
cuenta el valor de n, la distribuci#n es simétrica cuando p R FE (uando p es mayor que
FE, la distribuci#n es asimétrica y su má"imo se encuentra a la derecha del
centro (uando p es menor que FE, la distribuci#n es asimétrica y su má"imo se encuentra
a la izquierda del centro
Dist$i+#ciones de *$o+a+ilidad - =@ -
(uando las condiciones de una serie de ensayos de ?ernoulli se han satisfecho, la distribuci#n
binomial constituye un instrumento muy *til para determinar probabilidades Si se quiere
calcular la probabilidad de que ocurran " é"itos en n ensayos de ?ernoulli, simplemente se eval*a
nuestra ecuaci#n para los valores específicos de " y n.I
Sin embargo, debemos tener presente que el uso adecuado de la distribuci#n binomial
depende de la suposici#n de que los n ensayos del e"perimento sean n ensayos tomados de un
n*mero infinito de ensayos posibles %n las aplicaciones prácticas de la distribuci#n binomial,
decimos que esta se puede aplicar cuando la muestra se e"trae de una poblaci#n infinita o
cuando se e"trae de una poblaci#n finita con reemplazamiento (omo en la práctica se suele
e"traer la muestra sin reemplazamiento, hay que tener mucho cuidado al aplicar la
distribuci#n binomial
%"iste un consenso general en que cuando el tama&o de la poblaci#n es grande en
relaci#n con el tama&o de la muestra y cuando p no tiene un valor demasiado cercano a F o
a B, se puede utilizar la distribuci#n binomial si la muestra se e"trae sin reemplazamiento de
una poblaci#n finita %sta no es una guía muy precisa, pero no se puede disponer fácilmente
de otra me)or .lgunos profesionales recomiendan que se utilice la distribuci#n binomial s#lo
cuando la poblaci#n tenga por lo menos diez veces el tama&o de la muestra
(on otro e)emplo se puede e"plicar me)or el uso de la distribuci#n binomial
Dist$i+#ciones de *$o+a+ilidad - =1 -
%)emplo AD
%n un área geográfica determinada, el CF G de la poblaci#n adulta pertenece al partido
dem#crata Se saca una muestra aleatoria de diez adultos ¿$ué probabilidad hay de que
tres de ellos pertenezcan al partido dem#crata? Suponemos que el tama&o de la poblaci#n es
grande en relaci#n con el tama&o de la muestra 0enemos pues una pregunta que se puede
contestar por medio de la distribuci#n binomial, donde n R BF, p R FC y " R A +or medio
de nuestra ecuaci#n hallamos que-
+or lo tanto, la probabilidad de que haya tres dem#cratas entre diez adul tos escogidos al
azar en una poblaci#n grande en la que el CFc son dem#cratas es de FDBEF
0ablas de la distribuci#n binomial %l cálculo de las probabilidades binomiales mediante la
ecuaci#n anterior puede resultar increíblemente laborioso cuando n es grande
.fortunadamente, se han preparado tablas de probabilidades binomiales y entonces no es
necésario el uso directo de la ecuaci#n Solamente necesitamos utilizar una tabla con los
valores dados de n, p ' x para obtener la probabilidad deseada La 0abla , del .péndice es
una parte de una tabla de este tipo
+ara e"plicar el uso de la 0abla , consideremos nuevamente el %)emplo AD en el cual
deseábamos saber la probabilidad de que hubiera tres dem#cratas entre diez adultos
seleccionados al azar en una poblaci#n que tenía el CFc de dem#cratas +ara hallar esta
probabilidad en la 0abla ,, localizamos primero n 5 BF, luego la columna de p 5 FCF y
finalmente, para n R BF, la fila marcada con un A %l registro tabular que se encuentra en la
intersecci#n de esta hilera y la columna, es la probabilidad que se busca 4allamos que es
FDBEF, valor que obtuvimos por medio de la ecuaci#n
(#mo hallar las probabilidades binomiales acumuladas (on frecuencia se necesita saber
cuáles son las probabilidades que hay de que 1 asuma valores mayores que un valor dado ",
valores menores que un valor dado " o valores que están dentro de un intervalo limitado por
dos valores dados de 1, digamos ", y "D
Jolvamos a referirnos al área geográfica donde el CF c de la poblaci#n es dem#crata
Supongamos que deseamos saber la probabilidad de encontrar entre A y E dem#cratas en un
grupo de BF personas del área, elegidas al azar
Si están dados n, p y ", la probabilidad de que 4 sea mayor que x se halla sumando las
probabilidades individuales %sto es,

,e la misma manera, la probabilidad de que 1 asuma valores menores que x se halla
sumando las probabilidades de los valores individuales de 4 entre F y "IB %s decir
Dist$i+#ciones de *$o+a+ilidad - =% -
=inalmente, la probabilidad de que 1 asuma valores entre ", y "D inclusive, se halla
sumando las probabilidades de valores individuales de 1 entre ", y "D inclusive %sto lo
e"presamos en una forma más condensada como-

+odemos obtener todas estas clases de probabilidades sumando los n*meros apropiados de
la 0abla , del .péndice Jamos a e"plicar el procedimiento con un e)emplo
%)emplo AA
%l AE c de los internos de una instituci#n correccional son reincidentes Se selecciona,
para una evaluaci#n, una muestra aleatoria de BE internos
2a3 4allar la probabilidad de que el n*mero de reincidentes del grupo sea mayor que BF
Soluci#n- Seg*n la 0abla , del .péndice, hallamos
2b3 4allar la probabilidad de que E o más sean reincidentes Soluci#n- (on la
0abla , del .péndice obtenemos

2c3 4allar la probabilidad de que menos de G sean reincidentes Soluci#n- (on la
0abla , del .péndice hallamos

2d3 4allar la probabilidad de que P o menos sean reincidentes Soluci#n- Seg*n la
0abla , del .péndice tenemos

2e3 4allar la probabilidad de que el n*mero de reincidentes esté entre E y BD inclusive
Soluci#n- (on la tabla , del .péndice obtenemos
Dist$i+#ciones de *$o+a+ilidad - =' -

2f3 4allar la probabilidad de que el n*mero de reincidentes sea mayor que M pero menor
que BD
Soluci#n- Seg*n la tabla , del .péndice hallamos

!so de la 0abla , del .péndice para p j FE 7bsérvese que la 0abla , del .péndice no
contiene valores de p mayores que FEF +ara encontrar las probabilidades binomiales en la
0abla ,, cuando p es mayor que FEF, empleamos la tabla marcada con n como de
costumbre, pero localizamos la columna correspondiente a lI p y no a p y la fila
correspondiente a nI" y no a " %n otras palabras, hallamos la probabilidad deseada en la
intersecci#n de la columna marcada con BIp y la fila marcada n-x, para una n dada
!tilizando nuestra notaci#n usual podemos escribir
%"pliquemos esto por medio de un e)emplo
%)emplo AC
%l OFc de los adultos que viven en una comunidad tiene más de DE a&os de edad Se
seleccionan cinco adultos al azar ¿$ué probabilidad hay de que A tengan más de DE a&os?
+ara hallar esta probabilidad, localizamos n R E en la 0abla , y luego encontramos la
intersecci#n de la columna correspondiente a B I FO R FA y la fila correspondiente a E I A R
D
%ncontramos que la probabilidad es FAFGO
+odemos verificar que este resultado es correcto por medio de nuestra ecuaci#n-
%5%'(H(H7S
t B !n estudiante que no se ha preparado absolutamente nada para un e"amen, ve que
este contiene DF preguntas de verdadero y falso ,ecide lanzar al aire una moneda para
responder .nota ;verdadero; si la moneda cae por cara y ;falso; si cae por sello
2a3 ¿$ué probabilidad hay de que pase el e"amen si para hacerlo
debe contestar correctamente el OF cde las preguntas?
2b3 ¿$ué probabilidad hay de que conteste por lo menos la mitad
de las preguntas correctamente?
Dist$i+#ciones de *$o+a+ilidad - =( -
D La probabilidad de que un individuo acierte, en un solo tiro, con un dardo en el centro
de un blanco es de FCF Lanza BF dardos consecutivamente 4allar la probabilidad de que dé
en el blanco-
2a3 0odas las BF veces
2b3 (inco veces
2c3 %ntre A y O veces inclusive 2d3 9enos de A veces
A La probabilidad de un nacimiento masculino es de FED ¿(uál es la probabilidad
de que en una familia que tiene A hi)os, haya 2a3 ¿0res varones?
2b3 ¿8ing*n var#n?
2c3 ¿+or lo menos un var#n?
C Supongamos que el AF c de los estudiantes de una universidad se oponen a pagar
una cuota para actividades estudiantiles 4allar la probabilidad de que en una muestra
aleatoria de DE estudiantes el n*mero de estudiantes que se opone a la cuota sea-
2a3 %"actamente E
2b3 9ayor que E
2c3 (inco o menos
2d3 !n n*mero comprendido entre M y BF inclusive
E !na secretaria que debe llegar a su traba)o todas las ma&anas a las G-FF se
retarda BE minutos o más el DFc de las veces %l presidente de la compa&ía, que no
llega sino a las BF-FF am, llama ocasionalmente a la oficina entre G-FF y G-BE para dictar
una carta ¿(uál es la probabilidad de que, tres ma&anas de las M en que el presidente
llama, la secretaria no esté en la oficina?
M %n el BE , de los hogares de un área metropolitana no hay nadie por la noche entre
las O-FF y la media noche !na persona que está haciendo una encuesta telef#nica
selecciona al azar BF hogares de esa zona y los encuesta entre las O-FF y la media noche ¿(uál
es la probabilidad df- que la persona que está haciendo la encuesta no obtenga respuesta en
2a3 0odas las BF llamadas?
2b3 ¿%"actamente E llamadas?
2c3 ¿0res llamadas o menos?
2d3 ¿(uál es la probabilidad de que la persona obtenga una respues
ta en cada una de las BF llamadas?
O !n método modelo para ense&ar una habilidad especial a ciertos individuos
retardados resulta efectivo en el EF c de los casos Se ensayo un nuevo método con BE
personas Si el nuevo método no es me)or que el método modelo, ¿cuál es la probabilidad de
que BB o más aprendan la habilidad?
G %l archivo de personal de una fábrica indica que el BF c de los empleados de la
línea de monta)e se retiran al a&o de haber sido contratados Se acaba de contratar BF
empleados nuevos
2a3 ¿(uál es la probabilidad de que e"actamente la mitad de ellos
siga traba)ando después de un a&o?
2b3 ¿(uál es la probabilidad de que todos sigan traba)ando des
Dist$i+#ciones de *$o+a+ilidad - =/ -
pués de un a&o?
2c3 ¿(uál es la probabilidad de que A de los BF se vayan antes de terminar el a&o?
P %n una zona geográfica, el BEc de los adultos son analfabetos ,ada una muestra
aleatoria de DE adultos de esta área, ¿cuál es la probabili dad de que el n*mero de
analfabetos sea
2a3 ¿%"actamente BF?
2b3 ¿9enos de E? 2c3 ¿(inco o más?
2d3 ¿%ntre A y E inclusive?
2e3 ¿9enos de O pero más de C?
'4% DISTRI?UCIONS D ,!RI!?LS CONTINU!S
%n el (apítulo B definimos una variable continua como una variable qué puede asumir
cualquier valor dentro de un intervalo de valores y citamos como e)emplos variables que se
pueden medir en unidades de altura, peso, tiempo o temperatura
%n la Secci#n AB donde se estudiaron las variables discretas, aprendimos a determinar la
probabilidad de que la variable aleatoria discreta 1, asuma un valor particular " 4emos
estudiado los métodos tabulares, gráficos y matemáticos 2por medio de una f#rmula3
(uando concentramos la atenci#n en una variable continua, generalmente deseamos
saber determinar la probabilidad de que 1 asuma valores dentro de alg*n intervalo +or
e)emplo, deseamos saber la probabilidad de que 1 asuma valores entre 1
a
' 4
b,
la
probabilidad de que 1 sea mayor que 1
b
o la probabilidad de que 1 sea menor que 1
a

4emos visto que las distribuciones de frecuencia y las distribuciones de frecuencia
relativa de variables continuas se construyen definiendo unos intervalos de clase y
determinando la frecuencia o frecuencia relativa con que las observaciones quedan
incluidas dentro de los intervalos de clase 0ambién vimos que las distribuciones de
frecuencia y las distribuciones de frecuencia relativa se pueden representar gráficamente
por medio de histogramas y polígonos de frecuencia %l área que queda comprendida ba)o
el histograma o el polígono de frecuencia entre dos valores cualesquiera, digamos 1
a
' 4
b,
de
una variable aleatoria 1 que se está estudiando, es igual a la frecuencia relativa de la
ocurrencia de los valores de 4 entre 1
a
' 4
b
.

,e acuerdo con el estudio de las
probabilidades, sabemos que si los datos de que disponemos son una muestra e"traída de
una poblaci#n, podemos interpretar estas frecuencias relativas como estimaciones de las
probabilidades verdaderas correspondientes +or lo tanto, podemos interpretar la frecuencia
relativa de que ocurran valores muestrales de 4 entre x
a
' x
b
2inclusive3 como una estimaci#n
de +2"
a
k 4 H "
b
3, es decir, de la probabilidad de que 1 tome valores entre "
a
'
4b
2inclusive3
Dist$i+#ciones de *$o+a+ilidad - =5 -
Supongamos que tenemos una muestra de medidas de una variable continua aleatoria
1 !n histograma de frecuencia relativa para los datos de esa muestra podría tener la imagen
de la =igura AA La regi#n sombreada de la figura se puede interpretar corno una estimaci#n
de la probabilidad de que 1 asuma valores entre "
a
y "
b

Supongamos ahora que tenemos una muestra mucho más grande de valores 1 (omo
nuestra variable aleatoria es continua, podemos hacer mediciones con cualquier n*mero de
puntos decimales +or lo tanto, al construir un histograma para esta gran muestra de
observaciones, podemos hacer nuestros intervalos de clase tan peque&os como queramos !n
histograma de frecuencia relativa construido con una muestra muy grande de valores de 1
sería seme)ante a la =igura AC si se usan intervalos de clase muy peque&os
,e esta manera vemos que a medida que crece el n*mero de observaciones y a medida que
disminuyen las amplitudes de los intervalos de clase, el histograma se aseme)a cada vez más a una
curva suave como la que aparece en la =igura AE +arece entonces razonable suponer que el
área entre "
a
' "
b
de la =igura AC es casi igual al área entre "
a
'
4b
de la =igura AE
La distribuci#n de una probabilidad continua siempre se representa gráficamente mediante
una curva suave %l área comprendida ba)o de la curva, por encima del e)e horizontal y entre las
perpendiculares que se levantan sobre los dos puntos a y b es igual a la probabilidad de que la
variable aleatoria asuma los valores comprendidos entre los dos puntos
7bsérvese que este análisis ha perseguido el prop#sito de determinar la probabilidad
comprendida en un intervalo La raz#n de esto es que, para una variable continua, !> 4 5 x& 5
F %s decir, la probabilidad de que 4 asuma un valor específico es igual a F (onsideremos una
curva suave dibu)ada que represente una distribuci#n de probabilidad continua Se puede ver
Dist$i+#ciones de *$o+a+ilidad - =9 -
que el área que queda encima de un punto es igual a F
(uando se trata de histogramas hechos a partir de datos de una muestra, calculamos el
área comprendida ba)o el histograma y entre dos puntos, cada uno de los cuales está incluido en
alg*n límite de clase, sumando las áreas representadas por las celdas adyacentes del histograma
+or e)emplo, si deseamos hallar el área entre "
a
' x
b
del histograma de la =igura AA, sumamos las
áreas de las tres celdas que se encuentran entre "
a

G
"
b

Hgualmente, para obtener el área entre "
a
y "
b
del histograma de la =igura AC, sumamos las
áreas de las celdas que se encuentran entre x
a
' x
b
.

%n este caso la tarea es menos atractiva
que en el caso del primer histograma
%l cálculo del área comprendida ba)o una curva suave, como el área entre "a y "b de la =igura
AE, constituye un buen problema porque no tenemos ninguna celda y por lo tanto ning*n área
para sumar +ara calcular un área de este tipo necesitamos usar el cálculo integral (omo el
estudiante no tiene por qué estar familiarizado con este cálculo trataremos de él en forma
muy rápida
%n el proceso de integraci#n, el cálculo integral utiliza una técnica matemática que es el
límite de una sumaci#n .sí pues, cuando uno emplea el cálculo integral para hallar el área ba)o
una curva suave, en realidad está agregando áreas de rectángulos infinitesimalmente peque&os
2celdas3 +ara e)ecutar los cálculos que se requieren en la integraci#n, hay que conocer la
f#rmula de la distribuci#n específica que se está estudiando
.fortunadamente en este libro no vamos a utilizar el cálculo integral en ninguna de las
distribuciones de probabilidad continua Las áreas ba)o las curvas que tienen interés ya han
sido determinadas, tabuladas y están a nuestra disposici#n en las tablas del .péndice, que
mencionaremos cada vez que sea necesario
La dist$i+#ci&n no$mal
%ntre todas las distribuciones continuas que se conocen, una de las más importantes en
estadística es la distribuci"n normal. La f#rmula de esta distribuci#n fue publicada por primera
vez por .braham ,emoivre 2BMMOBOEC3 en BOAA 7tros matemáticos que figuran, en primer
plano, en la historia inicial de la distribuci#n normal son +ierre Simon, el 9arqués de Laplace
2BOCP IBGDO3 y (arl =riedrich <auss 2BOOOIBGEE3, en cuyo honor se denomina a veces
distribuci"n de Jauss.
La f#rmula de la distribuci#n normal es

Dist$i+#ciones de *$o+a+ilidad - =; -

y

indica que el término entre corchetes es el e"ponente de e, donde
La =igura AM muestra la gráfica de una distribuci#n normal con media K y varianza L
(

.lgunas características importantes de la distribuci#n normal son las que se mencionan a
continuaci#n-
B %l área total comprendida ba)o la curva y por encima del e)e horizontal es igual a B 2unidad
cuadrada3
D La distribuci#n es simétrica al respecto de su media %s decir, el EF c del área está a la
derecha de la media y el EF c a la izquierda
A La media, la mediana y la moda son todas iguales
C La distancia horizontal que hay desde el punto de infle"i#n de la curva 2el punto
donde la curva de)a de ser c#ncava hacia aba)o y empieza a ser c#ncava hacia arriba3 hasta una
perpendicular levantada sobre la media es igual a la desviaci#n típica a, como se muestra en la
=igura AM
E La distribuci#n normal es realmente una ;familia; de distribuciones, puesto que e"iste
una distribuci#n diferente para cada valor de u y v La =igura AO muestra tres
distribuciones normales con la misma desviaci#n típica pero con diferente media (omo
podemos ver, el valor de u sit*a la distribuci#n en el e)e horizontal Las distribuciones que
tienen diferentes medias se sit*an en diferentes posiciones sobre el e)e horizontal
Dist$i+#ciones de *$o+a+ilidad - == -
La =igura AG muestra tres distribuciones normales con la misma media pero con diferentes
desviaciones típicas %sta figura muestra c#mo mientras más grande sea la desviaci#n típica
más plana y más e"tendida es la gráfica de la distribuci#n
Dist$i+#ciones de *$o+a+ilidad - 1@@ -
M La curva de una distribuci#n normal se e"tiende de Iw hasta Y w
O Si levantamos perpendiculares a una distancia de una desviaci#n típica de la media en
cada uno de los dos lados, el área comprendida entre estas dos perpendiculares, la curva y
el e)e horizontal es igual apro"imadamente a FMG, esto es, apro"imadamente al MG c del área
total ,e igual manera, podemos encerrar apro"imadamente el PEc del área total deba)o de
la curva de una distribuci#n normal, levantando perpendiculares a una distancia de dos
desviaciones típicas de la media en cada uno de los dos lados +odemos encerrar
apro"imadamente el PPOc del área total, levantando perpendiculares a una distancia de tres
desviaciones estándar desde la media en cada uno de los dos lados La =igura AP e"plica estos
hechos
Si una variable aleatoria 1 está normalmente distribuída, podemos calcular !>x
a
9 4 x "
b
3, la
probabilidad de que 4 asuma valores entre "a y "
b
, integrando la ecuaci#n de la distribuci#n
normal desde "a hasta
4b.
La =igura ABF muestra el área correspondiente a la probabilidad
deseada
.fortunadamente, no habra necesidad, como se e"plicará a continuaci#n, de realizar
efectivamente la integraci#n de la f#rmula para hallar >! x
a
k1 k 4
b
& o cualquier otra
probabilidad que se esté buscando
7bsérvese que en el caso de las distribuciones continuas, !>x
a
9 4 9 x
b
* da el mismo
Dist$i+#ciones de *$o+a+ilidad - 1@1 -
resultado que !>x
a
9
4
9 1b*. (omo el área que queda sobre los puntos x
a
'
4b
es F, estos
puntos terminales no contribuyen en nada a la probabilidad asociada al intervalo
La dist$i+#ci&n no$mal estanda$iEada
>a hemos observado que hay una distribuci#n normal diferente para cada valor diferente
de u y v
D
!na distribuci#n normal de especial importancia en estadística es la distribuci"n normal
estandari)ada que tiene una media u R F y una varianza v
(
R B
Las áreas de la distribuci#n normal estandarizada correspondientes a varias probabilidades
se encuentran actualmente tabuladas La 0abla % del .péndice es un e)emplo %l cuerpo de esta
tabla da las áreas ba)o la curva entre F y za, un valor específico de l, variable aleatoria que está
normalmente distribuida con media F y varianza B %l área sombrada de la =igura ABB corresponde
al n*mero de la 0abla % para +2F k l x za3
%)emplo AE
4allar el área ba)o de la curva normal estandarizada entre F y z R I DFE


Soluci#n- %l área que se busca es el área sombreada en la =igura ABD +ara hallar el valor
numérico de esta área, localizamos el n*mero DF en la columna que está más hacia la izquierda y
el n*mero FFE en la fila superior de la 0abla % del .péndice %l n*mero que aparece en la
intersecci#n de esa columna y esa fila, FCOPG, es el área que estamos buscando
%)emplo AM
¿(uál es la probabilidad de que un valor de z sacado al azar esté comprendido entre F y
IDFE?
Dist$i+#ciones de *$o+a+ilidad - 1@% -
Soluci#n- %n virtud de la simetría de la distribuci#n normal, el área entre F y IDFE es
e"actamente igual al área entre F y Y DFE, como se ve en la =igura ABA
Gem-lo AO
Soluci#n- +odemos concebir que el área que se busca en este e)emplo consta de dos partes
!na parte está a la izquierda de F y la otra parte a la derecha, como se ve en la =igura ABC
+ara hallar el área con la 0abla % del .péndice, buscamos primero el área entre F y
BED, o sea FCAEO Luego buscamos el área entre F y BOG, o sea FCMDE 4allamos el
área total sumando FCAEO y FCMDE La respuesta es FGPGD
%)emplo AG
4allar +2l j BMO3
Soluci#n- %n la =igura ABE se muestra el área que se nos pide encontrar %sta área no
está dada directamente en la 0abla % 'ecordemos que el área total a la derecha de F es
FEFFF +ara buscar el área a la derecha de BMO, buscamos el área entre F y BMO y la restamos
de FEFFF 7btenemos FEFFF I FCEDE R FFCOE
!-licaciones de la dist$i+#ci&n no$mal
8o es muy probable que, en la naturaleza, encontremos variables aleatorias que se
distribuyan normalmente con e"actitud porque la distribuci#n normal es un ideal matemático
Sin embargo, muchas variables aleatorias continuas pueden caracterizarse mediante una
distribuci#n normal ,entro de este tipo de variables se pueden incluir la estatura de los
Dist$i+#ciones de *$o+a+ilidad - 1@' -
individuos que pertenecen a ciertas poblaciones bien definidas, las dimensiones de ciertos
artículos manufacturados, como el diámetro de las lavadoras, los (H de las personas y otros
diversos punta)es de pruebas
(uando en una investigaci#n, la variable de interés está normalmente distribuida por lo
menos de manera apro"imada, utilizamos en su análisis el conocimiento que tenemos de la
distribuci#n normal ,e la misma manera que con la distribuci#n normal estandarizada,
podemos responder preguntas de probabilidad en relaci#n a una variable aleatoria 1 que esté
normalmente distribuida por lo menos de manera apro"imada +or e)emplo, podríamos
desear saber la probabilidad de que alguna variable 1 aleatoria distribuida normalmente en forma
apro"imada, con media u y desviaci#n típica v, asuma valores comprendidos entre "a y "
b
+ara
obtener dichas probabilidades, transformamos la variable 1, con media u y varianza L
(,
en la
variable normal estándar, l, con media F y varianza BI

%sto lo hacemos por medio de la f#rmula
mediante la cual cualquier valor x de la variable aleatoria 4 se transforma en un valor z de la
variable normal estandarizada l La =igura ABM muestra la relaci#n entre la escala original, en
unidades de 1, y la escala transformada, en unidades de l
!na vez que hayamos hecho estas transformaciones, podemos utilizar la 0abla % del
.péndice para hallar las probabilidades de interés %"pliquémonos con algunos e)emplos
%)emplo AP
Los (H de los individuos que componen una determinada poblaci#n tienen apro"imadamente
una distribuci#n normal, con una media de BFF y una desviaci#n típica de BF
2a3 4allar la proporci#n de individuos con (H mayores que BDE
Dist$i+#ciones de *$o+a+ilidad - 1@( -
Soluci#n- (onvertimos primero BDE en un valor z por medio de la f#rmula
%l problema ahora se reduce a encontrar el área ba)o la curva normal estandarizada que
está a la derecha de DE Seg*n la 0abla % encontramos que el área es FFFMD La =igura ABO
e"plica el procedimiento
2b3 ¿(uál es la probabilidad de que un individuo elegido al azar entre los de esa poblaci#n
tenga un (H entre BFE y BBE?

Seg*n la 0abla % del .péndice encontramos que el área deseada es FDCBO La =igura ABG
muestra gráficamente esta probabilidad

Soluci#n- 0enemos
Dist$i+#ciones de *$o+a+ilidad - 1@/ -
La =igura ABP muestra gráficamente esta probabilidad
La a-$o8imaci&n no$mal de la +inomial
La utilidad que tiene la distribuci#n normal en estadística se puede comprender me)or si
se tiene en cuenta el hecho de que esta distribuci#n proporciona una buena apro"imaci#n de la
distribuci#n binomial, cuando n es grande y p no está demasiado cercano a F # B !na regla
práctica que se sigue con frecuencia establece que la apro"imaci#n normal de la binomial es
apropiada cuando np ' n>% -p& son mayores que cinco
+ara utilizar la apro"imaci#n normal, hacemos que u 5 np L 5 Mnp>%
-
p& y convertimos los
valores de la variable original en valores de z para hallar las probabilidades que presenten
interés (uando el tama&o de la muestra que se va a analizar no es uno de los valores de n
dados que figuran en las tablas binomiales disponibles, la apro"imaci#n normal a la binomial
proporciona una alternativa conveniente
Dist$i+#ciones de *$o+a+ilidad - 1@5 -
(omo la distribuci#n normal es continua y la binomial es una distribuci#n discreta,
podemos obtener me)ores resultados si hacemos un a)uste en que se tenga en cuenta este
hecho cuando utilicemos la apro"imaci#n %ste a)uste, denominado correcci"n de continuidad,
se puede comprender me)or observando un histograma construido con datos binomiales y con
una curva suave superpuesta La figura ADF muestra esto para n 5 (. ' p 5 FA
%n la =igura ADF, la probabilidad de que 1 R " es igual al área del rectángulo centrado en x.
+or e)emplo, la probabilidad de 4 5 G es igual al área del rectángulo centrado en G +odemos ver
que este rectángulo se e"tiende de OE a GE Si consultamos la 0abla , del .péndice
encontramos que esta área es igual a FBBCC %n la =igura ADF 2a3, aparece sombreada el área
correspondiente
(uando utilizamos la apro"imaci#n normal de la binomial, debemos tener en cuenta el
hecho de que, para la binomial, +21 R "3 es el área del rectángulo centrado en x. (uando
convertimos valores de x en valores de z, la correcci#n de continuidad consiste en sumar FE
a, yNo restar FE de, ", seg*n sea conveniente +ara e"plicar me)or esto, utilicemos la
correcci#n de continuidad y la apro"imaci#n normal para hallar la probabilidad de que 1
asuma un valor comprendido entre "a R OE ' 4
b
R GE (onvirtiendo a valores z, tenemos
Dist$i+#ciones de *$o+a+ilidad - 1@9 -

,e acuerdo con la 0abla % hallamos que la probabilidad que buscamos es FBDBE,
valor que está razonablemente cerca a la probabilidad e"acta de FBBCC %l área ba)o la
curva normal, correspondiente a +2OEk1 x GE3, aparece sombreada en la =igura ADF 2b3
!tilicemos este mismo e)emplo para hallar +2E k 1 x BF3 !tilizando probabilidades
binomiales mediante la 0abla ,, encontramos que la respuesta es FOCEC %l área correspondiente
aparece sombreada en la =igura ADB2a3
+or medio de la apro"imaci#n normal encontramos
%l área correspondiente aparece sombreada en la =igura ADB2b3 8uevamente, vemos que la
apro"imaci#n normal da un resultado muy cercano a la probabilidad e"acta Si no
hubiéramos utilizado la correcci#n de continuidad, la apro"imaci#n normal hubiera dado
Jemos que esta apro"imaci#n no está tan cercana a la probabilidad verdadera de
FOCEC como la apro"imaci#n obtenida empleando la correcci#n de continuidad (uando
Dist$i+#ciones de *$o+a+ilidad - 1@; -
n es grande y p no está demasiado cerca a F o a B, generalmente se omite la correcci#n
de continuidad si se trata de encontrar probabilidades relacionadas con intervalos tales
como

ARCICIOS
BF ,ada la variable aleatoria l que se distribuye como la distribuci#n normal estándar,
hallar lo siguiente-
2a3 +2z k BOO3
2b3 +2z k DCM3
2c3 +2F k z k FPE3
2d3 +2IDFF x z x BGF3
2e3 +2IDBF k z k IBME3
2f3 +2BCE k z k DBE3
2g3 La proporci#n de valores z mayores que BPM
2h3 La probabilidad de que l asuma valores entre IBPM y Y BPM
2i3 La frecuencia relativa de ocurrencia de valores mayores que IB ME
2)3 La probabilidad de que z sacada al azar esté entre IDEG y YDEG
BB !na empresa ha encontrado que la duraci#n de sus llamadas telef#nicas a larga
distancia tiene apro"imadamente una distribuci#n normal, con media de tres minutos y
desviaci#n típica de un minuto
2a3 ¿%n qué proporci#n las llamadas a larga distancia tienen una duraci#n de más de dos
minutos, pero de menos de tres y medio minutos?
2b3 ¿$ué proporci#n de llamadas se completan en un minuto o menos?
2c3 !na secretaria va a hacer una llamada a larga distancia ¿(uál es la probabilidad de que
dure más de cinco minutos?
BD !n psic#logo descubre que su)etos ;normales; completan una tarea determinada en
un promedio de diez minutos %l tiempo requerido para completar la tarea está
apro"imadamente normalmente distribuido con una desviaci#n típica de tres minutos 4allar
lo siguiente-
2a3 La proporci#n de su)etos normales que completan la tarea en menos de cuatro
minutos
2b3 La proporci#n de su)etos que requieren más de cinco minutos para completar la tarea
2c3 La probabilidad de que un su)eto normal, a quien se le haya asignado la tarea, la
complete en tres minutos
BA !nos e"pertos agrícolas descubren que el rendimiento por acre de un determinado
tipo de grano tiene una distribuci#n apro"imadamente normal, con media y desviaci#n típica de
CF y BF toneladas por acre respectivamente
2a3 ¿$ué proporci#n del área en acres sembradas de este grano producen más de
cincuenta toneladas por acre?
2b3 Si se elige al azar un acre en la hacienda donde se siembra este grano, ¿cuál es la
probabilidad de que produzca menos de BE toneladas?
BC Los punta)es de una prueba de aptitud escolar están normalmente distribuidos con
una media de MFF y una varianza de BF FFF?
Dist$i+#ciones de *$o+a+ilidad - 1@= -
2a3 ¿$ué proporci#n de los encuestados tiene un punta)e por deba)o de AFF?
2b3 !na persona va a presentar la prueba ¿$ué probabilidad tiene de obtener un punta)e
de GEF o más? 2c3 ¿$ué proporci#n de punta)es estará entre CEF y OFF?
BE %n una poblaci#n determinada la estatura de los adultos hombres está más o menos
normalmente distribuida, con una media y una desviaci#n típica de OF y A pulgadas
respectivamente
2a3 ¿$ué proporci#n de hombres tiene entre ME y OA pulgadas de altura?
2b3 Se elige al azar un adulto en esa poblaci#n ¿(uál es la probabilidad de que tenga más de
seis pies de altura?
2c3 ¿$ué proporci#n de adultos tiene menos de E pies y G pulgadas de altura?
BM La longitud de los pétalos en una especie de flor está normalmente distribuida con una
media y desviaci#n típica de C y D cm respectivamente
2a3 ¿$ué proporci#n de pétalos tiene más de E cm?
2b3 ¿$ué proporci#n tiene menos de D
I
L, cm?
BO La velocidad de los autom#viles al pasar por un punto de verificaci#n de una
autopista está más o menos normalmente distribuida, con una media de CE mph y una
varianza de DE
2a3 ¿$ué proporci#n de los autom#viles que pasan por el punto de control via)a a más de
EF mph?
2b3 ¿$ué proporci#n pasa por el punto de control a una veloci dad de menos de CF mph?
2c3 Supongamos que la velocidad límite en el control es de EE
mph ¿$ué proporci#n de autom#viles e"ceden esta veloci dad cuando pasan por el
control?
BG %n un sector del país los gastos semanales de alimentaci#n de una familia están más
o menos normalmente distribuidos, con media y desviaci#n típica de qMF y qBE
respectivamente
2a3 4allar la proporci#n de familias que gastan en alimentos más de qGF por semana
2b3 4allar la proporci#n que gasta menos de qEF por semana
BP ,entro de la poblaci#n de una prisi#n, el AF c de los reclusos está allí por robo Se
selecciona una muestra aleatoria de EF ¿(uál es la probabilidad de que el n*mero de
reclusos por robo en esa muestra esté entre DF y DC?
DF Supongamos que el CFc de los individuos que componen una poblaci#n están a
favor de un proyecto de ley determinado ¿(uál es la probabilidad de que en una muestra
aleatoria de BFF individuos se encuentre un n*mero comprendido entre AF y EF de votos a favor?
!-éndiceB Ta+las - 11@ -

!-éndiceB Ta+las - 111 -

!-éndiceB Ta+las - 11% -

!-éndiceB Ta+las - 11' -

!-éndiceB Ta+las - 11( -

!-éndiceB Ta+las - 11/ -

!-éndiceB Ta+las - 115 -

!-éndiceB Ta+las - 119 -

!-éndiceB Ta+las - 11; -

!-éndiceB Ta+las - 11= -

!-éndiceB Ta+las - 1%@ -

!-éndiceB Ta+las - 1%1 -

!-éndiceB Ta+las - 1%% -

!-éndiceB Ta+las - 1%' -

!-éndiceB Ta+las - 1%( -

!-éndiceB Ta+las - 1%/ -

!-éndiceB Ta+las - 1%5 -

!-éndiceB Ta+las - 1%9 -

!-éndiceB Ta+las - 1%; -

!-éndiceB Ta+las - 1%= -

!-éndiceB Ta+las - 1'@ -

!-éndiceB Ta+las - 1'1 -

!-éndiceB Ta+las - 1'% -

!-éndiceB Ta+las - 1'' -

!-éndiceB Ta+las - 1'( -

!-éndiceB Ta+las - 1'/ -

!-éndiceB Ta+las - 1'5 -

!-éndiceB Ta+las - 1'9 -

!-éndiceB Ta+las - 1'; -

!-éndiceB Ta+las - 1'= -