Professional Documents
Culture Documents
Sweeney
E
l propsito de este libro es proporcionar una introduccin a los conceptos clave de la
estadstica, para lo cual emplea una orientacin fundamental hacia las aplicaciones del
Williams
anlisis de datos y la metodologa. El anlisis y el desarrollo de cada tcnica se presentan
desde esta perspectiva, cuyos resultados estadsticos permiten comprender las decisiones y
soluciones de los problemas. Camm
Entre los cambios relevantes en esta edicin, se pueden mencionar los siguientes:
ESTADSTICA DESCRIPTIVA. Se incorpora material nuevo sobre visualizacin de datos, mejores Cochran
prcticas, grficas de barras apiladas y de barras agrupadas. Tambin se integra una nueva seccin
sobre dashboards o tableros de datos y cmo incorporar resmenes estadsticos para mejorar su
eficacia.
PARA
ESTADSTICA
DISTRIBUCIONES DISCRETAS. Se incluye una nueva seccin sobre distribuciones bivariadas
discretas y sus aplicaciones en las finanzas, por ejemplo, cmo elaborar y analizar portafolios
financieros por medio de estas distribuciones.
NEGOCIOS Y ECONOMA
COMPARACIN DE MLTIPLES PROPORCIONES, PRUEBAS DE INDEPENDENCIA Y DE
BONDAD DE AJUSTE. Se incorpora una nueva seccin sobre pruebas de igualdad para tres o ms
proporciones poblacionales, as como un procedimiento para llevar a cabo pruebas de
comparaciones mltiples entre todos los pares de proporciones poblacionales. Tambin se
incluyen apndices revisados con instrucciones detalladas para Minitab, Excel y StatTools.
NUEVOS CASOS PRCTICOS. Se incluyen nuevos casos prcticos, los cuales brindan la
oportunidad de analizar bancos de datos ms grandes y preparar los informes gerenciales con
base en los resultados del anlisis.
NUEVAS APLICACIONES REALES. Cada captulo comienza con un caso real. Por ejemplo,
en el captulo 4 se describe cmo un equipo de la NASA aplic la probabilidad para ayudar
ESTADSTICA
en el conocido rescate de los 33 mineros chilenos atrapados en un derrumbe.
12 EDICIN
ISBN-13: 978-607-522-457-2
ISBN-10: 607-522-457-2
Dennis J. Sweeney
University of Cincinnati
Thomas A. Williams
Rochester Institute of Technology
Jeffrey D. Camm
University of Cincinnati
James J. Cochran
Louisiana Tech University
Traduccin
Lorena Peralta Rosales
Traductor profesional
Revisin tcnica
Mara de Guadalupe Arroyo Satisteban Jos Cruz Ramos Bez
Academia de Matemticas ECEE Academia de Matemticas ECEE
Universidad Panamericana Universidad Panamericana
Australia Brasil Corea Espaa Estados Unidos Japn Mxico Reino Unido Singapur
Estadstica para negocios y economa D.R. 2016 por Cengage Learning
Dcimosegunda edicin Editores, S.A. de C.V., una compaa
David R. Anderson, Dennis J. Sweeney, de Cengage Learning, Inc.
Thomas A. Williams, Jeffrey D. Camm, Corporativo Santa Fe
James J. Cochran Av. Santa Fe, nm. 505, piso 12
Col. Cruz Manca, Santa Fe
Presidente de Cengage Learning C.P. 05349, Mxico, D.F.
Latinoamrica Cengage Learning es una marca
Fernando Valenzuela Migoya registrada usada bajo permiso.
Director Editorial para Latinoamrica DERECHOS RESERVADOS. Ninguna parte de este trabajo
Ricardo H. Rodrguez amparado por la Ley Federal del Derecho de Autor podr
ser reproducida, transmitida, almacenada o utilizada,
Gerente de Adquisiciones para en cualquier forma o por cualquier medio, ya sea grfico,
Latinoamrica electrnico o mecnico, incluyendo, pero sin limitarse
Claudia C. Garay Castro a lo siguiente: fotocopiado, reproduccin, escaneo,
digitalizacin, grabacin en audio, distribucin en Internet,
Gerente de Manufactura para distribucin en redes de informacin o almacenamiento
Latinoamrica y recopilacin en sistemas de informacin, a excepcin
Antonio Mateos Martnez de lo permitido en el captulo III, artculo 27 de la Ley
Federal del Derecho de Autor, sin el consentimiento
Gerente Editorial de Contenidos en Espaol por escrito de la editorial.
Pilar Hernndez Santamarina
ExamView es una marca registrada de eInstruction
Gerente de Proyectos Especiales Corp. Windows es una marca registrada de Microsoft
Luciana Rabuffetti Corporation; se utiliza aqu bajo licencia. Macintosh y
Power Macintosh son marcas comerciales registradas de
Coordinador de Manufactura Apple Computer, Inc. utilizadas en este documento bajo
Rafael Prez Gonzlez licencia.
2008 Cengage Learning. Todos Los Derechos Reservados.
Editor Microsoft Excel es una marca comercial registrada
Javier Reyes Martnez de Microsoft Corporation. 2014 Microsoft.
Impreso en Mxico
1 2 3 4 5 6 7 18 17 16 15
Contenido
Prefacio xxv
Acerca de los autores xxix
_
Forma de la distribucin de muestreo de p 324
_
Valor prctico de la distribucin de muestreo de p 324
7.7 Propiedades de los estimadores puntuales 328
Insesgadez 328
Eficiencia 329
Consistencia 330
7.8 Otros mtodos de muestreo 331
Muestreo aleatorio estratificado 331
Muestreo por conglomerados (o clusters) 331
Muestreo sistemtico 332
Muestreo de conveniencia 332
Muestreo subjetivo 333
Resumen 333
Glosario 334
Frmulas clave 335
Ejercicios complementarios 335
_
Apndice 7.1 Valor esperado y desviacin estndar de x 337
Apndice 7.2 Muestreo aleatorio con Minitab 339
Apndice 7.3 Muestreo aleatorio con Excel 340
Apndice 7.4 Muestreo aleatorio con StatTools 341
CAPTULO
ESTADSTICA en LA PRCTICA
BLOOMBERG BUSINESSWEEK*
NEW YORK, NEW YORK
Con una circulacin global de ms de un milln de ejem-
plares, Bloomberg Businessweek es la revista de negocios
ms leda en el mundo. Ms de 1 700 reporteros en 145 ofi-
cinas de todo el mundo producen una variedad de artculos
de inters para la comunidad de los negocios y la economa.
Adems de reportajes especiales sobre temas de actualidad,
la revista contiene secciones regulares sobre administracin
internacional, anlisis econmico, procesamiento de infor-
macin y ciencia y tecnologa. La informacin contenida
en los reportajes especiales y las secciones regulares ayuda
a los lectores a mantenerse al da en los desarrollos actuales
y evala su impacto en los negocios y la economa bajo las
condiciones actuales.
La mayora de los nmeros de Bloomberg Businessweek
anteriormente conocida slo como BusinessWeek contiene
un artculo de fondo sobre un tema de inters actual. Dichos Bloomberg Businessweek utiliza hechos estadsticos y
artculos a menudo contienen hechos y resmenes estads- resmenes en muchos de sus artculos. Kyodo/Photoshot.
ticos que ayudan al lector a comprender la informacin de
negocios y economa. Por ejemplo, el nmero del 3 de marzo rectivos de Bloomberg Businessweek utilizan resmenes
de 2011 analiz el impacto en los negocios de movilizar estadsticos de la consulta para brindar un mejor servicio a
su trabajo ms importante hacia el cmputo en la nube; el sus suscriptores y anunciantes. Una encuesta reciente entre
nmero del 30 de mayo de 2011 incluy un reportaje sobre los estadounidenses revel que 90% de los suscriptores de
la crisis del U.S. Postal Service, y el nmero del 1 de agosto Bloomberg Businessweek utiliza una computadora perso-
de 2011 contena un reportaje sobre las razones por las que nal en su hogar, y que 64% realiz compras por computadora
la crisis por endeudamiento era peor de lo que se pensaba. en el trabajo. Estas estadsticas alertaron a los directivos de
Adems, Bloomberg Businessweek proporciona estadsti- la revista sobre el inters de los suscriptores en los nuevos
cas sobre el estado de la economa, que incluyen ndices de avances en computacin. Los resultados de la encuesta tam-
produccin, precios de las acciones, fondos de inversin y bin se pusieron a disposicin de los posibles anunciantes.
tasas de inters. El alto porcentaje de suscriptores que usan computadoras
Bloomberg Businessweek tambin utiliza informacin personales en el hogar y de los que realizan compras por
estadstica en la administracin de su propia empresa. Por internet en su trabajo son un incentivo para que un fabri-
ejemplo, una encuesta anual aplicada a los suscriptores per- cante de estos equipos considere anunciarse en Bloomberg
mite a la empresa obtener sus datos demogrficos, hbitos Businessweek.
de lectura, compras probables, su estilo de vida, etc. Los di- En este captulo se estudian los tipos de datos de que
se dispone para el anlisis estadstico y se describe cmo se
* Los autores agradecen a Charlene Trentham, gerente de investigacin
obtienen los mismos. La estadstica descriptiva y la inferen-
de BusinessWeek, por proporcionar este artculo para la seccin Esta- cia estadstica se presentan como medios para convertir los
dstica en la prctica. datos en informacin fcil de interpretar.
La montaa rusa The Wild Eagle de Dollywood en Pigeon Forge, Tennessee, alcanza una
velocidad mxima de 61 millas por hora (sitio web de USA Today, 5 de abril de 2012).
El nmero de usuarios registrados en Pinterest, el servicio del sitio web para compartir
fotografas, creci 85% entre mediados de enero y mediados de febrero (CNBC, 29 de
marzo de 2012).
El Pew Research Center report que la mediana de la edad a la que las novias contraen
matrimonio por primera vez en Estados Unidos alcanz un mximo histrico de 26.5
aos (Significance, febrero de 2012).
Los canadienses registraron un promedio de 45 horas conectados en lnea durante el
cuarto trimestre del 2011 (CBC News, 2 de marzo de 2012).
La Reserva Federal de Estados Unidos report que la deuda promedio en tarjetas de
crdito es de 5 204 dlares por persona (sitio web PRWeb, 5 de abril de 2012).
Los datos numricos en las frases anteriores (8.2%, 23.2, $121 300, 61, 85%, 26.5, 45, $5 204)
se llaman estadsticas. En este sentido, el trmino estadstica se refiere a datos numricos como
promedios, medias, porcentajes e ndices que nos ayudan a entender una variedad de situaciones
de los negocios y la economa. Sin embargo, como ver ms adelante, el campo, o materia, de la
estadstica abarca mucho ms que los datos numricos. En un sentido ms amplio, la estadstica
se define como el arte y la ciencia de recolectar, analizar e interpretar datos. En particular en los
negocios y la economa, la informacin que se obtiene a partir de la recoleccin, el anlisis, la
presentacin y la interpretacin de los datos permite a los administradores o gerentes y a quienes
toman decisiones comprender mejor los entornos econmico y de negocios, y por lo tanto tomar
decisiones mejores y ms informadas. En este libro se enfatiza el uso de la estadstica para la
toma de decisiones en ambos mbitos.
El captulo 1 comienza con algunos ejemplos de aplicaciones de la estadstica en los ne-
gocios y la economa. En la seccin 1.2 se define el trmino dato y se introduce el concepto de
banco de datos. Esta seccin tambin presenta trminos clave como variables y observaciones;
estudia la diferencia entre datos cuantitativos y categricos, e ilustra los usos de los datos de cor-
te transversal y de series de tiempo. En la seccin 1.3 se analiza cmo se obtienen los datos de
fuentes existentes o por medio de estudios experimentales diseados para obtener datos nuevos.
Tambin se destaca el papel importante que juega hoy internet en la obtencin de datos. Los usos
de los datos en el desarrollo de la estadstica descriptiva y la elaboracin de inferencias estads-
ticas se describen en las secciones 1.4 y 1.5. Las ltimas tres secciones tratan sobre la funcin de
la computadora en el anlisis estadstico, y presentan una introduccin al campo relativamente
nuevo de la minera de datos y un anlisis de los lineamientos ticos para la prctica estadstica.
Al final del captulo se incluye un apndice con una introduccin al complemento StatTools que
se usa para ampliar las opciones estadsticas a los usuarios de Microsoft Excel.
Contabilidad
Las firmas de contabilidad pblicas utilizan procedimientos de muestreo estadstico cuando
realizan auditoras para sus clientes. Por ejemplo, suponga que una firma contable quiere de-
terminar si el estado de cuenta de un cliente representa de manera precisa el monto real de las
cuentas por cobrar. La gran cantidad de cuentas por cobrar hace que la revisin y la validacin
de cada cuenta consuman demasiado tiempo y dinero. Como prctica comn en este tipo de
situaciones, el personal de auditora selecciona un subconjunto de las cuentas llamado muestra.
Despus de revisar la precisin de la seleccin que tom como muestra, los auditores llegan a
4 Captulo 1 Los datos y la estadstica
una conclusin con respecto a si el monto de las cuentas por cobrar que aparece en el estado de
cuenta del cliente es aceptable.
Finanzas
Los analistas financieros utilizan una variedad de informacin estadstica como gua para sus
recomendaciones de inversin. En el caso de las acciones, revisan diversos datos financieros que
incluyen las razones precio/utilidad y el rendimiento por concepto de dividendos. Al comparar
la informacin para una accin con datos sobre los promedios del mercado de valores, un ana-
lista financiero puede formular una conclusin acerca de si una accin es una buena inversin.
Por ejemplo, el nmero del 19 de marzo de 2012 de The Wall Street Journal report que el
rendimiento promedio por concepto de dividendos de las 500 grandes empresas S&P 500 fue
de 2.2%. Microsoft, en especfico, obtuvo un rendimiento por concepto de dividendos de 2.42%.
En este caso, la informacin estadstica sobre el rendimiento por concepto de dividendos indica
una cifra superior de los dividendos de Microsoft sobre el promedio de dividendos de las empre-
sas S&P 500. Esta informacin sobre Microsoft, junto con otra, ayuda a los analistas a realizar
recomendaciones para conservar, vender o comprar acciones de Microsoft.
Marketing
Los escneres electrnicos en las cajas de cobro de las tiendas minoristas recolectan datos para
diversas aplicaciones de investigacin de mercados. Por ejemplo, proveedores de datos como
ACNielsen e Information Resources, Inc. compran datos de los escneres en puntos de venta
como las tiendas de abarrotes, los procesan y luego venden resmenes estadsticos a los fabri-
cantes. Estos ltimos gastan cientos de miles de dlares por categora de producto para obtener
este tipo de datos. Los fabricantes tambin compran datos y resmenes estadsticos sobre acti-
vidades promocionales, como la asignacin de precios especiales y el uso de exhibidores dentro
de las tiendas. Los gerentes de marca pueden revisar las estadsticas de los escneres y de la
actividad promocional para comprender mejor la relacin entre las actividades de promocin y
las ventas. Estos anlisis a menudo son tiles para establecer estrategias de futuras marketing
para diversos productos.
Produccin
El nfasis actual en la calidad hace que su control sea una aplicacin importante de la estadstica
en la produccin. Diversas grficas estadsticas de control de calidad se usan para monitorear el
resultado de un proceso de produccin. En particular, una grfica x barra sirve para monitorear
el resultado promedio. Suponga, por ejemplo, que una mquina llena envases con 12 onzas de
una bebida refrescante. En forma peridica, un empleado de produccin selecciona una mues-
tra de envases y calcula el nmero promedio de onzas en la muestra. Este promedio, o valor
x barra, se traza en una grfica x barra. Un valor trazado sobre el lmite superior de control de la
grfica indica que hay un exceso en el llenado, y un valor trazado por debajo del lmite inferior
de control indica que el llenado es deficiente. El proceso se considera bajo control y permite
continuar siempre que los valores x barra trazados se encuentren dentro de los lmites de control
superior e inferior de la grfica. Si se interpreta de manera adecuada, una grfica x barra ayuda a
determinar cundo es necesario realizar ajustes para corregir un proceso de produccin.
Economa
Los economistas a menudo proporcionan pronsticos sobre la economa o algn otro tema
relacionado. Utilizan diferente informacin estadstica para elaborarlos. Por ejemplo, para pro-
nosticar las tasas de inflacin recurren a informacin estadstica sobre indicadores como el
ndice de precios al consumidor, la tasa de desempleo y el uso de la capacidad de manufactura.
Estos indicadores se introducen con frecuencia en modelos computarizados de pronsticos que
predicen las tasas de inflacin.
Las aplicaciones de la estadstica, como las descritas en esta seccin, son parte integral de
este libro. Estos ejemplos proporcionan una descripcin general de gran diversidad de apli-
1.2 Datos 5
Sistemas de informacin
Los administradores de sistemas de informacin son responsables de la operacin cotidiana de
las redes de cmputo de una organizacin. Una gran variedad de informacin estadstica les
ayuda a evaluar el desempeo de dichas redes, como las redes de rea local (LAN), redes de
rea amplia (WAN), segmentos de redes, intranets y otros sistemas de comunicacin de datos.
Las estadsticas, como el nmero medio de usuarios del sistema, la cantidad de tiempo que un
componente del sistema no funciona y la proporcin de ancho de banda que se utiliza en varios
momentos del da son ejemplos de informacin estadstica que ayuda a los administradores de
los sistemas a comprender y manejar mejor las redes de cmputo.
1.2 Datos
Los datos son los hechos y las cifras recabados, analizados y resumidos para su presentacin e
interpretacin. Todos los datos recabados en un estudio en particular se conocen como banco o
conjunto de datos del estudio. La tabla 1.1 presenta un banco de datos que contiene informa-
cin sobre 60 pases que participan en la Organizacin Mundial de Comercio. Esta organizacin
fomenta el libre flujo del comercio internacional y proporciona un foro para resolver disputas
comerciales.
1
The Fitch Group es una de tres organizaciones de estadsticas, reconocidas a nivel nacional, designadas por la U.S.
Securities and Exchange Commission. Las otras dos son Standard and Poors y Moodys.
6 Captulo 1 Los datos y la estadstica
TABLA 1.1 Banco de datos de 60 pases que participan en la Organizacin Mundial de Comercio
mediciones para la segunda observacin (Austria) es Miembro, 40 800, 33 304 157, AAA y
Estable. Un banco de datos de 60 elementos contiene 60 observaciones
Escalas de medicin
La recoleccin de datos requiere una de las escalas de medicin siguientes: nominal, ordinal,
de intervalo o de razn. La escala de medicin determina la cantidad de informacin contenida
en los datos e indica la manera ms apropiada de resumirlos y analizarlos estadsticamente.
Cuando los datos de una variable se componen de etiquetas o nombres utilizados para iden-
tificar un atributo del elemento, la escala de medicin se considera una escala nominal. Por
ejemplo, al observar los datos de la tabla 1.1 se observa que la escala de medicin para la varia-
ble estatus en la OMC es nominal, porque miembro (member) y observador (observer) son
etiquetas que se usan para identificar la categora del estatus del pas. En tales casos se puede
utilizar un cdigo numrico o etiquetas no numricas. Por ejemplo, para facilitar la recoleccin
y preparacin de los datos con la finalidad de introducirlos en una base de datos computarizada,
podra utilizarse un cdigo numrico para la variable estatus en la OMC (WTO Status) que
establezca que 1 denota un pas miembro de la Organizacin Mundial de Comercio y 2 un pas
observador. La escala de medicin es nominal a pesar de que los datos aparecen como valores
numricos.
La escala de medicin de una variable se llama escala ordinal si los datos exhiben las
propiedades de los datos nominales y su orden o clasificacin es significativo. Por ejemplo, en
relacin con la tabla 1.1, la escala de medicin para Ritch Rating es ordinal, porque las etiquetas
de rating o calificacin que van desde AAA hasta F pueden ordenarse desde la mejor calificacin
crediticia AAA hasta la peor, que es F. Las letras que indican la calificacin proporcionan etique-
tas similares a los datos nominales, pero adems pueden clasificarse u ordenarse con base en la
calificacin crediticia, lo que hace que la escala sea ordinal. Los datos ordinales tambin pueden
proporcionarse por medio de un cdigo numrico, por ejemplo, su nmero de lista en clase.
En una escala de intervalo para una variable, los datos presentan todas las propiedades
de los datos ordinales, y el intervalo entre los valores se expresa en trminos de una unidad de
medida fija. Los datos de intervalo son siempre numricos. Las calificaciones de la prueba
de aptitudes Scholastic Aptitude Test (SAT) son un ejemplo de datos escala de intervalo. Por
ejemplo, tres estudiantes que obtuvieron las calificaciones 620, 550 y 470 en una prueba o exa-
men de matemticas llamada SAT pueden clasificarse u ordenarse en funcin del mejor al peor
desempeo. Adems, las diferencias entre las puntuaciones son significativas. Por ejemplo, el
estudiante 1 obtuvo 620 550 70 puntos ms que el estudiante 2, mientras que ste obtuvo
550 470 80 puntos ms que el estudiante 3.
En una escala de razn para una variable los datos tienen todas las propiedades de los
datos de intervalo, y la razn de los dos valores es significativa. Para la medicin de variables
como la distancia, la estatura, el peso y el tiempo se usa la escala de razn. sta requiere que
se incluya un valor cero para indicar que en este punto no existe un valor para la variable. Por
ejemplo, considere el costo de un automvil. Un valor cero para el costo indicara que el vehcu-
lo no tiene costo, es gratis. Adems, si se compara el costo de un automvil de $30 000 con el
8 Captulo 1 Los datos y la estadstica
costo de un segundo automvil de $15 000, la propiedad de la razn muestra que el primero
cuesta $30 000/$15 000 2 veces, o el doble, que el segundo.
FIGURA 1.1 Precio promedio por galn de la gasolina regular en Estados Unidos
$4.50
$4.00
$3.00
$2.50
$2.00
$1.50
$1.00
$0.50
$0.00
Ene 07 Ago 07 Mar 08 Oct 08 May 09 Dic 09 Jul 10 Feb 11 Sep 11 Mar 12
Fecha
La grfica (B) muestra la utilidad neta de McDonalds Inc. desde 2005 hasta 2011. Las
condiciones econmicas en declive de 2008 y 2009 fueron realmente benficas para la empresa,
ya que dicha utilidad alcanz un mximo histrico. Este crecimiento en la utilidad neta demos-
tr que la empresa estaba prosperando durante la crisis econmica, cuando la gente empez a
restringir sus gastos y prefera las alternativas ms econmicas ofrecidas por McDonalds en
lugar de los restaurantes tradicionales ms caros. La utilidad neta de McDonalds continu au-
mentando hasta alcanzar un nuevo mximo histrico en 2010 y 2011.
La grfica (C) muestra la serie de tiempo para la tasa de ocupacin de los hoteles en el sur
de Florida durante un periodo de un ao. Las tasas ms altas, 95 y 98%, ocurren durante los
meses de febrero y marzo, cuando el clima de la regin es atractivo para los turistas. De he-
cho, la temporada de ocupacin ms alta para los hoteles del sur de Florida es de enero a abril
de cada ao. Por otra parte, observe las menores tasas de ocupacin durante los meses de agosto
a octubre, periodo en cual se encuentra el indicador ms bajo de 50% durante septiembre. Las
altas temperaturas y la temporada de huracanes son las razones principales de la cada en la
ocupacin de los hoteles durante este periodo.
NOTAS Y COMENTARIOS
1. Una observacin es el conjunto de mediciones ob- 2. Los datos cuantitativos pueden ser discretos o con-
tenido para cada elemento de un banco de datos. tinuos. Los datos cuantitativos que miden cuntos
Por consiguiente, el nmero de observaciones es (por ejemplo, el nmero de llamadas recibidas en
siempre igual al nmero de elementos. El nmero 5 minutos), son discretos. Los datos cuantitativos
de mediciones obtenidas para cada elemento es que miden cunto (por ejemplo, el peso o el tiem-
igual al nmero de variables. Por ende, el nmero po), son continuos debido a que no hay una sepa-
total de elementos de datos se determina multipli- racin entre los valores de datos posibles.
cando el nmero de observaciones por el nmero
de variables.
10 Captulo 1 Los datos y la estadstica
16 000
6
Utilidad neta (miles de millones $)
0
2005 2006 2007 2008 2009 2010 2011
Ao
(B) Utilidad neta de McDonalds Inc.
100
Porcentaje de ocupacin
80
60
40
20
0
n
p
e
ic
go
ar
br
ay
ct
ov
l
En
Ju
Se
Fe
Ju
D
M
O
A
A
M
Mes
(C) Tasa de ocupacin de los hoteles del sur de Florida
1.3 Fuentes de datos 11
Fuentes existentes
En algunos casos, los datos necesarios para una aplicacin en particular ya existen. Las empre-
sas mantienen diversas bases de datos de sus empleados, clientes y operaciones de negocios.
Los datos sobre los sueldos, la edad y los aos de experiencia de los empleados se obtienen por
lo general de los registros internos del personal. Otros registros internos contienen datos sobre
ventas, gastos de publicidad, costos de distribucin, niveles de inventario y cantidades de pro-
duccin. La mayora de las empresas mantiene tambin datos detallados sobre sus clientes. La
tabla 1.2 muestra algunos de los datos de que se dispone por lo general a partir de los registros
internos de una empresa.
Las organizaciones que se especializan en la recoleccin y el mantenimiento de datos pro-
veen cantidades significativas de informacin econmica y de negocios. Las empresas tienen
acceso a estas fuentes de datos externos por medio de acuerdos o al comprarlos. Dun & Bradstreet,
Bloomberg y Dow Jones & Company son tres empresas que ofrecen extensos servicios de ba-
ses de datos a sus clientes. ACNielsen e Information Resources, Inc. ha logrado el xito en
su negocio de recoleccin y procesamiento de datos que vende a anunciantes y fabricantes de
productos.
Tambin se obtienen datos de diversas asociaciones de la industria y de organizaciones de
inters especial. Travel Industry Association of America mantiene informacin relacionada con
viajes, como el nmero de turistas y los gastos de viaje por estado. Estos datos son de inters para
las empresas y personas de la industria del ramo. El Graduate Management Admission Council
cuenta con datos sobre calificaciones de exmenes, caractersticas de los estudiantes y progra-
mas sobre administracin de educacin universitaria. La mayora de los datos provenientes de
estos tipos de fuentes se proveen a usuarios calificados por un costo moderado.
Internet es una fuente importante de datos e informacin estadstica. Casi todas las empresas
tienen una pgina web que proporciona informacin general acerca de la organizacin, as como
datos sobre ventas, nmero de empleados y de productos, el precio de los productos y sus especi-
ficaciones. Adems, varias empresas se especializan en proveer informacin a travs de Internet,
gracias a lo cual se puede tener acceso a cotizaciones de acciones, precios de los platillos en los
restaurantes, datos sobre sueldos y una variedad casi infinita de informacin.
Las agencias gubernamentales son otra fuente importante de datos existentes. Por ejem-
plo, el Departamento del Trabajo de Estados Unidos maneja una gran cantidad de datos sobre
las tasas de empleo, las tasas salariales, el porcentaje de la poblacin activa y la afiliacin a
TABLA 1.2 Ejemplos de datos disponibles de los registros o expedientes internos de una empresa
sindicatos. La tabla 1.3 lista algunas agencias gubernamentales seleccionadas y algunos de los
datos que proporcionan. La mayora de las dependencias que recaba y procesa datos tambin
los pone a disposicin de los usuarios por medio de un sitio web. La figura 1.3 muestra la pgi-
na principal del sitio web de la Oficina de Estadsticas Laborales de Estados Unidos.
Estudios estadsticos
Se cree que el estudio Algunas veces los datos necesarios para alguna aplicacin no estn disponibles a travs de las
estadstico experimental
ms grande jams realizado
fuentes existentes. En estos casos suelen obtenerse mediante estudios estadsticos, los cuales se
es el experimento para clasifican en experimentales u observacionales.
la vacuna Salk contra la En un estudio experimental se identifica primero la variable de inters. Luego se toma una
polio del Servicio de Salud o ms variables y se controlan para obtener datos de cmo influyen en la variable de inters. Por
Pblica efectuado en 1954. ejemplo, una compaa farmacutica podra interesarse en realizar un experimento para ente-
Se seleccionaron casi
2 millones de nios de
rarse de cmo afecta un nuevo medicamento la presin sangunea. sta es la variable de inters
1o., 2o. y 3er. grados en el estudio. El nivel de dosis del medicamento nuevo es otra variable que se espera que tenga
de enseanza elemental de un efecto causal en la presin sangunea. Para obtener datos sobre el efecto del nuevo frmaco,
todo Estados Unidos. los investigadores seleccionan una muestra de individuos. El nivel de dosis del medicamento
est controlado, ya que a los distintos grupos de individuos se les suministran dosis diferentes.
CAPTULO
Estadstica descriptiva:
Medidas numricas
CONTENIDO Teorema de Chebyshev
ESTADSTICA EN LA PRCTICA: Regla emprica
SMALL FRY DESIGN Deteccin de observaciones
atpicas
3.1 MEDIDAS DE POSICIN
O LOCALIZACIN 3.4 RESMENES DE CINCO
Media NMEROS Y DIAGRAMAS
Media ponderada DE CAJA
Mediana Resumen de cinco nmeros
Media geomtrica Diagrama de caja
Moda 3.5 MEDIDAS DE ASOCIACIN
Percentiles ENTRE DOS VARIABLES
Cuartiles Covarianza
3.2 MEDIDAS DE VARIABILIDAD Interpretacin de la covarianza
Rango Coeficiente de correlacin
Rango intercuartlico o intercuartil Interpretacin del coeficiente
Varianza de correlacin
Desviacin estndar 3.6 DATA DASHBOARDS O
Coeficiente de variacin TABLEROS DE DATOS:
3.3 MEDIDAS DE LA FORMA DE INCORPORACIN
LA DISTRIBUCIN, POSICIN DE MEDIDAS NUMRICAS
RELATIVA Y DETECCIN DE PARA MEJORAR
OBSERVACIONES ATPICAS SU EFICACIA
Forma de la distribucin
Valor z
100 Captulo 3 Estadstica descriptiva: Medidas numricas
ESTADSTICA en LA PRCTICA
SMALL FRY DESIGN*
SANTA ANA, CALIFORNIA
Small Fry Design, fundada en 1997, es una empresa de ju-
guetes y accesorios que disea e importa productos para
nios. Su lnea de artculos incluye osos de peluche, mvi-
les, juguetes musicales, sonajas y cobertores de seguridad,
y presenta diseos de juguetes de alta calidad para beb con
un nfasis en los colores, las texturas y los sonidos. Los pro-
ductos se disean en Estados Unidos y se fabrican en China.
Small Fry Design emplea representantes independien-
tes para la venta de sus productos a minoristas de muebles
infantiles, tiendas de accesorios y ropa para nios, negocios
de regalos, tiendas departamentales exclusivas e importan-
tes compaas de ventas por catlogo. En la actualidad, los
productos de Small Fry Design se distribuyen en ms de
1 000 puntos minoristas de venta en todo Estados Unidos.
La administracin del flujo de efectivo es una de las Small Fry Design aplica la estadstica descriptiva para
actividades ms importantes para la operacin diaria de monitorear sus cuentas por cobrar y su flujo de efectivo
esta empresa. Garantizar que dicho flujo entrante sea su- entrante. Robert Dant/Alamy Limited.
ficiente para cumplir con las obligaciones de deudas tanto
corrientes como a corto plazo puede significar la diferencia
entre el xito y el fracaso. Un factor crtico en la adminis-
tracin del flujo de efectivo es el anlisis y control de las
La interpretacin de estos datos estadsticos muestra que
cuentas por cobrar. Al medir el tiempo promedio de cobro
el tiempo promedio de cobro de una factura es de 40 das.
y el valor monetario de las facturas pendientes, la geren-
La mediana seala que la mitad de estos documentos per-
cia puede predecir la disponibilidad de efectivo y monito-
manece pendiente 35 das o ms. La moda de 31 das, el
rear los cambios en el estado de las cuentas por cobrar. La
tiempo de cobro de una factura ms frecuente, indica que
empresa estableci las metas siguientes: la antigedad pro-
el lapso ms comn en que sta permanece pendiente es
medio de las facturas pendientes no debe exceder los 45
de 31 das. El resumen estadstico indica tambin que slo
das y el valor de las facturas con una antigedad mayor de
3% del valor de todas las cuentas por cobrar tiene un tiem-
60 das no debe exceder 5% del valor de todas las cuentas
po de cobro de ms de 60 das. Con base en la informa-
por cobrar.
cin estadstica, la gerencia qued satisfecha, dado que las
En un resumen reciente del estado de las cuentas por
cuentas por cobrar y el flujo de efectivo entrante estaban
cobrar se proporcion los siguientes estadsticos descripti-
bajo control.
vos para la antigedad de las facturas pendientes.
En este captulo aprender a calcular e interpretar al-
Media 40 das gunas de las medidas estadsticas que utiliza Small Fry De-
Mediana 35 das sign. Adems de la media, la mediana y la moda, aprender
Moda 31 das otros estadsticos descriptivos, como el rango, la varianza,
la desviacin estndar, los percentiles y la correlacin. Es-
* Los autores agradecen a John A. McCarthy, presidente de Small Fry tas medidas numricas ayudan a la comprensin e interpre-
Design, por proporcionar este artculo para Estadstica en la prctica. tacin de los datos.
En el captulo 2 se estudiaron las presentaciones tabulares y grficas utilizadas para resumir los
datos. En este captulo se presentan varias medidas numricas que proporcionan otras opcio-
nes para la misma tarea.
Primero se ver el desarrollo de medidas numricas para conjuntos de datos que constan
de una sola variable. Cuando un conjunto de datos contiene ms de una variable, las mismas
medidas numricas se calculan por separado para cada variable. Sin embargo, en el caso de dos
variables, se desarrollarn tambin medidas de la relacin entre stas.
3.1 Medidas de posicin o localizacin 101
Se presentan las medidas numricas de posicin, dispersin, forma y asociacin. Si las me-
didas se calculan para los datos de una muestra, se les llama estadstico muestral. Si se calculan
para los datos de una poblacin, se les llama parmetros poblacionales. En la inferencia esta-
dstica, un estadstico muestral se conoce como estimador puntual del parmetro poblacional
correspondiente. En el captulo 7 se ver con ms detalle el proceso de la estimacin puntual.
En los tres apndices del captulo se explica cmo se usan Minitab, Excel y StatTools para
calcular las medidas numricas descritas en el captulo.
xi x1 x2 . . . xn
46 54 42 46 32
La notacin x1, x2, x3, x4, x5 se utiliza para representar el nmero de estudiantes en cada uno de
los cinco grupos.
x1 46 x2 54 x3 42 x4 46 x5 32
xi x x2 x3 x4 x5 46 54 42 46 32
x 1 44
n 5 5
La media muestral del tamao del grupo es 44 estudiantes.
Para proporcionar una perspectiva visual de la media y mostrar cmo puede ser influida por
valores extremos, observe el diagrama de puntos para el tamao de un grupo que se muestra en
la figura 3.1. Considere el eje horizontal del diagrama de puntos como una larga tabla estrecha
102 Captulo 3 Estadstica descriptiva: Medidas numricas
FIGURA 3.1 La media como centro de balance para el diagrama de puntos del tamao
de un aula de clase
30 35 40 45 50 55
en la que cada punto tiene el mismo peso fijo y la media es el punto en el que colocaramos un
soporte o punto de giro bajo la tabla para mantener en equilibrio el diagrama de puntos. Es-
te es el mismo principio que usa un sube y baja en un parque, la nica diferencia radica en
que este juego tiene su soporte en el centro, para que cuando un extremo suba el otro baje.
Ahora considere lo que ocurrira en la balanza si el nmero ms grande fuera 114 en vez de 54.
Para restablecer el equilibrio, tendramos que mover hacia una direccin positiva el soporte
debajo de un nuevo punto. Para determinar qu tanto debe moverse el soporte, se debe calcular
la media muestral para el tamao modificado del grupo.
xi x x2 . . . x12
x 1
n 12
3 850 3 950 . . . 3 880
12
47 280
3 940
12
Monthly Monthly
Graduate Starting Salary ($) Graduate Starting Salary ($)
1 3 850 7 3 890
2 3 950 8 4 130
WEB file 3 4 050 9 3 940
2012StartSalary 4 3 880 10 4 325
5 3 755 11 3 920
6 3 710 12 3 880
3.1 Medidas de posicin o localizacin 103
La ecuacin (3.1) ilustra cmo se calcula la media para una muestra con n observaciones.
La frmula para determinar la media de una poblacin es la misma, pero se emplea una notacin
diferente para indicar que se est trabajando con toda la poblacin. El nmero de observaciones
en una poblacin se denota con N y el smbolo para la media poblacional es .
Media ponderada
En la utilizacin de las frmulas para calcular la media muestral y la media poblacional, se
concede la misma importancia o peso a cada xi. Por ejemplo, la frmula de la media muestral
podra escribirse de la siguiente manera:
xi 1 1 1 1 1
x
n
n x i (x x2 . . . xn) (x1) (x2) . . . (xn)
n 1 n n n
Esto indica que cada uno de los elementos de la muestra tiene un peso de 1/n. Aunque esta es la
prctica ms comn, en algunos casos la media se calcula asignando a cada elemento un peso
que refleja su importancia relativa. Cuando se calcula as la media, se conoce como media
ponderada, que se calcula de la siguiente manera:
MEDIA PONDERADA
wi xi
x (3.3)
wi
donde
wi peso a observar de i
Cuando los datos provienen de una muestra, la ecuacin (3.3) proporcionar como resultado
la media muestral ponderada. Si los datos provienen de una poblacin, , reemplaza a x y la
ecuacin (3.3) proporcionar como resultado una media poblacional ponderada.
Para ejemplificar la necesidad de una media ponderada, considere la siguiente muestra de
cinco compras de materia prima durante los ltimos tres meses:
Observe que el costo por libra vara entre $2.80 y $3.40, y la cantidad adquirida vara entre
500 y 2 750 libras. Suponga que un gerente desea conocer el costo medio por libra de materia
prima. Dado que las cantidades solicitadas varan, debemos utilizar la frmula de la media
104 Captulo 3 Estadstica descriptiva: Medidas numricas
ponderada. Los cinco valores de costo por libra son x1 3.00, x2 3.40, x3 2.80, x4 2.90 y
x5 3.25. Para determinar la media ponderada del costo por libra se debe asignar un peso a cada
costo, con base en su cantidad correspondiente. Para este ejemplo, los pesos son w1 1 200,
w2 500, w3 2 750, w4 1 000 y w5 800. Con base en la ecuacin (3.3), la media ponde-
rada se calcula as:
Mediana
La mediana es otra medida de posicin central; es el valor de en medio cuando los datos estn
acomodados en orden ascendente (del valor menor al mayor). Con un nmero impar de obser-
vaciones, la mediana es el valor de en medio. Con un nmero par, no hay valor de en medio.
En este caso se sigue la convencin y la mediana se define como el promedio de los valores de
las dos observaciones de en medio. Por conveniencia, la definicin de la mediana se replantea
como sigue.
MEDIANA
Esta definicin se aplica para calcular la mediana de los tamaos de grupo para la muestra de
cinco grupos de estudiantes universitarios. Al ordenar los datos de forma ascendente se obtiene
la lista siguiente:
32 42 46 46 54
Dado que n 5 es impar, la mediana es el valor de en medio. As, la mediana del tamao del
grupo es 46 estudiantes. Aun cuando este conjunto de datos contiene dos observaciones con
valores de 46, cada una se trata de forma separada cuando los datos se acomodan en orden
ascendente.
3.1 Medidas de posicin o localizacin 105
Suponga adems que se calcula la mediana de los sueldos iniciales para los 12 licenciados
en administracin de empresas de la tabla 3.1. Primero se acomodan los datos en orden as-
cendente.
3 710 3 755 3 850 3 880 3 880 3 890 3 920 3 940 3 950 4 050 4 130 4 325
Los dos valores de en medio
3 890 3 920
Mediana 3 905
2
El procedimiento que se utiliza para calcular la mediana depende de si el nmero de elemen-
tos es par o impar. A continuacin se describe un enfoque ms conceptual y visual utilizando
el sueldo inicial de los 12 graduados en administracin de empresas. Al igual que se hizo antes,
comenzaremos por ordenar los datos en forma ascendente.
3 710 3 755 3 850 3 880 3 880 3 890 3 920 3 940 3 950 4 050 4 130 4 325
Una vez que los datos se encuentran en orden ascendente, se eliminan por pares los valores ex-
tremos altos y bajos, hasta que no queden pares de valores sin eliminar por completo los datos.
Por ejemplo, despus de eliminar el elemento menor (3 710) y el mayor (4 325), se obtiene un
nuevo conjunto de datos con 10 elementos.
3 710 3 755 3 850 3 880 3 880 3 890 3 920 3 940 3 950 4 050 4 130 4 325
Al eliminar el valor menor que sigue (3 755) y el siguiente valor mayor (4 130), obtendremos un
nuevo conjunto de datos con ocho observaciones.
3 710 3 755 3 850 3 880 3 880 3 890 3 920 3 940 3 950 4 050 4 130 4 325
3 710 3 755 3 850 3 880 3 880 3 890 3 920 3 940 3 950 4 050 4 130 4 325
3 710 3 755 3 850 3 880 3 880 3 890 3 920 3 940 3 950 4 050 4 130 4 325
3 710 3 755 3 850 3 880 3 880 3 890 3 920 3 940 3 950 4 050 4 130 4 325
En este punto no es posible continuar sin eliminar todos los datos, por lo tanto, la mediana es el
promedio de los dos valores restantes. Cuando existe un nmero par de elementos, el proceso de
eliminacin siempre concluir con dos valores restantes, y el promedio de estos dos valores ser
la mediana. Cuando existe un nmero impar de elementos, el proceso de eliminacin siempre
terminar en un valor final, que ser la mediana. Por lo anterior, este mtodo funciona tanto para
un nmero de elementos par como para uno impar.
La mediana es la medida Aunque la media es la medida de posicin central de uso ms comn, en algunas situaciones
de posicin que ms se se prefiere la mediana, ya que los valores de datos muy pequeos y muy grandes influyen en la
utiliza para los datos de los
media. Por ejemplo, suponga que uno de los licenciados recin graduados (tabla 3.1) tena un
ingresos anuales y el valor
de propiedad, debido a que sueldo inicial de $10 000 al mes (tal vez la empresa es propiedad de su familia). Si se cambia
algunos ingresos o valores el sueldo mensual inicial ms alto de la tabla 3.1 de $4 325 a $10 000 y se vuelve a calcular la
de propiedad muy grandes media, la media muestral pasa de $3 940 a $4 413. Sin embargo, la mediana de $3 905 permane-
pueden inflar la media. ce igual, ya que $3 890 y $3 920 siguen siendo los dos valores de en medio. Si el sueldo inicial
En tales casos, la mediana
es sumamente alto, la mediana proporciona una mejor medida de posicin central que la me-
es la medida preferida de
posicin central. dia. Al hacer una generalizacin, se afirma que siempre que un conjunto de datos contiene va-
lores extremos, la mediana suele ser la medida preferida de posicin central.
Anderson
Sweeney
E
l propsito de este libro es proporcionar una introduccin a los conceptos clave de la
estadstica, para lo cual emplea una orientacin fundamental hacia las aplicaciones del
Williams
anlisis de datos y la metodologa. El anlisis y el desarrollo de cada tcnica se presentan
desde esta perspectiva, cuyos resultados estadsticos permiten comprender las decisiones y
soluciones de los problemas. Camm
Entre los cambios relevantes en esta edicin, se pueden mencionar los siguientes:
ESTADSTICA DESCRIPTIVA. Se incorpora material nuevo sobre visualizacin de datos, mejores Cochran
prcticas, grficas de barras apiladas y de barras agrupadas. Tambin se integra una nueva seccin
sobre dashboards o tableros de datos y cmo incorporar resmenes estadsticos para mejorar su
eficacia.
PARA
ESTADSTICA
DISTRIBUCIONES DISCRETAS. Se incluye una nueva seccin sobre distribuciones bivariadas
discretas y sus aplicaciones en las finanzas, por ejemplo, cmo elaborar y analizar portafolios
financieros por medio de estas distribuciones.
NEGOCIOS Y ECONOMA
COMPARACIN DE MLTIPLES PROPORCIONES, PRUEBAS DE INDEPENDENCIA Y DE
BONDAD DE AJUSTE. Se incorpora una nueva seccin sobre pruebas de igualdad para tres o ms
proporciones poblacionales, as como un procedimiento para llevar a cabo pruebas de
comparaciones mltiples entre todos los pares de proporciones poblacionales. Tambin se
incluyen apndices revisados con instrucciones detalladas para Minitab, Excel y StatTools.
NUEVOS CASOS PRCTICOS. Se incluyen nuevos casos prcticos, los cuales brindan la
oportunidad de analizar bancos de datos ms grandes y preparar los informes gerenciales con
base en los resultados del anlisis.
NUEVAS APLICACIONES REALES. Cada captulo comienza con un caso real. Por ejemplo,
en el captulo 4 se describe cmo un equipo de la NASA aplic la probabilidad para ayudar
ESTADSTICA
en el conocido rescate de los 33 mineros chilenos atrapados en un derrumbe.
12 EDICIN
ISBN-13: 978-607-522-457-2
ISBN-10: 607-522-457-2