You are on page 1of 40

Anderson

Sweeney

E
l propsito de este libro es proporcionar una introduccin a los conceptos clave de la
estadstica, para lo cual emplea una orientacin fundamental hacia las aplicaciones del
Williams

anlisis de datos y la metodologa. El anlisis y el desarrollo de cada tcnica se presentan
desde esta perspectiva, cuyos resultados estadsticos permiten comprender las decisiones y
soluciones de los problemas. Camm
Entre los cambios relevantes en esta edicin, se pueden mencionar los siguientes:

ESTADSTICA DESCRIPTIVA. Se incorpora material nuevo sobre visualizacin de datos, mejores Cochran
prcticas, grficas de barras apiladas y de barras agrupadas. Tambin se integra una nueva seccin
sobre dashboards o tableros de datos y cmo incorporar resmenes estadsticos para mejorar su
eficacia.

PARA

ESTADSTICA
DISTRIBUCIONES DISCRETAS. Se incluye una nueva seccin sobre distribuciones bivariadas
discretas y sus aplicaciones en las finanzas, por ejemplo, cmo elaborar y analizar portafolios
financieros por medio de estas distribuciones.

NEGOCIOS Y ECONOMA
COMPARACIN DE MLTIPLES PROPORCIONES, PRUEBAS DE INDEPENDENCIA Y DE
BONDAD DE AJUSTE. Se incorpora una nueva seccin sobre pruebas de igualdad para tres o ms
proporciones poblacionales, as como un procedimiento para llevar a cabo pruebas de
comparaciones mltiples entre todos los pares de proporciones poblacionales. Tambin se
incluyen apndices revisados con instrucciones detalladas para Minitab, Excel y StatTools.

NUEVOS CASOS PRCTICOS. Se incluyen nuevos casos prcticos, los cuales brindan la
oportunidad de analizar bancos de datos ms grandes y preparar los informes gerenciales con
base en los resultados del anlisis.

NUEVAS APLICACIONES REALES. Cada captulo comienza con un caso real. Por ejemplo,
en el captulo 4 se describe cmo un equipo de la NASA aplic la probabilidad para ayudar

ESTADSTICA
en el conocido rescate de los 33 mineros chilenos atrapados en un derrumbe.

NUEVOS EJEMPLOS Y EJERCICIOS CON DATOS REALES. Se desarrollan


explicaciones y ejercicios para mostrar los mltiples usos de la estadstica en los

PARA NEGOCIOS Y ECONOMA


negocios a partir de estudios reales publicados en fuentes como The Wall Street
Journal, USA Today y Barrons. En total, esta edicin contiene ms de 350 ejemplos
y ejercicios de este tipo.

12 EDICIN

ISBN-13: 978-607-522-457-2
ISBN-10: 607-522-457-2

Anderson Sweeney Williams Camm Cochran

Visite nuestro sitio en http://latinoamerica.cengage.com


9 786075 224572
ESTADSTICA
PARA NEGOCIOS
Y ECONOMA
a. ed.
ESTADSTICA
PARA NEGOCIOS
Y ECONOMA
a. ed.
David R. Anderson
University of Cincinnati

Dennis J. Sweeney
University of Cincinnati

Thomas A. Williams
Rochester Institute of Technology

Jeffrey D. Camm
University of Cincinnati

James J. Cochran
Louisiana Tech University

Traduccin
Lorena Peralta Rosales
Traductor profesional

Revisin tcnica
Mara de Guadalupe Arroyo Satisteban Jos Cruz Ramos Bez
Academia de Matemticas ECEE Academia de Matemticas ECEE
Universidad Panamericana Universidad Panamericana

Ignacio Garca Jurez Iren Castillo Saldaa


Academia de Matemticas ECEE Academia de Matemticas ECEE
Universidad Panamericana Universidad Panamericana

Australia Brasil Corea Espaa Estados Unidos Japn Mxico Reino Unido Singapur
Estadstica para negocios y economa D.R. 2016 por Cengage Learning
Dcimosegunda edicin Editores, S.A. de C.V., una compaa
David R. Anderson, Dennis J. Sweeney, de Cengage Learning, Inc.
Thomas A. Williams, Jeffrey D. Camm, Corporativo Santa Fe
James J. Cochran Av. Santa Fe, nm. 505, piso 12
Col. Cruz Manca, Santa Fe
Presidente de Cengage Learning C.P. 05349, Mxico, D.F.
Latinoamrica Cengage Learning es una marca
Fernando Valenzuela Migoya registrada usada bajo permiso.

Director Editorial para Latinoamrica DERECHOS RESERVADOS. Ninguna parte de este trabajo
Ricardo H. Rodrguez amparado por la Ley Federal del Derecho de Autor podr
ser reproducida, transmitida, almacenada o utilizada,
Gerente de Adquisiciones para en cualquier forma o por cualquier medio, ya sea grfico,
Latinoamrica electrnico o mecnico, incluyendo, pero sin limitarse
Claudia C. Garay Castro a lo siguiente: fotocopiado, reproduccin, escaneo,
digitalizacin, grabacin en audio, distribucin en Internet,
Gerente de Manufactura para distribucin en redes de informacin o almacenamiento
Latinoamrica y recopilacin en sistemas de informacin, a excepcin
Antonio Mateos Martnez de lo permitido en el captulo III, artculo 27 de la Ley
Federal del Derecho de Autor, sin el consentimiento
Gerente Editorial de Contenidos en Espaol por escrito de la editorial.
Pilar Hernndez Santamarina
ExamView es una marca registrada de eInstruction
Gerente de Proyectos Especiales Corp. Windows es una marca registrada de Microsoft
Luciana Rabuffetti Corporation; se utiliza aqu bajo licencia. Macintosh y
Power Macintosh son marcas comerciales registradas de
Coordinador de Manufactura Apple Computer, Inc. utilizadas en este documento bajo
Rafael Prez Gonzlez licencia.
2008 Cengage Learning. Todos Los Derechos Reservados.
Editor Microsoft Excel es una marca comercial registrada
Javier Reyes Martnez de Microsoft Corporation. 2014 Microsoft.

Diseo de portada Traducido del libro:


Lilia Palomino Viveros Statistics for Business and Economics
RED Studio Twelfth edition
David R. Anderson, Dennis J. Sweeney,
Imagen de portada Thomas A. Williams, Jeffrey D. Camm,
Shutterstock James J. Cochran
254655451
Zadorozhnyi Viktor Publicado en ingls por
South-Western, Cengage Learning 2014
Composicin tipogrfica ISBN 978-1-133-27453-7
Heriberto Gachz Chvez
Datos para catalogacin bibliogrca:
Anderson, David R., Sweeney, Dennis J.
Williams, Thomas A., Camm, Jerey D.
Cochran, James J.
Estadstica para negocios y economa
Dcimosegunda edicin
ISBN-13: 978-607-522-515-9

Visite nuestro sitio en:


http://latinoamerica.cengage.com

Impreso en Mxico
1 2 3 4 5 6 7 18 17 16 15
Contenido

Prefacio xxv
Acerca de los autores xxix

Captulo 1 Los datos y la estadstica 1


Estadstica en la prctica. Bloomberg Businessweek 2
1.1 Aplicaciones en negocios y economa 3
Contabilidad 3
Finanzas 4
Marketing 4
Produccin 4
Economa 4
Sistemas de informacin 5
1.2 Datos 5
Elementos, variables y observaciones 5
Escalas de medicin 7
Datos categricos y cuantitativos 8
Datos de corte transversal y de series de tiempo 8
1.3 Fuentes de datos 11
Fuentes existentes 11
Estudios estadsticos 12
Errores en la adquisicin de datos 14
1.4 Estadstica descriptiva 14
1.5 Inferencia estadstica 16
1.6 Computadoras y anlisis estadstico 18
1.7 Minera de datos 18
1.8 Lineamientos ticos para la prctica de la estadstica 19
Resumen 21
Glosario 21
Ejercicios complementarios 22
Apndice Introduccin a StatTools 29

Captulo 2 Estadstica descriptiva: Presentaciones tabulares


y grficas 33
Estadstica en la prctica. Colgate-Palmolive Company 34
2.1 Resumen de datos para una variable cualitativa o categrica 35
Distribucin de frecuencia 35
Distribuciones de frecuencia relativa y frecuencia porcentual 36
x Contenido

Grficas de barras y circulares 36


2.2 Resumen de datos para una variable cuantitativa 42
Distribucin de frecuencia 42
Distribuciones de frecuencia relativa y de frecuencia porcentual 43
Diagrama de puntos 44
Histograma 44
Distribuciones acumuladas 46
Diagrama de tallo y hoja 47
2.3 Cmo resumir datos para dos variables por medio de tablas 55
Tabulacin cruzada 55
La paradoja de Simpson 58
2.4 Cmo resumir datos para dos variables por medio
de representaciones grficas 64
Diagrama de dispersin y lnea de tendencia 64
Grficas de barras apiladas y de barras agrupadas 65
2.5 Visualizacin de datos: Mejores prcticas en la elaboracin
de representaciones grficas efectivas 70
Cmo elaborar representaciones grficas efectivas 71
Seleccin del tipo de representacin grfica 72
Data dashboards o tableros de datos 72
La visualizacin de datos en la prctica: El zoolgico y jardn
botnico de Cincinnati 74
Resumen 77
Glosario 78
Frmulas clave 79
Ejercicios complementarios 79
Caso prctico 1 Pelican Stores 84
Caso prctico 2 Industria del cine 85
Apndice 2.1 Cmo usar Minitab para presentaciones tabulares y grficas 86
Apndice 2.2 Cmo usar Excel para presentaciones tabulares y grficas 88
Apndice 2.3 Cmo usar StatTools para presentaciones tabulares y grficas 98

Captulo 3 Estadstica descriptiva: Medidas numricas 99


Estadstica en la prctica. Small Fry Design 100
3.1 Medidas de posicin o localizacin 101
Media 101
Media ponderada 103
Mediana 104
Media geomtrica 106
Moda 107
Percentiles 108
Cuartiles 109
Contenido xi

3.2 Medidas de variabilidad 116


Rango 116
Rango intercuartlico o intercuartil 117
Varianza 117
Desviacin estndar 118
Coeficiente de variacin 119
3.3 Medidas de la forma de la distribucin, posicin relativa y deteccin
de observaciones atpicas 123
Forma de la distribucin 123
Valor z 123
Teorema de Chebyshev 125
Regla emprica 126
Deteccin de observaciones atpicas 127
3.4 Resmenes de cinco nmeros y diagramas de caja 130
Resumen de cinco nmeros 131
Diagrama de caja 131
3.5 Medidas de asociacin entre dos variables 136
Covarianza 136
Interpretacin de la covarianza 138
Coeficiente de correlacin 140
Interpretacin del coeficiente de correlacin 141
3.6 Data dashboards o tableros de datos: Incorporacin de medidas
numricas para mejorar su eficacia 145
Resumen 149
Glosario 149
Frmulas clave 150
Ejercicios complementarios 152
Caso prctico 1 Pelican Stores 157
Caso prctico 2 Industria del cine 158
Caso prctico 3 Escuelas de negocios de Asia-Pacfico 159
Caso prctico 4 Transacciones del sitio web de Heavenly Chocolates 161
Caso prctico 5 Las poblaciones de elefantes africanos 162
Apndice 3.1 Estadstica descriptiva usando Minitab 163
Apndice 3.2 Estadstica descriptiva usando Excel 165
Apndice 3.3 Estadstica descriptiva usando StatTools 167

Captulo 4 Introduccin a la probabilidad 169


Estadstica en la prctica. La probabilidad al rescate 170
4.1 Experimentos, reglas de conteo y asignacin de probabilidades 171
Reglas de conteo, combinaciones y permutaciones 172
Asignacin de probabilidades 176
Probabilidades para el proyecto de KP&L 178
4.2 Eventos y sus probabilidades 181
xii Contenido

4.3 Algunas relaciones bsicas de probabilidad 185


Complemento de un evento 185
Ley de la adicin 186
4.4 Probabilidad condicional 192
Eventos independientes 195
Ley de la multiplicacin 195
4.5 Teorema de Bayes 200
Mtodo tabular 203
Resumen 206
Glosario 206
Frmulas clave 207
Ejercicios complementarios 208
Caso prctico Jueces del condado de Hamilton 212

Captulo 5 Distribuciones discretas de probabilidad 215


Estadstica en la prctica. Citibank 216
5.1 Variables aleatorias 217
Variables aleatorias discretas 217
Variables aleatorias continuas 218
5.2 Desarrollo de distribuciones discretas de probabilidad 220
5.3 Valor esperado y varianza 225
Valor esperado 225
Varianza 225
5.4 Distribuciones bivariantes, covarianza y portafolios financieros 230
Distribucin discreta de probabilidad bivariante emprica 230
Aplicaciones financieras 233
Resumen 236
5.5 Distribucin binomial 239
Un experimento binomial 240
El problema de Martin Clothing Store 241
Cmo usar tablas de probabilidades binomiales 245
Valor esperado y varianza de la distribucin binomial 246
5.6 Distribucin de Poisson 250
Un ejemplo con intervalos de tiempo 250
Un ejemplo con intervalos de longitud o distancia 252
5.7 Distribucin hipergeomtrica 253
Resumen 257
Glosario 258
Frmulas clave 258
Ejercicios complementarios 260
Apndice 5.1 Distribuciones discretas de probabilidad con Minitab 263
Apndice 5.2 Distribuciones discretas de probabilidad con Excel 263
Contenido xiii

Captulo 6 Distribuciones continuas de probabilidad 265


Estadstica en la prctica. Procter & Gamble 266
6.1 Distribucin uniforme 267
El rea como medida de la probabilidad 268
6.2 Distribucin normal 271
Curva normal 271
Distribucin normal estndar 273
Clculo de probabilidades para cualquier distribucin normal 278
El problema de Grear Tire Company 279
6.3 Aproximacin mediante la distribucin normal de las probabilidades
binomiales 283
6.4 Distribucin exponencial 287
Clculo de probabilidades para la distribucin exponencial 287
Relacin entre las distribuciones de Poisson y exponencial 288
Resumen 290
Glosario 291
Frmulas clave 291
Ejercicios complementarios 291
Caso prctico Specialty Toys 294
Apndice 6.1 Distribuciones continuas de probabilidad con Minitab 295
Apndice 6.2 Distribuciones continuas de probabilidad con Excel 296

Captulo 7 Muestreo y distribuciones muestrales


o de muestreo 298
Estadstica en la prctica. MeadWestvaco Corporation 299
7.1 El problema de muestreo de Electronics Associates 300
7.2 Cmo seleccionar una muestra 301
Muestreo de una poblacin finita 301
Muestreo de una poblacin infinita 303
7.3 Estimacin puntual 306
Consejo prctico 308
7.4 Introduccin a las distribuciones muestrales o de muestreo 310
_
7.5 Distribucin de muestreo de x 312
_
Valor esperado de x 312
_
Desviacin estndar de x 313
_
Forma de la distribucin de muestreo de x 314
_
Distribucin de muestreo de x en el problema de EAI 316
_
Valor prctico de la distribucin de muestreo de x 317
Relacin entre el tamao de la muestra y la distribucin
_
de muestreo de x 318
_
7.6 Distribucin de muestreo de p 322
_
Valor esperado de p 323
_
Desviacin estndar de p 323
xiv Contenido

_
Forma de la distribucin de muestreo de p 324
_
Valor prctico de la distribucin de muestreo de p 324
7.7 Propiedades de los estimadores puntuales 328
Insesgadez 328
Eficiencia 329
Consistencia 330
7.8 Otros mtodos de muestreo 331
Muestreo aleatorio estratificado 331
Muestreo por conglomerados (o clusters) 331
Muestreo sistemtico 332
Muestreo de conveniencia 332
Muestreo subjetivo 333
Resumen 333
Glosario 334
Frmulas clave 335
Ejercicios complementarios 335
_
Apndice 7.1 Valor esperado y desviacin estndar de x 337
Apndice 7.2 Muestreo aleatorio con Minitab 339
Apndice 7.3 Muestreo aleatorio con Excel 340
Apndice 7.4 Muestreo aleatorio con StatTools 341

Captulo 8 Estimacin por intervalo 342


Estadstica en la prctica. Food Lion 343
8.1 Media poblacional:  conocida 344
Margen de error y estimacin por intervalo 344
Consejo prctico 348
8.2 Media poblacional:  desconocida 350
Margen de error y estimacin por intervalo 351
Consejo prctico 354
Uso de una muestra pequea 354
Resumen de los procedimientos de estimacin por intervalo 356
8.3 Determinacin del tamao de la muestra 359
8.4 Proporcin poblacional 362
Determinacin del tamao de la muestra 364
Resumen 367
Glosario 368
Frmulas clave 369
Ejercicios complementarios 369
Caso prctico 1 Revista Young Professional 372
Caso prctico 2 Gulf Real Estate Properties 373
Caso prctico 3 Metropolitan Research, Inc. 375
Apndice 8.1 Estimacin por intervalo con Minitab 375
Contenido xv

Apndice 8.2 Estimacin por intervalo usando Excel 377


Apndice 8.3 Estimacin por intervalo con StatTools 380

Captulo 9 Pruebas de hiptesis 382


Estadstica en la prctica. John Morrell & Company 383
9.1 Formulacin de las hiptesis nula y alternativa 384
La hiptesis alternativa como hiptesis de investigacin 384
La hiptesis nula como supuesto para desafiado 385
Resumen de las formas para las hiptesis nula y alternativa 386
9.2 Errores tipo I y tipo II 387
9.3 Media poblacional: conocida 390
Prueba de una cola 390
Prueba de dos colas 396
Resumen y consejo prctico 398
Relacin entre estimacin por intervalo y prueba de hiptesis 400
9.4 Media poblacional: desconocida 405
Prueba de una cola 405
Prueba de dos colas 406
Resumen y consejo prctico 408
9.5 Proporcin poblacional 411
Resumen 413
9.6 Pruebas de hiptesis y toma de decisiones 416
9.7 Clculo de la probabilidad de los errores tipo II 417
9.8 Determinacin del tamao de la muestra en una prueba de hiptesis
para la media poblacional 422
Resumen 425
Glosario 426
Frmulas clave 427
Ejercicios complementarios 427
Caso prctico 1 Quality Associates, Inc. 430
Caso prctico 2 Conducta tica de los estudiantes de negocios
en Bayview University 432
Apndice 9.1 Pruebas de hiptesis con Minitab 433
Apndice 9.2 Pruebas de hiptesis con Excel 435
Apndice 9.3 Pruebas de hiptesis con StatTools 439

Captulo 10 Inferencia estadstica acerca de medias y proporciones


con dos poblaciones 441
Estadstica en la prctica. U.S. Food and Drug Administration 442
10.1 Inferencias acerca de la diferencia entre dos medias poblacionales:
1 y 2 conocidas 443
Estimacin por intervalo para 1 2 443
xvi Contenido

Pruebas de hiptesis acerca de 1 2 445


Consejo prctico 447
10.2 Inferencias acerca de la diferencia entre dos medias poblacionales:
1 y 2 desconocidas 450
Estimacin por intervalo para 1 2 450
Pruebas de hiptesis acerca de 1 2 452
Consejo prctico 454
10.3 Inferencias acerca de la diferencia entre dos medias poblacionales:
muestras pareadas 458
10.4 Inferencias acerca de la diferencia entre dos proporciones
poblacionales 464
Estimacin por intervalo para p1 p2 464
Prueba de hiptesis acerca de p1 p2 466
Resumen 470
Glosario 471
Frmulas clave 471
Ejercicios complementarios 472
Caso prctico Par, Inc. 475
Apndice 10.1 Inferencias acerca de dos poblaciones usando Minitab 476
Apndice 10.2 Inferencias acerca de dos poblaciones usando Excel 478
Apndice 10.3 Inferencias acerca de dos poblaciones usando StatTools 479

Captulo 11 Inferencias acerca de varianzas poblacionales 482


Estadstica en la prctica. La U.S. Government Accountability Office 483
11.1 Inferencias acerca de una varianza poblacional 484
Estimacin por intervalo 484
Pruebas de hiptesis 488
11.2 Inferencias acerca de dos varianzas poblacionales 494
Resumen 501
Frmulas clave 501
Ejercicios complementarios 501
Caso prctico Programa de capacitacin de la Fuerza Area 503
Apndice 11.1 Varianzas poblacionales con Minitab 504
Apndice 11.2 Varianzas poblacionales con Excel 505
Apndice 11.3 Desviacin estndar poblacional simple con StatTools 505

Captulo 12 Comparaciones de mltiples proporciones,


pruebas de bondad de ajuste e independencia 507
Estadstica en la prctica. United Way 508
12.1 Pruebas de igualdad de proporciones poblacionales
para tres o ms poblaciones 509
Procedimiento de comparacin mltiple 514
Contenido xvii

12.2 Prueba de independencia 519


12.3 Prueba de bondad de ajuste 527
Distribucin de probabilidad multinomial 527
Distribucin de probabilidad normal 530
Resumen 536
Glosario 536
Frmulas clave 537
Ejercicios complementarios 537
Caso prctico Una agenda bipartidista para el cambio 540
Apndice 12.1 Pruebas de ji-cuadrada utilizando Minitab 541
Apndice 12.2 Pruebas de ji-cuadrada con Excel 542
Apndice 12.2 Pruebas de ji-cuadrada con StatTools 544

Captulo 13 Diseo de experimentos y anlisis de varianza 545


Estadstica en la prctica. Burke Marketing Services, Inc. 546
13.1 Introduccin al diseo de experimentos y al anlisis de varianza 547
Recoleccin de datos 548
Supuestos del anlisis de varianza 549
Anlisis de varianza: una perspectiva conceptual 549
13.2 Anlisis de varianza y diseo completamente aleatorizado 552
Estimacin de la varianza poblacional entre tratamientos 553
Estimacin de la varianza poblacional dentro de los tratamientos 554
Comparacin de las estimaciones de las varianzas: la prueba F 555
Tabla de ANOVA (anlisis de varianza) 557
Resultados de computadora para el anlisis de varianza 558
Prueba para la igualdad de k medias poblacionales: un estudio
observacional 559
13.3 Procedimientos de comparacin mltiple 563
LSD de Fisher 563
Tasas de error tipo I 566
13.4 Diseo de bloques aleatorizado 569
Prueba de estrs para controladores de trfico areo 570
Procedimiento ANOVA 571
Clculos y conclusiones 572
13.5 Experimento factorial 576
Procedimiento ANOVA 578
Clculos y conclusiones 578
Resumen 583
Glosario 584
Frmulas clave 584
Ejercicios complementarios 586
xviii Contenido

Caso prctico 1 Wentworth Medical Center 591


Caso prctico 2 Compensacin para vendedores profesionales 592
Apndice 13.1 Anlisis de varianza con Minitab 592
Apndice 13.2 Anlisis de varianza con Excel 594
Apndice 13.3 Anlisis de un diseo completamente aleatorizado
usando StatTools 597

Captulo 14 Regresin lineal simple 598


Estadstica en la prctica. Alliance Data Systems 599
14.1 Modelo de regresin lineal simple 600
Modelo de regresin y ecuacin de regresin 600
Ecuacin de regresin estimada 601
14.2 Mtodo de mnimos cuadrados 603
14.3 Coeficiente de determinacin 614
Coeficiente de correlacin 618
14.4 Supuestos del modelo 622
14.5 Prueba de significancia 623
Estimacin de 2 623
Prueba t 624
Intervalo de confianza para 1 626
Prueba F 627
Algunas advertencias acerca de la interpretacin de las pruebas
de significancia 629
14.6 Uso de la ecuacin de regresin estimada para estimacin
y prediccin 632
Estimacin por intervalo 633
Intervalo de confianza para el valor medio de y 634
Intervalo de prediccin para un solo valor de y 635
14.7 Solucin por computadora 640
14.8 Anlisis de residuales: validacin de los supuestos del modelo 644
Grfica de residuales contra x 645
Grfica de residuales contra y 646
Residuales estandarizados 648
Grfica de probabilidad normal 650
14.9 Anlisis de residuales: observaciones atpicas y observaciones
influyentes 653
Deteccin de observaciones atpicas 653
Deteccin de observaciones influyentes 656
Resumen 661
Glosario 661
Frmulas clave 662
Ejercicios complementarios 664
Caso prctico 1 Medicin del riesgo en el mercado burstil 671
Caso prctico 2 Departamento de Transporte de Estados Unidos 672
Caso prctico 3 Cmo seleccionar una cmara digital 673
Contenido xix

Caso prctico 4 Cmo encontrar el automvil de mayor valor 674


Apndice 14.1 Obtencin de la frmula de mnimos cuadrados con base
en el clculo 675
Apndice 14.2 Prueba de significancia usando correlacin 677
Apndice 14.3 Anlisis de regresin con Minitab 678
Apndice 14.4 Anlisis de regresin con Excel 678
Apndice 14.5 Anlisis de regresin con StatTools 681

Captulo 15 Regresin mltiple 682


Estadstica en la prctica. dunnhumby 683
15.1 Modelo de regresin mltiple 684
Modelo de regresin y ecuacin de regresin 684
Ecuacin de regresin mltiple estimada 684
15.2 Mtodo de mnimos cuadrados 685
Ejemplo: Butler Trucking Company 686
Nota sobre la interpretacin de los coeficientes 688
15.3 Coeficiente de determinacin mltiple 694
15.4 Supuestos del modelo 698
15.5 Prueba de significancia 699
Prueba F 699
Prueba t 702
Multicolinealidad 703
15.6 Uso de la ecuacin de regresin estimada para estimacin
y prediccin 706
15.7 Variables independientes cualitativas 709
Ejemplo: Johnson Filtration, Inc. 709
Interpretacin de los parmetros 711
Variables cualitativas ms complejas 713
15.8 Anlisis residual 717
Deteccin de observaciones atpicas 719
Residuales estudentizados eliminados y observaciones atpicas 719
Observaciones influyentes 720
Uso de la medida de la distancia de Cook para identificar
observaciones influyentes 720
15.9 Regresin logstica 724
Ecuacin de regresin logstica 725
Estimacin de la ecuacin de regresin logstica 726
Prueba de significancia 728
Aplicacin en la administracin 729
Interpretacin de la ecuacin de regresin logstica 729
Transformacin logit 732
Resumen 736
Glosario 736
Frmulas clave 737
xx Contenido

Ejercicios complementarios 739


Caso prctico 1 Consumer Research, Inc. 745
Caso prctico 2 Prediccin de victorias para los conductores de NASCAR 746
Caso prctico 3 Cmo encontrar el automvil de mayor valor 747
Apndice 15.1 Regresin mltiple con Minitab 748
Apndice 15.2 Regresin mltiple con Excel 748
Apndice 15.3 Regresin logstica con Minitab 750
Apndice 15.4 Anlisis de regresin mltiple con StatTools 750

Captulo 16 Anlisis de regresin: construccin de modelos 751


Estadstica en la prctica. Monsanto Company 752
16.1 Modelo lineal general 753
Modelado de relaciones curvilneas 753
Interaccin 756
Transformaciones que involucran a la variable dependiente 760
Modelos no lineales que son intrnsecamente lineales 763
16.2 Determinacin de cundo agregar o eliminar variables 767
Caso general 769
Uso de los valores-p 770
16.3 Anlisis de un problema mayor 773
16.4 Procedimientos de seleccin de variables 777
Regresin por pasos 777
Seleccin hacia adelante 778
Eliminacin hacia atrs 779
Regresin de los mejores subconjuntos 779
La eleccin final 780
16.5 Mtodo de regresin mltiple para el diseo de experimentos 783
16.6 Autocorrelacin y la prueba de Durbin-Watson 788
Resumen 792
Glosario 792
Frmulas clave 792
Ejercicios complementarios 793
Caso prctico 1 Anlisis de las estadsticas de la PGA Tour 796
Caso prctico 2 Clasificacin de vinos de la Regin de Piamonte en Italia 797
Apndice 16.1 Procedimientos de seleccin de variables con Minitab 798
Apndice 16.2 Procedimientos de seleccin de variables con StatTools 799

Captulo 17 Anlisis de series de tiempo y elaboracin


de pronsticos 800
Estadstica en la prctica. Nevada Occupational Health Center 801
17.1 Patrones de una serie de tiempo 802
Patrn horizontal 802
Contenido xxi

Patrn de tendencia 804


Patrn o componente estacional 804
Patrones estacional y de tendencia 805
Patrn cclico 805
Seleccin de un mtodo de elaboracin de pronsticos 807
17.2 Exactitud del pronstico 808
17.3 Promedios mviles y suavizamiento exponencial 813
Promedios mviles 813
Promedios mviles ponderados 816
Suavizamiento exponencial 816
17.4 Proyeccin de la tendencia 823
Regresin de tendencia lineal 823
Suavizamiento exponencial lineal de Holt 828
Regresin de tendencia no lineal 830
17.5 Estacionalidad y tendencia 836
Estacionalidad sin tendencia 836
Estacionalidad y tendencia 838
Modelos basados en datos mensuales 841
17.6 Descomposicin de series de tiempo 845
Clculo de los ndices estacionales 846
Desestacionalizacin de una serie de tiempo 849
Uso de una serie de tiempo desestacionalizada para identificar
tendencias 851
Ajustes estacionales 852
Modelos basados en datos mensuales 852
Patrn o componente cclico 852
Resumen 855
Glosario 856
Frmulas clave 857
Ejercicios complementarios 857
Caso prctico 1 Pronstico de ventas de alimentos y bebidas 861
Caso prctico 2 Elaboracin del pronstico de prdida de ventas 862
Apndice 17.1 Elaboracin de pronsticos con Minitab 864
Apndice 17.2 Elaboracin de pronsticos con Excel 866
Apndice 17.2 Elaboracin de pronsticos con StatTools 867

Captulo 18 Mtodos no paramtricos 870


Estadstica en la prctica. West Shell Realtors 871
18.1 La prueba de signos 872
Prueba de hiptesis acerca de una mediana poblacional 872
Prueba de hiptesis con muestras pareadas 877
18.2 Prueba de rangos con signo de Wilcoxon 880
18.3 Prueba de Mann-Whitney-Wilcoxon 885
18.4 Prueba de Kruskal-Wallis 895
xxii Contenido

18.5 Correlacin de rangos 900


Resumen 905
Glosario 905
Frmulas clave 906
Ejercicios complementarios 907
Apndice 18.1 Mtodos no paramtricos con Minitab 910
Apndice 18.2 Mtodos no paramtricos con Excel 912
Apndice 18.3 Mtodos no paramtricos con StatTools 914

Captulo 19 Mtodos estadsticos de control de la calidad 916


Estadstica en la prctica. Dow Chemical Company 917
19.1 Filosofas y marcos de referencia 918
El Malcolm Baldrige National Quality Award 919
ISO 9000 919
Six Sigma 919
Calidad en el sector servicios 922
19.2 Control estadstico de procesos 922
Grficas de control 923
Grfica x: media y desviacin estndar conocidas del proceso 924
Grfica x: media y desviacin estndar desconocidas del proceso 926
Grfica R 929
Grfica p 931
Grfica np 933
Interpretacin de las grficas de control 933
19.3 Muestreo de aceptacin 936
KALI, Inc.: un ejemplo de muestreo de aceptacin 937
Clculo de la probabilidad de aceptacin de un lote 938
Seleccin de un plan de muestreo de aceptacin 941
Planes de muestreo mltiple 943
Resumen 944
Glosario 944
Frmulas clave 945
Ejercicios complementarios 946
Apndice 19.1 Grficas de control con Minitab 948
Apndice 19.2 Grficas de control utilizando StatTools 949

Captulo 20 Nmeros ndice 951


Estadstica en la prctica. Oficina de Estadsticas Laborales, Departamento
del Trabajo de Estados Unidos 952
20.1 Precios relativos 953
20.2 ndices de precios agregados 953
20.3 Clculo del ndice de precios agregados a partir de los precios
relativos 957
Contenido xxiii

20.4 Algunos ndices importantes de precios 959


ndice de precios al consumidor 959
ndice de precios al productor 959
Promedios Dow Jones 960
20.5 Deflactacin de una serie mediante ndices de precios 961
20.6 ndices de precios: otras consideraciones 964
Seleccin de artculos 964
Seleccin de un periodo base 965
Variaciones en la calidad 965
20.5 ndices de cantidad 965
Resumen 967
Glosario 967
Frmulas clave 968
Ejercicios complementarios 968

Captulo 21 Anlisis de decisiones sitio web


Estadstica en la prctica. Ohio Edison Company 21-2
21.1 Formulacin del problema 21-3
Tablas de pagos 21-4
rboles de decisin 21-4
21.2 Toma de decisiones con probabilidades 21-5
Mtodo del valor esperado 21-5
Valor esperado de la informacin perfecta 21-7
21.3 Anlisis de decisiones con informacin muestral 21-13
rbol de decisin 21-14
Estrategia de decisin 21-15
Valor esperado de la informacin muestral 21-18
21.4 Clculo de probabilidades mediante el teorema de Bayes 21-24
Resumen 21-28
Glosario 21-29
Frmulas clave 21-30
Ejercicios complementarios 21-30
Caso prctico Estrategia de defensa en una demanda 21-33
Apndice Introduccin a PrecisionTree 21-34

Apndice Soluciones a los ejercicios de autoevaluacin y a los ejercicios pares 21-39

Captulo 22 Encuesta por muestreo sitio web


Estadstica en la prctica. Duke Energy 22-2
22.1 Terminologa que se utiliza en las encuestas por muestreo 22-2
22.1 Tipos de encuestas y mtodos de muestreo 22-3
xxiv Contenido

22.3 Errores en las encuestas 22-5


Error que no es de muestreo 22-5
Error de muestreo 22-5
22.4 Muestreo aleatorio simple 22-6
Media poblacional 22-6
Total poblacional 22-7
Proporcin poblacional 22-8
Determinacin del tamao de la muestra 22-9
22.5 Muestreo aleatorio estratificado simple 21-12
Media poblacional 22-12
Total poblacional 22-14
Proporcin poblacional 22-15
Determinacin del tamao de la muestra 22-16
22.6 Muestreo por conglomerados 22-21
Media poblacional 22-23
Total poblacional 22-24
Proporcin poblacional 22-25
Determinacin del tamao de la muestra 22-26
22.7 Muestreo sistemtico 22-29
Resumen 22-29
Glosario 22-30
Frmulas clave 22-30
Ejercicios complementarios 22-34
Apndice Soluciones de los ejercicios de autoevaluacin
y respuestas de los ejercicios pares 22-37

Apndice A Referencias y bibliografa 971

Apndice B Tablas 974

Apndice C Notacin de suma 1001

Apndice D Soluciones de las autoevaluaciones y respuestas


a los ejercicios con nmeros pares 1003

Apndice E Microsoft Excel 2010 y sus herramientas


para el anlisis estadstico 1064

Apndice F Clculo de los valores-p utilizando Minitab y Excel 1076


ndice analtico 1080
1
1.1 Applications in Business and Economics 1

CAPTULO

Los datos y la estadstica


CONTENIDO 1.3 FUENTES DE DATOS
ESTADSTICA EN LA PRCTICA: Fuentes existentes
BLOOMBERG BUSINESSWEEK Estudios estadsticos
Errores en la adquisicin de datos
1.1 APLICACIONES EN
NEGOCIOS Y ECONOMA 1.4 ESTADSTICA DESCRIPTIVA
Contabilidad 1.5 INFERENCIA ESTADSTICA
Finanzas 1.6 COMPUTADORAS Y
Marketing ANLISIS ESTADSTICO
Produccin
Economa 1.7 MINERA DE DATOS
Sistemas de informacin 1.8 LINEAMIENTOS TICOS
1.2 DATOS PARA LA PRCTICA DE
Elementos, variables y LA ESTADSTICA
observaciones
Escalas de medicin
Datos categricos y cuantitativos
Datos de corte transversal y de
series de tiempo
2 Captulo 1 Los datos y la estadstica

ESTADSTICA en LA PRCTICA
BLOOMBERG BUSINESSWEEK*
NEW YORK, NEW YORK
Con una circulacin global de ms de un milln de ejem-
plares, Bloomberg Businessweek es la revista de negocios
ms leda en el mundo. Ms de 1 700 reporteros en 145 ofi-
cinas de todo el mundo producen una variedad de artculos
de inters para la comunidad de los negocios y la economa.
Adems de reportajes especiales sobre temas de actualidad,
la revista contiene secciones regulares sobre administracin
internacional, anlisis econmico, procesamiento de infor-
macin y ciencia y tecnologa. La informacin contenida
en los reportajes especiales y las secciones regulares ayuda
a los lectores a mantenerse al da en los desarrollos actuales
y evala su impacto en los negocios y la economa bajo las
condiciones actuales.
La mayora de los nmeros de Bloomberg Businessweek
anteriormente conocida slo como BusinessWeek contiene
un artculo de fondo sobre un tema de inters actual. Dichos Bloomberg Businessweek utiliza hechos estadsticos y
artculos a menudo contienen hechos y resmenes estads- resmenes en muchos de sus artculos. Kyodo/Photoshot.
ticos que ayudan al lector a comprender la informacin de
negocios y economa. Por ejemplo, el nmero del 3 de marzo rectivos de Bloomberg Businessweek utilizan resmenes
de 2011 analiz el impacto en los negocios de movilizar estadsticos de la consulta para brindar un mejor servicio a
su trabajo ms importante hacia el cmputo en la nube; el sus suscriptores y anunciantes. Una encuesta reciente entre
nmero del 30 de mayo de 2011 incluy un reportaje sobre los estadounidenses revel que 90% de los suscriptores de
la crisis del U.S. Postal Service, y el nmero del 1 de agosto Bloomberg Businessweek utiliza una computadora perso-
de 2011 contena un reportaje sobre las razones por las que nal en su hogar, y que 64% realiz compras por computadora
la crisis por endeudamiento era peor de lo que se pensaba. en el trabajo. Estas estadsticas alertaron a los directivos de
Adems, Bloomberg Businessweek proporciona estadsti- la revista sobre el inters de los suscriptores en los nuevos
cas sobre el estado de la economa, que incluyen ndices de avances en computacin. Los resultados de la encuesta tam-
produccin, precios de las acciones, fondos de inversin y bin se pusieron a disposicin de los posibles anunciantes.
tasas de inters. El alto porcentaje de suscriptores que usan computadoras
Bloomberg Businessweek tambin utiliza informacin personales en el hogar y de los que realizan compras por
estadstica en la administracin de su propia empresa. Por internet en su trabajo son un incentivo para que un fabri-
ejemplo, una encuesta anual aplicada a los suscriptores per- cante de estos equipos considere anunciarse en Bloomberg
mite a la empresa obtener sus datos demogrficos, hbitos Businessweek.
de lectura, compras probables, su estilo de vida, etc. Los di- En este captulo se estudian los tipos de datos de que
se dispone para el anlisis estadstico y se describe cmo se
* Los autores agradecen a Charlene Trentham, gerente de investigacin
obtienen los mismos. La estadstica descriptiva y la inferen-
de BusinessWeek, por proporcionar este artculo para la seccin Esta- cia estadstica se presentan como medios para convertir los
dstica en la prctica. datos en informacin fcil de interpretar.

Es frecuente ver en los peridicos y las revistas las frases siguientes:


El Departamento del Trabajo de Estados Unidos report una cada en la tasa de desem-
pleo a 8.2%, su menor nivel en los ltimos tres aos (The Washington Post, 6 de abril
de 2012).
Cada estadounidense consume al ao un promedio 23.2 cuartos de galn de helado,
leche helada, sorbetes, hielos y otros lcteos congelados producidos comercialmente
(sitio web makeicecream.com 2 de abril de 2012).
La mediana del precio de venta de una casa vacacional es de 121 300 dlares (@CNN
Money, 29 de marzo de 2012).
1.1 Aplicaciones en negocios y economa 3

La montaa rusa The Wild Eagle de Dollywood en Pigeon Forge, Tennessee, alcanza una
velocidad mxima de 61 millas por hora (sitio web de USA Today, 5 de abril de 2012).
El nmero de usuarios registrados en Pinterest, el servicio del sitio web para compartir
fotografas, creci 85% entre mediados de enero y mediados de febrero (CNBC, 29 de
marzo de 2012).
El Pew Research Center report que la mediana de la edad a la que las novias contraen
matrimonio por primera vez en Estados Unidos alcanz un mximo histrico de 26.5
aos (Significance, febrero de 2012).
Los canadienses registraron un promedio de 45 horas conectados en lnea durante el
cuarto trimestre del 2011 (CBC News, 2 de marzo de 2012).
La Reserva Federal de Estados Unidos report que la deuda promedio en tarjetas de
crdito es de 5 204 dlares por persona (sitio web PRWeb, 5 de abril de 2012).

Los datos numricos en las frases anteriores (8.2%, 23.2, $121 300, 61, 85%, 26.5, 45, $5 204)
se llaman estadsticas. En este sentido, el trmino estadstica se refiere a datos numricos como
promedios, medias, porcentajes e ndices que nos ayudan a entender una variedad de situaciones
de los negocios y la economa. Sin embargo, como ver ms adelante, el campo, o materia, de la
estadstica abarca mucho ms que los datos numricos. En un sentido ms amplio, la estadstica
se define como el arte y la ciencia de recolectar, analizar e interpretar datos. En particular en los
negocios y la economa, la informacin que se obtiene a partir de la recoleccin, el anlisis, la
presentacin y la interpretacin de los datos permite a los administradores o gerentes y a quienes
toman decisiones comprender mejor los entornos econmico y de negocios, y por lo tanto tomar
decisiones mejores y ms informadas. En este libro se enfatiza el uso de la estadstica para la
toma de decisiones en ambos mbitos.
El captulo 1 comienza con algunos ejemplos de aplicaciones de la estadstica en los ne-
gocios y la economa. En la seccin 1.2 se define el trmino dato y se introduce el concepto de
banco de datos. Esta seccin tambin presenta trminos clave como variables y observaciones;
estudia la diferencia entre datos cuantitativos y categricos, e ilustra los usos de los datos de cor-
te transversal y de series de tiempo. En la seccin 1.3 se analiza cmo se obtienen los datos de
fuentes existentes o por medio de estudios experimentales diseados para obtener datos nuevos.
Tambin se destaca el papel importante que juega hoy internet en la obtencin de datos. Los usos
de los datos en el desarrollo de la estadstica descriptiva y la elaboracin de inferencias estads-
ticas se describen en las secciones 1.4 y 1.5. Las ltimas tres secciones tratan sobre la funcin de
la computadora en el anlisis estadstico, y presentan una introduccin al campo relativamente
nuevo de la minera de datos y un anlisis de los lineamientos ticos para la prctica estadstica.
Al final del captulo se incluye un apndice con una introduccin al complemento StatTools que
se usa para ampliar las opciones estadsticas a los usuarios de Microsoft Excel.

1.1 Aplicaciones en negocios y economa


En el actual entorno global de los negocios y la economa, cualquier persona tiene acceso a una
vasta cantidad de informacin estadstica. Los gerentes y lderes de decisiones ms exitosos
entienden la informacin y saben cmo usarla de manera eficiente. En esta seccin se proporcio-
nan ejemplos que ilustran algunas aplicaciones de la estadstica en los negocios y la economa.

Contabilidad
Las firmas de contabilidad pblicas utilizan procedimientos de muestreo estadstico cuando
realizan auditoras para sus clientes. Por ejemplo, suponga que una firma contable quiere de-
terminar si el estado de cuenta de un cliente representa de manera precisa el monto real de las
cuentas por cobrar. La gran cantidad de cuentas por cobrar hace que la revisin y la validacin
de cada cuenta consuman demasiado tiempo y dinero. Como prctica comn en este tipo de
situaciones, el personal de auditora selecciona un subconjunto de las cuentas llamado muestra.
Despus de revisar la precisin de la seleccin que tom como muestra, los auditores llegan a
4 Captulo 1 Los datos y la estadstica

una conclusin con respecto a si el monto de las cuentas por cobrar que aparece en el estado de
cuenta del cliente es aceptable.

Finanzas
Los analistas financieros utilizan una variedad de informacin estadstica como gua para sus
recomendaciones de inversin. En el caso de las acciones, revisan diversos datos financieros que
incluyen las razones precio/utilidad y el rendimiento por concepto de dividendos. Al comparar
la informacin para una accin con datos sobre los promedios del mercado de valores, un ana-
lista financiero puede formular una conclusin acerca de si una accin es una buena inversin.
Por ejemplo, el nmero del 19 de marzo de 2012 de The Wall Street Journal report que el
rendimiento promedio por concepto de dividendos de las 500 grandes empresas S&P 500 fue
de 2.2%. Microsoft, en especfico, obtuvo un rendimiento por concepto de dividendos de 2.42%.
En este caso, la informacin estadstica sobre el rendimiento por concepto de dividendos indica
una cifra superior de los dividendos de Microsoft sobre el promedio de dividendos de las empre-
sas S&P 500. Esta informacin sobre Microsoft, junto con otra, ayuda a los analistas a realizar
recomendaciones para conservar, vender o comprar acciones de Microsoft.

Marketing
Los escneres electrnicos en las cajas de cobro de las tiendas minoristas recolectan datos para
diversas aplicaciones de investigacin de mercados. Por ejemplo, proveedores de datos como
ACNielsen e Information Resources, Inc. compran datos de los escneres en puntos de venta
como las tiendas de abarrotes, los procesan y luego venden resmenes estadsticos a los fabri-
cantes. Estos ltimos gastan cientos de miles de dlares por categora de producto para obtener
este tipo de datos. Los fabricantes tambin compran datos y resmenes estadsticos sobre acti-
vidades promocionales, como la asignacin de precios especiales y el uso de exhibidores dentro
de las tiendas. Los gerentes de marca pueden revisar las estadsticas de los escneres y de la
actividad promocional para comprender mejor la relacin entre las actividades de promocin y
las ventas. Estos anlisis a menudo son tiles para establecer estrategias de futuras marketing
para diversos productos.

Produccin
El nfasis actual en la calidad hace que su control sea una aplicacin importante de la estadstica
en la produccin. Diversas grficas estadsticas de control de calidad se usan para monitorear el
resultado de un proceso de produccin. En particular, una grfica x barra sirve para monitorear
el resultado promedio. Suponga, por ejemplo, que una mquina llena envases con 12 onzas de
una bebida refrescante. En forma peridica, un empleado de produccin selecciona una mues-
tra de envases y calcula el nmero promedio de onzas en la muestra. Este promedio, o valor
x barra, se traza en una grfica x barra. Un valor trazado sobre el lmite superior de control de la
grfica indica que hay un exceso en el llenado, y un valor trazado por debajo del lmite inferior
de control indica que el llenado es deficiente. El proceso se considera bajo control y permite
continuar siempre que los valores x barra trazados se encuentren dentro de los lmites de control
superior e inferior de la grfica. Si se interpreta de manera adecuada, una grfica x barra ayuda a
determinar cundo es necesario realizar ajustes para corregir un proceso de produccin.

Economa
Los economistas a menudo proporcionan pronsticos sobre la economa o algn otro tema
relacionado. Utilizan diferente informacin estadstica para elaborarlos. Por ejemplo, para pro-
nosticar las tasas de inflacin recurren a informacin estadstica sobre indicadores como el
ndice de precios al consumidor, la tasa de desempleo y el uso de la capacidad de manufactura.
Estos indicadores se introducen con frecuencia en modelos computarizados de pronsticos que
predicen las tasas de inflacin.
Las aplicaciones de la estadstica, como las descritas en esta seccin, son parte integral de
este libro. Estos ejemplos proporcionan una descripcin general de gran diversidad de apli-
1.2 Datos 5

caciones. Para complementar estos ejemplos, profesionales en el campo de los negocios y la


economa aportaron artculos para la seccin Estadstica en la prctica al inicio de cada cap-
tulo, donde se presenta el material que cubre su contenido. Dichas aplicaciones muestran la
importancia de la estadstica en una amplia variedad de situaciones de negocios y economa.

Sistemas de informacin
Los administradores de sistemas de informacin son responsables de la operacin cotidiana de
las redes de cmputo de una organizacin. Una gran variedad de informacin estadstica les
ayuda a evaluar el desempeo de dichas redes, como las redes de rea local (LAN), redes de
rea amplia (WAN), segmentos de redes, intranets y otros sistemas de comunicacin de datos.
Las estadsticas, como el nmero medio de usuarios del sistema, la cantidad de tiempo que un
componente del sistema no funciona y la proporcin de ancho de banda que se utiliza en varios
momentos del da son ejemplos de informacin estadstica que ayuda a los administradores de
los sistemas a comprender y manejar mejor las redes de cmputo.

1.2 Datos
Los datos son los hechos y las cifras recabados, analizados y resumidos para su presentacin e
interpretacin. Todos los datos recabados en un estudio en particular se conocen como banco o
conjunto de datos del estudio. La tabla 1.1 presenta un banco de datos que contiene informa-
cin sobre 60 pases que participan en la Organizacin Mundial de Comercio. Esta organizacin
fomenta el libre flujo del comercio internacional y proporciona un foro para resolver disputas
comerciales.

Elementos, variables y observaciones


Los elementos son las entidades a partir de las cuales se recaban los datos. Cada uno de los
pases listados en la tabla 1.1 es un elemento con el nombre del pas o del elemento en la primera
columna. Puesto que se presentan 60 pases, el banco de datos contiene 60 elementos.
Una variable es una caracterstica de inters para los elementos. El banco de datos de la
tabla 1.1 incluye las cinco variables siguientes:
Estatus en la OMC (WTO Status): El estatus de membresa que tiene el pas ante la
Organizacin Mundial de Comercio; puede ser como miembro o como observador
PIB per cpita [Per Capita GDP ($)]: El producto total del pas dividido entre su nmero
de habitantes. Por lo general, esta variable se emplea para comparar la productividad
econmica de los pases.
Dficit comercial en miles de dlares (Trade Deficit $1000s): La diferencia en dlares
entre el valor de las importaciones y las exportaciones totales del pas.
Fitch Rating: La calificacin de crdito soberano del pas provista por el grupo Fitch1.
El rango de calificaciones para los crditos va desde AAA en su punto ms alto hasta F
en su punto ms bajo, y pueden ser modificadas con atributos o .
Fitch Outlook: Es un indicador de que la direccin de la calificacin del crdito tiene
posibilidades de modificarse durante los prximos dos aos. El panorama puede ser
negativo, estable o positivo.
En un estudio, las mediciones recabadas para cada elemento en cada variable proporcionan los
datos. El conjunto de mediciones obtenido para un elemento en particular se llama observa-
cin. Al analizar de nuevo la tabla 1.1, se observa que el conjunto de mediciones para la
primera observacin (Armenia) es Miembro, 5 400, 2 673 359, BB y Estable. El conjunto de

1
The Fitch Group es una de tres organizaciones de estadsticas, reconocidas a nivel nacional, designadas por la U.S.
Securities and Exchange Commission. Las otras dos son Standard and Poors y Moodys.
6 Captulo 1 Los datos y la estadstica

TABLA 1.1 Banco de datos de 60 pases que participan en la Organizacin Mundial de Comercio

WTO Per Capita Trade Fitch Fitch


Nation Status GDP ($) Deficit ($1000s) Rating Outlook
Armenia Member 5 400 2 673 359 BB Stable
Australia Member 40 800 33 304 157 AAA Stable
Austria Member 41 700 12 796 558 AAA Stable
Azerbaijan Observer 5 400 16 747 320 BBB Positive
Bahrain Member 27 300 3 102 665 BBB Stable
Belgium Member 37 600 14 930 833 AA Negative
Brazil Member 11 600 29 796 166 BBB Stable
WEB file Bulgaria
Canada
Member
Member
13 500
40 300
4 049 237
1 611 380
BBB
AAA
Positive
Stable
Nations
Cape Verde Member 4 000 874 459 B Stable
Chile Member 16 100 14 558 218 A Stable
China Member 8 400 156 705 311 A Stable
Los bancos de
datos, como el Colombia Member 10 100 1 561 199 BBB Stable
de Nations, estn Costa Rica Member 11 500 5 807 509 BB Stable
disponibles en Croatia Member 18 300 8 108 103 BBB Negative
ingls en el sitio Cyprus Member 29 100 6 623 337 BBB Negative
web de este libro. Czech Republic Member 25 900 10 749 467 A Positive
Denmark Member 40 200 15 057 343 AAA Stable
Ecuador Member 8 300 1 993 819 B Stable
Egypt Member 6 500 28 486 933 BB Negative
El Salvador Member 7 600 5 019 363 BB Stable
Estonia Member 20 200 802 234 A Stable
France Member 35 000 118 841 542 AAA Stable
Georgia Member 5 400 4 398 153 B Positive
Germany Member 37 900 213 367 685 AAA Stable
Hungary Member 19 600 9 421 301 BBB Negative
Iceland Member 38 000 504 939 BB Stable
Ireland Member 39 500 59 093 323 BBB Negative
Israel Member 31 000 6 722 291 A Stable
Italy Member 30 100 33 568 668 A Negative
Japan Member 34 300 31 675 424 AA Negative
Kazakhstan Observer 13 000 33 220 437 BBB Positive
Kenya Member 1 700 9 174 198 B Stable
Latvia Member 15 400 2 448 053 BBB Positive
Lebanon Observer 15 600 13 715 550 B Stable
Lithuania Member 18 700 3 359 641 BBB Positive
Malaysia Member 15 600 39 420 064 A Stable
Mexico Member 15 100 1 288 112 BBB Stable
Peru Member 10 000 7 888 993 BBB Stable
Philippines Member 4 100 15 667 209 BB Stable
Poland Member 20 100 19 552 976 A Stable
Portugal Member 23 200 21 060 508 BBB Negative
South Korea Member 31 700 37 509 141 A Stable
Romania Member 12 300 13 323 709 BBB Stable
Russia Observer 16 700 151 400 000 BBB Positive
Rwanda Member 1 300 939 222 B Stable
Serbia Observer 10 700 8 275 693 BB Stable
Seychelles Observer 24 700 666 026 B Stable
Singapore Member 59 900 27 110 421 AAA Stable
Slovakia Member 23 400 2 110 626 A Stable
Slovenia Member 29 100 2 310 617 AA Negative
South Africa Member 11 000 3 321 801 BBB Stable
1.2 Datos 7

Sweden Member 40 600 10 903 251 AAA Stable


Switzerland Member 43 400 27 197 873 AAA Stable
Thailand Member 9 700 2 049 669 BBB Stable
Turkey Member 14 600 71 612 947 BB Positive
UK Member 35 900 162 316 831 AAA Negative
Uruguay Member 15 400 2 662 628 BB Positive
USA Member 48 100 784 438 559 AAA Stable
Zambia Member 1 600 1 805 198 B Stable

mediciones para la segunda observacin (Austria) es Miembro, 40 800, 33 304 157, AAA y
Estable. Un banco de datos de 60 elementos contiene 60 observaciones

Escalas de medicin
La recoleccin de datos requiere una de las escalas de medicin siguientes: nominal, ordinal,
de intervalo o de razn. La escala de medicin determina la cantidad de informacin contenida
en los datos e indica la manera ms apropiada de resumirlos y analizarlos estadsticamente.
Cuando los datos de una variable se componen de etiquetas o nombres utilizados para iden-
tificar un atributo del elemento, la escala de medicin se considera una escala nominal. Por
ejemplo, al observar los datos de la tabla 1.1 se observa que la escala de medicin para la varia-
ble estatus en la OMC es nominal, porque miembro (member) y observador (observer) son
etiquetas que se usan para identificar la categora del estatus del pas. En tales casos se puede
utilizar un cdigo numrico o etiquetas no numricas. Por ejemplo, para facilitar la recoleccin
y preparacin de los datos con la finalidad de introducirlos en una base de datos computarizada,
podra utilizarse un cdigo numrico para la variable estatus en la OMC (WTO Status) que
establezca que 1 denota un pas miembro de la Organizacin Mundial de Comercio y 2 un pas
observador. La escala de medicin es nominal a pesar de que los datos aparecen como valores
numricos.
La escala de medicin de una variable se llama escala ordinal si los datos exhiben las
propiedades de los datos nominales y su orden o clasificacin es significativo. Por ejemplo, en
relacin con la tabla 1.1, la escala de medicin para Ritch Rating es ordinal, porque las etiquetas
de rating o calificacin que van desde AAA hasta F pueden ordenarse desde la mejor calificacin
crediticia AAA hasta la peor, que es F. Las letras que indican la calificacin proporcionan etique-
tas similares a los datos nominales, pero adems pueden clasificarse u ordenarse con base en la
calificacin crediticia, lo que hace que la escala sea ordinal. Los datos ordinales tambin pueden
proporcionarse por medio de un cdigo numrico, por ejemplo, su nmero de lista en clase.
En una escala de intervalo para una variable, los datos presentan todas las propiedades
de los datos ordinales, y el intervalo entre los valores se expresa en trminos de una unidad de
medida fija. Los datos de intervalo son siempre numricos. Las calificaciones de la prueba
de aptitudes Scholastic Aptitude Test (SAT) son un ejemplo de datos escala de intervalo. Por
ejemplo, tres estudiantes que obtuvieron las calificaciones 620, 550 y 470 en una prueba o exa-
men de matemticas llamada SAT pueden clasificarse u ordenarse en funcin del mejor al peor
desempeo. Adems, las diferencias entre las puntuaciones son significativas. Por ejemplo, el
estudiante 1 obtuvo 620 550 70 puntos ms que el estudiante 2, mientras que ste obtuvo
550 470 80 puntos ms que el estudiante 3.
En una escala de razn para una variable los datos tienen todas las propiedades de los
datos de intervalo, y la razn de los dos valores es significativa. Para la medicin de variables
como la distancia, la estatura, el peso y el tiempo se usa la escala de razn. sta requiere que
se incluya un valor cero para indicar que en este punto no existe un valor para la variable. Por
ejemplo, considere el costo de un automvil. Un valor cero para el costo indicara que el vehcu-
lo no tiene costo, es gratis. Adems, si se compara el costo de un automvil de $30 000 con el
8 Captulo 1 Los datos y la estadstica

costo de un segundo automvil de $15 000, la propiedad de la razn muestra que el primero
cuesta $30 000/$15 000 2 veces, o el doble, que el segundo.

Datos categricos y cuantitativos


Los datos se clasifican como categricos o cuantitativos. Los que se agrupan por categoras
especficas se conocen como datos categricos. Este tipo de datos utiliza una escala de medi-
cin que puede ser nominal u ordinal. Los que utilizan valores numricos para indicar cunto o
cuntos se conocen como datos cuantitativos; stos se obtienen usando la escala de medicin
ya sea de intervalo o de razn.
El mtodo estadstico Una variable categrica incluye datos categricos y una variable cuantitativa com-
apropiado para resumir prende datos cuantitativos. El anlisis estadstico apropiado para una variable en particular de-
los datos depende de
pende de que sta sea categrica o cuantitativa. Si la variable es categrica, el anlisis estadstico
que los datos sean
categricos o cuantitativos. es muy limitado. Los datos categricos se resumen mediante el conteo del nmero de obser-
vaciones en cada categora o por medio del clculo de la proporcin de las observaciones en
cada categora. Sin embargo, aun cuando estos datos se identifican por medio de un cdigo
aritmtico, operaciones como la suma, la resta, la multiplicacin y la divisin no producen
resultados que tengan sentido. En la seccin 2.1 se estudian algunas maneras de resumir los
datos categricos.
Las operaciones aritmticas s proporcionan resultados con sentido para las variables cuan-
titativas. Por ejemplo, los datos cuantitativos pueden sumarse y luego dividirse entre el nmero
de observaciones para calcular el valor promedio, el cual tiene significado y se interpreta con
facilidad. En general, se tienen ms alternativas para el anlisis estadstico cuando los datos
son cuantitativos. La seccin 2.2 y el captulo 3 proporcionan maneras de resumir este tipo de
datos.

Datos de corte transversal y de series de tiempo


Para efectos del anlisis estadstico es importante distinguir entre datos de corte transversal y
datos de series de tiempo. Los datos de corte transversal son recabados en el mismo momento,
o aproximadamente al mismo tiempo. Los de la tabla 1.1 son de corte transversal, debido a que
describen las cinco variables para los 60 pases de la Organizacin Mundial de Comercio en
el mismo punto de tiempo. Los datos de series de tiempo o series temporales son recabados
a lo largo de varios periodos. Por ejemplo, la serie de tiempo de la figura 1.1 muestra el precio
promedio por galn de gasolina regular convencional en Estados Unidos entre 2007 y 2012.
Observe que los precios ms altos del hidrocarburo han tendido a presentarse en los meses del
verano de 2008 y despus descendieron abruptamente en otoo de 2008. Desde este ao, el pre-
cio promedio por galn ha continuado su incremento de forma estable, alcanzando su mximo
histrico nuevamente en 2012.
Las grficas de los datos de series de tiempo a menudo se encuentran en publicaciones de
negocios y economa; ayudan a los analistas a comprender lo que ocurri en el pasado, identi-
ficar cualquier tendencia en el tiempo y proyectar niveles futuros para las series de tiempo. Las
grficas de este tipo pueden adoptar una variedad de formas, como lo muestra la figura 1.2. Con
un poco de estudio, suelen ser fciles de comprender e interpretar. Por ejemplo, la grfica (A) de
la figura 1.2 muestra el ndice promedio industrial Dow Jones de 2002 a 2012. En abril de 2002,
el ndice del mercado de valores se encontraba cercano a 10 000 puntos. Durante los siguientes
cinco aos alcanz su mximo histrico ligeramente por encima de los 14 000 puntos en octubre
de 2007. Sin embargo, observe que existe un declive en las series de tiempo despus de su punto
ms alto en 2007. Para marzo de 2009, las condiciones econmicas deficientes provocaron que
el promedio industrial Dow Jones regresara a niveles alrededor de los 7 000 puntos. Este fue un
periodo de temor y desaliento para los inversionistas. Sin embargo, para finales de 2009, el n-
dice mostr una recuperacin al alcanzar los 10 000 puntos. Este ndice ha aumentado de forma
constante y se ubic por encima de los 13 000 puntos a principios de 2012.
1.2 Datos 9

FIGURA 1.1 Precio promedio por galn de la gasolina regular en Estados Unidos

$4.50

$4.00

Precio promedio por galn


$3.50

$3.00

$2.50

$2.00

$1.50

$1.00

$0.50

$0.00
Ene 07 Ago 07 Mar 08 Oct 08 May 09 Dic 09 Jul 10 Feb 11 Sep 11 Mar 12
Fecha

Fuente. Energy Information Administration, U.S. Department of Energy, marzo de 2012.

La grfica (B) muestra la utilidad neta de McDonalds Inc. desde 2005 hasta 2011. Las
condiciones econmicas en declive de 2008 y 2009 fueron realmente benficas para la empresa,
ya que dicha utilidad alcanz un mximo histrico. Este crecimiento en la utilidad neta demos-
tr que la empresa estaba prosperando durante la crisis econmica, cuando la gente empez a
restringir sus gastos y prefera las alternativas ms econmicas ofrecidas por McDonalds en
lugar de los restaurantes tradicionales ms caros. La utilidad neta de McDonalds continu au-
mentando hasta alcanzar un nuevo mximo histrico en 2010 y 2011.
La grfica (C) muestra la serie de tiempo para la tasa de ocupacin de los hoteles en el sur
de Florida durante un periodo de un ao. Las tasas ms altas, 95 y 98%, ocurren durante los
meses de febrero y marzo, cuando el clima de la regin es atractivo para los turistas. De he-
cho, la temporada de ocupacin ms alta para los hoteles del sur de Florida es de enero a abril
de cada ao. Por otra parte, observe las menores tasas de ocupacin durante los meses de agosto
a octubre, periodo en cual se encuentra el indicador ms bajo de 50% durante septiembre. Las
altas temperaturas y la temporada de huracanes son las razones principales de la cada en la
ocupacin de los hoteles durante este periodo.

NOTAS Y COMENTARIOS

1. Una observacin es el conjunto de mediciones ob- 2. Los datos cuantitativos pueden ser discretos o con-
tenido para cada elemento de un banco de datos. tinuos. Los datos cuantitativos que miden cuntos
Por consiguiente, el nmero de observaciones es (por ejemplo, el nmero de llamadas recibidas en
siempre igual al nmero de elementos. El nmero 5 minutos), son discretos. Los datos cuantitativos
de mediciones obtenidas para cada elemento es que miden cunto (por ejemplo, el peso o el tiem-
igual al nmero de variables. Por ende, el nmero po), son continuos debido a que no hay una sepa-
total de elementos de datos se determina multipli- racin entre los valores de datos posibles.
cando el nmero de observaciones por el nmero
de variables.
10 Captulo 1 Los datos y la estadstica

FIGURA 1.2 Varias grficas de series de tiempo

16 000

Promedio industrial Dow Jones


14 000
12 000
10 000
8 000
6 000
4 000
2 000
0
Abr02 Abr04 Abr06 Abr08 Abr10 Abr12
Ao
(A) Promedio industrial Dow Jones

6
Utilidad neta (miles de millones $)

0
2005 2006 2007 2008 2009 2010 2011
Ao
(B) Utilidad neta de McDonalds Inc.

100
Porcentaje de ocupacin

80

60

40

20

0
n

p
e

ic
go
ar

br

ay

ct
ov
l
En

Ju

Se
Fe

Ju

D
M

O
A

A
M

Mes
(C) Tasa de ocupacin de los hoteles del sur de Florida
1.3 Fuentes de datos 11

1.3 Fuentes de datos


Los datos se obtienen de fuentes existentes o de encuestas y estudios experimentales disea-
dos para recabar datos nuevos.

Fuentes existentes
En algunos casos, los datos necesarios para una aplicacin en particular ya existen. Las empre-
sas mantienen diversas bases de datos de sus empleados, clientes y operaciones de negocios.
Los datos sobre los sueldos, la edad y los aos de experiencia de los empleados se obtienen por
lo general de los registros internos del personal. Otros registros internos contienen datos sobre
ventas, gastos de publicidad, costos de distribucin, niveles de inventario y cantidades de pro-
duccin. La mayora de las empresas mantiene tambin datos detallados sobre sus clientes. La
tabla 1.2 muestra algunos de los datos de que se dispone por lo general a partir de los registros
internos de una empresa.
Las organizaciones que se especializan en la recoleccin y el mantenimiento de datos pro-
veen cantidades significativas de informacin econmica y de negocios. Las empresas tienen
acceso a estas fuentes de datos externos por medio de acuerdos o al comprarlos. Dun & Bradstreet,
Bloomberg y Dow Jones & Company son tres empresas que ofrecen extensos servicios de ba-
ses de datos a sus clientes. ACNielsen e Information Resources, Inc. ha logrado el xito en
su negocio de recoleccin y procesamiento de datos que vende a anunciantes y fabricantes de
productos.
Tambin se obtienen datos de diversas asociaciones de la industria y de organizaciones de
inters especial. Travel Industry Association of America mantiene informacin relacionada con
viajes, como el nmero de turistas y los gastos de viaje por estado. Estos datos son de inters para
las empresas y personas de la industria del ramo. El Graduate Management Admission Council
cuenta con datos sobre calificaciones de exmenes, caractersticas de los estudiantes y progra-
mas sobre administracin de educacin universitaria. La mayora de los datos provenientes de
estos tipos de fuentes se proveen a usuarios calificados por un costo moderado.
Internet es una fuente importante de datos e informacin estadstica. Casi todas las empresas
tienen una pgina web que proporciona informacin general acerca de la organizacin, as como
datos sobre ventas, nmero de empleados y de productos, el precio de los productos y sus especi-
ficaciones. Adems, varias empresas se especializan en proveer informacin a travs de Internet,
gracias a lo cual se puede tener acceso a cotizaciones de acciones, precios de los platillos en los
restaurantes, datos sobre sueldos y una variedad casi infinita de informacin.
Las agencias gubernamentales son otra fuente importante de datos existentes. Por ejem-
plo, el Departamento del Trabajo de Estados Unidos maneja una gran cantidad de datos sobre
las tasas de empleo, las tasas salariales, el porcentaje de la poblacin activa y la afiliacin a

TABLA 1.2 Ejemplos de datos disponibles de los registros o expedientes internos de una empresa

Fuente Algunos datos comnmente disponibles


Registros de empleados Nombre, domicilio, nmero de Seguro Social, sueldo, nmero de das de vacaciones,
nmero de das de incapacidad y bonos
Registros de produccin Nmero de parte o de producto, cantidad producida, costo de la mano de obra directa y costo
de los materiales
Registros de inventarios Nmero de parte o de producto, cantidad disponible de unidades, punto de reorden, lote
econmico o cantidad econmica del pedido y programa de descuentos
Registros de ventas Nmero de producto, volumen de ventas, volumen de ventas por regin y volumen
de ventas por tipo de cliente
Registros de crdito Nombre del cliente, domicilio, nmero telefnico, lmite de crdito y saldo de las cuentas
por cobrar
Perfiles de clientes Edad, gnero, nivel de ingresos, nmero de miembros en la familia, domicilio y preferencias
12 Captulo 1 Los datos y la estadstica

TABLA 1.3 Ejemplos de datos disponibles de algunas agencias gubernamentales

Agencia gubernamental Algunos datos disponibles


Oficina del Censo Datos poblacionales, nmero de familias e ingresos por familia
Consejo de la Reserva Federal Datos sobre la masa monetaria, crdito a plazo, tipos de cambio y tasas
de descuento
Oficina de Administracin y Presupuesto Datos sobre ingresos, gastos y deudas del gobierno federal
Departamento de Comercio Datos sobre la actividad comercial, valor de las remesas por industria, nivel
de utilidades por industria e industrias en crecimiento y en declive
Oficina de Estadsticas Laborales Gasto de los consumidores, ingresos por hora, tasa de desempleo, registros
de seguridad y estadsticas internacionales

sindicatos. La tabla 1.3 lista algunas agencias gubernamentales seleccionadas y algunos de los
datos que proporcionan. La mayora de las dependencias que recaba y procesa datos tambin
los pone a disposicin de los usuarios por medio de un sitio web. La figura 1.3 muestra la pgi-
na principal del sitio web de la Oficina de Estadsticas Laborales de Estados Unidos.

Estudios estadsticos
Se cree que el estudio Algunas veces los datos necesarios para alguna aplicacin no estn disponibles a travs de las
estadstico experimental
ms grande jams realizado
fuentes existentes. En estos casos suelen obtenerse mediante estudios estadsticos, los cuales se
es el experimento para clasifican en experimentales u observacionales.
la vacuna Salk contra la En un estudio experimental se identifica primero la variable de inters. Luego se toma una
polio del Servicio de Salud o ms variables y se controlan para obtener datos de cmo influyen en la variable de inters. Por
Pblica efectuado en 1954. ejemplo, una compaa farmacutica podra interesarse en realizar un experimento para ente-
Se seleccionaron casi
2 millones de nios de
rarse de cmo afecta un nuevo medicamento la presin sangunea. sta es la variable de inters
1o., 2o. y 3er. grados en el estudio. El nivel de dosis del medicamento nuevo es otra variable que se espera que tenga
de enseanza elemental de un efecto causal en la presin sangunea. Para obtener datos sobre el efecto del nuevo frmaco,
todo Estados Unidos. los investigadores seleccionan una muestra de individuos. El nivel de dosis del medicamento
est controlado, ya que a los distintos grupos de individuos se les suministran dosis diferentes.

FIGURA 1.3 Pgina principal de la Oficina de Estadsticas Laborales de Estados Unidos


3
Chapter 3 [(H2F)] 99

CAPTULO

Estadstica descriptiva:
Medidas numricas
CONTENIDO Teorema de Chebyshev
ESTADSTICA EN LA PRCTICA: Regla emprica
SMALL FRY DESIGN Deteccin de observaciones
atpicas
3.1 MEDIDAS DE POSICIN
O LOCALIZACIN 3.4 RESMENES DE CINCO
Media NMEROS Y DIAGRAMAS
Media ponderada DE CAJA
Mediana Resumen de cinco nmeros
Media geomtrica Diagrama de caja
Moda 3.5 MEDIDAS DE ASOCIACIN
Percentiles ENTRE DOS VARIABLES
Cuartiles Covarianza
3.2 MEDIDAS DE VARIABILIDAD Interpretacin de la covarianza
Rango Coeficiente de correlacin
Rango intercuartlico o intercuartil Interpretacin del coeficiente
Varianza de correlacin
Desviacin estndar 3.6 DATA DASHBOARDS O
Coeficiente de variacin TABLEROS DE DATOS:
3.3 MEDIDAS DE LA FORMA DE INCORPORACIN
LA DISTRIBUCIN, POSICIN DE MEDIDAS NUMRICAS
RELATIVA Y DETECCIN DE PARA MEJORAR
OBSERVACIONES ATPICAS SU EFICACIA
Forma de la distribucin
Valor z
100 Captulo 3 Estadstica descriptiva: Medidas numricas

ESTADSTICA en LA PRCTICA
SMALL FRY DESIGN*
SANTA ANA, CALIFORNIA
Small Fry Design, fundada en 1997, es una empresa de ju-
guetes y accesorios que disea e importa productos para
nios. Su lnea de artculos incluye osos de peluche, mvi-
les, juguetes musicales, sonajas y cobertores de seguridad,
y presenta diseos de juguetes de alta calidad para beb con
un nfasis en los colores, las texturas y los sonidos. Los pro-
ductos se disean en Estados Unidos y se fabrican en China.
Small Fry Design emplea representantes independien-
tes para la venta de sus productos a minoristas de muebles
infantiles, tiendas de accesorios y ropa para nios, negocios
de regalos, tiendas departamentales exclusivas e importan-
tes compaas de ventas por catlogo. En la actualidad, los
productos de Small Fry Design se distribuyen en ms de
1 000 puntos minoristas de venta en todo Estados Unidos.
La administracin del flujo de efectivo es una de las Small Fry Design aplica la estadstica descriptiva para
actividades ms importantes para la operacin diaria de monitorear sus cuentas por cobrar y su flujo de efectivo
esta empresa. Garantizar que dicho flujo entrante sea su- entrante. Robert Dant/Alamy Limited.
ficiente para cumplir con las obligaciones de deudas tanto
corrientes como a corto plazo puede significar la diferencia
entre el xito y el fracaso. Un factor crtico en la adminis-
tracin del flujo de efectivo es el anlisis y control de las
La interpretacin de estos datos estadsticos muestra que
cuentas por cobrar. Al medir el tiempo promedio de cobro
el tiempo promedio de cobro de una factura es de 40 das.
y el valor monetario de las facturas pendientes, la geren-
La mediana seala que la mitad de estos documentos per-
cia puede predecir la disponibilidad de efectivo y monito-
manece pendiente 35 das o ms. La moda de 31 das, el
rear los cambios en el estado de las cuentas por cobrar. La
tiempo de cobro de una factura ms frecuente, indica que
empresa estableci las metas siguientes: la antigedad pro-
el lapso ms comn en que sta permanece pendiente es
medio de las facturas pendientes no debe exceder los 45
de 31 das. El resumen estadstico indica tambin que slo
das y el valor de las facturas con una antigedad mayor de
3% del valor de todas las cuentas por cobrar tiene un tiem-
60 das no debe exceder 5% del valor de todas las cuentas
po de cobro de ms de 60 das. Con base en la informa-
por cobrar.
cin estadstica, la gerencia qued satisfecha, dado que las
En un resumen reciente del estado de las cuentas por
cuentas por cobrar y el flujo de efectivo entrante estaban
cobrar se proporcion los siguientes estadsticos descripti-
bajo control.
vos para la antigedad de las facturas pendientes.
En este captulo aprender a calcular e interpretar al-
Media 40 das gunas de las medidas estadsticas que utiliza Small Fry De-
Mediana 35 das sign. Adems de la media, la mediana y la moda, aprender
Moda 31 das otros estadsticos descriptivos, como el rango, la varianza,
la desviacin estndar, los percentiles y la correlacin. Es-
* Los autores agradecen a John A. McCarthy, presidente de Small Fry tas medidas numricas ayudan a la comprensin e interpre-
Design, por proporcionar este artculo para Estadstica en la prctica. tacin de los datos.

En el captulo 2 se estudiaron las presentaciones tabulares y grficas utilizadas para resumir los
datos. En este captulo se presentan varias medidas numricas que proporcionan otras opcio-
nes para la misma tarea.
Primero se ver el desarrollo de medidas numricas para conjuntos de datos que constan
de una sola variable. Cuando un conjunto de datos contiene ms de una variable, las mismas
medidas numricas se calculan por separado para cada variable. Sin embargo, en el caso de dos
variables, se desarrollarn tambin medidas de la relacin entre stas.
3.1 Medidas de posicin o localizacin 101

Se presentan las medidas numricas de posicin, dispersin, forma y asociacin. Si las me-
didas se calculan para los datos de una muestra, se les llama estadstico muestral. Si se calculan
para los datos de una poblacin, se les llama parmetros poblacionales. En la inferencia esta-
dstica, un estadstico muestral se conoce como estimador puntual del parmetro poblacional
correspondiente. En el captulo 7 se ver con ms detalle el proceso de la estimacin puntual.
En los tres apndices del captulo se explica cmo se usan Minitab, Excel y StatTools para
calcular las medidas numricas descritas en el captulo.

3.1 Medidas de posicin o localizacin


Media
La media tambin se conoce La media, o valor medio, es quiz la medida de posicin ms importante para una variable, pues
como media aritmtica. proporciona una medida de la ubicacin central de los datos. Si los datos son para una muestra,
la media se denota x; si son para una poblacin, se denota con la letra griega .
En las frmulas estadsticas se acostumbra denotar el valor de la primera observacin de
la variable x mediante x1, el valor de la segunda observacin de la variable x por medio de x2, y
as sucesivamente. En general, el valor de la i-sima observacin de la variable x se representa
por medio de xi. Si se tiene una muestra con n observaciones, la frmula para la media muestral
es la siguiente:

La media muestral x es MEDIA MUESTRAL


un estadstico muestral.
xi
x (3.1)
n

En la frmula anterior, el numerador es la suma de los valores de las n observaciones. Es


decir,

xi x1 x2 . . . xn

La letra griega  es el signo de sumatoria o sumatorio.


Para ilustrar el clculo de una media muestral, considere los datos siguientes sobre el tamao
del grupo para una muestra de cinco grupos de estudiantes universitarios.

46 54 42 46 32

La notacin x1, x2, x3, x4, x5 se utiliza para representar el nmero de estudiantes en cada uno de
los cinco grupos.

x1 46 x2 54 x3 42 x4 46 x5 32

Por consiguiente, para calcular la media muestral se escribe

xi x x2 x3 x4 x5 46 54 42 46 32
x 1 44
n 5 5
La media muestral del tamao del grupo es 44 estudiantes.
Para proporcionar una perspectiva visual de la media y mostrar cmo puede ser influida por
valores extremos, observe el diagrama de puntos para el tamao de un grupo que se muestra en
la figura 3.1. Considere el eje horizontal del diagrama de puntos como una larga tabla estrecha
102 Captulo 3 Estadstica descriptiva: Medidas numricas

FIGURA 3.1 La media como centro de balance para el diagrama de puntos del tamao
de un aula de clase

30 35 40 45 50 55

en la que cada punto tiene el mismo peso fijo y la media es el punto en el que colocaramos un
soporte o punto de giro bajo la tabla para mantener en equilibrio el diagrama de puntos. Es-
te es el mismo principio que usa un sube y baja en un parque, la nica diferencia radica en
que este juego tiene su soporte en el centro, para que cuando un extremo suba el otro baje.
Ahora considere lo que ocurrira en la balanza si el nmero ms grande fuera 114 en vez de 54.
Para restablecer el equilibrio, tendramos que mover hacia una direccin positiva el soporte
debajo de un nuevo punto. Para determinar qu tanto debe moverse el soporte, se debe calcular
la media muestral para el tamao modificado del grupo.

xi x x2 x3 x4 x5 46 114 42 46 32 280


x 1 56
n 5 5 5
De esta manera, la media para la nueva muestra de tamao del grupo es 56, con un incremento de
12 estudiantes. En otras palabras, deberamos mover 12 unidades el soporte de nuestra balanza
bajo el nuevo diagrama de puntos.
Otro ejemplo del clculo de una media muestral se da en la situacin siguiente. Suponga
que una agencia de colocacin de empleos a nivel universitario envi un cuestionario a una
muestra de licenciados en administracin de empresas recin egresados (Graduate) solicitando
informacin sobre los sueldos mensuales iniciales (Monthly Starting Salary). La tabla 3.1 mues-
tra los datos recabados. El sueldo mensual inicial medio para la muestra de 12 licenciados en
administracin de empresas se calcula como sigue:

xi x x2 . . . x12
x 1
n 12
3 850 3 950 . . . 3 880

12
47 280
3 940
12

TABLA 3.1 Sueldos mensuales iniciales de una muestra de 12 licenciados en administracin


de empresas recin egresados

Monthly Monthly
Graduate Starting Salary ($) Graduate Starting Salary ($)
1 3 850 7 3 890
2 3 950 8 4 130
WEB file 3 4 050 9 3 940
2012StartSalary 4 3 880 10 4 325
5 3 755 11 3 920
6 3 710 12 3 880
3.1 Medidas de posicin o localizacin 103

La ecuacin (3.1) ilustra cmo se calcula la media para una muestra con n observaciones.
La frmula para determinar la media de una poblacin es la misma, pero se emplea una notacin
diferente para indicar que se est trabajando con toda la poblacin. El nmero de observaciones
en una poblacin se denota con N y el smbolo para la media poblacional es .

La media muestral x es un MEDIA POBLACIONAL


estimador puntual de la
media poblacional . xi
(3.2)
N

Media ponderada
En la utilizacin de las frmulas para calcular la media muestral y la media poblacional, se
concede la misma importancia o peso a cada xi. Por ejemplo, la frmula de la media muestral
podra escribirse de la siguiente manera:

xi 1 1 1 1 1
x
n

n x i (x x2 . . . xn) (x1) (x2) . . . (xn)
n 1 n n n

Esto indica que cada uno de los elementos de la muestra tiene un peso de 1/n. Aunque esta es la
prctica ms comn, en algunos casos la media se calcula asignando a cada elemento un peso
que refleja su importancia relativa. Cuando se calcula as la media, se conoce como media
ponderada, que se calcula de la siguiente manera:

MEDIA PONDERADA

wi xi
x (3.3)
wi
donde
wi peso a observar de i

Cuando los datos provienen de una muestra, la ecuacin (3.3) proporcionar como resultado
la media muestral ponderada. Si los datos provienen de una poblacin, , reemplaza a x y la
ecuacin (3.3) proporcionar como resultado una media poblacional ponderada.
Para ejemplificar la necesidad de una media ponderada, considere la siguiente muestra de
cinco compras de materia prima durante los ltimos tres meses:

Compra Costo por libra ($) Nmero de libras


1 3.00 1 200
2 3.40 500
3 2.80 2 750
4 2.90 1 000
5 3.25 800

Observe que el costo por libra vara entre $2.80 y $3.40, y la cantidad adquirida vara entre
500 y 2 750 libras. Suponga que un gerente desea conocer el costo medio por libra de materia
prima. Dado que las cantidades solicitadas varan, debemos utilizar la frmula de la media
104 Captulo 3 Estadstica descriptiva: Medidas numricas

ponderada. Los cinco valores de costo por libra son x1 3.00, x2 3.40, x3 2.80, x4 2.90 y
x5 3.25. Para determinar la media ponderada del costo por libra se debe asignar un peso a cada
costo, con base en su cantidad correspondiente. Para este ejemplo, los pesos son w1 1 200,
w2 500, w3 2 750, w4 1 000 y w5 800. Con base en la ecuacin (3.3), la media ponde-
rada se calcula as:

1 200(3.00) 500(3.40) 2 750(2.80) 1 000(2.90) 800(3.25)


x
1 200 500 2 750 1 000 800
18 500
2.96
6 250
De este modo, el clculo de la media ponderada indica que el costo medio por libra de materia
prima es de $2.96. Observe que si utilizramos la ecuacin (3.1) en vez de la ecuacin para la
media ponderada (3.3), ello conducira a un resultado errneo. En este caso, la media muestral
de los cinco valores de costo por libra es (3.00 3.40 2.80 2.90 3.25)/5 15.35/5
$3.07, lo que exagera el costo medio real por libra adquirida.
La eleccin de las ponderaciones para un clculo especfico de media ponderada depende de
la aplicacin. Un ejemplo bien conocido por los estudiantes universitarios es el clculo de una
calificacin promedio (grade point average, GPA). En este clculo, los valores que se usan
por lo general para los datos son 4 para una calificacin de A, 3 para B, 2 para C, 1 para D y
0 para F. Estos pesos significan el nmero de horas acreditadas para cada calificacin. El ejer-
cicio 16 al final de esta seccin proporciona un ejemplo para este clculo de media ponderada.
En otros clculos de media ponderada, las cantidades como libras, dinero o volumen se emplean
por lo general como pesos. En cualquiera de los casos, cuando los elementos varan en impor-
tancia, el analista debe elegir el peso que refleje mejor la importancia de cada elemento para
determinar de la media.

Mediana
La mediana es otra medida de posicin central; es el valor de en medio cuando los datos estn
acomodados en orden ascendente (del valor menor al mayor). Con un nmero impar de obser-
vaciones, la mediana es el valor de en medio. Con un nmero par, no hay valor de en medio.
En este caso se sigue la convencin y la mediana se define como el promedio de los valores de
las dos observaciones de en medio. Por conveniencia, la definicin de la mediana se replantea
como sigue.

MEDIANA

Ordene los datos de forma ascendente (del valor menor al mayor).


a) Para un nmero impar de observaciones, la mediana es el valor de en medio.
b) Para un nmero par de observaciones, la mediana es el promedio de los dos va-
lores de en medio.

Esta definicin se aplica para calcular la mediana de los tamaos de grupo para la muestra de
cinco grupos de estudiantes universitarios. Al ordenar los datos de forma ascendente se obtiene
la lista siguiente:

32 42 46 46 54

Dado que n 5 es impar, la mediana es el valor de en medio. As, la mediana del tamao del
grupo es 46 estudiantes. Aun cuando este conjunto de datos contiene dos observaciones con
valores de 46, cada una se trata de forma separada cuando los datos se acomodan en orden
ascendente.
3.1 Medidas de posicin o localizacin 105

Suponga adems que se calcula la mediana de los sueldos iniciales para los 12 licenciados
en administracin de empresas de la tabla 3.1. Primero se acomodan los datos en orden as-
cendente.

3 710 3 755 3 850 3 880 3 880 3 890 3 920 3 940 3 950 4 050 4 130 4 325


Los dos valores de en medio

Como n 12 es par, se identifican los dos valores de en medio: la mediana es el promedio de


estos dos valores.

3 890 3 920
Mediana 3 905
2
El procedimiento que se utiliza para calcular la mediana depende de si el nmero de elemen-
tos es par o impar. A continuacin se describe un enfoque ms conceptual y visual utilizando
el sueldo inicial de los 12 graduados en administracin de empresas. Al igual que se hizo antes,
comenzaremos por ordenar los datos en forma ascendente.

3 710 3 755 3 850 3 880 3 880 3 890 3 920 3 940 3 950 4 050 4 130 4 325

Una vez que los datos se encuentran en orden ascendente, se eliminan por pares los valores ex-
tremos altos y bajos, hasta que no queden pares de valores sin eliminar por completo los datos.
Por ejemplo, despus de eliminar el elemento menor (3 710) y el mayor (4 325), se obtiene un
nuevo conjunto de datos con 10 elementos.

3 710 3 755 3 850 3 880 3 880 3 890 3 920 3 940 3 950 4 050 4 130 4 325

Al eliminar el valor menor que sigue (3 755) y el siguiente valor mayor (4 130), obtendremos un
nuevo conjunto de datos con ocho observaciones.

3 710 3 755 3 850 3 880 3 880 3 890 3 920 3 940 3 950 4 050 4 130 4 325

Al continuar con el procedimiento, se obtienen los siguientes resultados:

3 710 3 755 3 850 3 880 3 880 3 890 3 920 3 940 3 950 4 050 4 130 4 325
3 710 3 755 3 850 3 880 3 880 3 890 3 920 3 940 3 950 4 050 4 130 4 325
3 710 3 755 3 850 3 880 3 880 3 890 3 920 3 940 3 950 4 050 4 130 4 325

En este punto no es posible continuar sin eliminar todos los datos, por lo tanto, la mediana es el
promedio de los dos valores restantes. Cuando existe un nmero par de elementos, el proceso de
eliminacin siempre concluir con dos valores restantes, y el promedio de estos dos valores ser
la mediana. Cuando existe un nmero impar de elementos, el proceso de eliminacin siempre
terminar en un valor final, que ser la mediana. Por lo anterior, este mtodo funciona tanto para
un nmero de elementos par como para uno impar.
La mediana es la medida Aunque la media es la medida de posicin central de uso ms comn, en algunas situaciones
de posicin que ms se se prefiere la mediana, ya que los valores de datos muy pequeos y muy grandes influyen en la
utiliza para los datos de los
media. Por ejemplo, suponga que uno de los licenciados recin graduados (tabla 3.1) tena un
ingresos anuales y el valor
de propiedad, debido a que sueldo inicial de $10 000 al mes (tal vez la empresa es propiedad de su familia). Si se cambia
algunos ingresos o valores el sueldo mensual inicial ms alto de la tabla 3.1 de $4 325 a $10 000 y se vuelve a calcular la
de propiedad muy grandes media, la media muestral pasa de $3 940 a $4 413. Sin embargo, la mediana de $3 905 permane-
pueden inflar la media. ce igual, ya que $3 890 y $3 920 siguen siendo los dos valores de en medio. Si el sueldo inicial
En tales casos, la mediana
es sumamente alto, la mediana proporciona una mejor medida de posicin central que la me-
es la medida preferida de
posicin central. dia. Al hacer una generalizacin, se afirma que siempre que un conjunto de datos contiene va-
lores extremos, la mediana suele ser la medida preferida de posicin central.
Anderson

Sweeney

E
l propsito de este libro es proporcionar una introduccin a los conceptos clave de la
estadstica, para lo cual emplea una orientacin fundamental hacia las aplicaciones del
Williams

anlisis de datos y la metodologa. El anlisis y el desarrollo de cada tcnica se presentan
desde esta perspectiva, cuyos resultados estadsticos permiten comprender las decisiones y
soluciones de los problemas. Camm
Entre los cambios relevantes en esta edicin, se pueden mencionar los siguientes:

ESTADSTICA DESCRIPTIVA. Se incorpora material nuevo sobre visualizacin de datos, mejores Cochran
prcticas, grficas de barras apiladas y de barras agrupadas. Tambin se integra una nueva seccin
sobre dashboards o tableros de datos y cmo incorporar resmenes estadsticos para mejorar su
eficacia.

PARA

ESTADSTICA
DISTRIBUCIONES DISCRETAS. Se incluye una nueva seccin sobre distribuciones bivariadas
discretas y sus aplicaciones en las finanzas, por ejemplo, cmo elaborar y analizar portafolios
financieros por medio de estas distribuciones.

NEGOCIOS Y ECONOMA
COMPARACIN DE MLTIPLES PROPORCIONES, PRUEBAS DE INDEPENDENCIA Y DE
BONDAD DE AJUSTE. Se incorpora una nueva seccin sobre pruebas de igualdad para tres o ms
proporciones poblacionales, as como un procedimiento para llevar a cabo pruebas de
comparaciones mltiples entre todos los pares de proporciones poblacionales. Tambin se
incluyen apndices revisados con instrucciones detalladas para Minitab, Excel y StatTools.

NUEVOS CASOS PRCTICOS. Se incluyen nuevos casos prcticos, los cuales brindan la
oportunidad de analizar bancos de datos ms grandes y preparar los informes gerenciales con
base en los resultados del anlisis.

NUEVAS APLICACIONES REALES. Cada captulo comienza con un caso real. Por ejemplo,
en el captulo 4 se describe cmo un equipo de la NASA aplic la probabilidad para ayudar

ESTADSTICA
en el conocido rescate de los 33 mineros chilenos atrapados en un derrumbe.

NUEVOS EJEMPLOS Y EJERCICIOS CON DATOS REALES. Se desarrollan


explicaciones y ejercicios para mostrar los mltiples usos de la estadstica en los

PARA NEGOCIOS Y ECONOMA


negocios a partir de estudios reales publicados en fuentes como The Wall Street
Journal, USA Today y Barrons. En total, esta edicin contiene ms de 350 ejemplos
y ejercicios de este tipo.

12 EDICIN

ISBN-13: 978-607-522-457-2
ISBN-10: 607-522-457-2

Anderson Sweeney Williams Camm Cochran

Visite nuestro sitio en http://latinoamerica.cengage.com


9 786075 224572

You might also like