UNIVERSIDAD NACIONAL DEL CALLAO

VICERECTORADO DE INVESTIGACIÓN
FACULTAD DE CIENCIAS ECONÓMICAS

TEXTO DE ESTADÍSTICA COMPUTACIONAL CON R, EXCEL, MINITAB Y SPSS

AUTOR: JUAN FRANCISCO BAZÁN BACA
(Resolución Rectoral 1351-2008-R del 22-12-08) 01-12-08 al 30-11-10

CALLAO – PERÚ 2010

ÍNDICE Pág. INDICE INTRODUCCIÓN Capítulo 1. CONSTRUCCIÓN DE UNA BASE DE DATOS 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Introducción Definición de variables Introducción de datos Archivo de datos Transformación de datos Recodificación de datos Manipulación de archivos 2 10 11 11 13 27 30 39 43 49

Capítulo 2. PRESENTACIÓN DE DATOS 2.1 2.2 2.3 2.4 2.5 2.6 2.7 Introducción Cuadros estadísticos Distribución de frecuencias Gráficos estadísticos Gráficos de variables cualitativas Gráficos de frecuencias Diagrama de tallos y hojas

50 50 50 72 87 89 98 112

Capitulo 3. MEDIDAS DE POSICIÓN 3.1 3.2 3.3 3.4 3.5 3.6 3.7 Introducción Mediaaritmética Mediana Moda Media geométrica Media armónica Los cuantiles: cuartiles, deciles y percentiles

115 115 116 120 124 133 137 140

Capítulo 4. MEDIDAS DE DISPERSIÓN Y FORMA 4.1 Introducción

155 155

2

4.2 4.3 4.4 4.5 4.6 4.7 4.8

Rango. Rango intercuartílico Desviación media La varianza La desviación típica El coeficiente de variación El diagrama de cajas o boxplot Medidas de forma de la distribución

156 158 160 166 167 174 182

Capítulo 5. CORRELACIÓN Y REGRESIÓN SIMPLE 5.1 5.2 5.3 5.4 5.5 Introducción Diagrama de dispersión Covarianza y coeficiente de correlación Regresión lineal simple Coeficiente de determinación

190 190 191 196 200 202

Capítulo 6. MODELOS DISCRETOS DE PROBABILIDAD 6.1 6.2 6.3 6.4 6.5 Introducción Distribución binomial Distribución Poisson Distribución hipergeométrica Distribución geométrica

210 210 211 224 236 246

Capítulo 7. MODELOS CONTINUOS DE PROBABILIDAD 7.1 7.2 7.3 7.4 7.5 7.6 Introducción Distribución uniforme o rectangular Distribución exponencial Distribución normal Distribución chi-cuadrado Distribución T de student

258 258 259 269 278 288 295

REFERENCIAS BIBLIOGRÁFICAS

303

Anexo

304

3

ÍNDICE DE CUADROS Y FIGURAS CUADROS 1.1 Tabla de la masa corporal ideal 2.1 PBI por rama de la actividad económica, según año: 2000-07 2.2 Alumnos de estadística básica 09-A de la FCE-UNAC, por sexo, según hobby 2.3 Alumnos de estadística básica 09-A de la FCE-UNAC, por sexo, según especialización y hobby 2.4 Alumnos de estadística básica 2009-A, de la FCE-UNAC, según hobby 2.5 Alumnos de estadística básica 2009-A, de la FCE-UNAC, según el número de miembros en la familia 2.6 Pesos (Kg.) de los 60 alumnos de estadística básica 09-A UNAC 2.7 Distribución de frecuencias de los pesos de los alumnos de estadística básica 09-A FCE-UNAC 3.1 Resumen de los cuantiles calculados para los pesos (Kg.) de los alumnos de estadística básica 09-A, FCE-UNAC, por la forma en que están los datos 3.2 Resumen de los percentiles calculados para los pesos (Kg.) de los alumnos de estadística básica 09-A, de la FCE-UNAC, por programa usado 4.1 Resumen de las medidas de dispersión calculadas para los pesos (Kg.) de los alumnos de estadística básica 09-A, de la FCE-UNAC, por programa usado 174 154 150 80 75 78 63 73 Pág. 39 55 58

FIGURAS 1.1 Variables definidas en Excel 1.2 Variables definidas en Minitab 1.3 Editor de datos en SPSS 1.4 Definición del Tipo de variable 1.5 Cuadro de diálogo para definir Etiquetas de Valor 1.6 Cuadro de diálogo para Definir Valores Perdidos 1.7 Vista de Variables definidas en SPSS 1.8 Variables definidas en SPSS 1.9 Abriendo base de datos en R desde un block de notas 1.10 1.11 1.12 Base de datos en Excel Base de Datos en MINITAB Base de datos en SPSS 15 16 16 18 20 21 23 24 26 28 28 29 Pág. 4

FIGURAS

1.13 1.14 1.15 1.16 1.17 1.18 1.19 1.20 1.21 1.22 1.23 1.24 1.25 1.26 1.27 1.28 1.29

Base de datos en R Ventana de archivamiento en Excel Cuadro de diálogo para Guardar como, en Excel Ventana de File (archivo), en Minitab Cuadro de diálogo para Save Project As, en Minitab Cuadro de diálogo para Guardar como, en SPSS Cuadro de diálogo para Guardar área de trabajo, en R Cálculo del imc en Excel Cálculo de la talla_m en Minitab Cálculo de la variable talla_m en SPSS Tipos de recodificación en Minitab Obtención de la Condición, recodificando el IMC en Minitab Resultado de la Condición recodificando el IMC en Minitab Obtención de la Condición, recodificando el IMC en SPSS Recodificar Valores antiguos del IMC y nuevos de Condición en SPSS Resultado de la Condición recodificando el IMC en SPSS Resultado de la Condición recodificando el IMC en R

29 30 31 32 33 34 35 40 41 42 43 44 45 46 47 47 48 51 56 57 60 61 64 65 66 67 67 73 79 80 81 82 83 Pág. 5

2.1 Estructura de un cuadro estadístico 2.2 Obtención de un cuadro bidimensional con SPSS 2.3 Mostrar en las casillas 2.4 Obtención de un cuadro bidimensional con Minitab 2.5 Escoger qué mostrar en las casillas con el Minitab 2.6 Cuadro tridimensional en SPSS 2.7 Creando tabla dinámica en Excel 2.8 Tabla dinámica para Sexo y Hobby en Excel 2.9 Tabla dinámica para Sexo y Hobby con porcentajes en Excel 2.10 Tabla dinámica para Sexo, Especialización y Hobby en Excel 2.11 Obtención de tablas de frecuencias en SPSS 2.12 Obtención de tabla de frecuencias en Excel 2.13 Argumentos de la función Frecuencia 2.14 Recodificación de la variable peso en Minitab 2.15 Variable peso recodificada en pesos (intervalos) con Minitab 2.16 Obtención de tabla de frecuencias en Minitab (variable pesos) FIGURAS

2.17 Recodificando la variable peso en SPSS 2.18 Recodificar Valores antiguos del peso y nuevos de pesos en SPSS 2.19 Resultado de la variable pesos, recodificando el peso en SPSS 2.20 Resultado de la variable pesos, recodificando el peso en R 2.21 Gráfico de sectores en Excel 2.22 Gráfico de sectores en SPSS 2.23 Gráfico de sectores en Minitab 2.24 Gráfico de sectores en R 2.25 Gráfico de barras de la variable hobby en Minitab 2.26 Datos de la variable hobby y clase en Excel 2.27 Herramientas del Análisis de datos en Excel 2.28 Obteniendo gráfico de Pareto en Excel 2.29 Gráfico de Pareto de la variable hobby en Excel 2.30 Gráfico de Pareto de la variable hobby en Minitab 2.31 Gráfico de barras de los miembros de la familia en Excel 2.32 Gráfico de barras de los miembros de la familia en SPSS 2.33 Gráfico de barras de los miembros de la familia en Minitab 2.34 Obteniendo el Histograma de peso en Excel 2.35 Histograma de frecuencia del peso en Excel 2.36 Obteniendo el histograma de peso en Minitab 2.37 Edición (en Binning) del histograma de peso en Minitab 2.38 Histograma de frecuencia del peso en Minitab 2.39 Histograma de frecuencia del peso en SPSS 2.40 Histograma de frecuencia del peso en R 2.41 Edición del histograma de densidad de peso en Minitab 2.42 Histograma de densidad de peso en Minitab 2.43 Datos para el Polígono de frecuencias y Ojiva del peso en Minitab 2.44 Scatterplot para el Polígono de frecuencias del peso en Minitab 2.45 Polígono de frecuencias del peso en Minitab 2.46 Scatterplot para la Ojiva del peso en Minitab 2.47 Ojiva del peso en Minitab 3.1 Cálculo de la media para datos agrupados en Excel 3.2 Cálculo de la media aritmética (PROMEDIO) en Excel FIGURAS 6

83 84 85 86 90 91 91 92 94 95 95 95 96 97 98 99 100 101 102 103 104 104 105 106 108 108 109 110 110 111 112 117 129 Pág.

6 Diagrama de cajas y bigotes de la variable peso en Minitab 4.13 Boxplot del peso para hombres y mujeres en R 4.7 Cálculo de cuartiles en Excel 3.9 Cálculo de cuartiles y percentiles en SPSS 4. por sexo 4.5 Creando el diagrama de dispersión en SPSS 5.4 Diagrama de dispersión de la cantidad y precio en Minitab 5.11 Boxplot del peso para hombres y mujeres en SPSS 4.9 Ventana de diálogo Explorar para definir el boxplot de peso en SPSS 4.8 Resultado de cuartiles y percentiles en Excel 3.3.6 Diagrama de dispersión de la cantidad y precio en SPSS 5.4 Selección de la variable peso para calcular estadígrafos en Minitab 3.2 Selección de estadígrafos de dispersión en Minitab 4. mediana y moda en Excel 3. .8 Boxplot del peso para hombres y mujeres en Minitab 4.8 Aplicando Regresión en Excel 5.11 Aplicando Regresión en SPSS 6.1 Medidas de dispersión obtenidas con Excel 4.1 Definiendo el diagrama de dispersión en Excel 5.12 Diagrama de cajas y bigotes de la variable peso en R 4.7 Diagrama de dispersión de la cantidad y precio en R 5.3 Cálculo de estadígrafos de dispersión en SPSS 4.1 Cálculo de probabilidades para la distribución binomial en Excel FIGURAS 7 129 130 130 131 151 152 153 169 170 171 175 176 176 177 178 179 179 180 181 182 187 192 192 193 193 194 195 196 204 205 205 207 214 Pág.4 Estructura del diagrama de cajas y bigotes (boxplot) 4.3 Resultados de la media aritmética.9 Resultado de la Regresión de cantidad y precio de muñecas en Excel 5.10 Aplicando Regresión en Minitab 5.5 Ventana de diálogo para definir el boxplot de peso en Minitab 4.14 Cálculo de la asimetría y curtosis en Excel 5.5 Selección de estadígrafos de posición a calcular en Minitab 3.7 Efectuando Gráfico Múltiple de Boxplot para peso.3 Definiendo el diagrama de dispersión en Minitab 5.10 Diagrama de cajas y bigotes de la variable peso en SPSS 4.2 Diagrama de dispersión de la cantidad y precio en Excel 5.6 Cálculo de estadígrafos de Tendencia central en SPSS 3.

22 Solución del Ejemplo 6.24 Probabilidades con distribución geométrica en Minitab 6.4 Probabilidad acumulada con la distribución binomial en Minitab 6.6.18 Probabilidades con distribución hipergeométrica en Minitab 6.17 Probabilidad con la distribución hipergeométrica en Minitab 6.16 Solución del Ejemplo 6. hipergeométrica en SPSS 6.10 Probabilidad con la distribución Poisson en Minitab 6.14 Distribución de probabilidades Poisson del ejemplo 6.9 Solución del Ejemplo 6.15 Cálculo de distribución hipergeométrica en Excel 6.3 en Excel 6.3 Definiendo el área a sombrear para probabilidades acumuladas con la distribución uniforme en Minitab 7. de probabilidades geométrica del ejemplo 6.4 en SPSS 6.23 Probabilidad con la distribución geométrica en Minitab 6.3 Probabilidad con la distribución binomial en Minitab 6.6 Cálculo de las densidades f(x) con la distribución uniforme en SPSS FIGURAS 8 215 216 217 218 220 221 227 228 229 230 231 232 233 238 239 240 241 242 243 243 248 249 251 252 253 254 261 263 263 264 265 266 Pág.2 Graficando probabilidades acumuladas para la uniforme en Minitab 7.11 Probabilidad para varios valores con distribución Poisson en Minitab 6. de probabilidades hipergeométrica del ejemplo 6.4 en Excel 6.8 Cálculo de probabilidades para la distribución Poisson en Excel 6.2 en Excel 6.1 Probabilidad con la distribución uniforme en Minitab 7.13 Probabilidades acumuladas con la distribución Poisson en SPSS 6.7 Probabilidades acumuladas con la distribución binomial en SPSS 6.25 Cálculo de probabilidades con la distribución geométrica en SPSS 6.27 Distrib.2 Solución del Ejemplo 6.12 Cálculo de probabilidades con la distribución Poisson en SPSS 6.26 Probabilidades acumuladas con la distribución geométrica en SPSS 6.6 Cálculo de probabilidades con la distribución binomial en SPSS 6. .19 Cálculo de probabilidades con la distrib.20 Probabilidades acumuladas con la distrib.5 en Excel 6.21 Distrib. uniforme en Minitab 7. acum. hipergeométrica en SPSS 6.3 en SPSS 6.5 Probabilidad para varios valores con distribución binomial en Minitab 6.5 en SPSS 7.5 Gráfico del inverso de probab.4 Cálculo y gráfico de P(22 ≤ X ≤ 24) con la dist. Con la dist. uniforme en Minitab 7.

14 Cálculo de probabilidades acumuladas con la normal en Excel 7.10 Probabilidad acumulada con la distribución exponencial en Minitab 7.11 Graficando probabilidades acum.8 Densidades y probab.12 Cálculo de probab. para la exponencial en Minitab 7.6 ≤ X ≤ 37. acumuladas con la chi-cuadrado en SPSS 7.18 Probabilidades acumuladas con la distribución normal en SPSS 7.17 Cálculo de probab.13 Probabilidades acumuladas con la distrib.23 Gráfico de P(-1. uniforme en SPSS 7.7 Probabilidades acumuladas con la distribución uniforme en SPSS 7.20 Gráfico de P(14.22 Cálculo de probabilidades acumuladas con la t en Excel 7. con la distribución exponencial en SPSS 7.7) con la chi-cuadrado en Minitab 7. acumuladas con la t en SPSS 267 267 271 272 274 276 276 281 283 284 286 287 291 292 294 298 300 301 9 . exponencial en SPSS 7.7.060) con la t en Minitab 7. acumuladas con la distribución normal en SPSS 7. acum.24 Cálculo de probab.21 Cálculo de probab.316 ≤ X ≤ 2.19 Cálculo de probabilidades acumuladas con la chi-cuadrado en Excel 7.16 Graficando probabilidades acumuladas con la normal en Minitab 7.9 Cálculo de probabilidades acumuladas con exponencial en Excel 7. acumuladas con la distrib.15 Probabilidad acumulada con la distribución normal en Minitab 7.

Minitab y SPSS” que de manera sencilla y práctica ayude a los estudiantes de la estadística a efectuar sus aplicaciones. dispersión y forma. Minitab 15.0 en español. En los capítulos seis y siete. Las aplicaciones se desarrollan tanto en las versiones comerciales del Excel 2007. acompañada de aplicaciones manuales y computacionales en cada programa. se explica la Construcción de una base de datos muy necesaria para procesar encuestas y otros cálculos. En los capítulos tres. como en la versión de uso libre del programa R-2. cuatro y cinco se presentan los indicadores de resumen de los datos mediante las medidas de posición.INTRODUCCIÓN La estadística ha desarrollado una serie de técnicas y procedimientos cuyas aplicaciones procedimentales requieren de algunas herramientas de cálculo como son las calculadoras programadas o los programas estadísticos desarrollados en diferentes plataformas computacionales. En el capítulo 2. ya que gracias a su esfuerzo y comprensión en los últimos años se han puesto en práctica los resultados de este modesto trabajo. A fin de contribuir al proceso de enseñanza aprendizaje del instrumental estadístico. se describe la Presentación de datos a través de cuadros y gráficos. así como el análisis de correlación y regresión simple acompañadas del concepto. se desarrollan los modelos discretos y continuos de probabilidad.11. En el primero. formas de cálculo (con datos sin agrupar y agrupados). interpretación de resultados y aplicaciones computacionales con cada uno de los programas. 24.0 English y SPSS 15. Agradezco a nuestra querida UNAC por el continuo apoyo ofrecido para alcanzar estos logros que permiten sistematizar conocimientos e incorporar temas para la discusión en clases. hemos creído conveniente elaborar un “Texto de Estadística computacional con R.1 cuya instalación se explica en la pág. El reconocimiento especial a los estudiantes de economía de la FCE-UNAC. partiendo de una presentación sencilla de sus características. 10 . Excel. El texto consta de siete capítulos.

se usa el Cuestionario de “Características del Alumno” que se muestra en la página siguiente. en la FCE-UNAC. 11 . CONSTRUCCIÓN DE UNA BASE DE DATOS “El hombre más feliz del mundo es aquel que sepa reconocer los méritos de los demás y pueda alegrarse del bien ajeno como si fuera propio” Johann Wolfgang von Goethe CONTENIDO 1. el mismo que fue aplicado a 60 alumnos del curso de Estadística Básica. Definición de variables. Manipulación de archivos. Transformación de datos. es necesario construir una Base de Datos (BD) que facilite procesamiento electrónico de los mismos mediante la obtención de cuadros.7 Introducción. Una Base de Datos es un arreglo matricial cuyas columnas contienen los Campos (las variables o preguntas del estudio) y las filas los Registros de datos (casos para el SPSS correspondientes a cada unidad de investigación estudiada. Para abreviar esta parte diseñaremos la base de datos inicialmente en Excel y de aquí veremos como se exporta a R.1 INTRODUCCIÓN Durante la fase de Elaboración de datos de una Encuesta. Excel. Introducción de datos.2 1.6 1.Capítulo 1. gráficos.4 1.1 1. 1. indicadores estadísticos y relaciones entre variables en las que esta interesado el investigador a partir de los propósitos de su investigación. Recodificación de datos. Archivo de datos. Minitab y SPSS) es necesario que el programa reconozca las variables consideradas y algunos detalles que se deben tomar en cuenta.3 1. Para el presente trabajo.5 1. Minitab y SPSS con sus particularidades especiales en el SPSS. Para efectos de procesamiento en cualquiera de los programas que estamos trabajando (R. el semestre 2009-A.

Nº de libros leídos el 2008: ….... 2 4 11.... Créditos aprobados acumulados: …… 10.... 1 3 Departamento en edificio Otro …... Edad: …. (Especifique) 9. Sexo: Masculino ………. 8...... 2 Baile 5 2 5 2 5 2 3 Otro …. Importancia de tu físico: Media 3 18.. 3.... ¿En que tipo de vivienda reside? Casa independiente Quinta …………........ ……. Gastos de estudio medio mensual: S/..... Peso (Kg.. ¿En que desea especializarse? Teor..... 4.... (Especifique 16... Talla (cm.....UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ECONÓMICAS Asignatura: Estadística Básica Profesor : Ingº Juan Francisco Bazán Baca CARACTERÍSTICAS DEL ALUMNO Nº……..... Horas semanales de TV: ……. 1 Femenino 2 2. Horas de estudio semanal fuera de clase: ……… 15..) ….. 5... Importancia de tus estudios: Media 3 Muy poca Mucha Muy poca Mucha Estatal 1 4 1 4 1 Poca Muchísima Poca Muchísima No Estatal 1 Gestión Empresarial 17..... Apellidos y Nombres: …………………………………………………………………….....) …. Colegio de procedencia: 19... 13....... Nº de dormitorios: ………. 14... 1... Ingreso familiar mensual: S/.... Promedio ponderado acumulado: …….... Nº de miembros en la familia: …… 7. Económica Callao.... 6... ¿Cuál es tu principal HOBBY? Deportes TV/Cine 1 4 Música 12... Abril de 2009 2 MUCHAS GRACIAS 12 .

promedio ponderado del alumno. ingreso. La medición de las variables cualitativas puede ser Nominal (las cualidades observadas no implican un orden particular.) y Razón (el valor cero indica la nulidad del estudio y el cociente de dos valores tiene significado. Ejemplo: nivel educativo.) y Ordinal (las cualidades observadas responden a un orden determinado.. Ejemplo: la temperatura. número de libros leídos el año anterior. hobby. etc. Tipos de Variables.. Variables cuantitativas. importancia de sus estudios.son aquellas cuyo resultado de la observación es un valor numérico. talla. Ejemplo: tipo de vivienda. Ejemplo: Sexo.) 13 . número de perceptores de ingreso en el hogar. peso. Ejemplo: ingreso familiar. Ejemplo: edad (años cumplidos). gastos de estudio mensual.las variables pueden ser cualitativas o cuantitativas. Variable cuantitativa discreta. hobby. créditos aprobados.son aquellas que responden a una categoría. distrito de residencia. etc. calidad del servicio. las notas o calificaciones en alguna escala. número de dormitorios. gastos de estudio. etc. La medición de variables cuantitativas puede ser Intervalo (cuando el cero y la escala de medida son arbitrarios. etc. horas de estudio semanal.. Variables cualitativas. etc. Ejemplo: peso. talla. colegio de procedencia.2 DEFINICIÓN DE VARIABLES Variable.. ingreso. Ejemplo: número de miembros en la familia. etc.. Las variables cuantitativas pueden ser discretas o continuas. etc. Son la mayoría de variables cuantitativas.. etc. edad.es una característica de interés observada en la población y que esta sujeta a diferentes resultados o valores. Variable cuantitativa continua.1. cualidad o atributo observado en la unidad de investigación. etc.son aquellas que son el resultado del conteo y asumen valores enteros. Ejemplo: sexo. especialización.son aquellas que son resultado de la medición y pueden tomar cualquier valor dentro de un intervalo.

Se recomienda empezar con el número de cuestionario (nº_cuest) para identificar la unidad de análisis a la que corresponden los datos y corregir los mismos ante cualquier error. A continuación se definen las siguientes variables.físico (pregunta 17: Importancia de tu físico) 14 . a) En EXCEL En una primera línea de la hoja de cálculo de Excel se específica el nombre de la variable utilizando el menor número posible de caracteres. Así tenemos las variables: sexo (pregunta 1) edad (pregunta 2) peso (pregunta 3) talla (pregunta 4) ing.acum (pregunta 9: Promedio ponderado acumulado) t.dormit (pregunta 11: Nº de dormitorios) horas. de modo que recoja el sentido de la pregunta. para facilitar posteriormente el ingreso de los datos.leidos (pregunta 14: Nº de libros leídos el 2008) hobby (pregunta 15: ¿Cuál es tu principal hobby?) imp.fam (pregunta 6: Nº de miembros en la familia) g. se tiene que indicar en cada campo (columna) las preguntas consideradas en el Cuestionario del estudio de manera abreviada.tv (pregunta 12: Horas semanales de TV) hrs.fam (pregunta 5: Ingreso familiar mensual: S/.) mie.estud (pregunta 7: Gastos de estudio medio mensual S/.estudio (pregunta 16: Importancia de tus estudios) imp.) cr.estu (pregunta 13: Horas de estudio semanal fuera de clase) lib.Para definir las Variables en una BD.aprob (pregunta 8: Créditos aprobados acumulados) prom.viv (pregunta 10: ¿En que tipo de vivienda reside?) nº. en el mismo orden en que se han formulado las preguntas en el Cuestionario.

Debajo de C1 hemos definido el nº_cuest (número de cuestionario). aparecen dos hojas: una de Session (Sesión: donde se muestran los resultados de tareas resueltas con el programa) y otra Worksheet (Hoja de Trabajo: similar a la de Excel y SPSS donde se definen las variables y se ingresa los datos). debajo de C2 sexo y así sucesivamente hasta C20 especial (ver figura 1.1 Variables definidas en Excel b) En MINITAB Al iniciar el programa Minitab 15.2) 15 . Las columnas aparecen definidas por la letra C y un dígito (que indica la columna.1 Figura 1.col.proc (pregunta 18: Colegio de procedencia) y especial (pregunta 19: ¿En que desea especializarse?) Las variables han sido definidas en la línea 6. tal como se muestra en la Figura 1.

Figura 1.3 Editor de datos en SPSS 16 . aparecen dos hojas: una de Resultados 1 [Dokument 1] – Visor SPSS (donde aparecen los resultados de las tareas efectuadas con SPSS) y otra Sin título [Conjunto_de_datos0] – Editor de datos SPSS (donde se definen las variables y se ingresan los datos del estudio) donde vamos a definir la base de datos.2 Variables definidas en Minitab c) En SPSS Al abrir el programa SPSS 15.Figura 1.

perdidos. con el que se comienza indicar algunas especificaciones de la variable. En general. EQ. ' y *). GE. dígitos. puntos o los símbolos #. Hay palabras reservadas que no se pueden utilizar como nombres de variable. columnas. Si el cuestionario contiene un número grande de preguntas se recomienda definir cada una de las variables (preguntas) de la siguiente manera: pgta_01. …. 17 .En la parte inferior del Editor de datos SPSS (ver figura 1. Para cada Variable (o característica en estudio) debemos indicar: nombre. NE. no se aceptan duplicados. etiqueta. alineación y medida. LE. pgta_150 y en el momento de definir la etiqueta de la variable indicar la pregunta formulada. BY. tipo. GT. estas son: ALL. ?. Justamente la fig. @. presionar Enter. _ o $.3) se observan dos vistas: una Vista de datos (donde se ingresan los datos para cada una de las variables en estudio) y otra Vista de variables (donde se definen las variables en estudio). en cada fila se van definiendo las variables en el mismo orden como aparecen en el cuestionario (o como el investigador quiera definirlas para cálculos estadísticos particulares). OR. NOT. al especificar del nombre de las variables se debe tener en cuenta: Debe comenzar por una letra y los demás caracteres pueden ser letras. 1. Establecido el nombre de la variable. valores. TO. dígitos o símbolos que se estimen necesarias de modo que con a lo más 64 caracteres juntos (sin espacio en blanco) resuman el significado de la variable o toda una pregunta del cuestionario. inmediatamente el cursor se ubica en Tipo (donde aparece automáticamente Numérico). pgta_02. anchura. . El nombre de la variable debe ser único.3 muestra la Vista de variables. decimales. WITH. AND. El nombre de variable no puede terminar en punto. Nombre El nombre de la variable debe comenzar con una letra del alfabeto español y luego utilizar las combinaciones de letras. No utilizar caracteres especiales (por ejemplo: !. tomando en cuenta algunas de las recomendaciones que a continuación señalamos. LT.

Tipo Seleccionar el tipo de datos que se espera para la variable. los mismos que aparecen sin separadores cada tres posiciones. El editor de datos acepta valores numéricos con o sin el exponente para estas variables.define una variable numérica cuyos valores se muestran con comas de separación cada tres posiciones y con un punto como separador de la parte decimal.define una variable numérica cuyos valores se muestran con puntos de separación cada tres posiciones y con una coma como separador de la parte decimal. En función del tipo escogido se visualizan los valores de la variable y éstos estarán disponibles sólo para aquellas operaciones que son esperables para los mismos. Figura 1.4 Definición del Tipo de variable Para definir. Punto... pulse el botón con los puntos suspensivos después de la palabra Numérico y aparece el cuadro de diálogo mostrado en la Figura 1.4. El editor de datos acepta valores numéricos para este tipo de variables. con o sin puntos.. o en notación científica. en el que se observa los tipos de variables siguientes: Numérico. El exponente puede ir precedido de E o D con un signo 18 . Coma. ubíquese en la casilla de Tipo..define una variable cuyos valores son números.define una variable numérica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base diez. Notación científica.

Las letras mayúsculas y las minúsculas son consideradas diferentes.. Decimales Determina el número de decimales para los valores de la variable.define una variable cuyos valores no son numéricos. por lo tanto.define una variable numérica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj. no se utilizan en los cálculos. comas o espacios en blanco. 1.23E+2. Fecha. El rango de siglo para los años de dos dígitos se toma de las opciones de configuración (Menú Edición. Anchura Establecer el número máximo de caracteres que contienen los valores de la variable. Pueden contener diferentes caracteres hasta la longitud definida. automáticamente aparecen 0 decimales y si es tipo numérica. Por ejemplo. 123. pestaña Datos) Dólar.23E2. Etiqueta En este recuadro se indica el nombre completo de la variable o la pregunta correspondiente formulada en el cuestionario hasta un máximo de 255 caracteres y espacios en blanco. o por el signo solamente.define una variable numérica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestaña Moneda del cuadro de diálogo Opciones del menú Edición. Automáticamente aparecen 8 caracteres. Seleccionar una plantilla de la lista desplegable.define una variable numérica cuyos valores contienen un signo de dólar.23D2. También son conocidas como variables alfanuméricas.23+2. puntos. Se recomienda escribirla toda con mayúsculas..opcional. Se puede introducir las fechas utilizando como delimitadores: barras. Moneda personalizada. Si la variable es tipo fecha o cadena. aparecen por defecto. una coma para la separación de los decimales y múltiples puntos. 1. ya que esta 19 . 2 decimales. 1.. Opciones. Cadena. Los caracteres definidos en la moneda personalizada no pueden emplearse para la introducción de datos pero sí los mostrará el editor de datos. o incluso 1.. guiones.

Figura 1. Es decir.5 Cuadro de diálogo para definir Etiquetas de Valor 20 . que si una variable cualitativa responde a varias cualidades (categorías o atributos) a cada una de ellas se le asigna un valor por lo general numérico. Valores En este recuadro por defecto. aparece Ninguno y sirve para asignar valores a los resultados de variables de tipo cualitativo (Etiquetas de valor) o para definir los rangos de variables cuantitativas transformadas con fines de procesamiento. A continuación se pulsa el tabulador y el cursor se sitúa en el recuadro Etiqueta donde se introduce la palabra o palabras que describen ese valor. pulsar el botón con los puntos suspensivos después de la palabra Ninguno y aparece el cuadro de diálogo mostrado en la Figura 1. luego pulsamos Añadir.5. inmediatamente el cursos se ubica nuevamente en Valor y se repite el proceso hasta que se define la etiqueta del último valor y se sale con Aceptar.etiqueta es la que aparece en los cuadros de salida cuando se procesan algunos resultados de interés y buscaremos de diferenciarlas de las etiquetas de valor. Los valores los definimos así: estando ubicado en la casilla de Valores. Para describir los valores de una variable de tipo cualitativo habrá que situar el cursor en el recuadro Valor e introducir el número o letra correspondiente. pudiendo ser también alfabético.

. Los valores perdidos los definimos así: estando ubicado en la casilla de Perdidos.son aquellos que define el usuario por diferentes motivos. Existen dos tipos de valores perdidos: Del sistema. se diferencie el nombre de la variable y sus categorías componentes. por defecto aparece No hay valores perdidos. Del usuario.6 Cuadro de diálogo para Definir Valores Perdidos Como se puede observar en la Figura 1.Se recomienda escribir las etiquetas de valor con mayúsculas y minúsculas (en el ejemplo Hombre y Mujer) para que cuando se obtenga un cuadro con la variable SEXO (con mayúsculas). pulsar el botón con los puntos suspensivos después de la palabra Ninguno y aparece el cuadro de diálogo mostrado en la Figura 1.. como por ejemplo cuando se han definido dos categorías de Sexo (1 = hombre y 2 = mujer) pero por error de digitación se puede colocar cualquier otro valor. entre los que podemos destacar aquellos que distorsionan los análisis estadísticos. además existe la posibilidad que el usuario defina tres Valores Perdidos Discretos o defina un Rango más un valor perdido discreto opcional 21 . Perdidos Son aquellos valores que no son considerados para realizar determinados cálculos estadísticos.cualquier casilla en blanco de la matriz de datos. Figura 1.6.6.

etc.. Si quiere modificar la Medida para la variable que esta definiendo. talla. peso. debiendo escoger la opción deseada haciendo clic sobre la palabra. por defecto aparece Derecha. Derecha y Centrado. debiendo escoger la opción deseada haciendo clic sobre la palabra. las variables edad.(un rango de valores perdidos definido por sus dos extremos junto con un solo valor discreto individual). Las medidas 22 . Escala.es utilizada para representar los valores de cualidades. Columnas Al igual que Anchura por defecto define un ancho de 8 para las Columnas de la base de datos. Se debe tener presente que sólo se pueden definir rangos para variables de tipo numérico y que no se pueden definir valores perdidos para variables de cadena larga (con más de 8 dígitos). ubíquese en la correspondiente casilla de alineación y haga clic en el botón que aparece al costado de Derecha e inmediatamente se despliegan las tres posibles opciones de alineación Izquierda. Si quiere modificar la Alineación de valores para la variable que esta definiendo. hobby.. hay que definirlo ubicándose en la casilla de Columnas y veremos que al extremo opuesto del 8 aparece un botón con un triángulo hacia arriba para aumentar el ancho y otro triángulo hacia abajo para disminuir dicho ancho de columna. Medida Indica el tipo de medición que le corresponde a la variable que estamos definiendo. Alineación Se tiene que escoger como van a estar alineados los valores en la base de datos.es utilizada para variables numéricas. sexo.). por defecto aparece Escala. atributos o categorías sin un orden particular (por ejemplo. etc. como por ejemplo. Ordinal y Nominal. Nominal. De requerirse otro ancho. También lo puede cambiar haciendo doble clic en la correspondiente casilla de Columnas para la variable que esta definiendo y digitar el ancho de columna deseado. ubíquese en la correspondiente casilla de medida y haga clic en el botón que aparece al costado de Escala e inmediatamente se despliegan las tres posibles opciones de medida: Escala.

2 = Mujer). 23 .8. se presenta en la Figura 1. 3 = Media. Poca. la variable Importancia de tus estudios con los valores Muy poca. se observan en la Vista de datos y se presenta en la Figura 1.7. Media. de la FCE-UNAC. 2 = Poca. Ordinal.7. La Vista de variables para la base de datos Estadística Básica 09A. Mucha y Muchísima. 1 = Muy poca. por ejemplo. Se recomienda utilizar valores numéricos para representar datos ordinales.. del 09A.nominales pueden ser valores de cadena (alfanuméricos) o numéricos que representen diferentes atributos (por ejemplo. Figura 1. 1 = Hombre. Las variables ordinales pueden ser valores numéricos o de cadena (alfanuméricos) que representen diferentes categorías (por ejemplo. Vista de Variables definidas en SPSS El encabezamiento para las variables definidas en la base de datos Estadística Básica 09A. Recordar que estas son las variables definidas a partir del cuestionario de “Características del alumno” de Estadística Básica.es utilizada para establecer un determinado orden entre los valores de la variable. 4 = Mucha y 5 = Muchísima).

Variables definidas en SPSS d) En R El programa R es un paquete estadístico de libre uso.1-win32. En la página escogida. se inicia el programa R. Una vez guardado el archivo. a continuación en Abriendo R-2. luego base. luego un país cuya web facilite la instalación. dentro de Download and Install R escoger Windows.1 for Windows. por ejemplo Australia (http://cran.unimelb. por ejemplo Download R 2.Figura 1. para cuya instalación se requiere ingresar por internet a la página web: http://www. 24 . por defecto.r-project. escoger la versión en la que se encuentra (que es única).exe.11. el cursor por defecto es el símbolo “ > ” indica que R esta listo para recibir y ejecutar un comando.8.org/ En el margen izquierdo escoger la opción CRAN. ejecutar la Instalación del programa la que al finalizar.au/ ). deja en el escritorio para su ejecución el ícono: Dando doble clic sobre el icono anterior.edu. escoger Guardar archivo.11.ms.

txt. se tiene que hacer la lectura de la misma por cualquiera de las siguientes maneras: desde un archivo con extensión *.txt) que se desea abrir. a un block de notas y grabarla como Estadística básica 09-A.. etc.table) o base de datos. lo cual significa que los comandos escritos en el teclado son ejecutados directamente sin necesidad de construir ejecutables. La sintaxis de R es muy simple e intuitiva. datos.txt.table(file. header=T esta indicando que es verdadero (en inglés true = T) que la tabla a escoger tiene encabezado (header) con el nombre de las variables (si no tiene encabezado. …. …. resultados. 25 .header=T) Se esta pidiendo que cree el objeto caso1. como resultado de leer una tabla (read. Una vez escogida la base de datos.choose() con la base de datos (Estadística básica 09-A. header=F.. Para tener una base de datos en una hoja de R. una regresión lineal se puede ejecutar con el comando lm(y~x).txt.choose(). Caso 1. En la sintaxis.Desde un archivo con extensión *.Según Paradis (2002) “R es un lenguaje orientado a objetos. Para que una función sea ejecutada en R debe estar siempre acompañada de paréntesis. Se procede copiando en R la siguiente sintaxis: > caso1=read. Por ejemplo. lógicos y comparativos) y funciones (que a su vez son objetos)”.al.. se guardan en la memoria activa del computador en forma de objetos con un nombre específico. El usuario puede modificar o manipular estos objetos con operadores (aritméticos. funciones. hacer clic en Abrir y la base de datos queda almacenada en la hoja de R con la denominación del objeto: caso1. como puede ser la base de datos (Estadística básica 09-A. el mismo que contiene 20 campos y 60 registros.” Paradis. señala también que “Orientado a Objetos significa que las variables.xls) trabajada en Excel y grabada con extensión *. solicitando la ruta correspondiente para escoger el archivo = file. o mediante un copy/paste “clipboard”.txt o copiar dicha base de datos de Excel.. incluyendo los encabezados con el nombre de la variable. Al hacer enter. desde un archivo de Excel con extensión csv. de false = falso en inglés). inmediatamente aparece la ventana de diálogo de la Figura 1. inclusive en el caso que no haya nada dentro de los mismos.9. et.

así: > caso1=read.txt ".choose se debe colocar entre comillas la ruta que contiene el archivo. header=T) > attach(caso1) 26 . Escribir en R: > attach(caso1) Si queremos editar los datos escribir: > fix(caso1) También se puede leer la base de datos. para que ello ocurra usamos el comando attach para unir las variables y reconozca a cada una de ellas por el nombre que aparece en el encabezado.Figura 1.table("D:/Beatriz/UNAC/Investigación/Proyecto 8 Estadística computacional/Base de datos/ Estadística básica 09-A. en forma parecida a la anterior. no reconoce a ninguna variable de manera independiente.9 Abriendo base de datos en R desde un block de notas Ha leído las variables de la base de datos de Estadística Básica 09A como un todo. sólo que en vez de file.

En Excel sombrear el encabezado y los datos de la base de datos que deseamos leer en R. en forma parecida a la anterior. Se procede copiando en R la siguiente sintaxis: > caso2=read.csv) que se desea abrir. 27 .”) aquí la base de datos (Estadística Básica 09A-copia. sólo que en vez de file.csv ". el mismo que contiene 20 campos y 60 registros idénticos a los del caso1. Una vez escogida la base de datos. en la que se ha definido los 20 campos (incluyendo los encabezados con el nombre de la variable) y los 60 registros.csv("D:/Beatriz/UNAC/Investigación/Proyecto 8 Estadística computacional/Base de datos/ Estadística Básica 09A-copia.") Al hacer enter. así: > caso2=read. es la forma más sencilla.Desde un archivo en Excel con extensión csv.9.csv..Caso 2. que lo que cambia es la forma de efectuar la lectura.header=T. escoger copiar (o Ctrl + C) y en R escribir: > caso3=read.3 INTRODUCCIÓN DE DATOS Una vez que se ha aplicado la encuesta y se ha efectuado la crítica-codificación de los cuestionarios.sep=".choose(). se ha grabado como libro de Excel y como tipo CSV (delimitado por comas). solicitando la ruta correspondiente para escoger el archivo con separador de comas (sep=”. desde el número 1 (registro 1) hasta el último. Para que el R junte y reconozca las variables escribir: > attach(caso2) También se puede leer la base de datos.. se efectúa el ingreso de datos cuestionario por cuestionario. en la base de datos definida en el programa correspondiente. hacer clic en Abrir y la base de datos queda almacenada en R con la denominación del objeto: caso2.Mediante un copy/paste “clipboard” de un archivo en Excel. header=T) > attach(caso2) Caso 3.table("clipboard") > attach(caso3) 1.choose se debe colocar entre comillas la ruta que contiene el archivo. Es decir.table(file. La base de datos se denomina Estadística Básica 09A-copia. inmediatamente aparece una ventana de diálogo idéntica a la de la Figura 1.

etc. miembros en la familia = 5. Figura 1. peso = 68 kg. ingreso familiar = 3900. se colocan los datos del alumno que aparecen en el cuestionario número 1. talla = 169 cm. Y del mismo modo todos los cuestionarios..En el registro 1.11 Base de Datos en MINITAB 28 .10 Base de datos en Excel Figura 1. en el mismo orden que se ha respondido. edad = 20 años. es decir: sexo = 1(hombre)..

13 Base de datos en R Las 20 variables trabajadas en los cuatro programas aparecen en las columnas y los 60 registros en filas. 29 . Figura 1.Figura 1.13. Muestra los datos en la consola. También con: > caso2 . El Minitab. el SPSS y el R reconocen las variables por su nombre. Es decir que la base de datos definida es una matriz de 60 x 20.12 Base de datos en SPSS Para ver y corregir datos en R escribir: >fix(caso2). Al efectuar enter aparecen los datos de la Figura 1.

si se desea cambiar el tipo.Guardar como: es el proceso inicial de almacenamiento en una unidad de disco de una base de datos creada para volver a trabajar con ella en otro momento. hacer clic sobre la flecha de la derecha y seleccionar el tipo de guardado (en este caso CSV (delimitado por comas) para usarlo al abrir la base de datos en R). En el recuadro Guardar como tipo:. En el recuadro Nombre de archivo. escribir el nombre que se desea poner a la base de datos (en este caso Estadística Básica 09-A).14) y elegir Guardar como y aparece el cuadro de diálogo de la Figura 1. automáticamente aparece Libro de Excel. Guardar: es el archivamiento continuo que se hace sobre una base de datos ya guardada y en la que se han efectuado cambios que se deben guardar antes de cerrarla.15. 30 . Figura 1. Además de nuevo y abrir.1.4 ARCHIVO DE DATOS El archivamiento de datos se efectúa a través de los clásicos guardar.14 Ventana de archivamiento en Excel a) Guardar y Guardar como. guardar como y cerrar cuando se esta trabajando con una base de datos. Hacer clic sobre la flecha de la derecha en el recuadro Guardar en: y seleccionar la unidad de disco y la carpeta donde se va a archivar la base de datos (en este caso en el disco D y en la carpeta Base de datos). en la Figura 1. Para Guardar en EXCEL: Hacer clic en el Botón de Office (el superior izquierdo.

-

Por último, hacer clic sobre el botón Guardar.

Figura 1.15 Cuadro de diálogo para Guardar como, en Excel

Si se esta trabajando un archivo ya guardado y se hacen modificaciones, para guardarlo con el mismo nombre, seleccionar la opción Guardar del Botón Office (ver figura 1.14) que es la misma que aparece al lado derecho de este Botón. También se puede utilizar la combinación de las teclas Ctrl + G.

Para Guardar en MINITAB: Al hacer clic en el botón File (archivo) de la barra de menú se despliega la ventana de la Figura 1.16, en la que se puede apreciar las opciones para un Proyecto (Project) que es un conjunto de tareas que contiene hojas de trabajo (worksheet), sesión (sesión), gráficos, etc. Y las opciones para una hoja de trabajo (worksheet) que se pueden incorporar en un proyecto determinado. Se observa entre otras las opciones New (nuevo), Open Project (abrir proyecto), Save Project (guardar proyecto), Save Project As (guardar proyecto como), Open Worksheet (abrir hoja de trabajo), Save Current Woksheet (guardar hoja de trabajo corriente), Save Current Worksheet As (guardar hoja de trabajo corriente como), etc.

31

Figura 1.16 Ventana de File (archivo), en Minitab

-

Hacer clic sobre la opción Save Project As (guardar proyecto como) y aparece el cuadro de diálogo de la Figura 1.17.

-

Hacer clic sobre la flecha de la derecha en el recuadro Guardar en: y seleccionar la unidad de disco y la carpeta donde se va a archivar la base de datos (en este caso en el disco D y en la carpeta Base de datos).

-

En el recuadro Nombre:, escribir el nombre que se desea poner a la base de datos (en este caso Estadística Básica 09-A).

-

En el recuadro Tipo: automáticamente aparece Minitab Project (*.MPJ) con extensión MPJ, si se hubiese guardado como Worksheet (hoja de trabajo) guarda con la extensión MTW.

-

Por último, hacer clic sobre el botón Guardar.

32

Figura 1.17 Cuadro de diálogo para Save Project As, en Minitab

Si se esta trabajando un archivo ya guardado y se hacen modificaciones, para guardarlo con el mismo nombre, seleccionar la opción Save Project o Save Current Worksheet (ver figura 1.16) que es idéntica al diskette que aparece en la banda de opciones. También se puede guardar un proyecto utilizando la combinación de las teclas Ctrl + S.

Para Guardar en SPSS: Es similar al de los otros programas, cuyo guardado ya hemos visto. Estando en el Editor de datos SPSS (Figura 1.13), hacer clic en el botón Archivo, se despliega una ventana en la que se puede apreciar las opciones Nuevo, Abrir, …., Cerrar, Guardar, Guardar como, etc. Hacer clic sobre la opción Guardar como y aparece el cuadro de diálogo de la Figura 1.18.

33

Figura 1.18 Cuadro de diálogo para Guardar como, en SPSS

-

Hacer clic sobre la flecha de la derecha en el recuadro Guardar en: y seleccionar la unidad de disco y la carpeta donde se va a archivar la base de datos (en este caso en el disco D y en la carpeta Base de datos).

-

En el recuadro Nombre:, escribir el nombre que se desea poner a la base de datos (en este caso Estadística Básica 09-A).

-

En el recuadro Tipo: automáticamente aparece SPSS (*.sav) con extensión sav para guardar datos en SPSS. Nota.- cuando se archiva textos: como la hoja de Resultados 1 [Dokument 1] – Visor SPSS, donde aparecen los resultados de las tareas ejecutadas con SPSS, se guarda con la extensión .spo; y si es sintaxis se guarda con la extensión .sps.

-

Por último, hacer clic sobre el botón Guardar.

34

Para Guardar en R: Hacer clic en el botón Archivo, se despliega una ventana en la que se puede apreciar las opciones Interpretar código fuente R, Nuevo script, Abrir script, etc. Hacer clic sobre la opción Guardar área de trabajo (imagen) y aparece el cuadro de diálogo de la Figura 1.19.

Figura 1.19 Cuadro de diálogo para Guardar área de trabajo en R

-

Hacer clic sobre la flecha de la derecha en el recuadro Guardar en: y seleccionar la unidad de disco y la carpeta donde se va a archivar la base de datos (en este caso en el disco D y en la carpeta Base de datos).

-

En el recuadro Nombre:, escribir el nombre que se desea poner a la base de datos (en este caso Estadística Básica-09A).

-

En el recuadro Tipo: automáticamente aparece R images (*.RData) con extensión Rdata para guardar datos en R.

-

Por último, hacer clic sobre el botón Guardar.

35

El archivo guardado en R contiene la base de datos como un objeto (aquí se llama caso2) y otros objetos que se definan, los que al Abrir con Cargar área de trabajo, se pueden visualizar desde la ventana Misc / Listar objetos y se puede seguir trabajando con todos ellos y crear nuevos objetos. Las modificaciones efectuadas se vuelven a guardar del modo descrito. Si desea saber el contenido de la base de datos guardada escriba: > str(caso2)

b) Cerrar.Una vez que se termina de trabajar con un archivo, se guarda y se procede a salir de éste así: En Excel: Elija el Botón de Office y luego la opción Cerrar. Cierra el libro y puede seguir trabajando con el programa Excel. Otra manera es utilizar el botón Cerrar ventana

x

de la barra de menú (no

el de la barra de título del libro, ya que cierra el programa Excel). También se cierra el libro con la combinación de teclas: Ctrl + F4.

-

En MINITAB: Elija el botón File (Archivo) de la barra de menú y luego la opción Close Worksheet (Cerrar hoja de trabajo). Cierra la hoja de trabajo y puede seguir usando el programa Minitab. Otra manera es utilizar el botón Cerrar

x

de la barra de menú (no el de la

barra de título, ya que cierra el programa). También se cierra la hoja de trabajo con la combinación de teclas: Ctrl + F4, sale un cuadro de diálogo preguntando si queremos guardarla y escogemos Si o No.

-

En SPSS: Elija el botón Archivo de la barra de menú y luego la opción Salir, inmediatamente sale la pregunta ¿Desea guardar el contenido del Visor de resultados en resultados 1 [Dokument 1]? Al escoger Sí, indique la carpeta

36

sale del programa. apareciendo una hoja Sin título 1 [Conjunto_de_datos1] – Editor de datos SPSS. inmediatamente sale la pregunta programa. luego elija el botón Archivo de la barra de menú y luego la opción Salir. sale automáticamente del programa. Otra manera es utilizar la combinación de teclas: Ctrl + U. Otra manera es utilizar el botón Cerrar Guardar imagen de área de trabajo? Escoger No y sale del x de la barra de título.para crear un nuevo archivo de trabajo. En MINITAB: Si ha ingresado al programa. sale la misma pregunta del párrafo anterior. elija el botón File y luego la opción Nuevo. se debe proceder así: En Excel: Si ha ingresado al programa.correspondiente y al terminar de guardar. Si escoge No. - En R: Se recomienda previamente Guardar área de trabajo. Otra manera es utilizar el botón Cerrar x de la barra de título. automáticamente tiene un nuevo libro de trabajo. En SPSS: Si ha ingresado al programa.. Otra manera es utilizar la combinación de teclas: Ctrl + N. sale la misma pregunta del párrafo anterior y procede del modo allí indicado. si no. Si esta trabajando en SPSS. c) Nuevo. Escoger No y sale del programa. automáticamente tiene una hoja Sin título [Conjunto_de_datos0] – Editor de datos SPSS (donde se definen las variables y se ingresan los datos del estudio) donde vamos a definir la base de datos. luego la opción Nuevo y escoja Datos. 37 . automáticamente tiene un Worksheet 1 (hoja de trabajo 1) o si no. elija el botón File. elija el Botón de Office y luego la opción Nuevo.

En el cuadro de diálogo. En R: Proceder conforme se ha indicado en el acápite 1. la variable peso de la base de datos caso2.si tenemos un archivo de datos ya guardado y se desea abrir para trabajar con él. ubique el nombre y tipo. seleccione la carpeta donde esta guardado el archivo. 53) El programa R reconoce en el objeto peso. presentado como un vector. los pesos de los 60 alumnos. ubique el nombre y tipo.2 Definición de variables en R..en R también se puede definir una variable por separado como un objeto. se ingresa así: >peso=c(68. Nota. seleccione la carpeta donde esta guardado el archivo. En SPSS: Elija el botón File. 48. 38 . luego haga clic en el botón Abrir. 57. En el cuadro de diálogo. 50. seleccione la carpeta donde esta guardado el archivo. se procede así: En Excel: Elija el Botón de Office y luego la opción Abrir o la combinación de teclas: Ctrl + A. . 67. luego haga clic en el botón Abrir. luego la opción Abrir y escoja Datos. 55. 63. …. 77. ubique el nombre y tipo. d) Abrir.69. luego haga clic en el botón Abrir. En el cuadro de diálogo. de tal manera que cada vez que se especifique el programa reconoce sus valores.2 Definición de variables en R. Por ejemplo..En R: Proceder conforme se ha indicado en el acápite 1. En MINITAB: Elija el botón File y luego la opción teclas: Ctrl + O) u Open Project (o la combinación de Open Worksheet.

por ejemplo: talla_m = talla en metros.J. La talla debe transformarse en una nueva variable. imc 39 . con las variables peso (en kilos) y talla (en metros). y la talla está en cm. (columna E). La fórmula de cálculo propuesta por el estadístico belga L.20. para ello es necesario efectuar algunos cálculos utilizando las variables de esa base de datos.5 – 25 25 – 30 30 . para poder calcular la variable imc con los datos transformados de la siguiente manera: En Excel: Los resultados aparecen en la Figura 1.40 40 y más En la base de datos EB-09A el peso esta en Kg.1. talla_m en metros (columna U) obtenidos dividiendo cada dato de la columna E entre 100. se puede crear la variable IMC = Índice de Masa Corporal (Kg. en la que aparece la base de datos EB09A con los datos de peso (columna D).5 18.1 Tabla de la masa corporal ideal CONDICIÓN 1 2 3 4 5 Delgado (bajo peso) Normal (peso saludable) Sobrepeso Obeso Obesidad morbida IMC (Kg.A. Quetelet es: imc peso talla 2 La OMS clasifica a las personas en función de su correspondiente IMC de la siguiente manera: Cuadro 1./m2) Menos de 18. en cualquiera de los programas. Por ejemplo. Para la Organización Mundial de la Salud (1995): “El IMC es una manera sencilla y universalmente acordada para determinar si una persona tiene peso adecuado”. con la base de datos Estadística básica 09-A (EB-09A).5 TRANSFORMACIÓN DE DATOS Muchas veces interesa crear nuevas variables a partir de una base de datos determinada. talla en cm./m2).

luego Calculator (calculadora) y aparece la ventana de diálogo de la Figura 1.24).20 Cálculo del imc en Excel En MINITAB: Para transformar la talla en centímetros a metros (talla_m) se tiene que escoger de la barra de menú la opción Calc.20. escoger nuevamente de la barra de menú Calc. Definida en la hoja de cálculo la variable talla_m. Figura 1. para terminar clic en OK y automáticamente aparece el cálculo en la columna talla_m en la base de datos Current data window (ver la Figura 1. estando en V2 =D2/(U^2) y copiado en todas las celdas de la columna V. y condición (columna W) que en el siguiente acápite se ve como se ha determinado.(columna V) calculado en la barra de formulas . Para calcular el IMC. 40 . en Store result in variable (almacenar resultado en variable) escribir talla_m y en Expression (expresión) escribir talla / 100. para terminar clic en OK y automáticamente en la base de datos (Current data window) aparecen los datos del IMC calculados (ver la Figura 1.21.21). En Store result in variable seleccionar o escribir imc y en Expression escribir la fórmula de cálculo peso / talla**2. Calculator y se abre una ventana de diálogo similar a la de la Figura 1.

22.) y el Tipo: numérica. En Expresión numérica: escribir talla / 100. Para terminar el cálculo hacer clic en Aceptar y aparece la variable talla_m con sus valores en la Vista de datos.28. Para calcular la variable IMC. Calcular variable y aparece la ventana de diálogo Calcular variable de la Figura 1. 41 . Para terminar el cálculo hacer clic en Aceptar y aparece la variable imc con sus valores. nuevamente se escoge de la barra de menú la opción Transformar.22./m2) y el Tipo: numérica. a metros (talla_m) se tiene que escoger de la barra de menú la opción Transformar. En Expresión numérica: escribir peso / talla**2. En Variable de destino: escribir talla_m. Calcular variable y aparece la ventana de diálogo Calcular variable.21 Cálculo de la talla_m en Minitab En SPSS: Para transformar la talla en centímetros.28. ver la Figura 1. En Variable de destino: escribir imc. Haciendo clic en Tipo y etiqueta definir etiqueta INDICE DE MASA CORPORAL (Kg. similar a la de la Figura 1. Haciendo clic en Tipo y etiqueta definir etiqueta (el nombre de la variable) TALLA (m. del Editor de datos SPSS. en la Vista de datos del Editor de datos SPSS. ver la Figura 1.Figura 1.

65 [31] 1.69 1.50 1.57 1.52 1.72 1.50 1.52 1.68 1.22 Cálculo de la variable talla_m en SPSS En R: Para transformar la talla en centímetros.64 1.70 1.54 1.Figura 1.60 1. talla_m=talla/100) > caso2=transform(caso2.75 1.73 1.69 1.65 1.60 1.68 1.58 1.72 1.78 1.73 1.61 1.71 1.76 1.65 1.79 1.71 1. escribir: > attach(caso2) 42 .64 1.69 1.75 1.77 1.68 1. a metros (talla_m) se tiene que escribir: > talla_m=talla/100 > talla_m [1] 1. si queremos que ello ocurra y guardarlos.56 1.65 1.77 1.75 1.60 1.55 1.67 1.77 1.52 1.55 1.72 1.60 1.57 Para calcular el IMC escribir la fórmula así: > imc=peso/talla_m^2 > imc Los objetos talla_m e imc creados no se almacenan en la hoja de R. así: > caso2=transform(caso2.74 1.52 1. debemos hacer transformaciones dentro de caso2.64 1.56 [46] 1.54 [16] 1.70 1.50 1.72 1. imc=peso/talla_m^2) Para unir las nuevas variables en caso 2.49 1.59 1.71 1.71 1.56 1.

43 . para definir la Condición del peso del alumno con la variable IMC obtenida.1.SI(V2<30. ver la Figura 1. En MINITAB: De la barra de menú escoger la opción Data. Figura 1. usando la propuesta del Cuadro 1. Luego se hace una copia para los demás datos de la columna W.20.23 Tipos de recodificación en Minitab Haciendo clic en Numeric to Text aparece la ventana de diálogo de la Figura 1."Obesidad morbida")))). creando nuevas variables y se esta interesado en recodificar los mismos."Delgado". Por ejemplo. los resultados se observan en la Figura 1. la condición (columna W) se calcula en la barra de fórmulas con la expresión lógica siguiente: =SI(V2<18.SI(V2<40.SI(V2<25."Ob eso"."Normal".24 (Code – Numeric to Text) para recodificar los datos numéricos en texto."Sobrepeso". también se puede apreciar otros tipos de recodificación. se procede de la siguiente manera: En Excel: Estando en W2.5. luego Code (código) y Numeric to text (numérico a texto) porque se desea recodificar valores numéricos en texto.23.6 RECODIFICACIÓN DE DATOS En el acápite anterior se han efectuado algunos cálculos con los datos.

25). separándolos por dos puntos (:) y en New los nuevos valores en texto. en Original values: se coloca desde un valor muy bajo.5 : 24. recodificando el IMC en Minitab En Code data from columns: (código de datos desde las columnas) seleccionar de las variables a la izquierda imc o escribirla.49 (de ser necesario se agregan más nueves en los decimales.99 y en New: Normal. en Original values: se escribe 40 : 100 (o un valor más alto para que no queden datos sin recodificar) y en New: Obesidad mórbida.5) y en New: Delgado. para el último intervalo de 40 a más. El siguiente intervalo va de 18. En Store couded data in columns: (almacenar datos codificados en la columna) seleccionar de las variables de la izquierda condición o escribirla. que aquí se ha tomado el 0. para estar más cerca a 18. en Original values: se escribe 18. Observar que el primer intervalo es para imc menor de 18.24 Obtención de la Condición.1.5 hasta antes de 25. A continuación en Original values (valores originales) se va definiendo uno a uno los intervalos definidos en el Cuadro 1. por eso se escribe 0 : 18. 44 .Figura 1.5. Para finalizar la recodificación hacer clic en OK y en la base de datos (Current data window) aparecen los datos de condición (ver Figura 1. Así sucesivamente.

asegurarse de ello). inmediatamente en Var. en Nombre: escribir condición.25 Resultado de la Condición recodificando el IMC en Minitab En SPSS: De la barra de menú escoger la opción Transformar. Escogiendo de la lista de variables que aparecen al lado izquierdo. de resultado: se modifica por imc→ condición. la recodificación no se realiza después. en Etiqueta: escribir CONDICIÓN (del peso) y luego hacer clic en el botón Cambiar (si no hace esto.Figura 1. en Var. numérica → Var. Aparece la ventana de diálogo Recodificar en distintas variables de la Figura 1. se pierden los valores originales ya que son reemplazados por los recodificados). de resultado: ingresar la variable imc. numérica → Var. luego hacer clic sobre Recodificar en distintas variables (si se escoge Recodificar en las mismas variables. 45 .26. inmediatamente aparece imc→ ? En Variable de resultado.

El siguiente intervalo va de 18. hacer clic en Valores antiguos y nuevos y aparece la ventana de diálogo Recodificar en distintas variables: Valores antiguos y nuevos de la Figura 1. y en Valor nuevo los nuevos valores del intervalo. en Valor antiguo se va definiendo uno a uno los intervalos definidos en el Cuadro 1. en Valor escribir 1. al hacer clic en Continuar regresa a la ventana de la Figura 1. en Valor antiguo.5) y en Valor nuevo.5. RANGO. luego hacer clic en añadir.5 hasta 24.26 Obtención de la Condición. en Valor antiguo. Observar que el primer intervalo es para imc menor de 18.Figura 1.27.99 y en Valor nuevo escribir 2. Para finalizar la recodificación. luego hacer clic en añadir. en Valor escribir 5. para el último intervalo de 40 a más. en Valor antiguo. 46 . MENOR hasta valor se escribe 18. A continuación.5 hasta antes de 25.49 (de ser necesario se agregan más nueves en los decimales. en Rango: se escribe 18. Así sucesivamente. valor hasta MAYOR se escribe 40 y en Valor nuevo. en Rango.26. para estar más cerca a 18.1. Luego hacer clic en Aceptar y aparece la variable condición con sus valores del 1 al 5 en la Vista de datos del Editor de datos SPSS. recodificando el IMC en SPSS Luego. luego clic en añadir.

Figura 1.27 Recodificar Valores antiguos del IMC y nuevos de Condición en SPSS

A continuación, en la Vista de variables, del Editor de datos SPSS, a la variable condición se le definen las Etiquetas de valor, en un cuadro de diálogo similar al de la Figura 1.5. Para ello asignar los valores y etiquetas siguientes: 1, Delgado; 2, Normal; 3, Sobrepeso; 4, Obeso; y 5, Obesidad mórbida. Una vez que termina de añadir los valores y etiquetas hacer clic en Aceptar, en la Vista de datos, del Editor de datos SPSS aparecen las etiquetas de condición que se muestran en la Figura 1.28.

Figura 1.28 Resultado de la Condición recodificando el IMC en SPSS 47

En R: Antes de crear la Condición, debemos crear los intervalos del Cuadro 1.1, así: > caso2=transform(caso2,condi=cut(imc,breaks=c(0,18.4999, 24.9999,29.9999, 39.9999,max(imc)))) > table(condi) condi (0,18.5] (18.5,25] (25,28.7] (28.7,30] 4 49 7 0 (30,40] 0

En el resultado anterior, hay 4 alumnos con imc menor de 18.5 (delgados), 49 alumnos con imc entre 18.5 y 25 (normales) y 7 alumnos con imc entre 25 y 30 (con sobrepeso); no hay alumnos obesos, ni con obesidad mórbida, por lo que vamos a colocar las etiquetas correspondientes a Condición, de la siguiente manera: > caso2=transform(caso2, Condición=factor(condi, labels=c("Delgado", "Normal", "Sobrepeso"))) Luego escribimos: > attach(caso2) y después: > table(Condición) Condición Delgado 4 Normal Sobrepeso 49 7

Con la sintaxis: > fix(caso2) obtenemos la hoja del R, donde aparecen las etiquetas de Condición que se muestran en la Figura 1.29.

Figura 1.29 Resultado de la Condición recodificando el IMC en R 48

1.7 MANIPULACIÓN DE ARCHIVOS
Para los programas Excel, Minitab y SPSS el proceso de agregar o quitar variables (en columnas) y registros o casos (en filas) es similar, simplemente hay que insertar filas o columnas si es necesario o copiar las variables y/o casos. Así mismo, la selección de variables para generar nuevos archivos se puede efectuar abriendo nuevas hojas de datos para trabajar con ellas situaciones particulares. Veamos la selección de variables en R y la obtención de casos.. Estando en caso2, la forma más sencilla es escribir en R: >attach(caso2) y al hacer enter quedan reconocidas todas las variable con el nombre del encabezado. Otra forma es, como las variables aparecen dentro del objeto caso2 en columna: el n_cuest (columna 1), sexo (columna 2), edad (col. 3), peso (col. 4), hasta col.proc (col. 19) y especial (col. 20). Cada una de las variables es trabajada como un objeto y se definen así: > peso=caso2[,4] Se pide crear el objeto peso y que lo obtenga de la columna 4, del objeto caso2 (la base de datos trabajada). Dentro del corchete de caso2, la primera componente indica fila (registro) y la segunda columna (variable). Al dejar vacía la primera componente reconoce sólo los valores de la variable. Si se quiere visualizar el contenido del objeto creado, escribimos peso y al hacer enter aparecen los pesos. > peso [1] 68.0 69.0 63.0 55.0 57.0 48.0 50.0 50.0 44.0 60.0 52.6 80.0 52.0 67.0 46.0 [16] 80.0 64.0 64.0 63.0 72.0 65.0 47.0 70.0 50.0 53.0 66.0 57.0 50.5 80.0 55.0 [31] 88.0 55.0 75.0 64.5 50.0 49.0 54.0 46.5 49.0 70.0 48.0 60.0 75.0 55.0 51.0 [46] 72.0 68.0 68.0 55.0 59.0 65.0 66.0 51.0 53.0 45.0 52.0 53.0 67.0 77.0 53.0 También se puede crear varios objetos a la vez separándolos con punto y coma, así: > talla=caso2[,5] ; ing.fam=caso2[,6] ; mie.fam=caso2[,7] Si desea visualizar los 20 datos del alumno 4 (registrados en la fila 4) escribir: > reg.4=caso2[4,] enter y luego > reg.4 al hacer enter obtenemos:

nº_cuest sexo edad peso talla ing.fam mie.fam g.estud cr.aprob prom.acum 4 4 1 20 55 173 1200 5 60 42 12.4

t.viviend nº.dormit horas.tv hrs.estu lib.leídos hobby imp.estudio 4 1 3 3 4 4 4 4

imp.físico col.proc especial 4 4 2 2 49

Capítulo 2. PRESENTACIÓN DE DATOS
“El propósito de la estadística es descubrir métodos para condensar la información relativa a un gran número de hechos relacionados, en cortas y compendiosas expresiones adecuadas para su discusión” Francis Galton CONTENIDO 2.1 2.2 2.3 2.4 2.5 2.6 2.7 Introducción. Cuadros estadísticos. Distribución de frecuencias. Gráficos estadísticos. Gráficos de variables cualitativas. Gráficos de frecuencias. Diagrama de tallos y hojas.

2.1 INTRODUCCIÓN Uno de los propósitos fundamentales de la estadística es la “reducción de datos”, la misma que se puede efectuar mediante la presentación de datos de tres maneras: cuadros o tablas estadísticas, gráficos y texto. Se recomienda la aplicación de todas ellas; siendo primordial la construcción del cuadro estadístico con los datos, para poder realizar la presentación gráfica y/o textual que permita describir, establecer relaciones y/o explicar las variables en estudio, contribuyendo así a la aplicación del método científico. En este capítulo se desarrollan los temas relacionados a cuadros estadísticos, tablas de frecuencias y algunas formas de presentación gráfica tanto para variables cualitativas como cuantitativas. 2.2 CUADROS ESTADÍSTICOS En la estadística, como ciencia de la observación, se emplean las tablas o cuadros estadísticos para resumir la información estadística (datos) obtenida mediante encuestas, experimentos, registros administrativos, etc. a) Definición.- un cuadro estadístico es un arreglo matricial que contiene las variables con sus correspondientes categorías y los datos observados de

50

manera concisa, reflejando la relación o comparación fácil entre las variables en un estudio determinado. b) Estructura.- las partes de un cuadro estadístico son: número, título, encabezamiento, columna matriz, cuerpo y pie (notas, llamadas y fuente). La ubicación de cada uno de ellos se puede apreciar en la Figura 2.1.

NÚMERO COLUMNA

TÍTULO ENCABEZAMIENTO

MATRIZ

CUERPO

PIE

NOTAS LLAMADAS FUENTE

Figura 2.1 Estructura de un cuadro estadístico

Número.- si en un estudio o investigación se presenta más de un cuadro hay que enumerarlos para diferenciarlos. Si el cuadro es único, no es necesario enumerar. El número se ubica en la parte superior izquierda o central. Se recomienda anteponer la palabra Cuadro o Tabla y a continuación colocar el número (sin la abreviatura Nº previa) que puede ser arábigo o alfanumérico, seguido de un punto, para luego indicar el título. Ejemplo: Cuadro 5. ; Cuadro B10. ; etc.

Título.- el título indica de manera clara y precisa el contenido del cuadro. Se coloca en la parte superior a continuación del número. Para su construcción debe responder a las cuatro preguntas siguientes: - ¿Qué? Estamos observando (unidad de análisis, objeto, característica principal, valores, elementos, etc.) - ¿Cómo? Están clasificados los datos (variables en el Encabezamiento precedidas de la palabra POR y variables en la columna matriz precedidas de la palabra SEGÚN) 51

- ¿Cuándo? Se realizó la observación de los datos (período al que se refieren los datos) - ¿Dónde? Se realizó la observación de los datos (lugar geográfico) Ejemplo.¿Qué? Producto Bruto Interno. ¿Cómo? Por Años, Según Rama de la Actividad Económica. ¿Cuándo? Del 2000 al 2007. ¿Dónde? Perú.

Ya se puede indicar el número y el título del cuadro de la siguiente manera: CUADRO 2.1 PRODUCTO BRUTO INTERNO, POR RAMA DE LA ACTIVIDAD ECONÓMICA, SEGÚN AÑO: 2000-07.

Observación: - Hay una reciprocidad entre el título y lo que aparece después de él, pues el ¿cómo? del título permite ubicar las variables en el encabezamiento y en la columna matriz; y viceversa, observando las variables en el encabezamiento y en la columna matriz se puede poner el título. - Cuando en el título del cuadro no se indica el lugar de observación, significa que corresponde al país. - La ubicación de variables en el encabezamiento y en la columna matriz es indistinto, depende del criterio del investigador, pudiendo ser éstas de cualquiera de los tipos definidos. - Si los años observados son consecutivos, se recomienda colocar 2000-07 y si sólo son dos años, indicar 2000 y 2007.

Encabezamiento.- es la parte del cuadro que contiene las variables que aparecen en el título después de la preposición “POR” y sus correspondientes categorías o rangos, generando las columnas del mismo. Recomendaciones: - Colocar en la primera línea qué se va observar y el POR, preferentemente cuando se esta diseñando cuadros preliminares para un estudio. - Indicar en forma breve y precisa las variables (con mayúsculas) y sus categorías o rangos (con mayúscula y minúsculas). 52

. . Recomendaciones: .Según sea el caso.Indicar en forma breve y precisa las variables a la altura del encabezamiento (con mayúsculas) y debajo sus categorías o rangos al lado del cuerpo del cuadro (con mayúscula y minúsculas). 53 .Escribir preferentemente en forma horizontal. antes indicado.Para el Cuadro 2. generando las filas del mismo.Cada cierto número de filas dejar espacio en blanco para no cansar al lector. POR RAMA DE LA ACTIVIDAD ECONÓMICA (Millones de nuevos soles) Pesca Minería Industria Electicidad Construcción Comercio Servicios Agricultura Total Columna Matriz. ordenar las columnas tomando en cuenta un ordenamiento: natural. colocarla en la fila correspondiente. .es la parte del cuadro que contiene las variables que aparecen en el título después de la palabra “SEGÚN” y sus correspondientes categorías o rangos. geográfico. . diferenciar las categorías con subrayado y/o negrita.es la parte del cuadro formada por casillas o celdas (resultado de la intersección de filas y columnas) donde aparecen los resultados de los conteos efectuados con los datos recogidos.I.. el encabezamiento es: P. Si hay más de una variable.1. importancia o alfabético. colocarla con mayúsculas y minúsculas encima del encabezamiento después del título o en su primera línea (si todos los valores del cuerpo del cuadro van a representar lo mismo) y/o en cada columna (si las unidades de medida son distintas). Ejemplo.B.Escribir preferentemente en forma horizontal o en forma vertical letra por letra de arriba hacia abajo. debe contener un valor o indicación. importancia o alfabético. Cuerpo.. Recomendaciones: .Si hay que indicar unidad de medida.Según sea el caso.Ninguna casilla debe quedar vacía. ordenar las columnas tomando en cuenta un ordenamiento: natural. ...Si hay que indicar unidad de medida. geográfico. .

.. ya que el usuario puede recurrir a la fuente primigenia para cualquier consulta. año.Usar algunos signos convencionales: Resultado nulo o no existe el fenómeno (-). Pie. inmediatamente después de la nota..cuando los datos son obtenidos de una fuente secundaria se recomienda indicar al “dueño” de la información (principio de cortesía y respeto al autor) bajo la forma de una ficha bibliográfica (autor o entidad. Se ubica a la derecha de lo que se desea aclarar”. páginas y lugar).00. 0. y si la aclaración se refiere a un rango o número. 0.. Notas. la palabra Nota: detallando lo que se desea aclarar. Cifra revisada (R). Se ubica primero las “llamadas-números” de menor a mayor y luego las “llamadas-letras” en orden alfabético”. Se efectúa colocando en el margen izquierdo. edición.. Cantidad inferior a la mitad de la unidad adoptada: 0. etc. usar un número.es la parte inferior del cuadro. Es recomendable. Si la aclaración esta referida a una categoría textual. Llamadas. Fuente.0. Según el INEI (2006) “La llamada se indica con una barra oblicua “/” siendo antecedida por una letra o un número. si hubiera. donde se colocan las notas. Según el INEI (2006) “Las llamadas deben ubicarse al pie del cuadro. Cifra estimada (E).son aclaraciones específicas referidas a una fila o columna. usar una letra. Cifra aún no disponible (…). así mismo ordenarlas alfabética y numéricamente.Son aclaraciones breves referidas a algún aspecto general del título del cuadro o definición de alguna variable. 54 . Dato provisional (P). título de la publicación. de la primera línea del pie. llamadas y la fuente de los datos. no abusar en el uso de notas y llamadas. editorial. Es recomendable aun cuando se haya efectuado algunas elaboraciones.

Igualmente. Si no se indica fuente.1 propuesto en el ejemplo queda así: CUADRO 2. en cuyo caso en la parte superior izquierda se coloca ….08 AÑOS 2000 2001 2002 2003 2004 2005 2006 2007 Fuente: Instituto Nacional de Estadística e Informática. El diseño del cuadro 2. país. . se recomienda indicar la Fuente y Elaboración. se indica el área de Elaboración (gerencia o dirección) para poder acudir directamente a ellos de requerirse.I.B. En caso de haber efectuado algunas modificaciones o reagrupamientos a la información presentada por algún productor de información. SEGÚN AÑOS: 2000 . indicar los elementos centrales de una referencia web (autor o entidad. P. título de la publicación.1 P. año. En el caso de pertenecer a una entidad grande. si la información se ha obtenido de alguna página web y para que el lector pueda recurrir a esa fuente.I. fecha de consulta y la página web donde está disponible). POR RAMAS DE LA ACTIVIDAD ECONÓMICA. Conclusión).. Continuación). repetir el encabezamiento y en la columna matriz continuar con las categorías o intervalos que siguen hasta que se concluya el cuadro. se asume que los datos son del autor (persona o entidad) que los publica..Si el cuadro se extiende es recomendable hacerlo verticalmente y se debe poner en la parte inferior derecha de la primera página la indicación (Continúa …. POR RAMAS DE LA ACTIVIDAD ECONÓMICA (MILLONES DE NUEVOS SOLES) Pesca Minería Industria Electicidad Construcción Comercio Servicios Agricultura Total Aspectos complementarios.B. En la página siguiente se debe indicar el título del cuadro y luego escribir a la izquierda …. 55 .

Veamos la obtención de un cuadro bidimensional con las variables hobby (en las filas) y sexo (en las columnas) con SPSS y luego con Minitab. ya que tiene la ventaja de reconocer las etiquetas (texto) para variables categóricas (codificadas numéricamente). Con los otros programas también se obtiene cuadros. d) Formas de obtención. Figura 2.. En SPSS: De la barra de menú escoger Analizar → Estadísticos descriptivos → Tabla de contingencia.2. sólo que hay que efectuar previamente recodificaciones de valores numéricos a texto.según el número de variables que se presentan. la forma más sencilla de obtener cuadros estadísticos es con el SPSS. los cuadros pueden ser unidimensionales (se presenta una sola variable). bidimensionales (se presentan dos variables) y multidimensionales (se presentan más de dos variables).c) Tipos de cuadro.2 Obtención de un cuadro bidimensional con SPSS 56 . aparece la ventana de diálogo de la Figura 2.Habiendo definido una base de datos.

Si hacemos clic al costado de Fila. de modo tal que en el cuadro la suma de los porcentajes de todas las casillas es el 100%. de modo tal que en el cuadro los totales de fila van a sumar 100%. en la que se escoge que debe aparecer en las casillas. el programa saca porcentaje sobre el total de casos. Figura 2. Del mismo modo. el programa saca porcentaje sobre el total de casos en cada columna. hacer clic sobre la variable HOBBY e ingresarla debajo del recuadro Filas haciendo clic en el botón . luego hacer clic sobre la variable SEXO e ingresarla debajo del recuadro Columnas haciendo clic en el botón . los recuadros al costado de Fila.3 Mostrar en las casillas Por defecto. En Porcentajes.3. Si hacemos clic en el botón Casillas se abre la ventana de diálogo de la Figura 2. Finalmente si hacemos clic al costado de Total. el programa saca porcentaje sobre el total de casos en cada fila.Entre las variables que aparecen al lado izquierdo. en Frecuencias aparece un check en el recuadro Observadas y la tabla va mostrar en las Casillas. 57 . los resultados del conteo (número de casos). si hacemos clic al costado de Columna. Columna y Total aparecen sin check. de modo tal que en el cuadro los totales de columna van a sumar 100%.

sólo alguno de los porcentajes. sólo que para el análisis hay que tener mucho cuidado). para terminar el cuadro hacer clic en Aceptar. SEGÚN HOBBY: 09-A HOBBY Hombre Deportes Música Baile TV / Cine Otros Total 14 14 1 4 0 33 SEXO Mujer 1 13 3 8 2 27 Total 15 27 4 12 2 60 Fuente: Base de datos del curso de Estadística Básica 58 . Pudiendo presentarse así: CUADRO 2. POR SEXO. regresa a la Figura 2. DE LA FCEUNAC. o cualquier combinación de frecuencias observadas y/o porcentajes (incluyendo los cuatro a la vez.2 ALUMNOS DE ESTADÍSTICA BÁSICA. Veamos algunos resultados: Si para las casillas escogemos sólo frecuencias salida es el siguiente: Tabla de contingencia HOBBY * SEXO Recuento SEXO Hombre Mujer 14 1 14 13 1 3 4 8 0 2 33 27 Total 15 27 4 12 2 60 Observadas. Escogido lo que va aparecer en las casillas.2. el cuadro de HOBBY Deportes Mus ica Baile TV / Cine Otros Total Haciendo doble clic sobre el cuadro de salida anterior se pueden hacer algunos arreglos de presentación y copiarlo en Excel o Word. hacer clic en Continuar.Queda a criterio del investigador escoger lo que desea: sólo frecuencias observadas (número de casos).

En cada casilla se aprecia el mismo número de casos anterior.7% 42.1% 29.0% 100.0% 4 100.0% HOBBY Deportes Mus ica Baile TV / Cine Otros Total Sobre los mismos 60 alumnos. el cuadro de Tabla de contingencia HOBBY * SEXO % de SEXO SEXO Hombre Mujer 42.3% 66.1% 12.0% 2 100. Así.0% 3.3% 6. ahora acompañado del porcentaje sobre el total de cada fila.0% 11.7% 20.0% 33 27 55.4% 48.0% 6.1%) son mujeres.0% 60 100.0% Baile y el 12.1% 3. se puede apreciar que del total de hombres (33 alumnos = 100.0% Total 15 100. otro 42.7% 14 13 51.6% 7. Si para las casillas sólo se escoge en porcentajes salida es el siguiente: Columna.4% 100.0% HOBBY Deportes Musica Baile TV / Cine Otros Total Recuento % de HOBBY Recuento % de HOBBY Recuento % de HOBBY Recuento % de HOBBY Recuento % de HOBBY Recuento % de HOBBY Cuadro que también se puede editar. Análisis similar se hace para mujeres y para el total de alumnos. el 3.0% 45. el cuadro de salida es el siguiente: Tabla de contingencia HOBBY * SEXO SEXO Hombre Mujer 14 1 93.0%) el 42. en la segunda fila hay 27 alumnos (100%) cuyo hobby es la música.9% 48.0% Total 25.4% 3.1% TV/Cine.0% 12 100.0% 75. de los cuales 14 (51.4% Música.0% 45.0% 4 8 33.7% 0 2 .4% gustan de los Deportes.Si para las casillas escogemos frecuencias hacemos clic en Observadas y en porcentajes Fila.1% 1 3 25.0% 27 100.9%) son hombres y 13 (48. 59 .3% 100.0% 100.

Si para las casillas sólo se escoge en porcentajes salida es el siguiente: Total.0% 6.0% 45.0% HOBBY Deportes Mus ica Baile TV / Cine Otros Total Aquí los porcentajes en cada Casilla.7% 13.3% 3.0% Total 25. hacer clic sobre la variable hobby que va ir en las filas (rows) e ingresarla en el recuadro en blanco al 60 .3% 21.7% 20. el cuadro de Tabla de contingencia HOBBY * SEXO % del total SEXO Hombre Mujer 23.7% 5. En Minitab: De la barra de menú escoger Stat → Tables → Descriptive Statistics aparece la ventana de diálogo de la Figura 2.4 Obtención de un cuadro bidimensional con Minitab De las variables que aparecen al lado izquierdo.7% 23.7% 1.0% 45.4. Figura 2.3% 1.3% 55.0% 6.0% 3. se obtienen haciendo a los 60 alumnos como el 100%.3% 100.

Si hacemos clic al costado de Row percents. Del mismo modo. si hacemos clic al costado de Column percents. los resultados del conteo (número de casos).4. de modo tal que en el cuadro los totales de fila van a sumar 100%. para terminar el cuadro hacer clic en OK. hacer clic en el botón OK.5 Escoger qué mostrar en las casillas con el Minitab Por defecto. en la que se escoge que debe aparecer en las casillas.5. regresa a la Figura 2. escogido lo que va aparecer en las casillas.costado de For rows: haciendo clic en el botón Select. de modo tal que en el cuadro los totales de columna van a sumar 100%. de modo tal que en el cuadro la suma de los porcentajes de todas las casillas es el 100%. el programa saca porcentaje sobre el total de casos. Veamos algunos resultados: Si para las casillas escogemos sólo frecuencias es el siguiente: Count. luego hacer clic sobre la variable sexo que va ir en las columnas (columns) e ingresarla al costado de For columns: haciendo clic en el botón Select. en Display aparece un check en el recuadro Count y la tabla va mostrar en las Casillas. Figura 2. Al igual que en el SPSS se tiene que escoger lo que se desea mostrar en las casillas. Finalmente si hacemos clic al costado de Total percents. el cuadro de salida 61 . el programa saca porcentajes sobre el total de casos en cada columna. de manera similar al SPSS. el programa saca porcentajes sobre el total de casos en cada fila. Si hacemos clic en el botón Categorical variables… se abre la ventana de diálogo de la Figura 2.

lo que no es necesario para las tablas en SPSS (es mejor trabajarlas con este programa). Si para las casillas escogemos Count y hacemos clic en Row percents. sexo Rows: hobby 1 1 2 3 4 5 All 14 14 1 4 0 33 2 1 13 3 8 2 27 Columns: sexo All 15 27 4 12 2 60 La tabla obtenida no presenta las etiquetas de las categorías de hobby. el cuadro de salida es el siguiente: 62 . efectuando el proceso anterior obtenemos la siguiente tabla: Tabulated statistics: hoby. sex Rows: hoby Columns: sex Hombre Baile Deportes Música Otros TV/Cine All 1 14 14 0 4 33 Mujer 3 1 13 2 8 27 All 4 15 27 2 12 60 En la tabla anterior ya aparecen las etiquetas de hobby y sexo recodificadas.6 Recodificación de datos en Minitab. Data → Code → Numeric to Text) antes de sacar el cuadro. requiere de un trabajo previo en Excel. pero la presentación no es muy estética. algo que no necesita el SPSS ya que las reconoce automáticamente al definir las variables y sus valores. Realizada la recodificación de datos para las variables sexo y hobby. por lo que es necesario tenerlas definidas (Ver acápite 1. ni las de sexo.Tabulated statistics: hobby.

00 1 6. Si desea escoge Casillas para indicar que va aparecer en las mismas.15 2 100. veamos sólo valores observados. Así. ahora acompañado del porcentaje sobre el total de cada fila.00 27 100.00 60 Cuadro que también se puede editar.00 14 93. Se ingresa la variable hobby en Filas. en la tercera fila hay 27 alumnos (100%) cuyo hobby es la música.00 15 100.00 4 33.00 12 100.00 8 66.67 27 All 4 100.2.5. POR SEXO.00 2 100.3 ALUMNOS DE ESTADÍSTICA BÁSICA. En SPSS: De la barra de menú escoger Analizar → Estadísticos descriptivos → Tabla de contingencia.67 13 48. DE LA FCEUNAC. El número y título son: CUADRO 2. sexo en Columnas y especial en Capa 1 de 1. aparece la ventana de diálogo de la Figura 2. SEGÚN ESPECIALIZACIÓN Y HOBBY: 09-A 63 .85%) son hombres y 13 (48. En cada casilla se aprecia el mismo número de casos anterior. La tabla es la que muestra la Figura 2. de los cuales 14 (51.85 0 0. Veamos ahora rápidamente la obtención de un cuadro tridimensional con las variables especial(ización) y hobby (en las filas) y sexo (en las columnas) con SPSS y luego con Minitab.Tabulated statistics: hoby. La tabla se puede editar haciendo doble clic sobre ella en SPSS o copiarla en Word y efectuar las modificaciones necesarias. sex Rows: hoby Columns: sex Hombre Baile Deportes Música Otros TV/Cine All 1 25.33 33 Mujer 3 75.33 14 51.15%) son mujeres.

OK y los resultados son los siguientes: Tabulated statistics: hoby. sex. Si desea escoge Categorical variables para indicar que va aparecer en las casillas.4. sexo en For columns y especialización en For layers. OK. especialización Results for especialización = Gestión Empresarial Rows: hoby Columns: sex Hombre Baile Deportes Música Otros TV/Cine All Cell Contents: 1 9 11 0 4 25 Mujer 3 1 10 2 6 22 Count All 4 10 21 2 10 47 Results for especialización = Teoría Económica Rows: hoby Columns: sex 64 . veamos sólo Counts (conteos).6 Cuadro tridimensional en SPSS En Minitab: De la barra de menú escoger Stat → Tables → Descriptive Statistics aparece la ventana de diálogo de la Figura 2. Con las variables recodificadas previamente.Tabla de contingencia HOBBY * SEXO * ESPECIALIZACIÓN Recuento ESPECIALIZACIÓN Teoría Económica SEXO Hombre Mujer 5 0 3 3 0 2 8 5 9 1 11 10 1 3 4 6 0 2 25 22 Total 5 6 2 13 10 21 4 10 2 47 HOBBY Deportes Musica TV / Cine Deportes Musica Baile TV / Cine Otros Gestión Empres arial Total HOBBY Total Figura 2. se ingresa la variable hoby en For rows.

B y C se ha copiado las variables sexo. 65 . En las columnas A. En elija dónde desea colocar el informe de la tabla dinámica.7 Creando tabla dinámica en Excel En Seleccione los datos que desea analizar. hobby y especial con las etiquetas de sus categorías. marcar Seleccione una tabla o rango e indicar en Tabla o rango: los valores a analizar sombreando los datos de la hoja de cálculo desde A1 hastaC61 y automáticamente aparece lo indicado en la Figura 2. Veamos el procedimiento para una tabla bidimensional con las variables hobby en filas y sexo en columnas. las mismas que están en la base de datos de los alumnos de Estadística Básica 09-A del Anexo.7. entre las filas 1 y 61.Hombre Baile Deportes Música Otros TV/Cine All 0 5 3 0 0 8 Mujer 0 0 3 0 2 5 All 0 5 6 0 2 13 Para obtener tablas en Excel es necesario recurrir a Tabla dinámica que se encuentran el menú Insertar. Figura 2. elegir Hoja de cálculo existente e indicar Ubicación: aquí celda E2. Luego hacer clic en Aceptar y aparece una estructura de tabla. Al hacer clic en Tabla dinámica aparece la ventana de diálogo Crear tabla dinámica que aparece en la Figura 2.7.

arrastrar la variable HOBBY. se obtiene la tabla dinámica requerida con el resultado de los conteos visto en las tablas anteriores (ver Figura 2. 66 . hacer clic en el botón Mostrar valores como aparece Normal.A continuación. aparece el cuadro de la Figura 2. sobre el mensaje Coloque campos de fila aquí. se debe arrastrar nuevamente la variable de conteo (SEXO) en el Cuerpo del cuadro.9. sobre el área de lo que fue el mensaje Coloque datos aquí.8 Tabla dinámica para Sexo y Hobby en Excel Para obtener porcentajes sobre las filas. Al hacer doble clic sobre Cuenta de SEXO2. las columnas o el total como en SPSS y Minitab. aparece la ventana de diálogo Configuración de campo de valor. al escoger el % de la columna y Aceptar. Al volver a arrastrar la variable SEXO sobre el Cuerpo del cuadro en el mensaje Coloque datos aquí. En las filas aparece Cuenta de SEXO y Cuenta de SEXO2. las columnas o el total.8). que aparece en el lado derecho. del mismo modo arrastrar la variable SEXO sobre el mensaje Coloque campos de columna aquí. hacer clic en la flecha de selección y se puede escoger el porcentajes sobre las filas. Figura 2.

10.10 Tabla dinámica para Sexo.9 Tabla dinámica para Sexo y Hobby con porcentajes en Excel Si se quiere obtener un cuadro tridimensional arrastrar la variable ESPECIALIZACIÓN en las filas sobre HOBBY y aparece la tabla dinámica de la Figura 2. donde haciendo doble clic sobre Cuenta de SEXO2 se ha escogido mostrar valores como % de la fila. Figura 2.Figura 2. Especialización y Hobby en Excel 67 .

se obtiene así: > table(hobby. así: > hobby=caso2[. Tal como se plantea en el acápite 1. sexo=caso2[.sexo) sexo hobby 1 2 1 3 8 2 1 14 3 4 5 1 4 0 2 14 13 Resultado idéntico al del Minitab.2] .20] La tabla bidimensional con la variable hobby en las filas y sexo en las columnas. También se pueden crear las variables como objetos.16] .sexo. Para obtener tablas con el programa R. La tabla tridimensional con la variable especial (especialización) y hobby en las filas y sexo en las columnas. es necesario definir las etiquetas de hoby y sexo. . separándolos con punto y coma. leída la base de datos como caso2. especialización=caso2[. primero se definen las variables como objetos. especial = 1 sexo hobby 1 2 3 4 5 1 5 3 0 0 0 2 0 3 0 2 0 68 .especial) . se obtiene así: > table(hobby.7 Manipulación de archivos. se identifican las variables con el nombre en el encabezado. al escribir >attach(caso2) y efectuar enter.Se reafirma nuevamente que el SPSS arroja una mejor presentación.

hobby=factor(hobby. especial = 2 sexo hobby 1 3 4 5 1 9 1 4 0 2 1 3 6 2 2 11 10 Vamos a definir en R las etiquetas de las categorías correspondientes a las variables sexo.23333333 0. especial=factor(especial. "TV/Cine". hobby y especialización de la siguiente manera: > caso2=transform(caso2.21666667 Hombres Mujeres 14 14 1 4 0 1 13 3 8 2 69 ."Mujeres"))) > caso2=transform(caso2. "Gestión Empresarial"))) Para que se reconozcan las nuevas variables con sus etiquetas escribir: > attach(caso2) Obtenemos las tablas anteriores de la siguiente manera: > t1=table(hobby.01666667 0. labels=c("Teoría Económica".table(t1) sexo hobby Música Hombres Mujeres Deporte 0. labels=c("Hombres"."Música"."Otro"))) > caso2=transform(caso2. .sexo) > t1 sexo hobby Deporte Música Baile TV/Cine Otro > prop.23333333 0.. "Baile". sexo=factor(sexo. labels=c("Deporte".

Baile Otro 0. especial = Teoría Económica sexo hobby Hombres Mujeres 70 .13333333 Sea t2 la tabla tridimensional: > t2=table(hobby. especial = Gestión Empresarial sexo hobby Deporte Música Baile TV/Cine Otro Hombres Mujeres 9 11 1 4 0 1 10 3 6 2 > prop.06666667 0. .especial) > t2 .sexo.05000000 0.03333333 TV/Cine 0. especial = Teoría Económica sexo hobby Deporte Música Baile TV/Cine Otro Hombres Mujeres 5 3 0 0 0 0 3 0 2 0 . .01666667 0.table(t2) . .00000000 0.

06666667 0.00000000 0.00000000 0. "No Estatal"))) > attach(caso2) NOTA.Deporte 0. se debe cambiar el nombre de la variable.03333333 TV/Cine 0.16666667 0.18333333 0. 71 .00000000 0.proc.08333333 0.Un caso particular de los cuadros estadísticos son las denominadas Tablas de Frecuencias (que veremos en el acápite siguiente) que son cuadros unidimensionales. > caso2=transform(caso2.03333333 .proc=factor(col.10000000 Para conservar los valores originales en la base de datos caso2 y poner etiquetas.15000000 0.00000000 TV/Cine 0.01666667 0. colegio. labels=c("Estatal". es decir.05000000 0.05000000 0.00000000 0.00000000 0.05000000 0. especial = Gestión Empresarial sexo hobby Música Baile Otro Hombres Mujeres Deporte 0.01666667 0.. con una sola variable acompañada por lo general de los resultados del conteo y porcentajes. .00000000 Música Baile Otro 0.

con las letras minúsculas: i. entonces: Xi = Peso del alumno i-ésimo de Estadística Básica 09-A. tanto cualitativas como cuantitativas. Por ejemplo. en salud: IMC (Índice de Masa Corporal). 60.A. k Atributo k Total Nº de U.A (hi) h1 h2 ….A. …..) a quienes corresponde el valor que toma la variable. Veamos las diferentes formas de presentación de datos.A. pk 100% U. representan números enteros y sirven para diferenciar las unidades de análisis (U. Xn (n = tamaño de la muestra) En la base de datos de los 60 alumnos de Estadística Básica 09-A. o con algunas siglas que las abrevia el investigador o propias de algunas disciplinas como en la economía: PBI (Producto Bruto Interno). .en este tipo de tablas se indican los atributos o categorías de la variable. ….. = unidades de análisis. acompañadas del número (ni). DATOS AGRUPADOS: a) Tabla de Frecuencia para Datos Cualitativos. 3. DATOS SIN AGRUPAR: Población: X1.. 72 .A. …. Y. XN (N = tamaño de la población) Muestra: X1. (ni) n1 n2 ….2. X = Peso de los alumnos. ver en el Anexo. X40 = 70 Kg.A. etc. de unidades de análisis (U. …. l. la proporción (hi).3 DISTRIBUCIÓN DE FRECUENCIAS La información obtenida puede provenir de un censo o de una muestra. j. etc. Con Xi representamos el valor de la variable X observado en laU. . i-ésima. X3. X2.. Su estructura es: Nº de Clase Categoría de (i) la variable 1 Atributo 1 2 Atributo 2 ….A. se tiene información de 19 variables estudiadas. Los subíndices. M (importaciones). 2. etc. Los resultados observados los podemos representar de la siguiente manera: Las variables. y/o el porcentaje (100 hi). Z.). es el peso del alumno 40 o valor observado 40 de la variable. si en la base de datos de los alumnos de Estadística Básica 09-A. m. X3. t. (100 hi) p1 p2 …. nk n Proporción de U. con las últimas letras mayúsculas del alfabeto: X. hk 1 % de U. etc. k. i = 1. X2.

veamos la obtención de una tabla de frecuencias por ejemplo.0 3.7 20. Inmediatamente se abre la ventana de diálogo de la Figura 2.4 ALUMNOS DE ESTADÍSTICA BÁSICA 2009-A.11.Tal como se presenta en el acápite anterior.0 6.11 Obtención de tablas de frecuencias en SPSS De las variables al lado izquierdo escogemos hobby.3 100. DE LA FCE-UNAC. de la siguiente manera: Stat → Tables → Tally Individual Variables … Escoger la variable hobby y Select 73 . luego Aceptar y se obtiene los resultados del Cuadro 2.0 45. CUADRO 2.4 editado en spss haciendo doble clic. para la variable hobby en SPSS: Analizar → Estadísticos descriptivos → Frecuencias. SEGÚN HOBBY % DE ALUMNOS 25.0 HOBBY Deportes Musica Baile TV / Cine Otros Total ALUMNOS 15 27 4 12 2 60 Un cuadro similar se puede obtener con el Minitab si se tiene previamente etiquetadas las categorías de la variable hobby. Figura 2. haciendo doble clic o clic en el botón la ingresamos en Variables.

pi = 100 hi = Porcentaje de U.. así: > caso2=transform(caso2. número de dormitorios en la vivienda. que toman el valor Xi .A.la variable discreta toma valores en un rango pequeño (por ejemplo: número de hijos. que toman el valor Xi o menos. attachada la base de datos y usando table obtenemos lo mismo. marcar también Percents. luego OK y aparecen los resultados del Cuadro 2. En display. etc. labels=c("Deporte".para que ingrese en Variables.00 45.67 25.A. estando etiquetadas las categorías de la variable hobby. que toman el valor Xi o menos.00 3. Frecuencia relativa acumulada = Hi = la proporción acumulada de U. "Baile".). "TV/Cine".A. que toman el valor Xi . Frecuencia absoluta acumulada o repeticiones acumuladas = Ni = Número acumulado de U.A."Otro"))) > attach(caso2) > table(hoby) hoby Deporte 15 Música 27 Baile TV/Cine 4 12 Otro 2 b) Tabla de Frecuencias para Datos Cuantitativos Discretos. por defecto aparece Counts. Tally for Discrete Variables: hoby hoby Baile Deportes Música Otros TV/Cine N= Count 4 15 27 2 12 60 Percent 6. (Xi) acompañados de las 74 .4. Frecuencia relativa = (hi) = Proporción de U.A.) que toman el valor Xi (resultado del conteo). Para su resumen en la presentación se indican esos pocos valores de la variable siguientes frecuencias en las columnas: Frecuencias absolutas o repeticiones = ni = Nº de unidades de análisis (U. que toman el valor Xi o menos.33 20. "Música".A. hoby=factor(hobby.00 También en R. Pi = 100 Hi = porcentaje acumulado U.

para la variable número de miembros en la familia mie.7 30.3 8. k X1 X2 ….3 96.La estructura general de este tipo de tablas es la que se muestra a continuación. (H i) % Acum. luego Aceptar y se obtiene los resultados del Cuadro 2. pi = 100 h i Nº Acum U. CUADRO 2. Hi = Ni / n = Hi .0 88.5 ALUMNOS DE ESTADISTICA BASICA 2009-A.3 45.Hi .A.0 Alumnos 2 5 11 27 8 5 1 1 60 75 .1 . Hk = 1 P1 P2 …. hk 1 p1 p2 …. U.3 11. SEGÚN EL NÚMERO DE MIEMBROS EN LA FAMILIA MIEMBROS EN LA FAMILIA 2 3 4 5 6 7 8 9 Total % de Alumnos 3. (n i) Proporc.A. nk n h1 h2 …. pk 100% N1 N2 …. Xk Total n1 n2 …. U. Pk = 100% Donde: Ni = Ni . (h i) % U.3 8. (N i) Prop.7 100. Nk = n H1 H2 ….A.A.0 75.3 1. hi = ni / n = Hi .fam en SPSS: Analizar → Estadísticos descriptivos → Frecuencias.1 + ni . Inmediatamente se abre la ventana de diálogo de la Figura 2. Clase (i) Valores (X i) Nº de U.fam. U. DE LA FCE-UNAC. haciendo doble clic o clic en el botón la ingresamos en Variables. De las variables al lado izquierdo escogemos mie.7 1. veamos la obtención de una tabla de frecuencias por ejemplo.3 18. cuando se efectúan presentaciones reales de datos sólo se muestran algunos elementos de esta estructura.A.3 100.0 13.A.5 editado en spss haciendo doble clic.7 98.0 Porcentaje acumulado 3.11. P i =100H i 1 2 ….1 + hi Tal como se presenta en el acápite anterior. Acum.

033 0. Un cuadro similar se puede obtener con el Minitab de la siguiente manera: Staat → Tables → Tally Individual Variables … Escoger la variable mie.083 0.7% 100.450 0.67 98.33 45. 18. queda con las frecuencias indicadas a continuación: Miembros en la Familia (X i) 2 3 4 5 6 7 8 9 Total Alumnos (ni) 2 5 11 27 8 5 1 1 60 Proporción alumnos (hi) 0.7% 1.300 0.083 0.000 En esta tabla se puede interpretar que: n4 = 27.3% 18.67 CumPct 3.33 1.33 100.33 18.00 88.017 1. N5 = 53.fam mie. por defecto aparece Counts.33 8.75.33 8.67 30.133 0.033 0. alumnos (Hi) 0.3% 8.33 96. H4 = 0.967 0.3% de los alumnos tienen 4 miembros en su familia cada uno.Tabla que trabajada en Excel. En display. 75% de los alumnos tienen 5 o menos miembros en su familia cada uno. h3 = 0. tal como se aprecia a continuación: Tally for Discrete Variables: mie. así: 76 .00 También en R.67 1.983 1.000 Porcentaje alumnos (p i = 100 h i) 3.750 0. estando attachada la base de datos y usando table obtenemos lo mismo.017 0. hay 53 alumnos con 6 o menos miembros en su familia cada uno.fam y Select para que ingrese en Variables. acum.0% 13.5.883 0. Cumulative counts y Cumulative percents.0 Nº acum. hay 27 alumnos con 5 miembros en su familia cada uno.183 0.3% 45. luego OK y aparecen los resultados del Cuadro 2.3% 1.117 0. marcar también Percents.fam 2 3 4 5 6 7 8 9 N= Count 2 5 11 27 8 5 1 1 60 CumCnt 2 7 18 45 53 58 59 60 Percent 3.00 13.183.3% 8.00 75.33 11. alumnos (Ni) 2 7 18 45 53 58 59 60 Prop.

2. desde un límite inferior (LI) hasta un límite superior (LS): LIi Intervalo 1 Intervalo 2 Intervalo 3 ………….. R = Xmáx – Xmín = {X / Xmín ≤ X ≤ Xmáx} Determinar el número de intervalos (k) con algún criterio del investigador o usando fórmulas como la de Sturges: k = 1 + 3.fam) mie. Intervalo k – 1 Intervalo k : : [Xmín + (k – 2)C [Xmín + (k – 1)C Xmín + (k – 1)C) Xmín + kC] : : : [Xmín [Xmín + C [Xmín + 2C LSi Xmín + C) Xmín + 2C) Xmín + 3C) Obtener las marcas de clase (Xi) como los valores representativos de la clase.. mediante la semisuma de los límites superior e inferior de la clase correspondiente: Xi LI i 2 LSi .> attach(caso2) > table(mie. para lo cual se debe seguir los siguientes pasos: Determinar el Rango (R) de la variable: como la diferencia entre el valor máximo y mínimo de la variable.fam 2 2 3 4 5 6 8 7 5 8 1 9 1 5 11 27 c) Tabla de Frecuencias con intervalos para Datos Cuantitativos. …. Tomar el valor de C redondeado con un determinado número de decimales.32 log10 N = 1 + log 2 N Tomar el valor de k redondeado (donde N es el número de observaciones en la población y si es n número de observaciones en la muestra). i = 1. Construir los k intervalos de clase.en este caso tanto la variable discreta como la continua toma valores en un rango relativamente grande y para su resumen hay que construir intervalos de clase. Hallar el ancho o amplitud (C) del intervalo: C = R/k.. k 77 . en función de las unidades de la variable.

k LI1 -LS1 LI2 –LS2 ….A. las marcas de clase (Xi) acompañadas de las siguientes frecuencias en las columnas: Frecuencias absolutas o repeticiones = ni = Nº de unidades de análisis (U.) en el intervalo i (resultado del conteo). en el intervalo i. hasta el límite superior i (LSi). hk 1 p1 p2 ….1 + ni . en el intervalo i. H1 = h1 . hasta el límite superior i (LSi).5 50. cuyos datos aparecen en el Anexo y de manera ordenada se muestran en el Cuadro 2.LSi Marca clase (X i) Nº de U. (N i) Prop.A. U. con k = 5 intervalos.A. Nk = n H1 H2 …. LIk –LSk Total X1 X2 …. hasta el límite superior i (LSi).A. pk 100% N1 N2 …. Frecuencia relativa = (hi) = Proporción de U.5 54 60 67 75 47 51 55 63 67 75 48 51 55 63 68 77 48 52 55 64 68 80 49 52 55 64 68 80 49 52. pi = 100 hi = Porcentaje de U. hi = ni / n .6.1 + hi Vamos a obtener una tabla de frecuencias. Acum. Su estructura es: Clase Intervalo (i) LIi . = {X / 44 ≤ X ≤ 88} 78 .6 55 64. nk n h1 h2 …. PESOS (Kg. Hk = 1 P1 P2 …. (n i) Proporc. Frecuencia absoluta acumulada o repeticiones acumuladas = Ni = Número acumulado de U. Pi = 100 Hi = porcentaje acumulado U.6 siguiente: CUADRO 2.A.5 69 80 50 53 57 65 70 88 El rango de los pesos es R = Xmáx – Xmín = 88 – 44 = 44 Kg.A.A. Hi = Ni / n = Hi .U.A.) DE LOS 60 ALUMNOS DE ESTADISTICA BÁSICA 09-A UNAC 44 50 53 57 65 70 45 50 53 59 66 72 46 50 53 60 66 72 46. pi = 100 h i # Acum U. Ni = Ni . Pi = 100 H i 1 2 ….LSi).A. (h i) % U. para los pesos de los alumnos de Estadística Básica 2009-A.A. Xk n1 n2 …. (H i) % Acu. se indican los intervalos de clase [LIi . Pk = 100% Donde: N1 = n1. Frecuencia relativa acumulada = Hi = la proporción acumulada de U.En la presentación de la distribución de frecuencias de la variable X.A.

Así mismo.2 – 88.LS].Por interés particular. [61.12 se puede apreciar que en la hoja de cálculo de Excel. ocupando las celdas desde A3 hasta A62. El Excel toma los intervalos abiertos por la izquierda y cerrados por la derecha: (LI . con la opción de funciones del Excel. es necesario sombrear las celdas donde se deposita el resultado automático de los conteos.8 Kg. escoger dentro de Seleccionar una categoría →Estadísticas → Frecuencia y aparece la ventana de diálogo de la Figura 2.6 – 70. tal como se muestra en la Figura 2. de la celda G12 a la G16.4).8). [70.2) y [79. La tabla completa se ha obtenido en Excel. que en este caso es en la columna G.8 – 61. en las columnas D y E se han definido los límites inferior y superior de clase. en la columna A.12. Los intervalos son de igual amplitud.12 Obtención de Tabla de Frecuencias en Excel Para obtener las frecuencias absolutas (ni) en Excel.6). se desean construir k = 5 intervalos. Los intervalos son cerrados por la izquierda y abiertos por la derecha: [44 – 52. que están ubicados de la celda A3 hasta la A62) sombrear los datos o escribir A3:A62 y en Grupos (indicar 79 .13 solicitando los Argumentos de la función Frecuencia: Datos (de la variable peso. de la siguiente manera: En la figura 2. ocupando desde la fila 12 a la 16.79.0]. Figura 2.4 . se ha copiado los pesos de los 60 alumnos. [52. A continuación. donde C = R/k = 44 / 5 = 8.

0% 60 1. cada uno. 15.0 17 0. 5 y 4.6 Kg.7% 19 0.283 28. cada uno.3% 56 0.317 31.6 70.7 DISTRIBUCIÓN DE FRECUENCIAS DE LOS PESOS DE LOS ALUMNOS DE ESTADÍSTICA BÁSICA 09-A FCE-UNAC Clase i 1 2 3 4 5 PESOS (Kg.000 100.0% En esta tabla se puede interpretar que: n3 = 17.933 93.8 y 61.4 Kg.) LIi 44.8 61. h2 = 0.567 56.000 100. % de Acum.4 19 0. El resto de columnas se han obtenido usando las fórmulas indicadas en la estructura general. 80 .250 25. que están en las celdas de E12 hasta E16).7% 57.13 Argumentos de la función Frecuencia Para terminar no usar Aceptar.3% 83. % Acum. sino la combinación de las teclas MAYUSCULA + Ctrl + Enter.083 8. Los resultados de este proceso se muestran en el cuadro siguiente: CUADRO 2.2 88.8 5 0.0% 34 0.3% 51 0.2 LSi 52.317 31.850 85.los límites superiores de los intervalos.8 61. Figura 2.0 52. Prop. el 25.6 4 0. hay 17 alumnos que pesan entre 61.7% 60 1.6 70.0% 74.4 79.067 6.4 79.0% de los alumnos pesan entre 52.6 y 70. 17.250.7% 66.Ac. automáticamente aparece el resultado de los conteos en las celdas de la columna de los ni con los valores 19.2 15 0. Alum-nos alumnos alumnos alumnos alumnos alumnos clase Xi ni hi 100hi Ni Hi 100 Hi 48.0 Marca Prop.

Aparece la ventana de diálogo de la Figura 2.6. 85% de los alumnos pesan menos de 70.4Kg. hay 56 alumnos que pesan menos de 79. H3 = 0.85. separándolos por dos puntos (:) y 81 . cada uno.14.14 Recodificación de la variable peso en Minitab En Code data from columns: (código de datos desde las columnas) seleccionar de las variables a la izquierda peso o escribirla. Figura 2.N4 = 56. luego Code (código) y Numeric to text (numérico a texto) porque se desea recodificar valores numéricos en texto (la denominación de los intervalos). se tiene que proceder con la recodificación de datos planteada en el acápite 1.7.2 Kg.De la barra de menú escoger la opción Data. cada uno. el SPSS y el R. En Store couded data in columns: (almacenar datos codificados en la columna) seleccionar de las variables de la izquierda pesos o escribirla. Veamos: En Minitab. Para obtener Tablas de frecuencias con el Minitab. A continuación en Original values (valores originales) se va definiendo uno a uno los intervalos definidos en el Cuadro 2.

En display. tal como se muestra en la Figura 2.en New los nuevos valores en texto para representar los intervalos.70.15).67 25.67 56.8 .7): Tally for Discrete Variables: pesos pesos 44.00 28. Para finalizar la recodificación hacer clic en OK y en la base de datos (Current data window) aparecen los datos de pesos (ver Figura 2. luego OK y aparecen los Cumulative Counts y Cumulative percents.33 CumPct 31.6 .8 52.0 .15 Variable peso recodificada en pesos (intervalos) con Minitab Para obtener la tabla de frecuencias proceder de la siguiente manera: Stat → Tables → Tally Individual Variables … Aparece la ventana de diálogo de la Figura 2. Escoger la variable pesos y Select para que ingrese en Variables.4 Count 19 15 17 CumCnt 19 34 51 Percent 31.14. por defecto aparece Counts. resultados siguientes (similares a los del Cuadro 2.52.00 82 .61.6 61. Figura 2.16.67 85. marcar también Percents.

33 6.70.67 93.2 .17. luego hacer clic sobre Recodificar en distintas variables.17 Recodificando la variable peso en SPSS 83 . Aparece la ventana de diálogo Recodificar en distintas variables de la Figura 2.4 . Figura 2.00 Figura 2.88.33 100.2 79.De la barra de menú escoger la opción Transformar.79.16 Obtención de Tabla de Frecuencias en Minitab (variable pesos) En SPSS.0 N= 5 4 60 56 60 8.

y en Valor nuevo los nuevos valores del intervalo.6. numérica → Var. en 84 . la recodificación no se realiza después). en Valor escribir 1. hacer clic en Valores antiguos y nuevos y aparece la ventana de diálogo Recodificar en distintas variables: Valores antiguos y nuevos de la Figura 2. en Etiqueta: escribir PESO (Kg. numérica → Var. en Var. inmediatamente en Var.8) y en Valor nuevo.18 Recodificar Valores antiguos del peso y nuevos de pesos en SPSS A continuación. Observar que el primer intervalo es para peso entre 44.8 hasta antes de 61. en Nombre: escribir pesos.0 hasta 52. de resultado: se modifica por peso→ pesos. luego hacer clic en añadir. el último intervalo va de 79.59 y en Valor nuevo escribir 2. de resultado: ingresar la variable peso.Escogiendo de la lista de variables que aparecen al lado izquierdo. en Rango: se escribe 44. en Valor antiguo.0.8. El siguiente intervalo va de 52.18.0 hasta antes de 52.7.8 hasta 61.79 (de ser necesario se agregan más nueves en los decimales. Luego. en Valor antiguo. para estar más cerca a 52. en Rango: se escribe 52.8 hasta 88. en Valor antiguo. Figura 2. luego hacer clic en añadir. Así sucesivamente.) y luego hacer clic en el botón Cambiar (si no hace esto. en Valor antiguo se va definiendo uno a uno los intervalos definidos en el Cuadro 2. inmediatamente aparece peso → ? En Variable de resultado.

haciendo doble clic o clic en el botón la ingresamos en Variables. y 5. 79. luego Aceptar y se obtiene los mismos resultados del Cuadro 2. De las variables al lado izquierdo escogemos pesos. 61. Figura 2.7 que se muestran a continuación: 85 . Para ello asignar los valores y etiquetas siguientes: 1. Inmediatamente se abre la ventana de diálogo de la Figura 2. Para finalizar la recodificación.2 – 88. A continuación.8 – 61. del Editor de datos SPSS.0 y en Valor nuevo. 4.0 – 52. Una vez que termina de añadir los valores y etiquetas hacer clic en Aceptar. 3. 44.0.17. luego clic en añadir.6 – 70.8. a la variable pesos se le definen las Etiquetas de valor. en la Vista de variables. 70. en Valor escribir 5. Luego hacer clic en Aceptar y aparece la variable pesos con sus valores del 1 al 5 en la Vista de datos del Editor de datos SPSS. 2. al hacer clic en Continuar regresa a la ventana de la Figura 2.14.2. en la Vista de datos. recodificando el peso en SPSS Para obtener la tabla de frecuencias ejecutar: Analizar → Estadísticos descriptivos → Frecuencias.8 hasta 88.11. del Editor de datos SPSS aparecen las etiquetas de condición que se muestran en la Figura 2.19 Resultado de la variable pesos.5.Rango: se escribe 79.4 – 79.6.4. 52. en un cuadro de diálogo similar al de la Figura 1.

Figura 2.7. 52. 79.70.7 25.PESO (Kg.7 100.20 Resultado de la variable pesos.61.7 56.20.0 Porcentaje acumulado 31.2 .3 100.pesos=cut(peso.79.52.0 28.0))) > attach(caso2) Para visualizar la base de datos caso2 con los intervalos escribir: > fix(caso2) En el R Editor de datos aparece la variable pesos con los intervalos definidos.3 6. 70. 61.) PESO (Kg.39. se procede así: > caso2=transform(caso2.4 70. estando en la base de datos caso 2.99.6 .0 Total Frecuencia 19 15 17 5 4 60 Porcentaje 31.59.0 En R. 88.) 44.0 93.79.88. tal como se muestra en la Figura 2.2 79.19.breaks=c(43.8 .3 8.8 52.Para crear los intervalos del Cuadro 2.0 .6 61.4 .7 85. recodificando el peso en R 86 .

a) Definición.52.6.8.el título indica de manera clara y precisa el contenido del gráfico. En esta parte vamos a desarrollar algunas formas de presentación gráfica básica.. título.4] 19 15 17 (70.si en un estudio se presenta más de un gráfico hay que enumerarlos para diferenciarlos.Para obtener la tabla de frecuencias ejecutar: > table(pesos) pesos (44. reflejando la relación o comparación fácil entre las variables en un estudio determinado.las partes de un gráfico estadístico son: número.61. 2. de tal manera que permita descripciones importantes de las variables en estudio. b) Estructura.79. seguido de un punto. .para Correa y González (2002) “Un gráfico estadístico es una representación visual de datos estadísticos. El número se ubica en la parte superior izquierda o central. ya que como dice el adagio popular “una imagen vale más que mil palabras”.2] 5 (79. Su elaboración es 87 . Se coloca en la parte superior a continuación del número.6] (61. para luego indicar el título.88] 4 Los resultados obtenidos son idénticos a los del Cuadro 2.. Se recomienda anteponer la palabra Gráfico y a continuación colocar el número (sin la abreviatura Nº previa) que puede ser arábigo o alfanumérico.8] (52.2. cuya elaboración requiere necesariamente de una tabla o cuadro estadístico y mediante el cual se busca que el lector de un golpe de vista pueda destacar aspectos importantes de la(s) variable(s) en estudio. no es necesario enumerar. Título. . cuerpo. leyenda y fuente. Si el gráfico es único. Número.4.7. etc..4 GRÁFICOS ESTADÍSTICOS Es una forma de presentación de datos..70. Ejemplo: Gráfico 4.” o las distribuciones estadísticas mediante figuras geométricas. Gráfico A13. En capítulos posteriores se verá algunas otras formas gráficas propias de los tópicos tratados.

.. c) Tipos de gráficos. tramas. se recomienda indicar la Elaboración..5 para el largo y como 1 para el ancho) en la que con algunas representaciones geométricas. En el caso de ser propio el gráfico. Leyenda. d) Formas de obtención.es la parte central del gráfico. Así mismo. indicando la unidad de medida si hubiera. 88 . etc. Se recomienda colocar el título de los ejes.. según su Hobby.. acompañadas de datos y símbolos se busca establecer contrastes de las variables y sus categorías a través de escalas apropiadas a las magnitudes en estudio. bidimensionales o pluridimensionales. es necesario indicar los elementos esenciales que permitan identificar a los “dueños” de los gráficos e información para cualquier consulta mediante una breve Ficha Bibliográfica o Referencia Web. etc. se debe buscar efectuar diferenciaciones entre los componentes del gráfico bien mediante colores. SPSS y R.al igual que los cuadros. con el nombre de la variable o sus categorías. y van colocados por lo general al costado de gráfico con su indicación de lo que representan. por ello ambos títulos (del cuadro y del gráfico) son idénticos. tal como se pase a detallar. según el número de variables que se presenten. los mismos que veremos para variables cualitativas y cuantitativas.se va a presentar la obtención de estos gráficos utilizando los programas Excel.similar a la del cuadro a partir del que se construye. tal como se indica en la fuente de cuadros estadísticos.son aclaraciones respecto a las partes componentes de un gráfico expresadas a través de lo que representan ciertos colores. Minitab. representada por lo general en forma rectangular (en una relación de 1. sombreados. los gráficos pueden ser unidimensionales.al igual que los cuadros estadísticos. Cuerpo. tramas. Ejemplo: Alumnos de Estadística básica 09-A. Fuente.

5 GRÁFICOS DE VARIABLES CUALITATIVAS Entre los principales gráficos de variables cualitativas tenemos los gráficos de sectores.7 20.4 siguiente: Nº DE ALUMNOS 15 27 4 12 2 60 % DE ALUMNOS 25. Para efectuar las particiones en la circunferencia se establece la proporcionalidad tomando en cuenta que los 360º de la circunferencia equivale al total de observaciones realizadas o el 100% y se efectúa las equivalencias a cada categoría en grados sexagesimales según el número de observaciones o porcentaje que le corresponde mediante una regla de tres simple. a) Gráfico de sectores. el gráfico de barras y el gráfico de Pareto.0 6..0 GRADOS SEXAGESIMALES 90 162 24 72 12 360 HOBBY Deportes Música Baile TV/Cine Otros Total Si a los 60 alumnos les corresponde una circunferencia de 360º. a los 27 que les 89 .2. obtenida en el Cuadro 2. Tomemos como referencia la distribución de la variable hobby de los alumnos de estadística básica 09-A.0 3. la proporcionalidad que se guarda aquí es de 6º por cada alumno y de este modo a los 15 alumnos que les gusta el deporte les corresponde 15 x 6 = 90º.3 100. es muy apropiado para representar las categorías de una variable cualitativa en una circunferencia con particiones proporcionales al número de casos en cada categoría que se busca representar.0 45.llamado también pie o pastel.

ponerle el número y el título.4 (Analizar → Estadísticos descriptivos → Frecuencias) aparece la ventana de la Figura 2. Aceptar y para finalizar Aceptar y aparece título del Gráfico. a los 12 que les gusta TV/Cine 12 x 6 = 72º y a los 2 que les gusta Otros 2 x 6 = 12º. Veamos.11. para finalizar Aceptar y en la Ventana de resultados aparece el gráfico de sectores. 90 . con doble clic se ha editado (Ver Figura 2. escoger en Diseños de gráfico (diseño 1) → Seleccionar datos → Rango de datos del gráfico: indicar las celdas donde se encuentran los datos → en Etiquetas del eje horizontal (categoría) escoger Editar. en Rango de rótulos de eje: indicar las celdas donde están los hobbies.22). a los 4 alumnos que les gusta el baile 4 x 6 = 24º.gusta la música 27 x 6 = 162º. Con estos datos es que los programas efectúan de modo automático la representación del pie correspondiente. En Excel: Seguir la secuencia siguiente: Insertar → Gráficos → Circular → Gráfico 2D. escoger dentro de la opción Tipo de gráfico: Gráficos de sectores. Con la variable hobby ya ingresada. tal como se muestra a continuación: Figura 2.21 Gráfico de sectores en Excel En SPSS: Siguiendo el procedimiento para obtener el cuadro 2. en Valores del gráfico: marcar Porcentajes. luego Continuar.

0% Figura 2. SEGÚN HOBBY 6. en Labels… poner número y título del gráfico. en Categorial variables: ingresar hoby de la lista de variables a la izquierda.0% 6.3% Category Baile Deportes Música Otros TV/Cine 45.7% 20.0% 3.23.23 Gráfico de Sectores en Minitab 91 .1 % DE ALUMNOS DE ESTADÍSTICA BÁSICA 09-A.Gráfico 2.0% Figura 2. SEGÚN HOBBY Deportes Musica Baile TV / Cine Otros 3.1 % DE ALUMNOS DE ESTADÍSTICA BÁSICA 09-A.3 % 20.7% 45.22 Gráfico de Sectores en SPSS En Minitab: En el menú escoger Graph → Pie Chart… Aparece la ventana de diálogo Pie Chart. Gráfico 2. y aparece el gráfico de sectores que se muestra en la Figura 2.0% 25.0% 25. OK.

Veamos la presentación de la variable hobby en gráfico de barras. por lo que para los otros tipos de gráficos se explicará como obtenerlos y presentaremos alguno de ellos.es una representación rectangular en el plano cartesiano. con sus propios matices. indicando en el eje de las abscisas (X) la variable con sus categorías y en el eje de las ordenadas (Y) el número y/o el porcentaje de unidades de análisis que se presenta. así: > attach(caso2) > pie(table(hoby)) Aparece el gráfico siguiente: Figura 2.24 Gráfico de Sectores en R Como se puede apreciar.En R: Estando attachada la base de datos obtenemos lo mismo. cada uno de los gráficos de sectores es parecido. tomando como referencia los resultados del Cuadro 2. 92 . b) Gráfico de barras..4.

6.09-A. Simple. main="GRÁFICO 2. colores.B. Aparece la ventana de diálogo Bar Chart – Counts of unique values. Columna agrupada. donde la presentación parece ser “más representativa”. En Minitab: En el menú escoger Graph → Bar Chart… → escoger Simple. y aparece el gráfico de sectores que se muestra en la Figura 2. etc.2 ALUMNOS E.4 (Analizar → Estadísticos descriptivos → Frecuencias) aparece la ventana de la Figura 2. 93 . SEGÚN HOBBY".25. en Labels… poner número y título del gráfico. Este gráfico ha sido editado poniendo la variable con mayúsculas. luego Continuar. ylab="Alumnos") A continuación se muestra el gráfico de barra obtenido en Minitab. OK. En Categorial variables: ingresar hoby de la lista de variables a la izquierda. en Valores del gráfico: marcar Porcentajes. En R: Estando attachada la base de datos. xlab="HOBBY". se usa la función barplot así: > attach(caso2) > barplot(table(hoby).7). que se puede editar con doble clic. en Rango de rótulos de eje: indicar las celdas donde están los hobbies. escoger (Estilo 2) → Seleccionar datos → en Rango de datos del gráfico: indicar las celdas donde se encuentran los datos → en Etiquetas del eje horizontal (categoría) escoger Editar. no olvidar ponerle el número y el título. Aceptar y para finalizar Aceptar y aparece el gráfico sin título.5.En Excel: Seguir la secuencia siguiente: Insertar → Gráficos → Columna → Columna en 2D. para finalizar Aceptar y en la Ventana de resultados aparece el gráfico de sectores. Con la variable hobby ya ingresada.4. col=c(3. escoger dentro de la opción Tipo de gráfico: Gráficos de barras. En SPSS: Siguiendo el procedimiento para obtener el cuadro 2.7.

4 y 5). y las clases de hobby (1.25 Gráfico de Barras de la variable Hobby en Minitab c) Gráfico de Pareto. 2.Gráfico 2. 3.. Para obtener el gráfico de Pareto. entre A2 y A61.27. 4 y 5) en la columna D.es un gráfico muy utilizado cuando se quiere mostrar las categorías más representativas de una variable cualitativa en forma de frecuencia descendente.2 ALUMNOS DE ESTADÍSTICA BÁSICA 09-A. se necesita herramientas para el Análisis (versiones anteriores de Excel en el menú tenían la opción Herramientas).26. proceder así: en la barra de menú Datos → Análisis de datos (ubicado en el extremo superior derecho) y aparece la ventana de diálogo Análisis de datos de la Figura 2. a fin de tomar algunas decisiones. por lo que utilizaremos las etiquetas numéricas para hobby (1. 94 . Su elaboración se puede obtener con herramientas para el análisis en Excel y de control de calidad que poseen el Minitab y el SPSS. 2. ver Figura 2. como sucede en los controles de calidad en los que por ejemplo se busca controlar los defectos más importantes (en un 90 o 95%). entre D3 y D7. SEGÚN HOBBY 30 27 25 20 Alumnos 15 10 5 0 15 12 4 2 Baile Deportes Música HOBBY Otros TV/Cine Figura 2. Consideremos que los datos para los 60 alumnos están en la columna A. 3. En Excel: Procede sólo si los valores de la variable son numéricos.

28 Obteniendo gráfico de Pareto en Excel 95 . de Funciones para análisis escoger Histograma.27.28.26 Datos de la variable hobby y clase en Excel Figura 2. luego Aceptar y aparece la ventana de diálogo Histograma de la Figura 2.27 Herramientas del Análisis de datos en Excel En la Figura 2. Figura 2.Figura 2.

marcar Porcentaje acumulado y Crear gráfico. de la Figura 2.En la parte de Entrada. marcar Rango de salida: y en el recuadro indicar la celda a partir de donde queremos que salgan los resultados (H2 aquí). de la Figura 2.29. indicar donde queremos que salga el resultado.26 (desde D3 hasta D7) y se marca Rótulos si se utilizaran para los dos rangos anteriores. y por último si queremos En un libro nuevo.29 Gráfico de Pareto de la variable hobby en Excel 96 . Luego marcar Pareto (Histograma ordenado). En Opciones de salida.28.28. si es en la misma hoja. en Rango de entrada: sombrear el área de los datos de hobby de la Figura 2. si es En una hoja nueva: marcar y en el recuadro ponerle nombre.26 (desde A3 hasta A62). Figura 2. en Rango de clases: sombrear el área de CLASE de la Figura 2. Para finalizar hacer clic en Aceptar y aparecen los resultados de la Figura 2. marcarlo.

0 Deportes 15 25.30.0 90. Aparece la ventana de diálogo Pareto Chart . En SPSS: En el menú escoger Analizar → Control de calidad → Gráficos de Pareto → escoger Simple.7 Other 2 3. En eje de categorías: ingresar la variable hobby que aparece en la lista de variables a la izquierda.7 96.0 45.30 Gráfico de Pareto de la variable Hobby en Minitab 97 . según Hobby 60 50 40 Alumnos 100 80 Porcentaje 60 30 40 20 10 0 Hobby Count Percent Cum % 20 Música 27 45.En Minitab: En el menú escoger Stat → Quality Tools → Pareto Charts…. luego Definir. aparece el gráfico de Pareto.0 70.0 TV/Cine 12 20. en Títulos… indicar el número y título del gráfico. se muestra el gráfico de Pareto obtenido en Minitab y editado en sus ejes y colores para las barras de las categorías de hobby. Gráfico 2. Aparece la ventana de diálogo Gráfico de Pareto simple: Recuentos o sumas para grupos de casos.0 0 Figura 2. luego Continuar y finalmente Aceptar. En Chart defects data in: ingresar hoby de la lista de variables a la izquierda y para finalizar OK y muestra el gráfico.0 Baile 4 6.3 100.3 Gráfico de Pareto de los alumnos de Estadística Básica 09-A. En la Figura 2.

31 Gráfico de barras de los Miembros de la familia en Excel 98 . indicando en el eje de las abscisas (X) la variable con sus pocos valores y en el eje de las ordenadas (Y) el número y/o el porcentaje de unidades de análisis que se presenta. a) Gráfico de barras para Datos Cuantitativos Discretos.3 8.0 75.5.7 98. Veamos como queda la presentación de la variable número de miembros en la familia en gráfico de barras.. Es una representación rectangular en el plano cartesiano. polígono de frecuencia y la ojiva.0 88.se usa si la variable discreta toma valores en un rango pequeño como el número de hijos.2.0 13.7 100.0 Figura 2. La gráfica de barras se obtiene de manera similar al de la variable cualitativa.3 1.3 18.3 96. MIEMBROS EN LA FAMILIA 2 3 4 5 6 7 8 9 Total Alumnos 2 5 11 27 8 5 1 1 60 % de Alumnos 3. tomando como referencia los resultados del Cuadro 2.0 Porcentaje acumulado 3.3 11.3 100.7 30.3 8. histograma de frecuencias.3 45.6 GRÁFICOS DE FRECUENCIAS Entre los principales gráficos de variables cuantitativas tenemos los gráficos de barras.7 1.

4 % DE ALUMNOS DE ESTADÍSTICA BÁSICA 09-A. tamaño de letra. OK. luego seleccionar Data Labels y marcar la opción Use y-value labels.32 Gráfico de barras de los Miembros de la familia en SPSS En términos estrictos.7% 1. 99 .3% 8.3% 8. OK. En Categorial variables: seleccionar mie. Para finalizar hacer clic en OK y aparece el gráfico de de la Figura 2. el mismo que se puede obtener con el Minitab de la siguiente manera: En el menú escoger Graph → Bar Chart… → escoger Simple. disminución del número de decimales.3% 3.3% 13.3% 1.33 ya editado en el tipo de letra.Gráfico 2.0% 10 18. OK. la variable número de miembros toma valores enteros y por lo tanto su gráfico no debería ser una barra sino más bien una línea (“gráfico de líneas”). color de las líneas. SEGÚN MIEMBROS EN LA FAMILIA 30 20 Alumnos 45. Simple. En Labels… poner número y título del gráfico. etc. Aparece la ventana de diálogo Bar Chart – Counts of unique values.7% 0 2 3 4 5 6 7 8 9 MIEMBROS EN LA FAMILIA Figura 2. En Data View… deshabilitar Bars y marcar Project lines. A continuación escoja Chart Options… y marcar Show Y as Percent.fam de la lista de variables a la izquierda.

0 Xi 48. según el Número de miembros en su familia 50 45.2 88.se usa si la variable cuantitativa discreta o continua se presenta en intervalos. Para intervalos de igual amplitud.3 8.317 0.283 0. Figura 2..0 40 Percent 30 20 18.4 % de Alumnos de Estadística Básica 09-A.0 74.Gráfico 2.067 1.7 0 2 3 4 5 6 7 8 9 Miembros en la familia Percent within all data.7 1.8 61.250 0.7 siguientes: Clase 1 2 3 4 5 LIi 44.6 ni 19 15 17 5 4 60 hi 0.2 66.000 100 .0 52.4 79.4 57.083 0.8 83. indicando en el eje de las abscisas (X) la variable con sus intervalos y en el eje de las ordenadas (Y) las frecuencias absolutas.3 1.33 Gráfico de barras de los Miembros de la familia en Minitab b) Histograma de Frecuencias para Datos Cuantitativos en intervalos.2 LSi 52.3 13. veamos la presentación de la variable peso de los alumnos de Estadística Básica mediante histograma de frecuencias.6 70. El Histograma de Frecuencias es un conjunto de rectángulos (barras) en el plano cartesiano.6 70. tomando como referencia los resultados del Cuadro 2.4 79. La base de los rectángulos es la amplitud del intervalo (pueden ser de igual o diferente amplitud) y la altura la frecuencia (absoluta o relativa) o la densidad que alcanza en cada intervalo.8 61. relativas o la densidad.3 8.3 10 3.

marcar Rango de salida: y en el recuadro indicar la celda a partir de donde queremos que salgan los resultados (N2 aquí). y por último si queremos En un libro nuevo. de la Figura 2.12 (desde E12 hasta E16) y se marca Rótulos si se utilizaran para los dos rangos anteriores.34. De Funciones para análisis escoger Histograma. en Rango de entrada: sombrear el área de los datos de peso de la Figura 2. Figura 2. marcarlo. de la Figura 2.En Excel: El proceso es similar a la construcción del gráfico de Pareto antes visto. 101 . que se requiere de herramientas para el análisis de datos. si es en la misma hoja. es decir.34. luego Aceptar y aparece la ventana de diálogo Histograma de la Figura 2. En Opciones de salida. Para finalizar hacer clic en Aceptar y aparecen los resultados del histograma.34. si es En una hoja nueva: marcar y en el recuadro ponerle nombre. en Rango de clases: sombrear el área de LSi de la Figura 2. Escoger en la barra de menú Datos → Análisis de datos (ubicado en el extremo superior derecho) y aparece la ventana de diálogo Análisis de datos.12 (desde A3 hasta A62). indicar donde queremos que salga el resultado. Luego marcar Crear gráfico.34 Obteniendo el Histograma de peso en Excel En la parte de Entrada.

En Excel se obtiene los resultados para los límites superiores de clase indicados y los rectángulos del histograma separados, por lo que se tiene que editar haciendo clic sobre los rectángulos y con botón derecho seleccionar Formato de serie de datos y en la ventana de diálogo del mismo nombre escoger Opciones de series y en Ancho del intervalo poner 0%. Al hacer clic en el botón Cerrar, los rectángulos del histograma aparecen juntos. Se pone número y título del gráfico, así como colores, etc. y se tiene los resultados del la Figura 2.35.

Figura 2.35 Histograma de frecuencia del peso en Excel En Minitab: Estando en la base de datos Estadística Básica 09-A.MPJ, seguir la secuencia Graph → Histogram… → Simple → OK y aparece la ventana de diálogo Histogram – Simple de la Figura2.36. En Graph variables: ingrese la variable peso seleccionándola de las variables del lado izquierdo.

102

Figura 2.36 Obteniendo el Histograma de peso en Minitab Haciendo clic en el botón Scale… luego en Y-Scale Type aparece marcado automáticamente Frecuency, también se puede escoger Percent o Density (densidad para intervalos de diferente amplitud) dejemos Frecuency, OK. Hacer clic en el botón Labels… en Title: poner el número y título del gráfico, en Data Labels escoger Use y-value labels, OK. Para finalizar OK y aparece un histograma que debe ser editado para obtener los intervalos de clase deseados. Para ello hacer doble clic sobre el histograma y aparece la ventana de diálogo Edit Bars de la Figura 2.37donde ya se ha escogido Binning. En la ventana de Binning, en Interval Type aparece automáticamente marcado Midpoint, escoger Cutpoint. Luego en Interval Definition escoger Midpoint/Cutpoint positions: en el recuadro en blanco escribir el valor mínimo (44), dos puntos, el valor máximo (88), diagonal, y el valor de la amplitud de clase C (8.8). Es decir, 44:88/8.8. También se puede escribir los 6 puntos de corte (cutpoint) de los 5 intervalos separados por un espacio en blanco: 44 52.8 61.6 70.4 79.2 88 y para finalizar OK, e inmediatamente aparece el histograma de frecuencia de la Figura 2.38.

103

Figura 2.37 Edición (en Binning) del Histograma de peso en Minitab

GRÁFICO 2.6 HISTOGRAMA DEL PESO DE LOS ALUMNOS DE ESTADÍSTICA BÁSICA 09-A 20
19 17

15

15

Frequency

10

5

5 4

0

44.0

52.8

61.6
Peso (Kg.)

70.4

79.2

88.0

Figura 2.38 Histograma de frecuencias del peso en Minitab 104

En SPSS: Seguir el procedimiento para obtener el cuadro 2.4 (Analizar → Estadísticos descriptivos → Frecuencias) aparece la ventana de la Figura 2.11. Con la variable peso ya ingresada, escoger dentro de la opción Tipo de

gráfico: Histogramas, luego Continuar, para finalizar Aceptar y en la Ventana de resultados aparece el histograma, que se puede editar haciendo doble clic sobre el histograma dos veces y aparece la ventana de Propiedades. En intervalos, dentro de Eje X marcar Personalizado, escoger Número de intervalos (e indicarlos) o Ancho de intervalo (e indicarlo 8.8), Aplicar y luego Cerrar. Poner número y título del gráfico, colores, etc. Y se tiene el histograma de la Figura 2.39.

Gráfico 2.6 HISTOGRAMA DEL PESO DE LOS ALUMNOS DE ESTADÍSTICA BÁSICA 09-A
20

15

Alumnos

10

19 17 15

5

5 4

Media =59,87 Desviación típica =10,53 N =60 90 100

0 40 50 60 70 80

PESO (Kg)

Figura 2.39 Histograma de frecuencias del peso en SPSS En R: Estando attachada la base de datos, para que reconozca la variable peso, se escribe la sintaxis sencilla siguiente: 105

hist(variable,

breaks=seq(mínimo,

máximo,

by=amplitud,

col=”color”,

labels=TRUE, main=”título del gráfico”, xlab=”título eje X”, ylab=”título eje Y”) Donde: variable (datos para obtener el histograma), mínimo = valor mínimo de los datos, máximo = valor máximo, amplitud = ancho de los intervalos, color = colores (blanco = 0, 8, “White”; negro= 1, 9, “black”; rojo = 2, 10, “red”; verde = 3, 11, “green”; azul = 4, 12, “blue”; magenta = 5, 13; violeta =6, 14, “violet”; amarillo = 7, 15, “yellow”; anaranjado = orange; purpura = purple; rosado =pink; fucsia=”magenta”; gris=”gray”; etc.) Para la variable peso en la base de datos caso2, el histograma se obtiene así: > attach(caso2) > hist(peso, breaks=seq(44,88,by=8.8), col="13", labels=TRUE, main="Gráfico 2.6 Histograma del Peso de los Alumnos", xlab="Peso(Kg.)", ylab="Alumnos")

Figura 2.40 Histograma de frecuencias del peso en R

106

Histograma de densidad.- se presenta, por lo general, para tablas con intervalos de clase de diferente amplitud, situación que ocurre para algunas variables económicas. En las columnas de frecuencias se agrega una de densidad (di) que se obtiene dividiendo las frecuencias relativas entre la amplitud de clase. Es decir, di = hi / Ci . Las barras del histograma de densidad tienen por base la amplitud del intervalo y por altura la densidad alcanzada. El área debajo del histograma de densidad es
k k

igual a1. Area
i 1

di Ci
i 1

hi Ci Ci

k

hi
i 1

1.00

Si para la variable peso trabajada, se juntan los dos últimos intervalos y se hace los conteos correspondientes, el Cuadro 2.7 se transforma en: ni hi di 19 0.317 0.0360 15 0.250 0.0284 17 0.283 0.0322 9 0150 0.0085 60 1.000 El último intervalo, tiene el doble de amplitud que los otros tres y por lo tanto mayor número de repeticiones (5 +4 = 9). Para contrarrestar el efecto del mayor ancho del intervalo es que se representa la densidad en vez de la frecuencia. El Minitab es el programa apropiado para obtener el histograma de densidad. Vamos a efectuar el mismo procedimiento de la construcción del histograma de frecuencias. Es decir, Graph → Histogram… → Simple → OK y aparece la ventana de diálogo Histogram – Simple de la Figura2.36. En Graph variables: ingresar la variable peso seleccionándola de las variables del lado izquierdo. Haciendo clic en el botón Scale… luego en Y-Scale Type aparece marcado automáticamente Frecuency, desactivarla y marcar Density, OK. Hacer clic en el botón Labels… en Title: poner el número y título del gráfico, en Data Labels escoger Use y-value labels, OK. Para finalizar OK y aparece un histograma de densidad que debe ser editado para obtener los intervalos de clase deseados. Para ello hacer doble clic sobre el histograma y aparece la ventana de diálogo Edit Bars de la Figura 2.41 donde ya se ha escogido Binning. Clase 1 2 3 4 LIi 44.0 52.8 61.6 70.4 LSi 52.8 61.6 70.4 88.0 Xi 48.4 57.2 66.0 79.2

107

en Interval Type aparece marcado Midpoint.4 PESO (Kg.6 70.7 HISTOGRAMA DE DENSIDAD DEL PESO DE LOS ALUMNOS E.4 88 y para finalizar OK.01 0. 09-A 0. GRÁFICO 2. escoger Cutpoint.B. Luego en Interval Definition escoger Midpoint/Cutpoint positions: en el recuadro en blanco escribir los 5 puntos de corte (cutpoint) de los 4 intervalos separados por un espacio en blanco: 44 52.) 88.6 70.0085 0.0360 0.41 Edición del Histograma de densidad de peso en Minitab En la ventana de Binning.04 0.03 0.42 Histograma de densidad de peso en Minitab 108 .42.00 44.0322 0.0284 Density 0.0 52.8 61.Figura 2.0 Figura 2. e inmediatamente aparece el histograma de densidad de la Figura 2.8 61.02 0.

ni) o (Xi.es un gráfico de líneas que une los puntos medios superiores de las barras del histograma. acum. Figura 2.44.43 Datos para el Polígono de frecuencias y Ojiva del peso en Minitab El procedimiento para construir el Polígono de frecuencias es el siguiente: Graph → Scatterplot → With Connect Line → OK.43. las trabajaremos en el Minitab. para poder cerrar las gráficas. (Xi. relat.. y en Data Labels marcar Use y-value labels.7. Marca de clase.Sup.45. en columnas nuevas: límite superior (Lím.c) Polígono de frecuencias. OK. y aparece la ventana de diálogo de la Figura 2. relat. OK. relat. es decir. se han agregado la primera y última clase con los valores que le corresponderían. Hacer clic en Data View… y en Data display marcar Connect line.44. siendo necesario para ello definir en el workshet (hoja de trabajo) los datos del Cuadro 2. hi) con el fin de tener una visión global de la distribución de frecuencias cuando son suavizadas. e ingresarla en Y variables y Marca de clase en X variables. como se muestra en la Figura 2.) y frecuencia relativa acumulada (Frec. Luego escoger Labels en Tittle: poner el número y título del gráfico. frecuencia relativa (Frec. 109 .) en las que. De la lista de variables del lado izquierdo seleccionar Frec. une los pares ordenados marcas de clase y frecuencias absolutas o relativas.). Para finalizar hacer clic en OK y aparece el polígono de frecuencias de la Figura 2. tal como se muestra en la Figura 2. Para efectuar la representación del polígono de frecuencias y la ojiva de la variable peso.

44 Scatterplot para el Polígono de frecuencias del peso en Minitab Gráfico 2. 0.000 40 50 60 70 Marca de clase 80 90 100 Figura 2.30 0.45 Polígono de frecuencias del peso en Minitab 110 .085 0.322 0.8 POLÍGONO DE FRECUENCIA DEL PESO DE LOS ALUMNOS E.35 0.288 0.B.10 0.051 0. 09-A 0.05 0.15 0.Figura 2.25 Frec.00 0.254 0.000 0. relat.20 0.

46 Scatterplot para la Ojiva del peso en Minitab De la lista de variables del lado izquierdo seleccionar Frec. la trabajaremos en el Minitab con los datos de la Figura 2.. OK. acum.sirve para representar las frecuencias (absolutas o relativas) acumuladas “menor o igual que” para una variable determinada. Hi).43. Hacer clic en Data View… y en Data display marcar Connect line. e ingresarla en Y variables y Lim.46. relat.46. Ni) o (LSi. (LSi. Su representación se hace con un gráfico de líneas.47. Para efectuar la representación de la ojiva de la variable peso. Para finalizar hacer clic en OK y aparece la Ojiva de la Figura 2. Sup. y aparece la ventana de diálogo de la Figura 2. no decreciente. Figura 2. OK. que une los pares ordenados formados por los límites superiores de los intervalos de clase y las frecuencias (absolutas o relativas) acumuladas. El procedimiento para construir la Ojiva es el siguiente: Graph → Scatterplot → With Connect Line → OK. Luego escoger Labels en Tittle: poner el número y título del gráfico.d) Ojiva. en X variables. 111 . y en Data Labels marcar Use y-value labels. tal como se muestra en la Figura 2.

relat.0 40 50 60 70 80 Lím. 0.7 DIAGRAMA DE TALLOS Y HOJAS Es un gráfico sencillo de realizar y fue propuesto por Tukey (1977) para ver la distribución de frecuencias preliminar de una variable cuantitativa con pocas observaciones. Al hacer clic en OK.0 0. aparecen los siguientes resultados.) 90 100 Figura 2. 112 . Para su elaboración se toma en cuenta el número de dígitos que poseen los valores de la variable.949 1. Sup. Veamos su obtención para la variable peso.2 0.8 Frec.47 Ojiva del peso en Minitab 2. Acum. acompañado por las hojas que es la parte complementaria del número representado.9 OJIVA DEL PESO DE LOS ALUMNOS DE ESTADÍSTICA BÁSICA 09-A 1.6 0.000 0.322 0.Gráfico 2. En Graph variables: ingresar la variable peso de las variables del lado izquierdo.864 1. El tallo viene dado por los dígitos de mayor orden.4 0.576 0.Seguir la secuencia: Graph → Stem-and-Leaf… (Tallos y Hojas) y aparece la ventana de diálogo Stem-and-Leaf.000 0. En Minitab. PESO (Kg. En Increment: escribir 5 (para que salgan los tallos con incrementos de 5 en 5 a partir del valor mínimo).000 0.

crecientes desde la primera línea hasta antes del número entre paréntesis (8) que indica que son 8 observaciones y que en esa línea se ubica el valor central (mediana).00 15. Leaf 4 56678899 000001122233334 113 .00 Stem & 4 . regresa a Explorar y para finalizar clic en Aceptar. En Dependientes: ingresar la variable peso de las variables del lado izquierdo. en Descriptivos aparece activado automáticamente Tallo y hojas. En SPSS.) y en la última columna las hojas con un dígito por cada observación (sus unidades se dan al comienzo del gráfico como Leaf Unit) aquí = 1.0 Kg. Hacer clic en el botón Gráficos y aparece la ventana de diálogo Explorar: Gráficos. Después aparecen valores decrecientes. En la ventana de Resultados aparece: PESO (Kg) Stem-and-Leaf Plot Frequency 1. En la columna central se presentan los tallos.0 1 9 24 (8) 28 21 11 7 4 1 4 4 5 5 6 6 7 7 8 8 4 56678899 000001122233334 55555779 0033444 5566778889 0022 557 000 8 N = 60 En la primera columna aparecen las frecuencias absolutas acumuladas. escoger del menú Analizar → Estadísticos descriptivos → Explorar y aparece la ventana de diálogo Explorar. ya que la acumulación empieza desde la última línea. 4 .00 8.Estando en la base de datos de Estadística Básica 09-A.Stem-and-Leaf Display: peso Stem-and-leaf of peso Leaf Unit = 1. 5 . Hacer clic en Continuar. En la primera línea aparece el peso mínimo (44) y en la última línea el peso máximo (88) Kg. representando los pesos en decenas (de kg.

00 Stem width: Each leaf: 5 6 6 7 7 8 8 . .00 4. Se procede así: > attach(caso2) > stem(peso) Aparece el diagrama de tallos y hojas siguiente: The decimal point is 1 digit(s) to the right of the | 4|4 4 | 56778899 5 | 000011122333334 5 | 55555779 6 | 003344 6 | 55566778889 7 | 0022 7 | 557 8 | 000 8|8 Sólo muestra los tallos en la primera columna (en decenas de Kg.) y las hojas (en Kg.). . . se usa la función stem(variable). .Estando attachada la base de datos de los alumnos de Estadística Básica 09-A representada por caso2.00 3. .00 1.00 3. 114 . 55555779 0033444 5566778889 0022 557 000 8 10 1 case(s) El ancho del tallo (Stem width) 10 indica que está en decenas de Kg. .00 7.00 10.8. En R.

dispersión. Moda. 3. Las aplicaciones con los programas se ven al final del capítulo. 115 . Media aritmética.4 3.6 3. la media geométrica. la mediana. Mediana. Media armónica. En este capítulo veremos las medidas de posición. la moda. Para una mejor comprensión de estos estadígrafos presentaremos su definición.Capítulo 3. Media Geométrica. Los cuantiles: cuartiles. forma y concentración. llamadas también estadígrafos de tendencia central.7 Introducción. los dos tenemos uno” George Bernard Shaw CONTENIDO 3. la media armónica y los cuantiles. porque al obtenerlos reflejan un valor entre el mínimo y máximo.1 INTRODUCCIÓN En este capítulo se da inicio a otras modalidades de descripción de los datos a través de los denominados estadígrafos que son medidas de resumen del conjunto de datos obtenidos a partir de una muestra o un censo (enumeración completa de las unidades de análisis de la población). MEDIDAS DE POSICIÓN “La estadística es una ciencia que demuestra que si mi vecino tiene dos coches y yo ninguno. Si el estadígrafo es obtenido en la muestra se denomina estimador (estadístico) y es usado en inferencia estadística como estimación (aproximación) al parámetro desconocido en la población.1 3.2 3. así como su interpretación. deciles y percentiles.5 3. cálculo para datos sin agrupar y para datos agrupados (tabla de frecuencias). Entre estos tenemos: la media aritmética.3 3. Los estadígrafos puedes ser de: posición.

Para un objeto unidimensional uniforme de longitud L. de los 60 alumnos de Estadística Básica 09-A. es el centro de gravedad o centroide de la distribución de frecuencias. Xi = Marca de clase ni = frecuencias absolutas o repeticiones. centroide es el centro de masa de un objeto con densidad uniforme.2 MEDIA ARITMÉTICA Llamada también media o promedio simple.N Xi a) Media o promedio poblacional: i 1 N n Xi b) Media o promedio muestral: X i 1 n Fórmulas de cálculo para datos agrupados.6. Es decir. N = tamaño de la población. Ejemplo 3. tenemos que la media aritmética es: 116 .k X i ni k a) Media o promedio poblacional: i 1 N k X i hi i 1 k X i ni b) Media o promedio muestral: X i ni i 1 k X i 1 k ni i 1 n X i hi i 1 Donde: k = número de intervalos de clase. n = tamaño de la muestra.3. Entonces.1 Si trabajamos con los datos sin agrupar del Cuadro 2. En física. es el punto en donde están en equilibrio todas las fuerzas. para cada barra (rectángulo) del histograma es su marca de clase y para todo el histograma de frecuencias es la media aritmética ponderada por las frecuencias absolutas o relativas o las ponderaciones consideradas. Fórmulas de cálculo para datos sin agrupar. peso en Kg. el centroide es el punto medio del segmento de línea. hi = frecuencia relativa.

.el peso promedio de los alumnos de Estadística Básica 09-A es 59. peso en Kg.7.2) (66. así: 5 X i hi i 1 (48..1 Kg.133 Figura 3.8) (83.4(19) 57.1 59. resultado diferente al anterior (normalmente difieren ya que se está agrupando datos).8(5) 83. tenemos que la media aritmética es: k 5 X i ni i 1 i 1 X i ni 60 X 1n1 X 2 n2 N = X 3n3 60 X 4 n4 X 5 n5 3608. 60 Interpretación.133 Kg. es decir que la suma de los pesos de los 60 alumnos en la población es de 3608.6) 60 60 60 60 60 60.0(17) 74.2(15) 66. es decir que la suma de los pesos de los 60 alumnos en la población es de 3592..0) (74. Si trabajamos con los datos agrupados del Cuadro 2.1 Cálculo de la media para datos agrupados en Excel 117 .4) 19 15 17 5 4 (57. Interpretación.. También podemos apreciar que el numerador representa el total poblacional. Resultado similar se obtiene usando la fórmula con frecuencias relativas (hi).. de los 60 alumnos de Estadística Básica 09-A.N 60 Xi i 1 i 1 Xi 60 N 44 45 46 .0 60 48.6(4) 60 60.el peso promedio de los alumnos de Estadística Básica 09-A es 60.0 Kg.133 Kg.868 Kg. 80 88 60 3592.868 Kg.. También podemos apreciar que el numerador sigue representando el total poblacional.

El cálculo del ejemplo 3. 15.1 se muestra en Excel como se ha efectuado el cálculo de la media aritmética para datos agrupados. La forma más sencilla de efectuar el cálculo es la que aparece en la casilla F10 utilizando la función matemática suma de productos que se indica así: e inmediatamente aparece el peso promedio igual a 60.4. En la celda F9 se muestra el cálculo de la suma de 5 productos de i 1 5 X i ni = 3608. ni y/o hi de la siguiente manera: > Xi=c(48. donde los Xi son las marcas de clase y las ponderaciones vienen dadas por las frecuencias absolutas (ni) o las frecuencias relativas (hi). y en la G9 la suma de productos de X i hi = 60. i 1 Media Ponderada.1 es una forma de media ponderada. Primero hay que ingresar las marcas de clase (Xi).13333 Con resultados similares a los del acápite anterior. 74..hi) [1] 60.13333 > weighted. 5.0 Kg. 57.133 Kg.6) > ni=c(19.mean(X.ni) [1] 60.133 Kg. 66. y E respectivamente.n X iWi X i 1 n Wi i 1 Donde Xi = valor de la i-ésima observación y Wi = ponderación o peso de la iésima observación.8. Dicho cálculo también lo podemos resolver usando el programa R así: Primero se definen los vectores de Xi. las frecuencias absolutas (ni) y las frecuencias relativas (hi) en las columnas C. así: > weighted.0. 118 .En la Figura 3. 4) > hi=ni/60 Luego usar la función weighted.mean.mean(X. D. 83.2. 17. que es la media solicitada.

500. Se recomienda usar la mediana. luego este índice es el siguiente promedio ponderado: n i 1 IPL t 0 Pti ( P0i Q0i ) P0i n n Pti Q0i i 1 n P0i Q0i i 1 i 1 P0i Q0i  Para el índice de precios de Paasche Wi = P0i Qti . Entonces el ingreso promedio es de 800 muy distante del ingreso de la mayoría de los trabajadores. c) El cálculo de la media aritmética se ve afectado por los valores extremos (outliers) muy grandes o muy pequeños.si los ingresos de 5 trabajadores son: 450. 500. 550 y 2000.. entonces : Y aX b.Para el caso de un índice de precios Xi es un relativo de precios (Pti / P0i) y para un índice de cantidad Xi es un relativo de cantidad (Qti / Q0i). d) Si a y b son números reales e Yi Demostración: n n n aX i b. de los valores observados con respecto a su media aritmética. luego este índice es el siguiente promedio ponderado: n i 1 IPPt 0 Pti ( P0i Qti ) P0i n n Pti Qti i 1 n P0i Qti i 1 i 1 P0i Qti Propiedades de la media aritmética. n n (Xi i 1 X) i 1 Xi nX nX nX 0 b) “La suma de las desviaciones al cuadrado. n (Xi i 1 X ) 2 es mínima. es mínima”.  Para el índice de precios de Laspeyres Wi = P0i Q0i . Ejemplo 3.2.a) “La suma de las desviaciones de los valores observados con respecto a su media aritmética es cero”. n Yi Y i 1 i 1 (aX i b) n a i 1 Xi i 1 b n aX b n n 119 .

Luego el nuevo ingreso promedio de los trabajadores es: Y = X + 100 = S/. 3. Luego el nuevo ingreso promedio de los trabajadores es: Y = 1.05 Xi + 50 . 1 100.05 (1 000) + 50 = S/.10 Xi .. entonces el nuevo ingreso de cada trabajador es: Yi = Xi + 100 . entonces el nuevo ingreso de cada trabajador es Yi = 1.3.3 MEDIANA (Me) Es el valor central que divide en dos partes iguales la distribución de frecuencias (conjunto de observaciones). 1 100. Hallar los ingresos promedio si se producen los siguientes incrementos:  S/.  5% más S/.Ejemplo 3. 1 100.10 X = 1. Luego el nuevo ingreso promedio de los trabajadores es: Y = 1. entonces el nuevo ingreso de cada trabajador es Yi = 1. 1 000.05 X + 50 = 1. 50 a cada trabajador. 100 para cada trabajador.si el ingreso promedio de los trabajadores es X = S/.10 (1 000) = S/.  10% para cada trabajador. 50% observaciones Me 50% observaciones 120 .

. se determina n/2 y ayudándonos de las frecuencias acumuladas se ve que clase j contiene (o donde esta) la Me. Cálculo para datos agrupados.a) Ordenar los datos en forma ascendente: X(1) ..6 55 64.a) Ubicar la clase j que contiene el valor Me Como en las tablas de frecuencias los valores de la variable están ordenados en forma ascendente.5 50.Cálculo para datos sin agrupar. Interpretación. se necesitan las observaciones ordenadas 30 y 31 para calcular la mediana. así: Me 1 X 2 30 X 31 1 57 57 2 57 Kg.el 50 % de los alumnos de Estadística Básica 09A tienen un peso menor o igual a 57 Kg y el otro 50% por encima de 57 Kg. de los 60 alumnos de Estadística Básica 09-A.5 54 60 67 75 47 51 55 63 67 75 48 51 55 63 68 77 48 52 55 64 68 80 49 52 55 64 68 80 49 52. peso en Kg.6. …. se tiene que: a) Los 60 datos ordenados en forma ascendente son: 44 50 53 57 65 70 45 50 53 59 66 72 46 50 53 60 66 72 46.4 Si se calcula la mediana con los datos sin agrupar del Cuadro 2. X(n) b) Calcular la mediana:  Si el número de observaciones n es par: Me  Si el número de observaciones n es impar: Me Ejemplo 3. b) Calcular la Me usando cualquiera de las siguientes expresiones: 121 . X(2) .5 69 80 50 53 57 65 70 88 1 X 2 n 2 X n 1 2 X n 1 2 b) Dado que n = 60 es par.

0 Marca Prop. 22. se han contado los pesos de los 19 primeros alumnos (recordemos que los pesos están ordenados de manera ascendente en el cuadro).2 LSi 52. Entonces. Acum.933 83.317 57. 21.000 Solución. 28. Alum-nos alumnos alumnos alumnos clase Xi ni hi Ni Hi 48.4 19 0. 31.000 60 1. 30. Ejemplo 3. Nj-1 = repeticiones acumuladas hasta la clase anterior a la que contiene Me.a) Ubicar la clase j que contiene el valor Me. 24. 33 y 34.4 79.067 60 1. 26.250 34 0. 29. n 2 60 2 30 .2 88.6 70. Hj-1 = frec. LIj = límite inferior de la clase que contiene la Me. ¿En que intervalo de clase se contó la observación o peso del alumno 30? Observando los Ni del Cuadro 2. la clase en la que se cuenta la talla del alumno clase j = 2.8 5 0. siguientes: Clase i 1 2 3 4 5 PESOS (Kg. Luego.6 4 0.317 19 0.567 66.0 17 0. relativa acumulada hasta la clase anterior a la que contiene Me. Cj = amplitud de la clase Me = LSj – LIj .) LIi 44.7.7. se aprecia que en la clase 1.4 79.283 51 0. 25. N1 = 19. nj = repeticiones en la clase que contiene la Me.083 56 0. Prop. 23.6 Kg.2 15 0. 27. en el intervalo de clase 2 se cuentan los pesos de los alumnos 20.8 61.5 Calcular la mediana con los datos agrupados del Cuadro 2. peso de los 60 alumnos de Estadística Básica 09-A FCE-UNAC.Ac.850 74.0 52.8 61.Me LI j n Nj 2 nj 1 Cj LI j 1 Hj 2 hj 1 Cj Donde: j = clase que contiene o donde esta la Me. n 2 60 2 30 es la 122 .6 70.8 y 61. La mediana es un peso entre 52. 32. hj = frecuencia relativa en la clase que contiene la Me.

Reemplazando valores en la fórmula se tiene: Me LI 2 n N1 2 C2 n2 52.el 50 % de los alumnos de Estadística Básica 09A tienen un peso menor o igual a 59. mucho más representativa que la media aritmética 800. que la media aritmética. que es menor que la suma de las desviaciones. 500. C3 = LS3 – LI3 = 61. Xi i 1 Me ni a ni .8 60 19 2 8. 500.8 = 8.. en valor absoluto. que la mediana es un valor más representativo de la tendencia central de un conjunto de datos. para datos agrupados.8 nj = n2 = 15..b) Calcular la Me usando la expresión: Me LI j n Nj 2 nj 1 Cj Donde: j = 2. sólo por los valores centrales. Se recomienda usar la mediana.8 Nj-1 = N1 = 19.a) La suma de las desviaciones.253 Kg. 123 . n n Xi i 1 k Me i 1 k Xi Xi i 1 a . es decir.2. cuando estos son asimétricos (los valores extremos reflejan desigualdades). con respecto a cualquier otro valor a de la distribución. de los valores observados con respecto a la mediana es mínima. b) Robustez: la mediana no se ve afectada por los valores extremos. Es decir.8 59. 15 Interpretación. LIj = LI2 = 52. que en este caso es 500. Ejemplo 3.253 Kg y el otro 50% por encima de 59. 550 y 2000) del ejemplo 3.para los ingresos de 5 trabajadores (450.6 – 52. para datos sin agrupar. el promedio es de 800 muy distante del ingreso de la mayoría de los trabajadores. n = 60. Propiedades de la mediana.6. en valor absoluto.253 Kg.

peso en Kg. Para una distribución de frecuencias o probabilidades.5 69 80 50 53 57 65 70 88 124 . entonces : Me(Y ) a Me( X ) b . 3.5 50. la moda es el valor que hace máxima dicha distribución.5 54 60 67 75 47 51 55 63 67 75 48 51 55 63 68 77 48 52 55 64 68 80 49 52 55 64 68 80 49 52. el que más se repite o el más frecuente.4 MODA Es el valor observado más común. X Cálculo para datos sin agrupar.Observar en el conjunto de datos el valor o los valores que más se repiten. Propiedad similar a la de la media aritmética. Ejemplo 3.6.c) Si a y b son números reales e Yi a X i b.7 Si se calcula la moda con los datos sin agrupar del Cuadro 2. de los 60 alumnos de Estadística Básica 09-A.6 55 64. se tiene que los pesos ordenados son: 44 50 53 57 65 70 45 50 53 59 66 72 46 50 53 60 66 72 46.

Prop.2 88.  Si los intervalos de clase son de diferente amplitud.4 19 0. Acum.Se aprecia que el peso 55 es el que más se repite. peso de los 60 alumnos de Estadística Básica 09-A FCE-UNAC.067 60 1.2 LSi 52. luego: Mo = 55 Kg. Alum-nos alumnos alumnos alumnos clase Xi ni hi Ni Hi 48. b) Calcular la moda usando la expresión: Donde: j = clase(s) que contiene(n) o donde esta(n) la(s) Mo. Puede haber más de una clase modal.  Si los intervalos de clase son de igual amplitud.6 4 0.8 61.000 Solución.7.8 61.850 74.250 34 0. 1 Mo LI j 1 1 2 Cj nj nj nj nj 1 hj hj hj hj 1 dj dj dj dj 1 2 1 1 1 Ejemplo 3.4 79.4 79. 125 . la clase j que contiene (o donde esta) la Mo es aquella que tiene la mayor repetición ni o la mayor frecuencia relativa hi.933 83.el mayor número (no la mayoría) de alumnos tiene un peso de 55 Kg.a) Ubicar la clase j que contiene el valor Mo. LIj = límite inferior de la clase que contiene la Mo.283 51 0. Puede haber más de una clase modal..2 15 0.083 56 0. siguientes: Clase i 1 2 3 4 5 PESOS (Kg. Cj = amplitud de la clase Mo = LSj – LIj .a) Ubicar la clase j que contiene el valor Mo.Ac.) LIi 44. Cálculo para datos agrupados.8 5 0.000 60 1. la clase j que contiene (o donde esta) la Mo es aquella que tiene la mayor densidad di = hi / Ci .8 Calcular la moda con los datos agrupados del Cuadro 2.6 70.0 Marca Prop.0 17 0. Interpretación.0 52.567 66.6 70.317 57.317 19 0.

al igual que la mediana.8 51. Propiedades de la moda.8 – 44 = 8. Relación entre la moda. d) Para una distribución determinada puede haber más de una moda o en su defecto de no existir moda. Si la distribución de frecuencias es simétrica se cumple que las tres medidas son aproximadamente iguales.8 Kg. b) La moda no se ve afectada por los valores extremos. ¿en que intervalo de clase se puede haber dado el mayor número de repeticiones ni o h i? Observando los ni del Cuadro 2.a) Es el único estadígrafo que se puede determinar para variables cualitativas.. La moda es un peso entre 44 y 52.270 Kg. C1 = LS1 – LI1 = 52. entonces : Mo(Y ) a Mo( X ) b . 19 4 Interpretación. la media y la mediana. LIj = LI1 = 44. puede haber antimoda (valor menos frecuente). Entonces: X Me Mo 126 .8. b) Calcular la moda usando la expresión: Mo Donde: j = 1. en el intervalo de clase j = 1 se encuentra la moda. 1 LI j 1 1 2 Cj nj nj nj nj 1 n1 n0 n1 n2 19 0 19 19 15 4 2 1 Reemplazando valores en la fórmula se tiene: Mo LI1 1 1 2 C1 44 19 8.7. Entonces. se aprecia que el mayor es n1 = 19.27 Kg. Propiedad similar a la de la media aritmética y la mediana.el mayor número (no la mayoría) de alumnos tiene un peso de 51. c) Si a y b son números reales e Yi a X i b.Considerando que los intervalos son de igual amplitud.

de A. Distribución asimétrica negativa 30 25 Nº de U.A. 20 15 10 5 0 140 145 150 155 160 165 170 Valores de la variable 175 180  Si la distribución de frecuencias es moderadamente asimétrica y unimodal. 20 15 10 5 0 140 145 150 155 160 165 170 175 180 Valores de la variable  Si X Me Mo entonces la distribución de frecuencias tiene asimetría negativa o asimetría hacia la izquierda. 20 15 10 5 0 140 145 150 155 160 165 170 Valores de la variable 175 180  Si Mo Me X entonces la distribución de frecuencias tiene asimetría positiva o asimetría hacia la derecha. según Karl Pearson se cumple la siguiente relación: X Mo 3X Me 127 .A. Distribución asimética positiva 30 25 Nº de U.Distribución simétrica 30 25 Nº de U.

Conociendo la sintaxis de la función.000 51. con la opción de funciones del Excel.2 solicitando los Argumentos de la función PROMEDIO.Para los pesos de los alumnos de Estadística Básica 09-A de la FCE-UNAC se pueden resumir los estadígrafos calculados así: Datos: Sin agrupar Agrupados X 59. Al hacer Enter. que están desde la celda D3 hasta la D62) sombrear los datos o escribir D3:D62.3).8683333 Kg. se sombrean estos o se escribe D3:D62. y para calcular la moda. cuando en el programa se pide el rango de valores (como Número 1). Me X entonces la distribución de los Cálculo de la media aritmética.868 Me 57. Al hacer Enter. (ver la Figura 3. Ubicarse en la celda D64 y al lado de escribir =MEDIANA(D3:D62).133 Se puede apreciar que en ambos casos Mo pesos tiene asimetría positiva. desde la base de datos construida y utilizando los programas. se hace mucho más sencillo así: Ubicarse en la celda D63 y al lado de escribir =PROMEDIO(D3:D62). Ubicarse en la celda D65 y al lado de escribir =MODA(D3:D62). 128 .3). aparece el resultado 59. De manera similar se hace escogiendo las funciones Mediana y Moda. (ver la Figura 3. desde D3 hasta D62. Para calcular la media aritmética nos ubicaremos en la celda D63. En Excel: Estando copiados los datos de la variable peso de los 60 alumnos en la columna D. la mediana y la moda con los programas Veamos como se puede obtener rápidamente los estadígrafos anteriores para la variable peso. aparece el resultado 57 Kg.253 Mo 55. Al hacer Enter. (ver la Figura 3. Para efectuar cualquier cálculo nos ubicamos en una celda posterior.8683333 Kg.000 59. aparece el resultado 55 Kg. En Número 1 (indicar la ubicación de los datos de la variable peso. De manera similar para calcular la mediana. Luego hacer clic en y aparece el resultado de la media aritmética 59.270 60. escoger dentro de Seleccionar una categoría →Estadísticas → Promedio y aparece la ventana de diálogo de la Figura 3. A continuación.3).

Figura 3. En variables: seleccionar la variable peso de las variables que están a la izquierda. Mode (moda) y hemos agregado Sum (suma).4. Hacer clic en OK y regresa a la Figura 3. escoger del menú Stat →Basic Statistics → Display Descriptive Statistics… aparece la ventana de diálogo de la Figura 3. mediana y moda en Excel En Minitab: Estando en la base de datos Estadística Básica 09A. 129 . Hacer clic en el botón y aparece la ventana de diálogo de la Figura 3.2 Cálculo de la media aritmética (PROMEDIO) en Excel Figura 3.3Resultados de la media aritmética. Escoger los estadígrafos a calcular: Mean (media).4. Minimum (mínimo) y Maximum (máximo).5. Median (mediana).

00 Median 57.00 Mode 55 Mode 5 130 .4 Selección de la variable peso para calcular estadígrafos en Minitab Figura 3.00 Maximum 88.87 Sum 3592.10 Minimum 44.5 Selección de estadígrafos de posición a calcular en Minitab Para terminar hacer clic en OK y en la ventana de Session aparecen los resultados solicitados (se ha subrayado la media. la mediana y la moda) siguientes: Descriptive Statistics: peso N for Variable peso Mean 59.Figura 3.

00 55 3592 Estadígrafos de tendencia central calculados con el SPSS 131 . mediana. regresando a la ventana de diálogo Frecuencias y efectuar clic en Aceptar para terminar. En Variables: ingresar la variable peso.87 57.6 Cálculo de estadígrafos de Tendencia central en SPSS En Tendencia central marcar los estadígrafos: media.En SPSS: Estando en la base de datos Estadística Básica 09A. Inmediatamente se abre la ventana de diálogo Frecuencias. luego hacer clic en el botón muestra la ventana de diálogo Frecuencias: Estadísticos de la Figura 3. y se Figura 3. moda y suma.6. Inmediatamente en el Visor de Resultados aparece: Estadísticos PESO (Kg) N Válidos Perdidos Media Mediana Moda Suma 60 0 59. luego hacer clic en Continuar. seguir la secuencia para obtener la tabla de frecuencias: Analizar → Estadísticos descriptivos → Frecuencias.

aparece lo siguiente. > mode(peso) [1] "numeric" 132 . min(variable) para el valor mínimo y max(variable) para el valor máximo.86833 > median(peso) [1] 57 > min(peso) [1] 44 > max(peso) [1] 88 El R no permite el cálculo de la moda. median(variable) para la mediana. para que reconozca las variables y sus valores. se escribe en la consola la sintaxis para el estadígrafo requerido: mean(variable) para la media. Aplicando a la variable peso se obtiene: > mean(peso) [1] 59.En R: Estando en la base de datos Estadística Básica 09A y habiendo attachado la misma.

9444826722 133 . de los 60 alumnos de Estadística Básica 09-A.9 Si se calcula la media geométrica con los datos sin agrupar del Cuadro 2. peso en Kg.5 54 60 67 75 47 51 55 63 67 75 48 51 55 63 68 77 48 52 55 64 68 80 49 52 55 64 68 80 49 52. tasas medias de crecimiento. cuyos pesos ordenados son: 44 50 53 57 65 70 45 50 53 59 66 72 46 50 53 60 66 72 46. etc.6.- G n X1 X 2 Xn X1 X 2 Xn 1 n Considerando que el producto de los valores observados puede ser muy elevado.6434526765 1.6 55 64.3.6532125138 60 1.5 MEDIA GEOMÉTRICA Es la raíz n-ésima del producto de los valores observados. Cálculo para datos sin agrupar. se sigue el siguiente procedimiento para hallar G: a) Determinar el logaritmo decimal de G: log G 1 log X 1 log X 2 n log X n 1 n n log X i i 1 b) Hallar G.5 69 80 50 53 57 65 70 88 a) Determinamos el logaritmo decimal de G: log G 1 60 60 log X i i 1 1 log X 1 log X 2 60 log 88 log X 60 1 log 44 log 45 60 1 1. Se utiliza para calcular promedios de datos con cierta tendencia geométrica.5 50. tomando el antilogaritmo de log G: G 10log G Ejemplo 3.

tomando el antilogaritmo de log G: G 10log G Ejemplo 3. Cálculo para datos agrupados. Interpretación.8 61.0 5 log 74.2486352942 1.283 51 0.Ac.6 4 0. siguientes: Clase i 1 2 3 4 5 PESOS (Kg.850 74.2 LSi 52.7708105882 58.4 19 0.106. peso de los 60 alumnos de Estadística Básica 09-A FCE-UNAC.8 5 0.6 60 134 .- G n X X n1 1 n2 2 X nk k X X n1 1 n2 2 X nk k 1 n Considerando que el producto de las potencias de las marcas de clase elevadas a las repeticiones observados puede ser muy grande.el peso medio de los alumnos es de 58. se sigue el siguiente procedimiento para hallar G: a) Determinar el logaritmo decimal de G: log G 1 n1 log X 1 n2 log X 2 n nk log X k 1 n k k ni log X i i 1 i 1 hi log X i b) Hallar G.083 56 0.000 Solución.6 70.994 Kg. Acum.10 Calcular la media geométrica con los datos agrupados del Cuadro 2.2 88.) LIi 44.4 15 log 57.0 17 0. Prop.2 15 0. Alum-nos alumnos alumnos alumnos clase Xi ni hi Ni Hi 48.8 61.6 70.4 79.067 60 1.933 83.8 4 log 83.567 66.a) Determinamos el logaritmo decimal de G: log G 1 60 5 ni log X i i 1 1 n1 log X 1 n2 log X 2 n3 log X 3 n4 log X 4 n5 log X 5 60 1 19 log 48..317 57.0 Marca Prop.994 Kg.250 34 0.4 79.0 52.7.317 19 0.2 17 log 66.7708105882 60 b) Hallamos G tomando el antilogaritmo de log G: G 10log G 101.000 60 1.

Asimismo. Pn = Población en el año n.) transcurridos desde el período 0 hasta el período n.764 habitantes.01206187 26. Interpretación.r n Pn P0 1 14 P07 P93 1 14 28' 220.36094043 30. Aplicación de la media geométrica.11 Según el INEI (2009) la población total del Perú el año 1993 fue de 22‟639.255 Kg. 443 135 .37 60 b) Hallamos G tomando el antilogaritmo de log G: G 10log G 101.255 Kg.015864843 -1 = 0. para lo cual se cuenta con información de los censos de población en dos períodos de tiempo no consecutivos (la ONU recomienda la realización de censos de población cada 10 años debiendo realizarse los mismos el 30 de junio de los años terminados en cero).443 habitantes y el 2007 de 28‟220. n = Períodos (años. Se pide determinar: a) La tasa media de crecimiento intercensal anual.32.36950799 7.68882511 60 106.Una de las aplicaciones importantes de la media geométrica es la referida a la determinación de tasas medias de crecimiento de la población (r).015864843 22 '639. meses.772726.93224690 9. se hacen proyecciones de población (similar al crecimiento del capital) con la expresión: Pn 1 r n P0 Es a partir de esta expresión que se obtiene la fórmula para hallar la tasa media de crecimiento intercensal (r) de la población siguiente: r n Pn P0 1 Po = Población en el año 0. etc. 764 1 = 1..el peso medio de los alumnos es de 59.77272637 59.36358231 1. Ejemplo 3.

P0 = P2007 = 28‟220.Para proyectar la población se usa la expresión: Pn Donde: Po = P2007 = Población en el año 0 = 2007 (Tomar el año más cercano).)..Si se hubiera solicitado la tasa media de crecimiento intercensal mensual.048353602(28220764) = = 29‟585. b) La población del Perú el año 2010. n = Años transcurridos desde el año 2007 hasta el año 2010 = 3 años. Pn = P2010 = Población en el año n = 2010. Es decir.015864843. r = Tasa media de crecimiento intercensal anual = 0.entre el año 1993 y el 2007 la población del Perú creció a un 1. Pn = 40 millones (Población que tendrá el Perú el año n). el más cercano).764 habitantes (Tomar como año 0. Asumiendo que la tasa media de crecimiento intercensal anual es la misma para los años siguientes y reemplazando valores en la fórmula de proyección de población se tiene: Pn P2010 1 r n 1 r n P0 P0 P2010 1 0.015864843 28220764 1. El año 2010 el Perú tiene 29.59 niñ@s (también se puede interpretar en tanto por mil o diez mil. que por cada 100 habitantes nacieron 1.015864843. etc.015864843 P2007 3 3 1 0. Reemplazando valores en la expresión anterior se tiene: 136 . se tendría que haber obtenido la raíz 168 (meses transcurridos del ‟93 al ‟07). c) ¿En que año el Perú tendrá 40 millones de habitantes? Despejando n de la fórmula Pn 1 r n P0 se tiene que: log n Pn P0 log 1 r n = año buscado.59% anual. Interpretación. r = Tasa media de crecimiento intercensal anual = 0.6 millones de habitantes.340 habitantes.

cuyos pesos ordenados son: 44 50 53 57 65 70 45 50 53 59 66 72 46 50 53 60 66 72 46.2 años Entonces: 2007 + 22.6.5 69 80 50 53 57 65 70 88 Reemplazando valores en la fórmula se tiene: 137 .H n n i 1 1 Xi Ejemplo 3.. 3. Nota.5 50.12 Si se calcula la media armónica con los datos sin agrupar del Cuadro 2.015864843 log 22.59%).6 MEDIA ARMÓNICA Se define como la inversa de la media aritmética de los inversos de los valores observados.5 54 60 67 75 47 51 55 63 67 75 48 51 55 63 68 77 48 52 55 64 68 80 49 52 55 64 68 80 49 52.6 55 64. de los 60 alumnos de Estadística Básica 09-A. El año 2029 el Perú tendrá 40 millones de habitantes (si la tasa de crecimiento de la población es del 1. Es utilizada para hallar determinadas tasas promedio o rendimientos promedio para una misma actividad.n 40000000 28220764 log 1 0. Cálculo para datos sin agrupar. peso en Kg.También se utiliza la media geométrica para determinar la inflación media mensual y a su vez hacer proyecciones de la inflación anual a partir del promedio mensual.2 años = 2029.

4 79.8 61.317 57. peso de los 60 alumnos de Estadística Básica 09-A FCE-UNAC.0316135533 58.H 60 i 60 1 1 Xi 60 1 X1 1 X2 1 X3 1 X 59 1 X 60 1 44 1 45 60 1 46 1 80 1 88 60 1.000 Solución.8 5 0.161 Kg. Ejemplo 3.4 79.4 19 0.Desarrollando la fórmula se tiene: H i k n ni 1 Xi 5 i 60 ni 1 Xi n1 X1 n2 X2 60 n3 X3 n4 X4 n5 X5 = 138 .283 51 0.2 LSi 52.8 61.161 Kg.0 52.Ac.H i k n ni 1 Xi 1 k i 1 hi Xi Fórmula para trabajar bien con las repeticiones o frecuencias absolutas ni o para trabajar con las frecuencias relativas hi. Interpretación.6 4 0.567 66. Prop.933 83.. Por tratarse de datos agrupados Xi representa la marca de clase para los intervalos o el valor indicado para los casos discretos con poca variabilidad de los valores observados.7.067 60 1.317 19 0. Alum-nos alumnos alumnos alumnos clase Xi ni hi Ni Hi 48.6 70.el peso promedio de los alumnos es de 58.) LIi 44. Cálculo para datos agrupados.083 56 0.0 Marca Prop.6 70. siguientes: Clase i 1 2 3 4 5 PESOS (Kg.850 74. Acum.0 17 0.250 34 0.13 Calcular la media armónica con los datos agrupados del Cuadro 2.2 88.000 60 1.2 15 0.

H 58.419 G 58.8 83.419 Kg.0270673130 Interpretación. 1.161 58. RELACIÓN ENTRE LAS MEDIAS ARITMÉTICA..el peso promedio de los alumnos es de 58.6 60 58.419 Kg.2 60 17 66.4 15 57.133 139 .= 19 48.255 X 59. GEOMÉTRICA Y ARMÓNICA Si se calcula estas tres medias para los mismos datos se tiene que: H G X Para los pesos de los alumnos se han obtenido los siguientes resultados: Datos: Sin agrupar Agrupados Vemos que se cumple la relación.0 5 4 74.994 59.868 60.

Cuartil 2 = Q2 acumula las dos cuartas partes de las observaciones (50%). Cuartil 3 = Q3 acumula las tres cuartas partes de las observaciones (75%). 140 . a) CUARTILES (Qk ) Son particiones de la distribución de frecuencias en cuatro partes iguales de modo que cada una de ellas acumula un cuarto de las observaciones (25% de los datos). cuartiles (cuatro partes iguales). Entre los cuantiles más conocidos se tiene: mediana (dos partes iguales). quintiles (cinco partes iguales). deciles (diez partes iguales). por ello los cuartiles son tres y se denotan de la siguiente manera: Cuartil 1 = Q1 acumula la cuarta parte de las observaciones (25%). X 25% datos Q1 25% datos Q2 25% datos Q3 25% datos Para dividir la distribución de frecuencias en cuatro partes iguales necesitamos 3 puntos. Se calculan de modo similar a la mediana.7 CUANTILES Son particiones de la distribución de frecuencias en un determinado número de partes iguales. veintiles (veinte partes iguales) y percentiles (cien partes iguales). Desarrollaremos los de mayor uso viendo su forma de cálculo e interpretación.3.

si es entero Q3 4 E E F X X E E 1 X E F X E 1 X 3( n 1) 4 . cuyos pesos ordenados son: 44 50 53 57 65 70 45 50 53 59 66 72 46 50 53 60 66 72 46. Entonces el cuartil 3 es: Q3 X Ejemplo 3. peso en Kg.F. se efectúa así: Cuantil X Aquí el cuartil 1 es: Q1 X Cuartil 3 (Q3) Ubicar su posición calculando 3( n 1) . Cálculo para datos sin agrupar. si es entero Q1 4 X n 1 4 . el resultado es de la forma E. X(n) b) Obtención de los cuartiles 1 y 3: Cuartil 1 (Q1) Ubicar su posición calculando n 1 . de los 60 alumnos de Estadística Básica 09-A. . entonces hacer una interpolación lineal entre las observaciones ordenadas E y (E + 1) entre las cuales esta la fracción F.F.5 54 60 67 75 47 51 55 63 67 75 48 51 55 63 68 77 48 52 55 64 68 80 49 52 55 64 68 80 49 52. donde E es la parte entera y F la fracción decimal.6.5 69 80 50 53 57 65 70 88 E F X E 1 X E 141 . Si no es entero. el resultado es de la forma E. X(2) . …. Dicha interpolación lineal es similar para cualquier cuantil que vamos a estudiar. Si no es entero. donde E es la parte entera y F la fracción decimal. Q2 = Me ya estudiada. Es decir.14 Calcular los cuartiles 1 y 3 con los datos sin agrupar del Cuadro 2.a) Ordenar las observaciones en forma ascendente: X(1) .El cuartil dos es igual a la mediana (acumula el 50% de los valores observados).6 55 64.5 50. entonces hacer una interpolación lineal antes indicada entre las observaciones ordenadas E y (E + 1) entre las cuales esta la fracción F.

51] = 51 Kg.). Aplicando la interpolación lineal recomendada. Donde: 142 . Aplicando la interpolación lineal recomendada. Ayudándonos de las 4 frecuencias acumuladas se ve que clase j contiene (o donde esta) el cuartil k (Qk). 2.25 . se determina kn .). Como no es un valor entero. 2 ó 3.75). k = 1.El 25 % de los alumnos de Estadística Básica 09-A tiene un peso menor o igual a 51 Kg. el cuartil 1 esta entre los pesos ordenados 15 y 16 (51 y 51 Kg. (E = 45 y F = 0.El 75 % de los alumnos de Estadística Básica 09-A tiene un peso menor o igual a 67.75 [68 . Interpretación. Como no es un valor entero.25 [51 . k = 1.. el cuartil 1 es: Q1 X 15 0. Interpretación.25).67] = 67. y el 75% restante por encima de 51 Kg.75 .75 Kg.- a) Ubicar la clase j que contiene el cuartil k Como en las tablas de frecuencias los valores de la variable están ordenados en forma ascendente.Solución: Cálculo del cuartil 1 (Q1) Ubicar su posición con n 1 4 60 1 15. y el 25% restante por encima de 67.75 Kg. Cálculo de los cuartiles con datos agrupados. Cálculo del cuartil 3 (Q3) Ubicar su posición con 3(n 1) 4 3(60 1) 4 45. el cuartil 3 esta entre los pesos ordenados 45 y 46 (67 y 68 kg. el cuartil 3 es: Q3 X 45 0. (E = 4 15 y F = 0. 3.. b) Calcular el cuartil k (Qk) usando cualquiera de las siguientes expresiones: Qk LI j kn 4 Nj nj 1 Cj LI j k Hj 4 hj 1 C j .75 Kg.25 X 16 X 15 = 51 + 0.75 X 46 X 45 = 67 + 0.

Prop. relativa acumulada hasta la clase anterior a la que contiene Qk. vemos que en la clase 1.6 4 0.8 61. N1 = 19. LIj = límite inferior de la clase que contiene el cuartil k (Qk).850 74. Acum.7.0 Marca Prop.2 15 0.2 88.250 34 0. hj = frecuencia relativa en la clase que contiene el cuartil k (Qk).8 Kg. Ejemplo 3.317 19 0. Alum-nos alumnos alumnos alumnos clase Xi ni hi Ni Hi 48. siguientes: Clase i 1 2 3 4 5 PESOS (Kg. Cálculo del cuartil 1 (Q1) k = 1.4 19 0.933 83.083 56 0. nj = repeticiones en la clase que contiene el cuartil k (Qk).8 61. Hj-1 = frec. Luego.067 60 1.15 Calcule e interprete los cuartiles con los datos agrupados del Cuadro 2.4 79.) LIi 44. ¿En que intervalo de clase se contó la observación o 4 peso del alumno 15? Observando los Ni del Cuadro 2. Nj-1 = repeticiones acumuladas hasta la clase anterior a la que contiene Qk. El cuartil 1 es un peso entre 44. b) Calcular el cuartil 1 (Q1) usando la expresión: 143 .7.0 y 52.4 79. Cj = amplitud de la clase Qk = LSj – LIj .8 5 0. la clase en la que se contó la talla del alumno kn 4 n 4 60 15 es la 4 clase j = 1.6 70.0 52.000 60 1.2 LSi 52.6 70. a) Ubicar la clase j que contiene el valor del cuartil k = 1 (Q1): kn 4 n 4 60 15 . peso de los 60 alumnos de Estadística Básica 09-A FCE-UNAC.567 66. se han contado los pesos de los 19 primeros alumnos (recordemos que los pesos están ordenadas de manera ascendente en el cuadro).000 Solución.283 51 0.Ac.j = clase que contiene o donde esta el cuartil k (Qk).317 57.0 17 0.

El cuartil 3 es un peso entre 61. LIj = LI1 = 44. nj = n1 = 19 C1 = LS1 – LI1 = 52. y el 75% restante por encima de46. n = 60. N2 = 34. se han contado los pesos de los 34 primeros alumnos.947 Kg. Nj-1 = N0 = 0.4 Kg.  Cálculo del cuartil 3 (Q3) k = 3. 19 Interpretación. vemos que hasta la clase 2. Reemplazando valores en la fórmula se tiene: Q1 LI1 n N0 4 C1 n1 44. Entonces.El 25 % de los alumnos de Estadística Básica 09-A tiene un peso menor o igual a 46. ¿En que intervalo de clase se contó la observación o peso del alumno 45? Observando los Ni del Cuadro 2. Luego. b) Calcular el cuartil 3 (Q3) usando la expresión: Q3 LI j 3n Nj 4 nj 1 Cj LI j 3 Hj 4 hj 1 Cj Donde: 144 .0 60 0 4 8.8.0 = 8.  Cálculo del cuartil 2 (Q2) es la mediana ya fue determinado.0. en el intervalo de clase 3 se cuenta el peso del alumno 45.6 y 70.Q1 LI j n Nj 4 nj 1 Cj LI j 1 Hj 4 hj 1 Cj Donde: j = 1.8 – 44.7.947 Kg.. la clase en la que se contó el peso del alumno kn 4 3n 4 3(60) 4 45 es la clase j = 3. a) Ubicar la clase j que contiene el valor del cuartil k = 3 (Q3): kn 4 3n 4 3(60) 4 45 .8 46.947 Kg.

Nj-1 = N2 = 34. Decil 3 = D3 acumula las tres décimas partes de las observaciones (30%). b) DECILES (Dk ) Son particiones de la distribución de frecuencias en diez partes iguales de modo que cada una de ellas acumula un décimo de las observaciones (10% de los datos). 17 Interpretación. nj = n3 = 17. Decil 2 = D2 acumula las dos décimas partes de las observaciones (20%).8 66.. 145 .… 10% D9 10% Para dividir la distribución de frecuencias en diez partes iguales se necesita 9 puntos. El decil cinco es igual a la mediana (acumula el 50% de los valores observados). y el 25% restante por encima de 66. D5 = Me.. por ello los deciles son nueve y se denotan de la siguiente manera: Decil 1 = D1 acumula la décima parte de las observaciones (10%).259 Kg.j = 3.El 75 % de los alumnos de Estadística Básica 09-A tiene un peso menor o igual a 66.6 3(60) 34 4 8. que pasamos a desarrollar.8 – 61. n = 60. Decil 6 = D6 acumula las seis décimas partes de las observaciones (60%).259 Kg. Es decir. El cálculo de los deciles y otros cuantiles se pueden efectuar mediante el cálculo del percentil correspondiente. Decil 7 = D7 acumula las siete décimas partes de las observaciones (70%).6 = 8. 10% D1 10% D2 . Decil 8 = D8 acumula las ocho décimas partes de las observaciones (80%). Reemplazando valores en la fórmula se tiene: Q3 LI 3 3n 4 n3 N2 C3 61. Decil 5 = D5 acumula las cinco décimas partes de las observaciones (50%). LIj = LI3 = 616.259 Kg. Decil 9 = D9 acumula las nueve décimas partes de las observaciones (90%). C3 = LS3 – LI3 = 70.8. Decil 4 = D4 acumula las cuatro décimas partes de las observaciones (40%).

Así tenemos que: la mediana (acumula el 50% de los valores observados) es igual al percentil 50. donde E es la parte entera y F la fracción decimal. 99 146 . …. D9 = P90. 99 Ubicar su posición calculando k ( n 1) .c) PERCENTILES (Pk ) Son particiones de la distribución de frecuencias en cien partes iguales de modo que cada una de ellas acumula un centésimo de las observaciones (1% de los datos). . por ello los percentiles son noventa y nueve y se denotan de la siguiente manera: Percentil 1 = P1 acumula una centésima parte de las observaciones (1%). Me = P50. si es entero Pk 100 X k ( n 1) 100 . 3.. Percentil k = Pk acumula las k centésimas partes de las observaciones (k%). Q2 = P50 = Me. Q3 = P75. …………. …. 2. X(2) . 2. También: Q1 = P25. Para dividir la distribución de frecuencias en cien partes iguales necesitamos 99 puntos. Entonces el percentil k es: Pk X E F X E 1 X E .Todas los cuantiles calculados anteriormente son también percentiles (según el % de observaciones que acumule cada uno de ellos). entonces hacer la interpolación lineal antes indicada entre las observaciones ordenadas E y (E + 1) entre las cuales esta la fracción F. Nota. X(n) b) Obtención del k-ésimo percentil (Pk). Percentil 99 = P99 acumula las 99 centésimas partes de las observaciones (99%). 3.F. D10 = P10. Es decir. …. D5 = P50 = Me. Percentil 3 = P3 acumula tres centésimas partes de las observaciones (3%).. Percentil 2 = P2 acumula dos centésimas partes de las observaciones (2%).a) Ordenar las observaciones en forma ascendente: X(1) . Cálculo para datos sin agrupar. Si no es entero. k = 1. el resultado es de la forma E. k = 1. ………….

80 . (E = 48 y F = 0.El 10 % de los alumnos de Estadística Básica 09-A tiene un peso menor o igual a 48 Kg. el percentil 10 está entre los pesos ordenados 6 y 7 (48 y 48 Kg.10 X 7 X 6 = 48 + 0. y el 90% restante por encima de 48 Kg.80 [69 .80 Kg.5 69 80 50 53 57 65 70 88 Solución: Cálculo del percentil 10 (P10) Ubicar su posición con 10 (n 1) 100 10 (60 1) 100 6.68] = 68. Aplicando interpolación lineal. Como no es un valor entero.10).80 Kg.80).80 X 49 X 48 = 68 + 0.). de los 60 alumnos de Estadística Básica 09-A. y el 20% restante por encima de 68. el percentil 80 esta entre los pesos ordenados 48 y 49 (68 y 69 kg.El 80 % de los alumnos de Estadística Básica 09-A tiene un peso menor o igual a 68. cuyos pesos ordenados son: 44 50 53 57 65 70 45 50 53 59 66 72 46 50 53 60 66 72 46. Interpretación.. Cálculo de los percentiles para datos agrupados.- a) Ubicar la clase j que contiene el decil k 147 .80 Kg. (E = 6 y F = 0. Cálculo del percentil 80 (P80) Ubicar su posición con 80 (n 1) 100 80 (60 1) 100 48. el percentil 80 es: P80 X 48 0.6.Ejemplo 3. el percentil 10 es: P 10 X 6 0. Como no es un valor entero.5 54 60 67 75 47 51 55 63 67 75 48 51 55 63 68 77 48 52 55 64 68 80 49 52 55 64 68 80 49 52.5 50.1 . Interpretación.).48] = 48 Kg.6 55 64.. peso en Kg.10 [48 .16 Calcular los percentiles 10 y 80 con los datos sin agrupar del Cuadro 2. Aplicando la interpolación lineal recomendada.

3.4 19 0.Calcule e interprete los percentiles 10 y 80 con los datos agrupados del Cuadro 2. hj = frecuencia relativa en la clase que contiene el percentil k (Pk)..8 61. 98 ó 99. Acum. Nj-1 = repeticiones acumuladas hasta la clase anterior a la que contiene Pk. …. Donde: j = clase que contiene o donde esta el percentil k (Pk).8 5 0. Hj-1 = frec. 2.317 19 0.4 79. k = 1.2 LSi 52.0 52.283 51 0.850 74. 98. se determina kn .Como en las tablas de frecuencias los valores de la variable están ordenados en forma ascendente.6 70. Cálculo del percentil 10 (P10) k = 10. Cj = amplitud de la clase Pk = LSj – LIj .4 79.567 66. peso de los 60 alumnos de Estadística Básica 09-A FCE-UNAC.933 83. 100 Ayudándonos de las frecuencias acumuladas se ve que clase j contiene (o donde esta) el percentil k (Pk). k = 1. …. Prop. relativa acumulada hasta la clase anterior a la que contiene Pk.6 70. Ejemplo 3. 2. LIj = límite inferior de la clase que contiene el percentil k (Pk).317 57.8 61.2 15 0. Alum-nos alumnos alumnos alumnos clase Xi ni hi Ni Hi 48.2 88.000 Solución.. 99.7.067 60 1. nj = repeticiones en la clase que contiene el percentil k (Pk).) LIi 44.083 56 0.17.0 17 0.Ac. 3.000 60 1. b) Calcular el percentil k (Pk) usando cualquiera de las siguientes expresiones: Pk LI j kn Nj 100 nj 1 Cj LI j k Hj 100 hj 1 C j . siguientes: Clase i 1 2 3 4 5 PESOS (Kg.0 Marca Prop.250 34 0. a) Ubicar la clase j que contiene el valor del percentil k = 10 (P10): 148 .6 4 0.

8 – 44. El percentil 80 es una talla entre 61.  Cálculo del percentil 80 (P80) k = 80.El 10 % de los alumnos de Estadística Básica 09-A tiene un peso menor o igual a 46. nj = n1 = 19. se han contado los pesos de los 34 primeros alumnos. es la clase j = 3.. b) Calcular el percentil 10 (P10) usando la expresión: 149 .4 Kg. vemos que en la clase 1. a) Ubicar la clase j que contiene el valor del percentil k = 80 (P80): kn 100 80n 100 80 (60) 100 48 . se han contado los pesos de los 19 primeros alumnos. El percentil 10 es una talla entre 44. Luego.0.0 = 8.7. ¿En que intervalo de clase se contó la observación o peso del alumno 48? Observando los Ni del Cuadro 2.0 y 52. es la clase j = 1. Nj-1 = N0 = 0. N2 = 34. n = 60.0 10(60) 0 100 8.6 y 70. ¿En que intervalo de clase se contó la observación o peso del alumno 6? Observando los Ni del Cuadro 2. Luego. Reemplazando valores en la fórmula se tiene: P 10 LI1 10n N0 100 C2 n1 44.779 Kg. C1 = LS1 – LI1 = 52. la clase en la que se contó el peso del alumno kn 100 10n 100 10 (60) 100 6 .779 Kg. N1 = 19. en el intevalo de la clase 3 se cuenta los pesos de los alumnos desde el 35 hasta el 51.8 46.8 Kg. LIj = LI1 = 44. y el 90% restante por encima de 46.8.779 Kg.kn 100 10n 100 10 (60) 100 6 . Entonces.7. vemos que hasta la clase 2. 19 Interpretación. la clase en la que se contó el peso del alumno 48. b) Calcular el percentil 10 (P10) usando la expresión: P 10 LI j 10n 100 nj Nj 1 Cj LI j 10 Hj 100 hj 1 Cj Donde: j = 1.

6.259 46. n = 60. desde la base de datos construida (datos sin agrupar) utilizando los programas.4 – 61.El 80 % de los alumnos de Estadística Básica 09-A tiene un peso menor o igual a 68.6 80(60) 34 100 8.) DE LOS ALUMNOS DE ESTADÍSTICA BÁSICA 09A .75 48. LIj = LI1 = 61. Reemplazando valores en la fórmula se tiene: P80 LI3 80n N2 100 C3 n3 61.00 68. C3 = LS3 – LI3 = 70. CUADRO 3. 17 Interpretación. primero ubicarse en la celda D66.447 Kg.253 66. cuando en el programa se pide Matriz se sombrean estos o se escribe D3:D62.00 67.947 59. Para calcular los CUARTILES.8 68. Nj-1 = N2 = 34. y el 20% restante por encima de 68..1 RESUMEN DE LOS CUANTILES CALCULADOS PARA LOS PESOS (KG.779 68. DE LA FCE-UNAC.P80 LI j 80n 100 nj Nj 1 Cj LI j 80 Hj 100 hj 1 Cj Donde: j = 3. En Excel: Con los datos de la variable peso de los 60 alumnos en la columna D.447 Cálculo de cuartiles y percentiles con los programas Veamos como se pueden obtener los cuartiles y percentiles para la variable peso.8. desde D3 hasta D62.447 Kg. nj = n3 = 17. POR LA FORMA EN QUE ESTÁN LOS DATOS CUANTIL Cuartil 1 Cuartil 2 (mediana) Cuartil 3 Percentil 10 Percentil 80 DATOS SIN AGRUPAR 51.00 57. 150 . por ejemplo el CUARTIL 1.6 = 8.80 DATOS AGRUPADOS 46.447 Kg.

10. escoger dentro de Seleccionar una categoría →Estadísticas → Cuartil. 1. En dicha figura. Conociendo la sintaxis de la función. Similarmente se obtiene los cuartiles 2 y 3 en las celdas 67 y 68. =CUARTIL(matriz.8).7 Cálculo de cuartiles en Excel Indicar los Argumentos de la función CUARTIL. con matriz (D3:D62) y k = 0. 151 . o 3 para el cuartil deseado y 4 = valor máximo) aquí 1.1). se muestra también la sintaxis de cálculo y el resultado del percentil 80. En matriz indicar la ubicación de los datos y k es un número entre 0 y 1 para indicar el percentil como una proporción.10) al hacer Enter. se obtiene así: ubicarse en la celda D69 y escribir =PERCENTIL(D3:D6. 0. aparece el resultado 48 Kg. Luego hacer clic en y aparece el resultado del Cuartil 1= 51 Kg. 2. k). Figura 3. aparece el resultado 51 Kg. en Matriz (dar la ubicación de los pesos. con la opción de funciones del Excel. (ver la Figura 3. Para obtener los PERCENTILES también se puede seleccionar la función PERCENTIL o utilizar la sintaxis =PERCENTIL(matriz. aparece la ventana de diálogo de la Figura 3.7. en la celda D70. En Cuartil escribir un número (0 = valor mínimo. cuartil) se hace así: Ubicarse en la celda D66 y al lado de escribir =CUARTIL(D3:D62. desde la celda D3 hasta la D62) sombrear los datos o escribir D3:D62. Al hacer Enter.Luego. Para obtener el percentil 10.8). (ver la Figura 3.

00 Median 57.5).4). Hacer clic en OK y regresa a la ventana Display Descriptive Statistics. Inmediatamente se abre la ventana de diálogo Frecuencias.00 Q3 67. 152 . Hacer clic en el botón Satatistcs – Statistics (Figura 3. Median (segundo cuartil o mediana). seguir la secuencia para obtener la tabla de frecuencias: Analizar → Estadísticos descriptivos → Frecuencias. escoger del menú Stat →Basic Statistics → Display Descriptive Statistics… aparece la ventana de diálogo Display Descriptive Statistics (ver Figura 3.Figura 3.00 Q1 51. Third quartile (tercer cuartil) y hemos agregado Minimum (mínimo) y Maximum (máximo). Para terminar hacer clic en OK y en la ventana de Session aparecen los resultados solicitados siguientes: Descriptive Statistics: peso Variable peso Minimum 44. En variables: seleccionar la variable peso de las variables que están a la izquierda. Escoger los CUARTILES a calcular: First quartile (primer cuartil).00 y aparece la ventana de diálogo Descriptive En SPSS: Estando en la base de datos Estadística Básica 09A.75 Maximum 88.8 Resultado de cuartiles y percentiles en Excel En Minitab: Estando en la base de datos Estadística Básica 09A.

75 68.80 Resultado de cuartiles y percentiles en SPSS En los resultados del SPSS se aprecia que los cuartiles aparecen como los percentiles 25 (primer cuartil). seleccionar Cuartiles y Percentiles.9 Cálculo de cuartiles y percentiles en SPSS En Valores percentiles. Luego hacer clic en Continuar. 50 (segundo cuartil o mediana) y 75 (cuartil 3). debiendo escribir el número de percentil deseado (10 y 80) por separado y luego hacer clic en Añadir.00 51. y se Figura 3. Inmediatamente en el Visor de Resultados aparece: Estadísticos PESO (Kg) N Percentiles Válidos Perdidos 10 25 50 75 80 60 0 48.9.En Variables: ingresar la variable peso. regresando a la ventana de diálogo Frecuencias y efectuar clic en Aceptar para terminar.00 67.00 57. luego hacer clic en el botón muestra la ventana de diálogo Frecuencias: Estadísticos de la Figura 3. 153 .

00 51.00 51.2 RESUMEN DE LOS PERCENTILES CALCULADOS PARA LOS PESOS (KG.p) 10% 25% 50% 75% 80% 48.00 57.50 = cuartil 2 o mediana).00 67.50. que quantile es el valor por abajo del cual se encuentra el p% de las observaciones.00 57.10) 10% 48 Si se requiere los percentiles 10 (0.75 68. p) Donde variable es un conjunto de datos cuantitativos (peso aquí) y p es una proporción para identificar a uno o varios percentiles determinados. POR PROGRAMA USADO PERCENTIL 10 25 o cuartil 1 50 o cuartil 2 75 o cuartil 3 80 MANUAL 48.10) para la variable peso se obtiene así: > quantile(peso. El percentil 10 (p =0. 0.00 51.00 67.00 51.20 154 .00 67.10.) DE LOS ALUMNOS DE ESTADÍSTICA BÁSICA 09A.10).00 57.00 57.80). entonces se define p como un vector con las proporciones indicadas y luego la función cuantile.25 68.75 68. para que reconozca las variables y sus valores.00 67.25 = cuartil 1). 0. 50 (0. 75(0. 0.75 = cuartil 3) y 80 (0.25 68.25.80 EXCEL 48.75 - SPSS 48.00 57.20 MINITAB 51.80) > quantile(peso.00 51. Es decir.00 67.0. 25 (0. DE LA FCE-UNAC.75.00 67. 0.En R: Estando en la base de datos Estadística Básica 09A y habiendo attachado la misma.20 CUADRO 3.25 68. se escribe en la consola la sintaxis para PERCENTILES: quantile(variable.00 57. así: > p=c(0.80 R 48.

4. MEDIDAS DE DISPERSIÓN Y DE FORMA “Vivimos en la era de la televisión.8 Introducción.6 4. es decir.3 4. Una sola toma de una enfermera bonita ayudando a un viejo a salir de una sala dice más que todas las estadísticas sanitarias” Margaret Thatcher CONTENIDO 4. También se presenta una forma gráfica de apreciar la dispersión de los datos. la varianza y la desviación estándar. Medidas de forma de la distribución. Rango intercuartílico. El coeficiente de variación. describiendo el mayor o menor alejamiento de los valores observados en formas absolutas y relativas.1 4. la desviación media. en tanto que como medición relativa usaremos el coeficiente de variación. Entre las formas absolutas de medición tenemos el rango. el resumen de los datos a través de un solo valor. La varianza La desviación típica. el rango intercuartílico. En el presente capítulo se continúa haciendo resúmenes de la información cuantitativa obtenida. El diagrama de caja (Box. a través del diagrama de caja y bigotes (box-plot) como herramienta importante para el análisis exploratorio de datos. Desviación media.4 4. el mismo que no es suficiente para formarse una idea de la distribución de la variable. 155 .Plot). Rango.Capítulo 4.1 INTRODUCCIÓN En el capítulo anterior vimos la caracterización de los datos de una variable mediante un solo punto.7 4.2 4.5 4.

Es el indicador usado para construir tablas de frecuencias. de los 60 alumnos de Estadística Básica 09-A..7. tenemos que el rango es: R = Xmáx – Xmín = {X / Xmáx ≤ X ≤ Xmín } R= 88 – 44 = 44 Kg.2 RANGO Y RANGO INTERCUARTÍLICO RANGO El Rango (R). tenemos que el rango es: R = LS5 – LI1 = {X / LSk ≤ X ≤ LI1 } = 88 – 44 = 44 Kg. peso en Kg.4.. o R = {X / 44 ≤ X ≤ 88} Interpretación. También podemos decir que los pesos de los 60 alumnos fluctúan entre 44 y 88 Kg. o R = {X / 44 ≤ X ≤ 88} Interpretación.la diferencia entre el peso máximo y mínimo de los alumnos de Estadística Básica 09-A es de 44 Kg.6. 156 .1 Si trabajamos con los datos sin agrupar del Cuadro 2. Tal como se puede apreciar el Rango es una medida muy gruesa de la dispersión de los datos ya que nos da una idea de la diferencia o fluctuación de los valores extremos. También podemos decir que los pesos de los 60 alumnos fluctúan entre 44 y 88 Kg. peso en Kg. de los 60 alumnos de Estadística Básica 09-A. Recorrido o Amplitud de la variable es la diferencia entre el valor máximo y mínimo.la diferencia entre el peso máximo y mínimo de los alumnos de Estadística Básica 09-A es de 44 Kg. Si trabajamos con los datos agrupados del Cuadro 2. Cálculo para datos sin agrupar: R = Xmáx – Xmín = {X / Xmín ≤ X ≤ Xmáx} Cálculo para datos agrupados: R = LSk – LI1 = {X / LSk ≤ X ≤ LI1 } Ejemplo 4.

Reemplazando valores en la fórmula del RIQ se tiene: RIQ = 66. En el ejemplo 3. Reemplazando valores en la fórmula del RIQ se tiene: RIQ = 67. se ha determinado que el cuartil 1 es Q1 = 46.7. peso en Kg.26 Kg.2 En el ejemplo 3. se ha determinado que el cuartil 1 es Q1 = 51 Kg.75 Kg. de los 60 alumnos de Estadística Básica 09-A.31 Kg.el 50% central de los pesos se encuentra entre 46. como para datos agrupados la fórmula de cálculo es: RIQ = Q3 – Q1 = P75 – P25 Ejemplo 4. peso en Kg.14 de cuartiles.75 – 51.26 – 46.26 Kg. Interpretación.95 Kg. y el cuartil 3 es Q3 = 67.75 Kg. 25% datos Q1 25% datos Q2 25% datos Q3 25% datos Tanto para datos sin agrupar. de los 60 alumnos de Estadística Básica 09-A.6.95 y 66.75 Kg.15. con los datos sin agrupar del Cuadro 2..RANGO INTERCUARTÍLICO El rango intercuartílico (RIQ o RIC) es la diferencia entre el cuartil 3 y el cuartil 1 y nos indica entre que valores se encuentra el 50% central de las observaciones. y el cuartil 3 es Q3 = 66.00 = 16.95 = 19.. con los datos agrupados del Cuadro 2. 157 . Interpretación.el 50% central de los pesos se encuentra entre 51 y 67.

13 80 59. Ejemplo 4.006 Kg.87 15.87 46 59. Utiliza la idea de distancia como la diferencia en valor absoluto de cada valor observado con respecto a su media aritmética o su mediana.1 se ha determinado que el peso promedio de los 60 alumnos de Estadística Básica 09-A es X = 59.6 55 64. peso en Kg.- n n Xi DM X i 1 X ó X i Me DM X i 1 n n Primero se calcula la media aritmética o mediana.87 60 20. 158 . cuyos pesos ordenados son: 44 50 53 57 65 70 45 50 53 59 66 72 46 50 53 60 66 72 46. se tiene que: n 60 Xi DM X i 1 X i 1 X i 59.3 DESVIACIÓN MEDIA Mide la desviación absoluta promedio de los valores observados bien con respecto a la media aritmética o con respecto a la mediana. y en el ejemplo 3. Cálculo para datos sin agrupar.87 45 59.4 la mediana Me = 57 Kg. de los 60 alumnos de Estadística Básica 09-A.87 14.87 Kg.En el ejemplo 3.87 540.4.3 Calcular la desviación media respecto a la media aritmética con los datos sin agrupar del Cuadro 2.6.5 54 60 67 75 47 51 55 63 67 75 48 51 55 63 68 77 48 52 55 64 68 80 49 52 55 64 68 80 49 52.87 60 n 44 59.5 69 80 50 53 57 65 70 88 Solución.87 60 9. Para calcular la desviación media respecto a la media aritmética. luego la desviación media.5 50.87 13.13 28.38 60 88 59.

con los datos agrupados del Cuadro 2.317 19 0.Ac. peso de los 60 alumnos de Estadística Básica 09-A FCE-UNAC.6 4 0.25 Kg.317 57.7.25 ni 60 n 159 .000 60 1.006 Kg..933 83. luego la desviación media.0 Marca Prop.0 17 0. Acum.850 74.el cálculo y la interpretación de la desviación media respecto a la mediana se efectúa de modo similar al de la media aritmética.) LIi 44.567 66. siguientes: Clase i 1 2 3 4 5 PESOS (Kg.2 88. Usando la fórmula de datos agrupados para la desviación media se tiene que: k 5 X i Me ni DM Me i 1 i 1 X i 59.4 79.250 34 0.el promedio de las desviaciones absolutas de los pesos de los alumnos respecto a su media aritmética es de 9.4 19 0. Alum-nos alumnos alumnos alumnos clase Xi ni hi Ni Hi 48.Interpretación.8 5 0..000 Solución. Cálculo para datos agrupados.067 60 1.4 Calcular la desviación media respecto a la mediana.En el ejemplo 3. y en el ejemplo 3.5 la mediana Me = 59. Nota.k k Xi DM X i 1 X ni k Xi Xi X hi ó DM Me i 1 Me ni n k n Xi i 1 Me hi i 1 Primero se calcula la media aritmética o mediana.8 61.2 LSi 52.8 61.083 56 0.0 52.4 79.283 51 0. sólo que se trabaja con Me = 57 Kg.13 kg.2 15 0..6 70.6 70. Prop.1 se ha encontrado la media aritmética X = 60. Ejemplo 4.

25 n3 60 X 4 59. Interpretación.25 4 66. Se denota por: o 2 X 2 SX V (X ) V (X ) 2 para la población.2 59.X 1 59. 4.78 Kg.13 kg.k k (Xi a) Varianza poblacional: 2 X i 1 ) 2 ni i 1 X i2 ni N N 2 N 160 .75 + 97. Nota.25 n2 X 3 59. S2 Cálculo para datos sin agrupar.25 n4 X 5 59.el promedio de las desviaciones absolutas de los pesos de los alumnos respecto a su media aritmética es de 8.4 VARIANZA Mide el promedio de las desviaciones al cuadrado de los valores observados con respecto a la media aritmética.8 / 60 = 8.4] / 60 = 526.75 + 77.25 19 57.el cálculo y la interpretación de la desviación media respecto a la media aritmética se efectúa de modo similar al de la mediana.. para la muestra. sólo que se trabaja con X = 60.25 15 60 74.25 n5 1 48.8 59.78 Kg.6 59.0 59.25 17 = [206.15 + 30.25 5 83.- N N (Xi a) Varianza poblacional: 2 X n i 1 )2 i 1 X i2 N n N 2 N (Xi X )2 i 1 X i2 n X 2 n 1 b) Varianza muestral: 2 SX i 1 n 1 Cálculo para datos agrupados.75 + 114.25 n1 X 2 59.4 59..

(1) 161 . de los 60 alumnos de Estadística Básica 09-A.47 60 109. Otra forma de cálculo es: N 60 X i2 2 i 1 N 2 i 1 X i2 60 60 2 N ………….2969 6542.87)2 405. Primera forma de cálculo: N 60 (Xi 2 i 1 )2 i 1 ( X i 59.8569 221.2169 791.87)2 (45 59.6 55 64.87) 2 60 N (44 59.5 Calcular la varianza con los datos sin agrupar del Cuadro 2.5 69 80 50 53 57 65 70 88 Solución.1169 192.3769 60 (80 59.6.5 54 60 67 75 47 51 55 63 67 75 48 51 55 63 68 77 48 52 55 64 68 80 49 52 55 64 68 80 49 52. Ejemplo 4.)2.87 Kg.5 50.87)2 60 251.0412 (Kg.En el ejemplo 3.1 se ha determinado que la media aritmética µ = 59.k k (Xi b) Varianza muestral: 2 SX i 1 X )2 ni i 1 X i2 ni n X 2 n 1 n 1 Primero se calcula la media aritmética para datos agrupados y luego la varianza. cuyos pesos ordenados son: 44 50 53 57 65 70 45 50 53 59 66 72 46 50 53 60 66 72 46.87)2 (46 59. peso en Kg.87)2 (88 59.

+ 6 400 + 7 744 = 221 595.Ac.083 56 0.5 Reemplazando este resultado en (1) se tiene: 60 X i2 60 2 i 1 2 60 221.133) n3 60 ( X 4 60.133)2 n4 ( X 5 60.2 88.la mayor precisión en este cálculo se obtiene con µ = 59. Ejemplo 4.47 109..el promedio de las desviaciones al cuadrado de los pesos de los alumnos respecto a su media aritmética es de 109.850 74.En el ejemplo 3.6 70. con los datos agrupados del Cuadro 2.133 kg.567 66.0 52.0 Marca Prop.933 83..283 51 0.)2. siguientes: Clase i 1 2 3 4 5 PESOS (Kg.2 60 Nota.250 34 0. Primera forma de cálculo: k 5 (Xi 2 i 1 ) 2 ni i 1 ( X i 60.8 5 0.133) 2 ni 60 N 2 2 2 1 ( X 1 60.5 60(59.87) 2 60 6.) LIi 44.8 61.000 60 1.2 LSi 52.4 79.1 se ha encontrado que la media aritmética es µ = 60.133) n1 ( X 2 60.542.8683333.6 Calcular la varianza de los pesos de los 60 alumnos de Estadística Básica 09-A FCE-UNAC.0 17 0.4 79.000 Solución.2 15 0.067 60 1. Interpretación.6 4 0.317 19 0.133) n2 ( X 3 60. Alum-nos alumnos alumnos alumnos clase Xi ni hi Ni Hi 48.317 57.133)2 n5 162 .0412 (Kg. Prop.0412 Kg.4 19 0.60 X i2 i 1 442 452 462 802 882 = 1 936 + 2 025 + 2 116 + …. Acum.6 70.595.7.8 61.

entonces: V (aX b) a 2V ( X ) 2 a2S X Demostración: n (Yi Y )2 2 SY V (Y ) i 1 n 1 ……….6 60.)2.2 60.)2.133)2 5 (83. Propiedades de la varianza.1369 (Kg.133) 19 (57. 223569. (2) 5 X i2 ni i 1 (48.133) 17 60 (74. (3) 163 .2)215 (66.1022 + 1075.2 a) La varianza de un conjunto de datos es mayor o igual que cero.7511 + 129.133) 15 (66..1369 (Kg.1369 (Kg.6)2 4 = 223 569. Otra forma de cálculo: k 5 X i2 ni 2 i 1 N 2 i 1 X i2 ni 60 60 2 N …………. b) Si a y b son números reales e Yi 2 SaX b aX i b.0667 + 585.1333333) 2 60 6608.28 Reemplazando este resultado en (2) se tiene: 5 X i2 ni 60 2 i 1 2 60 = 110.2 2 2 1 (48.0 60.28 60(60.4)219 (57.0)217 (74.el promedio de las desviaciones al cuadrado de los pesos de los alumnos respecto a su media aritmética es de 110.133)2 4 = (2615. S X ≥ 0.2133 60 Interpretación.)2.7378) / 60 = (6608.4 60.2133) / 60 = 110.8)2 5 (83.5555 + 2202.8 60.

con medias aritméticas de los subgrupos: x1 .05)2 250. .10)2 250. …. nk. Luego la varianza del nuevo ingreso de los trabajadores es: 2 SY2 = V(1.000 = 275.)2. tales k que i 1 ni n .05 X + 50) = (1.05 Xi + 50. 50 a cada trabajador. entonces : Y aX b [aX i b (aX 2 SY b)]2 i 1 a2 ( X i n 1 X )2 2 a 2V ( X ) a 2 S X 2 a2S X V (Y ) i 1 n 1 2 SaX 2 SaX b Entonces: Si b = 0. Donde: a = 1 y b = 100.10)2 S X = (1. x2 .625 (S/. 100 para cada trabajador.. entonces el nuevo ingreso de cada trabajador es Yi = 1. entonces: V (aX b) a 2V ( X ) 2 a2S X V (aX ) a 2V ( X ) 2 Si a = 0.10 X) = (1. Donde: a = 1.500 (S/.)2.10 y b = 0.000 = 302.7. Luego la varianza del nuevo ingreso de los trabajadores es: 2 SY2 = V(X + 100) = S X = 250.05)2 S X = (1.Sabemos que si a y b son números reales e Yi Reemplazando este resultado en (3) se tiene: n n aX i b. n2.. entonces: S b 2 SX V ( b) 0 b Si a =1. Luego la varianza del nuevo ingreso de los trabajadores es: 2 SY2 = V(1. entonces: V (X b) V ( X ) 2 SX 2 Ejemplo 4. entonces el nuevo ingreso de cada trabajador es: Yi = Xi + 100. Donde: a = 1.  10% para cada trabajador.)2.05 y b = 50. xk y varianzas 164 .000 (S/. Hallar la varianza de los ingresos si se producen los siguientes incrementos:  S/.)2.  5% más S/. c) Si se tiene k subgrupos (submuestras o estratos) de tamaños n1.000 (S/. entonces el nuevo ingreso de cada trabajador es Yi = 1.10 Xi.si la varianza del ingreso de los trabajadores es S X = 250.

así como la intravarianza e intervarianza. n 1 n 1 ni xi donde x i 1 n es la media aritmética ponderada de los subgrupos.Hombres 2.en el muestreo estratificado la variabilidad (varianza) total S2 se descompone en la suma de la variabilidad dentro de los estratos (intravarianza 2 Sw ) más la variabilidad entre los estratos (intervarianza Sb2 ).)2 xi (S/. el estudio de los ingresos de ambos grupos dio los siguientes resultados: SEXO Número ni Ingreso Medio Varianza Si2 (S/.) 1..en una muestra de 400 hombres y 600 mujeres.. grupos o rangos) se busca que la 2 intravarianza ( S w ) sea pequeña y la intervarianza ( Sb2 ) sea grande.000 250. Sk2 .Mujeres 400 600 360.000 Hallar la media aritmética y la varianza de los ingresos de ambos grupos juntos. Es decir: S2 2 Sw Sb2 K (ni 1) Si2  La intravarianza esta definida por: 2 Sw i 1 n 1 K ( xi  La intervarianza esta definida por: x )2 ni Sb2 i 1 n 1 Nota. entonces la varianza de la muestra de tamaño n esta dada por: K K (ni 1) Si2 S2 k i 1 i 1 ( xi x ) 2 ni .al construir estratos (clases..500 1.000 1. Observación. S2 . Ejemplo 4. .2 de los subgrupos: S12 .8. La media aritmética de los ingresos de ambos grupos es: 165 .

La intervarianza de los ingresos es: 2 ( xi Sb2 = i 1 x )2 ni n 1 ( x1 x )2 n1 ( x2 n 1 x ) 2 n2 (1. Se denota por: X o SX S Tanto para datos sin agrupar como para datos agrupados se define como la raíz cuadrada de la varianza (bien poblacional o muestral).200 La intravarianza de los ingresos es: 2 (ni 1) Si2 2 Sw i 1 n 1 = 2 (n1 1) S12 (n2 1) S2 n 1 399(360.)2.06 (S/. S2 2 Sw 4. 1. 000 999 = 60. 000 1.60 (S/.060.en la teoría del muestreo la desviación estándar recibe la denominación de error estándar.)2.060. 000 999 = 218.608. 000 1' 200. La varianza de los ingresos de ambos grupos es: Sb2 = 218.66 (S/.60 + 60. 000) 1.5 DESVIACIÓN ESTÁNDAR O DESVIACIÓN TÍPICA Mide el promedio de las desviaciones de los valores observados con respecto a la media aritmética.500 1.500) 600(1. 000 = 1.)2. 200) 2 (600) 999 60'000. 2 o S S2 Nota.668.608. 200) 2 (400) (1.2 ni xi x i 1 n n1 x1 n2 x2 n 400(1. 000) 599(250. 166 .06 = 278. 000 = S/.. 000) 999 218'390.

0412 (Kg. se ha determinado la varianza (para datos sin agrupar) de los pesos de los alumnos. Interpretación. siendo la misma σ2 = 109. Tanto para datos sin agrupar como para datos agrupados se define como: CV ( X ) X X 100 100 S 100 X para la población.. siendo la misma σ2 = 110.442 Kg. Nota.el promedio de las variaciones porcentuales de los pesos de los alumnos de Estadística Básica 09A-FCE-UNAC.44 % 59...87 Interpretación.87 y σ = 10. Luego el coeficiente de variación de los pesos de los alumnos es: CV ( X ) 100 10.1369 (Kg. (para datos sin agrupar) se ha determinado que µ = 59.en la teoría del muestreo el coeficiente de variación recibe la denominación de error relativo.1369 = 10.442 . Ejemplo 4. se ha determinado la varianza (para datos agrupados) de los pesos de los alumnos.el promedio de las desviaciones de los pesos de los alumnos respecto a su media aritmética es de 10.442 Kg.0412 = 10. Luego la desviación estándar será: 109. 167 .9..)2. Luego la desviación estándar será: 110.Ejemplo 4.6 COEFICIENTE DE VARIACIÓN Mide el promedio de las variaciones porcentuales de los valores observados respecto a la media aritmética.11 En el ejemplo de los pesos de los 60 alumnos de Estadística Básica 09A-FCEUNAC.5. Interpretación. Ejemplo 4. respecto a su media aritmética es del 17.en el ejemplo 4.100 =17.495 Kg.10.495 Kg.el promedio de las desviaciones de los pesos de los alumnos respecto a su media aritmética es de 10..en el ejemplo 4.44 %. 4..442 Kg. cv( X ) SX 100 X para la muestra.6.)2...

en la celda D73 escribir =D72-D7. al efectuar enter aparece 44(Ver figura 4. Luego el coeficiente de variación de las tallas de los alumnos es: CV ( X ) 100 10.el promedio de las variaciones porcentuales de los pesos de los alumnos de Estadística Básica 09A-FCE-UNAC. Para hallar el rango.45 %. en la celda D71 escribir =MAX(D3:D62) al hacer enter aparece 88 y para hallar el mínimo.. Otra forma de obtenerlos es con la sintaxis para cada estadígrafo.1). se debe utilizar los resultados de los cuatiles 1 y 3 calculados anteriormente en las celdas D66 y D68 respectivamente (ver 168 . Para hallar el rango intercuartílico (RIQ).495 Kg. escoger dentro de Seleccionar una categoría →Estadísticas → escoger estadígrafo y aparece ventana de diálogo en la que se indica los argumentos requeridos y se obtiene el resultado. desde la base de datos construida (datos sin agrupar) utilizando los programas.Ejemplo 4.12 En el ejemplo de los pesos de los 60 alumnos de Estadística Básica 09A-FCEUNAC. La sintaxis correspondiente es: MAX(Matriz) y MIN(Matriz) respectivamente. cuando en el programa se pide Matriz se sombrean estos o se escribe D3:D62. Para hallar el máximo de la variable peso. en la celda D72 escribir =MIN(D3:D62) al hacer enter aparece 44. que es la que utilizaremos.133 Interpretación. Una primera forma de obtener los estadígrafos es con la opción de funciones del Excel.133 y σ = 10.45 % 60. desde D3 hasta D62. respecto a su media aritmética es del 17.100 = 17. (para datos agrupados) se ha determinado que µ = 60. Cálculo de los estadígrafos de dispersión con los programas Veamos como se pueden obtener los estadígrafos de dispersión para la variable peso. En Excel: Con los datos de la variable peso de los 60 alumnos de estadística Básica 09-A en la columna D. Para calcular el rango necesitamos el valor máximo y el valor mínimo.495 .

en la celda D75 escribir =DESVPROM(D3:D62) al hacer enter aparece el resultado 9.44%. aparece 17. Para la variable peso.006.1).1 Medidas de Dispersión obtenidas con Excel 169 .1).1). Para calcular la desviación estándar muestral usar la sintaxis =DESVEST(Matriz) y para la desviación estándar poblacional usar =DESVESTP(Matriz).figura 3. En la celda D74 escribir =D68-D66. en la casilla D76 escribir =VARP(D3:D62) al hacer enter aparece el resultado 109.442 (ver Figura 4. Para calcular el coeficiente de variación se divide la desviación estándar de la celda D77 entre la media aritmética de la celda D63 así: en la casilla D78 escribir =D77/D63 al hacer enter y luego clic en %. Para hallar la varianza de la muestra usar la sintaxis =VAR(Matriz) y para la varianza de la población usar =VARP(Matriz). Para la variable peso.25 (Ver figura 4. Para calcular la desviación media (Excel obtiene con respecto a la media aritmética) usar la sintaxis: =DESVPROM(Matriz). al efectuar enter aparece 16.8).0412 (ver Figura 4. Para determinar la varianza de la variable peso. en la casilla D77 escribir =DESVESTP(D3:D62) al hacer enter aparece el resultado 10. Figura 4.

53 Variance 110.2).En Minitab: Estando en la base de datos Estadística Básica 09A. variance (varianza).4). escoger del menú Stat →Basic Statistics → Display Descriptive Statistics… aparece la ventana de diálogo Display Descriptive Statistics (vista en la Figura 3.59 Range 44. Hacer clic en OK y regresa a la ventana Display Descriptive Statistics. Para terminar hacer clic en OK y en la ventana de Session aparecen los resultados solicitados siguientes: Descriptive Statistics: peso Variable peso Total Count 60 Mean 59.75 170 .00 IQR 16. Figura 4.87 StDev 10. Standard deviation (desviación estándar) y Coefficient of variation (coeficiente de variación). En variables: seleccionar la variable peso de las variables que están a la izquierda. Hacer clic en el botón y aparece la ventana de diálogo Descriptive Satatistcs – Statistics (ver la Figura 4.89 CoefVar 17. Adicionalmente se ha solicitado mean (media) y N total (total de observaciones) ya que el Minitab hace cálculos muestrales para la varianza y se necesita reajustar este y otros cálculos.2 Selección de estadígrafos de dispersión en Minitab Escoger los estadígrafos de dispersión a calcular: Range (rango) Interquartile range (rango intercuartílico).

ya se puede calcular la desviación estándar Kg. 60 109. Adicionalmente se ha solicitado media ya que. Mínimo y Máximo. seleccionar Desviación típica. Varianza.44% (por ello solicitamos también la media aritmética). y se Figura 4. al igual que el Minitab. por lo que hay que hacer reconversiones a valores poblacionales. luego hacer clic en el botón muestra la ventana de diálogo Frecuencias: Estadísticos de la Figura 4.Se puede apreciar que los resultados obtenidos corresponden a cálculos muestrales. el SPSS hace cálculos muestrales para la varianza y se necesita reajustar este y otros cálculos. En SPSS: Estando en la base de datos Estadística Básica 09A. así la varianza será: N (Xi 2 i 1 )2 N ( N 1) S 2 N (50 1) 110. Amplitud (o Rango). 171 .0412 Kg2.442 Con este valor. En Variables: ingresar la variable peso. seguir la secuencia para obtener la tabla de frecuencias: Analizar → Estadísticos descriptivos → Frecuencias. Inmediatamente se abre la ventana de diálogo Frecuencias.3. y el coeficiente de variación 17.89 109.0412 = 10.3 Cálculo de estadígrafos de dispersión en SPSS En Dispersión. También se solicita cuartiles para calcular el RIQ.

44% (por ello solicitamos también la media aritmética). Para calcular el Rango. regresando a la ventana de diálogo Frecuencias y para terminar. Igualmente el RIQ = P75 – P25 = 67.00 57. escribir en la consola: > range(variable) al hacer enter se obtiene el valor mínimo y el máximo.75 – 51.0412 = 10. donde variable es un conjunto de datos cuantitativos (peso aquí). En R: Estando en la base de datos Estadística Básica 09A y habiendo attachado la misma. Para la variable peso. efectuar clic en Aceptar.00 = 16.Luego hacer clic en Continuar.75 Kg.00 67. > diff( range(variable)) al hacer enter se obtiene el rango (diferencia entre el valor máximo y el mínimo).889 109. Inmediatamente en el Visor de Resultados aparece: Estadísticos PESO (Kg) N Media Des v.530 110. 60 109.889 44 44 88 51. ya se puede calcular la desviación estándar Kg.87 10.75 Resultado de estadígrafos de dispersión en SPSS Al igual que en el Minitab se tiene que reajustar la varianza muestral así: N (Xi 2 i 1 )2 N ( N 1) S 2 N (50 1) 110. Varianza Rango Mínimo Máximo Percentiles Válidos Perdidos 25 50 75 60 0 59. para que reconozca las variables y sus valores.442 Con este valor. y el coeficiente de variación 17.0412 Kg2. se tiene: > range(peso) [1] 44 88 172 . típ.

para la variable peso se calcula así: > IQR(peso) [1] 16.0412 173 . escribir en la consola: > dm=sum(abs(peso-mean(peso)))/60 > dm [1] 9. La sintaxis para la varianza es var(variable) y para la desviación estándar sd(variable).25 Para obtener la Desviación media respecto a la media aritmética.881667 Tanto la varianza como la desviación estándar calculadas en R son muestrales. escribir en la consola: > dm=sum(abs(peso-median(peso)))/60 > dm [1] 8.5304 Al igual que en Minitab y SPSS se tiene que reajustar la varianza muestral así: > N=length(peso) >N [1] 60 > var=(N-1)*var(peso)/N > var [1] 109.> diff(range(peso)) [1] 44 Para calcular el Rango intercuartílico (RIQ) usar la sintaxis IQR(variable). debiéndose efectuar los mismos ajustes realizados en Minitab y en SPSS.8893 > sd(peso) [1] 10. Los cálculos para la variable peso son: > var(peso) [1] 110.006222 Si se quiere calcular la desviación media respecto a la mediana.

44% 44. CUADRO 4.0412 10.006 109. en un rectángulo (caja) se representan los cuartiles: en el extremo inferior el cuartil 1. POR PROGRAMA USADO ESTADÍGRAFO MANUAL Rango RIQ Desviación media Varianza Desviación estándar Coeficiente variación de 17. DE LA FCE-UNAC. que deben reajustarse.> sd=var^0.) DE LOS ALUMNOS DE ESTADÍSTICA BÁSICA 09A.1 se muestra el resumen de los estadígrafos de dispersión calculados.006 110.75 110.89 (a) 10.59 (a) SPSS 44 16.89 (a) 10.00 16.75 9.1RESUMEN DE LAS MEDIDAS DE DISPERSIÓN CALCULADAS PARA LOS PESOS (KG.5 > sd [1] 10.25 9. al extremo superior el cuartil 3 y entre ambos una línea divisoria para 174 .25 9.59 (a) R 44 16.0412 10.53 (a) 17.44228 > cv=sd/mean(peso)*100 > cv [1] 17.44% (a) Son resultados muestrales.7 DIAGRAMA DE CAJAS O BOXPLOT El diagrama de cajas y bigotes o boxplot es un gráfico sencillo de realizar y fue propuesto por Tukey (1977) para hacer el análisis exploratorio de datos de una variable cuantitativa usando principalmente los cuartiles .006 109.53 (a) 17.530 (a) 17.442 MINITAB 44.44207 En el Cuadro 4. Para su elaboración.75 110.442 EXCEL 44.00 16.59 (a) 17. 4.00 16.89 (a) 10.

. Hacer clic en el botón gráfico.4 Estructura del diagrama de cajas y bigotes (boxplot) Por lo general el boxplot se presenta rotado en 90º.5). En Minitab: Estando en la base de datos Estadística Básica 09A.5RIQ. por debajo de la parte inferior y por encima de la parte superior de los bigotes se colocan los valores extremos (outliers) con asteriscos. X2. máx (X1. pues concentra el 50% central de los valores observados. En este caso es: GRÁFICO 4.. Veamos la obtención del diagrama de cajas para la variable peso usando los programas Minitab. Figura 4. Simple (ver la Figura 4. SPSS y R. De la lista de variables del lado izquierdo seleccionar la variable peso e ingresarla en Graph variables:. X2.5RIQ. mín (X1. escoger del menú Graph →Boxplot → Simple → OK aparece la ventana de diálogo Boxplot – One Y. y en Title: poner el número y título del 175 .4. que la caja representa el RIQ.1 BOXPLOT DEL PESO DE LOS ALUMNOS DE ESTADÍSTICA BÁSICA 09-A. …. Así mismo. Xn)]. Es decir. …. tal como se indica en la figura 4. DE LA FCE-UNAC.1. De los extremos centrales de la caja se extienden los “bigotes” en la parte inferior hasta el máx[Q1 .representar el cuartil 2. Xn)] y en la parte superior hasta el min[Q3 + 1.

hacer clic en OK e inmediatamente aparece el boxplot (ver la figura 4.Para continuar hacer clic en OK y regresa a la ventana de Boxplot – One Y. Figura 4. Simple.6).5 Ventana de diálogo para definir el boxplot de peso en Minitab Figura 4.6 Diagrama de cajas y bigotes de la variable peso en Minitab 176 .

(Whiskers to = bigotes hasta: 44. (Q1) y el 25% de los alumnos con más peso se encuentra por encima de los 67. los cuartiles indican que el 25% de los alumnos con menos peso se encuentran por debajo de los 51 kg.5 y con las etiquetas de sexo como texto. También se puede obtener boxplot para hacer comparaciones entre una variable cuantitativa. Para ello.75 Kg. 88) y que no hay pesos extremos (outliers). (Q3).75 Kg. hacer clic en By variables (ver la figura 4. La lectura de los datos que allí aparecen. con alguna variable categórica. como puede ser en este caso ver el comportamiento del peso de los alumnos por sexo (hombres y mujeres). Así mismo.6).Ubicándose dentro de la caja con el puntero del mouse. hacer clic en el botón y aparece la ventana de diálogo Boxplot – Multiple Graphs. (Q3). permite describir que son 60 alumnos (N = 60). aparecen automáticamente los cuartiles (ver la parte inferior de la figura 4. o menos (median = mediana = 57 Kg. por sexo 177 . estando en la ventana de diálogo de la figura 4. cuyos pesos fluctúan entre 44 y 88 Kg. Figura 4. También que el 50% de los alumnos pesa 57 Kg.7 Efectuando Gráfico Múltiple de Boxplot para peso.) y que el 50% central de los pesos de los alumnos está entre 51 (Q1) y 67.7).

hacer clic en OK e inmediatamente aparece el Gráfico 4. POR SEXO 90 Hombre Mujer 80 Peso (Kg.2 boxplot para cada sexo (ver la figura 4. el boxplot para hombres y mujeres (el que se ha escogido aquí). Para continuar hacer clic en OK y regresa a la ventana de la figura 4. nos indica que se trata de las alumnas 19 con 63 Kg. de peso y la alumna 26 con 66 Kg. Haciendo clic con el puntero del mouse en los asteriscos.Seleccionar la variable sexo (con las etiquetas en texto) en By variables with groups in separate panels: si se desea en un solo gráfico. 178 .8). Simple. Aquí se puede apreciar que las mujeres pesan mucho menos que los hombres. y si se desea dos gráficos separados de boxplot uno para hombres y otro para mujeres selecciona la variable sexo en By variables with groups on separate graphs:.5 de Boxplot – One Y.8 Boxplot del peso para hombres y mujeres en Minitab Se puede hacer las comparaciones pertinentes y enriquecer el análisis de la variable cuantitativa comparada para algunas variables categóricas consideradas en el estudio. GRÁ FICO 4. pero en paneles separados.) 70 60 50 40 Panel variable: sexo Figura 4.2 BOXPLOT DEL PESO DE LOS A LUMNOS DE ESTA DÍSTICA BÁ SICA 09-A FCE-UNA C. no obstante dentro de ellas hay dos alumnas cuyos pesos sobresalen del resto (outliers).

10. Figura 4. seguir la secuencia: Analizar → Estadísticos descriptivos → Explorar y aparece la ventana de la Figura 4. 90 80 70 60 50 40 PESO (Kg) Figura 4. En Mostrar esta seleccionado Ambos.9 Ventana de diálogo Explorar para definir el boxplot de peso en SPSS En Dependientes: ingresar la variable peso.En SPSS: Estando en la base de datos Estadística Básica 09A.10 Diagrama de cajas y bigotes de la variable peso en SPSS 179 .9. ya que saca Estadísticos (descriptivos) y Gráficos (tiene seleccionado el boxplot) por lo que sólo queda hacer clic en Aceptar y aparece el Boxplot de la figura 4.

escribir en la consola: boxplot (variable). col="yellow".)") La representación del boxplot se muestra en la Figura 4. para que reconozca las variables y sus valores. en Factores: se ingresa la variable sexo y para finalizar hacer clic en Aceptar e inmediatamente aparece el resultado de la Figura 4. Para graficar el Boxplot.9. 90 80 PESO (Kg) 70 26 19 60 50 40 Hombre Mujer SEXO Figura 4. donde variable es un conjunto de datos cuantitativos (peso aquí). El diagrama de cajas y bigotes para la variable peso se obtiene así: > boxplot(peso.11. en la ventana de diálogo Explorar de la figura 4.Si se desea un gráfico de boxplot para hombres y mujeres en un solo gráfico.12. ylab="Peso (Kg. 180 . entonces.11 Boxplot del peso para hombres y mujeres en SPSS En R: Estando en la base de datos Estadística Básica 09A y habiendo attachado la misma. main="BOXPLOT PESO".

xlab="Sexo". debiendo escogerse aquella que este disponible o tenga una mejor presentación.12 Diagrama de cajas y bigotes de la variable peso en R Para obtener el boxplot de hombres y mujeres en un solo gráfico escribir: > plot(sex.13 En los tres programas se obtienen las representaciones del diagrama de cajas. quedando en potestad del investigador escoger la misma. 181 . peso.Figura 4.)". main="BOXPLOT PESO DE LOS ALUMNOS") La representación se muestra en la Figura 4.ylab="Peso (Kg.

concentrando por debajo de este valor a la mitad de las observaciones y la otra mitad por encima de dicho valor. Por otro lado. muchas veces se recurre a la distribución normal de probabilidades.13 Boxplot del peso para hombres y mujeres en R 4.8 MEDIDAS DE FORMA DE LA DISTRIBUCIÓN Cuando se quiere caracterizar mejor la distribución de frecuencias. la poca o fuerte concentración de observaciones entorno a la media se va estudiar con las medidas de curtosis o apuntamiento. que es una distribución simétrica respecto a su media aritmética.Figura 4. 182 . Para saber si la concentración de observaciones por debajo de la media es menor o mayor a la mitad de las mismas se usan las medidas de asimetría.

3 Af Donde σ es la desviación estándar poblacional. diremos que una distribución es simétrica si existe el mismo número de valores a ambos lados de dicho eje. equidistantes de x dos a dos.MEDIDAS DE ASIMETRÍA Según Pérez (2002) “Las medidas de asimetría tienen como finalidad el elaborar un indicador que permita establecer el grado de simetría (o asimetría) que presenta una distribución sin necesidad de llevar a cabo su representación gráfica. la mediana y la moda es: X Mo 3X Me . y tales que cada par de valores equidistantes de x tengan la misma frecuencia. Si Ap > 0. Karl Pearson encontró que la relación empírica entre la media aritmética. la misma que es utilizada en su coeficiente: Ap X Mo S 3 X S Me Donde S es la desviación estándar. la distribución es asimétrica positiva o asimétrica a la derecha. para datos sin agrupar. las distribuciones serán asimétricas” a) Coeficiente de asimetría de Pearson.El coeficiente de asimetría propuesto por R. Si Ap < 0. Si trazamos una perpendicular al eje de las abscisas por x y tomamos esta perpendicular como eje de simetría.Para distribuciones unimodales y ligeramente asimétricas. la distribución es simétrica. Si Af = 0. la distribución es asimétrica negativa o asimétrica a la izquierda. En caso contrario. 183 . Supongamos hemos representado gráficamente una distribución de frecuencias. la distribución es simétrica.A. Fisher es: Af 1 n 1 n n Xi i 1 3 k X 3 . Si Ap = 0. Xi i 1 3 X ni . para datos agrupados. la distribución es asimétrica negativa o asimétrica a la izquierda. Si Af < 0. la distribución es asimétrica positiva o asimétrica a la derecha. b) Coeficiente de asimetría de Fisher. Si Af > 0.

Me = 57 y σ = 10.5 69 80 50 53 57 65 70 88 Hallar los coeficientes de asimetría de Pearson y el de Fisher. de los 60 alumnos de Estadística Básica 09-A.083 56 0. de los pesos de los 60 alumnos de Estadística Básica 09-A FCE-UNAC. peso en Kg. El coeficiente de asimetría de Fisher es: 1 n n Xi i 1 3 X 3 Af 1 (38558.000 184 .0 52.868 57 10.8 5 0. Acum. los pesos tienen distribución asimétrica positiva.850 74.283 51 0.4 79.7. Alum-nos alumnos alumnos alumnos clase Xi ni hi Ni Hi 48.Ac.442 = 0.6 70.Ejemplo 4. Luego el coeficiente de asimetría de Pearson es: Ap 3 X S Me 3 59. cuyos pesos ordenados son: 44 50 53 57 65 70 45 50 53 59 66 72 46 50 53 60 66 72 46.56) 60 (10.6 4 0.8 61.13 Con los datos sin agrupar del Cuadro 2.5 50. Solución.6 70.868.0 17 0.6.14 Hallar los coeficientes de asimetría de Pearson y el de Fisher.317 19 0.4 19 0.442 Kg.8 61.56 > 0. siguientes: Clase i 1 2 3 4 5 PESOS (Kg.250 34 0.000 60 1.2 15 0.) LIi 44.2 LSi 52.4 79.442)3 = 0.933 83.317 57.82 > 0. con los datos agrupados del Cuadro 2. Ejemplo 4.067 60 1.0 Marca Prop.2 88.6 55 64. Prop.567 66.En ejemplos anteriores se obtuvo µ = 59. entonces los pesos tienen distribución asimétrica positiva.5 54 60 67 75 47 51 55 63 67 75 48 51 55 63 68 77 48 52 55 64 68 80 49 52 55 64 68 80 49 52.

Solución.y Otros (2007) “La curtosis cuantifica la cantidad de observaciones que se agrupan alrededor de las medidas de tendencia central de la distribución de los datos”. la distribución es platicúrtica (achatada). Si K = 0. Donde σ es la desviación estándar poblacional. X ni 4 4 Xi i 1 K 3 .6 (ver ejemplo 4. Me = 59.253 y σ = 10.495 Kg.En ejemplos anteriores se obtuvo µ = 60.253 10. MEDIDAS DE CURTOSIS O APUNTAMIENTO Según Chue J.13). entonces los pesos tienen distribución asimétrica positiva. Ejemplo 4.495 = 0. para datos sin agrupar. hallar el coeficiente de curtosis. la distribución es mesocúrtica (apuntamiento normal). El coeficiente de asimetría de Fisher es: 1 n n Xi i 1 3 X 3 ni Af 1 (39828. Si K < 0. Si K > 0. La fórmula de cálculo de la curtosis es: K 1 n 1 n n Xi i 1 4 k X 4 3 .En ejemplos anteriores se obtuvo µ = 59.133.15 Con los datos sin agrupar del Cuadro 2. para datos agrupados.133 59.25) 60 (10. de los 60 alumnos de Estadística Básica 09-A. 185 .442 Kg.868 y σ = 10. Luego el coeficiente de asimetría de Pearson es: Ap 3 X S Me 3 60. la distribución es leptocúrtica (puntiaguda). peso en Kg.57 > 0. los pesos tienen distribución asimétrica positiva.25 > 0. Solución.495)3 = 0.

81 60 3 (10. entonces la distribución es platicúrtica o achatada.41 < 0.495)3 3 = -0. Luego el coeficiente de curtosis es: 1 60 5 Xi i 1 60. Una manera de obtener los estadígrafos de forma es con la opción de funciones del Excel. desde la base de datos construida (datos sin agrupar) utilizando los programas.868 i 1 4 4 K 1762855. En Excel: Con los datos de la variable peso de los 60 alumnos de estadística Básica 09-A en la columna D. escoger dentro de Seleccionar una categoría →Estadísticas → escoger estadígrafo y aparece ventana de diálogo en la que se indica los argumentos requeridos y se obtiene el resultado.Luego el coeficiente de curotosis es: 1 60 60 X i 59. cuando en el programa se pide Matriz se sombrean estos o se escribe D3:D62. que es la que utilizaremos. Otra manera de obtenerlos es con la sintaxis para el estadígrafo. por lo tanto.16 Hallar el coeficiente de curtosis de los pesos de los 60 alumnos de Estadística Básica 09-A FCE-UNAC.21 60 3 (10.7.133 y σ = 10.133 ni 4 4 K 1825739. Solución.ASIMETRIA(Matriz) =CURTOSIS(Matriz). Cálculo de las medidas de forma con los programas Veamos como se pueden obtener los estadígrafos de forma para la variable peso.En ejemplos anteriores se obtuvo µ = 60.53 < 0.442) 4 3 = -0. desde D3 hasta D62.14.495 Kg. y para calcular la curtosis usar 186 . Ejemplo 4. con los datos agrupados del Cuadro 2. la distribución es platicúrtica o achatada. dados en el ejemplo 4. Para la asimetría usar la sintaxis =COEFICIENTE.

187 .14 Cálculo de la asimetría y curtosis en Excel En Minitab: Estando en la base de datos Estadística Básica 09A. Escoger Skewness (asimetría) y Kurtosis. Entonces los pesos tienen distribución asimétrica positiva.2).47 Resultados idénticos a los obtenidos en Excel. En variables: seleccionar la variable peso de las variables que están a la izquierda. regresa a la ventana Display Descriptive Statistics. hacer nuevamente clic en OK y aparecen los resultados siguientes: Descriptive Statistics: peso Variable peso Total Count 60 Skewness 0.4). Al hacer clic en OK. Hacer clic en el botón y aparece la ventana de diálogo Descriptive Satatistcs – Statistics (ver la Figura 4. Así mismo.14).Para el peso.47 (ver Figura 4. en la casilla D80 escribir =CURTOSIS(D3:62) al hacer enter aparece el resultado -0.58 Kurtosis -0.ASIMETRIA(D3:D62) al hacer enter aparece el resultado 0. Entonces los pesos tienen distribución platicúrtica o achatada. Figura 4. escoger del menú Stat →Basic Statistics → Display Descriptive Statistics… aparece la ventana de diálogo Display Descriptive Statistics (vista en la Figura 3.14). en la casilla D79 escribir =COEFICIENTE.58 (ver Figura 4.

En Variables: ingresar la variable peso. cargar paquete y aparece una lista. para calcular los estadígrafos de forma. efectuar clic en Aceptar. Luego. dar doble clic en fBasics. para que reconozca las variables y sus valores. Inmediatamente se abre la ventana de diálogo Frecuencias. seguir la secuencia para obtener la tabla de frecuencias: Analizar → Estadísticos descriptivos → Frecuencias.3). por ejemplo) aparece una lista de Packages (paquetes) buscar fBasics y hacer doble clic para que se instale en la pc. seleccionar Asimetría y Curtosis. Inmediatamente en el Visor de Resultados aparece: Estadísticos PESO (Kg) N Asimetría Error típ.579 .608 Resultado de estadígrafos de forma en SPSS Al igual que en el Excel y el Minitab se tiene el mismo resultado. desde el menú escoger en Paquetes. En el menú del R escoger Paquetes. 188 . de asimetría Curtosis Error típ. regresando a la ventana de diálogo Frecuencias y para terminar. Arriaza y Otros (2008) recomiendan en el Apéndice B “Medidas de forma. sólo hay que cargarlo. de curtosis Válidos Perdidos y se 60 0 . En Distribución. primero instalar el paquete fBasics. escoger un país (Australia. luego hacer clic en el botón muestra la ventana de diálogo Frecuencias: Estadísticos (ver la Figura 4. J. donde variable es un conjunto de datos cuantitativos (peso aquí). Luego hacer clic en Continuar.469 . luego Instalar paquetes. En R: Estando en la base de datos Estadística Básica 09A y habiendo attachado la misma. Si el fBasics esta instalado.En SPSS: Estando en la base de datos Estadística Básica 09A. Por ello. con el paquete fBasics del R”.309 -.

que la distribución de la variable peso es asimétrica positiva y platicúrtica. es decir.550345 attr(. escribir en la consola: > skewness(variable) al hacer enter se obtiene el resultado. 189 .6106151 attr(. escribir en la consola: > kurtosis(variable) al hacer enter se obtiene el resultado. Las medidas de forma de la variable peso se obtienen así: > skewness(peso) [1] 0. Para calcular la Curtosis."method") [1] "moment" > kurtosis(peso) [1] -0."method") [1] "excess" Cuyos resultados son parecidos a los obtenidos con los otros programas.Para calcular la Asimetría.

para lo cual es necesario explicar el comportamiento de una variable dependiente o explicada (denotada por Y) mediante una o más variables independientes o explicativas (denotadas por X‟s) basados en fundamentos teóricos del fenómeno que se estudia.5 Introducción. Diagrama de dispersión. 5.3 5. Regresión lineal simple. así como la medición de la relación entre las variables usando la covarianza y el coeficiente de correlación. vemos que en economía se busca explicar la demanda de los bienes y servicios en función de los precios de los mismos.4 5.Capítulo 5. Covarianza y coeficiente de correlación. En el presente capítulo se busca establecer algunas formas sencillas de establecer la relación entre las variables construyendo los diagramas de dispersión delos datos. CORRELACIÓN Y REGRESIÓN SIMPLE “Las cifras no mienten. Igualmente. basados en la información observada sobre la producción de un bien o servicio a través del tiempo. También se presenta la determinación de algunos modelos de regresión lineal simple entre dos variables y los de series de tiempo que permitan hacer pronósticos en situaciones de incertidumbre. 190 . Así. Coeficiente de determinación. tratamos de predecir las cantidades a producir en el futuro.2 5.1 5.1 INTRODUCCIÓN Uno de los propósitos de la estadística es efectuar predicciones al futuro. pero los mentirosos también usan cifras” Anónimo CONTENIDO 5.

Yi) los mismos que aparecen como puntos en el plano cartesiano y dan una idea del tipo de relación funcional matemática para las variables. Hacer clic con el botón derecho sobre los puntos del plano y seleccionar agregar línea de tendencia y aparece una ventana de diálogo. Gráficos.5 212 14.0 183 17. acompañados por alguna función (recta. Minitab.0 238 12.2 DIAGRAMA DE DISPERSIÓN Es la representación en el plano cartesiano de los valores que toma la variable dependiente Y conjuntamente con los valores que toma la variable independiente X.5 276 8. hoja de parábola. Es decir. Al hacer clic en Aceptar.5. etc. Es un gráfico recomendado para establecer el tipo de asociación entre las variables (si es directa o inversa).0 250 10. Solución.0 190 16.5 156 20. En Insertar. que se representan las parejas ordenadas (Xi.) a la que se ajustan dichos datos. En Excel: En una hoja de Excel ingresar los valores de X e Y en las columna A y B respectivamente. aparecen los puntos del diagrama de dispersión. Ejemplo 5. Los datos son: X Y 6. SPSS y R para realizar el diagrama de dispersión. tal como se muestra en la Figura 5. Sombrear la variable y los datos.1 Una compañía productora de muñecas quiere establecer la relación entre las variables X = precio de las muñecas ($) e Y = cantidad de muñecas vendidas. así como el tipo de relación funcional entre las mismas.1.Vamos a utilizar los programas Excel. escoger XY (Dispersión) y el recuadro Dispersión sólo con marcadores.0 125 Efectuar el diagrama de dispersión. Escoger el tipo (automáticamente aparece 191 .

lineal.1 Definiendo el diagrama de dispersión en Excel Figura 5. Al hacer clic en Cerrar se muestra el diagrama de dispersión y la línea de tendencia de la Figura 5.2 Figura 5.2 Diagrama de dispersión de la cantidad y precio en Excel En Minitab: 192 . que es la que interesa en este caso).

escoger With Regression y hacer clic en OK.5 10.3.4 Diagrama de dispersión de la cantidad y precio en Minitab En SPSS: 193 . Se muestra la ventana de diálogo de la Figura 5.0 7.0 17.0 12. del menú escoger Graph. Scatterplot.5 20.4. aparece la ventana de diálogo Scatterplots.3 Definiendo el diagrama de dispersión en Minitab En Y variables seleccionar Cantidad y en X variables Precio.0 Figura 5. Scatterplot of Y = Cantidad vs X = Precio 280 260 240 Y = Cantidad 220 200 180 160 140 120 5. Al efectuar clic en OK se muestra el diagrama de dispersión con la línea de regresión de la Figura 5.Con los datos de la variable precio (X) y cantidad (Y) en el Worksheet.5 X = Precio 15. Figura 5.

tal como se muestra en la Figura 5. del menú escoger Gráficos. 194 . Para finalizar hacer clic en Aceptar y aparece el diagrama de dispresión de la Figura 5.5.5 Creando el diagrama de dispersión en SPSS De la lista de variables arrastrar primero la variable dependiente (Cntidad) en el primer recuadro y luego la variable independiente (precio) en el siguiente. aparece la ventana de diálogo Crear diagrama de dispersión de la Figura 5.6.Con los datos de la variable precio (X) y cantidad (Y) en el Editor de datos SPSS. Diagrama de dispersión. Figura 5.5. Interactivos.

125) A continuación utilizar la función plot para definir el diagrama de dispersión. xlab es la etiqueta del eje X e ylab la etiqueta del eje Y. main="Diagrama de dispersión de Precios y Cantidad") Donde: X es la variable independiente e Y la variable dependiente. 195 . xlab="PRECIO". 12. 17. 00 PRECIO Figura 5. así: > plot(X.0. 16. 00 20. 238.5. 00 16. 156. 250.0 0 12.5. 190. main es para ponerle título al gráfico. 212. 20.0) > Y=c(276.5. Y.280   240  CANT IDAD  200   160   120 8. 14.0. 10.0. 8. por los vectores X e Y respectivamente siguientes: > X=c(6. 183.6 Diagrama de dispersión de la cantidad y precio en SPSS En R: Definir los valores de las variables Precio y Cantidad. El resultado aparece en la Figura 5. ylab="CANTIDAD".7.0.

Se calcula como: 1 n n Cov( X . Y ) Xi i 1 X Yi Y 1 SPXY n 196 . COVARIANZA. denotada por Cov (X.La covarianza entre las variables X e Y. mide el promedio de las discrepancias conjuntas del producto de las desviaciones de las variables X e Y con respecto a sus respectivas medias.Figura 5.3 COVARIANZA Y COEFICIENTE DE CORRELACIÓN Los indicadores del grado de asociación lineal entre dos variables son la covarianza y el coeficiente de correlación. Y).7 Diagrama de dispersión de la cantidad y precio en R 5.

Y). mide el grado de asociación lineal entre las variables en estudio. es decir. si X disminuye entonces Y aumenta. y r ( X . Así. para la población. para la muestra. surge el coeficiente de correlación lineal de Pearson que a continuación se explica. mientras que si el signo es negativo. Cuanto más cercano a -1 o a 1 se encuentra es más fuerte la asociación lineal entre las variables X e Y. Y ) n 1 S X SY n SPXY .Y ) r Cov( X . calculada así: n n SPXY i 1 Xi X Yi Y i 1 X iYi n X Y La covarianza tiene el inconveniente de las unidades de medida de las variables. entonces Y también aumenta o si uno disminuye el otro también disminuye.Y ) Cov( X . denotada por ρ (X. SCX SCY Donde: n 2 n n SCX i 1 Xi X X i2 n X 2 y SCY i 1 i 1 Yi Y 2 n Yi 2 nY 2 i 1 El coeficiente de correlación toma valores entre -1 y 1.Donde SPXY representa la Suma de Productos de las desviaciones de X e Y con respecto a sus medias. Como solución al inconveniente planteado en el párrafo anterior. 197 . entonces Y disminuye y viceversa. Se calcula así: ( X . y cercano a 0 indica que la asociación entre la variable es muy baja o que no existe relación entre X e Y. que si X aumenta. COEFICIENTE DE CORRELACIÓN. ya que proporciona una idea de la discrepancia conjunta de las variables en estudio.El coeficiente de correlación lineal entre las variables X e Y. por ello lo fundamental de la covarianza es el signo. Y ) X Y . indica una variación inversa. que si X aumenta. es decir. si el signo es positivo indica una variación directa entre los valores de la variable.

..75 n SCX i 1 X i2 n X 2 1520.1..0)(125) 19.5 156 20. 642 n SPXY i 1 X iYi n X Y 19. Y ) SPXY n 1649.5)(276) (8. 649. (20.814 n SCY i 1 Yi 2 nY 2 349. (156) 2 (125) 2 349. i 1 Yi 1630 .Ejemplo 5.0)(250) .0 125 Cálculos necesarios: 8 8 n = 8.. i 1 X i 104.. Los datos son: X Y 6.75 8(13.0625)2 155.875 8 206. Solución.7188 8 Yi 2 i 1 (276) 2 (250) 2 .2 Para los datos del ejemplo 5.0) 2 1. 701.5 8 X iYi i 1 (6. 642 8(13. calcular e interpretar la covarianza y el coeficiente de correlación lineal simple entre X e Y..5 212 14. (17.0625 .5) 2 (20.5) 2 (8.814 8(203.2344 198 . Y 203.0) 2 .0 238 12.0 183 17.75)2 17..75 8 X i2 i 1 (6.520. X 13.0625)(203.Las variables X = precio de las muñecas ($) e Y = cantidad vendida.5 ...0 190 16.75) 1.5 276 8.0 250 10.875 Luego: a) Cov( X .

6 0.88 -206.0 12.b) r SPXY SCX SCY 1.8 -47.89 -60. nos indican que existe una alta relación inversa entre los precios de las muñecas y las cantidades vendidas.95 -211.3 46.8 Media ( Xi -6.1 -0.0 13.994 Interpretación.64 -12.33 -1649.1 -3.8 SPXY = COV(X.7188 17..3 8. Y) = En el eje de las X‟s se ha representado ( X i X ) y en el eje de las Y‟s (Yi Y ) . 199 .La covarianza negativa y el coeficiente de correlación cercano a -1. A continuación ilustramos los cálculos de la covarianza realizados en Excel y su gráfico de dispersión correspondiente.1 Media Y = Cantidad 276 250 238 212 190 183 156 125 203.5 0.5 14.0 10.89 -4.0 16.9 4.14 -104.9 2. 701.3 34.0 17.4 6.6 -5.14 -234.89 -546.9 X) (Yi Y) ( Xi X ) (Yi -474. 649.8 -20.5 8.8 -78. X = Precio 6.5 20.2344 Y) 72.3 -13.875 155.

es una función del precio de las mismas (X). es decir buscando que todos los puntos caigan sobre la recta y que la varianza de estos errores sea mínima. se puede apreciar que no todos los puntos caen sobre la recta postulada. la misma que se traduce en: n n Minimizar i 1 ei2 i 1 Yi a bX i 2 200 .4 REGRESIÓN LINEAL SIMPLE Es el proceso que consiste en poner en relación a una variable dependiente (Y) en función de otra independiente (X). Es decir. se postula que los errores promedien cero. basados en una relación de causalidad para el fenómeno en estudio. en el ejemplo 5. llamada también variable explicativa o predictora. Donde a y b son los coeficientes de regresión.5. Para poder determinar los valores de a y de b. Método de los Mínimos Cuadrados Ordinarios Es un método de aproximación a los valores verdaderos de a y de b.1 vemos que las cantidad demandada de muñecas (Y). Así. La relación funcional a la que se postula es la ecuación de una recta. por lo tanto. que Y = f(X). En el diagrama de dispersión obtenido antes. siendo b la pendiente de la recta y es negativa porque recoge el efecto de la relación inversa entre el precio de las muñecas y la cantidad demandada. mediante la ecuación de una recta. buscando minimizar la varianza de los errores. se postula que: Yi = a + bXi. así el modelo queda como: Yi = a + bXi + ei Ahora el problema se reduce a encontrar los valores de a y de b que permitan hacer pronósticos de Y asumiendo determinados valores de X. por lo que es necesario agregarle al modelo una componente de error.. surgiendo así el método de los mínimos cuadrados ordinarios.

así: n ei2 i 1 n a n 2 i 1 Yi a bX i ( 1) 0 ei2 i 1 n b 2 i 1 Yi a bX i ( X i ) 0 Resultado de igualar a cero y aplicar el operador sumatoria.´ decir que si X se incrementa en una unidad. surgen las denominadas Ecuaciones normales siguientes: n n na b i 1 Xi i 1 Yi ……………. (1) n n n a i 1 Xi b i 1 X i2 i 1 X iYi ……. ˆ ˆ yb Interpretación de a ˆ ˆ la pendiente de la recta. si X X 1 ˆ b Y . quiere ˆ unidades. Cabe resaltar que el símbolo ˆ sobre a y sobre b indica que son valores estimados obtenidos con la información muestral y son una buena aproximación hacia a y b en la estadística inferencial. entonces en b Al ser b Y .Siendo la suma de los errores al cuadrado función de los parámetros a y b.. se tiene que tomar derivadas parciales con respecto a dichos parámetros e igualar a cero. entonces Y se incrementa en b 201 . (2) Cuyas soluciones algebraicas son: n n ˆ b X iYi i 1 n nXY i 1 Xi n X Yi Y Xi X 2 X i 1 2 i nX 2 i 1 SPXY .. SCX y ˆX ˆ Y b a Fórmulas de cálculo para los valores de a y de b en regresión simple.

a) Para las variables X = precio de las muñecas ($) e Y = cantidad vendida. 649. 5. Ejemplo 5.0625) 342. o sea: 100r2 %.994)2 = 0.15 r2 = (0.0625)2 155.875 155.ˆ representa el intercepto con el eje Y. así: n SPXY i 1 X iYi n X Y 19.5 COEFICIENTE DE DETERMINACIÓN (R2) El coeficiente de determinación mide el porcentaje de explicación de la variabilidad de la variable dependiente Y.875 n SCX i 1 X i2 n X 2 1520. 642 8(13.10.7188 n SCY i 1 Yi 2 nY 2 349.75)2 17.5 Luego: ˆ b SPXY SCX 1649. En la práctica se aproxima (estima) con el coeficiente de correlación al cuadrado multiplicado por 100.988 ≡ 98. Solución.1.75) 1.75 ( 1. cuando X se aproxima cero y en Por otro lado a algunos casos no tiene mayor sentido.814 8(203.0625)(203.085)(13.7188 . en la solución del ejemplo 5. 701. y b) determinar la cantidad demandada de muñecas cuando el precio sea de $ 15.2 tenemos los cálculos que necesitamos.8% 202 .5952 ˆX ˆ Y b a 203. se pide: a) calcular e interpretar los coeficientes de regresión y el coeficiente de determinación entre X e Y. que es debido a la regresión (explicada por la variable independiente X) y el resto que se queda sin explicar se atribuye al error.75 8(13.3 Para los datos del ejemplo 5.

Sombrear la variable y los datos. r2 = 0.15 10.15 10. por cada dólar que disminuye el precio de las muñecas.10. indica que la demanda tope bordeará las 342 muñecas.8. Veamos como obtener los indicadores del modelo de regresión usando los programas Excel. En Excel: En una hoja de Excel ingresar los valores de X e Y en las columna A y B respectivamente. Minitaab.595(15) 183. que el precio de las muñecas ajusta muy bien la cantidad demandada de éstas.- ˆ = .595 X i Interpretación. Es decir.La ecuación de regresión simple queda establecido como: Yi ˆX ˆ b a i 342.2 = 183 muñecas. seleccionar Regresión. con el precio de a las mismas alrededor de cero dólares.8% de la variabilidad de la demanda de muñecas es explicado por el precio de estas. En Datos. y aparece la ventana de diálogo Regresión de la Figura 5. reemplazamos en la ecuación de regresión de la parte a).8%. se espera vender 183 muñecas al precio de $15.15.15 10. ˆ = 342. b la cantidad demandada disminuye en casi 11 muñecas y viceversa.595 significa que por cada dólar de incremento en el precio de la muñecas.595 X i 342. indica que 98. SPSS y R. 203 . escoger Análisis de datos y en Funciones para análisis. la demanda se incrementa en cerca de 11 muñecas. Entonces. así: Yi 342.988 ≡ 98. b) Para determinar la cantidad de muñecas demandadas a un precio X = $15.

el Resumen muestra una serie de resultados de la estadística inferencial aplicados a la regresión como es el Análisis de Varianza. Rango X de entrada: $A41:$A$9 y marcar el recuadro Rótulos (para indicar los nombres de las variabes). 204 . A partir de la celda A12.993746364. que para el caso están sombreados y son: Coeficiente de correlación = r = 0.Figura 5. Precio = b Además. También se puede escoger obtener los resultados En una hoja nueva: (precisar la hoja en el recuadro) o En un libro nuevo (el programa lo crea). indicar el Rango Y de entrada: $B$1:$B$9. y Coeficiente para X = 0. aquí a partir de la celda A12. seleccionamos Rango de salida: indicándole donde queremos que salga.1501104.987531836. aparece el Resumen de los cálculos de regresión.9. escoger donde queremos que aparezcan los resultados de la regresión.595223376. Coeficiente de intercepción = a ˆ = -10. intervalos de confianza y pruebas estadísticas para los coeficientes de regresión.8 Aplicando Regresión en Excel En Entrada. Para terminar hacer clic en Aceptar y se obtiene los resultados de la Figura 5. En Opciones de salida. Coeficiente de determinación R2 = ˆ = 342.

10 Aplicando Regresión en Minitab 205 .9 Resultado de la Regresión de cantidad y precio de muñecas en Excel En Minitab: Con los datos de la variable precio (X) y cantidad (Y) en el Worksheet. y aparece la ventana de diálogo Regression de la Figura 5. del menú escoger Stat.10.Figura 5. luego Regression y nuevamente la opción Regression. Figura 5.

23 P 0.8% R-Sq(adj) = 98. En SPSS: Con los datos de las variables precio (X) y cantidad (Y) definidos e ingresados en el editor de datos del SPSS.06500 Coef 342.6 X = Precio Predictor Constant X = Precio S = 6. 206 .06 -21. del menú seleccionar Analizar → Regresión → Lineal e inmediatamente aparece la ventana de diálogo de la Figura5.000 0.000 R-Sq = 98. Inmediatamente en la ventana de Session del Minitab aparecen los resultados siguientes: Regression Analysis: Y = Cantidad versus X = Precio The regression equation is Y = Cantidad = 342 . Para terminar hacer clic en OK. los coeficientes de regresión y el R-cuadrado obtenidos con el Minitab.5952 SE Coef 6. Una vez ingresadas las variables.80 P 0. hacer clic en Aceptar y aparecen los resultados mostrados después de la Figura 5. De la lista de variables del lado izquierdo.11. seleccionar la variable CANTIDAD e ingresarla en el recuadro Dependiente:.150 -10. del mismo modo seleccionar la variable PRECIO e ingresarla en el recuadro Independientes:.000 Se puede apreciar los mismos resultados obtenidos antes.4860 T 51.10.5% Analysis of Variance Source Regression Residual Error Total DF 1 6 7 SS 17481 221 17702 MS 17481 37 F 475. seleccionar la variable Y = cantidad e ingresarla en Response: (variable de respuesta o dependiente) y en Predictors: seleccionar X = Precio.701 0. la ecuación de regresión.11.De la lista de variables del lado izquierdo. es decir.

de la estimación 6.059 -21. Variable dependiente: CANTIDAD 207 .000 . mientras que en los Coeficientes se presenta la constante ˆ = -10.150 6. Variables predictoras : (Cons tante).994 Modelo 1 (Constante) PRECIO ($) t 51.06500 a.000 a.985 Error típ. .150 y b a Resumen del modelo Modelo 1 R R cuadrado a .11 Aplicando Regresión en SPSS La vista de resultados del SPSS muestra en el Resumen del modelo los coeficientes de correlación y determinación. 342.701 -10.595 .595.486 Coeficientes estandarizad os Beta -.994 .Figura 5.800 Sig. ˆ = 342.988 R cuadrado corregida . PRECIO ($) Coeficientesa Coeficientes no estandarizados B Error típ.

Variable dependiente: CANTIDAD En R: Definidos los valores de las variables Precio y Cantidad.0. 17.0.5.60 > resumen=summary(modelo) > resumen 208 .000a Regres ión Res idual Total a.5.5.15 X -10.0.500 gl 1 6 7 Media cuadrática 17480. 16. 183. . 10.795 36. 8.0) > Y=c(276. 14.0. 238. 212. por los vectores X e Y respectivamente siguientes: > X=c(6. 12. Variables predictoras : (Cons tante). también presenta el análisis de varianza para la regresión siguiente: ANOVAb Modelo 1 Suma de cuadrados 17480. 125) A continuación utilizar la función lm para definir > modelo=lm(Y~X) > modelo Call: lm(formula = Y ~ X) Coefficients: (Intercept) 342.795 220. PRECIO ($) b. 250.226 Sig. 156.784 F 475.705 17701.Al igual que el Minitab. 190. 20.

701 0.1741 Coefficients: 2.01 „*‟ 0.086e-07 209 .150 -10.09e-07 *** F-statistic: 475.5342 3Q Max -7. Error t value Pr(>|t|) (Intercept) X --Signif.3735 Estimate Std.2 on 1 and 6 DF. p-value: 6.80 6.‟ 0.065 on 6 degrees of freedom Multiple R-squared: 0. codes: 0 „***‟ 0.595 6.79e-09 *** -21.Call: lm(formula = Y ~ X) Residuals: Min 1Q Median 0.05 „.06 3.486 51. Adjusted R-squared: 0.1 „ ‟ 1 Residual standard error: 6.3974 10.3883 -4.9875.001 „**‟ 0.9855 342.

Distribución binomial. pero lo fundamental lo oculta …. La determinación del éxito o fracaso en este tipo de pruebas esta sujeto al interés particular de quién realiza una determinada prueba.1 INTRODUCCIÓN En el presente capítulo se presentan los modelos de probabilidad discretos cuyo cálculo ha sido adaptado a los programas que estamos presentando y que permiten dinamizar el aprendizaje del cálculo de probabilidades por la simplificación de los procesos. hipergeométrica y la Geométrica. 210 . Distribución de Poisson.Capítulo 6. Olvidaba decir que lo fundamental es …. Poisson.3 6. lo que yo quiera creer” Robert Frost CONTENIDO 6. Distribución geométrica. Se presentan los principales modelos de probabilidad para variables aleatorias discretas. Entre los modelos a estudiar tenemos las distribuciones: binomial. la esperanza.1 6. la función de probabilidad.5 Introducción. 6. muestra casi todo. En cada caso se presenta las características principales de cada distribución. la función de distribución acumulativa de probabilidades y las respectivas formas de cálculo de probabilidades. Distribución hipergeométrica. MODELOS DISCRETOS DE PROBABILIDAD “La estadística es como una mujer con bikini. la varianza. en las que estamos interesados en el número de éxitos en un determinado número de ensayos o pruebas.2 6. es decir.4 6.

1}. x 0. El ingreso de una familia es menor o igual a S/.6.1 Son ensayos Bernoulli los siguientes: El resultado observado en el lado superior al lanzar una moneda (cara o sello). La distribución de probabilidades Bernoulli es: x p (x) = P (X = x) 0 p 1 q=1-p La media y la varianza de la distribución Bernoulli son: E (X) = p y Var (X) = pq respectivamente. P (F) = q = 1 – p = P (X = 0). Ejemplo 6. La variable aleatoria X = número de éxitos en una prueba de Bernoulli toma los valores: Rx = {0. 1.Según Bazán y Corbera (1997) la distribución de Bernoulli “es el modelo más sencillo de probabilidad y proporciona la base para derivar otras distribuciones de probabilidad discreta”. las mismas que se calculan con la función de probabilidad siguiente: p ( x ) P( X x) p x q1 x . El estado en que se encuentra un artículo fabricado (bueno o defectuoso). E}. Por tanto: Ω= {F. 2500 o es mayor de 2500. La probabilidad de éxito se denota por P (E) = p = P (X = 1) y la probabilidad de fracaso es el complemento. Las pruebas de Bernoulli tienen dos posibles resultados uno de los cuales es fijado convencionalmente como éxito (E) y el otro como fracaso (F). 211 .2 DISTRIBUCIÓN BINOMIAL Distribución Bernoulli.

n}. 2 .2 Se lanza una moneda correcta 5 veces.. ….3. Si una variable X tiene distribución binomial. Calcule la probabilidad de obtener: a) 3 caras. 212 .. 1.Características del ensayo binomial Una prueba binomial se caracteriza por estar constituida por n pruebas de Bernoulli repetidas o independientes. tal como veremos a continuación. Ejemplo 6.p) y la ley de probabilidades es la antes indicada. La función de distribución acumulativa de probabilidades La función de distribución acumulativa de probabilidades de la binomial esta dada por: F ( x) P( X x) xi x P( X xi ) xi x n xi n Cx p q i xi Todas estas probabilidades son calculadas por los programas estudiados.. . 2. x 0. Ley de probabilidad La distribución de probabilidad binomial esta dada por la siguiente función: p ( x) P( X n! n x ! x! n x n x) C x pq x .. 1. Rx = {0. Sea X = el número de caras obtenidas. c) la distribución de probabilidades. Media y varianza de la distribución binomial La media y la varianza de la distribución binomial son: µ = E (X) = np y σ2 = Var (X) = npq. se le denota así X ~B (n. b) a lo más 2 caras. n Donde: C xn Los parámetros de la distribución binomial son n y p. y d) la función de distribución acumulativa de probabilidades.. cada una con la misma probabilidad p de éxito y la variable aleatoria X = número de éxitos.

50 c) La distribución de probabilidades binomial.03125 1 5/32 = 0. 4.15625 31/32 = 0.5) x (0.96875 5 1/32 = 0. 213 . se trata de n = 5 pruebas independientes.3.5) y su función de probabilidad es: p ( x) P( X 5 x) Cx (0.5. Por lo tanto.5)5 .5) xi y se presentan en la tabla i anterior de la pregunta c).03125 F(x) 1/32 = 0. con p = q = 0.00000 d) La distribución acumulativa de probabilidades se ha determinado con la función F ( x) P( X x) xi x P( X xi ) xi x 5 Cx (0.03125 32/32 = 1.50000 3 10/32 = 0. se presentan en el cuadro siguiente: x p(x) 0 1/32 = 0. 1.5)5 x 5 Cx (0. puesto que el resultado de un lanzamiento no influye en los sucesivos.3125 b) P (X ≤ 2) = p(0) + p(1) + p(2) = 1 5 1 5 5 1 5 ( ) C15 ( )5 C2 ( ) = C0 2 2 2 1 5 10 32 32 32 16 32 0. 2. ya que estamos interesados en observar si sale cara (éxito) o no sale (fracaso). Así mismo. x 0. a) p(3) P( X 5 1 5 3) C3 ( ) 2 10 32 0.31250 16/32 = 0.5.18750 2 10/32 = 0.81250 4 5/32 = 0. p = 0.15625 6/32 = 0.Solución Cada lanzamiento de la moneda es una prueba de Bernoulli.31250 26/32 = 0. la variable aleatoria X = número de caras obtenidas ~B (n=5. calculadas con la función de probabilidad.

2. 1. En Excel: Para hallar la distribución de probabilidades binomial. 3. Núm_éxito A2 (0) para poder efectuar una copia para los demás valores de x. escogemos Estadísticas (de seleccionar una categoría) y buscamos la función DISTR.BINOM y aparece la ventana de diálogo de la Figura 6.1 Cálculo de probabilidades para la distribución binomial en Excel En Argumentos de función se define: el número de éxitos. en la hoja de cálculo definimos en la columna A los valores de la variable x = 0. estando en la casilla B2.Veamos el procedimiento de cálculo de estas probabilidades con los programas. en funciones del Excel. las mismas que están sintetizadas en la tabla de la pregunta c) y d).1. Figura 6. En la columna B. Ensayos 5 (número de ensayos independientes = 5 lanzamientos de la moneda). La probabilida p de éxito Prob_éxito 214 . Para ello. definimos las probabilidades p(x) para cada uno de los valores. 4 y 5.

3. porque no se desea calcular probabilidad acumulada. B5. seleccionamos la ventana de diálogo de la Figura 6. C5. tal como se ha efectuado en Excel.1. Esta función permite tres tipos de cálculos: Probabililty (calcular una probabilidad para un valor de la variable). Para obtener las probabilidades acumuladas para los otros valores de x. aparece la probabilidad F(0) = 0. con los mismos Argumentos de función. Del menú escoger Calc → Probability Distributions → Binomial y aparece la ventana de diálogo de la Figura 6. C6 y C7. estando en la casilla C2. cuyos resultados se muestran en la Figura 6. Al hacer enter.03125. se efectúa una copia de lo anterior para las celdas sucesivas en B3.5 y en Acumulado escribir FALSO.2 Solución del Ejemplo 6. se efectúa una copia de lo anterior para las celdas sucesivas en C3. Para obtener las probabilidades acumuladas.2 en Excel En Minitab: En este programa se puede hacer cálculos de probabilidades individuales o para el conjunto de valores que toma la variable. C4. B4. Figura 6. Cumulative probability (calcular la probabilidad acumulada hasta un valor determinado) e Inverse cumulative probability (calcular el valor de la 215 . aparece la probabilidad p(0) = 0.2. salvo el de Acumulado en el que se escribe VERDADERO.03125. Al hacer enter. Para obtener las probabilidades para los otros valores de x. cuyos resultados se muestran en la Figura 6. B6 y B7.0.2.

n = Number of trials (número de pruebas) y p = Event probability (probabilidad de éxito).3. tal como se muestra en la Figura 6. la variable aleatoria X = número de caras obtenidas ~B (n=5.5 x 3 P( X = x ) 0.variable para una probabilidad acumulada dada).2. En la parte a) se solicita p (3) = P (X = 3) por ello se ha activado Probability e donde se escribe 3.3 Probabilidad con la distribución binomial en Minitab Veamos el cálculo de probabilidades individuales.5) parámetros indicados en la Figura 6. Al hacer clic en OK. en la hoja de Session aparece el resultado siguiente: Probability Density Function Binomial with n = 5 and p = 0. Cálculos que son realizados indicando previamente los parámetros de la distribución binomial.3125 En la parte b) del ejemplo 6. 216 y en . En el ejemplo 6. es decir.2 se solicita la probabilidad acumulada F (2) = P (X ≤ 2) por lo que se hace necesario seleccionar escribir 2.4. Figura 6. p = 0.

se procede de manera similar a lo realizado en la Figura 6. sólo que no se selecciona Input constant:.5. en la hoja de Session aparece el resultado siguiente: Cumulative Distribution Function Binomial with n = 5 and p = 0. en la columna C1 con la denominación x se han definido los valores 0. 4 y 5. en donde se selecciona la columna C1 o x.4 Probabilidad acumulada con la distribución binomial en Minitab Al hacer clic en OK.5 x P( X <= x ) 2 0.5 Resultados similares a los del ejemplo 6. 2.Figura 6.2. 3. para el ejemplo 6. tal como se 217 .3.2. Para calcular las probabilidades para cada uno de los valores de la variable. 1. Veamos el cálculo de probabilidades para un conjunto de valores Primero definir los valores en una columna de la Worksheet (hoja de trabajo del Minitab). sino muestra en la Figura 6.

03125 0.Como son seis probabilidades las que se van a calcular se tiene que indicar donde se quiere colocar dichos resultados.15625 0.5 x 0 1 2 3 4 5 P( X = x ) 0. los mismos deben aparecer en la Worksheet del Minitab. Figura 6.15625 0. Si no se van hacer otros cálculos con los resultados.5 Probabilidad para varios valores con distribución binomial en Minitab Si se desea seguir usando estos resultados para hacer otros cálculos.03125 218 . Para terminar hacer clic en OK y los resultados se muestran en la columna C2 de la Worksheet.31250 0.31250 0. hacer clic en OK y dichos resultados se muestran en la hoja de Session así: Probability Density Function Binomial with n = 5 and p = 0. por ello en Optional storage: (deposito opcional de resultados) escribir C2.

15 0.Para calcular las probabilidades acumuladas para los seis valores del ejemplo 6. en la Figura 6.18750 2 0.2 y con los resultados en la hoja de Session. El gráfico de la distribución binomial obtenido con el Minitab es el siguiente: Gráfico 6.00000 Los dos últimos resultados son idénticos a los que aparecen en la Figura 6.2.00 p(x) 0 1 2 x 3 4 5 219 .10 0.35 0.5) 0.25 0.30 0.50000 3 0.81250 4 0.05 0.20 0.1 Distribución binomial (n = 5.03125 1 0.96875 5 1.5 seleccionar y al hacer clic en OK aparecen los resultados siguientes: Cumulative Distribution Function Binomial with n = 5 and p = 0.5 x P( X <= x ) 0 0. los que a continuación se presentan tal como se han obtenido en la Worksheet del Minitab. p = 0.

En SPSS: Para calcular las probabilidades simples (P) y las acumuladas (F) del ejemplo 6.Binom y con un clic en ingresarla en el recuadro Expresión numérica: donde aparece PDF.BINOM(?. Veamos el cálculo de probabilidades simples (P). hay que definir cada uno de los argumentos ? indicados en la función PDF.?. en la vista de variables se define x y en la vista de datos se ingresan los mismos (0.2. Figura 6.prob) que se precisan en el recuadro central de la Figura 6. 3. y de Funciones y variables especiales: seleccionar Pdf. Así cant representa los valores de la variable x. En Variable de destino: escribir P.6.6 Cálculo de probabilidades con la distribución binomial en SPSS A continuación. Del Grupo de funciones: del lado derecho.6.n. Del menú escoger Transformar → Calcular variable y aparece la ventana de diálogo de la Figura 6.BINOM(cant. 2. 4 y 5). n el número de ensayos = 5 y prob = 220 . 1.?). escoger FDP y FDP no centrada.

Figura 6. Del Grupo de funciones: escoger FDA y FDA no centrada. con las variantes indicadas.5. proceder de manera similar al cálculo de probabilidades simples.7. Para finalizar hacer clic en Aceptar y en la vista de datos aparece los resultados siguientes: Para el cálculo de las probabilidades acumuladas (F) del ejemplo 6.probabilidad de éxito = 0. n y prob 221 . tal como se muestra en la Figura 6.Binom e ingresarla en el recuadro Expresión numérica y definir los argumentos cant.7 Probabilidades acumuladas con la distribución binomial en SPSS En la Variable de destino: se escribe F.2. y de Funciones y variables especiales: seleccionar Cdf.

2.3.BINOM(x. En la parte a) se solicita p (3) = P (X = 3).5) [1] 0.0.5) > dbinom(x.n.5). primero se define el vector de valores y luego se calculan las probabilidades así: > x=c(0.0.15625 0..5.03125 0. Por ello se recomienda definir las probabilidades anteriores a través del objeto P definido así: 222 .p). Donde x puede ser un valor o un conjunto de valores definidos previamente.5) [1] 0.5. En R: Para calcular probabilidades simples con la distribución binomial usar la función dbinom(x.31250 0. p = 0. En el ejemplo 6. X = número de caras obtenidas ~B (n=5. esto se calcula así: > dbinom(3.2. n el número de ensayos y p la probabilidad de éxito.para el cálculo de probabilidades simples en SPSS se usa la función FDP y FDP no centrada y para calcular las probabilidades acumuladas la función FDA y FDA no centrada.así: CDF.15625 0. pero la presentación del resultado no permite una adecuada lectura.1.31250 0.03125 El resultado anterior muestra las probabilidades para cada valor de X.0.3125 Si se desea determinar la distribución de probabilidades de la variable aleatoria X.5.5).4. Para finalizar hacer clic en Aceptar y en la vista de datos aparece los resultados siguientes: Nota.

En la parte b) del ejemplo 6.P.31250 [5.2 se solicita F (2) = P (X ≤ 2).5) [1] 0.03125 0. n el número de ensayos y p la probabilidad de éxito.] 3 0.0. Donde x puede ser un valor o un conjunto de valores definidos previamente.03125 [2.18750 223 . uno a continuación de otro.] 0 0. P) usar la función cbind que permite presentar los resultados de los objetos definidos en columna.5) Para mejorar la presentación de la distribución de probabilidades (x.03125 [2.> P=dbinom(x.] 4 0.0.p). esto se calcula así: > pbinom(2.5.] 5 0.] 0 0.5 Para obtener la distribución de probabilidades y las probabilidades acumuladas efectuamos el siguiente proceso. así: > cbind(x.5) > cbind(x.] 1 0.5.n.0.03125 Para calcular probabilidades acumuladas con la distribución binomial usar la función pbinom(x.P) x P [1.5.31250 [4. > F=pbinom(x.15625 [3.F) x P F [1.] 2 0.15625 [6.15625 0.] 1 0.

00000 Resultados idénticos a los obtenidos con los demás programas.] 4 0. Observación.. 6. Media y varianza de la distribución Poisson La media y la varianza de la distribución Poisson es la misma e igual a λ.15625 0.] 2 0.3. La distribución de probabilidades de la variable aleatoria discreta de Poisson X = número de éxitos viene dada por: x p( x) P( X x) e . 1.31250 0.[3.81250 [5. 2.] 5 0. Si una variable X tiene distribución Poisson. x! El parámetro de la distribución Poisson es λ. se toma con media igual a λ = np asumiendo p pequeño (p → 0) y n grande (n → ∞).] 3 0.3 DISTRIBUCIÓN DE POISSON La distribución Poisson se deduce como un límite de la distribución binomial y como un proceso de Poisson.03125 1.50000 [4..96875 [6. µ = E (X) = σ2 = Var (X) = λ. se le denota así X ~ P (λ) y la ley de probabilidades es la antes indicada. La función de distribución acumulativa de probabilidades La función de distribución acumulativa de probabilidades de la Poisson esta dada por: xi F ( x) P( X x) xi x P( X xi ) xi x e xi ! 224 .para las siguientes distribuciones de probabilidades los cálculos efectuados con los programas estudiados son similares a los de la distribución binomial. Como un límite de la distribución binomial. x 0....31250 0.

3. 1. 2. el recorrido de la variable es RX = {0. bien λ o λt. Si en un proceso de Poisson de parámetro λ se observa t unidades de medida. b) a lo más 2 llamadas.. se define X = número de ocurrencias de eventos en las t unidades de medida. 3. …. La ocurrencia de los eventos son independientes.. Entonces..) y forman un proceso de Poisson con parámetro λ. 225 . 1.. Donde λt es el promedio de ocurrencias de los eventos en las t unidades de medida. El promedio de éxitos que ocurren en una unidad de medida t es conocido e igual a λt. 2. La variable aleatoria X tiene distribución Poisson definida por: p ( x) P( X x) ( t)x e x! t . Ejemplo 6. En ambas fórmulas del cálculo de probabilidades con la distribución de Poisson lo primero que se tiene que determinar es la media. volumen. La probabilidad de ocurrencia de 2 o más éxitos en esta unidad pequeña h es aproximadamente cero. c) la distribución de probabilidades. etc. y d) la función de distribución acumulativa de probabilidades. }. tiempo. surge cuando hay eventos discretos que se generan en un intervalo continuo t (unidad de medida: longitud. área. La probabilidad de éxito en una unidad de medida pequeña de longitud h es proporcional a su longitud: λh. si tiene las siguientes propiedades.La deducción como un proceso de Poisson. x 0.3 El promedio de llamadas recibidas por una central telefónica en un minuto es igual a 2. Calcule la probabilidad de que en 2 minutos se reciban: a) 3 llamadas.

156293 0.238103 0.000641 F(x) = P(X ≤ x) 0.889326 0.3. Luego: x! 43 e 4 = 0.23810 2! a) p(3) = P(X = 3) = b) P (X ≤ 2) = p(0) + p(1) + p(2) = c) La distribución de probabilidades Poisson.785130 0. calculadas con la función de probabilidad.059540 0.013231 0.104196 0.005292 0.978637 0.091578 0.. se presentan en el cuadro siguiente: x 0 1 2 3 4 5 6 7 8 9 10 11 12 p(x) = P(X = x) 0. 2.195367 0.628837 0.018316 0.433470 0. 1..Solución Como λ = 2 y t = 2..991868 0. x 0.018316 0.999085 0..029770 0.997160 0.195367 0.948866 0.001925 0.999726 226 .195367 3! 40 e 4 0! 41 e 4 1! 42 e 4 = 0.146525 0. λt = 4 llamadas promedio en 2 minutos. Sea X = el número de llamadas recibidas en 2 minutos ~ P (4) y la ley de probabilidades es: p( x) P( X x) 4x e 4 .073262 0.

2. 4. …. definimos las probabilidades p(x) para cada uno de los valores. escogemos Estadísticas (de seleccionar una categoría) y buscamos la función POISSON y aparece la ventana de diálogo de la Figura 6. en la hoja de cálculo definimos en la columna A los valores de la variable x = 0.8. 3. las mismas que están sintetizadas en la tabla de la pregunta c) y d). En la columna B.. 1.d) La distribución acumulativa de probabilidades se ha determinado con la función F ( x) P( X x) xi x P( X xi ) xi 4 xi e 4 y se presentan en la tabla anterior xi ! x de la pregunta c). 15. ….. estando en la casilla B2. Para ello. Veamos el procedimiento de cálculo de estas probabilidades con los programas.8 Cálculo de probabilidades para la distribución Poisson en Excel 227 . Figura 6. En Excel: Para hallar la distribución de probabilidades Poisson. en funciones del Excel.

B4.9 Solución del Ejemplo 6. Figura 6. Al hacer enter. C4. Para obtener las probabilidades para los otros valores de x. estando en la casilla C2. seleccionamos la ventana de diálogo de la Figura 6. x A2 (0) para poder efectuar una copia para los demás valores de x. cuyos resultados se muestran en la Figura 6. porque no se desea calcular probabilidad acumulada. hasta B17.3 en Excel 228 .8. cuyos resultados se muestran en la Figura 6.01832.9. se efectúa una copia de lo anterior para las celdas sucesivas en B3. hasta C17. Al hacer enter. Media 4 y en Acumulado escribir FALSO. Para obtener las probabilidades acumuladas.En Argumentos de función se define: el número de éxitos. aparece la probabilidad F(0) = 0. Para obtener las probabilidades acumuladas para los otros valores de x. aparece la probabilidad p(0) = 0. salvo el de Acumulado en el que se escribe VERDADERO. se efectúa una copia de lo anterior para las celdas sucesivas en C3. con los mismos Argumentos de función.01832.9.

seleccionar y en el recuadro escribir 3. Esta función permite tres tipos de cálculos: Probabililty (calcular una probabilidad para un valor de la variable). activar . En el ejemplo 6. es decir.10. Figura 6. Al hacer clic en OK. al igual que en la distribución binomial. Para calcular la probabilidad de X = 3.10. en la hoja de Session aparece este resultado: 229 . Cumulative probability (calcular la probabilidad acumulada hasta un valor determinado) e Inverse cumulative probability (calcular el valor de la variable para una probabilidad acumulada dada). Del menú escoger Calc → Probability Distributions → Poisson y aparece la ventana de diálogo de la Figura 6.En Minitab: En este programa. Cálculos que se realizan indicando previamente el parámetro de la distribución Poisson. la variable aleatoria X = número de llamadas recibidas ~P (λ=4) parámetro indicado en la Figura 6. se puede hacer cálculos de probabilidades individuales o para el conjunto de valores que toma la variable. λ = 4 = Mean (media).10 Probabilidad con la distribución Poisson en Minitab Veamos el cálculo de probabilidades individuales.3.

en la Figura 6. 3.10 seleccionar y en Optional storage: seleccionar F(x).195367 Para calcular las probabilidades individuales para todos los valores de x= 0..3 y con los resultados en la Worksheet. Al hacer clic en OK. en la Worksheet aparecen los resultados de la Figura 6.11. 4. se escoge p(x) para que los resultados los deposite en la misma Worksheet.11 Probabilidad para varios valores con distribución Poisson en Minitab Para calcular las probabilidades acumuladas para los valores del ejemplo 6. y en Optional storage. 15 especificados en la columna C1 de la Worksheet se activa Probability .11. …. 2. 1. Figura 6. Seleccionar y escoger x en el recuadro. El gráfico de la distribución Poisson obtenido con el Minitab es el siguiente: 230 .Probability Density Function Poisson with mean = 4 x 3 P( X = x ) 0. Al hacer clic en OK en la Worksheet aparecen los resultados de la Figura 6.

05 0. en la vista de variables se define x y en la vista de datos se ingresan los mismos (0.2 Distribución de Poisson con λ = 4 0.12 Cálculo de probabilidades con la distribución Poisson en SPSS 231 . 3.10 0. 4. 2. Figura 6.15 p(x) 0. ….3. …). 1.00 0 1 2 3 4 5 6 7 x 8 9 10 11 12 13 14 15 En SPSS: Para calcular las probabilidades simples (P) del ejemplo 6..Gráfico 6. 15.20 0.

12.3. Para el cálculo de las probabilidades acumuladas (F) del ejemplo 6.POISSON(cant.12.13.14. proceder de manera similar al cálculo de probabilidades simples. tal como se muestra en la Figura 6. Así cant representa los valores de la variable x. escoger FDP y FDP no centrada. y de Funciones y variables especiales: seleccionar Pdf.media) que se precisan en el recuadro central de la Figura 6.POISSON(?. Del Grupo de funciones: del lado derecho. con las variantes indicadas. A continuación. Para finalizar hacer clic en Aceptar y en la vista de datos aparece los resultados de la Figura 6. y media = λ = 4. hay que definir cada uno de los argumentos ? indicados en la función PDF.13 Probabilidades acumuladas con la distribución Poisson en SPSS 232 . En Variable de destino: escribir P.Del menú escoger Transformar → Calcular variable y aparece la ventana de diálogo de la Figura 6.Poison y con un clic en ingresarla en el recuadro Expresión numérica: donde aparece PDF. Figura 6.?).

3.3 en SPSS En R: Para calcular probabilidades simples con la distribución Poisson usar la función dpois(x. En la parte a) se solicita p (3) = P (X = 3).14. Del Grupo de funciones: escoger FDA y FDA no centrada.14 Distribución de probabilidades Poisson del ejemplo 6. X = número de llamadas recibidas ~ P (λ = 4).λ). y de Funciones y variables especiales: seleccionar Cdf.Poisson e ingresarla en el recuadro Expresión numérica y definir los argumentos cant y media así: CDF.POISSON(x.4). Donde x puede ser un valor o un conjunto de valores definidos previamente y λ la media. esto se calcula así: > dpois(3. Figura 6. En el ejemplo 6.1953668 233 .4) [1] 0. Para finalizar hacer clic en Aceptar y en la vista de datos aparece los resultados de la Figura 6.En la Variable de destino: se escribe F.

924537e-03 [13.] [9.323119e-02 [11.] [8. primero se define el vector de valores y luego se calculan las probabilidades así: > x=c(0.954036e-02 8 2.503912e-05 Para calcular probabilidades acumuladas con Poisson usar la función ppois(x.] [5.292477e-03 [12. Donde x puede ser un valor o un conjunto de valores definidos y λ la media. uno a continuación de otro.041956e-01 7 5.5.953668e-01 5 1.λ).P) x [1.] 10 5.562935e-01 6 1.415123e-04 [14.1.14. así: > cbind(x. 234 .2.] 13 1.] [7.10.977018e-02 9 1.8.] [3.13.Si se desea determinar la distribución de probabilidades de la variable aleatoria X.831564e-02 1 7.326256e-02 2 1.] [10.465251e-01 3 1.15) > P=dpois(x.] [2.953668e-01 4 1. P) usar la función cbind que permite presentar los resultados de los objetos definidos en columna.7.] 11 1.] [4.] 15 1.973884e-04 [15.] P 0 1.639669e-05 [16.9.] [6.4) Para presentar la distribución de probabilidades (x.] 14 5.3.11.6.4.] 12 6.12.

94886638 8 2.831564e-02 0.97863657 9 1.09157819 2 1.] [8.] 12 6.953668e-01 0.292477e-03 0.99972628 [14.] 10 5.F) x [1.326256e-02 0.99186776 [11.] [7.4) > cbind(x.] [9.] [3.415123e-04 0.P.465251e-01 0.954036e-02 0.88932602 7 5.] [2.99998007 [16.3 se solicita F (2) = P (X ≤ 2).En la parte b) del ejemplo 6.78513039 6 1.4) [1] 0.562935e-01 0.] [10.323119e-02 0.973884e-04 0.] [4.2381033 Para obtener la distribución de probabilidades y las probabilidades acumuladas efectuamos el siguiente proceso.62883694 5 1.] 14 5.503912e-05 0.99908477 [13. esto se calcula así: > ppois(2.] 15 1.01831564 1 7.] P F 0 1.953668e-01 0.] 13 1.] [5.] 11 1.041956e-01 0.23810331 3 1.977018e-02 0.] [6.924537e-03 0. > F=ppois(x.99999511 235 .99992367 [15.43347012 4 1.639669e-05 0.99716023 [12.

n) y la ley de probabilidades es la antes indicada.4 DISTRIBUCIÓN HIPERGEOMÉTRICA Esta distribución esta asociada a experimentos del siguiente tipo: de un conjunto de N objetos.p La función de distribución acumulativa de probabilidades La función de distribución acumulativa de probabilidades de la hipergeométrica esta dada por: F ( x) P( X x) xi x P( X xi ) xi x CxM CnN xiM i CnN Ejemplo 6.4 De la baraja de 52 cartas se reparten 5 naipes sin reposición. Dicho experimento tiene asociada una variable aleatoria X que da el número x de éxitos (objetos en la muestra que poseen la característica de interés) en n ensayos de Bernoulli cuya distribución de probabilidades esta dada por: p( x) P( X x) CxM CnN xM . n + M . máx {o.6. M. se le denota así X ~ Hiper (N.N} ≤ x ≤ mín {n. Media y varianza de la distribución hipergeométrica La media y la varianza de la distribución hipergeométrica son: µ = E (X) = np y σ2 = Var (X) = npq(N –n) / (N – 1) Donde: p = M/N y q = (N – M) / N = 1 . se extrae n objetos al azar y sin reemplazo. M} CnN Los parámetros de la distribución hipergeométrica son N. Si una variable X tiene distribución hipergeométrica. de los cuales M poseen cierta característica de interés y el resto N – M no la poseen. M y n. Calcule la probabilidad de que entre los 5 naipes 236 . y se observa el número x de objetos en la muestra que poseen la característica de interés. Sea X el número de naipes de color negros repartidos.

14956 + 0. 4. x 0. se presentan en el cuadro siguiente: x p(x) F(x) 0 0. 237 . M = 26 cartas negras. 26. b) a lo más 2 naipes negros. Solución En la baraja N = 52 cartas. c) la distribución de probabilidades.32513 52 C5 b) P (X ≤ 2) = p(0) + p(1) + p(2) = 26 C0 C526 52 C5 26 C126 C4 52 C5 26 C2 C326 = 52 C5 = 0.97469 5 0.32513 0.50000 3 0.14956 0.02531 1 0. 5) y la ley de probabilidades es: 26 Cx C526x x) .17487 2 0. n = 5 cartas repartidas sin reposición. las mismas que están sintetizadas en la tabla de la pregunta c) y d).1.82513 4 0.50000 c) La distribución de probabilidades.14956 0.02531 1.repartidos hayan: a) 3 naipes negros.32513 = 0. Sea X = el número de naipes negros repartidos ~ Hiper (52.00000 d) La distribución acumulativa de probabilidades se ha determinado con la función F ( x) P( X x) xi x P( X xi ) xi x Cx26 C526xi i 52 C5 y se presentan en la tabla anterior de la pregunta c). y d) la función de distribución acumulativa de probabilidades.5 Luego: 52 C5 p ( x) P( X a) p(3) P( X 3) 26 C326 C2 = 0.3. 2.02531 0. calculadas con la función de probabilidad hipergeométrica. Veamos el procedimiento de cálculo de estas probabilidades con los programas.02531 + 0.32513 0.

en la hoja de cálculo definimos en la columna A los valores de la variable x = 0. Para obtener las probabilidades para los otros valores de x. 238 . B4.15. estando en la casilla B2.En Excel: Para hallar la distribución de probabilidades hipergeométrica.16. 4 y 5. B5.15 Cálculo de distribución hipergeométrica en Excel En Argumentos de función se define: el número de éxitos en la muestra. B6 y B7. aparece la probabilidad p(0) = 0. en funciones del Excel.HIPERGEOM y aparece la ventana de diálogo de la Figura 6. definimos las probabilidades p(x) para cada uno de los valores. escogemos Estadísticas (de seleccionar una categoría) y buscamos la función DISTR.02531. 1. Num_de_muestra 5 (es el tamaño de la muestra n). Al hacer enter. 3. se efectúa una copia de lo anterior para las celdas sucesivas en B3. Población_éxito 26 (es el número de éxitos en la población = M) y en Num_de_población 52 (el tamaño de la población N). Para ello. cuyos resultados se muestran en la Figura 6. Figura 6. Muestra_éxito A2 (0) para poder efectuar una copia para los demás valores de x. En la columna B. 2.

17. Del menú escoger Calc → Probability Distributions → Hipergeometric y aparece la ventana de diálogo de la Figura 6. se puede hacer cálculos de probabilidades individuales o para el conjunto de valores que toma la variable.Las probabilidades acumuladas F(x) se han determinado haciendo los cálculos en la columna C usando los de la columna B. Cumulative probability (calcular la probabilidad acumulada hasta un valor determinado) e Inverse cumulative probability (calcular el valor de la variable para una probabilidad acumulada dada). En el ejemplo 6. la variable aleatoria X = número de naipes negros repartidos ~ Hiper (52. Cálculos que se realizan indicando previamente los parámetros de la distribución hipergeométrica. Event count in population (M) = número de éxitos en la población = 26. es decir: Population size (N): = el tamaño de la población = 52. Esta función permite tres tipos de cálculos: Probabililty (calcular una probabilidad para un valor de la variable). 26. 5) parámetros indicados en la Figura 6.4.16. y Sample size (n): = tamaño de la muestra = 5. al igual que en la distribución binomial y Poisson. Figura 6.17. estos se muestran en la Figura 6.4 en Excel En Minitab: En este programa. 239 .16 Solución del Ejemplo 6.

M = 26.. 15 especificados en la columna C1 de la Worksheet se activa Probability . and n = 5 x 3 P( X = x ) 0. Para calcular las probabilidades acumuladas para los valores del ejemplo 6. Al hacer clic en OK.325130 Para calcular las probabilidades individuales para todos los valores de x= 0.17 Probabilidad con la distribución hipergeométrica en Minitab Veamos el cálculo de probabilidades individuales.17 seleccionar 240 . en la Worksheet aparecen los resultados de la Figura 6. en la Figura 6. en la hoja de Session aparece este resultado: Probability Density Function Hypergeometric with N = 52. se escoge p(x) para que los resultados los deposite en la misma Worksheet.18. seleccionar y en el recuadro escribir 3. Seleccionar y escoger x en el recuadro. Al hacer clic en OK. 2. se activa . Para calcular la probabilidad de X = 3. …. 3.4 y con los resultados en la Worksheet. 4. 1. y en Optional storage.Figura 6.

35 0.19. Al hacer clic en OK en la Worksheet aparecen los resultados de la Figura 6. En Variable de destino: escribir P. 4.15 0. 241 .18. 2.y en Optional storage: seleccionar F(x). 1.05 0.3 Distribución hipergeométrica con N = 52.10 0.20 0. 3. Figura 6.18 Probabilidades con distribución hipergeométrica en Minitab El gráfico de la distribución hipergeométrica obtenido con el Minitab es el siguiente: Gráfico 6. 5). n = 5 0.4.00 p(x) 0 1 2 x 3 4 5 En SPSS: Para calcular las probabilidades simples (P) del ejemplo 6. M = 26.25 0.30 0. Del menú escoger Transformar → Calcular variable y aparece la ventana de diálogo de la Figura 6. en la vista de variables se define x y en la vista de datos se ingresan los mismos (0.

hay que definir cada uno de los argumentos ? indicados en la función PDF.4.HIPER(?.19 Cálculo de probabilidades con la distrib. muestra = n = 5 y aciertos = M = 26. y de Funciones y variables especiales: seleccionar Pdf. Para finalizar hacer clic en Aceptar y en la vista de datos aparece los resultados de la Figura 6. tal como se muestra en la Figura 6. En la Variable de destino: se escribe F.?. hipergeométrica en SPSS Del Grupo de funciones: del lado derecho.20. escoger FDP y FDP no centrada. y de Funciones y variables especiales: seleccionar Cdf. proceder de manera similar al cálculo de probabilidades simples.21. Así cant representa los valores de la variable x.19.aciertos) que se precisan en el recuadro central de la Figura 6.?.Hiper y con un clic en ingresarla en el recuadro Expresión numérica: donde aparece PDF. A continuación.Hiper e 242 . con las variantes indicadas.muestra.total.?). total = N = 52. Para el cálculo de las probabilidades acumuladas (F) del ejemplo 6.HIPER(cant.Figura 6. Del Grupo de funciones: escoger FDA y FDA no centrada.

4 en SPSS 243 . de probabilidades hipergeométrica del ejemplo 6.5. muestra y aciertos. Figura 6.26). total.HIPER(x. hipergeométrica en SPSS Para finalizar hacer clic en Aceptar y en la vista de datos aparece los resultados de la Figura 6.21.20 Probabilidades acumuladas con la distrib.ingresarla en el recuadro Expresión numérica y definir los argumentos cant. Figura 6. así: CDF.21 Distrib.52.

] 0 0.M.P) x P [1.n).26.3251301 Si se desea determinar la distribución de probabilidades de la variable aleatoria X.1.5) [1] 0.26.5) > P=dhyper(x. esto se calcula así: > dhyper(3.4. P) usar la función cbind que permite presentar los resultados de los objetos definidos en columna. Donde x puede ser un valor o un conjunto de valores definidos previamente. así: > cbind(x.] 2 0. uno a continuación de otro.02531012 [2.N-M. primero se define el vector de valores y luego se calculan las probabilidades así: > x=c(0. X = número de naipes negros repartidos ~ Hiper (N = 52.4. n = 5).3.] 5 0.14955982 [3. M =26.32513005 [4.] 4 0.2.5) Para presentar la distribución de probabilidades (x.] 1 0. En el ejemplo 6. M = objetos con la característica de interés. N-M = objetos sin la característica de interés y n el tamaño de la muestra.26.26.14955982 [6. En la parte a) se solicita p (3) = P (X = 3).32513005 [5.] 3 0.En R: Para calcular probabilidades simples con la distribución hipergeométrica usar la función dhyper(x.02531012 244 .

En la parte b) del ejemplo 6.26.5) > cbind(x.] 4 0.5 Para obtener la distribución de probabilidades y las probabilidades acumuladas efectuamos el siguiente proceso.] 1 0.14955982 0. Cabe resaltar que cualquiera de los cálculos de probabilidades con otras distribuciones son similares.N-M.00000000 Resultados idénticos para cada uno de los programas empleados.] 2 0. 245 .Para calcular probabilidades acumuladas con la hipergeométrica usar la función phyper(x.50000000 [4.F) x P F [1.32513005 0.] 0 0. vemos ahora la distribución geométrica de probabilidades.26.02531012 0.17486995 [3.n).5) [1] 0.] 5 0.26.4 se solicita F (2) = P (X ≤ 2). M = objetos con la característica de interés.26.02531012 [2. esto se calcula así: > phyper(2.32513005 0.M.97468988 [6.02531012 1.82513005 [5.P. Donde x puede ser un valor o un conjunto de valores definidos previamente.14955982 0. N-M = objetos sin la característica de interés y n el tamaño de la muestra.] 3 0. > F=phyper(x.

con probabilidad de éxito p y probabilidad de fracaso q.. La variable aleatoria geométrica se define como X = número de ensayos independientes requeridos hasta obtener el primer éxito.. El parámetro de la distribución geométrica es p. b) a lo más 2 lanzamientos.. 2.6. 246 .3.. Si una variable X tiene distribución geométrica. La ley de probabilidades geométrica está dada por: p ( x ) P( X x) p q x 1 . 4. Media y varianza de la distribución geométrica La media y la varianza de la distribución geométrica son: µ = E (X) = 1/p y σ2 = Var (X) = q/p2 La función de distribución acumulativa de probabilidades La función de distribución acumulativa de probabilidades de la geométrica esta dada por: F ( x) P( X x) xi x P( X xi ) p xi x q xi 1 Ejemplo 6.5 DISTRIBUCIÓN GEOMÉTRICA Es una distribución que se relaciona con el proceso de Bernoulli excepto que el número de ensayos no es fijo. x 1. Sea X el número de lanzamientos de la moneda hasta obtener cara. c) la distribución de probabilidades. y d) la función de distribución acumulativa de probabilidades. se le denota así X ~ Geom (p) y la ley de probabilidades es la antes indicada. Calcule la probabilidad de que se hayan realizado: a) 3 lanzamientos.5.5 Se lanza una moneda cargada con probabilidad de cara igual a 1/4.

01408 F(x) = P(X ≤ x) 0. x 1.76270 0.57813 0..25) y la ley de probabilidades es: 1 4 3 4 x 1 p( x) P( X x) .01877 0.10547 0.04449 0. Sea X = el número de lanzamientos de la moneda hasta obtener cara ~ Geom (0.14063 1 b) P (X ≤ 2) = p(1) + p(2) = 4 3 4 1 1 1 4 3 4 2 1 = = 0.02503 0. se presenta en el cuadro siguiente: x 1 2 3 4 5 6 7 8 9 10 11 p(x) = P(X = x) 0.05933 0.82202 0.07910 0.18750 0..89989 0.95776 247 .03337 0.18750 = 0...25000 0.92492 0.94369 0.86652 0. 2. calculadas con la función de probabilidad geométrica. 4.25000 0.3.43750 0.Solución El éxito es obtener cara.68359 0. entonces p = P(C) = ¼= 0. Luego: a) p(3) P( X 3) 1 4 3 4 3 1 = 0.25 y q = ¾ = 0.75.25000 + 0.14063 0.4375 c) La distribución de probabilidades.

Para ello definir en la columna A. Veamos el procedimiento de cálculo de estas probabilidades con los programas. definir los acumulados. Del mismo modo en la columna C. pero se pueden obtener en la hoja de cálculo trabajando con la fórmula. los valores de la variable x.22 Solución del Ejemplo 6.d) La distribución acumulativa de probabilidades se ha determinado con la función F ( x) P( X x) xi x P( X 1 xi ) 4 xi x 3 4 xi 1 y se presentan en la tabla anterior de la pregunta c).22.5 en Excel 248 . bajo la forma tradicional de acumulación y se obtiene el resultado mostrado en la Figura 6. Figura 6. luego en la columna B definir las probabilidades p(x) como fórmula de cálculo. En Excel: La distribución de probabilidades geométrica no esta definida en el Excel. las mismas que están sintetizadas en la tabla de la pregunta c) y d).

249 . la variable aleatoria X = el número de lanzamientos de la moneda hasta obtener cara ~ Geom (0. Del menú escoger Calc → Probability Distributions → Geometric y aparece la ventana de diálogo de la Figura 6.23. En el ejemplo 6.En Minitab: En este programa.23.25) parámetro indicado en la Figura 6. Figura 6.25 escrito en Event probability. Cumulative probability (calcular la probabilidad acumulada hasta un valor determinado) e Inverse cumulative probability (calcular el valor de la variable para una probabilidad acumulada dada). es decir: p = 0.23 Probabilidad con la distribución geométrica en Minitab Esta función permite tres tipos de cálculos: Probabililty (calcular una probabilidad para un valor de la variable). al igual que para las distribuciones anteriores.5. Cálculos que se realizan indicando previamente el parámetro de la distribución geométrica. se puede hacer cálculos de probabilidades individuales o para el conjunto de valores que toma la variable.

24. Para calcular las probabilidades acumuladas para los valores del ejemplo 6. ….24. seleccionar y en el recuadro escribir 3.987. 15 especificados en la columna C1 de la Worksheet se activa Probability . por lo que existen más valores de X cuyas probabilidades acumuladas no se han evaluado.25 x 3 P( X = x ) 0.5 y con los resultados en la Worksheet. 4. Seleccionar y escoger x en el recuadro. se escoge p(x) para que los resultados los deposite en la misma Worksheet. en la Worksheet aparecen los resultados de la Figura 6. para X = 15. Así tenemos que para X = 40: el Minitab arroja una probabilidad más cerca de uno y es la siguiente: Cumulative Distribution Function Geometric with p = 0. 250 . se encuentran alrededor de 0. se activa .Veamos el cálculo de probabilidades individuales.25 x 40 P( X <= x ) 0. en la Figura 6. 2. 1.999990 * NOTE * X = total number of trials. en la hoja de Session aparece este resultado: Probability Density Function Geometric with p = 0.24.23 seleccionar y en Optional storage: seleccionar F(x). Al hacer clic en OK. Para calcular las probabilidades individuales para todos los valores de x= 0.140625 * NOTE * X = total number of trials. 3. Al hacer clic en OK. Para calcular la probabilidad de X = 3. Al hacer clic en OK en la Worksheet aparecen los resultados de la Figura 6. y en Optional storage. Las probabilidades acumuladas presentadas en la Figura 6..

25 0.05 0.Figura 6.24 Probabilidades con distribución geométrica en Minitab El gráfico de la distribución geométrica obtenido con el Minitab es el siguiente: Gráfico 6.00 1 2 3 4 5 6 7 8 9 x 10 11 12 13 14 15 16 17 18 251 .25 0.15 0.4 Distribución geométrica con p = 0.20 p(x) 0.10 0.

GEOM(?.?). Así cant representa los valores de la variable x. 14. Del menú escoger Transformar → Calcular variable y aparece la ventana de diálogo de la Figura 6.25. 252 . 3.5.25. y de Funciones y variables especiales: seleccionar Pdf. en la vista de variables se define x y en la vista de datos se ingresan los mismos (0. A continuación. 2.GEOM(cant. …. escoger FDP y FDP no centrada.Geom y con un clic en ingresarla en el recuadro Expresión numérica: donde aparece PDF. ….25 Cálculo de probabilidades con la distribución geométrica en SPSS Del Grupo de funciones: del lado derecho.25.prob) que se precisan en el recuadro central de la Figura 6.En SPSS: Para calcular las probabilidades simples (P) del ejemplo 6. Figura 6. hay que definir cada uno de los argumentos ? indicados en la función PDF. En Variable de destino: escribir P. 15.). prob = probabilidad de éxito = p = 0. 1.

26 Probabilidades acumuladas con la distribución geométrica en SPSS Para finalizar hacer clic en Aceptar y en la vista de datos aparece los resultados de la Figura 6. Figura 6.27.GEOM(x. y prob.0. proceder de manera similar al cálculo de probabilidades simples. Del Grupo de funciones: escoger FDA y FDA no centrada. 253 .Geom e ingresarla en el recuadro Expresión numérica.27.Para finalizar hacer clic en Aceptar y en la vista de datos aparece los resultados de la Figura 6.5. así: CDF. Para el cálculo de las probabilidades acumuladas (F) del ejemplo 6.26. tal como se muestra en la Figura 6. y de Funciones y variables especiales: seleccionar Cdf. con las variantes indicadas.25). Luego definir los argumentos cant. En la Variable de destino: se escribe F.

27 Distrib.3. 2.1 = número de pruebas (lanzamientos de la moneda) menos uno hasta obtener el éxito (cara). esto se calcula en R así: 254 .Figura 6.. En el ejemplo 6.5..25).5 en SPSS En R: El cálculo de probabilidades para la distribución geométrica en R se realiza con una variante en los valores de la variable que van desde cero hacia adelante. Donde y puede ser un valor o un conjunto de valores definidos previamente y p = probabilidad de éxito. 4. de probabilidades geométrica del ejemplo 6. Para ello se define una variable Y = X . Es decir que: P(X = x) = P(Y = x – 1). se definió X = el número de lanzamientos de la moneda hasta obtener cara ~ Geom (0. y 0. En la parte a) se solicita p (3) = P (X = 3) = P(Y = 2). F ( y) P(Y y) yi y P(Y yi ) p yi y q yi Para calcular probabilidades simples con la distribución geométrica usar la función dgeom(y.. la función de probabilidad y la distribución acumulativa de probabilidades para el R son: p( y) P(Y y) p q y .p)..1. Por lo tanto.5.

] P 0 0.] [8.7.140625 Si se desea determinar la distribución de probabilidades de la variable aleatoria Y.10.4.250000000 1 0.] [2. P) usar la función cbind que permite presentar los resultados de los objetos definidos en columna. así: > cbind(y.11.9.140625000 3 0.25) Para presentar la distribución de probabilidades (y.] [7.] 10 0.6.033370972 8 0.0.15) > P=dgeom(y.5.025028229 9 0.2.] [9.> dgeom(2.13.014078379 [12.8.018771172 [11.] 11 0.105468750 4 0.] [5.] [10.12.3.059326172 6 0.] [6.] [4.044494629 7 0. uno a continuación de otro.] [3.14.187500000 2 0.1.0.25) [1] 0.079101563 5 0.P) y [1.010558784 255 . primero se define el vector de valores y luego se calculan las probabilidades así: > y=c(0.

] P F 0 0.059326172 0.0.6835938 4 0.005939316 [15.] 14 0.4375000 2 0. Donde x puede ser un valor o un conjunto de valores definidos previamente.8665161 256 .25) [1] 0.5 se solicita F (2) = P (X ≤ 2) = P(Y ≤ 1).p).8220215 6 0.] [2.044494629 0.] [7.[13.007919088 [14.004454487 [16.0.F) y [1.] [3.187500000 0.250000000 0.P. En la parte b) del ejemplo 6.25) > cbind(y.105468750 0.] 15 0.079101563 0.003340865 Para calcular probabilidades acumuladas con la geométrica usar la función pgeom(y. > F=pgeom(y.5781250 3 0.] [4.7626953 5 0.140625000 0.] 13 0. p = probabilidad de éxito.] [6.] 12 0.2500000 1 0.4375 Para obtener la distribución de probabilidades y las probabilidades acumuladas efectuamos el siguiente proceso.] [5. esto se calcula en R así: > pgeom(1.

018771172 0.033370972 0.] 11 0.9249153 9 0.004454487 0. 257 .] [10.9999925 También para Y = 50: > pgeom(50.9762427 [14.9436865 [11. siendo cuestión de explorar cada uno de ellos.0.9899774 Las probabilidades acumuladas presentadas hasta aquí.005939316 0.0.9577649 [12.025028229 0.9999996 Nota: el cálculo de probabilidades para las distintas distribuciones discretas vistas y otras. para Y = 15.25) [1] 0.9866365 [16.] 13 0.] [9.8998871 8 0.010558784 0.25) [1] 0.003340865 0.] 15 0. se encuentran alrededor de 0.] 12 0. tienen la misma forma de cálculo en cada uno de los programas estudiados.007919088 0. Así tenemos que para Y = 40: el R arroja una probabilidad más cerca de uno y es la siguiente: > pgeom(40.] 14 0. por lo que existen más valores de Y cuyas probabilidades acumuladas no se han evaluado.014078379 0.9683236 [13.] 10 0.[8.9821821 [15.98998.] 7 0.

T de student y F.5 7. la varianza. Distribución F. cuyo cálculo de probabilidades esta basado en la distribución acumulativa de probabilidades F(x) = P(X ≤ x) probabilidades como: P(a ≤ X ≤ b) = F(b) – F(a) o P(X > c) = 1. MODELOS CONTINUOS DE PROBABILIDAD “Democracia: es una superstición muy difundida. Distribución chi-cuadrado. ha sido adaptado a los programas que estamos estudiando y que facilitan el cálculo de probabilidades por la simplificación de los procesos. Distribución T de student. Distribución normal. 258 . 7. un abuso de la estadística”. las mismas que permiten calcular Entre los modelos a estudiar tenemos las distribuciones: uniforme.1 INTRODUCCIÓN En el presente capítulo se presentan los modelos de probabilidad continuos cuyo cálculo basado en integrales. chi-cuadrado.7 Introducción.2 7.1 7. normal. Jorge Luis Borges CONTENIDO 7. la función de distribución acumulativa de probabilidades y las respectivas formas de cálculo de probabilidades. es decir. Distribución uniforme o rectangular.P(X ≤ c) = 1 – F(c) x f (t ) dt . En cada caso se presenta las características principales de cada distribución. exponencial.3 7. Se presentan los principales modelos de probabilidad para variables aleatorias continuas. la esperanza.6 7. la función de probabilidad.Capítulo 7.4 7. Distribución exponencial.

m. b) y la ley de probabilidades es la antes indicada.a x b b a 1 .? b) Hallar P(22 ≤ X ≤ 24). 259 .1 El tiempo en minutos que cierta persona invierte en ir de su casa a la estación del tren es un fenómeno aleatorio que obedece a una ley de distribución uniforme en el intervalo de 20 a 25 minutos. se le denota así X ~ Uniforme (a.7. x b Ejemplo 7. en punto.se dice que una variable aleatoria continua X se distribuye uniformemente en el intervalo [a. b]. si sale de su casa exactamente a las 7:05 a.x a x a .a x b b a 0 . Media y varianza de la distribución uniforme La media y la varianza de la distribución uniforme son: µ = E (X) = (a + b)/2 y σ2 = Var (X) = (b – a)2/12 La función de distribución acumulativa de probabilidades La función de distribución acumulativa de probabilidades de la uniforme esta dada por: 0 F ( x) P( X x) . si su función de densidad de probabilidades está dada por: 1 f ( x) .m. Si una variable X tiene distribución uniforme. a) ¿Cuál es la probabilidad de que alcance el tren que sale de la estación a las 7:28 a..2 DISTRIBUCIÓN UNIFORME O RECTANGULAR Definición. otros casos Los parámetros de la distribución uniforme son a y b.

Solución La variable aleatoria X = tiempo que se demora la persona en ir de su casa a la estación del tren saliendo a las 7:05 a.m. ~ Uniforme (20, 25) y la función de densidad de probabilidades esta dada por:
1 , 20 x 25 5 0 , otros casos

f ( x)

Así mismo, su función de distribución acumulativa de probabilidades es:
0 F ( x) P( X x) ,x 20

x 20 , 20 x 25 5 1 , x 25

a) Si sale de su casa a las 7:05, para que alcance el tren que sale a las 7:28, debe demorarse a lo más 23 minutos, es decir X ≤ 23, luego la probabilidad solicitada usando la función de distribución acumulativa de probabilidades es:
P( X 23) F (23) 23 20 5 3 = 0.6. 5

Significa que el 60% de las veces que sale de su casa a las 7:05 alcanzará el tren. b) P(22 ≤ X ≤ 24) = F(24) – F(22) =
24 20 5 22 20 5 2 = 0.4. 5

Veamos el procedimiento de cálculo de estas probabilidades con los programas estudiados, reiterando que en la mayoría de los casos dichos cálculos se realizan utilizando las probabilidades acumuladas. En Excel: La distribución uniforme no ha sido definida en Excel, pero con la función de distribución acumulativa de probabilidades planteada, se pueden efectuar algunos cálculos de probabilidades acumulativos definiendo la fórmula correspondiente.

260

En Minitab: Del menú escoger Calc → Probability Distributions → Uniform y aparece la ventana de diálogo de la Figura 7.1.

Figura 7.1 Probabilidad con la distribución uniforme en Minitab La función permite tres tipos de cálculos: Probabililty density (para hallar f(x) para un valor x de la variable), Cumulative probability (calcular la probabilidad acumulada hasta un valor x determinado) e Inverse cumulative probability (calcular el valor de la variable para una probabilidad acumulada dada). Las más usadas son las dos últimos. En el Ejemplo 7.1, la variable aleatoria X = tiempo que se demora la persona en ir de su casa a la estación del tren ~ Uniforme (20, 25) parámetros indicados en la Figura 7.1. Para resolver la parte a) y b) se necesita el cálculo de probabilidades acumuladas F(23), F(24) y F(22) que se explican a continuación. Para el cálculo de probabilidades acumuladas seleccionar e

indicar los parámetros de la distribución uniforme, es decir: a = 20 escrito en Lower endpoint (valor más pequeño de X) y b = 25 escrito en Upper endpoint (valor más grande de X).

261

Para efectuar el cálculo F(23) de la parte a) del Ejemplo 7.1 necesitamos seleccionar y en el recuadro escribir 23. Al hacer clic en OK, en la hoja de Session aparece este resultado: Cumulative Distribution Function Continuous uniform on 20 to 25 x 23 P( X <= x ) 0.6

Se procede del mismo modo para hallar F(24) y F(22) de la parte b). Si de antemano sabemos que se requiere calcular probabilidades acumuladas para varios valores de X, en una columna de la worksheet definimos dichos valores como x y en otra columna F(x) para obtener los resultados. Para ello, en la figura 7.1 en vez de escoger Input constant: se selecciona y escoge x en el recuadro; y en

Optional storage; se escoge F(x) para que los resultados los deposite en la misma Worksheet. Al hacer clic en OK, en la Worksheet aparecen los resultados siguientes:

De la tabla, se obtiene rápidamente P(22 ≤ X ≤ 24) = F(24) – F(22) = 0.8 – 0.4 = 0.4. Una representación gráfica de la solución anterior en Minitab (cuyo procedimiento es similar para otras distribuciones continuas), se obtiene seleccionando del menú Graph → Probability Distribution Plots, de la ventana mostrada seleccionar View Probability, luego hacer clic en OK y aparece la ventana de diálogo de la Figura 7.2. En Distribution: hacer clic en parámetros. Luego hacer clic en , escoger la distribución uniforme e indicar sus (Área a sombrear) y aparece la ventana de , luego e

diálogo de la Figura 7.3. En Define Shaded Area By escoger

indicar los valores X1 = 22 y X2 = 24 [ya que queremos hallar P(22 ≤ X ≤ 24) y el gráfico con dicha área sombreada]. Para finalizar hacer clic en OK y aparece el gráfico de la Figura 7.4.

262

Figura 7.2 Graficando probabilidades acumuladas para la uniforme en Minitab

Figura 7.3 Definiendo el área a sombrear para probabilidades acumuladas con la distribución uniforme en Minitab

263

Uniform, Lower=20, Upper=25 0.20 0.4

Distribution Plot

0.15
Density

0.10

0.05

0.00

20

22

X

24

25

Figura 7.4 Cálculo y gráfico de P(22 ≤ X ≤ 24) con la dist. uniforme en Minitab Para el cálculo del inverso de probabilidades acumuladas (calcular el valor del cuantil x, para una probabilidad acumulada dada) seleccionar Figura 7.1 e indicar los parámetros de la distribución uniforme. Para determinar el valor de x, para una probabilidad acumulada F(x) =0.05 en el Ejemplo 7.1 necesitamos seleccionar y en el recuadro escribir 0.05. Al en la

hacer clic en OK, en la hoja de Session aparece este resultado: Inverse Cumulative Distribution Function Continuous uniform on 20 to 25 P( X <= x ) 0.65 x 20.25

Cuyo gráfico (válido para la distribución uniforme y otras variables continuas) se obtiene de manera similar al anterior, sólo que en la Figura 7.3 en Define Shaded Area By se escoge , luego seleccionar (cola del lado izquierdo en

inferencia estadística) y en el recuadro de Probability: escribir 0.05. Para finalizar hacer clic en OK e inmediatamente aparece el gráfico de la Figura 7.5.

264

Uniform, Lower=20, Upper=25 0.20 0.05

Distribution Plot

0.15
Density

0.10

0.05

0.00

20 20.3

X

25

Figura 7.5 Gráfico del inverso de probab. acum. Con la dist. uniforme en Minitab Nota.- todos los procedimientos vistos aquí con el Minitab son válidos para las otras distribuciones continuas de probabilidad y que serán abreviados cuando se vea para esas otras distribuciones. En SPSS: Para calcular las densidades f(x) (f) del ejemplo 7.1, sólo para hacer el gráfico de la función, en la vista de variables se define x y en la vista de datos se ingresan los mismos (22, 23, 24, ….). Del menú escoger Transformar → Calcular variable y aparece la ventana de diálogo de la Figura 7.6. En Variable de destino: escribir f. Del Grupo de funciones: del lado derecho, escoger FDP y FDP no centrada; y de Funciones y variables especiales: seleccionar Pdf.Uniform y con un clic en ingresarla al recuadro Expresión numérica: donde aparece PDF.UNIFORM(??,?). A continuación, hay que definir cada uno de los argumentos ? indicados en la función PDF.UNIFORM(cant,mín,máx) que se precisan en el recuadro central de la Figura 7.6.

265

266 .7. por lo que para las siguientes distribuciones los obviaremos.Así cant representa los valores de la variable x. con las variantes indicadas.1. cuyos resultados no son de mucha trascendencia para variables continuas.6 Cálculo de las densidades f(x) con la distribución uniforme en SPSS Para finalizar hacer clic en Aceptar y en la vista de datos aparece los resultados de la Figura 7. mín = valor mínimo = 20 y máx = valor máximo = 25. Figura 7. tal como se muestra en la Figura 7. donde se obtenía probabilidades p(x) con esta función].8. Para el cálculo de las probabilidades acumuladas (F) del ejemplo 7. las probabilidades acumuladas son de interés por lo que serán tratadas en cada una de las distribuciones continuas que se presentan y cuyo procedimiento es similar al que se ve a continuación. pero se obtienen de manera similar en el SPSS. ya que sirven para realizar la gráfica de la distribución [distinto al caso discreto. Sin embargo. proceder de manera similar al cálculo de densidades.

Del Grupo de funciones: escoger FDA y FDA no centrada. mín = valor mínimo = 20 y máx = valor máximo = 25. 267 .En la Variable de destino: se escribe Fx.8.7 Probabilidades acumuladas con la distribución uniforme en SPSS Para finalizar hacer clic en Aceptar y en la vista de datos aparece los resultados de la Figura 7. y de Funciones y variables especiales: seleccionar Cdf. Luego definir los argumentos cant representa los valores de la variable x. Figura 7.UNIFORM(x. Figura 7. acumuladas con la distrib.25). así: CDF.Uniform e ingresarla en el recuadro Expresión numérica. uniforme en SPSS Resultados que son idénticos a los obtenidos con el Minitab.20.8 Densidades y probab.

] 22 [2. Donde x puede ser un valor o un conjunto de valores definidos previamente. 25). En el ejemplo 7. Para determinar las probabilidades acumuladas F para los valores x ya definidos y presentar las densidades f también. Donde x puede ser un valor o un conjunto de valores definidos previamente. se procede así: > F=punif(x.máx). X = tiempo que se demora la persona en ir de su casa a la estación del tren ~ Uniforme (20.2 0.1. Para determinar las densidades correspondientes a los valores 22.23.20.24) > f=dunif(x.] 22 [2.] 23 [3. mín = a = valor más pequeño de X y máx = b = valor más grande de X.2 F 0.máx).2 0.6 0.mín.mín.20.8 268 .2 0.25) > cbind(x.f) x [1.f.25) > cbind(x.2 0.En R: Para calcular las densidades con la distribución uniforme se usa la función dunif(x.4 0. 23 y 24se define un vector x con dichos valores y luego las densidades f se calculan así: > x=c(22.F) x [1.] 23 [3. mín = a = valor más pequeño de X y máx = b = valor más grande de X.] 24 f 0.2 Para calcular probabilidades acumuladas con la uniforme usar la función punif(x.] 24 f 0.

Donde p puede ser una probabilidad acumulada o un conjunto de probabilidades acumuladas definidas previamente. Media y varianza de la distribución exponencial La media y la varianza de la distribución exponencial son: µ = E (X) = 1/ λ σ2 = Var (X) = 1/ λ2 269 . se le denota así X ~ Exp (λ) y la ley de probabilidades es la antes indicada.25 Resultados idénticos a los del Minitab y del SPSS.05. Para hallar el valor del cuantil x correspondiente a una probabilidad acumulada de 0. Cabe resaltar que cualquiera de los cálculos de probabilidades con otras distribuciones es similar. se procede así: > qunif(0.3 DISTRIBUCIÓN EXPONENCIAL Definición..20.se dice que una variable aleatoria continua X tiene distribución exponencial con parámetro λ positivo.05.mín.máx).x 0 . si su función de densidad de probabilidades está dada por: e 0 x f ( x) . para una probabilidad acumulada dada) usar la función qunif(p.25) [1] 20.Para el cálculo del inverso de probabilidades acumuladas (calcular el valor del cuantil x. Si una variable X tiene distribución exponencial. otros casos El parámetro de la distribución exponencial es λ. mín = a = valor más pequeño de X y máx = b = valor más grande de X. 7.

001(1000) = 1 – e-1 = 0. x 0 Entonces las probabilidades solicitadas son: a) P(X < 1000) = F(1000) = 1 – e-0. Luego X ~ Exp (0.001 e 0 0.698806 – 0. que tiene distribución exponencial con una vida media de 1000 horas.550671 = 0. x 0 . Por lo tanto. a) ¿Qué proporción de focos no sirve antes de las 1000 horas? y b) ¿Qué proporción de focos dura entre 800 y 1200 horas? Solución La variable aleatoria X = tiempo de vida de los focos tiene distribución exponencial con media µ = 1/ λ = 1000 horas. b) P(800 ≤ X ≤ 1200) = F(1200) . x 0 Ejemplo 7.2 El tiempo de vida de un tipo de focos es una variable aleatoria X.001(800)] = = [1 .F(800) = [1 – e-0.0.La función de distribución acumulativa de probabilidades La función de distribución acumulativa de probabilidades esta dada por: 0 1 e x F ( x) P( X x) .2] – [1 .e-1. 270 .8 = 0. Veamos el cálculo de estas probabilidades acumuladas con los programas en estudio.001 x F ( x) P( X x) . otros casos Así mismo.6321 Significa que el 63. x 0 .x 0 .21% de los focos no sirve antes de las 1000 horas.001 x f ( x) .e.81% de los focos dura entre 800 y 1200 horas. Significa que el 14. la función de distribución acumulativa de probabilidades esta dada por: 0 1 e 0.001) y la función de densidad de probabilidades esta dada por: 0.001. λ = 0.148135.001(1200)] – [1 – e-0.

En Excel: Para hallar la distribución de probabilidades acumuladas exponenciales.9 Cálculo de probabilidades acumuladas con exponencial en Excel En Argumentos de función se define: el valor de X = A2 (800) para poder efectuar una copia para los demás valores de x. estando en la casilla B2. Para ello. 1000 y 1200. Al hacer enter.001 (es el valor del parámetro) y en Acum escribir VERDADERO [para obtener las probabilidades acumuladas. En la columna B.EXP y aparece la ventana de diálogo de la Figura 7. Figura 7. si se escribe FALSO se obtiene la densidad de probabilidades f(x)].9. 271 . definimos las probabilidades acumuladas F(x) para cada uno de los valores. en funciones del Excel. aparece la probabilidad acumulada F(800) = 0. Lambda = λ = 0.550671. en la hoja de cálculo definimos en la columna A los valores de la variable x = 800. escogemos Estadísticas (de seleccionar una categoría) y buscamos la función DISTR.

cuyos resultados son: En Minitab: Del menú escoger Calc → Probability Distributions → Exponential y aparece la ventana de diálogo de la Figura 7.10 Probabilidad acumulada con la distribución exponencial en Minitab La función permite tres tipos de cálculos: Probabililty density (para hallar f(x) para un valor x de la variable). En el Ejemplo 7. se efectúa una copia de lo anterior para las celdas sucesivas en B3 y B4. Para resolver la parte a) y b) se necesita el 272 . Cumulative probability (calcular la probabilidad acumulada hasta un valor x determinado) e Inverse cumulative probability (calcular el valor de la variable para una probabilidad acumulada dada). Las más usadas son las dos últimos.2. la variable aleatoria X = tiempo de vida de los focos ~ Exp (0.10.Para obtener las probabilidades acumuladas para los otros valores de x.001) parámetro indicado en la Figura 7.10. Figura 7.

698806 – 0. en la figura 7. en la Worksheet aparecen los resultados siguientes: De la tabla. en la hoja de Session aparece este resultado: Cumulative Distribution Function Exponential with mean = 1000 x 1000 P( X <= x ) 0. se obtiene rápidamente P(800 ≤ X ≤ 1200) = F(1200) – F(800) = 0. se obtiene seleccionando del menú Graph → Probability Distribution Plots. Para efectuar el cálculo F(800) de la parte a) del Ejemplo 7. F(1000) y F(1200) que se explican a continuación. La representación gráfica de la solución anterior en Minitab. de la ventana mostrada seleccionar View Probability.cálculo de probabilidades acumuladas F(800).11.632121 e indicar el parámetro requerido por la distribución exponencial en Scale.10 en vez de escoger Input constant: se selecciona y escoge x en el recuadro.148135. en una columna de la worksheet definimos dichos valores como x y en otra columna F(x) para obtener los resultados. Para el cálculo de probabilidades acumuladas seleccionar µ = 1/ λ = 1000. Al hacer clic en OK. También se puede calcular probabilidades acumuladas para varios valores de X. 273 . luego hacer clic en OK y aparece la ventana de diálogo de la Figura 7. es decir: media Se procede del mismo modo para hallar F(800) y F(1200) de la parte b). Para ello. se escoge F(x) para que los resultados los deposite en la misma Worksheet.550671 = 0. Al hacer clic en OK. y en Optional storage.2 necesitamos seleccionar y en el recuadro escribir 1000.

Luego hacer clic en escoger . En Define Shaded Area By media = 1000 en Scale. luego e indicar los valores X1 = 800 y X2 = 1200 [ya que queremos hallar P(800 ≤ X ≤ 1200) y el gráfico con dicha área sombreada].0002 0.148 0. Para finalizar hacer clic en OK y aparece el gráfico siguiente: Scale= µ = 1/ λ = 1000.0010 Distribución exponencial 0.Figura 7.11 Graficando probabilidades acum.0004 0. para la exponencial en Minitab En Distribution: hacer clic en . escoger la distribución Exponential e indicar la .0000 0 800 1200 X 274 .0008 Density 0.0006 0. Thresh=0 0.

en la hoja de Session aparece este resultado: Inverse Cumulative Distribution Function Exponential with mean = 1000 P( X <= x ) 0.2.Para el cálculo del inverso de probabilidades acumuladas (calcular el valor del cuantil x.73 horas. El valor de x. para una probabilidad acumulada dada) seleccionar Figura 7.2 necesitamos seleccionar y en el recuadro escribir 0.escala) que se precisan en el recuadro central de la Figura 7.?). escoger FDA y FDA no centrada.95 2995. Al en la hacer clic en OK.05 x 51. para una probabilidad acumulada F(x) =0. 1200).05 en el Ejemplo 7.12.95 es: Inverse Cumulative Distribution Function Exponential with mean = 1000 P( X <= x ) x 0. para una probabilidad acumulada F(x) =0. Para determinar el valor de x.29 horas. y de Funciones y variables especiales: seleccionar Cdf. Del Grupo de funciones: del lado derecho. En Variable de destino: escribir F.2933 El 5% de los focos tiene un duración menor o igual a 51. 275 .EXP(?.EXP(cant.05.10 e indicar el parámetro de la distribución exponencial. en la vista de variables se define x y en la vista de datos se ingresan los mismos (800. En SPSS: Para calcular las probabilidades acumuladas F(x) (F) del ejemplo 7. Del menú escoger Transformar → Calcular variable y aparece la ventana de diálogo de la Figura 7. hay que definir cada uno de los argumentos ? indicados en la función CDF. A continuación.12.001.Exp y con un clic en ingresarla al recuadro Expresión numérica: donde aparece CDF. 1000. Así cant representa los valores de la variable x y escala = λ = 0.73 El 95% de los focos tiene una duración menor o igual a 2995.

exponencial en SPSS En R: Para calcular probabilidades acumuladas con la exponencial usar la función pexp(x.12 Cálculo de probab.λ). con la distribución exponencial en SPSS Para finalizar hacer clic en Aceptar y en la vista de datos aparece los resultados de la Figura 7. 276 .Figura 7.13. acum.13 Probabilidades acumuladas con la distrib. Donde x puede ser un valor o un conjunto de valores definidos previamente y λ = parámetro de la exponencial. Figura 7.

05 y 0.0.05 51.5506710 0. X = tiempo de vida de los focos ~ Exp (0.2.q) p q λ = [1.1000.1200) > F=pexp(x. 1000 y 1200 se define un vector x con esos valores y luego las probabilidades acumuladas F se calculan así: > x=c(800.F) x [1.λ). Para hallar el valor del cuantil q correspondiente a las probabilidades acumulada de 0.001) > cbind(x.0.95 2995. Donde p es una o un conjunto de probabilidades acumuladas definidas previamente y parámetro de la exponencial.001).] 1200 Para el cálculo del inverso de probabilidades acumuladas (calcular el valor del cuantil x o q.6988058 [2.] 0.0.05.73227 277 .En el ejemplo 7. para una probabilidad acumulada dada) usar la función qexp(p.95) > q=qexp(p.] 800 F 0.] 0.29329 [2.95 se procede así: > p=c(0.001) > cbind(p.6321206 0.] 1000 [3. Para determinar las probabilidades acumuladas correspondientes a los valores 800.

6 0.7 0..2 0.se dice que una variable aleatoria continua X tiene distribución normal con parámetros µ y σ2. si su función de densidad de probabilidades está dada por: f ( x) 2 1 2 (x )2 2 e 2 .0 µ X La función de distribución acumulativa de probabilidades La función de distribución acumulativa de probabilidades esta dada por: 278 . x La distribución normal es simétrica respecto a µ. La gráfica de la distribución normal tiene la siguiente forma: Distribution Normal Mean = µ.7. StDev = σ 0.4 DISTRIBUCIÓN NORMAL Definición.4 0.1 0. se le denota así X ~ N (µ y σ2) y la ley de probabilidades es la antes indicada.8 0.3 0. Media y varianza de la distribución normal La media y la varianza de la distribución normal son: E (X) = µ y Var (X) = σ2 Si una variable aleatoria X tiene distribución normal con media µ y varianza σ2.5 Density 0.

permitiendo el cálculo de probabilidades cuando X se encuentra entre dos números reales a y b del siguiente modo: P(a ≤ X ≤ b) = P[(a .µ) /σ ≤ (b . Problema que es resuelto mediante el proceso de estandarización (transformación) de la variable X ~ N (µ..es el proceso por el cual una variable aleatoria X ~ N (µ. 1). Estandarización.µ) /σ) . 1) llamada distribución normal estándar. σ2) se transforma en otra variable aleatoria Z X ~ N (0.µ) /σ] = Φ((b . para z > 0. σ2) en otra variable Z X ~ N (0. z La función de distribución acumulada de la distribución normal estándar se denota y define así: z t 1 2 e dt .µ) /σ ≤ Z ≤ (b .Φ(z). Se cumple que Φ(-z) = 1 . σ2) y se define la variable Z variable aleatoria Z tiene distribución normal estándar densidad de probabilidades esta dada por: 1 e 2 z2 2 X entonces la = N (0.F ( x) P( X x) x 1 2 2 (t )2 2 e 2 dt Calcular estas probabilidades acumuladas es complicado ya que los cálculos varían para cada media y cada varianza. 2 2 Φ(z) = P( Z z) Estas probabilidades han sido calculadas y aparecen en la denominada tabla de la distribución normal estándar y facilitada por el uso de los programas estadísticos como los que estamos estudiando.µ) /σ ≤ (X .µ) /σ) 279 . 1) y su función de f ( z) .µ) /σ] = = P[(a .Φ((b . La distribución normal estándar Si una variable aleatoria X ~ N (µ.

y c) ¿por debajo de que diámetro se encuentra el 95% de los tubos? Solución La variable aleatoria X = diámetro de los tubos en mm.53 1.25% de los tubos fabricados tienen diámetro entre 8.8 0.95 = x.53 9 9.8 ~ N (0.8 0.5 y 11.3 utilizando los programas y basados fundamentalmente en las probabilidades acumuladas de la normal. Z 0. si no se aceptan diámetros inferiores a 9 mm?.0. 0.53 0. Veamos la solución del ejemplo 7.0 mm?. 280 .0 mm.53).8 0.53 1. tal que: 0.99966 .Ejemplo 7.5 y 11.67 mm.95 = P(X ≤ x) = P Z x 9.99252.8 0.8 → 0. Estandarizando se tiene que Z X 9. b) P(8..53 mm.53 a) Se rechazan los tubos si X < 9 mm.06552 P( X 9) P P( Z Significa que alrededor del 6. Significa que alrededor del 99.95 Significa que el 95% de los tubos fabricados tienen un diámetro de alrededor de los 10. a) ¿Qué proporción de tubos serán rechazados. entonces: X 9.8.51) = Φ(-1.51) = 0.45 Z 3.5 9.00714 = 0.40) . b) ¿Qué proporción de tubos tiene un diámetro entre 8.8 0. y desviación estándar de 0.67 mm.0) = P 8.40) = Φ(3.645 → x = 10.53 P( 2.53 X 9. ~ N (9.45) = 0.3 Los diámetros de los tubos fabricados por cierta máquina tienen distribución normal con media de 9.Φ(-2. 1) 0.8 mm.8 x 9. c) Necesitamos halla el cuantil q0.53 9 9.55% de los tubos fabricados será rechazado.5 ≤ X ≤ 11.

Figura 7.NORM y aparece la ventana de diálogo de la Figura 7. En la columna B. aparece la probabilidad acumulada F(8.53 y en Acum escribir VERDADERO [para obtener las probabilidades acumuladas.5. escogemos Estadísticas (de seleccionar una categoría) y buscamos la función DISTR.14 Cálculo de probabilidades acumuladas con la normal en Excel En Argumentos de función se define: el valor de X = A2 (8. 9. Para hallar las probabilidades acumuladas.5) = 0. definimos las probabilidades acumuladas F(x). 281 . estando en la casilla B2.8.007087. en funciones del Excel. en la hoja de cálculo definimos en la columna A los valores de la variable x = 8. Al hacer clic en Aceptar. Media = µ = 9. si se escribe FALSO se obtiene la densidad de probabilidades f(x)].5) para poder efectuar una copia para los demás valores de x.14. Desv_estándar = σ = 0.0.En Excel: Para hallar la distribución de probabilidades acumuladas normales.0 y 11.

En el Ejemplo 7. Para hallar el inverso de probabilidades acumuladas (calcular el valor del cuantil x .3. para una probabilidad acumulada = p) usar la función DIST. 0.8. ya que éste internamente hace la estandarización y da una mejor aproximación. En Minitab: Del menú escoger Calc → Probability Distributions → Normal y aparece la ventana de diálogo de la Figura 7. resultados que difieren de los acumulados F(x) encontrados con el programa.Para obtener las probabilidades acumuladas para los otros valores de x.NORM.0) y F(11.NORM. La función permite tres tipos de cálculos: Probabililty density (para hallar f(x) para un valor x de la variable). Las más usadas son las dos últimos. se hizo una aproximación de los valores Z.53) en el recuadro al lado de anteriormente hallado. µ. σ) que para la parte c) del ejemplo 7. Para resolver la parte a) y b) se necesita el cálculo de probabilidades acumuladas F(8. F(9. Cumulative probability (calcular la probabilidad acumulada hasta un valor x determinado) e Inverse cumulative probability (calcular el valor de la variable para una probabilidad acumulada dada). el Excel también permite obtener los Φ(z) con la función DIST.5). cuyos resultados son: Nota.INV(p. la variable aleatoria X = diámetro de los tubos en mm.NORM.15. 282 .0) que se explican a continuación.0. ~ N (9.9. se efectúa una copia de lo anterior para las celdas sucesivas en B3 y B4.95.15. para poder usar la “vieja” tabla de la distribución normal estándar.para hallar los resultados iniciales del ejemplo 7. Sin embargo.INV(0.3.53) parámetro indicado en la Figura 7.3 escribir =DIST.ESTAND(z). similar al .67177 mm.. al hacer enter se obtiene x = 10. Tal como se muestra en los resultados anteriores difieren los F(x) y Φ(z).8.

en una columna de la worksheet definimos dichos valores como x y en otra columna F(x) para obtener los resultados.15 Probabilidad acumulada con la distribución normal en Minitab Para el cálculo de probabilidades acumuladas seleccionar 9.8 and standard deviation = 0.15 en vez de escoger Input constant: se selecciona y escoge x en el recuadro.0) y F(11.5 P( X <= x ) 0.5. en la figura 7. y en Optional storage: se escoge 283 . También se puede calcular probabilidades acumuladas para varios valores de X. en la hoja de Session aparece este resultado: Cumulative Distribution Function Normal with mean = 9. Para ello. Para efectuar el cálculo F(8.Figura 7.0).0070869 e indicar los parámetros requeridos por la distribución normal en Mean = media = µ = Se procede del mismo modo para hallar F(9.53.5) de la parte b) del Ejemplo 7.53 x 8. Al hacer clic en OK.8 y en Standard deviation = desviación estándar = σ = 0.3 necesitamos seleccionar y en el recuadro escribir 8.

5 ≤ X ≤ 11. En Define Shaded Area By escoger .16.0) – F(8. 284 . Figura 7.99252 encontrado en b).8 y σ .5) = 0.16 Graficando probabilidades acumuladas con la normal en Minitab En Distribution: hacer clic en = 0.53. e indicar los valores X1 = 8.007087 = 0.0) = F(11.988218 – 0.0 [ya que queremos hallar P(8. luego hacer clic en OK y aparece la ventana de diálogo de la Figura 7.F(x) para que los resultados los deposite en la misma Worksheet. Ligeramente diferente al 0. Luego hacer clic en luego . Al hacer clic en OK. La representación gráfica de la solución anterior en Minitab. se obtiene rápidamente P(8.981131.5 ≤ X ≤ 11. se obtiene seleccionando del menú Graph → Probability Distribution Plots. escoger la distribución Normal e indicar µ = 9.0) y el gráfico con dicha área sombreada]. de la ventana mostrada seleccionar View Probability.5 y X2 = 11. en la Worksheet aparecen los resultados siguientes: De la tabla.

0 8. para una probabilidad acumulada F(x) =0.3 0. StDev=0.5 P(8.0) = 0. Para determinar el valor de x. para una probabilidad acumulada dada) seleccionar Figura 7.8 X 11 Para el cálculo del inverso de probabilidades acumuladas (calcular el valor del cuantil x.2 0.8.3.5 9.8 and standard deviation = 0.6 0.6718 mm. Al hacer clic en OK. 285 . en la vista de variables se define x y en la vista de datos se ingresan los mismos (8.95 x 10.95.Para finalizar hacer clic en OK y aparece el gráfico siguiente: Distribution Normal Mean=9.4 0.0.15 e indicar los parámetros de la distribución normal.8 0.1 0. En SPSS: Para calcular las probabilidades acumuladas F(x) (F) del ejemplo 7. 9.53 0.95 en la parte c) del Ejemplo 7.5.981 Density 0. 11.0).5 ≤ X ≤ 11.53 P( X <= x ) 0. en la hoja de Session aparece este resultado: Inverse Cumulative Distribution Function Normal with mean = 9.7 0.3 necesitamos seleccionar y en el recuadro escribir en la 0.6718 El 95% de los tubos tiene un diámetro menor o igual a 10.

17.8 y desv_típ = σ = 0. escoger FDA y FDA no centrada.17 Cálculo de probab. acumuladas con la distribución normal en SPSS Para finalizar hacer clic en Aceptar y en la vista de datos aparece los resultados de la Figura 7. Los resultados obtenidos son idénticos a los del Excel y Minitab.?). 286 .?.Normal y con un clic en ingresarla al recuadro Expresión numérica: donde aparece CDF.NORMAL(cant.18. Del Grupo de funciones: del lado derecho.media.desv_típ) que se precisan en el recuadro central de la Figura 7. Figura 7. En Variable de destino: escribir F. hay que definir cada uno de los argumentos ? indicados en la función CDF.17.Del menú escoger Transformar → Calcular variable y aparece la ventana de diálogo de la Figura 7. Así cant representa los valores de la variable x. A continuación. media = µ = 9.53. y de Funciones y variables especiales: seleccionar Cdf.NORMAL(?.

0 Para el cálculo del inverso de probabilidades acumuladas (calcular el valor del cuantil x o q.95 se procede así: > qnorm(0.9.0) > F=pnorm(x. 9. µ = media.µ.0 se define un vector x con esos valores y luego las probabilidades acumuladas F se calculan así: > x=c(8.] [2.67177 El 95% de los tubos tiene un diámetro menor o igual a 10.0 y 11. ~ N (9.8.] 11.007086862 0.σ).6718 mm. 287 .0.8.5 9. Para hallar el valor del cuantil q correspondiente a las probabilidades acumulada de 0.5.988217584 [3. para una probabilidad acumulada dada) usar la función qnorm(x.065593960 0.0. X = diámetro de los tubos en mm.F) x [1.53) [1] 10.σ).µ.Figura 7.95.18 Probabilidades acumuladas con la distribución normal en SPSS En R: Para calcular probabilidades acumuladas con la exponencial usar la función pnorm(x. 0.53) > cbind(x.] 8. Donde p es una o un conjunto de probabilidades acumuladas definidas previamente.9. En el ejemplo 7.532). y σ = desviación estándar.8. Donde x puede ser un valor o un conjunto de valores definidos previamente.9.3.5.11.0 F 0.0. Para determinar las probabilidades acumuladas correspondientes a los valores 8.

asociadas a formas Si la variable aleatoria X tiene distribución chi-cuadrado con r grados de libertad.7.. r = grados de libertad (GL) representa el número de variable aleatorias independientes que se suman o el número de variables que pueden variar libremente.. la variable aleatoria x² Z12 2 Z2 . entero positivo  .Sean Z1. Zi ~ N(0 . cada una con distribución normal estándar.. en otros casos ( n) 1 2 0 X n 1e x dx . 1) . variables aleatorias independientes. En regresión y econometría es el rango de una matriz (máximo número de columnas linealmente independientes) cuadráticas delas sumas de cuadrados.. Media y varianza de la distribución chi-cuadrado La media y la varianza de la distribución chi-cuadrado son: = E(x²) = r y ² = Var(x²) = 2r La función de distribución acumulativa de probabilidades El cálculo de probabilidades para la variable aleatoria chi-cuadrado.5 DISTRIBUCIÓN CHI-CUADRADO Definición. Z r2 tiene una distribución chi-cuadrado con r grados de libertad. Z2. . n > 0. se efectúa utilizando las Tablas de Chi – Cuadrado. la denotaremos como X ~ X r2 .. ( n) = (n – 1)! . Zr. las mismas que han sido elaboradas 288 . 0<x< = 0 Donde:  Γ representa el gamma de un número.. si su función de densidad de probabilidades está dada por: f X 2 ( x) = 1 2 r 2 r r 2 x2 e 1 x/2 . Además. Entonces. Si n es .

6 y 37.03 0. df=25 0. Entonces. representada por: PX X2 .00 α Xα X Ejemplo 7.05 0.7?. 0≤ ≤1 Está dada por: PX x 2 x2 0 f X 2 x dx x2 0 1 2 r 2 r 2 x r 1 2 e dx x 2 y su gráfica es: Distribution chi-cuadrado Chi-Square. Hallar: a) ¿Qué proporción de valores de X son mayores que 40.6?. y c) ¿por debajo de que valor se encuentra el 10% de los valores de X? Solución 2 La variable aleatoria X ~ X 25 .04 Density 0. la probabilidad que la variable aleatoria X con distribución xr2 1 r 30 sea menor o igual a un valor constante x 2 .06 0.02 0.01 0. usando la tabla de chi-cuadrado se tiene que: 289 . b) ¿Qué proporción de valores de X se encuentran entre 14.utilizando la función de distribución acumulativa de probabilidades que en la mayoría de los casos son del tipo de acumulación menor o igual que. Así tenemos que.4 2 Si la variable aleatoria X ~ X 25 .

estando en la casilla B2.4 utilizando los programas y basados fundamentalmente en las probabilidades acumuladas de la chi-cuadrado.6.19.7) = P[ X 25 ≤ 37. Una forma directa de cálculo es escribir =DISTR.25) en el recuadro al lado de Aceptar. .7.950239. definimos las probabilidades acumuladas.7 y 40.0. 2 Significa que el 2.6.5 2 Significa que el 10% de los valores de X ~ X 25 son menores que 16.CHI y aparece la ventana de Argumentos de función donde se define: el valor de X = A2 (14.10 = 16. se efectúa una copia de lo anterior para las celdas sucesivas en B3 y B4.10 = x.5% de los valores de X ~ X 25 son mayores que 40. Veamos la solución del ejemplo 7.P[ X 25 ≤ 14.95 – 0. 2 2 b) P(14. c) Necesitamos halla el cuantil q0.P[ X 25 ≤ 40.90 2 Significa que el 90% de los valores de X ~ X 25 se encuentran entre 14. y en el recuadro de Grados_de libertad escribir 25. aparece la probabilidad acumulada F(14.025.CHI(A2. los resultados se presentan en la Figura 7.6] = 1 – 0.6. que en Excel vienen dadas por F(x) = P(X > x).975 = 0.7] .6 y 37. Al hacer clic en 290 .2 a) P[X > 40.6) para poder efectuar una copia para los otros valores de x. tal que: 2 2 0.6] = 0. En la columna B. en la hoja de cálculo definimos en la columna A los valores de la variable x = 14.6] = 1 . Para obtener las probabilidades acumuladas para los otros valores de x.6 ≤ X ≤ 37. Se puede apreciar que se ha calculado una columna de 1 – F(x) cuyos resultados son parecidos a los usados en la solución manual del Ejemplo 7. En Excel: Para hallar la distribución de probabilidades acumuladas chi-cuadrado.6) = 0. 37.10 = P( X 25 ≤ x) → x = X 25.4. Para hallar las probabilidades acumuladas.5.05 = 0. en funciones del Excel. escogemos Estadísticas (de seleccionar una categoría) y buscamos la función DISTR.

25) al hacer enter se obtiene x = 16. en una columna de la worksheet definimos como x los valores 14. y en otra columna F(x) para obtener los resultados. Al hacer clic en OK.90. para una probabilidad acumulada = p) usar la función PRUEBA. El procedimiento de cálculo es similar al ejecutado con las distribuciones de probabilidades antes vistas. en la Worksheet aparecen los resultados siguientes: 291 .7 y 40.INV(0. el cálculo para una constante (Input constant. con los resultados en la worksheeet) que usaremos de aquí en adelante. En Minitab: Del menú escoger Calc → Probability Distributions → Chi-Square y aparece la ventana de diálogo Chi-Square Distribution. 37.6.CHI.CHI.4 es PRUEBA. GL) que para la parte c) del ejemplo 7.4734 similar al 16.Figura 7. Para el cálculo de probabilidades acumuladas seleccionar e indicar el parámetro requerido Degrees of freedom (grados de libertad) escribir 25 en el recuadro. seleccionar y escoge x en el recuadro. Es decir.INV(1-p.19 Cálculo de probabilidades acumuladas con la chi-cuadrado en Excel Para hallar el inverso de probabilidades acumuladas (calcular el valor del cuantil x . Para ello.6. y en Optional storage: se escoge F(x) para que los resultados los deposite en la misma Worksheet.5 hallado con la tabla de chi-cuadrado. con el resultado en la ventana Session) o para varios valores definidos previamente en una columna de la Worksheet (Input column.4. Para calcular las probabilidades acumuladas para los valores de X del ejemplo 7.

escoger la distribución Chi-Square e indicar el parámetro requerido Degrees of freedom (grados de libertad) escribir 25 en el recuadro.6 y X2 = 37.6 X 37.6) = 0.03 0.20 Gráfico de P(14. Ligeramente diferente al 0.Resultados idénticos a los obtenidos con el Excel en la columna 1 – F(x).06 0.05 0. En Define Shaded Area By escoger .7 [ya que queremos hallar P(14. se obtiene seleccionando del menú Graph → Probability Distribution Plots.90 encontrado en b). Distribution Plot Chi-Square. De la tabla.00 14. luego hacer clic en OK y aparece la ventana de diálogo Probability Distribution Plot – Probability.901 0.7 Figura 7. La representación gráfica de la solución anterior en Minitab.6 ≤ X ≤ 37.6 ≤ X ≤ 37. luego e indicar los valores X1 = 14.02 0.900765. Luego hacer clic en . En Distribution: hacer clic en .6 ≤ X ≤ 37.01 0.7) = F(37.20.950526 – 0.7) con la chi-cuadrado en Minitab 292 . Para finalizar hacer clic en OK y aparece el gráfico de la Figura 7.049761 = 0. se obtiene rápidamente P(14. de la ventana mostrada seleccionar View Probability.04 Density 0.7) – F(14.7) y el gráfico con dicha área sombreada]. df=25 0.

escoger FDA y FDA no centrada. en la vista de variables se define x y en la vista de datos se ingresan los mismos (14. y de Funciones y variables especiales: seleccionar Cdf. Así cant representa los valores de la variable x y gl = grados de libertad = 25.4734 2 El 10% de los valores de X ~ X 25 son menores que 16.CHISQ(?.4. 37. Para determinar el valor de x.21.4 necesitamos seleccionar y en el recuadro escribir en la 0. para una probabilidad acumulada F(x) =0.gl) que se precisan en el recuadro central de la Figura 7. En SPSS: Para calcular las probabilidades acumuladas F(x) (F) del ejemplo 7.5. Del menú escoger Transformar → Calcular variable y aparece la ventana de diálogo de la Figura 7.1 x 16. Del Grupo de funciones: del lado derecho.10.21. En Variable de destino: escribir F.CHISQ(cant. 40.6). A continuación.Para el cálculo del inverso de probabilidades acumuladas (calcular el valor del cuantil x. en la hoja de Session aparece este resultado: Inverse Cumulative Distribution Function Chi-Square with 25 DF P( X <= x ) 0. para una probabilidad acumulada dada) seleccionar ventana de diálogo Chi-Square Distribution e indicar los grados de libertad 25.?).Chisq y con un clic en ingresarla al recuadro Expresión numérica: donde aparece CDF.10 en la parte c) del Ejemplo 7. hay que definir cada uno de los argumentos ? indicados en la función CDF. Al hacer clic en OK.7.6. Para finalizar hacer clic en Aceptar y en la vista de datos aparece los resultados siguientes: 293 .

6 F 0.] 14. 37. Donde x puede ser un valor o un conjunto de valores definidos previamente. 2 En el ejemplo 7. Para determinar las probabilidades acumuladas correspondientes a los valores 14.7 y 40.25) > cbind(x.04976093 294 . gl = grados de libertad.7.21 Cálculo de probab.6 se define un vector x con esos valores y luego las probabilidades acumuladas F se calculan así: > x=c(14. X ~ X 25 .Figura 7.gl).6) > F=pchisq(x.F) x [1.4.6.6.37. acumuladas con la chi-cuadrado en SPSS En R: Para calcular probabilidades acumuladas con la chi-cuadrado usar la función pchisq(x.40.

7 [3. Sea X2 ~ X r2 una variable aleatoria que tiene una distribución chi-cuadrado con r grados de libertad.<t< Notación: decir que la variable aleatoria T tiene distribución t con r grados de libertad.6 0. 295 .) Z X2 r Z r ~ tr Y T tiene una distribución t . . 7..10 se procede así: > qchisq(0. la denotaremos como T ~ t r .] 37.97471962 Para el cálculo del inverso de probabilidades acumuladas (calcular el valor del cuantil x o q. para una probabilidad acumulada dada) usar la función qchisq(x.25) [1] 16.95052629 0. y su función de densidad de probabilidades está dada por: r 1 2 r r 2 t² 1 r r 1 2 f t .10.Sea Z una variable aleatoria normal estándar N(0. Donde p es una o un conjunto de probabilidades acumuladas definidas previamente.5.] 40. entonces la variable aleatoria (v. con r grados de libertad.6 DISTRIBUCIÓN T DE STUDENT Definición.47341 2 El 10% de los valores de X ~ X 25 son menores que 16.gl). y si Z y X2 son independientes. Para hallar el valor del cuantil q correspondiente a las probabilidades acumulada de 0. 1).a.[2.

se efectúa utilizando las Tablas de t.3 Density 0.0 Tα 0 X 296 .4 0. 0< <1 PT t t f t dt r 1 2 r r 2 t² 1 r r 1 2 dt cuya representación gráfica es la siguiente: Distribution t gl = df=25 0.Media y Varianza: La media y la varianza de la v.2 0.El cálculo de probabilidades para variable aleatoria t.1 α 0. representada por: PT t Está dada por: t . . T con r grados de libertad son: E(T) = Var(T) = 2 T T =0 r r 2 . las mismas que han sido elaboradas utilizando la función de distribución acumulativa de probabilidades que en la mayoría de los casos son del tipo de acumulación menor o igual que. Así tenemos que. a. r>1 r>2 Función de Distribución Acumulativa de Probabilidades. la probabilidad que la variable aleatoria T con distribución tr (1 r < 30) sea menor o igual a un valor constante t .

5% de los valores de X ~ T25 se encuentran entre -1. 0. Hallar: a) ¿Qué proporción de valores de X son mayores que 2. Significa que el 1.875 Significa que el 87.05 = P(T25 ≤ x) → x = T25. definimos las probabilidades acumuladas. tal que: 0.05 = x.316] = = P[T25 ≤ 2.975 – {1 . que en Excel vienen dadas por F(x) = P(X > x). Entonces.5 Si la variable aleatoria X ~ T25.485.708 Significa que el 5% de los valores de X ~ T25 son menores que -1.316 y 2.485] = 1 – 0.P[T25 ≤ 1. 297 .485?.708.P[T25 ≤ -1.316 ≤ X ≤ 2. b) P(-1. b) ¿Qué proporción de valores de X se encuentran entre -1. En la columna B. en la hoja de cálculo definimos en la columna A los valores de la variable x = 1. 2.316]} = 0. y c) ¿por debajo de que valor se encuentra el 5% de los valores de X? Solución La variable aleatoria X ~ T25.5 utilizando los programas y basados fundamentalmente en las probabilidades acumuladas de la distribución t.485] = 1 .060] – {1 . Veamos la solución del ejemplo 7.F(a) Ejemplo 7.06. usando la tabla de t se tiene que: a) P[X > 2.060?. c) Necesitamos halla el cuantil q0.060) = P[T25 ≤ 2.05 = -1.316. Excel considera x > 0 y en el cálculo usar la simetría.316 y 2.99 = 0.P[T25 ≤ 2.060] .P[ T ≤ a] = 1 .0% de los valores de X ~ T25 son mayores que 2. En Excel: Para hallar la distribución de probabilidades acumuladas T.90} = 0.La distribución t es una distribución simétrica como la normal y se cumple que: F(-a) = P[ T ≤ -a] = 1 .485.0.01.060 y 2.

T. Para la parte c) del ejemplo 7.316) para poder efectuar una copia para los otros valores de x. Para obtener las probabilidades acumuladas para los otros valores de x. con el resultado en la ventana Session) o para varios valores definidos previamente en una columna de la Worksheet (Input column. Al Figura 7.708 hallado con la tabla de T. en el recuadro de Grados_de libertad escribir 25 y en colas escribir 1. 25) al hacer enter se obtiene x = 1. para una probabilidad acumulada = p) usar la función DISTR.100057. el cálculo para una constante (Input constant. Se puede apreciar que se ha calculado una columna de 1 – F(x) cuyos resultados son parecidos a los usados en la solución manual del Ejemplo 7.22 Cálculo de probabilidades acumuladas con la t en Excel Para hallar el inverso de probabilidades acumuladas (calcular el valor del cuantil x . El procedimiento de cálculo es similar al ejecutado con las distribuciones de probabilidades anteriores. GL) que es para 2 colas (por eso 2p).T(A2.708141(en valor absoluto) similar al -1.T.316) = 0.25. 298 . Una forma directa de cálculo es escribir =DISTR. se efectúa una copia de lo anterior para las celdas sucesivas en B3 y B4. escogemos Estadísticas (de seleccionar una categoría) y buscamos la función DISTR.T y aparece la ventana de Argumentos de función donde se define: el valor de X = A2 (1. Es decir. en funciones del Excel.1) en el recuadro al lado de hacer clic en Aceptar.INV(0.Para hallar las probabilidades acumuladas. los resultados se presentan en la Figura 7. aparece la probabilidad acumulada F(1.5 es DISTR.4. estando en la casilla B2.INV(2p.10. .22. con los resultados en la worksheeet) que se esta usando. En Minitab: Del menú escoger Calc → Probability Distributions → t y aparece la ventana de diálogo t Distribution.

Para el cálculo de probabilidades acumuladas seleccionar e indicar el parámetro requerido Degrees of freedom (grados de libertad) escribir 25 en el recuadro.316 ≤ X ≤ 2. escoger la distribución t e indicar el parámetro requerido Degrees of freedom (grados de libertad) escribir 25 en el recuadro.316.874967.060) y el gráfico con dicha área sombreada]. En Distribution: hacer clic en .23. Luego hacer clic en . en una columna de la worksheet definimos como x los valores -1.875 encontrado en b). se obtiene rápidamente P(-1.316 ≤ X ≤ 2. Para calcular las probabilidades acumuladas para los valores de X del ejemplo 7.485. Aproximadamente el 0. de la ventana mostrada seleccionar View Probability. y en Optional storage: se escoge F(x) para que los resultados los deposite en la misma Worksheet.060) = F(2.316 y X2 = 2. 299 .060) – F(-1.5.060 [ya que queremos hallar P(-1. Para ello.316) = 0. La representación gráfica de la solución anterior en Minitab. en la Worksheet aparecen los resultados siguientes: Resultados idénticos a los obtenidos con el Excel en la columna 1 – F(x). se obtiene seleccionando del menú Graph → Probability Distribution Plots.060 y 2.975024 – 0.100057 = 0. Para finalizar hacer clic en OK y aparece el gráfico de la Figura 7. Al hacer clic en OK. y en otra columna F(x) para obtener los resultados. luego e indicar los valores X1 = -1. En Define Shaded Area By escoger . 2. seleccionar y escoge x en el recuadro. luego hacer clic en OK y aparece la ventana de diálogo Probability Distribution Plot – Probability. De la tabla.

23 Gráfico de P(-1. 2. para una probabilidad acumulada F(x) =0. en la vista de variables se define x y en la vista de datos se ingresan los mismos (-1. En SPSS: Para calcular las probabilidades acumuladas F(x) (F) del ejemplo 7.70814 El 5% de los valores de X ~ T25 son menores que -1.485).4 0.Distribution T gl = df=25 0.0 -1.316 ≤ X ≤ 2.05 en la parte c) del Ejemplo 7.875 0.2 0. Para determinar el valor de x.4 necesitamos seleccionar y en el recuadro escribir en la 0. Al hacer clic en OK.70814. para una probabilidad acumulada dada) seleccionar ventana de diálogo Chi-Square Distribution e indicar los grados de libertad 25. 300 .060 y 2.1 0.316 0 X 2.06 Figura 7.316. en la hoja de Session aparece este resultado: Inverse Cumulative Distribution Function Student's t distribution with 25 DF P( X <= x ) 0.3 Density 0.05 x -1.5.05.060) con la t en Minitab Para el cálculo del inverso de probabilidades acumuladas (calcular el valor del cuantil x.

24.T(?. acumuladas con la t en SPSS 301 . Así cant representa los valores de la variable x y gl = grados de libertad = 25.T y con un clic en al recuadro Expresión numérica: donde aparece CDF. hay que definir cada uno de los argumentos ? indicados en la función CDF.T(cant.Del menú escoger Transformar → Calcular variable y aparece la ventana de diálogo de la Figura 7.gl) que se precisan en el recuadro central de la Figura 7. escoger FDA y FDA no centrada.24. y de Funciones y variables especiales: seleccionar Cdf.?).24 Cálculo de probab. Del Grupo de funciones: del lado derecho. A continuación. Para finalizar hacer clic en Aceptar y en la vista de datos aparece los resultados siguientes: ingresarla Figura 7. En Variable de destino: escribir F.

9899976 Para el cálculo del inverso de probabilidades acumuladas (calcular el valor del cuantil x o q.1000570 0.485) se define un vector x con esos valores y luego las probabilidades acumuladas F se calculan así: > x=c(-1.060 y 2. gl = grados de libertad. Para determinar las probabilidades acumuladas correspondientes a los valores (-1.En R: Para calcular probabilidades acumuladas con la T usar la función pt(x.25) > cbind(x.gl). X ~ T25.25) [1] -1.9750238 0. 2.485 F 0.] [3.2. En el ejemplo 7.2.] -1.F) x [1.316 [2.485) > F=pt(x. Para hallar el valor del cuantil q correspondiente a las probabilidades acumulada de 0. Donde x puede ser un valor o un conjunto de valores definidos previamente.060. Donde p es una o un conjunto de probabilidades acumuladas definidas previamente. para una probabilidad acumulada dada) usar la función qt(x. 302 .316.] 2.708141 El 5% de los valores de X ~ T25 son menores que -1.05 se procede así: > qt(0.5.gl).708141.05.316.060 2.

Colombia. España. Manual pdf.inei. Resolución Jefatural Nº 312-2006 INEI.pdf 2. Editorial Mc Graw-Hill. “Estadística descriptiva y probabilidades”.gob. “Exploratory Data Analysis”. http://knuth. Bazán. España. “Estadística Básica con R y R-Commander”. Correa. Madrid. “Norma Técnica para la elaboración de cuadros estadísticos”.pdf 6. Lima. César (2002). Tukey.REFERENCIAS BIBLIOGRÁFICAS 1. Posgrado en Estadística de la Universidad Nacional de Medellín. 1997. 4. Callao.gob. 8. John Wilder. “Gráficos estadísticos con R”.pe/ . UCA. Perú. publicada en la página web: http://www. Massachusetts. “Estadística aplicada a través de Excel”. publicada en la página web: http://www. 299 p. Pérez. Instituto Nacional de Estadística e Informática (2009). Francia. Perú. Ahumada. Fondo Editorial Universidad de Lima.pe/documentospublicos/nt_cestadisticos. 10. Emmanuel (2002). Juan y Corbera. Editorial Pearson-Prentice Hall.J. 156 p. Adisson-Wesley Publishing Company: Reading.es/repos/ebrcmdr/pdf/actual/ebrcmdr. Nelfy (2002). 9. 2003. 5. Documento HTML. 294 p. 1977. Instituto Nacional de Estadística e Informática (2006). 3. Bienvenido. 596 p. “Análisis estadístico con SPSS para Windows”. José (1997). “R para principiantes”. University of Hawai. Paradis. Perú en cifras.uca. Traducido por Jorge A. 61 p. Visauta. Universidad de Cádiz. Trabajo de investigación para la Facultad de Ciencias Económicas de la Universidad Nacional del Callao. Censos Nacionales de Población y Vivienda. Juan y González. Manual pdf del Institut des Sciences de l‟Évolution Universit Montpellier II. Madrid.apendices. y Otros (2008). “Problemas de probabilidad”. Chué. F-34095 Montpellier cdex 05. Jorge y Otros (2007).inei. 303 . 7. “Indicadores Demográficos-Población”. Arriaza A.

304 .

ANEXO 305 .

30 11.19 12. fam 3900 800 1000 1200 800 1000 700 1000 600 3000 800 1800 1200 1000 1600 750 3000 2800 2000 4500 3500 2200 4000 1000 800 800 950 1000 1500 1800 1000 4000 800 800 800 900 3000 2000 1300 2500 600 750 2100 2500 600 800 mie.60 12.30 13.BASE DE DATOS: ESTADÍSTICA BÁSICA 09-A nº_cuest 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 sexo 1 1 1 1 1 2 2 2 2 1 2 1 2 1 2 1 1 1 2 1 1 2 1 2 2 2 2 2 1 1 1 2 1 1 2 2 1 2 2 1 2 1 1 2 1 1 edad 21 16 20 20 21 19 19 17 19 19 22 20 19 18 17 20 18 18 18 23 19 20 20 22 21 23 19 19 20 19 18 20 20 21 18 21 19 19 19 21 19 20 20 19 21 21 peso 68 69 63 55 57 48 50 50 44 60 52.6 80 52 67 46 80 64 64 63 72 65 47 70 50 53 66 57 50.35 12.00 12.aprob 36 42 38 42 34 42 38 42 50 39 50 38 38 50 30 47 35 35 35 44 42 39 35 43 43 40 34 25 31 35 34 37 34 38 34 50 34 38 37 34 40 27 30 38 50 43 prom.49 12.20 12.00 13.00 14.00 11.33 13.95 12.00 11.00 13.92 13.5 49 70 48 60 75 55 51 72 talla 169 172 170 173 167 152 152 156 154 171 160 176 164 171 154 177 169 171 170 179 177 165 171 158 155 160 159 152 175 165 175 157 177 165 149 164 164 160 161 169 150 168 172 150 156 174 ing.00 12.00 15.92 13.40 12.70 11.5 80 55 88 55 75 64.00 12.30 13.00 14.00 12.00 11.35 12.96 12.00 11.00 11.00 11.00 11.00 12.99 12.00 13. acum 11.00 11.50 13. 306 .40 12.00 11.60 13.00 12.vi viend 2 1 3 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 1 1 2 2 1 1 1 1 1 1 4 3 2 1 1 1 1 1 1 1 2 3 1 1 1 1 4 1 (Continúa ….estud 150 50 250 60 90 250 150 400 20 80 180 150 150 250 300 170 200 240 160 300 200 150 200 120 250 120 180 150 150 200 80 230 250 70 250 300 250 160 80 100 100 120 140 150 200 120 cr.63 10.50 t.00 15.00 12.5 50 49 54 46. fam 5 5 5 5 5 5 5 4 6 7 4 6 4 4 7 4 6 3 5 5 6 5 5 6 5 2 5 4 5 7 3 5 3 5 2 6 5 5 5 5 4 6 6 5 5 5 g.29 13.

70 12. fam 3 4 5 8 9 4 7 4 7 4 5 5 5 3 imp. estud 8 25 35 4 6 30 12 12 30 30 15 16 26 15 10 14 14 18 10 10 20 25 24 8 6 15 8 5 15 9 9 talla 175 168 165 152 172 173 156 155 150 160 168 172 178 157 lib. estudio 4 4 5 4 4 5 4 5 5 4 5 5 5 4 5 5 5 4 4 5 4 4 4 3 4 4 5 5 5 5 4 g.00 11.00 14.00 12.aprob 34 52 34 48 32 29 16 40 34 44 36 39 30 35 prom.….00 t.00 12.00 13.09 11. acum 11.estud 150 180 100 240 300 250 100 250 125 150 250 180 150 150 imp.00 15.00 14. tv 8 4 30 3 4 6 8 10 8 15 10 6 26 7 8 12 10 6 12 5 14 6 14 8 7 14 5 3 6 21 16 peso 68 68 55 59 65 66 51 53 45 52 53 67 77 53 hrs. proc espe cial 2 2 1 2 1 1 1 1 1 2 1 1 2 1 2 1 2 2 2 1 1 2 1 1 1 1 1 1 1 2 1 2 1 2 2 2 2 2 2 1 2 1 2 2 1 2 2 2 1 2 2 2 2 1 2 2 2 2 2 1 2 2 (Continúa …. leidos 1 15 5 4 3 2 3 4 5 4 10 3 3 3 4 3 2 5 8 3 2 3 2 4 7 4 4 3 3 3 3 ing. fisico 4 3 3 4 4 2 3 3 3 2 3 3 5 3 3 4 5 3 2 4 4 4 4 4 5 3 3 3 3 3 4 cr.vi viend 2 1 1 1 3 1 1 1 1 2 1 2 1 1 nº_cuest 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 hobby 2 2 1 4 2 2 2 5 4 1 4 2 4 1 3 3 2 2 5 4 2 2 1 2 2 4 2 2 1 4 1 col. fam 1500 2000 1500 1300 1000 1000 900 1250 650 900 1000 1300 1200 600 mie.00 11.79 12. 307 .00 11.dor mit 3 7 2 3 4 2 4 3 4 5 3 7 4 4 3 3 4 3 6 4 2 3 4 7 6 3 4 3 3 10 3 edad 22 21 21 22 22 20 22 23 19 20 19 18 19 22 horas.00 12. Continuación) nº_cuest 47 48 49 50 51 52 53 54 55 56 57 58 59 60 sexo 1 1 1 2 1 1 2 2 2 2 1 1 1 2 nº.

leidos 3 4 3 6 8 5 3 5 4 10 0 3 2 1 3 2 3 2 3 7 5 4 2 3 8 2 5 5 3 hobby 2 2 2 4 2 2 3 4 2 1 1 4 4 2 2 1 1 2 2 1 1 2 3 2 4 1 1 1 2 imp.…. 1 = Muy Poca 2 = Poca 3 = Media 4 = Mucha 5 = Muchísima COLEGIO DE PROCEDENCIA ESPECIALIZACIÓN 1 = Estatal 2 = No Estatal 1 = Teoría Económica 2 = Gestión Empresarial 308 . fisico 1 4 3 2 3 3 3 4 2 3 3 3 4 3 3 4 4 4 3 5 5 5 4 5 4 3 3 3 4 col. Conclusión) nº_cuest 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Codificación: SEXO 1 = Hombre 2 = Mujer TIPO DE VIVIENDA 1 = Casa Independiente 2 = Dpto.dor mit 4 3 3 1 4 4 4 3 3 3 2 7 3 3 5 2 3 3 10 4 5 8 3 4 2 3 3 3 2 horas. estudio 5 5 4 4 5 4 5 5 5 5 3 4 5 5 4 2 5 5 4 5 5 4 4 4 5 3 4 4 3 imp. estud 9 14 16 12 30 14 5 28 28 14 10 7 14 12 35 10 14 18 10 10 14 18 10 10 8 5 14 30 16 lib. en Edificio 3 = Quinta 4 = Otro HOBBY 1 = Deporte 2 = Música 3 = Baile 4 = TV/Cine 5 = Otro nº. proc espe cial 1 1 2 1 1 2 1 1 1 1 1 2 1 1 1 1 2 1 1 1 2 1 1 1 1 1 1 1 1 1 2 2 2 1 2 2 2 2 2 2 2 2 1 2 1 1 2 2 2 2 1 2 2 2 2 2 2 2 IMPORTANCIA DE …. tv 3 8 12 12 12 14 10 30 12 16 6 10 14 7 21 10 21 10 8 5 10 10 9 4 8 14 14 14 15 hrs.

Sign up to vote on this title
UsefulNot useful