Laboratorios en Estadística y Econometría

Usando MS Excel 2010 y Tutoriales en Video
Gregory Crawford

Roberto Jalón

2012

Contents
1 Presentación de Datos en Tablas y Gráficos
1.1 Objetivos . . . . . . . . . . . . . . . . . . . .
1.2 Funciones Excel 2010 . . . . . . . . . . . . . .
1.3 Caso Aplicado: Industria de los Bebestibles en
1.4 Preguntas a Resolver . . . . . . . . . . . . . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

9
. 9
. 9
. 9
. 14

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

15
15
15
15
19

3 Media Geométrica y Tasa Media de Crecimiento
3.1 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2 Funciones Excel 2010 . . . . . . . . . . . . . . . . . . . . .
3.3 Caso Aplicado: Producto Interno Bruto de Chile 1990-2010
3.4 Preguntas a Resolver . . . . . . . . . . . . . . . . . . . . .

.
.
.
.

.
.
.
.

21
21
21
21
23

. . . .
. . . .
Chile
. . . .

2 Medidas de Tendencia Central y de Dispersión
2.1 Objetivos . . . . . . . . . . . . . . . . . . . . .
2.2 Funciones Excel 2010 . . . . . . . . . . . . . . .
2.3 Caso Aplicado: Encuesta CASEN 2009 . . . . .
2.4 Preguntas a Resolver . . . . . . . . . . . . . . .

.
.
.
.

.
.
.
.

.
.
.
.

4 Entendiendo la Distribución Normal
4.1 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2 Funciones Excel 2010 . . . . . . . . . . . . . . . . . . . . . . .
4.3 Caso Aplicado: Simulando y Graficando la Distribución Normal
4.4 Preguntas a Resolver . . . . . . . . . . . . . . . . . . . . . . .
1

24
24
24
24
27

5 Muestreo y Distribución Muestral
5.1 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2 Funciones Excel 2010 . . . . . . . . . . . . . . . . . . . . .
5.3 Caso Aplicado: Construyendo las distribuciones muestrales
5.4 Preguntas a Resolver . . . . . . . . . . . . . . . . . . . . .

.
.
.
.

6 Intervalo de Confianza y Prueba de Hipótesis
6.1 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.2 Funciones Excel 2010 . . . . . . . . . . . . . . . . . . . . . .
6.3 Caso Aplicado: Puntos de Venta del Comercio Minorista de
Santiago . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.4 Preguntas a Resolver . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.

29
29
29
29
31

33
. 33
. 33
. 33
. 35

7 Prueba t de diferencia de medias muestrales y prueba F de
varianzas
7.1 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.2 Funciones Excel 2010 . . . . . . . . . . . . . . . . . . . . . . .
7.3 Caso Aplicado: La PSU (Prueba de Selección Universitaria) .
7.4 Preguntas a Resolver . . . . . . . . . . . . . . . . . . . . . . .

36
36
36
36
38

8 Pruebas No-Paramétricas. Prueba de Mann-Whitney
8.1 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . .
8.2 Funciones Excel 2010 . . . . . . . . . . . . . . . . . . . .
8.3 Caso Aplicado: Hipódromo Chile y Club Hípico . . . . .
8.4 Preguntas a Resolver . . . . . . . . . . . . . . . . . . . .

.
.
.
.

39
39
39
39
40

.
.
.
.

41
41
41
41
42

.
.
.
.

45
45
45
45
47

9 Correlación y causalidad. Dependencia
9.1 Objetivos . . . . . . . . . . . . . . . .
9.2 Funciones Excel 2010 . . . . . . . . . .
9.3 Caso Aplicado: Venta de Autos Nuevos
9.4 Preguntas a Resolver . . . . . . . . . .

lineal
. . . .
. . . .
. . . .
. . . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

10 Test de Significancia Individual. R-cuadrado. Pronóstico
10.1 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.2 Funciones Excel 2010 . . . . . . . . . . . . . . . . . . . . . .
10.3 Caso Aplicado: Modelo CAPM del Sector Eléctrico . . . . .
10.4 Preguntas a Resolver . . . . . . . . . . . . . . . . . . . . . .

2

11 Modelo de regresión múltiple. Variables dicotómicas y politómicas. Test de significancia conjunta
48
11.1 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
11.2 Funciones Excel 2010 . . . . . . . . . . . . . . . . . . . . . . . 48
11.3 Caso Aplicado: Sector Inmobiliario en Santiago . . . . . . . . 48
11.4 Preguntas a Resolver . . . . . . . . . . . . . . . . . . . . . . . 50
12 Modelo de regresión múltiple. Especificación funcional y selección de modelos. Modelo semi-logarítmico. R-cuadrado
ajustado
12.1 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.2 Funciones Excel 2010 . . . . . . . . . . . . . . . . . . . . . . .
12.3 Caso Aplicado: La Industria de Cervezas en Chile . . . . . . .
12.4 Preguntas a Resolver . . . . . . . . . . . . . . . . . . . . . . .

3

51
51
51
51
52

Agradecimiento
Este recurso didáctico es el resultado del Fondo de ayuda al Mejoramiento
de la Didáctica de la Universidad Finis Terrae, 2011.

Autores
Gregory Crawford Harnecker
Magister en Economía Aplicada mención Economía Financiera. Pontificia Universidad Católica de Chile. Licenciado en Lingüística y Literatura Hispánicas
PUC. Profesor de los cursos: Probabilidad y Estadística, Inferencia Estadística,
Econometría, Modelos Financieros Aplicados, Evaluación Económica de Derivados.
A lo largo de su carrera, en la Facultad de Economía y Negocios de la Universidad
Finis Terrae, ha desempeñado los cargos de Coordinador Línea Métodos Cuantitativos y Finanzas, Coordinador de postgrados de especialización, Coordinador
Examenes de grado y título, y Director de Estudios de la carrera de Ingeniería
Comercial.

Roberto E. Jalón Gardella
Magíster en Dirección de Empresas, ESE Business School, Universidad de
los Andes. Magíster(e) en Economía, Dep.de Economía, Universidad de Chile.
Ingeniero Civil Electrónico Universidad Escuela Superior Politécnica del Litoral
(Guayaquil, Ecuador). Es Coordinador del Magíster de Especialidad en Marketing, Coordinador del Diplomado de Marketing Cuantitativo (Mercadometría),
Coordinador de Línea de los cursos de Marketing de la carrera de Ingeniería Comercial de la Facultad de Economía y Negocios de la Universidad Finis Terrae. Profesor de los cursos: Investigación de Mercados, Marketing Cuantitativo, Modelos
Aplicados de Marketing, Estadística Descriptiva, Econometría. Socio Fundador
y Gerente General de la consultora EXPERIMETRICAL S.A.

4

Introducción
La Universidad Finis Terrae, a través de la Vicerrectoría Académica,
viene impulsando desde hace ya varios años el que los profesores de pregrado
utilicen metodologías activas para fortalecer la aplicación del nuevo modelo
formativo, el cual tiene en cuenta que la sociedad demanda profesionales
formados sobre la base de potenciar en ellos determinadas competencias,
habilidades y destrezas. Por consiguiente, las prácticas pedagógicas deben
adecuarse al nuevo perfil del estudiante que ingresa a la educación superior,
quien llega especialmente influenciado por las tecnologías de información.
Los profesores están de acuerdo y comparten la importancia de adoptar
este cambio pedagógico. Sin embargo, es de nuestra experiencia que cuando
se han visto enfrentados al reto de incorporar metodologías activas, esta
introducción del enfoque se ha realizado lentamente, de modo que algunos
cursos mantienen un alto porcentaje del estilo acostumbrado, desarrollando
los contenidos en una modalidad de “conferencias expositivas”.
Este panorama refuerza un círculo vicioso respecto al propio estudiante:
dado que el alumno da por descontado que el profesor hará una exposición
tipo conferencia sobre los contenidos relevantes, ellos mantienen su actitud
pasiva y continúan viendo al instructor como la fuente del aprendizaje. De
esta forma, el cuadro empeora por la dependencia que los estudiantes desarrollan respecto al instructor y los ayudantes. Esto a su vez induce a que
lleguen poco o nada preparados para las actividades, o la dejen consistentemente para el último minuto, lo que a su vez lleva a que los estudiantes
entreguen y desarrollen un trabajo de pobre calidad.
Los estudiantes de Estadística y Probabilidades, Inferencia Estadística,
y Econometría, suelen describir estos cursos como aburridos, áridos o irrelevantes, cuando los contenidos son presentados predominantemente centradosen-el-profesor. Y, a pesar de que estos ramos tienen que ver con el análisis
de evidencia empírica y de datos, suele darse la paradoja que los estudiantes
llegan a percibir que hay poca relación entre la teoría y los contenidos más
aplicados, o que las clases están desconectadas de la realidad chilena, de su
propia realidad, y de sus intereses.
Una de las explicaciones para esta inercia, es el costo de cambio a la
incorporación de metodologías activas (incluso en el caso de los profesores ya
instruidos en el Diplomado en Metodologías y Habilidades Docentes, bajo el
total auspicio de la Vicerrectoría Académica) debido al tiempo requerido para

5

donde los estudiantes. en la sala de clases. que los profesores cuenten con un libro de laboratorios para la sala de clases. reduce dicho costo de cambio de transitar de un estilo centrado-en-el-profesor a una metodología centrada-enel-alumno. sino para el ciudadano común y corriente del siglo XXI. de un ambiente centrado-en-el-alumno. Este proyecto pretende colaborar a facilitar la implementación. Esta última les permitirá más oportunidades de desarrollar y fortalececer sus habilidades de razonamiento y pensamiento matemático-estadístico: • el proceso de abstracción • la capacidad de distinguir entre lo relevante de lo irrelevante • la capacidad de ir de casos especiales a generalizaciones • la capacidad de proponer conjeturas y verificarlas o contrastarlas con los datos de la realidad • la capacidad de utilizar ideas abstractas en situaciones aplicadas • la capacidad de argumentar de manera lógica soportado en la evidencia cuantitativa • la capacidad de entender diferencias que dependen de múltiples variables o causas • la capacidad de diferenciar entre correlación y causalidad por mencionar algunas de las competencias más relevantes de la formación matemático-estadística.la preparación de las actividades concretas y su adecuación al formato activo centrado en el alumno. En esta perspectiva. cada uno 6 . explorar los principios. por lo que un efecto esperado de este proyecto es que los cursos de esta área estadístico-econométrica puedan combinar ambos estilos pero elevando la proporción centrada-en-el-alumno. utilizando datos genuinos extraídos de la realidad chilena. aplicar las técnicas estadísticas mediante herramientas e instrumentos numéricos y gráficos. puedan descubrir los conceptos estadísticos. Para facilitar al profesor la selección y ubicación del laboratorio en la sesión de clase más conveniente de acuerdo a su programa del curso. facilitado por el uso de una planilla electrónica como Microsoft Excel. indispensables no sólo para estudiantes de ingeniería.

las que siguen a la descripción propia del caso aplicado. se debe aclarar que las soluciones a los enunciados de los laboratorios se desarrollan por separado. 7 . Finalmente. además de las preguntas propuestas y sugeridas de análisis. de modo que el profesor cuente con las respuestas y sugerencias docentes asociados a cada laboratorio.de ellos tiene claramente identificados al inicio los objetivos de aprendizaje y las funciones de Excel que se utilizarán.

Econometría y Métodos Cuantitativos. Su uso no estará circunscrito sólo para la carrera de Ingeniería comercial sino también podrá utilizarse en cursos de estadística para Medicina.Objetivos El objetivo general de este proyecto fue el de generar un libro de laboratorios para la sala de clases (workbook) y videos cortos (tutoriales). Educación. utilizando planillas electrónicas (Excel) para estudiantes de ramos de Estadística. problemas y aplicaciones reales con datos estadísticos chilenos. Odontología y Postgrados. Kinesiología. que incluya casos. Los objetivos específicos que se definió para este proyecto. fueron los siguientes: • Proveer actividades y casos para trabajo y discusión en clases • Acercar al alumno a la realidad de los datos y realidad chilena (en contraste con los textos traducidos) • Desarrollar competencias en uso de Excel • Desarrollar el pensamiento crítico en un contexto de evidencias basadas en datos para el apoyo y soporte de opiniones y afirmaciones • Motivar la búsqueda de datos en Internet en bases institucionales de uso público 8 .

las ventas de bebestibles no alcohólicos del año 2009 ascendieron a 2195 millones de litros. CONTAR. Módulo de Análisis de Datos: Histograma.SI. Construir histogramas utilizando funciones básicas de Excel.6% Total 2194 100. puede leerse que esta industria representa el 9% de la inversión publicitaria que se realiza en el país. MIN.9% Bebidas para Deportistas 9 0. jugos y néctares.1 Presentación de Datos en Tablas y Gráficos Objetivos Crear gráficos diversos. pisco. MAX.3 Caso Aplicado: Industria de los Bebestibles en Chile La industria de los bebestibles en Chile.4% Gaseosas 1790 81.CONJUNTO. 1. Descubrir patrones y obtener conclusiones a partir de la observación de gráficos. bebidas para deportistas y bebidas a base de té.2 Funciones Excel 2010 Funciones: FRECUENCIA. CONTAR.1% Jugos y Néctares 174 7. 1. se divide en dos grandes grupos: los que tienen algún grado alcohólico −vino. el 20% del 9 . entre otros−.1 1. CUARTIL. De acuerdo a cifras de la Asociación Nacional de Bebidas Refrescantes (ANBER). y los bebestibles refrescantes −gaseosas o bebidas de fantasía.0% Fuente: ANBER En la página web de la ANBER. PERCENTIL. cerveza. aguas minerales. CONTAR. y utilizando el complemento de análisis de datos. representaron aproximadamente el 82% del volumen total vendido.SI. Bebestible Millones de litros Porcentaje Aguas 221 10. de los cuales las gaseosas −también denominadas bebidas de fantasía−.

Una empresa importante de la categoría de jugos y néctares. Junto con el testeo de los prototipos. dado por el respondente. Datos y Cuestionario Esta investigación de marketing se realizó vía online. “qué tipo de bebestible es el que usted toma más habitualmente”. o de un segmento de consumidores que comparten una misma reacción a los conceptos −piénsese en un mismo "paladar" ante las "recetas" testeadas. tramos de edad. los encuestados respondieron otras preguntas como “cuál es el lugar habitual donde compra bebestibles”. permiten agruparlos según variables relevantes y responder preguntas del tipo: ¿qué atributos incluidos en los conceptos testeados son más valorados por las mujeres que compran en el Jumbo y cuya marca habitual de bebida de fantasía es Fanta?. A partir de los ratings a cada concepto. además de permitirnos conocer a los respondentes. o de un grupo de consumidores que comparten alguna característica demográfica. contrató a la consultora EXPERIMETRICAL para realizar un concepttest de un nuevo producto. y se suministra una base de datos con una submuestra de 180 observaciones de las 548 efectivamente realizadas. entre otras. de un panel de respondentes de la empresa internacional LIVRA PANELS (www. seleccionados mediante cuotas por género. La idea detrás es que cada combinación distinta de estos atributos es o puede ser.livrapanels.6% de la fuerza de trabajo −considerando que "por cada empleo directo de esta industria se generan 3. y nivel socioeconómico. 10 . combinando los diversos atributos o “ingredientes” que constituyen al producto. Estas preguntas.4 empleos indirectos adicionales". Por confidencialidad. con las respuestas a las preguntas que se entregan a continuación.consumo total de azúcar y el 0. Un concept-test consiste en construir y testear “prototipos” del producto.com). un distinto producto o concepto. se han omitido los contenidos explícitos del concepttest y varias de las preguntas de caracterización de los respondentes. desde el punto de vista del consumidor. y participaron en él 548 respondentes de la Región Metropolitana. a fines de 2009. es posible identificar las combinaciones óptimas de atributos que motiva o capta la máxima aceptación o preferencia del consumidor. “cuál es la marca de agua/jugo/néctar/gaseosa que usted bebe más habitualmente”.

$600.000 . 35-44 S5.$1. Independiente S5. $400.000 S4.700. $600. Mayor de 74 Q3: INGRESO MENSUAL FAMILIAR de su hogar: S1.001 . Desempleado S4. Estudiante Q6 : ¿Cuál de las siguientes opciones describe su ESTADO CIVIL? S1. 18-24 S3. Más de $1. Santiago Oriente S4.000 S5. Menos de $200.$400. 65-74 S8. Femenino Q2: ¿A qué rango de EDAD pertenece usted? S1. 55-64 S7. $200.000 S6.000 S2.Q1: ¿Cuál es su GENERO? S1. 25-34 S4. Santiago Poniente S5. Empleado a tiempo completo (40 o más horas/semana) S2. Prefiero no decir Q4: ¿Cuál de las siguientes opciones describe dónde VIVE usted? S1.700. Jubilado S6. Santiago Norte S3. 45-54 S6. Santiago Centro S2. Dueña de Casa S7. Santiago Sur S7. Soltero (nunca me he casado) 11 . Menor de 18 S2.001 .000 S3. Masculino S2. Empleado a jornada parcial (menos de 40 horas/semana) S3. Santiago Sur-oriente S6. Otro Q5 : ¿Cuál de las siguientes opciones describe su situación LABORAL? S1.

Divorciado/Separado S5. Sprite. etc) S4. 4 o más Q9 : Cual es el LUGAR habitual donde usted compra BEBESTIBLES? S1. Otro Q10 : SUPERMERCADO donde habitualmente hace sus compras? S1. 1 S3. Ninguno S2. 2 S3. Bilz. Tienda de barrio S6. Tottus S7. Ekono S2. lacteos. Jugos en polvo (Livean. Lider S4. Zuko. Supermercado S2. Viudo Q7 : Incluido usted. Andina. Farmacia S4. Jumbo S3. 3 S5. Gasolinera S3. Agua Mineral con/sin gas (Cachantun. etc) S5. Tang. 3 S4. café. Otro S9. Feria S5. etc) S3. ¿cuántas PERSONAS viven actualmente en su HOGAR? S1. Kem. Fanta. Santa Isabel S6. 1 S2. Coca. Montserrat S5. Jugos/Nectares (Watt’s. Sprim. etc) 12 . Otro (te. Soprole. Ninguno Q11 : Que tipo de BEBESTIBLE es el que usted toma HABITUALMENTE? S1.S2. Soltero viviendo con pareja S3. Vital. Benedictino. 4 o más Q8 : Cuántos MENORES de 18 años viven actualmente en su HOGAR? S1. 2 S4. Yuz. Casado S4. Bebidas de Fantasía (Pepsi. etc) S2. Unimarc S8. Pap.

Tang S4. Yo no tomo agua Q13 : Marca de JUGO/NECTAR que usted bebe HABITUALMENTE? S1. Soprole S4. Zuko S5. Andina S2. Livean S2. Watt’s S5. Yo no tomo jugo en polvo Q15 : Marca de BEBIDA DE FANTASIA que usted bebe HABITUALMENTE? S1. Otra marca S12. Otra marca S8. Fanta S5. Coca-Cola S4. Yo no tomo bebidas de fantasía 13 . Vital S7. Sprim S3. Bilz/Pap S2. Orange Crush S9. Limon Soda S8. Yuz S6. Otra marca S6. Cachantun S4. Aquarius S2. Sprite S11. Next S6. Sin marca / agua de la llave S9. Benedictino S3. Canada Dry S3. Kem S7. Dasani S5. Pepsi S10. Frugo S3.Q12 : Marca de AGUA que usted bebe HABITUALMENTE? S1. Yo no tomo jugos/nectares Q14 : Marca de JUGO EN POLVO que usted bebe HABITUALMENTE? S1. Otra Marca S7. Ice Frut S6.

4. (c) "barra 100% apilada" de las diferentes marcas de bebidas de fantasía bebidas habitualmente. 14 . 3. zona donde vive. supermercado habitual. bebestible habitual. Construya los siguientes gráficos: (a) "columna agrupada" de las diferentes marcas de bebidas de fantasía bebidas habitualmente. 2. no toman Coca-Cola. separadas por género.4 Preguntas a Resolver Utilizando los datos de la hoja de Excel datoslab1. (b) "barra apilada" de las diferentes marcas de bebidas de fantasía bebidas habitualmente. Comente la veracidad o falsedad de la afirmación: "quienes toman jugos/néctares. Compare los tres gráficos de la pregunta anterior. ¿Qué puede concluir respecto a las características de género. de los respondentes de la muestra de este estudio? Respalde sus afirmaciones con evidencia numérica y gráfica. e indique claramente sus diferencias. responda de manera rigurosa las siguientes preguntas: 1.1. separadas por género. edad. separadas por género. y viceversa".xlsx.

la que se ha llevado a cabo en los años 1987. VARP. contiene antecedentes sobre la cobertura y perfil de los beneficiarios de los 15 . DESVEST. con una periodicidad bianual y trianual. fue de 71.cl/ especiales/ que-es-la-encuesta-casen/) puede leerse: La encuesta de Caracterización Socioeconómico Nacional (Casen) es el principal instrumento de medición para el diseño y evaluación de la política social existente en nuestro país. MODA. ¿Qué es la Encuesta CASEN? En la página del gobierno (http://www. de acuerdo a las medidas de tendencia central y de dispersión. 2.924 personas. la incidencia. Esta encuesta entrega información acerca de las condiciones socioeconómicas de los diferentes sectores sociales del país. MIDEPLAN).3 Caso Aplicado: Encuesta CASEN 2009 Desde el año 1985. 1994.460 hogares encuestados a nivel Nacional. DESVESTP. se tiene representatividad para 334 comunas del país.2 2. 2003.2 Funciones Excel 2010 Funciones: PROMEDIO. Además. ha realizadp una encuesta de hogares representativa a nivel nacional. 2006 y 2009. El tamaño de la muestra de la Encuesta CASEN 2009.1 Medidas de Tendencia Central y de Dispersión Objetivos Comparar conjuntos de datos. el Ministerio de Desarrollo Social de Chile (antes Ministerio de Planificación y Cooperación. 2000. así como la distribución del ingreso de los hogares y la composición de sus ingresos. 1992. 1990. VAR. regional. urbano y rural y comunal. 2. representando una población muestral de 246.1996. denominada de Caracterización Socioeconómica Nacional (CASEN). DESVIA2. sus carencias más importantes. magnitud y características de la pobreza. 1998. En la versión del año 2009. MEDIANA.gobiernodechile.

Tales datos orientan el trabajo de diseño de nuevos proyectos y de modificaciones. ocupación e ingresos. Los objetivos generales de la aplicación de este instrumento son: · Disponer de información que permita caracterizar la situación de los hogares y de la población. biografía autoreportada y energía. Éstos últimos son: discapacidad. La información recolectada por esta encuesta es la que ha permitido hacer un seguimiento de la evolución de la pobreza e indigencia. La metodología utilizada para la elaboración esta encuesta responde al mismo modelo implementado para las mediciones anteriores. especialmente de aquélla en situación de pobreza y de los grupos definidos como prioritarios por la política social (según aspectos demográficos. para evaluar su impacto en el hogar (ingreso adicional y su distribución). empleo. tecnología/ información/ comunicación. vivienda. Además. ingresos. el 38. identificando a los sectores sociales que no acceden a dichos programas. en los sistemas de asignación de los beneficios para mejorar la focalización de aquellos que funcionan con carácter selectivo. educación. · Estimar la cobertura. salud. pueblos indígenas. existen objetivos específicos para cada uno de los módulos sectoriales abarcados en esta encuesta -residentes. En 1990. cultura. migración.y en relación a los temas emergentes. Este 16 . salud y vivienda. focalización y distribución del gasto fiscal de los principales programas sociales de alcance nacional.programas sociales.6% de la población estaba en situación de pobreza o de indigencia. de educación. lo que posibilita el cálculo de los déficit de atención asociados.

460 que son jefes de 17 . Un hogar se considera indigente si su ingreso per cápita es inferior al valor de una canasta básica de alimentos. en la zona urbana." Para este laboratorio.porcentaje.75 veces. ¿Qué se entiende por pobreza y qué por indigencia? En la misma página del gobierno. De los 246. puede leerse que: "[U]n hogar es pobre cuando su ingreso per cápita es inferior a 2 veces el valor de una canasta básica de alimentos. cuando ésta es habitada por sus propietarios. en la zona rural. hemos considerado una subpoblación de la muestra CASEN. al año 2009.924 encuestados. el ingreso del hogar se define como la suma del ingreso autónomo del hogar. es de 15. consideramos los 71. de la presentación de resultados de la Encuesta CASEN 2009. Para la clasificación de los hogares en estas categorías. las transferencias monetarias que recibe el hogar del Estado y una imputación por concepto de arriendo de la vivienda. y a 1.1% como se aprecia en la gráfica siguiente: Fuente: Ministerio de Desarrollo Social.

2=pobre no indigente.hogar.000 individuos. para de esta manera aumentar la precisión de las estimaciones. De acuerdo con el diseño de la muestra. 6=Media Humanista Completa. ponderando el valor de la variable en cada persona por su factor de expansión y luego. estos 1. " Para esta subpoblación de 2. 7=Media Técnico Completa. corresponde aplicar este factor de expansión a cada hogar y persona seleccionada. 5=Media Técnico Profesional Incompleta.. en el archivo de datos. De estos últimos. se obtuvo una muestra de 2. sumando todas las personas de la muestra. 99=Sin dato) corte (situación de indigencia o de pobreza: 1=indigente. 8=Técnica ó Universitaria Incompleta.914 porque de los restantes 86 no se tenía información de sus ingresos ocupacionales principales. 2=II. 4=Media Humanista Incompleta. 3=Básica completa. 10=X) 18 . 2=mujer) edad (años cumplidos) numper (número de personas en el hogar) esc (años de escolaridad) educ (nivel educacional: 1=sin educacion formal. . La estimación de un total dado para una variable se obtiene. 2=Básica incompleta. se deben utilizar los ponderadores denominados "factores de expansión": "Este factor se interpreta como la cantidad de personas en la población.914 individuos constituirán nuestra población de interés. 3=no pobre) dau (decil de ingreso autónomo per capita nacional: 1=I.. que representa una persona en la muestra. 9=Técnica o Universitaria Completa. Para efectos de este laboratorio. se incluyen las siguientes variables: folio (identificador del respondente) sexo (1=hombre. lo que depende del número de viviendas que tiene la sección geográfica y el número de secciones que tiene el estrato. por lo que las conclusiones que se obtengan se referirán a estos 1.914 individuos.. y de ellos los 45. Los factores de expansión incluyen un ajuste de población en hogares particulares. primero. Para obtener conclusiones a nivel nacional o regional. según las proyecciones del INE a la fecha de la encuesta.130 cuya situación de empleo corresponde a la de estar trabajando (ocupado). y de ellos nos quedamos con 1.000 individuos.

rentas. intereses. Nuestras autoridades. bonificaciones. Los resultados de la Encuesta Casen 2009 indican que el porcentaje de la población en situación de pobreza en Chile ha disminuido al 15%.4 Preguntas a Resolver Utilizando los datos de la hoja de Excel datoslab2. han mencionado más de una vez que Chile estaría cada vez más cerca de convertirse en un país desarrollado. 5=V) yopraj (ingreso ocupacional principal) yoprhaj (ingreso ocupacional principal en el hogar) donde. ya sea por concepto de trabajo dependiente en el caso de los asalariados (empleados y obreros del sector publico. de éste y del anterior gobierno. gratificaciones. servicio doméstico puertas adentro y puertas afuera y miembros de las fuerzas armadas y de orden)." "[Ingreso Autónomo es el] Ingreso por concepto de sueldos y salarios.gob.. autoprovision de bienes producidos por el hogar. o por concepto de trabajo independiente en el caso de los patrones o empleadores y trabajadores por cuenta propia. Los turistas que visitan Santiago suelen comentar que les parece que en Chile tenemos un estándar de vida superior al de otros países de la región. los ingresos están definidos para la Encuesta CASEN. ganancias provenientes del trabajo independiente. montepios y transferendas entre privados. ¿Qué afirmaciones puede hacer usted respecto a los ingresos ocupacionales principales de nuestra submuestra de 1.." 2. asi como jubilaciones.914 individuos? 19 . de empresas publicas y del sector privado.cl/ casen/ definiciones/ ingresos.xlsx. pensiones. de la siguiente manera (ver en http://www.ministeriodesarrollosocial. . Todo esto deja la impresión que habría una gran clase media y que al menos la mitad de los chilenos ha de ganar un sueldo superior al $1 millón de pesos.qaut (quintil de ingreso autónomo per capita nacional: 1=I.. 2=II.html): "[Ingreso Ocupacional Principal es el] Ingreso que obtienen los ocupados en su ocupacion principal. responda de manera rigurosa las siguientes preguntas: 1.

4." 20 . si en lugar del ingreso ocupacional principal individual se considera el del hogar? 3. La evidencia de nuestra submuestra indica lo contrario.2. En la submuestra de respondentes de la Encuesta Casen vemos que no hay diferencias en la media del ingreso ocupacional principal de los jefes de hogar. Comente: "Los expertos afirman que los salarios declinan después de los 50 años de edad. sean estos hombres o mujeres". Comente: "Chile ha dado un paso adelante en superar la discriminación por género. ¿Cambian sus conclusiones respecto a la pregunta anterior.

perdura el debate sobre la disyuntiva: ¿crecer o distribuir? Hace unos años. entre 1987 y 2006 el porcentaje de la población viviendo debajo de la línea de pobreza cayó de 45.2% en el mismo período. 3. pequeña. ¿Cómo logró Chile esta evolución? Diversos estudios empíricos estimarían que entre un 80% y 60% de la reducción de la pobreza fue consecuencia del crecimiento económico. sin embargo. POTENCIA. que ha sabido mantener tasas positivas de crecimiento anual. 3.GEOM. que le ha permitido sortear diversas crisis ocurridas a nivel internacional desde los años 1990s.4% al 3. Según cifras del Ministerio de Desarrollo Social (ex Mideplan). para distintas tasas media de crecimiento. Destaca que ha sido una economía abierta. el ingreso de las personas en términos reales. LOG.3 3. por eso le bastó un poco menos de 10 años para duplicar el producto interno bruto y con él.1 Media Geométrica y Tasa Media de Crecimiento Objetivos Calcular la tasa media (geométrica) de crecimiento en el período analizado. en la revista “Qué Pasa”. y que la diferencia sería gracias a las políticas sociales. MEDIA.1% a 13.2 Funciones Excel 2010 Funciones: PRODUCTO. o estamos bien porque la pobreza se ha reducido a menos de la mitad y el ingreso de todos −incluido el de los más pobres− se ha duplicado en el mismo período?”. La evidencia 21 . serio y exitoso manejo macroeconómico.3 Caso Aplicado: Producto Interno Bruto de Chile 1990-2010 Chile ha sido reconocido por su prudente. ¿Tanto importa el crecimiento para reducir la pobreza? Durante los “años dorados” (1986-1998) la economía chilena creció a tasas anuales de 7. Calcular el número de años requeridos para duplicar el nivel.3%. el economista Eduardo Engel se preguntaba: “¿Estamos mal porque la distribución del ingreso no ha mejorado en los últimos 15 años.7%. mientras que el porcentaje de personas en extrema pobreza cayó del 17. A nivel interno.

278 16.206 67.616.571.123 . la contribución de las libertades civiles.416.908.940.246.470 16.348 46.996. puede obtenerse los datos del Producto Interno Bruto (PIB).873 17.763.330 51.431 27.438. para los años 1990 a 2010: Producto interno bruto a precios constantes anual (Millones de pesos de 2003) Año 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 (*) Habitantes 13.504 14.848.213 15.473 14.546 44. la reducción del consumo del gobierno. en millones de pesos del año 2003. 22 PIB 25. los términos de intercambio positivos.bcentral.394.267.093.028.479 16.526.010 13.136.665.583 15.665 30.209.745. En la página web del Banco Central de Chile (www.796.indicaría que este ritmo de crecimiento se debió a la apertura comercial.275 Fuente: Banco Central de Chile (*) Cifras preliminares.cl).890.559.919.646.647 15.074 16.598.605.094.645 59.679 15.432.176 32.165.197. la esperanza de vida.378 16.971 62.831.340 44.723 38.784 15.126 64. últimamente le ha costado a Chile lograr recuperar las tasas de crecimiento de aquellos períodos anteriores.199 48.432 63.940 14.674 16.292 34.625 49.178.167.595.819 57. y la sinergia de los paquetes de buenas políticas públicas.241 13.151.944.076 14.928. Sin embargo. la expansión de la educación.597 43.415 54.422.142. la contribución de la infraestructura pública.262.708 14.591 40.397.156.782 13.

Considere la recta que une la observación del año 1990 con la observación del año 2010. Se podría afirmar.xlsx. Comente: "Considere el gráfico cartesiano. Comente: "Las tasas medias de crecimiento del PIB y del PIB per capita. necesariamente que las tasas anuales de variación del PIB y del PIB per capita.3.4 Preguntas a Resolver Utilizando los datos de la hoja de Excel datoslab3. 3. Comente: "La tasa media de crecimiento entre los años 1998 y 2000 es igual a la media aritmética de las tasas anuales de crecimiento de los años 1998-1999 y 1999-2000". 2. Ello implica. son positivas. y las ordenadas (eje Y) representan el PIB medido en millones de pesos de 2003. 23 . entre 1990 y 2010. calculada por:  − −1  = −1 verifique para qué años se cumple la aproximación: log (1 +  ) ≈  5. Comente: "Suponiendo que los próximos años Chile creciese a la misma tasa media anual del período 2000-2010. donde las abscisas (eje X) representan cada año. Sea la tasa de crecimiento entre el año anterior  − 1 y el año actual . 4. han sido positivas para cada año de ese período". entonces. que la tasa media de crecimiento entre 1990 y 2010 es equivalente a la pendiente de dicha recta". responda de manera rigurosa las siguientes preguntas: 1. le tomaría otros 20 años para poder duplicar el PIB y el PIB per capita".

con ingreso ocupacional principal.1 Entendiendo la Distribución Normal Objetivos Construir un “simulador” para graficar las funciones de densidad  () y la acumulada  (). DISTR. con empleo.NORM. consideremos la base de datos del Laboratorio #2.4 4.3 Caso Aplicado: Simulando y Graficando la Distribución Normal En el mundo real.924 hogares entrevistados en la Encuesta CASEN 2009.ESTAND. Construyamos un histograma para la variable "edad": 24 .ESTAND.INV.NORM.2 Funciones Excel 2010 Funciones: DISTR.ASIMETRIA. y estudiar cómo cambian los gráficos cuando cambian la media y la desviacion estándar. consistente en una muestra de 1. DISTR. hay variables cuyos "histogramas" tienen forma de "campana".INV. 4. Por ejempllo.NORM.NORM.914 jefes de hogar. COEFICIENTE. DISTR. tomada a partir de los 246. CURTOSIS 4.

. para la variable "número de personas en el hogar": .. para la variable "escolaridad": 25 ....

. en honor a Karl Friedrich Gauss.. para la variable "logaritmo del ingreso ocupacional principal": En los histogramas graficados previamente. si bien se dice que fue Abraham De Moivre quien la utilizara por primera vez en un artículo escrito en 1733. Nótese que en todos los ejemplos. por lo que está dada por el integral:  () =  (  ) = Z −∞ 26  ()  .. definida por la función de densidad de probabilidad de una distribución normal. se ha superpuesto una verdadera "campana gaussiana". unos con mayor precisión que otros. dada por: − 12 1  () = √  2 2   −  2  La función de probabilidad acumulada es el "área bajo la curva" de la función de densidad de probabilidad.. Uno de los tipos posibles de "campanas" se denomina "distribución normal" o "gaussiana". puede apreciarse que todos ellos parecen tener forma de "campana".

 2 = 32 . Se puede calcular el área bajo la curva para cualquier valor de .xlsx. se tiene que la sumatoria de las frecuencias relativas asignadas a cada uno de los intervalos de clase necesariamente suma 100%. cualquiera sea su forma.4 −∞ Preguntas a Resolver 1. tiene o no distribución normal".cuya solución no tiene una forma funcional elemental. comente de manera rigurosa la siguiente afirmación: "No hay manera de comprobar que la variable ’edad’. Puede suponer inicialmente que  = 4. Así también el área total bajo la curva de densidad de probabilidad. de la base de datos del Laboratorio #2 (Encuesta CASEN). Agregue al gráfico anterior la funcion de densidad de probabilidad de una nueva variable adicional  . Utilizando los datos de la hoja de Excel datoslab4. pero permita que usted pueda actualizar la tabla y el gráfico cambiando los valores de cualquiera de estos dos parámetros. y se calcula mediante métodos numéricos (esos cálculos están hechos en las tablas estadísticas o pueden hacerse mediante función definida del Excel). pero nuevamente permita que usted pueda actualizar la tabla y el gráfico cambiando los valores de 27 . 2. por definición suma 1 o 100%. Recuérdese que para un histograma. tal que inicialmente  = 0. dadas cualquier media  y cualquier desviación estándar . Construya una tabla para diversos valores de  de la función de densidad de probabilidad  () y haga su respectivo gráfico de dispersión. es decir:   −  2 Z+∞ Z+∞ 1 − 1 2  √  ()  =   = 1 2 2 −∞ 4.  2 = 22 . desde −∞ hasta +∞.

0% 20.0% 10.0% 0. 28 . Su gráfico debiera lucir así: 100.0% 60.cualquiera de estos dos parámetros. analice y compare qué ocurre con los gráficos cuando las varianzas son distintas. analice y compare qué ocurre con los gráficos cuando las medias son distintas. y cambiando el valor de la media de  . Suponiendo medias iguales.0% 15.0% 10.0% 70.0% 0.0% 90.0% 5. Suponiendo varianzas iguales. y cambiando el valor de la varianza de  . Construya una gráfica de dispersión de las funciones de probabilidad acumulada de las dos variables  e  de las preguntas anteriores.0% 40.0% 30.0% 20. 5. Su gráfico debiera lucir así: 25.0% ‐6 ‐5 ‐4 ‐3 ‐2 ‐1 0 1 2 3 4 5 6 7 8 9 10 3.0% 80.0% 50.0% ‐6 ‐5 ‐4 ‐3 ‐2 ‐1 0 1 2 3 4 5 6 7 8 9 10 4.

5. Para efectos de este laboratorio consideraremos que estos 150 hombres constituyen nuestra población de interés. con ocupación. y no una muestra.5 5. viendo cómo la forma de la distribución de la variable aleatoria media muestral .3 Caso Aplicado: Construyendo las distribuciones muestrales La hoja de Excel datoslab5. 5. y con educación técnica o universitaria completa. La variable "ingresos ocupacionales principales" 29 .xlsx. contiene una subpoblación de la base de datos del Laboratorio #2 (Encuesta CASEN): los hombres. Generador de Números Aleatorios.2 Funciones Excel 2010 Módulo Análisis de Datos: Estadistica Descriptiva. conforme aumenta el tamaño de las muestras.1 Muestreo y Distribución Muestral Objetivos Constatar de manera práctica el teorema límite central. Histograma. que tienen ingresos ocupacionales principales. Son 150. jefes de hogar. va acercándose cada vez más a la forma de una distribución normal.

generalmente no conocemos toda la población de una determinada variable. a partir de la distribución de la media muestral o de la varianza muestral. al aumentar el tamaño de la muestra. a partir de ellas. y explorar cómo. la distribución de muestreo de la media muestral sistemáticamente empieza a 30 . se quiere inferir cuáles serían los valores poblacionales de la media o de la varianza. sino una o algunas muestras y.tiene la siguiente distribución de probabilidad: Histograma 50 45 40 35 30 iac n e 25 u c e rF 20 15 10 5 0 Puede comprobarse que la media poblacional es P150   = =1 = $988730 34 150 y la desviación estándar poblacional s P150 2 =1 ( −  )  = = $995280 53 150 En la práctica. En este laboratorio se quiere repasar las propiedades de tales distribuciones de muestreo.

obteniendo así todas las muestras posibles a partir de la población. Cuántas muestras son posibles en una población  depende del tamaño  que escojamos para el muestreo. conforme el tamaño  va aumentando. Considere los siguientes datos poblacionales de la variable :  1 2 3 4 5 31  8 25 47 10 32 . el número de muestras posibles crece de manera multiplicativa conforme aumenta . del menú "Datos" del Excel. la distribución de la media muestral va tomando forma de campana.4 Preguntas a Resolver 1. (c) Haga lo mismo de la pregunta anterior. y construya el histograma correspondiente.  = 35 y  = 50 respectivamente (d) Verifique las propiedades de la distribución de .xlsx : (a) Tome 50 muestras de tamaño  = 1. procederemos de una manera ligeramente diferente.tomar forma de "campana". 2. sin importar cuál sea la distribución poblacional de la cual se obtienen las muestras (teorema límite central) y la media de las medias muestrales empieza a converger a la media de la población de la cual se obtuvieron las muestras. 5. para muestras de tamaño  = 15. para hacerlo manejable. tendríamos que generar todo el espacio muestral de la media muestral. Suponiendo un muestreo con reemplazo. y los datos de la hoja de Excel datoslab5. y construya el histograma correspondiente. Para lograr la distribución completa de la media muestral. (b) Tome 50 muestras de tamaño  = 5.  = 25. Utilizando el módulo de "Análisis de Datos". Dado que nuestro interés es poder ver que. calcule la variable media muestral  para cada una de las 50 muestras. conforme  crece.

y determine las respectivas medias muestrales  Verifique que  =  y  2 =  2 2. (e) Inserte en cada uno de los dos gráficos anteriores la función de densidad de probabilidad de una distribución √ normal. desde 0 hasta 50. y determine las respectivas medias muestrales . (c) Construya el espacio muestral de todas las muestras posibles de tamaño  = 3. para muestras de tamaño  = 3. con la media poblacional  y la desviación estándar  . grafique la respectiva distribución de probabilidades ("histograma") de . (b) Para intervalos de 2.5. Verifique que  =  y  2 =  2 3.(a) Construya el espacio muestral de todas las muestras posibles de tamaño  = 2. desde 0 hasta 50. Comente.5. 32 . (d) Para intervalos de 2. grafique su respectiva distribución de probabilidades ("histograma") de . para muestras de tamaño  = 2.

NORM. teléfono.NORM.1 Intervalo de Confianza y Prueba de Hipótesis Objetivos Construir un intervalo de confianza para la media. kioscos. para su uso de manera inteligente mediante sistemas de información. casas de empeño y otras.ESTAND. DISTR. puede leerse: "Mapcity ha decidido llevar a cabo el Primer Censo Georreferenciado de Comercio de la Región Metropolitana. rut. panaderías.censodecomercio. El Censo incluye información del nombre del local. botillerías.NORM.ESTAND. su categoría de rubro. 6.NORM. sino un conjunto enorme de puntos de ventas y tiendas del comercio minorista o al detalle −almacenes. con representación gráfica de calidad para cualquier aplicación o uso interno de las empresas. DISTR. requieren gestionar sus canales de distribución que incluyen no sólo supermercados. Todo esto ha sido georreferenciado y normalizado. frente del local y otras características de interés. lo que permite realizar consultas y selecciones por distintos atributos. DISTR. el que permite tener un registro único y exhaustivo del universo de negocios y comercio existente en la región.6 6. DISTR.3 Caso Aplicado: Puntos de Venta del Comercio Minorista de Santiago Los productos de consumo masivo de diversas categorías como galletas. con más de 48 mil manzanas. chocolates. DISTR.cl.2 Funciones Excel 2010 Funciones: DISTR. nombre del dueño o responsable del negocio. caramelos.T.T.INV 6. cigarrillos. bancos y centros comerciales hasta los que no lo son como funerarias. ubicación geográfica." 33 . minimarkets. bebidas.INV. En el sitio www. Este incluye desde los más tradicionales como restaurantes.INV.

5=Sur-oriente. 4=Poniente. 3270 botillerías. respectivamente. se suministra una base de datos con una submuestra no aleatoria de 200 puntos de ventas. 5=Kiosco) Zona (1=Centro. donde las categorías estarían dadas más bien por la ocasiones de consumo y misiones de compra que por los atributos de los productos. podemos enterarnos que en toda la Región Metropolitana habrían 1962 panaderías. típ. De uno de tales estudios. 4=Almacén. especializada en temas de "shopper marketing". 2=Minimarket. son: Tamaño del Local (metros cuadrados) Media N Desv. 1428 minimarkets. Botilleria 41.86 42 113.00 37 24. Sólo se incluyen las variables: Tipo de Local (1=Botillería. 18506 almacenes pequeños. entre otros tipos de locales.47 30 44.37 34 .54 MiniMarket 45. con el objetivo de aplicar una nueva manera de segmentar en el punto de venta.21 200 65. medidos en metros cuadrados.43 Total 46. se pueden considerar representativos de cada local o de cada zona.09 Kiosco 18. 2=Norte. 6=Sur) Comuna Metros cuadrados del Local Considérese. 3=Panadería.11 Almacen 43. Por confidencialidad se omiten variables e información estratégica. 2549 kioscos.46 39 46. puede verificarse que sus tamaños medios. 3=Oriente. ha conducido investigaciones de mercado para grandes retailers regionales. La consultora THE RETAIL FACTORY. para efectos del presente laboratorio. Para las tiendas y puntos de ventas de Santiago incluidas en la muestra.En ese sitio.48 Panaderia 79. que los datos para cada tipo de local o para cada zona de Santiago.10 52 41.

81 Santiago Sur 35. Comente: "No es posible que en todas las zonas de Santiago el tamaño medio poblacional sea 40. la evidencia indica que los minimarkets podrían tener un tamaño medio igual que el de los almacenes. 4.4 Santiago Centro Media 31. Comente: "Con respecto al parámetro poblacional ’tamaño medio’.86 28 73. 3. Según los cuadros dados. pero distinto que el de los kioscos".0 metros cuadrados".34 Santiago Norte N 35 Desv.05 Total 46. y todos los locales de Santiago Oriente son más grandes que los de Santiago Norte".21 200 65.Tamaño del Local (metros cuadrados) 6.83 Santiago Oriente 49. responda de manera rigurosa las siguientes preguntas: 1.88 24 51.98 Santiago Sur-oriente 42.37 Preguntas a Resolver Utilizando los datos de la hoja de Excel datoslab6. 35 . se aprecia que el tamaño medio muestral de los minimarkets es parecido al de los almacenes. típ. Entonces puede concluirse que: "considerando sólo los locales de Santiago Poniente.69 16 32. 32.06 69 89. se podría concluir que muestralmente todas las panaderías son más grandes que los minimarket.14 28 27. Comente. Comente: "Según los cuadros de tamaños medios muestrales dados anteriormente.83 Santiago Poniente 57. necesariamente también se deberá cumplir que los minimarkets tendrán un tamaño medio muestral parecido al de los almacenes". 2.xlsx. y el tamaño medio muestral de los locales en Santiago Norte es similar al de los locales de Santiago Poniente.17 60.

Este procedimiento consiste en transformar la distribución de los puntajes a una distribución normal. Por ejemplo. Su objetivo final es seleccionar a los postulantes para ingresar a las Universidades. Existen 4 pruebas: Lenguaje y Comunicación. ¿Cómo se cuantifica la evaluación? Primero se cuentan las respuestas correctas y se descuenta un cuarto de punto por cada respuesta incorrecta. 12 malas y 30 omitidas. Historia y Ciencias Sociales y Ciencias. Para darle una cuantificación al desempeño de cada alumno. Las preguntas omitidas no se cuentan.1 Prueba t de diferencia de medias muestrales y prueba F de varianzas Objetivos Analizar las varianzas y aplicar el test de diferencia de medias apropiado para comprobar si comparten la misma media. el puntaje será de 37. se toman los puntajes de todos los que rindieron de esa prueba y se realiza un procedimiento llamado normalización. Prueba t para dos muestras suponiendo varianzas desiguales. 7.3 Caso Aplicado: La PSU (Prueba de Selección Universitaria) Las Pruebas de Selección Universitaria (PSU) son un grupo de instrumentos de evaluación que tienen como objeto medir capacidades relacionadas con el razonamiento y que se basan en los contenidos del Plan de Formación General del Ministerio de Educación. sin alterar la proporción de alumnos que están entre ciertos puntajes cualquiera. Entre las dos restantes deben elegir al menos una. 7. De las 4 pruebas son obligatorias las de Lenguaje y Comunicación y Matematica. como lo 36 .2 Funciones Excel 2010 Análisis de Datos: Prueba t para dos muestras suponiendo varianzas iguales. un estudiante obtuvo 40 buenas. Esta elección dependerá de los requisitos exigidos por la Universidad y carrera a la cual quieren postular. Prueba F para varianzas de dos muestras.7 7. Matemática. si en una prueba que tiene un total de 80 preguntas.

Finalmente se considera (arbitrariamente)que la distribución final de la prueba será una normal con media 37 .demre.demre.cl Con esta frecuencia relativa. se busca en una tabla normal estandarizada los valores z correspondientes a cada puntaje. Fuente: Documentos técnicos. www. www. partiendo del mínimo puntaje (podría ser negativo dado que se descuenta un cuarto de punto por cada respuesta incorrecta) hasta el máximo puntaje (que podría llegar a un máximo de 80 en caso de que exista una o más personas que respondan todas las preguntas correctamente. Fuente: Documentos técnicos.muestra la siguiente figura.cl Para realizar esta transformación se realiza una tabla en donde se mide la frecuencia relativa de cada punto.

la distribución de los puntajes finales distribuyen de forma normal (o gaussiana). Por lo tanto. para obtener el puntaje final de un alumno cualquiera deberá calcularse como 500+110*z. Una de las repercusiones que puede tener esto es una inferior calidad educativa en regiones. No olvide verificar igualdad de varianzas para utilizar el test adecuado.de 500 puntos y una desviación estándar de 110. Suponiendo que la PSU es una buena medida de calidad en la educación. Esto quiere decir que los recursos y las prioridades se establecen para la Región Metropolitana en desmedro de las demás regiones. Como año tras año las tablas de distribución de frecuencias relativas pueden ser distintas. ¿Puede comprobar estadísticamente esta hipótesis utilizando las pruebas PSU como medición de calidad? 1 Los datos fueron obtenidos del sitio www. Ejemplo: Si un alumno obtuvo 56 puntos. Se excluyen los vespertinos y liceos técnicos. ¿podría usted corroborar o descartar eso? Tome en cuenta tanto la prueba de Lenguaje y Comunicación como la de Matematica. Por construcción del instrumento. puede haber un z distinto y por lo tanto un puntaje final distinto. utilizando el test t de diferencia de medias. ¿Existe diferencia entre Colegios Municipales y Particulares Subvencionados? 3. 38 . y ese puntaje le corresponde un valor z de 2. De aquí que podamos realizar algunos estudios interesantes.demre. Utilice la base de datos en datoslab7.4 Preguntas a Resolver 1.1 2. para un mismo número de respuestas malas y buenas.xls contiene los promedio de todos los establecimiento educacionales diurnos. entonces su puntaje final será de 720 puntos. 7. Uno de los temas que se suele tocar es la gran centralización de Chile.xls. La base de datos del archivo datoslab7.cl . Se dice que la educación de Colegios Municipales es inferior a los colegios Particulares Pagados.

8 8. 39 . se gana si se acierta a los caballos que llegarán primero. Con esto. segundo y tercero en el orden exacto elegido.200 millones de dólares. en Chile las apuestas facturan sobre los 1. Para entender el sistema de apuesta hípica recordaremos lo básico: Toda carrera tiene un único caballo favorito y un único ganador. fantasía y mitos. En general. lograr una mayor probabilidad de ganar en las carreras. las carreras se corren de 10 a 15 caballos en una cancha que tiene una distancia entre 1000 y 2000 metros. En el primer tipo de apuesta. Prueba de MannWhitney Objetivos Analizar. Por ejemplo. En Chile. Las más conocidas son: “a ganador”. De este total.2 Funciones Excel 2010 Funciones: CONTARA. Club Hípico y Valparaiso Sporting Club. un 22. en Inglaterra del siglo pasado. Loto. Basado en este mito. “a placé” y “trifecta. existía el mito que ciertas personas con poderes especiales eran capaces de conseguir lo que querían de un caballo con solo susurrarle al oído la orden que deseaban que cumpliese. Según proyecciones de la Polla Chilena de Beneficencia. En las apuestas a placé: se recolecta dinero cuando el caballo elegido sale en segundo lugar o ganador. a través de una prueba no-paramétrica. supuestamente. las canchas más importantes dedicadas a las carreras hípicas son: Hipódromo Chile. podían. sino que también es una fuente de superstición. el resto lo acapara los casinos y juegos de azar (Kino. si existe diferencia entre 2 proporciones de datos que distribuyen no-normal. Esto sólo contando la apuesta regulada. 8.7% corresponde a las carreras hípicas.1 Pruebas No-Paramétricas. etc).3 Caso Aplicado: Hipódromo Chile y Club Hípico En Chile la industria de las apuestas es permitida y está regulada. se recolecta el premio sólo si el caballo elegido gana. Y trifecta. Pero el deporte hípico no sólo es una actividad comercial en donde las apuestas juegan un papel preponderante en su desarrollo. Existen varios tipos de apuestas. CONTAR.SI 8.

Uno de ellos dice relación con los caballos favoritos. Con la base de datos del archivo2 datoslab8.4 Preguntas a Resolver 1. dado que un caballo es el favorito.cl e www. a cargo del director y actor Robert Redford. Basado en su hallazgo del punto 3) ¿qué recomendación haría a un apostador de caballos? 2 Se contó con la ayuda de Ricardo Guerra. ¿Será cierto este mito? 8.fue rodada la película “El hombre que susurraba a los caballos”. Estos se obtuvieron de los sitios: www.xls cree una tabla de contingencia. en la recopilación de datos. 4.cl 40 . Así como en otros países.clubhipico. estudiante de Ingeniería Comercial de la Universidad Finis Terrae. para distintos lugares donde se desarrolla una carrera? 2. Las variables son: lugar de la carrera y si ganó o no el favorito.hipodromo. 3. ¿qué diría usted acerca de este mito?¿ Es cierto? Pruebe si existe diferencia o no entre las probabilidades. Utilizando una prueba no-paramétrica. en la escena nacional también tenemos mitos hípicos. Utilice la función contar.si de Excel para facilitar la obtención de las frecuencias. El mito establece que en el Club Hípico la proporción de los caballos favoritos que ganan una carrera es mayor que en el Hipódromo Chile. ¿Es razonable pensar que varíe la probabilidad de ser ganador.

la familia ha decidido discutir lo que cada miembro.1 Correlación y causalidad. Distinguir entre correlación y causalidad. Por otro lado. cree que son las variables más importantes. a nosotros también nos debería ir bien.CORREL. Por lo tanto.2 Funciones Excel 2010 Funciones: COEF. Al año de su creación. decidieron realizar un análisis de las variables que inciden en la venta de autos nuevos en Chile. lo más probable es que si uno se independiza. el padre de familia es más categórico:”Para mí. es una empresa familiar dedicada a la venta de automóviles nuevos.DE. 9. Cuando uno se compra una casa o un departamento.3 Caso Aplicado: Venta de Autos Nuevos La empresa automotora Geils S. hermano menor y encargado de la contabilidad opina: “Para mí.9 9. un aumento en la venta de viviendas nuevas debería aumentar las ventas de automóviles. Si a la economía chilena le va bien y cada habitante tiene más poder adquisitivo. Ignacio.A. en su experiencia. Joaquín. Dependencia lineal Objetivos Analizar correlaciones entre variables a través del coeficiente de correlación y test de hipótesis. es administrada por Joaquín Geills. Para poder tener mayor información y prepararse ante posibles escenarios macroeconómicos adversos. Una vivienda va acompañada de un auto. su señora Daniela y por Ignacio. las únicas variables importantes son: el precio del dólar y el Producto Interno Bruto per cápita. la variable vivienda debería ser clave. Como primera aproximación. Distinguir variables espúreas de las variables relevantes. Módulo de Análisis de Datos: Coeficiente de correlación 9. Fundada en el año 2006. sufrieron los embates de la crisis económica que afectó a la economía mundial y que repercutió fuertemente en el rubro automotriz y a su negocio en particular. también adquiera un vehículo. como im- 41 . su hijo menor.

Indique. Analice signo y significancia de los coeficientes de correlación. analizando las opiniones de cada uno de los integrantes de la familia. ¿Qué es más apropiado para el análisis de estas variables?¿Los valores absolutos o las tasas de cambio? ¿Por qué? 6. 9. indique en cuáles se puede apreciar algún grado de dependencia entre las variables. Con el objeto que pueda realizar un análisis cuantitativo usted dispone de la base de datos datoslab9. Los datos abarcan desde el año 1994 hasta el 2007. que la venta de automóviles también debería depender del número de personas que nazcan. a mayor precio del dólar más caro debemos venderlos y por ende menos nos compran. agrega: “También hay que considerar que a medida que la población aumenta más vehículos se van a demandar”. A partir de ellos. Realice un análisis de correlación entre las variables. 4. su señora. Especialmente si crece el número de personas jóvenes. Obtenga la tasa de cambio para cada una de las variables y obtenga las correlaciones. Daniela. Es decir. 2. Los siguientes gráficos fueron obtenidos de las bases de datos del Banco Central de Chile y corresponden a las variables mencionadas por cada integrante de. ¿Que puede concluir respecto a las variables que afectan la venta de autos en Chile? 42 .4 Preguntas a Resolver 1. que son las que más manejan. Analice signo y significancia.xls la que incluye las variables antes mencionadas. 5. qué variables causan a cuales. según lo que se desprende de lo dicho por cada uno. ¿La dependencia observada es negativa o positiva? 3.portamos los vehículos.

43 .

44 .

10.3 Caso Aplicado: Modelo CAPM del Sector Eléctrico Enersis S. Su principal rubro es la minería del hierro. La empresa Vale do Rio Doce es una empresa fundada en 1942 con sede en Rio de Janeiro.DE. PRONOSTICO. En el año 1992 Enersis se expandió internacionalmente teniendo presencia en sectores eléctricos de Argentina. Dentro de las actividades que realiza están: la exploración. 45 . Al 31 de diciembre del 2010 tenía 195 plantas eléctricas y servía. 10. Obtener el R cuadrado. Pronóstico Objetivos Realizar una regresión lineal simple basado en el modelo de mercado.EJE.A. R-cuadrado. En 1993 comenzó a transar ADRs en la Bolsa de Nueva York (NYSE) bajo el nemotécnico ENI. Vale S. Brazil. servicios de ingeniería e informática.CORREL.10 10.A. Comenzó en el año 1988 como una sociedad nacida de la Compañía Chilena Metropolitana de Distribución Eléctrica cuya entrada al mundo privado se formalizó el año 1987 con la incorporación de varias AFP-s e inversionistas privados e institucionales junto con los mismos trabajadores de la empresa. Colombia y Perú. procesamientos de datos y servicios de abastecimiento y comercialización de productos eléctricos.A.1 Test de Significancia Individual. Brasil.2 Funciones Excel 2010 Funciones: PENDIENTE. Enersis S. es una empresa de distribución eléctrica. servicios de logística y generación de energía eléctrica. producción y venta de metales y fertilizantes. COEF. como consumidores finales. INTERSECCION. a aproximadamente 50 millones de personas. probar significancia del estimador de la pendiente y realizar un pronóstico basado en un escenario desfavorable para la economía mundial.

la tasa de retorno no explicada por la parte determinística del modelo. Los requisitos mínimos para que una acción esté dentro del portafolio son los siguientes: 1. es decir. el retorno de la acción fluctuará en mayor medida que la economía. Estar dentro de las 10 empresas con mayor capitalización bursátil de sus respectivos países 46 . y con riesgo moderado. La tasa de retorno de una acción se calcula como: ∗ ∗ − −1  = ∗ −1 donde ∗ es el precio de cierre ajustado por dividendos y divisiones (Split) en la fecha . Al igual que en el modelo del CAPM. En el caso que el beta sea mayor que 1. el parámetro  (el beta) es una medida de riesgo sistemático. y  es el residuo de la regresión. es el componente del retorno de la acción que se ve directamente afectado por las fluctuaciones de la economía como un todo. Es decir. Dentro de las 18 carteras que administra. el retorno fluctuará en menor medida que los cambios en los retornos en la economía y por tanto su riesgo será menor. En el año 2002 comenzó a transar ADRs en la Bolsa de Nueva York (NYSE) bajo el nemotécnico VALE. Modelo de Mercado El modelo de Mercado es una variante del Modelo de CAPM en donde se tiene la siguiente ecuación:  =  +  +   es la tasa de retorno de la acción en el período “”.  es la tasa de retorno de la cartera de mercado para el mismo período “”. posee un fondo de inversión denominado LAT20 que agrupa 20 empresas latinoamericanas.Actualmente posee 10179 kilómetros de líneas férreas y 8 terminales marítimos. Problema del laboratorio La empresa de inversiones BlueFinders es una empresa de inversiones con sede en USA que invierte en compañías con alta capitalización bursátil. en caso que sea menor que 1. De la misma manera.

disminuirá o dejará igual la participación de los activos que componen su cartera o. Dos de las 20 empresas que componen el portafolio son Enersis S.finance. (búsquelas en la página por su nemotécnico). Analice. Actualmente cada una representa un 5% y un 7% del portafolio del fondo LAT20 respectivamente y están dentro de las 10 empresas con mayor capitalización bursátil en sus países.A. significancia y 2 . ¿qué cambio haría en la participación de estas acciones en su portafolio? Explique conceptualmente. Utilice el índice S&P500 como retorno de mercado (el nemotécnico es: ^GSPC.A. Poseer un riesgo de mercado (medido por su beta de 90 días bolsa) de no más de 1. El precio ajustado está en la columna Adj.com obtenga las series de precios de ambas acciones y calcule las tasas de retorno según metodología planteada en la sección “Modelo de mercado”.2. ¿Cuál es el pronóstico para 1 día suponiendo que el mercado (a través del índice S&P500) baja un 1%? 6. 3.5. 47 . 4.4 Preguntas a Resolver 1. Si usted tiene la convicción de que aquí a 6 meses el mercado bajará un 6%. en caso de no cumplir con los requisitos mínimos anteriormente establecidos por más de 2 semestres consecutivos. 3. 2. A través del sitio http://es. 10. ¿Cumplen ambas acciones con el punto 3 de los requisitos para estar en el fondo LAT20? 5. Tener una participación dentro del fondo de no más de 10% y no menos de un 2% A finales de mes el administrador del portafolio debe decidir si aumentará.Close. Transar en el mercado de ADR‘s en USA. y Vale S. sacarla del fondo.yahoo. ¿Es el modelo de mercado un buen modelo para la tasa de retorno de estas acciones 4.

11. la cantidad y tipos de premios.3 Caso Aplicado: Sector Inmobiliario en Santiago La metodología de precios hedónicos consiste en explicar el precio de un producto (o servicio) a través de sus atributos. el tipo de envase (botella o caja). negativa o no tenerla. La función específica que utilizaremos es la de una función lineal. Estos atributos pueden tener una incidencia positiva (es decir hacer aumentar el precio del producto o servicio. También suelen aplicarse funciones semi-logaritmicas y logarítmicas (funciones que serán utilizadas en el laboratorio 12).11 11.1 Modelo de regresión múltiple. Por ejemplo. Esta incidencia es observada en el signo del beta que acompaña a esa variable. una función de la siguiente forma:  = 0 + 1 1 + 2 2 +  + −1 −1 +  donde  es el precio del departamento y los s sus atributos. podemos explicar el precio del vino por: los grados alcohólicos que tiene. Variables dicotómicas y politómicas. la nota otorgada por un catador experto. Las variables que utilizaremos y los nombres asociados a los datos de la 48 . 11. Test de significancia conjunta Objetivos Analizar las variables que inciden en el precio de un departamento en la comuna de providencia utilizando el modelo de precios hedónicos. etc.2 Funciones Excel 2010 Módulo Análisis de datos: Regresión. Es decir. el tamaño del envase (en centímetros cúbicos). Probar significancia de las variables en forma conjunta y ver impacto de variables dicotómicas y politómicas. En este laboratorio exploraremos los atributos que inciden en el precio de venta de departamentos en la comuna de Providencia.

 no) Saloneven Si posee gimnasio (1 si. 0.portalinmobiliario. no) Si tiene ubicación nor‐poniente (1 si. 0. primer piso.com durante el mes de noviembre de 2011 y de llamadas telefónicas realizadas para aquellas variables que no aparecían publicadas.xls son las siguientes: Variable Nombre de la variable en datoslab11. Para medir la distancia a la estación de metro más cercana se utilizó los 3 En la recolección de datos. 0. no) Cociamo Si hay piscina (1 si. Maximiliano Cuevas y Matías Fuentes. este laboratorio contó con la ayuda de los alumnos Carlos Benavente. no) Estacio Si posee bodega (1 si. 0. variable politómica compuesta de las siguientes variables dicotómicas: Si tiene ubicación nor‐oriente (1 si.hoja de Excel datoslab11. no) Gim Si posee estacionamiento (1 si. 0.) Superficie total (en metros cuadrados) Mts2 Número de Dormitorios Dorm Número de baños Ban Si la cocina es amoblada  (1 si. 2 segundo piso. 0. 0.xls Precio del departamento (en pesos) Precio Distancia desde el metro (en metros) Dist Piso del inmueble Piso (1. etc. no) Bodega Ubicación. 0. 49 . no) Piscina Si posee salón de eventos (1 si. no) nororien Si tiene ubicación sur‐oriente (1 si. 0. no) norponien Si tiene ubicación sur‐poniente (excluida) surorien Los datos3 fueron obtenidos de www.

Realice la regresión utilizando la herramienta de Análisis de Datos de Excel. Otro punto a considerar es que el precio de venta utilizado fue el que se publica antes de cerrar un acuerdo de venta y por ende no representa necesariamente el precio final ni el de equilibrio. ¿Son las variables independientes significativas en forma conjunta? 4. Sin embargo. basurales). indique: ¿Qué signo esperaría que tuviese las variables: metros cuadrado. Sin embargo. 11. Antes de realizar la regresión. En este sentido existe un sesgo.mapas y las funciones de medición de distancias del sitio www. sino por otras variables como la especulación. 2. las políticas regulatorias. etc. Debemos tomar en cuenta que el precio de una propiedad no sólo esta dado por estos atributos. cercanía con lugares no deseados (como cárceles.mapcity. piscina. ¿Es la variable ubicación significativa? Para verificarlo realice un test de significancia conjunta a las variables dummies asociadas a ubicación. 50 . la diferencia de precios para estos casos suele ser mínima. distancia al metro? Explique brevemente.4 Preguntas a Resolver 1. es un muy buen punto de inicio para entender las variables que inciden y la magnitud en las que afectan el precio. ¿Son los signos obtenidos coherentes con lo que usted esperaba en el punto 1)? 3.cl. piso.

12. Según información de ProChile para el año 2011 los países desde los que importamos cerveza son. Perú. 51 . Guatemala. Rusia España. También existe una gran variedad de cervezas internacionales. EXP. Las variables que utilizaremos y los nombres asociados a los datos4 de la hoja de Excel 4 Este laboratorio contó con la ayuda en la recopilación de datos de los alumnos Juan José Sánchez. destaca el gran crecimiento que ha tenido la industria artesanal. Turquía. Comparar R cuadrado ajustado y realizar test Reset de Ramsey.3 Caso Aplicado: La Industria de Cervezas en Chile Aunque la cerveza en nuestro país no alcanza los niveles de consumo de otros países (según la consultora Euromonitor International el año 2010 Chile fue el menor consumidor de Sudamérica con 47 litros anuales por persona). Bélgica. A través de un modelo de Precios Hedónicos. 12. Holanda. Especificación funcional y selección de modelos. existe una gran variedad de marcas y tipos. Singapur. Entre ellas.12 12. Este modelo establece que el precio de un producto está en función de sus características. analizaremos las variables que inciden en el precio de las cervezas en Chile. Bolivia Alemania. Modelo semi-logarítmico. China y Reino Unido.2 Funciones Excel 2010 Funciones: LN.1 Modelo de regresión múltiple. en orden de mayor a menor volumen: Estados Unidos. Argentina. Juan Pablo Barba y Guillermo Yávar. R-cuadrado ajustado Objetivos Testear entre modelos alternativos y con distinta especificación funcional.

sino que también la base de datos”? 6.xls son las siguientes: Variable Si es artesanal (1 si. Realice una regresión lineal simple y contraste los resultados con el punto 1) 4. Compare el R cuadrado ajustado. 0 no)f Color Si es Negra (1 si es Negra.4 Nombre de la variable en datoslab11. 0 si es normal) Si es con o sin alcohol (1 si tiene alcohol. ¿Cual modelo es mejor tomando en cuenta esta medida? 52 .datoslab12. 0 resto) Si es amarilla (1 si es Amarilla: 0 resto) Presentación Botella retornable (1 si es botella retornable. 0 si es nacional) Si es normal o light (1 si es light. Explique qué problema puede tener la regresión dado que los datos fueron obtenidos de distintos sitios (3 supermercados y páginas web). 0 resto) Lata (0. ¿Son los grados alcohólicos una variable importante en términos de magnitud? (contraste con la significancia) 5. Realice una regresión con las variables que sean significativas. Analizando la base de datos de Excel ¿qué inconvenientes tiene la variable light en relación a su representatividad? ¿Qué puede decir de la siguiente recomendación “siempre es bueno analizar no sólo los resultados de las salidas. 0 resto) 12.0) Cantidad de contenido (en CC) Grados alcohólicos Nacional o Importada (1 si es importada. si es botella desechable. indique qué signo esperaría para las variables  y ? 2.xls artesanal Negra Amarilla Botella Desechable cc grados importada light alcohol Preguntas a Resolver 1. ¿Sin realizar aún la regresión. 0 resto) Botella desechable (1. ¿Sería mejor la recopilación de datos de un solo lugar? 3.

7. Realice una regresión semi-log con todas las variables (signifcativa y no significativas) ¿ Mejora la estimación con esta especificación? 8. Verifique que la especificación funcional semi-log es apropiada con el test de Reset de Ramsey. 53 . Elija hasta una potencia de 3 para el test.