You are on page 1of 159

21/04/2013

METODOS CUANTITATIVOS

Profesora: Sara Arancibia C


2013

Contenidos

• Estadística Descriptiva
• Introducción a Inferencia Estadística
• Distribuciones de Probabilidad
• Una introducción al análisis de correlación y regresión
lineal

1
21/04/2013

ntroducción a la Estadística Descriptiva

¿Qué es la Estadística?
Estadística: Ciencia que trata de la recopilación
recopilación, organización
organización,
presentación, análisis e interpretación de datos numéricos
(estadísticas) con el fin de realizar una toma de decisiones más
efectiva.

¿Quién utiliza la Estadística?

Las técnicas estadísticas se aplican de manera amplia en


mercadotecnia,
d t i contabilidad,
t bilid d control
t l de
d calidad
lid d y en otras
t
actividades; estudios de consumidores; análisis de resultados;
administración de instituciones; la educación; organismos
políticos, médicos; y por otras personas que intervienen en la
toma de decisiones.

ntroducción a la Estadística Descriptiva

Estadística descriptiva: Procedimientos estadísticos que sirven para


organizar
g y resumir conjuntos
j de datos numéricos
Trata la presentación de datos en gráficas o en distribuciones de
frecuencias y diversas tablas estadísticas , y de aplicar medidas de
tendencia central y medidas de dispersión. ( DESCRIBIR
INFORMACIÖN).

Estadística inferencial: Procedimientos estadísticos que sirven para


deducir o inferir algo acerca de un conjunto de datos numéricos
(población), seleccionando un grupo menor de ello ( muestra).
Funciona tomando una muestra de una población y efectuando
estimaciones acerca de una característica de esa población con base
en los resultados de muestreo.

2
21/04/2013

Estadística Descriptiva

Población: Conjunto
j de todos los posibles
p individuos,,
personas,objetos o mediciones de interés científico

Para deducir algo acerca de una población, por lo


general se toma una muestra de dicha población.

Muestra: Una porción, o parte de una población de interés.

Estadística Descriptiva

Tipos y ejemplos de variables

Datos

Cualitativos o de atributo Cuantitativos o numéricos


(las no numéricas)

Ejemplos:
Tipo de auto
Color de cabello Discretos Continuos
Género
Número de hijos Peso de un embarque
Cantidad de empleados Distancia entre dos
ciudades

3
21/04/2013

Estadística Descriptiva

Niveles de medición

Nivel de Medición Nominal:

En este nivel se tienen dos o más categorías del ítem o


variable.Las categorías no tienen orden o jerarquía. Lo que
se mide es colocado en una u otra categoría, lo que indica
solamente diferencias respecto a una o mas características.

Por ejemplo la variable sexo de la persona tiene sólo dos


categorías: masculino y femenino.

Ninguna tiene mayor jerarquía que la otra, las categorías


únicamente reflejan diferencias en la variable.
No hay orden de mayor a menor.

Estadística Descriptiva

Si le asignamos una etiqueta o símbolo a cada categoría, esto identifica


exclusivamente a la categoría.

Por ejemplo;
M=Masculino; F=Femenino

Si usamos números por ejemplo;


1=Masculino
2=Femenino
Los números utilizados en este nivel de medición tienen una función
puramente de clasificación y no se puede manipular aritméticamente.

Otros ejemplos: tipo de escuela a la que asiste ( privada-pública),


afiliación política (Partido A,Partido B, Partido C....), la carrera elegida, la
raza, la ciudad de nacimiento, el canal de televisión preferido.

4
21/04/2013

Estadística Descriptiva

NOTA: Las categorías son los niveles donde serán


caracterizados las unidades de análisis.

OBS: las categorías se consideran como mutuamente


excluyentes y exhaustivas.

Mutuamente excluyente: Una persona, objeto o medición


se incluye solamente en una categoría.

Exhaustiva: Cada individuo, objeto, o medición debe


aparecer en una categoría.

Estadística Descriptiva

Nivel de medición ordinal


En este nivel hay
y varias categorías,
g pero además éstas
mantienen un orden de mayor a menor. Las etiquetas o
símbolos de las categorías sí indican jerarquía.

Calificación de estudiantes o personal diverso:

Calificaciones Número de personas


Excelente 6
Muy bien 28
Bien 25
Suficiente 17
Deficiente 0

5
21/04/2013

Estadística Descriptiva

Nivel de medición por Intervalos


Además del orden o jerarquía entre categorías, se establecen
intervalos iguales en la medición. Las distancias entre categorías
son las mismas a lo largo de toda la escala. Hay intervalo constante,
una unidad de medida.
Ejemplo:

Las puntuaciones en un cierto examen y las calificaciones en


uno de historia o de matemáticas son ejemplos de la escala de
medición de intervalo.
Obs: El cero en la medición, es un cero arbitrario, no es real (se
asigna arbitrariamente a una categoría el valor cero y a partir de
ésta se construye la escala).

Estadística Descriptiva

Nivel de medición de razón


En este nivel, además de tenerse todas las características
del nivel de intervalos ( intervalos iguales entre las
categorías y aplicación de operaciones aritméticas básicas
y sus derivaciones), el cero es real, es absoluto ( no es
arbitrario). Cero absoluto implica que hay un punto en la
escala donde no existe la propiedad.

Ejemplos de estas mediciones sería la exposición a la


televisión, el número de hijos,
televisión hijos la productividad,
productividad las
ventas de un producto y el ingreso.

6
21/04/2013

Estadística Descriptiva

Desde luego hay variables que pueden medirse en más


de un nivel, según el propósito de medición. Por ejemplo
la variable “antigüedad en la empresa”
empresa”.

Nivel de medición Categorías


De razón En días ( o a K días)
Ordinal Bastante antigüedad
Regular antigüedad
Poca antigüedad
Es muy importante indicar el nivel de medición de todas las variables e ítems
de la investigación, porque dependiendo de dicho nivel se selecciona uno u
otro tipo de análisis estadístico
( por ejemplo, la prueba estadística para correlacionar dos variables de
intervalo es muy distinta a la prueba para correlacionar dos variables
ordinales).

13

Estadística Descriptiva

1.-Resumen de datos: distribuciones de frecuencias y


representaciones gráficas
La primera tarea es describir los datos, valores o puntuaciones obtenidas
para cada variable.

¿Cómo pueden describirse estos datos?

Describiendo la distribución de las puntuaciones o


frecuencias
¿Qué es una distribución de frecuencias?

Una distribución de frecuencias es un conjunto de


puntuaciones ordenadas en sus respectivas categorías.

7
21/04/2013

Estadística Descriptiva
Variable: Cooperación del personal para el proyecto de calidad de la
empresa.
Categorías
g Códigos
g Frecuencia
Si se ha obtenido la cooperación 1 91
No se ha obtenido la cooperación 2 5
No responden 3 26
Total 122
Ingreso familiar ($) Frecuencia
10.000-11.999 12
A veces , las categorías de las 12.000-13.999 14
distribuciones de frecuencias 14.000-15.999 24
son tantas que es necesario 16.000-17.999 15
resumirlas en clases. 18.000-19.999 13
20.000-21.999 7
22.000-23.999 6
24.000-25.999 4
26.000-27.999 3
28.000-29.999 2
Total 100

Estadística Descriptiva

¿Qué otros elementos contiene una distribución de


frecuencias?

Las distribuciones de frecuencias pueden completarse


agregando las frecuencias relativas y las frecuencias
acumuladas. Las frecuencias relativas son los porcentajes de
casos en cada categoría, y las frecuencias acumuladas son
las que se van acumulando en cada categoría, desde la más
baja hasta la más alta.

Categorías Códigos Frecuencias Frecuencias Frecuencias Frecuencias


absolutas relativas% acumuladas Acumrelativas
Si se ha obtenido la cooperación 1 91 74,6 91 74,6
No se ha obtenido la cooperación 2 5 4,1 96 78,7
No responden 3 26 21,3 122 100

8
21/04/2013

Estadística Descriptiva
¿Cómo presentar las distribuciones de frecuencia?

Pueden presentarse con los elementos más informativos para el lector y


la verbalización de los resultados o un comentario o en forma de
histograma o gráficas de otro tipo.

Ejemplo: ¿ Se ha obtenido la cooperación del personal para el proyecto


de calidad de la empresa?
Categorías N de organizaciones Porcentajes

Si se ha obtenido la cooperación 91 74,6


No se ha obtenido la cooperación 5 4,1
No responden 26 21 3
21,3

Comentario: Prácticamente tres cuartas partes de las organizaciones si han


obtenido la cooperación del personal. Llama la atención que poco más de una
quinta parte no quiso comprometerse con su respuesta. Las organizaciones que no
han logrado la cooperación del personal mencionaron como factores al ausentismo,
rechazo al cambio.

Estadística Descriptiva

Representación gráfica de una distribución de frecuencia


Tres diagramas que representan de manera adecuada, una distribución
de frecuencias son el histograma
histograma, el polígono de frecuencias y el
polígono de frecuencias acumuladas.

Un histograma describe una distribución de frecuencias utilizando una


gráfica de barras ( rectángulos verticales adyacentes), en la que la altura de
cada barra es proporcional a la frecuencia de la clase que representa.

Histograma
Motivación hacia el trabajo
40 35 36
33
30 27
20
20
10 8
10

0
20-24,9 25-29,9 30-34,9 35-39,9 40-44,9 45-49,9 50-54,9

9
21/04/2013

Estadística Descriptiva

El polígono de frecuencias consiste en una línea poligonal formada por segmentos


de recta que unen los puntos determinados por la intersección de la vertical del
punto medio de clase, y la horizontal de la frecuencia de clase.

Polígono de frecuencia
Motivación hacia el trabajo

40
35 35 36
33
30
27
25
20 20
15
10 10
8
5
0
20-24,9 25-29,9 30-34,9 35-39,9 40-44,9 45-49,9 50-54,9

Estadística Descriptiva

Un polígono de frecuencias acumuladas (ojiva) se utiliza cuando se desea


determinar cuántas observaciones se encuentran por encima o debajo de
ciertos valores.

Polígono de frecuencias acumuladas


Motivación hacia el trabajo

180
169
160 161
140 134
120
100 98
80
60 65
40
30
20
10
0
20-24,9 25-29,9 30-34,9 35-39,9 40-44,9 45-49,9 50-54,9

10
21/04/2013

Estadística Descriptiva

Diagrama de Pareto
Un diagrama de Pareto se asemeja a un histograma, excepto que es una gráfica
de barras de frecuencias de una variable cualitativa
cualitativa.
Los diagramas de Pareto se usan en el control de procesos para tabular las
causas asociadas con variaciones de causas atribuibles en la calidad del
producto. Los diagramas de Pareto permiten que tanto equipos de trabajadores
como gerentes se concentren en las áreas más importantes en las que se
necesitan acciones correctivas.

Ejemplo:

Se encontró que los refrigeradores que no fueron aprobados en la


inspección final en una planta ensambladora de aparatos eléctricos durante
el último mes tenían defectos debidos a las siguientes causas: ensamble,
acabado de laca, fallas eléctricas, abolladuras u otras causas. Realizar un
diagrama de Pareto.

Estadística Descriptiva

Diagrama de Pareto de : Defectos


40
Po
orcentaje

30 100

20

50

10
Frecuencia

10
7
5 5
0 3 0
Ensamble Laca Abolladu Eléctric Otros

DEFECTO

11
21/04/2013

Estadística Descriptiva

Tablas de contingencia
Las tablas de frecuencia pueden organizar datos de sólo una
variable a la vez. Si se desea examinar o comparar dos
variables, una tabla de contingencia resulta de mucha
utilidad.

Supongamos que se recolecta información sobre el número


de pasajeros de una línea aérea, también se obtuvieron datos
sobre las edades de los pasajeros y el número de vuelos en
l que se registraron
los i t cada
d año.
ñ Ambas
A b variables
i bl pueden
d
verse en detalle mediante una tabla de contingencia.

Estadística Descriptiva

Número de vuelos por año


Edad 1-2 3-5 Mayor de 5 Total
Menor de 25 1 (2%) 1 (2%) 2 (4%) 4 (8%)
25-40 2 (4%) 8 (16%) 10 (20%) 20 (40%)
41-65 1 (2%) 6 (12%) 15 (30%) 22 (44%)
66 y más 1 (2%) 2 (4%) 1 (2%) 4 (8%)
Total 5 (10%) 17 (34%) 28 (56%) 50 (100%)

También se podría mostrar la información en cada celda


según
g el género.
g Todas las otras características
relevantes de los pasajeros también podrían
incorporarse en la tabla. Dicho perfil descriptivo podría
ser muy útil en la identificación del pasajero típico y en el
establecimiento de políticas de marketing efectivas.

12
21/04/2013

Estadística Descriptiva

2.- Descripción de los datos: Medidas de tendencia central


¿Qué es un promedio?
Valor que representa un conjunto de datos
datos.
Señala un centro de los valores.
Una denominación más precisa que promedio es medida de
tendencia central.

Las medidas de tendencia central, que por lo


común se emplean en administración y economía
son :

• la media aritmética
• la mediana
• la moda
• la media geométrica

Estadística Descriptiva
Media: (Mean) La media ( promedio) es la medida de tendencia central más
utilizada y puede definirse como el promedio aritmético de una distribución.
Es una medida solamente aplicable a mediciones por intervalos o de razón.

Media de una muestra:

X
X
n
donde  X indica la suma de todos las X
n es el número total de valores en la muestra
M di de
Media d una población:
bl ió


X
N
 indica la media poblaciona l.
N es el número total de observacio nes en la población

13
21/04/2013

Estadística Descriptiva

Ejemplo:

El ingreso anual (en dólares) de una muestra de varios empleados en una


industria son: 42900, 49100,38300 y 56800.
La media muestral es 187100/4=46775.
¿La media obtenida es un dato estadístico o un parámetro?
Estadístico porque es un valor muestral.

Nota:Cualquier
q característica medible de una muestra se llama dato
estadístico. Cualquier característica medible de una población, como la
media, se denomina parámetro.

Estadística Descriptiva

La Mediana:(Median) es el valor céntrico en un conjunto de valores


ordenados de menor a mayor o de mayor a menor.Una forma fácil de
localizar la posición del elemento medio para datos no agrupados es por
medio
di de:
d

n 1
2
•. Es una medida de tendencia central propia de los niveles de una medición
ordinal, por intervalos y de razón.
•. No es influenciada por valores extremos.
•. 50%de
50%d llas observaciones
b i son mayores que la
l mediana.
di
• No necesita ser uno de los valores del conjunto de datos.
• Es única para un conjunto de observaciones.

14
21/04/2013

Estadística Descriptiva

Ejemplo:

Supóngase que intenta adquirir una casa en un condominio de la comuna de La


Reina. El agente de ventas le indicó que el precio promedio de las casas
disponibles en este momento es de 4225 UF.
Si tuviera un presupuesto máximo de 2800UF, podría pensar que está fuera de
sus posibilidades. Sin embargo al verificar los precios individuales de las casas
podría cambiar de idea. Los precios son 2300UF, 2600UF, 3500UF y 8500UF.
El precio 8500UF está haciendo que la media se incline hacia arriba, por lo que
es un promedio no representativo. Un precio entre 2600 y 3500 es un promedio
más representativo. En casos como éste la mediana proporciona una medida
más exacta de la tendencia central.

Estadística Descriptiva

La moda: (mode): Valor de la observación que aparece con más frecuencia.

•La moda es útil en especial al describir los niveles nominal y ordinal de


medición (aunque puede determinarse para todos los niveles de datos)
•Un conjunto de datos puede tener más de una moda

Ejemplo:

Una empresa ha desarrollado cinco lociones para baño. En el diagrama se


muestran los resultados de una investigación de mercado diseñada para
determinar qué loción para baño prefieren los consumidores
consumidores.

15
21/04/2013

Estadística Descriptiva

Número de entrevistados acerca de lociones


para baño

400 360

Número de respuestas
350
300
250
200 180

150 105
100 70
50
50
0
Cariño Lamoure Extasis Elegancia Nocturna

La mayor cantidad de respuestas favoreció a la llamada Lamoure,


según lo indica la barra más alta. Por tanto tal producto es la moda.

Estadística Descriptiva

Uso de media, mediana y moda


Datos de la población
La moda puede ser útil como medida descriptiva de un grupo de la
población, aunque sólo si existe una moda claramente perceptible.

La mediana es siempre una medida excelente para representar el nivel típico


de los valores observados, como los índices salariales, de una población.
Esto es así independientemente de la existencia de más de una moda o de
que la distribución de la población sea asimétrica o simétrica.

La media aritmética es excelente como valor representativo de una


población,
bl ió aunque sólo ól sii la
l población
bl ió es claramente
l t simétrica.
i ét i En
E datos
d t no
simétricos, los valores extremos distorsionarán el valor de la media como
valor representativo.

16
21/04/2013

Estadística Descriptiva

Uso de media, mediana y moda

Datos muestrales
La moda: La moda no es una medida aceptable de posición respecto de
datos muestrales, porque su valor puede variar ampliamente de una
muestra a otra.

La mediana: es mejor que la moda, porque su valor es más estable entre


muestra y muestra.

La media: es la más estable de las tres medidas.

Estadística Descriptiva

Ejemplo:

Se han recopilado los índices salariales de los 650 empleados por hora de
una empresa manufacturera.
f t L
La medida
did más
á representativa
t ti del
d l índice
í di
salarial típico es la mediana, porque en este caso está implicada una
población y la mediana no se ve relativamente afectada por la posible falta
de simetría de los índices salariales.

Ejemplo:

Una muestra aleatoria de n=100 índices salariales se obtiene en una


compañía con varios miles de empleados por hora El índice salarial más
representativo de estos varios miles de empleados es la media muestral.
Aunque es improbable que la media muestral sea exactamente igual al índice
salarial medio de toda la población, por lo general se hallará mucho más
cerca de la media poblacional que la mediana muestral como estimador del
índice salarial mediano de la población.

17
21/04/2013

Estadística Descriptiva

Nota: Es mejor usar la mediana que la media como


medida de tendencia central,
central cuando un conjunto de
datos contiene valores extremos. Otra medida que se usa
a veces cuando hay valores extremos es la media
recortada al 5%, que se obtiene eliminando el 5% de los
valores mayores y el 5% de los menores, en un conjunto
de datos, procediendo entonces a calcular el promedio
de los valores restantes.

Estadística Descriptiva
Media Geométrica

La media ggeométrica (MG)


( ) tiene una amplia aplicación en los negocios
g y en
la economía.
Hay dos usos principales de la MG:
1)Para promediar porcentajes, índices y cifras relativas
2) Para determinar el incremento porcentual promedio en ventas,
producción u otras actividades o series económicas de un periodo a otro.

La media geométrica (MG) de un conjunto de n números positivos se define


como la raíz n-ésima del p
producto de los n números. Proporciona
p una medida
precisa de un cambio porcentual promedio en una serie de números.

MG  n ( X 1 )( X 2 )( X 3).............( X n )

18
21/04/2013

Estadística Descriptiva
Ejemplo:

Para ilustrar el empleo de la media geométrica en promedios de porcentajes


, supóngase que las utilidades obtenidas por una compañía constructora en
cuatro proyectos fueron de 3, 2 , 4 y 6%, respectivamente. ¿Cuál es la
media geométrica de las ganancias?

MG n (X1)(X2 )(X3)(X4 )


 4 (3)(2)(4)(6)
 4 144
 3,46
La media geométrica 3,46 da una cifra más conservadora para las
utilidades porque no se ve tan afectada por los valores extremos. En
realidad, será igual o menor que la media aritmética.

Estadística Descriptiva
Ejemplo:

Suponga que usted recibe un 5 por ciento de aumento en su salario este año
y un 15 por ciento de aumento el año próximo.
próximo El incremento porcentual
promedio es 9.886, no 10.0. Empezamos por calcular la media geométrica.
Recuerde, por ejemplo, que un aumento de 5 por ciento en el salario es 105 o
1.05. Lo escribiremos como 1.05.
Esto se puede verificar suponiendo que su salario mensual sea de $3.000 al
empezar y que usted reciba dos aumentos de 5 por ciento y de 15 por ciento.
Aumento 1 = $3.000 (.05) = $150.00
Aumento 2 = $3.150 (.15) = 472.50
Total $622.50
Su aumento total de salario es $622.50. Esto es equivalente a:
$3.000.00 (.09886) = $296.58
$3.296.58 (0.9886) = $325.90
$622.48 que es aproximadamente $622.50

19
21/04/2013

Estadística Descriptiva

Para determinar el incremento porcentual promedio en ventas,


exportaciones, población u otras series se utiliza la siguiente fórmula:

INCREMENTO PORCENTUAL PROMEDIO


EN EL TIEMPO

Valor al final del periodo


GM  n 1
Valor al principio del periodo

Estadística Descriptiva

Ejemplo:

La población de Haarlan,
Haarlan Alaska,
Alaska era de dos personas en 1990
1990, en 2000 fue de 22
22.
¿Cuál es la tasa de incremento anual promedio de este periodo?
Solución:
Hay 10 años entre 1990 y 2000 por lo que n = 10. La fórmula (3-6) para la media
geométrica aplicada a este tipo de problema queda:

22
MG  10  1  1.271  1  0.271
2
El valor final es .271. La tasa anual de incremento es 27.1 por ciento. Esto
significa que la tasa de crecimiento en Haarlan es 27.1 por ciento por año[1].

[1

20
21/04/2013

Estadística Descriptiva

Ejercicio:

El Director ejecutivo de la empresa Airlines desea determinar la tasa de


crecimiento promedio en los ingresos con base en las cifras entregadas
en la tabla: si la tasa de crecimiento promedio es menor que el promedio
industrial del 10% se asumirá una nueva campaña publicitaria .
Determine la tasa de crecimiento promedio.

Año Ingreso Miles de US$ Porcentaje del año anterior


1992 50
1993 55
1994 66
1995 60
1996 78

Estadística Descriptiva

Media Ponderada

La media ponderada de un conjunto de números denotados por


X1, X2, X3, ...,Xn, con ponderaciones
w1, w2, w3, ...,wn se calcula como sigue:

w1 X 1  w 2 X 2  .....  w n X n
Xw 
w1  w 2  .....  w n

Esto puede abreviarse.

21
21/04/2013

Estadística Descriptiva

Ejemplo:

Una empresa comercial paga a sus vendedores


$6 50 $7
$6.50, $7.50,
50 u $8
$8.50
50 (dól
(dólares)) por hora.
h
Podría llegarse a la conclusión de que la media de los sueldos (por
hora) es $7.50, obtenida al calcular: (6.50+7.50+8.50)/3. Esto es
cierto sólo si hay el mismo número de vendedores que perciben
$6.50, $7.50, y $8.50.
Sin embargo, supóngase que 14 empleados de ventas ganan $6.50,
a 10 se les paga $7.50,y 2 obtienen $8.50. Para encontrar la media
se debe calcular:

14(6.50)  10(7.50)  2(8.50)


Xw 
14  10  2

La media ponderada de los sueldos por hora es $7.04

Estadística Descriptiva

3.- Estadísticos de la distribución: Asimetría y curtosis


La asimetría es una estadística necesaria para conocer qué tanto nuestra
distribución se parece a una distribución teórica llamada curva normal.
normal

El sesgo o asimetría ( Skewness) es la carencia de forma simétrica en la


gráfica de un conjunto de datos.

•Si no existe asimetría o sesgo en los datos, son iguales la media, la mediana y
la moda. La mitad de los valores están por encima de estos promedios y la
mitad por debajo de ellos ( asimetría =0).

Media
mediana
Moda

22
21/04/2013

Estadística Descriptiva

Cuando la asimetría es positiva quiere decir que hay más valores


agrupados hacia la izquierda de la curva ( por debajo de la media).

•La moda es el valor que corresponde al punto más alto


•La media es el mayor de los tres promedios

Moda Media
Mediana

Estadística Descriptiva
Cuando la asimetría es negativa significa que los valores
tienden a agruparse hacia la derecha de la curva ( por encima
de la media).

•La moda es el valor que corresponde al punto más alto de la distribución.

•La media es el más pequeño de los tres promedios.

Media Moda
Mediana

Nota: Si la distribución es muy asimétrica, la media no sería un promedio


útil. La mediana y la moda son más representativas.

23
21/04/2013

Estadística Descriptiva

Coeficiente de asimetría
Karl Pearson desarrolló una medida para evaluar el sesgo de unas
distribución denominada coeficiente de asimetría (C
distribución, (C.A)
A)

3(media  mediana)
C. A 
desviación estándar
Ejemplo:

Las duraciones de estadía en el piso de cancerología de un hospital, se


organizaron en una distribución de frecuencias. La duración media fue 28
días, la mediana 25 días y la duración modal 23 días Se calculó la desviación
estándar de 4,2 días
¿Cuál es el coeficiente de asimetría?

El coeficiente de asimetría por lo general se encuentra entre -3 y 3. En


este caso es 2,4 e indica un grado importante de asimetría con sesgo
positivo.

Estadística Descriptiva
Curtosis;(Kurtosis) mide el grado de agudeza de una distribución.
Cuando la curtosis es cero, significa que
se trata de una curva normal, . Si es
positiva, quiere decir que la curva o
distribución es más levantada. Si es
negativa, quiere decir que la curva es
más plana .

Curva leptocúrtica Curva mesocúrtica

Curva plalticúrtica

Nota: La asimetría y la curtosis requieren mínimo un nivel de medición por intervalos.

24
21/04/2013

Estadística Descriptiva

4.- Medidas de Posición: Cuantiles


Los cuantiles son valores de la distribución que la dividen en partes iguales, es
d i en intervalos,
decir, i t l que comprendend ell mismo
i número
ú de
d valores.
l Los
L más á
usados son los cuartiles, los deciles y los percentiles.

Percentiles: Son 99 valores que dividen en cien partes iguales el conjunto de


datos ordenados. Ejemplo, el percentil de orden 15 deja por debajo al 15% de las
observaciones, y por encima queda el 85%.

Cuartiles: Son los tres valores que dividen al conjunto de datos ordenados en
cuatro
c atro partes ig
iguales,
ales son un n caso partic
particular
lar de los percentiles
percentiles.

Deciles: son los nueve valores que dividen al conjunto de datos ordenados en
diez partes iguales, son también un caso particular de los percentiles.

Estadística Descriptiva

La determinación de cuartiles con frecuencia es de utilidad. Por ejemplo


muchas escuelas de posgrados admitirán sólo aquellos estudiantes que
estén en el 25% superior (sobre el tercer cuartil) de los candidatos. Las
empresas, con frecuencia,
f i desean
d señalar
ñ l las
l plantas
l t cuyos deficientes
d fi i t
registros de producción los colocan por debajo del cuartil inferior.

El lugar del P-ésimo percentil se halla:

P
L p  (n  1)
100
Donde Lp es el sitio del percentil deseado en una serie ordenada
n es el número de observaciones.
P es el percentil deseado.

La amplitud intercuartil es la diferencia entre el tercer y primer cuartil.

25
21/04/2013

Estadística Descriptiva

Diagrama de Caja
(Box-plot)

El diagrama de caja permite


resumir los datos de una
gráfica.

Estadística Descriptiva

5.- Medidas de dispersión

Con frecuencia es conveniente contar con medidas de dispersión o


de la variabilidad de los valores de los datos.
Por ejemplo, suponga que usted es un agente de compras de una
importante empresa manufacturera, y que con regularidad coloca
pedidos con dos proveedores distintos. Ambos le indican que
necesitan alrededor de 10 días hábiles para surtir sus pedidos.
Después de varios meses de trabajar así encuentra usted que el
promedio de días necesarios para surtir los pedidos es realmente,
unos 10 para cada proveedor. Los histogramas que resumen la
cantidad de días hábiles requeridos para surtir los pedidos se ven en
la figura.

26
21/04/2013

Estadística Descriptiva

Aunque la cantidad promedio es, más o menos, de 10 en ambos casos


¿tienen éstos el mismo grado de confiabilidad para entregar a tiempo? ¿Qué
proveedor prefiere usted?

Proveedor A
.5 Proveedor B
Frecuencia
relativa .4

.3

.2

.1

9 10 11 7 8 9 10 11 12 13 15
Días hábiles Días hábiles

Estadística Descriptiva

Examinaremos varias medidas que describirán la dispersión o


variabilidad de los datos; la amplitud total, la varianza, la desviación
estándar, dispersión relativa.

¿Por qué estudiar la dispersión?

1. Al aplicar una medida de dispersión es posible evaluar la confiabilidad


del promedio que se está utilizando.
Una dispersión pequeña indica que los datos se encuentran acumulados
cercanamente, por ejemplo, alrededor de la media aritmética. Por tanto la
media se considera bastante representativa de los datos. Esto es la media
es un promedio confiable.
2. Una medida de dispersión permite apreciar cuán dispersas están dos o
más distribuciones.

27
21/04/2013

Estadística Descriptiva

Medidas de dispersión
Amplitud
p total ( rango)
g )
Se trata de la diferencia entre los valores mayor y menor de un
conjunto de datos.

Amplitud total= Valor más alto- Valor más bajo

Ejercicio: Los costos anuales de viaje para ejecutivos y gerentes medios


en una empresa se organizaron en distribuciones de frecuencias y se
representaron por medio de polígonos de frecuencias.
1 ¿Cuál
1. C ál es lla media
di aritmética
it éti ded los
l costos
t ded viaje
i j para ejecutivos?
j ti ?¿
Par los gerentes de nivel medio?
2. ¿Cuál es la amplitud total para los ejecutivos?¿ Y para los gerentes de
nivel medio?
3. Compare la dispersión de las dos distribuciones y explique lo que
indica.

Estadística Descriptiva

Gerencia de nivel medio

Ejecutivos

2000 6000 10000 12000

Nota: Un defecto importante de la amplitud total es que se basa sólo en dos


valores. No toma en consideración todos los datos.

28
21/04/2013

Estadística Descriptiva

Varianza y desviación estándar


La varianza y la desviación estándar se basan en las desviaciones con
respecto
p a la media.

Varianza:( Variance) Media aritmética de las desviaciones cuadráticas con


respecto a la media.

Varianza poblacional

(X X2  X 
2
  )2 
 2  o bien  2  
 
N N  N 
donde
 2  es el símbolo para la varianza de una población
X es el valor de la observación en la población
 es la media de la población
N es el número total de observaciones en la población

Estadística Descriptiva
En general es difícil interpretar el significado del valor de una varianza,
porque las unidades en las que se le expresa son valores elevados al
cuadrado. Es más frecuente el uso de la raíz cuadrada.

Desviación estándar:( Standard deviation) Raíz cuadrada de la varianza.

 ( X  )2  X 2    X 
2
  o bien  
 N 
N N  

Una desviación estándar pequeña para un conjunto de valores indica


que éstos se encuentran localizados cerca de la media. Por el contrario,
una desviación estándar grande revela que las observaciones están muy
dispersas con respecto a la media.

29
21/04/2013

Estadística Descriptiva
Varianza muestral

La fórmula para la varianza muestral utilizada como estimador de la


varianza poblacional es:

( X ) 2
 (X  X) 2 X2 n
s2  o bien s 2 
n 1 n 1

¿Por qué se hizo al denominador esta modificación?


Puede demostrarse que si se hubiera calculado la varianza
muestral utilizando sólo n en el denominador, el resultado
subestimaría la varianza poblacional. Esto es, la varianza muestral
sería un estimador sesgado de la varianza poblacional.

Estadística Descriptiva

Desviación estándar muestral

La desviación estándar de una muestra se utiliza como un estimador de la


desviación estándar de la población.

(X )2
(X  X )2 X 2

n
s o bien s 
n 1 n 1

30
21/04/2013

Estadística Descriptiva

Interpretación y usos de la desviación estándar


Por lo común la desviación estándar se emplea p como una medida p para
comparar la dispersión en dos o más conjuntos de observaciones. Por
ejemplo, la desviación estándar de las cantidades quincenales invertidas en
el plan de participación de las utilidades de una empresa se ha calculado
como 7,51 dólares. Supóngase que tal empresa tiene una rama en el sur. Si la
desviación estándar para otro grupo de empleados en el oeste es 10,47
dólares y las medias son aproximadamente iguales, esto indica que las
cantidades invertidas por los empleados del sur no se dispersan tanto como
las de los empleados del oeste (porque 7,51<10,47). Ya que las cantidades
invertidas por los empleados del sur se acumulan a la media, el valor medio
para estos trabajadores es una medida más confiable que la media para el
grupo del oeste.

Estadística Descriptiva

La desviación estándar se interpreta como cuánto se


desvía- en promedio
desvía promedio- de la media un conjunto de
puntuaciones.

Supóngase que un obtuvo para su muestra una media de


ingreso familiar de $800000 y una desviación estándar de
$100000. La interpretación es que los ingresos familiares
de la muestra se desvían en promedio respecto a la media
en cien mil pesos.

La desviación estándar sólo se utiliza en variables


medidas por intervalos o de razón.

31
21/04/2013

Estadística Descriptiva

Teorema de Chebyshev
El matemático ruso Chebyshevy desarrolló un teorema q que
permite determinar la proporción mínima de los valores que se
encuentra dentro de un número específico de desviaciones
estándares con respecto a la media.
Por ejemplo, con base en el teorema de Chebyshev, al menos tres
de cada cuatro valores, o 75%, deben encontrarse entre la media
más dos desviaciones estándares y la media menos dos
desviaciones estándares.
Esta relación se aplica sin importar la forma de la distribución.
distribución
Además, al menos ocho de cada nueve valores, o 89,9%, se
encontrarán entre la media más tres desviaciones estándares y la
media menos tres desviaciones. Al menos 24 de 25 valores, o
96%, se encontrarán entre la media y menos cinco desviaciones.

Estadística Descriptiva
En términos generales, el teorema de Chebyshev establece que; para un
conjunto cualquiera de observaciones (muestra o población), la proporción
mínima de los valores que se encuentran dentro de k desviaciones estándares
desde la media es al menos.
menos

donde k es una constante mayor que 1.


11/ k 2
Ejemplo:
suponga que la cantidad media quincenal depositada por los empleados de
una empresa en el plan de participación de utilidades de la empresa fue $51,04
y se obtuvo una desviación estándar de $7,51. Al menos ¿qué porcentaje de las
contribuciones se encuentran a una distancia de más dos desviaciones
estándares y menos dos desviaciones estándares de la media?
Solución; Aproximadamente 75%, que se obtiene al calcular

1
1  1 / k 2  1  1 / 22  1   0,75
4

32
21/04/2013

Estadística Descriptiva
El teorema de Chebyshev se refiere a cualquier conjunto de valores; esto es, la
distribución de los valores puede tomar cualquier forma. Sin embargo, para una
curva de distribución simétrica en forma de campana podemos ser más
precisos al explicar la dispersión
dispersión.

Para una curva de distribución simétrica en forma de campana, se puede ser


preciso al explicar la dispersión con respecto a la media.

Regla empírica ( regla normal): Para una distribución de frecuencias simétrica


de campana aproximadamente 68% de las observaciones se encontrará a más y
menos una desviación estándar de la media; aproximadamente 95% de las
observaciones se encontrarán a más y menos dos desviaciones estándares
desde la media; y prácticamente todas las observaciones 99,7% se encontrarán a
más y menos tres desviaciones desde la media.

Estadística Descriptiva

Curva simétrica de campana, que muestra las relaciones entre


desviación estándar y media.

-3s -2s -1s X 1s 2s 3s

68%

95%

99,7%

33
21/04/2013

Estadística Descriptiva

Ejemplo:

Se observa que las cuentas de energía eléctrica de una


zona residencial correspondiente al mes de junio tienen una
distribución normal. Si se calcula que la media de estas
cuentas es de $84, con una desviación estándar de $24,
entonces se desprende que aproximadamente 68% de las
cantidades facturadas se encuentran entre $60 y $108.
Asimismo de desprende que aproximadamente 95% de las
cantidades facturadas se hallan entre $36 y $132.

Estadística Descriptiva

Nota:
El concepto de desviación estándar es muy importante en los negocios y en
la economía. Por ejemplo, en finanzas la desviación estándar se utiliza como
medida
did de
d riesgo
i relacionada
l i d con varias
i oportunidades
t id d de d inversión.
i ió
Mediante el uso de la desviación estándar para medir la variabilidad en las
tasas de rendimiento ofrecidas por diferentes inversiones, el analista
financiero puede medir el nivel de riesgo que tiene cada activo financiero.

Ejercicio: Markus Boggs es gerente de Inversiones S:A. Markus estaba


interesado en las tasas de rendimiento de los últimos cinco años de dos
diferentes fondos mutuos. Fondo mutuo1 mostró, durante un período de
cinco años, tasas de rendimiento del 12, 10, 13, 9 y 11 % mientras que Fondo
mutuo 2 arrojó 13, 12, 14, 10 y 6%. Un cliente se acercó a Boggs y expresó su
interés en uno de estos fondos mutuos ¿ Cual debería escoger Boggs para su
cliente? Ayuda: Una inversión más segura es la que tiene un grado menor de
riesgo (el riesgo se mide por la desv estándar).

34
21/04/2013

Estadística Descriptiva

Dispersión Relativa
El coeficiente de variación (C.V) es una medida muy útil cuando:
1 L datos
1.-Los d t están tá en unidades
id d diferentes
dif t (como
( dól
dólares y días
dí ded inasistencia).
i i t i )
2.- Los datos están en las mismas unidades, pero las medias muy distantes (
como sucede con los ingresos de los ejecutivos y los ingresos de los empleados
no calificados).
3.- Cuando se desea comparar la variabilidad de dos conjuntos de datos.

Coeficiente de variación: Indica la magnitud relativa de la desviación estándar en


comparación con la media de la distribución, expresada como porcentaje.


Población C .V  . 100

s
Muestra C .V  . 100
X

Estadística Descriptiva

Ejemplo:

Se va a comparar la variación en los ingresos anuales de ejecutivos con


variación
i ió en los
l ingresos
i d trabajadores
de t b j d no calificados.
lifi d
Para una muestra de ejecutivos,
Para una muestra de trabajadores no  $500000 y s  $50000
X calificados,
Uno se ve tentado a afirmar que hay mayor dispersiónXen  $los
12000 y s  $anuales
ingresos 1200
de los ejecutivos porque $50000>$1200. Sin embargo, las medias están tan
distantes que se necesitan convertir las estadísticas a coeficientes para efectuar
una comparación significativa de la variación en los ingresos anuales.

Para los ejecutivos; CV= 10%


Para los trabajadores no calificados; CV
CV= 10%

No existe diferencia en la dispersión relativa de los dos grupos.

35
21/04/2013

Estadística Descriptiva

Ejemplo:

Un estudio de las calificaciones obtenidas en un curso interno sobre


principios de administración y los años de servicio de los empleados inscritos
en el curso, dio como resultado estas estadísticas:
la calificación media fue 200; la desviación estándar 20. La media del número
de años de servicio fue 18 años, la desviación estándar de 2,16 años. Compare
la dispersión relativa de las dos distribuciones.

Para las calificaciones: C.V= 10%.


Para los años de servicio: C.V = 12%

Estadística Descriptiva

6. – Puntuaciones Z ( Medida de localización relativa)

Las puntuaciones “z”z son transformaciones que se pueden hacer


a los valores o puntuaciones obtenidas, con el propósito de
analizar su distancia respecto a la media, en unidades de
desviación estándar.

X X
Z
s
donde X es la puntuación o valor a transformar
X es la media de la distribución
s la desviación estándar de ésta.
Z es la puntuación transformada en unidades de desviación estándar

Una puntuación “Z” nos indica la dirección y grado en que un valor


individual obtenido se aleja de la media, en una escala de unidades de
desviación estándar.

36
21/04/2013

Estadística Descriptiva

Las puntuaciones Z son el método más comúnmente utilizado


para estandarizar la escala de una variable medida en un nivel
por intervalos.

Ejemplo:
Supongamos que en una distribución de frecuencias obtuvimos una media
de 60 y una desviación estándar de 10, y deseamos comparar a una
puntuación de 50 con el resto de la distribución. Entonces, transformamos
esta puntuación o valor en una puntuación Z. Tenemos que: _
X=50, X=60, s=10
la puntuación Z correspondiente a un valor de 50 es:
Z= (50-60)/10= -1

Estadística Descriptiva

Podemos decir que el valor 50 está localizado a una desviación estándar


por debajo de la media de la distribución.
( el valor “30” está a tres desviaciones estándar por debajo de la media)

Estandarizar los valores permite comparar puntuaciones de dos


distribuciones diferentes.
Por ejemplo, podemos comparar una distribución obtenida en una preprueba
con otra obtenida en una postprueba (en un contexto experimental).

Supongamos que se trata de un estímulo que incrementa la


productividad.
d ti id d UnU trabajador
t b j d obtuvo
bt en la
l preprueba
b una productividad
d ti id d ded
130 ( la media del grupo fue de 122,5 y la desviación estándar de 10). Y en
la postprueba obtuvo 135
(la media del grupo fue de 140 y la desviación estándar de 9,8).
¿mejoró la productividad del trabajador?
Aparentemente la mejoría no es considerable-

37
21/04/2013

Estadística Descriptiva

Sin transformar las dos calificaciones en puntuaciones Z no podemos


asegurarlo porque los valores no pertenecen a la misma distribución.
Entonces transformamos ambos valores a puntuaciones Z, los
transformamos a una escala común, donde la comparación es válida.

El valor de 130 en productividad es en términos de unidades de


desviación estándar igual a z= (130-122,5)/10=0,75
y el valor de 135 corresponde a una puntuación
Z =(135-140)/9,8= -0,51

Como podemos observar, en términos absolutos 135 es una mejor


puntuación que 130, pero no en términos relativos ( en relación a
sus respectivas distribuciones).

Estadística Descriptiva

La variable estandarizada expresa la posición de un elemento en


una distribución dada, tanto en relación a la media como a la
desviación estándar quedando libre de toda ambigüedad.

Ejemplo:

Un alumno obtuvo las siguientes notas:


Historia=5; Francés=4; Matemáticas=4,5; Castellano=6
¿Qué opinión puede dar Ud de estas notas?
Si las compara con la nota 4, que es el promedio de las notas de
1 a 7 y la q
que se exige
g como mínimo para
p aprobar,
p , puede
p
concluir que ese alumno tiene una buena nota en Historia y el
mínimo en Francés.
Pero ¿puede decir si el alumno dentro de su curso es de los
mejores?

38
21/04/2013

Estadística Descriptiva
Para discernir esto es necesario acudir al promedio y a la
desviación estándar de las notas de esos ramos de todos los
alumnos.

Historia Francés Matemáticas Castellano


Promedio de curso 6,5 4 4,5 5,6
Desviación estándar 1 2 3 2
Var estandarizada Z -1,5 0 0 0,2

Aquí vemos que ha cambiado la faz de las notas,


notas ya que un 5 en Historia
significa que está muy por debajo del resto de sus compañeros, en
cambio el 4 en Francés y el 4,5 en Matemáticas indican que está dentro
del promedio del curso.

Estadística Descriptiva

La distribución de puntuaciones Z no cambia la forma de la


distribución original, pero si modifica las unidades
originales a unidades de desviación estándar. La
distribución de puntuaciones Z tiene una media 0 y una
desviación estándar 1.

Las puntuaciones Z son un elemento descriptivo


adicional que podemos agregar para analizar nuestros
datos.

39
21/04/2013

Estadística Descriptiva

Detección de valores atípicos


A veces un conjunto de datos tiene uno o más elementos con
valores demasiado grandes o demasiados pequeños. A los
valores extremos como éstos se les llama valores atípicos.
Un valor atípico puede ser un elemento para el cual se haya
anotado su valor en forma errónea. Si es así, puede corregirse
antes de proseguir el análisis. También, un valor atípico puede
ser uno que por error se incluyó en el conjunto de datos y, en
estos casos, debe eliminarse. Puede ser tan sólo un elemento
poco comúnú que se haya
h anotado
t d en forma
f correcta
t y que síí
pertenece al conjunto de datos.

Estadística Descriptiva

Los valores estandarizados (valores z) pueden emplearse para


identificar los valores atípicos.
Para identificar valores atípicos se recomienda considerar que
cualquier elemento con un valor z inferior a -3 o superior a 3 sea
tratado como un valor atípico. La exactitud de esos elementos se
podrá revisar después para determinar si pertenecen al conjunto
de datos o no.

OBS: Con los diagramas de caja también se pueden identificar los valores
atípicos, pero no necesariamente los mismos valores que aquellos menores
que 3 o mayores que 3 en los valores z.
z SE puede usar cualquiera de esos
métodos o ambos. Se trata de identificar valores que podrían no pertenecer al
conjunto de datos.

40
21/04/2013

Estadística Descriptiva

Resumen
Tipo de 
variable Estadisticos Gráficos Tabla de frecuencias
Nominal Moda Gráfico de barras Frecuencias absolutas
Diagrama de 
sectores Frecuencias relativas
Ordinal Moda Gráfico de barras Frecuencias absolutas
Diagrama de 
Mínimo sectores Frecuencias relativas
Diagrama de cajas  Frecuencias absolutas 
Máximo (box‐plot) acumuladas
Amplitud Frecuencias relativas acumuladas
Mediana
Percentiles
Rango intercuartilico
Medidas de tendencia
Medidas de tendencia  
Escala central Histogramas Frecuencias absolutas
Poligonos de 
Medidas de dispersión frecuencias Frecuencias relativas
Medidas de forma de la 
distribución (Asimetría y  Diagrama de cajas  Frecuencias absolutas 
curtosis) (box‐plot) acumuladas
Medida de localización
relativa Frecuencias relativas acumuladas
* Cuando hay muchos valores no 
tiene sentido, se agrupan en 
intervalos

Estadística Descriptiva

Números indices
Un número índice es una cifra relativa (expresada en forma de
porcentaje),
t j ) que representat las
l variaciones
i i medias
di en precio,
i
cantidad o valor, de uno o más ítem en una época dada, respecto
del período base.
Los índices tratan de cuantificar variaciones, y no expresan si los
precios son altos, o si se ha producido mucho. Sólo pretenden
comparar cifras con otras que se consideran como referencia.

Los índices se utilizan entonces, para comparaciones en el


tiempo y en el espacio.
Los índices no miden sino que indican una cierta tendencia.

41
21/04/2013

Estadística Descriptiva

Indices simples
En muchos casos es preciso expresar las diversas cifras de una serie
anual o mensual en función de una que considera como base.base En este
caso, se trata de índices simples, que representan el porcentaje de
cada cifra de la serie, respecto del valor observado en el período base.

Si se designa por Xo el valor de la observación para el período base y por


Xt el de los restantes períodos, el índice It para el período t queda
expresado por el cuociente de ambas observaciones.

Generalmente se acostumbra expresar los índices en forma porcentual, de


modo que la relación anterior se multiplica por 100.

Xt
I t  100
X0

Estadística Descriptiva

Energía Eléctrica: Producción total e índice de consumo


eléctrico industrial
Indice de consumo eléctrico
Producción total Base Base Base %
Periodo (Mill de kWh) Prom 1994=100 Prom 1996=100 Prom 1998=100 aumento anual
1994 21.929,10 100,0 97,8 85,5
1995 23.629,80 107,8 105,4 92,1 7,8
1996 22.411,70 102,2 100,0 87,4 -5,2
1997 23.953,50 109,2 106,9 93,4 6,9
1998 25.649,80 117,0 114,4 100,0 7,1
Fuente: Boletín Mensual del Banco Central de Chile (Nov 1999

Para calcular el porcentaje de aumento A entre dos cantidades Xo y Xt


conviene recordar la siguiente relación

X 
A  100 t  1
 X0 

42
21/04/2013

Estadística Descriptiva

Utilización de los índices


Las actividades económicas precisan de algunos indicadores
que permitan cuantificar en forma sintética el desarrollo de los
acontecimientos. Los organismos estatales o privados han
confeccionado números índices para diferentes fenómenos
económicos. El uso de esos indicadores es variado y depende
en cada oportunidad de su contenido específico.
Las ventas comerciales, los salarios pagados, el ingreso
nacional, los presupuestos fiscales, etc, han sufrido variaciones
por diferentes causas, una de las cuales es el constante
aumento de los precios. Por lo tanto, es necesario eliminar dicho
efecto para obtener series depuradas, que se refieran a valores
reales.

Estadística Descriptiva

Se precisa entonces, deflactar las series expresadas en


valores monetarios de cada periodo
periodo, con el objeto de
que representen valores monetarios de igual poder
adquisitivo.
Para la deflactación debería utilizarse el índice más
apropiado, el que no siempre existe. Por lo general, se
emplean índices de precios al por mayor o al
consumidor, que pese a no ser siempre estrictamente
aplicables, permiten eliminar en forma relativamente
aceptable, la deformación introducida en la serie por las
variaciones de los precios.

43
21/04/2013

Estadística Descriptiva

Cálculo del IPC


Los economistas definen inflación como un aumento generalizado
y sostenido en el tiempo del nivel general de precios en la
economía. Es decir, en palabras más simples, hay inflación
cuando existe una tendencia general de los precios a subir.
El Índice de Precios al Consumidor o IPC es el indicador mensual
que mide la inflación en Chile. El IPC del país está compuesto de
una canasta de bienes y servicios y cada uno de ellos tiene una
ponderación distinta de acuerdo con la importancia de éstos en el
presupuestot familiar
f ili ded los
l chilenos.
hil

Estadística Descriptiva

El IPC es el Índice de Precios al Consumidor e intenta reflejar la


variación de la inflación en un determinado período. El cuadro
señala que el índice de IPC para enero de 1999 era de 99,67
99 67
puntos, partiendo de un índice de 100 en Dic de 1998, lo que
comúnmente se denomina “base 100”.

¿Cuánto ha variado la inflación entre Dic de 1998 y Octubre del


2000. Para calcularlo, ocupamos la siguiente fórmula:

Variación IPC Dic 1998 a Oct 2000 = ((Índice IPC Oct 2000/Índice
IPC Dic 1998) –1) X 100 = 6,46%,
La variación es igual a 6,46%, que equivale a la inflación
acumulada en ese período.

44
21/04/2013

Estadística Descriptiva

¿Cuánto ha variado la inflación entre Abril del 2000 y Julio


del 2000? Para calcularlo, ocupamos la siguiente fórmula:

Variación IPC Abr 2000 a Julio 2000 = ((Índice IPC Julio


2000/Índice IPC Abr 2000) –1) X 100
=(104,91/104,31 -1)x100=0,5752%

Observe que la inflación acumulada de Mayo, Junio y Julio


no es la suma de las variaciones mensuales (es decir
0 2109+0 2295+0 1336=0 574) sino que algo mayor 0
0,2109+0,2295+0,1336=0,574), 0,5752
5752 %
%.

Estadística Descriptiva

Por otra parte, también se puede determinar el índice conociendo la


inflación del p
período. Considere la inflación en Enero de 1999,
equivalente a –0,33% y en Feb de 1999 equivalente a 0,07%. Si la
base 100 se define en Dic 1998.
¿ Cuál es el índice de IPC acumulado en Enero y Febrero?

Debemos multiplicar
Base 100x (1+IPC Enero)=100x(1+-0,0033)=99,67=Indice IPC Enero
1999.

Base 100x (1+IPC Enero)x(1+IPC Feb)=


100x(1+-0,0033)x(1+0,0007)=99,74= Indice Feb 1999

45
21/04/2013

Estadística Descriptiva

Ejercicio:

a) Considere la siguiente serie de valores que representan


ingresos en pesos corrientes ( pesos de dic de cada año).
Dado el índice IPC (base dic 1998=100) calcule el deflactor
IPC base dic1999=100 y luego estime la serie de ingresos en
base dic 1999=100.
b) Resuelva el ejercicio anterior usando alguna forma
equivalente.

Estadística Descriptiva

Año Ingresos corrientes IPC


( $ dic de cada año) ( dic 1998=100)
1989 116664 37 5093
37,5093
1990 131678 47,7601
1991 258790 56,6713
1992 185600 63,8659
1993 245679 71,6789
1994 456876 78,0909
1995 345721 84,4933
1996 245696 ,
90,0969
1997 234567 95,5428
1998 236458 100
1999 345672 102,31

46
21/04/2013

Estadística Descriptiva

Notar que el deflactor del IPC base 1999 es igual.

IPCdic añot - IPCdic año1999


Deflactor IPC base dic 99  1 
IPC dic año1999

Lo que equivale a:

IPCdic añot
Deflactor IPC base dic 99 
IPC dic año1999

Estadística Descriptiva

A B C A/C
Año Ingresos corrientes IPC Deflactor IPC Ingreso en $ constantes
( $ dic de cada año) ( dic 1998=100) (base dic 99) ( base dic1999=100)
1989 116664 37 5093
37,5093 0 367
0,367 318212
1990 131678 47,7601 0,467 282076
1991 258790 56,6713 0,554 467200
1992 185600 63,8659 0,624 297322
1993 245679 71,6789 0,701 350667
1994 456876 78,0909 0,763 598571
1995 345721 84,4933 0,826 418622
1996 245696 90,0969 0,881 279001
1997 234567 95,5428 0,934 251181
1998 236458 100 0 977
0,977 241920
1999 345672 102,31 1,000 345672

Valores nominales
VALORES REALES 
Deflactor

47
21/04/2013

Estadística Descriptiva

b) Formas equivalentes de estimar los ingresos reales en


base dic 1999 son las siguientes:

A B C (A/B)*102,31
Año Ingresos corrientes IPC A/B Ingreso en $ constantes
( $ dic de cada año) ( dic 1998=100) ( base dic1999=100)
1989 116664 37,5093 3110,269 318212
1990 131678 47,7601 2757,071 282076
1991 258790 56,6713 4566,509 467200
1992 185600 63,8659 2906,089 297322
1993 245679 71,6789 3427,494 350667
1994 456876 78 0909
78,0909 5850 566
5850,566 598571
1995 345721 84,4933 4091,697 418622
1996 245696 90,0969 2727,019 279001
1997 234567 95,5428 2455,099 251181
1998 236458 100 2364,580 241920
1999 345672 102,31 3378,673 345672

Estadística Descriptiva

A B C (A/C)*100
Año Ingresos corrientes IPC IPC Ingreso en $ constantes
( $ dic de cada año) ( dic 1998=100)
1998 100) ( dic 1999=100)
1999 100) ( base dic1999=100)
dic1999 100)
1989 116664 37,5093 36,662 318212
1990 131678 47,7601 46,682 282076
1991 258790 56,6713 55,392 467200
1992 185600 63,8659 62,424 297322
1993 245679 71,6789 70,061 350667
1994 456876 78,0909 76,328 598571
1995 345721 84,4933 82,586 418622
1996 245696 90,0969 88,063 279001
1997 234567 ,
95,5428 93,386
, 251181
1998 236458 100 97,742 241920
1999 345672 102,31 100,000 345672

48
21/04/2013

Estadística Descriptiva

Aplicación. La Unidad de Fomento (UF)

La Unidad de Fomento (UF) es una medida reajustable basada


en la variación del Indice de Precios al Consumidor (IPC).

El Ministerio de Hacienda en su Decreto Supremo


Nº 40 del 2 de enero de 1967, creó la Unidad de Fomento.
El valor de la UF se reajustaba el primer día de cada trimestre según la
variación del IPC del trimestre anterior.

El Decreto Supremo
p Nº 280 del 12 de Mayo
y de 1975 estableció q
que la UF p
pasaría
a reajustarse en forma mensual.

Estadística Descriptiva

El Decreto Supremo Nº 613 del 14 de julio de 1977 estableció que su


j
valor se reajustaría en forma diaria a partir
p del 1º de Agosto
g de dicho
año.

Mediante el acuerdo del 08-Ene-1990 y según las normas del Banco


Central la UF continúa reajustándose en forma diaria, siendo calculada a
principios de cada mes para el período comprendido entre el día 10 de
dicho mes y el día 9 del mes siguiente, de acuerdo a la tasa promedio
geométrica de la variación del IPC del mes anterior.

49
21/04/2013

Estadística Descriptiva

Cálculo de la UF

El valor de la UF para cada día se determinará sobre la base del valor


del día anterior, según la siguiente fórmula:

UFdía = UFdía-1 x Rd

Donde:
Rd = Factor de reajuste diario del valor de la Unidad de
Fomento.
d = NNº de días comprendidos en el período para el cual se
calcula el valor diario de la UF.
vIPC-1 = Variación porcentual del IPC registrada en el mes
inmediatamente anterior.

Estadística Descriptiva

Factor de reajuste diario del valor de la Unidad de Fomento.

1
 vIPC1  d
Rd  1  
 100 
Ejercicio:

Estime el valor de la UF diaria del mes de Marzo del 2008.

50
21/04/2013

Introducción a Inferencia Estadística


Introducción:
Hemos visto que la estadística descriptiva es el proceso de
recolectar,
l t agrupar y presentart datos
d t de
d una manera talt l que
describa fácil y rápidamente dichos datos.

La estadística inferencial involucra la utilización de una


muestra para sacar alguna inferencia o conclusión sobre la
población de la cual hace parte la muestra.

Inferencia estadística es el proceso de reunir datos


obtenidos de una muestra para hacer estimaciones o
probar hipótesis acerca de las características de una
población.

Introducción a Inferencia Estadística


Procedimiento de la estadística inferencial

INFERENCIA
RECOLECCION DE LOS
DE LOS DATOS CALCULO POBLACION
PARAMETROS
EN LA DE
MEDIANTE
MUESTRA ESTADIGRAFOS
TECNICAS
ESTADISTICAS
APROPIADAS

51
21/04/2013

Introducción a Inferencia Estadística


Ejemplo:

Supóngase
p g que
q tenemos datos de los ingresos
g de 1000
familias chilenas. Este grupo de datos puede ser resumido
encontrando el promedio de ingreso por familia y la
dispersión de estos ingresos familiares sobre y bajo el
promedio. Estos datos también pueden ser descritos
construyendo una tabla, un diagrama o gráfico del número
de familias en cada clase de ingresos. Esta es estadística
descriptiva.
Si estas 1000 familias son representativas
representati as de todas las
familias chilenas, podemos entonces estimar y probar
hipótesis sobre el promedio de ingreso familiar en Chile
como un todo. Puesto que estas conclusiones están
sujetas a errores, tendríamos también que indicar la
probabilidad de error. Esto es inferencia estadística.

1.Probabilidad

Debido a que existe una incertidumbre considerable al tomar


decisiones, resulta importante que todos los riesgos
implícitos
p conocidos se evalúen en forma científica.

Ayuda en esta evaluación la teoría probabilística, a la que a menudo se


denomina “ciencia de la incertidumbre”. El empleo de la probabilidad
permite a quien toma decisiones, analizar los riesgos y minimizar el azar
inherente con información limitada
inherente, limitada, por ejemplo
ejemplo, al lanzar un nuevo
producto o aceptar un embarque recién llegado que contenga partes
defectuosas.

52
21/04/2013

Probabilidad

1. -¿Qué es una probabilidad?


Probabilidad: Una medida de la posibilidad de que ocurra
un evento ( o suceso) en el futuro; sólo puede asumir un
valor entre 0 y 1, inclusive.
Experimento: Observación de alguna actividad o la acción de
efectuar una medición.

Resultado: Un acontecimiento final de un experimento.

Evento: Conjunto de uno o más resultados de un experimento.

Probabilidad

Ejemplo:

Experimento:
E i t Tirar
Ti un dado.
d d
Resultados posibles: Caer un 1
Caer un 2
Caer un 3
Caer un 4
Caer un 5
Caer un 6
Eventos p
posibles: Caer un número par
p
Caer un número mayor que 4
Caer un número 3 o menor

53
21/04/2013

Probabilidad

Enfoques de la probabilidad

Enfoque objetivo Enfoque subjetivo

1)Probabilidad clásica o a priori


La posibilidad de que suceda un
evento, asignado por una persona con
2) Concepto de frecuencia relativa
base en cualquier información de que
(probabilidad a posteriori).
disponga.

Probabilidad

Probabilidad clásica

El enfoque clásico o a priori de la probabilidad se basa en la


consideración de que los resultados de un experimento son
igualmente posibles.

Númerode resultadosfavorables
Probabilidad de un evento 
Númerototal de resultadosposibles

Ej
Ejemplo:
l

Una empresa tiene bodegas en cuatro regiones; la II, la


IV, la V y la RM ¿ Cuál es la probabilidad de que la
bodega seleccionada se encuentre en la II Región.

54
21/04/2013

Probabilidad

Concepto de frecuencia relativa


La p
probabilidad de que
q un evento ocurra a largo
g plazo
p se determina
observando en qué fracción de tiempo sucedieron eventos en el pasado

Número de veces que el evento ocurrió en el pasado


Probabilidad de un evento 
Número total de observaciones

Ejemplo: Antes de incluir la cobertura de ciertos tipos de problemas dentales


en sus pólizas de seguro médico para adultos asalariados, una compañía de
seguros desea determinar la probabilidad de ocurrencia de esos problemas,
para poder fijar el precio del seguro. Por lo tanto, un experto en estadística
recolecta datos de 10000 adultos de las categorías de edad adecuadas y
encuentra que 100 personas experimentaron el problema dental particular
durante el año anterior. Así la probabilidad de ocurrencia es 0,01 o 1%

Probabilidad

¿Qué es una variable aleatoria?


Cantidad que es resultado de un experimento aleatorio que,
debido al azar, puede tomar distintos valores.

Variable aleatoria

discreta continua

•Número de empleados ausentes •Ciclo de vida de un componente eléctrico


los Lunes •Duración de pilas alcalinas
•Número de lámparas defectuosas
producidas durante la semana.

55
21/04/2013

Distribuciones de probabilidad

2.- Distribuciones de probabilidad discretas y continuas

Cuando a todos los posibles valores numéricos de una variable aleatoria X se le


asignan valores de probabilidad, mediante un listado o una función matemática,
el resultado es una distribución de probabilidad.
La suma de las probabilidades de todos los resultados numéricos posibles debe
ser igual a 1.

Distribuciones de probabilidad discreta

Distribución de probabilidad discreta; En una variable aleatoria discreta ,


todos los posibles valores numéricos de la variable pueden enlistarse en
una tabla junto con sus respectivas probabilidades.

Distribuciones de probabilidad

Distribuciones de probabilidad discreta

Sea X una v.a discreta que toma valores x1,x2,…xn.


Entonces, la función:

f ( x)  P ( X  xi ) para i  1,2,...., n
0 para x  xi

Se denomina la función de densidad de probabilidad discreta (FDP) de


X, donde P(X=xi) significa la probabilidad de que la v.a discreta X tome
el valor de xi.

56
21/04/2013

2. Distribuciones de probabilidad
Ejemplo:

El número de camionetas solicitadas en arriendo a una agencia de


automóviles durante un p
periodo de 50 días se identifica en la tabla.

Demanda diaria dearriendo de camionetas


durante un periodo de 50 días

Demanda posible (X) Número de díaProbabilidad P(X)


3 3 0,06
4 7 0,14
5 12 0,24
6 14 0,28
7 10 0,2
8 4 0,08
,
50 1

Nota:Existen varias distribuciones de probabilidad estándar que pueden servir de


modelo para una amplia variedad de variables aleatorias discretas involucradas en
administración y economía; distribución de probabilidad binomial, y de Poisson.

Distribuciones de probabilidad

Distribución de Poisson

Id d por ell matemático


Ideada t áti francés
f é Simeon
Si Poisson
P i (1837),
(1837) la
l
distribución de Poisson mide la probabilidad de un evento aleatorio
sobre algún intervalo de tiempo o espacio.

 xe
P( x) 
x!
Donde
x es el número de veces que ocurre el evento
: Es el número promedio de eventos por unidad de tiempo
e= 2,71828 la base del logaritmo natural.

57
21/04/2013

Distribuciones de probabilidad

Distribución de Poisson

Otra forma de definir la distribución de Poisson.


Poisson

El proceso de Poisson consta de eventos independientes


que ocurren aleatoriamente en el tiempo, en los cuales 
es el número promedio de eventos por unidad de tiempo.
La probabilidad de que ocurran exactamente x eventos
durante un intervalo de tiempo T, es:

e λ T ( λ T ) x
P( x) 
x!

Distribuciones de probabilidad
Ejemplo:

Supongamos que se está interesado en la probabilidad de


que exactamente 5 clientes lleguen durante la siguiente hora
(o en cualquier hora dada) laboral. La observación simple de
las últimas 80 horas ha demostrado que 800 clientes han
entrado al negocio. Por tanto,  = 10 por hora. Utilizando la
fórmula anterior.

P (5) 
105  2.7182810  0.0378
5!

Por lo tanto, la probabilidad de que exactamente 5 clientes


lleguen durante la siguiente hora es 0,0378.

116

58
21/04/2013

Distribuciones de probabilidad

La distribución tiene muchas aplicaciones. Se utiliza


como modelo
d l para describir
d ibi fenómenos
f ó como lal
distribución de errores en captura de datos, el número de
rasaduras y otras imperfecciones en piezas recientemente
pintadas, el número de partes defectuosas en embarques
de salida, el número de clientes en espera de servicio en
un restaurante, o en espera de entrar a una de las
atracciones en una feria, y el número de accidentes en
una carretera durante un periodo de tres meses.

Distribuciones de probabilidad
Ejemplo:

Supóngase que las llamadas telefónicas se realizan


aleatoria e independientemente en el tiempo con una
frecuencia promedio de  llamadas por segundo.
a) Hallar la probabilidad de que se haga exactamente una llamada en un
intervalo de 3/  segundos.

La probabilidad de una llamada en T segundos


Es:
P (1)  e  λ T ( λ T )
Cuando T=3/  P (1)  3e 3

b) Determinar la probabilidad de que ocurran menos de tres


llamadas en un intervalo de 1/  segundos.

P ( x  3)  P (0)  P (1)  P ( 2)  5 / 2e

59
21/04/2013

Distribuciones de probabilidad

Ejemplos:

P(0)
P ( 0)  e  λ T P(1) P(1)  e  λ T ( λ T )
1

T
1/ 2/
1/ 2/ T
Distribución de Poisson p
para
la probabilidad de cero Distribución
Di t ib ió ded Poisson
P i de
d
eventos en T segundos. una llamada telefónica
realizada una vez en T
segundos.

Distribuciones de probabilidad

La Distribución Binomial

Cada ensayo en una distribución binomial termina en sólo uno


de dos resultados mutuamente excluyentes, uno de los cuales
se identifica como un éxito y el otro como un fracaso. La
probabilidad de cada resultado permanece constante de un
ensayo al siguiente.
Podrían citarse muchos ejemplos relacionados con los negocios. Los
sindicatos laborales con frecuencia desean saber cuántos trabajadores: (1)
están interesados en unirse al sindicato; (2) quienes no están interesados.
Los banqueros
q pueden
p hacer encuestas a los expertos
p en economía sobre
si las tasas de interés: (1) aumentarán o (2) no aumentarán.

60
21/04/2013

Distribuciones de probabilidad

Propiedades de un experimento binomial

El experimento consiste en una serie de n ensayos idénticos


En cada ensayo hay dos resultados posibles. A uno de estos resultados se
le llama éxito y al otro se le llama fracaso.
La probabilidad de éxito, que se denota p, no cambia de un ensayo a otro.
La probabilidad de fracaso se denota 1-p
Los ensayos son independientes.

Si se conoce la probabilidad de que un ensayo determinado producirá un éxito,


es pos
posible
b e estimar
est a cuá
cuántos
tos é
éxitos
tos habrá
ab á en
e un
u número
ú e o dado de ensayos.
e sayos Por o
ejemplo, si se conoce la probabilidad de que un solo trabajador esté interesado
en unirse al sindicato, entonces puede estimarse la probabilidad de que un
número determinado de trabajadores de la fuerza laboral estaría interesado en
unirse.

Distribuciones de probabilidad
La probabilidad que de n número de trabajadores, un número x dado, esté
interesado en unirse al sindicato es:

n!
Px   p x 1  p 
n x
 n C x  p  1  p 
x n x
x ! n  x !
Ejemplo:

Consideremos la siguiente situación: un gerente de crédito de American Express


ha descubierto que p = 10% de los usuarios de tarjeta no paga el monto
completo de la deuda durante un mes dado. Desea determinar la probabilidad
que de n = 20 cuentas seleccionadas de manera aleatoria, x = 5 de las
cuentas no sean pagadas. Esto puede expresarse como:
P X  5 n  20, p  0.10
lo cual se lee como “la probabilidad de cinco éxitos dado que hay 20 ensayos y
la probabilidad de un éxito de cualquier ensayo es del 10%”.

61
21/04/2013

Distribuciones de probabilidad
Valor esperado y varianza en la distribución binomial

Cuando la variable aleatoria tiene una distribución binomial para la que se


conoce ell número
ú de
d ensayos n y lal probabilidad
b bilid d de
d éxito
é it p, entonces
t la
l
fórmula para el valor esperado y la varianza se simplifican de la siguiente
forma.

E ( x)    np

Var ( x)   2  np (1  p )

Distribuciones de probabilidad

Distribución de probabilidad continua

En una variable aleatoria continua , no pueden enlistarse


todos los posibles valores fraccionarios de la variable,
motivo por el cual las probabilidades que se determinan
por medio de una función matemática son gráficamente
representadas por una función de densidad de
probabilidad o curva de probabilidad. El área entre dos
puntos cualquiera bajo la curva indica la probabilidad de
ocurrencia aleatoria de un valor entre esos dos puntos.

62
21/04/2013

Distribuciones de probabilidad

Función de densidad de probabilidad


Sea X una variable aleatoria continua en un espacio muestral S.S
Entonces, se dice que f(x) es la FDP de X si se satisfacen las siguientes
condiciones:

( 1 ) f(x)  0 , para toda x en S


representa el área bajo la
(2)  S
f ( x)dx  1 curva y=p(x) en el plano
xy entre dos puntos
arbitrarios.
(3) Para cualquier x1  x 2 en S,
x2

x1
p(x)dx  P(x1  x  x2 )

Distribuciones de probabilidad

Ejemplo:

Considérese la siguiente función de densidad.

1 2
f ( x)  x 0x3
9
Puede verificarse que f(x)0 para toda x en el intervalo 0
a 3 y que:

3 1 2
0 9
x dx  1

Si se desea evaluar la FDP anterior entre 0 y 1, se obtiene:

1 2
1 1
0 9 x dx 
27

63
21/04/2013

Distribuciones de probabilidad
Ejemplo:
Distribución de probabilidad continua.

El ciclo de vida de un
f(x) componente eléctrico sigue
una distribución de
probabilidad continua.

1400 1800 2000 2200 2400 2600 X horas


La probabilidad de que un componente aleatoriamente seleccionado
dure entre 2000 y 2400 horas es igual a la proporción del área total bajo
la curva incluida en el área achurada. Esto es , el área total bajo la
función de densidad de probabilidad se define como igual a 1, y la
proporción de esta área incluida entre los dos puntos establecidos
puede determinarse aplicando el método de integración.

Distribuciones de probabilidad

Características de las distribuciones de probabilidad

U di
Una distribución
t ib ió ded probabilidad
b bilid d a menudo
d puede
d
resumirse en términos de algunas de sus características,
conocidas como los momentos de la distribución. Dos
de los momentos más ampliamente utilizados son la
media, o valor esperado y la varianza.

64
21/04/2013

Distribuciones de probabilidad

Valor esperado de una variable aleatoria discreta


La media o valor esperado; es el valor promedio a largo plazo de la
variable
i bl aleatoria.
l t i La L media
di se denomina
d i también
t bié valor
l esperado,
d o
expectativa, E(X) , de la variable X. Es un promedio ponderado en el que
las ponderaciones son las probabilidades correspondientes de los valores
posibles.

La media de una distribución de probabilidad se calcula por:

E ( X )   xff ( x)
x

donde x significa la suma sobre todos los valores de X y


donde f(x) es la FDP (discreta) de X.

Distribuciones de probabilidad
Ejemplo:

Considérese la distribución de probabilidad de la suma de dos números


en el lanzamiento de dos dados
dados.

x 2 3 4 5 6 7 8 9 10 11 12
f(x) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36

1 2 3 1
E( X )  2  3  4  ...  12  7
36 36 36 36

El valor promedio de la suma de los números observada en un


lanzamiento de dos dados es 7.

65
21/04/2013

Distribuciones de probabilidad

Valor esperado de una variable aleatoria continua


El valor esperado de una variable aleatoria continua
está definido como:

E( X )   xf ( x)dx

Ejemplo:

Para determinar el valor esperado de la FDP continua dada en el ejemplo


anterior se tiene:

3
1  x4 
3
x2 9
E ( X )   x dx      2.25
0
9 9  4 0 4

Distribuciones de probabilidad

Propiedades del valor esperado


Sean a y b constantes y X variable aleatoria.

1. E(b)= b

2. E(aX+b)= aE(X)+b

Si X1, X2,…,Xn son n variables aleatorias


y a1, a2,… aN y b son constantes, entonces:

E ( a1 X 1  a2 X 2  ...  an X n )  a1 E ( X 1 )  a2 E ( X 2 )  ...  an E ( X n )
Si X, Y son variables aleatorias independientes, entonces:

3. E(XY) = E(X)E(Y)

66
21/04/2013

Distribuciones de probabilidad

Varianza y desviación estándar


Las fórmulas p
para la varianza de una distribución probabilística
p son:


 2  V ( X )   ( X   ) 2 P( X ) 
V ( X )  E ( X 2 )  E ( X ) 2
La desviación estándar de una distribución de probabilidades
di
discreta
t se determina
d t i tomando
t d la
l raíz
í cuadrada
d d ded la
l varianza.
i

   ( X   ) 2 P( X )

Distribuciones de probabilidad

Propiedades de la varianza
Sean a y b constantes y X variable aleatoria:

1. var (X)  σ X2  E(X  μ)2  E(X 2 )  μ 2


2. var (b)  0
3. var (aX  b)  a 2 var (X)
Si X, Y son variables aleatorias independientes, y
a y b constantes, entonces:

4. var (X  Y)  var (X)  var (Y)


var (X  Y)  var (X)  var (Y)
5. var (aX  bY)  a 2 var (X)  b 2 var (Y )

67
21/04/2013

Distribuciones de probabilidad
Ejemplo

Cálculo del valor esperado de la demanda de camionetas


Demanda posible Probabilidad Valor ponderado Demanda al cuadrado Cuadrado ponderado
X P(X) XP(X) X2 X 2 P(X )
3 0,06 0,18 9 0,54
4 0,14 0,56 16 2,24
5 0,24 1,20 25 6,00
6 0,28 1,68 36 10,08
7 0,2 1,40 49 9,80
8 0,08 0,64 64 5,12
1 E(X)=5,66 E ( X 2 )  33, 78

EL valor esperado de la variable discreta es 5,66 camionetas. Notese que


puede ser un valor fraccionario, porque representa el valor promedio a largo
plazo, no el valor específico de una observación dada.

La varianza de la demanda de camionetas en arriendo es 1,74 y la


desviación estándar es 1,32
V(X)=33,78-32,04=1,74.

Distribuciones de probabilidad

Propiedades de la varianza y covarianza

Sean X , Y dos v a con medias x , Y respectivamente,


v.a respectivamente entonces:

cov ar(X,Y)  E X  μ X Y  μY   E(XY)  μ X μY


cov( X , Y ) cov( X , Y )
 
 X Y
Coeficiente
(var( X ) var(Y ) de correlación

Varianzas de variables correlacionadas


Si X, Y son variables aleatorias

var (X  Y)  var (X)  var(Y )  2 cov( X , Y )


var (X  Y)  var (X)  var (Y)  2 cov( X , Y )

68
21/04/2013

Distribuciones de probabilidad

Distribución normal de probabilidad


La distribución normal de probabilidad es una distribución de probabilidad
continua tanto simétrica como mesocúrtica.
mesocúrtica

f(x f (X ) 
1 
e (X )
2 / 2 2 
2 2
) E( X )  
V (X )   2

x
La distribución normal de probabilidad es importante para la inferencia estadística
por tres razones:

1.- Se sabe que las medidas obtenidas en muchos procesos aleatorios siguen esta
distribución.
2.- Las distribuciones normales sirven para aproximar otras distribuciones como la
binomial y de Poisson.
3.- La distribución de la media muestral es normal cuando el tamaño de la muestra es
grande.

Distribuciones de probabilidad

Distribución normal estándar


Hablando en sentido general, no existe sólo una distribución probabilística
normal.
l En
E vez de
d esto, hay
h una familia
f ili dde tales
l curvas. Cada
C d distribución
di ib ió
tiene media µ y desviación estándar  diferentes. Por tanto, el número
de distribuciones normales es ilimitado.
Resultaría físicamente imposible proporcionar una tabla de probabilidades
para cada combinación de µ y  .

Puede utilizarse la distribución normal estándar.


µ=0 y =1 .
µ

Primero se convierte la distribución, o lo que se conoce como


estandarización, a una distribución normal estándar utilizando el
llamado valor z, también denominado puntuación z, estadístico z, o
desvío normal z.

69
21/04/2013

Distribuciones de probabilidad

Valor z ( o desvío normal z): Diferencia (desviación) entre un valor


seleccionado, denotado por X y la media poblacional, , dividida entre la
desviación estándar de la población, .

X 
z

Donde:
X es el valor de cualquier observación específica
 es la media de la distribución
 es la desviación estándar de la distribución

El valor z mide la distancia entre el valor específico X y la media, en


unidades de desviación estándar.
Conociendo el valor z determinado por la fórmula, se puede obtener el área
( o probabilidad) bajo la curva normal, recurriendo a una tabla.

Distribuciones de probabilidad
Ejemplo:

Supóngase que se obtuvo por cálculo z igual a 1.91.¿Cuál es el área bajo la


curva normal entre la media y X?
Descienda por el margen izquierdo de la tabla (área bajo la curva normal)
encabezado por la letra z hasta 1.9. Luego se pasa horizontalmente a la
derecha y se lee el área (probabilidad) bajo el encabezado de la columna
0,01. Resulta 0,4719. Esta es el área bajo la curva normal entre la media y X.

Ejemplo;
¿Cuál es el área bajo la curva normal entre la media y X para los siguientes
valores de z?

Valor calculado de z Área bajo la curva


2,84 0,4977
1,00 0,3413
0,49 0,1879

70
21/04/2013

Distribuciones de probabilidad

Ejemplo:

Se sabe que el ciclo de vida de un componente eléctrico sigue una distribución


normal con una media µ=2000 horas y una desviación estándar =200 horas.
La probabilidad de que un componente aleatoriamente seleccionado dure entre
2000 y 2400 horas se determina de la siguiente manera.

f(x)

1400 1800 2000 2200 2400 2600 X horas


-2 -1 0 1 2 3 z

Distribuciones de probabilidad

El límite inferior del intervalo se encuentra en la media de la distribución, y


coincide por lo tanto con el valor z=0. El límite superior del intervalo
establecido en términos de un valor z es:

X  2400  2000
z  2
 200

El valor z=2 indica que 2400 hr se halla por encima de la media de 2000 hr en
dos desviaciones estándar:

P(0z2)=0,4772 P(2000X2400)=0,4772

71
21/04/2013

Distribuciones de probabilidad

Supongamos que nos interesa la probabilidad de que un componente


aleatoriamente seleccionado dure más de 2200 horas.
Adviertase que, por definición, la proporción total del área a la derecha
d la
de l media
di de
d 2000 es d de 0
0,5.
5 PPor consiguiente,
i i t sii d determinamos
t i la
l
proporción entre la media y 2200, podemos restar este valor de 0,5 para
obtener la probabilidad de las horas X superiores a 2200.

2200 - 2000
z 1
200

Así 2200 hr se halla a una desviación estándar por encima de la media de


2000 hr
P(0z 1)=0,3413
P(z>1)=0,5 - 0,3413=0,1587
Por lo tanto P(X>2200)=0,1587

Distribuciones de probabilidad

OBS:Función de distribución acumulativa

La probabilidad P*(x) de que una variable aleatoria x, cuya función de


densidad de probabilidad es p(x) , tome un valor menor que o igual a x0
está dada por:

x0
P * (x 0 )   p ( x)dx

Observe que:

P(  x  b)  P * (b)  P * (a )
P(a
Y por el teorema fundamental del cálculo integral.

dP * ( x)
 p( x)
dx

72
21/04/2013

Distribuciones de probabilidad

Distribución uniforme
Una función de distribución de probabilidad p(x) se distribuye
uniformemente sobre un intervalo desde a hasta b si p(x) es constante en
todo el intervalo.

La distribución uniforme con parámetros a y b está definida por la función


de densidad:

1/b para a x a+b


p(x)
0 en otro lugar
p(x)=
1/b

Observar que todos los valores x


de x de a hasta a+b son a a+b
igualmente probables.

Distribuciones de probabilidad

Distribución exponencial
La variable aleatoria continua con distribución exponencial se define
como:

 e   x
si x  0
f ( x)  
2 0 si x  0

=2
1

=1

73
21/04/2013

Distribuciones de probabilidad

En la distribución exponencial la media o valor esperado


está dado por: 1


1
Y la varianza está dada por: 2 
2
y la desviación estándar es igual a:  

L probabilidad
La b bilid d d
de obtener
bt un valor
l ded la
l variable
i bl aleatoria
l t i exponencial
i l
igual o menor que determinado valor específico x0.

x0

F ( x0 )  P ( x  x0 )   e x dx  1  e  x0
0

Distribuciones de probabilidad

Por consiguiente, la probabilidad de que una variable aleatoria con


distribución exponencial asuma un valor mayor o igual a x0 se da por:

2 1  F ( x0 )  e - x 0
1,5

0,5 F(0,5)
( , )
1- F(0,5)

0,5

La distribución exponencial rige los tiempos de espera entre acontecimientos


consecutivos de Poisson.

74
21/04/2013

Distribuciones de probabilidad
El parámetro  se toma como el número ( o fracción ) de acontecimientos de
Poisson que ocurren por unidad de tiempo.
( la unidad de tiempo elegida para la exponencial).

Ejemplo:

Una secretaria recibe en promedio 6 llamadas telefónicas por


hora durante una jornada de trabajo ordinaria. Exprese el número
de llamadas por hora como sucesos de Poisson y exprese,
además, el tiempo transcurrido entre 2 llamadas consecutivas que
recibe
(Solución:
medidoen horas) como una distribución exponencial.
=número de llamadas que entran por unidad de tiempo (hora), luego
=6 llamadas por hora. La distribución del flujo de llamadas por horas es
Poisson. Entonces la distribución del tiempo de espera entre dos llamadas
consecutivas es:

f (t )  6e 6t

Distribuciones de probabilidad

Propiedades de la distribución exponencial


1. Ausencia de memoria:
1.-
En un proceso de llegada, esta propiedad implica que la probabilidad de que
ocurra una llegada en los minutos siguientes no está influenciada por el
momento en que haya ocurrido la llegada anterior; es decir, el sistema. no
memoriza lo que acaba de suceder. Esta situación surge cuando
1) hay muchos individuos que potencialmente pueden llegar al sistema
2) cada persona decide llegar independiente de los demás
3) cada individuo elige el momento de llegar al azar.

75
21/04/2013

Distribuciones de probabilidad
2.- Lapsos de servicio breves
Con una distribución exponencial, son comunes los valores pequeños en el
lapso
p de servicio. En la figura
g se observa la gráfica
g de la probabilidad
p de que
q el
tiempo de servicio S sea igual o menor que t Prob(St) si el tiempo promedio de
servicio es 10, o sea =0,10 y
1/ =10.
Alta probabilidad de lapsos de servicio cortos.
1

0,632

10

Distribuciones de probabilidad

Observe que la gráfica asciende con rapidez y luego, lentamente, se acerca al


valor 1. Esto indica una alta probabilidad de que el servicio dure poco tiempo.
P ejemplo,
Por j l cuandod t=10,
t 10 la
l probabilidad
b bilid d de
d que sea St es ded 0,632.
0 632 EEs d
decir,
i
más del 63% de los tiempos de servicio serán menores que el promedio de
servicio.
La implicación práctica de esta circunstancia es que una distribución
exponencial es la mejor para representar distribución de la duración de servicio
en un sistema en el que una gran proporción de tareas duran un lapso muy breve
y sólo una pequeña proporción duran largo tiempo.

76
21/04/2013

Distribuciones de probabilidad

3.- Relación con la distribución de Poisson

Si el tiempo
p entre llegadas
g tiene una distribución exponencial
p con parámetro
p ,,
entonces, en un periodo específico de tiempo (digamos T), el número de
llegadas tendrá una distribución de Poisson con parámetros T. Entonces, si X
es el número de llegadas durante el tiempo T, la probabilidad de que X sea igual
a un número dado (digamos n) se obtiene mediante la ecuación.

eλ T (λ T )n
Pr ob( X  n) 
n!

Las dos distribuciones de probabilidad, la distribución discreta de Poisson y la


distribución continua exponencial, son distribuciones complementarias. Se
utilizan en la teoría de colas para representar llegadas o servicios aleatorios.
Ambas se conocen como distribuciones de Markov.

3. Tipos de muestra
Los parámetros de una población frecuentemente se estiman sobre
la base de estadísticas muestrales. Para emplear una estadística
muestral como estimador de un parámetro, la muestra debe ser una
muestra
t aleatoria
l t i ded una población
bl ió

Muestra probabilística
Tipos de muestra
Muestra no probabilística

154

77
21/04/2013

Tipos de muestra

Muestra probabilística: Muestra que se


selecciona de modo que cada integrante de la
población en estudio tenga una probabilidad
conocida ( no igual a cero) de ser incluido en la
muestra

Muestra no probabilística: Métodos en los que


no todos los integrantes tienen probabilidad de
ser incluidos en la muestra

155

Tipos de muestra

•Muestreo aleatorio simple; los elementos de la población tienen la misma


probabilidad de ser seleccionados p
p para la muestra.

•Muestreo aleatorio sistemático; se selecciona un punto aleatorio de inicio y


después se selecciona para la muestra cada k-ésimo elemento.

•Muestreo aleatorio estratificado; la población se divide en varios grupos, o


estratos, y después se selecciona una muestra de cada uno.
.
•Muestreo por conglomerados; la población se divide en unidades primarias y
después se toman muestras de las citadas unidades.

Error de muestreo: Diferencia entre una estadística de muestra y su


parámetro de población correspondiente

156

78
21/04/2013

4. Distribución muestral de medias


La distribución muestral de medias es una distribución probabilistica que consta
de una lista de todas las medias muestrales posibles de un tamaño de muestra
dado de una población y la probabilidad de ocurrencia asociada con cada media
muestral
t l

Ejemplo: Una empresa industrial tiene siete trabajadores de producción


(considerados como la población). El salario de cada empleado se presenta
en la tabla

Trabajador Salario
Javier 7
Saúl 7
Susana 8
Berta 8
Juan 7
Aura 8
Carlos 9

157

Distribución muestral de medias


1.- Cuál es la media de la población
2.- Cuál es la distribución muestral de medias para una muestra de tamaño 2
3.- Cuál es la media de la distribución muestral

Solución:
1.- La media de la población es =7,7143 dólares
2.- Distribución de muestreo de las medias para n=2

media muestral Número de mediasProbabilidad


7 3 0,1429
7,5 9 0,4285
8 6 0,2857
8,5 3 0,1429
Prob
0,40

0,30

0,20

0,10

7 7,5 8 8,5 9 Medias muestrales 158

79
21/04/2013

Distribución muestral de medias

3.- Se obtuvo la media de la distribución muestral de medias,


sumandod las
l diferentes
dif t mediasdi muestrales
t l y dividiendo
di idi d lal suma
entre el número de las muestras

Suma de todas las medias muestrales 7(3)  7,5(9)  8(6)  8,5(3)


    7,7143
X Número total de muestras 21

Obs: La media de las medias muestrales (7,7143) es igual a la media de la


población

159

Distribución muestral de medias


Teorema del límite central
En el caso de una población con media  y varianza 2, la distribución muestral de
las medias de todas las muestras posibles de tamaño n generadas a partir de la
población, tendrá una distribución aproximadamente normal (siendo la media de la
distribución muestral igual a  y la varianza igual a 2/n) considerando que el
tamaño de la muestra es bastante grande

Es decir, cuando los parámetros de la población son conocidos, el valor esperado y la


desviación estándar de la distribución (error estándar de la media) de muestreo de la
media son


E( X )   X 
n
El teorema del límite central constituye el fundamento teórico para la inferencia
estadística. Este concepto se refiere a la estimación y las pruebas de hipótesis

160

80
21/04/2013

Distribución muestral de medias


Ejemplo: En relación con una marca específica de un componente electrónico
para televisores, se sabe que el ciclo medio de vida útil del componente es
µ=9000 horas con una desviación estándar de =500 horas
a) Determine el valor esperado y el error estándar de la distribución de muestreo
de la media dado un tamaño de muestra de n=36
b) Interprete el significado de los valores calculados

Solución

E ( X )    9000 X  
500
 83,3
n 36

b) estos cálculos indican que, a largo plazo, la media de un grupo grande de medias
muestrales, basada cada una de ellas en un tamaño de muestra n=36, será igual a
9000 hr. Además la variabilidad de estas medias muestrales respecto del valor
esperado de 9000 hr se expresa mediante una desviación estándar de 83,3 hr

161

5.Intervalos de confianza

Estimaciones puntuales y de intervalo


Estimación puntual:
Un estimador puntual es el valor numérico de una estadística muestral
empleado para estimar el valor de un parámetro de la población.
Una de las características más importantes de un estimador es que sea
insesgado. Un estimador es insesgado es una estadística muestral cuyo
valor esperado es igual al parámetro por estimar

Estimadores puntuales de uso más frecuente


M di 
Media, X
Diferencia entre las medias de dos poblaciones, 1 2 X1  X 2
Varianza,  2 s2
Desviación estándar, s s

162

81
21/04/2013

Intervalos de confianza
Error muestral e intervalo de confianza

Siempre que se usa una media de muestra para


proporcionar un estimado de punto de una media
poblacional, alguien puede preguntar:¿Qué tan
bueno xes el estimado?. La pregunta ¿que tan
bueno?, es una forma de indagar el error incurrido
cuando se usa el valor de como un estimado
puntual de 
p

Recordemos que Error muestral es :


Error muestral  x  
163

Intervalos de confianza
En la práctica no se puede determinar el valor del error
muestral, porque no se conoce la media de la población
. Sin embargo, se puede usar la distribución muestral
x
de para establecer márgenes de probabilidad respecto
al tamaño del error muestral

El teorema del límite central nos permite llegar a la


x de
conclusión de que la distribución muestral se
puede aproximar mediante una distribución normal de
probabilidades con media  y desviación estándar
x  / n

164

82
21/04/2013

Intervalos de confianza
Si usamos la tabla de áreas de la distribución
normal estándar de probabilidades, vemos que el
95% de los valores de cualquier variable aleatoria
con distribución normal quedan dentro de una
distancia igual a +- 1,96 desviaciones estándar de la
media. Por consiguiente para x la distribución
muestral de x el 95% de los valores de debe
estar a +- 1,96 desviaciones estándar o menos de .
Si por ejemplo n=100 y =20 entonces la desviación
estándar
tá d ded lal distribución
di t ib ió muestral
t l es 2 y que ell
95% de las medias de muestra deben estar a +-3,92
o menos de la media de la población ( pues +-
1,96*2=+-3,92 ).
165

Intervalos de confianza
Por consiguiente podemos hacer la siguiente
aseveración probabilística sobre el error muestral
para el ejemplo; Hay un probabilidad de 0,95
0 95 de que
la media de una muestra origine un error muestral de
3,92 o menos. Esta aseveración probabilistica acerca
del error muestral es una aseveración sobre la
precisión.
Podemos definir un estimado de intervalo para 
restando 3,92 de x y sumando 3,92 más

166

83
21/04/2013

Intervalos de confianza
Para interpretar el estimado de intervalo de  o intervalo
de confianza para la media  veamos los valores posibles
de que se p
q
x podrían obtener a ppartir de tres muestras
distintas aleatorias simples, cada una formada por 100
datos.
Supongamos que la primera media de muestra tiene el
valor que vemos indicado en la figura como x1. En este
caso, vemos en la figura que el intervalo formado, al
restar y sumar 3,92 a x1, abarca la media de población .
El intervalo basado en x2 también incluye a la media de
población . Sin embargo, el intervalo basado en la
tercera media de muestra, identificada con x3, no incluye
a la media de población; la razón es que x3 está en una
cola de la distribución, a mayor distancia que 3,92 de 
167

Intervalos de confianza

Distribución
muestral de x 95% de todos
los valores de
x

3,92  3,92

 x1 
 x2 
 x3 
168

84
21/04/2013

Intervalos de confianza
Como el 95% de las medias de muestra posibles
estará en la región, el 95% de los intervalos
definidos al sumar y restar
x 3 92 a
3,92 abarcarán a
.

En consecuencia, decimos que se tiene un x 95% x  3 , 92


3 , 92 dea confianza
de que el intervalo de confianza definido como
va a incluir la media de población.
Se emplea la letra griega  para indicar el nivel de significación. Para un 95%
de confianza el nivel  será 5%.
 indica la probabilidad de que el error muestral sea mayor que el
correspondiente en la aseveración de precisión.
Hay una probabilidad 1- de que el valor de una media de muestra origine un
error muestral de

z / 2 *  x o menos
169

Intervalos de confianza

Luego el intervalo de confianza para la media de


una población n grande (n>30) con  conocida es

z 
x  /2 n
Un intervalo de confianza para la media es un
intervalo estimado construido en relación con la
media muestral por medio del cual puede
especificarse la verosimilitud de que el intervalo
incluya el valor de la media de la población.
Estimación de intervalo: Expresa la amplitud dentro de la cual probablemente
se encuentra un parámetro poblacional

170

85
21/04/2013

Intervalos de confianza
El nivel de confianza asociado con un intervalo
de confianza indica el porcentaje de tales
intervalos que a largo plazo incluyen el
parámetro que está siendo estimado.

Se utilizan con frecuencia dos intervalos de confianza para la media


poblacional: el intervalo de confianza de 95% y el intervalo de confianza del
99% , correspondientes a los valores de z de 1.96 y 2.58 respectivamente

¿Cómo interpreta, por ejemplo, un intervalo de confianza de 95%?

Un intervalo de confianza de tal valor significa que aproximadamente 95% de


los intervalos construidos similarmente contendrá el parámetro que se estima.
Si se emplea un nivel de confianza de 99%, entonces se espera que casi 99%
de los intervalos contenga el parámetro a estimar

171

Intervalos de confianza
¿Cómo se elabora un intervalo de confianza?
Cuando n30 ;

•Intervalo de confianza de 95%:


•Cuando  conocido


X  z que equivale a X
 1.96
X n

•Cuando la población se distribuye normal y  desconocido

s
X  zs que equivale a X
 1.96
X n

172

86
21/04/2013

Intervalos de confianza
Ejemplo:
Durante una semana dada, una muestra aleatoria de 30 empleados
por hora seleccionada de un gran número de empleados de una
empresa
p tiene un salario medio muestral de $180.000,, con una
desviación estándar muestral de $14. Estimamos el salario medio de
todos los empleados por hora de la empresa con una estimación por
intervalo tal como para que podamos tener una confianza de 95% de
que el intervalo incluye el valor de la media de la población de la
siguiente manera


X  1.96s  180.000 1.96(2,56)  174,98 a 185,02
x

De este modo podemos afirmar que el nivel salarial medio de la totalidad de


los empleados es de entre $174,98 y $185,02, con un nivel de confianza de
95% en esta estimación

173

Intervalos de confianza
Ejemplo:

En un experimento se trata de seleccionar una muestra aleatoria de 256


administradores o gerentes para el estudio. Un elemento de interés es
su ingreso anual: la media muestral que se calcula es $35420 dólares y
la desviación estándar de la muestra es $2050.

1.- ¿Cuál es el ingreso medio estimado de todos los funcionarios (la


población)?.¿Cuál es la estimación puntual?
2.- ¿Cuál es el intervalo de confianza de 95%?
3.- ¿Qué grado de confianza se está usando?
4.- Interprete los resultados

174

87
21/04/2013

Intervalos de confianza
Solución:
1.- La media muestral vale 35.420
2.- El intervalo de confianza está entre 35170 y 35670

s
X  35420 
2050
 1.96  1,96
n 256
3.- La medida de confianza que se obtiene se denomina grado de confianza. En
este caso es 0,95.
4.- Si hubiera tiempo para seleccionar 100 muestras de tamaño 256 de la
población de administradores y calcular las medias muestrales y los intervalos
de confianza, la media poblacional del ingreso anual se encontraría
aproximadamente en 95 de los 100 intervalos de confianza. Un intervalo puede
o no contener a la media poblacional. Aproximadamente 5 de los 100 intervalos
de confianza no contienen a la media poblacional de ingreso anual, .

175

Intervalos de confianza

Error estándar de la media

Error estándar de la media: Desviación estándar de la distribución de muestreo de las


medias muestrales

 s
X  o bien sX 
n n
Lógicamente, una estimación de la media poblacional basada en una muestra
grande es más confiable que una estimación realizada con una muestra
pequeña.
ñ En
E otras
t palabras,
l b ell error en la
l estimación
ti ió de
d la
l media
di poblacional
bl i l
disminuye a medida que aumenta el tamaño de la muestra

176

88
21/04/2013

Estimación por intervalo de la media de la población.


Población Tamaño de muestra  conocida  desconocida

Con distribución Grande (n >= 30) X  z x X  ts x


normal
o
X  zs x * *
Pequeño (n < 30) X  z x X  ts x
Sin distribución Grande (n >= 30) X  z x * X  ts x *
normal
o
X  zs x

Pequeño (n < 30) Se usarían por lo general


procedimientos no paramétricos
dirigidos a la mediana.

* Se aplica el teorema central del límite


** z se usa como aproximación de t.
177

Factores que determinan el tamaño de muestra para


una media

1. El nivel de confianza deseado (z)


2. El máximo error de muestreo permisible (E)
3. La variación en la población ( que por lo general
se estima con s)
La fórmula para el tamaño de muestra para una media es

2
 z.s 
n 
 E 

178

89
21/04/2013

Ejemplo. Un analista de un departamento de personal desea estimar el


número medio de horas de capacitación al año para los supervisores de
una división de la compañía con un margen de error inferior a 3 horas y
confianza de 90%. Con base en datos procedentes de otras divisiones, el
analista estima que la desviación estándar de las horas de capacitación es
20 horas.
El tamaño de muestra mínimo requerido es

2 2 2
 z.s   (1.645)(20)   32.9 
n       121
 E   3   3 

179

6. Pruebas de Hipótesis
El propósito del análisis estadístico es reducir el
nivel de incertidumbre en el proceso de toma de
decisiones. Los gerentes pueden tomar mejores
decisiones sólo si tienen suficiente información a
su disposición. La prueba de hipótesis es una
herramienta analítica muy efectiva para obtener
esta valiosa información, bajo una gran variedad
de circunstancias.

Existen muchos ejemplos comunes en los negocios:


•Un embotellador de bebidas suaves debe determinar si el peso promedio
del contenido de sus botellas es 16 onzas (=16)
•Un productor de software de computador desea certificar que la proporción
de sus productos que son defectuosos es menor del 3% ( <0.03)

180

90
21/04/2013

Pruebas de Hipótesis
¿En qué consiste la prueba de hipótesis?

Una hipótesis en el contexto de la estadística inferencial es una proposición


respecto a uno o varios parámetros, y lo que el investigador hace a través de la
prueba de hipótesis es determinar si la hipótesis es consistente con los datos
obtenidos en la muestra.
Si la hipótesis es consistente con los datos, ésta es retenida como un valor
aceptable del parámetro.Si la hipótesis no es consistente con los datos, se
rechaza ésta.

Prueba de hipótesis: Procedimiento basado en la evidencia muestral y en la


teoría de probabilidad que se emplea para determinar si la hipótesis es un
enunciado razonable y no debe rechazarse, o si es irrazonable y debe ser
rechazada

181

Pruebas de Hipótesis
Procedimiento para aceptar una hipótesis

A. Plantear la hipótesis nula y la hipótesis alternativa


La hipótesis nula es una afirmación que se realiza acerca del valor del
parámetro de la población. La hipótesis alternativa o de investigación describe
lo que se considerará si se rechaza la hipótesis nula

B. Seleccionar el nivel de significación.El nivel de significación  es la


probabilidad de rechazar la hipótesis nula cuando en realidad es verdadera.
L niveles
Los i l de d 0.10,
0 10 0.05
0 05 y 0.01
0 01 son los
l que se usan por lo
l generall

182

91
21/04/2013

Pruebas de Hipótesis
C. Decidir acerca del estadístico de prueba.
El valor 2estadístico de prueba es un valor determinado a partir de la

información muestral que se utiliza para aceptar o rechazar la hipótesis
muestral,
nula. Por lo general se utilizan el valor z, t, F,

D. Plantear la regla de decisión. Con base en la distribución muestral,


pueden identificarse un área de aceptación y una de rechazo.

E. Tomar una muestra y adoptar una decisión. Si el valor del


estadístico de prueba calculado queda en el área de aceptación,
no se rechaza Ho y se acepta H1

183

Pruebas de Hipótesis
Prueba de hipótesis sobre la media poblacional
Para una prueba de hipótesis sobre la media poblacional si se conoce
la desviación estándar de la población se utiliza la fórmula (para una
muestra grande (n30)).
(n30)) La distribución muestral del estadístico z se
distribuye normalmente

X 
z

n
Si no se conoce se sustituye por la desviación estándar de la muestra.

Si el tamaño de la muestra es pequeño ( menos de 30) se utiliza el


estadístico t de Student

X 
t
s
n
184

92
21/04/2013

Pruebas de Hipótesis
Problema:

Suponga que la fábrica Phillips provee de sus luminarias a la Ilustre


Municipalidad de Viña del Mar; la vida media es de 50 días y la desviación
típica es de 10 días, al estar encendidas toda la noche en la misma plaza de
esa ciudad jardín.
Otra fábrica ofreció sus productos a esa misma Municipalidad, con precios
más ventajosos. Se desea saber si las luminarias de esta fábrica son de la
misma calidad o mejor que los de la Phillips. Tenemos entonces una
suposición: las luminarias de la otra fábrica son de la misma calidad o
mejor que los de la fábrica Phillips. Esto lo llamamos la hipótesis nula, o
sea, la suposición que queremos rechazar o no rechazar. Enseguida
vendría la hipótesis alterna, o sea la que habría que aceptar, si rechazamos
la hipótesis nula. Podría ser “la vida media de la luminarias es menor que
la de las antiguas”.

185

Pruebas de Hipótesis

Esto se escribe abreviadamente así:


Hipótesis nula Ho:µ50 días
Hipótesis alterna H1: µ<50

Puestas las hipótesis, se procede a hacer la comprobación. Para esto se


efectúa el muestreo de las nuevas luminarias y se elige unas 100 al azar, por
ejemplo. Se calculó el promedio de vida de estas 100 nuevas luminarias y se
obtuvo 45 y una desviación típica de 12 días.
Determine si se acepta o rechaza la hipótesis nula.

186

93
21/04/2013

Pruebas de Hipótesis
Consideremos 5% nivel de significancia de la prueba
Definición de región de aceptación y rechazo

Región de rechazo

Región de
aceptación Ho

Escala de z
-1,645 0
Valor crítico

187

Pruebas de Hipótesis
s 12 x -  45  50
  1,2 z   4,1
n 100 s/ n 1,2

Como -4,1<-1,645 punto crítico se rechaza la


hipótesis nula y se acepta la hipótesis alterna

Por lo tanto las nuevas luminarias ofrecidas son


de menor calidad que las de Phillips.

188

94
21/04/2013

Pruebas de Hipótesis
En el ejemplo dado la hipótesis alterna era unilateral. Se decía que la vida
media de las ampolletas era menor que 50 días. Sin embargo, se puede
presentar una hipótesis alterna bilateral. Sería en el caso de que se hubiera
dicho que la vida de las nuevas ampolletas era distinto de 50 días.
días H1: µ50.
µ50
También podría ser la hipótesis alterna unilateral derecha, cuando se dijese
que el promedio es mayor que. En este caso la región de rechazo estaría a
la derecha.

Región de rechazo
0 025
0,025 Región de rechazo
0,025
Región de aceptación Ho

-1,96 1,96

189

Pruebas de Hipótesis
Ejemplo: Un embotellador de bebidas suaves puede asumir, o plantear la
hipótesis que el contenido promedio es de 16 onzas (=16). Esta hipótesis
nula Ho se prueba contra la hipótesis alternativa H1 que establece lo
contrario. Por lo tanto se tendría que.
Ho: =16 H1: 16

Con base en los datos muestrales, la hipótesis nula es rechazada o no


rechazada. Nunca se puede “aceptar” la hipótesis nula como verdadera. El
no rechazo de la hipótesis nula solamente significa que la evidencia muestral
no es lo suficientemente fuerte como para llevar a su rechazo. Incluso si
, no prueba que =16.
=16 Podría ser que =15.8
=15 8 ( o cualquier otro número),
número) y
X de
debido al error 16muestreo la media muestral acaba de igualar al valor de 16
que se plantea como hipótesis.

190

95
21/04/2013

Pruebas de Hipótesis

Una analogía es que probar una hipótesis es


como poner una persona en juicio.
j i i El acusadod
se halla o culpable o no culpable. Un veredicto
no culpable simplemente significa que la
evidencia no es lo suficientemente fuerte como
para encontrar culpable al acusado. No significa
que él o ella sea inocente.
La evidencia de culpable debe establecerse más
allá de toda duda razonable. Antes que se
rechace la hipótesis nula, la media muestral
debe diferir significativamente de la media
poblacional planteada como hipótesis.
191

Pruebas de Hipótesis
Una vez planteadas las hipótesis;
Ho: =16 H1: 16

se calcula el estadístico de p prueba Z,, y se compara


p con los valores
críticos de Z.
Si el embotellador selecciona una muestra de n=50 botellas con una
media de onzas y una desviación estándar de s=0,866 onzas,
Z es X  16,357

X   0 16.357  16
Z   2.91
s 0.866
n 50

En la figura el nivel de significancia del 5% se divide en dos colas. El 95%


restante se divide por 2 para hallar el área de 0,4750. En la tabla Z esta
área de 0,4750 da los valores críticos de Z de +- 1.96

192

96
21/04/2013

Pruebas de Hipótesis
La regla de decisión es “ No se rechaza la hipótesis nula si -1,96Z 1,96.
Se rechaza si Z<-1,96 o Z>1,96

Ho: 
=16
16 H1: 16

0,95

0,4750 0,4750
0,025 0,025

-1,96
1 96 1 96
1,96

193

Pruebas de Hipótesis
El paso final de la prueba de hipótesis es donde cae el valor del
estadístico para la muestra y determinar si la hipótesis nula debería
rechazarse o no.
El valor del estadístico para la muestra de 16,357 onzas produce una
Z=2,91>1.96 y cae en la zona de rechazo, cola a la derecha.

Se pueden interpretar estos resultados como “ la hipótesis nula es


rechazada a un nivel de significancia del 5%”. Hay sólo un 2,5% de
probabilidad que Z pueda exceder de 1,96 ( y sólo un 2,5% de
probabilidad q
p , ) si  en realidad es 16 .
que Z<-1,96)
La impresión en SPSS entrega el valor p ( p-Value).

194

97
21/04/2013

Pruebas de Hipótesis
Valor p: Es el nivel más bajo de significancia (valor) al cual se puede
rechazar la hipótesis nula.

El valor p para una prueba es la probabilidad de obtener resultados muestrales


al menos tan extremos como los que se obtuvieron dado que la hipótesis nula
es verdadera. Se encuentra de la misma manera que el área de la cola que va
más allá del valor del estadístico para la muestra.
Por ejemplo, supongamos que el señor Martínez es el jefe de personal.
A partir de un breve análisis de los registros de los empleados, Martínez
considera que los empleados tienen un promedio de más de US$31.000 en sus
cuentas de pensiones (>31000). Al tomar como muestra 100 empleados,
Martínez encuentra una media de US$31.366
$ con
s= US$1.894. Se supone que Martínez desea calcular el valor p relacionado con
esta prueba de cola a la derecha..

195

Pruebas de Hipótesis
Las hipótesis son
a) Ho: 31.000
H1: >31.000
Z es 1,93
, 0,4732
Valor p =0
=0,0268
0268

b) Si  =0.05 es mayor que 1,93


0,0268 ( por ejemplo 0,05) el
Zona de
valor del estadístico para la
rechazo
muestra Z=1,93 cae en la
zona de rechazo
0,45
=0.05
1,65 1,93
c) Si  es menor que 0,0268
0 0268 (
por ejemplo 0,01) el valor del Zona de
estadístico para la muestra rechazo
Z=1,93 cae en la zona de no
rechazo 0,49
=0.01
1,93 2,33
196

98
21/04/2013

Pruebas de Hipótesis
Resumen de las formas para las
hipótesis nula y alternativa

Sea 0 el valor numérico específico que se considera en las hipótesis nula y


alternativa. En general, una prueba de hipótesis referente a los valores de una
media  de población debe asumir una de las tres formas siguientes:

Ho :    0 Ho :    0 Ho :    0

Ha :    0 Ha :    0 Ha :    0
Se debe tener en cuenta que la hipótesis alternativa es lo que trata de
establecer la prueba. Por consiguiente, al preguntar si el usuario busca
evidencia para respaldar que < o, > o o que  o, se contribuirá a
determinar Ha.

197

Pruebas de Hipótesis
Tipos de análisis; paramétricos
y no paramétricos

Análisis paramétricos

Para realizar análisis paramétricos debe partirse de los siguientes


supuestos:
1.- La distribución poblacional de la variable dependiente es normal
2.- El nivel de medición de la variable dependiente es por intervalos o razón
3.- Cuando dos o más poblaciones son estudiadas, tienen una varianza
3.
homogénea: las poblaciones en cuestión tienen una dispersión similar en
sus distribuciones

198

99
21/04/2013

Pruebas de Hipótesis
Pruebas paramétricas

Las pruebas
L b estadísticas
t dí ti paramétricas
ét i más
á utilizadas
tili d
son:
•Coeficiente de correlación de Pearson y regresión
lineal
•Prueba t
•Prueba de contraste de diferencia de proporciones
•Análisis de varianza unidireccional (ANOVA)

199

Pruebas de Hipótesis
Análisis no paramétricos

Para realizar análisis no paramétricos debe partirse de las siguientes


consideraciones:

1.- La mayoría de estos análisis no requieren de supuestos acerca de


la forma de la distribución poblacional. Aceptan distribuciones no
normales

2.- Las variables no necesariamente deben estar medidas en un nivel


por intervalos o de razón, pueden analizar datos nominales u
ordinales. De hecho, si se quieren aplicar análisis no paramétricos a
datos por intervalos o razón, éstos deben ser resumidos a categorías
discretas ( a unas cuantas). Las variables deben ser categóricas.

200

100
21/04/2013

Pruebas de Hipótesis

Pruebas no paramétricas

Las pruebas paramétricas más utilizadas son:

1.- La Chi cuadrado o 2


2.- Los coeficientes de correlación e independencia para tabulaciones
cruzadas

3.- Los coeficientes de correlación por rangos ordenados de Spearman y


Kendall

201

Pruebas de Hipótesis
¿Qué es la Chi cuadrado?
Definición; Es una prueba estadística para evaluar hipótesis acerca de la relación
entre dos variables categóricas

Se simboliza; 2
Hipótesis a probar: Correlacionales

Variables involucradas: Dos. La prueba Chi cuadrado no considera relaciones


causales

Nivel de medición de las variables: Nominal u ordinal ( o intervalos o razón


reducidas a ordinales)

Procedimiento: La Chi cuadrado se calcula por medio de una tabla de


contingencia o tabulación cruzada.

202

101
21/04/2013

Pruebas de Hipótesis
En la tabla de contingencia se anotan las frecuencias
observadas en la muestra de la investigación.
Posteriormente, se calculan las frecuencias esperadas para
cada celda. En esencia,, la Chi cuadrado es una comparación
p
entre la tabla de frecuencias observadas y la denominada tabla
de frecuencias esperadas, la cual constituye la tabla que
esperaríamos encontrar si las variables fueran estadísticamente
independientes o no estuvieran relacionadas.
La chi cuadrada es una prueba que parte del supuesto de “no
relación entre variables” y el investigador evalúa si en su caso
esto es cierto o no, analizando si sus frecuencias observadas
son diferentes de lo que pudiera esperarse en caso de ausencia
de correlación.

203

Pruebas de Hipótesis
Prueba de independencia

1 Plantear
1.- Pl t l hipótesis
la hi ót i nula
l y alternativa
lt ti
Ho: La variable de columna es independiente de la variable de renglón
Ha: La variable de columna no es independiente de la variable de renglón

2. Tomar una muestra aleatoria y anotar las frecuencias observadas para cada
celda de la tabla de contingencias

3. Aplicar la ecuación (1) para calcular la frecuencia esperada para cada celda

eij 
Total del renglón i Total de la columna j
Tamaño de la muestra

204

102
21/04/2013

Pruebas de Hipótesis
Prueba de independencia
4.-Aplicar la ecuación (2) para calcular un valor de como
2 estadístico

 f ij  eij 2
 2  
i j
eij

f ij  frecuencia observada para la categoría en el renglón i y la columna j


e ij  frecuencia esperada para la categoría en el renglón i y la column j,
basada en la hipótesis de independencia
5.-Regla de rechazo

Rechazar H 0 si  2   2
Siendo  el nivel de significación para la prueba ; si hay n renglones y m
columnas en la tabla, hay (n-1)(m-1) grados de libertad
205

Pruebas de Hipótesis
Prueba de independencia
Tabla de frecuencias esperadas
ZONA DEL DISTRITO ELECTORAL
Norte Sur Total
IDENTIFICACION Partido derechista 145,4 134,6 280
POLITICA Partido del centro 244 226 470
Partido izquierdista 150,6 139,4 290
Total 540 500 1040

206

103
21/04/2013

Pruebas de Hipótesis
Procedimiento para calcular la chi cuadrado
frec obs - frecesp2
CELDA frec observada frec esperada frecobs
frecobs-frecesp
frecesp  frec obs - frecespp 2 frecesp

Zona Norte/partido derechista 180 145,4 34,6 1197,16 8,23


Zona Norte/partido centro 190 244,4 -54,4 2959,36 12,11
Zona Norte/partido izquierdista 170 150,6 19,4 376,36 2,50
Zona Sur/partido derechista 100 134,6 -34,6 1197,16 8,89
Zona Sur/partido centro 280 226 54 2916 12,90
Zona Sur/partido izquierdista 120 139,4 -19,4 376,36 2,70
47,34
Gl=(3-1)(2-1)=2
Acudimos con los grados de libertad que nos corresponden a la tabla,
eligiendo nuestro nivel de confianza (0,05
(0 05 o 0,01).
0 01) Si nuestro valor
calculado de Ji cuadrada es igual o superior al de la tabla, decimos que las
variables están relacionadas (Ji cuadrada fue significativa).

Dado que  2  47,34   2  5,991 se rechaza Ho  2 resulta significat iva

207

Pruebas de Hipótesis

¿Qué son los coeficientes de correlación


por rangos ordenados de Sperman y Kendall?

Los coeficientes rho de Spearman, simbolizado como rs, y tau de Kendall,


simbolizado como t, son medidas de correlación para variables en un nivel de
medición ordinal, de tal modo que los individuos u objetos de la muestra
pueden ordenarse por rangos (jerarquías).
Por ejemplo, supongamos que tenemos las variables “preferencia en el
sabor” y “atractivo del envase”, y pedimos a personas representativas del
mercado q que evalúen conjuntamente
j a 10 refrescos embotellados y los
ordenen del 1 al 10 (donde “1” es la categoría o rango máximo en ambas
variables). Y tuviéramos los siguientes resultados

208

104
21/04/2013

Pruebas de Hipótesis
Refresco Variable 1 variable 2
Preferencia en el sabor Atractivo del envase
Coca-Cola 1 2
Fanta 2 5
Sprite 3 1
Bilz 4 3
Pap 5 4
Quatro 6 6
Orange 7 8
Kem Piña 8 7
Pepsi 9 10
Seven-Up 10 9

Para analizar los resultados, utilizaríamos los coeficientes “rs” y “t”.


Ahora bien, debe observarse que todos los sujetos u objetos deben
jerarquizarse por rangos que contienen las propiedades de una escala
ordinal ( se ordenan de mayor a menor). Ambos coeficientes varían de
-1 (correlación negativa perfecta) a 1 (correlación positiva perfecta).

209

Pruebas de Hipótesis
Análisis parámetricos
¿Qué es la prueba
¿Q p t para
p muestras independientes?
p
Definición: Es una prueba estadística para evaluar si dos grupos difieren entre si de
manera significativa respecto a sus medias.
Ejemplo:
Ho: No hay diferencia entre el ingreso medio de hombres y mujeres
H1: Hay diferencia entre el ingreso medio de hombres y mujeres

Se simboliza: t

Hipótesis: De diferencia entre dos grupos. La hipótesis de investigación propone


que los grupos difieren significativamente entre sí y la hipótesis nula propone que
los grupos no difieren significativamente

210

105
21/04/2013

Pruebas de Hipótesis
Variable: La comparación se realiza sobre una variable. Si hay diferentes
variables, se efectuarán varias pruebas t ( una por cada variable)
Nivel de medición de la variable: Intervalos o razón

Estadístico de prueba; El valor t se obtiene mediante la fórmula

x1  x2
t
2 2
s1 s2

N1 N1

Donde x1 es la media de un grupo, x2 es la media del otro


grupo.
El denominador es el error estándar de la distribución muestral de la
diferencia entre las medias

211

Pruebas de Hipótesis
Para saber si el valor t es significativo, se aplica la fórmula y se calculan
los grados de libertad . La prueba t se basa en una distribución muestral o
poblacional de diferencia de medias conocida como la distribución t de
Student.

Esta distribución es identificada por los grados de libertad, los cuales


constituyen el número de maneras en que los datos pueden variar
libremente.
Entre mayor número de grados de libertad se tengan, la distribución t de
Student se acerca más a ser una distribución normal y usualmente, si los
grados de libertad exceden los 120, la distribución normal es utilizada
como una aproximación adecuada de la distribución t de Student.
Los grados de libertad se calculan así

gl  ( N1  N 2 )  2

N1 y N2 son el tamaño de los grupos que se comparan


212

106
21/04/2013

Pruebas de Hipótesis
Una vez calculados el valor t y los grados de libertad, se elige el nivel de
significancia y se compara el valor obtenido contra el valor que le
correspondería en la tabla t de Student.
Student Si el valor calculado es igual o
mayor al que aparece en la tabla, se acepta la hipótesis de investigación.
Pero si es menor se acepta la hipótesis nula.
El nivel de confianza 0,05 significa que existe un 95% de confianza de que
los grupos difieren significativamente entre si y 5% posibilidad de error.
Cuanto mayor sea el valor t calculado respecto al valor de la tabla y menor
sea la posibilidad de error, mayor será la certeza en los resultados.
Cuando el valor t se calcula utilizando un paquete estadístico, la
significancia se proporciona como parte de los resultados y ésta debe ser
menor q que 0,05
,

213

Una introducción al análisis


de correlación y regresión lineal

214

107
21/04/2013

Análisis de correlación

Análisis de correlación simple


Análisis de correlación: Grupo de técnicas estadísticas empleado
para medir la intensidad de la relación (correlación) entre dos
variables. Una medida de esta relación es el coeficiente de
correlación.
Diagrama de dispersión: Gráfica que presenta la relación entre
las dos variables de interés.

Análisis de correlación

¿Qué es el coeficiente de correlación de Pearson?


Definición; Es una prueba estadística para analizar la relación entre dos variables
medidas en un nivel por intervalos o de razón.

Se simboliza; r

Hipótesis a probar: Correlacional del tipo “A mayor X, mayor Y”,”A mayor X,


menor Y”, “Altos valores en X están asociados con altos valores en Y”, “Altos
valores en X se asocian con bajos valores de Y”.

Variables involucradas: Dos. La prueba en sí no considera a una como


independiente y a otra como dependiente, ya que no se trata de una prueba que
evalúa causalidad.

108
21/04/2013

Análisis de correlación

Interpretación: El coeficiente r de Pearson puede variar de -1 a 1 donde;

-1= correlación negativa perfecta


-0 9= Correlación negativa muy fuerte
-0,9=
-0,75= Correlación negativa considerable
-0,5= Correlación negativa media
-0,1= Correlación negativa débil
0 = No existe correlación alguna entre las variables
0,1= Correlación positiva débil
0,5= Correlación positiva media
0,75= Correlación positiva considerable
0,9= Correlación positiva muy fuerte
1= Correlación ppositiva perfecta
p

El signo indica la dirección de la correlación y el valor numérico, la magnitud de la


correlación.

Análisis de correlación

Los principales programas de análisis estadístico reportan si el coeficiente


es o no significativo
significativo, de la siguiente manera:

s =0,001 significancia 0,7831 valor de coeficiente

Si s es menor del valor 0,05, se dice que el coeficiente es significativo al


nivel del 0,05 (95% de confianza en que la correlación sea verdadera y 5% de
probabilidad de error). Si s es menor a 0,01, el coeficiente es significativo al
nivel del 0,01 (99% de confianza de que la correlación sea verdadera y 1% de
probabilidad de error).
Por
o otra
ot a parte
pa te p<0,05
p 0,05 qu
quiere
e e dec
decir que e
el coe
coeficiente
c e te es s
significativo
g cat o a al nivel
e
0,05 o la probabilidad de error es menor del 5%.

109
21/04/2013

Análisis de correlación

Consideraciones: Cuando el coeficiente r de Pearson se eleva al cuadrado el


resultado indica el porcentaje de la variación de una variable debido a la variación
de la otra y viceversa.

Por ejemplo:

La correlación entre “productividad” y “asistencia al trabajo” es de 0,80.

r  0,8
r 2  0,64

“La asistencia al trabajo” explica el 64% de la “productividad”


La “productividad” contribuye a o explica el 64% de la variación de “la
asistencia al trabajo”

Análisis de correlación

Ejemplos:

•Hi: “A mayor motivación hacia el trabajo, mayor puntualidad”.


Resultado: r=0,721
s=0,0001
Interpretación:Se acepta la hipótesis de investigación al nivel de 0,01.La
correlación entre la motivación hacia el trabajo y la puntualidad es
considerable.

Hi: A mayor ingreso, mayor motivación hacia el trabajo”


•Hi: trabajo
Resultado: r=0,214
s=0,081
Interpretación: Se acepta la hipótesis nula. El coeficiente no es significativo.
0,081 es mayor que 0,05 ( 0,05 es el nivel mínimo para aceptar la hipótesis.

110
21/04/2013

Análisis de correlación

Uso de la covarianza para la comprensión del coeficiente de


correlación
Otra medida que puede ser útil para expresar la relación entre
dos variables es la covarianza. La covarianza mide el grado en
que dos variables “varían juntas” y es usada por los analistas
financieros para determinar el riesgo total asociado con
inversiones interrelacionadas. Lo mismo que en el caso del
coeficiente de correlación, un signo positivo indica una relación
directa, mientras que un signo negativo indica una relación
inversa.
inversa
La fórmula para las covarianzas es:
cov( x, y ) 
 x  x y
i i y  cov( x, y ) 
 x
i 
  x  yi   y 
n 1 N

muestra población

Análisis de correlación

Mientras que el coeficiente de correlación es una medida de


relación estandarizada cuyo valor sólo puede ir de -1 a 1, la
covarianza
i carece de
d tales
t l valores
l límite
lí it y no es una
medida estandarizada.
La fórmula por la que la covarianza puede convertirse en el
coeficiente de correlación es:

cov( x, y ) cov( x, y )
rxy   xy 
sx s y  x y

muestra población

111
21/04/2013

Análisis de correlación

Cálculo del coeficiente de correlación

•El
El coeficiente de correlación r (mide el grado de asociación lineal entre X y
Y) se estima de acuerdo a la fórmula:

n  XY   X  Y
r
n X  ( X ) 2 n Y 2  ( Y ) 2
2

•El coeficiente de determinación, r al cuadrado , es la proporción de la


variación en Y explicada por X. Puede adoptar cualquier valor entre 0 y 1,
inclusive.

Análisis de correlación

Ejemplo:

Una empresa comercial tiene establecimientos en varias grandes


ciudades. El gerente comercial de ventas planea lanzar al aire un
anuncio comercial por radio en las estaciones locales , al menos dos
veces antes de una venta gigante que empezará el Sábado y terminará el
Domingo. Planea tener las cifras de las ventas de video caseteras del
Sábado y Domingo en sus diferentes locales y parearlas con el número
de veces que apareció el comercial en la radio. El objetivo fundamental
de la investigación es determinar si existe relación entre el número de
veces que se transmitió el anuncio y las ventas de sus productos.

112
21/04/2013

Análisis de correlación

Localización Número de Ventas de Sábado


de la radio transmisiones y Domingo
de anuncio
La Serena 4 15
Valparaiso 2 8
Rancagua 5 21
Curicó 6 24
Puerto Montt 3 17

•1.-¿Cuál es la variable dependiente?


•2.-Trace el diagrama de dispersión
•3.-¿Parece haber alguna relación entre X y Y
•4.-Determine el coeficiente de correlación
•5.-Evalúe la intensidad de la relación entre X y Y

Análisis de correlación

Gráfico de dispersión
30

20
Ventas de sábado y domingo

10

0
1 2 3 4 5 6 7

Número de transmisiones de anuncio

1.- Ventas
3.- Si existe una fuerte correlación positiva
4.- 0,93
5.- 0,93 indica una correlación positiva fuerte entre el número de veces
que sale publicado el anuncio, y las ventas.

113
21/04/2013

Análisis de correlación

Observación: El coeficiente de correlación parcial es la


correlación entre la variable dependiente y una variable
independiente cuando se han eliminado de ambos los
efectos lineales de las otras variables independientes
presentes en el modelo.
La correlación parcial se emplea para controlar el efecto de
una o más variables sobre el coeficiente de correlacion de
Pearson. En la correlación parcial se estudia la relación
entre dos variables eliminando el influjo de una o más
variables de control.

Análisis de correlación
Ejemplo:
En un cierto estudio realizado en un parque de atracciones se halló una
correlación significativa y muy alta entre la temperatura y el número de tazas de
chocolate
h l t caliente
li t servidas
id , r= 0,923
0 923 p<=0,000.
< 0 000 Lo
L cuall es un resultado
lt d muy
extraño, pues implica que cuanto mayor es la temperatura más tazas de chocolate
caliente se consumen. Sin embargo, si se controla la variable número de visitantes
el resultado es muy diferente.

Cuando hace frío, mucha gente, (de la poca gente que va) toma chocolate, pero
cuando hace calor muy poca gente, de la mucha que va toma chocolate caliente.
Es decir, como en verano va mucha gente, por poca gente que tome chocolate
caliente ya es mayor la cantidad que en invierno.

114
21/04/2013

Análisis de regresión lineal

 Análisis de regresión lineal simple


Análisis de regresión lineal múltiple
Fuente:Econometría . Gujarati

229

Análisis de regresión lineal simple

Análisis de regresión con dos variables: Algunas ideas básicas


Concepto de función de regresión poblacional
Significado del término lineal
Especificación estocástica de la FRP
Función de regresión muestral (FRM)

Análisis de regresión con dos variables: problema de estimación.


Método de Mínimos cuadrados ordinarios (MCO)
Modelo clásico: Supuestos detrás del método MCO
Precisión o errores estándar de MCO
Propiedades de los estimadores de MCO
Coeficiente de determinación r2:una medida de bondad de
ajuste
Coeficiente de correlación muestral y propiedades de r
Interpretación de la pendiente
230

115
21/04/2013

Análisis de regresión lineal simple

Modelo clásico de regresión lineal normal (MCRLN)


Regresión con dos variables: estimación de
intervalos
y pruebas de hipótesis.
Intervalos de confianza
Pruebas t
Aplicación problemas de predicción
Predicción del valor de la media condicional
Predicción de un valor individual

Formas funcionales de los modelos de regresión


Modelo log-lineal
Modelos semilogaritmicos

231

Análisis de regresión lineal simple

Algunas ideas básicas

El análisis de regresión se relaciona en gran medida con la


estimación y/o predicción de la media (de la población) o valor
promedio de la variable dependiente, con base en los valores
conocidos o fijos de las variables explicativas.

Consideremos los datos de la tabla siguiente, la que


se refiere a la población total de 60 familias de una
comunidad hipotética, así como a su ingreso
semanal (X) y a su gasto de consumo semanal (Y),
dados en dólares.
232

116
21/04/2013

Análisis de regresión lineal simple


Algunas ideas básicas
Gastos de consumo familiar semanal Y,$. Ingreso familiar semanal X,$
Y\X 80 100 120 140 160 180 200 220 240 260
55 65 79 80 102 110 120 135 137 150
60 70 84 93 107 115 136 137 145 152
65 74 90 95 110 120 140 140 155 175
70 80 94 103 116 130 144 152 165 178
75 85 98 108 118 135 145 157 175 180
88 113 125 140 160 185
115 162 191
Total 325 462 445 707 678 750 685 1043 777 1211
Medias 65 77 89 101 113 125 137 149 155 173
Tabla 1

Las 60 familias se dividen en 10 grupos de ingresos


(de $80 a $260). Se tienen 10 valores fijos de X y los
correspondientes valores de Y para cada uno de los
valores X; así que hay 10 subpoblaciones Y 233

Análisis de regresión lineal simple

Algunas ideas básicas


A estos valores medios se
Se tienen 10 valores medios para lasles denomina valores
10 subpoblaciones de Y.
Y esperados condicionales
condicionales, en
vista de que dependen de
los valores dados a la
variable condicional X. Se
denota por E(Y/X)
Resulta importante distinguir dichos valores
condicionales esperados del valor esperado
incondicional del gasto de consumo semanal, E(Y).

E(Y)=7272/60=121,2
Es incondicional en el sentido de que para obtener esta
cifra se omiten los niveles de ingresos de las diversas
familias
234

117
21/04/2013

Análisis de regresión lineal simple

Algunas ideas básicas

¿Cuál es el valor esperado del gasto de consumo


semanal de una familia?

La media incondicional: $121,20

¿Cuál es el valor esperado del gasto de consumo


semanal de una familia cuyo ingreso mensual es,
digamos, $140?
$
La media condicional: $101
Saber el nivel de ingreso nos permite predecir
mejor el valor medio del gasto de consumo

235

Se puede observar en él gráfico de dispersión, al unir las medias


condicionales la recta de regresión poblacional (RRP).
( o regresión de Y sobre X).
El adjetivo
j “poblacional
p “ se debe al hecho de que
q en este ejemplo
j p se consideró
una población de 60 familias.

Gráfico de dispersión
Gasto de consumo v/s Ingreso
A pesar de la
200
variabilidad del
180
gasto para cada
160
ingreso, en
140
promedio el
120 consumo
Gasto de consumo

100 semanal se
80 incrementa en la
60 misma medida
40 que el ingreso
0 20 40 60 80 100 120 140 160 180 200 220 240 260 280
236
Ingreso semanal

118
21/04/2013

Curva de regresión poblacional

Desde el punto de vista geométrico, una curva de regresión


poblacional es simplemente el lugar geométrico de las medias
condicionales de la variable dependiente para los valores
fijos de la (s) variables explicativa(s).

Es la curva que conecta


l medias
las di ded las
l
subpoblaciones de Y que
corresponden a los
valores del regresor X

237

Concepto de función de regresión poblacional (FRP)

Es claro que cada media condicional E(Y/Xi) es función de Xi,


donde Xi es un valor dado de X.
E(Y/Xi)=f(Xi) (1)
y f(Xi) d
denota
t alguna
l ffunción
ió dde lla variable
i bl explicativa
li ti X X.

¿Qué forma toma la función f(Xi)?


En una situación real no tenemos la totalidad de la población
para efectuar el análisis.
La forma funcional de la FRP es, una pregunta empírica, aunque
en casos específicos la teoría puede tener algo que decir. Por
ejemplo, un economista podría plantear que el gasto de consumo
está relacionado linealmente con el ingreso.

Por tanto, como una primera aproximación podemos suponer


que la FRP es una función lineal de Xi

E (Y / X i )  1   2 X i
238

119
21/04/2013

Ecuación de regresión poblacional FRP

Ecuación de
E (Y / X i )  1   2 X i regresión
(2)

poblacional FRP

Donde 1 y  2son parámetros no conocidos pero fijos que se denominan


coeficientes de regresión.

En el análisis de regresión el interés es estimar la FRP, es decir estimar los


valores de no conocidos con base en las observaciones de Y y X
1 y  2

239

Linealidad en las variables


Se dice que una función Y=f(X) es lineal en X si X aparece
elevado a una potencia o índice de 1 solamente y dicha
variable no está multiplicada ni dividida por alguna otra
variable
E (Y / X i )  1   2 X i
es lineal en Xi.
Geométricamente la curva de regresión es una línea recta

Linealidad en los parámetros


Se dice que una función es lineal en el parámetro, 1 por
ejemplo si 1 aparece elevado a una potencia o índice de 1
solamente y no está multiplicado ni dividido por ningún otro
parámetro.
E (Y / X i )  1   2 X i2 Es lineal en los parámetros pero
no es lineal en la variable X
240

120
21/04/2013

Especificación estocástica de la FRP

¿Qué podemos decir sobre la relación entre el gasto de


consumo de una familia individual y un nivel dado de ingresos?
Se observa en la figura , que dado el nivel de ingresos de Xi, el
gasto de consumo de una familia individual está agrupado
alrededor del consumo promedio de todas las familias en ese
nivel de Xi, esto es, alrededor de su esperanza condicional. Por
consiguiente, podemos expresar la desviación de un Yi
individual alrededor de su valor esperado de la siguiente
manera: ((3))
ui  Yi  E (Y / X i ) o Y  E (Y / X )  u
i i i

Donde la desviación ui es una variable aleatoria no


observable que toma valores positivos o negativos.
Técnicamente , ui es conocida como perturbación
estocástica o término de error estocástico.
241

Especificación estocástica de la FRP

Se puede decir que el gasto de una familia individual


individual,
dado su nivel de ingresos, puede ser expresado
como la suma de dos componentes

Yi  E (Y / X i )  ui (4)

La media del gasto Componente aleatorio .


de consumo de Es un sustituto para todas
todas las familias aquellas variables que son
con el mismo nivel omitidas del modelo pero
de ingresos. que colectivamente afectan a
Y 242

121
21/04/2013

Especificación estocástica de la FRP

Si se supone que E (Y / X i ) es lineal en Xi como en la ec


(2) la ecuación (3) puede escribirse como

Yi  E (Y / X i )  ui  1   2 X i  ui (5)

La ecuación plantea que el gasto de consumo de una familia


está relacionado linealmente con su ingreso, más el término
de perturbación. Así los gastos de consumo individual, dado
X=US$80, pueden ser expresados como
Y1  55  1   2 80  u2
Y2  60  1   2 80  u2
Y3  65  1   2 80  u3
Y4  70  1   2 80  u4
Y5  75  1   2 80   u5
243

Especificación estocástica de la FRP

Ahora, si se toma el valor esperado de (5), obtenemos


Yi  E (Y / X i )  ui (5)
E (Yi / X i )  E E (Y / X i )  E (ui / X i )
 E (Y/X i )  E (ui / X i )
Puesto que E (Yi / X i ) es lo mismo que E (Y / X i )

Implica que E (ui / X i )  0 (6)

Así, el supuesto de que la recta de regresión pasa a través de las


medias condicionales de Y implica que los valores de la media
condicional de ui son cero.
244

122
21/04/2013

Especificación estocástica de la FRP

La especificación estocástica

Yi  E (Y / X i )  ui  1   2 X i  ui (7)

Tiene la ventaja que muestra claramente otras variables


además del ingreso, que afectan el gasto de consumo y que un
gasto de consumo de familias individuales no puede ser
explicado
li d en su totalidad
t t lid d solamente
l t por la(s)
l ( ) variable(s)
i bl ( )
incluida(s) en el modelo de regresión.

245

Función de regresión muestral (FRM)

En la práctica lo que se tiene al alcance no es más que una


muestra de valores de Y que corresponden a algunos valores
fijos de X. Por consiguiente la labor ahora es estimar la FRP
con base en información muestral.
muestral
Supóngase que no se conocía la población de la tabla 1 y que
la única información que se tenía era una muestra de valores
de Y seleccionada aleatoriamente para valores dados de X tal
como se presenta en la tabla 2 Y X
70 80
De la muestra de la tabla 2, 65 100
90 120
¿se puede predecir el gasto de 95 140
consumo semanal promedio Y 110 160
para la población 115 180
120 200
correspondiente a los valores de 140 220
X seleccionados? 155 240
150 260
¿Se puede estimar la forma FRP Tabla 2 Primera muestra
246
a partir de la información
muestral?

123
21/04/2013

Función de regresión muestral (FRM)

Consideremos otra muestra tomada de la población de la


tabla 1.
Las rectas de la figura se conocen como rectas de regresión
muestral. En general, se podrían obtener N FRM diferentes
para N muestras diferentes y estas FRM no necesariamente
Y X
son iguales 55 80
88 100
90 120
80 140
118 160
120 180
145 200
135 220
145 240
175 260
Tabla 3 Segunda muestra

247

Ahora, en forma análoga a la FRP en la cual se basa la recta de


regresión poblacional, se puede desarrollar el concepto de
función de regresión muestral.
L contraparte
La t t muestral
t l de
d (1) puede
d escribirse
ibi como
  
Yi  1   2 X i Es la contraparte de

Yi  estimador de E(Y/X) E (Y / X i )  1   2 X i
Donde

1  estimador de 1

 2  estimador de  2
Un estimador, conocido también como estadístico (muestral) es
simplemente una regla, o método que dice cómo estimar el
parámetro poblacional a partir de la información suministrada
por la muestra disponible. Un valor numérico particular obtenido
por el estimador en una aplicación es conocido como estimado.
248

124
21/04/2013

Función de regresión muestral (FRM)


en su forma estocástica

La FRM en su forma estocástica se puede expresar como

  
Yi  1   2 X i   i (8)


Donde  i denota el término residual (muestral)
Conceptualmente es análogo a ui y puede ser considerado
como un estimado de ui

El objetivo principal en el análisis de regresión


es estimar la FRP
Yi  1   2 X i   i
  
Con base en la FRM Y 
i 1   2 X i   i

249

Rectas de regresión muestral y poblacional

Debido a fluctuaciones muestrales el estimado de la FRP


basado en FRM es, en el mejor de los casos, una
aproximación.
250

125
21/04/2013

Rectas de regresión muestral y poblacional

Para X=Xi, se tiene una observación muestral Y=Yi. En términos


de la FRM, la Yi observada puede ser expresada como
 
Yi  Yi  i

Y en términos de la FRP, puede ser expresada como

Yi  E (Y / X i )  i

Dado que la FRM es apenas una aproximación de la FRP, ¿se


puede diseñar un método que haga que esta aproximación
sea lo más ajustada posible?

251

Función de regresión simple: problema de


estimación

La tarea consiste en estimar la función de regresión poblacional (FRP) con


base en la función de regresión muestral (FRM) en la forma más precisa
posible.
Los dos métodos de estimación que suelen utilizarse son:
1) Los mínimos cuadrados ordinarios (MCO)
2) La máxima verosimilitud (MV).

El método de MCO es el que más se emplea en el análisis de regresión por


ser en gran medida más intuitivo y matemáticamente más simple.

252

126
21/04/2013

Método de mínimos cuadrados


ordinarios (MCO)

El método MCO se atribuye a Carl Friedrich Gauss un


matemático alemán. Bajo ciertos supuestos el método tiene
algunas propiedades estadísticas muy atractivas que lo han
convertido en uno de los más eficaces y populares del análisis
de regresión.
  
Primero se estima ui  Yi  1   2 X i (9)

que muestra que los residuos son simplemente las diferencias entre los
valores observados y los estimados de Y.
Ahora, dados n pares de observaciones de Y y X, se está interesado en
determinar la FRM de tal manera que esté lo más cerca posible a la Y
observada.

253

Método de mínimos cuadrados ordinarios (MCO)

Con este fin se puede adoptar el siguiente criterio:


seleccionar la FRM de tal manera que la suma de los
 

residuos :  ui    Yi  Y i 
sea la menor posible.
Este criterio, no es muy bueno
porque a todos los residuos se les
da la misma importancia sin
considerar qué tan cerca o qué tan
dispersas estén las observaciones
individuales de la FRM. Debido a lo
anterior, es muy posible que la
suma algebraica de los residuos

sea pequeña (aun cero) a pesar de
u i
que las están bastante dispersas
alrededor de FRM.

254

127
21/04/2013

Valores ajustados y residuos

255

Método de mínimos cuadrados ordinarios (MCO)

Se puede evitar este problema si se adopta el criterio de


mínimos cuadrados, el cual establece que la FRM puede
determinarse en forma tal que

2 2

 2 
   

 i   i    i 1 2 X i 
u   Y  Y i    Y     (10)

sea la menor posible. Este método da más peso a los residuos


   
tales comou1 y u 4 que a los residuos u 2 y u 3

El procedimiento
di i t ded MCO genera las
l siguientes
i i t ecuaciones
i
para estimar 1 y 2 donde n es el tamaño de la muestra

256

128
21/04/2013

Método de mínimos cuadrados ordinarios (MCO)

 
 Yi  n  1   2  X i Ecuaciones
normales
 
 Yi X i   1  X i   2  X i2
Resolviendo las ecuaciones normales simultáneamente se
obtiene

2  
 xi yi   Estimadores de
1  Y -  2 X mínimos

x 2
i
cuadrados

257

Modelo clásico de regresión lineal:


supuestos detrás del método MCO

El modelo de Gauss,, modelo clásico o estándar de


regresión lineal (MCRL) el cual es el cimiento de la mayor
parte de la teoría econométrica, plantea 10 supuestos.

Supuesto 1: Modelo de regresión lineal


El modelo de regresión es lineal en los parámetros
Yi  1   2 X i   i modelo simple

Supuesto 2: Los valores de X son fijos en muestreo


repetido.
Significa que el análisis de regresión es un análisis de
regresión condicional, esto es, condicionado a los
valores dados del (los) regresor X.
258

129
21/04/2013

Supuesto 3: El valor medio de la perturbación ui es igual


a cero.
Dado el valor de X
X, el valor esperado del término
aleatorio de perturbación ui es cero.
E (u i / X i )  0

Nótese que el supuesto


E(ui/Xi)=0 implica que

E (Y / X i )  1   2 X i

259

Supuesto 4: Homocedasticidad o igual varianza de ui.


Dado el valor de X, la varianza de ui es la misma para todas las
observaciones, es decir, las varianzas condicionales de ui son
idénticas
idénticas. var((uii / Xi )   2

Homocedasticidad Heterocedasticidad
260

130
21/04/2013

Supuesto 5: No existe auto correlación entre las


perturbaciones.
Dados dos valores cualquiera de X, Xi y Xj , la correlación
entre dos ui y uj es cero. cov(ui, uj / Xi, X j )0

261

Supuesto 6: La covarianza entre ui y Xi es cero o E(uiXi)=0

cov((uii , X i )  0
Supuesto 7: El número de observaciones n debe ser mayor
que el número de parámetros por estimar.

Supuesto 8: Variabilidad en los valores de X.


No todos los valores de X en una muestra dada deben ser
iguales.
ar( X )  0
var(
Recordar que la varianza muestral de X es

 X 
2
i X
var( X ) 
n 1 262

131
21/04/2013

Supuesto 9: El modelo de regresión está correctamente


especificado.

Supuesto 10:No hay multicolinealidad perfecta.


No hay relaciones perfectamente lineales entre las variables
explicativas.
263

Precisión o errores estándar de los mínimos


cuadrados estimados

Lo que se requiere es alguna medida de “confiabilidad” o


 
 y 
precisión de los estimadores
p
1 2
. En estadística la
precisión de un valor estimado es medida por su error estándar
(ee). Los errores estándar de los MCO estimados pueden
obtenerse de la siguiente manera
 2
  
var( 2 )  ee(  2 )  (11)
x 2
i x 2
i

Nota: El error estándar es la desviación estándar de la


distribución muestral del estimador, y la distribución muestral
es una distribución del conjunto de valores del estimador
obtenidos de todas las muestras posibles de igual tamaño de
una población dada. 264

132
21/04/2013

Precisión o errores estándar de los mínimos


cuadrados estimados

Nota: 2 es estimada mediante la fórmula

 Suma de residuos al

 2  ui2 cuadrado (SRC)
(12)

n2 Número de grados


de libertad


Donde  2 es el estimador de MCO de la verdadera 2
.
El término número de grados de libertad significa el
número total de observaciones n menos el número de
restricciones puestas en ellas.

265

Error estándar de la regresión



  ui2 (13)

n2

Es la desviación estándar de los valores de Y alrededor de la recta de


regresión estimada, la cual es utilizada como una medida resumen de la
bondad del ajuste de dicha recta

266

133
21/04/2013

Propiedades de los estimadores de mínimos cuadrados: Teorema de Gauss-


Markov

Dados los supuestos del modelo de regresión lineal clásica, los


estimativos de mínimos cuadrados poseen propiedades ideales u
ó
óptimas, las cuales se encuentran resumidas en el teorema de Gauss
G
Markov


Un estimador  2 de MCO es el mejor estimador lineal insesgado (MELI)
de 2 si:

1. Es lineal, es decir, una función lineal de una variable aleatoria tal como
la variable dependiente Y en el modelo de regresión.

267

Propiedades de los estimadores de mínimos cuadrados: Teorema de Gauss-


Markov


2. Es insesgado, es decir, su valor promedio o esperado, E ( es
2)
igual al
valor verdadero, 
E ( 2 )   2
3. Tiene varianza mínima entre la clase de todos los estimadores lineales
insesgados; a un estimador insesgado con varianza mínima se le conoce
como estimador eficiente

268

134
21/04/2013

Teorema de Gauss-Markov

En el contexto del análisis de regresión


g se puede
p demostrar
que los estimadores de MCO son MELI

Teorema de Gauss-Markov: Dados los supuestos del modelo clásico


de regresión lineal, los estimadores de mínimos cuadrados, en la
clase de estimadores lineales insesgados, tienen varianza mínima; es
decir son MELI

269

Coeficiente de determinación r2
Una medida de la bondad del ajuste

La cantidad r2 se conoce como coeficiente de determinación


(muestral) y es la medida más frecuente utilizada de la bondad del
ajuste de una recta de regresión.

Mide la proporción o el porcentaje de la variación total en Y explicada por


el modelo de regresión

270

135
21/04/2013

Coeficiente de determinación r2

Para calcular r2 , para cada i se escribe:

 
y i  yi   i
Elevando la expresión al cuadrado en ambos
lados y sumando sobre la muestra, se obtiene

(14)

puesto que  yˆi uˆi  0 y yˆ i  ˆ2 xi

271

Coeficiente de determinación r2

Las diversas sumas de cuadrados que aparecen en la expresión


anterior pueden describirse de la manera siguiente

 yi   Yi  Y 
2 2

(STC)

variación total de los valores reales de y con respecto a su media


muestral, los cuales pueden ser llamados suma total de
cuadrados (STC)
 2
 2
 
 yˆ 2   Yˆ  Yˆ   Yˆ  Y  ˆ 2  x 2
i i
(SEC)
2 i

variación de los valores Y estimados alrededor de su media Yˆ  Y 


que apropiadamente puede llamarse la suma de los cuadrados
debida a la regresión [es decir, debida a la(s) variable(s)
explicativa(s)], o explicada por ésta, o simplemente la suma
explicada de cuadrados (SEC). 272

136
21/04/2013

Coeficiente de determinación r2

la variación residual o no
 uˆ i
2 (SRC) explicada de los valores de Y
alrededor de la recta de
Así, (14) es
regresión, o simplemente la
suma de residuos al cuadrado
STC = SEC + SRC (SRC).

273

Coeficiente de determinación r2

muestra que la variación total


en los valores Y observados STC = SEC + SRC
alrededor del valor de su
media puede ser dividida en
dos partes, una atribuible a la
recta de regresión y la otra a
fuerzas aleatorias, puesto que
no todas las observaciones Y
caen sobre la recta ajustada.
Ahora dividiendo por la STS
en ambos lados,
lados se obtiene

2
 
Ahora, se define r2 como  Y i  Y 
   SEC
r 
2


 Yi  Y STC
2

274

137
21/04/2013

Coeficiente de determinación r2

O en forma alterna
2
u
Coeficiente de
i SRC (15) determinación
r  1
2
 1
 Y  STC
2
i Y

La cantidad r2 así definida se conoce como el coeficiente


de determinación (muestral) y es la medida más
frecuentemente utilizada de la bondad del ajuste de una
recta
t dde regresión

r2 mide la proporción o el porcentaje de la variación total
en Y explicada por el modelo de regresión.

275

Coeficiente de correlación muestral

Una cantidad estrechamente relacionada con r 2 pero


conceptualmente muy diferente de ésta es el coeficiente de
correlación el cual
correlación, cual, es una medida del grado de asociación
entre dos variables. Puede ser calculado a partir de

r r2
O a partir de su definición

r
xy  i i n  xi y i   x  y 
i i

 x  y 
i
2
i
2
n  x i
2
  x  n  y   y  
i
2
i
2
i
2

(16)

276

138
21/04/2013

Propiedades de r

Puede tener signo positivo o negativo, dependiendo del signo


del término en el numerador de (16), el cual mide la covariación
muestral de dos variables.
Cae entre los límites de -1 y 1
Es simétrico por naturaleza; es decir, el coeficiente de
correlación entre X y Y (rxy) es el mismo que entre Y y X (ryx).
 Es independiente del origen y de la escala
 Si X y Y son estadísticamente independientes, el coeficiente
de correlación entre ellos es cero; ppero si r = O, esto no
significa que las dos variables sean independientes. En otras
palabras, una correlación igual a cero no necesariamente
implica independencia.
Es una medida de asociación lineal o dependencia lineal
solamente; su uso en la descripción de relaciones no lineales 277
no tiene significado.

Coeficiente de
correlación muestral

278

139
21/04/2013

Interpretación de la pendiente:

Puesto que el coeficiente de la pendiente es simplemente la tasa


de cambio, se mide en las unidades de la siguientes proporción

unidades de la variable dependiente (Y)


unidades de la variable explicativa (X)

La interpretación del coeficiente de la pendiente 2 es que si X


cambia en una unidad , la Y cambia en promedio en 2 unidades

279

Ejemplo; Gasto de consumo familiar e ingreso familiar

Considerando una muestra de una población donde X


representa ingreso familiar por semana e Y gastos de
consumo familiar por semana, se obtienen los siguientes
cálculos  
1  24,4545 se( 1 )  6,4138
 

Y X
 2  0,5091 se(  2 )  0,0357
70 80
65 100
90 120 r 2  0,9621 r  0,9809
95 140
110 160
115 180
120 200
140 220
Por tanto la línea de regresión estimada es
155 240 

150 260 Yi  24,4545  0,5091X i

280

140
21/04/2013

Resultados en SPSS

Ejemplo; Gasto de consumo familiar e ingreso familiar

Resumen del modelo

R cuadrado Error típ. de la


Modelo R R cuadrado corregida estimación
1 ,981a ,962 ,957 6,493
a. Variables predictoras: (Constante), X

Coeficientesa

Coeficientes
Coeficientes no estandarizad
estandarizados os
Modelo B Error típ. Beta t Sig.
1 (Constante) 24,455 6,414 3,813 ,005
X ,509 ,036 ,981 14,243 ,000
a. Variable dependiente: Y
281

Ejemplo; Gasto de consumo familiar e ingreso familiar

Interpretación:

El valor de   0,5091 que mide la pendiente de la línea, muestra


1
que dentro del rango de la muestra de X comprendido entre $80
y $260 semanales, a medida que X aumenta, digamos en $1, el
aumento estimado en el promedio de gastos de consumo
semanales es de aproximadamente 51 centavos.   24,45 El valor de

1
, el cual corresponde a la intersección de la línea, indica el nivel
promedio de los gastos de consumo semanales cuando el
ingreso semanal es cero.cero No obstante,
obstante esta es una
interpretación mecánica de la intersección. En el análisis de
regresión esta interpretación literal del intercepto no es siempre
significativa, aunque en el ejemplo que estamos considerando
se puede argumentar que una familia sin ingreso alguno( ya sea
por desempleo, despido, etc.) puede mantener algún nivel
mínimo de gastos de consumo, ya sea tomando dinero prestado282
o utilizando sus ahorros.

141
21/04/2013

Ejemplo; Gasto de consumo familiar e ingreso familiar

Sin embargo en general, se debe apelar al sentido común


para interpretar la intersección puesto que es muy común
que el rango que ha tomado la muestra de valores de X no
haya incluido el valor cero como uno de los valores
observados.
Quizá sea mejor interpretar la intersección como el efecto
medio o promedio que tienen todas las variables omitidas del
modelo de regresión sobre el valor de Y. El valor de 0,9621
para r cuadrado significa que cerca del 96% de la variación
en los gastos de consumo semanales se explica por la
variable ingreso; puesto que r cuadrado puede tener un valor
máximo de 1 solamente, el r cuadrado observado sugiere
que la línea de regresión muestral se ajusta muy bien a la
información. El coeficiente de correlación de 0,9809 muestra
que las dos variables, gastos de consumo e ingreso, están
muy positivamente correlacionadas. 283

Ejemplo: Salario y educación

De la población de trabajadores en 1976, sea y = sala, en la que


sala se mide, en dólares por hora. Así, para una persona
cualquiera, si sala = 6.75, el salario por hora es de 6.75 dólares.
Sea x = educ los años de escolaridad; por ejemplo, educ = 12
corresponde a la educación preparatoria completa. Puesto que
el salario promedio de la muestra es de 5.90 dólares, el índice
de precios al consumidor indica que esta suma es equivalente
a 16.64 dólares de 1997.
Con los datos de SALA 1.RAW, en los que n = 526 individuos,
obtenemos la siguiente línea de regresión de MCO (o función
de regresión muestra!):
saˆ la   0.90  0.54 educ.

284

142
21/04/2013

Ejemplo: Salario y educación

Debemos interpretar con cuidado la ecuación. La


intercepción -0.90 significa literalmente que una persona
sin instrucción recibe un salario pronosticado de -90
90
centavos de dólar por hora, lo que, desde luego, es una
tontería. Resulta que ningún miembro de la muestra tiene
menos de ocho años de educación, lo que explica el
pronóstico descabellado de una escolaridad de 0 años.
Para una persona con ocho años de escolaridad, el salario
pronosticado es

saˆla
l = -0.90 + 0.54(8) = 3.42, o 3.42 dólares por hora
(en dólares de 1976).
La estimación de la pendiente implica que un año más
de educación aumenta el salario promedio en 54
centavos de dólar por hora.
285

El supuesto de normalidad:
El modelo clásico de regresión lineal normal

Recordemos q que con los supuestos


p vistos anteriormente los

estimadores de MCO  ,  ,  2
 
satisfacían diferentes
1 2
propiedades estadísticas muy deseables, tales como
insesgamiento y varianza mínima . Si nuestro objetivo es
únicamente la estimación puntual el método de MCO será
suficiente, sin embargo la estimación puntual es sólo la
formulación de un aspecto
p de la inferencia estadística.

Nuestro interés no consiste solamente en estimar la función


muestral de regresión (FRM), sino también en utilizarla para
obtener inferencias respecto a la función de regresión
poblacional (FRP). 286

143
21/04/2013

El supuesto de normalidad: El modelo clásico de regresión lineal normal

La regresión
L ió lineal
li l normall clásica
lá i supone que
cada ui, está normalmente distribuida con

Media : E(ui )  0
E ui  E (ui )  E (ui2 )   2
2
Varianza :
Cov(ui , u j ) :  
E ui  E (ui ) u j  E (u j )   E (ui u j )  0 i  j

Estos supuestos pueden expresarse en forma más compacta como

ui ~ N(0,  2 )

287

El supuesto de normalidad

La regresión lineal normal clásica supone que la


distribución probabílistica de ui es normal.

Consideremos el ejemplo consumo e ingreso.



Yi  24,4545  0,5091X i
Obtuvimos que la PMC estimada es de 0,5091,
correspondiente a una sola estimación puntual de la PMC
de la poblacional desconocida.
¿Qué tan confiable es esta estimación?.
Debido a fluctuaciones muestrales,
muestrales es posible que una
sola estimación difiera del valor verdadero, aunque en un
muestreo repetido se espera que su valor medio sea igual
al valor verdadero

E ( 2 )   2
288

144
21/04/2013

Estimación de intervalos

Ahora, en estadística, la confiabilidad de un estimador puntual se


mide por su error estándar. Por consiguiente, en lugar de
depender de un solo estimador puntual, se puede construir un
intervalos alrededor del estimador puntual, por ejemplo, dentro
de dos o tres errores estándar a cada lado del estimador puntual,
tal que este intervalo tenga, digamos, 95% de probabilidad de
incluir el verdadero valor del parámetro. Esta es la idea básica
de la estimación de intervalos.

289

Estimación de intervalos

Consideremos el ejemplo hipotético consumo-ingreso. La


ecuación
ió 
Yi  24,4545  0,5091X i

muestra que la propensión marginal a consumir (PMC) estimada


es 0,5091, la cual constituye una única estimación (puntual) de la
PMC poblacional desconocida 2 que es un (punto) estimado de
la población desconocida PMC 2 .

¿Qué tan confiable es esta estimación?


Debido a las fluctuaciones muestrales, es probable que una sola
estimación difiera del valor verdadero, aunque en un muestreo

repetido se espera que el valor de su media sea igual al valor
E ( 2 )   2
verdadero (Nota: )
290

145
21/04/2013

Ahora, en estadística, la confiabilidad de un estimador puntual


se mide por su error estándar. Por consiguiente, en lugar de
depender de un solo estimador puntual, se puede construir un
i t
intervalo
l alrededor
l d d del
d l estimador
ti d puntual,
t l por ejemplo,
j l dentro
d t de d
dos o tres errores estándar a cada lado del estimador puntual, tal
que este intervalo tenga, digamos, 95% de probabilidad de
incluir el verdadero valor del parámetro. Ésta es, a grandes
rasgos, la idea básica de la estimación de intervalos.
Para ser más específico, supóngase que se desea encontrar qué

tan" cerca" está por ejemplo,
 de 
2 2

Con este fin, tratamos de encontrar dos números positivos,  y


, este último situado entre 0 y 1, tal que la probabilidad de que
  aleatorio

 contenga el verdadero 2 sea 1
 2 -  , 2 -  
el intervalo
 
- .
291

Simbólicamente
  

Pr   2 -    2   2     1  
 
Tal intervalo, si existe, se conoce como intervalo de
confianza;
a 1 -  se le denomina coeficiente de confianza; y  (0 <  <
1) se conoce como el nivel de significancia.
Los puntos extremos del intervalo de confianza se conocen
 
 2 -  de confianza (también denominados
como límites  2  valores
críticos) siendo
críticos), el límite de confianza inferior y
el límite de confianza superior.
Obsérvese que en la práctica  y 1 -  son expresados
frecuentemente en forma porcentual como 100 y 100(1 -
)%.
292

146
21/04/2013

Intervalos de confianza para los coeficientes de regresión 1 y


2

Intervalo de confianza de 100(1-) por ciento para 


 

 - t /2 se(  )

Al regresar a nuestro ejemplo ilustrativo de consumo e


ingreso encontramos que
 
 2  0,5091 se(  2 )  0,0357

Si suponemos que que  =5%, es decir un coeficiente de


confianza del 95% entonces la tabla t muestra que para 8 gl,
t 0,025  2.306
el t crítico es

293

Intervalos de confianza para los coeficientes de regresión 1 y


2

Al sustituir esos valores se obtiene que el intervalo de


confianza del 95% para 2 es el siguiente:
0,4268   2  0,5914

La interpretación de este intervalo de confianza es: dado un


coeficiente de confianza del 95%, a largo plazo, en 95 de cada
cien casos, intervalos como (0,4268 ; 0,5914) contendrán el
verdadero 2 .
Como se advirtió antes, obsérvese que no se puede decir que la
probabilidad de que el intervalo específico (0,4268 ; 0,5914)
contenga el verdadero 2 . de 95% porque este intervalo es ahora
fijo y no aleatorio;por consiguiente 2 se encontrará o no dentro
de él.
294

147
21/04/2013

Intervalos de confianza para los coeficientes de regresión 1 y


2

Para el ejemplo consumo-ingreso, el intervalo de confianza


para 1 al 95% es:
9,6643  1  39,2448
Utilizando
 

 - t /2 se(  )

Se tiene
24,4545 - 2,306(6,41 38)

Se debe ser cauteloso al interpretar el intervalo de confianza


( 9,6643; 39,2448). A largo plazo, en 95 de cada 100 casos,
intervalos como ( 9,6643; 39,2448) contendrán el verdadero 1; la
probabilidad de que este intervalo fijo incluya el verdadero 1 es 1 o
0
295

Prueba de hipótesis. Prueba t

La idea fundamental detrás de las pruebas de significancia


consiste en utilizar un estadístico de prueba ( estimador).
Bajo el supuesto de normalidad la variable


1  1
t 

se(  1 )

sigue la distribución t con N-2 grados de libertad. Si el valor


verdadero de 1 se especifica en la hipótesis nula, el valor t
puede calcularse fácilmente a partir de la muestra disponible,
pudiendo servir por tanto como estadístico de prueba

296

148
21/04/2013

Consideremos nuevamente el ejemplo de


consumo -ingreso.

Sabemos que

1  0,5091 se(( 1 )  0,0357

Si Ho: 1=0,3 y H1: 10,3

0,5091  0,3
t  5,86
0,0357
Si   5%, , , gl  8 entonces t 0 , 025  2.306
luego el t calculado es mayor al t de tabla y por lo tanto se rechaza la hipótesis nula

El procedimiento
di i t anterior
t i se denomina
d i prueba b t.
t En
E ell
lenguaje de pruebas de significancia, se dice que un
estadístico es estadísticamente significativo si el valor del
estadístico de prueba se encuentra en la región crítica. En
nuestro ejemplo, el estadístico t es significativo y
procedemos a rechazar la hipótesis nula.
297

Aplicación problema de predicción

Con base en los datos muestrales, se obtuvo la


siguiente regresión muestral.

Yi  24,4545  0,5091X i
Donde Ŷt es el estimador del verdaderoE (Y i )
correspondiente a X dada. ¿Qué uso se puede dar a esta
regresión histórica? Uno es “predecir” o “pronosticar” el
gasto de consumo futuro Y correspondiente a algún nivel
dado de ingreso X.
Ahora hay dos clases de predicciones:
Ahora,
1) la predicción del valor de la media condicional de Y
correspondiente a un valor escogido X, por ejemplo, que es
X0
el punto sobre la recta de regresión poblacional misma, y
2) predicción de un valor individual Y correspondiente a .
Se llamarán estas dos predicciones de predicción media y 298

la predicción individual.

149
21/04/2013

Aplicación problema de predicción


Supóngase que Xo = 100 y se desea predecir
E(Y
( I Xo = 100).
) Ahora, puede
p demostrarse que
q la regresión
g
histórica Y  24,4545  0,5091X
i i

proporciona la estimación
   puntual de esta predicción media de
la siguiente forma: Y0   1   2 X 0
 24.4545  0.5091(100)  75.3645


Donde Y0 = estimador de E(Y I Xo).
Xo) Puede demostrarse que
este predictor puntual es el mejor estimador lineal e insesgado
(MELI). 
Y0
Puesto que es un estimador, es probable que éste sea
diferente de su verdadero valor. La diferencia entre los dos
valores dará alguna idea sobre el error de predicción o de 299
pronóstico.

se demuestra que en la ecuación  


Y0   1   2 X 0

Y0 está normalmente distribuida con media 1   2 X 0 y con
1 X  X 
una varianza
i dada
d d por la
l siguiente
i i t fórmula:
fó  l  2

var(Y0 )   2   0 2 
n
 x
i


Al reemplazar 2 desconocida por su estimador insesgado
se cumple que la variable 
Y 0  1   2 X 0 
t 
ee(Y 0 )
sigue una distribución t con n - 2 g de l. La distribución t
puede
d ser utilizada
tili d por consiguiente
i i t para construir t i
intervalos de confianza para el verdadero E(Yo I Xo) y
para hacer pruebas de hipótesis acerca de tal valor de la
manera usual, a saber,
   
  1   2 X 0  - t / 2 ee(Y 0 )
 
300

150
21/04/2013

Aplicación problema de predicción

Para los datos del ejemplo


  1 100  1702 
var(Y0 )  42.159    10.4759
10 33000 

y ee(Y0 )  3.2366

Por consiguiente, el intervalo de confianza al 95% para el


verdadero E (Y / X 0 )  1   2 X 0

es 67.9010  E (Y / X  100)  82.8381

Por tanto, dada X0 =100, en muestreo repetido, en 95 de cada


100 intervalos como el anterior estará incluido el verdadero
valor medio; la mejor estimación del verdadero valor medio es,
por supuesto, la estimación puntual 75.3645
301

Predicción individual

Si nuestro interés está en predecir un valor individual Y, Y0


correspondiente a un valor dado X, digamos X0, entonces el
mejor estimador
  lineal
 insesgado de Y0 está dado también por
Y0   1   2 X 0 (17)
 24.4545  0.5091(100)  75.3645
Pero su varianza es la siguiente
  
 1 X X
var(Y0  Y 0 )  E (Y0  Y 0 ) 2   2 1   0 2
 
2

(18)
 n
  xi 

Puede demostrarse además que Y0 también sigue una
distribución normal

con media y varianza dadas por (17) y (18),

respectivamente.2 Sustituyendo  2desconocida por se
cumple que 
Y0  Y0
t  también sigue una distribución t
ee(Y0  Y0 )

302

151
21/04/2013

Por consiguiente, la distribución t puede utilizarse para hacer


inferencia sobre la verdadera Yo. Al continuar con nuestro
ejemplo consumo
consumo-ingreso,
ingreso, se ve que la predicción puntual de

Yo es 75.3645, igual
Y0 a y su varianza es 52.6349. Por
consiguiente, el intervalo de confianza al 95% para Yo
correspondiente a Xo =100 es
(58.6345  Y0 / X 0  100)  92.0945)

Comparando este intervalo con


67.9010  E (Y / X  100)  82.8381

Se ve que el intervalo de confianza para el Y0 individual es


más amplio que el intervalo para el valor medio de Y0

303

Intervalos de confianza para Y media y para valores individuales de Y

304

152
21/04/2013

Formas funcionales de los modelos


de regresión

Consideremos algunos modelos de regresión que pueden ser no lineales en


l variables
las i bl pero que son lineales
li l en los
l parámetros
á t o que pueden
d serIo
I
mediante transformaciones apropiadas de las variables.

En particular, consideremos los modelos de regresión:


1. El modelo log-lineal
2. Modelos semilogarítmicos

305

Cómo medir la elasticidad: Modelo Log-Lineal

Considérese el siguiente modelo, conocido como el


modelo de regresión exponencial:
Yi  1 X i 2 e i
El cual puede ser expresado alternativamente

ln Yi  ln β1  β2 ln X i  μi
Si escribimos como

ln Yi    β2 ln X i  μi
Donde   y β2
 ln β1 este modelo es lineal en los parámetros
y lineal en los logaritmos de las variables Y y X y puede ser
estimado por regresión MCO
306

153
21/04/2013

Cómo medir la elasticidad: Modelo Log-Lineal

Una característica importante del modelo log-Iog, que lo ha hecho muy


popular en el trabajo empírico, es que el coeficiente de la pendiente 2
mide la elasticidad de Y con respecto a X, es decir, el cambio porcentual en
Y ante un pequeño cambio porcentual en X dado. Así, si Yrepresenta la
cantidad demandada de un bien y X su precio unitario, 2 mide la
elasticidad-precio de la demanda, un parámetro de gran interés en
economía.

307

Modelo de elasticidad constante

Si la relación entre la cantidad demandada y el precio es


como se muestra en la figura (a ) la transformación doble-
Iog presentada en la figura ( b) dará entonces la estimación
de la elasticidad-precio (-2 ) lnY
ntidad demandada

Y  2 i
Yi  1 X i e
d demandada

ln Y  ln β1  β2 ln X i
Cantidad

ln de can

lnX
Precio X Ln del Precio

308

154
21/04/2013

Ejemplo
Gasto en bienes duraderos respecto al gasto de consumo personal total

Consideremos datos sobre el gasto de consumo personal


total (GCPERT), el gasto en bienes duraderos (GASBD), el
gasto en bienes perecederos (GASBPER) y el gasto en
servicios (GASERV), todos medidos en millones de dólares de
1992.
(tabla 6.3-Anexo 1)

Su póngase que se desea calcular la elasticidad del gasto en


bienes durables respecto al gasto de consumo personal total.
Al graficar el logaritmo del gasto en bienes durables en
comparación con el logaritmo del gasto de consumo personal
total, se observará que la relación entre las dos variables es
lineal. Por tanto, el modelo del doble logaritmo podría resultar
adecuado. Los resultados de la regresión son: 309

In GASBD = -9.6971 + 1.9056 In GCPERT,


ee = (0.4341) (0.0514)
t = (-22.3370)* (37.0962)* r² = 0.9849

donde * indica que el valor p es extremadamente pequeño.

Todos estos resultados muestran que la elasticidad de GASBD


respecto a GCPERT es de casi 1.90, lo que sugiere que si el
gasto personal total aumenta 1 %, en promedio, el gasto en
bienes duraderos se incrementa casi 1.90%. En consecuencia,
el g
gasto en bienes duraderos es muyy sensible a los cambios en
el gasto de consumo personal. Ésta es una razón por la que los
productores de bienes duraderos siguen muy de cerca los
cambios en el ingreso personal y el gasto de consumo
personal.

310

155
21/04/2013

Ejemplo: Salario y ventas

Podemos estimar un modelo de elasticidad constante que


relacione el salario del director ejecutivo con las ventas de la
empresa. Sea vtas las ventas anuales de la compañía, medidas
en millones de dólares.
dólares Un modelo de elasticidad constante es
ln sala    0   1 ln vtas   u
en el que es la elasticidad de sala en relación con vtas. Este
modelo se encuentra entre los de regresión simple, al definir la
variable dependiente como y = log(sala) y la independiente
como
x = log(vtas). La estimación de esta ecuación mediante MCO da
l saˆla
ln l   4.822  0.257
2 lnl vtas 
n  209, R 2  0.211.
El coeficiente de ln(vtas) es la elasticidad estimada de sala
con respecto a vtas. Implica que un incremento de uno por
ciento en las ventas de la compañía aumenta el salario del
director ejecutivo en alrededor de 0.257 por ciento, que es la
interpretación usual de elasticidad. 311

Ejemplo de regresiones lineales:

El gerente de ventas de una compañía se está preparando para una reunión


de ventas, y le gustaría mostrar al grupo de vendedores la forma como se
relaciona el número de llamadas a clientes con el valor anual de pedidos que
se reciben. De sus registros recolectó la siguiente información muestral para
el últimoNúmero
año. de llamadas Pedidos (miles de dólares) Número de llamadas Pedidos (miles de dólares)
5 4,8 2 2,2
4 6,1 4 7,1
6 12,3 4 8,7
7 13,7 8 13,7
8 15,7 1 2,3
1 2,2 3 4,6
3 7,3 9 16,7
4 5,8 3 6,1
1 1,9 4 7,5
3 6,7 8 15,1

A partir de estos datos muestrales:


a) Realice un gráfico de dispersión.
b) Determine el coeficiente de correlación.
c) Desarrolle una ecuación de regresión para predecir el valor de pedidos a
partir del número de llamadas.
d) Cuál es el valor de pronóstico de pedidos si se realizan cinco llamadas?

156
21/04/2013

Solución
Gráfico de dispersión
p
18

16

14

12
s de dólares)

10

6
Pedidos (miles

0
0 2 4 6 8 10

Número de llamadas

313

Coeficiente de correlación r = 0,956


b) Nivel de significancia s = 0,000
La correlación es significante al nivel 0,01

c) 
Y  a  bX
Número de pedidos  0,105  1,85 (llamadas )

d) 
Y  a  bX
Número de pedidos  0,105  1,85 (5)  9,145

Notar que el coeficiente de determinación es 0,915, indicando que


aproximadamente 91,5% de la variación en los pedidos se explica por los
números de llamadas.

157
21/04/2013

Ejemplo:

¿Cuál es la relación entre la cantidad gastada por semana en alimentos y el


tamaño de una familia? ¿Las familias grandes gastan más en alimentos?
Una muestra de 10 familias en una ciudad reveló los siguientes tamaños de
familia e importes en dinero gastados en alimentos, en cierto periodo.

Tamaño Cantidad gastada


de la familia en alimentos
3 99
6 104
a) Determine la ecuación de regresión. 5 151
b)) Obtenga
g el error estándar de la 6 129
estimación. 6 142
c) Estime la cantidad de dinero que una 3 111
4 74
familia de cuatro personas gastará en
4 91
alimentos.
5 119
3 91

Solución:

a) 
Y  a  bX
Cantidad gastada  60.4  11,3 (tamaño)

b)
S Y,X 
 (Y  Y )  3467,2
 20,818
n2 8

c) Cantidad gastada = 60,4+11,3 (4)=105,6

Obs: En este ejemplo el coeficiente de correlación es r=0,589 y s=0,037. La


correlación es significativa al nivel 0,05.

158
21/04/2013

Consideraciones de base para la regresión lineal

1 Para cada valor de X existe un grupo de valores de Y


1. Y, y estos
valores se distribuyen en forma normal.
2. Las medias de estas distribuciones normales de valores Y se
encuentran todas en la línea de regresión.
3. Las desviaciones estándares de dichas distribuciones normales
son iguales.
4. Los valores Y son estadísticamente independientes. Esto
significa que al seleccionar una muestra, los valores Y
seleccionados para un valor de X específico no dependen de los
valores Y para cualquier otro valor X.

Análisis de correlación y regresión lineal

Representación gráfica de las consideraciones básicas


de la regresión
Cada una de estas distribuciones
1. Es normal
2. Tiene la misma desviación
Y estándar estimada por S y x
Una desviación
} estándar
Una desviación
}estándar

Recta de
regresión Las tres medias quedan
en la recta de regresión

X
X1 X2 X3

159