You are on page 1of 21

31/10/2013

INFERENCIA ESTADISTICA

La inferencia estadstica busca determinar caractersticas de la


poblacin en base a una muestra

Muestra: subconjunto finito y representativo de la


poblacin

Problema: Estimar el total de habitantes en la comunidad: Estudiantes de


estadstica de la Maestra en Ingeniera Vial, para el efecto tomar una
muestra representativa del 20 % de la poblacin.
Si (n/N)*100 > 10 % usar factor de correccin por poblacin finita para
la desviacin estndar del total

fcpf

N n
N 1

N = Tamao poblacin
n = Tamao muestra

31/10/2013

Muestreo, Mtodo para


obtener un subconjunto
REPRESENTATIVO de la
poblacin

Tamaos de muestra

Para estimar el promedio poblacional por I.C. con m.a.s.


Determinar el tamao de muestra requerido para estimar el promedio
poblacional del numero de habitantes por vivienda de la comunidad de
estudiantes de estadstica de la maestra en Ingeniera Vial. Los datos al
respecto son:
Tamao poblacin N=47
Especificaciones de precisin para estimar :
e = 0.5 habitantes
NC= 95%
En base a una muestra piloto de n=10, se conoce que:
S=1.5 habitantes

31/10/2013

vs Precision with C.C.=0.95 S=4.219 C.I. Mean


10

Precision

Tamaos de muestra
Para estimacin de la proporcin poblacional por I.C. y m.a.s.
Ejem: Se desea estimar la proporcin poblacional de personas de
acuerdo con que se construya el camino por el Tipnis
Las especificaciones previas de precisin son:
N.C. = 95 %
Error admisible 2 %
Determinar el tamao de muestra

31/10/2013

N vs P with Precision=0.02000 C.C.=0.95 C.I. Mean


800

700

600

500

400
0.1

0.3

0.5

0.7

0.9

N vs P by Precision with C.C.=0.95 C.I. Mean


800

Precision

600

400

0.02
0.04
0.06
0.08
0.10

200

0
0.1

0.3

0.5

0.7

0.9

Precision 0.02 to 0.1 by 0.02


P 0.1 to 0.9 by 0.1

31/10/2013

Determinacin de p por I.C.


En base a una encuesta a 500 personas
(representativas de una determinada poblacin), se
conoce que la proporcin de personas favorables a la
construccin del camino por el tipnis es p=70 %, calcular
el error de muestreo correspondiente, usar un NC=95 %

PRUEBAS DE HIPOTESIS
P.H. es una regla de decisin para aceptar o rechazar una
hiptesis nula
Mtodo de inferencia estadstica:
El resultado esperado fue planteado como pregunta
(Intervalo de confianza) o como respuesta (prueba de
hiptesis)
Ejem:
R.E.: Estimar la proporcin de personas favorables a la
construccion del camino por el Tipnis.
R.E.: La proporcin de personas favorables a que se
construya el camino por el Tipnis es mayor o igual a 70 %

31/10/2013

TIPOS DE PRUEBAS DE HIPOTESIS


P.H. de conformidad de un parmetro
P.H. de comparacin de un parmetro de dos o mas
poblaciones
P.H. de bondad de ajuste
P.H. de independencia de variables de tipo cualitativo

PRUEBAS DE HIPOTESIS
Procedimiento general para pruebas de hiptesis:
a)
b)
c)
d)
e)
f)
g)

Formular respuestas provisorias


Adoptar un alfa
Tomar muestra
Calcular estadstico de prueba en base a distribucin
muestral del estadstico de inters
Definir regin de aceptacin de H0
Si pvalue > alfa =>aceptar H0
Escribir conclusin

31/10/2013

Prueba de hiptesis de conformidad de un promedio


Ejem: Se estudia la contaminacin por lluvia acida en cierta regin de
inters, para el efecto se cuenta con mediciones de los depsitos
de sulfatos mostrados en el Cuadro adjunto. Verificar la
aseveracin de que la muestra proviene de una poblacin con
promedio mayor que 12 Kg/Ha.
Depsitos de sulfatos por lluvia acida (Kg/Ha), observados en
zona de estudio
Ao
Depositos
sulfatos (Kg/Ha)

1980

1981

1982

1983

1984

1985

1986

1987

1988

1989

1990

17,59

12,84

11,55

12,72

14,33

12,23

15,16

14,08

10,85

11,87

12,93

SOLUCION

a) Formular respuestas provisorias


Ho : 12 Kg/Ha
H1 : > 12 Kg/Ha

SOLUCION

b) Adoptar un nivel de significacin

= 5%

c) Tomar muestra, calcular estadsticos de resumen


Promedio
Desv Estandar

13.29
1.91

d) Calcular estadstico de prueba enx base a distribucin muestral del


estadstico de inters

Como n<30 , asumiendo que X~Normal, desconocido

=>

~N

t pru

x
S
n

31/10/2013

Pruebas de comparacin de un parametro de dos


poblaciones distintas
P.H. de dos promedios:
muestras independientes
Datos pareados

Viviendas Barrio A
Viviendas Barrio B

50
32

Consumo de agua mes (m3)


55
42
45
50

35

Peso (Kg)
P1
90
85

pre dieta
post dieta

P2
80
72

P3
92
86

P4
85
79

Pruebas de comparacin del promedio, muestras


independientes
Las dos poblaciones al parecer tienen variancias poblacionales
distintas y desconocidas

Zp

21 2 2
n1

x1 x 2

tp

n2

H1 : (A) < (B)

S 21 S 2 2

n1
n2

( A B )2
A2
B2

n1 1 n2 1

Ho : (A) = (B)

x1 x 2

S
A 1
n

S2
n

31/10/2013

Pruebas de comparacin del promedio, muestras


independientes
Las dos poblaciones al parecer tienen variancias poblacionales
iguales y desconocidas

tp

x1 x 2

S p2

2
S2p S p

n1
n2

( n1 1 ) S12 ( n2 1) S 22
(n1 n2 2 )

n1 n2 2

Contraste de igualdad de Variancias

Fpr

S12 / 12
S 22 / 22

H 0 : 12 22

Fpr

S12
S 22

H1 : 12 22

Fpr

S12
S 22

S12

Mayor variancia muestral

S 22

Menor variancia muestral

1grados de libertad del numerador


1grados de libertad del numerador

31/10/2013

Pruebas de comparacin de un parametro de dos poblaciones distintas


1) En un terrapln de prueba se ha estado midiendo el peso especifico
seco obtenido en la compactacin de una capa de suelo A-2, de 30
cm de espesor, con dos compactadoras sobre neumticos con pesos
diferentes. Segn el ejecutor, con el compactador # 1 y 5 pases se
logra una adecuada compactacin. Segn el proyectista que
realizaba el control de autor, era necesario usar el compactador # 2
tambin con 5 pases. Para el compactador #1 se tomaron 20
muestras, las cuales arrojaron d = 1790 kg/m3. Para el # 2 se
tomaron 24 muestras con d = 1739 kg/m3 .Se debe decidir si
existe o no diferencia significativa entre el resultado de un
compactador y otro para un nivel de significacin del 95 %, las
varianzas calculadas son respectivamente

S1 = 10 Kg/m3
S2 = 5 Kg/m3

Pruebas de comparacin de un parametro de dos


poblaciones distintas
P.H. de dos promedios, muestras independientes
Ejem. 1: Considerando que el consumo de agua en los barrios A, B y C
corresponden a una muestra, determinar si se puede admitir que a nivel
poblacional el barrio A tiene un consumo promedio inferior al del barrio C.
En base a las observaciones muestrales, se calcularon los siguientes
estadsticos:
Estadsticos de grupo

concumo emnsual
de agua en m3

BARRIO 1=A, 2=B, 3=C


A
C

N
28
28

Media
101.1250
102.5714

Desviacin
tp.
9.15313
14.75046

Error tp. de
la media
1.72978
2.78758

Ho : (A) = (B)
H1 : (A) < (B)

10

31/10/2013

Pruebas de comparacin de un parametro de dos


poblaciones dependientes
P.H. de dos promedios, muestras pareadas
Calificaciones
Post curso

Pre curso

99

94

57

57

76

66

77

76

59

58

92

88

Ho : (d) = 0
H1 : (d) > 0

tp

d d
Sd / n

Pruebas de comparacin de un parametro de dos


poblaciones dependientes
P.H. de dos promedios, muestras pareadas
Ejercicio 3: Se miden concentraciones de Zinc en (mg/l), con el fin de
decidir si es conveniente plantear obras de captacin del agua
subsuperficial, en base a una muestra de 6 puntos indicar si se puede
admitir que a nivel poblacional el promedio de agua superficial tiene una
concentracin de Zinc mayor que el agua subsuperficial.

Local
1
2
3
4
5
6

Concentracion de Zinc (mg/l)


Agua
Agua
Superficial
Subsuperficial
0,430
0,415
0,266
0,238
0,567
0,390
0,531
0,410
0,707
0,605
0,716
0,609

Ho : (d) = 0
H1 : (d) > 0

11

31/10/2013

Pruebas de comparacin de un parmetro de mas de dos


poblaciones, ANOVA
Condiciones de aplicacin: muestras independientes,
poblacionales iguales, distribuciones poblacionales normales.

variancias

Se estudia la resistencia a compresin del hormign (Mpa) a 28 das de


4 tipos de dosificacin, los valores medidos en los cilindros de prueba,
se muestran en el siguiente cuadro. Indicar si el factor dosificacin
influye en la resistencia promedio
Dosifi A
42,00
39,00
48,00
43,00
44,00

Dosifi B
45,00
46,00
45,00
39,00
43,00

Dosifi C
64,00
61,00
50,00
55,00
58,00

Dosifi D
56,00
55,00
62,00
59,00
60,00

Ho : (A) = (B) = (C) = (D)


H1 : alguna de las igualdades anteriores no se cumple

Variabilidad dentro grupos:


n1

SCD1 ( xi x1 ) 2
i 1

n2

SCD2 ( xi x2 ) 2
i 1

.
.
SCD = SCD1+ SCD2 + + SCDk

CMD

SCD
nk

12

31/10/2013

Variabilidad entre grupos:

SCE ( xi x ) 2
i 1

n1 x1 n2 x2 ... nk xk
n1 n2 ... nk

CME

Fpr

SCE
K 1

CME
CMD

Pruebas de comparacin de un parmetro de mas de dos


poblaciones, ANOVA
Se desea comparar el consumo promedio de gasolina para tres
fabricantes de coches. Se cuenta con 20 conductores a quienes se les
asigna un coche de manera aleatoria, los datos obtenidos se muestran
en el cuadro.

Rendimiento coches en (km/l)


Coches A
Coches B
Coches C
22.2
24.6
22.7
19.9
23.1
21.9
20.3
22.0
23.2
21.4
23.5
24.1
21.2
23.6
22.1
21.0
22.1
23.4
20.3
23.5
Ho : (A) = (B) = (C)
H1 : alguna de las igualdades anteriores no se cumple

13

31/10/2013

Ejercicio 4: El proceso de obtencin de papel necesita grandes cantidades


de agua. Una vez preparada la madera, sta es normalmente calentada con
agentes reductores y lcalis para disolver las fibras y obtener pulpa. Este
proceso es muy contaminante. Se han tomado datos aleatorios a lo largo de
un ao de la cantidad de agua usada en el paso inicial de la obtencin de
pulpa por tonelada de madera en 4 trituradoras.
Se desea verificar si en promedio las 4 trituradoras consumen la misma
cantidad promedio de agua, analizar las diferencias si ellas existen

TA
22,0
18,8
19,5
23,7
21,9
19,9

TB
18,6
16,0
17,7
14,6
19,9
18,6

TC
23,1
18,0
20,0
21,0
23,7
22,4

TD
20,3
18,5
19,6
22,8
23,8
21,4

Ho : (TA) = (TB) = (TC) = (TD)


H1 : alguna de las igualdades anteriores no se cumple

Inferencia estadstica prueba de independencia


bidimensionales variables cualitativas
herramienta tablas de contingencia
Se consulto una muestra de pobladores de los distritos 1, 2 y 3, respecto a su
opinin para implantar o no cierto proyecto en inmediaciones de su
jurisdiccin, los datos se muestran en la tabla adjunta, indicar si la opinin de
los pobladores es independiente del distrito.
Opinion respecto a
la implantacion del
proyecto
a favor
en contra

Distrito 1

Dsitrito 2

Distrito 3

8
52

13
67

12
48

X2pr = (Oi-Ei)2/Ei

14

31/10/2013

Inferencia estadstica prueba de independencia


bidimensionales variables cualitativas
herramienta tablas de contingencia
Con los datos de la alcalda, verificar si el genero de las personas es
independiente de su categora laboral

Tabla de contingencia Genero * Categora laboral


Recuento

Genero
Total

Hombre
Mujer

Categora laboral
Administrativo
Seguridad
157
27
206
0
363
27

Directivo
74
10
84

Total
258
216
474

Regresin desde un punto de vista de inferencia

p1
p2
p3
p4
p5
p6
p7

Profundidad
(m)
15,00
20,00
30,00
40,00
50,00
60,00
70,00

Oxigeno
(mg/l)
5,50
5,30
4,00
3,00
2,50
1,40
,50

15

31/10/2013

Recordando que se esta trabajando con una muestra estadstica,


estimar el contenido de oxigeno para una profundidad PROMEDIO de
43 m

Determinar el contenido de oxigeno a una profundidad


concreta y especifica de 43 m

16

31/10/2013

Estimacin promedio y estimacin para un


valor puntual, va regresin

Modelo de regresin, desde un punto de vista de inferencia


con estimaciones por intervalos de confianza

17

31/10/2013

Preparar el SPSS para introducir datos de la siguiente boleta


Identificador boleta: bm01
Genero

H
M

Educacion Formal
Categoria laboral

aos
Directivo
Administrativo
Seguridad

Experiencia previa

meses

Filiacion politica

si
no

Salario actual

U$

Salacio inicial

U$

DATOS ALCALDIA

bm1
bm2
bm3
bm4
bm5
bm6
bm7
bm8
bm9
bm10

Genero
Hombre
Hombre
Mujer
Mujer
Hombre
Hombre
Hombre
Mujer
Mujer
Mujer

Educacion formal
(Aos)
15
16
12
8
15
15
15
12
15
12

Categoria
laboral
Directivo
Administrativo
Administrativo
Administrativo
Administrativo
Administrativo
Administrativo
Administrativo
Administrativo
Administrativo

Experiencia
previa
Filiacion
(meses)
politica
144
no
36
no
381
no
190
no
138
no
67
no
114
no
0
no
115
no
244
no

Salario
actual
Salario inicial
(U$)
(U$)
$1,140.00
$540.00
$804.00
$375.00
$429.00
$240.00
$438.00
$264.00
$900.00
$420.00
$642.00
$270.00
$720.00
$375.00
$438.00
$195.00
$558.00
$255.00
$480.00
$270.00

18

31/10/2013

Con datos de la alcalda, responder las siguientes preguntas

1. Cual el porcentaje de trabajadores por categora


laboral ?
2. Existe una diferencia por genero en funcin de la
categora laboral ?
3. Hay diferencias por genero en cuanto al salario y la
categora laboral ?

Usar los datos del archivo Consumo_diesel


En este archivo se cuenta con datos del consumo diario de diesel en 3
campamentos camineros, evaluar el comportamiento de esta
variable en cuanto a los siguientes aspectos:
a) Valor de la tendencia central
b) Dispersin de los datos
c) Valores extremos
d) Forma de la distribucin

19

31/10/2013

Anlisis de indepenencia de dos variables cualitativas (Archivo:


AFCS_referendum)
Prueba del Chi Cuadrado

1 Cual el proyecto de su preferencia:

Proyecto 1
Proyecto 2
Proyecto 3

2 Ciudad en la que vive:

Cochabamba
La Paz
Santa Cruz

Indicar si hay independencia entre la preferencia por un proyecto


y la ciudad en que vive

Ho: El proyecto ES INDEPENDIENTE de la ciudad en que vive


H1: El proyecto NO ES INDEPENDIENTE de la ciudad en que vive

20

31/10/2013

Ho: El proyecto ES INDEPENDIENTE de la ciudad en que vive


H1: El proyecto NO ES INDEPENDIENTE de la ciudad en que vive

Que proyecto es mas o menos preferido por determinada


ciudad ??
Una respuesta al respecto es dada la tcnica del Anlisis
Factorial de Correspondencias Simples (AFCS), que permite
medir la dependencia entre las categoras de dos variables
cualitativas.

Regresin desde un punto de vista de inferencia


usar archivo: dispersin _ oxigeno

p1
p2
p3
p4
p5
p6
p7

Profundidad
(m)
15,00
20,00
30,00
40,00
50,00
60,00
70,00

Oxigeno
(mg/l)
5,50
5,30
4,00
3,00
2,50
1,40
,50

21

You might also like