Professional Documents
Culture Documents
Sergi Peire
Departament de Matemà'ques
Escola d’Enginyeria de Barcelona Est
Universitat Politècnica de Catalunya
Febrer-maig 2020
Es'mació de la proporció .
Es'mació per intervals de confiança
€
Es'mació per intervals de confiança
Sigui Χ1,...,Χn una m.a.s de X, on X té una llei que depén d’un paràmetre θ
desconegut.
Es disposa d’una variable X~N(μ,σ) amb σ coneguda i X1,...,Xn una m.a.s. d’X
€
Construcció d’intervals de confiança
Es'mació de la mitjana en poblacions normals de variancia coneguda.
€
Construcció d’intervals de confiança
Es'mació de la mitjana en poblacions normals de variancia coneguda.
⎡ σ σ ⎤ és un interval de confiança
⎢ X − Zα , X + Zα ⎥ de nivell de confiança γ
⎣ 2
n 2
n⎦
per a µ
⎛ ⎞ α
φ ⎜ Zα ⎟ = 1 −
⎝ 2⎠ 2 €
€
€
€
Es'mació per intervals de confiança
€
€
Problemes per resoldre
Problemes per resoldre
> qnorm(0.975)
[1] 1.959964
€
Problemes per resoldre
Sol: b)
X compte el consum mitjà d' aigua diari per habitatge en m 3
X ~ N( µ,3) , X1,..., X n és una m. a. s. d' X, X n = 16
α
γ = 0.95 ⇒ α = 0.05 = 0.025 , Φ(z0.025 ) = 0.975 ⇒ z0.025 = 1.959964
2
⎡ σ σ ⎤ ⎡ 3 3 ⎤
llavors [a,b] = ⎢ X − Zα , X + Zα ⎥ = ⎢16 −1.959964⋅ , 16 +1.959964⋅ ⎥
⎣ 2
n 2
n⎦ ⎣ n n⎦
així : [a,b] = [15.26501, 16.73499] té longitud b − a = 16.73499 -15.26501 = 1.469973
⎛ 3 ⎞ ⎛ 3 ⎞ 3 1.469973
així volem ⎜16 +1.959964⋅ ⎟ − ⎜16 −1.959964⋅ ⎟ = 2⋅ 1.959964⋅ =
⎝ n⎠ ⎝ n⎠ n 2
n = 256
Problemes per resoldre
Problemes per resoldre
Sol: X compte el pes dels mascles d' una raça de gos en kg.
X ~ N( µ,1.5) , X1,..., X n és una m. a. s. d' X
α
γ = 0.99 ⇒ α = 0.01 = 0.005 , Φ(z0.005 ) = 0.995 ⇒ z0.005 = 2.575829
2
⎡ σ σ ⎤ ⎡ 1.5 1.5 ⎤
llavors [a,b] = ⎢ X − Zα , X + Zα ⎥ = ⎢ X n − 2.575829⋅ , X n + 2.575829⋅ ⎥⎦
⎣ 2
n 2
n ⎦ ⎣ n n
b−a σ 1.5
així : l'error màxim = = Zα = 2.575829⋅
2 2
n n
1.5
2.575829⋅ ≤ 0.5 ⇒ n ≥ 59.71406 així n = 60
n
> qnorm(0.995)
[1] 2.575829
€
Es'mació per intervals de confiança
On Γ( p) = ∫x p −1 −x
e dx és la funció gamma d’Euler.
0
€
2
Distribucions khi quadrat χ
2
• Caracterís'ques d’ χ
2 €
• E( χn )=n
2
• VAR( n )= 2n
χ
€
€
€ €
En R: > pchisq(19.02,9,lower.tail = FALSE) > qchisq(0.025,9,lower.tail = FALSE)
[1] 0.02502338 [1] 19.02277
Distribució t de Student
2
Siguin Y v.a. N(0,1), i Z v.a. n
χ
Llavors definim la v.a. t de Student amb n graus de llibertat a:
Y
€ t= n
Z
⎛ n +1⎞
Que té funció densitat Γ⎜ ⎟
1 ⎝ 2 ⎠ 1
Sn (x) = n +1
€ nπ ⎛n⎞
Γ⎜ ⎟ ⎛ x 2 ⎞ 2
⎝ 2 ⎠ ⎜1+ ⎟
⎝ n⎠
€
Distribució t de Student
• E(t)=0
ν
• VAR(t)= ν − 2
€
(només existeix si ν >2)
€
En R: > pt(2.262,9,lower.tail = FALSE) > qt(0.025,9,lower.tail = FALSE)
[1] 0.02500642 [1] 2.262157
Es'mació per intervals de confiança
€
Es'mació per intervals de confiança
⎡ Sˆ Sˆ ⎤
• Així, trobarem l’ IC : ⎢ X − t α , X +t α ⎥
⎣ n −1,
2
n n −1,
2
n⎦
• On
t n −1 és una v.a. t de Student amb
€ de llibertat
n −1 graus
α és el nivell de significació.
γ = 1 − α és el nivell de confiança
€
Exemple t de Student
Exemple t de Student
En el nostre cas:
α = 0.1
x = 37.33
Sˆ = 5.046
t 5,0.05 = 2.015
€ ⎡ Sˆ Sˆ ⎤ ⎡ 5.046 5.046 ⎤
⎢x − t α , x+t α ⎥ = ⎢37.33 − 2.015
⎣
, 37.33 + 2.015 ⎥⎦ = [ 33.18 , 41.49]
⎣ n −1,
2
n n −1,
2
n ⎦ 6 6
> qt(0.95,5)
€
[1] 2.015048
Es9mació de la variància d’una població normal
Sˆ 2 2
• S’u'litza l’estadís'c (n −1) 2 que té distribució χn −1
σ
⎡ ⎤
€ ⎢ (n −1) Sˆ 2 (n −1) Sˆ 2 ⎥
⎢ χ2 , 2 ⎥
χ
⎢⎣ €1−α2 α
2
⎥
⎦
Exemple: interval de confiança per a la variança
• Exemple
La resistència a la compressió de 15 provetes d’acer escollides
a l’atzar és:
X −µ Exemple
Z= → Ν(0,1) > pt(1.2,200)
S [1] 0.8842206
n > pnorm(1.2)
[1] 0.8849303
⎡ pˆ (1 − pˆ ) pˆ (1 − pˆ ) ⎤
⎢ pˆ − Zα , X + Zα ⎥
⎣ 2
n 2
n ⎦
€
Problemes per resoldre
Problemes per resoldre
Sol: b)
pˆ − p
pˆ = 0.017 i ~ N(0,1) ; γ = 0.99 ; α = 0.01 Φ(z0.005 ) = 0.995 ⇒ z0.005 = 2.575829
ˆp(1 − pˆ )
>qnorm(0.995)
1000 [1] 2.575829
⎡ pˆ (1 − pˆ ) pˆ (1 − pˆ ) ⎤
llavors : [a,b] = ⎢ pˆ − z0.005 ⋅ , pˆ + z0.005 ⋅ ⎥ = [ 0.006470244, 0.02752976]
⎣ 1000 1000 ⎦
és un int erval al 99% de confiança de p.
Problemes per resoldre
Sol: c)
⎡ pˆ (1 − pˆ ) pˆ (1 − pˆ ) ⎤
[a,b] = ⎢ p − z0.005 ⋅
ˆ ˆ
, p + z0.005 ⋅ ⎥ = [ 0.006470244, 0.02752976]
⎣ 1000 1000 ⎦
és un int erval al 99% de confiança de p.
Com que 0.02752976 > 0.02 no estem en condicions de complir les especificacions
del client amb aquest nivell de confiança.
Resum es9madors
·····> si n>30
si np>5 n(1-p)>5
·····> o també
si npq>5
n
1
Sˆ = ∑ (x i − x ) 2
n −1 i=1
€
Problemes per resoldre
Problemes per resoldre
Sol: b)
1.644854
≤ 0.02 ⇒ n ≥ 6763.859 agafem n = 6764
n
€
Problemes per resoldre
Sol:
X mesura el nivell d' afluència diari. X ~ N( µ,σ ), no coneixem σ
X −µ
Llavors : ~ t de Student amb 9 graus de llibertat,
S9
10
⎡ S S ⎤
llavors l' IC al 95% serà [a,b] = ⎢ X − t 9,0.975 * 9 , X + t 9,0.975 * 9 ⎥ on t 9,0.975 = 2.262157
⎣ 10 10 ⎦
682 + 553 + 555 + 666 + 657 + 649 + 522 + 568 + 700 + 558
on X = = 611
10
(682 - 611) 2 + (553 - 611) 2 + (555 - 611) 2 + (666 - 611) 2 + (657 - 611) 2 + (649 - 611) 2 + (522 - 611) 2 + (568 - 611) 2 + (700 - 611) 2 + (558 - 611) 2
i S9 = = 65.51166
9
⎡ 65.51166 65.51166 ⎤
així : [a,b] = ⎢611- 2.262157
⎣
, 611 + 2.262157 ⎥ = [564.1358, 657.8642]
10 10 ⎦
€
Problemes per resoldre
Problemes per resoldre
Sol: a)
X mesura la durada d' un tipus de bombeta en hores. amb µX = 1400 σ X = 140
n = 100 X100 = 1285
140
Com que n és prou gran n > 30 podem aplicar el TCL i acceptar que X100 ~ N(1400, )
100
€
Problemes per resoldre
Sol: b)
140
X100 ~ N(1285, )
100
α
γ = 0.95 ⇒ α = 0.05 = 0.025 , Φ(z0.025 ) = 0.975 ⇒ z0.025 = 1.959964
2
llavors [a,b] = [1285 − 1.959964 *14 , 1285 + 1.959964 *14 ] = [ 1257.561, 1312.439]
€
Problemes per resoldre
Sol: c)
1400 ∉ [ 1257.561, 1312.439] així que amb el nivell de confiança del 95%
podem dir que no són acceptables.
€
Problemes per resoldre
P8
Problemes per resoldre
Sol: a) X mesura el contingut de principi actiu per càpsula en mg. X ~ N( µ,σ ), no coneixem σ
X −µ
Llavors : ~ t de Student amb 9 graus de llibertat,
S9
10
> c2=c(4.82,4.62,4.75,4.92,4.66,5.01,
4.82 + 4.62 + 4.75 + 4.92 + 4.66 + 5.01 + 4.32 + 5.09 + 4.45 + 5.01
on X10 =
10
= 4.765 4.32,5.09,4.45,5.01)
10 > mean(c2)
∑ (x - 4.765)
i
2
[1] 4.765
i Sˆ 9 = i=1
= 0.254351 > sd(c2)
9
[1] 0.254351)
Problemes per resoldre
Sol: b) ⎡ S S ⎤
llavors l' IC al 95% serà [a,b] = ⎢ X − t 9,0.975 * 9 , X + t 9,0.975 * 9 ⎥ on t 9,0.975 = 2.262157
⎣ 10 10 ⎦
on X10 = 4.765 > qt(0.975,9)
i Sˆ = 0.254351
9
[1] 2.262157
⎡ 0.254351 0.254351 ⎤
així : [a,b] = ⎢4.765 - 2.262157
⎣
, 4.765 + 2.262157 ⎥ = [ 4.583048, 4.946952]
10 10 ⎦
€
Problemes per resoldre
Sol: c)
€
Problemes per resoldre
Problemes per resoldre
Sol: b)
€
Problemes per resoldre
€
Problemes per resoldre
Sol: b i c)
5 pˆ − p
pˆ = i ~ N(0,1) ; γ = 0.95 ; α = 0.025 Φ(z0.025 ) = 0.975 ⇒ z0.025 = 1.959964
6 pˆ (1 − pˆ )
150
⎡ pˆ (1 − pˆ ) pˆ (1 − pˆ ) ⎤
llavors : [a,b] = ⎢ pˆ − z0.025 ⋅ , pˆ + z0.025 ⋅ ⎥ = [0.7736935, 0.8929731]
⎣ 150 150 ⎦ > SE=sqrt(5/6*(1/6)/150)
és un int erval al 95% de confiança de p. > z=qnorm(0.975)
> SE=sqrt(5/6*(1/6)/150)
Podem acceptar que més del 75% valoren > E=z*SE
positivament, amb el 95% de confiança, perquè p > 77% > IC=5/6+c(-E,E)
> IC
[1] 0.7736935 0.8929731
€
Problemes per resoldre
Problemes per resoldre
€
Problemes per resoldre
Sol: b)
229.7 + 233.5
X= = 231.6 Hz
2
Sˆ
Com que E = 233.5 − 231.6 = 1.9 = t 4,0.025 * on t 4,0.025 = 2.776445
5
llavors Sˆ = 1.530205 Hz
€
Problemes per resoldre
Sol: c) α
X = 231.6 Hz Sˆ = 1.530205 γ = 99% α = 0.01 = 0.005 t 4,0.005 = 4.604095
2
⎡ Sˆ Sˆ ⎤
Com que [a,b] = ⎢ X − t 4,0.005 * , X + t 4,0.005 * ⎥ = [228.4493, 234.7507]
⎣ 5 5⎦
> SE=1.530205/sqrt(5)
> E=qt(0.995,4)*SE
> Xbarra=231.6
> IC=Xbarra+c(-E,E);IC
€
[1] 228.4493 234.7507
Problemes per resoldre
1. Obtener un intervalo de confianza para el valor medio con un nivel de significación del 5%. Cuál es el
error máximo come'do en la es'mación si damos como valor es'mado para la población el valor de la
media aritmé'ca obtenida en la muestra ? Cómo cambia el resultado si este nivel se aumenta al 10%?
2. Obtener un intervalo de confianza para es'mar tanto la varianza como la desviación •pica con un nivel
de significación del 5%.
Sol: 1)
X compte el nombre de píxels. X ~ N( µ,σ ) > c6=c(80,90,85,82,75,58,70,84,87,81,87,
61,73,84,85,70,78,95,77,52)
X = 77.7 ; Sˆ = 11.0506 ; α = 0.05 ; t19,0.975 = 2.093024 > Xbarra=mean(c6);Xbarra
⎡ Sˆ Sˆ ⎤ [1] 77.7
[a,b] = ⎢ X − t19,0.025 * , X + t19,0.025 * ⎥ = [ 72.52816, 82.87184 ] > sigma=sd(c6);sigma
⎣ 20 20 ⎦
[1] 11.0506
Si α = 0.1 ; t19,0.05 = 1.729133 > alpha=0.05 > alpha=0.1
⎡ Sˆ Sˆ ⎤ > t=qt(0.975,19);t > t=qt(0.95,19);t
[a,b] = ⎢ X − t19,0.05 * , X + t19,0.05 * ⎥ = [ 73.42733, 81.97267] [1] 2.093024 [1] 1.729133
⎣ 20 20 ⎦
> SE=sigma/sqrt(20) > SE=sigma/sqrt(20)
> t.test(c6,conf.level =0.95)$conf.in > t.test(c6,conf.level =0.90)$conf.in > E=t*SE > E=t*SE
[1] 72.52816 82.87184 [1] 73.42733 81.97267 > IC=Xbarra+c(-E,E) > IC=Xbarra+c(-E,E)
€ a‚r(,"conf.level") a‚r(,"conf.level") > IC > IC
[1] 0.95 [1] 0.9 [1] 72.52816 82.87184 [1] 73.42733 81.97267
Problemes per resoldre
El área de un 'po de célula sanguínea (neutrófilo), medida en número de píxeles a par'r de imágenes
digitales obtenidas mediante un microscopio es una variable aleatoria que sigue una distribución normal. Se
realiza un muestreo aleatorio con 20 imágenes y se ob'enen los siguientes valores: 80, 90, 85, 82, 75, 58, 70,
84, 87, 81, 87, 61, 73, 84, 85, 70, 78, 95, 77, 52. A par'r de estos datos queremos es'mar la media, la
varianza y la desviación •pica de esta variable en la población de todos los neutrófilos que circulan por la
sangre. Nos hacemos las siguientes preguntas:
1. Obtener un intervalo de confianza para el valor medio con un nivel de significación del 5%. Cuál es el
error máximo come'do en la es'mación si damos como valor es'mado para la población el valor de la
media aritmé'ca obtenida en la muestra ? Cómo cambia el resultado si este nivel se aumenta al 10%?
2. Obtener un intervalo de confianza para es'mar tanto la varianza como la desviación •pica con un nivel
de significación del 5%.
⎡ ⎤
⎢ (n −1) ˆ 2 (n −1) Sˆ 2 ⎥ ⎡19 *122.1158 19 *122.1158 ⎤
S
IC per a σ 2 ⎢ , = , = [ 70.62513, 260.50589]
χ2 α χα2 ⎥ ⎢⎣ 32.85233 8.906516 ⎥⎦
⎢⎣ 1− ⎥⎦
2 2