You are on page 1of 67

Estadís'ca

T7.2. Es'mació per intervals de confiança

Sergi Peire
Departament de Matemà'ques
Escola d’Enginyeria de Barcelona Est
Universitat Politècnica de Catalunya
Febrer-maig 2020

Es'mació de la mitjana en poblacions normals de variància coneguda.

Es'mació de la mitjana en variables de distribució desconeguda, amb variància


coneguda.

Es'mació de la mitjana en variables de distribució normal, amb variància desconeguda.

Es'mació de la variància en poblacions normals.

Es'mació de la proporció .
Es'mació per intervals de confiança

• Com hem vist, l’es'mació puntual proporciona la millor


aproximació possible al valor veritable dels paràmetres que es
desitgen es'mar i que en realitat són desconeguts.
• Ara bé, mai no sabrem quant a prop del veritable valor
poblacional ens trobarem.
• El que podrem dir doncs, és que θˆ = θ ± ε
• El que farem ara és determinar un interval en el qual es pugui
trobar el veritable valor de θ amb una certa probabilitat.


Es'mació per intervals de confiança

Sigui Χ1,...,Χn una m.a.s de X, on X té una llei que depén d’un paràmetre θ
desconegut.

Siguin A(Χ1,...,Χn) i B(Χ1,...,Χn) dos estadís'cs.


Suposem que P(A(x1,..., x n ) ≤ θ ≤ B(x1,..., x n )) = γ
on γ ∈ (0,1)

Si a=A(Χ1,...,Χn) i b=B(Χ1,...,Χn) són els valors observats



€ llavors diem que [a,b] és un interval de confiança per a θ
amb nivell de confiança γ
Construcció d’intervals de confiança

Es'mació de la mitjana en poblacions normals de variancia coneguda.

Es disposa d’una variable X~N(μ,σ) amb σ coneguda i X1,...,Xn una m.a.s. d’X

Llavors sabem que X −µ


Z= → Ν(0,1)
σ
n

Si trobem z de manera que P(−z < Z < z) = γ



Llavors 'ndrem que ⎛ ⎞
€ ⎜ X −µ ⎟ ⎛ σ σ ⎞
P⎜ −z < < z ⎟ = P⎜ X − z <µ< X +z ⎟=γ
⎜ σ ⎟ ⎝ n n ⎠
⎝ n ⎠


Construcció d’intervals de confiança
Es'mació de la mitjana en poblacions normals de variancia coneguda.

• Per tant: si tenim una X variable normal de paràmetres


µ i σ on σ és coneguda
⎡ σ σ ⎤
i X1,...Xn una m.a.s llavors: ⎢ X − Zα , X + Zα ⎥
⎣ 2
n 2
n⎦

és un interval de confiança de nivell γ per a μ
⎛ ⎞ α €
on φ⎜ Zα ⎟ = 1 − ; α=1-γ s’anomena nivell de significació.
⎝ 2⎠ 2


Construcció d’intervals de confiança
Es'mació de la mitjana en poblacions normals de variancia coneguda.

⎡ σ σ ⎤ és un interval de confiança
⎢ X − Zα , X + Zα ⎥ de nivell de confiança γ
⎣ 2
n 2
n⎦
per a µ
⎛ ⎞ α
φ ⎜ Zα ⎟ = 1 −
⎝ 2⎠ 2 €


Es'mació per intervals de confiança

Parlem de nivell de confiança en el sen't que


A la llarga el γ % dels IC con'ndrien el valor
que volem es'mar.

A la gràfica el valor que volem es'mar és la


mitjana d’una població normal.
€cada línia representa un IC per a
una mostra en par'cular amb la seva pròpia
mitjana mostral.
Si per exemple γ = 0.95 llavors el 95%
Dels IC con'ndrien µ



Problemes per resoldre
Problemes per resoldre

Sol: a) X compte el consum mitjà d' aigua diari per habitatge en m 3


X ~ N( µ,3) , X1,..., X 64 és una m. a. s. d' X, X 64 = 16
α
γ = 0.95 ⇒ α = 0.05 = 0.025 , Φ(z0.025 ) = 0.975 ⇒ z0.025 = 1.959964
2
⎡ σ σ ⎤ ⎡ 3 3 ⎤
llavors [a,b] = ⎢ X − Zα , X + Zα ⎥ = ⎢16 −1.959964⋅ , 16 +1.959964⋅ ⎥
⎣ 2
n 2
n⎦ ⎣ 64 64 ⎦
així : [15.26501, 16.73499] és l'int erval de confiança al 95% de µ

> qnorm(0.975)
[1] 1.959964

Problemes per resoldre

Sol: b)
X compte el consum mitjà d' aigua diari per habitatge en m 3
X ~ N( µ,3) , X1,..., X n és una m. a. s. d' X, X n = 16
α
γ = 0.95 ⇒ α = 0.05 = 0.025 , Φ(z0.025 ) = 0.975 ⇒ z0.025 = 1.959964
2
⎡ σ σ ⎤ ⎡ 3 3 ⎤
llavors [a,b] = ⎢ X − Zα , X + Zα ⎥ = ⎢16 −1.959964⋅ , 16 +1.959964⋅ ⎥
⎣ 2
n 2
n⎦ ⎣ n n⎦
així : [a,b] = [15.26501, 16.73499] té longitud b − a = 16.73499 -15.26501 = 1.469973
⎛ 3 ⎞ ⎛ 3 ⎞ 3 1.469973
així volem ⎜16 +1.959964⋅ ⎟ − ⎜16 −1.959964⋅ ⎟ = 2⋅ 1.959964⋅ =
⎝ n⎠ ⎝ n⎠ n 2
n = 256
Problemes per resoldre
Problemes per resoldre

Sol: X compte el pes dels mascles d' una raça de gos en kg.
X ~ N( µ,1.5) , X1,..., X n és una m. a. s. d' X
α
γ = 0.99 ⇒ α = 0.01 = 0.005 , Φ(z0.005 ) = 0.995 ⇒ z0.005 = 2.575829
2
⎡ σ σ ⎤ ⎡ 1.5 1.5 ⎤
llavors [a,b] = ⎢ X − Zα , X + Zα ⎥ = ⎢ X n − 2.575829⋅ , X n + 2.575829⋅ ⎥⎦
⎣ 2
n 2
n ⎦ ⎣ n n
b−a σ 1.5
així : l'error màxim = = Zα = 2.575829⋅
2 2
n n
1.5
2.575829⋅ ≤ 0.5 ⇒ n ≥ 59.71406 així n = 60
n
> qnorm(0.995)
[1] 2.575829

Es'mació per intervals de confiança

Es'mació de la mitjana en variables de distribució desconeguda, amb variancia coneguda.

Sigui X1,...,Xn una m.a.s de X, on X té una llei de distribució


desconeguda, suposem que n és gran, a la pràc'ca suposarem
n>30.
X −µ
Llavors segons el TCL podem aproximar Z =
σ
→ Ν(0,1)
n
Trobarem l’interval de confiança de la mateixa manera que fem
quan sabem que la distribució és normal.

2
Distribucions khi quadrat χ

Donades X1,...,Xn v.a. independents amb Xi=N(0,1) i=1...n



Anomenem variable aleatòria khi quadrat amb n graus de llibertat
a 2 2 2
χn = X1 + ...+ X n
Tant la funció de distribució com la de densitat només pot prendre
valors posi'us d’x. Així per x>0 la funció densitat d’χ2 és
n x
1 −1 −
kn (x) = x 2
e 2
€ 2
n
2
⎛ n⎞
Γ⎜ ⎟
⎝ 2⎠

On Γ( p) = ∫x p −1 −x
e dx és la funció gamma d’Euler.
0

2
Distribucions khi quadrat χ

2
• Caracterís'ques d’ χ
2 €
• E( χn )=n
2
• VAR( n )= 2n
χ


€ €
En R: > pchisq(19.02,9,lower.tail = FALSE) > qchisq(0.025,9,lower.tail = FALSE)
[1] 0.02502338 [1] 19.02277
Distribució t de Student

2
Siguin Y v.a. N(0,1), i Z v.a. n
χ
Llavors definim la v.a. t de Student amb n graus de llibertat a:
Y
€ t= n
Z
⎛ n +1⎞
Que té funció densitat Γ⎜ ⎟
1 ⎝ 2 ⎠ 1
Sn (x) = n +1
€ nπ ⎛n⎞
Γ⎜ ⎟ ⎛ x 2 ⎞ 2
⎝ 2 ⎠ ⎜1+ ⎟
⎝ n⎠


Distribució t de Student

• Caracterís'ques de t amb ν graus de llibertat

• E(t)=0
ν
• VAR(t)= ν − 2

(només existeix si ν >2)


En R: > pt(2.262,9,lower.tail = FALSE) > qt(0.025,9,lower.tail = FALSE)
[1] 0.02500642 [1] 2.262157
Es'mació per intervals de confiança

Es'mació de la mitjana en variables de distribució normal, amb variancia desconeguda.

• Sigui X1,...,Xn una m.a.s de X, on X té una llei de


distribució normal

Llavors, en virtut del Teorema de Fisher (veure pag. 239 llibre


d’estadís'ca de’n Francesc Pozo)
X −µ
L’estadís'c: T = → t n −1 és una v.a. t de Student amb
S
n-1 graus de llibertat
n
n
2
∑( X i − X)
On€ S = i=1
n −1


Es'mació per intervals de confiança

Es'mació de la mitjana en variables de distribució normal, amb variancia desconeguda.

⎡ Sˆ Sˆ ⎤
• Així, trobarem l’ IC : ⎢ X − t α , X +t α ⎥
⎣ n −1,
2
n n −1,
2
n⎦

• On
t n −1 és una v.a. t de Student amb
€ de llibertat
n −1 graus
α és el nivell de significació.
γ = 1 − α és el nivell de confiança


Exemple t de Student
Exemple t de Student

En el nostre cas:

α = 0.1
x = 37.33
Sˆ = 5.046
t 5,0.05 = 2.015

€ ⎡ Sˆ Sˆ ⎤ ⎡ 5.046 5.046 ⎤
⎢x − t α , x+t α ⎥ = ⎢37.33 − 2.015

, 37.33 + 2.015 ⎥⎦ = [ 33.18 , 41.49]
⎣ n −1,
2
n n −1,
2
n ⎦ 6 6

> qt(0.95,5)

[1] 2.015048
Es9mació de la variància d’una població normal

Sˆ 2 2
• S’u'litza l’estadís'c (n −1) 2 que té distribució χn −1
σ

Donat un nivell de confiança γ = 1 − α cal trobar a


2 2 2
χ i χ
les taules de€la χn −1 els valors α
2
1−€
α
2

tals que F( χα2 ) = α i F(χ2 α ) = 1 − α


2
2 € 1− 2 2
€ €
Llavors l’IC per a σ serà:
2

⎡ ⎤
€ ⎢ (n −1) Sˆ 2 (n −1) Sˆ 2 ⎥
⎢ χ2 , 2 ⎥
χ
⎢⎣ €1−α2 α
2


Exemple: interval de confiança per a la variança

• Exemple
La resistència a la compressió de 15 provetes d’acer escollides
a l’atzar és:

Volem trobar l’IC al 99% de confiança per a la variància.


X = 45.75 > c1=c(40.15,65.10,49.5,22.4,38.2,60.4,43.4
,26.35,31.2,55.6,47.25,73.2,35.9,45.25,52.4)
15 > mean(c1)
ˆS 2 = 1 ∑ ( x − x ) 2 = 201.6 [1] 45.75333
> var(c1)
14 i=1 i [1] 201.7534
> qchisq(0.995,14) > 14*var(c1)/qchisq(0.995,14)
[1] 31.31935 [1] 90.18538
> qchisq(0.005,14) > 14*var(c1)/qchisq(0.005,14)
[1] 4.074675 [1] 693.1957
Es'mació per intervals de confiança

Es'mació de la mitjana en variables de distribució desconeguda, amb variancia desconeguda.

Sigui X1,...,Xn una m.a.s de X, on X té una llei de distribució


desconeguda, suposem que n és gran, a la pràc'ca suposarem
n>100.
Per a valors grans d’n la distribució t de Student s’aproxima molt a
una normal N(0,1), així a la pràc'ca podem resoldre els
problemes amb la distribució normal.

X −µ Exemple
Z= → Ν(0,1) > pt(1.2,200)
S [1] 0.8842206
n > pnorm(1.2)
[1] 0.8849303

Trobarem l’interval de confiança de la mateixa manera.



Es9mació de la proporció d’una població.

⎡ pˆ (1 − pˆ ) pˆ (1 − pˆ ) ⎤
⎢ pˆ − Zα , X + Zα ⎥
⎣ 2
n 2
n ⎦


Problemes per resoldre
Problemes per resoldre

Sol: a) X compte el nombre de fusibles elèctrics defectuosos. X ~ B(n, p)


Com que n = 1000 np = 17 > 5 i n(1 − p) = 983 > 5
(
podem fer servir el TCL per aproximar X ~ N 1000 pˆ , 1000 pˆ (1 − pˆ ) )
X ⎛ pˆ (1 − pˆ ) ⎞
i equivalentment ~ N ⎜ pˆ , ⎟
1000 ⎝ 1000 ⎠
pˆ − p
així : pˆ = 0.017 i ~ N(0,1)
pˆ (1 − pˆ )
1000
Problemes per resoldre

Sol: b)
pˆ − p
pˆ = 0.017 i ~ N(0,1) ; γ = 0.99 ; α = 0.01 Φ(z0.005 ) = 0.995 ⇒ z0.005 = 2.575829
ˆp(1 − pˆ )
>qnorm(0.995)
1000 [1] 2.575829
⎡ pˆ (1 − pˆ ) pˆ (1 − pˆ ) ⎤
llavors : [a,b] = ⎢ pˆ − z0.005 ⋅ , pˆ + z0.005 ⋅ ⎥ = [ 0.006470244, 0.02752976]
⎣ 1000 1000 ⎦
és un int erval al 99% de confiança de p.
Problemes per resoldre

Sol: c)
⎡ pˆ (1 − pˆ ) pˆ (1 − pˆ ) ⎤
[a,b] = ⎢ p − z0.005 ⋅
ˆ ˆ
, p + z0.005 ⋅ ⎥ = [ 0.006470244, 0.02752976]
⎣ 1000 1000 ⎦
és un int erval al 99% de confiança de p.
Com que 0.02752976 > 0.02 no estem en condicions de complir les especificacions
del client amb aquest nivell de confiança.
Resum es9madors

·····> si n>30
si np>5 n(1-p)>5
·····> o també
si npq>5

n
1
Sˆ = ∑ (x i − x ) 2
n −1 i=1


Problemes per resoldre
Problemes per resoldre

Sol: a) X ~ N( µ,σ ) , X1,..., X 9 és una m. a. s. d' X


α
γ = 0.95 ⇒ α = 0.05 = 0.025 , Φ(z0.025 ) = 0.975 ⇒ z0.025 = 1.959964
2
⎡ σ σ ⎤
llavors [a,b] = (118.25,123.55) = ⎢ X −1.959964 , X +1.959964 ⎥
⎣ 9 9⎦
118.25 +123.55
així X = = 120.9
2
Problemes per resoldre

Sol: b) X ~ N( µ,σ ) , X1,..., X 9 és una m. a. s. d' X


α
γ = 0.95 ⇒ α = 0.05 = 0.025 , Φ(z0.025 ) = 0.975 ⇒ z0.025 = 1.959964
2
⎡ σ σ ⎤
llavors [a,b] = (118.25,123.55) = ⎢ X −1.959964 , X +1.959964 ⎥
⎣ 9 9⎦
123.55 −118.25
així σ = 9 = 4.056197
2⋅ 1.959964
Problemes per resoldre

Sol: c) µ = 120.9 σ = 4.056 n = 9


α
γ = 0.97 ⇒ α = 0.03 = 0.015 , Φ(z0.015 ) = 0.985 ⇒ z0.015 = 2.17009
2
⎡ 4.056 4.056 ⎤
llavors [a,b] = ⎢120.9 − 2.17009 , 120.9 + 2.17009 ⎥ = ( 117.966, 123.834)
⎣ 9 9 ⎦
>qnorm(0.985)
[1] 2.17009

Problemes per resoldre

Sol: d) µ = 120.9 σ = 4.056 n = ?


α
γ = 0.97 ⇒ α = 0.03 = 0.015 , Φ(z0.015 ) = 0.985 ⇒ z0.015 = 2.17009
2
⎡ 4.056 4.056 ⎤
llavors [a,b] = ⎢120.9 − 2.17009 , 120.9 + 2.17009 ⎥
⎣ n n ⎦
4.056
b - a = 2⋅ 2.17009 = 123.55 −118.25 ⇒ n = 11.03189, agafem n = 12
n
Problemes per resoldre
Problemes per resoldre

X ~ B(a) Com que na(1 − a) = 18 > 5


Sol: a) ⎛
X a(1 − a) ⎞
podem fer servir el TCL per aproximar ~ N ⎜ a, ⎟
n ⎝ n ⎠
α
si γ = 90% ⇒ α = 0.1 = 0.05 Φ(z0.05 ) = 0.95 ⇒ z0.05 = 1.644854
2
a(1 − a)
longitud de l'int erval para un n donat és una funció de a : f (a) = 2 *1.644854 *
n
aquesta funció tindrà un màxim quan f '(a) = 0
aquest màxim coincidirà pel mateix valor que g(x) = a(1 − a)
1
així : g'(a) = 0 ⇒ 2a −1 = 0 ⇒ a =
2
⎛ 1 ⎞ 1.644854
longitud màxima serà f ⎜ ⎟ =
⎝ 2⎠ n
Problemes per resoldre

Sol: b)
1.644854
≤ 0.02 ⇒ n ≥ 6763.859 agafem n = 6764
n


Problemes per resoldre

Sol:
X mesura el nivell d' afluència diari. X ~ N( µ,σ ), no coneixem σ
X −µ
Llavors : ~ t de Student amb 9 graus de llibertat,
S9
10
⎡ S S ⎤
llavors l' IC al 95% serà [a,b] = ⎢ X − t 9,0.975 * 9 , X + t 9,0.975 * 9 ⎥ on t 9,0.975 = 2.262157
⎣ 10 10 ⎦
682 + 553 + 555 + 666 + 657 + 649 + 522 + 568 + 700 + 558
on X = = 611
10
(682 - 611) 2 + (553 - 611) 2 + (555 - 611) 2 + (666 - 611) 2 + (657 - 611) 2 + (649 - 611) 2 + (522 - 611) 2 + (568 - 611) 2 + (700 - 611) 2 + (558 - 611) 2
i S9 = = 65.51166
9
⎡ 65.51166 65.51166 ⎤
així : [a,b] = ⎢611- 2.262157

, 611 + 2.262157 ⎥ = [564.1358, 657.8642]
10 10 ⎦


Problemes per resoldre
Problemes per resoldre

Sol: a)
X mesura la durada d' un tipus de bombeta en hores. amb µX = 1400 σ X = 140
n = 100 X100 = 1285
140
Com que n és prou gran n > 30 podem aplicar el TCL i acceptar que X100 ~ N(1400, )
100


Problemes per resoldre

Sol: b)

140
X100 ~ N(1285, )
100
α
γ = 0.95 ⇒ α = 0.05 = 0.025 , Φ(z0.025 ) = 0.975 ⇒ z0.025 = 1.959964
2
llavors [a,b] = [1285 − 1.959964 *14 , 1285 + 1.959964 *14 ] = [ 1257.561, 1312.439]


Problemes per resoldre

Sol: c)

1400 ∉ [ 1257.561, 1312.439] així que amb el nivell de confiança del 95%
podem dir que no són acceptables.


Problemes per resoldre

P8
Problemes per resoldre

Sol: a) X mesura el contingut de principi actiu per càpsula en mg. X ~ N( µ,σ ), no coneixem σ
X −µ
Llavors : ~ t de Student amb 9 graus de llibertat,
S9
10
> c2=c(4.82,4.62,4.75,4.92,4.66,5.01,
4.82 + 4.62 + 4.75 + 4.92 + 4.66 + 5.01 + 4.32 + 5.09 + 4.45 + 5.01
on X10 =
10
= 4.765 4.32,5.09,4.45,5.01)
10 > mean(c2)
∑ (x - 4.765)
i
2
[1] 4.765
i Sˆ 9 = i=1
= 0.254351 > sd(c2)
9
[1] 0.254351)
Problemes per resoldre

Sol: b) ⎡ S S ⎤
llavors l' IC al 95% serà [a,b] = ⎢ X − t 9,0.975 * 9 , X + t 9,0.975 * 9 ⎥ on t 9,0.975 = 2.262157
⎣ 10 10 ⎦
on X10 = 4.765 > qt(0.975,9)
i Sˆ = 0.254351
9
[1] 2.262157
⎡ 0.254351 0.254351 ⎤
així : [a,b] = ⎢4.765 - 2.262157

, 4.765 + 2.262157 ⎥ = [ 4.583048, 4.946952]
10 10 ⎦


Problemes per resoldre

Sol: c)

5 ∉ [ 4.583048, 4.946952] així , amb aquest nivell de confiança no podem mantenir


que el contingut mig de principi actiu és de 5mg.


Problemes per resoldre
Problemes per resoldre

X compte el nombre d' unitats processades per hora. X ~ N(13.5,σ) σ desconeguda.


Sol: a)
X 8 = 18.5 Sˆ 7 = 1.772811 t 7,0.025 = 2.364624
µX ∈[a,b] = [ 17.01789, 19.98211] ⇒ µX ≥16.5 si s'implementarà.

> c3=c(16,19,20,20,18,21,17,17) > xbarra=mean(c3)


> mean(c3) > sigma=sd(c3)
[1]
€18.5 > xbarra-qt(0.975,7)*sigma/sqrt(8)
> sd(c3) [1] 17.01789
[1] 1.772811 > xbarra+qt(0.975,7)*sigma/sqrt(8)
> qt(0.975,7) [1] 19.98211
[1] 2.364624 > t.test(c3,conf.level = 0.95)
Problemes per resoldre

Sol: b)

µX ∈ [17.17436, 19.82564 ] ⇒ µX ≥17.17436 ≥16.5 = 13.5 + 3 s'implementarà el nou sistema.


Problemes per resoldre

X compte el nombre d' unitats processades per hora. X ~ N(13.5,σ) σ desconeguda.


Sol: c) X 8 = 18.5 Sˆ 7 = 1.772811 t 7,0.005 = 3.499483
µX ∈[a,b] = [ 16.30658, 20.69342] ⇒ no podem assegurar que µX ≥16.5 no s'implementarà.

> t.test(c3,conf.level = 0.99)


One Sample t-test
> c3=c(16,19,20,20,18,21,17,17) > xbarra=mean(c3) data: c3
> mean(c3) > sigma=sd(c3) t = 29.516, df = 7, p-value = 1.32e-08
€ alterna've hypothesis: true mean is not equal
[1] 18.5 > xbarra-qt(0.995,7)*sigma/sqrt(8)
to 0
> sd(c3) [1] 16.30658 99 percent confidence interval:
[1] 1.772811 > xbarra+qt(0.995,7)*sigma/sqrt(8) 16.30658 20.69342
> qt(0.995,7) [1] 20.69342 sample es'mates:
mean of x
[1] 3.499483 18.5
Problemes per resoldre
Problemes per resoldre

Sol: a i b) X compte el temps der fabricació en min.


X1,..., X10 és una m. a. s. ; amb γ = 95% ; IC = (120.5,144.3) per µX
a) llavors podem afirmar que µX ≤ 145
b) la seguretat és del 95%


Problemes per resoldre

X compte el temps der fabricació en min.


Sol: c i d)
X1,..., X10 és una m. a. s. ; amb γ = 95% ; IC = (120.5,144.3) per µX
120.5 +144.3
X10 = = 132.4 t 9,0.25 = 1.833113
2
Sˆ 144.3 −120.5 Sˆ 11.9
t 9,0.25 * = = 11.9 ⇒ = = 5.260466
10 2 10 t 9,0.25
Llavors : per a γ = 99% t 9,0.005 = 3.249836
⎡ Sˆ Sˆ ⎤
[a,b] = ⎢ X10 − t 9,0.995 * , X10 + t 9,0.995 * ⎥ = [ 115.3044, 149.4956]
⎣ 10 10 ⎦
No podem assegurar que µX < 145 al 99%.
Problemes per resoldre
Problemes per resoldre

Sol: a) X compte el nombre d' avaluacions positives. X ~ B(n, p)


125 5
Com que n = 150 p = = ⇒ np = 125 > 5 i n(1 − p) = 25 > 5
150 6
(
podem fer servir el TCL per aproximar X ~ N 150 pˆ , 150 pˆ (1 − pˆ ) )
X ⎛ pˆ (1 − pˆ ) ⎞
i equivalentment ˆ
~ N ⎜ p, ⎟
150 ⎝ 150 ⎠
5 pˆ − p
així : pˆ = i ~ N(0,1)
6 pˆ (1 − pˆ )
150
Problemes per resoldre

Sol: b i c)
5 pˆ − p
pˆ = i ~ N(0,1) ; γ = 0.95 ; α = 0.025 Φ(z0.025 ) = 0.975 ⇒ z0.025 = 1.959964
6 pˆ (1 − pˆ )
150
⎡ pˆ (1 − pˆ ) pˆ (1 − pˆ ) ⎤
llavors : [a,b] = ⎢ pˆ − z0.025 ⋅ , pˆ + z0.025 ⋅ ⎥ = [0.7736935, 0.8929731]
⎣ 150 150 ⎦ > SE=sqrt(5/6*(1/6)/150)
és un int erval al 95% de confiança de p. > z=qnorm(0.975)
> SE=sqrt(5/6*(1/6)/150)
Podem acceptar que més del 75% valoren > E=z*SE
positivament, amb el 95% de confiança, perquè p > 77% > IC=5/6+c(-E,E)
> IC
[1] 0.7736935 0.8929731


Problemes per resoldre
Problemes per resoldre

Sol: a) No, no podem afirmar que P( µX ∈ (229.7,233.5)) = 0.95


µX és un nombre real, si µX ∈ (229.7,233.5) llavors P( µX ∈ (229.7,233.5)) = 1
si µX ∉ (229.7,233.5) llavors P( µX ∈ (229.7,233.5)) = 0
0.95 és el nivell de confiança, vol dir que µX ∈ IC en el 95% de les mostres.


Problemes per resoldre

Sol: b)
229.7 + 233.5
X= = 231.6 Hz
2

Com que E = 233.5 − 231.6 = 1.9 = t 4,0.025 * on t 4,0.025 = 2.776445
5
llavors Sˆ = 1.530205 Hz


Problemes per resoldre

Sol: c) α
X = 231.6 Hz Sˆ = 1.530205 γ = 99% α = 0.01 = 0.005 t 4,0.005 = 4.604095
2
⎡ Sˆ Sˆ ⎤
Com que [a,b] = ⎢ X − t 4,0.005 * , X + t 4,0.005 * ⎥ = [228.4493, 234.7507]
⎣ 5 5⎦
> SE=1.530205/sqrt(5)
> E=qt(0.995,4)*SE
> Xbarra=231.6
> IC=Xbarra+c(-E,E);IC

[1] 228.4493 234.7507
Problemes per resoldre

El área de un 'po de célula sanguínea (neutrófilo), medida en número de píxeles


a par'r de imágenes digitales obtenidas mediante un microscopio es una
variable aleatoria que sigue una distribución normal. Se realiza un muestreo
aleatorio con 20 imágenes y se ob'enen los siguientes valores: 80, 90, 85, 82,
75, 58, 70, 84, 87, 81, 87, 61, 73, 84, 85, 70, 78, 95, 77, 52. A par'r de estos
datos queremos es'mar la media, la varianza y la desviación •pica de esta
variable en la población de todos los neutrófilos que circulan por la sangre. Nos
hacemos las siguientes preguntas:

1. Obtener un intervalo de confianza para el valor medio con un nivel de


significación del 5%. Cuál es el error máximo come'do en la es'mación si
damos como valor es'mado para la población el valor de la media aritmé'ca
obtenida en la muestra ? Cómo cambia el resultado si este nivel se aumenta
al 10%?
2. Obtener un intervalo de confianza para es'mar tanto la varianza como la
desviación •pica con un nivel de significación del 5%.
Problemes per resoldre
El área de un 'po de célula sanguínea (neutrófilo), medida en número de píxeles a par'r de imágenes
digitales obtenidas mediante un microscopio es una variable aleatoria que sigue una distribución normal. Se
realiza un muestreo aleatorio con 20 imágenes y se ob'enen los siguientes valores: 80, 90, 85, 82, 75, 58, 70,
84, 87, 81, 87, 61, 73, 84, 85, 70, 78, 95, 77, 52. A par'r de estos datos queremos es'mar la media, la
varianza y la desviación •pica de esta variable en la población de todos los neutrófilos que circulan por la
sangre. Nos hacemos las siguientes preguntas:

1. Obtener un intervalo de confianza para el valor medio con un nivel de significación del 5%. Cuál es el
error máximo come'do en la es'mación si damos como valor es'mado para la población el valor de la
media aritmé'ca obtenida en la muestra ? Cómo cambia el resultado si este nivel se aumenta al 10%?
2. Obtener un intervalo de confianza para es'mar tanto la varianza como la desviación •pica con un nivel
de significación del 5%.

Sol: 1)
X compte el nombre de píxels. X ~ N( µ,σ ) > c6=c(80,90,85,82,75,58,70,84,87,81,87,
61,73,84,85,70,78,95,77,52)
X = 77.7 ; Sˆ = 11.0506 ; α = 0.05 ; t19,0.975 = 2.093024 > Xbarra=mean(c6);Xbarra
⎡ Sˆ Sˆ ⎤ [1] 77.7
[a,b] = ⎢ X − t19,0.025 * , X + t19,0.025 * ⎥ = [ 72.52816, 82.87184 ] > sigma=sd(c6);sigma
⎣ 20 20 ⎦
[1] 11.0506
Si α = 0.1 ; t19,0.05 = 1.729133 > alpha=0.05 > alpha=0.1
⎡ Sˆ Sˆ ⎤ > t=qt(0.975,19);t > t=qt(0.95,19);t
[a,b] = ⎢ X − t19,0.05 * , X + t19,0.05 * ⎥ = [ 73.42733, 81.97267] [1] 2.093024 [1] 1.729133
⎣ 20 20 ⎦
> SE=sigma/sqrt(20) > SE=sigma/sqrt(20)
> t.test(c6,conf.level =0.95)$conf.in > t.test(c6,conf.level =0.90)$conf.in > E=t*SE > E=t*SE
[1] 72.52816 82.87184 [1] 73.42733 81.97267 > IC=Xbarra+c(-E,E) > IC=Xbarra+c(-E,E)
€ a‚r(,"conf.level") a‚r(,"conf.level") > IC > IC
[1] 0.95 [1] 0.9 [1] 72.52816 82.87184 [1] 73.42733 81.97267
Problemes per resoldre
El área de un 'po de célula sanguínea (neutrófilo), medida en número de píxeles a par'r de imágenes
digitales obtenidas mediante un microscopio es una variable aleatoria que sigue una distribución normal. Se
realiza un muestreo aleatorio con 20 imágenes y se ob'enen los siguientes valores: 80, 90, 85, 82, 75, 58, 70,
84, 87, 81, 87, 61, 73, 84, 85, 70, 78, 95, 77, 52. A par'r de estos datos queremos es'mar la media, la
varianza y la desviación •pica de esta variable en la población de todos los neutrófilos que circulan por la
sangre. Nos hacemos las siguientes preguntas:

1. Obtener un intervalo de confianza para el valor medio con un nivel de significación del 5%. Cuál es el
error máximo come'do en la es'mación si damos como valor es'mado para la población el valor de la
media aritmé'ca obtenida en la muestra ? Cómo cambia el resultado si este nivel se aumenta al 10%?
2. Obtener un intervalo de confianza para es'mar tanto la varianza como la desviación •pica con un nivel
de significación del 5%.

X = 77.7 ; Sˆ 2 = 122.1158 ; n = 20 ; α = 0.05; χ 2 α = 8.906516 ; χ 2


Sol: 2) 19,
2
19,1−
α
2
= 32.85233

⎡ ⎤
⎢ (n −1) ˆ 2 (n −1) Sˆ 2 ⎥ ⎡19 *122.1158 19 *122.1158 ⎤
S
IC per a σ 2 ⎢ , = , = [ 70.62513, 260.50589]
χ2 α χα2 ⎥ ⎢⎣ 32.85233 8.906516 ⎥⎦
⎢⎣ 1− ⎥⎦
2 2

IC per a σ [8.403876, 16.140195]


> sigmasq=var(c6);sigmasq > IC=c(19*sigmasq/qchisq(0.975,19),19*sigmasq/qchisq(0.025,19));IC
[1] 122.1158 [1] 70.62513 260.50589
€> alpha=0.05 > sqrt(IC)
> qchisq(0.025,19) [1] 8.403876 16.140195
[1] 8.906516
> qchisq(0.975,19)
[1] 32.85233

You might also like