Professional Documents
Culture Documents
Sergi Peire
Departament de Matemà'ques
Escola d’Enginyeria de Barcelona Est
Universitat Politècnica de Catalunya
Febrer-Maig 2020
Tipus de contrast: bilateral, unilateral Regió d’acceptació, regió crí'ca o de rebuig. P-valor
€ €
Contrast d’hipòtesis
Resultat de la prova
Realitat
Acceptem H0 Acceptem H1
H0 certa No error (1 − α ) Fals posi'u (α )
(Error 'pus 1)
H1 certa Fals nega'u No error= Potència
( β)
(Error 'pus 2) (€φ = 1 − β)
€
Nivell de significació: (α ) és la probabilitat màxima de cometre un error de
'pus 1, és a dir , de rebutjar H0 i per tant acceptar H1 quan en realitat H0 és certa.
€ €
Potència: (φ ) de la prova d’hipòtesis és (φ = 1 − β) on (β) és la probabilitat màxima de
€
cometre un error de 'pus 2
€ € €
Contrast d’hipòtesis
Errors: nivell de significació i potència.
⎧H 0 : θ = θ 0
a) Contrast bilateral ⎨
⎩ H1 : θ ≠ θ 0
⎧H 0 : θ ≤ θ 0
b) Contrast unilateral superior ⎨
€ ⎩ H1 : θ > θ 0
( )
Considerem una variable X →Ν µ,σ on μ és el paràmetre sobre el qual
farem el contrast, amb σ coneguda. Sigui X1,...,Xn una m.a.s. d’X
X − µ0
Suposant H0 cert definim l’estadís'c Z=
σ
€ n
⎛ ⎞
Busquem zα perquè P⎜ −zα ≤ Z ≤ zα ⎟ = 1 − α
2 ⎝ 2 2⎠
⎛ ⎞ €
Llavors α
φ⎜ zα ⎟ = 1 −
⎝ 2 ⎠€ 2
€
Per tant , la regió d’acceptació serà ⎡ ⎤ o també ⎧ σ ⎫
A0 = ⎢−zα , zα ⎥ A0 = ⎨ x / x − µ0 ≤ zα ⎬
⎣ 2 2⎦ ⎩ n ⎭
€ 2
€ €
Contrast d’hipòtesis
Contrast bilateral de la mitjana d’una població normal amb variància coneguda.
⎛ ⎞
Així: P⎜ −zα ≤ Z ≤ zα ⎟ = 1 − α
⎝ 2 2⎠
⎛ ⎞ α
on
€ φ⎜ zα ⎟ = 1 −
⎝ 2⎠ 2
⎡ ⎤
Per tant , la regió d’acceptació serà A0 = ⎢−zα , zα ⎥
⎣ 2 2⎦
⎧ σ ⎫ ⎡ σ σ ⎤
€ O també A0 = ⎨ x / x − µ0 ≤ zα ⎬ = ⎢ µ0 − zα , µ0 + zα ⎥
⎩ 2
n ⎭ ⎣ 2
n 2
n ⎦
€x −µ ≤z σ o X ∈A
El criteri d’acceptació serà: 0 α 0
2
n
€
€
Contrast d’hipòtesis
Contrast bilateral de la mitjana d’una població normal amb variància coneguda.
• Exemple.
Volem saber si el consum habitual d’un producte modifica el nivell de
colesterol. Sabem que aquest segueix una llei normal µ = 200 mg /dl
i σ = 3 agafem una mostra de n=9 persones.
Establim un nivell de significació α = 0.01
Així, tenim €
€ α = 0.01 ⇒ zα = 2.575
⎧ H 0 : µ = 200 2 σ
⎨ € llavors z = 2.575
⎩ H1 : µ ≠ 200 σ = 3; n = 9 ⇒
σ α
n
=1 2
n
€
Contrast d’hipòtesis
P-valor
€
Contrast d’hipòtesis
• Exemple:
• Fa anys, es va fer un estudi de l’estatura de les persones d’una ciutat, el
resultat va donar que seguia una llei normal de mitjana 1,68 m i desviació
estandard 0,064 m. Volem comprovar ara si aquesta estatura mitjana ha
canviat. Agafem una mostra de 15 persones i obtenim una mitjana mostral de
1,73 m. Suposant que la desviació estandard no ha canviat volem discernir si
l’estatura mitjana ha canviat o no.
• Contrast bilateral:
⎧ H 0 : µ = 1.68 = µ0 α = 0.05 ⇒ zα = 1.96 ⎫
⎨ 2 ⎪
⎩ H1 : µ ≠ 1.68 σ = 0.064 ; n = 15 ; x = 1.73 ⎪⎪
x − µ0 1.73 −1.68 ⎬ ⇒ 3.026 > 1.96
zexp = = ≈ 3.026 ⎪
σ 0.064 ⎪
n 15 ⎪⎭
p − valor : p = 2 − 2φ ( 3.026) = 0.00246 < 0.05
€
Contrast d’hipòtesis
Contrast bilateral de la mitjana d’una població amb distribució desconeguda i variança coneguda
En el cas que la variable segueixi una llei desconeguda fent servir mostres de grandària
gran (n>30) podem fer servir el mateix estadís'c que en el cas anterior a par'r del
TCL. ⎛ ⎞
σ X − µ0
X ~ N ⎜ µ, ⎟ Estadístic de contrast : zexp =
⎝ n⎠ σ
n
Contrast bilateral de la mitjana d’una població amb variança desconeguda i mostra gran
€ el cas que no coneguem la variància ni la distribució, per una mostra prou gran sabem
En
pel TCL que la distribució de la mitjana mostral tendeix a la normal. Al no conèixer σ hem
d’u'litzar l’estadís'c de la t de Student. Però ja hem vist que quan els graus de llibertat
tendeixen a infinit la t de Student s’aproxima molt a la normal. Així l’estadís'c de contrast
serà:
X − µ0
X ~ t n −1 Estadístic de contrast : t exp =
S
n
Contrast d’hipòtesis
Contrast bilateral de la mitjana d’una població amb variança desconeguda
• Exemple:
• Suposem ara que entenem que la variància pot haver canviat i per tant és
desconeguda. Per tant fem servir la variància mostral i l’estàdís'c ob'ngut a
par'r de la t de Student amb 14 graus de llibertat. Suposem que obtenim una
desviació estandard mostral corregida de 0,144 Llavors:
• Contrast bilateral:
⎧ H 0 : µ = 1.68 = µ0 α = 0.05 ⇒ t = 2.1448 ⎫
α
14, ⎪
⎨ 2
⎩ H1 : µ ≠ 1.68 σ = 0.064 ; n = 15 ; x = 1.73 ⎪⎪
x − µ0 1.73 −1.68 ⎬ ⇒ t exp < t α
14,
t exp = ˆ = ≈ 1.3448 ⎪ 2
s 0.144 ⎪
n 15 ⎪⎭
p − valor : p = 2P ( t > 1.3448) = 0.2 > 0.05
> pt(1.3448,14,lower.tail = FALSE)
• Per tant acceptem H0 [1] 0.1000363
€
Contrast d’hipòtesis
Contrast bilateral de la mitjana d’una població amb variança coneguda
• Exemple:
• Una fàbrica de disposi'us va llençar un producte que tenia una vida mitjana de 2 anys.
Va realitzar una millora que podria allargar aquesta vida mitjana. Per a comprovar-ho
s’agafa una mostra de 18 disposi'us. Obtenim una mitjana mostral de 2.8 anys.
Suposant que la desviació estandard és 1.2 anys anem a realitzar una prova de contrast.
• Contrast unilateral:
⎧ H 0 : µ ≤ 2 = µ0 α = 0.05 ⇒ zα = 1.65 ⎫
⎨ ⎪
⎩ H1 : µ > 1.68 σ = 1.2 ; n = 18 ; x = 2.8 ⎪
x − µ0 2.8 − 2 ⎬ ⇒ zexp > zα
zexp = = ≈ 2.8284 ⎪
σ 1.2 ⎪
n 18 ⎭
p − valor : p = P ( z > 2.8284 ) = 1 − φ (2.8284) = 1 − 0.99767 = 0.0023 < 0.05
• Per tant rebutjem H0 , acceptem que les millores allarguen la vida dels disposi'us.
€
Contrast d’hipòtesis
Contrast bilateral de la mitjana d’una població amb variança desconeguda
• Exemple:
• Suposant ara que la desviació estandard és desconeguda anem a realitzar una
prova de contrast. Suposem que hem ob'ngut una desviació estandard
mostral corregida S= 1,2 anys. Llavors fem servir la t de Student .
• Contrast unilateral:
€
Contrast d’hipòtesis
Contrast d’una proporció.
• Sabem que per a una variable Bernuilli de paràmetre p i una
m.a.s prou gran np>5 i n(1-p)>5 podem considerar que
⎛ p(1 − p) ⎞
X →Ν⎜ p, ⎟
⎝ n ⎠
• Per tant podem fer servir com a estadís'c de contrast
pˆ − p0
€ • Z= on H 0 : p = p0 i pˆ = proporció mostral
p0 (1 − p0 )
n
€
€
Contrast d’hipòtesis
Contrast d’una proporció.
• Exemple:
• Un estudi sobre la obesitat a EEUU l’any 2002 va detectar que 1276 persones adultes
d’una mostra de 4115 van ser considerades obeses segons un test de massa corporal.
Una enquesta realitzada l’any 1998 va fer palès que el 20% de la població
s’autoconsideren obesos. Suggereixen les dades ob'ngudes el 2002 que la proporció
mostral d’adults 1276/4115=0.31 és més d’1.5 vegades la proporció de l’enquesta
d’autoavaluació (0,31/0.2>1.5) ?
• Per a respondre la pregunta farem un contrast d’hipòtesis amb nivell de significació 0.1
• Contrast unilateral:
• Per tant rebutgem H0 considerem, que al nivell de significació del 0.1, podem acceptar
que la proporció d’obesos ha augmentat en el conjunt de la població per sobre del 30%.
€
Contrast d’hipòtesis
Contrast d’una proporció.
• Exemple: I si fem un contrast bilateral en la situació anterior?
• Contrast bilateral:
n = 4115; np > 5 n(1 − p) > 5 ⎫
⎧ H 0 : p = 0.3 ⎪
⎨ α = 0.1 ⇒ zα = 1.65 ⎪
⎩ H1 : p ≠ 0.3 2
⎪
⎬ ⇒ zexp < zα
pˆ − p0 0.31 − 0.30 ⎪ 2
zexp = = ≈ 1.3998 ⎪
p0 (1 − p0 ) 0.3(1 − 0.3) ⎪
n 4115 ⎭
p − valor : p = 2 − 2φ (1.3998) = 2(1 − 0.91924) = 0.16152 > 0.1
€
Problemes per resoldre
€
Problemes per resoldre
Sol: a) ⎧ H 0 : µ = 14 = µ0
⎨ Re gió de rebuig : X < Valor crític
⎩ H1 : µ < 14
si acceptem H1 i rebutgem H 0 i en realitat H 0 era certa,
cometem un error de tipus 1, fals positiu.
€
Problemes per resoldre
⎧ H 0 : µ = 14 = µ0 α = 0.05 ⇒ zα = -1.644854 ⎫
Sol: c) ⎨ ⎪
⎩ H1 : µ < 14 σ = 4.8 ; n = 26 ; x = 12.5 ⎪
x − µ0 12.5 −14 ⎬ ⇒ t exp > t 25,α
zexp = = ≈ -1.593444 ⎪
σ 4.8 ⎪
n 26 ⎭
4.8
també : 12.5 > 14 -1.644854 * = 12.4516
26
p − valor : p = P ( t < -1.593444 ) = 0.05553036 > 0.05
Així no podem rebutjar H 0 acceptem que el temps mitjà no s' ha reduït.
Problemes per resoldre
Sol: a,b)
⎧ H 0 : µ ≥ 62000 = µ0 α = 0.05 ⇒ t 8,α = -1.859548 ⎫
⎨ ⎪
⎩ H1 : µ < 62000 S = 7464.081 ; n = 9 ; x = 57000 ⎪
x − µ0 57000 − 62000 ⎬ ⇒ t exp < t 9,α
t exp = = ≈ -2.009625 ⎪
S 7464.081 ⎪
n 9 ⎭
7464.081
també : 57000 < 206.5 -1.859548 * = 57373.39
9
p − valor : p = P ( t < -2.009625) = 0.03966217 < 0.05
Així hem de rebutjar H 0 les nostres vendes són inf eriors a la mitjana del sec tor.
Problemes per resoldre
Sol: a,b)
> c1=c(53700,55500,53000,52400,51000,62000,75000,53800,56600) #vector de dades
> xbarra=mean(c1);xbarra #mitjana mostral
[1] 57000 > alpha=0.05
> sigma=sd(c1);sigma # desv. estand. mostral > tcri=qt(alpha,n-1);tcri
[1] 7464.081 [1] -1.859548
> n=length(c1) > hnul+tcri*SE #valor infim de l'interval d'acceptació, valor crí'c.
> SE=sigma/sqrt(n) #error estandard [1] 57373.39
> hnul=62000 > pv=pt(texp,n-1); pv #p-valor
> texp=(xbarra-hnul)/SE;texp #estadís'c de la mostra. [1] 0.03966217
[1] -2.009625
Problemes per resoldre
>c1=c(53700,55500,53000,52400,51000,62000,75000,53800,56600)
Sol: a,b) > xbarra=mean(c1);xbarra #mitjana mostral
[1] 57000
α = 0.01 ⇒ z α = 2.575829 ⎫⎪ > sigma=sqrt(54760000);sigma # desv. estand. mostral
1−
2 ⎬ [1] 7400
σ = 7400 ; n = 9 ; x = 57000 ⎪⎭ > n=length(c1);n
⎡ [1] 9
σ σ ⎤ > SE=sigma/sqrt(n);SE #error estandard
IC = ⎢ x − z α * , x+z α * ⎥ = [50646.29, 63353.71]
⎣ 1−
2
n 1−
2
n ⎦ [1] 2466.667
> alpha=0.01
> zcri=qnorm(1-alpha/2);zcri
[1] 2.575829
€ > E=zcri*SE #error max de l'interval de confiança.
> IC=xbarra+c(-E,E);IC
[1] 50646.29 63353.71
Càlcul dels errors.
• EXEMPLE:
• Considerem una variable aleatòria X procedent d’una població
amb densitat de probabilitat N(μ,5). Efectuades dues hipòtesis
sobre el valor de la mitjana μ, H0: μ=12 ; H1: μ=15, mitjançant
una m.a.s. de n=25, es fa un contrast i s’estableix que si la
mitjana mostral és inferior a 14 s’acceptarà la hipòtesis nul·la.
• Determina:
• A) Probabilitat de cometre l’error de 'pus 1
• B) Probabilitat de cometre l’error de 'pus 2
• C) La potència del contrast.
Càlcul dels errors
€ €
Càlcul dels errors
⎛ ⎞
⎜ 14 −12 ⎟
α = P ( X > 14 )
µ = 12 = P⎜ Z > ⎟ = P(Z > 2) = 0.0228
⎜ 5 ⎟
⎝ 25 ⎠
€
Càlcul dels errors
Sol: a)
Problema per resoldre
Sol: b)
⎧ H 0 : µ = 8000 = µ0 α = 0.05 ⇒ zα = -1.644854 ⎫
⎨ ⎪
⎩ H1 : µ < 8000 σ = 136161 = 369 ; n = 6 ; x = 7750 ⎪
x − µ0 7750 − 8000 ⎬ ⇒ zexp < zα
zexp = = ≈ -1.659546 ⎪
σ 369 ⎪
n 6 ⎭
369
també : 7750 < 8000 -1.644854 * = 7752.213
6
p − valor : p = P ( t < -1.659546) = 0.04850292 < 0.05
Així hem de rebutjar H 0 la resistència és inf erior.
Problema per resoldre
€ ⎧ ⎡ ⎤
2 2
⎪χ ∈ ⎢χ α , χ 2
α⎥ ⇒ no rebutjem H 0 €
⎪ ⎣ n −1,
2
n −1,1−
2⎦
⎨
⎪ 2 €⎡ 2 2
⎤
⎪ χ ∉ ⎢⎣ χn −1,α , χn −1,1−α ⎥⎦ ⇒ rebutjem H 0
⎩ 2 2
€
Contrast de la variància d’una distribució normal.
• Si el contrast és:
H
⎩ 1 : σ 2
> σ 2
0
⎪⎩ χ ∈ [ χn2 −1,α ,+∞] ⇒ rebutjem H 0
€ €
Problema a resoldre
Problema a resoldre
Sol: a)
⎧ H 0 : σ 2 ≥10000 = σ0 2 (n −1)sˆ 2 χ 2 ∈ [ χn2 −1,α ,+∞] ⇒ no rebutgem H 0
⎨ χ n −1 =
⎩ H1 : σ 2 < 10000 σ 2
0 χ ∈ [ −∞, χ
2 2
n −1,α ] ⇒ rebutgem H 0
Sˆ 2 = 1590 n=4 α = 0.1 χn2 −1,α = 6.251389 ⎫ > c2=c(515,464,558,491)
⎪ 2
2 ⎬ χexp < χn2 −1,α ⇒ rebuitgem H 0 > sigma2=var(c2);sigma2
2 ( )
n −1 ˆ
s 3⋅ 1590
χexp = = = 0.477 ⎪ [1] 1590
σ02 10000 ⎭ > hnul=10000
> n=length(c2)
> chiexp=(n-1)*sigma2/hnul;chiexp
[1] 0.477
> chicri=qchisq(0.9,n-1);chicri
[1] 6.251389
€
Problema a resoldre
Sol: b)
> n=41
⎧ H 0 : µ > 10.5 = µ0 α = 0.05 ⇒ t 40,α = -1.683851⎫ > xbarra=10
⎨ ⎪
⎩ H1 : µ < 10.5 Sˆ = 1.5 ; n = 41 ; x = 10 ⎪ > sd=1.5
⎬ ⇒ t exp < t 9,α > SE=sd/sqrt(n)
x − µ 10 −10.5
t exp = ˆ 0 = ≈ -2.134375 ⎪ > alpha=0.05
S 1.5 > hnul=10.5
⎪
n 41 ⎭ > texp=(xbarra-hnul)/SE;texp
1.5 [1] -2.134375
també : 10 < 10.5 -1.683851* = 10.10554 > tcri=qt(alpha,n-1);tcri
41 [1] -1.683851
p − valor : p = P ( t < 2.134375) = 0.01949627 < 0.05 > E=tcri*SE
> vcri=hnul+E;vcri
Així hem de rebutjar H 0 .
[1] 10.10554
> p_valor=pt(texp,n-1);p_valor
[1] 0.01949627
€
Problemes per resoldre
Sol: b)
> n=41
⎧ H 0 : µ > 10.5 = µ0 α = 0.05 ⇒ zα = -1.644854 ⎫ > xbarra=10
⎨ ⎪
⎩ H1 : µ < 10.5 Sˆ = 1.5 ; n = 41 ; x = 10 ⎪ > sd=1.5
⎬ ⇒ zexp < zα > SE=sd/sqrt(n)
x − µ 10 −10.5
zexp = ˆ 0 = ≈ -2.134375 ⎪ > hnul=10.5
S 1.5 > zexp=(xbarra-hnul)/SE
⎪
n 41 ⎭ > alpha=0.05
1.5 > zcri=qnorm(alpha);zcri
també : 10 < 10.5 -1.644854 * = 10.11468 [1] -1.644854
41 > E=zcri*SE
p − valor : p = P ( z < 2.134375) = 0.01640606 < 0.05 > vcri=hnul+E;vcri
[1] 10.11468
Així hem de rebutjar H 0 .
> p_valor=pnorm(zexp);p_valor
[1] 0.01640606
€
Problemes per resoldre
Problemes per resoldre
Sol: a) n = 250; pˆ =
35
= 0.14 npˆ > 5 n(1 − pˆ ) > 5
250
⎧ H 0 : p = 0.1 = p0 pˆ − p0
⎨ ~ N(0,1)
⎩ H1 : p ≠ 0.1 p0 (1 − p0 )
n
Sol: b)
35 > n=250
n = 250; pˆ = = 0.14 npˆ > 5 n(1 − pˆ ) > 5
⎧ H 0 : p = 0.1 = p0 250 > p=35/n
⎨ α = 0.05 ⇒ zα = 1.959964 > alpha=0.05
⎩ H1 : p ≠ 0.1
2 > zcri=qnorm(1-alpha/2);zcri
[1] 1.959964
⎛ ⎞ > hnul=0.1
pˆ − p0 0.14 − 0.1 > sigma=sqrt(hnul*(1-hnul)/n)
zexp = = ≈ 2.108185 ∉ ⎜ −zα , zα ⎟ = (-1.959964, 1.959964 )
p0 (1 − p0 ) 0.1⋅ (1 − 0.1) ⎝ 2 2⎠ > E=zcri*sigma
n 250 > zexp=(p-hnul)/sigma;zexp
Re gió d' acceptació : pˆ ∉ (0.0628123, 0.1371877) [1] 2.108185
> Reg.accept=hnul+c(-E,E);Reg.accept
p − valor : p = 2φ (2.108185) - 2 = 0.03501498 < 0.05 [1] 0.0628123 0.1371877
Hem de rebutjar H 0 > p_valor=2*pnorm(zexp,lower.tail = FALSE)
> p_valor
[1] 0.03501498
€
Problemes per resoldre
Problemes per resoldre
Sol:
926
⎧ H 0 : p ≤ 0.75 = p0 n = 1225; pˆ = = 0.14 npˆ > 5 n(1 − pˆ ) > 5
1225
⎨
⎩ H1 : p > 0.75 α ⇒ zα
926
pˆ − p0 − 0.75
zexp = = 1225 ≈ 0.4783759 > zα no el podem calcular
p0 (1 − p0 ) 0.75⋅ (1 − 0.75)
n 1225
Rebutjarem H 0 si p − valor : p = 1 − φ (0.4783759) = 0.03501498 < α
Així nivell de significació : α > 0.03161913
€
Problemes per resoldre
Problemes per resoldre
Sol: a i b) ⎧ H 0 : p ≥ 0.45 = p0
Contrast unilateral ⎨
⎩ H1 : p < 0.45
80
n = 200; pˆ = = 0.4 npˆ = 80 > 5 n(1 − pˆ ) = 120 > 5
200
pˆ − p0
Estadístic de contrast ~ N(0,1)
p0 (1 − p0 )
n
Problemes per resoldre
80
Sol: c) Contrast unilateral per l'esquerra ⎧⎨ H 0 : p ≥ 0.45 = p0 n = 200; pˆ = = 0.4 α = 0.05
200
⎩ H1 : p < 0.45
pˆ − p0 p0 (1 − p0 )
Re gió de rebuig : zexp = < zα o pˆ < p0 + zα *
p0 (1 − p0 ) n
n
Criteri del p _ valor
Rebutjarem H 0 si p − valor : p = φ (zexp ) < α
Problemes per resoldre
80
Sol: c) n = 200; pˆ =
200
= 0.4 α = 0.05 zα = -1.644854
Re gió de rebuig :
pˆ − p0
zexp = > zα
p0 (1 − p0 )
n
o també :
p0 (1 − p0 )
Valor crític v cri = p0 + zα * pˆ > v cri
n
Criteri del p _ valor
Si p _ valor = φ (zexp ) < α rebutgem H 0
Problemes per resoldre
€ €
Problema a resoldre