You are on page 1of 39

Inferència amb dues mostres o més 1/1/24, 18:29

Inferència amb
dues mostres o més
Pere López Brosa

https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 1 de 39
Inferència amb dues mostres o més 1/1/24, 18:29

Recordatori: mitjana 1
mostra
σ
X̄ ∼ N(μ, )
√n‾
D’aquí surt l’interval de confiança per la
mitjana amb σ coneguda:
σ
x̄ ± zα ⋅
√n‾
I l’estadístic de contrast:

∗ X̄ − μ
Z = σ ∼ N(0, 1)
√n

2/38

https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 2 de 39
Inferència amb dues mostres o més 1/1/24, 18:29

Mitjana 2 mostres
Ens interessarà:

· Intervals de confiança per la diferència entre


les mitjanes de dues poblacions.
· Contrastos sobre la diferència de mitjanes
entre dues poblacions:

H0 : μ1 = μ2
H1 : μ1 ≠ μ2 La h. alternativa també μ1 < μ2
o μ1 > μ2

O també:

H0 : μ2 − μ1 = d
H1 : μ2 − μ1 ≠ d (o bé > o < )

3/38

https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 3 de 39
Inferència amb dues mostres o més 1/1/24, 18:29

Mitjana 2 mostres
independents
Ens interessa la distribució de X̄ 2 − X̄ 1 .
Partim de:
σ1
X̄ 1 ∼ N(μ1 , )
√n‾1
σ2
X̄ 2 ∼ N(μ2 , )
√n‾2

4/38

https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 4 de 39
Inferència amb dues mostres o més 1/1/24, 18:29

Mitjana 2 mostres
independents
E(X̄ 2 − X̄ 1 ) = E(X̄ 2 ) − E(X̄ 1 ) = μ2 − μ1
σ22 σ12
Var(X̄ 2 − X̄ 1 ) = Var(X̄ 2 ) + Var(X̄ 1 ) = n2 + n1

sd(X̄ 2 − X̄ 1 ) = √‾ ‾σ‾‾‾‾‾‾
2 σ1‾
X̄ 2 − X̄ 1‾) = √ n2 + n1
‾‾‾‾‾‾‾‾‾‾‾
Var( 2
2

Per tant:

‾σ‾‾‾‾‾‾
2 σ1‾
2
X̄ 2 − X̄ 1 ∼ N(μ2 − μ1 , √ n2 + n1 )
2

Si n1 = n2 = n i σ1 = σ2 = σ :
√2⋅σ
X̄ 2 − X̄ 1 ∼ N(μ2 − μ1 , )
√n

5/38

https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 5 de 39
Inferència amb dues mostres o més 1/1/24, 18:29

Mitjana 2 mostres
independents
‾σ‾‾‾‾‾‾
2 σ1‾
2
X̄ 2 − X̄ 1 ∼ N(μ2 − μ1 , √ n2 + n1 )
2

D’aquí surt l’interval de confiança per a la


diferència de dues mitjanes amb σ coneguda:

‾σ‾‾‾‾‾‾‾2‾

√ n2
2 σ
2
(x̄2 − x̄1 ) ± zα ⋅ + 1
n1

I l’estadístic pel contrast de dues mitjanes amb


σ coneguda:
(x̄2 − x̄1 ) − d

Z = ∼ N(0, 1)
‾σ‾‾‾‾‾‾
2 σ1‾
2

√ n2 + n1
2

6/38

https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 6 de 39
Inferència amb dues mostres o més 1/1/24, 18:29

Mitjana 2 mostres
independents
Si no coneixem σ1 i σ2 les podem estimar amb
s1 i s2 però aleshores canvia la distribució.

∗ (x̄2 − x̄1 ) − d
t = ∼ tgll
‾s‾‾‾‾‾‾
2 s1‾
2

√ n2 + n1
2

On:
s22 s21
2
(n + n1 )
gll = s22
2
s2
1 2 1 1 2
n2 −1
(n ) + n1 −1
( n1 )
2

(fórmula complicada que a mà simplificarem)

7/38

https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 7 de 39
Inferència amb dues mostres o més 1/1/24, 18:29

Mitjana 2 mostres
independents
s22 s21
2
(n + n1 )
gll = s22
2
s2
1 2 1 1 2
n2 −1
(n ) + n1 −1
( n1 )
2

Sempre
min(n1 − 1, n2 − 1) ≤ gll ≤ 2 ⋅ (n − 1)
Si σ1= σ2 i n1 = n2 , aleshores
gll = 2 ⋅ (n − 1)
Pels altres casos (a mà) agafarem
gll = min(n1 − 1, n2 − 1)

8/38

https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 8 de 39
Inferència amb dues mostres o més 1/1/24, 18:29

Mitjana 2 mostres
independents
Interval de confiança:

‾s‾‾‾‾‾‾
2 s21‾
(x¯2 − x¯1 ) ± tα ⋅ √ n2 + n1
2

9/38

https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 9 de 39
Inferència amb dues mostres o més 1/1/24, 18:29

Mitjana 2 mostres
aparellades
Mostres independents: Agafem dues mostres
de dues poblacions i mesurem una variable a
cada grup.

Mostres aparellades: Agafem una sola mostra i


mesurem dues variables a cada subjecte.

En mostres aparellades considerem la


diferència per cada subjecte com a variable i
apliquem les tècniques vistes per una sola
mostra.

10/38

https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 10 de 39
Inferència amb dues mostres o més 1/1/24, 18:29

Proporcions en dues
poblacions
Ens plantegem contrastos entre proporcions en
dues poblacions:

H0 : p1 = p2
H1 : p1 ≠ p2 (o bé > o < )
I intervals de confiança per la diferència
p1 − p2

11/38

https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 11 de 39
Inferència amb dues mostres o més 1/1/24, 18:29

Proporcions en dues
poblacions
Si les dues mostres són prou grans:


p‾‾‾‾‾
1 ⋅(1−p1 ‾
p̂1 ∼ N(p1 , √ n1 )
)

p̂2 ∼ N(p2 , √‾‾‾‾‾‾


p2 ⋅(1−p2 ‾
)
n2 )

Aleshores si les dues mostres són


independents:

E(p̂2 − p̂1 ) = p2 − p1
p1 ⋅(1−p1 )
Var(p̂2 − p̂1 ) = Var(p̂2 ) + Var(p̂1 ) = n1 +

p̂2 − p̂1‾) = √‾‾‾‾‾‾‾‾‾‾‾‾


p1 ⋅(1−p1 ) p2 ⋅(1
sd(p̂2 − p̂1 ) = √‾Var(
‾‾‾‾‾‾‾‾‾‾ n1 +

12/38

https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 12 de 39
Inferència amb dues mostres o més 1/1/24, 18:29

IC per la diferència de
proporcions

p̂2 − p̂1 ∼ N(p2 − p1 , √‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾


p1 ⋅(1−p1 ) p2 ⋅(1−p2 ‾
)
n1 + n2 )

L’interval de confiança:

p̂2 − p̂1 ± zα ⋅ √‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾


p1 ⋅(1−p1 ) p2 ⋅(1−p2 ‾
)
n1 + n2

On fem servir p̂2 i p̂1 com estimadors de p2 i


p1 .

13/38

https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 13 de 39
Inferència amb dues mostres o més 1/1/24, 18:29

Contrastos per la diferència


de proporcions
H0 : p1 = p2
H1 : p1 ≠ p2 (o bé > o < )
Amb l’estadístic de contrast:

∗ p2̂ −p1̂
z = p1 ⋅(1−p1 ) p2 ⋅(1−p2 )
√ n1
+ n2

Però si és certa H0 , p1 = p2 = p el podem


simplificar com:

∗ p2̂ −p1̂
z = 1 1
√p⋅(1−p)⋅( n1
+ n2
)

On estimem p com la proporció conjunta.

14/38

https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 14 de 39
Inferència amb dues mostres o més 1/1/24, 18:29

Contrastos per la diferència


de proporcions
H0 : p1 = p2
H1 : p1 ≠ p2 (o bé > o < )
∗ p2̂ −p1̂
z = 1 1
√p⋅(1−p)⋅( n1
+ n2
)

On estimem p com la proporció conjunta.

total d'èxits p1̂ ⋅n1 +p2̂ ⋅n2


p̂ = n1 +n2 = n1 +n2

15/38

https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 15 de 39
Inferència amb dues mostres o més 1/1/24, 18:29

Proporcions entre més de


dos grups: exemple
## Barcelona Àrea metrop Resta
## Management - - -
## Econòmiques - - -
## ADE - - -
## Dret - - -

16/38

https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 16 de 39
Inferència amb dues mostres o més 1/1/24, 18:29

Proporcions entre més de


dos grups
Partim de taula de contingència i tenim dos
contrastos matemàticament equivalents
(conceptualment no):

Contrast d’homogeneïtat

H0 : Les prop. del nivells d'A són iguals per cada va


H1 : No són iguals
Contrast d’independència

H0 : Les variables A i B són independents


H1 : Les variables A i B no són independents

17/38

https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 17 de 39
Inferència amb dues mostres o més 1/1/24, 18:29

2
Contrast χ
Farem servir l’estadístic χ 2

(Obs − Esp)2
χ 2∗ 2

= ∼ χ(f−1)⋅(c−1)
Esp
On f i c són el nombre de files i columnes de la
taula de contingència.

18/38

https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 18 de 39
Inferència amb dues mostres o més 1/1/24, 18:29

2
Distribució χ

19/38

https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 19 de 39
Inferència amb dues mostres o més 1/1/24, 18:29

Contrast entre mitjanes:


recordatori
H0 : μ1 = μ2
H1 : μ1 ≠ μ2

20/38

https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 20 de 39
Inferència amb dues mostres o més 1/1/24, 18:29

Contrast entre mitjanes:


recordatori

21/38

https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 21 de 39
Inferència amb dues mostres o més 1/1/24, 18:29

Contrast entre mitjanes:


recordatori
Estadístics de contrast:

σ coneguda:
(x̄2 − x̄1 )

Z = ∼ N(0, 1)
‾σ‾‾‾‾‾‾
2 σ1‾
2

√ n2 + n1
2

σ desconeguda:

∗ (x̄2 − x̄1 )
t = ∼ tgll
‾s‾‾‾‾‾‾
2 s1‾
2

√ n2 +
2
n1

22/38

https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 22 de 39
Inferència amb dues mostres o més 1/1/24, 18:29

Més de dues mitjanes

23/38

https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 23 de 39
Inferència amb dues mostres o més 1/1/24, 18:29

Anàlisi de la variància
(ANOVA)
Plantejarem el contrast:

H0 : μ1 = μ2 =. . . = μn (o sigui, totes les


mitjanes iguals)

H1 : Com a mínim una és diferent de les altres


Compararem:

· La variància entre les mitjanes dels grups.


· La variància de les observacions dins d’un
mateix grup.

Si la variància entre mitjanes dels grups és molt


més gran que la variància dins dels grups,
tindrem raons per rebutjar la hipòtesi nul·la (o
sigui, per dir que les mitjanes dels grups són
significativament diferents).

24/38

https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 24 de 39
Inferència amb dues mostres o més 1/1/24, 18:29

ANOVA: notació
X : variable quantitativa d’interès
xij : observació i del grup j (ex: x12 : 1a obs. del
2n grup)

n: total d’observacions
nj : nombre d’observacions del grup j

k : nombre de grups
O sigui, tenim en total n observacions
repartides en k grups.

x̄j : mitjana del grup j

x̄ : mitjana de totes les observacions (mitjana


global)

25/38

https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 25 de 39
Inferència amb dues mostres o més 1/1/24, 18:29

ANOVA
Estimador de la variància entre grups:

∑j nj ⋅(x̄j −x̄)2 SQentre


k−1 = k−1

Estimador de la variància dins dels grups:

∑j ∑i (xij −x̄j )2 ∑j (nj −1)⋅Var(xj ) SQdins


n−k = n−k = n−k

Estadístic de contrast:
SQentre /(k−1)
F∗ = SQdins /(n−k)

26/38

https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 26 de 39
Inferència amb dues mostres o més 1/1/24, 18:29

ANOVA
∗ SQentre /(k−1)
F = SQdins /(n−k) ∼ F(k−1)(n−k) quan es
compleix H0

Si xi j ∼ μj + eij on eij ∼ N(0, σ)


O sigui, simplificant:

· La variable X es distribueix prou


normalment dins de cada grup (a la pràctica
evitar mostres molt petites i distribucions
molt asimètriques i amb dades atípiques)
· La variància dins dels diferents grups és igual
(a la pràctica la més gran menys de 10 cops
la més petita)

F ∗ > 0 i més gran com més gran sigui la


variància entre grups

27/38

https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 27 de 39
Inferència amb dues mostres o més 1/1/24, 18:29

Distribució F

28/38

https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 28 de 39
Inferència amb dues mostres o més 1/1/24, 18:29

Potència

https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 29 de 39
Inferència amb dues mostres o més 1/1/24, 18:29

z-test: potència
Potència del z-test unilateral:

( )
∗ d
pot(n, d, σ, α) = P(Z > Zα ) = P Z > Zα + σ
√n

Amb:

Z ∼ N(0, 1)
I d és la diferència entre la realitat i la hipòtesi
nul·la:

d = μreal − μH0

30/38

https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 30 de 39
Inferència amb dues mostres o més 1/1/24, 18:29

z-test: potència

31/38

https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 31 de 39
Inferència amb dues mostres o més 1/1/24, 18:29

Potència del t-test


Exemple:

{ H1 : μ < 30
H0 : μ = 30

32/38
https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 32 de 39
Inferència amb dues mostres o més 1/1/24, 18:29

Potència del t-test


Quina és la probabilitat de rebutjar H0 amb
una mostra amb n = 5 si en realitat μ = 29 i
σ = 0.5, amb α = 0.05?
power.t.test(n=5,delta=1,sd=0.5,sig.level = 0.05,
type="one.sample",alternative="one.sided")

##
## One-sample t test power calculation
##
## n = 5
## delta = 1
## sd = 0.5
## sig.level = 0.05
## power = 0.9748306
## alternative = one.sided

33/38
https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 33 de 39
Inferència amb dues mostres o més 1/1/24, 18:29

Potència del t-test


Quina hauria de ser la mida de la mostra per
rebutjar H0 amb una probabilitat del 99% si en
realitat μ = 29 i σ = 0.5, amb α = 0.05?

power.t.test(n=NULL,delta=1,sd=0.5,sig.level = 0.05,power=0.
type="one.sample",alternative="one.sided")

##
## One-sample t test power calculation
##
## n = 5.67789
## delta = 1
## sd = 0.5
## sig.level = 0.05
## power = 0.99
## alternative = one.sided

34/38
https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 34 de 39
Inferència amb dues mostres o més 1/1/24, 18:29

Potència del t-test


Quina diferència podem arribar a detectar en
aquest contrast amb una probabilitat del 99% si
σ = 0.5, amb α = 0.05 i una mostra de mida
5?

power.t.test(n=5,delta=NULL,sd=0.5,sig.level = 0.05,power=0.
type="one.sample",alternative="one.sided")

##
## One-sample t test power calculation
##
## n = 5
## delta = 1.107865
## sd = 0.5
## sig.level = 0.05
## power = 0.99
## alternative = one.sided

35/38
https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 35 de 39
Inferència amb dues mostres o més 1/1/24, 18:29

35/38

Potència del t-test

36/38
https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 36 de 39
Inferència amb dues mostres o més 1/1/24, 18:29

36/38

Potència del t-test

37/38
https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 37 de 39
Inferència amb dues mostres o més 1/1/24, 18:29

37/38

Potència
Vegeu també:

power.prop.test

power.anova.test

38/38
https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 38 de 39
Inferència amb dues mostres o més 1/1/24, 18:29

38/38

https://aulaglobal.upf.edu/pluginfile.php/4489380/mod_resource/content/7/inf2mostres.html#1 Página 39 de 39

You might also like