Professional Documents
Culture Documents
一個隨機變數X:
X : Ω = {E1 , E2 , . . . , EN } → R = {x1 , x2 , . . . , xN }.
26
25
23
20
16
4
2
q q q q q q q q q q qq q q q q q q q q q q q q q q
0
M.-Y. Chen Basic Statistics
單一連續隨機變數分佈情形的描述(1)
1. 累加機率分配函數 (Cumulative Probability Distribution Function,
CDF):
FX (a) = P (X ≤ a)
Z a
= dFX (x).
−∞
2. 分散度衡量: 變異數
var(X) = E[(X − E(X))2 ]
Z ∞
= (x − E(X))2 dFX (x)
−∞
Z ∞
= (x − E(X))2 fX (x)dx, if FX (x) exists.
−∞
3. 偏態衡量:
α3 (X) = E[(X − E(X))3 ]
Z ∞
M.-Y. Chen Basic
3 Statistics
y
(∞, ∞)
•
兩個連續隨機變數分佈情形的描述
x
q q q q q q q qqqqqqq q q q q q q q qq q q
FX,Y (a, b) = P (X ≤ a, Y ≤ b)
Z a Z b
= dFX,Y (x, y).
−∞ −∞
是隨機變數X及Y 的邊際機率密度函數。
(4) 條件機率密度函數 (Conditional Probability Density
Function):
fX,Y (x, y) fX,Y (x, y)
fX|Y =y (x) = , fY |X=x (y) = ,
fY (y) fX (x)
是隨機變數X在條件Y = y下及隨機變數Y 在條件X = x下
的條件機率密度函數。
(5) 隨機變數X及Y 相互獨立 (independent) 若且為
若fX,Y (x, y) = fX (x) fY (y)。
M.-Y. Chen Basic Statistics
兩連續隨機變數間線性關係的描述
母體 樣本
實現值 {x1 , x2 , . . . , x∞ } {x1 , x2 , . . . , xn }
1
Pn
位置衡量 E(X) xi
n
1
Pi=1n 2
分散度衡量 var(X) n i=1 (xi − x̄n )
1
P n 3
偏態衡量 α3 (X) n i=1 (xi − x̄n )
1
P n 4
峰態衡量 α4 (X) n i=1 (xi − x̄n )
1
Pn 1
Sample 1 {x11 , x12 , . . . , x1n } ⇒ x̄1n = xi
n
1
Pi=1
n
Sample 2 {x21 , x22 , . . . , x2n } ⇒ x̄2n = x2i
n
1
Pi=1
n
Sample 3 {x31 , x32 , . . . , x3n } ⇒ x̄3n = n i=1 xi
3
.. ..
. .
1
Pn N
Sample N {xN N N N
1 , x2 , . . . , xn } ⇒ x̄n = n i=1 xi
x̄n 的抽樣分配為數值{x̄1n, x̄2n , · · · , x̄N
n }當N → ∞在實數線上的
分佈情形; 其分佈情形可用E(x̄n), var(x̄n )),α3 (x̄n ), 及α4 (x̄n )來
描述。
問題: 究竟離多遠才算夠遠使能棄卻虛無假設?
若樣本觀察值為自母體隨機抽出, 則每一個樣本觀察值的抽樣分配
與母體分配相同, 換言之,
E(xi ) = E(X), ∀i
var(xi ) = var(X), ∀i
α3 (xi ) = α3 (X), ∀i
α4 (xi ) = α4 (X), ∀i.
若X為常態分配,xi亦為常態分配。
n
!
1X
E(x̄n ) = E x
n i=1 i
n
1X
= E(xi )
n i=1
n
1X
= µ
n i=1
n
= µ = µ.
n
樣本平均數為不偏估計式。
M.-Y. Chen Basic Statistics
樣本平均數的抽樣分配: 變異數
n
!
1X
var(x̄n ) = var x
n i=1 i
n n−1 X
n
!
1 X X
= var(xi ) + 2 cov(xi , xj )
n2 i=1 i=1 j=i+1
1 2
σ2
= nσ = .
n2 n
當n → ∞時,var(x̄n ) → 0, 即樣本平均數為一致估計式。
x̄n ∼ N(µ, σ 2 ).
α = P (棄卻虛無假設|H0 為真)
β = P (不棄卻虛無假設|Ha 為真)
σX /n
(n − 1)s2X /σX 2
∼ χ2 (n − 1) given X ∼ N (µX , σX
2
)
x̄ H0
tx̄n = √ 2n −µ0
∼ t(n − 1)
sX /n
非棄卻域:tx̄n ∈ [tα/2 (n − 1), t1−α/2 (n − 1)]
p p
x̄n ∈ [µ0 − tα/2 (n − 1) s2X /n, µ0 + t1−α/2 (n − 1) s2X /n]
α為型 I 誤差
推論結果 若tx̄n 或x̄n 在非棄卻域
則在顯著水準1 − α下不棄卻虛無假設。
問題回答 樣本資料支持母體平均數等於µ0
M.-Y. Chen Basic Statistics
附錄: 樣本變異數的抽樣分配
2
假定一組來自母體X ∼ D(µX , σX )的樣本{x1 , x2 , . . . , xn }, 由前
一節的討論知道樣本平均數x̄n為µX 的不偏及一致估計式,
2
且var(x̄n ) = σX /n, 而在重複抽樣的概念下, 所有觀察值具
2
有var(xi ) = σX 的變異數, 則
Pn
(x − x̄n )2
sx = i=1 i
2
n−1
為樣本變異數 (sample variance)。
n
!
X
E (xi − x̄n )2 = nσX2 2
− 2σX 2
+ σX 2
= (n − 1)σX .
i=1
由此結果可知樣本變異數s2x為母體變異數σX 2
的不偏估計式, 即
Pn 2
2 i=1 (xi − x̄n )
E(sx ) = E
n−1
2
(n − 1)σX 2
= = σX .
n−1
n
X
(n − 1)s2x /σX
2
= (xi − x̄n )2 /σX
2
i=1
n
X
= [(xi − µX ) − (x̄n − µX )]2 /σX
2
i=1
Xn n
X
2
= [ (xi − µX ) − 2(x̄n − µX ) (xi − µX ) + n(x̄n − µX )2 ]/σX
2
i=1 i=1
n
X
= [ (xi − µX )2 − 2n(x̄n − µX )2 + n(x̄n − µX )2 ]/σX
2
i=1
n 2
X xi − µX X̄n − µX
= − σX
σX √
n
i=1
∼ χ (n) − χ2 (1) = χ2 (n − 1).
2
x̄n − µX
tx̄n = p .
s2x /n
因x̄n 和s2x 均為隨機變數, 則T 亦為隨機變數, 且
x̄n − µX
tx̄n = p
s2x /n
x̄n −µX
√
σX2 /n
= q 2
(n−1)s2x /σX
n−1
N(0, 1)
∼ p = t(n − 1),
χ2 (n − 1)n − 1
其中t(n − 1)表示具(n − 1)自由度的t-分配。
M.-Y. Chen Basic Statistics
附錄:t統計量
檢定虛無假設H0 : µX = µ0 的統計量:
x̄n − µ0
tx̄n =p
s2x /n
√x̄n −µ0
2 /n
σX
= q 2 2
(n−1)sx /σX
n−1
N(0, 1)
∼ p = t(n − 1),
χ2 (n − 1)n − 1