Professional Documents
Culture Documents
高統講義ch7 20230904
高統講義ch7 20230904
楔子,以一個真實故事開始。
某統計考試後後,一些學生找老師問班上成績為何?老師表示等上課之後再統一公布。生:
能否先透露一些訊息?師:平均大概 50 分,正負 50 分的話為 100%信賴區間。生:…,能
否精準些?師:平均約 50 分,正負 20 分的話為 95%信賴區間。
從參數為𝜃之母體抽出一組隨機樣本𝑋 , 𝑋 , ⋯ , 𝑋 ,則母體參數𝜃的區間估計型式為
𝑃 𝐿 𝜃 𝑈 1 𝛼
其中0 𝛼 1,而1 𝛼稱之為信賴係數(confidence coefficient)或信賴水準(confidence
level),亦稱之為信賴度(degree of confidence)。𝐿與𝑈為隨機樣本𝑋 , 𝑋 , ⋯ , 𝑋 之函數,皆
為隨機變數,區間 𝐿, 𝑈 稱之為母體參數𝜃的100 1 𝛼 %隨機區間(random interval);其值
分別以𝑙與𝑢表示,則區間 𝑙, 𝑢 稱之為母體參數𝜃的100 1 𝛼 %信賴區間(confidence
interval),𝑙稱之為信賴下限(lower confidence limit:簡稱 LCL),𝑢稱之為信賴上限
(upper confidence limit:簡稱 UCL)。至於如何決定𝑙與𝑢之值,需由𝜃的點估計量𝜃與𝜃之
抽樣分配來決定,以下將針對不同的參數,詳論如何決定𝑙與𝑢之值。
𝑖. 𝑖. 𝑑.
(A) 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑁 𝜇, 𝜎 ,𝜎 已知,可得𝑍 ~𝑁 0, 1 ,則
~ ⁄√
𝜇的100 1 𝛼 %信賴區間為 𝑥̅ 𝑧 ⁄ ∙ , 𝑥̅ 𝑧 ⁄ ∙ ,
√ √
簡記為 𝑥̅ 𝑧 ⁄ ∙
√
簡單記法:[點估計值 (分配的臨界值)(點估計量的標準差)]
※ 簡單記法僅適用於𝑍分配與𝑡分配,不適用於𝜒 分配與𝐹分配。
※ 參數𝜃的統計推論,思維四步驟:
(1) 求出參數𝜃的點估計量𝜃
(2) 求出點估計量𝜃的抽樣分配(機率分配)
(3) 畫出點估計量𝜃的抽樣分配圖(機率分配圖)
(4) 由點估計量𝜃的抽樣分配圖,依題意寫出數式
證明:
第 7 章第2頁共47頁
𝑋 𝜇
1 𝛼 𝑃 𝑧 ⁄ 𝑍 𝑧 ⁄ 𝑃 𝑧 ⁄ 𝑧 ⁄
𝜎⁄√𝑛
𝑃 𝑋 𝑧 ⁄ ∙ 𝜇 𝑋 𝑧 ⁄ ∙
√ √
可得𝜇的100 1 𝛼 %信賴區間為 𝑥̅ 𝑧 ⁄ ∙ , 𝑥̅ 𝑧 ⁄ ∙
√ √
附註,令為等尾,是因在抽樣分配對稱於平均數時,此為最小區間長的信賴區間。
𝑖. 𝑖. 𝑑.
(B) 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝜇, 𝜎 ,任何母體,𝜎 已知或未知皆可,當樣本數夠大時,例
~
如,假設𝑛 30,我們即當成樣本數夠大時,由中央極限定理,可得𝑍 ⁄√
近似𝑁 0, 1 ;若 未知,則以樣本標準差𝑆取代𝜎,亦可得𝑍 ⁄√
近似𝑁 0, 1 ,則𝜇的
100 1 𝛼 %信賴區間為 𝑥̅ 𝑧 ⁄ ∙ , 𝑥̅ 𝑧 ⁄ ∙ 或 𝑥̅ 𝑧 ⁄ ∙ , 𝑥̅ 𝑧 ⁄ ∙
√ √ √ √
簡記為 𝑥̅ 𝑧 ⁄ ∙ 或 𝑥̅ 𝑧 ⁄ ∙
√ √
𝑖. 𝑖. 𝑑.
(C) 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑁 𝜇, 𝜎 ,𝜎 未知且承繼上題的假設,假設𝑛 30為樣本數小,
~
可得𝑇 ⁄√
~𝑡 𝑛 1 ,
則𝜇的100 1 𝛼 %信賴區間為 𝑥̅ 𝑡 ⁄ 𝑛 1 ∙ , 𝑥̅ 𝑡 ⁄ 𝑛 1 ∙
√ √
簡記為 𝑥̅ 𝑡 ⁄ 𝑛 1 ∙
√
證明:
第 7 章第3頁共47頁
1 𝛼 𝑃 𝑡 ⁄ 𝑛 1 𝑇 𝑡 ⁄ 𝑛 1
𝑃 𝑡 ⁄ 𝑛 1 ⁄√
𝑡 ⁄ 𝑛 1
𝑃 𝑋 𝑡 ⁄ 𝑛 1 ∙ 𝜇 𝑋 𝑡 ⁄ 𝑛 1 ∙
√ √
可得𝜇的100 1 𝛼 %信賴區間為 𝑥̅ 𝑡 ⁄ 𝑛 1 ∙ , 𝑥̅ 𝑡 ⁄ 𝑛 1 ∙ .
√ √
1464.42, 1491.58
意即有 95%的信心,相信 60 瓦特燈泡之平均壽命𝜇至少為 1464.42 小時,至多為
1491.58 小時。
126.42, 139.58
17.94, 20.20
𝑥̅ 𝑡 . 19 ∙ , 𝑥̅ 𝑡 . 19 ∙
√ √
. .
507.5 1.729 ∙ , 507.5 1.729 ∙ 472.8, 542.2
√ √
𝑖. 𝑖. 𝑑.
Example 7.1-2 & Example 7.1-6 (a) 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑁 𝜇, 16 ,則𝜇的 90%信賴區
~
說明𝜇的 90%信賴區間之意義。
答:隨機抽取𝑘組樣本,則得到𝑘個關於𝜇的信賴區間,其中大約有0.90𝑘信賴區間包含𝜇。
𝑖. 𝑖. 𝑑.
(D) 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑁 𝜇, 𝜎 ,𝜎 已知,則
~
證明:(1) 1 𝛼 𝑃 ⁄√
𝑧 𝑃 𝑋 𝑧 ∙ 𝜇
√
可得𝜇的100 1 𝛼 %下界信賴區間為 𝑥̅ 𝑧 ∙ ,∞ 。
√
(2) 1 𝛼 𝑃 𝑧 ⁄√
𝑃 𝜇 𝑋 𝑧 ∙
√
可得𝜇的100 1 𝛼 %上界信賴區間為 ∞, 𝑥̅ 𝑧 ∙ 。
√
𝑖. 𝑖. 𝑑.
(E) 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝜇, 𝜎 ,任何母體,𝜎 已知或未知皆可,𝑛 30,則
~
𝑖. 𝑖. 𝑑.
(F) 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑁 𝜇, 𝜎 ,𝜎 未知且𝑛 30,則
~
影響信賴區間寬度的因素
信賴區間的寬度 (信賴上限)-(信賴下限),而會影響信賴區間寬度的因素有:
(1) 點估計量:被估計參數的點估計量可能不只一個,不同的點估計量,其抽樣分配亦不
同,因此會影響信賴區間的寬度。
𝑖. 𝑖. 𝑑.
例如:若𝑋 , 𝑋 , 𝑋 𝑁 𝜇, 𝜎 ,則
~
𝑋 與𝑊 皆可作為𝜇的點估計量,而
𝐸 𝑋 𝐸 𝑊 𝜇,意即站在不偏性的觀點,兩者一樣好;但
𝑉𝑎𝑟 𝑋
𝑉𝑎𝑟 𝑊 𝑉𝑎𝑟
𝑉𝑎𝑟 𝑋 𝑉𝑎𝑟 𝑊
意即站在變異數的觀點,𝑋較𝑊好。
因此,在同一信賴係數下,以𝑋作為𝜇的點估計量,所求得的信賴區間寬度
較窄。
(2) 樣本數:樣本數𝑛愈大,信賴區間的寬度愈窄。以抽樣母體為常態分配,母體變異數
𝜎 已知為例,𝜇的100 1 𝛼 %信賴區間為
𝑥̅ 𝑧 ⁄ ∙ , 𝑥̅ 𝑧 ⁄ ∙ ,信賴區間寬度為2𝑧 ⁄ ∙ ,可知樣本數𝑛愈大,信賴區
√ √ √
間的寬度愈窄。
(3) 信賴界限:若信賴界限的取法不同,也會造成信賴區間的寬度不同。
以抽樣母體為常態分配,母體變異數𝜎 已知為例:
(a)
第 7 章第7頁共47頁
若取𝜇的 95%信賴區間為
𝑥̅ 𝑧 . ∙ , 𝑥̅ 𝑧 . ∙ 𝑥̅ 1.96 ∙ , 𝑥̅ 1.96 ∙ ,
√ √ √ √
則信賴區間寬度為 3.92 ∙ 。
√
(b)
若取𝜇的 95%信賴區間為
𝑥̅ 𝑧 . ∙ , 𝑥̅ 𝑧 . ∙ 𝑥̅ 2.326 ∙ , 𝑥̅ 1.75 ∙ ,
√ √ √ √
則信賴區間寬度為 4.076 ∙ 。
√
此兩組信賴區間皆有 95%的信賴度,但因信賴界限的取法不同,造成信賴區間的寬
度亦不同。
𝑥̅ 𝑧 . ∙ , 𝑥̅ 𝑧 . ∙ 𝑥̅ 1.645 ∙ , 𝑥̅ 1.645 ∙ ,
√ √ √ √
則信賴區間寬度為 3.29 ∙ 。
√
𝑥̅ 𝑧 . ∙ , 𝑥̅ 𝑧 . ∙ 𝑥̅ 1.96 ∙ , 𝑥̅ 1.96 ∙ ,
√ √ √ √
則信賴區間寬度為 3.92 ∙ 。
√
由此兩組信賴區間可得:信賴係數1 𝛼愈大,信賴區間的寬度愈大。
在同一信賴係數下,信賴區間的寬度愈窄者,精確度愈高。
第 7 章第8頁共47頁
在信賴區間的寬度相同之下,信賴係數1 𝛼愈大者愈好(因為可信度愈高)。
第 7 章第9頁共47頁
Chochran’s Theorem.
Z 2 v 1 v v1 1 Z X 2 v v1
且 則
X 2 v1 2 zx0 2 Z X X
Xn
1 N 0,1 2已知, 推論
/ n
2 Xn
t n 1 2 未知, 推論
s/ n
t-distribution
Z N 0,1 Z
, Z U T t v
U 2
v U /v
性質
1. E T 0 , Var T
v
,v 2
v2
2. T N 0,1 , v
<1> 2 已知
Xn
Q N 0,1
/ n
X
1 P q1 n q2 P X n q2 X n q1
/ n n n
<考慮最短的區間長, min L >
q1 , q 2 必滿足 q z dz 1 * ,min q2 q1 **
q2
1
n
dq2 dq q1
q2 q1 0 2
dq1 dq1 q2
Let L q1 q2 q1
d dq q1
L q1 2 1 1 0 q1 q2
dq1 dq1 q2
q1 q 2 不合 , q 2 q1
Xn Z /2 , X n Z /2
n n
<2> 2 未知
s s
Similar to <1> case. Then, X n t /2 n 1 , X n t /2 n 1 是 ' s 100 1 % 最短區間
n n
長的信賴區間。
第 7 章第11頁共47頁
兩獨立母體平均數差𝜇 𝜇 的信賴區間
𝑖. 𝑖. 𝑑. 𝑖. 𝑖. 𝑑.
(A) 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑁 𝜇 , 𝜎 ;𝑌 , 𝑌 , ⋯ , 𝑌 𝑁 𝜇 , 𝜎 ,且假設此二母體互相獨
~ ~
立,𝜎 與𝜎 已知。
因為𝑋~𝑁 𝜇 , ,𝑌~𝑁 𝜇 , ,且 𝑋 𝑌 ~𝑁 𝜇 𝜇 , 。
可得 𝑍 ~𝑁 0, 1 ,且
⎡ ⎤
𝑋 𝑌 𝜇 𝜇
1 𝛼 𝑃⎢ 𝑧 ⁄ 𝑧 ⁄
⎥
⎢ 𝜎 𝜎 ⎥
⎣ 𝑛 𝑚 ⎦
𝜎 𝜎 𝜎 𝜎
𝑃 𝑋 𝑌 𝑧 ⁄ ∙ 𝜇 𝜇 𝑋 𝑌 𝑧 ⁄ ∙
𝑛 𝑚 𝑛 𝑚
𝜎 𝜎 𝜎 𝜎
𝑥̅ 𝑦 𝑧 ⁄ ∙ , 𝑥̅ 𝑦 𝑧 ⁄ ∙
𝑛 𝑚 𝑛 𝑚
簡記為 𝑥̅ 𝑦 𝑧 ⁄ ∙ 。
𝑖. 𝑖. 𝑑. 𝑖. 𝑖. 𝑑.
(B) 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝜇 , 𝜎 ;𝑌 , 𝑌 , ⋯ , 𝑌 𝜇 , 𝜎 ,此為任何二互相獨立母
~ ~
體,𝑛 30,𝑚 30,𝜎 與𝜎 已知或未知皆可。由中央極限定理,可得
(1) 𝜎 與𝜎 已知,則 𝑍 近似𝑁 0, 1 ,可得
𝜇 𝜇 的100 1 𝛼 %信賴區間為
𝜎 𝜎 𝜎 𝜎
𝑥̅ 𝑦 𝑧 ⁄ ∙ , 𝑥̅ 𝑦 𝑧 ⁄ ∙
𝑛 𝑚 𝑛 𝑚
簡記為 𝑥̅ 𝑦 𝑧 ⁄ ∙ 。
𝑠 𝑠 𝑠 𝑠
𝑥̅ 𝑦 𝑧 ⁄ ∙ , 𝑥̅ 𝑦 𝑧 ⁄ ∙
𝑛 𝑚 𝑛 𝑚
簡記為 𝑥̅ 𝑦 𝑧 ⁄ ∙ 。
𝑖. 𝑖. 𝑑. 𝑖. 𝑖. 𝑑.
(C) 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑁 𝜇 , 𝜎 ;𝑌 , 𝑌 , ⋯ , 𝑌 𝑁 𝜇 , 𝜎 ,且假設此二母體互相獨
~ ~
立,𝑛 30,𝑚 30,𝜎 未知【亦即假設兩母體變異數未知但相等】。
因為 𝑍 ~𝑁 0, 1 ,
𝑈 is 𝜒 𝑛 𝑚 2 ,且
Z 與 U 為獨立的隨機變數(數理統計範圍),可得
𝑋 𝑌 𝜇 𝜇
𝜎 𝜎
𝑍 𝑛 𝑚
𝑇
𝑈⁄ 𝑛 𝑚 2
𝑛 1 𝑆 𝑚 1 𝑆
𝑛 𝑚 2
𝜎 𝜎
𝑋 𝑌 𝜇 𝜇
𝑛 1 𝑆 𝑚 1 𝑆 1 1
𝑛 𝑚 2 𝑛 𝑚
𝑋 𝑌 𝜇 𝜇
~𝑡 𝑛 𝑚 2
1 1
𝑆
𝑛 𝑚
其中𝑆 ,
𝑥̅ 𝑦 𝑡 ⁄ 𝑛 𝑚 2 ∙𝑠 ∙ , 𝑥̅ 𝑦 𝑡 ⁄ 𝑛 𝑚 2 ∙𝑠 ∙
簡記為 𝑥̅ 𝑦 𝑡 ⁄ 𝑛 𝑚 2 ∙𝑠 ∙ 。
𝑖. 𝑖. 𝑑. 𝑖. 𝑖. 𝑑.
(D) 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑁 𝜇 , 𝜎 ;𝑌 , 𝑌 , ⋯ , 𝑌 𝑁 𝜇 , 𝜎 ,且假設此二母體互相獨
~ ~
立,𝑛 30,𝑚 30,𝜎 與𝜎 未知,可得 Welch’s T distribution
第 7 章第13頁共47頁
𝑇 ~𝑡 𝑟 ,其中𝑟 ,
若 r 不是整數,則採無條件捨去法取整數。
因此,𝜇 𝜇 的100 1 𝛼 %信賴區間為
𝑠 𝑠 𝑠 𝑠
𝑥̅ 𝑦 𝑡 ⁄ 𝑟 ∙ , 𝑥̅ 𝑦 𝑡 ⁄ 𝑟 ∙
𝑛 𝑚 𝑛 𝑚
簡記為 𝑥̅ 𝑦 𝑡 ⁄ 𝑟 ∙ 。
𝑖. 𝑖. 𝑑.
Example 7.2-1 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑁 𝜇 , 60 ,𝑥̅ 70.1;
~
𝑖. 𝑖. 𝑑.
𝑌 ,𝑌 ,⋯,𝑌 𝑁 𝜇 , 40 ,𝑦 75.3,且假設此二母體互相獨立。
~
試求𝜇 𝜇 的90%信賴區間。
解:𝜇 𝜇 的90%信賴區間為
𝜎 𝜎 𝜎 𝜎
𝑥̅ 𝑦 𝑧 . ∙ , 𝑥̅ 𝑦 𝑧 . ∙
𝑛 𝑚 𝑛 𝑚
60 40 60 40
70.1 75.3 1.645 ∙ , 70.1 75.3 1.645 ∙
15 8 15 8
10.135, 0.265
因為𝜇 𝜇 的90%信賴區間上下限均小於 0,故有90%的信心,相信𝜇 與𝜇 有顯
著差異且𝜇 顯著小於𝜇 。
例1 X 與 Y 兩種品牌電池,抽樣測得其壽命資料如下表:
樣本數 平均壽命(小時) 標準差(小時)
X 40 160 20
第 7 章第14頁共47頁
Y 50 150 16
(a) 求 X 與 Y 兩種品牌電池之平均壽命差𝜇 𝜇 的95%信賴區間。
(b) 在95%的信賴度之下,由(a)之結果,說明𝜇 與𝜇 是否有顯著差異?
解:(a) 𝜇 𝜇 的95%信賴區間為
𝑠 𝑠 𝑠 𝑠
𝑥̅ 𝑦 𝑧 . ∙ , 𝑥̅ 𝑦 𝑧 . ∙
𝑛 𝑚 𝑛 𝑚
20 16 20 16
160 150 1.96 ∙ , 160 150 1.96 ∙
40 50 40 50
2.38, 17.62
1 1
𝑥̅ 𝑦 𝑡 . 22 ∙ 𝑠 ∙
𝑛 𝑚
9 1 60.76 15 1 48.24 1 1
81.31 78.61 2.074 ∙ ∙
9 15 2 9 15
3.65, 9.05
例2 X 與 Y 兩種品牌電池,抽樣測得其壽命資料如下表:(假設 X 與 Y 兩種品牌電池之壽
命皆呈常態分配)
樣本數 平均壽命(小時) 標準差(小時)
X 8 160 10
Y 10 150 20
求 X 與 Y 兩種品牌電池之平均壽命差𝜇 𝜇 的95%信賴區間。
第 7 章第15頁共47頁
解:𝑟 13.77,
取𝑟 13
𝜇 𝜇 的95%信賴區間為
𝑠 𝑠 10 20
𝑥̅ 𝑦 𝑡 . 13 ∙ 160 150 2.16 ∙
𝑛 𝑚 8 10
5.65, 25.65
配對樣本之母體平均數差𝝁𝑫 的信賴區間
配對編號 1 2 … 𝑛
𝑋 𝑋 𝑋 ⋯ 𝑋
𝑌 𝑌 𝑌 ⋯ 𝑌
𝐷 𝑋 𝑌 𝐷 𝐷 ⋯ 𝐷
𝑖. 𝑖. 𝑑.
假設𝐷 , 𝐷 , ⋯ , 𝐷 𝑁 𝜇 , 𝜎 ,𝜇 𝜇 𝜇 ,𝜎 未知且𝑛 30。
~
∑ ∑
令𝐷 ,𝑆 ,可得𝑇 ⁄√
~𝑡 𝑛 1 。
∑ ∑
觀察值為𝑑̅ ,𝑠 。
𝑑̅ 𝑡 ⁄ 𝑛 1 ∙ , 𝑑̅ 𝑡 ⁄ 𝑛 1 ∙
√ √
簡記為 𝑑̅ 𝑡 ⁄ 𝑛 1 ∙ 。
√
𝜇 的 95%信賴區間為 𝑑̅ 𝑡 . 4 ∙ , 𝑑̅ 𝑡 . 4 ∙
√ √
4.30 4.30
10 2.776 ∙ , 10 2.776 ∙
4.66, 15.34
√5 √5
意即有 95%的信心,相信服用 BB 減肥食品一個月,平均體重至少可減輕 4.66 磅,
至多可減輕 15.34 磅。
第 7 章第17頁共47頁
兩樣本的區間估計
X 1 X m N 1 , 12
iid
Y1 Yn N 2 , 22
iid
1 2 ' s 100 1 %的區間估計量
12 22 12 22
:X Y , Var X Y Var X Y
m n m n
12 22
case 1 和 已知 X Y
2 2
Z /2
1
2
m n
S12 S22
case 2 12和 22 未知,但為大樣本 X Y Z / 2
m n
S12 S 22
case 3 和 未知,小樣本 X Y
2 2
t /2 v
1 2
m n
2
S12 S22
Where v Welch d . f . 2
m n
2
(取近似整數)
S12 S22
m n
m 1 n 1
variance)
x x y y
n n
2 2
iid
X 1 X m E X 1 ,Var X 2 i j
SP2 i 1 i 1
綜合樣本變異數
iid
mn2
Y1 Yn E Y 2 ,Var Y 2
(Recall)
第 7 章第18頁共47頁
2
2
Var X Y 1
2
m n
1 1
X Y N 1 2 , 2
m n
m n
m n
xi x yi y i yi y
2 2 2 2
x x
i 1
i 1
~ 2 m n 2 且 x y i 1 i 1
2 2 2
2
X Y 1 2
1 1 2
X Y 1 2
m n
T t m n 2
1 1 2
x x y y
n n
2 2
i j SP
i 1 j 1 m n
/mn2
2
1
Where S P 2
mn2
m 1 S X2 n 1 SY2
X Y 1 2
1 P t /2 m n 2 t /2 m n 2
1 1 2
SP
m n
1 1
P 1 2 X Y S P2 t /2 m n 2
m n
Ex.
n N 1 ,
iid
2
1 X X
X Y W Y1 Yn N 2 , a 2 且a, b已知
iid
W1 Wn N 3 , b 2
iid
解答
1 a b 2
X Y W N 1 +2 3 ,
n
第 7 章第19頁共47頁
2
a 2
b 2
Var X Y W V X V Y V W
n n n
1 n 1 n
y j y
n n n n
xi x wk w
2 2
xi x wk w
2 2
2 2
y j y
a j 1 b k 1
i 1
j 1
k 1
i 1
2 3n 3
2
a 2
b 2
2
1 1
y j y wk w
n n n
x x
2 2 2
i
i 1 a j 1 b k 1
Let A S2
3n 3
X Y W 1 2 3
~ N (0,1)
1 a b 2
X Y W 1 2 3
n
T ~ t 3n 3 .
3n 3 A / 2 2 2 3n 3
1/ 2
1 a b
~
A
3n 3 3n 3
n
(再比照上式作 1 即知 C. I.)
第 7 章第20頁共47頁
母體變異數𝝈𝟐 的信賴區間
𝑖. 𝑖. 𝑑.
假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑁 𝜇, 𝜎 ,𝜎 未知,可得𝜒 ~𝜒 𝑛 1 ,則
~
𝜎的100 1 𝛼 %信賴區間為 , 。
⁄ ⁄
證明:
1 𝛼 𝑃𝜒 ⁄ 𝑛 1 𝜒 𝜒 ⁄ 𝑛 1
𝑃 𝜒 ⁄ 𝑛 1 𝜒 ⁄ 𝑛 1
𝑃 𝜎
⁄ ⁄
例4 在墨西哥發現一種開花植物 Guardiola,其種子成熟所需天數呈常態分配𝑁 𝜇, 𝜎 。
若隨機抽出𝑛 13顆窄葉種子,得𝑥̅ 18.97,12𝑠 ∑ 𝑥 𝑥̅ 128.41。
(a) 求𝜎 的90%信賴區間。
(b) 求𝜎的90%信賴區間。
. .
解:(a) 𝜎 的90%信賴區間為 , , 6.11, 24.57 。
. . . .
. .
(b) 𝜎的90%信賴區間為 , , 2.47, 4.96 。
. . . .
第 7 章第21頁共47頁
⁄
若𝑈~𝜒 𝑟 ,𝑉~𝜒 𝑟 ,𝑈與𝑉為獨立的隨機變數,則𝐹 ⁄
為具有自由度為 𝑟 , 𝑟
,以符號簡記成𝐹~𝐹 𝑟 , 𝑟 。
之𝐹分配(𝐹 distribution)
𝑖. 𝑖. 𝑑. 𝑖. 𝑖. 𝑑.
假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑁 𝜇 , 𝜎 ;𝑌 , 𝑌 , ⋯ , 𝑌 𝑁 𝜇 , 𝜎 ,且假設此二母體互相
~ ~
獨立,則
【1】𝑈 ~𝜒 𝑛 1
【2】𝑉 ~𝜒 𝑚 1
【3】𝑈與𝑉為獨立的隨機變數
【4】由【1】【2】【3】可得
𝑛 1 𝑆
𝑛 1
𝑈⁄ 𝑛 1 𝜎 𝑆 ⁄𝜎
𝐹 ~𝐹 𝑛 1, 𝑚 1
𝑉⁄ 𝑚 1 𝑚 1 𝑆 𝑆 ⁄𝜎
𝑚 1
𝜎
𝝈𝟐
兩獨立母體變異數比 𝑿𝟐 的信賴區間
𝝈𝒀
𝑖. 𝑖. 𝑑. 𝑖. 𝑖. 𝑑.
假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑁 𝜇 , 𝜎 ;𝑌 , 𝑌 , ⋯ , 𝑌 𝑁 𝜇 , 𝜎 ,且假設此二母體互相獨
~ ~
立,可得𝐹 ~𝐹 𝑛 1, 𝑚 1 。
∙ , ∙ 或
⁄ , ⁄ ,
∙ , ∙𝐹 ⁄ 𝑚 1, 𝑛 1 ;
⁄ ,
∙ , ∙ 或
⁄ , ⁄ ,
∙ , ∙𝐹 ⁄ 𝑚 1, 𝑛 1 。
⁄ ,
證明:
第 7 章第22頁共47頁
𝑆 ⁄𝜎
1 𝛼 𝑃 𝐹 ⁄ 𝑛 1, 𝑚 1 𝐹 ⁄ 𝑛 1, 𝑚 1
𝑆 ⁄𝜎
𝑃 ∙
⁄ , ⁄ ,
𝑆 1 𝜎 𝑆 1
𝑃 ∙ ∙
𝑆 𝐹 ⁄ 𝑛 1, 𝑚 1 𝜎 𝑆 𝐹 ⁄ 𝑛 1, 𝑚 1
可得 的100 1 𝛼 %信賴區間為 ∙ , ∙ 。
⁄ , ⁄ ,
異。
有顯著差異且𝜎 顯著大於𝜎 。
有顯著差異且𝜎 顯著小於𝜎 。
例5 在墨西哥發現一種開花植物 Guardiola,其窄葉種子成熟所需天數呈常態分配
𝑁 𝜇 , 𝜎 ;寬葉種子成熟所需天數呈常態分配𝑁 𝜇 , 𝜎 。若隨機抽出𝑛 13顆窄葉種
子,得𝑥̅ 18.97,12𝑠 ∑ 𝑥 𝑥̅ 128.41;隨機抽出𝑚 9顆寬葉種子,得
𝑦 23.20,8𝑠 ∑ 𝑦 𝑦 36.72。
(a) 求 的98%信賴區間。
(c) 求 的98%信賴區間。
解:(a) 的98%信賴區間為 ∙ , ∙𝐹 . 8, 12
. ,
128.41/12 1 128.41/12
∙ , ∙ 4.50 0.41, 13.22
36.72/8 5.67 36.72/8
第 7 章第23頁共47頁
異。
n
xi
2
1 i 1 2 n 已知, 推論 2
2
n
xi xn
2
2
i 1
2 n 1 未知, 推論 2
2
F-distribution
U 2 v1 U / v1
且U V F F v1 , v2
V v2
2
V / v2
特性
1 F v.s. Beta
v1 U v U V 1 V v v
F 1 1 F Beta 2 , 1
1 1 F U V 2 2
v2 V v2 V v
v2
2 抽樣式
m N 1 , 1
iid
2
X
1 X
X Y
Y1 Yn N 2 , 22
iid
n n
xi 1 y
2 2
i 2
i 1
2 m , i 1
2 n
2
1 2
2
x
2
n i 1 /m
x
2 i 1
1 / 2
1 n
y
i 2
i 1
i 2 /n
F m i 1
F m, n
n
12 / 22
y
2
i 2 / 2
2
i 1
n
case 2 1和 2 未知
第 7 章第25頁共47頁
n n
x x y y
2 2
i i
i 1
2 m 1 , i 1
2 n 1
12 22
n
x
2
n i 1 / m 1
x x
2 i 1
/ 2
1 n
y
i 2
i 1
i 2 / n 1
F m 1 i 1
F m 1, n 1
n
12 / 22
y y
2
i / 2
2
i 1
n 1
F 分配即是推論兩母體變異數是否相等時所需的樞紐量之近似分配。
第 7 章第26頁共47頁
無限母體,母體比例𝒑的信賴區間
𝑖. 𝑖. 𝑑.
若𝑋 , 𝑋 , ⋯ , 𝑋 𝑏 1, 𝑝 ,
~
(1) 𝑌 ∑ 𝑋 ~𝑏 𝑛, 𝑝 且𝐸 𝑌 𝑛𝑝,𝑉𝑎𝑟 𝑌 𝑛𝑝𝑞。
∑
(2) 𝑃 為樣本比例且𝐸 𝑃 𝑝,𝑉𝑎𝑟 𝑃 。當樣本數夠大時,由中央極限定
理,可得 𝑍 分配近似𝑁 0, 1 。
簡記為 𝑝̂ 𝑧 ⁄ 。
證明:【方法一】
1 𝛼 𝑃 𝑧 ⁄ 𝑧 ⁄
𝑃 𝑃 𝑧 ⁄ 𝑝 𝑃 𝑧 ⁄
𝑃𝑄 𝑃𝑄
𝑃 𝑃 𝑧 ⁄ 𝑝 𝑃 𝑧 ⁄
𝑛 𝑛
可得𝑝的100 1 𝛼 %信賴區間為 𝑝̂ 𝑧 ⁄ , 𝑝̂ 𝑧 ⁄ 。
證明:【方法二】
𝑃 𝑝 𝑃 𝑝
1 𝛼 𝑃⎛ 𝑧 ⁄ 𝑧 ⁄
⎞ 𝑃⎛ 𝑧 ⁄
⎞
𝑝𝑞 𝑝𝑞
⎝ 𝑛 ⎠ ⎝ 𝑛 ⎠
解不等式 𝑧 ⁄ ,可得 𝑃 𝑝 𝑧 / ∙
/ /
⇒ 1 𝑝 2𝑃 𝑝 𝑃 0
第 7 章第27頁共47頁
/ / / /
/ /
⇒ 𝑝
/ /
可得𝑝的100 1 𝛼 %信賴區間為
⎡ 𝑧 / 𝑃 1 𝑃 𝑧 / 𝑧 / 𝑃 1 𝑃 𝑧 / ⎤
⎢ 𝑃 2𝑛
𝑧 / 𝑛 4𝑛
𝑃
2𝑛
𝑧 / 𝑛 4𝑛 ⎥
⎢ , ⎥
⎢ 𝑧 / 𝑧 / ⎥
⎢ 1 1 ⎥
𝑛 𝑛
⎣ ⎦
/ / /
當𝑛很大時, 0, 0, 0;令𝑞 1 𝑝̂ ,可得
𝑝的100 1 𝛼 %信賴區間為 𝑝̂ 𝑧 ⁄ , 𝑝̂ 𝑧 ⁄ 。
𝐛 𝑝的 95%信賴區間為
185 166
𝑝̂ 𝑞 185 351 351
𝑝̂ 𝑧 . 1.96
𝑛 351 351
兩獨立母體比例差𝒑𝟏 𝒑𝟐 的信賴區間
令𝑃 ,𝑃 ,則
(1) 𝐸 𝑃 𝑃 𝑝 𝑝
第 7 章第28頁共47頁
(2) 𝑉𝑎𝑟 𝑃 𝑃
𝑝̂ 𝑝̂ 𝑧 ⁄ , 𝑝̂ 𝑝̂ 𝑧 ⁄ ,
簡記為 𝑝̂ 𝑝̂ 𝑧 ⁄ 。
證明:1 𝛼 𝑃 𝑧 ⁄ 𝑧 ⁄
𝑃 𝑃 𝑃 𝑧 ⁄ 𝑝 𝑝 𝑃 𝑃 𝑧 ⁄
𝑃𝑄 𝑃𝑄 𝑃𝑄 𝑃𝑄
𝑃 𝑃 𝑃 𝑧 ⁄ 𝑝 𝑝 𝑃 𝑃 𝑧 ⁄
𝑛 𝑛 𝑛 𝑛
𝑝̂ 𝑝̂ 𝑧 ⁄ , 𝑝̂ 𝑝̂ 𝑧 ⁄ 。
1, 𝑝̂ 𝑝̂ 𝑧 。
𝑝̂ 𝑝̂ 𝑧 , 1。
(b) 𝑝 𝑝 的90%信賴區間為 𝑝̂ 𝑝̂ 𝑧 .
63 28 42 37
63 42 91 91 79 79
1.645
91 79 91 79
估計母體平均數𝝁所需的樣本數𝒏與抽樣誤差𝜺
𝑖. 𝑖. 𝑑.
假設𝑋 , 𝑋 , ⋯ , 𝑋 𝜇, 𝜎 ,任何母體,樣本數𝑛為大樣本。
~
若𝜎未知,則以樣本標準差𝑠取代𝜎。
(2) 當樣本數 n 未知,以𝑋估計𝜇的100 1 𝛼 %最大估計誤差為𝜀,則樣本數
⁄
𝑛 且以無條件進位法取整數。若𝜎未知,則辦理試查後,以樣本標
準差𝑠取代𝜎。標準差𝜎愈小,則抽樣調查所需的樣本數𝑛愈小;當𝜎 0時,
抽樣調查所需的樣本數𝑛 1即可。
證明:由中央極限定理,可得𝑍 ⁄√
近似𝑁 0, 1
| |
1 𝛼 𝑃 |𝑋 𝜇| 𝜀 𝑃 ⁄√ ⁄√
𝑃 |𝑍| ⁄√
⁄
可得 ⁄√
𝑧 ⁄ ⇒ 𝜀 𝑧 ⁄ ∙ and 𝑛 .
√
例1 為估計一部計程車一天行駛十小時,使用汽油燃料費之平均金額𝜇。今隨機抽出 200
部計程車從事試驗,得知使用汽油燃料費之平均金額𝑥̅ 600元,標準差𝑠 200元。
(a) 求以𝑋估計𝜇的 95%最大估計誤差。
(b) 若要求樣本平均數𝑋與母體平均數𝜇之誤差不能超過 20 元,且要有 95%的可信度,
則題目中的樣本數是否足夠?若不夠,則樣本數至少需再增加多少?
無限母體,估計母體比例𝒑所需的樣本數𝒏與抽樣誤差𝜺
𝑖. 𝑖. 𝑑.
假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑏 1, 𝑝 ,樣本數𝑛為大樣本。
~
若𝑝未知,則以樣本比例𝑝̂ 取代𝑝。
(2) 當樣本數𝑛未知,以𝑃估計𝑝的100 1 𝛼 %最大估計誤差為 ,則樣本數
⁄ √
𝑛 且以無條件進位法取整數。若𝑝未知,可採用下列方法:
𝑝𝑞 𝑝 1 𝑝 ∙ 。
證明:由中央極限定理,可得𝑍 近似 𝑁 0, 1
| |
1 𝛼 𝑃 𝑃 𝑝 𝜀 𝑃 𝑃 |𝑍|
⁄ √
可得 𝑧 ⁄ ⇒ 𝜀 𝑧 ⁄ ∙ and 𝑛 .
例2 為估計某電視節目之收視率𝑝,節目部經理要求調查結果的收視率𝑃(樣本比例)與
實際的收視率𝑝(母體比例)之誤差不能超過 2%,且要有 95%的可信度。
(a) 若沒有提供有關收視率𝑝之訊息,又沒有辦理試查,則樣本數至少需取多少?
(b) 若在該電視節目播放中,隨機抽出 800 戶家庭做收視率調查,結果有 64 戶家庭表
示正收看該電視節目,則題目中的樣本數是否足夠?若不夠,則樣本數至少需再增
加多少?
(c) 由(b)之收視率調查結果,求以𝑃估計𝑝的 95%最大估計誤差。
解:(a) 𝜀 0.02, 𝛼 0.05
第 7 章第32頁共47頁
. ∙
. √
𝑛 2401,至少需取𝑛 2401。
.
𝑝̂ 𝑞 0.08 0.92
𝑧 . ∙ 1.96 0.0188 1.88%
𝑛 800
. ∙
. √
𝑛 1067.11,至少需取𝑛 1068。
.
有限母體,母體比例𝒑的信賴區間
𝑁 𝑁 𝑁
𝑁 𝑁
抽出不放回
𝑛
𝑋 𝑛 𝑋
若𝑋~𝐻 𝑁, 𝑛, 𝑁 ,𝑝 為母體比例,則
當樣本數𝑛 30時,由中央極限定理,可得 𝑍 近似 𝑁 0, 1
∙
𝑝̂ 𝑞 𝑁 𝑛 𝑝̂ 𝑞 𝑁 𝑛
𝑝̂ 𝑧 ⁄ ∙ , 𝑝̂ 𝑧 ⁄ ∙
𝑛 𝑁 1 𝑛 𝑁 1
簡記為 𝑝̂ 𝑧 ⁄ ∙
例3 從商學院1000位學生中,隨機抽出100位學生調查,其中有30位贊同暑期實習制
度。試問贊同暑期實習制度之學生比率𝑝的95%信賴區間為何?
𝑝的95%信賴區間為
. .
𝑝̂ 𝑧 . ∙ 0.3 1.96 ∙
有限母體,估計母體比例𝒑所需的樣本數𝒏與抽樣誤差𝜺
假設𝑋~𝐻 𝑁, 𝑛, 𝑁 ,𝑝 ,樣本數𝑛為大樣本。
若𝑝未知,則以樣本比例𝑝̂ 取代𝑝。
(2) 當樣本數𝑛未知,以𝑃估計𝑝的100 1 𝛼 %最大估計誤差為ε,則樣本數
⁄ √
𝑛 ,,其中𝑚 且以無條件進位法取整數。
若𝑝未知,可採用下列方法:
(a) 辦理試查後,以樣本比例𝑝̂ 取代𝑝。
𝑝𝑞 𝑝 1 𝑝 ∙ 。
證明:由中央極限定理,可得𝑍 近似 𝑁 0, 1
∙
| |
1 𝛼 𝑃 𝑃 𝑝 𝜀 𝑃 𝑃 |𝑍|
∙ ∙ ∙
可得 𝑧 ⁄
∙
𝑝𝑞 𝑁 𝑛
𝜀 𝑧 ⁄ ∙
𝑛 𝑁 1
∙ ⁄ ∙
𝑛 【由上式化簡得之】
⁄ ∙
⁄ ∙ /
【分子分母同除以𝑁𝜀 】
⁄ ∙ /
⁄ √
,,其中𝑚 。
. ∙
. √
𝑚 1067.11,取𝑚 1068。
.
𝑛 787.80,取𝑛 788。
第 7 章第36頁共47頁
變數間的關係:
函數關係:變數與變數間的關係一定,無誤差存在,即所有觀察值 𝑥, 𝑦 全落在同
一直線或同一曲線上,此種函數關係模式,稱為確定性模式(deterministic
model)。例如:𝑦 10000 40𝑥。
統計關係:變數與變數間的關係有誤差存在,即所有觀察值 𝑥, 𝑦 並不全落在同一
直線或同一曲線上,此種統計關係模式,稱為機率模式(probabilistic model),本
節主要討論的模式即屬此一模式。例如:𝑦 10000 40𝑥 𝜀,其中𝜀為隨機誤差
項。
散佈圖(scatter plot):由描述統計關係的散佈點,所繪出的統計圖,每一個散佈點代表
一個觀察值,如 Figure 6.5-1 所示:
第 7 章第37頁共47頁
簡單線性迴歸模式
1. 簡單線性迴歸模式為 𝑌 𝛼 𝛽𝑥 𝜀 ,
此處
𝑌 為因變數在第𝑖次試驗的值;
𝑥 為獨立變數在第𝑖次試驗的值,是一個已知常數;
𝛼 為參數,代表𝑌軸截距(僅在模式中,含𝑥 0時,才有意義);
𝛽為參數,代表斜率(意即當𝑥每增加 1 單位,則𝑌增加𝛽單位);
𝑖. 𝑖. 𝑑.
𝜀 為隨機誤差項,而且假設𝜀 , 𝜀 , ⋯ , 𝜀 𝑁 0, 𝜎 。
~
𝑖. 𝑖. 𝑑.
3. 因為𝜀 , 𝜀 , ⋯ , 𝜀 𝑁 0, 𝜎 ,可知𝐸 𝜀 0且𝑉𝑎𝑟 𝜀 𝜎 ;𝑖 1, 2, ⋯ , 𝑛。
~
𝛼 𝛽𝑥 是常數,可得
𝐸 𝑌 𝐸 𝛼 𝛽𝑥 𝜀 𝛼 𝛽𝑥 𝐸 𝜀 𝛼 𝛽𝑥
𝑉𝑎𝑟 𝑌 𝑉𝑎𝑟 𝛼 𝛽𝑥 𝜀 𝑉𝑎𝑟 𝜀 𝜎
由上述結果可知𝑌 , 𝑌 , ⋯ , 𝑌 為互相獨立的隨機變數且
𝑌 ~𝑁 𝛼 𝛽𝑥 , 𝜎 ;𝑖 1, 2, ⋯ , 𝑛。
4. 𝑌 𝛼 𝛽𝑥 𝜀 𝛼 𝛽𝑥̅ 𝛽 𝑥 𝑥̅ 𝜀 𝛼 𝛽 𝑥 𝑥̅ 𝜀
可知𝑌 , 𝑌 , ⋯ , 𝑌 為互相獨立的隨機變數且𝑌 ~𝑁 𝛼 𝛽 𝑥 𝑥̅ , 𝜎 ;𝑖 1, 2, ⋯ , 𝑛。
1 𝑦 𝛼 𝛽 𝑥 𝑥̅
exp
√2𝜋𝜎 2𝜎
1 𝑦 𝛼 𝛽 𝑥 𝑥̅
𝐿 𝛼, 𝛽, 𝜎 exp
√2𝜋𝜎 2𝜎
∑ ̅
exp
, , ∑ ̅
⎧ 0 ⋯⋯⋯⋯ 1
⎪ , , ∑ ̅ ̅
Set 0 ⋯⋯ 2
⎨
⎪ , , ∑ ̅
0 ⋯⋯ 3
⎩
By (1) ⇒ ∑ 𝑦 𝑛𝛼 𝛽∑ 𝑥 𝑥̅ 0
⇒∑ 𝑦 𝑛𝛼 0 [∵ ∑ 𝑥 𝑥̅ 0
⇒ 𝛼 𝑌 ⋯⋯ 4
By (2)(4) ⇒ ∑ 𝑦 𝑦 𝑥 𝑥̅ 𝛽∑ 𝑥 𝑥̅ 0
∑ ̅ ∑ ̅ ∑ ̅
⇒𝛽 ∑ ̅ ∑ ̅ ∑ ̅
.
⇒ 𝑛𝜎 𝑦 𝛼 𝛽 𝑥 𝑥̅
𝑦 𝑦 𝛽 𝑥 𝑥̅
∑ 𝑦 𝑦 2𝛽 ∑ 𝑥 𝑥̅ 𝑦 𝑦 𝛽 ∑ 𝑥 𝑥̅
𝑆 2𝛽𝑆 𝛽 𝑆
𝑆 2𝛽𝑆 𝛽∙ ∙𝑆
𝑆 𝛽𝑆 .
By (1) ⇒ ∑ 𝑦 𝑛𝛼 𝛽∑ 𝑥 𝑥̅ 0
⇒∑ 𝑦 𝑛𝛼 0 [∵ ∑ 𝑥 𝑥̅ 0
⇒ 𝛼 𝑌 ⋯⋯ 3
By (2)(3) ⇒ ∑ 𝑦 𝑦 𝑥 𝑥̅ 𝛽∑ 𝑥 𝑥̅ 0
∑ ̅ ∑ ̅ ∑ ̅
⇒𝛽 ∑ ̅ ∑ ̅ ∑ ̅
.
第 7 章第39頁共47頁
7. 𝐸 𝑌 𝛼 𝛽 𝑥 𝑥̅ 𝜇 𝑥 稱之為迴歸函數(regression function)。
利用𝑌 𝛼 𝛽 𝑥 𝑥̅ 估計𝐸 𝑌 𝛼 𝛽 𝑥 𝑥̅ 𝜇 𝑥 。
𝑌 𝛼 𝛽 𝑥 𝑥̅ 稱之為最小平方迴歸線(the least squares regression line)或估計
迴歸方程式(the estimated regression equation)
。
因為𝑌 𝛼 𝛽 𝑥 𝑥̅ 𝑌 𝛽 𝑥 𝑥̅ ,故最小平方迴歸線一定會通過 𝑥̅ , 𝑌 點。
9. 殘差和∑ 𝑒 ∑ 𝑌 𝑌 ∑ 𝑌 𝛼 𝛽 𝑥 𝑥̅
∑ 𝑌 𝑌 𝛽 𝑥 𝑥̅
∑ 𝑌 𝑌 𝛽∑ 𝑥 𝑥̅ 0
(假設簡單線性迴歸模式適用於本例)
(a) 求最小平方迴歸線。
(b) 求𝜎 的最大概似估計值。
第 7 章第40頁共47頁
(c) 繪出殘差圖。
𝛼 𝑦 81.3
𝑆 ∑ 𝑥 10𝑥̅ 47405 10 68.3 756.1
𝑆 ∑ 𝑥 𝑦 𝑛𝑥̅ 𝑦 56089 10 68.3 81.3 561.1
.
𝛽 0.7421
.
(c)
𝛼的機率分配
分配。𝐸 𝛼 𝐸 𝑌 ∑ 𝐸 𝑌 ∑ 𝛼 𝛽 𝑥 𝑥̅ 𝛼且
𝑌 , 𝑌 , ⋯ , 𝑌 的線性函數。因此,𝛽的機率分配為常態分配。
∑ 𝑥 𝑥̅ 𝐸 𝑌 ∑ 𝑥 𝑥̅ 𝛼 𝛽 𝑥 𝑥̅
𝐸 𝛽
∑ 𝑥 𝑥̅ ∑ 𝑥 𝑥̅
∑ ̅ ∑ ̅
∑ ̅
𝛽
∑ 𝑥 𝑥̅ 𝑉𝑎𝑟 𝑌 𝜎 𝜎
𝑉𝑎𝑟 𝛽
∑ 𝑥 𝑥̅ ∑ 𝑥 𝑥̅ 𝑆
可得 𝛽~𝑁 𝛽, 。
第 7 章第42頁共47頁
Let ~𝜒 𝑟 , ~𝜒 𝑟 , ~𝜒 𝑟 , ⋯ , ~𝜒 𝑟 .
If 𝑄 0, then
(a) 𝑄 , 𝑄 , ⋯ , 𝑄 are mutually independent, and hence,
(b) ~𝜒 𝑟 , where 𝑟 𝑟 𝑟 𝑟 ⋯ 𝑟 .
∑ 𝑌 𝛼 𝛽 𝑥 𝑥̅ ∑ 𝛼 𝛼 𝛽 𝛽 𝑥 𝑥̅ 𝑌 𝛼 𝛽 𝑥 𝑥̅
𝑛 𝛼 𝛼 𝛽 𝛽 ∑ 𝑥 𝑥̅ ∑ 𝑌 𝛼 𝛽 𝑥 𝑥̅ 【left as exercise】
𝑛 𝛼 𝛼 𝛽 𝛽 𝑆 𝑆𝑆𝐸 ⋯ ⋯ ⋯ ⋯ 1
𝑖𝑛𝑑.
∵𝑌 𝑁𝛼 𝛽 𝑥 𝑥̅ , 𝜎 ;𝑖 1, 2, ⋯ , 𝑛
~
̅ 𝑖. 𝑖. 𝑑.
⇒ 𝜒 1 ;𝑖 1, 2, ⋯ , 𝑛
~
∑ ̅
⇒ ~𝜒 𝑛 ⋯ ⋯ ⋯ ⋯ 2
𝜎
∵ 𝛼 ~𝑁 𝛼,
𝑛
𝛼 𝛼
⇒ ~𝑁 0, 1
𝜎⁄√𝑛
⇒ ~𝜒 1 ⋯ ⋯ ⋯ ⋯ 3
/
𝜎
∵ 𝛽 ~𝑁 𝛽,
𝑆
𝛽 𝛽
⇒ ~𝑁 0, 1
𝜎⁄ 𝑆
⇒ ~𝜒 1 ⋯ ⋯ ⋯ ⋯ 4
/
※ 𝜎 的最大概似估計量為
※ 𝜎 的不偏估計量為 𝑀𝑆𝐸
𝑆𝑆𝐸 ∑ 𝑦 𝛼 𝛽 𝑥 𝑥̅
𝑦 𝑦 𝛽 𝑥 𝑥̅
∑ 𝑦 𝑦 2𝛽 ∑ 𝑥 𝑥̅ 𝑦 𝑦 𝛽 ∑ 𝑥 𝑥̅
𝑆 2𝛽𝑆 𝛽 𝑆
𝑆 2𝛽𝑆 𝛽∙ ∙𝑆
𝑆 𝛽𝑆 .
⁄√
𝑇 ~𝑡 𝑛 2
⁄
𝛼 𝛼
1 𝛾 𝑃 𝑡 ⁄ 𝑛 2 𝑡 ⁄ 𝑛 2
𝑀𝑆𝐸 ⁄𝑛
𝑃 𝛼 𝑡 ⁄ 𝑛 2 𝛼 𝛼 𝑡 ⁄ 𝑛 2
可得𝛼的100 1 𝛾 %信賴區間為 𝛼 𝑡 ⁄ 𝑛 2 。
※ 僅在模式中,含𝑥 0時,才有意義。
第 7 章第44頁共47頁
⁄
𝑇 ~𝑡 𝑛 2
⁄
𝛽 𝛽
1 𝛾 𝑃 𝑡 ⁄ 𝑛 2 𝑡 ⁄ 𝑛 2
𝑀𝑆𝐸 ⁄𝑆
𝑃 𝛽 𝑡 ⁄ 𝑛 2 𝛽 𝛽 𝑡 ⁄ 𝑛 2
可得𝛽的100 1 𝛾 %信賴區間為 𝛽 𝑡 ⁄ 𝑛 2 。
~𝜒 𝑛 2
𝑆𝑆𝐸
1 𝛾 𝑃 𝜒 ⁄ 𝑛 2 𝜒 ⁄ 𝑛 2
𝜎
𝑃 𝜎
⁄ ⁄
(c) 𝛼的95%信賴區間為
.
𝛼 𝑡 . 8 81.3 2.306 77.50, 85.10 .
第 7 章第45頁共47頁
(d) 𝛽的95%信賴區間為
.
𝛽 𝑡 . 8 0.7421 2.306 0.30, 1.18 .
.
(e) 𝜎 的95%信賴區間為
. .
, , 12.41, 99.87 .
. . . .
𝐸 𝑌 𝛼 𝛽 𝑥 𝑥̅ 𝜇 𝑥 的區間估計
1. 𝐸 𝑌 𝛼 𝛽 𝑥 𝑥̅ 𝜇 𝑥 的點估計量為𝑌 𝛼 𝛽 𝑥 𝑥̅ 。
2. 𝛼與𝛽是常態隨機變數𝑌 , 𝑌 , ⋯ , 𝑌 的線性函數,可得𝑌 𝛼 𝛽 𝑥 𝑥̅ 亦是常態隨機
變數𝑌 , 𝑌 , ⋯ , 𝑌 的線性函數。因此,𝑌 𝛼 𝛽 𝑥 𝑥̅ 的機率分配為常態分配。
3. 𝐸 𝑌 𝐸𝛼 𝛽 𝑥 𝑥̅ 𝛼 𝛽 𝑥 𝑥̅ 𝜇 𝑥
可得𝑌是𝜇 𝑥 的不偏估計量。
4. 𝑉𝑎𝑟 𝑌 𝑉𝑎𝑟 𝛼 𝛽 𝑥 𝑥̅
𝑉𝑎𝑟 𝛼 𝑥 𝑥̅ 𝑉𝑎𝑟 𝛽 [因為𝛼與𝛽互相獨立]
𝑥 𝑥̅
1 𝑥 𝑥̅
𝜎
𝑛 𝑆
註: 若𝑥與𝑥̅ 之差值愈大,則 𝑥 𝑥̅ 愈大,可得𝑉𝑎𝑟 𝑌 愈大。若𝑥與𝑥̅ 之差值愈小,
則 𝑥 𝑥̅ 愈小,可得𝑉𝑎𝑟 𝑌 愈小。
̅
5. 𝑌~𝑁 𝜇 𝑥 , 𝜎 ,可得
𝑍 ~𝑁 0, 1
𝑇 ~𝑡 𝑛 2
√
6. 1 𝛾 𝑃 𝑡 ⁄ 𝑛 2 𝑡 ⁄ 𝑛 2
√
̅ ̅
𝑃 𝑌 𝑡 ⁄ 𝑛 2 √𝑀𝑆𝐸 𝜇 𝑥 𝑌 𝑡 ⁄ 𝑛 2 √𝑀𝑆𝐸
̅
可得𝜇 𝑥 的100 1 𝛾 %信賴區間為 𝑦 𝑡 ⁄ 𝑛 2 √𝑀𝑆𝐸 。
第 7 章第46頁共47頁
新觀察值𝑌 的預測
1. 以𝑌 𝛼 𝛽 𝑥 𝑥̅ 預測𝑌 ,其中𝛼 與𝛽是由 𝑥 , 𝑌 , 𝑥 , 𝑌 , ⋯ , 𝑥 , 𝑌 估計
得來的。
∑
2. 𝑌 𝛼 𝛽 𝑥 𝑥̅ 𝜀 ,𝜀 ~𝑁 0, 𝜎 ,其中𝑥̅ 。
3. 預測誤差 𝑊 𝑌 𝑌 𝑌 𝛼 𝛽 𝑥 𝑥̅ 是常態隨機變數𝑌 , 𝑌 , ⋯ , 𝑌
的線性函數,可得𝑊的機率分配為常態分配。
4. 𝐸 𝑊 𝐸 𝑌 𝑌 𝐸𝑌 𝛼 𝛽 𝑥 𝑥̅
𝛼 𝛽 𝑥 𝑥̅ 𝛼 𝛽 𝑥 𝑥̅ 0
5. 𝑉𝑎𝑟 𝑊 𝑉𝑎𝑟 𝑌 𝑌
𝑉𝑎𝑟 𝑌 𝛼 𝛽 𝑥 𝑥̅
𝑉𝑎𝑟 𝑌 𝑉𝑎𝑟 𝛼 𝑥 𝑥̅ 𝑉𝑎𝑟 𝛽
𝜎 𝑥 𝑥̅
̅
𝜎 1
̅
6. 𝑊 𝑌 𝑌 ~𝑁 0, 𝜎 1 ,可得
𝑍 ~𝑁 0, 1
𝑇 ~𝑡 𝑛 2
√
7. 1 𝛾 𝑃 𝑡 ⁄ 𝑛 2 𝑡 ⁄ 𝑛 2
√
1 𝑥 𝑥̅
𝑃 𝑌 𝑡 ⁄ 𝑛 2 √𝑀𝑆𝐸 1 𝑌
𝑛 𝑆
1 𝑥 𝑥̅
𝑌 𝑡 ⁄ 𝑛 2 √𝑀𝑆𝐸 1
𝑛 𝑆
.
75.1406 2.306 √27.21
.
75.1406 5.2586
69.8820, 80.3992
.
75.1406 2.306 √27.21 1
.
75.1406 13.1280
62.0126, 88.2686
比較(a)與(b)發現,在同一信賴度與同一𝑥值下,預測區間的長度較信賴區間的長度寬,乃是
因為預測區間是對隨機變數(為一變動值)做預測,而信賴區間是對參數(為一固定值)做
估計。