高統講義ch7 20230904

第 7 章第1頁共47頁
Chapter 7 Interval Estimation
楔子，以一個真實故事開始。
某統計考試後後，一些學生找老師問班上成績為何？老師表示等上課之後再統一公布。生：
能否先透露一些訊息？師：平均大概 50 分，正負 50 分的話為 100％信賴區間。生：…，能
否精準些？師：平均約 50 分，正負 20 分的話為 95％信賴區間。
7.1 Confidence Intervals for Means
從參數為𝜃之母體抽出一組隨機樣本𝑋 , 𝑋 , ⋯ , 𝑋 ，則母體參數𝜃的區間估計型式為
𝑃 𝐿 𝜃 𝑈 1 𝛼
其中0 𝛼 1，而1 𝛼稱之為信賴係數（confidence coefficient）或信賴水準（confidence
level），亦稱之為信賴度（degree of confidence）。𝐿與𝑈為隨機樣本𝑋 , 𝑋 , ⋯ , 𝑋 之函數，皆
為隨機變數，區間 𝐿, 𝑈 稱之為母體參數𝜃的100 1 𝛼 %隨機區間（random interval）；其值
分別以𝑙與𝑢表示，則區間 𝑙, 𝑢 稱之為母體參數𝜃的100 1 𝛼 %信賴區間（confidence
interval），𝑙稱之為信賴下限（lower confidence limit：簡稱 LCL），𝑢稱之為信賴上限
（upper confidence limit：簡稱 UCL）。至於如何決定𝑙與𝑢之值，需由𝜃的點估計量𝜃與𝜃之
抽樣分配來決定，以下將針對不同的參數，詳論如何決定𝑙與𝑢之值。
 母體平均數𝜇的雙尾信賴區間（two-sided confidence interval）
𝑖. 𝑖. 𝑑.
(A) 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑁 𝜇, 𝜎 ，𝜎 已知，可得𝑍 ~𝑁 0, 1 ，則
~ ⁄√
𝜇的100 1 𝛼 %信賴區間為 𝑥̅ 𝑧 ⁄ ∙ , 𝑥̅ 𝑧 ⁄ ∙ ，
√ √
簡記為 𝑥̅ 𝑧 ⁄ ∙
√
簡單記法：[點估計值（分配的臨界值）（點估計量的標準差）]
※ 簡單記法僅適用於𝑍分配與𝑡分配，不適用於𝜒 分配與𝐹分配。
※ 參數𝜃的統計推論，思維四步驟：
(1) 求出參數𝜃的點估計量𝜃
(2) 求出點估計量𝜃的抽樣分配（機率分配）
(3) 畫出點估計量𝜃的抽樣分配圖（機率分配圖）
(4) 由點估計量𝜃的抽樣分配圖，依題意寫出數式
證明：
𝑋 𝜇
1 𝛼 𝑃 𝑧 ⁄ 𝑍 𝑧 ⁄ 𝑃 𝑧 ⁄ 𝑧 ⁄
𝜎⁄√𝑛
𝑃 𝑋 𝑧 ⁄ ∙ 𝜇 𝑋 𝑧 ⁄ ∙
√ √
可得𝜇的100 1 𝛼 %信賴區間為 𝑥̅ 𝑧 ⁄ ∙ , 𝑥̅ 𝑧 ⁄ ∙
√ √
附註，令為等尾，是因在抽樣分配對稱於平均數時，此為最小區間長的信賴區間。
𝑖. 𝑖. 𝑑.
(B) 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝜇, 𝜎 ，任何母體，𝜎 已知或未知皆可，當樣本數夠大時，例
~
如，假設𝑛 30，我們即當成樣本數夠大時，由中央極限定理，可得𝑍 ⁄√
近似𝑁 0, 1 ；若  未知，則以樣本標準差𝑆取代𝜎，亦可得𝑍 ⁄√
近似𝑁 0, 1 ，則𝜇的
100 1 𝛼 %信賴區間為 𝑥̅ 𝑧 ⁄ ∙ , 𝑥̅ 𝑧 ⁄ ∙ 或 𝑥̅ 𝑧 ⁄ ∙ , 𝑥̅ 𝑧 ⁄ ∙
√ √ √ √
簡記為 𝑥̅ 𝑧 ⁄ ∙ 或 𝑥̅ 𝑧 ⁄ ∙
√ √
𝑖. 𝑖. 𝑑.
(C) 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑁 𝜇, 𝜎 ，𝜎 未知且承繼上題的假設，假設𝑛 30為樣本數小，
~
可得𝑇 ⁄√
~𝑡 𝑛 1 ，
則𝜇的100 1 𝛼 %信賴區間為 𝑥̅ 𝑡 ⁄ 𝑛 1 ∙ , 𝑥̅ 𝑡 ⁄ 𝑛 1 ∙
√ √
簡記為 𝑥̅ 𝑡 ⁄ 𝑛 1 ∙
√
證明：
1 𝛼 𝑃 𝑡 ⁄ 𝑛 1 𝑇 𝑡 ⁄ 𝑛 1
𝑃 𝑡 ⁄ 𝑛 1 ⁄√
𝑡 ⁄ 𝑛 1
𝑃 𝑋 𝑡 ⁄ 𝑛 1 ∙ 𝜇 𝑋 𝑡 ⁄ 𝑛 1 ∙
√ √
可得𝜇的100 1 𝛼 %信賴區間為 𝑥̅ 𝑡 ⁄ 𝑛 1 ∙ , 𝑥̅ 𝑡 ⁄ 𝑛 1 ∙ .
√ √
Example 7.1-1 假設某廠商所銷售 60 瓦特燈泡之壽命呈常態分配𝑁 𝜇, 1296 ，隨機抽驗 27

個，得平均壽命為𝑥̅ 1478小時，求𝜇的 95%信賴區間。
解：𝜇的 95%信賴區間為
𝑥̅ 𝑧 . ∙ , 𝑥̅ 𝑧 . ∙ 1478 1.96 ∙ , 1478 1.96 ∙

√ √ √ √
1464.42, 1491.58
意即有 95%的信心，相信 60 瓦特燈泡之平均壽命𝜇至少為 1464.42 小時，至多為
1491.58 小時。
Example 7.1-3 假設𝑋為一個美國人一天飲用柳橙汁的數量（公克/天），柳橙栽培者隨機抽

出 576 位美國人做調查，得飲用柳橙汁的樣本平均數為𝑥̅ 133（公克/天）。若𝑋的標
準差為𝜎 96（公克/天），試求𝑋的平均數𝜇的 90%信賴區間。
解：𝜇的 90%信賴區間為
𝑥̅ 𝑧 . ∙ , 𝑥̅ 𝑧 . ∙ 133 1.645 ∙ , 133 1.645 ∙

√ √ √ √
126.42, 139.58
Example 7.1-4 為估計麥考特瓦湖西邊水域湖水之平均含鈉量𝜇（密西根州），隨機抽取 32

單位體積的湖水為樣本，測量其鈉含量（單位：ppm），得如下資料：
13.0 18.5 16.4 14.8 19.4 17.3 23.2 24.9
20.8 19.3 18.8 23.1 15.2 19.9 19.1 18.1
25.1 16.8 20.4 17.4 25.2 23.1 15.3 19.4
16.0 21.7 15.2 21.3 21.5 16.8 15.6 17.6
試求𝜇的 95%信賴區間。
解：𝑛 32, 𝑥̅ 19.07, 𝑠 10.60
𝜇的 95%信賴區間為
√ . √ .
𝑥̅ 𝑧 . ∙ , 𝑥̅ 𝑧 . ∙ 19.07 1.96 ∙ , 19.07 1.96 ∙
√ √ √ √
17.94, 20.20
Example 7.1-5 為估計母牛在泌乳期之平均乳脂肪產量  ，隨機抽出 20 隻泌乳期之母牛，

測量乳脂肪產量（單位：磅）
，得如下資料：
481 537 513 583 453 510 570 500 457 555
618 327 350 643 499 421 505 637 599 392
假設乳脂肪產量呈常態分配𝑁 𝜇, 𝜎 ，試求𝜇的 90%信賴區間。
解：𝑛 20, 𝑥̅ 507.5, 𝑠 89.75
𝜇的 90%信賴區間為
𝑥̅ 𝑡 . 19 ∙ , 𝑥̅ 𝑡 . 19 ∙
√ √
. .
507.5 1.729 ∙ , 507.5 1.729 ∙ 472.8, 542.2
√ √
𝑖. 𝑖. 𝑑.
Example 7.1-2 ＆ Example 7.1-6 (a) 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑁 𝜇, 16 ，則𝜇的 90%信賴區
~
間為 𝑥̅ 1.645 ∙ , 𝑥̅ 1.645 ∙ 。今以電腦從𝑁 50, 16 中模擬 50 組樣本數為 5

√ √
的樣本，計算𝜇的 90%信賴區間，以線段描繪出此 50 個區間，如 Figure 7.1-1(a)所示，

其中有 45 個（90%）信賴區間包含𝜇。
𝑖. 𝑖. 𝑑.
(b) 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑁 𝜇, 𝜎 ，𝜎 未知，則𝜇的 90%信賴區間為 𝑥̅ 2.132 ∙
~
, 𝑥̅ 2.132 ∙ 。今以前面已模擬出 50 組樣本數為 5 的樣本（相同資料），計算𝜇

√ √
的 90%信賴區間，以線段描繪出此 50 個區間，如 Figure 7.1-1(b)所示，其中有 46 個

（大約 90%）信賴區間包含𝜇。
 說明𝜇的 90%信賴區間之意義。
答：隨機抽取𝑘組樣本，則得到𝑘個關於𝜇的信賴區間，其中大約有0.90𝑘信賴區間包含𝜇。
 母體平均數𝝁的單尾信賴區間（one-sided confidence interval）
𝑖. 𝑖. 𝑑.
(D) 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑁 𝜇, 𝜎 ，𝜎 已知，則
~
(1) 𝜇的100 1 𝛼 %下界（lower bound）信賴區間為 𝑥̅ 𝑧 ∙ ,∞ ，

√
(2) 𝜇的100 1 𝛼 %上界（upper bound）信賴區間為 ∞, 𝑥̅ 𝑧 ∙ 。

√
證明：(1) 1 𝛼 𝑃 ⁄√
𝑧 𝑃 𝑋 𝑧 ∙ 𝜇
√
可得𝜇的100 1 𝛼 %下界信賴區間為 𝑥̅ 𝑧 ∙ ,∞ 。
√
(2) 1 𝛼 𝑃 𝑧 ⁄√
𝑃 𝜇 𝑋 𝑧 ∙
√
可得𝜇的100 1 𝛼 %上界信賴區間為 ∞, 𝑥̅ 𝑧 ∙ 。
√
𝑖. 𝑖. 𝑑.
(E) 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝜇, 𝜎 ，任何母體，𝜎 已知或未知皆可，𝑛 30，則
~
(1) 𝜇的100 1 𝛼 %下界信賴區間為 𝑥̅ 𝑧 ∙ , ∞ 或 𝑥̅ 𝑧 ∙ ,∞ ，

√ √
(2) 𝜇的100 1 𝛼 %上界信賴區間為 ∞, 𝑥̅ 𝑧 ∙ 或 ∞, 𝑥̅ 𝑧 ∙ 。

√ √
𝑖. 𝑖. 𝑑.
(F) 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑁 𝜇, 𝜎 ，𝜎 未知且𝑛 30，則
~
(1) 𝜇的100 1 𝛼 %下界信賴區間為 𝑥̅ 𝑡 𝑛 1 ∙ ,∞ ，

√
(2) 𝜇的100 1 𝛼 %上界信賴區間為 ∞, 𝑥̅ 𝑡 𝑛 1 ∙

√
 影響信賴區間寬度的因素
信賴區間的寬度  （信賴上限）－（信賴下限），而會影響信賴區間寬度的因素有：
(1) 點估計量：被估計參數的點估計量可能不只一個，不同的點估計量，其抽樣分配亦不
同，因此會影響信賴區間的寬度。
𝑖. 𝑖. 𝑑.
例如：若𝑋 , 𝑋 , 𝑋 𝑁 𝜇, 𝜎 ，則
~
𝑋 與𝑊 皆可作為𝜇的點估計量，而
𝐸 𝑋 𝐸 𝑊 𝜇，意即站在不偏性的觀點，兩者一樣好；但
𝑉𝑎𝑟 𝑋
𝑉𝑎𝑟 𝑊 𝑉𝑎𝑟
𝑉𝑎𝑟 𝑋 𝑉𝑎𝑟 𝑊
意即站在變異數的觀點，𝑋較𝑊好。
因此，在同一信賴係數下，以𝑋作為𝜇的點估計量，所求得的信賴區間寬度
較窄。
(2) 樣本數：樣本數𝑛愈大，信賴區間的寬度愈窄。以抽樣母體為常態分配，母體變異數
𝜎 已知為例，𝜇的100 1 𝛼 %信賴區間為
𝑥̅ 𝑧 ⁄ ∙ , 𝑥̅ 𝑧 ⁄ ∙ ，信賴區間寬度為2𝑧 ⁄ ∙ ，可知樣本數𝑛愈大，信賴區
√ √ √
間的寬度愈窄。
(3) 信賴界限：若信賴界限的取法不同，也會造成信賴區間的寬度不同。
以抽樣母體為常態分配，母體變異數𝜎 已知為例：
(a)
若取𝜇的 95%信賴區間為
𝑥̅ 𝑧 . ∙ , 𝑥̅ 𝑧 . ∙ 𝑥̅ 1.96 ∙ , 𝑥̅ 1.96 ∙ ，
√ √ √ √
則信賴區間寬度為 3.92 ∙ 。
√
(b)
若取𝜇的 95%信賴區間為
𝑥̅ 𝑧 . ∙ , 𝑥̅ 𝑧 . ∙ 𝑥̅ 2.326 ∙ , 𝑥̅ 1.75 ∙ ，
√ √ √ √
√
此兩組信賴區間皆有 95%的信賴度，但因信賴界限的取法不同，造成信賴區間的寬
度亦不同。
(4) 信賴係數：信賴係數1 𝛼愈大，信賴區間的寬度愈寬。

以抽樣母體為常態分配，母體變異數𝜎 已知為例：
(a) 若取𝜇的 90%信賴區間為
𝑥̅ 𝑧 . ∙ , 𝑥̅ 𝑧 . ∙ 𝑥̅ 1.645 ∙ , 𝑥̅ 1.645 ∙ ，
√ √ √ √
√
(b) 若取𝜇的 95%信賴區間為
𝑥̅ 𝑧 . ∙ , 𝑥̅ 𝑧 . ∙ 𝑥̅ 1.96 ∙ , 𝑥̅ 1.96 ∙ ，
√ √ √ √
√
由此兩組信賴區間可得：信賴係數1 𝛼愈大，信賴區間的寬度愈大。
 在同一信賴係數下，信賴區間的寬度愈窄者，精確度愈高。
 在信賴區間的寬度相同之下，信賴係數1 𝛼愈大者愈好（因為可信度愈高）。
Chochran’s Theorem.
Z   2 v  1 v  v1  1 Z  X   2  v  v1 
且則  
X   2  v1  2 zx0  2  Z  X   X

 Xn  
1  N  0,1 2已知, 推論
 / n

2 Xn  
 t  n  1 2 未知, 推論
 s/ n
t-distribution
Z  N  0,1 Z
, Z U  T   t v 
U  2
v  U /v
性質
1. E T   0 , Var T  
v
,v  2
v2
2. T  N  0,1 , v  
  ' s 100 1    % 的區間估計量
<1>  2 已知
Xn  
Q  N  0,1
/ n
 X      
1    P  q1  n  q2   P  X n  q2    X n  q1 
 / n   n n
＜考慮最短的區間長， min L ＞
 
q1 , q 2 必滿足 q   z  dz 1   * ,min   q2  q1  **
q2
1
 n 
Let q 2  q 2  q1  . * 兩側對 q1微分

dq2 dq   q1 
   q2     q1   0  2 
dq1 dq1   q2 
Let L  q1   q2  q1
d dq   q1 
L  q1   2  1   1  0    q1     q2 
dq1 dq1   q2 
 q1  q 2  不合  , q 2   q1
   
 Xn  Z /2 , X n  Z /2 
 n n 
是  ' s 100 1    % 最短區間長的信賴區間。
<2>  2 未知
 s s 
Similar to <1> case. Then,  X n  t  /2  n  1 , X n  t /2  n  1  是  ' s 100 1    % 最短區間
 n n 
長的信賴區間。
7.2 Confidence Intervals for the Difference of Two Means
 兩獨立母體平均數差𝜇 𝜇 的信賴區間
𝑖. 𝑖. 𝑑. 𝑖. 𝑖. 𝑑.
(A) 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑁 𝜇 , 𝜎 ；𝑌 , 𝑌 , ⋯ , 𝑌 𝑁 𝜇 , 𝜎 ，且假設此二母體互相獨
~ ~
立，𝜎 與𝜎 已知。
因為𝑋~𝑁 𝜇 , ，𝑌~𝑁 𝜇 , ，且 𝑋 𝑌 ~𝑁 𝜇 𝜇 , 。
可得 𝑍 ~𝑁 0, 1 ，且
⎡ ⎤
𝑋 𝑌 𝜇 𝜇
1 𝛼 𝑃⎢ 𝑧 ⁄ 𝑧 ⁄
⎥
⎢ 𝜎 𝜎 ⎥
⎣ 𝑛 𝑚 ⎦
𝜎 𝜎 𝜎 𝜎
𝑃 𝑋 𝑌 𝑧 ⁄ ∙ 𝜇 𝜇 𝑋 𝑌 𝑧 ⁄ ∙
𝑛 𝑚 𝑛 𝑚
因此，𝜇 𝜇 的100 1 𝛼 %信賴區間為
𝜎 𝜎 𝜎 𝜎
𝑥̅ 𝑦 𝑧 ⁄ ∙ , 𝑥̅ 𝑦 𝑧 ⁄ ∙
𝑛 𝑚 𝑛 𝑚
簡記為 𝑥̅ 𝑦 𝑧 ⁄ ∙ 。
𝑖. 𝑖. 𝑑. 𝑖. 𝑖. 𝑑.
(B) 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝜇 , 𝜎 ；𝑌 , 𝑌 , ⋯ , 𝑌 𝜇 , 𝜎 ，此為任何二互相獨立母
~ ~
體，𝑛 30，𝑚 30，𝜎 與𝜎 已知或未知皆可。由中央極限定理，可得
(1) 𝜎 與𝜎 已知，則 𝑍 近似𝑁 0, 1 ，可得
𝜇 𝜇 的100 1 𝛼 %信賴區間為
𝜎 𝜎 𝜎 𝜎
𝑥̅ 𝑦 𝑧 ⁄ ∙ , 𝑥̅ 𝑦 𝑧 ⁄ ∙
𝑛 𝑚 𝑛 𝑚
簡記為 𝑥̅ 𝑦 𝑧 ⁄ ∙ 。
(2) 𝜎 與𝜎 未知，分別以𝑠 與𝑠 取代，可得

𝜇 𝜇 的100 1 𝛼 %信賴區間為
𝑠 𝑠 𝑠 𝑠
𝑥̅ 𝑦 𝑧 ⁄ ∙ , 𝑥̅ 𝑦 𝑧 ⁄ ∙
𝑛 𝑚 𝑛 𝑚
簡記為 𝑥̅ 𝑦 𝑧 ⁄ ∙ 。
𝑖. 𝑖. 𝑑. 𝑖. 𝑖. 𝑑.
(C) 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑁 𝜇 , 𝜎 ；𝑌 , 𝑌 , ⋯ , 𝑌 𝑁 𝜇 , 𝜎 ，且假設此二母體互相獨
~ ~
立，𝑛 30，𝑚 30，𝜎 未知【亦即假設兩母體變異數未知但相等】。
因為 𝑍 ~𝑁 0, 1 ，
𝑈 is 𝜒 𝑛 𝑚 2 ，且
Z 與 U 為獨立的隨機變數（數理統計範圍），可得
𝑋 𝑌 𝜇 𝜇
𝜎 𝜎
𝑍 𝑛 𝑚
𝑇
𝑈⁄ 𝑛 𝑚 2
𝑛 1 𝑆 𝑚 1 𝑆
𝑛 𝑚 2
𝜎 𝜎
𝑋 𝑌 𝜇 𝜇
𝑛 1 𝑆 𝑚 1 𝑆 1 1
𝑛 𝑚 2 𝑛 𝑚
𝑋 𝑌 𝜇 𝜇
~𝑡 𝑛 𝑚 2
1 1
𝑆
𝑛 𝑚
其中𝑆 ，
而𝑆 稱為𝜎 的合併估計量（pooled estimator）。

𝑥̅ 𝑦 𝑡 ⁄ 𝑛 𝑚 2 ∙𝑠 ∙ , 𝑥̅ 𝑦 𝑡 ⁄ 𝑛 𝑚 2 ∙𝑠 ∙
簡記為 𝑥̅ 𝑦 𝑡 ⁄ 𝑛 𝑚 2 ∙𝑠 ∙ 。
𝑖. 𝑖. 𝑑. 𝑖. 𝑖. 𝑑.
(D) 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑁 𝜇 , 𝜎 ；𝑌 , 𝑌 , ⋯ , 𝑌 𝑁 𝜇 , 𝜎 ，且假設此二母體互相獨
~ ~
立，𝑛 30，𝑚 30，𝜎 與𝜎 未知，可得 Welch’s T distribution
𝑇 ~𝑡 𝑟 ，其中𝑟 ，
若 r 不是整數，則採無條件捨去法取整數。
𝑠 𝑠 𝑠 𝑠
𝑥̅ 𝑦 𝑡 ⁄ 𝑟 ∙ , 𝑥̅ 𝑦 𝑡 ⁄ 𝑟 ∙
𝑛 𝑚 𝑛 𝑚
簡記為 𝑥̅ 𝑦 𝑡 ⁄ 𝑟 ∙ 。
※ 課本 P320 第 1 列 It is …起至 P321 倒數第 10 列…in these samples.止，省略不講。
 若𝜇 𝜇 的100 1 𝛼 %信賴區間包含 0，則有100 1 𝛼 %的信心，相信𝜇 與𝜇 無顯

著差異。
 若𝜇 𝜇 的100 1 𝛼 %信賴區間上下限均大於 0，則有100 1 𝛼 %的信心，相信𝜇

與𝜇 有顯著差異且𝜇 顯著大於𝜇 。
 若𝜇 𝜇 的100 1 𝛼 %信賴區間上下限均小於 0，則有100 1 𝛼 %的信心，相信𝜇

與𝜇 有顯著差異且𝜇 顯著小於𝜇 。
𝑖. 𝑖. 𝑑.
Example 7.2-1 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑁 𝜇 , 60 ，𝑥̅ 70.1；
~
𝑖. 𝑖. 𝑑.
𝑌 ,𝑌 ,⋯,𝑌 𝑁 𝜇 , 40 ，𝑦 75.3，且假設此二母體互相獨立。
~
試求𝜇 𝜇 的90%信賴區間。
解：𝜇 𝜇 的90%信賴區間為
𝜎 𝜎 𝜎 𝜎
𝑥̅ 𝑦 𝑧 . ∙ , 𝑥̅ 𝑦 𝑧 . ∙
𝑛 𝑚 𝑛 𝑚
60 40 60 40
70.1 75.3 1.645 ∙ , 70.1 75.3 1.645 ∙
15 8 15 8
10.135, 0.265
因為𝜇 𝜇 的90%信賴區間上下限均小於 0，故有90%的信心，相信𝜇 與𝜇 有顯
著差異且𝜇 顯著小於𝜇 。
例1 X 與 Y 兩種品牌電池，抽樣測得其壽命資料如下表：
樣本數平均壽命（小時）標準差（小時）
X 40 160 20
Y 50 150 16
(a) 求 X 與 Y 兩種品牌電池之平均壽命差𝜇 𝜇 的95%信賴區間。
(b) 在95%的信賴度之下，由(a)之結果，說明𝜇 與𝜇 是否有顯著差異？
解：(a) 𝜇 𝜇 的95%信賴區間為
𝑠 𝑠 𝑠 𝑠
𝑥̅ 𝑦 𝑧 . ∙ , 𝑥̅ 𝑦 𝑧 . ∙
𝑛 𝑚 𝑛 𝑚
20 16 20 16
160 150 1.96 ∙ , 160 150 1.96 ∙
40 50 40 50
2.38, 17.62
(b) 因為𝜇 𝜇 的95%信賴區間上下限均大於 0，可得有95%的信心，相信𝜇 與𝜇

有顯著差異且𝜇 顯著大於𝜇 。
Example 7.2-2 設大、小兩所高中的學生，數學成績分別呈常態分配𝑁 𝜇 , 𝜎 與

𝑁 𝜇 , 𝜎 。若由大高中隨機抽出 9 位學生，得𝑥̅ 81.31，𝑠 60.76；由小高中隨機抽
出 15 位學生，得𝑦 78.61，𝑠 48.24。
(a) 求𝜇 𝜇 的95%信賴區間。
(b) 在 95 % 的信賴度之下，由(a)之結果，說明𝜇 與𝜇 是否有顯著差異？
解：(a) 𝜇 𝜇 的95%信賴區間為
1 1
𝑥̅ 𝑦 𝑡 . 22 ∙ 𝑠 ∙
𝑛 𝑚
9 1 60.76 15 1 48.24 1 1
81.31 78.61 2.074 ∙ ∙
9 15 2 9 15
3.65, 9.05
(b) 因為𝜇 𝜇 的95%信賴區間包含 0，可得有95%的信心，相信𝜇 與𝜇 無顯著差

異。
例2 X 與 Y 兩種品牌電池，抽樣測得其壽命資料如下表：（假設 X 與 Y 兩種品牌電池之壽
命皆呈常態分配）
樣本數平均壽命（小時）標準差（小時）
X 8 160 10
Y 10 150 20
求 X 與 Y 兩種品牌電池之平均壽命差𝜇 𝜇 的95%信賴區間。
解：𝑟 13.77，
取𝑟 13
𝜇 𝜇 的95%信賴區間為
𝑠 𝑠 10 20
𝑥̅ 𝑦 𝑡 . 13 ∙ 160 150 2.16 ∙
𝑛 𝑚 8 10
5.65, 25.65
 配對樣本之母體平均數差𝝁𝑫 的信賴區間
配對編號 1 2 … 𝑛
𝑋 𝑋 𝑋 ⋯ 𝑋
𝑌 𝑌 𝑌 ⋯ 𝑌
𝐷 𝑋 𝑌 𝐷 𝐷 ⋯ 𝐷
𝑖. 𝑖. 𝑑.
假設𝐷 , 𝐷 , ⋯ , 𝐷 𝑁 𝜇 , 𝜎 ，𝜇 𝜇 𝜇 ，𝜎 未知且𝑛 30。
~
∑ ∑
令𝐷 ，𝑆 ，可得𝑇 ⁄√
~𝑡 𝑛 1 。
∑ ∑
觀察值為𝑑̅ ，𝑠 。
因此，𝜇 的100 1 𝛼 %信賴區間為
𝑑̅ 𝑡 ⁄ 𝑛 1 ∙ , 𝑑̅ 𝑡 ⁄ 𝑛 1 ∙
√ √
簡記為 𝑑̅ 𝑡 ⁄ 𝑛 1 ∙ 。
√
 若𝜇 𝜇 𝜇 的100 1 𝛼 %信賴區間包含 0，則有100 1 𝛼 %的信心，相信𝜇 與𝜇

無顯著差異。
 若𝜇 𝜇 𝜇 的100 1 𝛼 %信賴區間上下限均大於 0，則有100 1 𝛼 %的信心，相
信𝜇 與𝜇 有顯著差異且𝜇 顯著大於𝜇 。
 若𝜇 𝜇 𝜇 的100 1 𝛼 %信賴區間上下限均小於 0，則有100 1 𝛼 %的信心，相
信𝜇 與𝜇 有顯著差異且𝜇 顯著小於𝜇 。
Example 7.2-4 進行一實驗以比較人們對紅燈與綠燈的平均反應時間有無顯著差異。今隨機
抽出 8 人從事實驗，當每人看到紅燈或綠燈信號時，被要求按開關鍵關燈，按關燈鍵
時，計秒器會紀錄反應時間，8 位實驗者的反應時間記錄如下（單位：秒）：
實驗者編號 Red 𝑋 Green 𝑌 𝐷 𝑋 𝑌
1 0.30 0.43  0 .13
2 0.23 0.32  0.09
3 0.41 0.58  0.17
4 0.53 0.46 0.07
5 0.24 0.27  0 .03
6 0.36 0.41  0 .05
7 0.38 0.38 0.00
8 0.51 0.61  0.10
求𝜇 𝜇 𝜇 的 95%信賴區間。
解：𝑛 8, 𝑑̅ 0.0625, 𝑠 0.0765
𝜇 的 95%信賴區間為
𝑠 𝑠
𝑑̅ 𝑡 . 7 ∙ , 𝑑̅ 𝑡 . 7 ∙
√𝑛 √𝑛
0.0765 0.0765
0.0625 2.365 ∙ , 0.0625 2.365 ∙
√8 √8
0.1265, 0.0015
因為𝜇 的 95%信賴區間包含 0，可得有 95 % 的信心，相信人們對紅燈與綠燈的平
均反應時間無顯著差異。本例僅有 8 對數據資料且信賴區間的上界 0.0015 非常接近
0，當數據資料增加時，信賴區間可能不包含 0 且信賴區間上下限均小於 0，果真
如此，則似乎顯示人們對紅燈的平均反應時間較快。
例3 BB 減肥食品公司宣稱「服用 BB 減肥食品一個月，平均體重至少可減輕 20 磅」。今

隨機抽取 5 位服用者從事試驗，得服用前及服用一個月後的體重記錄如下：
服用者編號 1 2 3 4 5
服用前體重𝑥 130 143 157 146 144
服用一個月後體重𝑦 125 137 142 134 132
𝑑 𝑥 𝑦 5 6 15 12 12
假設服用前後體重差呈常態分配，服用前的母體平均體重為𝜇 ，服用後的母體平均體
重為𝜇 ，且設𝜇 𝜇 𝜇 ，求𝜇 的 95%信賴區間。
解：𝑛 5, 𝑑̅ 10, 𝑠 4.30
𝜇 的 95%信賴區間為 𝑑̅ 𝑡 . 4 ∙ , 𝑑̅ 𝑡 . 4 ∙
√ √
4.30 4.30
10 2.776 ∙ , 10 2.776 ∙
4.66, 15.34
√5 √5
意即有 95%的信心，相信服用 BB 減肥食品一個月，平均體重至少可減輕 4.66 磅，
至多可減輕 15.34 磅。
兩樣本的區間估計
X 1  X m  N  1 ,  12 
iid
Y1 Yn  N  2 ,  22 
iid

1   2 ' s 100 1    %的區間估計量
 12  22  12  22
 :X  Y , Var  X  Y     Var  X  Y   
m n m n
  12  22 
case 1  和 已知   X  Y 
2 2
  Z /2 
1
 2
m n 
 
 S12 S22 
case 2  12和 22 未知,但為大樣本   X  Y    Z / 2 
 m n 
 
 S12 S 22 
case 3  和 未知,小樣本   X  Y 
2 2
  t /2  v  
1 2
 m n 
 
2
 S12 S22 
  
Where v  Welch d . f .   2
m n 
2
（取近似整數）
 S12   S22 
   
 m   n 
m 1 n 1
case 4 12和 22未知,但 12 = 22
 遇到兩個獨立母體,具有共同的母體變異數  ，計算綜合樣本變異數(pooled sample

2
variance)
x  x    y  y
n n
2 2
iid
X 1  X m  E  X   1 ,Var  X    2 i j
 SP2  i 1 i 1
 綜合樣本變異數 
iid
mn2
Y1 Yn  E Y    2 ,Var Y    2
（假設具有相同的  2 下，估計 variance）


 m  1 S X2   n  1 SY2  
1
E  S P 2  = 2 ,  S P 2  
 mn2 
  1 1 
Then, the CI for 1   2 ,   X  Y     S P2  t /2  m  n  2   。
 m n 
 
(Recall)
 2
 2
Var  X  Y   1
 2
m n
  1 1 
X  Y  N  1  2 ,     2 
 m n 
m n
 m n

  xi  x    yi  y   i     yi  y 
2 2 2 2
x  x 
i 1
 i 1
~  2  m  n  2  且  x  y    i 1  i 1 
2 2   2
2 
 
 
X  Y   1   2 
 1 1 2
   X  Y   1  2 
m n
T    t  m  n  2
 1 1 2
 x  x    y  y
n n
2 2
i j    SP
i 1 j 1 m n
/mn2
2
1
Where S P 2 
mn2
 m  1 S X2   n  1 SY2 
 
 
 X  Y   1   2  
1    P  t /2  m  n  2    t /2  m  n  2  
  1 1 2 
    SP 
m n
   1 1  
 P  1   2    X  Y     S P2  t /2  m  n  2   
 m n 
   
Ex.

n  N  1 ,  
iid
2
 1 X  X

X  Y  W  Y1 Yn  N  2 , a 2  且a, b已知
iid

W1 Wn  N  3 , b 2 
iid

 求  1 + 2  3  ' s 100 1    %的區間估計量
解答
 1 a  b  2 
X  Y  W  N  1 +2  3 ,   
  n  
 2
a 2
b 2
Var  X  Y  W   V  X   V Y   V W    
n n n
1 n 1 n
 y j  y  
n n n n
  xi  x     wk  w
2 2
  xi  x    wk  w
2 2
2 2
 y j  y 
a j 1 b k 1
i 1
 j 1
 k 1
 i 1
  2  3n  3
 2
a 2
b 2
 2
1 1
 y j  y     wk  w 
n n n
 x  x  
2 2 2
i 
i 1 a j 1 b k 1
Let A   S2
3n  3
X  Y  W   1   2  3 
~ N (0,1)
 1 a  b  2
  X  Y  W   1   2  3 
 n 
T   ~ t  3n  3  .
  3n  3  A /  2  2   2  3n  3 
1/ 2
1 a  b 
  ~   

A

 3n  3   3n  3 
n
（再比照上式作 1   即知 C. I.）
Confidence Intervals for Variances

註: 本是自成一節的內容，本書第 9 版卻將它分拆在習題 7.1-16 及習題 7.2-14 裡。
 母體變異數𝝈𝟐 的信賴區間
𝑖. 𝑖. 𝑑.
假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑁 𝜇, 𝜎 ，𝜎 未知，可得𝜒 ~𝜒 𝑛 1 ，則
~
𝜎 的100 1 𝛼 %信賴區間為 , ；亦可得

⁄ ⁄
𝜎的100 1 𝛼 %信賴區間為 , 。
⁄ ⁄
證明：
1 𝛼 𝑃𝜒 ⁄ 𝑛 1 𝜒 𝜒 ⁄ 𝑛 1
𝑃 𝜒 ⁄ 𝑛 1 𝜒 ⁄ 𝑛 1
𝑃 𝜎
⁄ ⁄
可得𝜎 的100 1 𝛼 %信賴區間為 , 。

⁄ ⁄
例4 在墨西哥發現一種開花植物 Guardiola，其種子成熟所需天數呈常態分配𝑁 𝜇, 𝜎 。
若隨機抽出𝑛 13顆窄葉種子，得𝑥̅ 18.97，12𝑠 ∑ 𝑥 𝑥̅ 128.41。
(a) 求𝜎 的90%信賴區間。
(b) 求𝜎的90%信賴區間。
. .
解：(a) 𝜎 的90%信賴區間為 , , 6.11, 24.57 。
. . . .
. .
(b) 𝜎的90%信賴區間為 , , 2.47, 4.96 。
. . . .
⁄
 若𝑈~𝜒 𝑟 ，𝑉~𝜒 𝑟 ，𝑈與𝑉為獨立的隨機變數，則𝐹 ⁄
為具有自由度為 𝑟 , 𝑟
，以符號簡記成𝐹~𝐹 𝑟 , 𝑟 。
之𝐹分配（𝐹 distribution）
𝑖. 𝑖. 𝑑. 𝑖. 𝑖. 𝑑.
 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑁 𝜇 , 𝜎 ；𝑌 , 𝑌 , ⋯ , 𝑌 𝑁 𝜇 , 𝜎 ，且假設此二母體互相
~ ~
獨立，則
【1】𝑈 ~𝜒 𝑛 1
【2】𝑉 ~𝜒 𝑚 1
【3】𝑈與𝑉為獨立的隨機變數
【4】由【1】【2】【3】可得
𝑛 1 𝑆
𝑛 1
𝑈⁄ 𝑛 1 𝜎 𝑆 ⁄𝜎
𝐹 ~𝐹 𝑛 1, 𝑚 1
𝑉⁄ 𝑚 1 𝑚 1 𝑆 𝑆 ⁄𝜎
𝑚 1
𝜎
𝝈𝟐
 兩獨立母體變異數比 𝑿𝟐 的信賴區間
𝝈𝒀
𝑖. 𝑖. 𝑑. 𝑖. 𝑖. 𝑑.
假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑁 𝜇 , 𝜎 ；𝑌 , 𝑌 , ⋯ , 𝑌 𝑁 𝜇 , 𝜎 ，且假設此二母體互相獨
~ ~
立，可得𝐹 ~𝐹 𝑛 1, 𝑚 1 。
因此，的100 1 𝛼 %信賴區間為
∙ , ∙ 或
⁄ , ⁄ ,
∙ , ∙𝐹 ⁄ 𝑚 1, 𝑛 1 ；
⁄ ,
亦可得的100 1 𝛼 %信賴區間為
∙ , ∙ 或
⁄ , ⁄ ,
∙ , ∙𝐹 ⁄ 𝑚 1, 𝑛 1 。
⁄ ,
證明：
𝑆 ⁄𝜎
1 𝛼 𝑃 𝐹 ⁄ 𝑛 1, 𝑚 1 𝐹 ⁄ 𝑛 1, 𝑚 1
𝑆 ⁄𝜎
𝑃 ∙
⁄ , ⁄ ,
𝑆 1 𝜎 𝑆 1
𝑃 ∙ ∙
𝑆 𝐹 ⁄ 𝑛 1, 𝑚 1 𝜎 𝑆 𝐹 ⁄ 𝑛 1, 𝑚 1
可得的100 1 𝛼 %信賴區間為 ∙ , ∙ 。
⁄ , ⁄ ,
 若的100 1 𝛼 %信賴區間包含 1，則有100 1 𝛼 %的信心，相信𝜎 與𝜎 無顯著差
異。
 若的100 1 𝛼 %信賴區間上下限均大於 1，則有100 1 𝛼 %的信心，相信𝜎 與𝜎
有顯著差異且𝜎 顯著大於𝜎 。
 若的100 1 𝛼 %信賴區間上下限均小於 1，則有100 1 𝛼 %的信心，相信𝜎 與𝜎
有顯著差異且𝜎 顯著小於𝜎 。
例5 在墨西哥發現一種開花植物 Guardiola，其窄葉種子成熟所需天數呈常態分配
𝑁 𝜇 , 𝜎 ；寬葉種子成熟所需天數呈常態分配𝑁 𝜇 , 𝜎 。若隨機抽出𝑛 13顆窄葉種
子，得𝑥̅ 18.97，12𝑠 ∑ 𝑥 𝑥̅ 128.41；隨機抽出𝑚 9顆寬葉種子，得
𝑦 23.20，8𝑠 ∑ 𝑦 𝑦 36.72。
(a) 求的98%信賴區間。
(b) 在98%的信賴度之下，由(a)之結果，說明𝜎 與𝜎 是否有顯著差異？
(c) 求的98%信賴區間。
解：(a) 的98%信賴區間為 ∙ , ∙𝐹 . 8, 12
. ,
128.41/12 1 128.41/12
∙ , ∙ 4.50 0.41, 13.22
36.72/8 5.67 36.72/8
(b) 因為的98%信賴區間包含 1，，可得有 98 % 的信心，相信𝜎 與𝜎 無顯著差
異。
(c) 的98%信賴區間為 √0.41, √13.22 0.64, 3.64 。

  2 ' s 100 1    % 的區間估計量
 n
  xi   
2

 1 i 1   2  n   已知, 推論  2
 2
 n

  xi  xn 
2

 2
i 1
  2  n  1  未知, 推論  2
 2
F-distribution
U   2  v1  U / v1
且U  V  F   F  v1 , v2 
V    v2 
2
V / v2
特性
1 F v.s. Beta
v1 U v U V 1 V v v 
F   1 1 F     Beta  2 , 1 
1 1 F U V  2 2
v2 V v2 V v
v2
2 抽樣式

m  N  1 ,  1 
iid
2
X
 1  X
X Y 
 Y1 Yn  N   2 ,  22 
iid
case 1 1和 2已知
n n
  xi  1   y   
2 2
i 2
i 1
  2  m , i 1
  2  n
 2
1  2
2
 x   
2
n i 1 /m
 x   
2 i 1
1 / 2
1 n
 y   
i 2
i 1
i 2 /n
F  m  i 1
 F  m, n 
n
 12 /  22
 y   
2
i 2 / 2
2
i 1
n
case 2 1和 2 未知
n n
x  x   y  y 
2 2
i i
i 1
  2  m  1 , i 1
  2  n  1
 12  22
n
x   
2
n i 1 / m 1
 x  x 
2 i 1
/ 2
1 n
 y   
i 2
i 1
i 2 / n 1
F  m 1  i 1
 F  m  1, n  1
n
 12 /  22
 y  y 
2
i / 2
2
i 1
n 1
F 分配即是推論兩母體變異數是否相等時所需的樞紐量之近似分配。
7.3 Confidence Intervals for Proportions
 無限母體，母體比例𝒑的信賴區間
𝑖. 𝑖. 𝑑.
若𝑋 , 𝑋 , ⋯ , 𝑋 𝑏 1, 𝑝 ，
~
(1) 𝑌 ∑ 𝑋 ~𝑏 𝑛, 𝑝 且𝐸 𝑌 𝑛𝑝，𝑉𝑎𝑟 𝑌 𝑛𝑝𝑞。
∑
(2) 𝑃 為樣本比例且𝐸 𝑃 𝑝，𝑉𝑎𝑟 𝑃 。當樣本數夠大時，由中央極限定
理，可得 𝑍 分配近似𝑁 0, 1 。
(3) 𝑝的100 1 𝛼 %信賴區間為 𝑝̂ 𝑧 ⁄ , 𝑝̂ 𝑧 ⁄ ，
簡記為 𝑝̂ 𝑧 ⁄ 。
證明：【方法一】
1 𝛼 𝑃 𝑧 ⁄ 𝑧 ⁄
𝑃 𝑃 𝑧 ⁄ 𝑝 𝑃 𝑧 ⁄
𝑃𝑄 𝑃𝑄
𝑃 𝑃 𝑧 ⁄ 𝑝 𝑃 𝑧 ⁄
𝑛 𝑛
可得𝑝的100 1 𝛼 %信賴區間為 𝑝̂ 𝑧 ⁄ , 𝑝̂ 𝑧 ⁄ 。
證明：【方法二】
𝑃 𝑝 𝑃 𝑝
1 𝛼 𝑃⎛ 𝑧 ⁄ 𝑧 ⁄
⎞ 𝑃⎛ 𝑧 ⁄
⎞
𝑝𝑞 𝑝𝑞
⎝ 𝑛 ⎠ ⎝ 𝑛 ⎠
解不等式 𝑧 ⁄ ，可得 𝑃 𝑝 𝑧 / ∙
/ /
⇒ 1 𝑝 2𝑃 𝑝 𝑃 0
/ / / /
/ /
⇒ 𝑝
/ /
可得𝑝的100 1 𝛼 %信賴區間為
⎡ 𝑧 / 𝑃 1 𝑃 𝑧 / 𝑧 / 𝑃 1 𝑃 𝑧 / ⎤
⎢ 𝑃 2𝑛
𝑧 / 𝑛 4𝑛
𝑃
2𝑛
𝑧 / 𝑛 4𝑛 ⎥
⎢ , ⎥
⎢ 𝑧 / 𝑧 / ⎥
⎢ 1 1 ⎥
𝑛 𝑛
⎣ ⎦
/ / /
當𝑛很大時， 0， 0， 0；令𝑞 1 𝑝̂ ，可得
𝑝的100 1 𝛼 %信賴區間為 𝑝̂ 𝑧 ⁄ , 𝑝̂ 𝑧 ⁄ 。
Example 7.3-2 某次政治選舉中，為估計某候選人之得票率𝑝，隨機抽出 351 位選民做調

查，結果有 185 位選民表示願意把票投給該候選人。試求：
(a) 該候選人之得票率𝑝的點估計值。
(b) 該候選人之得票率𝑝的95%信賴區間。
解：(a) 𝑝的點估計值為 𝑝̂ 0.527 52.7%
𝐛 𝑝的 95%信賴區間為
185 166
𝑝̂ 𝑞 185 351 351
𝑝̂ 𝑧 . 1.96
𝑛 351 351
0.475, 0.579 47.5%, 57.9%

意即有 95 % 的信心，相信該候選人之得票率𝑝至少為 47.5%，至多為 57.9%。
 𝑝的100 1 𝛼 %上界（upper bound）信賴區間為 0, 𝑝̂ 𝑧 。
 𝑝的100 1 𝛼 %下界（lower bound）信賴區間為 𝑝̂ 𝑧 , 1。
 兩獨立母體比例差𝒑𝟏 𝒑𝟐 的信賴區間
假設𝑌 ~𝑏 𝑛 , 𝑝 ，𝑌 ~𝑏 𝑛 , 𝑝 ，𝑛 30，𝑛 30，且假設𝑌 與𝑌 互相獨立。
令𝑃 ，𝑃 ，則
(1) 𝐸 𝑃 𝑃 𝑝 𝑝
(2) 𝑉𝑎𝑟 𝑃 𝑃
(3) 由中央極限定理，可得 𝑍 近似𝑁 0, 1 。
因此，𝑝 𝑝 的100 1 𝛼 %信賴區間為
𝑝̂ 𝑝̂ 𝑧 ⁄ , 𝑝̂ 𝑝̂ 𝑧 ⁄ ，
簡記為 𝑝̂ 𝑝̂ 𝑧 ⁄ 。
證明：1 𝛼 𝑃 𝑧 ⁄ 𝑧 ⁄
𝑃 𝑃 𝑃 𝑧 ⁄ 𝑝 𝑝 𝑃 𝑃 𝑧 ⁄
𝑃𝑄 𝑃𝑄 𝑃𝑄 𝑃𝑄
𝑃 𝑃 𝑃 𝑧 ⁄ 𝑝 𝑝 𝑃 𝑃 𝑧 ⁄
𝑛 𝑛 𝑛 𝑛
可得𝑝 𝑝 的100 1 𝛼 %信賴區間為
𝑝̂ 𝑝̂ 𝑧 ⁄ , 𝑝̂ 𝑝̂ 𝑧 ⁄ 。
 若𝑝 𝑝 的100 1 𝛼 %信賴區間包含 0，則有100 1 𝛼 %的信心，相信𝑝 與𝑝 無顯

著差異。
 若𝑝 𝑝 的100 1 𝛼 %信賴區間上下限均大於 0，則有100 1 𝛼 %的信心，相信𝑝
與𝑝 有顯著差異且𝑝 顯著大於𝑝 。
 若𝑝 𝑝 的100 1 𝛼 %信賴區間上下限均小於 0，則有100 1 𝛼 %的信心，相信𝑝
與𝑝 有顯著差異且𝑝 顯著小於𝑝 。
 𝑝 𝑝 的100 1 𝛼 %上界（upper bound）信賴區間為
1, 𝑝̂ 𝑝̂ 𝑧 。
 𝑝 𝑝 的100 1 𝛼 %下界（lower bound）信賴區間為
𝑝̂ 𝑝̂ 𝑧 , 1。
Example 7.3-4 欲比較兩種清潔劑之去污能力，某檢驗員測試第一種清潔劑 91 次，有 63 次

成功去污；測試第二種清潔劑 79 次，有 42 次成功去污。
(a) 試求去污比例差𝑝 𝑝 的點估計值。
(b) 試求去污比例差𝑝 𝑝 的90%信賴區間。
(c) 在90%的信賴度之下，由(b)之結果，說明𝑝 與𝑝 是否有顯著差異？
解：(a) 𝑝 𝑝 的點估計值為 𝑝̂ 𝑝̂ 0.1607
(b) 𝑝 𝑝 的90%信賴區間為 𝑝̂ 𝑝̂ 𝑧 .
63 28 42 37
63 42 91 91 79 79
1.645
91 79 91 79
0.0387, 0.2826 3.87%, 28.26%

意即有90%的信心，相信兩種清潔劑之去污比例差𝑝 𝑝 至少為 3.87%，至多
為 28.26%。
(c) 因為𝑝 𝑝 的 90%信賴區間上下限均大於 0，可得有 90%的信心，相信𝑝 與𝑝

有顯著差異且𝑝 顯著大於𝑝 。
7.4 Sample Size
 估計誤差（Error of the estimate）：估計量𝜃與被估計參數𝜃的距離，稱為估計誤差，以

|𝜃 𝜃|表示。
 最大估計誤差（Maximum error of the estimate）：若𝑃 𝜃 𝜃 𝜀 1 𝛼，則稱𝜀為以𝜃
估計參數𝜃的100 1 𝛼 %最大估計誤差，亦稱𝜀為以𝜃估計參數𝜃的100 1 𝛼 %抽樣誤
差（sampling error）。
 估計母體平均數𝝁所需的樣本數𝒏與抽樣誤差𝜺
𝑖. 𝑖. 𝑑.
假設𝑋 , 𝑋 , ⋯ , 𝑋 𝜇, 𝜎 ，任何母體，樣本數𝑛為大樣本。
~
公式 : (1) 當樣本數𝑛已知，以𝑋估計𝜇的100 1 𝛼 %最大估計誤差 𝜀 𝑧 ⁄ ∙ 。

√
若𝜎未知，則以樣本標準差𝑠取代𝜎。
(2) 當樣本數 n 未知，以𝑋估計𝜇的100 1 𝛼 %最大估計誤差為𝜀，則樣本數
⁄
𝑛 且以無條件進位法取整數。若𝜎未知，則辦理試查後，以樣本標
準差𝑠取代𝜎。標準差𝜎愈小，則抽樣調查所需的樣本數𝑛愈小；當𝜎 0時，
抽樣調查所需的樣本數𝑛 1即可。
證明：由中央極限定理，可得𝑍 ⁄√
近似𝑁 0, 1
| |
1 𝛼 𝑃 |𝑋 𝜇| 𝜀 𝑃 ⁄√ ⁄√
𝑃 |𝑍| ⁄√
⁄
可得 ⁄√
𝑧 ⁄ ⇒ 𝜀 𝑧 ⁄ ∙ and 𝑛 .
√
例1 為估計一部計程車一天行駛十小時，使用汽油燃料費之平均金額𝜇。今隨機抽出 200
部計程車從事試驗，得知使用汽油燃料費之平均金額𝑥̅ 600元，標準差𝑠 200元。
(a) 求以𝑋估計𝜇的 95%最大估計誤差。
(b) 若要求樣本平均數𝑋與母體平均數𝜇之誤差不能超過 20 元，且要有 95%的可信度，
則題目中的樣本數是否足夠？若不夠，則樣本數至少需再增加多少？
解：(a) 以𝑋估計𝜇的 95%最大估計誤差為 𝑧 . ∙ 1.96 ∙ 27.72 元)

√ √
(b) 𝜀 20, 𝛼 0.05, 𝑠 200

𝑧 .1.96 200𝑠
𝑛 384.16
𝜀 20
取𝑛 385。題目中的樣本數不夠，至少需再增加385 200 185部計程車
從事試驗。
Example 7.4-1 某數學系想評估採用新的微積分教學法之效果，在課程結束後，以學生的微
積分平均成績𝜇評估其成效。今隨機抽出𝑛位學生參加此新的微積分教學法，若要求樣
本平均數𝑋與母體平均數𝜇之誤差不能超過 1 分，且要有 95%的可信度，則樣本數至少
需多少？（假設𝜎 15）
解：𝜀 1, 𝛼 0.05, 𝜎 15
. .
𝑛 864.36，取𝑛 865。
 無限母體，估計母體比例𝒑所需的樣本數𝒏與抽樣誤差𝜺
𝑖. 𝑖. 𝑑.
假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑏 1, 𝑝 ，樣本數𝑛為大樣本。
~
公式 : (1) 當樣本數𝑛已知，以𝑃估計𝑝的100 1 𝛼 %最大估計誤差 𝜀 𝑧 ⁄ ∙ 。
若𝑝未知，則以樣本比例𝑝̂ 取代𝑝。
(2) 當樣本數𝑛未知，以𝑃估計𝑝的100 1 𝛼 %最大估計誤差為  ，則樣本數
⁄ √
𝑛 且以無條件進位法取整數。若𝑝未知，可採用下列方法：
(a) 辦理試查後，以樣本比例𝑝̂ 取代𝑝。
(b) 若無法以樣本比例𝑝̂ 取代𝑝，則以𝑝 𝑞 代入，此乃因為
𝑝𝑞 𝑝 1 𝑝 ∙ 。
證明：由中央極限定理，可得𝑍 近似 𝑁 0, 1
| |
1 𝛼 𝑃 𝑃 𝑝 𝜀 𝑃 𝑃 |𝑍|
⁄ √
可得 𝑧 ⁄ ⇒ 𝜀 𝑧 ⁄ ∙ and 𝑛 .
例2 為估計某電視節目之收視率𝑝，節目部經理要求調查結果的收視率𝑃（樣本比例）與
實際的收視率𝑝（母體比例）之誤差不能超過 2%，且要有 95%的可信度。
(a) 若沒有提供有關收視率𝑝之訊息，又沒有辦理試查，則樣本數至少需取多少？
(b) 若在該電視節目播放中，隨機抽出 800 戶家庭做收視率調查，結果有 64 戶家庭表
示正收看該電視節目，則題目中的樣本數是否足夠？若不夠，則樣本數至少需再增
加多少？
(c) 由(b)之收視率調查結果，求以𝑃估計𝑝的 95%最大估計誤差。
解：(a) 𝜀 0.02, 𝛼 0.05
. ∙
. √
𝑛 2401，至少需取𝑛 2401。
.
(b) 𝜀 0.02, 𝛼 0.05, 𝑝̂ 0.08
𝑧 . 𝑝̂ 𝑞 1.96 0.08 0.92

𝑛 706.8544
𝜀 0.02
取𝑛 707。題目中的樣本數 800 已足夠。

(c) 以𝑃估計𝑝的 95%最大估計誤差為
𝑝̂ 𝑞 0.08 0.92
𝑧 . ∙ 1.96 0.0188 1.88%
𝑛 800
Example 7.4-3 為估計某州長候選人之得票率𝑝，要求調查結果的得票率𝑃（樣本比例）與

實際的得票率𝑝（母體比例）之誤差不能超過 3%，且要有 95%的可信度。
(a) 若沒有提供有關得票率𝑝之訊息，又沒有辦理試查，則樣本數至少需取多少？
(b) 若隨機抽出 1068 位選民做調查，結果有 214 位選表示願意把票投給該候選人，求
以𝑃估計𝑝的 95%最大估計誤差。
解：(a) 𝜀 0.03, 𝛼 0.05
. ∙
. √
𝑛 1067.11，至少需取𝑛 1068。
.
(b) 以𝑃估計𝑝的 95%最大估計誤差為

214 854
𝑝̂ 𝑞 1068 1068
𝑧 . ∙ 1.96 0.024 2.4%
𝑛 1068
 有限母體，母體比例𝒑的信賴區間
𝑁 𝑁 𝑁
𝑁 𝑁
抽出不放回
𝑛
𝑋 𝑛 𝑋
若𝑋~𝐻 𝑁, 𝑛, 𝑁 ，𝑝 為母體比例，則
(1) 𝐸 𝑋 𝑛𝑝，𝑉𝑎𝑟 𝑋 𝑛𝑝𝑞 ∙
(2) 𝑃 為樣本比例且𝐸 𝑃 𝑝，𝑉𝑎𝑟 𝑃 ∙
當樣本數𝑛 30時，由中央極限定理，可得 𝑍 近似 𝑁 0, 1
∙
(3) 𝑝的100 1 𝛼 %信賴區間為
𝑝̂ 𝑞 𝑁 𝑛 𝑝̂ 𝑞 𝑁 𝑛
𝑝̂ 𝑧 ⁄ ∙ , 𝑝̂ 𝑧 ⁄ ∙
𝑛 𝑁 1 𝑛 𝑁 1
簡記為 𝑝̂ 𝑧 ⁄ ∙
例3 從商學院1000位學生中，隨機抽出100位學生調查，其中有30位贊同暑期實習制
度。試問贊同暑期實習制度之學生比率𝑝的95%信賴區間為何？
解：𝑁 1000, 𝑛 100, 𝑝̂ 0.3
𝑝的95%信賴區間為
. .
𝑝̂ 𝑧 . ∙ 0.3 1.96 ∙
0.2147, 0.3853 21.47%, 38.53%

意即有95%的信心，相信贊同暑期實習制度之學生比率𝑝至少為21.47%，至多為
38.53%。
 有限母體，估計母體比例𝒑所需的樣本數𝒏與抽樣誤差𝜺
假設𝑋~𝐻 𝑁, 𝑛, 𝑁 ，𝑝 ，樣本數𝑛為大樣本。
公式 : (1) 當樣本數𝑛已知，以𝑃估計𝑝的100 1 𝛼 %最大估計誤差𝜀 𝑧 ⁄ ∙ 。
若𝑝未知，則以樣本比例𝑝̂ 取代𝑝。
(2) 當樣本數𝑛未知，以𝑃估計𝑝的100 1 𝛼 %最大估計誤差為ε，則樣本數
⁄ √
𝑛 ,，其中𝑚 且以無條件進位法取整數。
若𝑝未知，可採用下列方法：
(a) 辦理試查後，以樣本比例𝑝̂ 取代𝑝。
(b) 若無法以樣本比例𝑝̂ 取代𝑝，則以𝑝 𝑞 代入，此乃因為
𝑝𝑞 𝑝 1 𝑝 ∙ 。
證明：由中央極限定理，可得𝑍 近似 𝑁 0, 1
∙
| |
1 𝛼 𝑃 𝑃 𝑝 𝜀 𝑃 𝑃 |𝑍|
∙ ∙ ∙
可得 𝑧 ⁄
∙
𝑝𝑞 𝑁 𝑛
𝜀 𝑧 ⁄ ∙
𝑛 𝑁 1
∙ ⁄ ∙
𝑛 【由上式化簡得之】
⁄ ∙
⁄ ∙ /
【分子分母同除以𝑁𝜀 】
⁄ ∙ /
⁄ √
,，其中𝑚 。
Example 7.4-4 某學院學生總數𝑁 3000人，為估計學生對新的評分方式之贊成比例𝑝，要

求調查結果的比例𝑃（樣本比例）與實際的比例𝑝（母體比例）之誤差不能超過 3%，且
要有 95%的可信度。若沒有提供有關贊成比例𝑝之訊息，又沒有辦理試查，則樣本數至
少需取多少？
解：𝑁 3000, 𝜀 0.03, 𝛼 0.05
. ∙
. √
𝑚 1067.11，取𝑚 1068。
.
𝑛 787.80，取𝑛 788。
6.5 A Simple Regression Problem
簡單線性迴歸（simple linear regression）是用來探討兩個變數間的關係，建立機率函數

模式，來做推論及預測。要預測的變數稱為因變數（dependent variable），以𝑌表示；與𝑌有
關的變數稱為獨立變數（independent variables），以𝑥表示。例如：
 已知廣告費𝑥與銷售額𝑌之關係，則可用迴歸分析，以花費的廣告費預測銷售額。
 已知一個學生的數學能力測驗成績𝑥與微積分成績𝑌之關係，則可用迴歸分析，以數學能
力測驗成績預測微積分成績。
 變數間的關係：
 函數關係：變數與變數間的關係一定，無誤差存在，即所有觀察值 𝑥, 𝑦 全落在同
一直線或同一曲線上，此種函數關係模式，稱為確定性模式（deterministic
model）。例如：𝑦 10000 40𝑥。
 統計關係：變數與變數間的關係有誤差存在，即所有觀察值 𝑥, 𝑦 並不全落在同一
直線或同一曲線上，此種統計關係模式，稱為機率模式（probabilistic model），本
節主要討論的模式即屬此一模式。例如：𝑦 10000 40𝑥 𝜀，其中𝜀為隨機誤差
項。
 散佈圖（scatter plot）：由描述統計關係的散佈點，所繪出的統計圖，每一個散佈點代表
一個觀察值，如 Figure 6.5-1 所示:
 簡單線性迴歸模式
1. 簡單線性迴歸模式為 𝑌 𝛼 𝛽𝑥 𝜀 ，
此處
𝑌 為因變數在第𝑖次試驗的值；
𝑥 為獨立變數在第𝑖次試驗的值，是一個已知常數；
𝛼 為參數，代表𝑌軸截距（僅在模式中，含𝑥 0時，才有意義）；
𝛽為參數，代表斜率（意即當𝑥每增加 1 單位，則𝑌增加𝛽單位）；
𝑖. 𝑖. 𝑑.
𝜀 為隨機誤差項，而且假設𝜀 , 𝜀 , ⋯ , 𝜀 𝑁 0, 𝜎 。
~
2. 因為𝑌 𝛼 𝛽𝑥 𝜀 （常數項）+隨機誤差項，可知𝑌 為一隨機變數。
𝑖. 𝑖. 𝑑.
3. 因為𝜀 , 𝜀 , ⋯ , 𝜀 𝑁 0, 𝜎 ，可知𝐸 𝜀 0且𝑉𝑎𝑟 𝜀 𝜎 ；𝑖 1, 2, ⋯ , 𝑛。
~
𝛼 𝛽𝑥 是常數，可得
𝐸 𝑌 𝐸 𝛼 𝛽𝑥 𝜀 𝛼 𝛽𝑥 𝐸 𝜀 𝛼 𝛽𝑥
𝑉𝑎𝑟 𝑌 𝑉𝑎𝑟 𝛼 𝛽𝑥 𝜀 𝑉𝑎𝑟 𝜀 𝜎
由上述結果可知𝑌 , 𝑌 , ⋯ , 𝑌 為互相獨立的隨機變數且
𝑌 ~𝑁 𝛼 𝛽𝑥 , 𝜎 ；𝑖 1, 2, ⋯ , 𝑛。
4. 𝑌 𝛼 𝛽𝑥 𝜀 𝛼 𝛽𝑥̅ 𝛽 𝑥 𝑥̅ 𝜀 𝛼 𝛽 𝑥 𝑥̅ 𝜀
可知𝑌 , 𝑌 , ⋯ , 𝑌 為互相獨立的隨機變數且𝑌 ~𝑁 𝛼 𝛽 𝑥 𝑥̅ , 𝜎 ；𝑖 1, 2, ⋯ , 𝑛。
5. 以最大概似估計法求𝛼, 𝛽與𝜎 的最大概似估計量

The joint pdf of 𝑌 , 𝑌 , ⋯ , 𝑌 is
1 𝑦 𝛼 𝛽 𝑥 𝑥̅
exp
√2𝜋𝜎 2𝜎
The likelihood function is
1 𝑦 𝛼 𝛽 𝑥 𝑥̅
𝐿 𝛼, 𝛽, 𝜎 exp
√2𝜋𝜎 2𝜎
∑ ̅
exp
Find 𝛼, 𝛽 and 𝜎 to maximize 𝐿 𝛼, 𝛽, 𝜎 . ⇔ Find 𝛼, 𝛽 and 𝜎 to minimize

𝑛 ∑ 𝑦 𝛼 𝛽 𝑥 𝑥̅
ln 𝐿 𝛼, 𝛽, 𝜎 ln 2𝜋𝜎
2 2𝜎
, , ∑ ̅
⎧ 0 ⋯⋯⋯⋯ 1
⎪ , , ∑ ̅ ̅
Set 0 ⋯⋯ 2
⎨
⎪ , , ∑ ̅
0 ⋯⋯ 3
⎩
By (1) ⇒ ∑ 𝑦 𝑛𝛼 𝛽∑ 𝑥 𝑥̅ 0
⇒∑ 𝑦 𝑛𝛼 0 [∵ ∑ 𝑥 𝑥̅ 0
⇒ 𝛼 𝑌 ⋯⋯ 4
By (2)(4) ⇒ ∑ 𝑦 𝑦 𝑥 𝑥̅ 𝛽∑ 𝑥 𝑥̅ 0
∑ ̅ ∑ ̅ ∑ ̅
⇒𝛽 ∑ ̅ ∑ ̅ ∑ ̅
.
By (3) and replacing 𝛼 and 𝛽 by their solutions 𝛼 and 𝛽

∑ ̅
⇒𝜎 is the MLE of 𝜎 .
⇒ 𝑛𝜎 𝑦 𝛼 𝛽 𝑥 𝑥̅
𝑦 𝑦 𝛽 𝑥 𝑥̅
∑ 𝑦 𝑦 2𝛽 ∑ 𝑥 𝑥̅ 𝑦 𝑦 𝛽 ∑ 𝑥 𝑥̅
𝑆 2𝛽𝑆 𝛽 𝑆
𝑆 2𝛽𝑆 𝛽∙ ∙𝑆
𝑆 𝛽𝑆 .
6. 以最小平方法（method of least squares）求𝛼與𝛽的點估計量

如 Figure 6.5-1 所示，|𝑦 𝛼 𝛽 𝑥 𝑥̅ | |𝑦 𝜇 𝑥 |表示 𝑥 , 𝑦 與直線𝑦 𝜇 𝑥
上 𝑥 , 𝜇 𝑥 點的距離，𝐻 𝛼, 𝛽 ∑ 𝑦 𝛼 𝛽 𝑥 𝑥̅ 代表這些距離的平方和。
最小平方法乃是求𝛼與𝛽的點估計量，使得距離的平方和𝐻 𝛼, 𝛽 ∑ 𝑦 𝛼
𝛽 𝑥 𝑥̅ 為最小。
,
2∑ 𝑦 𝛼 𝛽 𝑥 𝑥̅ 0 ⋯⋯⋯⋯ 1
令 ,
2∑ 𝑦 𝛼 𝛽 𝑥 𝑥̅ 𝑥 𝑥̅ 0 ⋯⋯⋯⋯ 2
By (1) ⇒ ∑ 𝑦 𝑛𝛼 𝛽∑ 𝑥 𝑥̅ 0
⇒∑ 𝑦 𝑛𝛼 0 [∵ ∑ 𝑥 𝑥̅ 0
⇒ 𝛼 𝑌 ⋯⋯ 3
By (2)(3) ⇒ ∑ 𝑦 𝑦 𝑥 𝑥̅ 𝛽∑ 𝑥 𝑥̅ 0
∑ ̅ ∑ ̅ ∑ ̅
⇒𝛽 ∑ ̅ ∑ ̅ ∑ ̅
.
7. 𝐸 𝑌 𝛼 𝛽 𝑥 𝑥̅ 𝜇 𝑥 稱之為迴歸函數（regression function）。
利用𝑌 𝛼 𝛽 𝑥 𝑥̅ 估計𝐸 𝑌 𝛼 𝛽 𝑥 𝑥̅ 𝜇 𝑥 。
𝑌 𝛼 𝛽 𝑥 𝑥̅ 稱之為最小平方迴歸線（the least squares regression line）或估計
迴歸方程式（the estimated regression equation）
。
因為𝑌 𝛼 𝛽 𝑥 𝑥̅ 𝑌 𝛽 𝑥 𝑥̅ ，故最小平方迴歸線一定會通過 𝑥̅ , 𝑌 點。
8. 第𝑖次試驗觀察值𝑌 與𝐸 𝑌 之差𝜀 𝑌 𝐸 𝑌 ，以𝑒 𝑌 𝑌 𝑌 𝛼 𝛽 𝑥 𝑥̅

預測𝜀 ，而稱𝑒 為第𝑖次試驗觀察值𝑌 與估計值𝑌 之殘差（residual）。
設𝑆𝑆𝐸 ∑ 𝑒 ∑ 𝑌 𝑌 ∑ 𝑌 𝛼 𝛽 𝑥 𝑥̅ 稱之為誤差平方和
（error sum of squares）或稱殘差平方和（residual sum of squares），用來衡量𝑌 值與
估計值𝑌 之差異情形。若𝑆𝑆𝐸 0，表示所有觀察值全落在最小平方迴歸線上，即
𝑌 𝑌 。因此，若𝑆𝑆𝐸很小，表示簡單線性迴歸模式是一個相當合適的分析工具；
反之，若𝑆𝑆𝐸很大，表示𝑌 與𝑌 之差異很大，此時，簡單線性迴歸模式就不是一個合
適的分析工具。
9. 殘差和∑ 𝑒 ∑ 𝑌 𝑌 ∑ 𝑌 𝛼 𝛽 𝑥 𝑥̅
∑ 𝑌 𝑌 𝛽 𝑥 𝑥̅
∑ 𝑌 𝑌 𝛽∑ 𝑥 𝑥̅ 0
10. 以 𝑥 , 𝑒 , 𝑖 1, 2, ⋯ , 𝑛所繪出的殘差圖（residuals plot）

，可看出簡單線性迴歸模式
是不是一個合適的分析工具。
Example 6.5-1 某心理學班的 10 位學生，期初測驗成績𝑥與期末測驗成績𝑦之關係，如下表

所示：
（假設簡單線性迴歸模式適用於本例）
(a) 求最小平方迴歸線。
(b) 求𝜎 的最大概似估計值。
(c) 繪出殘差圖。
解：(a) 𝑛 10, 𝑥̅ 68.3, 𝑦 81.3, 可得
𝛼 𝑦 81.3
𝑆 ∑ 𝑥 10𝑥̅ 47405 10 68.3 756.1
𝑆 ∑ 𝑥 𝑦 𝑛𝑥̅ 𝑦 56089 10 68.3 81.3 561.1
.
𝛽 0.7421
.
因此，最小平方迴歸線為𝑦 81.3 0.7421 𝑥 68.3 。
(b) 𝑆 ∑ 𝑦 10𝑦 66731 10 81.3 634.1
𝜎 𝑆 𝛽𝑆 634.1 0.7421 561.1 21.771
(c)
 𝛼的機率分配
𝛼 𝑌 ∑ 𝑌 是常態隨機變數𝑌 , 𝑌 , ⋯ , 𝑌 的線性函數。因此，𝛼 的機率分配為常態
分配。𝐸 𝛼 𝐸 𝑌 ∑ 𝐸 𝑌 ∑ 𝛼 𝛽 𝑥 𝑥̅ 𝛼且
𝑉𝑎𝑟 𝛼 𝑉𝑎𝑟 𝑌 ∑ 𝑉𝑎𝑟 𝑌 ，可得 𝛼 ~𝑁 𝛼, 。

 𝛽的機率分配
∑ ̅ ̅
𝛽 ∑ 𝑐 𝑌 ，其中 𝑐 ，所以知道𝛽是常態隨機變數
∑ ̅ ∑ ̅
𝑌 , 𝑌 , ⋯ , 𝑌 的線性函數。因此，𝛽的機率分配為常態分配。
∑ 𝑥 𝑥̅ 𝐸 𝑌 ∑ 𝑥 𝑥̅ 𝛼 𝛽 𝑥 𝑥̅
𝐸 𝛽
∑ 𝑥 𝑥̅ ∑ 𝑥 𝑥̅
∑ ̅ ∑ ̅
∑ ̅
𝛽
∑ 𝑥 𝑥̅ 𝑉𝑎𝑟 𝑌 𝜎 𝜎
𝑉𝑎𝑟 𝛽
∑ 𝑥 𝑥̅ ∑ 𝑥 𝑥̅ 𝑆
可得 𝛽~𝑁 𝛽, 。
7.6 More Regression
Theorem 9.3-1 (Cochran’s Theorem)

Let 𝑄 𝑄 𝑄 ⋯ 𝑄 , where 𝑄, 𝑄 , 𝑄 , ⋯ , 𝑄 are 𝑘 1 real quadratic forms in 𝑛
mutually independent random variables normally distributed with same variance 𝜎 .
Let ~𝜒 𝑟 , ~𝜒 𝑟 , ~𝜒 𝑟 , ⋯ , ~𝜒 𝑟 .
If 𝑄 0, then
(a) 𝑄 , 𝑄 , ⋯ , 𝑄 are mutually independent, and hence,
(b) ~𝜒 𝑟 , where 𝑟 𝑟 𝑟 𝑟 ⋯ 𝑟 .
 ∑ 𝑌 𝛼 𝛽 𝑥 𝑥̅ ∑ 𝛼 𝛼 𝛽 𝛽 𝑥 𝑥̅ 𝑌 𝛼 𝛽 𝑥 𝑥̅
𝑛 𝛼 𝛼 𝛽 𝛽 ∑ 𝑥 𝑥̅ ∑ 𝑌 𝛼 𝛽 𝑥 𝑥̅ 【left as exercise】
𝑛 𝛼 𝛼 𝛽 𝛽 𝑆 𝑆𝑆𝐸 ⋯ ⋯ ⋯ ⋯ 1
𝑖𝑛𝑑.
∵𝑌 𝑁𝛼 𝛽 𝑥 𝑥̅ , 𝜎 ；𝑖 1, 2, ⋯ , 𝑛
~
̅ 𝑖. 𝑖. 𝑑.
⇒ 𝜒 1 ；𝑖 1, 2, ⋯ , 𝑛
~
∑ ̅
⇒ ~𝜒 𝑛 ⋯ ⋯ ⋯ ⋯ 2
𝜎
∵ 𝛼 ~𝑁 𝛼,
𝑛
𝛼 𝛼
⇒ ~𝑁 0, 1
𝜎⁄√𝑛
⇒ ~𝜒 1 ⋯ ⋯ ⋯ ⋯ 3
/
𝜎
∵ 𝛽 ~𝑁 𝛽,
𝑆
𝛽 𝛽
⇒ ~𝑁 0, 1
𝜎⁄ 𝑆
⇒ ~𝜒 1 ⋯ ⋯ ⋯ ⋯ 4
/
By (1)(2)(3)(4) and Cochran’s Theorem

𝛼 , 𝛽, and 𝑆𝑆𝐸 are mutually independent.

⇒ 𝑆𝑆𝐸
~𝜒 𝑛 2 .
𝜎
因為𝐸 𝑛 2，可得𝐸 𝜎 ，意即是𝜎 的不偏估計量，故以誤差均方
（Mean Square Error）𝑀𝑆𝐸 估計𝜎 ，以√𝑀𝑆𝐸估計𝜎。
※ 𝜎 的最大概似估計量為
※ 𝜎 的不偏估計量為 𝑀𝑆𝐸
 𝑆𝑆𝐸 ∑ 𝑦 𝛼 𝛽 𝑥 𝑥̅
𝑦 𝑦 𝛽 𝑥 𝑥̅
∑ 𝑦 𝑦 2𝛽 ∑ 𝑥 𝑥̅ 𝑦 𝑦 𝛽 ∑ 𝑥 𝑥̅
𝑆 2𝛽𝑆 𝛽 𝑆
𝑆 2𝛽𝑆 𝛽∙ ∙𝑆
𝑆 𝛽𝑆 .
⁄√
 𝑇 ~𝑡 𝑛 2
⁄
𝛼 𝛼
1 𝛾 𝑃 𝑡 ⁄ 𝑛 2 𝑡 ⁄ 𝑛 2
𝑀𝑆𝐸 ⁄𝑛
𝑃 𝛼 𝑡 ⁄ 𝑛 2 𝛼 𝛼 𝑡 ⁄ 𝑛 2
可得𝛼的100 1 𝛾 %信賴區間為 𝛼 𝑡 ⁄ 𝑛 2 。
※ 僅在模式中，含𝑥 0時，才有意義。
⁄
 𝑇 ~𝑡 𝑛 2
⁄
𝛽 𝛽
1 𝛾 𝑃 𝑡 ⁄ 𝑛 2 𝑡 ⁄ 𝑛 2
𝑀𝑆𝐸 ⁄𝑆
𝑃 𝛽 𝑡 ⁄ 𝑛 2 𝛽 𝛽 𝑡 ⁄ 𝑛 2
可得𝛽的100 1 𝛾 %信賴區間為 𝛽 𝑡 ⁄ 𝑛 2 。
 ~𝜒 𝑛 2
𝑆𝑆𝐸
1 𝛾 𝑃 𝜒 ⁄ 𝑛 2 𝜒 ⁄ 𝑛 2
𝜎
𝑃 𝜎
⁄ ⁄
可得𝜎 的100 1 𝛾 %信賴區間為 , 。

⁄ ⁄
例題利用 Example 6.5-1 的資料

(a) 求誤差平方和（error sum of squares）𝑆𝑆𝐸。
(b) 求𝜎 的不偏估計值𝑀𝑆𝐸。
(c) 求𝛼的95%信賴區間。
(d) 求𝛽的95%信賴區間。
(e) 求𝜎 的95%信賴區間。
解：𝑛 10, 𝑥̅ 68.3, 𝑦 81.3
𝑆 ∑ 𝑥 10𝑥̅ 47405 10 68.3 756.1

𝑆 ∑ 𝑥 𝑦 𝑛𝑥̅ 𝑦 56089 10 68.3 81.3 561.1
𝑆 ∑ 𝑦 10𝑦 66731 10 81.3 634.1
𝛼 𝑦 81.3
.
𝛽 0.7421
.
(a) 𝑆𝑆𝐸 𝑆 𝛽𝑆 634.1 0.7421 561.1 217.71

.
(b) 𝑀𝑆𝐸 27.21
(c) 𝛼的95%信賴區間為
.
𝛼 𝑡 . 8 81.3 2.306 77.50, 85.10 .
(d) 𝛽的95%信賴區間為
.
𝛽 𝑡 . 8 0.7421 2.306 0.30, 1.18 .
.
(e) 𝜎 的95%信賴區間為
. .
, , 12.41, 99.87 .
. . . .
 𝐸 𝑌 𝛼 𝛽 𝑥 𝑥̅ 𝜇 𝑥 的區間估計
1. 𝐸 𝑌 𝛼 𝛽 𝑥 𝑥̅ 𝜇 𝑥 的點估計量為𝑌 𝛼 𝛽 𝑥 𝑥̅ 。
2. 𝛼與𝛽是常態隨機變數𝑌 , 𝑌 , ⋯ , 𝑌 的線性函數，可得𝑌 𝛼 𝛽 𝑥 𝑥̅ 亦是常態隨機
變數𝑌 , 𝑌 , ⋯ , 𝑌 的線性函數。因此，𝑌 𝛼 𝛽 𝑥 𝑥̅ 的機率分配為常態分配。
3. 𝐸 𝑌 𝐸𝛼 𝛽 𝑥 𝑥̅ 𝛼 𝛽 𝑥 𝑥̅ 𝜇 𝑥
可得𝑌是𝜇 𝑥 的不偏估計量。
4. 𝑉𝑎𝑟 𝑌 𝑉𝑎𝑟 𝛼 𝛽 𝑥 𝑥̅
𝑉𝑎𝑟 𝛼 𝑥 𝑥̅ 𝑉𝑎𝑟 𝛽 [因為𝛼與𝛽互相獨立]
𝑥 𝑥̅
1 𝑥 𝑥̅
𝜎
𝑛 𝑆
註: 若𝑥與𝑥̅ 之差值愈大，則 𝑥 𝑥̅ 愈大，可得𝑉𝑎𝑟 𝑌 愈大。若𝑥與𝑥̅ 之差值愈小，
則 𝑥 𝑥̅ 愈小，可得𝑉𝑎𝑟 𝑌 愈小。
̅
5. 𝑌~𝑁 𝜇 𝑥 , 𝜎 ，可得
𝑍 ~𝑁 0, 1
若𝜎 未知，以𝑀𝑆𝐸 估計𝜎 ，可得
𝑇 ~𝑡 𝑛 2
√
6. 1 𝛾 𝑃 𝑡 ⁄ 𝑛 2 𝑡 ⁄ 𝑛 2
√
̅ ̅
𝑃 𝑌 𝑡 ⁄ 𝑛 2 √𝑀𝑆𝐸 𝜇 𝑥 𝑌 𝑡 ⁄ 𝑛 2 √𝑀𝑆𝐸
̅
可得𝜇 𝑥 的100 1 𝛾 %信賴區間為 𝑦 𝑡 ⁄ 𝑛 2 √𝑀𝑆𝐸 。
 新觀察值𝑌 的預測
1. 以𝑌 𝛼 𝛽 𝑥 𝑥̅ 預測𝑌 ，其中𝛼 與𝛽是由 𝑥 , 𝑌 , 𝑥 , 𝑌 , ⋯ , 𝑥 , 𝑌 估計
得來的。
∑
2. 𝑌 𝛼 𝛽 𝑥 𝑥̅ 𝜀 ，𝜀 ~𝑁 0, 𝜎 ，其中𝑥̅ 。
3. 預測誤差 𝑊 𝑌 𝑌 𝑌 𝛼 𝛽 𝑥 𝑥̅ 是常態隨機變數𝑌 , 𝑌 , ⋯ , 𝑌
的線性函數，可得𝑊的機率分配為常態分配。
4. 𝐸 𝑊 𝐸 𝑌 𝑌 𝐸𝑌 𝛼 𝛽 𝑥 𝑥̅
𝛼 𝛽 𝑥 𝑥̅ 𝛼 𝛽 𝑥 𝑥̅ 0
5. 𝑉𝑎𝑟 𝑊 𝑉𝑎𝑟 𝑌 𝑌
𝑉𝑎𝑟 𝑌 𝛼 𝛽 𝑥 𝑥̅
𝑉𝑎𝑟 𝑌 𝑉𝑎𝑟 𝛼 𝑥 𝑥̅ 𝑉𝑎𝑟 𝛽
𝜎 𝑥 𝑥̅
̅
𝜎 1
̅
6. 𝑊 𝑌 𝑌 ~𝑁 0, 𝜎 1 ，可得
𝑍 ~𝑁 0, 1
若𝜎 未知，以𝑀𝑆𝐸 估計𝜎 ，可得
𝑇 ~𝑡 𝑛 2
√
7. 1 𝛾 𝑃 𝑡 ⁄ 𝑛 2 𝑡 ⁄ 𝑛 2
√
1 𝑥 𝑥̅
𝑃 𝑌 𝑡 ⁄ 𝑛 2 √𝑀𝑆𝐸 1 𝑌
𝑛 𝑆
1 𝑥 𝑥̅
𝑌 𝑡 ⁄ 𝑛 2 √𝑀𝑆𝐸 1
𝑛 𝑆
可得𝑌 的100 1 𝛾 %預測區間(prediction interval)為

̅
𝑦 𝑡 ⁄ 𝑛 2 √𝑀𝑆𝐸 1 。
例題利用 Example 6.5-1 的資料
(a) Find a 95% confidence interval for 𝜇 𝑥 when 𝑥 60。
(b) Find a 95% prediction interval for 𝑌 when 𝑥 60。
解：𝑦 81.3 0.7421 𝑥 68.3
When 𝑥 60, 𝑦 81.3 0.7421 60 68.3 75.1406.
(a) A 95% confidence interval for 𝜇 60 is
̅
𝑦 𝑡 . 8 √𝑀𝑆𝐸
.
75.1406 2.306 √27.21
.
75.1406 5.2586
69.8820, 80.3992
(b) A 95% prediction interval for 𝑌 when 𝑥 60 is

̅
𝑦 𝑡 . 8 √𝑀𝑆𝐸 1
.
75.1406 2.306 √27.21 1
.
75.1406 13.1280
62.0126, 88.2686
比較(a)與(b)發現，在同一信賴度與同一𝑥值下，預測區間的長度較信賴區間的長度寬，乃是
因為預測區間是對隨機變數（為一變動值）做預測，而信賴區間是對參數（為一固定值）做
估計。
註: P351-353 兩個以上獨立變數的多元迴歸(multiple regression)，留待進階課程再來討論。

高統講義ch7 20230904

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

高統講義ch7 20230904

Uploaded by

Copyright:

Available Formats

第 7 章第1頁共47頁

Chapter 7 Interval Estimation

7.1 Confidence Intervals for Means

 母體平均數𝜇的雙尾信賴區間（two-sided confidence interval）

Example 7.1-1 假設某廠商所銷售 60 瓦特燈泡之壽命呈常態分配𝑁 𝜇, 1296 ，隨機抽驗 27

𝑥̅ 𝑧 . ∙ , 𝑥̅ 𝑧 . ∙ 1478 1.96 ∙ , 1478 1.96 ∙

Example 7.1-3 假設𝑋為一個美國人一天飲用柳橙汁的數量（公克/天），柳橙栽培者隨機抽

𝑥̅ 𝑧 . ∙ , 𝑥̅ 𝑧 . ∙ 133 1.645 ∙ , 133 1.645 ∙

Example 7.1-4 為估計麥考特瓦湖西邊水域湖水之平均含鈉量𝜇（密西根州），隨機抽取 32

Example 7.1-5 為估計母牛在泌乳期之平均乳脂肪產量  ，隨機抽出 20 隻泌乳期之母牛，

間為 𝑥̅ 1.645 ∙ , 𝑥̅ 1.645 ∙ 。今以電腦從𝑁 50, 16 中模擬 50 組樣本數為 5

的樣本，計算𝜇的 90%信賴區間，以線段描繪出此 50 個區間，如 Figure 7.1-1(a)所示，

, 𝑥̅ 2.132 ∙ 。今以前面已模擬出 50 組樣本數為 5 的樣本（相同資料），計算𝜇

的 90%信賴區間，以線段描繪出此 50 個區間，如 Figure 7.1-1(b)所示，其中有 46 個

 母體平均數𝝁的單尾信賴區間（one-sided confidence interval）

(1) 𝜇的100 1 𝛼 %下界（lower bound）信賴區間為 𝑥̅ 𝑧 ∙ ,∞ ，

(2) 𝜇的100 1 𝛼 %上界（upper bound）信賴區間為 ∞, 𝑥̅ 𝑧 ∙ 。

(1) 𝜇的100 1 𝛼 %下界信賴區間為 𝑥̅ 𝑧 ∙ , ∞ 或 𝑥̅ 𝑧 ∙ ,∞ ，

(2) 𝜇的100 1 𝛼 %上界信賴區間為 ∞, 𝑥̅ 𝑧 ∙ 或 ∞, 𝑥̅ 𝑧 ∙ 。

(1) 𝜇的100 1 𝛼 %下界信賴區間為 𝑥̅ 𝑡 𝑛 1 ∙ ,∞ ，

(2) 𝜇的100 1 𝛼 %上界信賴區間為 ∞, 𝑥̅ 𝑡 𝑛 1 ∙

(4) 信賴係數：信賴係數1 𝛼愈大，信賴區間的寬度愈寬。

(b) 若取𝜇的 95%信賴區間為

  ' s 100 1    % 的區間估計量

Let q 2  q 2  q1  . * 兩側對 q1微分

是  ' s 100 1    % 最短區間長 的信賴區間。

7.2 Confidence Intervals for the Difference of Two Means

因此，𝜇 𝜇 的100 1 𝛼 %信賴區間為

(2) 𝜎 與𝜎 未知，分別以𝑠 與𝑠 取代，可得

而𝑆 稱為𝜎 的合併估計量（pooled estimator）。

※ 課本 P320 第 1 列 It is …起至 P321 倒數第 10 列…in these samples.止，省略不講。

 若𝜇 𝜇 的100 1 𝛼 %信賴區間包含 0，則有100 1 𝛼 %的信心，相信𝜇 與𝜇 無顯

 若𝜇 𝜇 的100 1 𝛼 %信賴區間上下限均大於 0，則有100 1 𝛼 %的信心，相信𝜇

 若𝜇 𝜇 的100 1 𝛼 %信賴區間上下限均小於 0，則有100 1 𝛼 %的信心，相信𝜇

(b) 因為𝜇 𝜇 的95%信賴區間上下限均大於 0，可得有95%的信心，相信𝜇 與𝜇

Example 7.2-2 設大、小兩所高中的學生，數學成績分別呈常態分配𝑁 𝜇 , 𝜎 與

(b) 因為𝜇 𝜇 的95%信賴區間包含 0，可得有95%的信心，相信𝜇 與𝜇 無顯著差

因此，𝜇 的100 1 𝛼 %信賴區間為

 若𝜇 𝜇 𝜇 的100 1 𝛼 %信賴區間包含 0，則有100 1 𝛼 %的信心，相信𝜇 與𝜇

例3 BB 減肥食品公司宣稱「服用 BB 減肥食品一個月，平均體重至少可減輕 20 磅」。今

case 4 12和 22未知,但 12 = 22

 遇到兩個獨立母體,具有共同的母體變異數  ，計算綜合樣本變異數(pooled sample

（假設具有相同的  2 下，估計 variance）

 求  1 + 2  3  ' s 100 1    %的區間估計量

Confidence Intervals for Variances

𝜎 的100 1 𝛼 %信賴區間為 , ；亦可得

可得𝜎 的100 1 𝛼 %信賴區間為 , 。

因此， 的100 1 𝛼 %信賴區間為

亦可得 的100 1 𝛼 %信賴區間為

 若 的100 1 𝛼 %信賴區間包含 1，則有100 1 𝛼 %的信心，相信𝜎 與𝜎 無顯著差

 若 的100 1 𝛼 %信賴區間上下限均大於 1，則有100 1 𝛼 %的信心，相信𝜎 與𝜎

 若 的100 1 𝛼 %信賴區間上下限均小於 1，則有100 1 𝛼 %的信心，相信𝜎 與𝜎

(b) 在98%的信賴度之下，由(a)之結果，說明𝜎 與𝜎 是否有顯著差異？

(b) 因為 的98%信賴區間包含 1，，可得有 98 % 的信心，相信𝜎 與𝜎 無顯著差

(c) 的98%信賴區間為 √0.41, √13.22 0.64, 3.64 。

  2 ' s 100 1    % 的區間估計量

case 1 1和 2已知

7.3 Confidence Intervals for Proportions

(3) 𝑝的100 1 𝛼 %信賴區間為 𝑝̂ 𝑧 ⁄ , 𝑝̂ 𝑧 ⁄ ，

Example 7.3-2 某次政治選舉中，為估計某候選人之得票率𝑝，隨機抽出 351 位選民做調

解：(a) 𝑝的點估計值為 𝑝̂ 0.527 52.7%

0.475, 0.579 47.5%, 57.9%

 𝑝的100 1 𝛼 %上界（upper bound）信賴區間為 0, 𝑝̂ 𝑧 。

是  ' s 100 1    % 最短區間長的信賴區間。

因此，的100 1 𝛼 %信賴區間為

亦可得的100 1 𝛼 %信賴區間為

 若的100 1 𝛼 %信賴區間包含 1，則有100 1 𝛼 %的信心，相信𝜎 與𝜎 無顯著差

 若的100 1 𝛼 %信賴區間上下限均大於 1，則有100 1 𝛼 %的信心，相信𝜎 與𝜎

 若的100 1 𝛼 %信賴區間上下限均小於 1，則有100 1 𝛼 %的信心，相信𝜎 與𝜎

(b) 因為的98%信賴區間包含 1，，可得有 98 % 的信心，相信𝜎 與𝜎 無顯著差

因為𝐸 𝑛 2，可得𝐸 𝜎 ，意即是𝜎 的不偏估計量，故以誤差均方

例題利用 Example 6.5-1 的資料