You are on page 1of 47

第 7 章第1頁共47頁

Chapter 7 Interval Estimation

楔子,以一個真實故事開始。
某統計考試後後,一些學生找老師問班上成績為何?老師表示等上課之後再統一公布。生:
能否先透露一些訊息?師:平均大概 50 分,正負 50 分的話為 100%信賴區間。生:…,能
否精準些?師:平均約 50 分,正負 20 分的話為 95%信賴區間。

7.1 Confidence Intervals for Means

從參數為𝜃之母體抽出一組隨機樣本𝑋 , 𝑋 , ⋯ , 𝑋 ,則母體參數𝜃的區間估計型式為
𝑃 𝐿 𝜃 𝑈 1 𝛼
其中0 𝛼 1,而1 𝛼稱之為信賴係數(confidence coefficient)或信賴水準(confidence
level),亦稱之為信賴度(degree of confidence)。𝐿與𝑈為隨機樣本𝑋 , 𝑋 , ⋯ , 𝑋 之函數,皆
為隨機變數,區間 𝐿, 𝑈 稱之為母體參數𝜃的100 1 𝛼 %隨機區間(random interval);其值
分別以𝑙與𝑢表示,則區間 𝑙, 𝑢 稱之為母體參數𝜃的100 1 𝛼 %信賴區間(confidence
interval),𝑙稱之為信賴下限(lower confidence limit:簡稱 LCL),𝑢稱之為信賴上限
(upper confidence limit:簡稱 UCL)。至於如何決定𝑙與𝑢之值,需由𝜃的點估計量𝜃與𝜃之
抽樣分配來決定,以下將針對不同的參數,詳論如何決定𝑙與𝑢之值。

 母體平均數𝜇的雙尾信賴區間(two-sided confidence interval)

𝑖. 𝑖. 𝑑.
(A) 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑁 𝜇, 𝜎 ,𝜎 已知,可得𝑍 ~𝑁 0, 1 ,則
~ ⁄√

𝜇的100 1 𝛼 %信賴區間為 𝑥̅ 𝑧 ⁄ ∙ , 𝑥̅ 𝑧 ⁄ ∙ ,
√ √

簡記為 𝑥̅ 𝑧 ⁄ ∙

簡單記法:[點估計值 (分配的臨界值)(點估計量的標準差)]
※ 簡單記法僅適用於𝑍分配與𝑡分配,不適用於𝜒 分配與𝐹分配。
※ 參數𝜃的統計推論,思維四步驟:
(1) 求出參數𝜃的點估計量𝜃
(2) 求出點估計量𝜃的抽樣分配(機率分配)
(3) 畫出點估計量𝜃的抽樣分配圖(機率分配圖)
(4) 由點估計量𝜃的抽樣分配圖,依題意寫出數式

證明:
第 7 章第2頁共47頁

𝑋 𝜇
1 𝛼 𝑃 𝑧 ⁄ 𝑍 𝑧 ⁄ 𝑃 𝑧 ⁄ 𝑧 ⁄
𝜎⁄√𝑛

𝑃 𝑋 𝑧 ⁄ ∙ 𝜇 𝑋 𝑧 ⁄ ∙
√ √

可得𝜇的100 1 𝛼 %信賴區間為 𝑥̅ 𝑧 ⁄ ∙ , 𝑥̅ 𝑧 ⁄ ∙
√ √

附註,令為等尾,是因在抽樣分配對稱於平均數時,此為最小區間長的信賴區間。

𝑖. 𝑖. 𝑑.
(B) 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝜇, 𝜎 ,任何母體,𝜎 已知或未知皆可,當樣本數夠大時,例
~

如,假設𝑛 30,我們即當成樣本數夠大時,由中央極限定理,可得𝑍 ⁄√

近似𝑁 0, 1 ;若  未知,則以樣本標準差𝑆取代𝜎,亦可得𝑍 ⁄√
近似𝑁 0, 1 ,則𝜇的

100 1 𝛼 %信賴區間為 𝑥̅ 𝑧 ⁄ ∙ , 𝑥̅ 𝑧 ⁄ ∙ 或 𝑥̅ 𝑧 ⁄ ∙ , 𝑥̅ 𝑧 ⁄ ∙
√ √ √ √

簡記為 𝑥̅ 𝑧 ⁄ ∙ 或 𝑥̅ 𝑧 ⁄ ∙
√ √

𝑖. 𝑖. 𝑑.
(C) 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑁 𝜇, 𝜎 ,𝜎 未知且承繼上題的假設,假設𝑛 30為樣本數小,
~

可得𝑇 ⁄√
~𝑡 𝑛 1 ,

則𝜇的100 1 𝛼 %信賴區間為 𝑥̅ 𝑡 ⁄ 𝑛 1 ∙ , 𝑥̅ 𝑡 ⁄ 𝑛 1 ∙
√ √

簡記為 𝑥̅ 𝑡 ⁄ 𝑛 1 ∙

證明:
第 7 章第3頁共47頁

1 𝛼 𝑃 𝑡 ⁄ 𝑛 1 𝑇 𝑡 ⁄ 𝑛 1

𝑃 𝑡 ⁄ 𝑛 1 ⁄√
𝑡 ⁄ 𝑛 1

𝑃 𝑋 𝑡 ⁄ 𝑛 1 ∙ 𝜇 𝑋 𝑡 ⁄ 𝑛 1 ∙
√ √

可得𝜇的100 1 𝛼 %信賴區間為 𝑥̅ 𝑡 ⁄ 𝑛 1 ∙ , 𝑥̅ 𝑡 ⁄ 𝑛 1 ∙ .
√ √

Example 7.1-1 假設某廠商所銷售 60 瓦特燈泡之壽命呈常態分配𝑁 𝜇, 1296 ,隨機抽驗 27


個,得平均壽命為𝑥̅ 1478小時,求𝜇的 95%信賴區間。
解:𝜇的 95%信賴區間為

𝑥̅ 𝑧 . ∙ , 𝑥̅ 𝑧 . ∙ 1478 1.96 ∙ , 1478 1.96 ∙


√ √ √ √

1464.42, 1491.58
意即有 95%的信心,相信 60 瓦特燈泡之平均壽命𝜇至少為 1464.42 小時,至多為
1491.58 小時。

Example 7.1-3 假設𝑋為一個美國人一天飲用柳橙汁的數量(公克/天),柳橙栽培者隨機抽


出 576 位美國人做調查,得飲用柳橙汁的樣本平均數為𝑥̅ 133(公克/天)。若𝑋的標
準差為𝜎 96(公克/天),試求𝑋的平均數𝜇的 90%信賴區間。
解:𝜇的 90%信賴區間為

𝑥̅ 𝑧 . ∙ , 𝑥̅ 𝑧 . ∙ 133 1.645 ∙ , 133 1.645 ∙


√ √ √ √

126.42, 139.58

Example 7.1-4 為估計麥考特瓦湖西邊水域湖水之平均含鈉量𝜇(密西根州),隨機抽取 32


單位體積的湖水為樣本,測量其鈉含量(單位:ppm),得如下資料:
13.0 18.5 16.4 14.8 19.4 17.3 23.2 24.9
20.8 19.3 18.8 23.1 15.2 19.9 19.1 18.1
25.1 16.8 20.4 17.4 25.2 23.1 15.3 19.4
16.0 21.7 15.2 21.3 21.5 16.8 15.6 17.6
試求𝜇的 95%信賴區間。
解:𝑛 32, 𝑥̅ 19.07, 𝑠 10.60
第 7 章第4頁共47頁
𝜇的 95%信賴區間為
√ . √ .
𝑥̅ 𝑧 . ∙ , 𝑥̅ 𝑧 . ∙ 19.07 1.96 ∙ , 19.07 1.96 ∙
√ √ √ √

17.94, 20.20

Example 7.1-5 為估計母牛在泌乳期之平均乳脂肪產量  ,隨機抽出 20 隻泌乳期之母牛,


測量乳脂肪產量(單位:磅)
,得如下資料:
481 537 513 583 453 510 570 500 457 555
618 327 350 643 499 421 505 637 599 392
假設乳脂肪產量呈常態分配𝑁 𝜇, 𝜎 ,試求𝜇的 90%信賴區間。
解:𝑛 20, 𝑥̅ 507.5, 𝑠 89.75
𝜇的 90%信賴區間為

𝑥̅ 𝑡 . 19 ∙ , 𝑥̅ 𝑡 . 19 ∙
√ √

. .
507.5 1.729 ∙ , 507.5 1.729 ∙ 472.8, 542.2
√ √

𝑖. 𝑖. 𝑑.
Example 7.1-2 & Example 7.1-6 (a) 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑁 𝜇, 16 ,則𝜇的 90%信賴區
~

間為 𝑥̅ 1.645 ∙ , 𝑥̅ 1.645 ∙ 。今以電腦從𝑁 50, 16 中模擬 50 組樣本數為 5


√ √

的樣本,計算𝜇的 90%信賴區間,以線段描繪出此 50 個區間,如 Figure 7.1-1(a)所示,


其中有 45 個(90%)信賴區間包含𝜇。
𝑖. 𝑖. 𝑑.
(b) 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑁 𝜇, 𝜎 ,𝜎 未知,則𝜇的 90%信賴區間為 𝑥̅ 2.132 ∙
~

, 𝑥̅ 2.132 ∙ 。今以前面已模擬出 50 組樣本數為 5 的樣本(相同資料),計算𝜇


√ √

的 90%信賴區間,以線段描繪出此 50 個區間,如 Figure 7.1-1(b)所示,其中有 46 個


(大約 90%)信賴區間包含𝜇。
第 7 章第5頁共47頁

 說明𝜇的 90%信賴區間之意義。
答:隨機抽取𝑘組樣本,則得到𝑘個關於𝜇的信賴區間,其中大約有0.90𝑘信賴區間包含𝜇。

 母體平均數𝝁的單尾信賴區間(one-sided confidence interval)

𝑖. 𝑖. 𝑑.
(D) 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑁 𝜇, 𝜎 ,𝜎 已知,則
~

(1) 𝜇的100 1 𝛼 %下界(lower bound)信賴區間為 𝑥̅ 𝑧 ∙ ,∞ ,


(2) 𝜇的100 1 𝛼 %上界(upper bound)信賴區間為 ∞, 𝑥̅ 𝑧 ∙ 。


證明:(1) 1 𝛼 𝑃 ⁄√
𝑧 𝑃 𝑋 𝑧 ∙ 𝜇

可得𝜇的100 1 𝛼 %下界信賴區間為 𝑥̅ 𝑧 ∙ ,∞ 。

(2) 1 𝛼 𝑃 𝑧 ⁄√
𝑃 𝜇 𝑋 𝑧 ∙

可得𝜇的100 1 𝛼 %上界信賴區間為 ∞, 𝑥̅ 𝑧 ∙ 。

𝑖. 𝑖. 𝑑.
(E) 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝜇, 𝜎 ,任何母體,𝜎 已知或未知皆可,𝑛 30,則
~

(1) 𝜇的100 1 𝛼 %下界信賴區間為 𝑥̅ 𝑧 ∙ , ∞ 或 𝑥̅ 𝑧 ∙ ,∞ ,


√ √

(2) 𝜇的100 1 𝛼 %上界信賴區間為 ∞, 𝑥̅ 𝑧 ∙ 或 ∞, 𝑥̅ 𝑧 ∙ 。


√ √
第 7 章第6頁共47頁

𝑖. 𝑖. 𝑑.
(F) 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑁 𝜇, 𝜎 ,𝜎 未知且𝑛 30,則
~

(1) 𝜇的100 1 𝛼 %下界信賴區間為 𝑥̅ 𝑡 𝑛 1 ∙ ,∞ ,


(2) 𝜇的100 1 𝛼 %上界信賴區間為 ∞, 𝑥̅ 𝑡 𝑛 1 ∙


 影響信賴區間寬度的因素
信賴區間的寬度  (信賴上限)-(信賴下限),而會影響信賴區間寬度的因素有:
(1) 點估計量:被估計參數的點估計量可能不只一個,不同的點估計量,其抽樣分配亦不
同,因此會影響信賴區間的寬度。
𝑖. 𝑖. 𝑑.
例如:若𝑋 , 𝑋 , 𝑋 𝑁 𝜇, 𝜎 ,則
~

𝑋 與𝑊 皆可作為𝜇的點估計量,而

𝐸 𝑋 𝐸 𝑊 𝜇,意即站在不偏性的觀點,兩者一樣好;但

𝑉𝑎𝑟 𝑋

𝑉𝑎𝑟 𝑊 𝑉𝑎𝑟

𝑉𝑎𝑟 𝑋 𝑉𝑎𝑟 𝑊

意即站在變異數的觀點,𝑋較𝑊好。
因此,在同一信賴係數下,以𝑋作為𝜇的點估計量,所求得的信賴區間寬度
較窄。

(2) 樣本數:樣本數𝑛愈大,信賴區間的寬度愈窄。以抽樣母體為常態分配,母體變異數
𝜎 已知為例,𝜇的100 1 𝛼 %信賴區間為

𝑥̅ 𝑧 ⁄ ∙ , 𝑥̅ 𝑧 ⁄ ∙ ,信賴區間寬度為2𝑧 ⁄ ∙ ,可知樣本數𝑛愈大,信賴區
√ √ √

間的寬度愈窄。

(3) 信賴界限:若信賴界限的取法不同,也會造成信賴區間的寬度不同。
以抽樣母體為常態分配,母體變異數𝜎 已知為例:
(a)
第 7 章第7頁共47頁

若取𝜇的 95%信賴區間為

𝑥̅ 𝑧 . ∙ , 𝑥̅ 𝑧 . ∙ 𝑥̅ 1.96 ∙ , 𝑥̅ 1.96 ∙ ,
√ √ √ √

則信賴區間寬度為 3.92 ∙ 。

(b)

若取𝜇的 95%信賴區間為

𝑥̅ 𝑧 . ∙ , 𝑥̅ 𝑧 . ∙ 𝑥̅ 2.326 ∙ , 𝑥̅ 1.75 ∙ ,
√ √ √ √

則信賴區間寬度為 4.076 ∙ 。

此兩組信賴區間皆有 95%的信賴度,但因信賴界限的取法不同,造成信賴區間的寬
度亦不同。

(4) 信賴係數:信賴係數1 𝛼愈大,信賴區間的寬度愈寬。


以抽樣母體為常態分配,母體變異數𝜎 已知為例:
(a) 若取𝜇的 90%信賴區間為

𝑥̅ 𝑧 . ∙ , 𝑥̅ 𝑧 . ∙ 𝑥̅ 1.645 ∙ , 𝑥̅ 1.645 ∙ ,
√ √ √ √

則信賴區間寬度為 3.29 ∙ 。

(b) 若取𝜇的 95%信賴區間為

𝑥̅ 𝑧 . ∙ , 𝑥̅ 𝑧 . ∙ 𝑥̅ 1.96 ∙ , 𝑥̅ 1.96 ∙ ,
√ √ √ √

則信賴區間寬度為 3.92 ∙ 。

由此兩組信賴區間可得:信賴係數1 𝛼愈大,信賴區間的寬度愈大。

 在同一信賴係數下,信賴區間的寬度愈窄者,精確度愈高。
第 7 章第8頁共47頁
 在信賴區間的寬度相同之下,信賴係數1 𝛼愈大者愈好(因為可信度愈高)。
第 7 章第9頁共47頁

Chochran’s Theorem.

Z   2 v  1 v  v1  1 Z  X   2  v  v1 
且 則  
X   2  v1  2 zx0  2  Z  X   X


 Xn  
1  N  0,1 2已知, 推論
 / n

2 Xn  
 t  n  1 2 未知, 推論
 s/ n

t-distribution
Z  N  0,1 Z
, Z U  T   t v 
U  2
v  U /v

性質

1. E T   0 , Var T  
v
,v  2
v2

2. T  N  0,1 , v  

  ' s 100 1    % 的區間估計量

<1>  2 已知

Xn  
Q  N  0,1
/ n
 X      
1    P  q1  n  q2   P  X n  q2    X n  q1 
 / n   n n
<考慮最短的區間長, min L >

 
q1 , q 2 必滿足 q   z  dz 1   * ,min   q2  q1  **
q2

1
 n 

Let q 2  q 2  q1  . * 兩側對 q1微分


第 7 章第10頁共47頁

dq2 dq   q1 
   q2     q1   0  2 
dq1 dq1   q2 

Let L  q1   q2  q1

d dq   q1 
L  q1   2  1   1  0    q1     q2 
dq1 dq1   q2 

 q1  q 2  不合  , q 2   q1
   
 Xn  Z /2 , X n  Z /2 
 n n 

是  ' s 100 1    % 最短區間長 的信賴區間。

<2>  2 未知
 s s 
Similar to <1> case. Then,  X n  t  /2  n  1 , X n  t /2  n  1  是  ' s 100 1    % 最短區間
 n n 
長的信賴區間。
第 7 章第11頁共47頁

7.2 Confidence Intervals for the Difference of Two Means

 兩獨立母體平均數差𝜇 𝜇 的信賴區間

𝑖. 𝑖. 𝑑. 𝑖. 𝑖. 𝑑.
(A) 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑁 𝜇 , 𝜎 ;𝑌 , 𝑌 , ⋯ , 𝑌 𝑁 𝜇 , 𝜎 ,且假設此二母體互相獨
~ ~
立,𝜎 與𝜎 已知。

因為𝑋~𝑁 𝜇 , ,𝑌~𝑁 𝜇 , ,且 𝑋 𝑌 ~𝑁 𝜇 𝜇 , 。

可得 𝑍 ~𝑁 0, 1 ,且

⎡ ⎤
𝑋 𝑌 𝜇 𝜇
1 𝛼 𝑃⎢ 𝑧 ⁄ 𝑧 ⁄

⎢ 𝜎 𝜎 ⎥
⎣ 𝑛 𝑚 ⎦

𝜎 𝜎 𝜎 𝜎
𝑃 𝑋 𝑌 𝑧 ⁄ ∙ 𝜇 𝜇 𝑋 𝑌 𝑧 ⁄ ∙
𝑛 𝑚 𝑛 𝑚

因此,𝜇 𝜇 的100 1 𝛼 %信賴區間為

𝜎 𝜎 𝜎 𝜎
𝑥̅ 𝑦 𝑧 ⁄ ∙ , 𝑥̅ 𝑦 𝑧 ⁄ ∙
𝑛 𝑚 𝑛 𝑚

簡記為 𝑥̅ 𝑦 𝑧 ⁄ ∙ 。

𝑖. 𝑖. 𝑑. 𝑖. 𝑖. 𝑑.
(B) 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝜇 , 𝜎 ;𝑌 , 𝑌 , ⋯ , 𝑌 𝜇 , 𝜎 ,此為任何二互相獨立母
~ ~
體,𝑛 30,𝑚 30,𝜎 與𝜎 已知或未知皆可。由中央極限定理,可得
(1) 𝜎 與𝜎 已知,則 𝑍 近似𝑁 0, 1 ,可得

𝜇 𝜇 的100 1 𝛼 %信賴區間為

𝜎 𝜎 𝜎 𝜎
𝑥̅ 𝑦 𝑧 ⁄ ∙ , 𝑥̅ 𝑦 𝑧 ⁄ ∙
𝑛 𝑚 𝑛 𝑚

簡記為 𝑥̅ 𝑦 𝑧 ⁄ ∙ 。

(2) 𝜎 與𝜎 未知,分別以𝑠 與𝑠 取代,可得


𝜇 𝜇 的100 1 𝛼 %信賴區間為
第 7 章第12頁共47頁

𝑠 𝑠 𝑠 𝑠
𝑥̅ 𝑦 𝑧 ⁄ ∙ , 𝑥̅ 𝑦 𝑧 ⁄ ∙
𝑛 𝑚 𝑛 𝑚

簡記為 𝑥̅ 𝑦 𝑧 ⁄ ∙ 。

𝑖. 𝑖. 𝑑. 𝑖. 𝑖. 𝑑.
(C) 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑁 𝜇 , 𝜎 ;𝑌 , 𝑌 , ⋯ , 𝑌 𝑁 𝜇 , 𝜎 ,且假設此二母體互相獨
~ ~
立,𝑛 30,𝑚 30,𝜎 未知【亦即假設兩母體變異數未知但相等】。
因為 𝑍 ~𝑁 0, 1 ,

𝑈 is 𝜒 𝑛 𝑚 2 ,且

Z 與 U 為獨立的隨機變數(數理統計範圍),可得
𝑋 𝑌 𝜇 𝜇
𝜎 𝜎
𝑍 𝑛 𝑚
𝑇
𝑈⁄ 𝑛 𝑚 2
𝑛 1 𝑆 𝑚 1 𝑆
𝑛 𝑚 2
𝜎 𝜎

𝑋 𝑌 𝜇 𝜇

𝑛 1 𝑆 𝑚 1 𝑆 1 1
𝑛 𝑚 2 𝑛 𝑚

𝑋 𝑌 𝜇 𝜇
~𝑡 𝑛 𝑚 2
1 1
𝑆
𝑛 𝑚

其中𝑆 ,

而𝑆 稱為𝜎 的合併估計量(pooled estimator)。


因此,𝜇 𝜇 的100 1 𝛼 %信賴區間為

𝑥̅ 𝑦 𝑡 ⁄ 𝑛 𝑚 2 ∙𝑠 ∙ , 𝑥̅ 𝑦 𝑡 ⁄ 𝑛 𝑚 2 ∙𝑠 ∙

簡記為 𝑥̅ 𝑦 𝑡 ⁄ 𝑛 𝑚 2 ∙𝑠 ∙ 。

𝑖. 𝑖. 𝑑. 𝑖. 𝑖. 𝑑.
(D) 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑁 𝜇 , 𝜎 ;𝑌 , 𝑌 , ⋯ , 𝑌 𝑁 𝜇 , 𝜎 ,且假設此二母體互相獨
~ ~
立,𝑛 30,𝑚 30,𝜎 與𝜎 未知,可得 Welch’s T distribution
第 7 章第13頁共47頁

𝑇 ~𝑡 𝑟 ,其中𝑟 ,

若 r 不是整數,則採無條件捨去法取整數。
因此,𝜇 𝜇 的100 1 𝛼 %信賴區間為

𝑠 𝑠 𝑠 𝑠
𝑥̅ 𝑦 𝑡 ⁄ 𝑟 ∙ , 𝑥̅ 𝑦 𝑡 ⁄ 𝑟 ∙
𝑛 𝑚 𝑛 𝑚

簡記為 𝑥̅ 𝑦 𝑡 ⁄ 𝑟 ∙ 。

※ 課本 P320 第 1 列 It is …起至 P321 倒數第 10 列…in these samples.止,省略不講。

 若𝜇 𝜇 的100 1 𝛼 %信賴區間包含 0,則有100 1 𝛼 %的信心,相信𝜇 與𝜇 無顯


著差異。

 若𝜇 𝜇 的100 1 𝛼 %信賴區間上下限均大於 0,則有100 1 𝛼 %的信心,相信𝜇


與𝜇 有顯著差異且𝜇 顯著大於𝜇 。

 若𝜇 𝜇 的100 1 𝛼 %信賴區間上下限均小於 0,則有100 1 𝛼 %的信心,相信𝜇


與𝜇 有顯著差異且𝜇 顯著小於𝜇 。

𝑖. 𝑖. 𝑑.
Example 7.2-1 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑁 𝜇 , 60 ,𝑥̅ 70.1;
~
𝑖. 𝑖. 𝑑.
𝑌 ,𝑌 ,⋯,𝑌 𝑁 𝜇 , 40 ,𝑦 75.3,且假設此二母體互相獨立。
~
試求𝜇 𝜇 的90%信賴區間。
解:𝜇 𝜇 的90%信賴區間為

𝜎 𝜎 𝜎 𝜎
𝑥̅ 𝑦 𝑧 . ∙ , 𝑥̅ 𝑦 𝑧 . ∙
𝑛 𝑚 𝑛 𝑚

60 40 60 40
70.1 75.3 1.645 ∙ , 70.1 75.3 1.645 ∙
15 8 15 8

10.135, 0.265
因為𝜇 𝜇 的90%信賴區間上下限均小於 0,故有90%的信心,相信𝜇 與𝜇 有顯
著差異且𝜇 顯著小於𝜇 。

例1 X 與 Y 兩種品牌電池,抽樣測得其壽命資料如下表:
樣本數 平均壽命(小時) 標準差(小時)
X 40 160 20
第 7 章第14頁共47頁
Y 50 150 16
(a) 求 X 與 Y 兩種品牌電池之平均壽命差𝜇 𝜇 的95%信賴區間。
(b) 在95%的信賴度之下,由(a)之結果,說明𝜇 與𝜇 是否有顯著差異?
解:(a) 𝜇 𝜇 的95%信賴區間為

𝑠 𝑠 𝑠 𝑠
𝑥̅ 𝑦 𝑧 . ∙ , 𝑥̅ 𝑦 𝑧 . ∙
𝑛 𝑚 𝑛 𝑚

20 16 20 16
160 150 1.96 ∙ , 160 150 1.96 ∙
40 50 40 50

2.38, 17.62

(b) 因為𝜇 𝜇 的95%信賴區間上下限均大於 0,可得有95%的信心,相信𝜇 與𝜇


有顯著差異且𝜇 顯著大於𝜇 。

Example 7.2-2 設大、小兩所高中的學生,數學成績分別呈常態分配𝑁 𝜇 , 𝜎 與


𝑁 𝜇 , 𝜎 。若由大高中隨機抽出 9 位學生,得𝑥̅ 81.31,𝑠 60.76;由小高中隨機抽
出 15 位學生,得𝑦 78.61,𝑠 48.24。
(a) 求𝜇 𝜇 的95%信賴區間。
(b) 在 95 % 的信賴度之下,由(a)之結果,說明𝜇 與𝜇 是否有顯著差異?
解:(a) 𝜇 𝜇 的95%信賴區間為

1 1
𝑥̅ 𝑦 𝑡 . 22 ∙ 𝑠 ∙
𝑛 𝑚

9 1 60.76 15 1 48.24 1 1
81.31 78.61 2.074 ∙ ∙
9 15 2 9 15

3.65, 9.05

(b) 因為𝜇 𝜇 的95%信賴區間包含 0,可得有95%的信心,相信𝜇 與𝜇 無顯著差


異。

例2 X 與 Y 兩種品牌電池,抽樣測得其壽命資料如下表:(假設 X 與 Y 兩種品牌電池之壽
命皆呈常態分配)
樣本數 平均壽命(小時) 標準差(小時)
X 8 160 10
Y 10 150 20
求 X 與 Y 兩種品牌電池之平均壽命差𝜇 𝜇 的95%信賴區間。
第 7 章第15頁共47頁

解:𝑟 13.77,

取𝑟 13
𝜇 𝜇 的95%信賴區間為

𝑠 𝑠 10 20
𝑥̅ 𝑦 𝑡 . 13 ∙ 160 150 2.16 ∙
𝑛 𝑚 8 10

5.65, 25.65

 配對樣本之母體平均數差𝝁𝑫 的信賴區間
配對編號 1 2 … 𝑛
𝑋 𝑋 𝑋 ⋯ 𝑋
𝑌 𝑌 𝑌 ⋯ 𝑌
𝐷 𝑋 𝑌 𝐷 𝐷 ⋯ 𝐷
𝑖. 𝑖. 𝑑.
假設𝐷 , 𝐷 , ⋯ , 𝐷 𝑁 𝜇 , 𝜎 ,𝜇 𝜇 𝜇 ,𝜎 未知且𝑛 30。
~
∑ ∑
令𝐷 ,𝑆 ,可得𝑇 ⁄√
~𝑡 𝑛 1 。

∑ ∑
觀察值為𝑑̅ ,𝑠 。

因此,𝜇 的100 1 𝛼 %信賴區間為

𝑑̅ 𝑡 ⁄ 𝑛 1 ∙ , 𝑑̅ 𝑡 ⁄ 𝑛 1 ∙
√ √

簡記為 𝑑̅ 𝑡 ⁄ 𝑛 1 ∙ 。

 若𝜇 𝜇 𝜇 的100 1 𝛼 %信賴區間包含 0,則有100 1 𝛼 %的信心,相信𝜇 與𝜇


無顯著差異。
 若𝜇 𝜇 𝜇 的100 1 𝛼 %信賴區間上下限均大於 0,則有100 1 𝛼 %的信心,相
信𝜇 與𝜇 有顯著差異且𝜇 顯著大於𝜇 。
 若𝜇 𝜇 𝜇 的100 1 𝛼 %信賴區間上下限均小於 0,則有100 1 𝛼 %的信心,相
信𝜇 與𝜇 有顯著差異且𝜇 顯著小於𝜇 。
Example 7.2-4 進行一實驗以比較人們對紅燈與綠燈的平均反應時間有無顯著差異。今隨機
抽出 8 人從事實驗,當每人看到紅燈或綠燈信號時,被要求按開關鍵關燈,按關燈鍵
時,計秒器會紀錄反應時間,8 位實驗者的反應時間記錄如下(單位:秒):
實驗者編號 Red 𝑋 Green 𝑌 𝐷 𝑋 𝑌
1 0.30 0.43  0 .13
2 0.23 0.32  0.09
第 7 章第16頁共47頁
3 0.41 0.58  0.17
4 0.53 0.46 0.07
5 0.24 0.27  0 .03
6 0.36 0.41  0 .05
7 0.38 0.38 0.00
8 0.51 0.61  0.10
求𝜇 𝜇 𝜇 的 95%信賴區間。
解:𝑛 8, 𝑑̅ 0.0625, 𝑠 0.0765
𝜇 的 95%信賴區間為
𝑠 𝑠
𝑑̅ 𝑡 . 7 ∙ , 𝑑̅ 𝑡 . 7 ∙
√𝑛 √𝑛
0.0765 0.0765
0.0625 2.365 ∙ , 0.0625 2.365 ∙
√8 √8
0.1265, 0.0015
因為𝜇 的 95%信賴區間包含 0,可得有 95 % 的信心,相信人們對紅燈與綠燈的平
均反應時間無顯著差異。本例僅有 8 對數據資料且信賴區間的上界 0.0015 非常接近
0,當數據資料增加時,信賴區間可能不包含 0 且信賴區間上下限均小於 0,果真
如此,則似乎顯示人們對紅燈的平均反應時間較快。

例3 BB 減肥食品公司宣稱「服用 BB 減肥食品一個月,平均體重至少可減輕 20 磅」。今


隨機抽取 5 位服用者從事試驗,得服用前及服用一個月後的體重記錄如下:
服用者編號 1 2 3 4 5
服用前體重𝑥 130 143 157 146 144
服用一個月後體重𝑦 125 137 142 134 132
𝑑 𝑥 𝑦 5 6 15 12 12
假設服用前後體重差呈常態分配,服用前的母體平均體重為𝜇 ,服用後的母體平均體
重為𝜇 ,且設𝜇 𝜇 𝜇 ,求𝜇 的 95%信賴區間。
解:𝑛 5, 𝑑̅ 10, 𝑠 4.30

𝜇 的 95%信賴區間為 𝑑̅ 𝑡 . 4 ∙ , 𝑑̅ 𝑡 . 4 ∙
√ √

4.30 4.30
10 2.776 ∙ , 10 2.776 ∙
4.66, 15.34
√5 √5
意即有 95%的信心,相信服用 BB 減肥食品一個月,平均體重至少可減輕 4.66 磅,
至多可減輕 15.34 磅。
第 7 章第17頁共47頁

兩樣本的區間估計
X 1  X m  N  1 ,  12 
iid

Y1 Yn  N  2 ,  22 
iid


1   2 ' s 100 1    %的區間估計量

 12  22  12  22
 :X  Y , Var  X  Y     Var  X  Y   
m n m n
  12  22 
case 1  和 已知   X  Y 
2 2
  Z /2 
1
 2
m n 
 

 S12 S22 
case 2  12和 22 未知,但為大樣本   X  Y    Z / 2 
 m n 
 

 S12 S 22 
case 3  和 未知,小樣本   X  Y 
2 2
  t /2  v  
1 2
 m n 
 
2
 S12 S22 
  
Where v  Welch d . f .   2
m n 
2
(取近似整數)
 S12   S22 
   
 m   n 
m 1 n 1

case 4 12和 22未知,但 12 = 22

 遇到兩個獨立母體,具有共同的母體變異數  ,計算綜合樣本變異數(pooled sample


2

variance)

x  x    y  y
n n
2 2
iid
X 1  X m  E  X   1 ,Var  X    2 i j
 SP2  i 1 i 1
 綜合樣本變異數 
iid
mn2
Y1 Yn  E Y    2 ,Var Y    2

(假設具有相同的  2 下,估計 variance)



 m  1 S X2   n  1 SY2  
1
E  S P 2  = 2 ,  S P 2  
 mn2 
  1 1 
Then, the CI for 1   2 ,   X  Y     S P2  t /2  m  n  2   。
 m n 
 

(Recall)
第 7 章第18頁共47頁
 2
 2
Var  X  Y   1
 2
m n
  1 1 
X  Y  N  1  2 ,     2 
 m n 

m n
 m n

  xi  x    yi  y   i     yi  y 
2 2 2 2
x  x 
i 1
 i 1
~  2  m  n  2  且  x  y    i 1  i 1 
2 2   2
2 
 
 
X  Y   1   2 
 1 1 2
   X  Y   1  2 
m n
T    t  m  n  2
 1 1 2
 x  x    y  y
n n
2 2
i j    SP
i 1 j 1 m n
/mn2
2
1
Where S P 2 
mn2
 m  1 S X2   n  1 SY2 

 
 
 X  Y   1   2  
1    P  t /2  m  n  2    t /2  m  n  2  
  1 1 2 
    SP 
m n

   1 1  
 P  1   2    X  Y     S P2  t /2  m  n  2   
 m n 
   

Ex.

n  N  1 ,  
iid
2
 1 X  X

X  Y  W  Y1 Yn  N  2 , a 2  且a, b已知
iid


W1 Wn  N  3 , b 2 
iid



 求  1 + 2  3  ' s 100 1    %的區間估計量

解答
 1 a  b  2 
X  Y  W  N  1 +2  3 ,   
  n  
第 7 章第19頁共47頁
 2
a 2
b 2
Var  X  Y  W   V  X   V Y   V W    
n n n

1 n 1 n
 y j  y  
n n n n

  xi  x     wk  w
2 2
  xi  x    wk  w
2 2
2 2
 y j  y 
a j 1 b k 1
i 1
 j 1
 k 1
 i 1
  2  3n  3
 2
a 2
b 2
 2

1 1
 y j  y     wk  w 
n n n

 x  x  
2 2 2
i 
i 1 a j 1 b k 1
Let A   S2
3n  3

X  Y  W   1   2  3 
~ N (0,1)
 1 a  b  2
  X  Y  W   1   2  3 
 n 
T   ~ t  3n  3  .
  3n  3  A /  2  2   2  3n  3 
1/ 2
1 a  b 
  ~   

A

 3n  3   3n  3 
n

(再比照上式作 1   即知 C. I.)
第 7 章第20頁共47頁

Confidence Intervals for Variances


註: 本是自成一節的內容,本書第 9 版卻將它分拆在習題 7.1-16 及習題 7.2-14 裡。

 母體變異數𝝈𝟐 的信賴區間

𝑖. 𝑖. 𝑑.
假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑁 𝜇, 𝜎 ,𝜎 未知,可得𝜒 ~𝜒 𝑛 1 ,則
~

𝜎 的100 1 𝛼 %信賴區間為 , ;亦可得


⁄ ⁄

𝜎的100 1 𝛼 %信賴區間為 , 。
⁄ ⁄

證明:

1 𝛼 𝑃𝜒 ⁄ 𝑛 1 𝜒 𝜒 ⁄ 𝑛 1

𝑃 𝜒 ⁄ 𝑛 1 𝜒 ⁄ 𝑛 1

𝑃 𝜎
⁄ ⁄

可得𝜎 的100 1 𝛼 %信賴區間為 , 。


⁄ ⁄

例4 在墨西哥發現一種開花植物 Guardiola,其種子成熟所需天數呈常態分配𝑁 𝜇, 𝜎 。
若隨機抽出𝑛 13顆窄葉種子,得𝑥̅ 18.97,12𝑠 ∑ 𝑥 𝑥̅ 128.41。
(a) 求𝜎 的90%信賴區間。
(b) 求𝜎的90%信賴區間。
. .
解:(a) 𝜎 的90%信賴區間為 , , 6.11, 24.57 。
. . . .

. .
(b) 𝜎的90%信賴區間為 , , 2.47, 4.96 。
. . . .
第 7 章第21頁共47頁

 若𝑈~𝜒 𝑟 ,𝑉~𝜒 𝑟 ,𝑈與𝑉為獨立的隨機變數,則𝐹 ⁄
為具有自由度為 𝑟 , 𝑟

,以符號簡記成𝐹~𝐹 𝑟 , 𝑟 。
之𝐹分配(𝐹 distribution)

𝑖. 𝑖. 𝑑. 𝑖. 𝑖. 𝑑.
 假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑁 𝜇 , 𝜎 ;𝑌 , 𝑌 , ⋯ , 𝑌 𝑁 𝜇 , 𝜎 ,且假設此二母體互相
~ ~
獨立,則

【1】𝑈 ~𝜒 𝑛 1

【2】𝑉 ~𝜒 𝑚 1

【3】𝑈與𝑉為獨立的隨機變數
【4】由【1】【2】【3】可得
𝑛 1 𝑆
𝑛 1
𝑈⁄ 𝑛 1 𝜎 𝑆 ⁄𝜎
𝐹 ~𝐹 𝑛 1, 𝑚 1
𝑉⁄ 𝑚 1 𝑚 1 𝑆 𝑆 ⁄𝜎
𝑚 1
𝜎

𝝈𝟐
 兩獨立母體變異數比 𝑿𝟐 的信賴區間
𝝈𝒀

𝑖. 𝑖. 𝑑. 𝑖. 𝑖. 𝑑.
假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑁 𝜇 , 𝜎 ;𝑌 , 𝑌 , ⋯ , 𝑌 𝑁 𝜇 , 𝜎 ,且假設此二母體互相獨
~ ~

立,可得𝐹 ~𝐹 𝑛 1, 𝑚 1 。

因此, 的100 1 𝛼 %信賴區間為

∙ , ∙ 或
⁄ , ⁄ ,

∙ , ∙𝐹 ⁄ 𝑚 1, 𝑛 1 ;
⁄ ,

亦可得 的100 1 𝛼 %信賴區間為

∙ , ∙ 或
⁄ , ⁄ ,

∙ , ∙𝐹 ⁄ 𝑚 1, 𝑛 1 。
⁄ ,

證明:
第 7 章第22頁共47頁

𝑆 ⁄𝜎
1 𝛼 𝑃 𝐹 ⁄ 𝑛 1, 𝑚 1 𝐹 ⁄ 𝑛 1, 𝑚 1
𝑆 ⁄𝜎

𝑃 ∙
⁄ , ⁄ ,

𝑆 1 𝜎 𝑆 1
𝑃 ∙ ∙
𝑆 𝐹 ⁄ 𝑛 1, 𝑚 1 𝜎 𝑆 𝐹 ⁄ 𝑛 1, 𝑚 1

可得 的100 1 𝛼 %信賴區間為 ∙ , ∙ 。
⁄ , ⁄ ,

 若 的100 1 𝛼 %信賴區間包含 1,則有100 1 𝛼 %的信心,相信𝜎 與𝜎 無顯著差

異。

 若 的100 1 𝛼 %信賴區間上下限均大於 1,則有100 1 𝛼 %的信心,相信𝜎 與𝜎

有顯著差異且𝜎 顯著大於𝜎 。

 若 的100 1 𝛼 %信賴區間上下限均小於 1,則有100 1 𝛼 %的信心,相信𝜎 與𝜎

有顯著差異且𝜎 顯著小於𝜎 。

例5 在墨西哥發現一種開花植物 Guardiola,其窄葉種子成熟所需天數呈常態分配
𝑁 𝜇 , 𝜎 ;寬葉種子成熟所需天數呈常態分配𝑁 𝜇 , 𝜎 。若隨機抽出𝑛 13顆窄葉種
子,得𝑥̅ 18.97,12𝑠 ∑ 𝑥 𝑥̅ 128.41;隨機抽出𝑚 9顆寬葉種子,得
𝑦 23.20,8𝑠 ∑ 𝑦 𝑦 36.72。

(a) 求 的98%信賴區間。

(b) 在98%的信賴度之下,由(a)之結果,說明𝜎 與𝜎 是否有顯著差異?

(c) 求 的98%信賴區間。

解:(a) 的98%信賴區間為 ∙ , ∙𝐹 . 8, 12
. ,

128.41/12 1 128.41/12
∙ , ∙ 4.50 0.41, 13.22
36.72/8 5.67 36.72/8
第 7 章第23頁共47頁

(b) 因為 的98%信賴區間包含 1,,可得有 98 % 的信心,相信𝜎 與𝜎 無顯著差

異。

(c) 的98%信賴區間為 √0.41, √13.22 0.64, 3.64 。


第 7 章第24頁共47頁

  2 ' s 100 1    % 的區間估計量

 n

  xi   
2

 1 i 1   2  n   已知, 推論  2
 2
 n

  xi  xn 
2


 2
i 1
  2  n  1  未知, 推論  2
 2

F-distribution
U   2  v1  U / v1
且U  V  F   F  v1 , v2 
V    v2 
2
V / v2

特性

1 F v.s. Beta

v1 U v U V 1 V v v 
F   1 1 F     Beta  2 , 1 
1 1 F U V  2 2
v2 V v2 V v
v2

2 抽樣式


m  N  1 ,  1 
iid
2
X
 1  X
X Y 
 Y1 Yn  N   2 ,  22 
iid

case 1 1和 2已知

n n

  xi  1   y   
2 2
i 2
i 1
  2  m , i 1
  2  n
 2
1  2
2

 x   
2
n i 1 /m
 x   
2 i 1
1 / 2
1 n

 y   
i 2
i 1
i 2 /n
F  m  i 1
 F  m, n 
n
 12 /  22
 y   
2
i 2 / 2
2
i 1
n

case 2 1和 2 未知
第 7 章第25頁共47頁
n n

x  x   y  y 
2 2
i i
i 1
  2  m  1 , i 1
  2  n  1
 12  22
n

x   
2
n i 1 / m 1
 x  x 
2 i 1
/ 2
1 n

 y   
i 2
i 1
i 2 / n 1
F  m 1  i 1
 F  m  1, n  1
n
 12 /  22
 y  y 
2
i / 2
2
i 1
n 1
F 分配即是推論兩母體變異數是否相等時所需的樞紐量之近似分配。
第 7 章第26頁共47頁

7.3 Confidence Intervals for Proportions

 無限母體,母體比例𝒑的信賴區間

𝑖. 𝑖. 𝑑.
若𝑋 , 𝑋 , ⋯ , 𝑋 𝑏 1, 𝑝 ,
~
(1) 𝑌 ∑ 𝑋 ~𝑏 𝑛, 𝑝 且𝐸 𝑌 𝑛𝑝,𝑉𝑎𝑟 𝑌 𝑛𝑝𝑞。

(2) 𝑃 為樣本比例且𝐸 𝑃 𝑝,𝑉𝑎𝑟 𝑃 。當樣本數夠大時,由中央極限定

理,可得 𝑍 分配近似𝑁 0, 1 。

(3) 𝑝的100 1 𝛼 %信賴區間為 𝑝̂ 𝑧 ⁄ , 𝑝̂ 𝑧 ⁄ ,

簡記為 𝑝̂ 𝑧 ⁄ 。

證明:【方法一】

1 𝛼 𝑃 𝑧 ⁄ 𝑧 ⁄

𝑃 𝑃 𝑧 ⁄ 𝑝 𝑃 𝑧 ⁄

𝑃𝑄 𝑃𝑄
𝑃 𝑃 𝑧 ⁄ 𝑝 𝑃 𝑧 ⁄
𝑛 𝑛

可得𝑝的100 1 𝛼 %信賴區間為 𝑝̂ 𝑧 ⁄ , 𝑝̂ 𝑧 ⁄ 。

證明:【方法二】

𝑃 𝑝 𝑃 𝑝
1 𝛼 𝑃⎛ 𝑧 ⁄ 𝑧 ⁄
⎞ 𝑃⎛ 𝑧 ⁄

𝑝𝑞 𝑝𝑞
⎝ 𝑛 ⎠ ⎝ 𝑛 ⎠

解不等式 𝑧 ⁄ ,可得 𝑃 𝑝 𝑧 / ∙

/ /
⇒ 1 𝑝 2𝑃 𝑝 𝑃 0
第 7 章第27頁共47頁

/ / / /
/ /
⇒ 𝑝
/ /

可得𝑝的100 1 𝛼 %信賴區間為

⎡ 𝑧 / 𝑃 1 𝑃 𝑧 / 𝑧 / 𝑃 1 𝑃 𝑧 / ⎤
⎢ 𝑃 2𝑛
𝑧 / 𝑛 4𝑛
𝑃
2𝑛
𝑧 / 𝑛 4𝑛 ⎥
⎢ , ⎥
⎢ 𝑧 / 𝑧 / ⎥
⎢ 1 1 ⎥
𝑛 𝑛
⎣ ⎦
/ / /
當𝑛很大時, 0, 0, 0;令𝑞 1 𝑝̂ ,可得

𝑝的100 1 𝛼 %信賴區間為 𝑝̂ 𝑧 ⁄ , 𝑝̂ 𝑧 ⁄ 。

Example 7.3-2 某次政治選舉中,為估計某候選人之得票率𝑝,隨機抽出 351 位選民做調


查,結果有 185 位選民表示願意把票投給該候選人。試求:
(a) 該候選人之得票率𝑝的點估計值。
(b) 該候選人之得票率𝑝的95%信賴區間。

解:(a) 𝑝的點估計值為 𝑝̂ 0.527 52.7%

𝐛 𝑝的 95%信賴區間為

185 166
𝑝̂ 𝑞 185 351 351
𝑝̂ 𝑧 . 1.96
𝑛 351 351

0.475, 0.579 47.5%, 57.9%


意即有 95 % 的信心,相信該候選人之得票率𝑝至少為 47.5%,至多為 57.9%。

 𝑝的100 1 𝛼 %上界(upper bound)信賴區間為 0, 𝑝̂ 𝑧 。

 𝑝的100 1 𝛼 %下界(lower bound)信賴區間為 𝑝̂ 𝑧 , 1。

 兩獨立母體比例差𝒑𝟏 𝒑𝟐 的信賴區間

假設𝑌 ~𝑏 𝑛 , 𝑝 ,𝑌 ~𝑏 𝑛 , 𝑝 ,𝑛 30,𝑛 30,且假設𝑌 與𝑌 互相獨立。

令𝑃 ,𝑃 ,則

(1) 𝐸 𝑃 𝑃 𝑝 𝑝
第 7 章第28頁共47頁

(2) 𝑉𝑎𝑟 𝑃 𝑃

(3) 由中央極限定理,可得 𝑍 近似𝑁 0, 1 。

因此,𝑝 𝑝 的100 1 𝛼 %信賴區間為

𝑝̂ 𝑝̂ 𝑧 ⁄ , 𝑝̂ 𝑝̂ 𝑧 ⁄ ,

簡記為 𝑝̂ 𝑝̂ 𝑧 ⁄ 。

證明:1 𝛼 𝑃 𝑧 ⁄ 𝑧 ⁄

𝑃 𝑃 𝑃 𝑧 ⁄ 𝑝 𝑝 𝑃 𝑃 𝑧 ⁄

𝑃𝑄 𝑃𝑄 𝑃𝑄 𝑃𝑄
𝑃 𝑃 𝑃 𝑧 ⁄ 𝑝 𝑝 𝑃 𝑃 𝑧 ⁄
𝑛 𝑛 𝑛 𝑛

可得𝑝 𝑝 的100 1 𝛼 %信賴區間為

𝑝̂ 𝑝̂ 𝑧 ⁄ , 𝑝̂ 𝑝̂ 𝑧 ⁄ 。

 若𝑝 𝑝 的100 1 𝛼 %信賴區間包含 0,則有100 1 𝛼 %的信心,相信𝑝 與𝑝 無顯


著差異。
 若𝑝 𝑝 的100 1 𝛼 %信賴區間上下限均大於 0,則有100 1 𝛼 %的信心,相信𝑝
與𝑝 有顯著差異且𝑝 顯著大於𝑝 。
 若𝑝 𝑝 的100 1 𝛼 %信賴區間上下限均小於 0,則有100 1 𝛼 %的信心,相信𝑝
與𝑝 有顯著差異且𝑝 顯著小於𝑝 。

 𝑝 𝑝 的100 1 𝛼 %上界(upper bound)信賴區間為

1, 𝑝̂ 𝑝̂ 𝑧 。

 𝑝 𝑝 的100 1 𝛼 %下界(lower bound)信賴區間為

𝑝̂ 𝑝̂ 𝑧 , 1。

Example 7.3-4 欲比較兩種清潔劑之去污能力,某檢驗員測試第一種清潔劑 91 次,有 63 次


成功去污;測試第二種清潔劑 79 次,有 42 次成功去污。
(a) 試求去污比例差𝑝 𝑝 的點估計值。
(b) 試求去污比例差𝑝 𝑝 的90%信賴區間。
(c) 在90%的信賴度之下,由(b)之結果,說明𝑝 與𝑝 是否有顯著差異?
第 7 章第29頁共47頁

解:(a) 𝑝 𝑝 的點估計值為 𝑝̂ 𝑝̂ 0.1607

(b) 𝑝 𝑝 的90%信賴區間為 𝑝̂ 𝑝̂ 𝑧 .

63 28 42 37
63 42 91 91 79 79
1.645
91 79 91 79

0.0387, 0.2826 3.87%, 28.26%


意即有90%的信心,相信兩種清潔劑之去污比例差𝑝 𝑝 至少為 3.87%,至多
為 28.26%。

(c) 因為𝑝 𝑝 的 90%信賴區間上下限均大於 0,可得有 90%的信心,相信𝑝 與𝑝


有顯著差異且𝑝 顯著大於𝑝 。
第 7 章第30頁共47頁

7.4 Sample Size

 估計誤差(Error of the estimate):估計量𝜃與被估計參數𝜃的距離,稱為估計誤差,以


|𝜃 𝜃|表示。
 最大估計誤差(Maximum error of the estimate):若𝑃 𝜃 𝜃 𝜀 1 𝛼,則稱𝜀為以𝜃
估計參數𝜃的100 1 𝛼 %最大估計誤差,亦稱𝜀為以𝜃估計參數𝜃的100 1 𝛼 %抽樣誤
差(sampling error)。

 估計母體平均數𝝁所需的樣本數𝒏與抽樣誤差𝜺

𝑖. 𝑖. 𝑑.
假設𝑋 , 𝑋 , ⋯ , 𝑋 𝜇, 𝜎 ,任何母體,樣本數𝑛為大樣本。
~

公式 : (1) 當樣本數𝑛已知,以𝑋估計𝜇的100 1 𝛼 %最大估計誤差 𝜀 𝑧 ⁄ ∙ 。


若𝜎未知,則以樣本標準差𝑠取代𝜎。
(2) 當樣本數 n 未知,以𝑋估計𝜇的100 1 𝛼 %最大估計誤差為𝜀,則樣本數

𝑛 且以無條件進位法取整數。若𝜎未知,則辦理試查後,以樣本標

準差𝑠取代𝜎。標準差𝜎愈小,則抽樣調查所需的樣本數𝑛愈小;當𝜎 0時,
抽樣調查所需的樣本數𝑛 1即可。

證明:由中央極限定理,可得𝑍 ⁄√
近似𝑁 0, 1

| |
1 𝛼 𝑃 |𝑋 𝜇| 𝜀 𝑃 ⁄√ ⁄√
𝑃 |𝑍| ⁄√


可得 ⁄√
𝑧 ⁄ ⇒ 𝜀 𝑧 ⁄ ∙ and 𝑛 .

例1 為估計一部計程車一天行駛十小時,使用汽油燃料費之平均金額𝜇。今隨機抽出 200
部計程車從事試驗,得知使用汽油燃料費之平均金額𝑥̅ 600元,標準差𝑠 200元。
(a) 求以𝑋估計𝜇的 95%最大估計誤差。
(b) 若要求樣本平均數𝑋與母體平均數𝜇之誤差不能超過 20 元,且要有 95%的可信度,
則題目中的樣本數是否足夠?若不夠,則樣本數至少需再增加多少?

解:(a) 以𝑋估計𝜇的 95%最大估計誤差為 𝑧 . ∙ 1.96 ∙ 27.72 元)


√ √

(b) 𝜀 20, 𝛼 0.05, 𝑠 200


𝑧 .1.96 200𝑠
𝑛 384.16
𝜀 20
取𝑛 385。題目中的樣本數不夠,至少需再增加385 200 185部計程車
從事試驗。
第 7 章第31頁共47頁
Example 7.4-1 某數學系想評估採用新的微積分教學法之效果,在課程結束後,以學生的微
積分平均成績𝜇評估其成效。今隨機抽出𝑛位學生參加此新的微積分教學法,若要求樣
本平均數𝑋與母體平均數𝜇之誤差不能超過 1 分,且要有 95%的可信度,則樣本數至少
需多少?(假設𝜎 15)
解:𝜀 1, 𝛼 0.05, 𝜎 15
. .
𝑛 864.36,取𝑛 865。

 無限母體,估計母體比例𝒑所需的樣本數𝒏與抽樣誤差𝜺

𝑖. 𝑖. 𝑑.
假設𝑋 , 𝑋 , ⋯ , 𝑋 𝑏 1, 𝑝 ,樣本數𝑛為大樣本。
~

公式 : (1) 當樣本數𝑛已知,以𝑃估計𝑝的100 1 𝛼 %最大估計誤差 𝜀 𝑧 ⁄ ∙ 。

若𝑝未知,則以樣本比例𝑝̂ 取代𝑝。
(2) 當樣本數𝑛未知,以𝑃估計𝑝的100 1 𝛼 %最大估計誤差為  ,則樣本數
⁄ √
𝑛 且以無條件進位法取整數。若𝑝未知,可採用下列方法:

(a) 辦理試查後,以樣本比例𝑝̂ 取代𝑝。

(b) 若無法以樣本比例𝑝̂ 取代𝑝,則以𝑝 𝑞 代入,此乃因為

𝑝𝑞 𝑝 1 𝑝 ∙ 。

證明:由中央極限定理,可得𝑍 近似 𝑁 0, 1

| |
1 𝛼 𝑃 𝑃 𝑝 𝜀 𝑃 𝑃 |𝑍|

⁄ √
可得 𝑧 ⁄ ⇒ 𝜀 𝑧 ⁄ ∙ and 𝑛 .

例2 為估計某電視節目之收視率𝑝,節目部經理要求調查結果的收視率𝑃(樣本比例)與
實際的收視率𝑝(母體比例)之誤差不能超過 2%,且要有 95%的可信度。
(a) 若沒有提供有關收視率𝑝之訊息,又沒有辦理試查,則樣本數至少需取多少?
(b) 若在該電視節目播放中,隨機抽出 800 戶家庭做收視率調查,結果有 64 戶家庭表
示正收看該電視節目,則題目中的樣本數是否足夠?若不夠,則樣本數至少需再增
加多少?
(c) 由(b)之收視率調查結果,求以𝑃估計𝑝的 95%最大估計誤差。
解:(a) 𝜀 0.02, 𝛼 0.05
第 7 章第32頁共47頁

. ∙
. √
𝑛 2401,至少需取𝑛 2401。
.

(b) 𝜀 0.02, 𝛼 0.05, 𝑝̂ 0.08

𝑧 . 𝑝̂ 𝑞 1.96 0.08 0.92


𝑛 706.8544
𝜀 0.02

取𝑛 707。題目中的樣本數 800 已足夠。


(c) 以𝑃估計𝑝的 95%最大估計誤差為

𝑝̂ 𝑞 0.08 0.92
𝑧 . ∙ 1.96 0.0188 1.88%
𝑛 800

Example 7.4-3 為估計某州長候選人之得票率𝑝,要求調查結果的得票率𝑃(樣本比例)與


實際的得票率𝑝(母體比例)之誤差不能超過 3%,且要有 95%的可信度。
(a) 若沒有提供有關得票率𝑝之訊息,又沒有辦理試查,則樣本數至少需取多少?
(b) 若隨機抽出 1068 位選民做調查,結果有 214 位選表示願意把票投給該候選人,求
以𝑃估計𝑝的 95%最大估計誤差。
解:(a) 𝜀 0.03, 𝛼 0.05

. ∙
. √
𝑛 1067.11,至少需取𝑛 1068。
.

(b) 以𝑃估計𝑝的 95%最大估計誤差為


214 854
𝑝̂ 𝑞 1068 1068
𝑧 . ∙ 1.96 0.024 2.4%
𝑛 1068
第 7 章第33頁共47頁

 有限母體,母體比例𝒑的信賴區間

𝑁 𝑁 𝑁

𝑁 𝑁

抽出不放回

𝑛
𝑋 𝑛 𝑋

若𝑋~𝐻 𝑁, 𝑛, 𝑁 ,𝑝 為母體比例,則

(1) 𝐸 𝑋 𝑛𝑝,𝑉𝑎𝑟 𝑋 𝑛𝑝𝑞 ∙

(2) 𝑃 為樣本比例且𝐸 𝑃 𝑝,𝑉𝑎𝑟 𝑃 ∙

當樣本數𝑛 30時,由中央極限定理,可得 𝑍 近似 𝑁 0, 1

(3) 𝑝的100 1 𝛼 %信賴區間為

𝑝̂ 𝑞 𝑁 𝑛 𝑝̂ 𝑞 𝑁 𝑛
𝑝̂ 𝑧 ⁄ ∙ , 𝑝̂ 𝑧 ⁄ ∙
𝑛 𝑁 1 𝑛 𝑁 1

簡記為 𝑝̂ 𝑧 ⁄ ∙

例3 從商學院1000位學生中,隨機抽出100位學生調查,其中有30位贊同暑期實習制
度。試問贊同暑期實習制度之學生比率𝑝的95%信賴區間為何?

解:𝑁 1000, 𝑛 100, 𝑝̂ 0.3

𝑝的95%信賴區間為
. .
𝑝̂ 𝑧 . ∙ 0.3 1.96 ∙

0.2147, 0.3853 21.47%, 38.53%


意即有95%的信心,相信贊同暑期實習制度之學生比率𝑝至少為21.47%,至多為
38.53%。
第 7 章第34頁共47頁

 有限母體,估計母體比例𝒑所需的樣本數𝒏與抽樣誤差𝜺

假設𝑋~𝐻 𝑁, 𝑛, 𝑁 ,𝑝 ,樣本數𝑛為大樣本。

公式 : (1) 當樣本數𝑛已知,以𝑃估計𝑝的100 1 𝛼 %最大估計誤差𝜀 𝑧 ⁄ ∙ 。

若𝑝未知,則以樣本比例𝑝̂ 取代𝑝。
(2) 當樣本數𝑛未知,以𝑃估計𝑝的100 1 𝛼 %最大估計誤差為ε,則樣本數
⁄ √
𝑛 ,,其中𝑚 且以無條件進位法取整數。

若𝑝未知,可採用下列方法:
(a) 辦理試查後,以樣本比例𝑝̂ 取代𝑝。

(b) 若無法以樣本比例𝑝̂ 取代𝑝,則以𝑝 𝑞 代入,此乃因為

𝑝𝑞 𝑝 1 𝑝 ∙ 。

證明:由中央極限定理,可得𝑍 近似 𝑁 0, 1

| |
1 𝛼 𝑃 𝑃 𝑝 𝜀 𝑃 𝑃 |𝑍|
∙ ∙ ∙

可得 𝑧 ⁄

𝑝𝑞 𝑁 𝑛
𝜀 𝑧 ⁄ ∙
𝑛 𝑁 1

∙ ⁄ ∙
𝑛 【由上式化簡得之】
⁄ ∙

⁄ ∙ /
【分子分母同除以𝑁𝜀 】
⁄ ∙ /

⁄ √
,,其中𝑚 。

Example 7.4-4 某學院學生總數𝑁 3000人,為估計學生對新的評分方式之贊成比例𝑝,要


求調查結果的比例𝑃(樣本比例)與實際的比例𝑝(母體比例)之誤差不能超過 3%,且
要有 95%的可信度。若沒有提供有關贊成比例𝑝之訊息,又沒有辦理試查,則樣本數至
少需取多少?
解:𝑁 3000, 𝜀 0.03, 𝛼 0.05
第 7 章第35頁共47頁

. ∙
. √
𝑚 1067.11,取𝑚 1068。
.

𝑛 787.80,取𝑛 788。
第 7 章第36頁共47頁

6.5 A Simple Regression Problem

簡單線性迴歸(simple linear regression)是用來探討兩個變數間的關係,建立機率函數


模式,來做推論及預測。要預測的變數稱為因變數(dependent variable),以𝑌表示;與𝑌有
關的變數稱為獨立變數(independent variables),以𝑥表示。例如:
 已知廣告費𝑥與銷售額𝑌之關係,則可用迴歸分析,以花費的廣告費預測銷售額。
 已知一個學生的數學能力測驗成績𝑥與微積分成績𝑌之關係,則可用迴歸分析,以數學能
力測驗成績預測微積分成績。

 變數間的關係:
 函數關係:變數與變數間的關係一定,無誤差存在,即所有觀察值 𝑥, 𝑦 全落在同
一直線或同一曲線上,此種函數關係模式,稱為確定性模式(deterministic
model)。例如:𝑦 10000 40𝑥。

 統計關係:變數與變數間的關係有誤差存在,即所有觀察值 𝑥, 𝑦 並不全落在同一
直線或同一曲線上,此種統計關係模式,稱為機率模式(probabilistic model),本
節主要討論的模式即屬此一模式。例如:𝑦 10000 40𝑥 𝜀,其中𝜀為隨機誤差
項。

 散佈圖(scatter plot):由描述統計關係的散佈點,所繪出的統計圖,每一個散佈點代表
一個觀察值,如 Figure 6.5-1 所示:
第 7 章第37頁共47頁
 簡單線性迴歸模式
1. 簡單線性迴歸模式為 𝑌 𝛼 𝛽𝑥 𝜀 ,
此處
𝑌 為因變數在第𝑖次試驗的值;
𝑥 為獨立變數在第𝑖次試驗的值,是一個已知常數;
𝛼 為參數,代表𝑌軸截距(僅在模式中,含𝑥 0時,才有意義);
𝛽為參數,代表斜率(意即當𝑥每增加 1 單位,則𝑌增加𝛽單位);
𝑖. 𝑖. 𝑑.
𝜀 為隨機誤差項,而且假設𝜀 , 𝜀 , ⋯ , 𝜀 𝑁 0, 𝜎 。
~

2. 因為𝑌 𝛼 𝛽𝑥 𝜀 (常數項)+隨機誤差項,可知𝑌 為一隨機變數。

𝑖. 𝑖. 𝑑.
3. 因為𝜀 , 𝜀 , ⋯ , 𝜀 𝑁 0, 𝜎 ,可知𝐸 𝜀 0且𝑉𝑎𝑟 𝜀 𝜎 ;𝑖 1, 2, ⋯ , 𝑛。
~
𝛼 𝛽𝑥 是常數,可得
𝐸 𝑌 𝐸 𝛼 𝛽𝑥 𝜀 𝛼 𝛽𝑥 𝐸 𝜀 𝛼 𝛽𝑥
𝑉𝑎𝑟 𝑌 𝑉𝑎𝑟 𝛼 𝛽𝑥 𝜀 𝑉𝑎𝑟 𝜀 𝜎
由上述結果可知𝑌 , 𝑌 , ⋯ , 𝑌 為互相獨立的隨機變數且
𝑌 ~𝑁 𝛼 𝛽𝑥 , 𝜎 ;𝑖 1, 2, ⋯ , 𝑛。

4. 𝑌 𝛼 𝛽𝑥 𝜀 𝛼 𝛽𝑥̅ 𝛽 𝑥 𝑥̅ 𝜀 𝛼 𝛽 𝑥 𝑥̅ 𝜀
可知𝑌 , 𝑌 , ⋯ , 𝑌 為互相獨立的隨機變數且𝑌 ~𝑁 𝛼 𝛽 𝑥 𝑥̅ , 𝜎 ;𝑖 1, 2, ⋯ , 𝑛。

5. 以最大概似估計法求𝛼, 𝛽與𝜎 的最大概似估計量


The joint pdf of 𝑌 , 𝑌 , ⋯ , 𝑌 is

1 𝑦 𝛼 𝛽 𝑥 𝑥̅
exp
√2𝜋𝜎 2𝜎

The likelihood function is

1 𝑦 𝛼 𝛽 𝑥 𝑥̅
𝐿 𝛼, 𝛽, 𝜎 exp
√2𝜋𝜎 2𝜎

∑ ̅
exp

Find 𝛼, 𝛽 and 𝜎 to maximize 𝐿 𝛼, 𝛽, 𝜎 . ⇔ Find 𝛼, 𝛽 and 𝜎 to minimize


𝑛 ∑ 𝑦 𝛼 𝛽 𝑥 𝑥̅
ln 𝐿 𝛼, 𝛽, 𝜎 ln 2𝜋𝜎
2 2𝜎
第 7 章第38頁共47頁

, , ∑ ̅
⎧ 0 ⋯⋯⋯⋯ 1
⎪ , , ∑ ̅ ̅
Set 0 ⋯⋯ 2

⎪ , , ∑ ̅
0 ⋯⋯ 3

By (1) ⇒ ∑ 𝑦 𝑛𝛼 𝛽∑ 𝑥 𝑥̅ 0
⇒∑ 𝑦 𝑛𝛼 0 [∵ ∑ 𝑥 𝑥̅ 0
⇒ 𝛼 𝑌 ⋯⋯ 4
By (2)(4) ⇒ ∑ 𝑦 𝑦 𝑥 𝑥̅ 𝛽∑ 𝑥 𝑥̅ 0
∑ ̅ ∑ ̅ ∑ ̅
⇒𝛽 ∑ ̅ ∑ ̅ ∑ ̅
.

By (3) and replacing 𝛼 and 𝛽 by their solutions 𝛼 and 𝛽


∑ ̅
⇒𝜎 is the MLE of 𝜎 .

⇒ 𝑛𝜎 𝑦 𝛼 𝛽 𝑥 𝑥̅

𝑦 𝑦 𝛽 𝑥 𝑥̅

∑ 𝑦 𝑦 2𝛽 ∑ 𝑥 𝑥̅ 𝑦 𝑦 𝛽 ∑ 𝑥 𝑥̅
𝑆 2𝛽𝑆 𝛽 𝑆

𝑆 2𝛽𝑆 𝛽∙ ∙𝑆

𝑆 𝛽𝑆 .

6. 以最小平方法(method of least squares)求𝛼與𝛽的點估計量


如 Figure 6.5-1 所示,|𝑦 𝛼 𝛽 𝑥 𝑥̅ | |𝑦 𝜇 𝑥 |表示 𝑥 , 𝑦 與直線𝑦 𝜇 𝑥
上 𝑥 , 𝜇 𝑥 點的距離,𝐻 𝛼, 𝛽 ∑ 𝑦 𝛼 𝛽 𝑥 𝑥̅ 代表這些距離的平方和。
最小平方法乃是求𝛼與𝛽的點估計量,使得距離的平方和𝐻 𝛼, 𝛽 ∑ 𝑦 𝛼
𝛽 𝑥 𝑥̅ 為最小。
,
2∑ 𝑦 𝛼 𝛽 𝑥 𝑥̅ 0 ⋯⋯⋯⋯ 1
令 ,
2∑ 𝑦 𝛼 𝛽 𝑥 𝑥̅ 𝑥 𝑥̅ 0 ⋯⋯⋯⋯ 2

By (1) ⇒ ∑ 𝑦 𝑛𝛼 𝛽∑ 𝑥 𝑥̅ 0
⇒∑ 𝑦 𝑛𝛼 0 [∵ ∑ 𝑥 𝑥̅ 0
⇒ 𝛼 𝑌 ⋯⋯ 3
By (2)(3) ⇒ ∑ 𝑦 𝑦 𝑥 𝑥̅ 𝛽∑ 𝑥 𝑥̅ 0
∑ ̅ ∑ ̅ ∑ ̅
⇒𝛽 ∑ ̅ ∑ ̅ ∑ ̅
.
第 7 章第39頁共47頁
7. 𝐸 𝑌 𝛼 𝛽 𝑥 𝑥̅ 𝜇 𝑥 稱之為迴歸函數(regression function)。
利用𝑌 𝛼 𝛽 𝑥 𝑥̅ 估計𝐸 𝑌 𝛼 𝛽 𝑥 𝑥̅ 𝜇 𝑥 。
𝑌 𝛼 𝛽 𝑥 𝑥̅ 稱之為最小平方迴歸線(the least squares regression line)或估計
迴歸方程式(the estimated regression equation)

因為𝑌 𝛼 𝛽 𝑥 𝑥̅ 𝑌 𝛽 𝑥 𝑥̅ ,故最小平方迴歸線一定會通過 𝑥̅ , 𝑌 點。

8. 第𝑖次試驗觀察值𝑌 與𝐸 𝑌 之差𝜀 𝑌 𝐸 𝑌 ,以𝑒 𝑌 𝑌 𝑌 𝛼 𝛽 𝑥 𝑥̅


預測𝜀 ,而稱𝑒 為第𝑖次試驗觀察值𝑌 與估計值𝑌 之殘差(residual) 。
設𝑆𝑆𝐸 ∑ 𝑒 ∑ 𝑌 𝑌 ∑ 𝑌 𝛼 𝛽 𝑥 𝑥̅ 稱之為誤差平方和
(error sum of squares)或稱殘差平方和(residual sum of squares),用來衡量𝑌 值與
估計值𝑌 之差異情形。若𝑆𝑆𝐸 0,表示所有觀察值全落在最小平方迴歸線上,即
𝑌 𝑌 。因此,若𝑆𝑆𝐸很小,表示簡單線性迴歸模式是一個相當合適的分析工具;
反之,若𝑆𝑆𝐸很大,表示𝑌 與𝑌 之差異很大,此時,簡單線性迴歸模式就不是一個合
適的分析工具。

9. 殘差和∑ 𝑒 ∑ 𝑌 𝑌 ∑ 𝑌 𝛼 𝛽 𝑥 𝑥̅
∑ 𝑌 𝑌 𝛽 𝑥 𝑥̅
∑ 𝑌 𝑌 𝛽∑ 𝑥 𝑥̅ 0

10. 以 𝑥 , 𝑒 , 𝑖 1, 2, ⋯ , 𝑛所繪出的殘差圖(residuals plot)


,可看出簡單線性迴歸模式
是不是一個合適的分析工具。

Example 6.5-1 某心理學班的 10 位學生,期初測驗成績𝑥與期末測驗成績𝑦之關係,如下表


所示:

(假設簡單線性迴歸模式適用於本例)
(a) 求最小平方迴歸線。
(b) 求𝜎 的最大概似估計值。
第 7 章第40頁共47頁
(c) 繪出殘差圖。

解:(a) 𝑛 10, 𝑥̅ 68.3, 𝑦 81.3, 可得

𝛼 𝑦 81.3
𝑆 ∑ 𝑥 10𝑥̅ 47405 10 68.3 756.1
𝑆 ∑ 𝑥 𝑦 𝑛𝑥̅ 𝑦 56089 10 68.3 81.3 561.1
.
𝛽 0.7421
.

因此,最小平方迴歸線為𝑦 81.3 0.7421 𝑥 68.3 。

(b) 𝑆 ∑ 𝑦 10𝑦 66731 10 81.3 634.1

𝜎 𝑆 𝛽𝑆 634.1 0.7421 561.1 21.771

(c)

 𝛼的機率分配

𝛼 𝑌 ∑ 𝑌 是常態隨機變數𝑌 , 𝑌 , ⋯ , 𝑌 的線性函數。因此,𝛼 的機率分配為常態

分配。𝐸 𝛼 𝐸 𝑌 ∑ 𝐸 𝑌 ∑ 𝛼 𝛽 𝑥 𝑥̅ 𝛼且

𝑉𝑎𝑟 𝛼 𝑉𝑎𝑟 𝑌 ∑ 𝑉𝑎𝑟 𝑌 ,可得 𝛼 ~𝑁 𝛼, 。


第 7 章第41頁共47頁
 𝛽的機率分配
∑ ̅ ̅
𝛽 ∑ 𝑐 𝑌 ,其中 𝑐 ,所以知道𝛽是常態隨機變數
∑ ̅ ∑ ̅

𝑌 , 𝑌 , ⋯ , 𝑌 的線性函數。因此,𝛽的機率分配為常態分配。
∑ 𝑥 𝑥̅ 𝐸 𝑌 ∑ 𝑥 𝑥̅ 𝛼 𝛽 𝑥 𝑥̅
𝐸 𝛽
∑ 𝑥 𝑥̅ ∑ 𝑥 𝑥̅
∑ ̅ ∑ ̅
∑ ̅
𝛽

∑ 𝑥 𝑥̅ 𝑉𝑎𝑟 𝑌 𝜎 𝜎
𝑉𝑎𝑟 𝛽
∑ 𝑥 𝑥̅ ∑ 𝑥 𝑥̅ 𝑆

可得 𝛽~𝑁 𝛽, 。
第 7 章第42頁共47頁

7.6 More Regression

Theorem 9.3-1 (Cochran’s Theorem)


Let 𝑄 𝑄 𝑄 ⋯ 𝑄 , where 𝑄, 𝑄 , 𝑄 , ⋯ , 𝑄 are 𝑘 1 real quadratic forms in 𝑛
mutually independent random variables normally distributed with same variance 𝜎 .

Let ~𝜒 𝑟 , ~𝜒 𝑟 , ~𝜒 𝑟 , ⋯ , ~𝜒 𝑟 .

If 𝑄 0, then
(a) 𝑄 , 𝑄 , ⋯ , 𝑄 are mutually independent, and hence,

(b) ~𝜒 𝑟 , where 𝑟 𝑟 𝑟 𝑟 ⋯ 𝑟 .

 ∑ 𝑌 𝛼 𝛽 𝑥 𝑥̅ ∑ 𝛼 𝛼 𝛽 𝛽 𝑥 𝑥̅ 𝑌 𝛼 𝛽 𝑥 𝑥̅

𝑛 𝛼 𝛼 𝛽 𝛽 ∑ 𝑥 𝑥̅ ∑ 𝑌 𝛼 𝛽 𝑥 𝑥̅ 【left as exercise】

𝑛 𝛼 𝛼 𝛽 𝛽 𝑆 𝑆𝑆𝐸 ⋯ ⋯ ⋯ ⋯ 1

𝑖𝑛𝑑.
∵𝑌 𝑁𝛼 𝛽 𝑥 𝑥̅ , 𝜎 ;𝑖 1, 2, ⋯ , 𝑛
~
̅ 𝑖. 𝑖. 𝑑.
⇒ 𝜒 1 ;𝑖 1, 2, ⋯ , 𝑛
~
∑ ̅
⇒ ~𝜒 𝑛 ⋯ ⋯ ⋯ ⋯ 2

𝜎
∵ 𝛼 ~𝑁 𝛼,
𝑛
𝛼 𝛼
⇒ ~𝑁 0, 1
𝜎⁄√𝑛

⇒ ~𝜒 1 ⋯ ⋯ ⋯ ⋯ 3
/

𝜎
∵ 𝛽 ~𝑁 𝛽,
𝑆
𝛽 𝛽
⇒ ~𝑁 0, 1
𝜎⁄ 𝑆

⇒ ~𝜒 1 ⋯ ⋯ ⋯ ⋯ 4
/

By (1)(2)(3)(4) and Cochran’s Theorem


第 7 章第43頁共47頁

𝛼 , 𝛽, and 𝑆𝑆𝐸 are mutually independent.


⇒ 𝑆𝑆𝐸
~𝜒 𝑛 2 .
𝜎

因為𝐸 𝑛 2,可得𝐸 𝜎 ,意即 是𝜎 的不偏估計量,故以誤差均方

(Mean Square Error)𝑀𝑆𝐸 估計𝜎 ,以√𝑀𝑆𝐸估計𝜎。

※ 𝜎 的最大概似估計量為

※ 𝜎 的不偏估計量為 𝑀𝑆𝐸

 𝑆𝑆𝐸 ∑ 𝑦 𝛼 𝛽 𝑥 𝑥̅

𝑦 𝑦 𝛽 𝑥 𝑥̅

∑ 𝑦 𝑦 2𝛽 ∑ 𝑥 𝑥̅ 𝑦 𝑦 𝛽 ∑ 𝑥 𝑥̅
𝑆 2𝛽𝑆 𝛽 𝑆

𝑆 2𝛽𝑆 𝛽∙ ∙𝑆

𝑆 𝛽𝑆 .

⁄√
 𝑇 ~𝑡 𝑛 2

𝛼 𝛼
1 𝛾 𝑃 𝑡 ⁄ 𝑛 2 𝑡 ⁄ 𝑛 2
𝑀𝑆𝐸 ⁄𝑛

𝑃 𝛼 𝑡 ⁄ 𝑛 2 𝛼 𝛼 𝑡 ⁄ 𝑛 2

可得𝛼的100 1 𝛾 %信賴區間為 𝛼 𝑡 ⁄ 𝑛 2 。

※ 僅在模式中,含𝑥 0時,才有意義。
第 7 章第44頁共47頁


 𝑇 ~𝑡 𝑛 2

𝛽 𝛽
1 𝛾 𝑃 𝑡 ⁄ 𝑛 2 𝑡 ⁄ 𝑛 2
𝑀𝑆𝐸 ⁄𝑆

𝑃 𝛽 𝑡 ⁄ 𝑛 2 𝛽 𝛽 𝑡 ⁄ 𝑛 2

可得𝛽的100 1 𝛾 %信賴區間為 𝛽 𝑡 ⁄ 𝑛 2 。

 ~𝜒 𝑛 2

𝑆𝑆𝐸
1 𝛾 𝑃 𝜒 ⁄ 𝑛 2 𝜒 ⁄ 𝑛 2
𝜎

𝑃 𝜎
⁄ ⁄

可得𝜎 的100 1 𝛾 %信賴區間為 , 。


⁄ ⁄

例題 利用 Example 6.5-1 的資料


(a) 求誤差平方和(error sum of squares)𝑆𝑆𝐸。
(b) 求𝜎 的不偏估計值𝑀𝑆𝐸。
(c) 求𝛼的95%信賴區間。
(d) 求𝛽的95%信賴區間。
(e) 求𝜎 的95%信賴區間。

解:𝑛 10, 𝑥̅ 68.3, 𝑦 81.3

𝑆 ∑ 𝑥 10𝑥̅ 47405 10 68.3 756.1


𝑆 ∑ 𝑥 𝑦 𝑛𝑥̅ 𝑦 56089 10 68.3 81.3 561.1
𝑆 ∑ 𝑦 10𝑦 66731 10 81.3 634.1
𝛼 𝑦 81.3
.
𝛽 0.7421
.

(a) 𝑆𝑆𝐸 𝑆 𝛽𝑆 634.1 0.7421 561.1 217.71


.
(b) 𝑀𝑆𝐸 27.21

(c) 𝛼的95%信賴區間為
.
𝛼 𝑡 . 8 81.3 2.306 77.50, 85.10 .
第 7 章第45頁共47頁
(d) 𝛽的95%信賴區間為
.
𝛽 𝑡 . 8 0.7421 2.306 0.30, 1.18 .
.

(e) 𝜎 的95%信賴區間為
. .
, , 12.41, 99.87 .
. . . .

 𝐸 𝑌 𝛼 𝛽 𝑥 𝑥̅ 𝜇 𝑥 的區間估計
1. 𝐸 𝑌 𝛼 𝛽 𝑥 𝑥̅ 𝜇 𝑥 的點估計量為𝑌 𝛼 𝛽 𝑥 𝑥̅ 。
2. 𝛼與𝛽是常態隨機變數𝑌 , 𝑌 , ⋯ , 𝑌 的線性函數,可得𝑌 𝛼 𝛽 𝑥 𝑥̅ 亦是常態隨機
變數𝑌 , 𝑌 , ⋯ , 𝑌 的線性函數。因此,𝑌 𝛼 𝛽 𝑥 𝑥̅ 的機率分配為常態分配。
3. 𝐸 𝑌 𝐸𝛼 𝛽 𝑥 𝑥̅ 𝛼 𝛽 𝑥 𝑥̅ 𝜇 𝑥
可得𝑌是𝜇 𝑥 的不偏估計量。
4. 𝑉𝑎𝑟 𝑌 𝑉𝑎𝑟 𝛼 𝛽 𝑥 𝑥̅
𝑉𝑎𝑟 𝛼 𝑥 𝑥̅ 𝑉𝑎𝑟 𝛽 [因為𝛼與𝛽互相獨立]

𝑥 𝑥̅

1 𝑥 𝑥̅
𝜎
𝑛 𝑆
註: 若𝑥與𝑥̅ 之差值愈大,則 𝑥 𝑥̅ 愈大,可得𝑉𝑎𝑟 𝑌 愈大。若𝑥與𝑥̅ 之差值愈小,
則 𝑥 𝑥̅ 愈小,可得𝑉𝑎𝑟 𝑌 愈小。
̅
5. 𝑌~𝑁 𝜇 𝑥 , 𝜎 ,可得

𝑍 ~𝑁 0, 1

若𝜎 未知,以𝑀𝑆𝐸 估計𝜎 ,可得

𝑇 ~𝑡 𝑛 2

6. 1 𝛾 𝑃 𝑡 ⁄ 𝑛 2 𝑡 ⁄ 𝑛 2

̅ ̅
𝑃 𝑌 𝑡 ⁄ 𝑛 2 √𝑀𝑆𝐸 𝜇 𝑥 𝑌 𝑡 ⁄ 𝑛 2 √𝑀𝑆𝐸

̅
可得𝜇 𝑥 的100 1 𝛾 %信賴區間為 𝑦 𝑡 ⁄ 𝑛 2 √𝑀𝑆𝐸 。
第 7 章第46頁共47頁
 新觀察值𝑌 的預測
1. 以𝑌 𝛼 𝛽 𝑥 𝑥̅ 預測𝑌 ,其中𝛼 與𝛽是由 𝑥 , 𝑌 , 𝑥 , 𝑌 , ⋯ , 𝑥 , 𝑌 估計
得來的。

2. 𝑌 𝛼 𝛽 𝑥 𝑥̅ 𝜀 ,𝜀 ~𝑁 0, 𝜎 ,其中𝑥̅ 。

3. 預測誤差 𝑊 𝑌 𝑌 𝑌 𝛼 𝛽 𝑥 𝑥̅ 是常態隨機變數𝑌 , 𝑌 , ⋯ , 𝑌
的線性函數,可得𝑊的機率分配為常態分配。
4. 𝐸 𝑊 𝐸 𝑌 𝑌 𝐸𝑌 𝛼 𝛽 𝑥 𝑥̅
𝛼 𝛽 𝑥 𝑥̅ 𝛼 𝛽 𝑥 𝑥̅ 0
5. 𝑉𝑎𝑟 𝑊 𝑉𝑎𝑟 𝑌 𝑌
𝑉𝑎𝑟 𝑌 𝛼 𝛽 𝑥 𝑥̅
𝑉𝑎𝑟 𝑌 𝑉𝑎𝑟 𝛼 𝑥 𝑥̅ 𝑉𝑎𝑟 𝛽

𝜎 𝑥 𝑥̅

̅
𝜎 1

̅
6. 𝑊 𝑌 𝑌 ~𝑁 0, 𝜎 1 ,可得

𝑍 ~𝑁 0, 1

若𝜎 未知,以𝑀𝑆𝐸 估計𝜎 ,可得

𝑇 ~𝑡 𝑛 2

7. 1 𝛾 𝑃 𝑡 ⁄ 𝑛 2 𝑡 ⁄ 𝑛 2

1 𝑥 𝑥̅
𝑃 𝑌 𝑡 ⁄ 𝑛 2 √𝑀𝑆𝐸 1 𝑌
𝑛 𝑆

1 𝑥 𝑥̅
𝑌 𝑡 ⁄ 𝑛 2 √𝑀𝑆𝐸 1
𝑛 𝑆

可得𝑌 的100 1 𝛾 %預測區間(prediction interval)為


̅
𝑦 𝑡 ⁄ 𝑛 2 √𝑀𝑆𝐸 1 。
第 7 章第47頁共47頁
例題 利用 Example 6.5-1 的資料
(a) Find a 95% confidence interval for 𝜇 𝑥 when 𝑥 60。
(b) Find a 95% prediction interval for 𝑌 when 𝑥 60。
解:𝑦 81.3 0.7421 𝑥 68.3
When 𝑥 60, 𝑦 81.3 0.7421 60 68.3 75.1406.
(a) A 95% confidence interval for 𝜇 60 is
̅
𝑦 𝑡 . 8 √𝑀𝑆𝐸

.
75.1406 2.306 √27.21
.

75.1406 5.2586
69.8820, 80.3992

(b) A 95% prediction interval for 𝑌 when 𝑥 60 is


̅
𝑦 𝑡 . 8 √𝑀𝑆𝐸 1

.
75.1406 2.306 √27.21 1
.

75.1406 13.1280
62.0126, 88.2686

比較(a)與(b)發現,在同一信賴度與同一𝑥值下,預測區間的長度較信賴區間的長度寬,乃是
因為預測區間是對隨機變數(為一變動值)做預測,而信賴區間是對參數(為一固定值)做
估計。

註: P351-353 兩個以上獨立變數的多元迴歸(multiple regression),留待進階課程再來討論。

You might also like