You are on page 1of 73

第七章 .

假設檢定 - 統計推

Hypothesis Testing-Statistical Inference
 推斷樣品是否來自某族群
 假設檢定程序
 兩類型錯誤的意義
 單邊與雙邊檢定
 檢定力的意義
族群與樣品的關係

族群 樣品

抽樣
* 平均數 * 樣品平均數
* 比例值 * 樣品比例值
* 變異數 * 樣品變異數

推論

母數 統計值
7.1 緒言
 根據研究所取得的樣品是否來自某一特定的族群,
我們應如何檢定?
 例如牧場生產的奶粉,如要推測奶粉每罐的重量,
是否合乎所設定的 500 公克重(族群均值)的標
準。『假設   30

 如果從每天生產的奶粉中隨機抽取 25 罐,測得其
樣品均值為 485 或 515 公克,那是否符合標準呢?
 不能因為 485 公克比 500 公克少,就推斷不符合
標準,因有抽樣誤差的存在。
 檢定方法 ( 將樣品均值標準化 , 視其發生機率大小而
定 ) x   485  500
Z   2.5 P  0.0062
 n 30 25
x   515  500
Z   2.5 P  0.0062
 n 30 25

485克或515克均不符合

98.76%

0.62% 0.62%
Z

485 500 515


-2.5 0 2.5 Z
 假設抽中另一個樣品為 494 公克(或 506 公克)
x   494  500
Z   1.0 P  0.1587
 n 30 25
x   506  500
Z   1.0 P  0.1587
 n 30 25

494克或506克均符合

68.26%
15.87% 15.87%

494 500 506


-1.0 0 1.0 Z
 假設抽中另一個樣品為 488.24 公克 ( 或 511.76 公
克)
x   488.24  500
Z   1.96 P  0.025
 n 30 25
x   511.76  500
Z   1.96 P  0.025
 n 30 25

488.24或511.76克均不符合

95%
2.5% 2.5%

488.24 500 511.76


-1.96 0 1.96 Z
 而此機率 P 值稱為顯著水準 (significance level) ,
 表示。
通常以符號
 所以我們以  0.05 為顯著水準,作為判斷的標
準,而這樣的結論,判斷錯誤的機率為 5% 。
 顯著水準並非僅選定   0.05 ,也可選擇
  0.10
  0.01或 。
 在一般試驗中,通常此分界點訂為 P=0.05 ,若 P
值小於 0.05 ,表示樣品出現的機會,在 100 次中
可能少於 5 次,因此研判此樣品並非來自某族群。
 而 P=5% 機率有分配在常態分布之一尾及雙尾之分
( 見 7.4 節 ) 。
7.2 假設檢定
 由於  未知,我們假設此族群均值為0 ,而由
取得的樣品均值 x 與0 
之差異來推判族群均值
是否就是0 。

補 充

 對族群母數 ( 特性 ) 提出假設 ( 或主張 ) ,再利


用樣品的訊息,決定接受 (accept) 該假設或拒絕
(reject) 該假設的統計方法。
不拒絕 (not reject)
假設檢定程序
1) 虛無假設 (null hypothesis) :
對族群母數值的某一假設,通常假定此假設是真
實的,通常以 H0 表示之。
2) 對立假設 (alternative hypothesis) :
對族群母數值提出與虛無假設相反的
假設,通常以 H1 表示之。
3) 設定顯著水準  0.05 或   0.01 。 x  0
Z
4) 計算樣品均值之標準化值 Z  n
若 Z  Z1 (orZ1 2 ) 則接受 H0 的假設,反之
Z  Z1 (orZ1 2 )
,則接受 H1 的假設。
例子 7.1 設一般人血液中平均膽固醇含量為
180 mg%/ml ,其標準偏差  50
mg%/ml 。今調查某地區 16 個成人之平均膽固醇
為 200 mg%/ml ,試問某地區成人膽固醇是否合
(1)乎標準值:
H :     180
0 0 (2) H :   
1 0

(3) 設定顯著水準  0.05


x  0 200  180
(4) 計算 Z 值Z    1.6
 n 50 16
Z  1.6  Z 0.975  1.96 ,故接受 H0 的
假說,表示某地區成人膽固醇含量合乎標準值。
7.3 兩類型錯誤 (two types of
error)
 根據假設檢定程序,以推論某樣品是否抽自均值
為 0 的族群,但此推論結果並非百分之百正確,
而可能有四種情形產生。
 這四種情形中,包含了兩類型的錯誤,而且兩種
錯誤並不會同時發生。
真實情況
H 0 :    0 為真 H1 :    0 為真
推論錯誤
接受 推論正確
型 II 誤差
(accept) H 0 1-α
β
決策
推論錯誤
拒絕 推論正確
型 I 誤差
(reject) H 0 1-β
α
a.樣品確實抽自均值為 0 的族群,而檢定的結果
為接受 H0 的假說 ( P >0.05) ,故這樣的推論是正
確的,而此推論正確的機率為 1 。
真實情況
H 0 :    0 為真 H1 :    0 為真
推論錯誤
接受 推論正確
型 II 誤差
(accept) H 0 1-α
β
決策
推論錯誤
拒絕 推論正確
型 I 誤差
(reject) H 0 1-β
α
b.樣品確實抽自均值為 0 的族群,而檢定的結果
為拒絕 H0 的假說 (P<0.05) ,也就是接受 H1 的假
說,故這樣的推論是錯誤的,這種錯誤在統計學上

稱為第一型錯誤 (type Ⅰ error) ,其錯誤率為 。
真實情況
H 0 :    0 為真 H1 :    0 為真
推論錯誤
接受 推論正確
型 II 誤差
(accept) H 0 1-α
β
決策
推論錯誤
拒絕 推論正確
型 I 誤差
(reject) H 0 1-β
α
c.樣品確實不是抽自均值為 0 的族群,而檢定的
結果為接受 H0 的假說 (P>0.05) ,故這樣的推論是
錯誤的,這種錯誤在統計學上稱為第二型錯誤

(type Ⅱerror) ,其錯誤率為 。
真實情況
H 0 :    0 為真 H1 :    0 為真
推論錯誤
接受 推論正確
型 II 誤差
(accept) H 0 1-α
β
決策
推論錯誤
拒絕 推論正確
型 I 誤差
(reject) H 0 1-β
α
d.樣品確實不是抽自均值為 0 的族群,而檢定的
結果為拒絕 H0 的假說 (P<0.05) ,也就是接受 H1
的假說,故這樣的推論是正確的,而此推論正確的
1 
機率為 ,在統計學上稱為檢定力 (test of
power) 。
7.4 單邊與雙邊檢定
One-sided and Two-sided Test
 單邊 ( 單尾 ) 檢定:
只有一個拒絕區的檢定稱為單邊檢定。拒絕區
在左邊的稱為左尾檢定,拒絕區在右邊的稱為
右尾檢定,各拒絕區的機率為  。

 雙邊 ( 雙尾 ) 檢定:
有兩個拒絕區的檢定稱為雙邊檢定,雙尾各有
一個拒絕區,各拒絕區的機率為  / 2 。
雙邊 ( 雙尾 ) 檢定H1 :   0

拒絕區 拒絕區
2.5% 接受區 2.5%
Z

0

拒絕區 拒絕區
5% 接受區 接受區 5%
Z Z

0 0
單邊 ( 左尾 ) 檢定H1 :   0 單邊 ( 右尾 ) 檢定H1 :   0
例子 7.3 設今欲試驗某飼料添加魚骨粉後,對
於雞每月的平均產蛋量是否提高。而一般的飼
料,每隻雞每月平均產量為 0  21 個,
標準差
 9 ,假設今試驗 100 隻雞,每月
平均產蛋量為
x  24 個,試問添加魚骨
粉是否能提高產蛋量?
(1) H 0 :   0  21 (2) H1 :   0
(3) 設定顯著水準  0.05
x  0 24  21
(4) 計算 Z 值Z    3.33
 n 9 100
Z  3.33  Z 0.95  1.645 ,故接受 H1 的
假說,表示添加魚骨粉可提高產蛋量。
x   24  21 P  0.0004
Z   3.33
 n 9 100

99.96%
0.04%

Z
21 24
0 3.33 Z
 若一個樣品平均值為 22.48 公克
x   22.48  21
Z
 n

9 100
 1.645 P  0.05

95%
5%

Z
21 22.48
0 1.645 Z
7.5 檢定力 (test of power)
若試驗選取較小的  ,以限制第一型錯誤發生的
機會,卻會增大第二型錯誤的機會。


1 1 

0 
檢定力求法
 在統計學上 1   稱為檢定力
 [ 例 7.4] 依據大學聯招分數高低分發於甲乙大學
學生 IQ 是否差 5 個單位 , 設乙大學學生
IQ=110 , 標準偏差 =20, 今從甲大學隨機抽
取 n=64 位學生 , 得其平均 IQ=113, 若甲大學
IQ 要比乙大學高 , 其平均 IQ 必需大於下式
_
x  0 113  110
Z   1.2  Z 0.05  1.645
 / n 20 / 64
_
x  0  Z 0.95 / n  110  1.645  20 / 64
 114.1
_
若 x  114.1 , 則認為甲大學學生 IQ=115
若此判斷正確的話 , 其判斷正確的機率為

_
_
x   114.1  115
1    Pr ( x  114.1)  Pr (  )
 / n 20 / 64
 Pr ( Z  0.36)  1  Pr ( Z  0.36)
 1  0.3594  64.06%
7.6 樣品大小計算公式
H 0 :   o ( 0 ) vs. H a :   o (    a  o )
單尾檢定: H 0 :   o ( 0 ) vs. H a :   o (    a  o )
0  a
1    P(Z   z1 )
/ n
if 1    0.5
  a a  o
 z1   o  z1 , = z1  z1 
/ n / n

a  o  ( z1  z1  )
n

n ( z1  z1  )
(  a  o )
2 2
n ( z1  z1  )
(  a  o ) 2
雙尾檢定: H 0 :   o vs. H a :    o (    a  o )
2 2
n ( z   z1  )
(  a  o ) 2 1 2
由例 7.4 甲乙兩校學生 IQ 若欲相差 5, 則樣品大小

  0  115  110  5
  20, Z 0.05  1.645,1    0.8, Z 0.8  0.845
2 2
(20) (0.845  1.645) 
n 2
 99.20 100
5
例:奶粉罐重量
H 0 :   500( o ) vs. H a :   0 ( a  485)
單尾檢定:
  30,   0.05,   0.2
z0,95  1.645 z0.8  0.842
(30) 2 2
n 2
(1.645  0.842)  24.74  25
(15)

雙尾檢定: H 0 :   500 vs. H a :   500(  a  485)


  30,   0.05,   0.2
z0,975  1.96 z0.8  0.842
(30) 2 2
n 2
(1.96  0.842)  31.4  32
(15)
第八章 . 樣品均值比較問題
The Comparison Problem of Sample Mean

 學生氏 t 分布
 單一樣品均值推論
 兩樣品均值差之分布
 兩樣品非成對 t 值檢定
 兩樣品成對 t 值檢定
 二項分佈均值差推論
8.1 學生氏 t 分布
2
 於實際應用上,族群變異數  通常都是未知的,
2
S
因此以樣品資料求得樣品均方 來代替族群變異數
( 2 )

x  x 
Z   S
x  n

x 
t
S n
 所得並非標準常態分布的標準化值 Z ,而是 t 值。
學生氏 t 分布
 此 t 值之分佈為學生氏 t 分布 (Student’s t-
distribution) ,為高斯特 (William Sealy Gosset) 於
1908 年所推導得,並以其筆名 Student 來命名。
 t 分布之機率密度函數為:

k
f (t )  2 ( 1) / 2
,   t  
(1  t  )
8.2 t 分布之性質
 t 分布是以均值 0 為中心的左右對稱分布,而不
同的自由度  n  1 有不同的 t 分布。
 t 分布不與橫軸相交, t 分布曲線下的面積等於
1。 
 t 分布決定於自由度 ,它是 t 分布唯一的參數。
 若 n 趨近於無窮大時, t 分布會趨近於標準常態
分布 (Z 分布 ) 。
 t 分布曲線下的機率,如同標準常態分布,已有
累計機率表可供查閱 ( 附表五 ) 。
t 分布之性質

N (0,1)

 9

 2
ZZ
Z

-3 -2 -1 0 1 2 3
8.3 單一樣品均值推論
2
 如檢測一樣品是否來自於某族群,若族群變異數 
未知,而以樣品均方S 2 來代替族群變異數,則
其假設檢定程序為:
1) 虛無假設 (null hypothesis)H 0 :   0

2) 對立假設 (alternative hypothesis) H1 :   0


3) 定顯著水準   0.05 或   0.01 ( 雙尾 )
x  0
4) 計算 t 值t 
S2 n
若t  t 2, n 1 ,則接受 H0 的假設,反之則拒絕
H0 的假設。 ( 附表 5 列出右單尾機率及其 t 值,
與附表 4 之 Z 值分佈表示法不同 )
例子 8.1 假設消基會調查市面上某速食品所含
防腐劑如下: 3 , 4 , 5 , 4 , 2 ppm ,試推
論此速食品所含防腐劑是否符合國家訂定的標
準值 3ppm 。

首先計算資料之平均值及均方
_
x  (3  4  ...  2) / 5  18./ 5  3.6
S 2  (32  42  ...  22  182 / 5) / 4  5.3 / 4  1.3
例子 8.1 假設消基會調查市面上某速食品所含
防腐劑如下: 3 , 4 , 5 , 4 , 2 ppm ,試推
論此速食品所含防腐劑是否符合國家訂定的標
準值 3ppm
(1 H 0 :   0  3 (2) H1 :   0
)
(3) 設定顯著水準  0.05 ( 雙
尾) x  0 3.6  3
(4) 計算 t 值 t   0.6 0.51 1.1765
S2 n 1.3 5
t  1.1765  t0.05 2,4  2.776 ,故接
受 H0 的假設,表示此速食品所含防腐劑符合
國家標準值 3ppm 。
 另外我們也可求 的1   之信賴區間如下:
 S S 
Pr  x  t 2    x  t 2   1
 n n
 例子 8.1 可得此速食品防腐劑含量之 95% 信賴區
間為 S 1.3
x  t 2  3.6  2.776 
n 5

2.1842    5.0160

由上式信賴區間中包括 3ppm 在內,故接受 H0


的假設。
8.4 二項族群樣品均值推

 二項族群檢測一樣品是否來自於某族群,其假設
檢定程序為:
1) 虛無假設 (null hypothesis) H 0 : p  p0
2) 對立假設 (alternative hypothesis)H1 : p  p0 (定值)
3) 定顯著水準   0.05 ( 雙尾 )
 
p  p0 n p  np0
4) 計算 Z 
p0 q0 / n
或Z 
np0 q0
若Z  Z 0.05/ 2  1.96 ,則接受 H0 的假設,反之則拒絕
H0 的假設。 ( 見附表 4 之 Z 值分布 )
[ 例 8.2a] 一般患肺癌病人 3 年內之死亡率約 90%,
今有一新療法 , 試驗 150 位病人 3 年內有 126 位病
人死亡 ,
問新療法是否較佳
1.H 0 : p  p0  0.9
2.H1 : p  p0
3.定  0.05( 雙尾)
4.計算Z 值

p  126 /150  0.84
| 0.84  0.9 |
Z   2.45  Z 0.05 / 2  1.96
0.9  0.1/150
 故接受 H1 , 新療法較佳
或以樣品合計亦得同樣結果

T  126
np0  150  0.9  135
T  np0 |126  135 |
Z   2.45  Z 0.025  1.96
np0 q0 150  0.9  0.1
[ 例 8.2b] 設今有甲乙兩位市長候選人 , 在投票前
做民調 , 從全市電話 100 萬號中隨機訪問 1000 人 ,
結果有 480 人贊成甲候選人 ,520 人贊成甲候選人 ,
試推算兩位市長候選人之得票率有無差異
 (1) 得票率
 甲 : p1=480/1000=0.48
 乙 : p2=520/1000=0.52
 (2) 得票率估計誤差值
 為安全起見 , 在估算估計值 ( 得票率
p) 之變異數時 , 當取 p=0.5, 可得族群最大
變異數為
 V(p)=pq/n=0.5x0.5/1000=0.00025
 其抽樣誤差 V ( p)  (sampling error) 為
pq / n  0.00025  0.0158
 SE(p)=
在 95% 信賴水準下 ( ), 估計誤差值 (b)
Z 0.025  1.96

.
 b= 1.96 pq / n  2 pq / n  2 0.5  0.5 / n  1/ n

 1/ 1000  0.0316  0.032  3.2%

 (3) 95% 信賴區間p  b


 甲 :(0.48-0.032,0.48+0.032)
 (0.448,0.512)
 乙 :(0.52-0.032,0.52+0.032)
 (0.488,0.552)
結論
 在乙候選人之 95% 信賴區間
(48.8%,55.2%) 中包括甲候選人之
得票率估計值上限 51.2%, 因此推
斷兩候選人之得票率沒有差別。
 不過當調查人數 (n) 增加時 , 其結

論就不一定相同了。
8.5 兩樣品均值差之推論
Inference of The Difference of Two Sample Means
 一般從事試驗性研究,多會比較兩事物 ( 兩族
群 ) 是否有差異,如 A 、 B 兩種藥品治療某疾
病是否有差別,或是兩種土壤 pH 值是否一樣等
問題。
 而採用的方法是由兩事物中隨機抽取樣品,並
以兩樣品均值之差,經假設檢定程序以推論兩
事物是否有差異存在。
 我們不能單憑比較兩樣品均值的大小而下結論。
 關於如何進行假設檢定,我們先要瞭解兩樣品
均值差之分佈型態。
8.5.2 兩樣品均值差之 Z 分佈
 若兩樣品均值之分佈都為常態,則兩樣品均值
差之分佈亦為常態,因此可求得標準常態化值 Z
為:  x1  x2    1  2  2 2
Z 1  2
x1  x2  N ( 1  2 ,  )
 12  22 n1 n2

n1 n2
2 2 2
 
若兩族群之變異數 1   2   相等,則上式可
改寫成:  x1  x2    1  2 
Z
2 1 1
 (  )
n1 n2
8.5.2 兩樣品均值差之 t 分
佈 2
 S
由於族群變異數通常未知,因此以樣品均方
來代替,即可得 t 值如下:
t
 x1  x2    1   2 
S12 S 22

n1 n2
 若兩族群之變異數相等時,兩樣品均方可求得
2
一共同均方
Sc ,則上式可改寫成:
1  1 2  2
n  1 S 2
 n  1 S 2
t
 x1  x2    1   2 
Sc2  1 1
n1  n2  2 2
S (  )
c
n1 n2
8.5.3 兩樣品均值差成對 t 檢

(paired t test for two sample means)
 當欲比較之兩樣品來自相同環境時,如每個試
驗單位可分前後期來比較,或者可分為兩個小
單位,以隨機安排兩處理 (treatment) 。
 則我們宜採用成對 t 檢定法。
 例如比較同一株菸草,其上、下部葉片之尼古
丁含量是否有差別,我們可將上半部菸草及下
半部菸草當作兩個樣品,而且此兩樣品是成對
的,兩族群變異數也是相同的。
假設檢定程序
(1) 虛無假設H 0 : 1  2 即 1   2  0
(2) 對立假設H 0 : 1  2 即 1   2  0
(3) 設定顯著水準  0.05 或  0.01 。
(4) 計算 t 值,首先求成對樣品觀測值之差 Di  X 1i  X 2i
n n
而 n 對觀測值差之總和為  Di   ( X 1i  X 2i )
i 1 i 1
n
1 n
其均值為D   Di n   ( X 1i  X 2i )  x1  x2
i 1 n i 1
n n
SSD
平方和 SSD   D  ( Di )
i
2 2
n 均方為 S D2 
i 1 i 1 n 1
為 n n

S 2
SSD D i
2
 ( Di )2 n
成對樣品均值差之均方為S D 
2
 D
 i 1 i 1
n n(n  1) n(n  1)
假設檢定程序
故 t 值為 t   x1  x2    1  2   D0
2
SD SSD
n(n  1)
D0

n n

 D 
i 1
(  i n
i
2
D ) 2

i 1
n(n  1)

若實測 |t|> t 2, 值 , 自由度為


  n  1 ,顯著水
 ,表示兩族群均值有差異,反之則否。
準為
成對 t 值檢定 (paired t test)
一 . 自身配對:
• 如下圖為 A,B 兩種病毒分別接種於一片菸葉的兩邊 , 以比較此菸草品種抗
何種病毒。
• 同一試驗單位(如人、大型動物或植物)分成兩部位安排兩處理。

• 同一試驗單位在前後不同時間安排兩處理
 例子 8.3 今欲比較洗腎病人透析前後之體重
是否不同 ,6 位病人腎臟透析前後體重如下表:
透析前體重 X1 透析後體重 X2 X1  X 2  D
53.2 48.0 5.2
73.0 69.6 3.4
61.8 57.2 4.6
43.4 41.6 1.8
52.9 51.8 1.1
62.8 59.6 3.2
和 347.1 327.8 19.3
均值 57.85 54.6333 3.2167
自身配對
 透析前體重為一樣品 , 透析後之體重為另一樣
品 , 兩樣品相對樣品點均來自同一人 , 故以成
對 t 值檢定法先求兩樣品相對觀測值差之平方
和為 2
i 
SSD   D 2   D
i  /n

 5.2  ...  3.2  19.3  / 6  12.3683


2 2 2

D 3.2167
t   5.0097
D  x1  x2  3.2167, SSD 12.3683
n  n  1 6  6  1

t = 5.0097 > t0.05/ 2,5  2.571 ,表示一般洗腎病


人透析後之體重會減輕。
成對 t 值檢定 (paired t test)
二 . 同源配對-安排兩處理之兩個試驗單位
(動物或植物)要同性質 , 如種屬、
同性別、同年齡與相近體重。
不同時期出生
【例】今有 A 、 B 兩營養食品品質比較 , 每種
食品重複四次 , 試驗材料為白老鼠 , 每兩隻為
不同時期出生 , 隨機安排兩食品 , 飼養一段時
間後之增重如下

出 生 時 期(週)
食品 I Ⅱ Ⅲ Ⅳ 和 平均

A 10 15 16 18 59 14.75

B 16 20 25 28 89 22.25
同源配對 (paired t test)
食品 ` Ⅰ Ⅱ Ⅲ Ⅳ 和 平均

A 10 15 16 18 59 14.75
B 16 20 25 28 89 22.25
A-B -6 -5 -9 -10 -30 -7.50

SSD   6   ...   10    30  / 4  17


2 2 2

14.75  22.25 7.5


t   6.3013  t0.025,3  3.182
SSD 17 / 4  4  1
n  n  1
兩食品間品質有差異 , 以 B 食品為

8.5.4 非成對 t 檢定 (unpaired t
test)
 當兩樣品並非成對得來,而是獨立取得時,則
宜採用非成對 t 檢定。
 安排兩處理之試驗單位應全為同質,並將試驗
單位完全隨機分成兩組。
試驗單位 n=20
隨機分配

A 藥品 第 1 組 第2組 B 藥品
(10) (10)
 根據族群變異數是否相等,而有不同的檢定式。
2 2 2

(1) 變異數相等 ( 1 ) 2  
兩處理 ( 藥品、食品、療法、技術 ) 比較
非成對 t 值檢定 (unpaired t test)
( 兩獨立處理比較 )
@ 安排兩處理之試驗單位全為同質 , 如下圖為
8 隻白老鼠同時出生 , 每處理重複 4 次 , 隨機安
排兩處理 , 可得各處理有相同變異數

( 各處理隨機排列 )
 例子 8.4 假設有 A 、 B 兩種嬰兒奶粉, A 奶
粉試用 9 位初生男嬰, B 奶粉試用 10 位男嬰,
則一個月後兩組嬰兒增重情形如下,試比較兩
2 2
種嬰兒奶粉的增重效果是否有差異?  A  (B
編號 A 奶粉嬰兒增重 B 奶粉嬰兒增重
) 1 6.9 6.4
2 7.6 6.7
3 7.3 5.4
4 7.6 8.2
5 6.8 5.3
6 7.2 6.6
7 8.0 5.8
8 5.5 5.7
9 7.3 6.2
10 7.1

合計 64.2 63.4
平均 7.13 6.34
(1 H 0 :  A   B (2) H1 :  A   B
)(3) 設定顯著水準  0.05 ( 雙

(4))計算 t 值,首先求兩獨立樣本之平
SSA  6.9    7.3   64.2  / 9  4.08
2
方和
2 2

SSB  6.42    7.12   63.4  /10  6.924


2

共同均方為 SSA  SSB 4.08  6.924


Sc2  
n1  n2  2 9  10  2

x A  xB 7.13  6.34 0.79


t    2.1369
2 1 1 1 1 0.3697
Sc (  ) 0.6473(  )
n1 n2 9 10
t  2.1369  t0.05 2,9 10 2  t0.025,17  2.11
,故拒絕 H0 的假設,表示 A 奶粉對嬰兒的增
(2) 族群變異數不等 (  12   22 )
x1  x2
t ' 
S12 S 22

n1 n2
方法一:加權t 值
S12 S 22
t , n1 1 .  t , n2 1 .
n1 n1
 
t
S12 S 22

n1 n2

方法二:加權自由度
2
 S12 S 22 
  
 n1 n2 
df  
S12 S 22
n1 n2

n1  1 n2  1
雙尾檢定
H:μ
0 1  μ2 vs H:μ
a 1  μ2

x1  x2
1. t '  
 t 拒絕H
S 2
S 2
2
0
1
 2
n1 n2

x1  x2
2. t '   t , df  拒絕H
S 2
S 2
2
0
1
 2
n1 n2
單尾檢定
H:μ
0 1  μ2 vs H a :μ1  μ2

x1  x2
1.t ' 
2 2
 t 拒絕H0
S S
1
 2
n1 n2

x1  x2
2.t ' 
2 2
 t , df  拒絕H0
S S
1
 2
n1 n2
例:痛風病人與正常人血中尿酸濃度之比較

資料
痛風病人 : 8.2 16.7 7.5 14.6 6.3 9.2
11.9 5.6 12.8 4.9
正常人 : 4.7 6.3 5.2 6.8 5.6 4.2
6.0 7.4
樣品大小 平均 平方和 均方
痛風病人
n1=10 x1 : 9.17 94.401 10.600
正常人
n2=8 x2 :5.775 8.0150 1.1450
S12 10.6001 2 2
2
  9.25   1   2 (見第十章F值 )
S2 1.1450
x1  x2 9.17  5.775
t' 
S12 S22 10.6001 1.1450
 
n1 n2 10 8
3.395
  3.0952
1.0969
加權自由度
2
S 2
S 
2
 10.6001 1.1450 
2


1
 2
   
n n 10 8
df    21 2 
  
 S1 S 22   10.6001   1.1450 
     
 10  8 
 n1  n2 
 n1  1 n2  1  9 7
 
 

 11.33  11


t '  3.0952  t0.025,11  2.201 拒絕H 0
加權 t 值
 S12   S 22 
t0.025,9   n   t0.025,7   n 

t0.025   1   2 
S12 S 22

n1 n2
 10.6001   1.1450 
 2.262      2.365   
 10   8 

10.6001 1.1450

10 8
 2.2743


t '  3.0952  t0.025  2.2743 拒絕H 0
痛風病人與正常人血液中尿酸量有顯著差異
思考題

[ 案例 ] 設今有 A 、 B 兩種藥品欲比較其對某種
疾病之療效,有 12 位病患自願參與試驗,試
問如何安排此試驗比較妥當?
1. 每種藥品選擇兩位年齡體位相近的病人隨機
安排 A 、 B 兩藥品,採用同源配對試驗。
2. 將 12 位病患隨機分成兩組,每組 6 人,各安
排 A 、 B 兩藥品,採用非成對 t 值試驗。
請問?你比較贊成那種試驗法,為什麼 ?
@ 人為雜種動物 , 無法同源配對 , 故採用非成
對 t 值測驗比較妥當。
8.6 二項分佈兩樣品均值差推論
 當取得的樣品夠大時,二項分佈可呈近似常態分
佈,而二項分佈兩樣品均值差之分佈,亦為近似
p1q1 p2 q2
常態分佈 x1  x2  N ( p1  p2 ,  )
n1 n2
(1) 虛無假設H 0 : p1  p2  ( p1  p2 )0
(2) 對立假設H 0 : p1  p2  ( p1  p2 )0
(3) 設定顯著水準  0.05 或  0.01 。
(4) 計算 Z 值
 pˆ1  pˆ 2    p1  p2 0  pˆ1  pˆ 2    p1  p2 0
Z Z
pq p q pˆ1qˆ1 pˆ 2 qˆ2
( 1 1  2 2) (  )
n1 n2 n1 n2
二項分布兩樣品均值差推論
 若 ( p1  p2 )0 = 0 ,且 H0 的假設成立,則其 p 之估
值為 n1 pˆ1  n2 pˆ 2
pˆ 
n1  n2
虛無假設 H 0 : p1  p2  0 對立假設 H1 : p1  p2  0

則 Z 值為 Z  pˆ1  pˆ 2
1 1
pˆ (1  pˆ )(  )
n1 n2
 例子 8.7 某農藥商宣稱,其新的農藥產品比
舊產品之殺蟲效果高出 8% ,今將此農藥施用
於某昆蟲,其結果得如下記錄:
新產品 舊產品 合計
死蟲數 320 60 380
活蟲數 80 40 120
合計 400 100 500
死亡率 p̂1 = 0.8 p̂2 = 0.6 p̂ = 0.76
(1) 虛無假設H 0 : p1  p2  ( p1  p2 )0  0.08
(2) 對立假設H 0 : p1  p2  ( p1  p2 )0
(3) 設定顯著水準   0.05 。
(4) 計算 Z 值Z   pˆ1  pˆ 2    p1  p2 0
pˆ1qˆ1 pˆ 2 qˆ2
(  )
n1 n2
(0.8  0.6)  0.08 0.12
   2.27
0.8  0.2 0.6  0.4 0.0529

400 100
Z  2.27  Z10.05 2  1.96 ,則拒絕 H0 的假設,表示
新產品之殺蟲效果比舊產品高出 8% 。
 假設我們只要知道新產品是否比舊產品之殺蟲
效果好,而不一定要知道殺蟲率高多少。
(1) 虛無假設H 0 : p1  p2  0 (2) 對立假設
H 0 : p1  p2  0

(3) 設定顯著水準  0.05 。


pˆ1  pˆ 2
(4) 計算 Z 值
Z
1 1
pˆ (1  pˆ )(  )
n1 n2
(0.8  0.6)  0 0.20
   4.188
1 1 0.04775
(0.76)(0.24)(  )
400 100
Z  4.188  Z10.05 2  1.96 ,則拒絕 H0 的假設,表
示新產品之殺蟲效果比舊產品好。
卜瓦松分布兩樣品比較

 根據卜瓦松分布原理  2   V ( ,   )    
1 2 1 2

 當 n  x1  x2  5 x1  x,2 之分布接近常態分布

 卜瓦松分布兩樣品比較公式為
| x1  x2 |
Z
x1  x2 |
[ 例 8.10] 設今檢察 A,B 兩國小學童大便中有無蛔
蟲 , 分別得為 A 校為 8 人 ,B A 校為 15 人 , A,B
兩國小學童大便中有蛔蟲人數有無不同

| 8  15 | 7
Z   1.4596
8  15 4.7958

 實測 |Z|=1.4596<Z 0.05/ 2  1.96


 故推論 A,B 兩國小學童大便中有蛔蟲人數相同
x 
t
S n
(1) 單一樣品 H :   
0 0
t 檢定 (3) 兩樣品 H 0 : 1  2  0
(2) 兩樣品 H :    成對
非成對 0 1 2 t 檢定
t 檢定 Di  X 1i  X 2i
x  0 SSD
t  12   22 S D2 
S2 n (n  1)
n n

2
S 
 n1  1 S 1
2
  n2  1 S 2
2 D i
2
 ( Di )2 n
c  i 1 i 1
n1  n2  2 (n  1)

t
 x1  x2    1   2 
D0
21 1
S (  )
t
c
n1 n2 S D2 n

You might also like