Professional Documents
Culture Documents
假設檢定 - 統計推
論
Hypothesis Testing-Statistical Inference
推斷樣品是否來自某族群
假設檢定程序
兩類型錯誤的意義
單邊與雙邊檢定
檢定力的意義
族群與樣品的關係
族群 樣品
抽樣
* 平均數 * 樣品平均數
* 比例值 * 樣品比例值
* 變異數 * 樣品變異數
推論
母數 統計值
7.1 緒言
根據研究所取得的樣品是否來自某一特定的族群,
我們應如何檢定?
例如牧場生產的奶粉,如要推測奶粉每罐的重量,
是否合乎所設定的 500 公克重(族群均值)的標
準。『假設 30
』
如果從每天生產的奶粉中隨機抽取 25 罐,測得其
樣品均值為 485 或 515 公克,那是否符合標準呢?
不能因為 485 公克比 500 公克少,就推斷不符合
標準,因有抽樣誤差的存在。
檢定方法 ( 將樣品均值標準化 , 視其發生機率大小而
定 ) x 485 500
Z 2.5 P 0.0062
n 30 25
x 515 500
Z 2.5 P 0.0062
n 30 25
485克或515克均不符合
98.76%
0.62% 0.62%
Z
494克或506克均符合
68.26%
15.87% 15.87%
488.24或511.76克均不符合
95%
2.5% 2.5%
補 充
雙邊 ( 雙尾 ) 檢定:
有兩個拒絕區的檢定稱為雙邊檢定,雙尾各有
一個拒絕區,各拒絕區的機率為 / 2 。
雙邊 ( 雙尾 ) 檢定H1 : 0
拒絕區 拒絕區
2.5% 接受區 2.5%
Z
0
拒絕區 拒絕區
5% 接受區 接受區 5%
Z Z
0 0
單邊 ( 左尾 ) 檢定H1 : 0 單邊 ( 右尾 ) 檢定H1 : 0
例子 7.3 設今欲試驗某飼料添加魚骨粉後,對
於雞每月的平均產蛋量是否提高。而一般的飼
料,每隻雞每月平均產量為 0 21 個,
標準差
9 ,假設今試驗 100 隻雞,每月
平均產蛋量為
x 24 個,試問添加魚骨
粉是否能提高產蛋量?
(1) H 0 : 0 21 (2) H1 : 0
(3) 設定顯著水準 0.05
x 0 24 21
(4) 計算 Z 值Z 3.33
n 9 100
Z 3.33 Z 0.95 1.645 ,故接受 H1 的
假說,表示添加魚骨粉可提高產蛋量。
x 24 21 P 0.0004
Z 3.33
n 9 100
99.96%
0.04%
Z
21 24
0 3.33 Z
若一個樣品平均值為 22.48 公克
x 22.48 21
Z
n
9 100
1.645 P 0.05
95%
5%
Z
21 22.48
0 1.645 Z
7.5 檢定力 (test of power)
若試驗選取較小的 ,以限制第一型錯誤發生的
機會,卻會增大第二型錯誤的機會。
1 1
0
檢定力求法
在統計學上 1 稱為檢定力
[ 例 7.4] 依據大學聯招分數高低分發於甲乙大學
學生 IQ 是否差 5 個單位 , 設乙大學學生
IQ=110 , 標準偏差 =20, 今從甲大學隨機抽
取 n=64 位學生 , 得其平均 IQ=113, 若甲大學
IQ 要比乙大學高 , 其平均 IQ 必需大於下式
_
x 0 113 110
Z 1.2 Z 0.05 1.645
/ n 20 / 64
_
x 0 Z 0.95 / n 110 1.645 20 / 64
114.1
_
若 x 114.1 , 則認為甲大學學生 IQ=115
若此判斷正確的話 , 其判斷正確的機率為
_
_
x 114.1 115
1 Pr ( x 114.1) Pr ( )
/ n 20 / 64
Pr ( Z 0.36) 1 Pr ( Z 0.36)
1 0.3594 64.06%
7.6 樣品大小計算公式
H 0 : o ( 0 ) vs. H a : o ( a o )
單尾檢定: H 0 : o ( 0 ) vs. H a : o ( a o )
0 a
1 P(Z z1 )
/ n
if 1 0.5
a a o
z1 o z1 , = z1 z1
/ n / n
a o ( z1 z1 )
n
n ( z1 z1 )
( a o )
2 2
n ( z1 z1 )
( a o ) 2
雙尾檢定: H 0 : o vs. H a : o ( a o )
2 2
n ( z z1 )
( a o ) 2 1 2
由例 7.4 甲乙兩校學生 IQ 若欲相差 5, 則樣品大小
為
0 115 110 5
20, Z 0.05 1.645,1 0.8, Z 0.8 0.845
2 2
(20) (0.845 1.645)
n 2
99.20 100
5
例:奶粉罐重量
H 0 : 500( o ) vs. H a : 0 ( a 485)
單尾檢定:
30, 0.05, 0.2
z0,95 1.645 z0.8 0.842
(30) 2 2
n 2
(1.645 0.842) 24.74 25
(15)
學生氏 t 分布
單一樣品均值推論
兩樣品均值差之分布
兩樣品非成對 t 值檢定
兩樣品成對 t 值檢定
二項分佈均值差推論
8.1 學生氏 t 分布
2
於實際應用上,族群變異數 通常都是未知的,
2
S
因此以樣品資料求得樣品均方 來代替族群變異數
( 2 )
x x
Z S
x n
x
t
S n
所得並非標準常態分布的標準化值 Z ,而是 t 值。
學生氏 t 分布
此 t 值之分佈為學生氏 t 分布 (Student’s t-
distribution) ,為高斯特 (William Sealy Gosset) 於
1908 年所推導得,並以其筆名 Student 來命名。
t 分布之機率密度函數為:
k
f (t ) 2 ( 1) / 2
, t
(1 t )
8.2 t 分布之性質
t 分布是以均值 0 為中心的左右對稱分布,而不
同的自由度 n 1 有不同的 t 分布。
t 分布不與橫軸相交, t 分布曲線下的面積等於
1。
t 分布決定於自由度 ,它是 t 分布唯一的參數。
若 n 趨近於無窮大時, t 分布會趨近於標準常態
分布 (Z 分布 ) 。
t 分布曲線下的機率,如同標準常態分布,已有
累計機率表可供查閱 ( 附表五 ) 。
t 分布之性質
N (0,1)
9
2
ZZ
Z
-3 -2 -1 0 1 2 3
8.3 單一樣品均值推論
2
如檢測一樣品是否來自於某族群,若族群變異數
未知,而以樣品均方S 2 來代替族群變異數,則
其假設檢定程序為:
1) 虛無假設 (null hypothesis)H 0 : 0
首先計算資料之平均值及均方
_
x (3 4 ... 2) / 5 18./ 5 3.6
S 2 (32 42 ... 22 182 / 5) / 4 5.3 / 4 1.3
例子 8.1 假設消基會調查市面上某速食品所含
防腐劑如下: 3 , 4 , 5 , 4 , 2 ppm ,試推
論此速食品所含防腐劑是否符合國家訂定的標
準值 3ppm
(1 H 0 : 0 3 (2) H1 : 0
)
(3) 設定顯著水準 0.05 ( 雙
尾) x 0 3.6 3
(4) 計算 t 值 t 0.6 0.51 1.1765
S2 n 1.3 5
t 1.1765 t0.05 2,4 2.776 ,故接
受 H0 的假設,表示此速食品所含防腐劑符合
國家標準值 3ppm 。
另外我們也可求 的1 之信賴區間如下:
S S
Pr x t 2 x t 2 1
n n
例子 8.1 可得此速食品防腐劑含量之 95% 信賴區
間為 S 1.3
x t 2 3.6 2.776
n 5
2.1842 5.0160
T 126
np0 150 0.9 135
T np0 |126 135 |
Z 2.45 Z 0.025 1.96
np0 q0 150 0.9 0.1
[ 例 8.2b] 設今有甲乙兩位市長候選人 , 在投票前
做民調 , 從全市電話 100 萬號中隨機訪問 1000 人 ,
結果有 480 人贊成甲候選人 ,520 人贊成甲候選人 ,
試推算兩位市長候選人之得票率有無差異
(1) 得票率
甲 : p1=480/1000=0.48
乙 : p2=520/1000=0.52
(2) 得票率估計誤差值
為安全起見 , 在估算估計值 ( 得票率
p) 之變異數時 , 當取 p=0.5, 可得族群最大
變異數為
V(p)=pq/n=0.5x0.5/1000=0.00025
其抽樣誤差 V ( p) (sampling error) 為
pq / n 0.00025 0.0158
SE(p)=
在 95% 信賴水準下 ( ), 估計誤差值 (b)
Z 0.025 1.96
為
.
b= 1.96 pq / n 2 pq / n 2 0.5 0.5 / n 1/ n
1/ 1000 0.0316 0.032 3.2%
論就不一定相同了。
8.5 兩樣品均值差之推論
Inference of The Difference of Two Sample Means
一般從事試驗性研究,多會比較兩事物 ( 兩族
群 ) 是否有差異,如 A 、 B 兩種藥品治療某疾
病是否有差別,或是兩種土壤 pH 值是否一樣等
問題。
而採用的方法是由兩事物中隨機抽取樣品,並
以兩樣品均值之差,經假設檢定程序以推論兩
事物是否有差異存在。
我們不能單憑比較兩樣品均值的大小而下結論。
關於如何進行假設檢定,我們先要瞭解兩樣品
均值差之分佈型態。
8.5.2 兩樣品均值差之 Z 分佈
若兩樣品均值之分佈都為常態,則兩樣品均值
差之分佈亦為常態,因此可求得標準常態化值 Z
為: x1 x2 1 2 2 2
Z 1 2
x1 x2 N ( 1 2 , )
12 22 n1 n2
n1 n2
2 2 2
若兩族群之變異數 1 2 相等,則上式可
改寫成: x1 x2 1 2
Z
2 1 1
( )
n1 n2
8.5.2 兩樣品均值差之 t 分
佈 2
S
由於族群變異數通常未知,因此以樣品均方
來代替,即可得 t 值如下:
t
x1 x2 1 2
S12 S 22
n1 n2
若兩族群之變異數相等時,兩樣品均方可求得
2
一共同均方
Sc ,則上式可改寫成:
1 1 2 2
n 1 S 2
n 1 S 2
t
x1 x2 1 2
Sc2 1 1
n1 n2 2 2
S ( )
c
n1 n2
8.5.3 兩樣品均值差成對 t 檢
定
(paired t test for two sample means)
當欲比較之兩樣品來自相同環境時,如每個試
驗單位可分前後期來比較,或者可分為兩個小
單位,以隨機安排兩處理 (treatment) 。
則我們宜採用成對 t 檢定法。
例如比較同一株菸草,其上、下部葉片之尼古
丁含量是否有差別,我們可將上半部菸草及下
半部菸草當作兩個樣品,而且此兩樣品是成對
的,兩族群變異數也是相同的。
假設檢定程序
(1) 虛無假設H 0 : 1 2 即 1 2 0
(2) 對立假設H 0 : 1 2 即 1 2 0
(3) 設定顯著水準 0.05 或 0.01 。
(4) 計算 t 值,首先求成對樣品觀測值之差 Di X 1i X 2i
n n
而 n 對觀測值差之總和為 Di ( X 1i X 2i )
i 1 i 1
n
1 n
其均值為D Di n ( X 1i X 2i ) x1 x2
i 1 n i 1
n n
SSD
平方和 SSD D ( Di )
i
2 2
n 均方為 S D2
i 1 i 1 n 1
為 n n
S 2
SSD D i
2
( Di )2 n
成對樣品均值差之均方為S D
2
D
i 1 i 1
n n(n 1) n(n 1)
假設檢定程序
故 t 值為 t x1 x2 1 2 D0
2
SD SSD
n(n 1)
D0
n n
D
i 1
( i n
i
2
D ) 2
i 1
n(n 1)
• 同一試驗單位在前後不同時間安排兩處理
例子 8.3 今欲比較洗腎病人透析前後之體重
是否不同 ,6 位病人腎臟透析前後體重如下表:
透析前體重 X1 透析後體重 X2 X1 X 2 D
53.2 48.0 5.2
73.0 69.6 3.4
61.8 57.2 4.6
43.4 41.6 1.8
52.9 51.8 1.1
62.8 59.6 3.2
和 347.1 327.8 19.3
均值 57.85 54.6333 3.2167
自身配對
透析前體重為一樣品 , 透析後之體重為另一樣
品 , 兩樣品相對樣品點均來自同一人 , 故以成
對 t 值檢定法先求兩樣品相對觀測值差之平方
和為 2
i
SSD D 2 D
i /n
D 3.2167
t 5.0097
D x1 x2 3.2167, SSD 12.3683
n n 1 6 6 1
出 生 時 期(週)
食品 I Ⅱ Ⅲ Ⅳ 和 平均
A 10 15 16 18 59 14.75
B 16 20 25 28 89 22.25
同源配對 (paired t test)
食品 ` Ⅰ Ⅱ Ⅲ Ⅳ 和 平均
A 10 15 16 18 59 14.75
B 16 20 25 28 89 22.25
A-B -6 -5 -9 -10 -30 -7.50
A 藥品 第 1 組 第2組 B 藥品
(10) (10)
根據族群變異數是否相等,而有不同的檢定式。
2 2 2
(1) 變異數相等 ( 1 ) 2
兩處理 ( 藥品、食品、療法、技術 ) 比較
非成對 t 值檢定 (unpaired t test)
( 兩獨立處理比較 )
@ 安排兩處理之試驗單位全為同質 , 如下圖為
8 隻白老鼠同時出生 , 每處理重複 4 次 , 隨機安
排兩處理 , 可得各處理有相同變異數
( 各處理隨機排列 )
例子 8.4 假設有 A 、 B 兩種嬰兒奶粉, A 奶
粉試用 9 位初生男嬰, B 奶粉試用 10 位男嬰,
則一個月後兩組嬰兒增重情形如下,試比較兩
2 2
種嬰兒奶粉的增重效果是否有差異? A (B
編號 A 奶粉嬰兒增重 B 奶粉嬰兒增重
) 1 6.9 6.4
2 7.6 6.7
3 7.3 5.4
4 7.6 8.2
5 6.8 5.3
6 7.2 6.6
7 8.0 5.8
8 5.5 5.7
9 7.3 6.2
10 7.1
合計 64.2 63.4
平均 7.13 6.34
(1 H 0 : A B (2) H1 : A B
)(3) 設定顯著水準 0.05 ( 雙
尾
(4))計算 t 值,首先求兩獨立樣本之平
SSA 6.9 7.3 64.2 / 9 4.08
2
方和
2 2
方法二:加權自由度
2
S12 S 22
n1 n2
df
S12 S 22
n1 n2
n1 1 n2 1
雙尾檢定
H:μ
0 1 μ2 vs H:μ
a 1 μ2
x1 x2
1. t '
t 拒絕H
S 2
S 2
2
0
1
2
n1 n2
或
x1 x2
2. t ' t , df 拒絕H
S 2
S 2
2
0
1
2
n1 n2
單尾檢定
H:μ
0 1 μ2 vs H a :μ1 μ2
x1 x2
1.t '
2 2
t 拒絕H0
S S
1
2
n1 n2
或
x1 x2
2.t '
2 2
t , df 拒絕H0
S S
1
2
n1 n2
例:痛風病人與正常人血中尿酸濃度之比較
資料
痛風病人 : 8.2 16.7 7.5 14.6 6.3 9.2
11.9 5.6 12.8 4.9
正常人 : 4.7 6.3 5.2 6.8 5.6 4.2
6.0 7.4
樣品大小 平均 平方和 均方
痛風病人
n1=10 x1 : 9.17 94.401 10.600
正常人
n2=8 x2 :5.775 8.0150 1.1450
S12 10.6001 2 2
2
9.25 1 2 (見第十章F值 )
S2 1.1450
x1 x2 9.17 5.775
t'
S12 S22 10.6001 1.1450
n1 n2 10 8
3.395
3.0952
1.0969
加權自由度
2
S 2
S
2
10.6001 1.1450
2
1
2
n n 10 8
df 21 2
S1 S 22 10.6001 1.1450
10 8
n1 n2
n1 1 n2 1 9 7
11.33 11
t ' 3.0952 t0.025,11 2.201 拒絕H 0
加權 t 值
S12 S 22
t0.025,9 n t0.025,7 n
t0.025 1 2
S12 S 22
n1 n2
10.6001 1.1450
2.262 2.365
10 8
10.6001 1.1450
10 8
2.2743
t ' 3.0952 t0.025 2.2743 拒絕H 0
痛風病人與正常人血液中尿酸量有顯著差異
思考題
[ 案例 ] 設今有 A 、 B 兩種藥品欲比較其對某種
疾病之療效,有 12 位病患自願參與試驗,試
問如何安排此試驗比較妥當?
1. 每種藥品選擇兩位年齡體位相近的病人隨機
安排 A 、 B 兩藥品,採用同源配對試驗。
2. 將 12 位病患隨機分成兩組,每組 6 人,各安
排 A 、 B 兩藥品,採用非成對 t 值試驗。
請問?你比較贊成那種試驗法,為什麼 ?
@ 人為雜種動物 , 無法同源配對 , 故採用非成
對 t 值測驗比較妥當。
8.6 二項分佈兩樣品均值差推論
當取得的樣品夠大時,二項分佈可呈近似常態分
佈,而二項分佈兩樣品均值差之分佈,亦為近似
p1q1 p2 q2
常態分佈 x1 x2 N ( p1 p2 , )
n1 n2
(1) 虛無假設H 0 : p1 p2 ( p1 p2 )0
(2) 對立假設H 0 : p1 p2 ( p1 p2 )0
(3) 設定顯著水準 0.05 或 0.01 。
(4) 計算 Z 值
pˆ1 pˆ 2 p1 p2 0 pˆ1 pˆ 2 p1 p2 0
Z Z
pq p q pˆ1qˆ1 pˆ 2 qˆ2
( 1 1 2 2) ( )
n1 n2 n1 n2
二項分布兩樣品均值差推論
若 ( p1 p2 )0 = 0 ,且 H0 的假設成立,則其 p 之估
值為 n1 pˆ1 n2 pˆ 2
pˆ
n1 n2
虛無假設 H 0 : p1 p2 0 對立假設 H1 : p1 p2 0
則 Z 值為 Z pˆ1 pˆ 2
1 1
pˆ (1 pˆ )( )
n1 n2
例子 8.7 某農藥商宣稱,其新的農藥產品比
舊產品之殺蟲效果高出 8% ,今將此農藥施用
於某昆蟲,其結果得如下記錄:
新產品 舊產品 合計
死蟲數 320 60 380
活蟲數 80 40 120
合計 400 100 500
死亡率 p̂1 = 0.8 p̂2 = 0.6 p̂ = 0.76
(1) 虛無假設H 0 : p1 p2 ( p1 p2 )0 0.08
(2) 對立假設H 0 : p1 p2 ( p1 p2 )0
(3) 設定顯著水準 0.05 。
(4) 計算 Z 值Z pˆ1 pˆ 2 p1 p2 0
pˆ1qˆ1 pˆ 2 qˆ2
( )
n1 n2
(0.8 0.6) 0.08 0.12
2.27
0.8 0.2 0.6 0.4 0.0529
400 100
Z 2.27 Z10.05 2 1.96 ,則拒絕 H0 的假設,表示
新產品之殺蟲效果比舊產品高出 8% 。
假設我們只要知道新產品是否比舊產品之殺蟲
效果好,而不一定要知道殺蟲率高多少。
(1) 虛無假設H 0 : p1 p2 0 (2) 對立假設
H 0 : p1 p2 0
根據卜瓦松分布原理 2 V ( , )
1 2 1 2
當 n x1 x2 5 x1 x,2 之分布接近常態分布
卜瓦松分布兩樣品比較公式為
| x1 x2 |
Z
x1 x2 |
[ 例 8.10] 設今檢察 A,B 兩國小學童大便中有無蛔
蟲 , 分別得為 A 校為 8 人 ,B A 校為 15 人 , A,B
兩國小學童大便中有蛔蟲人數有無不同
| 8 15 | 7
Z 1.4596
8 15 4.7958
2
S
n1 1 S 1
2
n2 1 S 2
2 D i
2
( Di )2 n
c i 1 i 1
n1 n2 2 (n 1)
t
x1 x2 1 2
D0
21 1
S ( )
t
c
n1 n2 S D2 n