You are on page 1of 30

假說檢定(顯著性檢定)

江倫志
2 假說檢定(p214)
 統計學最重要的課題之一,就是用來比較兩母體或多個母體其參數之間的異同,
給予統計學上顯著性(significance)的結論。
 虛無假說與對立假說共同構成事實的全部, 當拒絕虛無假說時,對立假說即成立
 若要比較兩母體某變項的平均值(如以µ1與µ2表示)是否相同
 先建立假說(hypothesis)
虛無假說(null hypothesis):
陳述兩者相等的假說
H0:µ1=µ2
對立假說(alternative hypothesis)
兩者不相等的假說
H1:µ1≠µ2
3 假說檢定相關名詞與圖示(p215)
 虛無假說(null hypothesis, H0):
大家都一樣, 沒有差別
兩比較參數相等的假說,如以H0:µ1=µ2表示
設定母群體平均數和假說的數值之間並無差異,H0:µ1=10
 對立假說(alternative hypothesis, H1):
不同意虛無假說
呈顯著差異
兩比較參數不相等的假說,如以H1:µ1≠µ2表示
設定母群體平均數和假說的數值之間有無差異,H0:µ1≠10
4 設立假說舉例

 研究問題: 某急性疾病在兒童的發病年齡是否為11.5歲
0 : =11.5 --發病年齡是11.5歲
1 : 11.5 --發病年齡不是11.5歲

 研究問題:警報器汙染物警報平均值是否高於設定值
0 : ≦7 –汙染物警報平均值沒有高於設定值
1 : >7 --汙染物警報平均值設定值高於

 研究問題:男生與女生的學期成績是否有差異
 研究問題:男性的血壓是否高於女性的血壓
5 假說檢定相關名詞與圖示(p215)
 接受域:也稱非拒絕域
 等同於所設定的信賴估計區間(CI)
 如果樣本的檢定統計量位於此區域內,則接受虛無假說
 兩比較的參數相等,沒有差異。
 拒絕域
 又稱為臨界域
 如果樣本的檢定統計量位於此區域內,則拒絕虛無假說,接受對立假說
 亦即兩比較的參數不相等
 顯著水平(level of significance):
 即拒絕域(臨界域)的大小(面積)
𝛼
 以α代表,單尾為α,雙尾則為 2
 通常α設為0.05、0.01、0.001
6
 臨界值(critical value):→為查表而來(Z or t or F…)
 界定拒絕域(臨界域)的標準化分數。
 例如: 設α=0.05,1-α=0.95→95%CI
 查表得到 Z=±1.96
 檢定統計量(statistic):即計算Z分數或t分數或…。
7
 p值(p-value):
在單尾的情形下,p值為檢定統計量至最近尾端的面積(機率)
但如果是雙尾,則p值為檢定統計量至最近尾端的面積(機率)的
兩倍
8 假說檢定的型式(雙尾與單尾檢定)
以下µ1代表檢定樣本的母體平均數,µ2代表欲比較母體的平均數。
 雙尾檢定(two-tailed test):
 檢定兩母體的參數(如兩母體的平均數µ1與µ2)是否相等
 其中µ1未知,但µ2已知
 H0:µ1=µ2
 H1:µ1≠µ2
 1  2 ,1 < 2 都可能發生
9  單尾檢定: 具有方向性,欲證實比較參數誰高誰低
 左單尾(負單尾)檢定(left-tailed test):
 檢定某母體的參數(如平均數µ1,未知)是否小於欲比較
母體的相對應參數(如平均數µ2,已知)
 H0:µ1≥µ2
 H1:µ1<µ2
10  右單尾(正單尾)檢定(right-tailed test):
 檢定某母體的參數(如平均數µ1,未知)是否大於欲比較母
體的相對應參數(µ2,已知)
 H0:µ1≤µ2
 H1:µ1>µ2
舉例: 是雙尾還是單尾?
 某急性疾病在兒童的發病年齡是否為11.5歲
0 : =11.5 --發病年齡是11.5歲
a : 11.5 --發病年齡不是11.5歲

 警報器汙染物警報平均值是否高於設定值
0 : ≦7 –汙染物警報平均值沒有高於設定值
a : <7 --汙染物警報平均值高於設定值

 男生與女生的學期成績是否有差異
 男性的血壓是否高於女性的血壓
練習1
12
 吸菸者(n=52) 與已戒菸者 (n=50)的收縮壓是否相同
 H0:_________ H1:_________(_______尾_______檢定)
 設 =0.01,臨界值為_________
 若統計量為 3.21 ,請決定拒絕或接受虛無假說 ____________
 某疾病患者血紅素值是否低於12g/ml,
 H0:_________ H1:_________(_______尾_______檢定)
 設 =0.05,n=16,σ=2 g/ml,臨界值為 _________
 若統計量為 -1.95,請決定拒絕或接受虛無假說 ____________
 某小學一年級的學生的身高是否高於110cm
 H0:_________ H1:_________ (_______尾_______檢定)
 設 =0.01,n=16,σ已知,臨界值為_________
 若統計量為 2.35 ,請決定拒絕或接受虛無假說 ____________
13 假說檢定的步驟(五步驟法) (p218)
1) 建立假說:
決定以雙尾或單尾檢定
建立虛無假說與對立假說
2) 決定顯著水平
通常以α = 0.05或α = 0.01當作檢定標準。
14 3) 計算檢定統計量
 如果欲比較母體的標準差(σ)已知
 計算Z分數
 此種檢定稱為Z檢定(Z-test)
 Z檢定在現實生活上很少用到

 母體的標準差(σ)未知
 樣本的標準差(s)已知,且樣本數n < 30
 計算t分數
 此種檢定稱為t檢定(t-test)
 是用到最多的一種檢定方法。

 母體的標準差未知
 樣本的標準差(s)已知
 樣本數𝑛 ≥ 30,則還是使用Z檢定,公式為
15 假說檢定的步驟

4) 決定臨界值並畫圖
臨界值可經由查表或Excel函數功能獲得

5) 結論:接受或是拒絕虛無假說。
[範例說明 9.1] P219~222

臨床上膽固醇(Cholesterol)與三酸甘油酯(TG)為兩項心血管疾病發生率的重要指
標。全臺一般成年母群體的膽固醇平均數(µ)與標準差(σ)分別為 180 mg/dl 與 25

mg/dl。今隨機調查 25 名長期喝酒民眾,發現此 25 名民眾的膽固醇平均數( x )


為 190 mg/dl。(1)請問喝酒族群的膽固醇平均數是否與一般族群不同? (2) 請
問喝酒族群的膽固醇平均數是否大於一般族群的膽固醇平均數? (3) 如果一般
族群的膽固醇平均數平均數(µ)為 180 mg/dl 但標準差未知,不過此 25 名長期喝

酒民眾的膽固醇平均數( x )與標準差(s)分別為 190 與 30 mg/dl,請問喝酒族群


的膽固醇平均數是否與一般族群不同?(α=0.05)
範例9.1(p221)

(1) µ=180,σ=25,檢定喝酒族群膽固醇值是否與一般群眾不同
Z檢定還是t檢定???→設定假說→單尾還是雙尾??→假說檢定五步驟
(2) µ=180,σ=25,檢定喝酒族群膽固醇值是否大於一般群眾
Z檢定還是t檢定???→設定假說→單尾還是雙尾??→假說檢定五步驟
(3) µ=180,σ未知,檢定喝酒族群膽固醇值是否與一般群眾不同
Z檢定還是t檢定???→設定假說→單尾還是雙尾??→假說檢定五步驟
(1)
19
1. 假說:H0:µ=180
H1:µ≠180 (雙尾檢定)
1. 顯著水平:=0.05
2. 檢定統計量:

1−0.05
4. 查表,A= =0.4750,臨界值:Z=± 1.96
2
5. 結論:因為檢定統計量= 2 >臨界值1.96,所以拒絕虛無假說,接受
對立假說,亦即喝酒族群的膽固醇平均數與一般族群的膽固
醇平均數有顯著性的不同。
20 (2)
1. 假說:H0:µ≤180
H1:µ>180 (右單尾檢定,正單尾檢定)
1. 顯著水平:=0.05
2. 檢定統計量:

4. 查表,A=0.5 − 0.05 = 0.4500,臨界值:Z=± 1.645


5. 因為檢定統計量= 2 >臨界值1.645,所以拒絕虛無假說,接受對立假
說,亦即喝酒族群的膽固醇平均數高於一般族群的膽固醇平均數。
21 (3)
1. 假說:H0:µ=180
H1:µ≠180 (雙尾檢定)
1. 顯著水平:=0.05
2. 檢定統計量:

3. 在自由度=n-1=25-1=24,雙尾且=0.05的條件下,查t表,得到臨界值為
±2.0639。
4. 因為檢定統計量= 1.67<臨界值2.0639,所以接受虛無假說,拒絕對立假說,亦
即喝酒族群的膽固醇平均數與一般族群相同
[範例說明9.2]
 為瞭解每日健走是否會降低身體質量指數(Body Mass Index, BMI)。
今隨機抽樣16個平日有健走習慣的成年男性,經測量其BMI,得到
平均值為20.5,標準差為3.5。假設全國成年男性的BMI平均值為
23.6,請問健走族群的BMI是否低於全國成年男性的BMI平均值?
體重(公斤)
(α=0.01) (BMI = )
身高2 (公尺2)

 𝑥=20.5,s=3.5,n=16,
ҧ µ=23.6,檢定健走男性BMI是否低於一般群眾
 Z檢定還是t檢定??? →設定假說→單尾還是雙尾??→假說檢定五步驟
1. 假說:H0:µ≥23.6
H1:µ<23.6 (左尾檢定)
1. 顯著水平:=0.01
2. 檢定統計量:

4. 臨界值:
在自由度=n-1=16-1=15,左尾檢定且=0.01的條件下
查t表,得到臨界值為-2.602。
5. 因為檢定統計量= −3.54<臨界值−2.602,所以拒絕虛無假說,接受對立假說,亦即
健走族群的BMI平均值低於全國成年男性的BMI平均值
練習2:
請執行「男生與女生的學期成績是否有差異」的假說檢定

0 :
a :
單尾還是雙尾

Excel 通常設=0.05
臨界值:
統計量:
P值:
結論:
25 練習3:
 假設20歲男性的身高值呈常態分佈,平均數為170、標準差為12
 某研究16位20歲男性樣本身高平均數為175,標準差為15,請執行此樣本
身高是否高於一般青年的顯著性檢定(設α=0.05)
 若不知其母群體標準差,16位20歲男性樣本身高平均數為175,標準差為
15,請執行此樣本身高是否高於一般青年的顯著性檢定(設α=0.05)
課後摘要:單一樣本假說檢定整理
26
獨立樣本t檢定的顯著性檢定

 Η0 : µ1=µ2 (µ1- µ2=0),Η1 : µ1≠µ2 (µ1- µ2 ≠ 0)


 設定α
𝑥,ҧ −𝑥2
 計算檢定統計量 → μ1- μ2=0 →𝑡 =
ⅈ 1
𝑠𝑝 +
𝑛1 𝑛2

 查臨界值: df=n1+n2-2 ,決定雙尾或單尾


 結論
練習4
學校欲比較護理系與醫管系同學生活滿意度是否有差異,護理系抽樣36人,生活
滿意度平均分數為74,醫管系抽樣46人,生活滿意度平均分數為70,Sp=6.8,
t=2.65,
請執行”護理系與醫管系同學生活滿意度是否有差異”的假說檢定(設α=0.01)
配對t檢定假說

 實驗前後心跳數是否呈顯著差異
0 : (µd=0) δ=0 –實驗前後心跳數沒有差異
1 : (µd  0) δ0 --實驗前後心跳數有差異
δ為前後測差值平均數(後側檢前側相差值的平均數)
 設定α

𝑑−𝜇 ത
𝑑−0
 計算檢定統計量 𝑡= 𝑠𝑑
𝑑 →(µd=0)→ 𝑡 = 𝑠𝑑
𝑛
𝑛
 查臨界值: df=n-1 ,決定雙尾或單尾
 結論
練習5
復健病房欲探討病人在衛教活動後病人自我照顧的意願是否有差
異?(以問卷評估,結果為分數,分數越高表示意願越高),參與衛教
之病人共51人,經電腦計算後 𝑑ҧ =6.47, 𝑠𝑑 =18.3,t=2.53
請執行”衛教活動後病人自我照顧的意願是否有差異”是否有差異的
假說檢定(設α=0.05)

You might also like