Professional Documents
Culture Documents
江倫志
2 假說檢定(p214)
統計學最重要的課題之一,就是用來比較兩母體或多個母體其參數之間的異同,
給予統計學上顯著性(significance)的結論。
虛無假說與對立假說共同構成事實的全部, 當拒絕虛無假說時,對立假說即成立
若要比較兩母體某變項的平均值(如以µ1與µ2表示)是否相同
先建立假說(hypothesis)
虛無假說(null hypothesis):
陳述兩者相等的假說
H0:µ1=µ2
對立假說(alternative hypothesis)
兩者不相等的假說
H1:µ1≠µ2
3 假說檢定相關名詞與圖示(p215)
虛無假說(null hypothesis, H0):
大家都一樣, 沒有差別
兩比較參數相等的假說,如以H0:µ1=µ2表示
設定母群體平均數和假說的數值之間並無差異,H0:µ1=10
對立假說(alternative hypothesis, H1):
不同意虛無假說
呈顯著差異
兩比較參數不相等的假說,如以H1:µ1≠µ2表示
設定母群體平均數和假說的數值之間有無差異,H0:µ1≠10
4 設立假說舉例
研究問題: 某急性疾病在兒童的發病年齡是否為11.5歲
0 : =11.5 --發病年齡是11.5歲
1 : 11.5 --發病年齡不是11.5歲
研究問題:警報器汙染物警報平均值是否高於設定值
0 : ≦7 –汙染物警報平均值沒有高於設定值
1 : >7 --汙染物警報平均值設定值高於
研究問題:男生與女生的學期成績是否有差異
研究問題:男性的血壓是否高於女性的血壓
5 假說檢定相關名詞與圖示(p215)
接受域:也稱非拒絕域
等同於所設定的信賴估計區間(CI)
如果樣本的檢定統計量位於此區域內,則接受虛無假說
兩比較的參數相等,沒有差異。
拒絕域
又稱為臨界域
如果樣本的檢定統計量位於此區域內,則拒絕虛無假說,接受對立假說
亦即兩比較的參數不相等
顯著水平(level of significance):
即拒絕域(臨界域)的大小(面積)
𝛼
以α代表,單尾為α,雙尾則為 2
通常α設為0.05、0.01、0.001
6
臨界值(critical value):→為查表而來(Z or t or F…)
界定拒絕域(臨界域)的標準化分數。
例如: 設α=0.05,1-α=0.95→95%CI
查表得到 Z=±1.96
檢定統計量(statistic):即計算Z分數或t分數或…。
7
p值(p-value):
在單尾的情形下,p值為檢定統計量至最近尾端的面積(機率)
但如果是雙尾,則p值為檢定統計量至最近尾端的面積(機率)的
兩倍
8 假說檢定的型式(雙尾與單尾檢定)
以下µ1代表檢定樣本的母體平均數,µ2代表欲比較母體的平均數。
雙尾檢定(two-tailed test):
檢定兩母體的參數(如兩母體的平均數µ1與µ2)是否相等
其中µ1未知,但µ2已知
H0:µ1=µ2
H1:µ1≠µ2
1 2 ,1 < 2 都可能發生
9 單尾檢定: 具有方向性,欲證實比較參數誰高誰低
左單尾(負單尾)檢定(left-tailed test):
檢定某母體的參數(如平均數µ1,未知)是否小於欲比較
母體的相對應參數(如平均數µ2,已知)
H0:µ1≥µ2
H1:µ1<µ2
10 右單尾(正單尾)檢定(right-tailed test):
檢定某母體的參數(如平均數µ1,未知)是否大於欲比較母
體的相對應參數(µ2,已知)
H0:µ1≤µ2
H1:µ1>µ2
舉例: 是雙尾還是單尾?
某急性疾病在兒童的發病年齡是否為11.5歲
0 : =11.5 --發病年齡是11.5歲
a : 11.5 --發病年齡不是11.5歲
警報器汙染物警報平均值是否高於設定值
0 : ≦7 –汙染物警報平均值沒有高於設定值
a : <7 --汙染物警報平均值高於設定值
男生與女生的學期成績是否有差異
男性的血壓是否高於女性的血壓
練習1
12
吸菸者(n=52) 與已戒菸者 (n=50)的收縮壓是否相同
H0:_________ H1:_________(_______尾_______檢定)
設 =0.01,臨界值為_________
若統計量為 3.21 ,請決定拒絕或接受虛無假說 ____________
某疾病患者血紅素值是否低於12g/ml,
H0:_________ H1:_________(_______尾_______檢定)
設 =0.05,n=16,σ=2 g/ml,臨界值為 _________
若統計量為 -1.95,請決定拒絕或接受虛無假說 ____________
某小學一年級的學生的身高是否高於110cm
H0:_________ H1:_________ (_______尾_______檢定)
設 =0.01,n=16,σ已知,臨界值為_________
若統計量為 2.35 ,請決定拒絕或接受虛無假說 ____________
13 假說檢定的步驟(五步驟法) (p218)
1) 建立假說:
決定以雙尾或單尾檢定
建立虛無假說與對立假說
2) 決定顯著水平
通常以α = 0.05或α = 0.01當作檢定標準。
14 3) 計算檢定統計量
如果欲比較母體的標準差(σ)已知
計算Z分數
此種檢定稱為Z檢定(Z-test)
Z檢定在現實生活上很少用到
母體的標準差(σ)未知
樣本的標準差(s)已知,且樣本數n < 30
計算t分數
此種檢定稱為t檢定(t-test)
是用到最多的一種檢定方法。
母體的標準差未知
樣本的標準差(s)已知
樣本數𝑛 ≥ 30,則還是使用Z檢定,公式為
15 假說檢定的步驟
4) 決定臨界值並畫圖
臨界值可經由查表或Excel函數功能獲得
5) 結論:接受或是拒絕虛無假說。
[範例說明 9.1] P219~222
臨床上膽固醇(Cholesterol)與三酸甘油酯(TG)為兩項心血管疾病發生率的重要指
標。全臺一般成年母群體的膽固醇平均數(µ)與標準差(σ)分別為 180 mg/dl 與 25
(1) µ=180,σ=25,檢定喝酒族群膽固醇值是否與一般群眾不同
Z檢定還是t檢定???→設定假說→單尾還是雙尾??→假說檢定五步驟
(2) µ=180,σ=25,檢定喝酒族群膽固醇值是否大於一般群眾
Z檢定還是t檢定???→設定假說→單尾還是雙尾??→假說檢定五步驟
(3) µ=180,σ未知,檢定喝酒族群膽固醇值是否與一般群眾不同
Z檢定還是t檢定???→設定假說→單尾還是雙尾??→假說檢定五步驟
(1)
19
1. 假說:H0:µ=180
H1:µ≠180 (雙尾檢定)
1. 顯著水平:=0.05
2. 檢定統計量:
1−0.05
4. 查表,A= =0.4750,臨界值:Z=± 1.96
2
5. 結論:因為檢定統計量= 2 >臨界值1.96,所以拒絕虛無假說,接受
對立假說,亦即喝酒族群的膽固醇平均數與一般族群的膽固
醇平均數有顯著性的不同。
20 (2)
1. 假說:H0:µ≤180
H1:µ>180 (右單尾檢定,正單尾檢定)
1. 顯著水平:=0.05
2. 檢定統計量:
3. 在自由度=n-1=25-1=24,雙尾且=0.05的條件下,查t表,得到臨界值為
±2.0639。
4. 因為檢定統計量= 1.67<臨界值2.0639,所以接受虛無假說,拒絕對立假說,亦
即喝酒族群的膽固醇平均數與一般族群相同
[範例說明9.2]
為瞭解每日健走是否會降低身體質量指數(Body Mass Index, BMI)。
今隨機抽樣16個平日有健走習慣的成年男性,經測量其BMI,得到
平均值為20.5,標準差為3.5。假設全國成年男性的BMI平均值為
23.6,請問健走族群的BMI是否低於全國成年男性的BMI平均值?
體重(公斤)
(α=0.01) (BMI = )
身高2 (公尺2)
𝑥=20.5,s=3.5,n=16,
ҧ µ=23.6,檢定健走男性BMI是否低於一般群眾
Z檢定還是t檢定??? →設定假說→單尾還是雙尾??→假說檢定五步驟
1. 假說:H0:µ≥23.6
H1:µ<23.6 (左尾檢定)
1. 顯著水平:=0.01
2. 檢定統計量:
4. 臨界值:
在自由度=n-1=16-1=15,左尾檢定且=0.01的條件下
查t表,得到臨界值為-2.602。
5. 因為檢定統計量= −3.54<臨界值−2.602,所以拒絕虛無假說,接受對立假說,亦即
健走族群的BMI平均值低於全國成年男性的BMI平均值
練習2:
請執行「男生與女生的學期成績是否有差異」的假說檢定
0 :
a :
單尾還是雙尾
Excel 通常設=0.05
臨界值:
統計量:
P值:
結論:
25 練習3:
假設20歲男性的身高值呈常態分佈,平均數為170、標準差為12
某研究16位20歲男性樣本身高平均數為175,標準差為15,請執行此樣本
身高是否高於一般青年的顯著性檢定(設α=0.05)
若不知其母群體標準差,16位20歲男性樣本身高平均數為175,標準差為
15,請執行此樣本身高是否高於一般青年的顯著性檢定(設α=0.05)
課後摘要:單一樣本假說檢定整理
26
獨立樣本t檢定的顯著性檢定
實驗前後心跳數是否呈顯著差異
0 : (µd=0) δ=0 –實驗前後心跳數沒有差異
1 : (µd 0) δ0 --實驗前後心跳數有差異
δ為前後測差值平均數(後側檢前側相差值的平均數)
設定α
ഥ
𝑑−𝜇 ത
𝑑−0
計算檢定統計量 𝑡= 𝑠𝑑
𝑑 →(µd=0)→ 𝑡 = 𝑠𝑑
𝑛
𝑛
查臨界值: df=n-1 ,決定雙尾或單尾
結論
練習5
復健病房欲探討病人在衛教活動後病人自我照顧的意願是否有差
異?(以問卷評估,結果為分數,分數越高表示意願越高),參與衛教
之病人共51人,經電腦計算後 𝑑ҧ =6.47, 𝑠𝑑 =18.3,t=2.53
請執行”衛教活動後病人自我照顧的意願是否有差異”是否有差異的
假說檢定(設α=0.05)