You are on page 1of 26

卡方檢定

(百分比考驗)

許惠媚
卡方檢定(X2 test)
最早由英國卡爾‧皮爾森(Karl Pearson)在 1900 年
發表,適用於類別變項(categorical variables)的
檢定。
在一般文獻中,當提及卡方檢定而沒有特別指
明類型時,通常是指皮爾森卡方檢定(Pearson's
chi-squared test)。
卡方檢定適用於非連續變項(例如:類別或次序
變數)之差異分析,卡方檢定的虛無假設是:一
個樣本中已發生事件(類別變數)的次數分配(實
際觀察值)會服從某個理論分配(期望值)。其中
事件必須互斥並且所有事件機率總合等於 1。
卡方檢定的種類
適配度檢定(good-of-fit test)
獨立性檢定(test of independence)
同質性檢定(test of homogeneity)
適配度檢定(good-of-fit
test)
當我們想了解某一個變數是否與某個理論或
母體分配相符合時,就可以使用卡方檢定的
應用之一「適配度檢定」,適配度檢定的內
容是一個變數,因此,也稱為單因子分類
(one-way classification) 檢定。
卡方的適配度檢定是取樣本的觀察值和母體
的期望值作比較,而卡方值愈大,代表觀察
值和期望值差異愈大,當卡方值超過某一個
臨界值時,就會得到顯著的統計檢定結果。
適配度檢定(good-of-fit
test)
範例
某電腦公司分別售出筆電白色50台,黑色40
台,灰色30台,請問消費者對筆電的顏色喜
好是否有差異?
顏色 白色 黑色 灰色
銷售量 50 40 30

H0:消費者對筆電的顏色喜好沒有不同(是相同的)
適配度檢定(good-of-fit
test)
卡方適配度檢定的實務操作如下:
開啟 expected.sav
點選[資料/加權觀察值]
勾選「觀察值加權依據」,選擇
「Sale」至次數變數欄位
選擇完畢後,點選[確定]
點選[分析/無母數檢定/舊式對話框(歷
史對話記錄)/卡方檢定(卡方)]
選擇「Sale」至[檢定變數清單]欄位
點選[選項]
勾選「敘述統計(描述性統計量)」,
點選[繼續]
選擇完畢後,點選[確定]
適配度檢定(good-of-fit
test)結果

從表中我們可以看到卡方統計
量為 5,P 值 0.082 大於 0.05,
因此,我們接受虛無假設 H0,
消費者對筆記型電腦顏色的偏
好是相同的。
獨立性檢定(test of
independence)
獨立性檢定是用在同一個樣本中,兩個變數的關連性
檢定,也就是說,在探討兩個類別變數之間,是否互
為獨立,或則是有相依的關係存在
獨立性檢定的結果,若是達到顯著,則需要查看二個
變數的關連性強度,我們整理如下:
2×2 列連表:查看 φ (phi)相關係數
3×3 列連表:查看列聯係數(coefficient of contingency)
注意:4×4,5×5,6×6:也是查看列聯係數。
2×3 列連表:查看 Cramer’s V 係數
注意:(3×2,2×4,3×4…):也是查看 Cramer’s V 係數。
註解:一般建議不超過 16 個方格,也就是使用小於 4×4
或 3×5 的表格,以免難於解釋結果,另外,一般也常用
Lamda( λ )係數來解釋兩個變數的關係, λ 係數是以一個
變數可以解釋另一個變數時,削減誤差比率(Proportioned
Reduction in Error),愈大代表兩個變數的關連性愈強。
獨立性檢定(test of
independence)
範例
電腦公司筆電銷售資料,男性顧客購買白色50,黑
色60,灰色50;女性顧客購買白色70,黑色30,灰
色40,試問,顧客在購買筆電的顏色選擇上是否與
性別有關?(男女顧客在購買筆電在顏色的決策上
是否有差異?)
性別/顏色 白色 黑色 灰色 總計
男 50 60 50 160
女 70 30 40 140
總計 120 90 90 300

H0:兩變數相互獨立,代表男女性別在採購筆電之決策上與顏色無關
獨立性檢定(test of
independence)
獨立性檢定的實務操作如下:
開啟範例 independence.sav
點選[資料/加權觀察值]
勾選「觀察值加權依據」,
選擇「Sale」至次數變數欄位
選擇完畢後,點選[確定]
點選[分析/敘述統計/交叉資料表]
選擇「Sex」至[列],選擇「Color」至
[直欄]
點選 [統計量(資料)]
勾選「卡方檢定(分配)」、「列聯係數」、
「Phi 與 Cramer’s V」與「Lambda 值」,
點選[繼續]
點選[單元(儲存格)]
勾選「觀察值」、「列」、「欄(行)」
和「總計(和)」,點選[繼續]
點選[確定]
獨立性檢定(test of
independence)結果

我們得到卡方統計量為 13.17,
P 值 0.001 小於臨界值 0.05,
因此,我們拒絶虛無假設 H0,
消費者男女性別與購買筆記型電
顏色有關。
同質性檢定(test of
homogeneity)
同質性檢定是用在不同樣本(例如:二個樣本)中,同一個變數是否
為一致的檢定,也就是說,用來檢測不同母體在同一個變數的回應
下,是否有顯著差異。 同質性檢定的統計量如下:

O 為觀察次數,E 為期望次數
若 X2> X2 (r-1)(j-1),α 則拒絕虛無假設 H0
同質性檢定的統計量為皮爾森卡方統計量,另外,也可以使用
likelihood 概似比卡方統計量來作檢定
注意:我們使用同質性檢定於細格大於 2 時,只能檢定出是否
有顯著差異,至於是那二組有顯著差異,則需要再進一步,作
事後比較,才可以得知。
同質性檢定(test of
homogeneity)
範例
想了解大學生、大學教師、家長對於研究生
購買筆電的意見是否一致?

身份/意見 贊成 反對

大學生 50 40

大學教師 60 30

家長 50 70

H0:大學生、大學教師、及家長對研究生購買筆電的態度一致
同質性檢定(test of
homogeneity)
同質性檢定的實務操作:
開啟範例 homogeneity.sav,點選[資料/加權觀
察值]
勾選「觀察值加權依據」,
選擇「number」至[次數變數]欄位
點選[確定]
點選[分析/敘述統計/交叉資料表]
選擇「ID」至列,選擇「opinion」至欄,
點選[統計資料(量)]
勾選「卡方檢定、「列聯係數」、
「Phi 與 Cramer’s V」與「Lambda 值」,
點選[繼續]
點選[單元(儲存格)]
勾選「觀察值」、「期望值」、「列」、「欄
(行)」和「總計(和)」,點選[繼續]
同質性檢定(test of
homogeneity)結果

我們得到卡方統計量為 13.17,P 值 0.001


小於臨界值 0.05,因此,我們拒絶虛無假
設 H0,對於問題的反應是不同的,代表著
大學生,大學教師和家長,對於研究生購
買筆記型電腦的態度是不一致的。
卡方檢定的種類
適配度檢定(good-of-fit test)
一個變數,取樣本的觀察值和母體的期望值
作比較→無母數卡方
獨立性檢定(test of independence)
同一個樣本中,兩個變數的關連性檢定→
敘述統計下的交叉資料表
同質性檢定(test of homogeneity)
不同樣本(例如:二個樣本)中,同一個變數
是否為一致的檢定→敘述統計下的交叉資料

有發現這次的資料和過去
的資料不太一樣的地方嗎?
為什麼要「加權觀察值」?
什麼情況下不需要加權?
Pearson
t 檢定
相關性分析

複習一下 ANOVA 卡方檢定

X (自變項)
類別資料 連續資料
Y(依變項)

類別資料

連續資料
Pearson
t 檢定
相關性分析

複習一下 ANOVA 卡方檢定

X (自變項)
類別資料 連續資料
Y(依變項)

類別資料 卡方檢定

t 檢定
連續資料 Pearson 相關
性分析
ANOVA
練習題
練習一
勞工對整體工作之滿意度.csv
工作滿意度與性別有關係嗎?
工作滿意度與年齡層有關係嗎??
工作滿意度與教育程度有關係嗎?
工作滿意度與婚姻狀況有關係嗎?
工作滿意度與地區有關係嗎?
工作滿意度與企業規模(員工規模)有關係
嗎?
工作滿意度與收入層級有關係嗎?

Hint: 先整理資料成可以進行卡方檢定的格式
練習二
我們以大學生為例,抽樣調查 12 個大學生
examples.sav
Gender 性別(1 男性,2 女性),
Score1上學期成績,Score2 下學期成績,
Cost 每月花費,
Income 家庭收入(1 低收入,2 高收入),
Location 區域(1 北部,2 中部,3 南部),
Sat_Score 成績的滿意度(1 非常不滿意、2 不滿
意、3 普通、4 滿意、5 非常滿意),
Mag_Cost 自我管理生活費的滿意度(1 非常不滿
意、2 不滿意、3 普通、4 滿意、5 非常滿意)
卡方練習二
想了解不同性別的學生在成績的滿意度上
是否有關係?在自我管理生活費的滿意度
上是否有關係?
想了解不同Income (家庭收入)的學生在成
績的滿意度上是否有關係?在自我管理生
活費的滿意度上是否有關係?
想了解不同區域的學生在成績的滿意度上
是否有關係?在自我管理生活費的滿意度
上是否有關係?
如果題目問,有無差異?可以用何種統計方法呢?
練習三
歷年來台旅客來台目的統計.csv
試問,旅客來自不同洲別與來台目的是否有
顯著的關係?
旅客來台人數前三國的國家別與來台目的是
否有顯著的關係?
Hint: 先整理資料成可以進行卡方檢定的格式
回家作業
地區年齡性別統計表-嚴重特殊傳染性肺炎
1. 2022年得到COVID19的人數和年齡層有關係嗎?
2. 2022得到COVID19的人數和性別有關係嗎?
3. 2022得到COVID19的人數和地區別(請分為北
北基、桃竹苗、中彰投、雲嘉南、高屏澎金馬、
宜花東)有關係嗎?

You might also like