You are on page 1of 31

2014/7/30

信度與效度

馬瀰嘉
成功大學統計諮詢暨推廣中心 召集人
成大統計學系 副教授
電話: (06)275-7575(分機 53639)
email:mcma@stat.ncku.edu.tw
2014.8.8

內容大綱

一、信度 (Reliability)
 何謂信度
 信度的古典測量理論
 信度的型態
 信度測量方法
 信度分析之實例說明
 影響信度的原因

1
2014/7/30

內容大綱

二、效度 (Validity)
 何謂效度
 效度的概念
 效度的型態
 信度與效度的差異
 效度分析之實例說明

前言
 問卷調查是獲取訊息的方法,是根據調查目
的設計的調查問卷,其質量高低對調查結果
的真實性、適用性等具有決定性的作用。
 為了保證問卷具有較高的可靠性和有效性,
在形成正式問卷之前,應當對問卷進行試測,
並對試測結果進行信度和效度分析,根據分
析結果篩選問卷題項,調整問卷架構,從而
提升問卷的信度和效度。

2
2014/7/30

一、信度分析
何謂信度?
 信度(Reliability)即可靠性,指的是一
份量表所測得分數的可信度或穩定性,同一
群受測者在同一份量表或測驗多次的答案如
有一致性即表示信度高,反之若兩次測驗的
結果相差很多則表示信度低。信度的概念其
實就是統計學上的變異數,我們總希望估計
值之變異可以越小越好,也就是信度越高越
好!
5

信度的古典測量理論
 它將每個測量分數分成真實能力所得分數與
誤差造成的分數,若誤差分數越小,即代表
測量分數越接近真實分數。基本模式如下:
X=T+E
X:測量分數;T:真實分數;E:誤差項
Cov(T,E )=0
 信度=測量分數和真實分數相關係數的平方
=(真實分數的變異數)/(測量分數的變異數)

3
2014/7/30

• 以血壓計為例,A男在短時間內以同一台血壓
計測量血壓兩次,結果發現兩次測出的血壓差
很多,由此可知此台血壓計的變異很大,即可
信度很低。差異有可能是受測者第一次是在剛
跑步後測量,第二次卻是在休息過後,則兩次
血壓不同是可想而知的。
• 想要得到良好測量的信度,需對受測者在相同
環境條件下進行至少兩次的試驗。
• 信度越高越好,但信度的測量可能會受到許多
因素的影響。
• 通常信度達0.8以上我們才認為該測量是信度
佳,不過還是應視測量性質或目的而定。
7

 測量理論上,對於兩個測量基本上有三種測量模式,
分別為平行(Parallel)、同義(Equivalent)和同類
(Congeneric)。
 假設 x1 , x2是兩個測量的分數
T1 ,T2 是兩個測量的真實分數; E1, E2 是量測誤差項

:因應可能有測量尺度單位不同而設的係數
1.同類測量模式:當誤差項 不相關且真實分數
相同( )時,稱之為同類測量模式。
2.同義測量模式:當模式為同類測量且
時,稱之為同義測量模式。
3.平行測量模式:當模式為同義測量且誤差項的變異
相等,則稱之為平行測量模式。

4
2014/7/30

信度的型態
 信度指標多以相關係數表示,大致可分為三
類︰穩定係數、等值係數和內在一致性係數。
 信度= corr ( x1 , x2 )
 信度測量的方法主要有三種︰再測法(retest
method)、複本法(equivalent-forms method)、
折半法(split half method)。

信度分析─(1)再測法
 此方法是用同樣的問卷對同一組受訪者,間
隔一定時間重複施測(相同題目,不同時間
測驗),在平行測量模式下,再測信度是計
算兩次施測結果的相關係數,屬於穩定係數。
 再測法特別適用於事實式問卷,例如性別、
出生年月等在兩次施測中不應有任何差異的
問題,或是大多數被調查者的興趣、愛好、
習慣等在短時間內也不會有十分明顯變化的
問題。
10

10

5
2014/7/30

信度分析─(1)再測法

 假設你家中有兩個磅秤,你嘗試在一個小時
內重複量度你的體重,以下是你的測量紀錄:
測量紀錄 A 磅 秤 B 磅 秤

1 120 97
2 120 101
3 120 100
4 120 124
5 119 98
 結論是,A 磅秤的可信度較高。
11

11

信度分析─(1)再測法
 研究者希望知道學生「對於台灣目前的民主
了解的程度」,抽樣詢問10位同學的看法。
為了檢測「再測信度」,對於此10位同學,
前後實施兩次調查,此10位同學前後測10個
得分如下:
 前測得分( x1 ):5,3,2,5,4,3,5,2,
4,1
 後測得分( x2 ):5,2,2,4,3,4,5,2,
3,1
 再測信度= corr ( x1 , x2 ) =0.8846
12

6
2014/7/30

信度分析─(1)再測法的優缺點
優點:使估計信度簡單化。
缺點:(a)前後兩次測試的時間間隔很難設定恰當。
若兩次測驗相隔太短,受測者可能記憶猶新,使得
第二次測試的分數提高;若兩次測驗相隔太長,受
測者可能受心智成長的影響,而使穩定係數降低。
(b)再測法假設真實分數是相同的,但事實上很多
情況下真實分數可能會隨時間而改變。若兩次測試
的真實分數不同,則再測信度可能造成低估。
(c)再測法假設兩次測試的誤差項是不相關的,但
兩者可能會有相關,尤其是當兩次測量時間間隔
很短時,更容易發生,當誤差項呈正相關時,可
能造成再測信度高估。

13

信度分析─(2)複本法

 複本信度法是讓同一組受訪者間隔一定時間
填答兩份問卷複本 (不同題目,不同時間測
驗) ,計算兩個複本施測結果的相關係數。
複本信度屬於等值係數。
 複本信度法要求兩個問卷複本使用不同的語
句敘述,或是不同的問題測試,形成外表看
似完全不同,而實際所測內容一致的兩種測
驗,但在實際調查中,很難使調查問卷達到
這種要求,因此採用這種方法者較少。
14

14

7
2014/7/30

信度分析─(2)複本法的優缺點
優點:
 不會受記憶效用的影響。

 對測量誤差的相關性通常比再測法低。

缺點:
 和再測法有一樣的缺點,特別是兩次真實
分數的相等性之假設最遭受質疑。
 誤差項變異數的相等性之假設相較於再測
法更有問題。

15

信度分析─(3)折半法

 折半信度法是將調查項目分為兩半(不同問
卷題目,相同時間測驗) ,計算兩半施測
結果的相關係數,進而估計整個量表的信度。
折半信度屬於內在一致性係數,測量的是兩
半題項得分間的一致性。
 這種方法一般不適用於事實式問卷(如年齡
與性別無法相比),常用於態度、意見式問
卷的信度分析。在問卷調查中,態度測量最
常見的形式是5級李克特(Likert)量表。
16

16

8
2014/7/30

信度分析─(3)折半法
進行折半信度分析時,如果量表中含有
反向題,應先將反向題的得分作逆向處理,
以保證各題項得分方向的一致性,然後將
全部題項按奇偶或前後分為儘可能相等的
兩半,計算二者的相關係數,最後用斯皮
爾曼-布朗(Spearman-Brown)公式︰
2r
rSB  [corr(T , x1  x 2)]2  12
求出整個量表的信度係數。 1  r12
r12  corr ( x1 , x2 ) =兩半測驗分數之相關係數

17

信度分析─(3)折半法的優缺點
優點:
 只需舉行一次測量,在人力、物力和時間上,相較
於其他方法節省,成本較低廉,也較容易實施。
 不需假設兩半真實分數相等,因它是在同一時間內
完成測驗的,沒有記憶效應的問題。
 誤差項存在相關性的可能性很低。
缺點:
 此法必須是平行測量的,但通常並不知道測量誤差
的變異數是否相等,也不知道 是否成立。
 此法需將一份問卷分成兩半,分法有很多種,但不
同分法所得的信度可能不一樣。
 因此法是將整份問卷分成兩半,故問項過少時,此
法並不恰當。

18

9
2014/7/30

信度分析─CRONBACH α信度係數
 Cronbach (1951)克服折半法的缺點提出α
係數,是目前最常用的信度係數,α係數評
價的是量表中各題項得分間的一致性,屬於
內在一致性係數。
n    xi 
n 2

  [corr (T ,  xi )] 
2
1
i 1 n  1   x2 
 其中  x2i 為第i題項分數的變異數
 x2 為總分的變異數
 這種信度適用於態度、意見式問卷或量表的
19
信度分析。
19

信度分析─CRONBACH α信度係數

 x2

Si2 為第 i 題項分數變異數的估計值
為總分的變異數的估計值
S H2
當每個受測者各題分數有一致性時, Cronbach’s α=1

20

10
2014/7/30

信度分析─CRONBACH α信度係數
 標準化的α係數,若假設每題分數變異數相
同,使得變異數為  2 ,則α係數可整理如
下 n    n  n 
2 2
 1  xi
 1  
n  1   x2  n  1  n 2  n n  1 2 
n  1  n  n  1 
 1    
n  1  1  n  1  n  1  1  n  1 
n

1  n  1

 其中 ρ 為任兩題分數的平均相關係數
21

21

信度分析─CRONBACH α信度係數
 若以題目問項當因子,以受測者當集區,利
用ANOVA分析,假設此問卷有 n 個題目,k
位受測者, x ij 為第 j 位受測者在第 i 題
的分數,則ANOVA模式為
xij     i   j   ij ; i  1,, n ; j  1,, k .
 其中αi為第 i 題的主效用,βj為第 j 個
受測者的主效用,ANOVA表為
變異來源 自由度 平方和 均方和 F
試題間(A) n-1 SSA MSA FA
受測者間(B) k-1 SSB MSB FB
誤差 (n-1)(k-1) SSE MSE
22
總變異 nk-1 SSTO
22

11
2014/7/30

信度分析─CRONBACH α信度係數

 ANOVA中的α係數
MSE 1
  1  1
MSB FB
 可知受測者間的差異越大時(即FB越小),
測驗的信度會越高。

23

23

信度分析─CRONBACH α信度係數
優點:
(1)不需要對真實分數的相等(穩定性)做假設。
(2)沒有記憶效應的問題,且不需將一份問卷分成兩半。
(3)計算容易。
缺點:
(1)對同類測量模式有低估信度的可能。
(2)對只有單一項目(n=1)的量表,沒有辦法計算其信度。
(3)當問項的相關性很低(甚至是負相關)時,可能產生係數
為負值。設計問卷時若不是基於同一概念,或存在反向
問法時,都可能產生此種現象。前者可以藉由刪去某些
不同概念問項或分成個別構面計算信度,後者則應將得
分方向做更正,以提高信度。欲進行係數的計算前,都
須先檢查每個問項是否都是正相關,若有違反者,應先
將其變號或刪除,否則可能使信度估計不準確。
(4)若有受試者亂答,可能使信度估計不準,須將其資料刪
除後再計算。

24

12
2014/7/30

信度分析─CRONBACH α信度操作範例
 使用STARBUCKS咖啡店對消費者做調查資料(資料來源:
陳順宇,多變量分析,第四版,例9.2),並運用SPSS
來執行信度分析。此問卷共有100份,前十筆資料如下:

價格 公司形象 口味 研發能力 銷售員 座位 採光 次數 金額 滿意分數


1 1 3 1 1 3 4 4 1 1 2
2 1 1 3 2 3 2 2 2 3 3
3 3 2 2 3 1 2 1 5 1 5
4 5 1 1 2 1 4 4 2 1 5
5 5 3 5 2 2 5 4 2 2 5
6 4 3 1 3 1 3 3 5 2 4
7 1 3 3 1 5 3 3 3 3 3
8 4 5 5 3 1 1 4 1 2 5
9 3 5 1 4 1 4 3 5 2 2
10 1 1 1 5 5 1 3 3 1 2
25

25

信度分析─CRONBACH α信度操作與說明

1. 首先將data.sav開啟,點選「分析」→
「尺度」→「信度分析」,將全部的問題
選入。
2. 點選「統計量」並勾選「刪除項目後之量
尺摘要」,退出並確定執行信度分析。
3. 得到結果如下頁所示

26

26

13
2014/7/30

信度分析─CRONBACH α信度操作與說明
信度統計量
Cronbach's
Alpha 值 項目的個數
.772 10
項目總和統計量
項目刪除時的
項目刪除時的 項目刪除時的 修正的項 Cronbach's
尺度平均數 尺度變異數 目總相關 Alpha 值
價格 26.15 61.826 .575 .733
公司形象 26.13 63.589 .568 .736
口味 26.38 62.662 .571 .734
研發能力 25.95 65.987 .439 .752
銷售員 26.17 72.163 .181 .785
座位 26.14 73.940 .121 .791
採光 26.20 64.263 .513 .743
次數 25.98 66.888 .394 .758
金額 26.47 65.807 .466 .749
滿意分數 26.15 62.553 .573 .734
27
 顯示α係數為0.772,α係數越大表示此問卷信度越高
27

信度分析─CRONBACH α信度操作與說明
4. 將該項目刪除時的Cronbach’sα值與整份問卷α值比較,
經刪除掉高於0.772的「銷售員」及「座位」項目後,再執
行一次步驟2及3,得到結果如下
信度統計量
Cronbach's
Alpha 值 項目的個數
.810 8

項目總和統計量
項目刪除時的
項目刪除時的 項目刪除時的 修正的項 Cronbach's
尺度平均數 尺度變異數 目總相關 Alpha 值
價格 20.30 50.535 .586 .779
公司形象 20.28 51.557 .611 .777
口味 20.53 51.221 .586 .780
研發能力 20.10 54.172 .456 .799
採光 20.35 52.573 .532 .788
次數 20.13 55.569 .383 .809
金額 20.62 53.996 .485 .794 28
滿意分數 20.30 51.667 .562 .783

28

14
2014/7/30

信度分析─庫李(Kuder-Richardson)信度

 當量表題目為二分法計分,庫李(Kuder-
Richardson)提出另一種信度,即答案類型只有
對或錯兩種的情況之信度,公式如下:
 n

  pi (1  pi ) 
 n  
rKR 20  1  i 1
 n 1 x
2 
 
 
其中 n=測驗之題數,

pi (1  pi ) =第i題項分數之變異數,

 x2 =測驗總分之變異數。
29

信度係數參考範圍
 一般而言,信度的係數之可信程度如下表所
示,但實務上還是要視測量性質或目的而定!
信度係數 可信程度
信度 <0.30 不可信
(0.3, 0.4] 初步的研究,勉強可信
(0.4, 0.5] 稍微可信
(0.5, 0.7] 可信(最常見的信度範圍)
(0.7, 0.9] 很可信(次常見的信度範圍)
信度 > 0.9 十分可信

30

15
2014/7/30

信度分析─影響信度的原因
 造成一份量表信度低的原因,主要可分成下列三種:
 抽樣誤差
 測驗題目本身特殊的差異會影響到量表的信度,因題目太少或
題目取樣不當以致測量結果不能代表受測者的真實能力,所以
一般測驗取材要有充分的代表性。
 量測誤差
 因使用量尺、智力測驗、問卷調查等測量工具所造成的誤差,
有時也有可能是量測讀數四捨五入或誤判等所造成。
 系統偏差
 由問卷設計者本身造成的偏差,包括題目有缺點、題目太困難
或太容易、題目間的相似性不高等。另外對於測驗時的環境、
聲音、測驗時間長短等也是造成測驗偏差的原因。
31

31

題目
有問題

32

16
2014/7/30

二、效度分析
 效度(Validity)即正確度,是指衡量的工
具是否能真正衡量到研究者想要衡量的目的。
效度是探討一份量表是否真能量測出所想要
測量的指標。IQ測驗是否真能測量出智力?
滿意度調查表是否真能測出顧客喜愛程度?
這些都是效度問題。
 效度即為有效程度,既稱之為程度就表示測
驗的效度只是程度上的高低,而非全無或全
有!
33

33

效度分析
 以智力測驗為例,設計一份智力測驗的試題,
A測驗以中文命題,B測驗則以英文命題,
且A、B兩問卷的問題一模一樣,但就台灣
人而言,A問卷相對於B問卷的效度將高的
多!
 因智力測驗是要能測出每個人智力的高低,
這樣測驗的有效程度才高,如果智力測驗以
英文命題,學生不會填答,可能是因為英文
程度不好的緣故,而不是智力不好,因此英
文命題的B問卷就較不具有智力的代表性!
34

17
2014/7/30

效度分析
 假設受測者真正體重是 100 磅:
A磅秤 B磅秤
120 97
120 101
120 100
120 124
119 98

 相對而言,B 磅秤較能反映受測者的實際體重。其
中四個紀錄是 97, 98, 100和 101磅,誤差保留在 3 磅
以內,與受測者實際體重100 磅相差不遠
35

35

效度分析
 一個好的測量工具應該既可信又有效,C 磅
秤便是一個好例子
A磅秤 B磅秤 C磅秤
120 97 99
120 101 100
120 100 100
120 124 100
119 98 100

○ ╳ ○


╳ ○ ○ 36

36

18
2014/7/30

效度的型態
 效度分為三種型態︰內容效度
(content validity)、效標效度
(criterion validity)和建構效度
(construct validity)。

37

效度分析─(1)內容效度
 內容效度又稱表面效度或邏輯效度,它是指所設計
的題項能否代表所要測量的內容或主題。主要是觀
念上的驗證!
 內容效度可分為抽樣效度、表面效度與訪問效度三
種。
 抽樣效度:主要驗證該測驗所包含的項目是能代表
母體的概念的項目。
 表面效度:此效度是指測驗量表的項目和型式上給
人的主觀印象。
 訪問效度:訪問者是否能和受訪者建立良好、互信
的關係。
38

38

19
2014/7/30

效度分析─(2)效標效度
 效標效度是以外在效標與測試量表的相關係數為評
量依據。所謂外在效標通常指的是一份已被認定是
此種量表的標準測量。主要是經驗數據為依據!以
簡單的例子做說明,我們到菜市場買菜要秤重時,
其秤重機就是依政府機關認定的標準作為外在效標。
效標效度又可分成同時效度與預測效度兩種。
 效標效度=量表與效標間的相關係數
 同時效度:指測驗與效標兩者的分數是同時段獲得
的,目的是使用測驗分數來評估學生在效標方面的
表現。
 預測效度:利用本量表分數作為預測學生未來在效
標方面的表現。例如使用大學聯考成績來預測學生
39

微積分成績。
39

效度分析─(3)建構效度
 很多社會科學的概念是沒有辦法完全清楚的定義,
因此沒有辦法應用內容效度,而要找到適當的效標
也不是一件容易的事,在此情況下使用建構效度是
個不錯的方法。
 建構效度是用來評估衡量工具能衡量某種特質或概
念的程度。即指量表(測驗或問卷)能夠測量到理論
上的構面或特質的程度,主要分成收斂效度與區別
效度兩種。
 檢測量表是否具備建構效度,最常使用之方法為因
素分析法。

40

20
2014/7/30

效度分析─(3)建構效度
(1) 收斂效度:一般是在操作的層面,用兩種不同衡量
方式去衡量同一構面的內容時其相關程度。以因素
分析法為例,同一因素構面中,若各題目之因素負
荷量(factor loading)愈大則愈具備「收斂效度」,一
般以大於0.5為準則。
(2) 區別效度:其概念是將不相同的兩個概念進行量測,
量測之過程不管是使用相同的方法或是不同的方法,
經量測結果進行相關分析之相關程度,越低越佳!
以因素分析法為例,若問卷題目在非所屬因素構面
中,其因素負荷量愈小,則愈具備「區別效度」,
一般以低於0.5為準則。

41

效度分析─區別效度
 如果一份量表有多個因素構面,各因素構面間沒有相
關, 則稱此量表有區別效度。
 H0 :ρ=1(受限模式) vs H1 :ρ≠1(未受限模式)
(1)對任兩對因素間的相關係數ρ檢定是否為1。
(2)卡方檢定:以構面間兩兩比較方式來檢定區別效
度;首先設定兩個構面間之相關係數為1(受限模
式, restricted model),其次自由估計兩個構面間之
相關(未受限模式或稱做標準模式, unrestricted
model),當受限模式卡方值與未受限模式卡方值
的差值大於3.84(拒絕H0), 就表示兩因素構面間不是
完全相關,也就是因素構面有區別效度。

42

21
2014/7/30

效度分析─區別效度

對任兩對因素間的相關係數ρ檢定是否為1。

43

信度與效度的差異
 有效度不保證有信度,相反的有信度也不保證有
效度。然而信度高是一份有效度測量的基本條件,
測量若沒有信度也就沒有效度可言。
 我們希望信度高效度大!
 以體重機為例,甲生在一分鐘內測量10次體重,
得到的體重都是65公斤,由此我們可以認定這台
體重機是有信度的,但是甲生的體重真的是65公
斤嗎?若甲生真正的體重真是65公斤,我們稱此
台體重機具有高信度且效度大!反之若甲生真實
的體重是60公斤,則稱此台體重機具高信度但效
度小!

44

22
2014/7/30

 1. 信度:不管測量所用的工具或量表所用的項目是否
正確,只關心測量所得的資料是否穩定,也就是量測
幾次的結果是否一致。
 2. 效度:涉及測量所用的工具或量表所用的項目是否
正確,資料是否準確。
 3. 信度與效度:在此以打靶說明信度與效度的關係,
效度是目標要命中靶心,而信度則是每次打的子彈都
很集中,如下圖:

45

效度分析─收斂效度之操作與說明

46

23
2014/7/30

效度分析─收斂效度之操作與說明

47

效度分析─收斂效度之操作與說明

48

24
2014/7/30

效度分析─收斂效度之操作與範例

49

 此檢定為檢定資料是否適合因素分析,由上表得知KMO=0.806,
Bartlett’s test Chi-sq =515.02,p-value<0.001,代表適合進行因素分析!

 由上表得知,在以Principal components的方法及eigenvalue大於1的原則萃
取下進行因素分析,共萃取出兩個因素,累積解釋變異量達48.57%。
50

25
2014/7/30

由Output可得知,第六個問項在因素1中之負荷量小於0.5,
不具收斂效度,且在因素2中之負荷量亦達到0.374,因此
得知此問項不具備區別效度。故建議將此問項刪除,使測
量分成兩個具備建構效度的構面。
51

效度分析─區別效度之操作與說明
 使用下列資料研究一般消費者對迪士尼商品購買意願
是否受商品定位、防偽標籤因素影響(資料來源:
蔡滋彬,成功大學EMBA碩士論文,2014),運用
AMOS18.0來執行區別效度分析。此問卷共有348份,
各構面下共同因素的相關係數資料如下:
rowtype_ varname_ 重要性 信任感 可靠性 流行設計 溫馨獨特 購買意願
n 348 348 348 348 348 348
corr 重要性 1.000
corr 信任感 0.642 1.000
corr 可靠性 0.763 0.615 1.000
corr 流行設計 0.522 0.471 0.530 1.000
corr 溫馨獨特 0.378 0.602 0.391 0.589 1.000
corr 購買意願 0.440 0.547 0.491 0.657 0.631 1.000
stddev 0.80 1.09 0.97 0.84 1.13 0.95
mean 4.87 3.81 4.85 4.53 3.52 3.96
52

52

26
2014/7/30

效度分析─區別效度之操作與說明
1. 啟動Amos 18.0,並使用

路徑圖繪製如右圖。
2. 點擊 輸入分析資料,
「File Name」選擇 SEM.sav
(SPSS存檔)。
3. 點擊 選擇可觀測變數
拖曳到路徑圖方框中,拖
曳「可靠性」、「重要
性」、「信任感」…等至
方框中。

53

53

效度分析─區別效度之操作與說明
4. 於○按右鍵選「Object Properties」,於「Text」裡的
「Variable name」裡輸入潛在變數「防偽標籤」和「商品定
位」變數名稱及測量誤差「e1」…「e7」,結果如上一頁右
圖。
5. 點擊 後在空白處點一下,並選擇Figure Caption,出現對
話框,在Caption空白處 輸入下列文字:
\FORMAT
群組=\GROUP
卡方值=\CMIN(p值=\P);自由度=\DF
AGFI=\AGFI;GFI=\GFI;
RMSEA=\RMSEA; CN=\HFIVE

54

54

27
2014/7/30

效度分析─區別效度之操作與說明

6. 點擊 ,在output處勾選Standardized estimates、Squared
multiple correlations或全選。

7. 點擊 執行。執行完後按左邊的「Standardized estimates」
及 紅色箭頭,即可得標準化的各路徑

係數及其各個模式適合度的衡量指標值。

55

55

效度分析─區別效度之操作與說明
8.至此得到的結果如右圖
由執行結果來看,卡方值越大
表示模型不適合,卡方值定義
為 2
χ   n  1 F0 ~ χ k
2

其中k為自由度。
p值定義為 2
P χk  χ 2 
RMSEA值小於0.08或RMR值小
於0.05時,表示模式擬合不錯。
GFI值或AGFI一般要求要超過
56
0.9 ,表示模式擬合不錯。
56

28
2014/7/30

效度分析─區別效度之操作與說明
9. 可按 開啟報表視窗,選取Estimates (→Scalars→
Standardized Regression Weights)可見看路徑係數。
Regression Weights: (Group number 1 - Default model)

Estimate S.E. Standardized C.R. P Label


Estimate
防偽標籤 <--- 商品定位 .873 .080 0.706 10.945 *** par_6
流行設計 <--- 商品定位 1.000 0.805
購買意願 <--- 防偽標籤 -.116 .095 -0.102 -1.220 .222 par_1
購買意願 <--- 商品定位 1.268 .144 0.905 8.832 *** par_2
信任感 <--- 防偽標籤 .984 .062 0.745 15.862 *** par_3
溫馨獨特 <--- 商品定位 1.196 .089 0.72 13.434 *** par_4
可靠性 <--- 防偽標籤 1.000 0.862
重要性 <--- 防偽標籤 .844 .045 0.882 18.831 *** par_5
57

57

效度分析─區別效度之操作與說明
選取Model Fit,可看到各種模式評估指標,以下介紹幾個常
用的指標:
 GFI (Goodness of Fit Index)

GFI為最常用來當作適合度的指標,定義為


tr ˆ 1 θ  S  I 
2

GFI  1 

tr ˆ 1 θ  S 
2

其中 ˆ θ  是擬合或再製矩陣,S為樣本變異數矩陣,tr(A)
表矩陣A的跡(Trace)。
GFI的分配未知,所以無法執行統計的檢定工作,通常以
GFI接近1時,表示模式擬合不錯。 58

58

29
2014/7/30

效度分析─區別效度之操作與說明
 AGFI(Adjusted Goodness of Fit Index)對於經自由
度調整後的GFI值,定義為
r  r  1
AGFI  1  1  GFI 
2k
與GFI越接近1時,表示模式擬合越好。
 AIC (Akaike Information Criterion)定義為

AIC   n  1 F0  2t  χ 2  2t
其值越小表模式擬合越好。
 RMR (Root Mean Square Residual)定義如下

 r r  sij  σˆ ij 2 
12

RMR   2  
i 1 j 1 r  r  1
 
RMR是測量殘差的平均數,當RMR小於0.05時可說模式擬
合不錯。 59

效度分析─區別效度之操作與說明
10. 若模型表現不佳需校正,可利用修正指標(Modification Index)來幫忙,
點選 選擇Output分頁,勾選「Modification Indices」並檢視報表 ,可
看見左邊欄位多了Modification Indices,發現如下
Modification Indices (Group number 1 - Default model)
Covariances: (Group number 1 - Default model)

M.I. Par Change


e3 <--> 商品定位 8.865 0.089
e3 <--> e6 12.976 -0.1
e3 <--> e5 50.934 0.247
e2 <--> e6 4.437 0.036
e2 <--> e5 9.971 -0.069
e1 <--> e5 11.159 -0.09
e1 <--> e3 4.917 -0.053
e7 <--> e3 5.123 0.061
e7 <--> e2 5.597 -0.04
e4 <--> e3 12.154 -0.084
e4 <--> e2 5.045 0.034

由上面可知,由於e3<-->e5是雙向的箭頭,建議將模式增加這兩者間的共變
異路徑,經過使用 加上兩條共變異路徑後,重複執行步驟7,得到結
60
果於下頁。

60

30
2014/7/30

效度分析─區別效度之操作與說明
 卡方值明顯的變小,
使得p值大過0.01,
RMSEA小於0.08,
GFI維持在0.9以上,
可說此模式擬合尚可。

61

61

參考資料
 Anderson, J., & Gerbing, D. (1988). Structural equation
modeling in practice: A review and recommended two-step
approach. Psychological bulletin, 103(3), 411-423.
 Fornell, C., & Larcker, D. (1981). Evaluating structural
equation models with unobservable variables and
measurement error. Journal of marketing research, 18, 39-
50.
 Hair, J. F., Black, W. C., Babin, B. J., Anderson, R. E., &
Tatham, R. L. (2006). Multivariate data analysis (6th ed.).
New Jersey : Prentice-Hall.
 Joreskog, K., & Sorbom, D. (1989). LISREL 7: A guide to
the program and applications: SSI.
 陳順宇 (2005), 多變量分析, 第四版, 華泰文化.
 關秉寅, 社會研究方法: 信度與效度.
 http://www3.nccu.edu.tw/~soci1005/Reliability%20and%20Validity.doc

 網址 http://tw.myblog.yahoo.com/da_sanlin/article?mid=2587
62

62

31

You might also like