You are on page 1of 22

鍾素香

《 測 驗 鄭英耀
學 刊 》 王佳琪 「閱讀理解篩選測驗」的再驗證和應用
第六十二輯第三期 2015 年 9 月 209~230 頁

「閱讀理解篩選測驗」的再驗證和應用

鍾素香 1 鄭英耀 2 王佳琪 3

摘要
本研究以 Rasch 分析重新檢驗「國民小學二年級閱讀理解測驗(A)」(柯華
葳、詹益綾,2007)的信、效度,並探討其應用結果。研究對象來自北、中、南、
東四區隨機選取的 882 名國小二年級學童。此閱讀理解篩選測驗分為句子理解 7
題、命題組合 5 題、短文理解 7 題,共 19 題單選題。結果顯示,符合命題組合、句
子理解與短文理解三向度結構模式,亦即模式與資料間有良好的吻合度,而且並無
性別上的差異試題功能(DIF),但在句子理解和命題組合向度各有一題具有地區
性的 DIF。該測驗的題目難度偏低且分配較集中,受試者能力明顯高於試題難度。
進一步分析測驗應用結果發現,有 15.1%的受試學童可能有閱讀理解困難。本研究
亦針對測驗的應用提出建議。

關鍵詞:Rasch 分析、閱讀理解、閱讀理解篩選測驗

1. 鍾素香,國立中山大學教育研究所暨師資培育中心兼任助理教授
2. 鄭英耀,國立中山大學教育研究所特聘教授
3. 王佳琪,國立中山大學師資培育中心兼任助理教授
收件日期:2014.09.16;完成修改:2015.08.20;正式接受:2015.09.17
通訊作者:王佳琪;Email:wcc0805@gmail.com
地址:高雄市鼓山區蓮海路 70 號 國立中山大學師資培育中心

- 209 -
測驗學刊,第 62 輯第 3 期
Psychological Testing
September 2015, Vol.62 No.3, pp.209-230

Validation and Application of the Reading


Comprehension Screen Test

Su-Hsiang Chung1 Ying-Yao Cheng2 Chia-Chi Wang3

Abstract
This study aimed to validate “the Reading Comprehension Test for Second Graders
(A)” (Ko & Chan, 2007) using Rasch analysis and to explore the application results. A
total of 882 second graders from four geographic areas in Taiwan completed this test.
The Reading Comprehension Screen Test consisted of 19 multiple-choice questions in-
cluding 7 questions on sentence comprehension, 5 questions on naming task, and 7
questions on passage comprehension. The results revealed that the three dimensions of
the Reading Comprehension Screen Test showed good model-data fit, and no gender
DIF was found. However, regional DIF was shown respectively in one question on the
sentence comprehension and on the naming task. The data manifested that the difficulty
of the test questions was relatively low and skew as the ability of the participants was
remarkably higher than the level of the test questions. There were 15.1% of participants
at risk of reading comprehension difficulty. Furthermore, concerns related to the use of
the test were discussed.

Keywords: reading comprehension, Reading Comprehension Screen Test, Rasch analysis

1. Su-Hsiang Chung, Adjunct Assistant Professor, Institute of Education & Center for Tea-
cher Education, National Sun Yat-sen University
2. Ying-Yao Cheng, Distinguished Professor, Institute of Education, National Sun Yat-sen
University
3. Chia-Chi Wang, Adjunct Assistant Professor, Center for Teacher Education, National Sun
Yat-sen University
Received: 2014.09.16; Revised: 2015.08.20; Accepted: 2015.09.17
Corresponding Author: Chia-Chi Wang; Email: wcc0805@gmail.com
Address: No.70, Lianhai Rd., Gushan Dist., Kaohsiung City 804, Taiwan
Center for Teacher Education, National Sun Yat-sen University

- 210 -
鍾素香 鄭英耀 王佳琪 「閱讀理解篩選測驗」的再驗證和應用

壹、前言
近年來,各國對閱讀的重視日益增加,擁有了閱讀力就如同掌握了進入
競爭力的門票,故有愈來愈多的國家參與國際性的閱讀素養評估計畫,藉由
了解學童的閱讀水準,來預測其未來的公民是否具有國際競爭力。由國際教
育成就評鑑協會(International Association for Evaluation of Educational Achie-
vement)所主導的「促進國際閱讀素養研究」(Progress in International Read-
ing Literacy Study,簡稱 PIRLS),將閱讀素養定義為學生能理解並運用書寫
語言的能力,並採用故事體和說明文文章來檢測國小四年級學童的(1)直接理
解歷程:提取訊息及推論分析,以及(2)詮釋理解歷程:詮釋整合及比較評估
能力(柯華葳、詹益綾、張建妤、游婷雅,2009)。另外,由國際經濟合作
發展組織(Organization for Economic Cooperation Development,簡稱 OECD)
所發展的「國際學生能力評量計畫」(Programme for International Student As-
sessment,簡稱 PISA)強調,15 歲學生能運用閱讀以進行學習、溝通和問題
解決的能力。在其所評量的閱讀認知面向,重點在於評量學生對文本所進行
的認知運作,包含對來自文本訊息的「擷取與檢索」、「理解與解釋」,以
及連結外在的知識做「省思與評鑑」三個類別(臺灣 PISA 國家研究中心,
2010)。不論是 PIRLS 或 PISA,均強調閱讀的重要性。
閱 讀 涉 及 一 連 串 複 雜 的 心 理 歷 程,因 此 有 各 種 不 同 的 立 論,例 如:
Aaron 與 Joshi(1992)認為,閱讀理解除了書面文字的理解外,應該同時涵
蓋聽覺理解。因為閱讀的管道除了從看書面資料外,包含從聽覺接收的訊
息,因此結果同時涉及閱讀理解與聽覺理解。然而,大部分的閱讀理論聚焦
在書面文字的理解,而且認同閱讀理解技能是有層次性的,例如:Gagné、
Yekovich 與 Yekovich(1993)指出,閱讀理解包括文義理解、推論理解及理
解監控三個層次。文義理解是經由字彙接觸或語法分析中得到書寫文字的意
義;推論理解則是透過統整、精緻化與摘要歷程,使讀者對閱讀內容有更深
入和廣泛的了解;理解監控為最高層次的閱讀理解,個體能監控自己的閱讀
歷程,依據閱讀目標選擇適當的策略以達到成效,並能對內容做賞析和評
鑑。Swaby(1989)將閱讀理解視為一種技能,讀者依據所獲得的技能而達
到從字義理解、推論理解與評鑑理解,最終達到批判理解的不同閱讀理解層
次。學習閱讀不僅止於文字或字面意義的了解,唯有達到理解層次,尤其是
理解監控層次,才能最大化閱讀的目的。

- 211 -
測驗學刊,第 62 輯第 3 期

閱讀力的養成非一蹴而得,學童學習如何閱讀的能力養成是國小低年級
教育階段的重要目標(Chall, 1983)。但是影響閱讀力發展的因素多元且複
雜,因此除了致力於學童閱讀能力的培養,同時亟須早期發現閱讀能力落後
學童,方能及時給予各項資源而將其能力帶上來。綜觀我國四年級學童參加
PIRLS 2006 結果顯示,有 13%學童的閱讀分數位於最低指標及 3%學童未能
達到最低指標(柯華葳等人,2009);15 歲學童參加 PISA 2009 結果顯示,
有高達 15.6%學童的閱讀素養未達水準 2,顯示這些學生未具備辨識文本大
意、了解關係,以及在訊息不明顯時能做低層次推論的能力(臺灣 PISA 國
家研究中心,2010)。有鑑於我國未具備基礎閱讀能力學童的比率雖然低於
PIRLS 2006 及 PISA 2009 的平均值,但是相較於同樣以中文測試的其他國
家,臺灣學童的表現相對落後許多。陳昭珍(2011)指出,個體若不能在小
學三年級前具備基本的閱讀能力,將影響其未來生活及成就;Burgoyne、
Whiteley 與 Hutchinson(2011)主張,學童一進入小學就需要開始持續評估
其閱讀能力,發現可能有閱讀困難的學生就應立即提供補救措施。綜合上
述,「閱讀理解篩選測驗」的重要性不言而喻;而且,確定測驗的品質相形
重要,以免人力不當投入,更甚者出現誤判,影響到及時協助提升學童閱讀
能力的時機。
近年來,我國積極參與國際閱讀理解素養研究,卻沒有建置自己的全國
性閱讀理解能力研究方案。「國民小學及國民中學補救教學實施方案」和
「臺灣學生學習成就評量資料庫」(國家教育研究院,2014)雖然將一般國
語文學科能力納入評量科目,但是閱讀理解只是測驗的其中一小部分。「國
民小學及國民中學補救教學實施方案」的對象雖然為全國國中小的學童,但
是必須為單一學科成績為該班級或年級後 35%者,並須由教師提出申請再加
入攜手計畫名單的學生方得以參加篩選測驗(教育部,2014)。顯見,國內
對閱讀理解評估方案的廣度和深度亟待加強。
國內針對閱讀理解能力所編製的測驗,其施測對象主要以國小學童為
主,而且依據測驗發展目的和理念,所檢測的閱讀成分和歷程不盡相同,例
如:柯華葳(1999)所編製的「閱讀理解困難篩選測驗」,是在評估學童抽
取字義、概念、代名詞和句意理解能力;「中文閱讀理解測驗」(林寶貴、
錡寶香,2002),是在檢測受試者在音韻處理、語法、語意、理解文章基本
事實、摘要重點大意、推論、比較分析等能力;陳美芳(2003)編製的「語
文理解能力測驗」,係透過測驗內容以書面或聽力呈現的方式,評估及比較受

- 212 -
鍾素香 鄭英耀 王佳琪 「閱讀理解篩選測驗」的再驗證和應用

試者閱讀理解與聽覺理解能力表現;張世彗、楊坤堂(2005)編製的「國小一
年級閱讀理解測驗」,是在檢測學童的字詞釋義、命題組合、句子理解與短文
閱讀能力;王木榮、董宜俐(2006)發展的「國小學童中文閱讀理解測驗」,
是在評量國小六年級學童在字意理解、文本理解、推論理解、摘要及佈題五
個閱讀次能力的發展;柯華葳、詹益綾(2007)將柯華葳(1999)的「閱讀理
解困難篩選測驗」,以相同的構念重新編製為「國民小學(二至六年級)閱
讀理解篩選測驗」,作為篩選可能有閱讀理解困難學童的工具;林怡君、張
麗麗、陸怡琮(2013)所發展的閱讀理解測驗,是以國小高年級學童為施測
對象,是在檢測學童的尋找和回憶、整合和解釋,以及批判和評鑑能力。
在上述測驗中,除了林怡君等人(2013)發展的測驗外,皆以傳統測驗
理論(Classical Test Theory, CTT)編製而成,通常用答對率來表示測驗難
度,用得分來表示受試者能力,因此題目答對率會受到受試者能力的影響;
同理,題目的難度也會影響受試者得分。換言之,分數受到能力和題目難度
間的彼此干擾,例如:同一受試者,當測驗題目偏難時,受試者得分較低;
題目偏易時,得分較高;或是同一測驗,受試者能力高時,試題答對率高;
受試者能力低時,試題答對率低。因此,以 CTT 編製的測驗在解釋和比較受
試者之潛在特質上可能有其限制(王文中,2004;Wright, Linacre, Gustafson,
& Martin-Lof, 1994)。近年來,試題反應理論的 Rasch 測量模式(Rasch,
1960/1980)可以檢驗測驗的資料,如果測驗資料吻合 Rasch 模式的預期,該
測驗就具有試題獨立、樣本獨立及客觀等距量尺的特性。換句話說,若是資
料適配於模式,則試題特性的估計不會受到樣本特性的影響;反之,樣本特
性的估計不會受到試題特性的影響,可提供試題難度階層的分布,並解決樣
本依賴及測驗依賴的困境(Rasch, 1960/1980)。
柯華葳、詹益綾(2007)編製的「國民小學(二至六年級)閱讀理解篩
選測驗」,每個年級皆有題本,為適用於國小二至六年級的篩選工具,亦是
國內用於閱讀理解障礙的診斷工具。學童的學習廣泛需要閱讀理解技能,然
而部分學童有閱讀理解困難,但是正常的識字能力,讓他們的困難被忽略。
此「閱讀理解篩選測驗」施測對象從國小二年級開始,可以早期發現閱讀理
解困難學童,及早給予協助。綜此,本研究以「國民小學(二至六年級)閱
讀理解篩選測驗」中的二年級測驗為研究工具,測驗的品質關係到所篩選出
的個案是否為需要協助的對象,因此本研究試圖以 Rasch 分析「國民小學二
年級閱讀理解測驗(A)」(柯華葳、詹益綾,2007)是否為具客觀及等距

- 213 -
測驗學刊,第 62 輯第 3 期

特性的測驗工具。本研究的研究目的有兩項:(1)以 Rasch 二分題模式分析


「國民小學二年級閱讀理解測驗(A)」,驗證該量表的品質,並提供多元
的效度證據;(2)探討「國民小學二年級閱讀理解測驗(A)」的應用結果。

貳、研究方法

一、研究對象
本研究以全國公立國民小學二年級學童為母群體,依北、中、南、東四
區先隨機各抽取兩個縣市,各縣市再隨機抽取五個行政區域/鄉鎮中的各一
所學校之一個班級為研究對象。研究工具「國民小學二年級閱讀理解測驗
(A)」以郵寄方式請班導師依據施測說明對當日出席的學童進行施測,期
間為 2013 年 11 月。回收測驗共 918 份,剔除漏答整頁的無效測驗,可用率
為 96%。共有來自全國 40 個班級的 882 位學童參與此研究,其中北、中、
南、東四區人數及百分比,依序為 230 人(26.08%)、231 人(26.19%)、
223 人(25.28%)、198 人(22.45%);男童為 470 人(53.29%)、女童為
412 人(46.71%)。

二、研究工具
柯華葳、詹益綾(2007)編製的「國民小學(二至六年級)閱讀理解篩
選測驗」,每個年級有 A、B 卷兩份試題,二年級 A 卷的信度約 .80、B 卷的
信度僅約 .70;各縣市做閱讀理解及學習障礙鑑定時是以 A 卷為主,因此本
研究採用的是信度較佳的 A 版本「國民小學二年級閱讀理解測驗(A)」
(以下簡稱為「閱讀理解測驗」)為研究工具。該測驗共有 19 題單選題,其
中命題組合 5 題、句子理解 7 題,以及短文理解 7 題,每題答對一分。命題
組合題採用題目中已出現過的人、事、物對應代名詞,透過由上下文抽取字
意,來檢測受試者是否具備形成命題與整合命題的能力;句子理解題為以句
子為主的句意理解;若句子數達兩句以上,以文為題幹的理解題則屬短文理
解題,能檢測受試者是否能從文中做推論的能力。常模分為全國與花東地
區,內部一致性 Cronbach’s 及再測信度約為 .80。此「閱讀理解測驗」與洪
儷瑜、王瓊珠、張郁雯、陳秀芬、陳慶順(2007a,2007b)編製的小二「識
字量評估測驗」相關達 .63,而與小二「常見字流暢性測驗」相關達 .48。

- 214 -
鍾素香 鄭英耀 王佳琪 「閱讀理解篩選測驗」的再驗證和應用

三、資料分析
在量表信、效度檢驗部分,因「閱讀理解測驗」的作答選項為二元計分
(答對/答錯),再加上「閱讀理解測驗」由三個向度所組成,因此本研究
採多向度 Rasch 測量模式(Adams, Wilson, & Wang, 1997)進行分析,並根據
Wolfe 與 Smith(2007)所提出的 Rasch 觀點之效度理論,分析學童在「閱讀
理 解 測 驗」的 作 答 資 料,從 多 元 的 面 向 提 供 各 種 效 度 證 據,包 括:內 容
(content)、結 構(structural)、類 推(generalizability)、本 質(substan-
tive),以及解釋(interpretability)等。
在內容效度上,本研究重新檢視「閱讀理解測驗」的核心概念及命題陳
述撰寫,檢視命題陳述是否符合閱讀理解的構念。在結構效度上,以多向度
Rasch 二分題模式針對命題組合、句子理解和短文理解三個向度,進行模式
資料適配度(model-data fit)分析,以檢核測驗構念的向度。適配度指標採
用 infit 及 outfit 均方誤(mean square error, MNSQ)統計量,若數值介於
0.75~1.33,表示模式資料適配度良好(Wilson, 2004)。
由於測驗試題不應該因為受試群體的不同而有差異(Holland & Wainer,
1993),因此在類推效度證據上,進行性別及地區的差異試題功能(differ-
ential item functioning, DIF)分析,以了解每一個試題對於性別(男、女童)
以及不同地區(北、中、南、東)是否具有相同的意涵。此 DIF 分析以 Con-
Quest 軟體進行分析,主要以相等平均難度法(equal-mean-difficulty, EMD)
來檢測試題的 DIF。若某一個試題的整體難度估計值差距未達 0.5 個 logit 時,
即表示兩個群體間對此題的認知沒有差異(Wang, 2008)。其次,以多向度
Rasch 分 析,探 討 三 向 度 的 彼 此 相 關 和 信 度 估 計 值(Cheng, Wang, & Ho,
2009)。在本質與解釋效度證據上,透過受試者的閱讀理解程度與題目難度
的對照圖,檢視試題難度分布及受試者能力對應的情形。
本研究工具「閱讀理解測驗」於編製時的第一次抽樣只抽到北、中、南區
學校,因此另外對花東學校進行第二次抽樣,並將第一次抽樣樣本稱為「全國
樣本」,第二次抽樣樣本稱為 「花東樣本」。又因全國樣本與花東樣本的分數
有顯著差異,故取全國常模的切截分數為 10 分,花東地區則為 8 分。本研究
「閱讀理解測驗」的應用結果,北、中、南區樣本以 10 分為切截點,東區樣
本採 8 分為切截點,進行敘述性統計及單因子變異數分析。測驗分數若低於
切截點,則顯示學童可能有閱讀理解困難,需要再進一步檢測確認。

- 215 -
測驗學刊,第 62 輯第 3 期

參、研究結果與討論

一、效度分析結果

(一)內容和結構效度證據
本研究以具學習障礙的特殊教育專長之專家觀點,重新檢視「閱讀理解
測驗」的試題與原先三個向度的定義構念是否吻合;再者,構念向度以多向
度 Rasch 分析,採用的適配度指標為 infit 及 outfit MNSQ 統計量,所有題目數
值介於 0.87~1.16 之間(如表 1 所示),介於 0.75~1.33 為合理範圍內(Wil-
son, 2004),顯示閱讀理解所蒐集到的資料符合命題組合、句子理解與短文
理解三向度結構模式,亦即模式與資料間有良好的吻合度。

表1 試題難度估計值、適配度數值和 DIF 檢測值


outfit infit DIF= 北部 中部 南部 東部
向度 題號 難度 SE
MNSQ MNSQ △男女 難度 難度 難度 難度
句子理解 1 -0.18 0.06 1.08 1.06 0.24 0.14 -0.01 -0.03 -0.11
2 0.09 0.06 1.02 1.02 0.22 -0.08 -0.13 0.07 0.14
3 0.75 0.05 1.07 1.05 0.04 -0.09 0.28 -0.05 -0.15
4 -0.60 0.06 0.87 0.93 0.14 -0.05 0.13 -0.04 -0.05
5 -0.81 0.06 0.90 0.95 0.34 -0.21 -0.16 -0.10 0.47
6 0.46 0.05 1.11 1.07 0.42 0.27 -0.24 0.14 -0.17
7 0.30 0.12 0.96 0.98 0.08 0.01 0.12 0.01 -0.14
命題組合 8 0.04 0.06 1.04 1.03 0.02 0.24 0.14 -0.15 -0.23
9 -0.03 0.06 1.01 1.01 0.22 0.17 -0.20 0.14 -0.11
10 0.00 0.06 0.93 0.97 0.03 0.08 0.04 -0.28 0.16
11 0.42 0.06 1.04 1.03 0.31 -0.18 0.27 0.11 -0.20
12 0.43 0.12 1.08 0.99 0.04 -0.30 -0.24 0.17 0.38
短文理解 13 -0.46 0.06 0.96 0.99 0.13 0.30 0.02 -0.09 -0.23
14 0.13 0.06 1.06 1.05 0.04 -0.08 0.25 -0.14 -0.02
15 -0.44 0.06 1.02 1.02 0.35 -0.09 -0.11 0.01 0.19
16 -0.28 0.06 1.16 1.09 0.38 -0.11 -0.10 0.12 0.09
17 -0.11 0.06 0.89 0.95 0.07 0.14 -0.17 -0.12 0.15
18 0.32 0.06 0.98 1.00 0.11 -0.14 0.05 0.15 -0.07
19 0.85 0.14 1.05 1.03 0.02 -0.02 0.06 0.07 -0.11
註:1. DIF=△男女 = |男難度 女難度|。
2. 粗體表示具備 DIF 題之難度估計值的最大值及最小值,若|最大值-最小值|大於 0.5
logit,表示該題具有 DIF。

- 216 -
鍾素香 鄭英耀 王佳琪 「閱讀理解篩選測驗」的再驗證和應用

(二)類推效度證據
多向度 Rasch 分析結果顯示,命題組合、句子理解和短文理解三向度的
受試者分離信度(person separation reliability)依序為 .65、.63 與 .68。經由多
向度 Rasch 分析所得到的信度值,主要是指這份測驗是否能有效區分高低能
力的受試者,低於 .80 的值表示此份測驗無法區分高低能力受試者。基於
此,本研究所採用的測驗立意為篩選出閱讀理解能力困難的學童,表示此測
驗的題目需要進一步修改及增加。句子理解與命題組合的相關係數為 .77,
句子理解與短文理解的相關係數為 .78,命題組合與短文理解的相關係數為 .
75。再者,Rasch 分析亦可得到整體信度指標,其整體信度為 .76。Carmines
與 Zeller(1979)指出,一份教育測驗至少應該具有 .80 以上的信度係數值,
才具有使用的價值。余民寧(2011)則認為,篩選測驗試題一般而言趨於簡
單,因此多數學生的得分會集中在高分區域,容易造成受試樣本的測驗分數
偏異程度變小,因而造成信度係數值偏低。本研究採用的「閱讀理解測驗」
為篩選測驗,為有利於挑出能力不佳的學童,所以試題設計的難度低,可能
如同余民寧所言,造成分測驗信度稍微偏低的情況。另外,每個向度的題數
過少,也可能是內部一致性信度偏低的原因之一。
檢測題目是否具有性別及地區的 DIF,可以比較相同能力的學生在題目
上的答對機率是否相同,亦即可以檢測試題對於不同性別及地區是否有不同
的意涵,此亦為檢測試題品質指標之一。DIF 分析結果顯示(如表 1 所
示),題目的難度估計值在性別上的差距介於 0.02~0.42 個 logit,均在 0.5 個
logit 以下,表示測驗題目不因學童性別不同而有不同的意涵。另一方面,多
數測驗試題在不同地區的難度估計值之最大值與最小值之間的差距均在 0.5
個 logit 以下,唯有在句子理解向度的題 5 和命題組合向度的題 12 之題目難度
估計值,出現東部高於其他地區,特別是與北部地區有明顯的差距,表示此
兩題是不利於東部學童的,推測可能是東部和其他地區學童對於題目描述的
概念理解不同所致。

(三)解釋效度證據
學童於閱讀理解向度的能力分布以及題目的難度分布,如圖 1 所示,單
位是 logit;虛線左邊的「X」表示學童的能力分布,愈上面的受試者其閱讀
理解能力愈高;虛線右邊的數字為「閱讀理解測驗」各向度的題目,愈上面

- 217 -
測驗學刊,第 62 輯第 3 期

的題目愈難作答。

閱讀理解向度 句子理解 命題組合 短文理解


------------------------------------------------------------
logits 學童 題目 學童 題目 學童 題目
------------------------------------------------------------
4 | X| |
| X| X|
| X| XX|
X| X| X|
X| XX| X|
X| XX| X|
3 X| XXX| XX|
XX| XXX| XXXX|
XX| XXX| XXX|
XXX| XXX| XXXX|
XXXXX| XXXXX| XXXXX|
XXXX| XXXXXX| XXXXXX|
XXXXXX| XXXXXX| XXXXXX|
2 XXXXXXXX| XXXXXX| XXXXXX|
XXXXXXXXX| XXXXXXXXXX| XXXXXXX|
XXXXXXXXXXX| XXXXXX| XXXXXXXXX|
XXXXXXXXXX| XXXXXXXX| XXXXXXX|
XXXXXXXXXXXXX| XXXXXXXXXX| XXXXXXXXXX|
XXXXXXXXXXX| XXXXXXXXX| XXXXXXXXX|
1 XXXXXXXXXXXX| XXXXXXXXXX| XXXXXXXX|
XXXXXXXXXX| XXXXXXXXXX| XXXXXXXXX|19
XXXXXXXXX|3 XXXXXXXX| XXXXXXXX|
XXXXXXXXXXX|6 XXXXXXXX| XXXXXXXXXX|
XXXXXXX|7 XXXXXX|11 XXXXXXX|18
XXXXXXXX| XXXXXXXXX| XXXXXXX|14
0 XXXXXX|2 XXXXXX|8 9 10 XXXXXX|
XXXX|1 XXXXXXX| XXXXX|17
XXXX| XXXXX| XXXXXXX|16
XXX| XXX|12 XXXXX|13 15
XXX|4 XXX| XXXX|
XX|5 XXX| XX|
-1 X| XXX| XX|
X| XX| XX|
X| X| XX|
| | X|
| X| X|
| X| |
| | |
-2 | X| |

註:每個 X 代表 5.2 個受試者,低於 5.2 則未顯示出。


圖1 學童於閱讀理解向度的能力分布與題目難度分布之對照圖

- 218 -
鍾素香 鄭英耀 王佳琪 「閱讀理解篩選測驗」的再驗證和應用

由圖 1 可知,所有題目的平均難度介於 1~1 個 logit,其中題 2、8、9、


10 的難度 logit 為 0 或趨近 0,有八題(1、4、5、12、13、15、16、17)的
logit 介於 -1~0 之間,其餘七題 logit 介於 0~1 之間。大多數的受試者能力在
最難試題的 logit 之上,顯示多數受試者的能力高於題目的難度。

(四)本質效度證據
學童在閱讀理解三個向度上的能力分布遠較試題難度的分布來得分散,
表示各向度的試題僅能區分部分學生;而且學生的平均能力遠高於題目的平
均難度,表示題目趨於簡單。統計結果顯示,學童在句子理解的能力分布
(M = 1.09,SD = 0.77)高於題目的難度分布(M = 0,SD = 0.57);命題組
合的能力分布(M = 1.08,SD = 0.93)高於題目的難度分布(M = 0,SD =
0.30);短文理解的能力分布(M = 1.07,SD = 0.99)高於題目的難度分布
(M = 0,SD = 0.47)。
檢視閱讀理解三個向度的個別試題難度(如表 1 所示)發現,試題的難
度分布介在 -.81~.85 個 logit 間。圖 1 中難度估計值最低的題 5,有 98.2%的
學童傾向答對;而難度估計值最高的題 19,只有 54.1%的學童傾向答對。句
子理解的題目難度 logit 值介於 -.81~.75 間,難度差異值最大,有測驗中最簡
單和難度次高的題目;命題組合 logit 值介於 -.03~.43 間,難度差異值最小;
短文理解 logit 值介於 -.46~.85 間。雖然各向度間有些許差異,但整體而言,
這份量表的題目難度偏低且分布較集中。然而,篩選測驗的目的在於找出閱
讀理解表現欠佳的個案,以作進一步的檢測或施予補救教學,因此題目的難
度很低是可接受的(王文中,2004)。
計算受試者能力在個別試題難度的受試者人數發現(如圖 1 所示),有
64.7%的學童傾向能答對所有句子理解的題目;有 70.5%的學童傾向能答對所
有命題組合的題目;有 54.1%的學童傾向能答對所有短文理解的題目。其
次,除了句子理解的題 3、6,命題組合的題 11,以及短文理解的題 14、18、
19,其傾向答對題目的人數未達 75%外,其餘 13 個試題皆有超過 75%學童的
能力傾向能答對那些試題。由上述結果得知,命題組合的試題難度最低,短
文理解的難度最高。

- 219 -
測驗學刊,第 62 輯第 3 期

二、「閱讀理解測驗」的應用結果
Rasch 分析結果支持「閱讀理解測驗」具等距及客觀的特性,因此以測
驗的統計結果來說明受試者間的差異是合適的;再者,在 Rasch 模式裡,原
始總分是 的充分統計量(sufficient statistic)。換言之,原始總分和 是一對
一的對應關係:原始總分相同, 的估計值就相同;原始總分愈高, 的估計
值 就 愈 高(王 文 中,2004)。據 此,為 將 統 計 數 據 與 柯 華 葳、詹 益 綾
(2007)的研究結果做比較與討論,本研究忽略原始分數會因些許 DIF 題疑
慮的影響,而直接以原始總分作進一步的分析以了解其應用結果。

(一)各地區「閱讀理解測驗」的分數及差異
各地區「閱讀理解測驗」得分的描述性統計如表 2 所示。結果顯示,北
區在所有的向度和測驗總分平均數皆高於整體(M = 13.29,SD = 3.72)及其
他地區。測驗總分依高低順序為北區(M = 14.19,SD = 3.57)、東區(M =
13.09,SD = 3.92)、南區(M = 12.96,SD = 3.54),以及中區(M = 12.89,
SD = 3.74)。柯華葳、詹益綾(2007)的研究結果顯示,學童的測驗平均分
數為:整體(M = 12.61,SD = 4.23)、南區(M = 14.06,SD = 3.78)、北區
(M = 13.97,SD = 3.67)、中區(M = 12.06,SD = 4.24),以及花東地區
(M = 11.41,SD = 4.35)。比較柯華葳、詹益綾與本研究各地區學童平均得
分的高低順序,發現其排序截然不同。尤其是從數據來看,柯華葳、詹益綾
研究中的花東地區學童測驗分數顯著低於其他地區,但是本研究中的東區學
童表現,並不遜於中區和南區的學童。可惜,國內目前缺少客觀性資料來釐
清上述研究結果矛盾之處。
平均數差異考驗結果顯示,北、中、南、東四個地區在所有的閱讀理解
向度和總分皆有顯著差異(如表 3 所示),其中句子理解分析結果,F(3,
878) = 2.78,p < .05, 2
= .01(Bonferroni 事後比較結果:北>中);命題組合
分析結果,F(3, 878) = 8.08,p < .001, 2
= .03(Bonferroni 事後比較結果:
北>中、北>南、北>東);短文理解分析結果,F(3, 878) = 4.35,p = .005, 2

= .02(Bonferroni 事後比較:北>東)。而「閱讀理解測驗」總分分析結果,
F(3, 878) = 6.24,p < .001, 2
= .02(Bonferroni 事後比較結果:北>中、北>
南、北>東)。

- 220 -
鍾素香 鄭英耀 王佳琪 「閱讀理解篩選測驗」的再驗證和應用

表2 各地區「閱讀理解測驗」分數的描述性統計
句子理解 命題組合 短文理解 Total
M SD M SD M SD M SD
北(N = 230) 5.15 1.49 3.85 1.27 5.19 1.70 14.19 3.57
中(N = 231) 4.74 1.59 3.38 1.32 4.77 1.72 12.89 3.74
南(N = 223) 4.89 1.55 3.28 1.38 4.78 1.66 12.96 3.54
東(N = 198) 5.01 1.61 3.46 1.34 4.62 1.90 13.09 3.92
Total(N = 882) 4.95 1.56 3.50 1.34 4.85 1.75 13.29 3.72

表3 各地區「閱讀理解測驗」之變異數分析摘要表
SS df MS F P
組間 20.19 3 6.73 2.78 .040*
句子理解 組內 2124.30 878 2.42 Bonferroni 事後比較:
總和 2144.50 881 北 >中(p < .05)
組間 42.59 3 14.20 8.08 .000***
組內 1541.90 878 1.76 Bonferroni 事後比較:
命題組合 總和 1584.50 881 北 >中(p < .01)
北 >南(p < .001)
北 >東(p < .05)
組間 39.63 3 13.21 4.35 .005**
短文理解 組內 2669.40 878 3.04 Bonferroni 事後比較:
總和 2709.03 881 北 >東(p <.01)
組間 254.53 3 84.84 6.24 .000***
組內 11929.17 878 13.59 Bonferroni 事後比較:
Total 總和 12183.70 881 北 >中(p < .01)
北 >南(p < .01)
北 >東(p < .05)
*p < .05, **p < .01, ***p < .001

(二)各地區得分通過切截點人數及差異
各地區通過切截點學童人數百分比如表 4 所示。在所有受試學童中,有
749 名(84.9%)通過切截點,133 名(15.1%)未達切截分數。換言之,有
15.1%小二學童可能有閱讀理解困難,僅略低於臺灣小四學童在 PIRLS 2006
評比中未達基本閱讀指標的比率(16%)。這樣的數據對國內教育是一個警
訊,也讓人不免對臺灣未來主人翁的國際競爭力擔憂。因為,閱讀技能發展

- 221 -
測驗學刊,第 62 輯第 3 期

有「富者愈富、貧者愈貧」的現象,若學童在小二即出現閱讀理解能力低落
的情況,除了語文學習困難外,也會影響其他學科的學習,長期將造成他們
的知識和能力與同儕的落差愈來愈大。有 15.1%的學童在小二上學期即出現
閱讀理解能力低落現象,的確值得教育單位關注及協助,以避免這些學童出
現閱讀理解能力的馬太效應。

表4 各地區「閱讀理解測驗」分數通過切截點的描述性統計
通過人數(%) 未通過人數(%)
北(N = 230) 202(87.8%) 28(12.2%)
中(N = 231) 185(80.1%) 46(19.9%)
南(N = 223) 184(82.5%) 39(17.5%)
東(N = 198) 178(89.9%) 20(10.1%)
Total(N = 882) 749(84.9%) 133(15.1%)
註:北、中、南區切截點為 10 分,東區切截點為 8 分。

北部地區受試學童共 230 名,其中 202 名(87.8%)通過切截點,28 名


(12.2%)未 通 過 切 截 點。中 部 地 區 受 試 學 童 共 231 名,其 中 185 名
(80.1%)通過切截點,46 名(19.9%)未通過切截點。南部地區受試學童共
223 名,其中 184 名(82.5%)通過切截點,39 名(17.5%)未通過切截點。
198 名東部地區受試學童中有 178 名(89.9%)通過切截點,20 名(10.1%)
未通過切截點。結果顯示,在全國四區中通過切截點的人數百分比依序為東
區(89.9%)、北區(87.8%)、南區(82.5%)和中區(80.1%)。假若東區
採用 10 分為切截分數,可能有閱讀理解困難的學童人數將從 20 人(10.1%)
增加至 34 人(17.2%)。影響所及,整體未通過切截分數的學童人數將由
133 人(15.1%)增加至 147 人(16.7%);並且東區與其他地區通過切截點
學童比率上的差距明顯縮小。可見花東地區使用較低的切截點來設定通過標
準,對篩選是否有閱讀理解困難人數的影響不容小覷。
變異數分析結果顯示,各地區間通過切截點學童人數達顯著差異(F =
14.78,p < .001),Bonferroni 事後比較結果(F = 3.595,p < .05),顯示東部
地區通過切截點的學童人數顯著多於中部地區。

- 222 -
鍾素香 鄭英耀 王佳琪 「閱讀理解篩選測驗」的再驗證和應用

(三)閱讀理解性別差異
在性別差異方面的統計結果顯示,女童在「閱讀理解測驗」總分和所有
的閱讀理解向度平均分數皆高於男童(如表 5 所示)。整體平均分數,女童
(M = 13.76,SD = 3.59)、男童(M = 12.88,SD = 3.78);句子理解平均得
分,女童(M = 5.10,SD = 1.50)、男童(M = 4.81,SD = 1.60);命題組合
平均得分,女童(M = 3.58,SD = 1.31)、男童(M = 3.43,SD = 1.36);短
文 理 解 平 均 得 分,女 童(M = 5.08,SD = 1.67)、男 童(M = 4.64,SD =
1.80)。

表5 性別在「閱讀理解測驗」分數的描述性統計
句子理解 命題組合 短文理解 Total
M SD M SD M SD M SD
女(N = 412) 5.10 1.50 3.58 1.31 5.08 1.67 13.76 3.59
男(N = 470) 4.81 1.60 3.43 1.36 4.64 1.80 12.88 3.78
Total(N = 882) 4.95 1.56 3.50 1.34 4.85 1.75 13.29 3.72

「閱讀理解測驗」得分的單因子變異數分析結果(如表 6 所示)顯示,
有顯著的性別差異,F(1, 880) = 12.35,p < .001, 2
= .01,女童得分顯著高於
男童;句子理解女童得分顯著高於男童,F(1, 880) = 7.71,p < .01, 2
= .01;
短文理解上亦出現女童得分顯著高於男童的情形,F(1, 880) = 13.42,p <
2
.001, = .02;命題組合分數則沒有顯著性別差異,F(1, 880) = 2.92,p =
2
.088, = .00。前述結果顯示,命題組合的試題難度最低,可能是此閱讀向
度沒有出現性別差異的原因。
雖然以往的研究結果對閱讀障礙是否有性別差異莫衷一是,但是洪儷瑜
等人(2009)發現,被鑑定為閱讀障礙的學童並沒有因為是經由篩選或教師
轉介管道不同而有性別上的差異,因此洪儷瑜等人認為閱讀障礙是有性別差
異現象。雖然國內並沒有對小二學童在閱讀理解困難的性別差異報告,但是
從 101 學年度國小學習障礙男童約為女童兩倍(教育部,2013);小二低識
字量男童為女童兩倍(王瓊珠、洪儷瑜、陳秀芬,2007);2007 年臺灣學生
學習成就評量結果顯示,國小四年級女童的國語文成就顯著高於男童(曾建
銘、陳清溪,2009),以及 PIRLS 2006 和 PISA 2009 臺灣及國際的閱讀平均
成績皆呈現女童優於男童,本研究中女童表現明顯優於男童的結果與上述研

- 223 -
測驗學刊,第 62 輯第 3 期

究結果相符合。

表6 性別在「閱讀理解測驗」之變異數分析摘要表
SS df MS F P
組間 18.63 1 18.63 7.71 .006**
句子理解 組內 2125.87 880 2.42
總和 2144.50 881
組間 5.24 1 5.24 2.92 .088
命題組合 組內 1579.25 880 1.80
總和 1584.50 881
組間 40.70 1 40.70 13.42 .000***
短文理解 組內 2668.33 880 3.03
總和 2709.03 881
組間 168.64 1 168.64 12.35 .000***
Total 組內 12015.06 880 13.65
總和 12183.70 881
*p < .05, **p < .01, ***p < .001

肆、結論與建議
不同年齡學童有他們需要達到的閱讀任務,然而並不是所有的學童都能
學習到同儕具有的閱讀技能,為幫助在閱讀技能上落後甚或有障礙的學童,
我們必須有良好的工具去及早篩選與鑑定出可能有閱讀理解困難和障礙者。
因此,本研究以 Rasch 分析驗證應用於閱讀理解困難篩選和學習障礙鑑定的
「國民小學二年級閱讀理解測驗(A)」是否為好的篩選測驗,並敘述及討
論其應用結果。本研究獲致的結論和建議敘述如下。

一、Rasch 分析驗證「閱讀理解測驗」
Rasch 測量模式分析測驗的構念向度、個別試題適配度的結果顯示,
「閱讀理解測驗」具有客觀等距的特性,且支持測驗以句子理解、命題組合
和短文理解為向度;測驗信度偏低,雖然難以區分高、低閱讀理解能力者,
但符合此測驗應用於篩選閱讀理解困難者的宗旨。其次,「閱讀理解測驗」
的試題雖然沒有性別 DIF,但是此測驗的第 5 題和第 12 題的難度估計值出現

- 224 -
鍾素香 鄭英耀 王佳琪 「閱讀理解篩選測驗」的再驗證和應用

地區的 DIF,顯示該二題對於東區學童的填答上是較為不利的。再者,測驗
的試題難度和受試者能力的相對應情形欠佳,題目難度偏低且分配較集中,
受試者能力高於試題難度。

二、「閱讀理解測驗」的應用
研究發現,100 個學童中約有 15 個學童可能有閱讀理解困難。中、南、
東三個地區的測驗總分和閱讀理解三個向度得分皆無顯著差異。北區在總分
和命題組合得分顯著高於中、南、東三區;在句子理解得分顯著高於中區;
在短文理解得分顯著高於東區。東部地區通過切截點的學童比率高於北、
中、南三區,而且與中部地區達顯著差異。閱讀理解得分有顯著的性別差
異,女童的閱讀理解表現顯著優於男童。

三、「閱讀理解測驗」應用結果之建議
本研究結果顯示,有 15.1%的受試學童可能有閱讀理解困難,有鑑於閱
讀能力影響個人及國家未來的競爭力甚鉅,教育單位應積極採取系統性的閱
讀教育,以提升及補救這些學童的閱讀能力。
儘管本研究施測的時間為小二上學期期中評量後,相較於柯華葳、詹益
綾(2007)施測時間為小二下學期,本研究的受試學童在測驗平均得分更勝
一籌,而且 Rasch 分析結果亦顯示受試學童的能力遠大於試題難度,因此本
研究建議「閱讀理解測驗」可以從小二上學期期中以後開始施測。
小二學童的閱讀能力處於識字和識字流暢度發展階段,雖然識字是理解
的基礎,但是識字沒困難不必然理解沒問題。陳淑麗、洪儷瑜(2003)分析
被鑑定為學習障礙國中學生各項測驗的差距結果顯示,出現閱讀理解困難學
童(占 89%)多於識字困難者(占 72%);在 152 位學障個案中,有 10 人出
現識字困難但理解 OK,34 人識字 OK 但理解困難,亦即有 44 位(占 29%)
國中學習障礙學童出現識字和閱讀理解能力表現不一致情形。語文學習有明
顯的馬太效應,有必要在小二作「閱讀理解篩選測驗」,以早期發現閱讀理
解困難學童,及時提供必要的教學協助。
篩選測驗主要是在篩選學童是否具備該階段應有的基礎能力,此測驗的
結果除了能篩選出有閱讀理解困難的學童,更有診斷─教學的功能。施測者
有必要將詳細的施測結果和作答反應提供給導師或是國語文教師,讓相關教
師可以針對測驗結果出現困難的部分做加強輔導,同時融入平日的教學,以

- 225 -
測驗學刊,第 62 輯第 3 期

協助該學童閱讀理解能力的提升,達到診斷即教學的目的。

四、「閱讀理解測驗」編修之建議
有鑑於此測驗的第 5 題及第 12 題的難度估計值出現地區 DIF,因此建議
未來編修測驗時修改該試題之內容或增加題目以取代該題。再者,Rasch 分
析「閱讀理解測驗」的信度偏低,為了提高測驗的信度以有效的區分高低能
力的受試者,亦建議此測驗內容進一步修改及增加各向度的題目。
「閱讀理解測驗」的題目有注音符號輔助,但是答案卻未提供注音符
號,檢視該測驗答案並沒有破音字詞或可能因為注音的標示而造成提示效果
的情形。雖然使用手冊上強調在測驗中所使用的字與詞皆是學童熟悉的,不
致造成理解的干擾;然而,陳冠廷、孟瑛如、陳虹君、楊佩蓁(2013)指
出,當試題描述較難或出現較難的字彙時,閱讀低成就學生可能就會出現閱
讀理解表現不佳的情形。本研究的施測教師亦表示,試題對學童來說頗有難
度,有的國字看不懂,有的意思看不懂。據此,本研究工具對識字困難者可
能是不利的,建議未來在編修測驗時,將答案加上注音符號或是施測時提供
報讀,以排除受試者識字能力對施測結果的影響。

五、研究限制與未來研究建議
本研究僅分析「國民小學二年級閱讀理解測驗(A)」,結果無法推論至
測驗的其他年級和版本,此為研究限制一。其他年級的測驗或同年級 A、B 版
本是否互為複本測驗,需要後續研究探討。考量導師對學童的了解和班級掌
握較熟練,並且施測程序簡單易行,因此本研究的「閱讀理解測驗」是由導
師所施測,並未要求須符合此測驗所建議的施測資格,此為研究限制二。後
續研究可比較施測者資格是否影響測驗結果。本研究為和柯華葳、詹益綾
(2007)結果進行比較,在忽略兩個 DIF 試題的前提下,以原始總分進行假
設考驗,此亦為研究限制。柯華葳、詹益綾的研究發現,東區學童得分表現
顯著低於其他地區,因此設定其切截分數低於全國其他地區兩分。本研究東
區學童的測驗平均總分優於南區和中區學生,而且通過切截點的比率高於其
他地區;然而,假若花東地區與其他地區的切截分數一致,則上述顯著差距
即弭平;再者,有兩個試題出現對東區學童不利的地區 DIF。因此,東區學童
與其他地區學童在閱讀理解表現上是否真的有顯著差異,以及東區常模的切
截點低於其他地區兩分的適切性與其影響,需要後續研究進一步探討釐清。

- 226 -
鍾素香 鄭英耀 王佳琪 「閱讀理解篩選測驗」的再驗證和應用

致謝
本研究感謝國立中山大學邁向頂尖大學計畫經費之支持。

- 227 -
測驗學刊,第 62 輯第 3 期

參考文獻

中文部分

王文中(2004)。Rasch 測量理論與其在教育和心理之應用。教育與心理研究,
27,637-694。
王木榮、董宜俐(2006)。國小學童中文閱讀理解測驗。臺北市:心理。
王瓊珠、洪儷瑜、陳秀芬(2007)。低識字能力學生識字量發展之研究:馬太效
應之可能表現。特殊教育研究學刊,32(3),1-16。
余民寧(2011)。教育測驗與評量:成就測驗與教學評量(第三版)。臺北市:
心理。
林怡君、張麗麗、陸怡琮(2013)。Rasch 模式建置國小高年級閱讀理解測驗。
教育心理學,45(1),39-61。
林寶貴、錡寶香(2002)。中文閱讀理解測驗。臺北市:教育部。
柯華葳(1999)。閱讀理解困難篩選測驗。測驗年刊,46(2),1-11。
柯華葳、詹益綾(2007)。國民小學(二至六年級)閱讀理解篩選測驗使用手
冊。桃園縣:國立中央大學學習與教學研究所。
柯華葳、詹益綾、張建妤、游婷雅(2009)。臺灣四年級學生閱讀素養(PIRLS
2006 報告)(第二版)。桃園縣:國立中央大學學習與教學研究所。
洪儷瑜、王瓊珠、張郁雯、陳秀芬、陳慶順(2007a)。常見字流暢性測驗。臺
北市:教育部。
洪儷瑜、王瓊珠、張郁雯、陳秀芬、陳慶順(2007b)。識字量評估測驗。臺北
市:教育部。
洪儷瑜、陳淑麗、王瓊珠、方金雅、張郁雯、陳美芳、柯華葳(2009)。閱讀障
礙 篩 選 流 程 的 檢 驗:篩 選 或 教 師 轉 介 之 比 較。特 殊 教 育 研 究 學 刊,34
(1),1-22。
國家教育研究院(2014)。TASA 臺灣學生學習成就評量資料庫。取自 http://tasa.
naer.edu.tw/1about-2.asp? id=1
張世彗、楊坤堂(2005)。國小一年級閱讀理解測驗。臺北市:心理。
教育部(2013)。一O二年度特殊教育統計年報。臺北市:教育部。
教 育 部(2014)。重 大 教 育 政 策 發 展 歷 程。取 自 http://history.moe.gov.tw/policy.
asp? id=2

- 228 -
鍾素香 鄭英耀 王佳琪 「閱讀理解篩選測驗」的再驗證和應用

陳冠廷、孟瑛如、陳虹君、楊佩蓁(2013)。國民小學二年級閱讀低成就學生於
新竹縣閱讀理解與數學解題篩選測驗之表現。特教論壇,15,35-50。
陳昭珍(2011)。閱讀知能與閱讀推動方案。載於陳昭珍、簡馨瑩、林菁、賴苑
玲、陳海泓(著),圖書教師手冊(頁 7-21)。臺北市:教育部。
陳美芳(2003)。語文理解能力測驗之發展與效度分析。特殊教育研究學刊,24
(1),1-14。
陳淑麗、洪儷瑜(2003)。學習障礙國中學生在不同差距標準差異之研究。特殊
教育研究學刊,24,85-111。
曾建銘、陳清溪(2009)。2007 年臺灣學生學習成就評量結果之分析。教育研
究與發展期刊,5(4),2-38。
臺灣 PISA 國家研究中心(2010)。臺灣 PISA 2009 精簡報告。臺南市:作者。

英文部分

Aaron, P. G., & Joshi, R. M. (1992). Reading problems: Consultation and remediation.
New York, NY: The Guilford Press.
Adams, R. J., Wilson, M. R., & Wang, W. C. (1997). The multidimensional random coef-
ficients multinomial logit model. Applied Psychological Measurement, 21, 1-23.
Burgoyne, K., Whiteley, H. E., & Hutchinson, J. M. (2011). The development of compre-
hension and reading-related skills in children English as an additional language and
their monolingual English-speaking peers. British Journal of Educational Psychol-
ogy, 81, 344-354.
Carmines, E. G., & Zeller, R. A. (1979). Reliability and validity assessment. Thousand
Oaks, CA: Sage.
Chall, J. S. (1983). Stages of reading development. New York, NY: McGraw-Hill.
Cheng, Y. Y., Wang, W. C., & Ho, Y. H. (2009). Multidimensional Rasch analysis of a psy-
chological test with multiple subtests: A statistical solution for the bandwidth-fidelity
dilemma. Educational and Psychological Measurement, 69, 369-388.
Gagné, E. D., Yekovich, C. W., & Yekovich, F. R. (1993). The cognitive psychology of
school learning. New York, NY: Harper Collins College Publishers.
Holland, P. W., & Wainer, H. (Eds.) (1993). Differential item functioning. Hillsdale, NJ:
Lawrence Erlbaum Associates.
Rasch, G. (1960/1980). Probabilistic models for some intelligence and attainment tests.
(Copenhagen, Danish Institute for Educational Research), expanded edition (1980)
with foreword and afterword by B.D. Wright. Chicago, IL: The University of Chicago

- 229 -
測驗學刊,第 62 輯第 3 期

Press.
Swaby, B. E. R. (1989). Diagnosis and correction of reading difficulties. Boston, MA: All-
yn and Boston.
Wang, W. C. (2008). Assessment of differential item functioning. Journal of Applied Mea-
surement, 9(4), 1-22.
Wilson, M. (2004). Constructing measures: An item response modeling approach. Ma-
hwah, NJ: Lawrence Erlbaum Associates.
Wolfe, E. W., & Smith, E. V. Jr. (2007). Instrument development tools and activities for me-
asure validation using Rasch models: Part II-Validation activities. Journal of Applied
Measurement, 8, 204-233.
Wright, B. D., Linacre, J. M., Gustafson, J. E., & Martin-Lof, P. (1994). Reasonable mean-
square fit values. Rasch Measurement Transactions, 8(3), 370.

- 230 -

You might also like