基于Coh-Metrix的... 托福、雅思阅读语篇难度研究江进林

基于Coh-Metrix的大学英语六级与
托福、雅思阅读语篇难度研究
江进林对外经济贸易大学韩宝成北京外国语大学
摘要：本研究使用Coh-Metrix工具对近年大学英语六级、托福和雅思的163篇阅读语篇
进行难度对比分析。研究表明：Coh-Metrix能够使用适合二语学习者的可读性
公式对语篇难度进行整体测量，还可通过53个词汇语法和语义特征的计算，从
8个维度（叙事性、句法简约性、词汇具体度、指称衔接、深度衔接、动词衔
接、连接度、时序性）解析语篇难度。研究发现六级阅读语篇整体上比托福和
雅思容易，并在4个维度上与它们存在显著差异。六级阅读语篇的叙事性比托
福和/或雅思更强（话题更为人们所熟悉、口语性更强）、连接度更高（显性附
加连词、转折连词、比较连词更多），而词汇具体度更低（词汇更抽象）、指
称衔接更少（上下文词汇的重叠更少）。我们认为，这种不一致的情况反映了
语篇的复杂性本质，即主题较难的题材可能使用更多的隐性衔接手段对理解进
行补偿；并且，词汇具体度和词汇难度之间存在非线性关系。本研究为考试开
发、阅读分级和教材编写提供了参考依据。
作者简介：江进
主题词：阅读语篇；难度；大学英语六级；托福；雅思
林，对外经济贸中图分类号：H319 文献标识码：A 文章编号：1672-9382 (2018)03-0086-10
易大学英语学院 DOI:10.13564/j.cnki.issn.1672-9382.2018.03.017
1 引言
副教授，研究方英语四、六级考试（以下简称“四、六级”）
向：语言测试、
阅读的研究主要探讨其内容效度（辜向东等，
语料库语言学，
阅读理解是外语考试中不可或缺甚至权重 2009）、答题效度（金艳、吴江，1998；杨
E-m a i l：j i a n g-
Vol.15 No.3 (General Serial No.83)
最高的部分，也是中国学生比较擅长的部分，卫健，2011）和情感因素（金艳、程李颖，
j i n l i n2014@163.
但在大型国际性考试中，学生仍觉得阅读理解 2013），对直接影响考生成绩的阅读语篇难
c om。韩宝成，北
偏难，而学界鲜有研究报告这些阅读语篇本身度研究较少，对四、六级和国际性考试中的阅
京外国语大学中国
外语与教育研究中
难在何处。已有研究主要介绍托福和雅思阅读读语篇进行比较的研究更为鲜见。已有相关研
心教授、博士生导测试的开发，并从考生背景和考试策略角度进究通常采用单一的可读性公式对语篇难度进行

May 2018
师，研究方向：语行效度验证（Freedle & Kostin，1993；Cohen 计算（李跃平、杨廷君，2013），缺乏对语

言测试、外语教育 & Upton，2007；Gomez et al.，2007；Taylor 篇本身客观、全面的测量。本研究拟使用国外
F L C
与教师发展研究。 & Weir，2012；Clapham，1996）。围绕大学自然语言处理工具Coh-Metrix对六级、托福和
86
中国外语
雅思考试的阅读语篇进行分析，从多个维度对六个维度（Graesser & McNamara，2011；
三项考试的语篇难度进行比较。目前中国英语 Kintsch，1998）。其中前五个维度都与文本
第15卷第3期（总第83期）

2018年5月
等级量表的相关研究正在进行之中（刘建达，特征密切相关，在C o h-M e t r i x中均有体现。
2017；闵尚超、何莲珍，2016），语言测试 Coh-Metrix的设计初衷是对口头、书面文本的
标准（范劲松、金艳，2010）的呼声也越来越衔接性进行自动分析，该工具的名称Coh来自
高，而雅思和托福与国际公认的语言能力标准单词c o h e s i o n。不过它的后期设计已超出此
C E F R对接，因此三项考试的阅读语篇对比研范围，可对一系列语言指标进行测量。C o h-
究可为制定我国统一的外语能力等级量表、建 M e t r i x整合了词性赋码器、模式分类器、句
立统一的外语测评体系提供参考数据。法分析器、语义分析器等计算语言学和语料
库语言学的多种技术，例如Wo r d N e t中的词
2 阅读语篇难度和Coh-Metrix
汇语义信息，英国医学研究理事会（Medical
Research Council，MRC）心理语言学数据
阅读语篇难度指语篇难以阅读和理解的程库中人工对词汇熟悉度、想象性、具体度、意
度，反过来讲就是可读性（readability）或易义性的评级，CELEX数据库中基于大规模语料
读性（easibility）（McNamara et al.，2014：库的词汇频率信息，Charniak句法分析器，潜
①
78，83）。长期以来，学界采用单一的可读性语义分析技术（Latent Semantic Analysis，
指标来测量语篇难度，如弗莱士-金凯德年级水 L S A）等（M c N a m a r a e t a l.，2014：40-
平（Flesch-Kincaid Grade Level，FKGL）、 41）。其中，潜语义分析技术是Coh-Metrix的
阅读能力等级（Degrees of Reading Power，一大优势，它超越了表层形式特征的统计，通
D R P）和蓝思分级（L e x i l e S c o r e s）。过奇异值分解来压缩词频-文本矩阵，以此构
McNamara et al.（2014：13-15）发现，这些建潜藏的文本语义空间，然后计算两个语言单
指标计算出的语篇难度高度相关（r>0.9），位所代表的向量夹角的余弦值，即为两者的语
因为它们都包含词长和句长信息。例如，弗莱义相似度（桂诗春，2003；Landauer et al.，
士-金凯德年级水平的计算公式为：0.39× 2007）。Coh-Metrix将本科层次的语义空间作
句子的平均单词数＋11.8×单词的平均音节为潜语义分析的基础，该语义空间包括TA S A
数-15.59，其基本理念是单词越长，可能越生（Touchstone Applied Science Associates）
僻；句子越长，句法可能越复杂，需要的工作语料库中的大量小说、报刊文章等文本。目
记忆越多，因而语篇的阅读等级越高。不过，前Coh-Metrix 3.0可以对11个模块共106个变
词长和句长只能反映语篇的一部分表层特征，量进行自动分析 ②，这些模块依次是：描述性
即语篇难度的一部分。这些公式忽略了阅读理统计量、文本易读性主成分得分、指称衔接、
解过程涉及的语言表征、结构、策略使用、加潜语义分析、词汇多样性、连词、情景模式、
工过程等其他认知层面的因素（McNamara et 句法复杂度、句法型式密度、词汇信息和可读
al.，2014：79）。Masi（2002）也指出，在性。以往研究表明，Coh-Metrix提取的绝大多
考察语篇是否适合特定读者时，不仅要量化数变量都能影响阅读测试的难度（e.g. Freedle
测量词汇和句法复杂度，还应考虑其他语义 & Kostin，1993；Fortus et al.，1998）。
和句法因素如结构嵌入、语篇类型、读者的背基于多种自动分析技术，C o h-M e t r i x
景知识等。改进了以往单一的可读性公式，研制出
为克服以上不足，美国孟菲斯大学的 C o h-M e t r i x二语可读性指标（C o h-M e t r i x
McNamara等人研发了一个基于网络的文本分 L2 Readability，RDL2）。其计算公式为：
析工具Coh-Metrix。Coh-Metrix的理论基础是 -45.032＋（52.23×相邻句子实词重叠的平均
影响阅读理解的多层面理论框架，包括词汇、数）＋（61.306×句子的平均句法相似度）
句法、篇章格局（textbase）、指称性情景模＋（22.205×C E L E X数据库中实词的最低对
式（situation model）、体裁和修辞结构、数词频平均数）（McNamara et al.，2014：
读者和写作者/说话人和听者之间的语用交际 80）。该指标尤其适用于二语学习者，因为
87
它反映了二语阅读者在词汇、句子和语篇衔 concreteness）；句法层面对应句法简约性
接方面遇到的困难。研究表明，C o h-M e t r i x （syntactic simplicity）；篇章格局对应指称
二语可读性与日本学生英语完形填空得分的衔接（referential cohesion）；情景模式对应
相关度（r=0.93）高于弗莱士易读性（Flesch 深度衔接（deep cohesion）、动词衔接（verb
Reading Ease）和弗莱士-金凯德年级水平（r cohesion）、连接度（connectivity）和时序性
均为0.86），因此比后两者更有效（Crossley （temporality）；体裁和修辞结构对应叙事性
et al.，2008）。另一项研究表明，Coh-Metrix （narrativity）。每个主成分的得分由其内部各变
二语可读性公式能准确区分59%的阅读材料，量（见表1）加权求和得出，权数为各变量的方
高于弗莱士易读性和弗莱士-金凯德年级水平差贡献率（即载荷量的平方数）③。在进行相加
（44%~48%）（Crossley et al.，2011）。时，需要对载荷为负数的变量进行符号转换，
由于可读性指标仍然比较简单，Graesser 保证各变量的数值越大，文本易读性越高。8
et al.（2011）使用TASA语料库中的37 520个个主成分即为Co h-M e t r i x 3.0提供的易读性
文本对C o h-M e t r i x的测量指标进行了主成分模块。
分析（Principal Components Analysis），试目前国外主要使用C o h-M e t r i x研究其
图找出主要构成因素。这些文本的平均长度为测量指标对连贯性和阅读理解的影响（e.g.
288.6词，相当于一个段落。选用这些文本的 M c N a m a r a e t a l.，2010），分析文本之
原因有两个：第一，文本的代表性强，涵盖间的区别、判断文本的语体、体裁和类别
了美国从幼儿园到12年级可能接触到的文本（Crossley et al.，2007；Louwerse et al.，
片段，包括语言艺术、科学、社会研究、历 2004），或者探讨写作语言的特点及其对写
史，甚至商业、医疗、家政、工业艺术；第作质量的预测力（Crossley & McNamara，
二，每个文本已有难度指标（D R P）。研究 2012；Crossley et al.，2011）。极少数研究
者排除了Coh-Metrix中无法预测文本变异的指也使用Coh-Metrix分析考试中的阅读语篇。例
标，以及与其他特征高度相关（r>0.9）的指如，Green et al.（2010）使用Coh-Metrix、
标，最终剩下53个变量。通过主成分分析进 WordSmith和VocabProfile工具提取了英国14
行压缩，最终发现8个主要成分，它们能解释本本科教材中42篇学术语篇和42篇雅思阅读
67.3%的文本变异，并且这些成分与Graesser 真题的27个量化特征，包括句子平均单词数、
& M c N a m a r a（2011）的多层面理论框架基段落平均句子数、主动词前单词数，以及衔接
本吻合：词汇层面对应词汇具体度（w o r d 性、文本抽象程度（如词汇具体度、词汇上义
表1 Coh-Metrix 易读性主成分包含的变量
包含的变量
主成分变量数量
正载荷变量负载荷变量
动词、副词、代词、第一人称代词、第三人
单词平均音节数；名
称代词的比例；CELEX数据库中所有词汇的
词、形容词的比例；
对数词频平均数；CELEX数据库中实词的最
叙事性实词的平均习得年 17
低对数词频平均数；句子最低词频；实词的
龄；名词短语的平均
平均熟悉度；否定式的比例；句子间词性相
修饰语数；被动语态
异度
虚词与实词之比；句
因果关系动词；意愿动词或意愿副词；段落
句法简约性子平均单词数；主动 6
May 2018
内句子的平均句法相似度
词前平均单词数
实词的平均意义性；实词的平均具体度；实
词汇具体度无 3
F L C
词的平均想象性
88
中国外语
续表
包含的变量
主成分变量数量

2018年5月
正载荷变量负载荷变量
相邻句子实词重叠的平均数；所有句子实词
重叠的平均数；相邻句子论元重叠的平均
数；所有句子论元重叠的平均数；相邻句子类形符比；所有词汇
指称衔接 13
名词重叠的平均数；所有句子词干重叠的平多样性；动词多样性
均数；已知信息和新信息的LSA；相邻句子
LSA；所有LSA；句子间词汇相异度
所有连词的比例；因果连词的比例；时序连
深度衔接词的比例；逻辑连词的比例；因果关系衔无 6
接；意愿关系衔接
实词的平均多义性；相邻句子动词重叠的平
动词衔接无 3
均数；相邻句子LSA动词重叠
连接度附加连词的比例；转折连词的比例无 2
时序性时序衔接；动词时态重复；动词体重复无 3
度）、Coh-Metrix二语可读性等，然后使用t检行自动分析。网络版Coh-Metrix 3.0可以自动

验对两组数据进行了比较。研究者还对文本进处理15 000词以内的单个文本。如果文本超过
行了内容分析、专家评价等质性考察。研究结 15 000词，或者需要处理多个文本，其研发团
果表明，教材语篇和雅思阅读在词汇具体度、队可以提供免费服务。文本超过一定数量和长
主题专业性（subject specificity）等少数指度则需付费。
标上存在显著差异，这一方面是由于雅思需要
避免出现文化、话题偏误（bias），另一方面 3.2 语篇选择
也因为雅思阅读语篇比少数专业性教材（如法本研究使用的语篇有三组，包括2005—
律）容易。该研究表明Coh-Metrix能够用于对 2013年六级考试的阅读理解文本55篇，以及
阅读测试进行效度研究。新托福和雅思官方样题和真题中的阅读理解文
在国内，一些研究者指出了已有易读性公本各54篇。为使研究结果具有可比性，我们排
式的不足（李绍山，2000；邢富坤、程东元，除了快速阅读、信息匹配等题型，仅保留阅读
2010），但没有形成有影响力的改进方法。江后需做单项选择题的文本。研究者将每篇文本
进林（2016）对Coh-Metrix的原理和使用方保存为一个文档，并对三组文本的格式进行了
法进行了深入浅出的介绍。不过，相关实证研统一：删除雅思和托福阅读的标题、文本后的
究不到10项，一类是自动评分研究（梁茂成，术语（glossary）和英文释义、六级阅读文本
2006；杜慧颖、蔡金亭，2013），一类是写内超纲词汇的汉语释义；使用分段符为段落标
作语言的特征研究，如词汇和衔接手段（桂记；将标点符号统一为英文输入，等等。
林，2010；鲍贵，2011）。在前人研究的基
础上，本研究将使用Coh-Metrix对六级、托福 3.3 数据收集
和雅思阅读语篇的难度进行比较。本研究从Coh-Metrix汇报的11个模块中选
择可读性和易读性数据进行分析。可读性模块
3 研究设计汇报Coh-Metrix二语可读性、弗莱士易读性和
弗莱士-金凯德年级水平。由于后两者都基于
3.1 研究工具词长和句长计算获得，我们仅采用其中一个。
本研究使用Coh-Metrix 3.0对阅读语篇进易读性模块包括8个易读性主成分的z分数和百
89
表2 三项考试阅读语篇的可读性差异
六级托福雅思 Post Hoc
F[2,
指标 (Bonferroni/ MD
M SD M SD M SD 160]
Games-Howell)
六级>托福 7.51**
弗莱士易读性 49.09 10.47 41.58 9.55 43.28 10.29 8.288** 六级>雅思 5.81**
雅思>托福 1.71
六级>托福 2.13**
Coh-Metrix二
12.13 3.49 10.01 2.38 10.57 2.73 7.822** 六级>雅思 1.56*
语可读性
雅思>托福 0.56
注：*表示p <0.05，**表示p <0.01。
分位数。z分数是经过标准化处理的数据，即性术语更多（Biber，1988）。由此可见，六
每个文本的特征值减去所在文本组的平均数再级阅读的话题比托福和雅思更为读者所熟悉，
除以标准差。百分位数在0~100%之间，80% 口语特点更明显。
的百分位数表示该文本比80%的文本更容易。第二，六级阅读语篇的词汇具体度显著低
由于本研究的重点不是单个文本，而是三组文于托福（M D=0.45）。语篇中实词的比例越
本，我们未使用百分位数。高、实词的意义越丰富、越能在人们大脑中激
发意象（mental images），词汇具体度的数
4 结果与讨论值越高，语篇也越容易加工和理解。反之，抽
象的词汇通常代表着难以可视化的概念，因而
单因素方差分析结果（表2）显示，三更难理解（McNamara et al.，2014：85）。
组语篇在弗莱士易读性和C o h-M e t r i x二语可第三，六级阅读语篇的指称衔接显著低于
读性上都具有显著差异（F[2，160]=8.288，托福（MD=1.00）和雅思（MD=0.65），且均
④
7.822，p <0.01）。事后比较（Post Hoc）值差异在易读性主成分中最大。指称衔接反映
结果进一步表明，六级阅读语篇的易读性的是随着文本的展开，文中的词汇和观点彼此
显著高于托福（M D=7.51，2.13）和雅思联系的程度（Graesser et al.，2011：230）。
（MD=5.81，1.56）。如果一个句子与上一句的词汇重叠极少，则可
图1呈现了三组语篇的易读性z分数。表3 能出现衔接断层（gap），对读者造成加工困
显示，三组语篇在叙事性、词汇具体度、指称难。由于名词短语对照应和衔接起着重要作
衔接、动词衔接、连接度上具有显著差异。用，六级阅读语篇需要特别注意名词的衔接。
第一，六级阅读语篇的叙事性显著高于第四，雅思阅读语篇的动词衔接显著高于
托福（M D=0.61）和雅思（M D=0.43）。叙托福（MD=0.43）。该指标反映了文本中动词
事文本往往讲述一个故事，包括地点、人物、重叠的程度。如果文本多次使用相同或意义相
事件等，因此使用的动词、副词、代词更多。近的动词，事件结构可能更连贯，便于读者理
以往研究表明，叙事文本往往带有口语色彩解文本情景模式。该指标对叙事性文本和低水
（Biber，1988；Clark，1996），其话题通常平读者更有效（McNamara et al.，2012）。
为人们所熟悉，句子的构成也容易理解。话题第五，六级阅读语篇的连接度显著高于托
的熟悉度意味着叙述者会使用音节较短、频次福（M D=0.46）。连接度体现的是文本使用
较高的词汇，这些词汇被儿童习得的年龄也较显性附加连词（and，moreover等）、转折连
May 2018
早。句子构成简单则表明名词短语的修饰语、词、比较连词的程度，反映了文本中显性表达
主动词前的单词、被动语态较少。与之相反的逻辑关系的数量。
F L C
是偏重信息传递的书面文本，这些文本的名词从表3也可以看出，三组语篇在句法简约
90
中国外语
2018年5月
图1 三项考试阅读语篇的易读性 z 分数
表3 三项考试阅读语篇的易读性差异
六级托福雅思 Post Hoc
易读性
F[2, 160] (Bonferroni/ MD
主成分 M SD M SD M SD Games-Howell)
六级>托福 0.61**
叙事性 -0.43 0.62 -1.04 0.41 -0.86 0.43 21.286** 六级>雅思 0.43**
雅思>托福 0.18
托福>六级 0.04
句法简约性 -0.34 0.64 -0.30 0.56 -0.51 0.98 1.198 六级>雅思 0.17
托福>雅思 0.21
托福>六级 0.45*
词汇具体度 0.04 0.70 0.48 0.81 0.28 0.85 4.401* 雅思>六级 0.25
托福>雅思 0.20
托福>六级 1.00**
指称衔接 -1.25 0.76 -0.24 0.52 -0.59 0.98 23.616** 雅思>六级 0.65**
托福>雅思 0.35
托福>六级 0.04
深度衔接 0.37 0.71 0.41 0.77 0.59 0.75 1.401 雅思>六级 0.23
雅思>托福 0.18
六级>托福 0.20
动词衔接 -0.27 0.62 -0.48 0.60 -0.04 0.78 5.625** 雅思>六级 0.23
雅思>托福 0.43**
六级>托福 0.46*
连接度 -1.94 0.88 -2.41 1.00 -2.22 0.83 3.547* 六级>雅思 0.27
雅思>托福 0.19
托福>六级 0.05
时序性 -0.71 0.98 -0.67 1.06 -0.61 0.94 0.156 雅思>六级 0.11
雅思>托福 0.06
注：*表示p <0.05，**表示p <0.01。
91
性、深度衔接、时序性指标上没有显著差异。推测，文本的叙事性越强，词汇可能越容易，
第一，句子包含的词汇越少、句法结构越简但不一定越具体。为验证这个假设，我们将每
单、越为人们所熟悉，则句法越简约，越容易项考试的50多个阅读语篇合并到一个文档，然
加工。相反，句子结构的嵌套越多，读者在工后使用Paul Nation开发的Range软件对词汇进
作记忆中需要储存的词汇和观点越多，则句法行分析。Range软件的前两个词表包含两千词
越复杂。从句法的角度看，六级阅读语篇与托族（word families），源自通用英语词表（A
福和雅思相当。第二，深度衔接主要反映语篇 General Service List of English Words）；第
在出现因果或逻辑关系的情况下，使用因果性三个词表包含570个词族，源自学术英语词表
和意愿性连词的程度。这些连词能够帮助读者（Academic Word List）。词族、第三级类符
理解事件和行为，否则读者需要从文中推断因和词表外词汇（Not in the lists）通常是可靠
果关系和逻辑关系，加工的难度更大。数据显的难度判别标准。由于三组语篇的形符数不
示，六级阅读语篇的深度衔接数量与托福、雅同，类符和词族数量的可比性不强，我们采用
思一致。第三，时序性强的文本包含更多的时百分比数据来判断词汇难度。表4显示，六级
序衔接手段，相同的动词时、体也更多。这样阅读语篇的第三级类符百分比（15.06%）略
的文本有助于读者理解情景模式，因而更易高于托福（14.54%）和雅思（14.43%），而
于加工（G r a e s s e r et al.，2011）。数据显词表外词汇的百分比（34.19%）远低于托福
示，六级阅读语篇的时序性指标与托福、雅（40.78%）和雅思（41.36%）。因此，六
思相当。级阅读语篇的词汇整体上比托福和雅思容易，
从以上分析可以得出两个结论。首先，主这与词汇具体度的结论相反，可见词汇具体
题较难的题材可能使用更多的隐性衔接手段。度和词汇难度的关系比较复杂。Graesser et
六级阅读语篇的叙事性和连接度显著高于托福 al.（2011）也发现，词汇具体度和年级整体上
和/或雅思，而指称衔接显著低于后两者。也就是非线性的关系。具体而言，在美国幼儿园到
是说，六级阅读语篇的话题更为人们所熟悉， 12年级的自然科学类阅读材料中，词汇随着
使用的显性附加连词（and，moreover等）、年级的增加越来越抽象；语言艺术类阅读材料
转折连词、比较连词更多，而上下文词汇（尤的词汇越来越具体；社会研究类阅读材料的词
其是名词）重叠更少。这种不一致的情况可能汇在5年级前越来越具体，5年级后越来越抽
是因为叙事性较低，题材较难的托福、雅思语象。可见学科类型是影响词汇具体度的一个
篇会采用隐性衔接手段进行弥补。Graesser et 重要变量，今后需要对词汇具体度进行进一步
a l. （2011：231）指出，当主题较难，使用探讨。
的词汇和表达的观点不为读者所熟悉时，作者
5 结语
倾向于使用更简单的句法和更多的衔接手段，
以弥补读者理解文本的难度。McNamara et
al.（2012）也发现，信息性较强的文本比语言本研究表明，六级阅读语篇的难度整体
艺术类文本中的句法结构更简单、衔接手段更上低于托福和雅思。具体而言，六级阅读语篇
多，并且学生的年级越高，其阅读材料中的衔的叙事性显著高于托福和雅思，可见其话题更
接手段越多，这种不符合预期的现象就是出于为人们所熟悉，口语性更强。六级阅读语篇的
作者对理解进行补偿的心理。
连接度显著高于托福，表明语篇使用的显性附
其次，词汇具体度和词汇难度可能不是简加连词（and，moreover等）、转折连词、比
单的线性关系。六级阅读语篇的叙事性显著高较连词更多，有助于理解。不过，六级阅读语
于托福和雅思，而词汇具体度显著低于托福，篇的词汇具体度显著低于托福，表明词汇的意
这种现象也与我们的预期相反。不过，即使是义更抽象，更难以在读者大脑中激发可视化意
May 2018
最基本的名词，也有抽象（如thing，person）象。六级阅读语篇的指称衔接也显著低于托福
和具体（如ball，teacher）之分；很多简单的和雅思，表明文中上下文词汇（尤其是名词）
F L C
动词也是抽象的（如do，make）。因此我们重叠更少，读者加工的困难更大。三项考试在
92
中国外语
表4 三项考试阅读语篇的词汇分布报告
考试词表形符/% 类符/% 词族

2018年5月
1 36 081/76.14 1 856/37.37 849
2 2 620/5.53 664/13.37 437

六级
3 3 395/7.16 748/15.06 415
词表外词汇 5 293/11.17 1 698/34.19 ?????
1 53 815/72.59 1 973/31.59 867
2 4 496/6.06 817/13.08 495

托福
3 5 660/7.64 908/14.54 436
词表外词汇 10 160/13.71 2 547/40.78 ?????
1 61 796/74.04 2 199/31.13 911
2 4 916/5.89 924/13.08 558

雅思
3 6 101/7.31 1 019/14.43 483
词表外词汇 10 654/12.76 2 922/41.36 ?????
上述4个易读性主成分上的差异不尽一致，体语, 有人严格区分, 有人混而用之。本文在定

现了语篇的复杂性本质。例如，六级阅读语篇义上不作区分。在McNamara et al. (2014: 78,
的叙事性和连接度高于托福和/或雅思，而指 83) 的研究中, 可读性仅采用一个计算公式来
称衔接更低，因为主题较难的题材可能使用更测量, 而易读性从词汇、句法、衔接等多个
多的隐性衔接手段对理解进行补偿。再如，六维度进行测量, 两者的本质都是语篇易于阅
级阅读语篇的叙事性高于托福和雅思，词汇也读和理解的程度。
比托福和雅思容易，而词汇具体度比托福低， ② Coh-Metrix工具参见http://cohmetrix.com/。106
表明词汇具体度和词汇难度可能是复杂的曲线个变量及其说明可参见McNamara et al. (2014:
关系，不过这需要进一步研究进行验证。六级 60-77, 247-251) 或从h t t p://141.225.42.101/
与托福、雅思阅读语篇在另外4个易读性主成 CohMetrixHome/documentation_indices.html
分（句法简约性、深度衔接、动词衔接、时序了解。
性）上没有显著差异。托福和雅思阅读语篇仅 ③ 变量的英文名称及其载荷量参见Graesser et
在一项指标上存在显著差异，即托福阅读的动 al. (2011: 228-230)。
词衔接度低于雅思。 ④ 在本研究中, 三组平均数的方差相等 (equal
总之，本研究采用的Coh-Metrix易读性主 variances assumed) 时, 使用Bonferroni检验法
成分模块能够反映词汇、句法、衔接、语义相进行两两比较; 方差不相等 (equal variances
似度等更丰富、全面的文本信息，克服了以往 not assumed) 时, 使用Games-Howell检验法。
单一可读性公式的不足。本研究的结果为改进
现有考试的阅读语篇难度提供了相应的实证基参考文献
础。国内的阅读分级和教材编写也可以借鉴本 [1] Biber, D. Variation across Speech and Writing
文介绍的多维文本难度分析法。 [M]. Cambridge: Cambridge University Press,
1998.
注释 [2] Clapham, C. The Development of IELTS: A
① 英文文献中的readability、easibility以及中文 Study of the Effect of Background on Reading
文献中的“可读性”“易读性”等近义术 Comprehension [M]. Cambridge: Cambridge
93
University Press, 1996. [12] Gomez, P. G., Noah, A., Schedl, M., Wright, C.
[3] Clark, H. H. Using Language [M]. Cambridge: & Yolkut, A. Proficiency descriptors based on
Cambridge University Press, 1996. a scale-anchoring study of the new TOEFL iBT
[4] Cohen, A. D. & Upton, T. A.‘I want to go back reading test [J]. Language Testing, 2007, 24(3):
to the text’: Response strategies on the reading 417-444.
subtest of the new TOEFL [J]. Language [13] G r a e s s e r, A . C . & M c N a m a r a , D . S .
Testing, 2007, 24(2): 209-250. Computational analysis of multilevel discourse
[5] Crossley, S. A. & McNamara, D. S. Predicting comprehension [J]. Topics in Cognitive Science,
second language writing proficiency: The roles 2011, 3(2): 371-398.
of cohesion and linguistic sophistication [J]. [14] Graesser, A. C., McNamara, D. S. & Kulikowich,
Journal of Research in Reading, 2012, 35(2): J. Coh-Metrix: Providing multilevel analyses of
115-135. text characteristics [J]. Educational Researcher,
[6] Crossley, S. A., Allen, D. & McNamara, D. S. 2011, 40(5): 223-234.
Text readability and intuitive simplification: A [15] Green, A., Ünaldi, A. & Weir, C. Empiricism
comparison of readability formulas [J]. Reading versus connoisseurship: Establishing the
in a Foreign Language, 2011, 23(1): 84-102. appropriacy of texts in tests of academic reading
[7] Crossley, S. A., Greenfield, J. & McNamara, D. [J]. Language Testing, 2010, 27(3): 1-21.
S. Assessing text readability using cognitively [16] Kintsch, W. Comprehension: A Paradigm
based indices [J]. TESOL Quarterly, 2008, for Cognition [M]. Cambridge: Cambridge
42(3): 475-493. University Press, 1998.
[8] Crossley, S. A., Louwerse, M. M. & McCarthy, [17] Landauer, T. K., McNamara, D. S., Dennis,
P. M. A linguistic analysis of simplified and S. & Kintsch, W. (eds.). Handbook of Latent
authentic texts [J]. Modern Language Journal, Semantic Analysis [M]. Mahwah, NJ: Erlbaum,
2007, 91(1): 15-30. 2007.
[9] Crossley, S. A., Salsbury, T., McNamara, D. [18] Louwerse, M. M., McCarthy, P. M., McNamara,
S. & Jarvis, S. Predicting lexical proficiency D. S. & Graesser, A. C. Variation in language
in language learner texts using computational and cohesion across written and spoken registers
indices [J]. Language Testing, 2011, 28(4): 561- [A]. In K. D. Forbus, D. Gentner & T. Regier
580. (eds.). Proceedings of the 26th Annual Meeting
[10] Fortus, R., Coriat, R. & Fund, S. Prediction of of the Cognitive Science Society [C]. Mahwah,
item difficulty in the English subtest of Israel’s NJ: Erlbaum, 2004: 843-848.
inter-university psychometric entrance test [A]. [19] Masi, S. The literature on complexity [A]. In B.
In A. J. Kunnan (ed.). Validation in Language Merlini (ed.). Complexity in Language and Text
Assessment: Selected Papers from the 17th [C]. Pisa, Edizioni Plus, 2002: 197-228.
Language Research Colloquium, Long Beach [20] McNamara, D. S., Graesser, A. C. & Louwerse,
[C]. Mahwah, NJ: Lawrence Erlbaum, 1998: M. M. Sources of text difficulty: Across genres
61-87. and grades [A]. In J. P. Sabatini, E. Albro & T.
[11] Freedle, R. & Kostin, I. The prediction of O’Reilly (eds.). Measuring Up: Advances in
TOEFL reading comprehension item difficulty How We Assess Reading Ability [C]. Plymouth,
for expository prose passages for three item UK: Rowman & Littlefield Education, 2012:
types: Main idea, inference, and supporting idea 89-116.
May 2018
items [R]. TOEFL Research Reports No. RR-93- [21] McNamara, D. S., Graesser, A. C., McCarthy,
44. Princeton, NJ: Educational Testing Service, P. M. & Cai, Z. Automated Evaluation of Text
F L C
1993. and Discourse with Coh-Metrix [M]. New York:
94
中国外语
Cambridge University Press, 2014. 读性研究[J]. 解放军外国语学院学报, 2010:
[22] McNamara, D. S., Louwerse, M. M., McCarthy, (6): 19-24.
P. M. & Graesser, A. C. Coh-Metrix: Capturing [39] 杨卫健. 英语专业四级考试阅读理解测试的

2018年5月
linguistic features of cohesion [J]. Discourse 答题效度验证[J]. 外语教学, 2011(6): 53-56.
Processes, 2010, 47(4): 292-330.
[23] Taylor, L. & Weir, C. J. (eds.). IELTS Collected A Study of Reading Text Difficulty of
Papers 2: Research in Reading and Listening CET6, TOEFL and IELTS Based
A s s e s s m e n t [C]. C a m b r i d g e: C a m b r i d g e on Coh-Metrix
University Press, 2012. Abstract: This paper presents an analysis of
[24] 鲍贵. 不同课程水平英语学习者词汇复杂性 the difficulty of CET6, TOEFL and IELTS
研究[J]. 解放军外国语学院学报, 2011(4): 55- reading texts with Coh-Metrix tool based on
60. 163 texts. The results show that Coh-Metrix is
[25] 杜慧颖, 蔡金亭. 基于Coh-Metrix的中国英语 effective in measuring the overall text difficulty
学习者议论文写作质量预测模型研究[J]. 现 with a readability formula which is suitable
代外语, 2013 (3): 293-300. for L2 learners. More detailed analysis of text
[26] 范劲松, 金艳. 语言测试的标准研究: 回顾、 difficulty is also identified along eight functional
反思与启迪[J]. 外语界, 2010 (1): 82-91. dimensions (narrativity, syntactic simplicity, word
[27] 辜向东, 李志芳, 张书奎. 大学英语四级考试 concreteness, referential cohesion, deep cohesion,
快速阅读部分内容效度研究 [J]. 西南民族大 verb cohesion, connectivity, and temporality)
学学报 (人文社科版) [J]. 2009 (1): 258-263. through calculation of 53 lexico-grammatical and
[28] 桂林. 基于计算机评估的L1和L2作文词汇水 semantic features. It is found that the reading
平对比研究[J]. 外语教学与研究, 2010 (6): t e x t s o f C E T 6 a r e e a s i e r t h a n TO E F L a n d
445-450. IELTS, and they have significant difference
[29] 桂诗春. 潜伏语义分析的理论及其应用[J]. 现 along four dimensions. CET6 reading texts
代外语, 2003 (1): 76-84. exhibit higher narrativity (topics being more
[30] 江进林. Coh-Metrix工具在外语教学与研究中 familiar and texts more oral) and connectivity
的应用[J]. 中国外语, 2016 (5): 58-65. (more explicit additive connectives, adversative
[31] 金艳, 程李颖. 影响高风险考试效度的心理因 and contrastive connectives, and comparative
素研究[J]. 现代外语, 2013 (1): 62-69. connectives), while lower word concreteness
[32] 金艳, 吴江. 以“内省”法检验CET阅读理解 (words being more abstract) and referential
测试的效度[J]. 外语界, 1998 (2): 47-52. cohesion (less word overlap) than TOEFL and/or
[33] 李绍山. 易读性研究概述[J]. 解放军外国语学 IELTS. The inconsistency along four dimensions
院学报, 2000 (4): 1-5. reveals the complexity of text. The study
[34] 李跃平, 杨廷君. 大学英语四级考试传统阅 concludes that when subject matter is unfamiliar
读试题难度的相关性及趋势研究[J]. 广西师 and difficult, authors tend to write the text with
范大学学报 (哲学社会科学版) [J]. 2013 (6): more implicit cohesive devices to compensate
124-128. for comprehension, and there is a curvilinear
[35] 梁茂成. 学习者书面语语篇连贯性的研究[J]. relationship between word concreteness and
现代外语, 2006 (3): 284-292. word difficulty. The study prepares a relatively
[36] 刘建达. 中国英语等级量表与英语学习[J]. 中 objective descriptive frame of reference for test
国外语, 2017 (6): 4-11. development, reading material grading and text
[37] 闵尚超, 何莲珍. 构建英语听力能力发展性量 selection for students.
表[J]. 中国外语, 2016 (4): 70-77. Keywords: reading texts; difficulty; CET6;
[38] 邢富坤, 程东元. 基于统计语言模型的英语易 TOEFL; IELTS
95

基于Coh-Metrix的... 托福、雅思阅读语篇难度研究江进林

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

基于Coh-Metrix的... 托福、雅思阅读语篇难度研究江进林

Uploaded by

Copyright:

Available Formats

基于Coh-Metrix的大学英语六级与

江进林对外经济贸易大学韩宝成北京外国语大学

心教授、博士生导测试的开发，并从考生背景和考试策略角度进究通常采用单一的可读性公式对语篇难度进行

师，研究方向：语行效度验证（Freedle & Kostin，1993；Cohen 计算（李跃平、杨廷君，2013），缺乏对语

与教师发展研究。 & Weir，2012；Clapham，1996）。围绕大学自然语言处理工具Coh-Metrix对六级、托福和

第15卷第3期（总第83期）

第15卷第3期（总第83期）

度）、Coh-Metrix二语可读性等，然后使用t检行自动分析。网络版Coh-Metrix 3.0可以自动

第15卷第3期（总第83期）

2 2 620/5.53 664/13.37 437

词表外词汇 5 293/11.17 1 698/34.19 ?????

1 53 815/72.59 1 973/31.59 867

2 4 496/6.06 817/13.08 495

词表外词汇 10 160/13.71 2 547/40.78 ?????

1 61 796/74.04 2 199/31.13 911

2 4 916/5.89 924/13.08 558

词表外词汇 10 654/12.76 2 922/41.36 ?????

上述4个易读性主成分上的差异不尽一致，体语, 有人严格区分, 有人混而用之。本文在定

1993. and Discourse with Coh-Metrix [M]. New York:

第15卷第3期（总第83期）

You might also like

基于Coh-Metrix的... 托福、雅思阅读语篇难度研究 江进林

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

基于Coh-Metrix的... 托福、雅思阅读语篇难度研究 江进林

Uploaded by

Copyright:

Available Formats

基于Coh-Metrix的大学英语六级与

江进林 对外经济贸易大学 韩宝成 北京外国语大学

心教授、博士生导 测试的开发，并从考生背景和考试策略角度进 究通常采用单一的可读性公式对语篇难度进行

师，研究方向：语 行效度验证（Freedle & Kostin，1993；Cohen 计算（李跃平、杨廷君，2013），缺乏对语

与教师发展研究。 & Weir，2012；Clapham，1996）。围绕大学 自然语言处理工具Coh-Metrix对六级、托福和

第15卷 第3期 （总第83期）

第15卷 第3期 （总第83期）

度）、Coh-Metrix二语可读性等，然后使用t检 行自动分析。网络版Coh-Metrix 3.0可以自动

第15卷 第3期 （总第83期）

2 2 620/5.53 664/13.37 437

词表外词汇 5 293/11.17 1 698/34.19 ?????

1 53 815/72.59 1 973/31.59 867

2 4 496/6.06 817/13.08 495

词表外词汇 10 160/13.71 2 547/40.78 ?????

1 61 796/74.04 2 199/31.13 911

2 4 916/5.89 924/13.08 558

词表外词汇 10 654/12.76 2 922/41.36 ?????

上述4个易读性主成分上的差异不尽一致，体 语, 有人严格区分, 有人混而用之。本文在定

1993. and Discourse with Coh-Metrix [M]. New York:

第15卷 第3期 （总第83期）

You might also like

基于Coh-Metrix的... 托福、雅思阅读语篇难度研究江进林

基于Coh-Metrix的... 托福、雅思阅读语篇难度研究江进林

江进林对外经济贸易大学韩宝成北京外国语大学

心教授、博士生导测试的开发，并从考生背景和考试策略角度进究通常采用单一的可读性公式对语篇难度进行

师，研究方向：语行效度验证（Freedle & Kostin，1993；Cohen 计算（李跃平、杨廷君，2013），缺乏对语

与教师发展研究。 & Weir，2012；Clapham，1996）。围绕大学自然语言处理工具Coh-Metrix对六级、托福和

第15卷第3期（总第83期）

第15卷第3期（总第83期）

度）、Coh-Metrix二语可读性等，然后使用t检行自动分析。网络版Coh-Metrix 3.0可以自动

第15卷第3期（总第83期）

上述4个易读性主成分上的差异不尽一致，体语, 有人严格区分, 有人混而用之。本文在定

第15卷第3期（总第83期）