Professional Documents
Culture Documents
语言测试的社会学思考 杨惠中
语言测试的社会学思考 杨惠中
语言测试的社会学思考*
上海交通大学 杨惠中 广东外语外贸大学 桂诗春
提要: 大规模、高风险考试的设计者有 很 重 的 社 会 责 任 , 因 为 许 多 年 轻 人 的 未 来 取 决 于 考 试 结
果。他们必须尽一切可能保证自己所开发的考试对考生的语言能力提供 准确、客观和公正的测量。
一项好的考试还应当对教学有好的反拨作用, 对社会有好的影响。但是考试的后效取决于许多考试
之外的因素。考试的社会权重越大, 作弊与应试教育的倾向越严重, 这跟题型和考试内容无关。从考
试社会学的角度来看, 决定考试社会权重的因素常常超出语言测试工作者的控制范 围, 尤其是当考
试成为一种体现政策的工具的时候, 此时改进考试后效需要更高层次 的决策, 包括考试各相关方的
正确对待。
关键词: 语言测试、效度研究、社会性、语言测试与语言教学
[ 中图分类号] H313 [ 文献标识码] A [ 文章编号] 1003-6105 ( 2007 ) 04-0368-07
关注语言测试对教学的反拨作用是语言
1. 引言 测试工作者的本职工作。作为对教学结果的
评估手段, 测试自然会对教学产生影响, 即产
语言测试经过半个多世纪的发展, 已经 生反拨作用。反拨作用有正面的, 也有负面
成为一门独立的学科。从语言测试发展的历 的。负面的反拨作用限制学习的深度和广度;
史看, 语言测试工作者的研究重点逐步从提 从广义来说, 作弊、替考、应试培训和模拟试
高测试信度和改进测试效度发展到关注测试 题集泛滥等都可算是考试的负面作用。语言
的后效。近年来, 国际语言测试界逐渐把研究 测试工作者努力探索新的题型、改进考试的
的重点转向语言测试的社会应用, 即研究语 内容和形式, 对减少考试的负面效应有一定
言测试的社会性。这一发展轨迹反映了语言 的效果。
测试工作者认识的深化。 但是, 教学是一种社会现象, 作为教学一
一项好的语言测试首先本身的专业质量 部分的考试自然也是一种社会现象。考试是
要高, 主要是考试的信度和效度要高。提高信 在 特 定 的 社 会 环 境 下 ( social context ) 发 生
度是语言测试的内部问题, 通过采用心理测 的。对考试反拨作用进行深入研究后发现, 考
量学所提供的技术手段, 仅凭语言测试工作 试的反拨作用是一个极其复杂的现象, 涉及
者本身努力即可解决。 语言测试工作者、教师、学生、家长、政策制定
效度问题涉及到考试的对象和用户, 它 者、用人部门等等, 可说是涉及一切与考试有
的研究要复杂得多。效度是一个实证问题, 必 关的人员。一项考试, 尤其是一项大规模、高
须靠实验来验证。大规模语言测试必须开展 风险考试, 如果不但要求测量准确、而且还要
效度研究, 以实据来证明自己的效度, 即测量 收到良好的反拨作用, 那就需要社会各方面
了所要测量的语言能力, 这样才能取信于民 的协同努力; 认为改进考试对教学的反拨作
( Alderson et al. 1995 : 193) 。 用 ( washback effect and social impact ) 只 是
*
考试制度是社会制度的重要组成部分, 对保证社会公平和建立和谐社会起到 重要的作用。大规模高风险考试常常会影响
考生的未来, 具有极强的社会性, 考试社会性问题正是国际语言测试界在新世纪的研究重点之一。我们打算 撰写一组系列
文章, 对我国社会和教育环境下考试社会性的方方面面进行 探讨, 希望引起国内教育界和社会各方的讨论, 推动语言测试
学科本身的发展, 并且使考试结果能更好地服务于教学和人才培养工作。本文是系列文章中的第一篇。
杨惠中 桂诗春 369
可能通过法律诉讼制止各种侵权行为, 不但 密与泄密者的法律责任、作弊替考等行为者
有利于保护考试机构的知识产权, 而且有利 的法律责任、教育考试的专业质量监管、对考
于廓清混乱不堪的教辅市场和应试培训市 试结果使用的监管, 等等。只有健全的法律制
场。 度才能避免考试走向商业化, 成为某些人或
( 6) 鼓励教育测量和心理测量领域的专 某些部门的牟利工具, 才能保证教育考试的
业人员制定行业道德规范语言测试工作者要 健康发展, 使教育考试服务于教育事业并造
以敬业精神来对待自己的专业工作, 充分意 福千万学子。
识到自己的专业工作所承担的社会责任。考 3.3 教师和学生
试专业人员, 包括涉及命题的人员, 应当自 语言测试要收到预期的效果还需要教师
律, 不搞模拟试题、不搞应试培训等等进行牟 和学生正确对待。语言教学和语言测试具有
利。如果主持考试的人或单位利用自己的身 各自不同的目的, 前者是为了帮助学生掌握
份进行应试培训, 不但对其他考生不公, 而且 英语, 获得以英语为工具参与国际交流的能
也使考试失去了公信力。 力, 获取本专业所需要的各种信息; 而后者只
( 7) 成立语言政策咨询委员会 是一种测量工具, 目的是对学生的语言能力
外语教育受国家政治形势和经济形势的 进行客观的、准确的、公正的评价, 同时反映
影响极大, 这涉及到国家的语言政策, 涉及国 教学中的优缺点, 以便改进教学。因此, 教师
民的文化认同、国家改革开放和对外交流、母 应当帮助学生理解测试工具不等于教学工具
语学习与外语学习的平衡等重大问题, 因而 的道理, 自觉摈弃各种应试培训的做法, 还课
需要科学规划。也有一些人把英语学习看得 堂教学以本来面貌, 探索各种有效的、丰富多
太简单, 以为随便学学就可以开口说流利的 彩的语言教学形式, 包括任务型教学、课题型
英语, 说不了就是“哑巴英语”, 而且把考试当 教学、交际型教学, 充分利用宝贵的课堂教学
作现成的替罪羊, 仿佛只要取消考试, 千百万 时间提高学生实际运用英语的能力。对学生
人立马就能流利地说英语了, 显然这是缘木 来说, 他们应当相信英语可以学好, 但又不是
求鱼。事实上, 语言教学是一门科学, 就全国 可以随便学好, 非下苦功不可。不要轻易相信
来说, 语言政策需要全面规划, 语言教学也是 模拟试题集之类的“捷径”, 只有下苦功夫才
如此。如果由政府主管部门成立“语言政策咨 能学好英语, 达到用英语进行交际的目的。
询委员会”, 由应用语言学家、语言学家、教育 3.4 社会
学家、语言教学专家、语言测试学家、热心教 由于大规模考试具有社会性, 也希望社
育的社会知名人士参加, 集思广益, 反映各方 会能够正确对待考试, 善待考试。首先, 要正
观点和社会需要, 全面规划语言教学, 正确处 确使用考试结果, 避免考试结果的误用。另
理语言教学与语言测试的关系, 则不仅上述 外, 要为语言测试学科的发展创造宽松的氛
1) -6) 项工作都可以相应得到落实, 英语教学 围。那种“大字报”式的所谓学术讨论是伪学
也可以避免“费时多、收效低”的窘况。 术, 除了哗众取宠, 蒙骗不明真相的普通公
( 8) 制定教育考试法并颁布执行 众, 完全无助于语言测试学科的发展。
考试需要“法治”, 在条件成熟时应根据
法律制订一整套制度和规定, 明确规定什么 4. 结论
单位有权举办全国性的考试、考试机构的权
利和责任、考试结果的使用范围、考生的权利 有教学就有考试, 对教学效果和考生的
与义务、考试用户的权利和义务、考试知识产 能力水平进行测试鉴定, 这是由社会需要所
权保护、考试试卷的考前与考后保密、试卷窃 决定的。迄今为止, 考试依然被公认为是公正
374 语言测试的社会学思考
study language and mind using the same method as that in natural sciences. Internalism emphasizes
the study of abstract representations inside the human brain. Individualism implies that the internal
states of the brain being studied are characteristic of the individual. Chomsky takes universal
grammar and particular grammars as real objects in the world. The objectiveness of theoretical terms
and assertions that are used to describe the two types of grammar can be accounted for by what he
terms as the“best theory ”, an approach to developing a theory with the“best ”explanatory power.
The sociology of language testing , by Yang Huizhong and Gui Shichun , p.368
The designers of a large-scale high-stakes test shoulder heavy social responsibilities, because
the future of many young people lies with the results of the test. They therefore must do what they
can to ensure that the measurement of the candidateKs English proficiency is accurate , objective ,
and fair. A good test should also have a positive washback effect on teaching and beneficial impact
on society. Various factors, however , are responsible for the washback effect and social impact of a
test , many of which are out of the control of language testers. The dilemma for the language tester
is that the better professional quality of a public test , the greater the liability of its being misused.
Our experience shows that the so-called negative washback effect is mainly caused by the social
weight a public test carries, and has little to do with the item types and the test content. Therefore ,
all the stake-holders should share their responsibility for the avoidance of misuse of the test results.
The language testerKs responsibility is to provide the public with transparency and documentation of
a test on what is measured , through the dissemination of explicit standards , content outlines ,
theoretical frameworks and score interpretation materials.
The second wr iting pr ocess: Differ ences in the use of str ategies between high- and low-ability
students , by Ho Man-koon , p.375
Essay writing is increasingly being viewed as a process rather than a final product. From a
teaching point of view , two processes are involved in writing. The first process begins when the
student receives the topic of a writing task from the teacher and ends when the essay is turned in.
The second process begins when the student receives the marked essay from the teacher and ends
when the student finishes revising the essay according to the comments from the teacher. In the last
20 years or so, research on writing mostly centered on the first writing process while the second
writing process was largely neglected. This paper reports on a study which aims to investigate the
second writing process. The main focus is on the differences in the strategies used by high- and low-
ability students in their English writing as a second language. It was found that the high- and low-
ability students differed in their use of strategies relating to detection, diagnosis and review.
A study of the over gener alization in second language acquisition , by Zhou Baoguo , p.387
Overgeneralization regarding the use of the English article the is a ubiquitous phenomenon in
SLA for Chinese-speaking learners of English. An analysis shows that three context types of article
use ( i.e. specific definite , specific indefinite and unspecific indefinite ) involve differential
complexity of semantic interrelations , which relates to the ease or difficulty in the acquisition of
these context types. In an empirical investigation based on this analysis, three groups of Chinese
learners of English were tested on their knowledge of the. Results show that article semantics bears
on the phenomenon of the overgeneralization and that such overgeneralization mainly occurs in the
specific indefinite context.