You are on page 1of 166

学校代码:80201 学号:B11500034

分 类 号: H 密级: 无

中国社会科学院研究生院
博士学位论文
普通话水平测试依据研究

王 晖

导师姓名及职称: 姚喜双 教授
系 别:语言文字应用系
专 业: 媒体语言学
研 究 方 向:普通话测试研究

评 阅 人:
答辩委员会:
答辩日期:

2016 年 4 月
中国社会科学院研究生院

学位论文原创性声明和版权使用授权书

原创性声明

本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究

工作所取得的成果。除文中已注明引用的内容外,本论文不含任何其他个人或集

体已经发表或撰写过的作品成果。对本论文的研究做出重要贡献的个人和集体,

均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。

学位论文作者签名: 年 月 日
中文摘要

普通话水平测试是载入《国家通用语言文字法》的大规模国家通用语言口试,在我国语
言文化建设中具有重要作用,在语言测试领域也以其鲜明的特点,独树一帜。本文旨在通过
对普通话水平测试依据的研究,丰富普通话水平测试学科体系,为完善普通话水平测试提供
学理支持,为推广和规范使用国家通用语言文字工作提供学术建议。
本文以普通话水平测试依据为研究对象,共分六章。第一章为绪论,阐述选题缘由、研
究对象、现状、框架以及思路、方法、意义。第二章是理论部分,界定测试依据的内涵、外
延,构建测试依据层级系统,论述测试依据的三级范畴及特征。第三章是史论,梳理测试依
据发展历程,为本文研究树立纵向参照系。第四章、第五章是专论,分别研究测试管理依据、
学术依据及其二级范畴、三级范畴。第六章为结语。
本文对普通话水平测试活动要素进行解构和建构,并将测试依据置于“测试中介”的核
心要素中加以研究,提出测试依据的三级范畴体系,首次将测试管理依据纳入研究范畴,确
立了管理依据与学术依据并立的新格局。本研究提出一系列测试依据术语,如管理依据、学
术依据、宏观管理依据、微观管理依据、基础学术依据、具体学术依据、法律法规依据、政
策文件依据、业务管理依据、命题依据、评分依据等,初步构建测试依据术语子系统,增强
了测试依据研究的理论张力。本文提出测试依据发展历程“两阶段五时期”划分法,为测试
发展史研究提供新思路。本研究对测试依据的内容、特点和作用等进行专门探讨,对《国家
通用语言文字法》
《普通话水平测试管理规定》
《普通话水平测试等级标准(试行)
》《普通话
水平测试大纲》以及命题依据、评分依据等进行重点研究,分析其特点、现状及存在的问题,
并提出完善建议。
本文以普通话水平测试要素构成理论为参照,运用文献研究法、比较研究法、定性定量
综合研究法,对测试依据进行描述、归纳、阐释、分析和建构,探究测试依据的内在规律和
发展动因,使测试依据成为独立的、系统化和理论化的研究界域,为普通话水平测试学科理
论和工作实践提供参考。

关键词:普通话;普通话水平测试;测试依据;管理依据;学术依据

I
ABSTRACT
Putonghua Proficiency Test(Putonghua Shuiping Ceshi,PSC) is a national-wide
spoken Chinese language test. The test is enshrined in the Law of the People's
Republic of China on the Standard Spoken and Written Chinese Language. The PSC
distinguishes itself by its contribution to Chinese language and culture as well as its
unique features. This paper enriches the research of PSC by the study on the test basis.
It provides academic supports to improve the PSC. The paper also gives suggestions
to publishing and standardizing the construction of Spoken and Written Chinese
Language.
This paper focuses on the test basis of PSC. It consists of six chapters. The first
chapter, the introduction, elaborates on the origin of the theme selection of the paper,
research objectives, current status and framework of the research, research methods
and significance. The second chapter is theoretic which defines the intension and
extension, as well as the construction of hierarchical organization of the test basis. It
also clarifies the secondary category and characteristics of PSC. Chapter Three tracks
the historic development of the test basis. It builds up the longitudinal frame of
references for the research. Chapter Four and Chapter Five examine the administrative
and academic basis as well as its secondary and tertiary domains. Chapter Six is
summary.
The paper not only constructs and deconstructs the elements of test conduct but
also examines the test basis as one of the key factors of the test medium (the other
factor is test methods) and proposes three-level category system which bring into
incorporate the administrative basis into research objectives for the first time, and
therefore establishes the new pattern for the administrative basis as well as the
academic basis. Additionally, the paper presents series of new terminologies of the
test basis. For instance, administrative basis, academic basis, macro-management and
micro-management basis, fundamental academic basis, specific academic basis, basis
of laws and regulations, policy basis, management basis, proposition basis, grading
basis etc..It also proposes "Two stages Five Periods", a new historical division based
on the test development. The paper discusses the content, features and effects of the
basis of the test and especially examines the basis of test design and grading
according to laws and regulations. Also, the paper analyzes the status and existing
problem and presents some suggestions for further improvement.
II
Based on the theory of the constituent elements of PSC test, this paper employs
various research methods to describe, generalize, interpret and construct the test basis
and explores the inner law and motivation of the test basis to make test basis an
independent, systematic and theoretical domain and provide foundation and
references for PSC test theoretically and practically.

KEY WORDS: Putonghua(mandarin); Putonghua Proficiency test (Putonghua


Shuiping Ceshi, PSC ) ; test basis; administrative basis; academic basis

III
目 录

中文摘要............................................................................................................................................. I
ABSTRACT........................................................................................................................................... II
第一章 绪论....................................................................................................................................... 1
第一节 选题缘由....................................................................................................................... 1
第二节 文献综述....................................................................................................................... 1
一、理论框架性文献......................................................................................................... 1
二、具体性研究文献......................................................................................................... 2
三、综括............................................................................................................................. 6
第三节 研究设计....................................................................................................................... 7
一、研究范畴..................................................................................................................... 7
二、研究框架..................................................................................................................... 7
三、研究方法..................................................................................................................... 8
第四节 研究意义....................................................................................................................... 8
一、理论意义..................................................................................................................... 8
二、实践意义..................................................................................................................... 9
第二章 普通话水平测试依据的内涵、范畴体系及特征............................................................ 10
第一节 普通话水平测试依据的内涵.................................................................................... 10
一、测试活动要素理论框架...........................................................................................10
二、测试依据的内涵.......................................................................................................11
第二节 普通话水平测试依据的范畴体系............................................................................ 12
一、测试依据一级范畴...................................................................................................12
二、测试依据二级范畴...................................................................................................13
三、测试依据三级范畴...................................................................................................13
第三节 普通话水平测试依据的特征.................................................................................... 14
一、凭信性....................................................................................................................... 14
二、规约性....................................................................................................................... 15
三、层次性....................................................................................................................... 16
第三章 普通话水平测试依据发展历程........................................................................................ 18
第一节 普通话水平测试依据发展分期................................................................................ 18
一、普通话水平测试发展历程的分期.......................................................................... 18
二、测试依据发展历程的分期...................................................................................... 19
第二节 酝酿探索阶段的普通话水平测试依据.................................................................... 20
IV
一、酝酿探索阶段的管理依据...................................................................................... 21
二、酝酿探索阶段的学术依据...................................................................................... 22
三、综括........................................................................................................................... 26
第三节 实施发展阶段的普通话水平测试依据.................................................................... 27
一、实施发展阶段的管理依据...................................................................................... 27
二、实施发展阶段的学术依据...................................................................................... 32
三、综括........................................................................................................................... 38
第四章 普通话水平测试管理依据................................................................................................ 39
第一节 普通话水平测试法律法规依据................................................................................ 39
一、《宪法》..................................................................................................................... 39
二、《国家通用语言文字法》........................................................................................ 39
三、国务院部门规章.......................................................................................................45
四、省级地方语言文字法规规章.................................................................................. 52
五、普通话水平测试法律法规依据的层级体系.......................................................... 60
六、法律法规依据的作用...............................................................................................61
第二节 普通话水平测试政策文件依据................................................................................ 63
一、中共中央和国务院政策文件依据.......................................................................... 63
二、语言文字工作部门政策文件依据.......................................................................... 64
三、教育部门政策文件依据...........................................................................................67
四、其他行业系统政策文件依据.................................................................................. 68
五、政策文件依据的作用...............................................................................................69
第三节 普通话水平测试业务管理依据................................................................................ 69
一、《普通话水平测试实施办法(试行)》.................................................................. 69
二、《国家语言文字工作委员会关于普通话水平测试管理工作的若干规定(试行)》
........................................................................................................................................... 71
三、《普通话水平测试规程》........................................................................................ 73
四、《普通话水平测试工作评估指导标准》................................................................ 74
五、
《计算机辅助普通话水平测试操作规程(试行)》………………………………76
六、《教育部语用司关于推进计算机辅助普通话水平测试工作等有关问题的通知》
........................................................................................................................................... 78
七、《计算机辅助普通话水平测试试点业务指导意见》............................................ 79
第五章 普通话水平测试学术依据................................................................................................ 81
第一节 普通话水平测试基础学术依据................................................................................ 81
一、《普通话水平测试等级标准(试行)》.................................................................. 81

V
二、《普通话水平测试大纲》........................................................................................ 91
第二节 普通话水平测试具体学术依据................................................................................ 98
一、《普通话水平测试实施纲要》................................................................................ 98
二、普通话水平测试命题依据.................................................................................... 104
三、普通话水平测试评分依据.................................................................................... 123
第六章 结语................................................................................................................................... 134
一、主要结论................................................................................................................. 134
二、创新之处................................................................................................................. 135
三、不足及改进方向.....................................................................................................136
参考文献......................................................................................................................................... 137
附录 A:教育部门普通话水平测试政策文件依据简表............................................................... 149
附录 B:其他行业系统普通话水平测试政策文件依据简表....................................................... 152
后 记............................................................................................................................................. 155
在学期间学术成果情况................................................................................................................. 157

VI
图表目录

图表 1 图 2–1 普通话水平测试活动四要素图解.............................................................. 11
图表 2 图 2–2 普通话水平测试活动三要素图解.............................................................. 11
图表 3 图 2–3 普通话水平测试依据范畴体系.................................................................. 14
图表 4 表 3–1 普通话水平测试发展历程分期法比较...................................................... 18
图表 5 图 3–1 普通话水平测试依据发展历程分期.......................................................... 20
图表 6 表 4–1 国家对相关行业人员普通话等级标准的要求.......................................... 43
图表 7 图 4–1 全国省级语言文字法规规章颁布时间和数量分布图.............................. 54
图表 8 表 4–2 全国省级语言文字法规规章新增普通话水平测试内容简况表.............. 54
图表 9 图 4–2 普通话水平测试法律法规依据效力等级图.............................................. 60
图表 10 图 4–3 全国测试量累计变化简图........................................................................ 62
图表 11 表 4–3 普通话水平测试工作评估指导标准........................................................ 74
图表 12 图 5–1 欧洲语言共同参考框架三等六级语言能力量表树形图........................ 86
图表 13 图 5–2 普通话水平测试等级树形图.................................................................... 86
图表 14 表 5–1 《普通话水平测试等级标准(试行)》评价要素分析表...................... 87
图表 15 表 5–2 《普通话水平测试等级标准(试行)》评价要素区别特征指数表...... 88
图表 16 表 5–3 新《测试大纲》试卷构成及评分简表(五项测试)............................ 95
图表 17 表 5–4 新《测试大纲》试卷构成及评分简表(四项测试)............................ 96
图表 18 表 5–5 原《测试大纲》和《实施纲要》
“词语表”以“白”为首字词条对比表
......................................................................................................................................... 100
图表 19 表 5–6 香港、澳门应试人“选择判断”题型错误抽样统计.......................... 107
图表 20 表 5–7 “选择判断”题型问卷调查统计.......................................................... 108
图表 21 表 5–8 常模参照和标准参照测验的误差及信度估计值.................................. 112
图表 22 表 5–9 读单音节字词题型声母应出现的频率.................................................. 115
图表 23 表 5–10 读单音节字词题型韵母应出现的频率................................................ 115
图表 24 表 5–11 汉语普通话声母的出现频率比例 Pr(%)表..................................... 116
图表 25 表 5–12 汉语普通话韵母的出现频率比例 Pf(%)表..................................... 116
图表 26 表 5–13 汉语声调的出现频率比例表................................................................ 117
图表 27 图 5–3 普通话水平测试题库系统架构图.......................................................... 121
图表 28 表 5–14 原《测试大纲》与新《测试大纲》朗读短文评分对比表................ 126

VII
第一章 绪论

第一节 选题缘由

普通话水平测试已有 30 余年的研究历程和 20 余年的工作实践,这项具有显著中国语言


规划特质的、专门测试汉语母语者标准语水平的大规模口试,以其鲜明的特点,在语言测试
领域独树一帜。作为语言学及应用语言学专业的一个分支学科,近年来普通话水平测试学术
研究取得一批重要成果,学科体系初具雏形。
普通话水平测试研究领域相当广泛,姚喜双等《普通话水平测试概论》,将测试活动中
涉及的众多因素归纳为四个方面:测试主体、测试对象、测试依据和测试手段,奠定了普通
话水平测试研究的理论基础和框架,具有学科的理论指导意义和方法论意义。王晖《普通话
水平测试阐要》在继承借鉴此理论架构基础上进行了局部调整,将普通话水平测试实践活动
归纳为施测主体、受测对象、测试中介三要素,测试中介可细分为两个子要素:测试依据和
测试手段。
本学位论文的研究对象聚焦在“普通话水平测试依据”方面,主要基于以下考虑:测试
依据是测试活动基础要素之一,是测试活动开展所凭借和依循的规则,是其他要素活动和发
挥作用的前提,在测试活动体系中居基础性地位,因此测试依据研究是普通话水平测试研究
的重要领域。目前学术界对施测主体、测试手段等均已有专门性研究成果,例如孟晖《普通
话水平测试员评价标准研究》
、周梅《普通话水平测试手段研究》。但学术界对测试依据的研
究多集中于具体微观性研究,且限于学术依据一隅,作为完整、独立学术范畴的专门研究尚
属空白,测试依据作为测试活动要素,其范畴体系、内部层级,发展历程、发展特点与内在
规律,对测试活动的作用与影响,未来发展的方向等问题都缺乏深入研究,本研究将在这些
方面进行全方位的探索。

第二节 文献综述

一、理论框架性文献

普通话水平测试依据作为一个学科定义和研究范畴,是姚喜双等《普通话水平测试概论》
首次提出的。作者将普通话水平测试活动概括为包括测试依据在内的四个要素,并阐述了它
们之间相互影响,矛盾运动,共同推动普通话水平测试活动发展的规律,该专著对普通话水
平测试活动进行了体系性概括,为测试依据的专题研究起到了理论奠基作用。此后聂丹《普
1
通话水平测试研究概说》沿用此定义和框架,并尝试把普通话水平测试研究的成果纳入“四
要素”范畴,《普通话水平测试研究概说》为测试依据的专题研究提供了重要学术参考。韩
玉华博士学位论文《普通话水平测试发展历程研究》对测试依据的发展有所梳理,虽未进行
专题研究,但为本研究提供了发展史框架的纵向参考。孟晖博士学位论文《普通话水平测试
员评价标准研究》、周梅博士学位论文《普通话水平测试手段研究》分别对施测主体和测试
手段等测试活动要素进行了专门研究,为本研究提供了横向参考。

二、具体性研究文献

目前,国内外以普通话水平测试依据为专题研究对象的论文或论著尚未发现,但涉及具
体测试学术依据研究的文献较多,这些文献多数本身并非学术依据,却是制订学术依据的学
术参考。据聂丹《普通话水平测试研究概说》对中国知网(CNKI)1980年~2011年“全部数

据库”进行的检索统计,有关测试依据研究的文章总计271篇,占全部论文数量的20.3%。 我
们在聂丹研究的基础上,对中国知网(CNKI)2012年~2014年的“全部数据库”进行补充检
索,增补测试依据研究的论文45篇,论文文献总计316篇。现将该领域研究状况概述如下:
(一)基础学术依据文献
《等级标准》和《测试大纲》是普通话水平测试的基础学术依据,对二者的研究,成果
丰实。陈章太《略论汉语口语的规范》
、孙修章《“普通话水平测试标准”的研制与实践》、
刘照雄主编《普通话水平测试大纲》(原《测试大纲》)是奠定普通话水平测试理论和实践

基础的最重要的三部(篇)文献。 1997 年颁布的《普通话水平测试等级标准(试行)》和
2003 年教育部、国家语委颁布的《普通话水平测试大纲》(新《测试大纲》)既是重要的
学术成果,也是目前普通话水平测试最重要的基础学术依据。
学术界关于测试基础学术依据的探讨不乏有分量的论文。如陈章太《论普通话水平测试
等级标准》讨论了等级标准的由来、背景和各种方案,论述了制订等级标准的目的、意义、
原则和依据,等级的内容和描述,等级标准的掌握和实施等问题,是全面理解和深入解读等
级标准的代表性文献。刘照雄《普通话水平测试的构想与实施》,对测试标准、测试大纲的
内容、测试的方式等进行了阐释和解读。宋欣桥《普通话水平测试的语言表征与相应的测试
等级》
,立足于测试实践,论述了语言表征与相应的测试等级标准之间的关系,对理解和把
握测试等级标准具有指导意义。姚喜双《
〈大纲〉修订和〈纲要〉研制的思考》,系统阐述了
新《测试大纲》研制和《实施纲要》编制的原则,并讨论了若干带有根本性的问题,对领会
以上两部基础学术依据的实质,科学开展测试工作具有指导意义。其他如鲁允中《普通话水
平测试刍议》、庄守常《中师生普通话考核标准问题探讨》、刘照雄《普通话水平测试实施纲
要概述》、王晖《〈普通话水平测试大纲〉修订的若干问题》,也是论述《等级标准》和《测
试大纲》的重要文献。


聂丹:《普通话水平测试研究概说》
,语文出版社 2012 年版,第 51 页。

为节省篇幅,本节文献综述仅列作者和篇名(书名),文献详细内容详参其他章节和文末参考文献。
2
(二)具体学术依据研究
2004 年出版的《普通话水平测试实施纲要》是普通话水平测试具体学术依据的集成性
成果,其他具体学术依据体现在命题依据和评分依据两大方面。
1.命题依据研究文献
对命题依据进行总括性研究的成果不多,吴积才、王渝光《普通话标准化考试的理论与
实践》,是较早对普通话测试题型、测试长度和试题、试卷等命题问题进行综合性探讨的文
献,将理论探讨与实证研究、数据分析相结合的研究方法尤为可贵。伍巍《关于普通话水平
测试内容与方法的思考》,对普通话水平测试总体框架,包括测试题型、测试长度和分值比
重提出调整性的设计方案。具体命题依据研究成果较多,现分述如下:
(1)题型研究文献
朱楚宏《试论单字试题在 PSC 中的语言学意义》对读单字(单音节)题型的必要性进行
了论证,分析其语言学上的考核意义、方法意义和规范意义。简启贤《普通话水平测试单字
试题中语素字对测试目标的影响》
、李根芹《普通话水平测试(PSC)要求简化多音字》、许
光烈《对普通话水平测试中字词测试的思考》等论文从不同角度对读单音节字词和读多音节
词语题型的改进进行了研究。
专论“选择判断”和“朗读短文”题型的文献较少,刘慧《对“选择判断”中“语序或
表达形式判断”项的建议》通过分析该题型测试出现的问题,提出增强针对性的改进建议。
朱丽红《普通话水平测试免测“选择判断”项实证研究》通过五项测试与四项测试的实证对
比分析,提出尽量避免“选择判断”题型两种模式并存的建议和取消该题型的发展趋势。
“命题说话”题型研究成果相对较多,刘冬冰《关于〈“PSC”大纲〉中“会话”项的
思考》,探讨了测试中加入会话题型的利弊,并就话题呈现方式、语料选取、题目区分度、
题目数量、评分方式等提出具体建议。钱华《普通话水平测试“说话”项若干问题的分析与
对策》《普通话测评“说话”项负面因素探析》《PSC“说话”测试的学理依据与界域定位》
《PSC“说话”测试项的现状与改革设想》等系列论文,对“命题说话”的题型探讨,角度
多样,学理分析与测试实践结合紧密,所提改进其测试效度的建议也较有参考价值。聂丹的
博士学位论文《普通话水平测试话题难度及影响因素探究》,深入探究话题难度的层级及影
响因子,研究视角独特,实证研究的方法值得借鉴。
云天骄《普通话水平测试(PSC)和香港普通话水平考试(PSK)题型比较研究》运用对
比研究方法,对两种测试的 6 种题型进行分析,并提出借鉴性意见。
(2)测试长度研究文献
孙修章《“普通话水平测试标准”的研制与实践》,对各题型的测试长度设计进行了阐
释。王渝光等《现行普通话水平测试的质量评析与改进——兼答〈方言区普通话测评中的负
面因素〉一文》,运用概化理论与方法,探讨测试质量及改进问题,其中对字词测试长度的
讨论,值得重视。杨志明、张雷《用多元概化理论对普通话的测试》在概化理论运用方面更

3
进一步,对读单音节字词和读多音节词语测试长度的探讨很有启发意义。康健《普通话水平
测试时间长度探析》、钱华《普通话测评“时间限制”问题刍议》就测试时限科学性进行了
讨论。
(3)覆盖分布研究文献
王渝光、杨瑞鲲、李洪平《语言信息处理与普通话水平测试》主张试卷中出现的测查要
素应与现代汉语客观使用的语言概率相符,并基于自然语言统计,提出试卷中声母、韵母、
声调分布频次的建议。刘健硕士学位论文《普通话音系与 PSC 试题音子比率研究》详细统计
了普通话音子在各题型语料中的覆盖与分布,并以此为参照系检验普通话水平测试中音子覆
盖分布的合理度,并提出测试试卷覆盖分布参考指数。
读单音节字词和读多音节词语覆盖分布研究方面,新《测试大纲》对读单音节字词和读
多音节词语测试要素覆盖分布做出明确规定。汪磊《试论普通话水平测试语料的选择原则》
对读单音节字词、读双音节词语语料的覆盖和选择进行讨论,提出词频原则、通识原则和品
位原则等三条语料选择原则。朱盈梅硕士学位论文《PSC 试卷单音节字词测试题结构分析》
对读单音节字词的语音要素分布进行了分析,并提出改进建议。
“朗读短文”覆盖分布研究方面,《纲要》朗读作品选编课题组的《关于普通话水平测
试用“朗读作品”的分析报告》,对测试朗读作品的不重复字种数、声韵调覆盖率、基本音
节、分声调音节数进行报告。陈小燕、刘慧的《“普通话水平测试用朗读作品”字种数及音
节覆盖率的计量研究》,运用统计手段,对测试朗读作品的字种数和音节覆盖进行考察,并
讨论了朗读作品选取的科学性。
(4)分值比重研究文献
厉兵《普通话测试可行性分析》,讨论了普通话水平测试的题型,并提出各种题型的分
值比重方案。孙修章《“普通话水平测试标准”的研制与实践》对普通话水平测试分值比重
进行了系统阐释。宋欣桥《试论普通话水平测试(PSC)》讨论了“有文字凭借”和“无文字
凭借”题型的分值比重,对《测试大纲》分值比重的合理性进行论证,建议在一定时间内保
持这种比重。佟乐泉《不断提高普通话水平测试的科学水平》,对语音和词汇、语法的分值
比重提出讨论和商榷。许光烈《试论普通话水平测试的现存问题及对策》对《测试大纲》
“有
文字凭借”和“无文字凭借”题型的分值比重提出改进方案,建议大大提高“无文字凭借”,
即说话题型的分值比重。
(5)试卷编制和题库建设研究文献
程明《普通话水平测试试卷的科学编制及规范使用》讨论了试卷的制卷规则、计算机辅
助制卷的技术路线及人工干预原则。王渝光、杨万兵《普通话水平测试规范试卷的研制》、
王渝光、陈典红、杨万兵《普通话水平测试题库建设的理论与实践》,基于云南省试卷编制
和题库建设实践,对试卷编制的教育测量标准、试卷编制规范、题库建设理论、技术指标、
系统构成等进行了开创性的探索,为统一的国家题库建设进行了理论和实践准备。PSC 国家

4
题库建设课题组《普通话水平测试国家题库制卷系统研制报告》,对国家题库制卷系统的设
计思想、系统架构、主要特点、开发工具及部分性能实测结果作了详尽的说明。其他研究如
杨绍林《谈谈普通话水平测试试卷的拟制》对测试试卷的拟制原则和方法进行了阐述。朱丽
红《普通话水平测试的试卷问题》,分析了测试试卷中存在的测试项冗余、内容错误、异形
词等问题,探讨了解决的对策。
2.评分依据研究文献
(1)总体性评分依据研究文献
宋欣桥和王晖的研究具有代表性。宋欣桥《普通话水平测试评分中的几个问题》,提出
拟制“普通话水平测试语音评定参照细则”的基本设想 ,探讨了《测试大纲》中“语速”“停
顿”“方言语调”的评分问题;《普通话水平测试中的评分差异》一文,对评分差异的范围、
临界评分差异的处理等问题进行了探讨。王晖《略论普通话水平测试评分系统》
,阐释评分
系统与上位测试依据的关系,论述测试评分体系及其特点;
《普通话水平测试评分细则论析》

对地方性评分细则存在的问题进行了详细探讨,提出制定评分细则的原则和改进建议。其他
如屠国平《制定“PSC评分细则”的原则与方法》,单红、王颐嘉、乔丽华《普通话水平测
试评分细则研究》以及齐影《对各省〈普通话水平测试评分细则〉中一、二项的思考》等论
文,也对制定地方评分细则原则、方法和存在的问题进行了论述。
2007年,计算机辅助普通话水平测试工作开展后,机辅测试评分依据成为测试研究的一
个新热点。孙海娜《浅析〈计算机辅助普通话水平测试评分试行办法〉
》,阐述了制定《机辅
测试评分试行办法》遵循的主要原则,对实操运用中应注意的问题进行了探讨。另外有代表
性的还有刘洪超、姜岚《PSC机测与人工测试对比分析》、王芹春《PSC现场评定与录音评定
的对比研究》、许艳丽《普通话计算机辅助测试与人工测试的差异比较》、李德龙《计算机
辅助普通话水平测试“命题说话”评分标准的比较与探索》等成果。
(2)专门性评分依据研究文献
专门性评分依据研究多为学术性探究,并不一定固化为有形的测试依据——《测试大纲》
或地方性评分细则,但这些学术探讨对形成具体有形的测试依据具有学术支撑作用,对指导
测试评分实践具有参考价值,按照专题分述如下。
①语音评分依据研究文献
关于语音评分依据的研究成果最为丰富。在评分原则和方法的探讨方面,宋欣桥《普及
普通话的语音标准框架》
、庄守常《相对性与确定性——谈普通话的口语测试》、王明东《精
确与模糊——也谈普通话的口语测试》、张传曾《普通话等级测试标准的音位学阐释》、刘
俐李《普通话水平测试标准的音位学思考》
、孟晖《从普通话水平测试谈新时期普通话的语
音规范》等研究较有特色,这些论文不局限于语音评定具体问题的探讨,而是着眼于测试评
分的原则方法和理论研究,对语音评定具有理论参考意义。
在具体语言构成要素和试卷构成要素(测试项目)的评分依据方面,讨论比较集中的有

5
轻重音(包括轻声)、 朗读测试项、 命题说话测试项的评分和“方言语调”的把握等。
轻重音(包括轻声)方面,代表性的文献有田晋音《普通话水平测试中双音节词的轻重
音问题刍议》、赵则玲《普通话水平测试中的“轻声”问题》、田皓《普通话水平测试中的
轻声评判》、章石芳《“方言语调”探讨之一:关于词语轻重音模式》、孙海娜《略论〈普
通话水平测试实施纲要〉中的可轻读词语》
、杨绍林《论普通话水平测试中轻声词语读音的
判定》、谢晖《普通话水平测试中轻声词语的规范》等成果。
研究儿化评定的成果有许艳丽《普通话水平测试中“儿化韵”的规范问题》
、魏丽杰《普
通话水平测试“儿化”的把握》、易敏等《关于儿化词语认知与语感的调查》、孟晖《普通
话中儿母的“类”和“值”的语音规范》等论文。
研究音变评定的成果有赵欣《普通话测试与教学中音变常见问题及对策》、曹国安《语
气助词“啊”的音变不必强求——与〈普通话水平测试大纲〉商榷》、王晖《文白异读与语
音规范》《必然性与或然性——论“啊”音变的教学与测试》
、杨绍林《论普通话水平测试
中AABB式形容词读音的判定标准》等。
研究朗读测试项评定的成果有高廉平《“方言语调”及判定》、廖广莉《普通话水平测
试中“朗读”扣分标准刍议》
、吴雪青《PSC朗读项“语调偏误”判定的依据》、钱华《普通
话测评“方言语调”研究》等。
研究命题说话测试项评定的成果有屠国平《普通话水平测试说话项评分的几个具体问
题》、钱华《普通话水平测试“说话”项若干问题的分析与对策》、马圣霞《对PST中“命题
说话”测试项评分系统改革的设想》(按:“PST”讹,当为“PSC”之误)等。
此外,还有一些关于特定级别或方言区评定的研究成果,前者如宋欣桥、齐影《试论普
通话水平“一级甲等”的等级表征》
、孙海娜《普通话水平测试“一级甲等”评审的若干问
题》、刘惠琼《普通话水平未达二级乙等应试群的音错调查及相关表现特征分析》;后者如
朱爱萍《对太原普通话中“语调偏误”的评分把握》,徐波、陈岩 《基于方言的 PSC 语音定
性方法建构——以吴语甬江片方言为例》等。
②词汇、语法评分依据研究文献
一直以来,词汇、语法评分依据研究较为薄弱。王晖《试论普通话水平测试中的词汇、
语法问题》阐述了词汇、语法在普通话水平测试中不可或缺的地位,探讨了词汇、语法的评
定原则、规范度依据和主要视点,是研究测试词汇、语法评分依据的重要参考文献。韩玉华
《香港考生在普通话水平测试“说话”中几种常见的偏误分析》《从认知语言学的角度浅析
香港人普通话中的词汇偏误问题》分别将中介语理论、偏误分析理论和认知语言学理论运用
于对测试词汇、语法研究,角度新颖。另外曹炼等《普通话测试中词汇、语法规范探讨》、
朱楚宏《关于普通话水平测试中方言词语的认定》、钱华《PSC词汇、语法评定与语用原则》

谢英《谈普通话水平测试中“词汇语法规范”项检测问题》等也各具特色。

三、综括

6
总括而言,学术界关于测试依据的研究,涉及范畴较广,但比较分散,系统性不强,且
成果分布不均;普通话水平测试依据研究形成了一些热点,存在一些冷门,尚有一些空白。
具体而言,评分依据研究,尤其是语音要素评分依据研究一直广受关注,成果远超其他领域,
可谓是“显学”
,但仍有深入挖掘和探讨的空间。词汇、语法评分依据研究相对滞后,命题
依据研究方面,特别是试卷编制、题库建设和测试长度的研究,更是成果寥落,亟待加强。
管理依据和测试依据范畴的专题研究则是未开垦的“处女地”
,评分依据与测试主体、测试
对象、测试手段等测试活动要素关联互动,共同推动测试活动发展的规律也鲜有探究,这为
本课题研究提出了需求和方向。

第三节 研究设计

一、研究范畴

本研究以普通话水平测试依据为研究对象,在普通话水平测试活动要素构成理论框架下
构建“测试依据”研究的范畴体系。
测试依据指测试活动开展所凭借和依循的规则,是其他要素活动和发挥作用的基础。测
试依据的外延学术界目前有广狭之分,狭义的理解仅指评分标准;广义的理解,把等级标准、
测试大纲、评分标准、语言要素的规范标准和命题依据(题型、测试长度、试卷、试题题库
等)等涵盖在内。本研究着眼于更宏阔的范畴,首次把管理依据,包括宏观的法律法规依据、
政策文件依据和微观的业务管理依据等纳入研究范畴,尝试构建一个相对完整的、包含三级
范畴的测试依据研究层级系统,并以此为基础搭建研究框架。

二、研究框架

本研究由六章构成,主要内容如下:
第一章 绪论。阐明本文研究的对象、现状、范畴框架以及方法、思路和意义。
第二章 普通话水平测试依据的内涵、范畴体系及特征。运用普通话水平测试构成要素
划分理论,对普通话水平测试依据的内涵、外延进行界定,构建测试依据层级系统,论述测
试依据三级范畴及其特征。
第三章 普通话水平测试依据发展历程。梳理普通话水平测试依据发展历程,为本文的
总体研究树立纵向坐标。探讨管理依据在测试发展不同阶段出台的背景、原因,梳理和阐释
测试发展不同阶段学术依据的发展和演进,勾勒管理依据和学术依据“双轮驱动”的发展历
程和特征。
第四章 普通话水平测试管理依据。探讨测试管理依据的层级和相互关系,深入分析《国
家通用语言文字法》
(除标题和图表以外,本文正文一般简称“《语言文字法》
”)、
《普通话水

7
平测试管理规定》(除标题和图表以外,本文正文一般简称“《测试管理规定》”)、各地法律
法规依据以及政策文件依据和业务管理依据的内容及特征,揭示测试管理依据对测试活动以
及对测试学术依据的先导作用、推动作用和约束作用。
第五章 普通话水平测试学术依据。探讨测试学术依据的二级范畴和三级范畴及其相互
关系,重点对《普通话水平测试等级标准(试行)
》(除标题和图表以外,本文正文一般简称

《等级标准》”)
、《普通话水平测试大纲》(除标题和图表以外,本文正文一般简称“《测试
大纲》”)等测试基础学术依据和《普通话水平测试实施纲要》(除标题和图表以外,本文正
文一般简称“《实施纲要》”)、命题依据、评分依据等具体学术依据等进行研究,分析其特点、
现状、存在的问题,并在此基础上提出完善建议,揭示学术依据对测试活动的显性支撑作用、
导向作用和制约作用。
第六章 结语。总括本研究的主要结论,提出需要讨论的问题和存在的不足。

三、研究方法

(一)文献研究法
测试依据以具体文本为基本呈现方式,因此,文献研究法是本文采用的基本研究方法。
通过对测试依据文献的全面搜集和梳理,使测试依据以条理化、系统化、简明化的样貌呈现,
总结以往相关研究所使用材料、方法以及所得出的结论,为本研究提供借鉴,在此基础上对
测试依据进行描述、阐释、分析和建构。
(二)比较研究法
本文以测试依据发展历程为纵断面,通过测试依据历时形态的比较,探究其发展脉络和
规律;以测试依据系统的构造类型为横断面,通过测试依据共时形态的比较,分析其异同,
比较其优长与缺陷,探究测试依据的普遍规律和特殊规律。
(三)定性定量综合法
本文采用定性定量综合研究法,以描写、归纳、解释等定性研究方法为基础,同时结
合必要的定量研究方法。测试依据体系的建构、构造类型的定义、具体内容的解读、相互关
系的分析和作用的归纳等,以定性研究为主;具体测试依据的比较、改进建议等内容,辅以
统计分析、比较分析、问卷调查等定量研究支撑。

第四节 研究意义

一、理论意义

(一)本研究旨在探索普通话水平测试依据体系,搭建测试依据研究的理论框架,提出
相对完整的测试依据研究范畴和术语子系统,描述测试依据主要特征,阐释测试依据内在规

8
律,填补测试依据专门研究的空白。
(二)本研究有助于拓展普通话水平测试新的学科研究方向,丰富普通话水平测试学科
体系,促进学科建设。
(三)本研究有利于丰富语言测试理论和语言规划理论。

二、实践意义

(一)本研究有利于促进普通话水平测试工作的健康、规范、持续发展,对修订普通话
水平测试的《管理规定》
《测试大纲》《实施纲要》,推动普通话水平测试的改革、完善和创
新具有现实意义。
(二)本研究可为构建全方位的语言文字能力测评体系提供学术支撑,对提升语言测试
服务能力发挥积极作用。
(三)本研究有助于推动语言本体研究、语言教学研究和语言立法实践研究,为“推广
和规范使用国家通用语言文字”工作提供参考。

9
第二章 普通话水平测试依据的内涵、
范畴体系及特征

第一节 普通话水平测试依据的内涵

一、测试活动要素理论框架

(一)测试活动“四要素”框架
测试依据是本文的研究对象,其作为专门术语的历史并不长。普通话水平测试依据是在
测试活动要素理论框架下诞生的,2011 年,姚喜双等在其专著中首次提出测试活动四要素
构成理论,将测试活动要素分为测试主体、测试对象、测试依据和测试手段等四大类,并对

其进行理论界定和阐释。
测试活动要素构成理论指出普通话水平测试是由“四要素”构成的统一的活动系统,该
理论从唯物辩证法的高度分析测试活动的矛盾运动过程,研究测试内部要素之间相互连结、
相互依赖、相互影响、相互作用等关系,探讨测试活动系统的整体性、相关性及动态性,揭
示测试发展的动因和规律。测试活动要素理论,既是对测试宏观工作内容的全面提炼,也是
对测试活动在语言哲学层面的抽象概括,使得普通话水平测试研究在理论上有了现代系统论
的建构视角,对普通话水平测试研究具有重要的学科方法论意义。
(二)测试活动“三要素”框架
姚喜双等测试活动要素构成理论对普通话水平测试研究有深远的影响,奠定了该领域研
究的理论基础和框架。我们赞同这一理论架构,同时提出两点修正性意见:
一是“测试主体”和“测试客体”的术语名称问题。普通话水平测试活动是施测与受测
间的一种对象性交互活动,在测试实践活动中,二者互为主客体,互为存在的条件。而就每
方自身来说,从不同的角度看,各自同时是这一活动的主体,又是另一方面活动的客体。马
克思主义认识论认为,主体和客体不仅相互联系、相互制约,而且在一定条件下相互转化。
测试员和应试人都有能动的意识,包括关于对象的意识和自我意识,因此都具有主体性的特
征。从评测角度看,测试员是评测实践活动和认识活动的承担者,是评测的主体;从语言输


“测试主体指测试员,测试员在整个测试活动中处于主导地位;测试对象是测试活动的客体,指参加测试
的应试人,他们在测试活动中是不可或缺的一部分;测试依据包括试卷、大纲、评分标准、评分方法以及
等级认定标准等,测试主体根据这些测试依据对测试客体的普通话水平作出客观、公正的评定;测试手段
既包括测试设施,也包括测试活动的组织、管理手段,还包括测试的技术手段,测试手段是测试活动进行
的物质保障。……普通话水平测试系统是由各种要素构成的,但这个系统不是各种要素简单相加,而是按
照一定规律、模式组织运行的,各个要素在运行过程中互相联系、互相作用。”姚喜双、韩玉华、聂丹、黄
庭玮、孟晖:《普通话水平测试概论》,高等教育出版社 2011 年版,第 75 页。
10
出角度看,应试人则是语言输出实践活动的承担者,是语言输出的主体,因此我们认为,将
其中的一方定位于“测试主体”,另一方定位于“测试客体”,似有欠周延之处,如概括为“施
测主体”和“受测对象”可能更为恰当,这样便把二者放到了“施—受”这个同一矛盾体当
中,一个是测试实践活动的实施者,一个是测试实践活动和认识活动指向的对象。
二是“测试活动四要素”建议修改为“测试活动三要素”。姚喜双等《普通话水平测试
常用术语》指出:普通话水平测试实践活动是“施测方(测试机构、测试员、测试管理人员)
按照国家和地方语言文字工作部门颁布的、用于指导国家和地方普通话培训测试机构开展测
试活动的测试依据(等级标准、评分标准、评分方法、试卷等)和规章制度,对受测方(测

试对象)实施测试及相关活动的具体行为过程。
” 在阐释“普通话水平测试活动基本规律”
时指出:“在普通话水平测试中,测试员根据测试依据,运用一定的测试手段,考察测试对
象的普通话面貌,对照规范标准的普通话,对测试对象的普通话水平进行评判,计算分数,

确定等级”
。 以上表述,可通过图 2–1 表示:

图表 1 图 2–1 普通话水平测试活动四要素图解

马克思主义实践论认为,实践是由主体、客体、中介三者构成的。主体是指从事实践活
动的人,客体是指主体活动对象的总和,中介是指把主体和客体联系起来的各种形式的工具、
手段或方法。我们认为作为一种实践活动,测试活动要素可以归纳为:施测主体、受测对象、
测试中介三要素,测试中介是联系主客体的“系体”
,可细分为测试依据和测试手段两个子
要素。普通话水平测试实践活动三要素,可通过图 2–2 表示:

图表 2 图 2–2 普通话水平测试活动三要素图解

相较“测试活动四要素”,
“测试活动三要素”理论架构更加简明,理论建构力更具优势。

二、测试依据的内涵


姚喜双、韩玉华、聂丹、黄庭玮、孟晖:
《普通话水平测试常用术语》,语文出版社 2014 年版,第 137 页。

姚喜双、韩玉华、聂丹、黄庭玮、孟晖:
《普通话水平测试常用术语》
,语文出版社 2014 年版,第 137 页。

11
测试依据是姚喜双等在测试活动要素理论框架下提出的,其内涵也须放到测试活动要素
框架下进行理论解析。
语言测试是对应试人语言能力进行测量评定的社会实践活动,语言测试活动要解决的基
本问题包括:“为什么测”“谁测”
“测谁”“测什么”
“怎么测”。“为什么测”即测试目的,
所有语言测试都是有特定目的的实践活动,测试目的反映社会需求,测试需求与测试发展不
足之间的矛盾是测试实践产生和发展的根本缘由。
“谁测”指向的是施测主体,
“测谁”指向
的是受测对象,二者是测试实践活动开展的实体。“测什么”“怎么测”指向的是测试中介,
涉及到测试的规则、标准、内容以及方法和手段,是联系施测主体和受测对象的津梁。在测
试活动要素理论框架下,我们把测试中介析分为测试依据和测试手段。测试依据和测试手段
共同组成测试中介,构成实现测试预期目的“传导系统”。我们认为,测试手段相较而言侧
重于指具体的“物化”工具、技术和手段,即姚喜双等提出的“测试主体在对测试对象评分

过程中依赖的外部客观条件”
“是测试活动赖以发生、发展的物质保障”; 而“测试依据”
是测试活动实施和运作的各方必须共同遵守的规则和标准,侧重的是文本化的制度性规约。
测试依据的概念有广狭之分,姚喜双等认为:“测试依据指的是测试主体对测试对象评
分时所依据的标准和规定等。在普通话水平测试中,测试依据有大纲、试卷、评分标准以及

等级确定的规定等”
, 这是着眼于狭义的理解。从广义的角度来说,测试活动涉及的运行流
程主要包括但不限于“评分”环节,除了评分依据,它还应包括管理规程等方面的实施依据,
因此我们可以从广义角度上定义测试依据,即:施测主体对受测对象进行语言测评时所依凭
的文本化的制度性规则和标准,包括测试法律法规、管理规定和规程、等级标准、测试大纲、
实施纲要、命题规则、评分标准及方法等。本文采用广义上的测试依据概念。

第二节 普通话水平测试依据的范畴体系

普通话水平测试依据是一个体系,但不是一个平面的系统,而是一个立体的具有层级性
特征的范畴体系。科学划分普通话水平测试依据范畴体系的层级,有利于深刻解析测试依据
的类别,把握测试依据的内在本质。普通话水平测试范畴体系可分为三个层级,包含 2 个一
级范畴、4 个二级范畴和 9 个三级范畴。

一、测试依据一级范畴

测试依据包含 2 个一级范畴:管理依据和学术依据。
管理依据,指开展普通话水平测试所依凭的管理性规则和标准,是对测试活动及其要素
进行组织、控制、协调、统筹等所依凭的规范形式的总和,是测试管理规范的制度化成果。


姚喜双、韩玉华、聂丹、黄庭玮、孟晖:《普通话水平测试概论》
,高等教育出版社 2011 年版,第 83 页。

姚喜双、韩玉华、聂丹、黄庭玮、孟晖:《普通话水平测试概论》
,高等教育出版社 2011 年版,第 80 页。
12
管理依据对测试管理组织、管理机构、参与人员、管理方法和手段等进行约定,是保障测试
活动规范顺畅运转的重要依据。
学术依据,指开展普通话水平测试所依凭的学术性规则和标准,是施测主体对受测对象
实施测试时所依凭的学术性规范标准的总和,是测试学术规范的制度化成果。学术依据是对
测试所需的语言学和测试学的学理规约化、文本化的结果,是保障测试活动科学有效运转的
重要依据。

二、测试依据二级范畴

测试依据包含 4 个二级范畴,其中管理依据包含 2 个二级范畴:宏观管理依据和微观管


理依据;学术依据包含 2 个二级范畴:基础学术依据和具体学术依据。
宏观管理依据,指普通话水平测试在全局和整体层面上的管理依凭,是测试实施所涉及
的法律法规、政策文件等规范的总和,是保障测试活动开展的根本性的管理依据。
微观管理依据,指普通话水平测试在具体执行层面上的管理规则依凭,是测试实施各种
操作性管理规范的总和,是保障测试活动开展的具体管理依据。
基础学术依据,指普通话水平测试根本性、支撑性的学术依凭,是测试实施具有统摄作
用和指导作用的学术规范的总和,是保障测试活动开展的学术基础。
具体学术依据,指普通话水平测试具体化、操作性的学术依凭,是测试实施具有执行性
作用的学术规范的总和,是保障测试活动开展的细节明确的应用性学术依据。

三、测试依据三级范畴

测试依据包含 9 个三级范畴,其中宏观管理依据包含 2 个三级范畴:法律法规依据和政


策文件依据;微观管理依据包含 2 个三级范畴:业务管理依据和其他管理依据;基础学术依
据包含 2 个三级范畴:等级标准、测试大纲;具体学术依据包含 3 个三级范畴:实施纲要、
命题依据和评分依据。
法律法规依据,指由国家立法机构及有关部门制定和颁布,保障普通话水平测试开展的
法律法规依凭的总和,包括国家法律、地方性法规和国务院部门规章以及地方规章。
政策文件依据,指由党中央国务院及国家有关部门制定和发布,对普通话水平测试具有
权威性、指导性或规定意义的政策文件的总和。
业务管理依据,指由普通话水平测试管理部门制定和发布,保障普通话水平测试开展的
业务管理工作依凭的总和,是对测试专项业务的性质、内容、范围及其运作规范等做出系统
规定的具有部门行政约束力的依据。
其他管理依据,主要是指财务管理依据,即由财务主管部门制定,保障普通话水平测试
开展的财务管理工作依凭的总和,是对测试专项的财务工作规范做出系统规定的依据。
等级标准,指由国家语言文字主管部门制定和发布,规定普通话水平测试等级划分、描
述普通话水平测试等级特征的标准体系,是测试最基本的学术依据。
13
测试大纲,指由国家语言文字主管部门制定和发布,规定普通话水平测试名称、性质、
方式,阐明测试内容和范围,明确试卷构成、评分和应试人普通话水平等级确定方式的规范
性文本,是测试体系架构的基本学术依据。
实施纲要,指由国家测试机构编制,国家语言文字主管部门审定,规定普通话水平测试
详细内容的规范性文本,是测试操作实施的具体的学术依据。
命题依据,指由国家测试机构制定,规定普通话水平测试试题设计、试题命制的学术依
凭,是测试试题生产程序中具体的学术规范的总和。
评分依据,指由国家和地方测试机构制定,规定普通话水平测试评分体系、评分要素、
评分规则的具体的学术依凭。
普通话水平测试依据范畴体系以图 2–3 表示如下:

图表 3 图 2–3 普通话水平测试依据范畴体系

第三节 普通话水平测试依据的特征

测试依据作为测试活动的核心中介要素,具有以下主要特征:凭信性、规约性、层次性。

一、凭信性

测试依据具有凭信性,凭信性指两方面特征,一是可凭性,二是可信性。
(一)可凭性

14
可凭性,指的是可资“遵凭”,可凭性是测试依据的显著特征。普通话水平测试既是国
家推广普通话事业的一项工作,也是一种具有学科特色的学术实践,作为社会活动它必然由
种种规则和标准即测试依据维系,否则难以顺畅运行。测试依据是实施测试活动的规则体系,
为测试活动提供遵照依凭文本,它把抽象的制度设计和学理根据具化为一套可操作的标准,
使每一位参与者(施测主体和受测对象)对普通话水平测试运行所依凭的事实处于“已知”
状态,可以正确地预期测试行为,能够以此为指引并遵照执行,同时也使普通话水平测试运
行的各个环节处于可控状态,可以保障测试行为规则化运行。
(二)可信性
可信性,也即可靠性,可信性是测试依据的另一个显著特征。测试依据作为实施测试活
动的规则和标准体系,必须是可以信赖、可以依靠的。测试依据“可信可靠”的特征体现为
三个方面:自恰性、稳定性和统一性。
首先,测试依据可信可靠应具有“自恰性”
。任何测试依据都会具有规则计划的不圆满
性,但普通话水平测试依据同时又具备自恰性,即按照自身的逻辑体系,自己可以证明自己
至少是不矛盾的或者错误的。普通话水平测试无论是作为一项工作还是科学研究,本身都是
具有自恰性的,这是测试依据可信可靠的重要原因。
其次,测试依据可信可靠应具有“稳定性”
。历时地看,测试依据具有变动性,它随着
测试实践的发展和条件的变化而发展变化,但无论怎样发展变化,都必须随着新的需求打破
原有的自恰,产生新的测试依据,进而进入新的自恰。共时地看,测试依据具有相对稳定的
特征,语言测试是评价应试人语言水平的工具,一旦形成规则标准,在一定时间内,至少在
短时期内不能随意更改。
第三,测试依据要可信可靠还应具有“统一性”
。普通话水平测试是公共测试,涵盖地
域和领域广泛,涉及的机构和人员众多,因此要求统一的测试依据以保证测试的可信可靠。
统一的测试依据,包括统一的测试等级标准、统一的测试大纲、统一的测试规程、统一的测
试等级证书(统称“四统一”
)。
自恰性、稳定性和统一性是保障测试依据可信可靠的内在需求和根本保障,也是测试规
范性的客观要求。

二、规约性

测试依据具有规约性,规约性体现为两个方面,一是强制性,二是调适性。
(一)规约强制性
测试依据是测试活动参与者必须共同遵守的规则和标准体系,普通话水平测试中有一些
属于法律依据或法规依据,如《语言文字法》
《测试管理规定》等是国家制定或认可,由国
家强制力保证实施的,因此对参与者而言,具有执行的强制性和普遍约束力,参与者必须严
格遵循,不得改变,不得变通,此即测试依据的强制性。
(二)规约调适性
15
普通话水平测试中,有一些测试依据是对测试的实施环节和要素进行具体的约定,它们
多由国家业务主管部门制定,属于操作性规约,如《测试大纲》对测试的性质、目的、要求、
工作原则以及测试方式和范围、评分系统和方法等进行约定。这些测试依据也是具有约束力
的规定,但在执行时有一定调适性,例如《测试大纲》允许各省级语委根据实际情况,自主
决定“选择判断”测试项的取舍;又如某些地方根据《测试大纲》评分规则制定的评分细则,
也是在遵循《测试大纲》评分原则的前提下做出的调适性约定。
测试活动根据测试依据维持运转和秩序,只有依规而行才是许可的行为。尽管强制性和
调适性体现出测试依据强制力和效力范畴的某些差异,但二者都体现了测试依据的限制性,
只要是依据便具有规约性,便具有绝对的或相对的约束力。测试依据规约性中包含着测试参
与者切身的利害关系,因此它是普遍存在的,也是不可消除的。测试依据规约性是测试依据
的本质属性之一,是测试权威性的内在需要。

三、层次性

测试依据具有层次性,测试依据是由诸多要素组成的系统,诸要素在地位与作用、结构
与功能上表现出等级统摄性和系统关联性,因此测试依据的层次性包含两个方面:等级性和
类型性。
(一)层次等级性
纵向地看,测试依据具有层次等级性。普通话水平测试依据是高层次系统、低层次系统
套叠并协同整合的统一系统,高层次系统制约低层次系统,低层次系统受制于高层次系统,
但却有自身一定的独立性。从测试依据统摄力和广适性角度而言,宏观管理依据处于系统的
最高层次,其中法律依据是第一层次,法规依据是第二层次,微观管理依据和基本学术依据
处于第三层次,具体学术依据处于第四层次,第四层次之下还可划分出更细的层次。以具体
的测试依据文本为例,《语言文字法》是在全国范围发挥效力的法律依据,统摄力和广适性
居最高层次;《测试管理规定》是国务院部门规章,具有法规效力,统摄力和广适性居第二
层次;
《测试规程》和《等级标准》《测试大纲》是根据《语言文字法》和《测试管理规定》
制定的管理依据和基本学术依据,分别在测试工作领域和测试学术规范领域发生效力,统摄
力和广适性居第三层次;《实施纲要》主要依据《测试管理规定》和《测试大纲》编制,是
测试操作实施的纲领性学术依据,统摄力和广适性居第四层次;命题使用的测试用词表、朗
读作品、话题题目等是《实施纲要》的具体组成部分,规定测试的具体范围和内容,统摄力
和广适性居第五层次。以上充分显示出测试依据的层次序列等级性。
(二)层次类型性
横向地看,测试依据具有层次类型性。测试依据作为一个系统,其层次具有多样性特征,
可从不同角度进行不同的类型划分。我们可以按照组织机构类型划分层次系统,如国家级测
试依据、省级测试依据、地市级测试依据;也可以按照发展历程划分层次系统,如初期测试
依据、发展期测试依据、成熟期测试依据;还可以按照客观的性质状态划分层次,如管理依
16
据、学术依据。测试依据的层次类型性,是测试依据实践多种状态及其共性的客观反映,测
试依据不但可以划分为不同层次等级,而且还可以划分出不同的类型,每一类型贯穿不同层
次等级,一定层次等级也横跨多种类型。层次等级性和类型性是紧密联系的,二者纵横交错,
构成测试依据的体系之网。

17
第三章 普通话水平测试依据发展历程
测试依据伴随着普通话水平测试实践产生和发展。从探索酝酿算起,普通话水平测试已
有 30 多年的发展历程,随着测试实践的发展,测试依据呈现鲜明的阶段性发展的特点。本
章梳理测试依据发展历程,为测试依据研究搭建总体的纵向坐标,并分析各个阶段的背景、
发展特点及发展规律,为探究测试依据发展规律奠定基础。

第一节 普通话水平测试依据发展分期

一、普通话水平测试发展历程的分期

学界关于测试发展历程的分期,归纳起来大致有“二分法”
“三分法”
“四分法”和“两

阶段四时期”等分期方法。 表 3–1“普通话水平测试发展历程分期法比较”反映了研究者
的不同看法:

图表 4 表 3–1 普通话水平测试发展历程分期法比较

内 容
提出时间 提出者 文 献 分 期
分期法
《国家普通话水平测试
课题研究(1994 年前)
回顾与展望——纪念开
二分法 2009 年 韩其洲
展普通话水平测试 15 周
组织实施(1994 年后)
年》
国家语委 议论酝酿(1988 年前)
早期 普通话 《普通话水平测试的理 研制等级标准和测试大纲(1988
1998 年
三分法 培训测试 论与实践》 年~1994 年)
中心 开展测试工作(1994 年后)
姚喜双
《普通话水平测试概论》
韩玉华 酝酿研制阶段(1982 年~1994 年)
2011 年
新三分法 聂 丹 组织实施阶段(1994 年~2001 年)
2012 年 《普通话水平测试发展
黄庭玮 发展创新阶段(2001 年至今)
历程研究》
孟 晖
酝酿期(1982 年~1993 年)
《普通话水平测试研究 初创期(1994 年~1999 年)
四分法 2012 年 聂 丹
概说》 发展期(2000 年~2005 年)
深化期(2006 年~2011 年)


王晖、曹昭、云天骄:
《普通话水平测试发展历程的分期》,
《语言文字应用》2013 年第 3 期,第 115~126
页。
18
第一阶段 酝酿探索阶段(1982
年~1994 年)
萌芽酝酿时期(1982 年~1988 年)
立项研制时期(1988 年~1994 年)
王 晖
两阶段 《普通话水平测试发展
2013 年 曹 昭
四时期法 历程的分期》 第二阶段 实施发展阶段(1994 年
云天骄
至今)
起步初创时期(1994 年~2000 年
底)
规范拓展时期(2001 年至今)

表 3–1 中“二分法”和“早期三分法”尚停留在对测试工作爬梳整理层面,略显粗疏,
未对各阶段特点进行深入探讨,对分期的依据也未进行理论阐述,学术性稍显薄弱,但其划
段界标的处理,客观上贡献了一种分期的思路,对探讨普通话水平测试发展历程分期有一定
参考价值。
姚喜双等《普通话水平测试概论》和韩玉华《普通话水平测试发展历程研究》提出“新
三分法”,相较以上两种分期方法,
“新三分法”的划界标准清晰,阶段特征明显,是一个明
显的进步。从学术发展史来看,姚喜双、韩玉华等人的研究首次对测试发展历程进行学术性
系统研究,注重寻求和探讨分期的“划段界标”特征,把测试阶段划分放到测试实践发展的
历史格局中进行,首次尝试从学术视角对普通话水平测试发展历程进行理论解析。
聂丹的专著《普通话水平测试研究概说》提出了“四分法”,这是在姚喜双、韩玉华等
“新三分法”基础上的进一步细化,其特点是对计算机辅助普通话水平测试技术带来的发展
变化予以特别的关注和重视,并给予独立地位,单独划分出一个新的时期,体现出新的思考。
王晖、曹昭、云天骄《普通话水平测试发展历程的分期》提出“两阶段四时期法”。该
文是关于普通话水平测试发展历程分期的集成性文献,不仅提出了新的划分方法,还提出三
维度综合考量的划分原则,重视代表性成果的界标作用,具有方法论的意义。
学界关于测试发展历程分期的上述成果,各有优长和理据,也存在各自不足,为本文研
究提供了很好的基础。

二、测试依据发展历程的分期

从逻辑上讲,测试依据发展历程分期与普通话水平测试发展历程的分期是一致的,而且
由于是普通话水平测试活动的核心要素,测试依据还往往是普通话水平测试发展阶段的界标
性成果。测试依据发展历程的分期应当置于普通话水平测试整体发展历程的框架内,典型的
管理依据和学术依据的发展,既是测试依据体系建设的内容,又是测试依据体系发展的外在
表征。王晖等为代表的“两阶段四时期法”,综合了以往研究的优长,尤其注重代表性成果
的提取和界标的设定,该分期法的三个界标中有两个直接以测试依据为界标:三部委《关于
开展普通话水平测试工作的决定》(简称“三部委《决定》”)及《语言文字法》颁布实施,

19
解释性和操作性较强。本文对“两阶段四时期法”进行必要的修正,提出“两阶段五时期”
的新方法,并以此构建研究的纵向框架。
第一阶段是酝酿探索阶段(1982 年~1994 年),第二阶段是实施发展阶段(1994 年至
今),两段的分段界标是:“三部委《决定》
”文件的出台(1994 年 10 月)。
酝酿探索阶段划分为两个时期:第一个时期是萌芽时期(1982 年~1988 年)
,第二个时
期是研发时期(1988 年~1994 年),两期的分期界标为国家语委成立“普通话水平测试等级
标准”课题组(1988 年底)。
实施发展阶段划分为三个时期:第一个时期是初创时期(1994 年~2000 年底),第二个
时期是规范时期(2000 年底~2007 年)
,第三个时期是拓展时期(2007 年至今)。初创时期
和规范时期的分期界标为《语言文字法》颁布实施(2000 年底),规范时期和拓展时期的分
期界标为计算机辅助普通话水平测试正式试点(2007 年)。
测试依据发展历程的分期以图 3–1 表示如下:

图表 5 图 3–1 普通话水平测试依据发展历程分期

第二节 酝酿探索阶段的普通话水平测试依据

酝酿探索阶段,普通话水平测试依据尚处萌发期。管理依据方面,宏观管理依据以顶层
设计的面貌出现,全国性微观管理依据尚未出台,但开始出现地方性探索。学术依据方面,
基础学术依据开展得最早也比较充分,经专家及地方机构的自发研究和国家主管机构有组织

20
的自觉研发两个时期的相继推进,全国性基础学术依据最终成型,具体学术依据开始初步探
索,但不够系统和深入。

一、酝酿探索阶段的管理依据

(一)萌芽时期(1982 年~1988 年)的管理依据


1.概况
萌芽时期普通话水平测试的管理依据首先在法律法规依据方面取得突破,而且是在国家
根本大法——《宪法》中获得保障。此后,根据《宪法》要求,国家语言文字工作部门着手
制定新的政策文件,产生了《新时期的语言文字工作》为代表的政策文件依据。
2.代表性成果
(1)《中华人民共和国宪法》
1982 新《宪法》颁布实施,
《宪法》第十九条第五款新增“国家推广全国通用的普通话”

的规定, 首次在国家根本大法中明确了普通话“全国通用”的法律地位,推广普通话第一
次上升为我国法律层面的国家意志,因此具有划时代的意义。
“国家推广全国通用的普通话”
的规定是适应新时期政治、经济、文化、社会发展的需要,把握我国语言实际使用状况和历
史发展趋势,着眼于解决语言应用主要矛盾,在总结新中国成立以来推普工作经验基础上提
出的。新《宪法》把推广普通话工作推到新的历史阶段,是新时期推广普通话工作的总布局、
总任务和总依据。《宪法》为普通话水平测试提供了坚实的国家需求背景和最为重要的、最
为根本的管理依据来源。

(2)《新时期的语言文字工作》
该报告把推广普通话列为新时期国家语言文字工作的首要任务,关于普通话等级要求分

三级的设想更是成为报告的一大亮点,提出普通话的要求初步分为三级。 《新时期的语言
文字工作》把各地探索的实践经验和学者的学术智慧转化为国家语言文字规划,把普通话水
平等级要求纳入国家语言文字工作的全局范畴,普通话水平测试的蓝图首次在国家语言文字
规划层面展现出来。
(二)研发时期(1988 年~1994 年)的管理依据
1.概况
研发时期,全国推广普通话事业根据《宪法》要求进行新的布局和调整,该时期普通话
水平测试工作实践还未开展,理论探讨和路径探索是这一阶段的主要任务。测试管理依据在
全国层面的成果主要体现在宏观管理依据尤其是政策文件依据方面,这个特点是测试实践发


《中华人民共和国宪法(1982 年)
》,中国人大网:http://www.npc.gov.cn/ wxzl/wxzl/2000-12/06/
content_4421.htm。

《新时期的语言文字工作》是 1986 年全国语言文字工作会议的主题报告。

三级的要求分别是:“第一级是会说相当标准的普通话,语音、词汇、语法很少差错;第二级是会说比较
标准的普通话,方音不太重,词汇、语法较少差错;第三级是会说一般的普通话,不同方言区的人能够听
懂。”参见刘导生《新时期的语言文字工作》 ,《语文建设》1986 年第 1、2 期,第 10 页。
21
展阶段所决定的;在测试工作开展较早的省份出现一些微观管理依据,为制定全国性微观管
理依据提供了经验。
2.代表性成果
(1)《国家语言文字工作十年规划和“八五”计划纲要》

该计划纲要首次对 20 世纪 50 年代提出的推普工作方针进行调整, 弃用“大力提倡”
的表述,这是因为《宪法》已经把推广普通话列为国家意志和国家行为,推普不只是“提议、
倡导”的工作,而已是政府责任以及公民的义务。“重点推行”调整为“大力推行”,“逐步
普及”调整为“积极普及”
,体现了新时期推普工作在广度、深度和力度上的新要求,
“逐步
提高”则首次对普通话普及的质量提出了要求。推普“十二字”新方针要求推广普通话要有
新的举措,衡量推普工作质量则直接对评估和测试提出了客观的需求。该计划纲要对测试起
到了重要促进作用。
(2)《云南省普通话水平测试中心章程》和《云南省普通话水平测试规程》
云南省普通话测试工作起步较早,萌芽时期即已开展测试实践的探索,20 世纪 90 年代
初是云南省普通话水平测试实践取得较大成绩的时期,1992 年全国首家省级测试机构——
“云南省普通话水平测试中心”成立,该中心一方面着手进行测试标准、题库建设等学术依
据的研究,一方面着手制度、规章等管理依据的探索,《云南省普通话水平测试中心章程》
《云南省普通话水平测试规程》两种管理依据便是其突出成果。《云南省普通话水平测试中
心章程》并非省测试中心的内部章程,内容涉及地、州、市级测试站,因此是云南省域内测
试管理的章程。该章程对测试机构、测试宗旨和任务、测试对象和要求、测评人员、管理办
法等方面进行了约定,是全国范围内第一次针对测试专项工作提出的管理依据,对制定全国
性的管理依据具有启发意义。《云南省普通话水平测试规程》主要对测试流程的规范化操作
进行规定,内容包括组织程序、测试程序、测评员职责、测试后工作(包括复审、抽查、归
档、颁证、总结、评估)、档案格式要求(包括录音、录音卡、成绩登记表)等,该规程内
容较为全面,为制定全国性测试规程提供了可资借鉴的实践版本。

二、酝酿探索阶段的学术依据

(一)萌芽时期(1982 年~1988 年)的学术依据及其研究


1.概况
萌芽时期普通话水平测试学术依据尚未成型,开始出现等级标准的探讨和测试方案的设
计,以专家学者的自发性研究和地方语言文字工作机构的探索性实践为主要形式。1982 年

《普通话等级标准条例草案》是目前发现的最早的普通话水平测试研究文献, 此后一批学
者探讨标准、设计方案,在学术界形成一个研究的热潮。


20 世纪 50 年代的推普方针为“大力提倡、重点推行、逐步普及”,调整后的推普方针为“大力推行、积
极普及、逐步提高” 。

《普通话等级标准条例草案》由北京市语言学会普通话等级标准研究小组提出,参见孙修章《“普通话水
平测试标准”的研制与实践》 ,《语言文字应用》1992 年第 1 期,第 12 页。
22
2.代表性成果
(1)《略论汉语口语规范》
萌芽时期最具有代表性的学术依据研究成果是陈章太 1983 年发表的《略论汉语口语的
规范》
。该文明确提出汉语口语规范三个等级的要求,奠定了测试等级设计的学术依据基础。
陈文还为测试对象的确立提供了思路并对不同对象的等级要求进行了区别性探讨,文中蕴含

的规范度、规范域等规范思想,对制订普通话水平测试评分依据具有启发意义。 该文是最
早系统性阐述普通话水平测试等级标准的文章,不仅开辟了学术界关于普通话水平测试学术
依据的探讨领域,具有拓荒引领意义,而且对国家语言规划产生了直接的、深远的影响,其
学术建议转化为 1986 年全国语言文字工作会议主报告的一部分,正式成为国家语言规划的
内容之一。因此,我们认为《略论汉语口语规范》可以说是普通话水平测试研究的“破题”
之作,也称得上研究普通话水平测试基础学术依据的开篇之作和扛鼎之作。
(2)《语文建设》杂志的系列文章
1986 年全国语言文字工作会议之后,
《语文建设》杂志作为国家语委主管的机关刊物和
学术刊物,成为讨论测试学术问题的主要平台,“陆续刊载论述普通话水平测试的文章,将

标准和测试的研究提到一个新水平。” 其中以下几篇较有影响:
①《普通话水平测试刍议》
鲁允中 1987 年发表的《普通话水平测试刍议》旨在拟定一个“具体的、科学的包括所

有语言因素在内的测试原则和测试方法,以提高测试的有效程度和可信程度”。 该文采纳陈
章太普通话水平分三级的构想,提出“宽式的三级标准”,并对每一等级的成绩(一级 750
分以上,二级 670 分以上,三级 529 分)和具体的语言表现做出明确规定。该文是较早探讨
普通话水平测试具体评分依据的文章,文章还提出“允许灵活地掌握达标标准”的主张,对
制定普通话水平测试等级要求等管理依据也有启发意义。
②《中师生普通话考核标准问题的探讨》
庄守常 1987 年发表的《中师生普通话考核标准问题的探讨》主要围绕“中等师范学校
学生”这一特定群体的普通话考核问题进行探讨。文章指出中师生“普通话考核的主要内容

是语音,同时兼顾词汇和语法”, 文章还对声母、韵母、声调以及轻声、儿化、变调等音变
现象的考核要求和评分标准进行讨论,拟定了中师生普通话考核的合格标准,即语流中的音
节正确率(包括声韵调及音变)“在朗读中,正确率不低于 95%,在口语(指工作、学习用

语)中不低于 90%。
” 该文虽着眼于特定领域和专门人群,但对具体语音标准的探讨比较细
密,是拟制测试具体评分依据的有效参考。


陈章太:《略论汉语口语规范》,陈章太《语言规划研究》第 232~248 页,商务印书馆 2005 年版,原载《中
国语文》1983 年第 6 期。

孙修章:《“普通话水平测试标准”的研制与实践》, 《语言文字应用》1992 年第 1 期,第 12 页。

鲁允中:《普通话水平测试刍议》 ,《语文建设》1987 年第 3 期,第 21 页。

庄守常:《中师生普通话考核标准问题的探讨》 ,《语文建设》1987 年第 3 期,第 21 页。

庄守常:《中师生普通话考核标准问题的探讨》 ,《语文建设》1987 年第 3 期,第 23 页。
23
③《普通话测试可行性分析》
厉兵 1988 年发表的《普通话测试可行性分析》对普通话水平测试的特性、测试目标进
行了比较深入的探讨,提出一套建议性的测试方案,尤其可贵的是对测试题型、测试要素和
测试分值权重的设计很具有启发性。该文主张“普通话测试,严格地说,应当称作普通话口
语测试……属于语言能力的考察和评价……但不是总体意义上的语言能力的测试”,因此建

议“测试重点放在普通话语音面貌上”
, 这些见解对确立测试目标,阐释测试的学术理据,
乃至研制《测试大纲》等基础性学术依据都具有重要的参考意义。该文提出“提高效度和信
度”是确保测试质量的关键,这在测试研究的萌芽阶段是相当可贵的。
(3)地方语言文字工作机构的探索性实践
①云南省普通话水平测试实践

云南省 1982 年即开始实施全省师范院校普通话统一考试。 1986 年之后,云南省积极
贯彻全国语言文字工作会议精神,根据会议提出的“普通话三级标准”,探索测试新的途径
和方法。1987 年云南师范大学推出“普通话标准化水平考试”,开始把标准化考试引入普通
话测试。该方案将普通话测试设计为笔试和口试两部分:笔试为 100 个词语的汉语拼音选择
题;口试分四部分:读 100 个音节;读 100 个词语;3 分钟话题选题说话; 3 分钟短文朗读。
根据应试人笔试、口试的总成绩,按一、二、三级定级。云南省语委办对云南师师范大学的
探索予以肯定,并依照该方案对全省师范院校毕业生进行了两年统一测试。云南省的探索包
括测试方式、内容、题型、测试长度、定级方法等诸多方面,这些探索对普通话水平测试的
基础学术依据和具体学术依据都具有先锋试验意义。
②河北师范大学普通话水平测试实践
师范院校对普通话水平测试既有现实的需求,又有实施的科研基础和组织基础,师范院
校的早期实践,对普通话水平测试具有重要的探索意义,萌芽时期除了云南师范大学,较有
代表性的还有河北师范大学,金慧宁 1988 年发表的《我们测试普通话的标准和方法》介绍
了其做法。河北师范大学以 1986 年国家语委提出的“普通话三级标准”为框架,根据“宽

严适度原则、针对性原则、量化原则”, 设计了一套量化测试方案。该方案把测试分为语音
测试和综合测试两大部分,语音测试细分为声韵调单项测试和声韵调配合测试(即读双音节
词语)两部分,综合测试细分为朗读(150 音节)和自由谈话(不少于两分钟)。该方案总
分为 623 分,一级最低分 568 分,二级最低分 511 分,三级最低分 429 分。以上探索是很有
意义的,测试模式(完全的口试方式)、测试内容(音节、词语、朗读、谈话)的设计及按
音节定量分析的操作方法,为普通话水平测试学术依据提供了鲜活的实例。
在萌芽时期,除了云南省和河北师范大学的实践,全国还有其他省份对普通话水平测试


厉兵:《普通话测试可行性分析》 ,《语文建设》1988 年第 4 期,第 16~18 页。

“1982—1986 年,普通话考试包括笔试和口试两种形式:笔试由省统一命题,主要考察掌握汉语拼音的
熟练程度;口试由各校自己进行,主要考察普通话的运用能力。 ”详参张茀:《云南省普通话水平测试科研
述评》 ,云南省普通话水平测试中心编《普通话水平测试工作文集》,语文出版社 1996 年版,第 40 页。

金慧宁:《我们测试普通话的标准和方法》 ,《语文建设》1988 年第 5 期,第 27 页。
24
进行了初步探索,例如辽宁省制定的“教师汉语拼音及普通话等级考核方案”,黑龙江省制

定的“中师普通话考核标准和办法”,河南省也对普通话标准和测试进行了探索和实践。
学者或学术机构的自发性研究和地方语言文字工作机构的探索性实践,使国家普通话水
平测试具有了学术探索和实践经验的双重基础。
(二)研发时期(1988 年~1994 年)的学术依据
1.概况
以 1988 年底国家语委成立“普通话水平测试等级标准”课题组(由国家社会科学基金
(93BYY010)资助)为标志,测试依据发展进入研发时期。该时期是普通话水平测试学术依
据奠基和成型的关键时期,其突出特征是基础理论研究和应用方案研究并重。在这一时期,
国家语言文字规划机构充分发挥“国家队”的作用,以集体性学术研究和实验为主要形式,
辅以地方机构的探索,研发了普通话水平测试的《等级标准》和《测试大纲》这两大标志性
成果,构建了普通话水平测试坚实的理论和实践基石。
2.代表性成果
(1)《普通话水平测试等级标准(试行)》
等级标准是普通话水平测试最基础、最根本的学术依据。萌芽时期陈章太提出“三级”
的设想,并进行了等级特征的初步概括,但这还仅仅是设想的方案,并非直接适用于测试实
践的操作性标准,制订等级标准成为研发时期首要的历史任务。1988年国家语委“普通话水
平测试等级标准”课题组成立,孙修章和于根元为负责人,课题组成员以国家语委专家为主
体。课题组历时三年,进行了具有开创性的设计研究,经过多次调研验证和试测调整,1991

年课题通过论证。1992年《等级标准》经修改,由国家语委原普通话推广司印发试行, 标
志着普通话水平测试“三级六等”等级框架正式确立,
《等级标准》描述了六个等次的特征,
划定了等级分数线,还对测试项目的设置、各测试项评分比例、记分方法和测试时间等进行
了设计。课题组以勇于创新的科研精神,科学严谨的科研作风和卓越的研究成果,构筑了实
施普通话水平测试的第一块基石。
(2)《普通话水平测试大纲》
《测试大纲》根据《等级标准》制定,是体现和实现《等级标准》的重要学术依据,也
是测试操作的实施蓝本,其重要性显而易见。1992 年国家语委组织《测试大纲》研制课题
组和学术委员会。在“普通话水平测试等级标准”课题组研究基础上,进一步完善。经过课
题组努力,1994 年 6 月《测试大纲》定稿。
《测试大纲》规定了测试的内容、范围、题型和
要求,使测试有了切实的具体可靠的实施依据,对保证普通话水平测试顺利启动和开展提供
了操作蓝本。《测试大纲》编制的完成,标志着开展普通话水平测试的学术依据准备最终完
成,普通话水平测试最终“定型”

(3)地方实践探索


孙修章:《
“普通话水平测试标准”的研制与实践》,
《语言文字应用》1992 年第 1 期,第 12 页。

孙修章:《
“普通话水平测试标准”的研制与实践》,
《语言文字应用》1992 年第 1 期,第 12 页。
25
研发时期,除了国家语委研发团队,地方的探索实践也发挥了“试验田”的作用,尤以
云南省的贡献最大。1989 年云南省语委办在总结萌芽时期工作经验的同时,广泛征询师范
院校和专家意见,决定自 1989 年底试行口语测试,对测试大纲、评分标准和操作规程进行
修改。“自 1990 年开始,全省师范院校普通话统考取消了笔试,统一进行口语测试,并连

续三年实行全省集中评卷”。 1991 年国家语委“普通话水平测试等级标准”课题组负责人
孙修章到云南省调研,从那时起,云南省普通话测试在方向上向国家语委的方案靠拢,并在
以下方面取得突出的成果:一是探讨确定了测试目标和方式,明确了测试目标是检测应试人
的普通话水平,测试中应尽可能排除非普通话因素,笔试和汉语拼音考核因背离这个目标,
最终被取消。二是确定了评测题型,根据测试目标,把测试题型确定为读单字、读词语、读
短文(朗读)、说话四项。三是制定了评分方法和细则,读单字、读词语、读短文(朗读)
完全采用量化评分,说话采用定量定性相结合的评分方法。1992 年云南省普通话水平测试
中心还开展了一项有探索意义的工作——题库建设,在题库建设原则、方法、方式和技术指
标方面进行初步探讨。可以说在研发时期,云南省在国家语委课题组指导下的探索是全方位
的和富有成效的,初步建立了普通话三级六等的评定体系和操作框架,对普通话水平测试学
术依据的实证性探索具有开拓意义。

三、综括

纵观酝酿探索阶段,普通话水平测试依据经历了富有成效的探索。《宪法》赋予推广普
通话国家基本语言政策的地位,推广普通话上升为国家意志和国家责任,普通话水平测试萌
发具备了最主要的催生力量。国家语言文字工作部门积极落实《宪法》要求,从国家宏观语
言规划的角度,汇集学界智慧和地方探索经验,以需求为导向,以实践为基础,以学理为支
撑,在普通话水平测试路径设计和引导地方实践方面发挥了规划、引领的作用。全国不少语
言学者和地方语文工作者也进行了积极的探索,为测试研究贡献了学术智慧和实践经验,并
与国家语委形成有效互动。在这种背景下,普通话水平测试依据取得重要进展。
测试管理依据方面,宏观管理依据以顶层设计的面貌出现,产生出《宪法》这样的法律
依据和《新时期的语言文字工作》《国家语言文字工作十年规划和“八五”计划纲要》等带
有全局规划性的政策文件依据。全国性微观管理依据尚未出台,但开始出现地方性探索,如
《云南省普通话水平测试中心章程》和《云南省普通话水平测试规程》等,为制定适用于全
国的微观管理依据提供了宝贵经验。
学术依据方面,基础学术依据开展得最早也比较充分,经专家及地方机构的自发研究和
国家主管机构有组织的自觉研发两个时期的相继推进,全国性基础学术依据最终成型。最具
标志性的基础学术依据《等级标准》和《测试大纲》的研制,主要由国家语委组织规划,国
家语委研究机构和研究人员承担,国家语委刊物《语文建设》
(包括其前身《文字改革》)发


张茀:《云南省普通话水平测试科研述评》,云南省普通话水平测试中心编《普通话水平测试工作文集》语
文出版社 1996 年版,第 42 页。
26
挥科研成果研讨主阵地的作用,这些都既体现出国家语言文字主管部门对普通话水平测试工
作的职责担当,也反映出测试工作从孕育时期,就打下了国家语言规划的鲜明烙印。具体学
术依据开始初步探索,最主要的具体学术依据是《测试大纲》附属的测试内容、范围、题型
等部分,另外有代表性的还有云南省制定的评分方法、细则和题库建设方面的探索等。整体
来说,测试具体学术依据的研究取得了一些成绩,但尚不够系统和深入,有待进一步挖掘和
完善。
整个酝酿探索阶段的测试依据,从社会需求、国家需要,到学者探讨、地方实践,再到
纳入国家语言文字工作宏观规划并立项研发,发展脉络明晰。命题—破题—奠基—成型,等
级设想—等级标准—测试大纲—细则和题库,可以这样概括:规划有序,科研扎实、实践务
实,各种因素协调互动,政府主导、语委统筹、地方配合、学者支持,普通话水平测试依据
框架就这样艰辛而又顺理成章地搭建起来了,这堪称是我国语言规划富有成效的一个突出范
例。管理依据“起意”在前,学术依据“布局”于后,宏观基础依据“谋全篇”
,微观具体
依据“下细棋”,可谓是双擎推动,两翼互动。用“出场学”的理论来概括,从 “出场路径”
来说,酝酿探索阶段管理依据推动是其主要动力;就“出场形态”而言,管理依据和学术依
据二合一是其出场的“定妆”形态。

第三节 实施发展阶段的普通话水平测试依据

实施发展阶段是普通话水平测试依据全面实践、规范和创新发展的阶段。管理依据方面,
宏观管理依据形成体系,全国性和地方微观管理依据出台并不断完善。学术依据方面,基础
学术依据有充分的发展,具体学术依据探究深入并渐成体系。

一、实施发展阶段的管理依据

(一)初创时期(1994 年~2000 年底)的管理依据


1.概况
初创时期普通话水平测试刚刚起步,全方位实践刚刚开始。宏观管理依据方面,我国第

一部关于语言文字的专门法律于1996年10月开始纳入全国人大的立法程序, 普通话水平测
试的法律法规依据开始迈出关键的一步。政策文件依据则以1994年“三部委《决定》”和1997
年全国语言文字工作会议大会报告——《开拓语言文字工作新局面,为把社会主义现代化建
设事业全面推向21世纪服务》为代表。微观的管理依据方面,1994年《普通话水平测试实施
办法(试行)》和1997年《国家语言文字工作委员会关于普通话水平测试管理工作的若干规
定(试行)
》是初创时期微观业务管理依据的突出成果。


《全国人大教育科学文化卫生委员会关于提请审议〈中华人民共和国国家通用语言文字法(草案)的议案〉
》,
参见全国人大教科文卫委员会教育室、教育部语言文字应用管理司编《中华人民共和国国家通用语言文字
法学习读本》语文出版社 2001 年版,第 10 页。
27
2.代表性成果
(1)宏观管理依据代表性成果

①三部委《关于开展普通话水平测试工作的决定》
1994年的“三部委《决定》”是测试实施的第一份政策文件依据,也被学术界认为是普
通话水平测试工作正式启动的肇端。“三部委《决定》”对特定领域岗位人员开展测试进行
了规定,提出了相关人员的普通话等级要求,同时对普通话等级证书制度进行了预设性规定,
还提出建立测试领导机构和执行机构。“三部委《决定》”由国家语言文字主管部门会同教
育、广电两大语言文字应用领域的主管部门共同下发,成为开展测试的纲领性文件和依据。

②《开拓语言文字工作新局面,为把社会主义现代化建设事业全面推向21世纪服务》
作为1997年全国语言文字工作会议的主题报告,该文用很大篇幅论及普通话水平测试,

以“使普通话推广工作迈上了新台阶” 对测试的意义和成效予以充分肯定。报告对测试工
作下一步发展提出明确要求,着重强调强化管理,促进测试工作科学化、现代化以满足社会

更大需求。 该报告对跨世纪的语言文字工作进行部署,明确了测试工作在跨世纪语言文字
工作蓝图中的重要地位,对其适应需求、科学发展提出更高的要求。该报告是世纪之交的重
要时期开展普通话水平测试的重要政策文件依据。
(2)微观管理依据代表性成果

①《普通话水平测试实施办法(试行)》
“三部委《决定》”是宏观管理依据,除了文件的主件,还包括三个附件,分属不同的
测试依据类别。其中“《实施办法》”和《普通话等级证书(样本)》属于微观管理依据的
范畴,《等级标准》属于基础学术依据。这种各类测试依据杂糅在一起的缺陷,在初创时期
在所难免,也是初创时期“前修未密”的阶段性特征,无须过多指摘。《实施办法》是“三
部委《决定》”的第一个附件,依据“三部委《决定》”制定,包括6部分共18条。《实施
办法》首次对实施普通话水平测试必须明确的测试领导机构、测试依据、施测主体(测试员)

受测对象(应试人员)、测试流程等核心问题进行规定,成为全国范围内第一个具体的测试
业务管理依据。

②《国家语言文字工作委员会关于普通话水平测试管理工作的若干规定(试行)


《关于开展普通话水平测试工作的决定》(国语[1994]43 号),国家语言文字工作委员会、国家教育委员
会、广播电影电视部 1994 年 10 月联合下发。

《开拓语言文字工作新局面,为把社会主义现代化建设事业全面推向 21 世纪服务》是 1997 年全国语言文
字工作会议的主题报告。

许嘉璐:《开拓语言文字工作新局面,为把社会主义现代化建设事业全面推向 21 世纪服务》, 《语文建设》
1998 年第 2 期,第 4 页。

“加强普通话培训测试工作,提高普通话培训测试的科学水平。各级语言文字工作机构要加强对普通话培
训测试工作的管理,适应社会对普通话培训测试的更大需求,使培训测试工作更加科学化、现代化。”参见
许嘉璐《开拓语言文字工作新局面,为把社会主义现代化建设事业全面推向 21 世纪服务》 ,
《语文建设》1998
年第 2 期,第 9 页。

《普通话水平测试实施办法(试行)》是“三部委《决定》”(1994 年)的三个附件之一。

《国家语言文字工作委员会关于普通话水平测试管理工作的若干规定(试行)》 (国语[1997]32 号)
,1997
年 6 月颁布。
28
1997年6月颁布的《若干规定》是针对“三部委《决定》”下发后测试实施过程中出现
的具体问题,在制度和操作流程上进一步明确和规范。《若干规定》从普通话水平测试工作
的机构和网络、普通话水平测试员、普通话水平测试的标准和大纲、测试成绩的认定和证书、
普通话水平测试试卷、测试对象及其达标要求等方面做出比较详细的规定,是对“三部委《决
定》”不够科学、不便操作、不甚明确的部分条款和内容进行的修正,对测试工作管理和测
试流程,提出了较为全面和明确的制度性要求。《若干规定》是普通话水平测试早期重要的
规范指导性文件依据。
(二)规范时期(2000 年底~2007 年)的管理依据
1.概况
规范时期普通话水平测试管理依据建立在初创时期坚实的基础之上,并且在法制化方面
取得突破性进展。规范时期我国第一部语言文字的专门法律——《国家通用语言文字法》出
台并实施,这是测试的顶层管理依据,成为普通话水平测试发展的一个重要里程碑。在其影
响下,国务院部门规章《普通话水平测试管理规定》及多部省级地方性法规规章陆续出台,
测试法律法规依据取得实质性进展,这是规范时期测试管理依据最鲜明的特征。与宏观管理
依据相配合,有关管理部门相继发布《普通话水平测试规程》《普通话水平测试工作评估指
导标准》等微观管理依据,全国性微观管理依据基本完备。
2.代表性成果
(1)宏观管理依据代表性成果
①《国家通用语言文字法》
《语言文字法》于 2000 年 10 月 31 日颁布,2001 年 1 月 1 日正式实施。
《语言文字法》
是我国语言文字工作立法实践的重要成就,也是语言文字工作步入治理体系和治理能力现代
化的重要标志,著名语言学家江蓝生称之为语言文字工作战线收到的 21 世纪的“一份不同

寻常的世纪礼物。” 它的诞生标志着我国语言文字工作迈上法制化的新阶段。
《语言文字法》
有两条(第十九条和第二十四条)专门涉及普通话水平测试,普通话水平测试以在国家专门
法律中规定的独特形态呈现在世人面前,这在国内外语言测试中尚属首例,《语言文字法》
成为普通话水平测试的直接法理依据。

②《普通话水平测试管理规定》
2003 年《测试管理规定》发布,这是普通话水平测试工作法制化进程中又一重要成果。
《测试管理规定》把部委规范性文件上升为具有法律效力的国务院部门规章,其影响力和影
响范围远超《实施办法》和《若干规定》。《测试管理规定》根据《语言文字法》,对测试管
理工作的主要要素、关键环节和重要程序进行了规定,强化了测试宏观管理的统一性,使测
试依法管理的性质更加明确。《测试管理规定》是测试宏观管理依据的重要组成部分,为制


江蓝生:《简论语言文字立法的意义》 ,《光明日报》2001 年 1 月 16 日,B04 版。

《普通话水平测试管理规定》,2003 年 5 月 21 日中华人民共和国教育部令第 16 号发布。
29
定地方性法规和规章提供了重要参考,并为普通话水平测试微观依据提供了规约性参照。
③省级地方性法规和规章
《语言文字法》的颁布实施带动了地方语言文字的立法实践,各地人大和政府,相继依
据《语言文字法》制定颁布了地方法规或规章。据笔者统计,2001 年至 2007 年,全国各省
(自治区、直辖市)先后出台了地方性法规 20 部、地方性规章 4 部,在上述 24 部省级地方
性法规和规章中,有 23 部对普通话水平测试做出明确规定和要求(仅《新疆维吾尔自治区
语言文字工作条例》未对此进行规定),有的省份对测试人群进行了扩充,有的省份对受测
对象等级要求做出更为具体的规定。省级地方性法规和规章是测试宏观管理依据的重要组成
部分,对保障和促进各地测试工作发挥了重要作用。
(2)微观管理依据代表性成果

①《普通话水平测试规程》
《测试规程》是《测试管理规定》的下位文件,依据《测试管理规定》对测试报名、考
场、试卷、测试、质量检查、等级证书以及应试人档案等 7 个管理环节做出了明确的规定。
《测试规程》使普通话水平测试的施测主体和受测对象都有了可依凭的规范,在具体的操作
环节更加有章可循、有据可依,对于进一步规范测试工作、加强测试工作流程管理和质量监
控,起到了重要作用。

②《普通话水平测试工作评估指导标准》
《评估指导标准》也是《测试管理规定》的下位微观管理依据,其适用的主体是各级测
试管理机构和实施机构。该标准旨在通过一套评估体系建立测试工作评估制度,
“以评促建”,
督促和引导各地测试管理机构和实施机构加强测试基础建设,提高管理水平。《评估指导标
准》用量化的方式对普通话测试工作提出评估要求,是对测试实施监督和指导的重要手段。
③《国家发展改革委、财政部关于普通话水平测试费和国家普通话水平等级证书工本费
收费标准的通知》
普通话水平测试具有公益性质,但测试作为专业化服务,需要必要的经费支持,收取合

理的费用。因此从 1994 年“三部委《决定》”开始,即对测试收费提出规范性要求, 1997

年《若干规定》进一步提出明确要求。 但是,由于没有国家价格管理部门的统一依据,各
地在执行以上规定时遇到不少实际困难。2003 年 12 月,国家发展改革委、财政部关于测试
和证书收费的通知,第一次由国家价格管理部门从全国层面,就测试收费项目、收费范围和
收费单位的收费行为提出规范性要求,并核定了收费标准。该通知是重要的测试管理依据。


《普通话水平测试规程》,教育部语用司 2003 年 5 月下发(教语用司函[2003]18 号)


《普通话水平测试工作评估指导标准》,教育部语用司 2003 年 5 月下发(教语用司函[2003]17 号)。

国家语言文字工作委员会、国家教育委员会、广播电影电视部《关于开展普通话水平测试工作的决定》规
定: “普通话培训测试中心为事业单位,测试做要合理收费,开展工作初期,应有一定的启动经费,培训和
测试工作要逐步做到自收自支。 ”参见刘照雄主编《普通话水平测试大纲(新修订本)》 ,吉林人民出版社
2002 年版,第 6 页。

“各级测试实施机构实施测试的收费标准须经统计物价部门核准,并建立规范的财务制度。”《国家语言
文字工作委员关于普通话水平测试管理工作的若干规定(试行)》 ,刘照雄主编《普通话水平测试大纲(新
修订本) 》吉林人民出版社,2002 年版,第 12 页。
30
至此,普通话水平测试管理的基础性文件大体完备,测试管理依据体系初步建立。
(三)拓展时期(2007 年至今)的管理依据
1.概况
拓展时期普通话水平测试宏观管理依据和微观管理依据均有新的发展,但体现出不同的
特征。宏观管理依据方面主要是实现了省级地方性法规和规章在全国范围(除港澳台地区以
外)近乎全覆盖,测试宏观管理依据体系基本建立;《国家中长期语言文字事业改革和发展
规划纲要(2012—2020 年)》出台,成为这一时期政策文件依据的最大亮点。微观管理依
据方面,为指导计算机辅助测试工作,国家主管机构陆续出台了一系列新的规范性文件。
2.代表性成果
(1)宏观管理依据代表性成果
①省级地方性法规和规章
拓展时期出台省级地方性法规或规章 6 部(其中地方性法规 3 部,地方性规章 3 部),
且均对测试工作做出地方性补充,对测试人群进行了扩充,6 个省份均对公共服务领域的话
务员、解说员、讲解员、导游员提出测试要求和等级规定,其中有 4 个省份对高等院校和中
等职业学校毕业生提出测试要求和等级规定。截至 2014 年,随着河南省和青海省省级地方
性法规和规章的公布,全国范围内普通话水平测试宏观管理依据体系构建基本完备。
②《国家中长期语言文字事业改革和发展规划纲要(2012—2020 年)》
2012 年 12 月,
《规划纲要》以教育部、国家语言文字工作委员会通知形式下发。
《规划

纲要》
“是 21 世纪我国第一个中长期语言文字事业改革和发展规划”, 部署了 7 项主要任务
和 16 项主要工作。《规划纲要》在“大力推广和普及国家通用语言文字”“提高国民语言文
字应用能力”和“弘扬传播中华优秀文化”三大任务中都提及普通话水平测试,在“国家通
用语言文字培训”“构建语言文字应用能力测评体系”“港澳台地区及海外合作交流”3 项
主要工作中对普通话水平测试进行了具体规划,尤其是在“构建语言文字应用能力测评体系”
中,对测试提出详细要求。《规划纲要》是测试拓展时期最重要的政策文件依据。
(2)微观管理依据代表性成果

①《计算机辅助普通话水平测试操作规程》
该《规程》针对机辅测试的新特点和新需求,依据《测试规程》制定,对机辅测试模式
下的考点设置、报名办法、组织流程、应试流程、试卷管理、成绩评定、证书颁发和档案管
理等诸环节进行规定,是拓展时期开展计算机辅助测试具有全国指导性的微观管理依据。

②《教育部语用司关于推进计算机辅助普通话水平测试工作等有关问题的通知》


《教育部、国家语委关于印发〈国家中长期语言文字事业改革和发展规划纲要(2012—2020 年)〉的通知》,
教育部语言文字应用管理司编: 《国家中长期语言文字事业改革和发展规划纲要(2012—2020 年)》,语文
出版社 2012 年版,第 2 页。

《计算机辅助普通话水平测试操作规程(试行)》 ,教育部语用司 2008 年 6 月下发(教语用司函[2008]23
号)。

《教育部语用司关于推进计算机辅助普通话水平测试工作等有关问题的通知》,教育部语用司 2010 年 7 月
下发(教语用司函[2010]72 号)。
31
该《通知》对在全国范围内开展机辅测试试点、实现测试管理信息化,以及启用新版“普
通话水平测试等级证书”进行了具体规定,并统一规定了机辅测试技术服务费标准。该《通
知》旨在推动机辅测试的快速发展,是国家语言文字工作主管部门在拓展时期出台的一项专
门性的微观管理依据。

③《计算机辅助普通话水平测试试点业务指导意见》
该《指导意见》由国家语委普通话与文字应用培训测试中心印发各地,对蓬勃兴起的机
辅测试试点工作进行规范和指导。《指导意见》主要内容涉及试点报批、方案制定,试点原
则、试点建设、业务培训、对比实验、试点监管、质量监控、总结评估等方面,提出了“科
学、规范、积极、稳妥”的试点工作原则和“一级复审、异常复审、抽查复审”的复审要求,
是旨在规范机辅测试工作健康发展的重要微观管理依据。

二、实施发展阶段的学术依据

(一)初创时期(1994 年~2000 年底)的学术依据及其研究


1.概况
初创时期普通话水平测试学术依据的发展建立在酝酿探索阶段“研发时期”基础之上,
由于最重要的两大基础学术依据——《等级标准》和《测试大纲》已颁布,初创时期的基础
学术依据发展并不突出,主要是重新审定和发布《等级标准》,并且出现一些探讨性阐释性
文章。具体学术依据方面,评分依据和命题依据在《测试大纲》中予以体现,同时出现一些
有代表性的论文,但总体而言还不够充分。
2.代表性成果
(1)基础学术依据代表性成果及其研究
①《普通话水平测试等级标准(试行)

《等级标准》是最早产生的测试基础学术依据,1992 年由国家语委原普通话推广司印
发给各地试行。1994 年国家语委对该《等级标准》进行了修订,同年 10 月,修订后的《等
级标准》以“三部委《决定》”附件的形式印发各地继续试行;1997 年国家语委再次对《等
级标准》进行审订,并以部级标准形式予以正式颁布。此次重新审订发布的《等级标准》,
虽然仍以“试行”样态呈现,但不再以文件或文件附件的面目出现,而代之以部级标准形式,
更加彰显其基础学术依据的属性。

②《论普通话水平测试等级标准》
该文作者为陈章太,文章全面论述等级标准产生的社会背景以及方案的创制过程,通过
梳理和对比,提出划分等级的原则及方法,并对已试行的等级标准的内容进行阐述。文章还
对《等级标准》的修订和完善提出建议。该文不但是解读普通话水平等级标准的重要文献,


《计算机辅助普通话水平测试试点业务指导意见(试行)》 ,国家语委普通话与文字应用培训测试中心 2010
年 9 月下发(国语普测[2010]8 号)


陈章太:《论普通话水平测试的等级标准》 ,《语言文字应用》1997 年第 3 期。
32
而且对修订和完善等级标准具有很高的参考价值。

③《〈普通话水平测试大纲〉的编制和修订》
该文作者为刘照雄,文章对《测试大纲》研制的过程和背景进行了说明,重点是对《测
试大纲》的一些具体问题进行阐释,主要包括:
“常用词语表”的选编原则和处理,
“普通话
与方言常用词语对照表”的编制,普通话与方言常见语法差异对照的归纳,定量和定性的关
系等内容。该文是解读《测试大纲》的重要文献,而且对修订《测试大纲》提出了有价值的
建设性意见。
(2)具体学术依据代表性成果及其研究
评分依据的代表性成果是《测试大纲》关于评分的规定(详见第五章)。有代表性的研
究是宋欣桥的以下两篇文章:
①《普通话水平测试评分试中的几个问题》
该文发表于 1997 年,探讨了测试中对等级特征的把握,包括三级的基本特征、一级甲
等基本特征、一级乙等基本特征和不进入等级(不入等级)水平基本特征和评分的处理等问
题,还提出了拟订语音评定参照框架的基本设想。文章对普遍关注的 9 类语音评定问题进行
了详细论述,还对朗读项中“语速”
“停顿”和“方言语调”的评分提出建议。该文是阐释
和论述普通话评分依据的重要文献。
②《语音评定参照细则框架》
该框架本系作者在国家级测试员培训班的讲义,后收录于《普通话水平测试员实用手册》。
该框架列举了 130 条参照细则,虽如作者所言,
“不可能把全部语音问题概括详尽”,仍属‘举

例’的性质”
, 但对普通话水平测试主要的和典型的错误类型、缺陷类型进行了较为详细的
归纳,对普通话水平测试语音评分具有实践指导意义,是初创时期重要的评分参考依据。
命题依据的代表性成果是《测试大纲》关于命题的规定(详见第五章)。有代表性的研
究有《普通话水平测试试卷的科学编制及规范使用》和《普通话水平测试题库建设的理论与
实践》

③《普通话水平测试试卷的科学编制及规范使用》
上海市普通话培训测试中心 1995 年即开始研制计算机制卷,是较早开展计算机拟卷的
省级测试机构。程明发表于 1997 年的《普通话水平测试试卷的科学编制及规范使用》讨论
了上海市中心计算机拟制普通话水平测试试卷的科学方法。该文对计算机拟卷的过程、规则、
“字种表”研制、试卷干预办法、审卷合议方法和版面设计等问题进行了详细探讨,还对试
卷管理保密问题进行讨论。该文虽是地方性实践探讨,但对制定全国命题依据具有重要的启
发意义,是初创时期讨论命题依据的重要成果。
④《普通话水平测试题库建设的理论与实践》


刘照雄:《 〈普通话水平测试大纲〉的编制和修订》,
《语言文字应用》1997 年第 3 期。

宋欣桥: 《语音评定参照细则框架》,宋欣桥编《普通话水平测试员实用手册》 ,商务印书馆 2000 年版,第
141 页。
33
云南省普通话水平测试中心是全国最早开展计算机拟卷和题库建设的省级测试机构。
1997 年王渝光、陈典红、杨万兵发表的《普通话水平测试题库建设的理论与实践》总结了
1994 年以来云南省计算机拟卷和题库建设的经验,讨论了题库建设的理论基础和采取的技
术路线,对测试规范试卷的研制,包括命题方式、题量和覆盖指标、试卷等值、难度标准、
各等级标准的控制与测试数据的稳定性、信度指标等进行了详细论述。该文对研制国家题库
进行了重要探索,是初创时期测试题库建设的重要研究文献。
(二)规范时期(2000 年底~2007 年)的学术依据及其研究
1.概况
规范时期是普通话水平测试学术依据全面发展、成果丰硕的时期。随着国家语委“十五”
科研规划重点项目“汉语普通话水平测试研究”的开展,产生出新《测试大纲》这一重要的
基础学术依据,以及《实施纲要》
、“普通话水平测试国家题库”两大具体学术依据。此外,
还出现 150 余篇探讨学术依据的论文,呈现出普通话水平测试依据研究多角度、全方位发展
的特点。
2.代表性成果
(1)基础学术依据代表性成果及其研究
①新《普通话水平测试大纲》
《测试大纲》是普通话水平测试实施的纲领性学术依据,1994 年颁布后在测试中发挥
了基础性和引导性的作用。但各地在测试实践中也反映出《测试大纲》存在一些不足,在呈
现形式的权威性、体例的纲领性和内容的科学性方面还有改进的必要。从 1996 年起国家语
委开始研究《测试大纲》的修订工作,《语言文字法》的颁布实施以及测试理论和实践的日
益丰富,为修订《测试大纲》创造了条件。2002 年初,国家语委成立“《普通话水平测试
大纲》修订及《普通话水平测试实施纲要》研制”课题组(姚喜双、刘照雄为课题负责人)。
2003 年 1 月,新《测试大纲》通过国家语委规范标准审定委员会审定,成为新的部颁标准;

2003 年 10 月,新《测试大纲》由教育部、国家语委以部颁文件形式正式发布。
新《测试大纲》和原《测试大纲》相比,呈现形式发生了结构性改变,采取了新《测试
大纲》和《实施纲要》功能区分的处理方式。新《测试大纲》简洁精当,突出和强调原则性、
指导性、纲领性和规范性,提高了表述的科学性,评分要素、评分方法的修订对提高测试的
信度具有积极的意义。部颁标准的学术底色,使新《测试大纲》基础学术依据的性质和地位
更为突出。
②《〈大纲〉修订和〈纲要〉研制的思考》
姚喜双 2004 年发表的《
〈大纲〉修订和〈纲要〉研制的思考》是论述新《测试大纲》修
订的重要文献。该文详细讨论了修订《测试大纲》
“科学性与可操作性统一”
“连续性与前瞻


王晖:《
〈普通话水平测试大纲〉修订的若干问题》,教育部语言文字应用研究所编《语言文字应用研究论
文集Ⅱ》
,语文出版社 2004 年,第 343~348 页。
34

性统一”
“规范性与服务性统一”等三项原则, 并阐释了测试题目、测试内容等值、水平与
能力判定、等级标准和岗位要求、测试语言与测试文化、“机器测试”等问题。这些问题是
修订《测试大纲》过程中作者深入思考的议题,有些已经在新《测试大纲》中有所体现,有
些涉及测试活动和测试系统的其他方面,关于这些问题的思考既是新《测试大纲》修订背后
延伸出的深度阐释,又为《测试大纲》进一步完善和测试未来发展开启了思路。
③《〈普通话水平测试大纲〉修订的若干问题》
王晖发表于 2004 年的《〈普通话水平测试大纲〉修订的若干问题》是最早对新《测试大
纲》进行阐述的文章之一。该文论述了新《测试大纲》修订的背景和主要历程,对《测试大
纲》修订的原则进行了解析,重点阐述了《测试大纲》修订的主要内容。该文对评分要素的
调整和评分系统的阐释尤为详细,首次探讨了测试术语研究的内容,虽只初步探讨了“普通

话、普通话水平测试、语音错误、语音缺陷、语调偏误” 等五条术语,但开启了普通话水
平测试学科术语研究这一新的研究范畴。
(2)具体学术依据代表性成果及其研究
①《普通话水平测试实施纲要》
《测试大纲》和《实施纲要》“一体两翼”的创编思路是新《测试大纲》研制的一个重
要贡献,
“《普通话水平测试大纲》修订及《普通话水平测试实施纲要》研制”是一个统一
的课题,
《测试大纲》管纲领,
《实施纲要》则着眼于实施,二者各有其用,又紧密配合。
《实
施纲要》按照新《测试大纲》要求编制,2004 年出版,被确定为普通话水平测试国家指导
用书。
《实施纲要》脱胎于 1994 年原《测试大纲》的具体测试内容和训练材料部分,但在编
制时多有创新,仅以词语表的编制为例,《实施纲要》词语表在语料库语言学成果的运用,
语料的选用与处理,规范性加工等方面都有了长足的进步。《实施纲要》规定测试的具体内
容和实施依据,对于试卷编制和题库建设及指导应试人备考,有直接的参考作用,它是与新
《测试大纲》相配套的最重要的具体学术依据。
②普通话水平测试国家题库
题库建设是大规模语言测试的重要保障,普通话水平测试题库在酝酿探索阶段和实施发
展阶段的初创时期有了初步的探索,但都还局限于地方性题库建设,尚未在全国范围内实现
通用共享。测试国家题库研究和建设在规范时期有了重大进展,2002年“普通话水平测试国

家题库建设”正式立项研制, 2004年9月,课题通过了教育部语用司和语信司联合组织的
鉴定。
普通话水平测试国家题库系统,对上海、云南、黑龙江、湖北等省市的题库建设成果进
行了优化和综合。该系统以《测试大纲》和《实施纲要》规定的命题原则和要求为规范原则,


姚喜双:《 〈大纲〉修订和〈纲要〉研制的思考》, 《语言文字应用》2004 年第 3 期,第 3~7 页。

王晖:《〈普通话水平测试大纲〉修订的若干问题》, 《语言文字应用研究论文集Ⅱ》,教育部语言文字应用
研究所编,语文出版社 2004 年,第 347~348 页。

该课题被列为国家语委“十五”科研规划重点项目“汉语普通话水平测试研究”的核心子课题( ZDI105
—18—21)。
35
题库内容设计和制卷规则设计完全符合新《测试大纲》对测查要素的覆盖与分布要求,所拟

制的试卷是“全面反映《纲要》要求的、内容完整的标准试卷。” 国家题库大大提高了制
卷效率和质量,提升了测试的科学化水平。
③《〈普通话水平测试实施纲要〉概述》
刘照雄发表于 2004 年的《〈普通话水平测试实施纲要〉概述》是阐述《实施纲要》编制
情况的重要文章。该文指出《实施纲要》是贯彻落实新《测试大纲》要求编制的测试实施的
依据,论述了《实施纲要》与原《测试大纲》的继承关系,对《实施纲要》的创新性调整和
一些基本数据进行了报告。
④《略论普通话水平测试评分系统》
该文作者为王晖,文章对评分系统与《等级标准》的关系进行了研究和阐释,指出评分
系统是一套可量化的“数字化解释系统”,与《等级标准》
“共同构成了普通话水平测试成绩

的解释系统。” 该文对普通话水平测试评分系统的特点进行分析,对新《测试大纲》评分系
统进行解析,归纳出新《测试大纲》评分系统简表。该文是最早系统论述测试评分系统的文
章,是研究测试评分依据的代表文献。
⑤《普通话水平测试国家题库制卷系统研制报告》
该报告发表于 2005 年,以“PSC 国家题库建设课题组”集体名义发表。该报告对国家
题库系统研制情况做了较为详尽的说明,报告了系统设计思想、系统结构、主要特点、开发
工具以及部分性能实测结果。该报告是反映测试具体学术依据的一个重要研究成果。
(三)拓展时期(2007 年至今)的学术依据及其研究
1.概况
拓展时期普通话水平测试学术依据呈现领域拓展和挖掘深化的特点,在具体学术依据方
面这个特点尤为显著。就基础学术依据而言,由于规范时期新《测试大纲》及《实施纲要》
的出台,各方面的探索已比较成熟,没有出现更多的新成果。具体学术依据方面,最突出的
是在计算机辅助测试依据方面出现一批成果,这开启了测试依据一个新的领域,在命题依据
和评分依据方面的挖掘也更加深入。
2.代表性成果
(1)计算机辅助普通话水平测试依据代表性成果及其研究

①《计算机辅助普通话水平测试评分试行办法》
2009 年《计算机辅助普通话水平测试评分试行办法》(简称“《机辅评分办法》”)
以教育部语用司通知的形式下发。《机辅评分办法》适应计算机辅助测试评分的实际变化而
制定,主要对需要人工评分的“命题说话”的评分进行约定,针对机辅测试模式较为普遍的


PSC 国家题库建设课题组:《普通话水平测试国家题库制卷系统研制报告》 ,《语言文字应用》2005 年第 2
期,第 64 页。(注:笔者为该课题组负责人(执行),也是该报告的主要执笔人。)

王晖:《略论普通话水平测试评分系统》 ,《语言文字应用》2004 年第 3 期,第 30 页。

《计算机辅助普通话水平测试评分试行办法》,2009 年下发(教语用司函[2009]5 号)。
36
“离题、内容雷同”和“无效话语”现象,提出评分的操作规则。《机辅评分办法》是拓展
时期具有全国指导性的微观学术依据,随着这一文件的出台,出现了一个探讨机辅测试依据
的高潮。
②《计算机辅助普通话水平测试实施研究》
该文 2007 年发表,作者为叶军等 4 人,对上海市机辅测试试点调研情况进行报告。上
海市是最早开展机辅测试试点的省市之一,该文论证了机辅测试的可行性,通过考察应试者
应试时的心理状态,分析了机测的可接受性,还详细讨论了机辅测试的实施方案,包括机辅
测试的基本条件、组织实施、质量监控、反馈与技术升级等方面,该文以机辅测试试点实践
为基础,又为机辅测试更大规模实践提供了有价值的参考。
③《计算机辅助普通话水平测试试点地区的调查研究》
该文发表于 2009 年,作者为韩玉华。作者对全国机辅测试试点省份的基本情况进行调
查研究,肯定了机辅测试试点的成绩和经验,同时分析了存在的问题,主要涉及机辅测试引
发的一系列管理工作问题以及评测的具体问题(包括说话项的评分、复审问题、字化现象和
朗读评分等),并提出了具体的对策建议。该文是机辅测试试点开展后较早的专门文献,对
制定机辅测试微观管理依据和评分等具体学术依据都具有参考价值。
④《浅析〈计算机辅助普通话水平测试评分试行办法〉》
孙海娜 2010 年发表的《浅析〈计算机辅助普通话水平测试评分试行办法〉》阐述了制定
《计算机辅助普通话水平测试评分试行办法》所遵循的 4 条原则,文章还对如何理解和把握
《机辅评分办法》特别是第四项“命题说话”的评分进行了详细讨论,并就施行中应注意的
问题提出建议。这篇文章是拓展时期关于机辅测试领域具体学术依据的代表文献之一。
(2)其他代表性研究成果
①《普通话水平测试评分细则论析》
王晖 2007 年发表的《普通话水平测试评分细则论析》对全国 17 个省份的普通话水平测
试评分细则进行调查研究,对各地制定评分细则的 13 个热点问题进行讨论和分析。文章还
提出制定细则的 4 条建议:明确细则制定的原则,明确细则制定的主体,规范细则制定程序,
建立质量监控制度。该文对评分依据的探讨细致深入,对各地制定评分细则颇具参考价值。
②《基于概化理论的 PSC 分数误差探析》
该文发表于 2010 年,作者为聂丹。该文应用概化理论对影响普通话水平测试分数构成
的诸多因素进行检验和分析,主要考察了评分者、测试任务类型、说话测试项评分要素和评
分标准、说话项话题类型等测量误差的主要来源,分析了其对测试结果变异的程度。该文是
讨论测试质量评估的重要文献,从命题依据和评分依据角度来看,对改进普通话水平测试题
型设计、控制评分误差都具有很高的参考价值。
③《普通话语音测试中的目标无关性错误研究》
华东师范大学周中兴 2007 年的硕士学位论文《普通话语音测试中的目标无关性错误研

37
究》聚焦于普通话水平测试“读单音节字词”和“读多音节词语”的测试目标和测试方式,
通过对两个测试项的效度检验,认为“目标无关性错误”是影响测试效度的重要原因。为了
改善“读单音节字词”的效度,作者设计了新的测试模式:增设词语语境,对新模式进行了
实测检验。该论文最后提出拟制新模式试卷方面应遵守的 7 条原则,并对“普通话语音测试”
提出 4 条原则性的建议。虽然作者所理解的普通话水平测试的测试目标尚有可商之处,但其
普通话水平测试效度的研究视角值得肯定,对测试题型和命题方式的探讨也有借鉴意义。

三、综括

综观实施发展阶段,普通话水平测试先是在教育、广播电视等重点领域启动实施,此后
在实践过程中完善发展,并在世纪之交被载入《语言文字法》,之后在《语言文字法》推动
下不断创新,获得巨大进步。实施发展阶段普通话水平测试经历了三个波浪式发展时期:初
创时期、规范时期和拓展时期,普通话水平测试依据在三次发展浪潮中因势而变,呈现出管
理依据和学术依据阶段性递进的发展特征。
测试管理依据方面,宏观管理依据成果丰硕并逐步实现体系化。《语言文字法》是宏观
管理依据的统领性成果和总依据,它的的颁布施行直接推动了普通话水平测试管理依据的体
系化建设。为了贯彻落实《语言文字法》,国家语言文字主管部门和各地进行了立法实践,
陆续出台《测试管理规定》以及 30 个省级地方性法规和规章,测试的法律法规依据体系逐
渐完善。在实施发展阶段的不同时期,国家语言文字主管部门先后颁布(或会同相关部委联
合颁布)《关于开展普通话水平测试工作的决定》《国家中长期语言文字事业改革和发展规
划纲要(2012—2020 年)》等全局规划性政策文件依据。微观管理依据方面,普通话水平
测试的《若干规定》
《测试规程》
《评估指导标准》
《机辅测试操作规程》
《机辅测试试点业务
指导意见》等微观管理依据随着各个时期工作任务的发展陆续出台,全国性微观管理依据在
推动工作进程中发展健全。
《语言文字法》的颁布施行也推动了测试学术依据的创新发展。基础学术依据方面,
《等
级标准》最终审定并以部颁标准形式正式颁布,《测试大纲》重新修订,以部颁标准和教育
部文件的双重形式呈现,《等级标准》和新《测试大纲》夯实了测试的基础学术依据。具体
学术依据方面,《实施纲要》和“国家题库”是两项最重要的成果。进入拓展时期后,计算
机辅助测试为测试带来前所未有的变革,《机辅测试评分试行办法》是在此背景下产生的重
要的具体学术依据。实施发展阶段测试学术依据的发展还体现在很多学术论文研究方面,如

〈大纲〉修订和〈纲要〉研制的思考》
《〈普通话水平测试实施纲要〉概述》
《普通话水平测
试试卷的科学编制及规范使用》
《普通话水平测试题库建设的理论与实践》
《普通话水平测试
评分细则论析》
《浅析〈计算机辅助普通话水平测试评分试行办法〉》等,对普通话水平测试
命题依据(包括题型、试题、试卷、题库测试长度等方面)以及评分依据(包括评分体系、
评分细则及语音词汇语法等要素评分等方面)
,进行了多方面有参考价值的探讨,普通话水
平测试学术依据步入渐成系统和有序发展的新阶段。
38
第四章 普通话水平测试管理依据

普通话水平测试管理依据是普通话水平测试的管理规则,与学术依据一起对施测主体、
受测对象和测试手段进行管控,使测试活动规范运行。本章对测试管理依据进行专题研究,
分为三节:法律法规依据、政策文件依据和业务管理依据,法律法规依据和政策文件依据属
宏观管理依据,业务管理依据依据属微观管理依据。

第一节 普通话水平测试法律法规依据

法律法规依据,是保障普通话水平测试开展的法律、法规和规章的总和,是测试实施的
保障性的依据,也是制定其他测试依据的依据,在测试依据体系中具有统辖的作用。在“推
进国家治理体系和治理能力现代化”的历史时代,法律法规依据在普通话水平测试工作中的
作用更加凸显。

一、《宪法》

建国以来推广普通话工作一直得到国家的高度重视,国务院、国家语言文字工作部门以
及其他相关部门,颁布了一系列关于推广普通话的法规、规章或规范性文件。进入新时期以
来,推广普通话在国家政治、经济、文化和社会生活中的作用更加突出,推广普通话的意义
更加彰显,任务更加紧迫。在这种背景下,1982 年《宪法》第十九条第五款明确规定:
“国
家推广全国通用的普通话”。这一条款中“国家”指明责任主体,既包括国务院及其语言文
字主管部门,也包括地方各级人民政府及其语言文字管理部门,还包括国家其他各级相关部
门;同时也表明每个公民个体也应是这一国家意志的责任者。
“推广”是指运用行政力量推
行并扩大普通话的使用范围;
“全国通用”既表明了普通话的语言本体功能属性,也表明了
普通话的法律地位和语言规划地位——普通话是全国范围内通用的中华民族的族际共同语。
《宪法》是国家的根本大法,它所包含的内容涉及国家全局性的基本制度、宏观政策和重要
事项,拥有最高法律效力。《宪法》关于推广普通话的条款,为确立新时期推广普通话工作
方针奠定了基础,也为新时期推广普通话的各种创新性举措包括普通话水平测试,提供了最
强大和最根本的法律保障,《宪法》是开展测试的总依据和法理总来源。

二、《国家通用语言文字法》

制定语言文字专门法律,把语言文字工作纳入法制轨道是提高语言文字工作规范性和权
威性的必由之路。1992 年国家语委提出“八五”期间要着手研究起草“语言文字基本法”

39
的工作规划,全国人大代表和全国政协委员对此也有不少议案和提案,全国人大作为国家立

法机构也密切关注该项工作。 1997 年语言文字法的起草工作启动,2000 年 10 月 31 日《语
言文字法》经第九届全国人民代表大会常务委员会第十八次会议审议通过,于 2000 年 1 月
1 日起施行。普通话水平测试作为国家通用语言使用的具体规范条款之一,在这部法律中予
以明确,《语言文字法》成为普通话水平测试的直接法律依据。
(一)普通话水平测试作为法律条款研究
1.法律条款的起草与修改
《语言文字法》共 4 章 28 条,正文计 1964 字,可以说相当精炼,在不长的篇幅中涉及
普通话水平测试的条文就有 2 章 2 条计 156 字,篇幅占全文的 7.94%,分量不可谓不重。为
了更好解读有关条文,我们研究了该法律起草修订过程的相关文献。
(1)《关于〈中华人民共和国国家通用语言文字法(草案)的说明〉》的表述
在国家法律中对一项语言测试进行规范性要求,这在各国立法实践中是很罕见的,因此
在《语言文字法》起草过程中确实出现一些“疑问”或“疑虑”。2000 年 7 月,全国人大教

科文卫委员会副主任委员汪家镠就“普通话水平测试问题”向全国人大常委会作了说明。 该
《说明》把开展普通话水平测试的意义及作用进行了透彻的表述,把对社会主要行业普通话
的总体要求和具体做法进行了区分,并肯定“三部委《决定》”的要求是“合适的”
。该《说
明》对消除常委会部分委员的疑虑起到了很好的作用。据时任教育部语用司杨光司长介绍,
全国人大常委会审议“语言文字法(草案)
”时他曾接受问询,向全国人大常委会报告普通
话水平测试开展情况,阐释普通话水平测试等级标准,曾有委员当场询问李鹏委员长普通话
等级标准,杨光司长回答:“(李鹏委员长)稍加培训,可以达到二级甲等”
,他的回答和解
释对打消部分委员“要求过高、过严”的担心也起到了很好的作用。
(2)《全国人大法律委员会关于〈中华人民共和国国家通用语言文字法(草案)
〉修改
情况的汇报》的表述
2000 年 8 月 17 日,全国人大法律委员会就“语言文字法(草案)
”中关于普通话水平


“1990~1996 年,全国人大代表和全国政协委员关于语言文字问题的议案和提案达 97 项,其中全国人大
代表提出加速语言文字立法的议案有 28 项。……语言文字工作无法可依的状况亟待改变,语言文字立法已
十分迫切。 ”参见汪家镠《关于〈中华人民共和国国家通用语言文字法(草案)的说明〉 》,全国人大教科文
卫委员会教育室、教育部语言文字应用管理司编《中华人民共和国国家通用语言文字法学习读本》,语文出
版社 2001 年版,第 12 页。

汪家镠: 《关于〈中华人民共和国国家通用语言文字法(草案)的说明〉》 ,具体引述如下: “普通话水平测
试,是使推广普通话深入开展,逐步走向科学化、规范化、制度化的主要举措。本草案第十九条规定: ‘播
音员、节目主持人和影视话剧演员、教师、国家机关工作人员以及有关部门规定的其他人员,应当通过普
通话水平测试,并应达到国家规定的等级标准。’对于这一规定,在本法草案征求意见中,有些同志有疑问,
认为是不是说话不标准就违法了?也有些同志有疑虑,担心这样规定在现实情况下做不到,认为要求过高、
过严。其实,草案对这几类人员工作用语提出的是一个总要求,没有这样的规定是不行的。但是,考虑到
目前普通话推广现状,在具体做法上会区别不同情况,采取不同的办法。1994 年国家语言文字工作委员会、
国家教育委员会、广播电影电视部联合发布的《关于开展普通话水平测试工作的决定》,对普通话水平的等
级和开展测试的具体办法已经区别不同情况作了合适的规定。 ”参见全国人大教科文卫委员会教育室、教育
部语言文字应用管理司编《中华人民共和国国家通用语言文字法学习读本》 ,语文出版社 2001 年版,第 17
页。
40
测试相关条款的修改情况向全国人大常委会进行了说明,修改涉及第十九条第二款和第二十

四条。 第十九条第二款的修改,在“播音员、节目主持人和影视话剧演员、教师、国家机
关工作人员”之前增加“以普通话作为工作语言”的表述,更清晰地表达出对这四类人员提
出普通话等级要求的合理性,以上四类人员因其工作岗位的需要,被纳入法律规范管理的范
畴,理据充足,合情合理。第二十四条的修改涉及普通话水平测试工作的管理和实施,实事
上,普通话水平测试自 1994 年起就根据政事分开的原则,由语言文字主管部门和测试机构
分工合作予以推动,前者负责宏观组织管理,后者负责具体实施,因此“普通话水平测试工
作由国务院语言文字工作主管部门负责组织实施”的表述不够严密,也不符合今后工作的发
展方向。该条修改为“国务院语言文字工作主管部门颁布普通话水平测试等级标准”
,凸显
出国务院语言文字工作主管部门宏观管理的特征。
(3)《全国人大法律委员会关于〈中华人民共和国国家通用语言文字法(草案)
〉审议
结果的报告》的表述
2000 年 10 月 18 日,全国人大法律委员会就“语言文字法(草案)”审议结果关于普通

话水平测试条款修改的情况向全国人大常委会进行说明,修改建议涉及第十九条第二款。 该
条款的修改,增加了对“尚未达标的人员”的培训要求,既规定测试也规定培训,“以测促
训,以训保测”
,测试是服务,培训是服务的延伸,测试为抓手,培训为推手,二者协同配
合、共同作用,能更有力地保障推广普通话工作取得实效。
通过以上法律条款的起草与修改历程,可以看出普通话水平测试是《语言文字法》中相
当重要的条款,在 2000 年该法正式颁布前的历次审议中都涉及其内容的修改和完善,受到
重视的程度可见一斑。普通话水平测试的法条,数易其稿,几经增润,在不断修订的过程中
趋于完善。
2.法条研究
《语言文字法》关于普通话水平测试的规定体现为两条,第二章第十九条和第三章第二


全国人大法律委员会: 《全国人大法律委员会关于〈中华人民共和国国家通用语言文字法(草案)〉修改情
况的汇报》,具体内容引述如下:“将草案第十九条第二款规定的‘播音员、节目主持人和影视话剧演员、
教师、国家机关工作人员以及有关部门规定的其他人员,应当通过普通话水平测试,并应达到国家规定的
等级标准。’修改为:‘以普通话作为工作语言的播音员、节目主持人和影视话剧演员、教师、国家机关工
作人员,普通话水平应当分别达到国家规定的等级标准。 ’(草案第二次审议稿第十九条第二款) ”“将草案
第二十四条规定的‘普通话水平测试工作由国务院语言文字工作主管部门负责组织实施。’修改为‘国务院
语言文字工作主管部门颁布普通话水平测试等级标准。 ’(草案第二次审议稿第二十四条) 。”参见全国人大
教科文卫委员会教育室、教育部语言文字应用管理司编《中华人民共和国国家通用语言文字法学习读本》 ,
语文出版社 2001 年版,第 20~21 页。

全国人大法律委员会: 《全国人大法律委员会关于〈中华人民共和国国家通用语言文字法(草案)〉审议结
果的报告》,具体内容引述如下: “草案二次审议稿第十九条第二款规定: ‘以普通话作为工作语言的播音员、
节目主持人和影视话剧演员、教师、国家机关工作人员,普通话水平应当分别达到国家规定的等级标准。 ’
有的常委委员提出,草案对以普通话为工作语言的人员,要求他们的普通话水平达到国家规定的标准,十
分必要,但对尚未达标的人员如何提高也应有所规定。因此,法律委员会建议将这一款修改为: ‘以普通话
作为工作语言的播音员、节目主持人和影视话剧演员、教师、国家机关工作人员,普通话水平应当分别达
到国家规定的等级标准;对尚未达到国家规定的普通话等级标准的,分别情况进行培训。 ’(草案第三次审
议稿第十九条第二款) 。” 参见全国人大教科文卫委员会教育室、教育部语言文字应用管理司编《中华人民
共和国国家通用语言文字法学习读本》 ,语文出版社 2001 年版,第 23~24 页。

41
十四条:
(1)第十九条的研究
①第一款
《语言文字法》第十九条第一款规定:“凡以普通话作为工作语言的岗位,其工作人员

应当具备说普通话的能力”。 该款是对特定工作岗位人员普通话能力的总要求,
“凡”在该
条款第三次审议稿中尚未出现,正式颁布时加上这个表示“总括”语义的副词,强调了这一
规范的周遍性,即规定了有关人员,全都“应当具备说普通话的能力。”
“以普通话作为工作
语言的岗位”具体所指有宽窄两种理解:宽的理解是把该法第二章当作一个整体,第二章是
“关于通用语言文字的使用”
,其中涉及岗位(或行业)用语表述的有:第九条(国家机关:
公务用语)
、第十条(学校及教育机构:基本的教育教学用语)、第十二条(广播电台、电视
台:基本的播音用语)
、第十三条(公共服务行业:服务用语),因此宽的理解主张把公共服
务行业人员纳入进来。窄的理解是仅把第十九条当作一个论述整体,第十九条第二款明确提
出对“播音员、节目主持人和影视话剧演员、教师、国家机关工作人员”的普通话等级标准
要求,因此窄的理解主张以上四类人员是法律条款所指的具体对象。
从《〈国家通用语言文字法〉讲解》中“这一具体规定体现了对有关专业人员和国家工

作人员的较高要求” 的表述看,除了“国家工作人员”外,其他几类人员是被当作“有关
专业人员”来加以考虑的。我们再参看该法第十三条第二款:
“提倡公共服务行业以普通话
为服务用语”,
“提倡”一词,也不同于“公务用语、基本的教育教学用语、基本的播音用语”
的表述,后面三种未用“提倡”加以表述,意味着以上三种用语是法律的明确规定。因此“以
普通话为工作语言的岗位人员”更准确的理解应当是第二款明确的四类岗位的工作人员,这
四类人员普通话等级标准的要求和未达标的培训要求具有法律意义上的强制性。当然,随着
社会的发展,有的地方和相关行业着眼于国家通用语言规范要求的提高,对公共服务行业岗
位人员也提出普通话等级标准和未达标培训的要求,这也是符合《语言文字法》立法精神的,
是把“提倡”落到实处的一种提高性举措。
②第二款
《语言文字法》第十九条第二款主要是对四类特定岗位人员提出普通话等级标准规定和
未达标培训的规定。四类特定岗位人员的确立有充分的考虑。1986年全国语言文字工作会议
就确定了推普的工作重点领域,提出使普通话成为“教学语言、工作语言、宣传语言、交际

语言”的目标。 1997年全国语言文字工作会议后,国家语委形成了“一个中心,四大领域”


全国人大教科文卫委员会教育室、教育部语言文字应用管理司编:《中华人民共和国国家通用语言文字法
学习读本》,语文出版社 2001 年版,第 7 页。

全国人大教科文卫委员会教育室、教育部语言文字应用管理司编:《中华人民共和国国家通用语言文字法
学习读本》,语文出版社 2001 年版,第 67 页。

具体内容引述如下:“第一,各级各类学校采用普通话教学,普通话成为教学语言。第二,各级各类机关
进行工作时一般使用普通话,普通话成为工作语言。第三,广播( 包括县以上的广播台、站)、电视、电影、
话剧使用普通话,普通话成为宣传语言。第四,不同方言区的人在公共场合的交往基本使用普通话,普通
话成为交际语言。” 参见刘导生《新时期的语言文字工作》, 《语文建设》1986 年第 1、2 期,第 11 页。
42
的推普工作思路——一个中心,指的是“以城市为中心”,四大领域,分别指“学校、党政

机关、新闻媒体和公共服务行业”。 因此,《语言文字法》对“播音员、节目主持人和影
视话剧演员、教师、国家机关工作人员”这四类“担负语言示范责任的工作人员必须提出较

高要求”, 这种规定是有工作实践基础和历史根据的。
《语言文字法》第十九条第二款提出四类特定岗位工作人员“应当分别达到国家规定的
等级标准”
。国家规定的行业人员的等级标准散见于不同部门的不同文件中,详见表4–1:

图表 6 表 4–1 国家对相关行业人员普通话等级标准的要求

人员类别 等级要求 文件依据

播音员 国家级、省级电台、电视 国家语言文字工作委员会关于普通话水平测试


一级甲等
台播音员、节目主持人 管理工作的若干规定(试行)
(1997年)
节目主 其余电台、电视台播音 国家语言文字工作委员会关于普通话水平测试
一级乙等
持人 员、节目主持人 管理工作的若干规定(试行)
(1997年)
国家语言文字工作委员会关于普通话水平测试
影视话剧演员 一级乙等
管理工作的若干规定(试行)
(1997年)
普通话语音教师、口语课 国家语言文字工作委员会关于普通话水平测试
一级乙等
教师 管理工作的若干规定(试行)
(1997年)
国家语言文字工作委员会关于普通话水平测试
其他教师 二级乙等
教师 管理工作的若干规定(试行)
(1997年)

少数方言复杂地区教师 三级甲等 《教师资格条例》实施办法(2000年)

关于对1998年申报对外汉语教师资格人员进行
对外汉语教师 二级甲等
普通话水平测试的通知(1998年)

国家机关工作人员 三级甲等 关于开展国家公务员普通话培训的通知(1999年)

师范院校毕业生、职业中
国家语言文字工作委员会关于普通话水平测试
学与口语表达密切相关 二级乙等
管理工作的若干规定(试行)
(1997年)
专业毕业生
国家语言文字工作委员会关于普通话水平测试
其他 报考教师资格人员 二级乙等
管理工作的若干规定(试行)
(1997年)
人员
配音人员,播音、主持人
国家语言文字工作委员会关于普通话水平测试
专业和电影、话剧表演专 一级乙等
管理工作的若干规定(试行)
(1997年)
业教师及毕业生

(注:本表所列为2000年10月《语言文字法》颁布前有关文件对特定岗位人员普通话等级标准的要求,

《语言文字法》颁布后的规定本表未列,可另参本文表4–3、表4–4。


1998 年《首届全国推广普通话宣传周宣传提纲》 :“要以学校为基础,以党政机关为龙头,以直辖市、省
会、自治区首府等中心城市为重点,以广播电视等新闻媒体为榜样,并带动公共服务行业和全社会推广普
及普通话。 ”(参见教育部语言文字应用管理司编《新时期语言文字法规政策文件汇编》 ,语文出版社 2005
年版,第 230 页。)这是“一个中心,四大领域”的雏形,后形成“以城市为中心,以学校为基础,以党政
机关为龙头,以新闻媒体为榜样,以公共服务行业为窗口,带动全社会推广普及普通话”的正式表述。

全国人大教科文卫委员会教育室、教育部语言文字应用管理司编:《中华人民共和国国家通用语言文字法
学习读本》 ,语文出版社 2001 年版,第 89 页。
43
(2)第二十四条的研究
第二十四条规定附属于《语言文字法》的第三章,该章内容涉及国家通用语言文字社会
应用的管理和监督。第二十四条规定:
“国务院语言文字工作部门颁布普通话水平测试等级

标准。
” 该法条明确了颁布等级标准的主管部门——国务院语言文字工作部门。教育部(国
家语委)是国务院主管语言文字工作的部门。1998年7月21日,国务院批准并公布《教育部
职能配置、内设机构和人员编制规定》
,明确了教育部的17项主要职责,其中第十三项职责

涉及普通话测试工作。 普通话测试工作被国务院批准为教育部工作职能,其重要性可见一
斑。《语言文字法》第二十四条,以法律条文的形式对普通话水平测试工作的主体责任部门
予以明确,将行政管理法定化,测试工作的权威性和规范性得到进一步增强。
稍有遗憾的是,该法条只规定了“颁布普通话水平测试等级标准”一项具体内容,这固
然体现了颁布《等级标准》的重要性,但作为法律应该更宏观,此条规定稍嫌具体,有“大
马配小鞍”之感,仍有完善的余地。国务院语言文字工作部门对国家通用语言文字社会应用
的管理和监督涉及多项内容,更理想的表述是涵盖更广泛的范畴,凸显教育部(国家语委)
的管理监督职责。
(二)
《国家通用语言文字法》作为普通话水平测试法律依据的作用
《语言文字法》使普通话水平测试有了直接的、明确而坚实的法律保障,
《语言文字法》
成为普通话水平测试直接而具体的法律法规依据,在普通话水平测试依据体系中具有顶层统
辖的核心地位,其重要意义具体可以通过以下四方面作用予以体现:
1.指引作用
《语言文字法》对普通话水平测试的责任主体、行为主体具有规范指引作用。这种规范
指引作用,既体现为义务性指引,也体现为授权性指引。同时《语言文字法》对其他普通话
水平测试管理依据和学术依据也具有指引作用,其他测试依据必须在《语言文字法》的规范
指引框架内才具有法理依据。
2.评价作用
《语言文字法》是法律规范,具有判断、衡量行为主体是否合法或有效的评价作用。
《语
言文字法》对其他测试依据也具有评价作用。例如,该法规定四类人应当接受测试并达到规
定的相应等级,尚未达到规定的等级标准的应当参加培训,根据这些规定,如果不参加测试
或达不到等级也不进行相关培训,即属违法;国家语言文字工作部门以外的其他部门颁布测
试等级标准,可以判定不合法,也无效。
3.预测作用
法律具有可预测性的特征,人们(包括组织机构)依靠《语言文字法》可以预先估计到


全国人大教科文卫委员会教育室、教育部语言文字应用管理司编:《中华人民共和国国家通用语言文字法
学习读本》,语文出版社 2001 年版,第 8 页。

第十三项职责为:“拟定国家语言文字工作的方针、政策;编制语言文字工作中长期规划;制定汉语和少
数民族语言文字的规范和标准并组织协调监督检查;指导推广普通话和普通话测试工作。”参见《教育部历
史沿革与职能》,新华网:http://news.xinhuanet.com/zhengfu/2003-02/25/content_744527.htm。
44
将如何行为。《语言文字法》对其他普通话水平测试依据也具有预测作用,例如《语言文字
法》出台后,相关部门尤其是语言文字工作机构须出台配套的规章、规程细化法律的规定,
行为主体必须按照法律规定参加普通话水平测试或培训。根据《语言文字法》也可以预测国
家通用语言的推广和规范使用将迎来新的发展高潮,事实已证明这一点。
4.强制作用
法律是具有强制作用的社会规范,不少人认为《语言文字法》是部“软”法,缺乏有力

度的罚则,这种认识不完全准确。
《语言文字法》在第三章第二十六条第二款规定了罚则,
《语言文字法》的违法者由广播电影电视部门、教育部门和其他行政部门做出处理,这本身
也是具有强制性的处罚,相对于其他由司法机关处理违法行为的法律,
《语言文字法》体现
出重在引导,刚柔相济的鲜明特色。

三、国务院部门规章

(一)
《普通话水平测试管理规定》
《语言文字法》使普通话水平测试的实施有了基本的法律保障,同时也对测试依法实施
提出了更高的要求,与之配套的更加细化的部门规章的制定提上了日程。2003 年 5 月,
《测
试管理规定》发布。
1.《测试管理规定》概述
《测试管理规定》共 28 条,分三大版块:第一部分(第一条和第二条)属于概述部分,
主要内容是明确制定《测试管理规定》的目的、依据以及测试的性质、作用。第二部分(第
三条至第二十七条)属于主体部分,主要规定测试管理的具体内容,包括管理机构、属地管
理原则、测试员和测试视导员、应试人以及成绩认定、证书、测试间隔、申诉、测试纪律、
收费等内容。第三部分(第二十八条)属于第三部分,规定施行时间。
2.《测试管理规定》研究
(1)关于第一部分的研究
第一部分统辖全文,
《测试管理规定》在第一条首先阐明其制定目的,接着表明其制定
依据。普通话水平测试实施以来,国家语委先后出台《普通话水平测试实施办法(试行)》
(1994 年)、《国家语言文字工作委员会关于普通话水平测试管理工作的若干规定(试行)

(1997 年)等规范性文件,
《测试管理规定》是对以上两份管理依据的继承和发展。与二者
不同的是,
《测试管理规定》出台的形式和文件的效力发生了变化,在出台形式上,由部门
管理文件变为国务院部门规章;在效力上,由行政性规范文件上升为具有广义法律效力的国
家法规,提升了管理依据的整体层次。
《语言文字法》既为《测试管理规定》的制定提出了
要求,也是其制定的直接依据,这在《测试管理规定》第一条的后半段话予以明确的表述。


“本法第十九条第二款规定的人员用语违反本法第二条有关规定的,有关单位应当对直接责任人员进行批
评教育;拒不改正的,由有关单位作出处理。
”参见全国人大教科文卫委员会教育室、教育部语言文字应用
管理司编中华人民共和国国家通用语言文字法学习读本》 ,语文出版社 2001 年版,第 8~9 页。
45
第二条规定首先阐述测试的性质,
“规范程度(考试)” 和“口语考试”是《测试管理
规定》对测试性质的描述。该表述比较简练和概括,
“口语考试”的表述比较准确,但只表
述“规范程度”不够准确,而且与 2003 年颁布的新《测试大纲》的表述不够协调,令人遗
憾。相较而言,新《测试大纲》
“规范程度和熟练程度(考试)
”的表述更为准确,建议《测
试管理规定》据此修订完善。第二条后一句话阐述测试的作用,凸显其作为推普基本措施之
一的功能。2004 年时任国家语委主任袁贵仁对普通话水平测试的作用进行了高度概括,为

《测试管理规定》关于测试作用的表述做了最好的注脚(详参脚注)。
(2)关于第二部分的研究
①关于测试管理工作机构和属地管理原则
普通话水平测试工作实行的是语言文字工作主管部门和测试专门机构分工负责的管理
运行体制,1994 年《实施办法》和 1997 年《若干规定》对此均有所规定,尤其是后者对测
试工作机构和网络的规定相当细致。《测试管理规定》在此基础上,对国家和省级相关管理
工作机构职能进行了更为清晰的规定。
《测试管理规定》第三条和第四条规定国家语言文字工作部门的主要职责。第三条明确

了国家语言文字工作部门对具有基础性作用的测试管理依据和学术依据负有管理职能。 其
中关于“测试等级标准”的规定是对《语言文字法》第二十四条的落实性条款;该条所规定
的“测试大纲、测试规程和测试工作评估办法”等其他要件,均为具有全局性作用的测试管
理依据(测试规程和测试工作评估办法)和学术依据(测试大纲)。第四条规定明确了宏观

管理的内容:制定政策规划、组织协调、指导监督和检查评估。 第四条的内容更为宏观,
第三条规定的内容相对而言较具体,因此从条目顺次上,我们认为二者对调顺序更为合理。
《测试管理规定》第五条明确了国家测试业务机构与国家语言文字工作部门的关系——
隶属关系,后者是国家行政管理机构,国家测试业务机构是独立法人事业单位,国家测试业
务工作机构隶属于国家语言文字工作部门,应接受其管理和指导。该条规定对理顺行政管理
部门和测试业务工作机构的关系具有重要的指导作用。该条规定还明确了国家测试业务机构

的五项主要业务职责:组织实施测试、业务指导、质量监督检查、开展科研、业务培训。


“普通话水平测试在我国首开汉语标准语口语考试先河,使科学地衡量普通话水平成为可能。它有利于国
家语言规划的拓展和深化,对普通话的普及与提高发挥了不可替代的作用。……普通话水平测试载入《国
家通用语言文字法》 ,成为推广普通话工作的基本措施之一。”参见袁贵仁: 《再接再厉,团结奋进,开创普
通话水平测试工作新局面——在全国普通话水平测试管理工作会议上的讲话》 ,教育部语言文字应用管理司、
国家语委普通话培训测试中心编《全国普通话水平测试管理工作会议资料汇编》 ,语文出版社 2004 年版,
第 2 页。

《普通话水平测试管理规定》第三条:“国家语言文字工作部门颁布测试等级标准、测试大纲、测试规程
和测试工作评估办法。 ”参见教育部语言文字应用管理司编《新时期语言文字法规政策文件汇编》,语文出
版社 2005 年版,第 49 页。

《普通话水平测试管理规定》第四条:“国家语言文字工作部门对测试工作进行宏观管理,制定测试的政
策、规划,对测试工作进行组织协调、指导监督和检查评估。”参见教育部语言文字应用管理司编《新时期
语言文字法规政策文件汇编》 ,语文出版社 2005 年版,第 49 页。

《普通话水平测试管理规定》第五条:“国家测试机构在国家语言文字工作部门的领导下组织实施测试,
对测试业务工作进行指导,对测试质量进行监督和检查,开展测试科学研究和业务培训。”参见教育部语言
文字应用管理司编《新时期语言文字法规政策文件汇编》 ,语文出版社 2005 年版,第 49 页。
46
《测试管理规定》第六条、第七条明确省级语言文字工作部门和测试业务机构的管理职
责。这两条分别与第四条和第五条相对应,只不过管理职责限定在各自省级行政区划范围内。

第七条把省级以下测试业务机构管理职责交由省级语言文字工作部门负责, 体现了测试层
级管理的特色,与 1997 年《若干规定》直接由国家规定到市级测试机构的处理方式相比,

有明显的进步。第七条还规定:“各级测试机构的设立须经同级编制部门批准。” 体现出
依法依规管理的思维。
《测试管理规定》第八条规定阐明测试工作“属地管理”原则。该条规定旨在解决测试
实际工作中可能出现的“条块”管理不协调的问题,普通话水平测试工作涉及语言文字工作
部门(教育部门)、广播电影电视行业、人事主管部门及其他行业部门,容易造成条块分割,

根据工作职责,“原则上由所在地区省级语言文字工作部门组织实施”, 是按国家赋予语
言文字工作部门的职权和其应承担的责任实施的统一归口管理,对于防止多头管理、重复管
理、交叉管理具有现实的意义。
②关于测试员和测试视导员
《测试管理规定》第九条至第十三条对测试员诸多方面进行规定。测试员是测试活动的
施测主体,测试员实施测试是国家法律法规赋予的职责,受到法律的保护和约束,测试员实
施测试要遵守《测试管理规定》第九条的规定,该条是对测试员要求的总则,要求测试员在

“测试机构的组织下”依规程、遵规定、守纪律、保质量、受培训。 第十条规定测试员的
级别(省级测试员和国家级测试员),并对省级测试员和国家级测试员的学历要求、专业能
力和普通话水平做出具体约定。《测试管理规定》第十一条规定省级测试员和国家级测试员
资格证书的颁发,省级测试员和国家级测试员分别需要经过省级测试机构和国家级测试机构
培训考核,并分别由省级语言文字工作部门和国家语言文字工作部门颁发资格证书。第十二

条规定:“测试机构根据工作需要聘任测试员并颁发有一定期限的聘书。” 第十三条规定:
“在同级语言文字工作办事机构指导下,各级测试机构定期考查测试员的业务能力和工作表

现,并给予奖惩。” 测试员管理评聘分开,形成动态管理,辅以奖惩激励机制,这是对以
兼职人员为主的测试员实施管理的有效方式。测试员是测试活动的施测主体,在测试活动中
具有主导地位,是保证测试质量的关键环节,《测试管理规定》用 6 条条款对测试员管理的
各个环节进行详细规定,体现出对测试员专业资格规范管理的严格要求。《测试管理规定》


《普通话水平测试管理规定》第七条: “省级以下测试机构的职责由省级语言文字工作部门确定。”参见教
育部语言文字应用管理司编《新时期语言文字法规政策文件汇编》 ,语文出版社 2005 年版,第 49 页。

教育部语言文字应用管理司编《新时期语言文字法规政策文件汇编》,语文出版社 2005 年版,第 49 页。

《普通话水平测试管理规定》第八条:“测试工作原则上实行属地管理。国家部委直属单位的测试工作,
原则上由所在地区省级语言文字工作部门组织实施。 ”参见教育部语言文字应用管理司编《新时期语言文字
法规政策文件汇编》,语文出版社 2005 年版,第 49 页。

《普通话水平测试管理规定》第九条:“在测试机构的组织下,测试由测试员依照测试规程执行。测试员
应遵守测试工作各项规定和纪律,保证测试质量,并接受国家和省级测试机构的业务培训。”参见教育部语
言文字应用管理司编《新时期语言文字法规政策文件汇编》 ,语文出版社 2005 年版,第 49 页。

教育部语言文字应用管理司编《新时期语言文字法规政策文件汇编》,语文出版社 2005 年版,第 50 页。

教育部语言文字应用管理司编《新时期语言文字法规政策文件汇编》,语文出版社 2005 年版,第 50 页。
47
第十四条对测试视导员进行规定,测试视导员不具体实施测试,其职责是“参与和指导测试

管理和测试业务工作”, 测试视导员作为测试施测主体的补充,在《测试管理规定》中予以
明确。
③关于应试人
应试人是测试矛盾运动中与施测主体相对应的受测对象,是测试活动重要的参与要素,
《测试管理规定》用 4 条条款对应试人进行约定。其第十五条规定应接受测试的人员,与《语
言文字法》第十九条相比,《测试管理规定》有以下两方面特色,一是调整了应接受测试的
四类特定岗位人员的顺序,二是扩大了应试人范围,由四类特定岗位人员扩大为六类应接受
测试人员。具体体现为《测试管理规定》把“教师和申请教师资格的人员”列为第一类,这
容易理解,因为《测试管理规定》是教育部的部门规章,也正因此原因,《测试管理规定》
不但首先规定教师应接受测试,还规定申请教师资格的人员应接受测试。《测试管理规定》

第十五条第五款对相关专业学生做出接受测试的规定, 第十五条第六款对相关行业人员测

试进行规定。 这两款规定极大地拓展了测试对象范围,对于充分发挥测试功用具有重要的
促进意义,特别是对各地地方法规规章关于测试对象的约定具有引导和启发意义。第六款将
规定测试的权限交给行业主管部门,把测试管理实施权利交给语言文字工作部门和测试机构,
该条款配合第八条属地管理原则发挥作用,为公共服务行业人员接受测试预留了操作空间。

《测试管理规定》第十六条对测试达标等级确定的职责单位予以明确, 该条是对《语

言文字法》第十九条四类特定岗位工作人员“应当分别达到国家规定的等级标准” 的具体
化,因为国家规定的不同行业人员的等级标准散见于不同行业主管部门几个不同的文件中,
该条规定明确了国家行业主管部门为测试达标等级确定的职责单位,今后拓展范围的其他应
该接受测试的人员的等级标准也由其行业部门规定。《测试管理规定》第十七条规定:“社

会其他人员可自愿申请接受测试。” 该条为非强制性测试应试人提供了测试依据,拓展了
普通话水平测试功能,使之在强制性测试之外具有了部分服务性测试的特征。《测试管理规

定》第十八条对在内地就读的港澳台学生、外国留学生(外籍人士)测试进行规定, 该条


教育部语言文字应用管理司编《新时期语言文字法规政策文件汇编》,语文出版社 2005 年版,第 50 页。

《普通话水平测试管理规定》第十五条第五款:“师范类专业、播音与主持艺术专业、影视话剧表演专业
以及其他与口语表达密切相关专业的学生” (应接受测试)。参见教育部语言文字应用管理司编《新时期语
言文字法规政策文件汇编》 ,语文出版社 2005 年版,第 50 页。

《普通话水平测试管理规定》第十五条第六款: “行业主管部门规定的其他应该接受测试的人员” (应接受
测试) 。参见教育部语言文字应用管理司编《新时期语言文字法规政策文件汇编》,语文出版社 2005 年版,
第 50 页。

《普通话水平测试管理规定》第十六条:“应接受测试的人员的普通话达标等级,由国家行业主管部门规
定。 ”参见教育部语言文字应用管理司编《新时期语言文字法规政策文件汇编》,语文出版社 2005 年版,第
50 页。

《中华人民共和国国家通用语言文字法》第十九条,参见教育部语言文字应用管理司编《新时期语言文字
法规政策文件汇编》 ,语文出版社 2005 年版,第 6 页。

教育部语言文字应用管理司编《新时期语言文字法规政策文件汇编》,语文出版社 2005 年版,第 50 页。

《普通话水平测试管理规定》第十八条:“在高等学校注册的港澳台学生和外国留学生可随所在校学生接
受测试。测试机构对其他港澳台人士和外籍人士开展测试工作,须经国家语言文字工作部门授权。”参见教
育部语言文字应用管理司编《新时期语言文字法规政策文件汇编》 ,语文出版社 2005 年版,第 50 页。
48
是测试应试对象范围的进一步延伸,使测试服务的外延拓展更加丰富。
④关于测试管理其他方面

《测试管理规定》第十九条明确了成绩认定机构,体现了测试实施权责的统一。 《测
试管理规定》第二十条、第二十一条对等级证书进行规定,“统一证书”的指导思想非常明

确, 连同第三条“国家语言文字工作部门颁布测试等级标准、测试大纲、测试规程”的规

定, 测试工作“统一标准、统一大纲、统一规程、统一证书”的“四统一”原则正式确立。

《测试管理规定》第二十二条对应试人测试间隔时间进行规定。 普通话水平测试属于
大规模反复性不定期测试,间隔不少于 3 个月的规定,一是出于测试成本的考量,短时期内
反复测试无疑会增大测试成本;二是为了防止出现偏重测试忽视培训的错误做法,把“以测
促训、以训保测”原则落到实处,促使测试的“抓手作用”和培训的“推手作用”双效统一。

《测试管理规定》第二十三条对应试人申诉进行规定, 该条体现了对应试人的权益予
以保护,凸显了测试的服务性公益性特征,对测试机构和施测主体也有警示作用。《测试管
理规定》第二十四条、第二十五条是纪律处分条款,分别对测试工作人员和应试人违反测试
规定的行为提出具体的纪律处分规定,作为国家法定考试,这些规定是必须的。
《测试管理规定》第二十六条、第二十七条对测试收费进行约定。维持测试工作正常开
展应当收取合理的费用,但必须遵守财务制度,以上两条规定对于规范测试收费,保证测试

的公益性质具有重要作用。
《测试管理规定》第二十八条规定该部门规章的施行时间。
3.《测试管理规定》作为普通话水平测试法律法规依据的作用
(1)集成作用
《测试管理规定》是在国家语委先期试行性文件依据基础上出台的,综合了《普通话水
平测试实施办法(试行)》《国家语言文字工作委员会关于普通话水平测试管理工作的若干
规定(试行)》行之有效的条文及规定,又结合了新的测试实践需求,是测试规范性文件的
集成创新之作。此外,《测试管理规定》将规范效力层级由部门行政性文件提升到国家法规


《普通话水平测试管理规定》第十九条: “测试成绩由执行测试的测试机构认定。”参见教育部语言文字应
用管理司编《新时期语言文字法规政策文件汇编》 ,语文出版社 2005 年版,第 50 页。

《普通话水平测试管理规定》第二十条: “测试等级证书由国家语言文字工作部门统一印制”,第二十一条:
“普通话水平测试等级证书全国通用。 ”参见教育部语言文字应用管理司编《新时期语言文字法规政策文件
汇编》 ,语文出版社 2005 年版,第 50 页。

《普通话水平测试管理规定》第三条:“国家语言文字工作部门颁布测试等级标准、测试大纲、测试规程”。
参见教育部语言文字应用管理司编《新时期语言文字法规政策文件汇编》 ,语文出版社 2005 年版,第 49 页。

《普通话水平测试管理规定》第二十二条:“应试人再次申请接受测试同前次接受测试的间隔应不少于 3
个月。”参见教育部语言文字应用管理司编《新时期语言文字法规政策文件汇编》,语文出版社 2005 年版,
第 50 页。

《普通话水平测试管理规定》第二十三条:“应试人对测试程序和测试结果有异议,可向执行测试的测试
机构或上级测试机构提出申诉。”参见教育部语言文字应用管理司编《新时期语言文字法规政策文件汇编》,
语文出版社 2005 年版,第 50 页。

“测试收费标准须经当地价格部门核准”,“各级测试机构须严格执行收费标准,遵守国家财务制度,并
接受当地有关部门的监督和审计。”详参《普通话水平测试管理规定》第二十六条、第二十七条,教育部
语言文字应用管理司编《新时期语言文字法规政策文件汇编》 ,语文出版社 2005 年版,第 50~51 页。
49
层面,使其在测试依据体系中的作用更加凸显。
(2)具化作用
《宪法》和《语言文字法》是《测试管理规定》的上位法依据,《宪法》是《测试管理
规定》的总依据,《语言文字法》是《测试管理规定》的直接的上位法依据。作为一部专门
法律,
《语言文字法》关于普通话水平测试的法条(共有 2 条)简约概括,具有框架性的特
征。
《测试管理规定》有 28 条,针对性、补充性、明确性、实操性是其突出特征,涉及测试
施测主体、受测对象、成绩认定、证书、纪律、收费等诸多具体内容的约定,是《语言文字
法》测试条款的具体体现和细化。
(3)承上启下作用
《测试管理规定》在测试依据体系中起着承上启下的重要作用。“承上”是指《测试管
理规定》作为国务院部门规章,是《语言文字法》在具体行政管理领域的延伸和具化,对法
中关于普通话水平测试相关法律条款进行了进一步细化;“启下”则是指《测试管理规定》
又是普通话水平测试规范性政策文件的直接依据,是制定和出台普通话水平测试文件的直接
上位依据。
(4)示范作用
法律法规具有示范作用,
《测试管理规定》对其他普通话水平测试依据具有示范作用。
例如,
《测试管理规定》对地方法规、规章的制定具有明显的示范作用,这在受测对象范围
的确定方面有充分的体现。《测试管理规定》拓展了《语言文字法》受测对象,应接受测试
的人员由四类特定岗位人员延展至六类,还规定对“社会其他人员”“港澳台学生和外国留
学生”提供测试服务。《测试管理规定》的这些拓展性规定与《语言文字法》并不矛盾和抵
触,相反与其立法精神是一致的。例如,拓展到“申请教师资格的人员”
“特定专业的学生”
“与口语表达密切相关专业的学生”,这是教育部(国家语委)在本部门权限内制定的针对
本部门人员的补充性规定,符合制定部门规章的法律规定;拓展到“行业主管部门规定的其
他应该接受测试的人员”是对《语言文字法》“提倡公共服务行业以普通话为服务用语”规
定的落实。对于非教育系统的其他行业部门人员的测试,
《测试管理规定》将管理权限交由
行业主管部门,既无“跨界越位”之嫌,规避了权限的交叉,同时又把国家语言文字工作部
门的统筹职能发挥到位。在《测试管理规定》之后出台的地方语言文字法规、规章以及其他
行业的部门规章在制订时,很多受到它的启发和影响,受测对象的拓展性规定成为惯常的做
法。

(二)
《〈教师资格条例〉实施办法》

〈教师资格条例〉实施办法》以国务院部门规章的形式对教师资格进行专门的规定。
推广普通话以学校为基础,教师普通话具有无可替代的示范作用,其普通话水平至关重要,
该办法把普通话水平测试规定为申请和认定教师资格的必备条件之一,在第八条、第十二条、


《〈教师资格条例〉实施办法》
(教育部令第 10 号)
,2000 年 9 月发布。
50

第十四条专门规定普通话水平测试相关内容。 该办法使测试与应试人利益高度相关,直接
推升了测试的地位,因而具有刚性的特征和源头管理的作用,既贯彻了《语言文字法》的要
求,又实现了与《测试管理规定》等邻接法规及政策的衔接与配合,对在教育领域把普通话
水平测试落到实处具有很大的推动作用。

(三)
《汉语作为外语教学能力认定办法》

该办法第四条、第六条、第七条、第十条涉及普通话水平测试。 该办法对从事汉语作
为外语教学的教师的能力和资格认证提出具体的要求,将普通话水平视为对外汉语教学教师
的能力要素之一,使对从事或申请对外汉语教学人员开展测试并达到相应等级标准(二级甲
等)有了具体的依据。随着汉语国际传播事业的发展,对外汉语教学师资水平的提高,二级
甲等的达标标准,现在看来有些偏低,汉语国际传播需要对外汉语教师具备比较高的汉语标
准语能力,建议该《办法》修订时,将对外汉语教师的普通话达标水平提高为一级乙等。
(四)《播音员主持人持证上岗规定》和《广播电视编辑记者、播音员主持人资格管理

暂行规定》

《播音员主持人持证上岗规定》第六条、第七条涉及普通话水平测试; 《广播电视编

辑记者、播音员主持人资格管理暂行规定》第十六条涉及普通话水平测试。


《〈教师资格条例〉实施办法》涉及测试条款节录:
“第八条 申请认定教师资格者的教育教学能力应当符
合下列要求:
(二)普通话水平应当达到国家语言文字工作委员会颁布的《普通话水平测试等级标准》二级
乙等以上标准。少数方言复杂地区的普通话水平应当达到三级甲等以上标准;使用汉语和当地民族语言教
学的少数民族自治地区的普通话水平,由省级人民政府教育行政部门规定标准。
”“第十二条 申请认定教师
资格者应当在规定时间向教师资格认定机构或者依法接受委托的高等学校提交下列基本材料:
(五)普通话
水平测试等级证书原件和复印件。
”“第十四条 普通话水平测试由教育行政部和语言文字工作部门共同组织
实施,对合格者颁发由国务院教育行政部门统一印制的《普通话水平测试等级证书》
。”参见教育部语言文
字应用管理司编:
《新时期语言文字法规政策文件汇编》,语文出版社 2005 年版,第 55~56 页。

《汉语作为外语教学能力认定办法》(教育部令第 19 号),2004 年 8 月发布。

《汉语作为外语教学能力认定办法》涉及测试条款节录:
“第四条 《能力证书》申请者……须具有大专(含)
以上学历和必要的普通话水平。
”“第六条 申请《能力证书》须通过下列考试:初级证书的考试科目为:
现代汉语基本知识、中国文化基础常识、普通话水平。”“第七条 申请中级、高级证书者普通话水平需达
到中国国家语言文字工作委员会规定的二级甲等以上。”“第十条 《能力证书》申请者须向申请受理机构
提交以下材料:(五)普通话水平测试等级证书原件及复印件。”参见教育部语言文字应用管理司编:
《新
时期语言文字法规政策文件汇编》
,语文出版社 2005 年版,第 52~53 页。

《播音员主持人持证上岗规定》(国家广播电影电视总局令第 10 号),2001 年 12 月发布;《广播电视
编辑记者、播音员主持人资格管理暂行规定》(国家广播电影电视总局令第 26 号),2004 年 6 月发布。

《播音员主持人持证上岗规定》涉及测试条款节录:
“第六条 基本条件:(六)普通话水平测试达到国家
《普通话水平测试实施办法》规定的标准。”“第七条 资格取得程序:(一)申请人提出书面申请并提交
以下书面材料:4.普通话等级证书及其他有关证明。”参见教育部语言文字应用管理司编:
《新时期语言文
字法规政策文件汇编》
,语文出版社 2005 年版,第 56 页。

《广播电视编辑记者、播音员主持人资格管理暂行规定》涉及测试条款节录:“第十六条 具备下列条件
的人员,可以申请相关执业资格注册:(五)以普通话为基本用语的播音员主持人,取得与岗位要求一致的
普通话水平测试等级证书。
”参见《中华人民共和国国务院公报》,中华人民共和国中央人民政府网站,
http://www.gov.cn/gongbao/content/2005/content_63223.htm。
51
以上两部规定对播音员主持人的岗位资格认定提出普通话等级标准的明确要求,是广播
电视主管部门根据《语言文字法》相关规定,对播音员主持人实施测试的重要规章依据。广
播电视主管部门作为普通话水平测试工作启动的“三部委”之一,对相关人员的普通话水平
有严格的达标要求,为各行业树立了榜样。

四、省级地方语言文字法规规章

地方语言文字法规和规章是一种重要的测试宏观管理依据,学术界以往对该领域关注几
为空白,实际上,与国家语言文字专门法律和国务院部门规章一样,地方语言文字法规和规
章也有其独特的、不可替代的作用。地方语言文字法规和规章有省级和市级(较大的市)之
分,限于篇幅,本文仅对省级语言文字法规和规章进行研究。
(一)省级语言文字法规规章概况
1.省级语言文字法规和规章基本类别
省级语言文字法规规章根据制定颁布机关的不同和效力的不同,可以区分为两类:省级
语言文字法规和省级语言文字规章。截至2015年底,全国已制定30部省级地方语言文字法规
和规章,其中省级语言文字法规23部,省级语言文字规章7部。
(1)省级语言文字法规
省级语言文字法规的制定机构均为省级人民代表大会常务委员会,《宪法》和《语言文
字法》是省级语言文字法规的上位法和制定依据。省级人民代表大会常务委员会在不同上位
法相抵触的前提下,根据各自行政区域的实际情况和需要制定省级语言文字法规。例如:北
京市第十二届人民代表大会常务委员会第四次会议通过的《北京市实施〈中华人民共和国国

家通用语言文字法〉若干规定》。
(2)省级语言文字规章
省级语言文字规章的制定机构为省级人民政府,《宪法》和《语言文字法》是省级语言
文字规章的上位法和制定依据。省级人民政府,在不同上位法相抵触的前提下,根据各自行
政区域的实际情况和需要制定省级语言文字规章,省级语言文字规章以政府令的形式公布。
例如:天津市人民政府令第86号 《天津市语言文字社会应用管理规定》(2004年);宁夏
回族自治区人民政府令第92号《宁夏回族自治区实施〈中华人民共和国国家通用语言文字法〉

办法》(2006年)。
2.省级语言文字法规规章名称及其规范
全国30部省级语言文字法规和规章中,
“实施办法”的命名方式最为常见,多达20部,
如《安徽省实施〈中华人民共和国国家通用语言文字法〉办法》《山西省实施〈中华人民共
和国国家通用语言文字法〉办法》《重庆市实施〈中华人民共和国国家通用语言文字法〉办


教育部语言文字应用管理司编《国家通用语言文字法律法规汇编》,语文出版社 2015 年版,第 6 页,第
27 页。

教育部语言文字应用管理司编《国家通用语言文字法律法规汇编》,语文出版社 2015 年版,第 10 页,第
155 页。
52
法》;以“实施办法”命名的有15部为省级语言文字法规,5部为省级语言文字规章。有6
个省份用“条例”名称命名,如《吉林省国家通用语言文字条例》《黑龙江省汉语言文字应
用管理条例》《新疆维吾尔自治区语言文字工作条例》;以“条例”名称命名的均为省级语
言文字法规。另有4个省份用“规定”名称命名,如《北京市实施〈中华人民共和国国家通
用语言文字法〉若干规定》《天津市语言文字社会应用管理规定》《广东省国家通用语言文
字规定》;以“规定”命名的有2部为省级语言文字法规,2部为省级语言文字规章。
30部省级语言文字法规和规章的名称中,套嵌“国家通用语言文字”的有27部,在名称
中直接标明其作为《语言文字法》下位法的性质。另有3部名称中未出现“国家通用语言文
字”,需要具体分析:
《新疆维吾尔自治区语言文字工作条例》由于其管辖区域范围内需要规
范管理包括国家通用语言文字和少数民族语言文字在内的6种语言文字,其上位法依据除了
《语言文字法》(属于“专门法”),还有法律层级更高的《民族区域自治法》(属于“基
本法”),因此命名为“语言文字工作条例”是恰当的。《天津市语言文字社会应用管理规
定》就其立法宗旨、依据、内容和区域范围内语言文字实际应用状况而言,以“国家通用语
言文字”命名比现有名称更为合适。“语言文字”涵盖内容过于广泛,“社会应用管理”的
内容又比较窄,似可借鉴其他省份的法规和规章予以修订。《黑龙江省汉语言文字应用管理
条例》名称更值得商榷,该条例早于《语言文字法》制定发布(1997年),如此命名尚无大
碍;但在《语言文字法》颁布后,该条例于2002年进行了修订,名称因承旧名,未予修改,

而且与其法条存在矛盾和冲突。 “普通话和规范汉字”国家通用语言文字的法律地位已由
《语言文字法》予以明确规定,“汉语言文字”的表述内涵不准确,外延宽泛,包含汉语方
言和非规范汉字在内,该表述出现在法规中殊为不当,建议修订为规范的表述。
为了讨论方便,下文讨论我们将以“省份+办法(条例、规定)”的方式指称各省级地
方语言文字法规和规章,如:
“《北京规定》
”“《新疆条例》”“《湖北办法》”。
3.省级语言文字法规规章出台时间研究
从时间上看,全国30部省级语言文字法规规章2000年前出台的仅有2部:1993年《新疆
条例》出台,这是我国第一部省级语言文字法规;另一部较早的省级语言文字法规是1997
年出台的《黑龙江条例》
。省级语言文字法规和规章大规模制定是在2000年《语言文字法》
颁布施行以后,
《黑龙江条例》和《新疆条例》均于2002年根据《语言文字法》进行了修订

《新疆条例》2015年进行了第二次修订)。2003年《北京规定》和《山西办法》先后出台,
二者是2000年《语言文字法》颁布施行以后首批在其影响下新制定的省级语言文字法规。2003
年《测试管理规定》出台,对省级地方语言文字法规和规章起到很好的示范作用,图4–1
可以清晰反映这种影响:


《黑龙江省汉语言文字应用管理条例》第一条规定:“根据《中华人民共和国国家通用语言文字法》和有
关法律、法规的规定,结合本省实际,制定本条例”;第二条规定:“本条例所称汉语言文字是指国家通
用的语言文字,即普通话和规范汉字。” 教育部语言文字应用管理司编《国家通用语言文字法律法规汇编》,
语文出版社 2015 年版,第 40 页。
53
图表 7 图 4–1 全国省级语言文字法规规章颁布时间和数量分布图

通过图4–1我们可以看出,2004年~2007年是省级地方语言文字法规规章出台的高峰期,
这段时期出台省级法规规章20部,占总数的2/3。
《语言文字法》是省级法规规章的直接上位
法律依据,助推作用和引导作用是相当明显的,结合各省级法规规章普通话水平测试的具体
条款来看,
《测试管理规定》的影响也显而易见。
《测试管理规定》的效力在法律体系中虽然
不能管辖省级地方语言文字法规和规章,但就统摄的广度而言,其规定调整范围涉及全国的
测试工作,内容更聚焦、也更具实操性,并且有补充《语言文字法》空白的作用,在测试对
象的拓展方面尤为明显,因此对省级地方语言文字法规规章的制定具有很高的参考价值。
(二)省级语言文字法规规章对普通话水平测试的规定
全国 30 部省级地方语言文字法规和规章,除《新疆条例》以外,其他 29 部均对《语言
文字法》进行细化,制定了更为具体的涉及测试的条款,最主要的是对测试对象、等级标准
要求和测试机构职责等方面做了更为详细的规定。为了更清晰地反映这方面的状况,我们通
过表 4–2 进行观察。

图表 8 表 4–2 全国省级语言文字法规规章新增普通话水平测试内容简况表

应试人 细化 测试机构
省份 明晰罚则
扩大范围 新录聘人员 持证上岗 等级要求 职责

北京(2003) - + - - - -
天津(2004) + (0) + - - - +(1、2)
河北(2007) +(1、2) + - + + +(1、2)
山西(2003) +(1、2) - + + - +(1)

54
内蒙古(2007) +(1、2) - - + + -
辽宁(2005) +(2) - - - - -
吉林(2005) +(1、2) - - + + -
黑龙江(2002) - + - - + -
上海(2005) +(1、2) - - + + -
江苏(2006) +(2) - - + - -
浙江(2006) +(2) + - + + -
安徽(2006) +(1、2) + - + + +(1、2)
福建(2006) +(2) - + + + -
江西(2010) +(2) - - + + +(2)
山东(2004) +(1、2) + - + + -
河南(2014) +(2) - - + + +(1、2)
湖北(2004) +(1、2) + - - + -
湖南(2006) +(1、2) + - + - -
广东(2011) +(2) - - - + -
广西(2006) +(1、2) - + - + -
海南(2010) +(1、2) - + + + +(1、2)
重庆(2004) +(1、2) - - + - -
四川(2004) +(0) - + - + -
贵州(2007) +(2) - - + + -
云南(2004) +(1、2) + + + + -
陕西(2007) +(2) - - + + -
甘肃(2011) +(1、2) - - + + -
青海(2014) +(1、2) - - + + -
宁夏(2006) +(2) - - - + -
新疆(2015) - - - - - -

(注:本表第一列“扩大范围”中,
“+0”表示仅依据《测试管理规定》扩大应试人范围,
“+1、2”表示把

“高等院校、中等职业学校的学生和公共服务行业人员纳入应试人范围,
“+2”表示把公共服务行业人员纳

入应试人范围。本表最后一列“明晰罚则”中,
“+1”表示明晰应试人罚则,
“2”表示明晰测试工作人员罚

则,“+1、2”表示明晰应试人罚则和测试工作人员罚则。“-”表示无新增内容。)

1.拓展关于应试人的规定
大部分省级语言文字法规和规章,拓展了关于测试应试人的规定,主要体现在扩大应试
人范围、增加对新录(聘)人员的普通话等级要求、明确持证上岗制度等三个方面。
(1)扩大应试人范围
全国有 27 个省份,对《语言文字法》规定的四类特定岗位工作人员之外的其他人员作

了拓展性规定。天津、四川的拓展性规定与《测试管理规定》的拓展性规定一致; 其他 25


参见《天津市语言文字社会应用管理规定》《四川省实施〈中华人民共和国国家通用语言文字法〉办法》 ,
教育部语言文字应用管理司编《国家通用语言文字法律法规汇编》,语文出版社 2015 年版,第 12 页,第
126 页。
55
个省份则在《测试管理规定》基础上又作了扩充,最突出的是把高等院校、中等职业学校的
学生和公共服务行业人员纳入应试人范围。表 4–2 显示,有多达 25 个省份把公共服务行业
人员纳入应试人范围;其中河北、山西、内蒙古、吉林、上海、安徽、山东、湖北、湖南、
广西、海南、重庆、云南、甘肃、青海等 15 个省份,把高等院校、中等职业学校的学生和
公共服务行业人员均纳入应试人范围。
2003 年颁布施行的《山西办法》是最早对测试应试人做出扩充性规定的省级语言文字
法规,该办法对公共服务行业从业人员、大中专毕业生的普通话水平,均规定了具体的达标
要求,并细致区分了公共服务行业一般从业人员与特定岗位人员不同的普通话等级要求(前
者为三级,后者为二级),对大中专毕业生更是区分了师范类与非师范类、师范类中文专业

与非中文专业的不同要求, 这些规定对其他省份起到了很好的借鉴效应。
应试人范围的扩大还体现为对《语言文字法》规定的四类特定岗位人员的外延有所扩充。

《河南办法》
《广东规定》均把应测试人员延展到配音人员, 配音人员与“播音员、节目主
持人和影视话剧演员”具有相近的专业语言要求和同样的语言榜样示范作用,将其纳入应试
人范畴既有现实的需要,又符合逻辑,是很好的补充性规定。关于“教师”的规定,《河北

办法》
《上海办法》
《湖南办法》均将教学管理人员和辅导(辅助)人员纳入应试人范畴, 对
教学管理人员和辅导(辅助)人员的普通话水平进行规定,与国家语委 1996 年 “九五”计

划提出的“使普通话成为学校的校园语言”的目标相协调, 将教学管理人员和辅导(辅助)
人员纳入应试人范畴,有利于创设校园语言氛围,充分发挥学校语言环境的浸润效应。关于
“国家机关工作人员”的外延,《河北办法》《浙江办法》《甘肃条例》均有所扩展,把社会

团体(人民团体)
、事业单位(组织)涵括在内。 1998 年起国家语委开始提出 “一个中心,

四大领域”的推普工作思路,
“以党政机关为龙头”是重要内容之一, 在我国的国家治理体
系中,社会团体、事业单位也是参与国家管理的重要社会支柱,对其人员提出普通话等级要


“公共服务行业从业人员的普通话应达到三级以上水平,其中播音员、解说员、导游员、话务员等特定岗
位人员的普通话应当达到二级以上水平。 ”“大中专学生毕业时的普通话应当达到三级甲等以上水平,其中
师范类中文专业学生毕业时的普通话应当达到二级甲等以上水平,师范类其他专业毕业时的普通话应当达
到二级以上水平。 ”参见《山西省实施〈中华人民共和国国家通用语言文字法〉办法》,教育部语言文字应
用管理司编《国家通用语言文字法律法规汇编》 ,语文出版社 2015 年版,第 24~25 页。

《河南办法》的规定是“播音员、节目主持人、影视话剧演员和配音专业人员”, 《广东规定》的表述是“播
音员、节目主持人、影视话剧演员、配音演员” 。参见《河南省实施〈中华人民共和国国家通用语言文字法〉
办法》 《广东省国家通用语言文字规定》,教育部语言文字应用管理司编《国家通用语言文字法律法规汇编》,
语文出版社 2015 年版,第 89 页,第 106 页。

《河北办法》规定为“教师及管理人员”, 《上海办法》规定为“教师”和“学校及其他教育机构中除教师
以外的其他管理人员” ,《湖南办法》规定为“教师”和“教学辅助人员”。详参教育部语言文字应用管理司
编《国家通用语言文字法律法规汇编》 ,语文出版社 2015 年版,第 17 页(河北) 、第 58 页(上海)、第 99
页(湖南) 。

《国民经济和社会发展第九个五年计划期间国家语言文字工作计划》, 《语文建设》1996 年第 9 期,第 4
页。

《河北办法》规定为“国家机关、社会团体、事业单位工作人员” ,《浙江办法》规定为“国家机关和具有
管理公共事务职能的事业组织的工作人员” ,《甘肃条例》规定为“国家机关、人民团体、事业单位工作人
员” 。详参教育部语言文字应用管理司编《国家通用语言文字法律法规汇编》,语文出版社 2015 年版,第
17 页(河北)、第 60 页(浙江)、第 147 页(甘肃) 。

1998 年《首届全国推广普通话宣传周宣传提纲》 ,参见教育部语言文字应用管理司编《新时期语言文字法
规政策文件汇编》 ,语文出版社 2005 年版,第 230 页。
56
求,对于扩大测试的影响力和覆盖面具有积极的作用,是一种很有意义的探索。
(2)对新录(聘)人员提出普通话等级要求
表 4–2 显示,北京、天津、河北、黑龙江、浙江、安徽、山东、湖北、湖南、云南等
10 个省份,对特定岗位新录(聘)人员提出普通话等级要求。
《安徽办法》对国家机关、学
校、新闻媒体新录(聘)人员提出考核要求;
《云南条例》对国家机关新录(聘)人员提出
普通话等级要求;北京、天津、黑龙江等 3 个省份对新录(聘)人员提出要求的岗位范围与
《语言文字法》规定的四大类人员一致;河北、浙江、山东、湖北、湖南等 5 个省份则将新

录(聘)人员的要求范围扩展至公共服务行业特定岗位。 这些规定使得管理前移,是促进
测试工作的有效措施,值得其他省份借鉴。
(3)明确持证上岗制度

持普通话等级证书上岗制度最早由 1994 年“三部委《决定》”提出。 此后,《〈教师资
格条例〉实施办法》(2000 年)对教师提出持证上岗的明确规定;《关于进一步做好播音员
主持人持证上岗工作的几点意见》
(1997 年)、
《播音员主持人持证上岗规定》
(2001 年)、
《广
播电视编辑记者、播音员主持人资格管理暂行规定》
(2004 年),对播音员、节目主持人提
出持证上岗的明确规定;
《关于在文化系统贯彻实施〈中华人民共和国国家通用语言文字法〉

的通知》(2001 年)
,则对话剧演员提出持普通话等级证书上岗的制度。
表 4–2 显示,山西、福建、广西、海南、四川、云南等 6 个省份,明确提出了持证上
岗制度。各省份对持证上岗职业类别的规定不尽相同,
《海南办法》规定的是教师和播音员、
节目主持人;
《山西办法》
《云南办法》规定的是教师及播音员、节目主持人和影视话剧演员;
《福建办法》《四川办法》规定得比较宏观,按照国家规定对相关职业人员执行持证上岗;
《广西办法》规定的对象最为具体和广泛,除了包含上述省份规定的各类相关人员,还把“公

共服务行业的播音员、解说员、导游员、话务员”列入持证上岗制度要求的对象。
持证上岗作为一种制度性设计,一般先由行业主管部门出台部门规定,甚至以部门规章
的形式呈现,省级语言文字法规规章对持证上岗制度做出规定,更加强化了这一制度的法律
保障作用,使普通话水平测试工作的长效机制有了更加充分的支撑。
2.细化对有关人员的普通话水平要求


10 省份具体规定详参教育部语言文字应用管理司编《国家通用语言文字法律法规汇编》 ,语文出版社 2015
年版,第 7 页(北京) 、第 12 页(天津) 、第 17 页(河北) 、第 44 页(黑龙江) 、第 60 页(浙江)、第 68
页(安徽) 、第 84 页(山东) 、第 95 页(湖北) 、第 99~100 页(湖南)、第 136 页(云南) 。

该文件规定: “对播音员、节目主持人、教师等岗位人员,从 1995 年起逐步实行持普通话等级证书上岗制
度。 ”参见国家语言文字工作委员会、国家教育委员会、广播电影电视部《关于开展普通话水平测试工作的
决定》 ,教育部语言文字应用管理司编《新时期语言文字法规政策文件汇编》,语文出版社 2005 年版,第
205 页。

以上文件详参教育部语言文字应用管理司编《新时期语言文字法规政策文件汇编》,语文出版社 2005 年版,
第 55~56 页、第 56 页、第 132 页、第 159 页;中华人民共和国中央人民政府网站,http://www.gov.cn/
gongbao/ content/2005/content_63223.htm。

6 省份具体规定详参教育部语言文字应用管理司编《国家通用语言文字法律法规汇编》 ,语文出版社 2015
年版,第 25 页(山西)、第 72 页(福建)、第 110 页(广西) 、第 118 页(海南)、第 126 页(四川)
、第
136 页(云南) 。
57
《语言文字法》和《测试管理规定》都有应试人普通话达到国家规定的等级标准的原则
性规定,但对各类别应试人应达到的普通话等级标准均无具体表述。表 4–2 显示,有 20
个省份对有关人员的普通话水平要求进行了具体的规定。
以《河北办法》为例,该办法对应参加测试人员的年龄有明确规定,而且分 5 大类、12
个次类,对不同职业、不同岗位类别、不同层级的应试人员应达标的等级标准进行了非常详
细具体的规定。其中以对教育系统的规定最为细密,对教育从业人员按“工作人员”“教师
及管理人员”
“汉语文教师”
“语音教师”分别规定了从“三级甲等”依次上升到“一级乙等”
的等次要求;对高校及中等职业学校学生,则根据与口语表达密切程度区分专业类别,分别

规定“二级乙等”和“二级甲等”两个达标等级要求。 对播音员、节目主持人及影视话剧
演员、公务人员、公共服务行业人员等其他职业,也都区分不同层次进行不同等级的要求。
这种细化管理的规定,依类分层要求,既符合语言应用实际和普通话推广实际,又有利于提
高测试工作的执行性。
3.细化普通话测试机构职责
测试工作管理机构的职能,
《语言文字法》规定得较为宏观,
《测试管理规定》则对国家
级及省级测试管理机构、测试实施机构的职能进行了较为详细的规定。表 4–2 显示,有 22
个省份法规规章对普通话测试机构职责进行细化,特别是对辖区内省级及以下测试机构的职
责进行了规定。
例如《河北办法》对省级和省级以下语言文字工作部门和培训测试机构的职能进行了明

确表述。 《上海办法》
《云南条例》均在条文中明确设立普通话测试专门机构,负责实施测
试工作,使得测试机构设置和工作职能得到根本的保障。有的省份对辖区内测试机构的职能
规定得很具体,例如《内蒙古办法》对自治区、盟市,乃至高等学校及相关行业培训测试机
构的职能都予以具体表述,为测试机构依法实施测试提供了充分的法理支持,增强了依法行

政的支撑力度。
4.明晰罚则
《语言文字法》对违反测试规定的人员和行为没有具体罚则,《测试管理规定》针对违
规测试工作人员和应试人提出了处罚规性定。表 4–2 显示,天津、河北等 7 个省份,与《测
试管理规定》相协调,明晰了对违规人员的罚则。
就处罚的对象而言,
《山西办法》对违规应试人提出了罚则,
《江西办法》对违规测试工
作人员提出了罚则,天津、河北、安徽、河南、海南等 5 省份则对违规测试工作人员和应试


详参《河北省实施〈中华人民共和国国家通用语言文字法〉办法》,教育部语言文字应用管理司编《国家
通用语言文字法律法规汇编》 ,语文出版社 2015 年版,第 18 页。

《河北省实施〈中华人民共和国国家通用语言文字法〉办法》规定:县级以上语言文字主管部门负责培训
测试工作的“组织协调和指导监督” ,省级语言文字工作主管部门负责“核发普通话水平等级证书”;培训
测试机构负责培训测试工作的实施。详参教育部语言文字应用管理司编《国家通用语言文字法律法规汇编》,
语文出版社 2015 年版,第 17 页。

3 省份具体规定详参教育部语言文字应用管理司编《国家通用语言文字法律法规汇编》,语文出版社 2015
年版,第 50 页(上海)、第 134 页(云南)、第 30 页(内蒙古) 。
58
人均提出了罚则。处罚行为的实施机构各省份各不相同,常见的做法是由省级语言文字工作
部门(省级教育行政部门)、测试机构、违法行为人所在单位,根据违规行为情节做出不同
的处罚。在具体罚则方面,应试人违规的,一般会受到取消测试成绩的处罚;情节严重的,
给予行政处分。测试工作人员违规的,一般给予批评教育;情节严重的,取消测试工作资格,

给予行政处分。
地方性法规规章明晰对违规人员的罚则,体现了“以罚止禁”
“违禁有罚”“处罚法定”
的法律原则,这是严肃测试纪律,提高测试权威性,保证测试依法有效实施的客观需要。
(三)省级语言文字法规规章作为普通话水平测试法律法规依据的作用
1.补充拓展作用
省级法规规章是我国语言文字法律法规体系中的一种重要类别,在测试依据体系中具有
独特的、不可替代的作用。省级法规规章具有严格的从属性,有着与《语言文字法》相一致
的立法价值取向和立法定位;省级法规规章同时具有鲜明的地域性,必须根据各自管辖区域
内的社会、经济、政治、文化实际状况,尤其是与语言文字使用状况相协调。因此省级法规
规章关于普通话水平测试的规定,必须遵循《语言文字法》,并根据需要有所补充拓展。
例如,内蒙古、吉林、海南、贵州、云南、甘肃、青海等 7 个民族区域自治区或少数民
族人口较多的省份,对少数民族应试人有补充拓展的明确规定。以教师达标等级规定为例,
以上 7 省份均对以民族语言授课为主的教师进行补充性规定,
《甘肃条例》规定为三级乙等,
其余 6 省份规定为三级甲等。其他如《广西办法》对乡镇机关工作人员达标等级的补充性规
定,《青海办法》对母语非汉语的少数民族师范院校毕业生达标等级的补充性规定等等,也

都具有补充拓展的作用。 这些规定对在以上省份开展测试具有现实意义。
2.指导操作作用
省级地方语言文字法规规章是针对管辖区域内语言文字状况和实际的比较具体的专门
规定,相对于《语言文字法》
,具有突出的实施性和执行性。
如上文所述,上海、江苏、浙江等 20 个省份对有关人员的普通话水平要求进行了细化,
例如《广西办法》对教师达标等级的细密规定很有特点:普遍达标规定为二级乙等;语文教
师和对外汉语教师则提高为二级甲等;乡镇、农村学校教师则降低为三级甲等(其中语文教

师又有高于其他教师,为二级乙等)
, 这种详尽的分层分类要求,具有很强的指导操作作用。
又如《湖南办法》对公共服务行业从业人员达标等级的规定,三级乙等为普遍性要求,对其
中的“播音员、解说员、导游员、话务员、律师、星级宾馆服务员等特定岗位人员”则要求


7 省份具体规定详参教育部语言文字应用管理司编《国家通用语言文字法律法规汇编》,语文出版社 2015
年版,第 13 页(天津)、第 19~20 页(河北)、第 26 页(山西)、第 68 页(安徽)、第 81 页(江西)、第
89~90 页(河南)、第 120 页(海南) 。

7 省份具体规定详参教育部语言文字应用管理司编《国家通用语言文字法律法规汇编》,语文出版社 2015
年版,第 30 页(内蒙古) 、第 38 页(吉林)、第 118 页(海南)、第 131 页(贵州)、第 135 页(云南)
、第
147 页(甘肃)、第 153 页(青海)。

《广西壮族自治区实施〈中华人民共和国国家通用语言文字法〉办法》,教育部语言文字应用管理司编《国
家通用语言文字法律法规汇编》 ,语文出版社 2015 年版,第 109~110 页。
59

达到二级乙等以上。 该规定把公共服务行业人员纳入测试应试人范畴,而且比《测试管理
规定》更具操作指导意义。
3.探索创新作用
省级地方语言文字法规规章在普通话水平测试依据体系中的作用是多方面的,一方面把
《语言文字法》的相关规定延承下来并加以细化,另一方面根据当地语言应用实际和测试的
发展需要,主动适应测试工作发展规律,在不违背《语言文字法》立法价值取向和立法定位
的基础上,以地方法规规章的形式加以规定,因此具有探索创新的作用。
例如,上文所述天津、河北、海南等 7 个省份增加对违规人员的罚则,北京、天津、河
北等 10 个省份对新录(聘)人员提出普通话等级要求,山西、福建、广西等 6 个省份明确
提出持证上岗制度,相对《语言文字法》而言,这些省级语言文字法规规章都具有先行探索
性,这种探索和创新,对完善《语言文字法》具有借鉴意义。

五、普通话水平测试法律法规依据的层级体系

普通话水平测试法律法规依据具有典型的层级性特征,根据法律地位和效力的不同,可
以排列成若干层级,构成一个完整的体系。其从属关系如图 4–2 所示:

图表 9 图 4–2 普通话水平测试法律法规依据效力等级图

图 4–2 自上至下是统属关系,我们可以看出,
《宪法》依据居效力等级最高层,《语言
文字法》依据居第二层,国务院部门规章依据、省级地方性法规依据、省级地方性规章依据

居第三层。按照《立法法》的规定, 省级语言文字法规依据的效力高于省级语言文字规章
依据。但就全国范围看,省级语言文字法规和省级语言文字规章并不共现,因此图 4–2 显


《湖南省实施〈中华人民共和国国家通用语言文字法〉办法》,教育部语言文字应用管理司编《国家通用
语言文字法律法规汇编》 ,语文出版社 2015 年版,第 99 页。

《中华人民共和国立法法》第八十九条的规定:“地方性法规的效力高于本级和下级地方政府规章。 ” 中
国人大网,http://www.npc.gov.cn/npc/dbdhhy/12_3/2015-03/18/content_1930713.htm。
60
示二者是“并列关系”而非“从属关系”。国务院部门规章与省级语言文字法规、省级语言
文字规章,是“纵”“横”两种类型法律法规的关系,根据《立法法》相关法条的规定,国
务院部门规章与省级语言文字规章具有同等效力,国务院部门规章与省级语言文字法规关系

较为复杂。 总体而言,如图 4–2 所示,三者呈“并列”关系。就目前实践来看,作为国务
院部门规章的《普通话水平测试管理规定》
《〈教师资格条例〉实施办法》和《播音员主持人
持证上岗规定》的出台早于大部分省级语言文字法规、规章,对其制定有示范作用。以上国
务院部门规章分别对教育和广电系统的规定比较周详,对其他行业不宜规定过多;省级语言
文字法规、规章对辖区内各领域均可提出规范性规定。因此国务院部门规章“纵”的规范和
省级语言文字法规、规章“横”的规范相结合,相辅相成,在各自权限范围内,协同发挥作
用,构成了普通话水平测试比较完备的法规依据体系。

六、法律法规依据的作用

(一)规范作用
所谓规范,就是规则和标准。普通话水平测试作为一种社会行为,必须通过一定的社会
规范来调节各相关要素间的一系列关系。法律法规由国家制定,是由国家力量保证实施的具
有普遍约束力的社会规范。普通话水平测试法律法规体系自上而下,从纵到横,对测试活动
的各个要素和环节进行规范,这种社会规范在产生方式、调整手段、适用范围、程序要求、
效力层次和规范力度上,都远远超过主管部门或行业部门的政策文件或制度规定。
(二)保障作用
普通话水平测试工作的健康发展离不开测试法律法规依据体系的保障。后者对前者的保
障作用主要体现在明晰权责、价值平衡两个方面。法律法规明确了普通话水平测试的法律地
位、法律目标、运行程序、管理机构以及对象范围,明晰了测试参与者的权责,更重要的是
法律法规具有很强的稳定性和很高的权威性,对于确保测试工作在相关行业以及公众心中具
有合法的、长期的预期具有重要的作用。任何法律制度的背后都有一定的价值追求,测试法
律法规依据在发展过程中体现了这种探索,将应试人区分为“应当接受测试”和“鼓励接受
测试”人群,对母语非汉语的少数民族应试人做出补充性规定等等,这些都体现出尽量兼顾
各种价值诉求的、更为合理的价值平衡。这种价值平衡的作用,对于解决测试中错综复杂的
问题,避免制度失当带来的混乱,都具有重要意义。
(三)促进作用
普通话水平测试法律法规依据通过立法这种特殊的制度架构,促进了测试功能的充分实


《中华人民共和国立法法》第九十一条规定:“部门规章之间、部门规章与地方政府规章之间具有同等效
力,在各自的权限范围内施行。”第九十五条规定: “地方性法规与部门规章之间对同一事项的规定不一致,
不能确定如何适用时,由国务院提出意见,国务院认为应当适用地方性法规的,应当决定在该地方适用地
方性法规的规定;认为应当适用部门规章的,应当提请全国人民代表大会常务委员会裁决” “部门规章之间、
部门规章与地方政府规章之间对同一事项的规定不一致时,由国务院裁决。”中国人大网,http://www.npc.
gov.cn/npc/dbdhhy/12_3/2015-03/18/content_1930713.htm。
61
现。作为推广国家通用语的重要措施,测试工作发展需要国家宏观政策的支持和引导,但仅
依靠政策支持引导其价值实现还较有局限,普通话水平测试法律法规依据则可以通过法律规
范的功能集合优势,把测试的作用充分地发挥出来。普通话水平测试法律法规依据可以认为
是一种政府推动型的法律法规体系,明确了政府及其附属机构在测试工作中的组织者、领导
者地位,其推动促进作用是巨大和显著的。图 4–3 全国测试量累计的变化可以显示出这种
作用:

图表 10 图 4–3 全国测试量累计变化简图

(数据来源:2000 年采用《中华人民共和国国家通用语言文字法学习读本》(第 90 页)数据,2004 年采

用袁贵仁《总结经验,再接再厉,开创普通话水平测试和语言文字应用研究的新局面——在庆祝普通话水

平测试开展 10 周年暨语言文字应用研究所成立 20 周年座谈会和第四届全国社会语言学研讨会开幕式上的

讲话》数据,其余各年数据采用国家语委普通话与文字应用培训测试中心编《普通话水平测试二十年大事

记(1994~2014)》(未刊)统计。)

如图4–3所示,2000年以前的6年,普通话水平测试年测试量平均为50万人次左右,对
于新兴的测试已属不易。随着2000年《语言文字法》和2003年《测试管理规定》的颁布,测
试量有快速提升,四年间测试量增长了3倍,年均测试量达225万人次。2004年~2007年是各
地语言文字法规规章颁布的高峰期,有20部省级法规规章出台,对测试的促进作用甚为显著,
到2008年,测试量增长了约100%,四年间的年均测试量达约295万人次。2008年以后,随着
各地语言文字法规规章数量的进一步增长和计算机辅助测试的开展,两个“推进器”叠加助
力,普通话水平测试量到2012年有了进一步的增长,测试量增长了约71.3%,四年间的年均
测试量达约424万人次。到2014年,各地语言文字法规规章颁布的基本覆盖,计算机辅助普
通话水平测试也基本实现全覆盖,年均测试量达约500万人次。普通话水平测试法律法规依
据是测试的顶层控制性依据系统,其指引教育、调控激励和强制保障等功能的实现,是促进
测试发展的重要动力。
62
第二节 普通话水平测试政策文件依据

普通话水平测试政策文件依据是由中共中央、国务院及国家有关部门制定和发布,对普
通话水平测试具有权威性、导向性和规定意义的文件的总和。政策文件依据是以党政组织为
行为协调主体的规范准则文件,因为这个特质,政策文件依据在测试依据体系中发挥着重要
的作用。

一、中共中央和国务院政策文件依据


(一)
《国务院批转国家语委关于当前语言文字工作请示的通知》
该通知 1992 年下发,是酝酿探索阶段重要的政策文件依据。该通知以 1/3 的篇幅对推
广普通话工作进行充分论述,强调其为新时期“语言文字工作首要任务”,并对推普的重要
意义和工作部署进行了详细表述。该通知明确了推普的重点地区和基础领域,提出“从地区
上讲……重点是南方方言区”
“社会推广普通话的工作,重点是抓好城市”
“推广普通话,学
校是基础”
。该通知还从社会应用角度提出“学校用语”“工作用语”“服务用语”等普通话
推广的应用目标,对服务行业的“窗口作用”和新闻媒体的“示范作用”也有清晰的表述,

对此后形成“一个中心,四大领域”的推普工作新思路有直接的先导作用。
该通知对学校推普尤为重视,对学校开设普通话课程做出规定,对教师及相关专业毕业
生普通话的要求也有具体表述,特别是首次在国家行政管理层面提出对教师及毕业生普通话

进行考核,并建议与教学评估、评优评聘以及毕业证书相关联。 以上规定为普通话水平测
试的加快实施提供了政策文件依据。
(二)十七届六中全会《决定》和十八大报告
2011年10月,党的十七届六中全会《决定》中提出“大力推广和规范使用国家通用语言
文字,科学保护各民族语言文字”的新表述,这是《决定》的一大亮点。语言文字工作在中
央文件特别是党中央全会文件中出现,极为罕见,“推广和规范使用国家通用语言文字”是
党中央站在时代前沿,着眼于文化建设全局提出的语言文字工作新定位,是对我国语言文字

事业发展主要矛盾和主要任务的高度凝练,其基础性、战略性作用得到充分彰显。


《国务院批转国家语委关于当前语言文字工作请示的通知》,1992 年 11 月下发(国发﹝1992﹞63 号) 。

《国务院批转国家语委关于当前语言文字工作请示的通知》,具体内容详参教育部语言文字应用管理司编
《新时期语言文字法规政策文件汇编》 ,语文出版社 2005 年版,第 33~34 页。

“各级各类师范学校(包括承担师资培养任务的普通高校、有条件的部分民族院校)和职业高中的幼师类、
文秘类、公共服务类(旅游、商业等)专业都要开设普通话课程,要把普通话作为一项重要基本功,认真
训练,严格考核;普通话不合格的毕业生,必须进行补课和补考,补考合格后方可发给毕业证书。用普通
话进行教学是合格教师的一项必备条件,应当成为评估教学质量、评选优秀教师、评聘教师职务的一个内
容。对语文教师说普通话的能力和水平应有更高的要求。”参见教育部语言文字应用管理司编《新时期语言
文字法规政策文件汇编》 ,语文出版社 2005 年版,第 34 页。

详参《中共中央关于深化文化体制改革推动社会主义文化大发展大繁荣若干重大问题的决定》,人民网(中
国共产党新闻网),http://cpc.people.com.cn/GB/67481/94156/231018/。
63

2012年11月,党的十八大报告再次强调“推广和规范使用国家通用语言文字”
。 一年之
内,这一新论断、新要求连续两次出现在党的最高层级的文件中,而且从中央全会文件到党
的代表大会报告,“推广和规范使用国家通用语言文字”这一语言文字工作的核心工作被提
升到了前所未有的新高度,堪称语言文字工作事业发展进程中的一座里程碑。
十七届六中全会《决定》和十八大报告凸显了“推广和规范使用国家通用语言文字”的
核心地位和战略作用,作为普通话推广普及和提高重要手段的普通话水平测试肩负着更加艰
巨的使命,开展普通话水平测试有了更加强大的动力和更为充分的政策文件依据。

二、语言文字工作部门政策文件依据

(一)两次全国语言文字工作会议报告
20世纪80年代和90年代,国家语委召开了两次在我国语言规划史上具有划时代意义的全
国语言文字工作会议,两次会议的报告均对普通话水平测试进行了论述。1986年会议的主题
报告,富有创造性地由政府主管部门首次提出普通话水平等级的设想,并勾勒出普通话三级
的设计雏形,该报告发布了开展普通话水平测试工作的动员令。
1997年会议主题报告为我国语言文字工作描绘了跨世纪的蓝图。该报告对普通话水平测
试工作成效予以充分肯定,认为此项工作使普通话推广工作迈上了新台阶,并对特定岗位人
员普通话水平提出明确要求。该报告对测试工作发展进行部署,为其下一步发展张目壮势,
该报告是普通话水平测试实施发展阶段重要的政策文件依据。
(二)国家语言文字工作规划性文件
国民经济和社会发展五年规划(
“十一五”之前称为“五年计划”)属中期规划,在我国
经济社会发展中具有重要地位。我国国家语言文字工作的五年规划,始自 1986 年“七五”
计划,这些中期规划都对普通话水平测试具有直接或间接的依据作用。

1.《“七五”期间语言文字工作规划(草案)》
“七五”规划(草案)提出,到20世纪末“要按普及普通话的三级要求,在全国范围内使
普通话成为‘教学语言’、
‘工作语言’、
‘宣传语言’和公共场合的‘交际语言’。
‘七五’期
间,推广普通话要根据各地区经济文化发展的需要和已有的工作基础,对不同行业和不同年

龄的人提出不同的要求。”
“七五”规划(草案)是落实 1986 年全国语言文字工作会议的第一个语言文字工作五年
规划,“普通话三级要求”的明确,“教学语言、工作语言、宣传语言、交际语言”目标的
提出,“对不同行业和不同年龄的人提出不同的要求”的政策指向,都对普通话水平测试具
有指导意义。


详参《坚定不移沿着中国特色社会主义道路前进 为全面建成小康社会而奋斗》,人民网(中国共产党新
闻网),http://cpc.people.com.cn/n/2012/1118/c64094-19612151.html。

《“七五”期间语言文字工作规划(草案)》,1986 年制定。
陈乃华:《国家语委和国家教委联合召开“七五”期间语言文字工作规划会议》
,《语文建设》1986年第6

期,第7页。
64

2.《国家语言文字工作十年规划和“八五”计划纲要》
该计划纲要把“大力推广、积极普及普通话”列为 20 世纪最后十年的主要任务之首,
并再次明确到世纪末,使普通话成为“教学用语、交际用语、工作用语”的目标任务和“县
以上广播、话剧、影视制作等要用标准的普通话”的要求,并提出师范院校和重点地区普通
话成为“校园用语”的要求,相较“七五”计划“教学语言”的表述,在要求上更提高了一

步。
该规划纲要的一个突出的创新成果是提出了推广普通话工作的新方针——“大力推行、

积极普及、逐步提高”,并要求“在深度上和广度上要上一个新的台阶”, 这个新表述和新
要求具有继往开来的重要意义,对普通话水平测试的出台起到了重要促进作用。该规划纲要

还提出“
‘八五’期间要着手语言文字基本法的研究、起草工作”, 这是首次对语言文字法
律法规依据的起草进行工作部署,发出了时代的先声。

3.《国民经济和社会发展第九个五年计划期间国家语言文字工作计划》
“九五”计划把“坚持普通话的法定地位,继续大力推广普通话”确定为第一项任务,
并要求“大力推行、积极普及,逐步提高普通话的应用水平。”使普通话成为“校园语言”

“工作用语”“主要服务用语”“播音用语”,普通话的领域应用目标更为清晰。 “九五”
计划对刚刚起步的普通话水平测试给予肯定,该计划提出 4 项推广普通话主要措施,其中第
三项专门针对普通话水平测试工作:“普通话的水平标准必须统一。要进一步完善《普通话
水平等级标准》,加强普通话培训,完善等级测试办法,在全国建立健全布局合理的普通话

培训测试网络。” 这是在国家语言文字五年规划中首次对普通话水平测试工作进行专门部
署,测试工作开始在国家中长期语言文字工作规划中占据一席之地。

4.《国家语言文字工作“十五”计划》
“十五”计划首次明确提出:“一个中心,四个重点领域,三项基本措施”的语言文字

工作新思路。 普通话水平测试作为三项长效的基本措施之一,在“十五”计划中予以了充
分重视。在“十五”期间主要任务和主要工作措施两大部分,对测试均有集中的表述,尤其
是在主要工作措施方面,“十五”计划更是以整条的篇幅对普通话水平测试工作进行了专门


《国家语言文字工作十年规划和“八五”计划纲要》,1992 年制定。

详参《国家语言文字工作十年规划和“八五”计划纲要》,王均主编《当代中国的文字改革》,当代中国出
版社 1995 年版,第 847~849 页。

《国家语言文字工作十年规划和“八五”计划纲要》,王均主编《当代中国的文字改革》,当代中国出版社
1995 年版,第 848 页。

《国家语言文字工作十年规划和“八五”计划纲要》,王均主编《当代中国的文字改革》,当代中国出版社
1995 年版,第 852 页。

《国民经济和社会发展第九个五年计划期间国家语言文字工作计划》,1996 年制定。

《国民经济和社会发展第九个五年计划期间国家语言文字工作计划》, 《语文建设》1996 年第 9 期,第 4
页。

《国民经济和社会发展第九个五年计划期间国家语言文字工作计划》, 《语文建设》1996 年第 9 期,第 4
页。

《国家语言文字工作“十五”计划》,2001 年制定。

教育部、国家语委关于印发《国家语言文字工作“十五”计划》的通知(教语用﹝2001﹞2 号),教育部
语言文字应用管理司编《新时期语言文字法规政策文件汇编》 ,语文出版社 2005 年版,第 270 页。
65
的部署。“十五”计划是《语言文字法》实施后的第一个五年规划,普通话水平测试在规划
中所占篇幅约为 6.5%,给予重视的程度超过以往。
“十五”计划在依法施测及管理、实行持
证上岗制度、测试机构网络建设、规章制度建设、科学研究、题库建设等方面进行了整体规

划, 为“十五”期间普通话水平测试工作提供了依据和蓝图。

5.《国家语言文字工作“十一五”规划》
“十一五”规划多次提及普通话水平测试工作。在“十五”期间工作进展部分,对普通
话水平测试法规建设、业务规范建设、科研应用研究及标准建设成绩予以充分肯定,对《语
言文字法》《测试管理规定》和地方法规规章的公布施行,以及新《测试大纲》和系列管理
办法的出台等测试依据的标志性成果给予了特别的关注,对测试规模增长、领域拓展取得的

新进展给予积极评价。 “十一五”规划对测试工作目标、工作措施有不少新提法,并提出
适应新形势,立足科学发展,注重工作创新的新要求。这些新提法、新要求体现为三方面:
一是把普通话水平测试放到“建成汉语应用能力的立体测试系统”中去重新定位(包括汉语
国际传播整体战略中的语言测评);二是强调依据《语言文字法》,加强测试管理,重点领
域保落实(教师、城市公务员),拓展领域要推进;三是把测试手段自动化和管理信息化作
为明确目标。“十一五”规划是普通话水平测试在“十一五”期间的重要的依据,为测试发
展尤其是测试新技术的发展提供了重要遵循。

6.《国家中长期语言文字事业改革和发展规划纲要﹙2012—2020 年﹚》
《规划纲要》是新世纪以来我国语言文字事业第一部中长期的指导性、纲领性文件。
《规
划纲要》是根据党的十八大对新时期语言文字工作提出的新要求,围绕为“五位一体”社会
主义事业总体布局提供服务和支撑而制定的,凸显了语言文字工作围绕全局,服务需求的主
旨。《规划纲要》在指导思想、目标任务和具体措施上,都体现出对十八大精神的贯彻和落
实,“推广和规范使用国家通用语言文字”成为其“关键词”之一。
《规划纲要》给予普通话水平测试突出的地位,正文中有 28 次提及测试和测试员,测
试成为高频词。
《规划纲要》在指导思想、目标任务、重点工作、创新保障 4 章中都涉及普
通话水平测试(或测评体系)内容;在 7 项主要任务中,有 3 项任务与普通话水平测试相关;
在 16 项重点工作中,有 4 项涉及普通话水平测试。因此,在《规划纲要》中普通话水平测
试已不仅仅是一项任务或措施,而是承担着方向目标、工作支撑、创新保障等全方位的作用。
《规划纲要》对推动军队系统普通话测试、教师全员测试(包括新进教师)
、校长(园长)
测试等级达标提出明确要求。
《规划纲要》提出“构建语言文字应用能力测评体系”,推进和
完善普通话水平测试,加快推进测试的信息化建设和资源建设,推进计算机辅助测试,以及


教育部、国家语委关于印发《国家语言文字工作“十五”计划》的通知(教语用﹝2001﹞2 号),教育部
语言文字应用管理司编《新时期语言文字法规政策文件汇编》 ,语文出版社 2005 年版,第 272 页。

《国家语言文字工作“十一五”规划》,2007 年制定。

教育部文件《国家语言文字工作“十一五”规划》
(教语用[2007]2 号),中华人民共和国教育部政府门户
网,http://www.moe.edu.cn/publicfiles/business/htmlfiles/moe/moe_800/201001/xxgk_78577.html。

《国家中长期语言文字事业改革和发展规划纲要(2012—2020 年)
》,教育部、国家语委 2012 年印发。
66
修订《测试大纲》、研制和推行中小学生普通话水平测试标准的任务,促使测试工作完善提
高,在体系化、信息化、资源化、领域化方面有新突破。
《规划纲要》还提出服务港澳同胞
普通话测试需求,深化相关合作,加大普通话测试海外推广力度,拓展境外测试范围,推进
与国际汉语教育、海外华文教育的有效对接,促使测试工作开拓新的功能空间。
《规划纲要》
提出通过多渠道合作为相关行业提供语言文字专业测试服务,通过举办测试员提高培训,建

设高水平、专业化的测试员队伍,促使测试工作提升创新服务意识、强化人才意识。 《规
划纲要》把普通话水平测试工作放到全面建成小康社会的大局中去谋划,放到推广普及和规
范使用国家通用语言的核心任务中去推进,体现出全新的事业发展理念,是普通话水平测试
工作当前和今后一个时期统领性、基础性的文件依据。

三、教育部门政策文件依据

教育部门是普通话推广的基本阵地,1998 年国家语委并入教育部,教育部新增了“指
导推广普通话和普通话测试工作”的职能,在教育系统推动测试工作的力度进一步加强。普
通话水平测试实施以来,教育部门制定施行了多种文件对相关人员提出测试要求和等级要求,
现撮录如下:
《关于加强高等院校语言文字规范化工作的几点意见》
(教高﹝1995﹞11 号)
、《关于印
发〈职业中学普通话教学基本要求〉的通知》(教职﹝1996﹞14 号)、《关于对 1998 年申报
对外汉语教师资格人员进行普通话水平测试的通知》
(国语管﹝1998﹞5 号)、《关于进一步
加强学校普及普通话和用字规范化工作的通知》
(教语用﹝2000﹞1 号)、《教育部、国家语
委关于开展语言文字规范化示范校创建活动的意见》
(教语用﹝2004﹞4 号)、
《关于印发〈关
于进一步发挥城市的中心作用,全面推进语言文字工作的意见〉的通知》
(教语用﹝1999﹞1
号)、《关于印发〈一类城市的语言文字工作评估标准(试行)
〉的通知》(教语用﹝2000﹞2
号)、
《关于印发〈一类城市的语言文字工作评估标准(试行)〉实施细则〉的通知》
(教语用
司﹝2000﹞2 号)、《关于印发首届全国推广普通话宣传周宣传提纲、宣传口号的通知》(国

语﹝1998﹞29 号)等。
教育部门关于普通话水平测试的政策文件具有针对性、创新性、协调性的突出特点。针
对性方面,以上文件对教育机构及人员做出了统一的测试要求,但对不同地区、不同类别、
不同专业的教育机构及人员又进行了差异化的区别性对待,例如对语文教师、语音教师、对
外汉语教师、师范专业、其他与口语表达密切相关专业学生有较高要求,而对教育行政部门
公务员和学校管理人员、对以少数民族语言授课为主的民族学校的师生的普通话水平要求适
当降低,这些规定体现出务实推进的工作思路。
创新性方面,以上文件大多是在《语言文字法》《测试管理规定》和大部分省级法规规


详参教育部语言文字应用管理司编:《国家中长期语言文字事业改革和发展规划纲要(2012—2020 年)》

语文出版社 2012 年版,第 2~39 页。

根据教育部语言文字应用管理司编《新时期语言文字法规政策文件汇编》(语文出版社 2005 年版)摘录,
具体内容可详参附录 A“教育部门普通话水平测试政策文件依据简表 ”。
67
章出台前制定,很多规定,例如把高等院校、职业中学学生纳入测试对象范畴,对新录用公
务员和学校管理人员提出测试等级要求,提出对教师和广电系统播音员、节目主持人逐步实
行持普通话等级证书上岗制度等等,对普通话水平测试法律法规依据和其他政策文件依据都
具有探索意义和实践铺垫作用。
协调性方面,体现在测试工作与学校语言文字规范化整体工作相衔接,也体现在测试工
作与城市语言文字评估工作和推广普通话宣传周两大措施有效对接,互为支撑。以上文件中,
后 5 种文件(第 5 种~第 9 种)突出显示出这个特点。测试的政策文件与其他语言文字工作
相协调,有利于相互借力、给力,形成合力,从全局角度整体推进普通话水平测试工作。

四、其他行业系统政策文件依据

普通话水平测试具有社会性的特点,涉及诸多领域和行业系统。国家语委统筹协调相关
领域,制定出台了多种行业系统开展测试的政策文件,现撮录如下:
《关于建立广播电影电视系统普通话水平测试工作领导小组和测试站的通知》(广发人
字﹝1997﹞146 号)
、《关于进一步做好播音员主持人持证上岗工作的几点意见》
(广人专字
﹝1997﹞397 号)、《关于在检察系统做好推广普通话工作的通知》
(﹝1999﹞高检办发第 35
号)、
《关于开展国家公务员普通话培训的通知》
(人发﹝1999﹞46 号)
、《关于加强金融系统
语言文字规范化工作的通知》
(金融工发﹝2000﹞8 号)、
《关于进一步加强铁路系统语言文
字规范化工作的通知》
(铁科教﹝2000﹞72 号)、
《关于加强邮政系统语言文字规范化工作的
通知》
(国邮联﹝2000﹞304 号)、
《关于认真做好信息产业系统语言文字规范化工作的通知》
(信部联办﹝2001﹞242 号)
、《关于在文化系统贯彻实施〈中华人民共和国国家通用语言文
字法〉的通知》
(文政法发﹝2001﹞20 号)、
《关于学习贯彻〈中华人民共和国国家通用语言

文字法〉的意见》(﹝2001﹞政宣字 12 号)

除教育系统外,另有广播电影电视、检察、公务员、金融、铁路、邮政、信息产业、文
化、军队等 9 个系统在相关文件中对其系统内普通话水平测试工作提出明确要求。原广播电
影电视部是 1994 年“三部委《决定》”的会签单位之一,鉴于播音员、节目主持人的榜样作
用,广播电影电视主管部门对普通话水平测试工作不仅认识到位,而且在测试依据制定工作
上也起步早,要求严。1997 年出台的《关于建立广播电影电视系统普通话水平测试工作领
导小组和测试站的通知》
,对建立广电系统测试领导机构和实施机构提出明确要求;
《关于进
一步做好播音员主持人持证上岗工作的几点意见》,明确提出播音员主持人持证上岗的要求,
详细规定了各级台播音员主持人的等级达标标准和时间要求,力度之大,要求之严,措施之
硬堪称典范,起到了很好的示范作用。其他行业系统出台相关文件集中在 1999 年至 2001
年之间,即《语言文字法》颁布施行前后,有力配合或贯彻了国家法律的相关规定,普通话
水平测试在国家语言文字工作机构和各相关行业系统的合作协调下,大大拓展了工作的广度,


根据教育部语言文字应用管理司编《新时期语言文字法规政策文件汇编》(语文出版社 2005 年版)摘录,
具体内容可详参附录 B“其他行业系统普通话水平测试政策文件依据简表 ”。
68
加大了推动的力度。

五、政策文件依据的作用

普通话水平测试政策文件依据是党中央、国务院及国家语言文字工作主管机构和行业系
统主管机构制定的规范准则文件。党中央、国务院政策文件依据主要着力于充分发挥推广国
家通用语言在国家政治、经济、社会和文化发展中的基础性作用,客观上为测试工作提供引
导性、纲领性的顶层依据,起到了为法律法规依据“发先声”和“增力度”的作用。国家语
言文字工作主管机构和行业系统主管机构制定的政策文件,以权威的形式对普通话水平测试
的工作目标、原则、任务、步骤和措施等进行具体规定,在党中央、国务院政策文件依据和
法律法规依据出台前,是测试实施的先导性权威依据,发挥规划指导作用;在党中央、国务
院政策文件依据和法律法规依据出台后,成为配合性、落实性的权威依据,发挥着保障实施
作用,政策文件依据是测试管理依据的重要组成部分。

第三节 普通话水平测试业务管理依据

业务管理依据属于微观执行依据,是由测试管理机构或实施机构制定发布,对普通话水
平测试业务管理工作进行规范的文件依据总和。普通话水平测试业务管理依据是落实宏观管
理依据的具体的工作程序、工作方式、支撑手段、质量监督等环节的业务性规约。


一、《普通话水平测试实施办法(试行)》

《实施办法》以“三部委《决定》”附件的形式发布。“三部委《决定》”是《实施办
法》的上位文件依据,相对于前者,《实施办法》属于微观管理依据的范畴。
(一)《实施办法》的主要内容
《实施办法》包括普通话水平测试委员会、普通话水平测试等级标准和《测试大纲》、
测试员、应试人员、普通话等级证书和附则等6部分共18条。《实施办法》的主要内容如下:
1.普通话水平测试委员会
该部分共 3 条(第一条~第三条),主要内容是规定测试的机构,明确了各级普通话水

平测试委员会负责测试工作。
2.普通话水平等级标准和《测试大纲》
该部分共2条(第四条、第五条),核心内容是明确普通话水平的等级划分(三级六等)

和量化评分原则;要求按照《测试大纲》统一测试内容和要求。


《普通话水平测试实施办法(试行)》,1994 年 10 月下发试行。

详参《普通话水平测试实施办法(试行)》 ,教育部语言文字应用管理司编《新时期语言文字法规政策文件
汇编》,语文出版社 2005 年版,第 206 页。

详参《普通话水平测试实施办法(试行)》 ,教育部语言文字应用管理司编《新时期语言文字法规政策文件
汇编》,语文出版社 2005 年版,第 206 页。
69
3.测试员
该部分共4条(第六条~第十条)
,主要内容是规定国家级和省级测试员资格培训考核要

求、业务素质要求、年龄要求、工作职责要求、评分方法要求和违规处理办法。
4.应试人员
该部分共2条(第十一条、第十二条),规定应试人员范围及其等级要求(共规定了7类
人员,主要包括教师和师范院校毕业生,电台、电视台的播音员、节目主持人,影视话剧表

演和影视配音专业人员,其他人员)。
5.普通话等级证书
该部分共 4 条(第十三条~第十六条),内容比较庞杂,主要包括:等级证书的颁发机
构及格式(全国统一)和编号(各省份分别编号)要求;一级甲等和一级乙等成绩的复审、

备案及注册要求;第二次受试申请的时限要求(测试 5 个月之后)

6.附则

该部分共 2 条(第十七条、第十八条)
,规定该办法的解释机构及实施日期。
(二)《实施办法》的作用
《实施办法》是普通话水平测试第一个全国性测试业务管理依据,首次对开展测试必须
明确的测试机构、测试学术依据、施测主体(测试员)、受测对象(应试人员)、测试流程、
证书管理等实操性问题进行规定,《实施办法》奠定了测试的操作基础。当然,作为第一个
业务管理依据,由于没有可资借鉴的模式,特别是缺乏工作实践,《实施办法》还有一些值
得完善之处,例如建立普通话水平测试委员会的可行性问题,普通话水平测试委员会与普通
话培训测试中心和语委的职能界定问题,证书的统一管理与属地管理的协调问题等等,需要

进一步明确。有些规定缺乏理据和操作性,例如规定一级甲等复审按比例操作, 不进行全
员复审,有损测试公平。《实施办法》一些表述也欠严密,如:“普通话三级水平测试由各

地按照测试标准和大纲的要求,根据各地的情况和工作的需要组织进行”, 很容易误导人们
以为普通话水平测试采取“分级测试”模式。但无论如何,《实施办法》使测试有了可以依
凭的操作办法,推动普通话水平测试迈出了由理论到实践的第一步,其贡献是毋庸置疑的。


详参《普通话水平测试实施办法(试行)》 ,教育部语言文字应用管理司编《新时期语言文字法规政策文件
汇编》 ,语文出版社 2005 年版,第 206~207 页。

详参《普通话水平测试实施办法(试行)》 ,教育部语言文字应用管理司编《新时期语言文字法规政策文件
汇编》 ,语文出版社 2005 年版,第 207 页。

详参《普通话水平测试实施办法(试行)》 ,教育部语言文字应用管理司编《新时期语言文字法规政策文件
汇编》 ,语文出版社 2005 年版,第 207~208 页。

详参《普通话水平测试实施办法(试行)》 ,教育部语言文字应用管理司编《新时期语言文字法规政策文件
汇编》 ,语文出版社 2005 年版,第 208 页。

“10 名以内复审 1/3,11 名~50 名以内复审 1/5,51 名以上复审 1/10”参见《普通话水平测试实施办法
(试行) 》,教育部语言文字应用管理司编《新时期语言文字法规政策文件汇编》 ,语文出版社 2005 年版,
第 207 页。

详参《普通话水平测试实施办法(试行)》 ,教育部语言文字应用管理司编《新时期语言文字法规政策文件
汇编》 ,语文出版社 2005 年版,第 207~208 页。
70

二、《国家语言文字工作委员会关于普通话水平测试管理工作的若干规定(试行)》

(一)《若干规定》的主要内容
《若干规定》包括普通话水平测试工作的机构和网络、普通话水平测试员、普通话水平
测试的标准和测试大纲、测试成绩的认定和证书、普通话水平测试试卷、测试对象及其达标
要求和其他等 7 部分共 26 条。《若干规定》的主要内容如下:
1.普通话水平测试工作的机构和网络
该部分共 6 条(第一条~第六条)
,主要包含以下内容:明确国家及省级测试工作的行
政机关和测试的实施机构,并规定各自职责;经省语委同意,计划单列市可成立市级培训测

试中心;省域内测试工作网络建设由省级语委办规划。
与《实施办法》相比,《若干规定》的一大变化是,不再成立各级普通话水平测试委员
会,解决了普通话水平测试委员会的可行性问题以及与测试中心和语委的职能界定问题,避
免了机构职能重叠交叉。第二个突出变化是明确了国家及省级语委、国家及省级测试中心的
职责划分,使测试组织管理工作和业务工作各有所属。第三个变化是可以根据需要建立市
(地、州、盟) 级普通话培训测试中心,勾勒出测试工作三级网络的架构模型。
2.普通话水平测试员
该部分共 7 条(第七条~第十三条),主要内容是:详细规定国家级测试员资格和省级
测试员资格及考核要求;明确测试员聘任制和考核制度;规定测试员资格证书由国家语委统
一印制;规定测试员职责和纪律;提出测试员队伍建设规划任务;明确可根据需要聘任普通

话水平测试视导员,并规定其资格和职责。
与《实施办法》相比,《若干规定》关于测试员的内容有很多扩充和完善。测试员资格
规定得尤为详细,对学历、职称、工作经历、职业、年龄、专业素质、普通话水平、工作能
力、健康状况及品行等均做出要求,显示出测试员的专业特性。测试员聘任制、考核制度、
测试员资格证书统一印制、测试员职责和纪律条款、测试员队伍建设规划等内容,凸显出对
测试员管理的重视。测试视导员队伍建设,进一步完善了测试工作队伍,具有创新意义。
3.普通话水平测试的标准和大纲
该部分共 2 条(第十四条、第十五条),明确《等级标准》和《测试大纲》的全国统一

性。 与《实施办法》相比,内容实质没有大的变化,但《若干规定》以“全国统一”的表
述,彰显二者的地位作用和普通话水平测试统一管理的思路。


《国家语言文字工作委员会关于普通话水平测试管理工作的若干规定(试行)》 ,1997 年 6 月发布实施。

详参《国家语言文字工作委员会关于普通话水平测试管理工作的若干规定(试行) 》,国家语言文字工作委
员会普通话培训测试中心、 《语言文字应用》编辑部合编《普通话水平测试的理论与实践》 ,商务印书馆 1998
年版,第 192~193 页。

详参《国家语言文字工作委员会关于普通话水平测试管理工作的若干规定(试行) 》,国家语言文字工作委
员会普通话培训测试中心、 《语言文字应用》编辑部合编《普通话水平测试的理论与实践》 ,商务印书馆 1998
年版,第 194~196 页。

详参《国家语言文字工作委员会关于普通话水平测试管理工作的若干规定(试行) 》,国家语言文字工作委
员会普通话培训测试中心、 《语言文字应用》编辑部合编《普通话水平测试的理论与实践》 ,商务印书馆 1998
年版,第 196~197 页。
71
4.测试成绩的认定和证书
该部分共 4 条(第十六条~第十九条),主要内容为:明确测试成绩的认定机构以及一
级甲等、一级乙等的复审机构;规定等级证书的颁发机构;规定测试成绩抽查制度;明确等

级证书全国通用性、有效期限,及其制作和编号、颁发管理。
与《实施办法》相比,《若干规定》调整了证书颁发机构,由原来的测试机构调整为语
言文字工作部门颁发,反映出加强政府管理力度的工作思路,将证书管理视为政府行为,与
测试业务管理分属不同行为主体。等级证书全国通用,有效期为 5 年,反映出统一管理和动
态推进的工作设想。上级测试机构对下级测试机构的抽查,是加强测试质量管理的制度保障
性规定。
5.普通话水平测试试卷

该部分共 1 条(第二十条),该条规定测试试卷编制机构及办法。 与《实施办法》相比,
此条是新增条款,在当时条件下,全国统一题库尚未建立,各地测试以自拟试卷方式进行,
该条规定旨在为试卷质量提供必要的保障。
6.测试对象及其达标要求
该部分共 1 条(第二十一条),与《实施办法》相比,对教师类别和等级要求规定得更
为细密,并增加对“广播电视教学教师”“报考教师资格人员”的普通话等级要求;对“其
他应当接受普通话水平测试的人员(如公务员、律师、医护人员、导游员、讲解员、公共服

务行业的营业员等)”, 以括注的形式对其对象范畴加以明确。
7.其他
该部分共 5 条(第二十二条~第二十六条),主要内容包括:确定属地管理原则;要求
各级语委与其他有关部门相互支持配合,共同做好测试工作;提出测试收费和财务规范;要
求重视资料积累,加强科研;“三部委《决定》”的精神继续贯彻执行,与《若干规定》不

一致的,以《若干规定》为准。
(二)《若干规定》的作用
《若干规定》是针对在“三部委《决定》”下发后测试活动中遇到的一些亟需规范的问
题,在实践经验基础上,对测试宏观管理和具体操作环节进一步的规范和完善。《若干规定》
对普通话水平测试工作机构及其职能的明确,对测试机构三级网络的构架布局,对测试员队


详参《国家语言文字工作委员会关于普通话水平测试管理工作的若干规定(试行) 》,国家语言文字工作委
员会普通话培训测试中心、 《语言文字应用》编辑部合编《普通话水平测试的理论与实践》,商务印书馆 1998
年版,第 197 页。

详参《国家语言文字工作委员会关于普通话水平测试管理工作的若干规定(试行) 》,国家语言文字工作委
员会普通话培训测试中心、 《语言文字应用》编辑部合编《普通话水平测试的理论与实践》,商务印书馆 1998
年版,第 197 页。

详参《国家语言文字工作委员会关于普通话水平测试管理工作的若干规定(试行) 》,国家语言文字工作委
员会普通话培训测试中心、 《语言文字应用》编辑部合编《普通话水平测试的理论与实践》,商务印书馆 1998
年版,第 198 页。

详参《国家语言文字工作委员会关于普通话水平测试管理工作的若干规定(试行) 》,国家语言文字工作委
员会普通话培训测试中心、 《语言文字应用》编辑部合编《普通话水平测试的理论与实践》,商务印书馆 1998
年版,第 198~199 页。
72
伍建设的重视,对测试统一管理的强化,对测试质量的保障、对测试对象范围的进一步拓展
和明晰,以及对测试规范、协调、持续发展的部署等诸方面都具有现实的意义,《若干规定》
是测试工作早期重要的测试依据。


三、《普通话水平测试规程》

《测试规程》与《实施办法》和《若干规定》既具有前后相承的关系,又“后出转精”,
有自身的特色。
《实施办法》和《若干规定》中很多测试宏观管理的内容,如工作机构(包
括语言文字工作部门和测试机构)
、管理原则、测试员(测试视导员)管理、应试人管理,
成绩认定、证书、测试时间间隔、申诉、测试纪律、收费等方面管理内容都纳入《测试管理
规定》
,同时将《测试管理规定》升格为国务院部门规章,测试业务流程中的具体微观的管
理内容,纳入《测试规程》,以《测试管理规定》下位文件的形式由语用司发布,体现出文
件依据的体系性特征和层级关系。
(一)
《测试规程》的主要内容
《测试规程》包括报名、考场、试卷、测试、质量检查、等级证书、应试人档案等 7
部分共 28 条。《测试规程》的主要内容如下:
1.报名

该部分共 2 条(第 1 条、第 2 条)
,规定报名办法及测试时间和地点安排办法。
2.考场
该部分共 2 条(第 3 条、第 4 条)
,规定考场安排要求,包括工作条件要求、人员配备

要求和测试组的测试量要求。
3.试卷
该部分共 4 条(第 5 条~第 8 条)
,规定测试试卷提供、运转、使用,以及测试之后的

回收、清点、封存(或销毁)。
4.测试
该部分共 11 条(第 9 条~第 19 条),该部分是《测试规程》内容规定最详细的部分,
对测试环节中应试人身份查验、抽取考题、备测、应试的要求,测试员工作程序、评分方法
(包括复议方法)、成绩登录、录音要求、试卷回收处理、测试档案规范,以及考场负责人

职责、考场工作人员职责等均有详细规定。
5.质量检查


《普通话水平测试规程》,教育部语用司 2003 年 5 月下发(教语用司函[2003]18 号)


详参《普通话水平测试规程》 ,教育部语言文字应用管理司编《新时期语言文字法规政策文件汇编》,语文
出版社 2005 年版,第 221 页。

详参《普通话水平测试规程》 ,教育部语言文字应用管理司编《新时期语言文字法规政策文件汇编》,语文
出版社 2005 年版,第 221 页。

详参《普通话水平测试规程》 ,教育部语言文字应用管理司编《新时期语言文字法规政策文件汇编》,语文
出版社 2005 年版,第 221 页。

详参《普通话水平测试规程》 ,教育部语言文字应用管理司编《新时期语言文字法规政策文件汇编》,语文
出版社 2005 年版,第 222 页。
73
该部分共 5 条(第 20 条~第 24 条),规定巡视要求、测试质量检查方式,明确一级甲

等、一级乙等复审机构,并对复审业务要求和时限进行规定。
6.等级证书
该部分共 2 条(第 25 条、第 26 条),规定等级证书发放及盖章机构;规定一级甲等、
一级乙等成绩加盖复审机构印章。
7.应试人档案

该部分共 2 条(第 27 条、第 28 条),规定应试人档案内容和档案保存期限。
(二)《测试规程》的作用
《测试规程》是在《实施办法》和《若干规定》基础上,总结测试 10 年实践经验,依
据《测试管理规定》制定的,反映了测试工作,尤其是测试管理业务流程的规律和实际。《测
试规程》是指导普通话水平测试活动参与者的具体操作规范,又是测试实施前进行测试物质
准备(场地、设备)、技术准备的依据,还为规范测试中心建设提供了参考。《测试规程》
对规范测试工作,提高测试标准化程度,保障测试质量起到了积极作用。


四、《普通话水平测试工作评估指导标准》

(一)
《评估指导标准》的主要内容
《评估指导标准》由三级指标体系构成,包括 5 个一级指标,13 个二级指标,二级指
标下包含若干具体检测内容,共计 43 项,满分 100 分,具体内容和分值详见表 4–3:

图表 11 表 4–3 普通话水平测试工作评估指导标准

一级 二级
检测内容 分值
指标 指标

1.全面贯彻执行《普通话水平测试管理规定》 2
A1
2.测试行政管理列入语委办主要职责 2 6
工作地位
A
3.测试工作与语言文字其他方面协调发展 2

作 4.制定培训测试工作规划,并报主管部门备案 1 10

A2 5.有相应的地方性实施措施 1
位 4
实施规划 6.统计工作真实准确并规范填写工作报表 1

7.按时向上级主管部门上报年度工作计划、总结、报表 1


详参《普通话水平测试规程》 ,教育部语言文字应用管理司编《新时期语言文字法规政策文件汇编》,语文
出版社 2005 年版,第 222 页。

应试人档案内容包括测试申请表、试题、测试录音、测试员评分记录、复审记录、成绩单等,详参《普通
话水平测试规程》 ,教育部语言文字应用管理司编《新时期语言文字法规政策文件汇编》,语文出版社 2005
年版,第 222 页。

《普通话水平测试工作评估指导标准》,教育部语用司 2003 年 5 月下发(教语用司函[2003]17 号)

74
8.经省级编制部门批准设置,规范运作 2

B1 9.有专职工作人员 2
8
测试机构 10.有必要的工作设施 1

B 11.实行计算机信息化管理 3

省 12.市地、区县、高校、行业网络布局合理,便于属地管理 2
级 B2 25
机 13.各级测试机构在同级语委办领导下,运作协调 4 8
工作网络
构 14.各级测试机构职责明确,运转正常 2

15.各项收费项目和标准经财政价格部门核准,并严格执行 3
B3
16.经费独立核算,遵守国家财务制度并接受国家审计 3 9
财务管理
17.无财经违纪事件 3

18.测试员、视导员人数和分布满足工作需要 2
C1
19.测试员素质符合规定条件, 95%以上胜任工作 3 7
队伍组成
20.视导员素质符合规定条件,并充分发挥作用 2

C 21.测试员评聘分开,有任期;未聘测试员不得承担测试任务 2

试 C2 22.定期考查测试员,建立测试员业务档案和视导员工作记录 4
10 25
队 队伍管理 23.对测试员、视导员奖罚分明,并能调动积极性 2

24.测试员、视导员无违纪事件和非组织测试事件 2

25.有测试员队伍建设计划并实施 2
C3
26.严格规范测试员资格考试,定期对全体测试员进行培训 3 8
队伍建设
27.有计划组织测试科研,定期开展研讨活动,有科研成果 3

28. 测试由省级测试机构统一组织进行 1

D1 29.严格执行国家统一的测试规程 4
10
测试规程 30.有进行过程监控的有效措施 2
D
测 31.有完整、规范的测试录音档案和文字档案 3

过 32.培训内容遵循测试等级标准和测试大纲 2
D2 25
程 33.选用符合等级标准、测试大纲并结合本地实际需要的教材 2 7
及 教材试卷

管 34.使用国家制定题库提供的试卷,试卷运转规范 3

理 35.发证前严格执行成绩复审和备案制度 2
D3
36.证书发放严格执行有关规定 2 8
证书管理
37.使用全国统一证书,杜绝假证书 4

75
38.全省年度测试任务总完成率 90%以上 2

E E1 39.二级、三级成绩抽查年度总合格率 95%以上 4
11
工 测试结果 40.一级乙等省级复审年度总通过率 90%以上 3
作 15
效 41.一级甲等国家复审年度总通过率 90%以上 2

果 42.经调查,90%以上应试人员对培训测试过程和结果满意 2
E2
4
社会效果 43.经调查,测试的作用和效果得到绝大多数被测单位认可 2

(资料来源:教育部语言文字应用管理司编《新时期语言文字法规政策文件汇编》

语文出版社 2005 年版第 219 页。)

(二)
《评估指导标准》的作用
《评估指导标准》旨在引导测试管理机构及实施机构加强自身建设,提高测试管理水平。
该标准借鉴教育评估和城市语言文字评估经验,用量化评估的方式对测试机构的工作提出指
标性要求,是第一个对测试管理机构和实施机构工作进行评估的文件依据。
《评估指导标准》
通过一套评估体系引导和推动测试评估制度的建立,
“以评促建、以评促管、评建结合、重
在建设”,引导各地测试机构对照标准,加强测试基础建设和内涵建设,提高管理水平,确
保测试工作健康发展。《评估指导标准》是普通话水平测试富有特色的微观业务管理依据。


五、《计算机辅助普通话水平测试操作规程(试行)》

(一)
《机辅测试规程》的主要内容
《机辅测试规程》包括考点、报名、组织流程、测试流程、试卷、成绩评定、证书、档
案管理、附则等 9 部分共 26 条。《机辅测试规程》的主要内容如下:
1.考点
该部分共 7 条(第 1 条~第 7 条)
,主要包含以下内容:考点总体要求;考点设置和网

络及设备条件;考场用途、设置条件及设备要求; 考点人员配备要求和佩戴证件的要求。
与 2003 年《测试规程》相比,该部分内容由 2 条扩充为 7 条,主要是对考点及附属考
试专用房间的设置条件、设备要求进行了细化,尤其是对机辅测试必备的硬件和软件条件等

进行了详细规定, 这些规定是适应机辅测试要求做出的标准化调整。
2.报名
该部分共 2 条(第 8 条、第 9 条)
,主要包含以下内容:报名时间地点应提前向社会公


《计算机辅助普通话水平测试操作规程(试行)》 ,教育部语用司 2008 年 6 月下发(教语用司函[2008]23
号)。

考场包括考务办公室、候测室、备测室、测试室等专用的独立房间。详参教育部语言文字应用管理司文件
《计算机辅助普通话水平测试操作规程(试行) 》(教语用司函[2008]23 号。

如该规程第 6 条规定:“专用测试室应有独立测试机位若干,测试机位应为 2 平方米以上独立空间,隔音
效果良好,内置测试设备 1 套。利用常规教室或语音室作为测试室的,其室内各机位的间隔不得少于 3 米”,
详参教育部语言文字应用管理司文件《计算机辅助普通话水平测试操作规程(试行)》 (教语用司函[2008]23
号。
76
告;报名的具体要求。与 2003 年《测试规程》相比,该部分内容对查验身份,信息(包括

照片)采集的规定更为具体, 这与机辅测试信息管理的需要密切相关。
3.组织流程
该部分共 2 条(第 10 条、第 11 条),主要规定测试机构测试前的申请和测试后报送测

试信息及数据的具体内容。 与 2003 年《测试规程》相比,该部分内容是为适应机辅测试而
新增的条款。
4.测试流程
该部分共 4 条(第 12 条~第 15 条),主要规定测试机构从报到、备测、候测,再到实

施测试,最后到测试结束的工作内容及要求。 与 2003 年《测试规程》相比,该部分内容与
机辅测试紧密结合,流程环节顺序衔接,各环节任务界定清晰而且前后连贯。
5.试卷
该部分共 2 条(第 16 条、第 17 条),主要内容是规定试卷的提供机构和具体的管理要

求。 与 2003 年《测试规程》相比,该部分增加了对存储在计算机内试卷的规范管理规定。
6.成绩评定
该部分共 4 条(第 18 条~第 21 条),主要规定成绩评定的依据;规定计算机辅助测试

评分项目和测试员评分项目;规定成绩合成及确认程序。 与 2003 年《测试规程》相比,该
部分内容是为适应机辅测试而新增的条款,对机辅测试系统与测试员评分相结合的操作方法、
步骤、分数合成、成绩审核确认进行了明确规定。
7.证书
该部分共 3 条(第 22 条~第 24 条),主要内容是:规定证书统一印制机构;规定证书

颁发机构,一级甲等须国家测试机构复审并加盖印章;规定证书补办机构。 与 2003 年《测
试规程》相比,该部分内容重申了《测试管理规定》证书由国家语言文字工作部门统一印制
的内容,新增加了补办证书的内容,意在强化统一证书的意识和服务意识。我们认为这种重
复性规定也存在一定弊端,导致两份文件边界重叠,似并无必要。此外证书颁发机构规定为
“省级语言文字工作机构”,而证书的补办机构规定为“省级测试机构”,造成机构职能前
后不统一,为实际工作带来不便。
8.档案管理


详参教育部语言文字应用管理司文件《计算机辅助普通话水平测试操作规程(试行)
》(教语用司函[2008]23
号。

详参教育部语言文字应用管理司文件《计算机辅助普通话水平测试操作规程(试行)
》(教语用司函[2008]23
号。

详参教育部语言文字应用管理司文件《计算机辅助普通话水平测试操作规程(试行)
》(教语用司函[2008]23
号。

详参教育部语言文字应用管理司文件《计算机辅助普通话水平测试操作规程(试行)
》(教语用司函[2008]23
号。

详参教育部语言文字应用管理司文件《计算机辅助普通话水平测试操作规程(试行)
》(教语用司函[2008]23
号。

详参教育部语言文字应用管理司文件《计算机辅助普通话水平测试操作规程(试行)
》(教语用司函[2008]23
号。
77
该部分共 1 条(第 25 条),主要内容是规定测试档案的管理机构,对档案的类别(文书

档案和电子档案)、内容以及管理要求进行详细规定。 与 2003 年《测试规程》相比,该部
分内容增加了电子档案细目及保存要求,体现了机辅测试和信息管理系统的特色。
9.附则
该部分共 1 条(第 26 条),规定该规程自颁发之日执行。
(二)
《机辅测试规程》的作用
2007 年计算机辅助普通话水平测试试点工作正式启动,在教育部语用司推动下,机辅
测试试点发展很快。机辅测试是测试发展历程中的一次重大技术变革,并且以技术浪潮的方
式推动测试发生全局性和系统性的变革。为了适应机辅测试的需要,《机辅测试规程》对机
辅测试模式下的考点设置、报名方式、组织流程、应试流程、试卷管理、成绩评定、证书管
理和档案管理等诸环节进行新的规定,成为规范和指导全国机辅测试工作的业务管理依据。


六、《教育部语用司关于推进计算机辅助普通话水平测试工作等有关问题的通知》

(一)
《机辅测试通知》的主要内容
《机辅测试通知》主要包括以下三方面内容:
1.全面开展计算机辅助测试试点工作
《机辅测试通知》指出,机辅测试具有突出的优点,已具备在全国范围内推广的条件。

要求在 2010 年底前,所有尚未开展试点的省份都要开展试点工作。
2.全面实行计算机辅助测试
《机辅测试通知》要求到 2012 年年底,全部实现机辅助测试和信息化管理。严格执行

《机辅测试规程》和《机辅测试评分办法》 规定,保证机辅测试工作健康有序推进。为配

合机辅测试工作推进,决定于 2010 年 8 月 1 日起启用新版“普通话水平测试等级证书”。
3.统一计算机辅助测试技术服务费标准
《机辅测试通知》决定从 2010 年 8 月 1 日起,测试机构统一按照 3.50 元/人次的标准

支付技术服务费。


详参教育部语言文字应用管理司文件《计算机辅助普通话水平测试操作规程(试行) 》
(教语用司函[2008]23
号。

《教育部语用司关于推进计算机辅助普通话水平测试工作等有关问题的通知》,教育部语用司 2010 年 7 月
下发(教语用司函[2010]72 号)。

《教育部语用司关于推进计算机辅助普通话水平测试工作等有关问题的通知》(教语用司函[2010]72 号),
中华人民共和国教育部政府门户网,http://www.moe. gov.cn/s78/A18/yys_left/moe_803/s3133/201309/
t20130923_157634.html。

按:在《机辅测试通知》中该文件名称有误,应当为《计算机辅助普通话水平测试评分试行办法》(教语
用司函〔2009〕5 号)。

《教育部语用司关于推进计算机辅助普通话水平测试工作等有关问题的通知》(教语用司函[2010]72 号),
中华人民共和国教育部政府门户网,http://www.moe. gov.cn/s78/A18/yys_left/moe_803/s3133/201309/
t20130923_157634.html。

《教育部语用司关于推进计算机辅助普通话水平测试工作等有关问题的通知》(教语用司函[2010]72 号),
中华人民共和国教育部政府门户网,http://www.moe. gov.cn/s78/A18/yys_left/moe_803/s3133/201309/
t20130923_157634.html。
78
(二)
《机辅测试通知》的作用
《机辅测试通知》是国家语言文字工作机构在机辅测试试点工作实践 3 年后,为推动机
辅测试快速发展而出台的专门性微观管理依据。《机辅测试通知》认为机辅测试是“测试模

式发展进程中的根本性改革和历史性跨跃,是语言文字应用水平测试发展的方向”, 因此
对机辅测试试点和全面实行机辅助测试提出了明确的时间要求,这份通知体现了主管机构对
机辅测试方向的肯定和推动决心,明确了测试模式发展的方向和步骤,有力助推了测试工作
的快速发展。


七、《计算机辅助普通话水平测试试点业务指导意见》

(一)
《机辅测试业务指导意见》的主要内容
《机辅测试业务指导意见》共 18 条,框架主要包括 4 大部分:文件出台的目的、对各
省(自治区、直辖市)开展机辅测试的业务指导意见、国家语委普通话培训测试中心(简称
“国测中心”)的业务职责规定、附则。主要内容如下:
1.文件出台的目的
该部分共 1 条(第一条),明确指出“保证测试质量,确保试点规范、有序、健康发展

并取得实效”是出台《机辅测试业务指导意见》的目的。
2.对各省(自治区、直辖市)开展机辅测试的业务指导意见
该部分共 12 条(第二条~第十三条),主要包含以下内容:
(1)各地开展机辅测试试点
应报批和报备。
(2)应遵循“科学、规范、积极、稳妥”的原则。
(3)试点省份应统一使用
全国统一的信息管理系统;符合《机辅测试规程》要求;可制订机辅测试评分实施细则,并
对测试员进行培训和考核;应对相关人员进行机辅测试的适应性培训。
(4)应进行对比实验,
并报送国家测试中心;应加强对试点工作的监督管理;应开展必要的一级复审、异常复审、
抽查复审;对试点中发现的问题和不足,及时组织研讨,并上报国家测试中心。
(5)试点省

份每年度应进行试点总结,并书面报告教育部语用司和国家测试中心。
3.国家语委普通话与文字应用培训测试中心的业务职责规定
该部分共 3 条(第十四条~第十六条),主要包含以下内容:(1)国家测试中心负责协
调和督促技术服务方,为试点提供保障服务;
(2)国家测试中心应针对试点中带有普遍性的
问题,组织研究和制订应对措施;
(3)国家测试中心应加强对各试点工作的业务指导、质量


《教育部语用司关于推进计算机辅助普通话水平测试工作等有关问题的通知》 (教语用司函[2010]72 号),
中华人民共和国教育部政府门户网,http://www.moe. gov.cn/s78/A18/yys_left/moe_803/s3133/201309/
t20130923_157634.html。

《计算机辅助普通话水平测试试点业务指导意见(试行)》 ,国家语委普通话与文字应用培训测试中心 2010
年 9 月下发(国语普测[2010]8 号) 。

详参《计算机辅助普通话水平测试试点业务指导意见(试行)》 (国语普测[2010]8 号),全国普通话培训
测试信息资源网,http://www.cltt.org/zhengcefagui/20101210105.html。

详参《计算机辅助普通话水平测试试点业务指导意见(试行)》 (国语普测[2010]8 号),全国普通话培训
测试信息资源网,http://www.cltt.org/zhengcefagui/20101210105.html。
79

监督和检查评估,研究解决突出问题。
4.附则
该部分共 2 条(第十七条、第十八条),规定试点省份可参照本指导意见制订相应的实
施细则;规定本意见解释机构和开始试行的时间。
(二)
《机辅测试业务指导意见》的作用
《机辅测试业务指导意见》针对 2007 年机辅测试试点工作开展以来的具体情况,根据
机辅测试进一步发展的需要而制定。该指导意见对机辅测试工作开展的程序、工作原则、方
案规划、工作规范、质量要求、问题处置、年度报告制度等诸多业务问题提出了具体的富有
操作性指导意见。
“科学、规范、积极、稳妥”的工作原则,
“试点—总结—推广”的工作程

序, 统一管理系统和规程、适应性培训、对比实验、加强复审、强化监管、年度报告等工
作措施,对于刚刚起步,即将大规模推进的机辅测试工作,起到了不可替代的保障作用。


详参《计算机辅助普通话水平测试试点业务指导意见(试行)》 (国语普测[2010]8 号),全国普通话培训
测试信息资源网,http://www.cltt.org/zhengcefagui/20101210105.html。

详参《计算机辅助普通话水平测试试点业务指导意见(试行)》 (国语普测[2010]8 号),全国普通话培训
测试信息资源网,http://www.cltt.org/zhengcefagui/20101210105.html。
80
第五章 普通话水平测试学术依据

普通话水平测试学术依据是测试的学术性规则,学术依据规定测试的框架内容、等级设
计、命题设计、分数体系、评分规则等,是实施测试所依凭的学科领域性规范标准和执行标
准的总和,也是测试目标和测试构想的综合体现,是保障测试活动科学运转的重要依据。本
章以普通话水平测试学术依据为专题,分为两节:基础学术依据和具体学术依据。

第一节 普通话水平测试基础学术依据

基础学术依据指开展普通话水平测试根本性、支撑性的学术依凭,是对测试实施具有统
摄作用和指导作用的学术规范的总和,是保障测试活动开展的学术基础。在测试学术依据系
统架构中,
《等级标准》和《测试大纲》层级最高,作用最大,均由国家语言文字主管部门
制定和发布,是最根本的依据,也是最权威的依据。

一、《普通话水平测试等级标准(试行)》

《等级标准》规定测试等级划分、描述测试等级特征,是覆盖全国的层次分明的标准体
系,是测试最基本的学术依据。
(一)
《普通话水平测试等级标准(试行)》的发展流变
关于《等级标准》的探索是一个渐进的过程,《等级标准》在发展过程中经历了从学术
设想到规划研制,从管理文件到规范标准,从部门标准到国家法条规定三大发展流变阶段。
1.从学术设想到规划研制
《等级标准》研究滥觞于 20 世纪 80 年代初期,目前已知较早的有影响的设计方案是

1982 年的《普通话等级标准条例草案》。 陈章太 1983 发表的《略论汉语口语的规范》明确
提出汉语口语规范三个等级的要求:
“我们对汉语口语本身的规范初步提出下列三个等级的
要求:第一级的要求是:说标准或比较标准的普通话……第二级的要求是:说大体标准的普

通话……第三级的要求是:说不很标准的普通话……。” 该文还从语音、词汇、语法等三个
方面对每个级别的特征进行了比较详细的描述,甚至尝试对二三级特征辅以量化指标,如语
音方面,二级误差“一般不应超过五项”,三级误差“一般不应超过六项”;词汇方面,方言
词或其他方面的词所占词汇总数,二级 “一般不应超过百分之四”,三级误差“一般不应超


该方案由北京市语言学会普通话等级标准研究小组提出。参见孙修章《“普通话水平测试标准”的研制与
实践》,《语言文字应用》1992 年第 1 期,第 12 页。

陈章太:《略论汉语口语的规范》 ,《语言规划研究》,商务印书馆 2005 年版,第 240~241 页,原载《中国
语文》1983 年第 6 期。
81

过百分之七” 等等。该文是最早系统性阐述普通话水平测试等级标准的文献,体现出前瞻
性的学术探索品质,开创和引领了学术新方向,此后学术界出现一批探讨普通话水平测试等
级标准的文章。
1986 年全国语言文字工作会议主报告吸纳了学术界的理论成果,首次在国家正式的语
言规划中将“普通话的要求初步分为三级”的方向确定下来,完成了等级标准从学术探讨到
行政调控目标的转变,这种转变是语言规划方式的一大变化,大大推进了等级标准研制和测
试整体工作的发展。1988《等级标准》进入研制阶段,在国家语委领导下,成立了专门的研
制课题组,历时三年,1991 年通过论证。
《等级标准》正式确立了三级六等的等级框架,对
各等特征进行了具体描述,划定了各等级的量化标准。《等级标准》为实施普通话水平测试
奠定了坚实基础。
2.从管理文件到规范标准
1992 年,
《等级标准》由国家语委原普通话推广司印发各地试行,正式由学术成果转化
为执行性的行政文件。1994 年,课题组对《等级标准》进行了文字修订,同年 10 月,“三
部委《决定》”将修订的《等级标准》作为附件印发各地试行,
《等级标准》的发文机关由司
局级上升为部级。1997 年,国家语委下发《关于颁布〈普通话水平测试等级标准(试行)

的通知〉》
(国语[1997]64 号)
,明确《等级标准》为“部颁标准”, 《等级标准》由管理文
件回归其学术依据的类别属性,在管理性文件中明确其学术依据属性,这既符合其学术性规
范的底色和本质,又增添其行政管理的特色,有利于其效力的充分发挥,具有积极的意义。
3.从部门标准到国家法条规定
2000 年《语言文字法》第二十四条规定:
“国务院语言文字工作部门颁布普通话水平测

试等级标准”, 这是《等级标准》作为测试依据的又一次重要发展变化。由于是国家专门法
律法条规定的内容,确立了《等级标准》在普通话水平测试依据乃至在整个普通话水平测试
中的重要地位。该法条明确了《等级标准》是经国家法律授权,由国务院语言文字工作部门
颁布的测试依据,在保持其学术依据特征的同时,相比部门标准又增添了国家法律的权威性
特征,
《等级标准》成为顶端层级学术依据的特征更为显著。
(二)
《普通话水平测试等级标准(试行)》的内容
1.三个级别的描述语
1994 年测试开展以来执行的《等级标准》对“三级六等”中的“六等”均有具体的特
征描述,对“三级”并无特征描述。但在《等级标准》发展过程中,对“三级”曾一直存在


陈章太:《略论汉语口语的规范》 ,
《语言规划研究》,商务印书馆 2005 年版,第 240~241 页,原载《中国
语文》1983 年第 6 期。

“试行六年来……实践证明,该标准具有科学性和可行性。为使该《标准》在推广普通话工作中发挥更大
的作用,该《标准》经我委再次审订,作为部颁标准予以正式颁布,请按照执行。”详参《关于颁布〈普通
话水平测试等级标准(试行)的通知〉 》(国语[1997]64 号),教育部语言文字应用管理司编《新时期语言
文字法规政策文件汇编》 ,语文出版社 2005 年版,第 217 页。

全国人大教科文卫委员会教育室、教育部语言文字应用管理司编:《中华人民共和国国家通用语言文字法
学习读本》 ,语文出版社 2001 年版,第 8 页。
82
总括性的描述语。1983 年陈章太《略论汉语口语的规范》对三级标准的描述语分别为:一
级是“标准或比较标准的普通话”,二级是“大体标准的普通话”,三级是“不很标准的普通

话”。 1986 年《新时期的语言文字工作》提出的描述语为:一级是“相当标准的普通话”,

二级是“比较标准的普通话”,三级是“一般的普通话”。 1992 年《等级标准》的描述语
为:一级是“标准的普通话”,二级是“比较标准的普通话”,三级是“一般水平的普通话”

1997 年陈章太《论普通话水平测试等级标准》建议三级标准的描述语分别为:一级是“标

准的普通话”,二级是“比较标准的普通话”,三级是“合格的普通话”。
有两个问题本文提出讨论:
(1)三个级别描述语的必要性
关于三个级别的描述语问题,孙修章有专门说明:“最初我们对报告(按:指《新时期
的语言文字工作》的报告)概括的水平只稍做改动。1.一级去掉‘相当’,改成‘会说标准
的普通话’
;2.三级将‘一般的普通话’改为‘不标准的普通话’;3.去掉各级的说明用语,
只保留级的主要特征。后来,在小范围征求意见中发现,许多同志对‘不标准’的提法不太
赞同。他们认为‘不标准’与‘比较标准’之间跨度太大,‘不标准’实际上已超出普通话
的范围。另外,有的同志认为概括级的主要特征不一定必要,级下有等,等的特征已有具体
叙述,级的特征概括得准确还能对等起归纳作用,概括得不准,反而会使级和等脱节。我们

接受了这些意见,删去了级的特征,只保留‘一级、二级、三级’
。” 陈章太从 1983 年起,
多次表达各等标准描述前最好加一句总的描述语的意见,认为“这既能概括、形容各级的特

征,又便于人们称说。” 陈章太对三个级别的描述语进行了反复考虑,并在 1997 年《论普
通话水平测试等级标准》中建议用“标准的普通话”“比较标准的普通话”“合格的普通话”
来概括一级、二级和三级普通话。
按照孙修章、陈章太文章介绍的情况,
《等级标准》正式试用时取消了三个级别的描述
语主要基于两点考虑:一是三级普通话“不标准的普通话”的概括欠准确,也难以准确概括,
另外与二级“比较标准”之间跨度太大;二是级下有等,等的特征已有具体叙述,级的总描
述语似无必要,概括不准反而导致级和等脱节。我们认为陈章太的意见有合理之处,
《等级
标准》突出的外显特征是“三级六等”,就“三级六等”产生的逻辑过程而言,
“三级”在前,
“六等”在后,
“六等”是“三级”的细化层级、下位层级,只有“六等”的描述,缺乏“三
级”的概括在逻辑上和事实上都有缺憾。其实对三个级别进行概括的必要性学术界有共识基
础,只是因在实践中难以概括准确不得已而弃之。


陈章太:《略论汉语口语的规范》 ,
《语言规划研究》,商务印书馆 2005 年版,第 240~241 页,原载《中国
语文》1983 年第 6 期。

刘导生:《新时期的语言文字工作》 ,《语文建设》1986 年第 1、2 期,第 10 页。

陈章太:《论普通话水平测试的等级标准》, 《语言规划研究》 ,商务印书馆 2005 年版,第 313 页,原载《语
言文字应用》1997 年第 3 期。

孙修章:《“普通话水平测试标准”的研制与实践》, 《语言文字应用》1992 年第 1 期,第 13 页。

陈章太:《论普通话水平测试的等级标准》, 《语言规划研究》 ,商务印书馆 2005 年版,第 313 页,原载《语
言文字应用》1997 年第 3 期。
83
(2)三个级别描述语的具体建议
“级”和“等”有层级关系,描述语的修改思路应该是“级”管总体,一定要概括,
“等”管具体,可以细密一些。原有描述语“标准的普通话”
“比较标准的普通话”和“不
标准的普通话”
(或“一般的普通话”
“不太标准的普通话”
“基本标准的普通话”
“大体标准

的普通话”
“基本合格的普通话”“地方普通话”
“合格的普通话” ),看似难点是关于三级
普通话的概括,其实一级普通话、二级普通话的概括也难说令人满意,因为级下设等,一级
名曰“标准的普通话”,概括一级甲等还比较准确,概括一级乙等尤其是一级乙等的低分数
段,就不很准确了;同理,二级名曰“比较标准的普通话”,概括二级甲等尚可(某种程度
上也可概括一级乙等),概括二级乙等尤其是二级乙等的低分数段(失分率接近 20%),就不
够准确了。
本文提出如下解决方案:首先需要跳出“标准”
“比较标准”
“不标准”的概括描述序列。
“标准”是较为具象的程度描述,测试中呈现复杂情况采用比较具象的描述方式,难免会首
尾难顾,捉襟见肘。另外,仅从“标准程度”一个维度概括普通话水平等级也不全面,仅就
目前考查评价框架而言,普通话水平测试除了“标准程度”的维度,还有“熟练程度”的维
度,在朗读和说话测试项中有语调评价。采用相对不很具象的“高级、中级、初级”概括描
述序列,辅以量化表达,可以解决以上问题。具体建议如下:
一级:高级水平普通话,测试总失分率不超过 8%;
一级甲等:
(《等级标准》具体描述……)
一级乙等:
(《等级标准》具体描述……)
二级:中级水平普通话,测试测试总失分率不超过 20%;
二级甲等:
(《等级标准》具体描述……)
二级乙等:
(《等级标准》具体描述……)
三级:初级水平普通话,测试测试总失分率不超过 40%。
三级甲等:
(《等级标准》具体描述……)
三级乙等:
(《等级标准》具体描述……)
这样处理,增加了级的总描述语,并与现有《等级标准》
“六等”具体描述相衔接,解
决了级和等的脱节问题。
“高级、中级、初级”概括力强,同时规避了各级间的跨度难题,
必要的量化表达既丰富了描述语的内容,又实现了与“六等”描述中量化表达方式的套嵌。
2.三级六等框架
《等级标准》的等级框架设计为三级六等,共 6 个等级数量。等级数量的设计值得深入
探讨,陈章太和孙修章分别对普通话水平测试等级的设立进行了阐释。1997 年陈章太《论
普通话水平测试标准》对普通话及汉语测试文献进行了比较系统的研究,认为:“对普通话


陈章太:《论普通话水平测试的等级标准》,
《语言规划研究》
,商务印书馆 2005 年版,第 313 页,原载《语
言文字应用》1997 年第 3 期。
84

水平测试等级的划分,多数分为三级……或三级六等,少数分为四级、五级、六级。” 这是
陈章太对 1983 年发表《略论汉语口语的规范》提出普通话水平“三级”划分的进一步阐释。
孙修章则对从“三级”设想到设立“六等”进行了说明:
“关于设立六个等我们有两点想法。
一是级的跨度大,级中分两等,跨度缩小,能减少晋级的难度,增强人们进取的信心;二是
级的跨度大,对级的水平特征难以具体描述,分等以后等的特征和界限很容易说清楚,测试

员与受试人也易于掌握,评级的透明度高。” 该文把“三级”发展为“三级六等”的原因解
释得很清楚。
三级六等的框架从产生的过程看,不是一开始就成型的,先有“三级”的设想,在研制
等级标准过程中遇到实践困难,深化认识之后,采用级中套等的处理办法,产生了“三级六
等”的最终框架。我们从语言测试本身分析三级六等框架的合理性,有以下几点认识:
(1)三级的设计符合普遍认知规律,简洁明了,易于理解和操作
普通话水平测试属于大规模主观性测试,就操作而言,在传统面测模式阶段,测试评分
更多地依靠测试员的直觉判断,三级的设计,使得测试员的评价判断定位相对容易,因为这
与人们的心理定势是契合的。当然其可靠性和确切性还有局限,如再辅以定性定量的补充,
整个测试就既容易操作,又提高了可靠程度。另外,
《等级标准》的用户还不仅仅是测试员,
它还是应试人、使用单位共同参考的框架,三级的设计对他们来说也通俗易懂,易于理解和
接受。
(2)六等的设计可减少“趋中评分”现象
“趋中评分”是指在主观性测试评分过程中,测试员(评分员)规避评定高分(等级)
或低分(等级),致使评分结果过多集中于评估量表中间段的现象,也有学者称之为“集中
度”。“评分员效应”(rater effects)理论认为,“趋中评分”是一种测试员(评分员)
效应,并且具有系统性、模式化的特点。导致“趋中评分”的因素有很多,有测试员因素、
评分模式因素、测试管理因素、评分环境因素等等,其中评估(等级)量表设计是一种重要
的技术性因素。在等级数量的设计上,偶数级别与奇数级别相比有一个优点,就是有利于减
少测试员“趋中评分”效应。我们注意到,在众多语言测试中,偶数级别运用得比较广泛,
如中国少数民族汉语水平考试(MHK)分四级,专业英语考试分八级,香港普通话水平考试
(PSK)等级设计为三级八等,欧洲语言共同参考框架(CEF)等级设为六级。在偶数级别中,
四级略显粗疏,八级或以上不仅操作不够便利,而且有可能因计分定级繁复,导致测试员避
繁趋简,从而产生“趋中评分”,因此六级是较为适宜的选择。
(3)三级六等具有等级套叠和层级隶属关系
要准确把握三级六等的设计真谛,必须明了六等不是简单由高到低依次排列的6个独立
等次,而是具有等级套叠和层级隶属关系。级下设等,等隶属于级,各等具有相对独立性,


陈章太:《论普通话水平测试的等级标准》,
《语言规划研究》,商务印书馆 2005 年版,第 309 页,原载《语
言文字应用》1997 年第 3 期。

孙修章:《“普通话水平测试标准”的研制与实践》,
《语言文字应用》1992 年第 1 期,第 13 页。
85
但同一级中的两等又具有不少共同语言表征。《欧洲语言共同参考框架》的共同语言能力量
表,设计为“三等六级”
,并以“三等六级语言能力量表树形图”形式表示,见图5–1:

A B C
初学阶段 独立阶段 精通阶段

A1 A2 B1 B2 C1 C2

入门级 初级 中级 中高级 高级 精通级

图表 12 图 5–1 欧洲语言共同参考框架三等六级语言能力量表树形图

(资料来源:欧洲理事会文化合作教育委员会编《欧洲语言共同参考框架:学习、教学、评估》

刘骏、傅荣主译,外语教学与研究出版社 2008 年版,第 24 页。


以上树形图最突出的特点是采用“超级文本”类型,把“六级”置于“三等”隶属的第
二层级中,比平铺排列的“六级”更清晰地表示层级关系,也更易于把握。该量表还是一个
开放和灵活的体系,可根据需要“添枝加叶”,例如在 A2 层级下,可以再细分 A2.1、 A2.2
等等。受此启发,我们尝试以普通话水平测试等级树形图显示普通话水平测试的等级套叠和
层级隶属关系,见图 5–2:

图表 13 图 5–2 普通话水平测试等级树形图

整体来看,六等可以构成一个连续的统一体,但这个统一体是“三级各自套叠两等”的

86
结构。强调三级六等具有等级套叠和层级隶属关系,是为了突出普通话水平测试的层次特征,
更准确把握等级特征,正确评估测试等级。
3.等级标准的具体内容
(1)《等级标准》内容概况
《等级标准》采取的是文字叙述而非惯用的等级量表方式,具体表述按一级、二级、三
级顺序,分别描述各级别甲等、乙等两个等次的主要语言表征。整体来看,
《等级标准》实
际上是一个连贯的等级量表的文字表述,各等级语言表征的基本评价要素:语音(包括声母、
韵母、声调),词汇、语法,语调,流畅程度,各自体现出较为典型的连续序列特征,参见
表 5–1:

图表 14 表 5–1 《普通话水平测试等级标准(试行)
》评价要素分析表

(本表内容根据《普通话水平测试等级标准(试行)》摘编,详参教育部语言文字应用管理司编《新时期语
言文字法规政策文件汇编》
,语文出版社 2005 年版,第 218 页。

通过表 5–1 可以看出,语音评价要素的等级连续序列特征最为突出,语音质量由一级


甲等的“语音标准”到三级乙等的“声韵母发音失误多,方音特征突出”
,各等级语音质量
次第降低:语音错误类别逐渐增多,难点音逐渐增多,错误性质由音质性错误(声母、韵母
错误)
,继而到声调调值(二级乙等及以下等次)乃至整体方音面貌。
我们主张,在测试中不绝对区分词汇和语法,即词汇、语法不作为两个分立要素,而是
处理为与语音要素(包括语调在内的广义语音系统)相并立的一个评价要素(广义语义系统)。

87
在《等级标准》中,一级甲等、一级乙等的词汇、语法要素均描述为“正确无误”,从二级
甲等到三级乙等则顺次下降,分别描述为“极少有误”“有使用方言词、方言语法的情况”
“有失误”
“失误较多”,基本上通过程度词的变化体现连续序列特征。二级乙等(有使用方
言词、方言语法的情况)
、三级甲等(词语、语法有失误)区别特征不够明显。
语调在《等级标准》框架体系中被处理为与语音并列的要素,语调要素在一级甲等、一
级乙等、二级甲等中均描述为“语调自然”,从二级乙等到三级乙等则顺次下降,由“方言
语调不明显”到“方言语调较明显”
,再到“方言语调明显”,主要通过程度词的变化体现出
连续序列特征。
流畅程度要素在《等级标准》框架体系中等级序列体现得不够充分,二级甲等(含)以
上均描述为“表达流畅”
,二级乙等(含)以下则未予表述。
(2)《等级标准》内容讨论
①评价要素描述语讨论
通过以上各要素排列对比和评价要素描述语分析,可以看出设计者力图体现各评价要素
在不同等级中的质量梯度,并将各要素评价复合为普通话水平测试的综合评价体系。客观而
言,如着眼于宏观,《等级标准》不失为一个特征较为明晰,富有概括性和协调性,易于标
准参照的评价体系。但如果对每一评分要素描述语进行微观观照,则会发现各评价要素等级
序列具有一定的不均衡性。为便于进一步分析,本文提出“区别特征指数”的概念,“区别
特征指数”指反映普通话水平测试评价要素区别特征程度的量化数据,区别特征指数等于有
区别性的特征组别数量。普通话水平测试等级标准为三级六等,
“区别特征指数”最高为 6,
各评价要素区别特征指数见表 5–2:

图表 15 表 5–2 《普通话水平测试等级标准(试行)
》评价要素区别特征指数表

评价要素 语音评价要素 词汇、语法评价要素 语调评价要素 流畅程度评价要素


区别特征指数 6 4 4 2

表 5–2 反映出区别特征指数最高的是语音评价要素,最低的是流畅程度评价要素,词
汇、语法评价要素区别特征指数确定为 4+,是因为二级乙等“有使用方言词、方言语法的
情况”和三级甲等“词语、语法有失误”区别特征不显著,不作为单独的区别特征处理,以
附加符号“﹢”体现。《等级标准》区别特征指数差异过大使得整个评价体系有失衡之感,
在科学性上仍有提升的空间。流畅程度评价要素区别特征指数仅为 2,二级甲等(含)以上
等级均描述为“表达流畅”,二级乙等(含)以下则没有表述。流畅程度评价要素区别特征
指数过小,造成区分度过低的缺陷。《等级标准》的描述也容易造成一种误解,认为只有二
级乙等及以下才会出现“不流畅”的语言表征,甚至一些学者也认为“流畅”是三级甲等以

88

上的等级共有的语言表征, 换言之,除了三级乙等,其他等级都可以表述为“表达流畅”。
但是在逻辑上,
“流畅”并非三级甲等的充分必要条件,
“流畅”并不一定达到三级甲等,不
流畅并非达不到三级甲等;在测试实践中,我们能够遇到表达流畅的三级乙等应试样本,也
有可能会遇到表达不很流畅、或很不流畅的三级甲等,甚或二级乙等以上的样本。词汇、语

法区别特征指数为 4 ,指数虽较高,但也时常发生等级语言表征描述语与测试实践并不十
分吻合的情况。
出现以上问题的原因是流畅程度和词汇、语法规范是与语音(包括语调)规范程度不同
质的要素,与语音规范性要素在一个等级框架内并列并以相连成序的描述语呈现,难以做到
周延,这实在是个难以处理的缺憾。如若解决这个问题,笔者建议:第一,调整评分要素构
成,把语音和语调评分要素合而为一,形成语音、语调规范程度,词汇、语法规范程度、流
畅程度等 3 类评分要素;第二,对以上 3 类评分要素分别赋予恰当的区别特征指数并分别描
述;第三,3 类评分要素描写与三级六等不直接挂钩,而是通过分数赋值系数与三级六等最
终产生关联,三级六等的描述尽量向描写语言能力转化,不再局限于 3 类评分要素的相连成
序的传统描述方式。
②其他问题讨论
讨论一:总括性的限定内容“朗读和自由交谈时”是否有必要
《等级标准》在各等描述语之前,都有一句“朗读和自由交谈时”的限定性内容,例如
一级甲等描述为:“朗读和自由交谈时,语音标准,词语、语法正确无误,语调自然,表达

流畅。测试总失分率在 3%以内。” 这句限定性内容旨在突出各等级语言表征是一种“活态”
特征,不过,如此表达容易使人把语言表征与具体的测试项目——“朗读短文”和“命题说
话”关联起来,难免产生其他三个测试项(
“读单音节字词”“读多音节词语”“选择判断”)
的语言表征是否涵盖在内的疑问,或者产生所描述的语言表征仅仅局限于“朗读和自由交谈
时”而排除其他语言应用场合的误解。笔者认为《等级标准》应当提供超越任何具体场合局
限的描述语体系,各等级语言表征描述应该“切合具体的场合,能与每个相关具体场景相关

联,并能专用到每一个不同的具体场合,而且还能满足人们使用的功能需求”, “朗读和自
由交谈时”并不能涵盖普通话的所有“应用态”
(如播音、主持、教学、演讲、辩论等)
, 因
此建议删除此句。
讨论二:一级甲等、一级乙等“词汇、语法正确无误”是否准确
《等级标准》关于一级甲等、一级乙等词汇、语法要素的描述语都是“词汇、语法正确
无误”,该表述在理论和实践上都带来不少困惑。从理论上讲,词汇系统和语法系统是与语
音系统并立的“形式—意义”结合的符号系统,测试中允许一级甲等、一级乙等应试者出现


宋欣桥:《普通话水平的语言表征与相应的测试等级》 ,《语言文字应用》2000 年第 3 期,第 61 页。

详参《普通话水平测试等级标准(试行)》 ,教育部语言文字应用管理司编《新时期语言文字法规政策文件
汇编》,语文出版社 2005 年版,第 218 页。

欧洲理事会文化合作教育委员会编: 《欧洲语言共同参考框架:学习、教学、评估》 ,刘骏、傅荣主译,外
语教学与研究出版社 2008 年版,第 22 页。
89
语音失误,却要求其“词汇、语法正确无误”似有不妥,即使词汇系统、语法系统有不同于
语音系统的特点,其理论缺陷也难以克服。实践中,一些测试员和学者认为“一级标准是代
表普通话水平的最高级别。获得一级水平的应试人,在测试过程中,不出现词汇语法的错误,

仅仅出现不系统的零星的偶尔闪现的语音语调失误或缺陷。” 在评分实践中,有些测试员把
“词汇、语法正确无误”视为一级甲等、一级乙等的典型表征,对词汇、语法失误的评分过
于严苛,对发生词语、语法失范的应试人进行降级降等处理。事实上一级乙等水平的应试人
出现词汇、语法失范的情况是偶尔可见的,甚至极个别一级甲等也会出现词汇、语法失范的
情况,笔者曾在测试中遇到一位长期生活在北京后移居香港的著名语言学者,成绩评定为一
级甲等,但测试中出现了“一间银行”的词语语法失范现象。
相较于语音系统,词汇系统、语法系统模糊性相对更大一些,一级水平的应试人测试时
出现词汇、语法规范程度不很高的现象虽然不像语音失误或缺陷那样普遍,但也有可能出现。
“词汇、语法正确无误”的表述显得过于缺乏弹性,笔者认为要把词汇、语法和语音放到共
同框架内,只要总失分率在在 3%以内(一级甲等)、在 8%以内(一级乙等)
,即使出现比较
典型的方言性质的词汇、语法错误,应当是允许的,关键是“量”的体现。
讨论三:三级乙等“外地人听其谈话有听不懂的情况”
三级乙等是普通话水平测试等级量表的起始量级,《等级标准》关于三级乙等最后一句

描述语是:
“外地人听其谈话有听不懂的情况。” 有人据此认为只要听得懂,就应该能够入
级,甚至认为应当在三级甲等以上;或者认为只要有听不懂的情况,就应评定为三级乙等甚
至以下。
“外地人听其谈话有听不懂的情况”,不是判断三级乙等水平的“有之必然,无之必
不然”的充要条件,而只是一种可能性表述,指在三级乙等水平的应试人群中,可能出现这
种现象,但并不意味着所有的三级乙等水平的应试人都有这种表征。
“听不懂”原因很复杂,
可能有语音因素,也可能有词汇、语法因素,甚至存在语言理解的问题,测试实践也并不排
除有“听不懂的情况”但评定级别在三级乙等以上测试实例,因此不能把“是否听得懂”作
为普通话水平测试是否入级的判断标准,建议《等级标准》中去掉这句不够严谨、易引发误
解的表述。
(三)
《普通话水平测试等级标准(试行)》的作用
1.先导作用
先导作用是指在普通话水平测试学术依据体系中,《等级标准》具有先行作用和导向作
用。纵观测试发展历程,关于等级标准的探讨先行启动。等级评价是教育测量和评价普遍应
用的方式之一,其操作形式是首先确定不同等级的定义和描述,然后针对每一个评价要素或
指标按照确定的等级进行评价,最后再给出总的评价,因此等级标准是进行等级评价的前提


宋欣桥:《创建国家普通话水平测试(PSC)的理论体系——纪念普通话水平测试(PSC)开展 15 周年》,
国家语言文字工作委员会普通话培训测试中心编《第四届全国普通话培训测试学术研讨会论文集》 ,语文出
版社 2010 年版,第 11 页。

详参《普通话水平测试等级标准(试行)》 ,教育部语言文字应用管理司编《新时期语言文字法规政策文件
汇编》 ,语文出版社 2005 年版,第 218 页。
90
和基础,任何等级评价都首先要建立明确的标准,语言等级测试也不例外。梳理测试发展历
史,我们发现普通话水平测试领域最早的探索,集中在等级标准方面,换言之,等级标准开
启了普通话水平测试研究的序幕。现有可查文献最早的《普通话等级标准条例草案》和酝酿
探索阶段重要的代表性成果《略论汉语口语的规范》
《普通话水平测试刍议》等,都以等级
标准的探讨为核心和焦点,这些成果与“普通话水平测试标准”课题成果,共同奠定了测试
等级标准的学术基础。等级标准还具有导向性,突出体现为对学科发展的导向性,等级标准
研究引领和开辟了语言规划研究的新领域,上世纪八九十年代《语文建设》
《语言文字应用》
为主要阵地,出现一批探索性文章,具有典型的普通话水平测试学科先导性色彩。
2.统摄作用
统摄作用是指在普通话水平测试学术依据体系中,《等级标准》具有统揽全局的作用。
等级标准的统摄性首先体现为在学术依据层级中,
《等级标准》处于最高的级别。1997 年国
家语委将《等级标准》作为部级标准予以颁布,2000 年进而在国家专门法律《语言文字法》
中予以确认和表述,奠定了《等级标准》顶端层级学术依据的地位。其次,等级标准的统摄
性体现为对其他学术依据的制约和影响。作为顶层核心依据,
《等级标准》具有路径定位的
作用,框定了测试的实践方向,
《等级标准》是制订《测试大纲》的直接依据,也是编写《实
施纲要》,进行试题设计、评分体系设计的基础,因此《等级标准》在普通话水平测试学术
依据体系中可谓“百术之源,统摄万端”。
3.指导作用
《等级标准》对测试具有指导作用,测试的参与者,无论是施测主体(包括测试机构和
测试者),还是受测对象,抑或测试成绩的使用单位,都需要通过《等级标准》了解、准备、
实施和运用普通话水平测试。
《等级标准》对普通话教学和学习也具有指导意义,
《等级标准》
是对普通话水平测试语言表征的描述和水平界定,测试的反拨作用,使其对语言教学和学习
产生不可低估的影响,因此《等级标准》也就成为普通话教学的标准参照和普通话学习的目
标参照,对普通话教学和普通话学习的动机、内容、方法等产生指导性影响。

二、《普通话水平测试大纲》

《测试大纲》是由国家语言文字主管部门制定和发布,规定普通话水平测试名称、性质、
方式,阐明测试内容和范围,明确试卷构成、评分和应试人普通话水平等级确定方式的规范
性文本,《测试大纲》是依据《等级标准》制定的具有实施“蓝本”性质的基本学术依据。
(一)《普通话水平测试大纲》的发展流变
《测试大纲》经历了两个发展阶段,出现过两个版本。学术界一般称 1994 年刘照雄主
编的《测试大纲》为原《测试大纲》,把 2003 年教育部、国家语委颁布的《大纲》称为新《测
试大纲》。
1.《测试大纲》的研制
(1)
《测试大纲》研制缘起和过程
91
《测试大纲》研制原本是 1988 年“普通话水平测试标准”课题的三个子项目之一(三

个子项目分别为“普通话水平测试标准”
“普通话测试大纲”
“测试题的编制与题型”), 1991
年“普通话水平测试等级标准”子课题通过论证,
《普通话水平测试大纲(初稿)》和“测试
题的编制与题型”的研究也已基本成型,但因种种原因并未最终完成。1992 年,为推动普
测试尽早实施,国家语委组织专门的学术委员会和课题组,抓紧编制《测试大纲》,该课题
是国家语委‘八五’ 重点科研项目,并获得国家社会科学基金的支持。这个项目以《普通
话水平测试大纲(初稿)
》为基础,“实际上是 1988 年课题的延续,是对前一个项目的拓

展和完善 。” 1994 年,《测试大纲》在“三部委《决定》”下发的同时正式出版。
(2)原《测试大纲》的内容
原《测试大纲》框架由三大部分构成:开展测试的“三部委《决定》”
、总论及正文、附
录,其中第二部分总论及正文是原《测试大纲》的主体。总论部分对普通话水平测试的目的、
作用、性质、对象、方式、要求进行概括,对试卷编制进行说明,对评分办法进行解说,并
对试卷分型和样卷进行阐述;正文部分包括普通话语音分析和词语表、普通话和方言语法差
异对照、朗读篇目、说话话题等具体测试内容。
原《测试大纲》包括一般语言测试大纲应当具备的测试说明、试卷编制、试题结构以及
评分办法等内容,还有不少内容超出一般测试大纲的范畴,例如”普通话语音分析”对普通
话语音系统进行描述和解说,从形式到内容都类似普通话学习教材,词语表、普通话和方言
语法差异对照、朗读篇目、说话话题等内容则属于具体测试和训练范围。
2.《测试大纲》的修订
(1)
《测试大纲》修订原因
1996 年,即测试实施约两年以后,国家语委开始酝酿《测试大纲》修订工作,这是因
为原《测试大纲》在呈现形式、内容框架和学术规范等方面还有改进的必要。
在呈现形式方面,原《测试大纲》以学术专著的面貌面世,字数达百万之巨,与测试大
纲惯常的纲领性、框架式的面目很不一致。在署名方式上,原《测试大纲》以个人为主编,
体现了主编的学术贡献和责任,有其合理性。不过,普通话水平测试是带有鲜明行政色彩的
国家级语言测试,专门机构的署名方式更为权威和适宜。在内容体例方面,原《测试大纲》
内容繁复,集测试管理性文件、测试操作要求、测试范围以及培训教材内容于一体,显得学
术性、全面性有余,纲领性、专门性不足;在内容表述方式上,原《测试大纲》纲领性要求
和解释性叙说穿插在一起,显得较为杂糅和分散;在学术性方面,原《测试大纲》有学术开
创之功,但也难免存在不完善之处。随着测试实践的发展,一些学者陆续对原《测试大纲》
测试内容、试卷构成、评分标准等问题提出学术性改进建议。
(2)《测试大纲》修订过程
《测试大纲》修订经历了三个阶段:第一阶段是 1996 年,国家语委成立了《测试大纲》


孙修章:《
“普通话水平测试标准”的研制与实践》,
《语言文字应用》1992 年第 1 期,第 12 页。

刘照雄:《
〈普通话水平测试实施纲要〉概述》,
《语言文字应用》2004 年第 3 期,第 11 页。
92
修订的领导小组,下设起草小组;同年起草小组完成《测试大纲》修订送审稿,为《测试大

纲》修订打下学术基础和工作基础。 第二阶段是 1998 年~1999 年,语用司责成国家语委
普通话培训测试中心就《测试大纲》修订进行专题调研,国家测试中心成立了“PSC 评分标
准对比实验课题组”,进行测试题型、题量、评分标准的对比实验;1999 年 1 月,语用司下

发通知,征求对《测试大纲》修订稿的意见。 第一阶段和第二阶段,测试尚未在全国范围
全面开展,测试实践还不够丰富,《测试大纲》修订未取得实质性进展,但修订工作从未间
断。第三阶段是 2001 年~2003 年,随着《语言文字法》的颁布实施,测试工作在广度和深
度上的拓展,以及测试实践和理论的丰富成熟,
《测试大纲》修订迎来了最佳时机。2002 年
初,国家测试中心成立“《普通话水平测试大纲》修订及《普通话水平测试实施纲要》研制”

课题组和学术委员会。 2003 年 1 月,新《测试大纲》通过国家语委审定,2003 年 10 月,

新《测试大纲》由教育部、国家语委发布,
《测试大纲》修订工作正式完成。
(二)新《普通话水平测试大纲》具体内容
新《测试大纲》把原《测试大纲》具体的测试内容和训练材料的部分剥离出来,另外编
制《实施纲要》。新《测试大纲》
“注重原则性和指导性,突出规范性和纲领性,追求简洁精

当”, 主要包括四部分内容:①测试的名称、性质、方式;②测试内容和范围;③试卷构成

和评分;④应试人普通话水平等级的确定。新《测试大纲》具体内容如下 :
1.《测试大纲》的制定依据
新《测试大纲》正文首句即明确《测试管理规定》和《等级标准》是其制定的依据,新
《测试大纲》以此开篇,目的就是为了凸显其上位依据,这与原《测试大纲》相比是个进步。
测试依据具有层级性,
《测试管理规定》是国务院部门规章,属测试的法律法规依据;
《等级
标准》和《测试大纲》同属学术依据范畴,但《等级标准》在《语言文字法》中由专门法条
予以表述,因此层级也高于《测试大纲》,所以《测试管理规定》和《等级标准》是《测试
大纲》的制定依据。
2.测试的名称、性质和方式
新《测试大纲》规定:“本测试定名为‘普通话水平测试’(PUTONGHUA SHUIPING CESHI,
缩写为 PSC)。”原《测试大纲》并无测试名称的明确规定,新《测试大纲》进行这种规定,
一方面是因为当时出现测试名称的一些混乱情况,另一个目的是与《语言文字法》称法相协


起草小组成员为仲哲明(执笔)、陈章太、刘照雄,详参刘照雄《〈普通话水平测试实施纲要〉概述》, 《语
言文字应用》2004 年第 3 期,第 11 页。

王晖:《 〈普通话水平测试大纲〉修订的若干问题》,教育部语言文字应用研究所编《语言文字应用研究论
文集Ⅱ》 ,语文出版社 2004 年,第 343 页。

课题组负责人为姚喜双、刘照雄,王晖、刘新珍为核心组成员。学术委员会召集人为刘照雄、姚喜双,委
员共 19 人。详参王晖《〈普通话水平测试大纲〉修订的若干问题》,教育部语言文字应用研究所编《语言文
字应用研究论文集Ⅱ》 ,语文出版社 2004 年,第 344 页。

王晖:《普通话水平测试阐要》 ,商务印书馆 2013 年版,第 184 页。

王晖:《普通话水平测试阐要》 ,商务印书馆 2013 年版,第 185 页。

《测试大纲》具体引述内容均引自教育部语言文字应用管理司编《新时期语言文字法规政策文件汇编》,
语文出版社 2005 年版,第 223~226 页;为节省篇幅,各条引述不再标明具体页码。
93
调,使这一载入国家专门法律的名称,成为具有特定意义的专门术语。普通话水平测试名称
及其汉语拼音(包括缩写形式)的确定,对测试术语规范具有示范性意义,PSC 收录于 2005
年第 5 版《现代汉语词典》所附 “西文字母开头的词语”中。

新《测试大纲》对普通话水平测试目标和性质进行了明确表述。 原《测试大纲》未对
普通话水平测试目标进行概括,早期学者讨论普通话水平测试目标时,多数视之为“规范程

度”或“标准程度”的测试,例如,仲哲明以“规范程度”概括, 刘照雄则以“标准程度”

论之。 我们认为这种看法尚不够全面,考察应试人一般语言能力(语言水平)通常有两个
维度——规范(标准)程度和熟练程度,“普通话水平测试”无论名称还是测试实践本身,
熟练程度都应是不容忽视的一个维度,评分系统中也把熟练程度列为评分要素之一,因此在
对普通话水平测试目标进行表述时,有必要把“熟练程度”明确提出来。
“标准参照性”是教育测量领域按照分数解释的方法对测试的分类,与之相对应的是“常
模参照性”考试。对于普通话水平测试的性质,我们比较赞同仲哲明“普通话水平测试基本

上属于目前比较通行的所谓标准参照性或者说达标性测试的范围” 的看法。
新《测试大纲》规定测试以口试方式进行。“口试”指的是测试实施的方式,需要指出
的是,“以口试方式进行”并不等同于“口语”的测试。普通话包括“口语”和“书面语”

两种形式,
“普通话不仅是民族共同语的口语,同时也是有统一规范的文学语言” 把普通话
水平测试理解为普通话“口语”的测试有失偏颇。以《实施纲要》
“词语表”的编制为例,
该表既以语料库为基础遴选书面语色彩较浓的词语,也补充了一些口语色彩较典型的儿化词
语,并将二者都视为测试内容。
3.测试内容和范围
新《测试大纲》规定:
“普通话水平测试内容包括普通话语音、词汇和语法。”该表述清
楚地表明,普通话水平测试是以完整的普通话语言结构系统为测查内容的,涵盖语音系统、
词汇系统和语法系统。新《测试大纲》规定的测试范围是“国家测试机构编制的《普通话水
平测试用普通话词语表》
《普通话水平测试用普通话与方言词语对照表》
《普通话水平测试用
普通话与方言常见语法差异对照表》《普通话水平测试用朗读作品》《普通话水平测试用话
题》。”该规定为《实施纲要》的编制提供了依据,保证了测试内容在全国范围的统一性。
4.试卷构成和评分
新《测试大纲》规定了普通话水平测试的试卷构成和评分。试卷构成部分包括题型、
题量、时限,评分部分包括分值、评分要素和评分规则,具体内容详见表 5–3 和表 5–4:


“普通话水平测试测查应试人的普通话规范程度、熟练程度,认定其普通话水平等级,属于标准参照性考
试。”引自新《普通话水平测试大纲》第一条。

“普通话水平测试是对应试人掌握和运用普通话所达到的规范程度的检测”,参见仲哲明《普通话水平测
试若干问题的讨论》,《语言文字应用》1997 年第 3 期,第 6 页。

“普通话水平测试是根据需要对应试人员运用普通话所达到的标准程度的检测和评定”,参见刘照雄《普
通话水平测试的构想与实施》,《语文建设》1996 年第 2 期,第 28 页。

仲哲明:《普通话水平测试若干问题的讨论》 ,《语言文字应用》1997 年第 3 期,第 6 页。

《中国大百科全书·语言文字卷》,中国大百科全书出版社 1988 年版,第 310 页。
94
图表 16 表 5–3 新《测试大纲》试卷构成及评分简表(五项测试)

试卷构成 评 分
题 型 题 量 时限 分 值 评分要素 评分规则
语音错误 0.1 分/音节
100 个 3.5 语音缺陷 0.05 分/音节
单音节字词 10 分
音节 分钟
0.5 分(1 分钟以内);1 分(1
超 时
分钟以上)(含 1 分钟)
语音错误 0.2 分/音节
100 个 2.5 语音缺陷 0.1 分/音节
多音节词语 20 分
音节 分钟
0.5 分(1 分钟以内);1 分(1
超 时
分钟以上)(含 1 分钟)
判断错误 0.25 分/组
词 语
10 组 0.1 分/音节(如判断错误已扣
判 断 语音错误
分,不重复扣分)
判断错误 0.5 分/组
量词名 3
10 组 10 分 0.1 分/音节(如判断错误已扣
词搭配 分钟 语音错误
选择 分,不重复扣分)
判断
词序或 判断错误 0.5 分/组
表达形 5组 0.1 分/音节(如判断错误已扣
式判断 语音错误
分,不重复扣分)
0.5 分(1 分钟以内);1 分(1
超 时
分钟以上)(含 1 分钟)
音节错误(漏
0.1 分/音节
读、增读)
声母或韵母系
视程度扣 0.5 分、1 分
统性缺陷
1篇
4
朗读短文 (400 音 30 分 语调偏误 视程度扣 0.5 分、1 分、2 分
分钟
节)
停连不当 视程度扣 0.5 分、1 分、2 分
朗读不流畅 视程度扣 0.5 分、1 分、2 分
超 时 1分
一档 扣 0 分、0.5 分、1 分
二档 扣 1.5 分、2 分

20 语音标准 三档 扣 3 分、4 分
分 程度 四档 扣 5 分、6 分
五档 扣 7 分、8 分、9 分

1 个话题 3 30 六档 扣 10 分、11 分、12 分


命题说话
分钟 分 一档 扣0分
5 词汇语法
二档 扣 0.5 分、1 分
分 规范程度
三档 扣 2 分、3 分
一档 扣0分
5 自然流畅
二档 扣 0.5 分、1 分
分 程度
三档 扣 2 分、3 分

95
图表 17 表 5–4 新《测试大纲》试卷构成及评分简表(四项测试)

试卷构成 评 分
题 型 题 量 时限 分 值 评分要素 评分规则
语音错误 0.1 分/音节
100 个 3.5 语音缺陷 0.05 分/音节
单音节字词 10 分
音节 分钟
0.5 分(1 分钟以内);1 分(1
超 时
分钟以上)(含 1 分钟)
语音错误 0.2 分/音节
100 个 2.5 语音缺陷 0.1 分/音节
多音节词语 20 分
音节 分钟
0.5 分(1 分钟以内);1 分(1
超 时
分钟以上)(含 1 分钟)
音节错误(漏
0.1 分/音节
读、增读)
声母或韵母系
视程度扣 0.5 分、1 分
统性缺陷
1篇
4
朗读短文 (400 音 30 分 语调偏误 视程度扣 0.5 分、1 分、2 分
分钟
节)
停连不当 视程度扣 0.5 分、1 分、2 分
朗读不流畅 视程度扣 0.5 分、1 分、2 分
超 时 1分
一档 扣 0 分、1 分、2 分
二档 扣 3 分、4 分

25 语音标准 三档 扣 5 分、6 分
分 程度 四档 扣 7 分、8 分
五档 扣 9 分、10 分、11 分

1 个话题 3 40 六档 扣 12 分、13 分、14 分


命题说话
分钟 分 一档 扣0分
10 词汇语法
二档 扣 1 分、2 分
分 规范程度
三档 扣 3 分、4 分
一档 扣0分
5 自然流畅
二档 扣 0.5 分、1 分
分 程度
三档 扣 2 分、3 分

(两表资料来源:王晖《略论普通话水平测试的评分系统》
,《语言文字应用》2004 年第 3 期,

第 34~35 页,有改动。

试卷构成和评分是新《测试大纲》的内容主体,通过对具体测试项目题型、题量、内容、
时限、分值及评分规则等详细规定,实现普通话水平测试构想的目标蓝图。新《测试大纲》
是在原《测试大纲》将近 10 年测试经验基础上,经过充分研究修订而成的,科学性和可操
作性总体令人满意。题型、题量、内容、时限、分值及评分规则诸方面的具体内容,属于具
体学术依据,将在下一节专门讨论。

96
5.应试人普通话水平等级的确定
新《测试大纲》最后一部分明确《等级标准》是确定应试人普通话水平等级的依据,规

定等级确定机构和证书颁发机构, 并对“三级六等”具体划线分值进行量化描述。该部分
内容,方便施测主体、应试人和用户单位全面准确地了解普通话水平测试的分数、等级及其
层级和进阶关系。
6.“选择判断” 测试项的免测说明
新《测试大纲》正文之后,有一段说明的内容,主要涉及“选择判断” 测试项的免测
规定及具体的分值调整,属于具体学术依据,将在下一节专门讨论。
(三)《普通话水平测试大纲》的作用
1.奠基作用
普通话水平测试系统,需要相互配合的两套支撑体系作为实施的依据:管理支撑体系和
学术支撑体系。在学术支撑体系中,《测试大纲》确定测试的目的、类别、性质、方式,规
定测试的内容、结构、范围、题型和要求,把测试的学术设想“定型”为切实的具体的可靠
的测试依据,为测试提供了操作蓝图,为启动和实施普通话水平测试奠定了坚固的基石。在
学术层面,
《测试大纲》和《等级标准》共同为普通话水平测试学科“塑型”提供了基石,
具有学术奠基的意义。
2.规范作用
作为大规模公开性测试,普通话水平测试必须在命题、施测、评分和分数解释等环节严
格控制,确立操作规范。
“规范”可以理解为规定的范式,范式理论的创始人托马斯·库恩
(Thomas Kuhn)指出,“(范式)指的是一个共同体成员所共享的信仰、价值、技术等等的集
合。指常规科学所赖以运作的理论基础和实践规范,是从事某一科学的研究者群体所共同遵

从的世界观和行为方式。
” 这是科学哲学领域的范式概念,普通话水平测试的范式是一种实
践规范,《测试大纲》以清晰、系统而又简洁的描述方法,确立了测试活动公认的范式,这
种测试范式以正式文件的形式公布,使得非专业人员也可以理解复杂的专业过程,并对测试
试活动共同体成员(施测主体、受测对象)都起到契约性的约束作用,测试试活动共同体成
员不能随意违背或偏离测试大纲,这对规范测试活动,保障测试质量具有重要意义。
3.指导作用
《测试大纲》对实施普通话水平测试具有指导作用,相对于《等级标准》,《测试大纲》
对测试参与者的指导作用更为直接和具体。
《测试大纲》一方面为施测主体提供命题、制卷、
题库、评分等业务操作指导;另一方面,其提供的题型、题量、时限、分值等测试信息,对
受测对象备考具有重要指导意义;此外,
《测试大纲》对普通话教学和学习也具有指导作用,


“国家语言文字工作部门颁布的《普通话水平测试等级标准》是确定应试人普通话水平等级的依据。测试
机构根据应试人的测试成绩确定其普通话水平等级,由省、自治区、直辖市以上语言文字工作部门颁发相
应的普通话水平测试等级证书。 ” 引自新《普通话水平测试大纲》第四条。

百度百科:http://baike.baidu.com。
97
《测试大纲》对测试要素的具体要求以及对评分的规定,为普通话教师和学习者提供直接的
参照框架,例如《测试大纲》考核内容涵盖语音、词汇、语法,把语调、停连、流畅程度列
为评分要素,对于纠正普通话教学片面重视语音教学,特别是只注重静态的声母、韵母、声
调、音节教学,忽视语流语感教学和词汇语法教学等现象,提供了有益的方向性指导。

第二节 普通话水平测试具体学术依据

具体学术依据是指开展普通话水平测试详细的操作性的学术依凭,是测试实施具有执行
性作用的学术规范的总和,是保障测试活动开展的细节明确的应用性学术依据,具体包括《普
通话水平测试实施纲要》
、命题依据和评分依据。

一、《普通话水平测试实施纲要》

(一)《普通话水平测试实施纲要》编制概况
《实施纲要》2002 年立项编制,2003 年编制完成。
《实施纲要》和新《测试大纲》均脱
胎于原《测试大纲》,在修订《测试大纲》时,课题组采用了“一体两翼”的创编思路,把
纲领性、指导性文件修订完善为新《测试大纲》,把具体的测试内容和训练材料等重新编制
为《实施纲要》,实现了新《测试大纲》和《实施纲要》的功能区分。新《测试大纲》突出
纲领性,《实施纲要》则着眼于实施,二者各有其用,又协调配合。《实施纲要》2004 年出
版,以“国家语委普通话培训测试中心”的机构名义编制,教育部语用司组织审定,具有突
出的权威性,是测试实施的国家指导用书。
(二)
《普通话水平测试实施纲要》的框架和内容
1.《实施纲要》的框架
从结构上看,《实施纲要》分为三大部分:
第一部分是新《测试大纲》、总论和普通话语音分析。新《测试大纲》编排在第一部分,
是为了突出《测试大纲》是《实施纲要》的编制依据,同时为使用者提供翻检便利;总论分
三个小单元——导语,试卷构成、测试时间和评分,样卷;普通话语音分析简述普通话语音
系统(包括声母、韵母、声调、音节以及变调、轻声、儿化、语调等内容)

第二部分是《实施纲要》的主要内容单元,具体包括测试的词语表、普通话与方言词语
对照表、语法对照表、朗读作品、话题等内容。
第三部分是附录,包括《等级标准》
《测试管理规定》
《测试规程》
《汉语拼音方案》
《普
通话异读词审音表》
《音标表》等 6 个附录。
2.《实施纲要》的主体内容
(1)普通话水平测试用普通话词语表
普通话水平测试用普通话词语表(简称“词语表”)主要为“读单音节字词”和“读多

98
音节词语”测试项提供命题依据。
①“词语表”的结构

“词语表”结构分三部分:“表一”“表二”及 3 个附表。 区分“表一”和“表二”
延续了原《测试大纲》的处理方式,如此处理目的有三:一是为命题提供依据,因为《测试
大纲》规定“读单音节字词”和“读多音节词语”两个测试项的字词、词语 70%选自“表一”

30%选自“表二”。二是保证试题的难度和区分度,“表一”根据使用频度区分为带“*”的
(一级词语)与不带“*” 的(二级词语)两级词语,连同“表二”词语(三级词语),“词
语表”区分出三级词语,分级处理对保证试卷难度和区分度具有现实意义。三是为普通话培
训和学习提供进阶性素材,有利于循序渐进学习原则的落实。3 个附表可为应试人备考和题
库建设提供更便利的条件。“用字统计”和“必读轻声词语表”均根据“词语表”编制,“儿
化词语表”以“词语表”为基础扩充而成。
②“词语表”的规模

笔者曾以“言实”笔名专文探讨“词语表”的收词规模。 “词语表”是以“普通话水
平测试用”冠名的专业用途词表,因此应首先考虑测试需求,其次还应考虑“以测促训”

为普通话培训和学习提供高效的素材,规模适当、适测性强是编制“词语表”的专业要求。
原《测试大纲》词语表收词语 23950 条,测试实践表明规模偏大,反而不利于普通话培训
和学习。林杏光认为:“ 一个以汉语为母语的人,知识全面发展的人,掌握汉语的词约 6000

到 9000。以汉语为母语的大作家所掌握的词汇,可以达到两万多”, 陈章太认为:“如果
制订现代汉语通用词表,大体可收词语五、六万条,其中使用频率最高的 12000 条词语至

15000 条词语是测试内容应当包括的基本词汇”, 课题组综合了林杏光和陈章太的研究,
确定“词语表”规模控制在 15000 条~18000 条左右为宜,经选材、干预、加工,最终收词

语 17055 条,“表一”收词语 6595 条,“表二”收词语 10460 条。
③“词语表”的语料选择和加工方法

《实施纲要》“词语表”和原《测试大纲》“词语表”“在取材方面有很大变化。” 《实
施纲要》“词语表”不是原《测试大纲》“词语表”基础上简单增补删汰,而是重新编制,
可以说是另起炉灶。这样做是因为原《测试大纲》“词语表”语料处理的科学性有欠缺、理
据不够充分,并且难以在自身框架内加以解决。比如原《测试大纲》“表一”,基本上是“嫁
接”《汉语水平词汇与汉字等级大纲》而成(仅有少量删选),该《大纲》适用于对外汉语
教学领域。有些词语如“背着手、不得不、不是吗、就是说、甚至于、有时候、真是的”,
对第二语言学习者有学习和测试价值,对第一语言学习者和应试者的价值则大打折扣,以上


3 个附表分别为“[表一][表二]用字统计”“普通话水平测试用必读轻声词语表”和“普通话水平测试用
儿化词语表”。

详参言实《关于普通话水平测试用普通话词语表的编制》, 《语言文字应用》2004 年第 3 期,第 15~19 页。

林杏光:《词汇语义和计算语言学》 ,语文出版社 1999 年版,第 50 页。

陈章太:《关于普通话水平测试的效度问题》 ,《中国语文测试》 (香港)2002 年第 1 期,第 5 页。

言实:《关于普通话水平测试用普通话词语表的编制》 ,《语言文字应用》2004 年第 3 期,第 19 页。

刘照雄:《〈普通话水平测试实施纲要〉概述》, 《语言文字应用》2004 年第 3 期,第 13 页。
99
词条《现代汉语词典》均未予收录也是一个旁证。原《测试大纲》“表二”是在《现代汉语
词典》(按:1983年第2版)基础上选编而成,但选编的主观性较强,也未能充分利用语料库的
技术和成果,例如过于注重“字种”数量,收录了一些罕用词语,如“蠹虫、褫夺、镪水、
鼻衄、纽襻、绱鞋、鹁鸪、斑蝥”等;对于某些专业(行业)词汇的收录过于集中,尤以语
言学术语收录为甚,收录了“标准音、标准语、国际音标、词头、词尾、词性、词序、词根、
词缀、词法、词类、单纯词、合成词、复音词、单句、复句、祈使句、调号、调类、调值、
鼻音、边音、介音、擦音、唇齿音、齿唇音、尖团音、复辅音、喉塞音、喉擦音、半元音、
卷舌元音、开口呼、合口呼、闭口韵、鼻韵母、反切……”等,不下50词。以上罕用词语和
领域专业词语缺乏广泛的社会运用基础,入选“词语表”不太恰当。笔者另以“白”为首字
的词头为例进行考察,详见表5–5:
图表 18表5–5 原《测试大纲》和《实施纲要》“词语表”以“白”为首字词条对比表

二者兼收词条(16条) 仅收录于原《测试大纲》词条(55条) 仅收录于《实施纲要》词条(5条)

白、白色、白天、白菜、 白白、白案、白班儿、白醭儿、白痴、 白骨、白果、白人、白薯、白皙


白费、白话、白话文、 白炽、白搭、白垩、白矾、白干儿、白宫、
白桦、白净、白酒、 白鹤、白喉、白灰、白芨、白金、白卷、、
白日、白糖、白眼、 白开水、白蜡、白兰地、白痢、白蛉、
白蚁、白银、白昼 白露、白鹭、白茫茫、白蒙蒙、白面、
白描、白内障、白皮书、白皮松、白旗、
白鳍豚、白区、白热化、白刃战、白肉、
白色恐怖、白芍、白事、白铁、白头、
白头翁、白熊、白癣、白血病、白血球、
白杨、白药、白夜、白翳、白芷、白术、
白字、白族

表5–5显示,原《测试大纲》收词语比《实施纲要》多出约2.4倍,而且对“疾病类”
和“植物类(尤其是中草药类)”词语似有偏好,但理据似又不够充分。以收录的植物名称
为例,我们依据国家语委现代汉语语料库进行词频检索,《实施纲要》收录的“白果”频度
为39,“白薯”频度为39。原《测试大纲》收录的各词的频度如下:白芨3、白皮松4、白芍
15、白杨93、白芷13、白术59”。仅“白杨”“白术”频度高于“白果”“白薯”,其中“白
杨”1996年版《现代汉语词典》未收;“白术”编制“实施纲要”时根据2000万字语料统计,
此次查询根据5500万字语料查询,词频有所变化,修订《实施纲要》时以上两词可考虑补录。
通过表5–5对比可以发现,原《测试大纲》“词语表”收录词语不够严谨和精当。
以上缺憾在原《测试大纲》“词语表”内难以微调弥补,为了克服原《测试大纲》在选
词方面的缺陷,课题组提出语料选择的两条原则:词频原则和通用性原则,低频度的非基本
词语、专业术语、行业用语、方言词语不收入“词语表”。在“词语表”编制的技术路线上,
课题组创新思路,充分利用国家语委现代汉语语料库,采用“词频+规范”的手段,具体做
法如下:
100
步骤一,选用国家语委现代汉语语料库作为“词语表”的基础语料来源,把该语料库2000
万字熟语料中的词语以降频顺序排列,取词频前30000的词语形成“基础词语表”;
步骤二,对“基础词语表”进行必要人工干预(主要是删除地名、人名、机构名等专用
名称词);
步骤三,将干预后的“基础词语表”(27000余条)与权威的规范性辞书《现代汉语词
典》(按:指当时版本即1996年第3版《现汉》)做“交集”,形成约21000词的“备选词语
表”;
步骤四,根据通用性原则、“适测性”原则、“避重”原则进行删汰,形成“词语表(草
表)” ;
步骤五,根据规范性原则要求,对“词语表(草表)”进行语音、字 (词) 形规范化
加工和结构处理,最终形成“词语表”及其3个附表。
④ “词语表”的主要数据
笔者《关于普通话水平测试用普通话词语表的编制》一文详细报告了“词语表”的主要
数据,包括:收词量、词语音节长度分布、用字统计、轻声词语统计、儿化词语统计等五大
方面,这些数据充分利用了语料库语言学的技术支撑,对普通话水平测试试题编制、题库建
设发挥了重要作用。
(2)普通话水平测试用普通话与方言词语对照表
普通话水平测试用普通话与方言词语对照表(简称“普—方词语对照表”)主要为词汇
测查服务,课题组经研究采用七大方言区的划分方法。该表在原《测试大纲》闽方言( 福州) 、
粤方言( 广州) 、吴方言( 上海) 、湘方言( 长沙) 、客家方言( 梅州) 五个方言区语料基
础上,增加了赣方言( 南昌)的语料。
“普—方词语对照表”编制的具体做法是:步骤一,依照“表一” 条目( 6595 条) 排
比六大方言与普通话说法不同的词语,得到约 500 条对照词条;步骤二,进行语料扩充,把
原《测试大纲》里有而《实施纲要》中缺少的 400 多条目增补入“普—方词语对照表”,总
条目达到 955 条,可满足测试的需要。
(3)普通话水平测试用普通话与方言常见语法差异对照表
普通话水平测试用普通话与方言常见语法差异对照表(简称“普—方语法对照表”)
按照语法差异的类型进行对比,大致按词法和句法分类排列,词法在前,句法在后。“普—
方语法对照表”共附列语法差异对比34项,在各类别下附列若干组例句,共计217组,命题
时例句可类推替换。
“普—方语法对照表”后有一个附表——“量词、名词搭配表”(简称“量名搭配表”),
该表以量词为纲排列,量词后附列可与之搭配的常用名词。“量名搭配表”收录测试用量词
45条,名词389条(次),其中可搭配多个量词的名词219个,这些名词以“互见”的形式体
现,不含“互见”条,该表实收录名词170条。

101
(4)普通话水平测试用朗读作品
普通话水平测试用朗读作品(简称“朗读作品”)为“朗读短文”测试项提供命题依据。
①“朗读作品”选文原则
课题组确定了总量适恰原则、真实文本原则、综合平衡原则、适读适测原则等四个选文
原则。
在选文总量上,“朗读作品”选篇总量既要满足测试需求,还要尽可能为普通话培训、
学习提供足量、精当的素材。课题组根据倪海曙“普通话的学习指标,可以定为‘万词、千

句、标准音’”的建议, 并结合原《测试大纲》50 篇“朗读作品”总训练量(约 25000 字),
确定“朗读作品”总量为 60 篇,总训练量经最终统计为 28779 字,句子(以句号处、叹号

处、问号处、句末省略号处为标志进行统计)总量为 1013 句。
曾有专家建议利用计算机辅助程序编制专门满足测试需求的篇章,以利于统一和控制
“朗读作品”的难度。但这种作品工具性、人文性和审美性都远不及真实文本,质量控制难
度也非易事。现代语言测试强调真实文本和真实情景,真实文本辅以必要的规范性干预是较
为可行的途径,因此选文必须遵循真实文本原则。
“朗读短文”是一个综合性测试项目,入选篇章的首要目的是服务于语言测试,但也要
兼顾其综合性质,因此选文应遵循综合平衡原则,注重工具性、规范性与人文性、审美性的
结合。
“朗读作品”以“适读适测”为原则,要求入选篇章适合朗读(而非阅读),语句明快
晓畅,节律均衡和谐。在体裁方面以散文为主,并对测试要素进行详细的统计,保证文章符
合测试要求。
②“朗读作品”选文步骤
步骤一:初选。课题组委托天津、上海、重庆、湖北、湖南、江西和广西等7个省份的

语委办及测试机构,协助参与初选工作,初选作品总计达580余篇。
步骤二:复选。首轮复选主要考虑以下问题:作品整体的“适读适测性”、作品内容的
“普适性”(即适合广大人群)、作品主题的丰富性(同类主题的作品以1篇为宜,最多不超
过3篇)、作品体裁的多样性(作品以散文为主,但不局限于散文)。第二轮复选采用集体
讨论方式,逐篇分析,反复比较,对作品的时代性和人本对话性尤为重视,一些与现代生活
密切相关的科学性、知识性作品得以入选。经过两轮复选,遴选篇目82篇。
步骤三:终选。对复选的作品进行测试要素统计分析,包括每篇的用字数量、字种数量
以及音韵(主要包括声、韵、调、儿化等要素)覆盖分布。音韵分布比较均衡,用字难度适
中的最终入选,最后选定的篇目共计60篇。当然,由于采用真实文本,这方面要求也不宜过


倪海曙:《普通话要通过教学才能推广》 ,《倪海曙语文论集》,上海教育出版社 1991 年版,第 232 页。

参见《纲要》朗读作品选编课题组(刘彦执笔): 《关于普通话水平测试用“朗读作品”的分析报告》 ,《语
言文字应用》2004 年第 3 期,第 28 页。

参见《纲要》朗读作品选编课题组(刘彦执笔): 《关于普通话水平测试用“朗读作品”的分析报告》 ,《语
言文字应用》2004 年第 3 期,第 22 页。
102
于严苛,但要有大致的要求,使入选作品总体符合测试的需求。
③“朗读作品”规范性加工
课题组对最终入选的“朗读作品”进行了必要的规范性加工处理。
一是定篇幅:《测试大纲》要求测试400个音节,经著作权人同意,对篇幅较长的作品
进行删节加工,并在作品的第400个音节后标注双斜线“∥”,以示测试完结。
二是定形:经著作权人同意,对个别不规范、不常用的字形以及有方言色彩的词句进行
调整。数字用法统一以汉字形式表示,如“2002 年”写作“二〇〇二年”,“95%”写作“百

分之九十五”。这样处理是“为了便于字数和音节的统计”, 但也产生了两点不足:一是
在某种程度上使考试的效度有所减损,如“213”,有的应试人习惯读为“两百一十三”或
“两百十三”,改为汉字形式的“二百一十三”则会掩盖这种误读;二是全部改用汉字不符
合国家标准《出版物上数字用法的规定》。建议按照《出版物上数字用法的规定》规范使用
数字,音节统计完全不是问题。
三是注音:《实施纲要》全文加注汉语拼音,原则上依据《汉语拼音正词法基本规则》
拼写,必要时参考《现代汉语词典》加以处理。有几项具体规定说明如下:一是注音一般只
标本调,不标变调;二是区分必读轻声音节和“一般轻读,间或重读的音节”;必读轻声音
节,注音不标调号,“一般轻读,间或重读”的音节,加注调号并在拼音前加圆点予以提示,
表方位的语素(上、下、里、边、面等)和表趋向的语素(来、去、上、下)统一处理为“一
般轻读,间或重读”音节,形容词生动形式AA式、ABB式、AABB式,原则上也只标本调,不
标变调(个别口语中习惯音变的,以“又音”说明)。
“朗读作品”的规范性加工处理,为应试人学习普通话,提高规范运用普通话的能力提
供了便利的文本。
(5)
“普通话水平测试用话题”
“普通话水平测试用话题”
(简称“话题”)为命题说话测试项提供命题依据。《实施纲
要》把原《测试大纲》50 则话题整合归并为 30 则,“话题”设置主要涉及两方面因素:内
容因素和体裁因素。
内容因素主要考虑四点:一是话题开放性,范围尽可能开放、宽泛、通用,避免话题过
于专业化;二是话题熟悉度,话题内容尽可能贴近生活,大多数人熟悉,有话可说;三是话
题独立性,各话题间应有各自侧重的角度和方向,尽可能避免交叉;四是话题公开性,话题
尽量回避隐私和保密内容,尽可能避免引起应试人情绪波动。
体裁因素主要考虑是述说性(具体包括描述体、叙述体、说明体三类)话题、议论性话
题兼顾,述说性话题为主,议论性话题为辅。这种设计是因为述说性话题的思维和结构复杂
度要求较低,容易引发应试人话题输出,而议论性话题要求较高,引发应试人话题输出相对
困难。


《纲要》朗读作品选编课题组(刘彦执笔):《关于普通话水平测试用“朗读作品”的分析报告》
,《语言
文字应用》2004 年第 3 期,第 23 页。
103
30 则话题是对多年测试实践的总结归纳,实践可行性较佳,但已有近 12 年未做调整,
测试真实性减损,同时测试方法研究、话题难度的分析研究等也应持续加强 。
(三)《普通话水平测试实施纲要》的作用
1.文本支撑作用
《实施纲要》为普通话水平测试提供基础素材,是测试的总素材库。《实施纲要》被确
定为“普通话水平测试国家指导用书”
,是全国范围内统一落实新《测试大纲》
“测试内容和
范围”要求的实体呈现,是试题编制和国家测试题库建设的执行性依据,在测试依据体系中
发挥着测试内容文本支撑的重要作用。
2.应试指导作用
《实施纲要》编制是富有学术创新性的工作实践,
《实施纲要》
“词语表”充分利用语料
库资源和词汇学研究成果,选材科学,富有理据;
“普—方言词语对照表”
“普—方言语法对
照表”和“量名搭配表”吸收了国内词汇、语法及方言研究的成果;“朗读作品”注重规范
性和人文性,并进行了语料的计量统计和分析,在审音、注音等方面进行了有益的尝试;
“话
题”的选择也更为精当。因此《实施纲要》不仅是测试员的业务指导用书,也是普通话培训、
学习的资源库,对应试人参加测试和普通话学习具有专业性的指导作用。

二、普通话水平测试命题依据

命题依据规定普通话水平测试试题设计和试题编制,是试题生产程序中学术规范的总和。
《测试大纲》是命题的根本依据,规定命题依据的框架,在实施层面,命题依据通过试题生
产环节具体体现。本研究重点讨论题型、测试长度、覆盖与分布、分值比重、试卷设计和题
库建设等问题。
(一)题型
1. 普通话水平测试题型的早期探讨
题型即试题的类型,解决“怎么考”的问题,题型研究是普通话水平测试早期研究的热
点问题之一。普通话水平测试题型设计在《测试大纲》出台前历经了一个发展变化的过程,
以下三个问题比较重要。
(1)关于笔试题型
现行普通话水平测试采用口试方式,但在测试的研发时期,国家语委“普通话水平测试
标准”课题组曾提出口试加笔试的方式。口试题型有四种:读单字、读词语、读文章、说话,
笔试题型为选择题。“笔试集中考查掌握普通话词语和语法的能力。这样定主要考虑说话时
带出的方言词、方言语法是分散的、零散的,不能全面了解人们在说普通话时保留方言词、
方言语法的全面情况。笔试却能做到这一点。测试题的编制有针对性,包容量大,测试结果

可信度高,是其他测试形式无法比拟的。” 厉兵设计的普通话测试方案,从内涵上对普通话


孙修章:《
“普通话水平测试标准”的研制与实践》,
《语言文字应用》1992 年第 1 期,第 15 页。
104

测试进行严格界定:
“我们所说的普通话测试,严格地说,应当称作普通话口语测试”, 因
此他拟定的方案采取完全的口试题型,包括读词语、读短文、对话、方言—普通话转述等四
种题型。
在各地实践中也有两种情形,以云南省为代表,采用口试加笔试的方式,笔试题型为选
择题,考查 100 个词语,列出汉语拼音供应试人选择;以河北师范大学为代表,采用完全口
试的方式,题型包括读声韵调、读双音节词语、朗读和自由谈话(详见本文第三章第二节)

普通话水平测试定位于“水平测试”,属于语言能力测试范畴,考虑到其第一语言能力
测试的特性,笔试题型终因效度较差的原因被舍弃。但以上学术探讨和实践探索具有积极的
意义,为测试题型的最终“定型”进行了充分的理论和实践准备。
(2)关于听力题型
国家语委“普通话水平测试标准”课题组最初也曾考虑设计听力试题,“这个问题在我
们拟定测试大纲时曾经考虑过。当时认为,测试听力是测试理解的项目。……我们暂时不专
设听力测试,但我们准备将‘听’的形式用于考查人们辨别语音能力、辨别方言词和语法的

能力等方面” “现在的普通话水平测试,一般试卷由读单音节词和双音节词语、朗读短文、

判断词语和语法、说话、会话等几部分构成,个别地方的测试有听力的部分。
” 这表明在学
术和实践两个领域,听力题型都曾经是普通话水平测试选项之一。
论及语言测试,人们往往认为应涵盖听、说、读、写四项基本技能,我们认为语言测试
的测试内容、结构和题型都应服从和服务于测试目标,都应当分析具体测试对象和测试性质,
据此确定测试类别、范围、内容结构和题型。我们认同厉兵的观点:“普通话测试可不可以
省去‘听’的专项考评呢,对于以汉语方言为第一语言的人,由于语言环境和社会心理等多
方面因素的作用,听懂普通话比说‘通’普通话要容易得多。这一点与说汉语的人学习外国

语(特别是在故土学习外语)不一样。因此,普通话测试可以不列‘听’的专项测试。” 陈
章太认为“听力对母语水平测试不很重要,尤其是内地,广播、电视、电影绝大多数用普通
话播音,学校教学大多也用普通话,即使是偏僻地区,一般人听普通话的机会也比较多,聆

听普通话对内地多数人来说问题不太大,所以全国性普通话水平测试大纲没有这项内容。”
因此普通话水平测试不设听力题型既有学理的支撑,也是实践的选择。
(3)关于汉语拼音题型
在酝酿探索阶段,汉语拼音测试也是普通话水平测试惯常使用的题型之一,如云南省的
全省师范院校普通话统一考试(1982 年)、云南师范大学的“普通话标准化水平考试”
(1987
年),辽宁省语言文字工作委员会的《辽宁省教师汉语拼音及普通话等级考核方案(试行稿)》
(1988 年)等(详见本文第三章第二节)。


厉兵:《普通话测试可行性分析》
,《语文建设》1988 年第 4 期,第 16 页。

孙修章:《
“普通话水平测试标准”的研制与实践》, 《语言文字应用》1992 年第 1 期,第 20 页。

陈章太:《关于普通话水平测试的效度问题》
,《中国语文测试》 (香港)2002 年第 1 期,第 6 页。

厉兵:《普通话测试可行性分析》
,《语文建设》1988 年第 4 期,第 17 页。

陈章太:《关于普通话水平测试的效度问题》
,《中国语文测试》 (香港)2002 年第 1 期,第 6 页。
105
国家语委“普通话水平测试标准”课题组认为“普通话水平测试是为评定普通话等级而
设立的,测试中心是考查普通话口语水平。汉语拼音是学习普通话的重要工具,但不是学习
普通话的唯一途径,更不是普通话本身。汉语拼音阅读、书写能力与普通话水平不完全是一

回事,因此我们没有把汉语拼音考查列入测试项目。
” 以上观点是正确的,在测试酝酿探索
阶段,大量的应试对象是教师和师范生,测查汉语拼音是普遍的做法,也有提高教师专业素
质的现实需求。但是,普通话水平测试以促进普通话推广为根本目的,应试对象不仅是教育
系统的师生,还包括其他行业领域人员,汉语拼音题型对于通用型语言测试而言显然是不适
宜的。汉语拼音作为一种学习工具和作为一种测试中介工具具有不同的功用,采用汉语拼音
题型会影响测试的公平性和效度,因此普通话水平不涉及汉语拼音题型是正确的选择。
2.《测试大纲》题型讨论
新《测试大纲》规定,测试试卷由五个部分组成:读单音节字词、读多音节词语、选择
判断、朗读短文和命题说话,这五个组成部分也即五种题型。
(1)读单音节字词、读多音节词语、朗读短文题型
这三种题型都是以“读”有文字凭借题目的方式测查语音的题型,因此具有一定同质性,
有人对以上三个题型设立的独立性提出质疑。例如,佟乐泉认为“所有朗读部分的考察都有
测查基本发音水平的功能。换句话说,这三项朗读作业是前后迭加的关系,朗读单字要考察
的内容在朗读双音节词和文章时同样要考察;朗读双音节词要考察的内容在朗读文章时也还
要考察。结果,有些考察项在三种题型中重复测查,有些在两种题型中重复测查,而有些只
在一种题型中测查。既然我们相信在一种题型中测查的可靠性,那么我们是否还要对有些考

察项一而再、再而三地考察呢?”
就题型的类型而言,按照语言测试专家李筱菊的分类,读单音节字词、读多音节词语和

朗读短文三种题型均属于受限制性的产生型、直接型、主观型的题型。 但读单音节字词、
读多音节词语需要应试人把题目语言材料直接读出来,朗读短文需要对题目语言材料进行加
工然后输出,主观性高于读单音节字词和读多音节词语,效度相对较高。
就题型的考查目标而言,三种题型并不相同,各有侧重,这在《测试大纲》中有明确表
述。三种题型测查的语言单位由小到大,测查目的由简及繁,虽然朗读短文综合性最强,但
也并不能代替其他两项测试。读单音节字词,测试项名称即揭示了该题型以单独音节的声母、
韵母、声调的标准程度测查为主要目的,这种对静态备用音节的测查,排除了接邻音节或语
流中音变等因素的影响,因此其测查目的是读多音节词语和朗读短文题型难以实现的。读多
音节词语题型中的音节,不是孤立的音节,而是可以构成最小语言单位的音节的组合,对备
用状态的词语尤其是变调、轻声、儿化的测查都有特殊设计,这种测查读单音节字词、朗读
短文难以取代;朗读短文具有综合性,在测查音节和常见音变标准程度的同时,还要重点测


孙修章:《
“普通话水平测试标准”的研制与实践》,《语言文字应用》1992 年第 1 期,第 16 页。

佟乐泉:《不断提高普通话水平测试的科学水平》
,《语言文字应用》1997 年第 3 期,第 22 页。

李筱菊:《语言测试科学与艺术》
,湖南教育出版社 1997 年版,第 179 页。
106
查停连、语调以及流畅程度,这个测查任务读单音节字词和读多音节词语同样也无法完成。
三个测试题型的考点由离散到综合,并且与传统语文教育字、词、句、段、篇的学习序列相
配合,题型设计从形式到内容颇具巧思。
(2)选择判断题型
选择判断题型的目的在于测查应试人词汇、语法的规范程度,该题型又区分为三个小题
型:①词语判断,②量词、名词搭配,③语序或表达形式判断。该题型在普通话水平测试中
较为特殊,
《测试大纲》规定该题型为自主选测题型,
“各省(自治区、直辖市)语言文字工

作部门可以根据测试对象或本地区的实际情况,决定是否免测‘选择判断’测试项”, 并对
取消该题型后的分值处理进行了规定。
就题型类型而言,该题型提供备选答案,应试人可猜测作答,相对其他题型而言属于接
受型、间接型、客观型的题型。整体而言该题型效度有其局限,但对某些方言区应试人(如
香港、澳门应试人)而言,测试效度则比较理想。笔者利用赴香港、澳门实测的机会,对2014
年至2016年5个批次应试人选择判断失误(指选择判断出现的词汇、语法错误,不包括选择
判断出现的语音错误)进行了统计,详见表5–6:

图表 19 表 5–6 香港、澳门应试人“选择判断”题型错误抽样统计

测试机构 测试时间 测试人数(人) 选择判断失误人数(人) 错误比例

香港大学 2014.8 109 67 61.5%

香港公开大学 2015.10~2015.11 58 38 65.5%

澳门理工学院 2015.11 64 36 56.3%

香港大学 2016.3 68 37 54.4%

香港职业训练局 2016.3 59 45 76.3%

合 计 358 223 62.3%

如表5–6所示,所有测试机构的所有批次应试人“选择判断”出现失误的比例均高于50%,
最高的为香港职业训练局的应试人,失误比例达76.3%,该机构应试人参加测试前培训的比
例也较低,能够反映比较原始的普通话语言内化能力。表5–6说明“选择判断”题型对港澳
应试人的词汇、语法测查具有比较理想的区分度,可以较好地实现测试设计者的构念效度。
朱丽红《普通话水平测试免测“选择判断”项实证研究》对免测“选择判断”题型进行
了专门研究,与笔者观点一致,该文也认为“‘选择判断’项对某些特定人群来说仍有一定
的价值。香港地区的语言生活与内地不同,对多数香港应试人来说,这一项的保留在超考试


《普通话水平测试大纲》 ,详参教育部语言文字应用管理司编《新时期语言文字法规政策文件汇编》,语文
出版社 2005 年版,第 226 页。
107

效度层面能够提醒应试人在普通话学习过程中词汇语法规范程度仍是需要注意的问题。” 不
过,该文指出就全国范围而言,“由于五项测试与四项测试的分数和等级都存在统计学意义
上的显著差异,为保证普通话水平测试的公平性,应尽量避免五项测试与四项测试两种测试

模式同时存在。”
2011年,笔者承担了国家语委“十二五”科研规划委托课题“普通话水平测试体系研
究”项目。2015年10月,课题组就《测试大纲》和《实施纲要》修订问题,通过“问卷星”

在线调查系统进行了专项问卷调查, 本次调查共发放问卷1180份,回收有效问卷1180份,
调查对象覆盖全国32个省份,主要为国家级普通话水平测试员(221人)、省级普通话水平测
试员(818人)和测试管理人员(141人),其中关于“选择判断”题型是否保留的调查结果
详见表5–7:

图表 20 表 5–7 “选择判断”题型问卷调查统计

选 项 人数(人) 比例

需要保留,不需要调整 321 27.2%

需要保留,但需要改进 183 15.5%

不需要保留 676 57.3%

内地已无施测“选择判断”题型的省份,表 5–7 显示近 60%的调查对象认为应当去除


该测试题型,这种意见是顺理成章的。但我们注意到,仍有 42.7%的的调查对象建议保留此
题型,这个比例也并不算低,如果调查港澳地区测试员,这个比例预计还要高一些。我们认
为选择判断题型,带有一定的指向性和引导性,又具有一定的内容效度,加之该题型测试员
信度较高,《测试大纲》将此项设为选测项是有其考量的。该题型“选测”的处理属于“技
术性”调整,如何更好地设计值得继续深入研究。我们建议对不同区域的应试人考生采用两
种类型试卷:境内考生采用Ⅰ型卷,统一免测“选择判断”题型;境外考生采用Ⅱ型卷,保
留“选择判断”题型。
(3)命题说话题型
命题说话题型的目的是测查应试人在无文字凭借情况下说普通话的规范程度和熟练程
度,要求应试人在规定的两个话题中,任意选择一个并进行独立的、单向的话语输出。命题
说话虽然内容有一定限制,但话题自主选择,表达形式不受太多局限,应试人有较多自主空
间,因此属于表达性的主观类题型。


朱丽红: 《普通话水平测试免测“选择判断”项实证研究》,
《沈阳师范大学学报(社会科学版)》2014 年
第 2 期,第 115 页。

朱丽红: 《普通话水平测试免测“选择判断”项实证研究》,
《沈阳师范大学学报(社会科学版)》2014 年
第 2 期,第 115 页。

该调查的子课题负责人为王晖(本文作者),核心成员为陈茜、于谦、苏恒。
108

“说话是口试中难度较大的一项,是测试的主要项目。” 之所以说是“主要项目”,主
要是因为其综合性最强,能同时测查普通话的各个层次和各个因素的范畴,就语言构成要素
而言,不仅可以综合测查声、韵、调,以及语流中的音变、语调等语音要素,而且可以测查
读单音节字词、读多音节词语、朗读短文等题型无法测查的词汇、语法等要素;该题型综合
性还体现为它不仅能测查“语言形式系统自身静止的属性,”(按:指语言系统的准确性)


而且能测查语言形式系统“在运用中的属性”
(按:指语言系统运用的效率,即流利性)。 因
此,说话的题型是普通话水平测试效度最高的一个题型。之所以说该题型“难度较大”,是
因为该题型命题难度大、实施难度大、评分难度大,信度相对其他题型而言较低。
命题说话题型,在原《测试大纲》的命名是“说话”
。严格地说,“说话”是试题要求,
指向的是“考什么”,与题型(指向“怎么考”
)并不是完全相同的概念,实现“说话”的题
型可以有多种题型:①对话(谈话)题型(主试人与应试人对话),河北师范大学采用的“自
由谈话”题型与此类似,厉兵提出的方案则是“对话”题型;②“命题说话”题型(
“选题
说话”
),云南师范大学《普通话训练和标准化测试手册》采用的是“选题说话”
;③回答问
题题型,香港理工大学普通话水平考试(PSK)采用该题型;④看图说话题型,国家语委普
通话培训测试中心1999年“PSC评分标准对比实验课题组”曾采用此题型。对话(谈话)题
型,对测试员(主试人)要求很高,难以保证全体应试人在公平、一致的条件下实施测试,
大规模测试更是难以实现;回答问题题型,对所提问题的难度控制难以实现,对应试人的作
答状况也难以控制;看图说话题型,图片局限性较大,难度区分的把控是个难题。新《测试
大纲》将题型确定为“命题说话”是从信度、效度、操作性等方面多角度综合考量的选择。
当然从现代语言测试发展的趋势来讲,普通话水平测试的“命题说话”还缺乏语境、情景的
因素,题型的改进值得继续深入研究。
(二)测试长度
测试长度,即题量,指构成一份测试试题的数量,在教育测量领域一般称为“测试长度”

(或考试长度、测验长度)。一般认为“考试长度与考试信度成正比”, 测试长度越大,可
靠性越高,但研究也表明,测试长度并非越大越好,当达到一定信度、效度水平后,再增加
题目数量不仅意义不大,而且影响效率,甚至增加误差。测试长度设计,除了考虑测试质量
的需要,还要考虑测试成本和操作性的需求。任何测试都需要对测试长度做出合理设计,以
期用较少的题目和时间得到较高信度和效度的测试结果。
“语言测试有速度测试(speed tests)和力度测试(power tests)之分。前者提供超
量的试题,有意测量在规定时间内每人能完成的量。后者给的题量估计是规定时间内每人可

以完成的,旨在测量能力而不考虑速度。” 普通话水平测试的语言能力目标,以规范(标准)


孙修章:《
“普通话水平测试标准”的研制与实践》,
《语言文字应用》1992 年第 1 期,第 15 页。

李筱菊:《语言测试科学与艺术》
,湖南教育出版社 1997 年版,第 481 页。

谢小庆、李航:《关于HSK(初中等)长度适当性的研究》,
《语言教学与研究》1999年第1期,第45页。

李筱菊:《语言测试科学与艺术》
,湖南教育出版社 1997 年版,第 92 页。
109
程度为主,兼顾熟练程度的测查,但从每一题型的限时来看,超时极少发生,因此,普通话
水平测试基本属于力度测试,测试长度控制尤为关键。
1.读单音节字词、读多音节词语测试长度
在酝酿探索阶段,云南师范大学“普通话标准化水平考试” 设计的方案为读 100 个音
节;读 100 个词语(双音节,即 200 个音节)。国家语委“普通话水平测试标准”课题组设
计的方案是“读单字、读词语,题量各为 100 个音节”。
对于读单音节字词、读多音节词语的测试长度学术界也有不同看法。佟乐泉认为“在考
察字、词时是不是可以把单项题(指读单音节字词和读多音节词语题型)和复合题(按:指
朗读短文题型)看作一个整体,后面会测到的内容前面不必追求过多的数量,待尔后的题型
测完将同一考察项的成绩合并计算呢? 这样看起来,朗读100个单字和50个双音节词,数量
是不是可以降低一些?其实,即使没有重复测查的情况,朗读多少个单字才能测查出发音的

准确度也是值得研究的。” 杨志明、张雷运用多元概化理论(MGT)对普通话水平测试读单
音节字词、读多音节词语题型的信度进行了研究,该研究认为“就分测验1(按:即读单音
节字词)和2(按:即读双音节词语)来说,当评分者个数为3、试题数量都是28时,其测量
信度已经达到较高水准。所以,在有3个评分者的条件下,减少实际测试时的题数(100和104)

同样能够保证测量信度达到一定的质量标准。”
杨志明、张雷运用教育测量学理论研究普通话水平测试,建议把读单音节字词、读多音
节词语的测试长度减少至28个单音节和28个双音节词语,分别减少72%和73.1%,结论异乎寻
常,值得深思。其研究采用的是随机减少试题的方法,并未进行更细密的测试长度对比研究,
其研究文献也未见测试试卷及28个随机抽样的实例,应试人等级、测试员评分等数据也未报
告,所以仍有讨论空间。①试验用卷代表性问题。该研究注明“所用测验由国家语言文字工

作委员会编制,测量数据由香港中文大学普通话测试中心提供”, 但从设计方案“第2部分
包括104道试题,第3部分(按:指选择判断题型)包括20道试题”的表述推测,该试卷当为
实验用卷而非实测用卷,实测用卷这两个题型的测试长度分别为50道题和25道题。实验用卷
的字词选例、题目编排与实测用卷有所不同,可能影响研究结论,如果是经过均衡化处理的
试卷,这种影响则会更加明显。②测试员组配方式和评分方法。该研究“所有试卷均由相同

的3个国家级评分员评分,取3者之均数为每题的最后得分”, 普通话水平测试现行模式为
两位测试员独立评分,如在同一等级,两人平均分为最后得分;两人如有分歧可协商,如有
必要请第三位测试员评分,在同一等级的两位测试员的平均分为最后得分。测试员组配方式、
评分方法差异对题量效度分析的影响值得重视。③应试人等级因素。该实验研究对象为40
名香港人,等级分布不详,但对象来源较为单一,按常态分布推测,应试人成绩应当以三级


佟乐泉:《不断提高普通话水平测试的科学水平》
,《语言文字应用》1997 年第 3 期,第 22 页。

杨志明、张雷:《用多元概化理论对普通话的测试》,《心理学报》2002 年第 1 期,第 54 页。

杨志明、张雷:《用多元概化理论对普通话的测试》,《心理学报》2002 年第 1 期,第 50 页。

杨志明、张雷:《用多元概化理论对普通话的测试》,《心理学报》2002 年第 1 期,第 51 页。
110
甲等及其以下最为集中(香港中文大学普通话教育研究及发展中心“普通话水平测试统计
(1998年11月至2006年11月)”数据显示,测试等级三级甲等、三级乙等和不入级的比例高

达64.4%。 )抽样对象等级的局限性对研究有较大影响,小题量对测试等级较低的应试人可
能测试信度、效度较高,但对于高级别,特别是一级水平的应试人,小题量的测试信度、效
度会受到挑战,因为“问题不仅仅是确定用多少试题和评分者那么简单。例如,测验是用来
评估电视或广播播音员,则由于被试的能力非常接近,需要区分度好高精确度(即高信度)

的测验。”
我们认为,测试长度应当充分综合普通话水平测试测查要素要求、题目质量(信度、效
度、难度、区分度)要求、操作性要求(如评分方式)和经济性要求,超考试效度也是一个
不容忽视的因素。就读单音节字词而言,该题型以测查应试人孤立音节声母、韵母、声调读
音的标准程度为目的,我们需要首先进行详细的测查要素分析方可有效控制测试长度,较好
地实现测查目的。普通话语音系统有22个声母(含零声母)、39个韵母,从抽样统计的角度
看,测100个单音节字词,可以保证每个声母平均测查不少于3次,每个韵母测查平均不少于
2次,基本能够满足抽样的最低需求。如果测试长度为50题,则普通话的所有声母最多出现2
次、韵母则只能出现1次,再加上测试员评分随机因素,测试的信度、效度很容易受到影响。
云南省普通话培训测试中心承担的国家语委科研项目“普通话水平测试题库系统的改进与提
高”(项目编号99002)对普通话水平测试各题型的测试长度进行了实验,其对比实验表明,

测100个单音节字词的α信度系数为0.912,高于测50题的0.906。 应该说该研究样本测50
题,信度指标也还不错,但“尽管100字的经济性比50字差一些,综合科学性、可操作性和

经济性来看,考100字仍是单字测试量的最佳模式。” 这还只是孤立地着眼于音位层面,如
果考虑到普通话声韵结合构成的400个左右的基本音节,题量如果仅为50题,试卷只占音节
总量的1/8,应该说题量偏小。
就读多音节词语而言,该题型除测查声韵调读音的标准程度,还要测查变调、轻声、儿
化,测查要素比单音节字词更为综合和复杂。一方面在音节测查要素层面,既要满足与读单
音节字词同样的声韵调抽样要求,又要与读单音节字词题型音节形成互补(即多音节词语题
型与单音节字词题型的音节,除了er、uenɡ两个音节,需选择完全不同的音节)
;另外还要
满足变调、轻声、儿化等音变系统的测查要求。香港中文大学和云南师范大学的张雷、侯杰
泰、王渝光等用概化理论对词语部分测试长度及测试员对信度的影响进行了实验研究,实验
结果得出相关数据如表5–8:


宋欣桥主编:《香港普通话测试研究与发展》 ,商务印书馆(香港)有限公司 2007 年版,第 48 页。

张雷、侯杰泰、何伟杰、文剑冰、王渝光:《普通话测试的录音评分可行性、信度及经济效率》 ,《心理学
报》2001 年第 2 期,第 101~102 页。

云南省普通话培训测试中心“普通话水平测试题库系统的改进与提高”课题组:《普通话水平测试题库系
统的改进与提高实验研究报告》 (未刊)2001 年,第 49 页。

云南省普通话培训测试中心“普通话水平测试题库系统的改进与提高”课题组:《普通话水平测试题库系
统的改进与提高实验研究报告》 (未刊)2001 年,第 56 页。
111
图表 21 表 5–8 常模参照和标准参照测验的误差及信度估计值

(资料来源:张雷、侯杰泰、何伟杰、文剑冰、王渝光:
《普通话测试的录音评分可行性、信度及经济效率》,

《心理学报》2001年第2期,第101页。)

从表5–8可知,选择2人评判,50题100音节的测试长度(按:该实验依据原《测试大纲》

题型为读双音节词语,50题即为100个音节)可能是普通话水平测试的最低信度要求(0.778)

应当指出的是,该实验采取的是录音测试样本,存在一定信噪比,面测模式的信度应当略高
于报告数据。综合科学性、可操作性和经济性诸因素,我们认为就全国范围而言,读多音节
题型100个音节的测试长度是较恰当的选择。
2.朗读短文测试长度
在酝酿探索阶段,不同测试方案对朗读短文题型的测试长度有不同的设计。测试长度较
小的是河北师范大学设计的方案,为150个音节;测试长度较大的是国家语委“普通话水平
测试标准”课题组提出的方案,为500个音节;云南师范大学“普通话标准化水平考试”设
计的方案为300个音节。国家语委在2004年新《测试大纲》实施前,曾在香港采用过“1+1”
的模式,朗读短文考核1篇规定篇目,再加1篇临场篇目,每篇各300个音节,音节总量为600
个音节。
112
朗读短文属于考核综合能力的题型,在测查声韵调标准程度的同时,重点测试连读音变、
停连、语调以及流畅程度,以力度测试为主要目标,兼具速度测试功能。测查要素的综合性
要求朗读短文题型的测试长度不宜过小,考虑到读单音节字词、读多音节词语已测查200个
左右(198个)不同的音节,最理想的状态是普通话的剩余200余个基本音节在朗读短文中大
部分可以测查到。另外一个设计因素是测试时间,根据正常语速测算,2~3分钟能够结束最

为理想,据研究“普通话(朗读)的正常语速大约每分钟240个音节左右”, 当然考虑到篇
章内容、基调不同的因素,再加上考试场合和特殊情况因素等原因,200个/分钟左右的音节
设计是较为恰当的。因此综合科学性、可操作性和经济性诸因素,《测试大纲》最终确定的
朗读短文测试长度为400个音节。
朗读短文的篇数也是一个值得探讨的问题。云南省普通话培训测试中心“普通话水平测
试题库系统的改进与提高”课题组对1篇模式(朗读1篇规定篇目300音节)和“1+1”模式(朗
读1篇规定篇目300音节+1篇临场篇目300音节)进行了对比,实验表明“1+1”模式信度系数

为0.933,1篇模式信度系数为0.912, 信度有所提高,不过差别并不显著。综合考虑各个题
型测试长度的均衡和测试的科学性、经济性、可操作性问题,从操作层面上讲,新《测试大
纲》考1篇的设计更经济,操作性更强。
以上实验,其实主要反映测试长度(300 个音节和 600 个音节)差异带来的的信度差异。
那么朗读短文考 1 篇还是考 2 篇,仍有深入讨论的必要,这个问题已不仅仅是测试长度问题,
还涉及到测试方式问题。
目前新《测试大纲》规定 60 篇朗读篇目为测试范围,题目是封闭的,可供应试人学习
和备考。朗读篇目是改进学习者语音面貌,培养语感,提高语言表达能力的有效训练材料,
设置规定篇目,可以有效发挥测试对普通话培训和教学的反拨作用,调动应试人普通话学习
的积极性。考核临场朗读篇目,可以获取相对真实的抽样表征,更加有效地测查应试人用普
通话朗读书面作品的内化能力,从教育测量数据的角度来看,效度更为理想。其缺点是测试
的反拨作用受到抑制。
我们建议兼取两种测试的长处,控制各自不利因素,提出以下改进方案:朗读短文测试
设定为2篇(400个音节)
,1篇规定篇目(200个音节),1篇临场篇目(200个音节)。
3.命题说话测试长度
命题说话是综合性最强的题型,效度高,实施难度大。命题说话测试长度需要讨论两个
问题,一是话题时间,二是话题数量。
命题说话话题时间,云南师范大学“普通话标准化水平考试” 设计的方案为说话3分钟,
河北师范大学设计的方案为自由谈话不少于2分钟;话题时间较长的是国家语委“普通话水


宋欣桥:《普通话水平测试评分中的几个问题》 ,宋欣桥编《普通话水平测试员实用手册(增订本)
》,商务
印书馆 2004 年版,第 217 页。

云南省普通话培训测试中心“普通话水平测试题库系统的改进与提高”课题组:《普通话水平测试题库系
统的改进与提高实验研究报告》 (未刊)2001 年,第 56 页。
113
平测试标准”课题组提出的方案,为5分钟;原《测试大纲》规定是4分钟(不得少于3分钟)

新《测试大纲》规定是3分钟。说话是典型的产出型题型,在可行性允许的情况下,话语输
出量越多效度越高。话题时间首先要满足语言样本抽样的需求,我们以200音节/分钟计算,
结合普通话400个左右基本音节数量,说话话题不宜少于2分钟,考虑到口语表达常见的冗余、
重复、衔接、连贯等方面因素,3分钟左右较为适宜。
命题说话话题数量目前采用的是1个话题,有专家对此提出讨论。佟乐泉认为“从受试
来讲,要根据一个被动选择的话题连续说三分钟的独白,恐怕不完全是普通话使用能力起作
用。……能不能考虑让受试者在3分钟内说两个话题,这样可以使有些受试者避免同一话题
说得时间过长没话找话的尴尬,又能在较广阔的范围内了解受试者普通话的实际水平,是否

不无小补?” 我们认同以上观点,单向说话3分钟,并非日常说话的典型模式和典型长度,
因此也不能说是应试人普通话水平典型的抽样样本,目前题型模式和测试长度是科学性、可
操作性、经济性综合考虑的结果,但是有改进的空间。
另外需要特别考虑的是命题说话由封闭性的30个话题构成,本旨是引导应试人练习,但
就测试实践而言,话题内容雷同已非个例,特别是计算机辅助测试开展以来,因缺乏测试员
临场引导和干预,此弊端日益凸显,在“考辅产业”发达的今天,各种话题的“范本”很容
易找到,说话题型日渐蜕变为“背话”
,单向命题说话的局限性日益显现,测试信度和效度
受到影响。虽然测试管理者通过调整评分标准等手段加以指引,但终究非根本之策。
我们认为,可以尝试通过调整题量的方式对说话题型加以改善。具体建议为:说话题型
话题数量改为“1+1”模式,1个为指定话题,1个为现场话题。将新《测试大纲》规定话题
调整完善后作为第一个话题的命题范围,再加上现场抽取的第二个话题,共同构成完整的说
话测试题。在命题方式上,第二个话题可借鉴香港理工大学普通话水平考试(PSK)的说话
项,设计交际情景和任务,使说话更加接近真实语境,交际能力的三个范畴(语言能力、语
篇能力、语用能力)都能得到更有效的测查,同时有效避免背稿的现象。“1+1”的设计有利
于兼顾测试中语言运用真实性和测试的反拨作用,使测试的说话题型在保持自身特色的同时,
更加符合现代语言测试的发展方向。综合考虑测试科学性、经济性和可操作性,说话的测试
时间建议保持3分钟,两个话题各1分30秒。
(三)覆盖与分布
普通话水平测试本质上是通过对应试人输出的普通话要素的有效抽样,推论其内化的普
通话能力,命题中测查要素的合理覆盖和分布是有效抽样的前提。普通话水平测试命题要考
虑三方面的覆盖问题:语言要素全覆盖、语音要素均衡覆盖、词语和字种覆盖。
1.语言要素全覆盖

新《测试大纲》规定:“普通话水平测试的内容包括普通话语音、词汇和语法。” 也就


佟乐泉:《不断提高普通话水平测试的科学水平》 ,《语言文字应用》1997 年第 3 期,第 22 页。

《普通话水平测试大纲》 ,详参教育部语言文字应用管理司编《新时期语言文字法规政策文件汇编》,语文
出版社 2005 年版,第 223 页。
114
是说,该测试是普通话语音、词汇、语法的“全要素”测试,绝非仅仅是语音测试,因此其
命题应涵盖三个要素。从题型设计来看,普通话水平测试读单音节字词、读多音节词语、朗
读短文基本上是语音要素的测试,当然也涉及内化的词汇、语法能力(以熟练程度、停连等
语言表征体现)
;选择判断题型以词汇、语法为主要测试要素,兼测语音要素;命题说话题
型综合测查语音、词汇、语法三要素。这样,依托命题结构的总体框架,普通话水平测试试
题通过不同题型设计实现了语音、词汇、语法的“全要素”覆盖。
2.语音要素均衡覆盖分布
普通话水平测试语音测查全面而细致,对语音要素的覆盖有专门的规定。命题说话语料
输出自主性强、随意性大,难以对语音要素覆盖提出明确要求;朗读短文是自然语料,对语
音要素覆盖可以有大体的要求,但做到均衡覆盖有一定困难。因此,测试的语音要素覆盖主
要通过读单音节字词、读多音节词语来实现,朗读短文对语音要素覆盖起补充作用。
新《测试大纲》对读单音节字词和读多音节词语的声、韵、调覆盖以及读多音节词语上
声变调、轻声、儿化出现次数都有明确规定。读单音节字词题型要求:“100 个音节中,每
个声母出现次数一般不少于 3 次,每个韵母出现次数一般不少于 2 次,4 个声调出现次数大
致均衡。”读多音节词语题型要求:
“声母、韵母、声调出现次数与读单音节字词的要求相同。”
同时要求:“上声与上声相连的词语不少于 3 个,上声与非上声相连的词语不少于 4 个,轻

声不少于 3 个,儿化不少于 4 个(应为不同的儿化韵母)
。”
《实施纲要》在“总论”部分对声母、韵母覆盖分布有延伸性规定,我们综合规整,以
表 5-9、表 5-10 显示如下:

图表 22 表 5–9 读单音节字词题型声母应出现的频率

出现频率(次) 声 母

3~6 (零声母), d, l, j, q, x, zh, ch, sh

3~5 b, m, f, t, ɡ, h, z

2~3 p, n, k, r, c, s

图表 23 表 5–10 读单音节字词题型韵母应出现的频率

出现频率(次) 韵 母
i, u, iɑn, inɡ, ɑn,-i(舌尖后元音), onɡ, ɑo, ɑnɡ, e,
3~4
enɡ, uei, ɑi
en, iɑo, uɑn, in, ou, ɑ, ü, uo,-i(舌尖前元音), uen,
2~3
iou, ie ,iɑnɡ, ei, uɑnɡ, iɑ, üe
1~2 uɑ, o, üɑn, uɑi,ionɡ, ün

0~1 er, uenɡ


《普通话水平测试大纲》 ,详参教育部语言文字应用管理司编《新时期语言文字法规政策文件汇编》,语文
出版社 2005 年版,第 224 页。
115
(注:韵母 ê[ε]除语气词“欸”外单独使用的机会不多,只出现在复韵母 ie、üe 中,ê[ε]相当于

已在这两个复韵母中考察过了,故此表中共列 38 个韵母。以上两表根据国家语言文字工作委员会普通话培

训测试中心编制《普通话水平测试实施纲要》
(商务印书馆 2004 年版,第 2~3 页)整理。)

《实施纲要》的延伸性规定是对《测试大纲》的操作性细化,是基于《实施纲要》词语
表累计出现的 3.1 万多个音节声韵调出现频率划分的,希望为测试命题提供实际语料统计依
据,为建设题库提出操作性指标。但我们认为据此操作有超出《测试大纲》规定之嫌,在题
库建设时,实际严格按照《测试大纲》规定的覆盖指标执行,声调更是严格按照每个调类出
现 25 次编制入库。
学术界对声母、韵母、声调均衡覆盖存在不同观点,一些学者认为试卷对覆盖率的要求

“应该接近现代汉语使用客观的语言概率。
” 这种观点孤立地看,有其合理性,但应当看到,
普通话水平测试实际上是一种经过设计的语言抽样片段,与纯粹的客观语言并不完全等同。
朗读短文和命题说话测试是基于自然语料的测试题型,不易实现对语料的控制,这种限制在
命题说话题型尤为突出。加大现有题型的测试长度是解决上述问题的一个途径,但需付出增
加测试成本的代价。备用状态的声韵调,甚至变调、轻声、儿化等测查要素,可通过读单音
节字词、读多音节词语两个题型较容易地实现均衡控制,并可与朗读短文、命题说话的自然
语料形成有效互补。为了更清楚地说明问题,我们通过表 5–11、表 5–12、表 5–13 分析:

图表 24 表 5–11 汉语普通话声母的出现频率比例 Pr(%)表

声母 b p m f d t n l ɡ k h

Pr 5.15 0.98 3.74 2.45 12.00 3.53 2.53 5.69 5.50 1.83 4.42

声母 j q x zh ch sh r z c s 零声母

Pr 6.98 3.11 4.86 7.18 2.75 7.66 1.94 3.01 1.15 1.08 12.45

图表 25 表 5–12 汉语普通话韵母的出现频率比例 Pf(%)表

韵母 ɑ o e i u ü -i er ê ɑi ei ɑo ou

Pf 3.89 0.54 12.38 8.80 7.11 1.80 6.41 0.28 0 2.83 1.28 3.10 1.18

韵母 iɑ ie iɑo iu uɑ uo uɑi ui üe ɑn en ɑnɡ enɡ

Pf 1.09 2.42 2.06 2.60 0.44 4.40 0.32 2.75 1.01 3.41 3.62 2.87 3.09

韵母 onɡ iɑn in iɑnɡ inɡ ionɡ uɑn un uɑnɡ uenɡ üɑn ün

Pf 4.18 4.10 1.95 1.80 3.05 0.42 1.24 0.8 0.65 0.003 0.85 0.52


王渝光、杨瑞鲲、李洪平:《语言信息处理与普通话水平测试》
,云南大学出版社,2010 年版,第 27 页。
116
图表 26 表 5–13 汉语声调的出现频率比例表

调类 第一声 第二声 第三声 第四声 轻声

出现频率(%) 18.71 19.37 17.51 35.79 8.63

(资料来源:马大猷、沈山豪:《声学手册》
(修订版)
,2004 年版。转引自王渝光、杨瑞鲲、李洪平:

《语言信息处理与普通话水平测试》
,云南大学出版社,2010 年版,第 21~22 页。)

由表 5–11、表 5–12、表 5–13 可知,在普通话自然语言声、韵、调三个要素中,出


现频率差异最小的是声调,其次是声母,最大的是韵母。以频率差异最小的声调覆盖分布设
计为例,若不统计轻声,频率最高的去声(35.79%)是频率最低的上声(17.51%)的 2.04
倍,如完全按自然语言分布比例设计试题,上声在读单音节字词题型出现 17 次左右,而去
声则出现 35 次左右。再加上朗读短文和命题说话的自然分布,对上声的测查势必大大缺乏,
尤其是“全上”在语流中很少出现,如果不在读单音节题型中保证其出现频率,其测查抽样
严重不足,相较而言,上声、去声各出现 25 次左右显然是更为合理的覆盖分布设计。
如完全按自然语言分布比例设计声母、韵母在试卷中的覆盖分布,其不合理性就更为突
出。出现频率最高的声母 d(12.00%),是出现频率最低的声母 p(0.98%)的 12.25 倍;出
现频率最高的韵母 e(12.38%),是出现频率最低的韵母 uenɡ(0.003%)的 4126.67 倍;如
不经特别设计,在 3.3 万个音节的语料中才可能出现一次 uenɡ音节,这需要极大的测试长
度方可实现,因此是不可行的。国家题库制卷要求出现频率最低的 er、uenɡ两个韵母,在
读单音节字词、读多音节词语两个题型中分别出现 1 次的办法,显然是有效控制抽样的可行
方案。因此,我们主张用系统和整体的眼光看待语音覆盖与分布,参考语言学频度统计,对
试卷中声母、韵母覆盖进行适当的分级要求,但不完全拘泥于数据,这才是更为可取的态度。
3.词语和字种覆盖分布
(1)词语覆盖分布
普通话水平测试对读单音节字词、读多音节词语题型的词语覆盖提出了明确要求。《测
试大纲》规定两个测试项中的字词和词语“70%选自《普通话水平测试用普通话词语表》
‘表

一’,30%选自‘表二’。” 这种规定是为了实现对试卷命题难度的有效控制,但“表一”收
词量(6595条)远少于“表二”收词量(10460条),7:3的比例容易导致字词重现率偏高,
“表一”“表二”6:4的比例或许有利于解决这个问题,但需要题库统计的数据支持。
(2)字种覆盖分布
普通话水平测试是语言测试,文字并非测试目标,但除命题说话题型以外,测试实施均


《普通话水平测试大纲》 ,详参教育部语言文字应用管理司编《新时期语言文字法规政策文件汇编》,语文
出版社 2005 年版,第 224 页。
117
依托文字馈入题目,字种覆盖对试卷难度有直接的影响,因此普通话水平测试命题对字种覆
盖做出要求是题中应有之意。
①读单音节字词、读多音节词语的字种覆盖分布
语言学界对现代汉语常用字及通用字进行了大量计量和概率统计研究,为普通话水平测
试有文字凭借题型命题提供了很好的基础。1988 年国家语委公布了《现代汉语常用字表》,
收常用字 3500 个,其中一级常用字 2500 个,二级常用字 1000 个,该字表在我国语文教学、
推广普通话、辞书编纂及其他社会应用领域发挥了重要作用。有人主张以该表为普通话水平
测试读单音节字词的依据,课题组未采纳这种建议,因为“字”和“词”是不同的概念,
“词”
属语言范畴,“字”属文字范畴,常用词未必都使用常用字,如“禅宗”“忏悔”
“猖獗”作
为词都较为常用,并收入普通话水平测试“词语表”
,但就字而言,“禅”“忏”“猖”
“獗”
均非常用字。
普通话水平测试读单音节字词、读多音节词语的字种覆盖通过以“词”带“字”的方式
实现。测试所用“词语表”是以国家语委现代汉语语料库和《现代汉语词典》(1996 年版)
为基础编制的,国家语委现代汉语语料库也是《通用规范汉字表》
(含 3500 常用字)的基础
语料库,这可以保证测试“词语表”与 3500 常用字有共同的语料来源基础,不会有很大差
异,而“词语表”的“词语”属性,与语言测试的“语言”测试目标相契合。为了命题方便,
《实施纲要》在“词语表”后增加了“[表一][表二]用字统计”
,为试题命制提供便利条件。
②朗读短文字种覆盖分布
朗读短文题型来自真实语料,字种的科学覆盖是实现试卷难度、信度和效度控制的基础
性因素之一。《实施纲要》未对朗读作品全字种覆盖量进行规定,但《实施纲要》朗读作品
选编课题组对朗读入选篇目常用字的字种进行了规定,“终选作品要求所使用的汉字,一般
控制在3500个常用字范围内的用字数为170个以上,170 个字以下的视为偏易。在3500个常
用字至7000个通用字范围内的用字数在10个以下,10个以上视为偏难(不采用)。在7000通用
字表以外的字,所选作品中应该不出现,有这样字的应该调整用字(但有个别篇目因为作者

坚持而未作调整)。”
我们认为,对朗读作品全字种覆盖量进行规定是有必要的。据王渝光等统计,原《测试

大纲》朗读作品平均字种覆盖量为212个,最大覆盖量为266个,最小覆盖量为153个; 《实
施纲要》朗读作品平均字种覆盖量为203个,最大覆盖量为242个,最小覆盖量为167个。与
原《测试大纲》相比,《实施纲要》朗读作品字种覆盖更为均衡,科学性有所提高。当然,
就单篇而言,最大覆盖量和最小覆盖量的作品字种相差75个,差别还是偏大。根据笔者对《实
施纲要》朗读作品字种覆盖的统计,60篇作品中字种220个以上的有9篇,字种180个以下的


《纲要》朗读作品选编课题组(刘彦执笔) :
《关于普通话水平测试用“朗读作品”的分析报告》, 《语言文
字应用》2004 年第 3 期,第 22 页。

王渝光、陈典红、杨万兵:《普通话水平测试题库建设的理论与实践》 ,《语言文字应用》1997 年第 3 期,
第 26 页。
118
有9篇,综合考量字种以外的测查要素,如音节要素分布,音变要素,词汇语法分布及规范
要素以及文章思想性、艺术性等等因素,我们建议朗读作品(400字)字种覆盖200个左右为
宜,允许±20个,即以180个~220个为限。
以上分析是就单篇作品而言,我们还需要对朗读作品整体进行覆盖研究。有学者对《实
施纲要》60篇朗读作品的字种进行了计量统计,不重复字种总量为2156个,有1842个字为一
级常用字(2500字范围内)
,216字为二级常用字(1000字范围内)
,《实施纲要》朗读作品用

字中常用字占比达95.4%, 《实施纲要》朗读作品字种覆盖分布的科学性总体上值得称道。
(四)分值比重
分值比重也是命题设计的一个重要方面,测试的目标、性质和信度、效度往往体现在各
题型的分值比重上,而且分值比重设计还通过测试反拨效应影响到普通话教学和学习。
1.语音、词汇和语法分值比重
《测试大纲》规定测试内容包括语音、词汇和语法,但这并不意味着语言构成三要素在
普通话水平测试中分值比重“鼎足为三”。在酝酿探索阶段的测试方案中,大部分设计者就
把语音作为最重要的测查要素。厉兵设计的方案“测试的重点放在普通话语音面貌上(内容

和分数比重占 60%)
,其次是词汇(比重占 25%)”, 语法占 10%,其他(语调、停顿、变调、
轻声、儿化、逻辑重音、节奏)占 5%。该方案“语音面貌”仅指狭义的“声韵调”
,即普通
话音节层面的内容,
“其他”大多也可涵盖在广义的“语音面貌”范畴,因此着眼于广义的
语音范畴,该方案语音、词汇和语法的比重可理解为语音 65%,词汇 25%,语法 10%。国家
语委“普通话水平测试标准”课题组设计的方案有口试和笔试两部分,口试占 80%,以语音
为主,有少量词汇语法考查(说话题型);笔试占 20%,集中考查普通话词语和语法,再加

上说话题型中词语、语法部分,“语音、词汇、语法,大体是 7:2:1”。
原《测试大纲》主要通过“选择判断”题型专门测查词语和语法,分值比重为 10%,并
通过“说话”题型辅助测查词语和语法,分值比重为 5%,词汇语法的总比重为 15%。
《实施
纲要》维持原《测试大纲》比例,即语音分值比重占 85%,词语和语法分值比重占 15%;免
测“选择判断”项后,语音分值比重进一步加大,达到 90%,词语和语法分值比重减少为 10%。
从分值比重来看,语音是普通话水平测试的首要测查要素,不仅分值高,而且语音测试
贯穿测试始终,每一题型都有语音要素的测查,即使以词汇语法为主要测查目的的选择判断
题型,语音要素失误也占有一定扣分分值。在总的思路上,普通话水平测试侧重语音的测查
有其合理之处。在三要素中,语音系统是物质外壳,是最容易感知的和方言区的学习者最感
困难的部分;词汇系统和语法系统是语言的意义系统,汉语方言与普通话之间的词汇语法虽
然从研究的角度看差异也不小,但从感知的角度看不像语音系统那样直接和敏感。从学习过


陈小燕、刘慧:
《“普通话水平测试用朗读作品”字种数及音节覆盖率的计量研究》 ,
《广西师范大学学报(哲
学社会科学版)》2012 年第 4 期,第 118 页。

厉兵:《普通话测试可行性分析》 ,《语文建设》1988 年第 4 期,第 19 页。

孙修章:《
“普通话水平测试标准”的研制与实践》, 《语言文字应用》1992 年第 1 期,第 15 页。
119
程来讲,学习者词语语法的“化石化”程度(板结程度)远不像语音那样普遍和严重。从命
题的角度看,在以口试方式进行的语言测试中,语音系统比较容易命制试题,而词汇和语法
题目的命制难度则大很多。因此普通话水平测试把语音当作首要测查要素是有道理的。但诚
如佟乐泉所言:
“从整体来看,语音所占比重较大,与词语和语法部分似乎不够协调。……
这三个要素的比例应当怎样掌握,值得研究,并且应当把这个研究成果用到普通话水平测试

上。”
2.各题型分值比重
普通话水平测试的题型整体上可分为两大类:有文字凭借题型和无文字凭借题型,有文
字凭借题型以“读”为输出形式,包括读单音节字词、读多音节词语、选择判断(选测项)

朗读短文等 4 个测试项目,无文字凭借题型以“说”为输出形式,具体测试项目为命题说话。
各题型分值比重的分歧主要在于有文字凭借和无文字凭借两大类属方面。原《测试大纲》二
者分值比例为 7:3,现《测试大纲》仍为 7:3,免测选择判断测试项后比例为 6:4。
有学者提出不同看法:“现行的普通话水平测试,70%是读( 第一题、第二题、第三题、

第四题),30%是说( 第五题),有文字凭借的部分比重过大,口语测试内容比重过小。”
作者所提建议中虽未明确两类题型的具体分值比例,但从其“我们的测试要突出说话部分的

地位,以说话来定性” 的表述和“我们不妨设想总体测试时间为10 分钟。其中说话6分钟;
朗读4分钟(实际上用不了4 分钟)”的建议方案,以及增加说话具体题型(扩充为单向说话3
分钟、双向说话3分钟两种题型)并增加逻辑及交际性评分要素的设想,我们可判断其预想
的方案,有无文字凭借的比重应为70%左右,甚至更高。
无文字凭借题型分值比重问题的讨论并非新的议题,国家语委“普通话水平测试标准”
课题组设计的方案有口试和笔试两部分,其口试部分的比例为“说话50%,读文章25%,读词

语15%。读单字10%”
, 无文字凭借题型分值比重为50%。《测试大纲》修订时也曾讨论过增
加无文字凭借题型分值比重的问题,对比50%与原《测试大纲》30%的优劣。宋欣桥建议“有
文字凭借部分维持60%或70%”
,并主张“应该维持相当一段时间”
,其理由是“可以促进应试
者打好普通话的基础,使其凭借有文字依托的部分为过渡,达到提高普通话口语水平的目的,

这有利于普通话的普及与提高。” 新《测试大纲》最终维持了无文字凭借题型分值比重占30%
的格局,但基于全国境内各省份免测选择判断测试项的事实,其分值比重实质调整为40%。


佟乐泉:《不断提高普通话水平测试的科学水平》 ,《语言文字应用》1997 年第 3 期,第 21~22 页。

许光烈《试论普通话水平测试的现存问题及对策》, 《广州大学学报(社会科学版)》 ,2003 年第 8 期,第
25 页。

许光烈《试论普通话水平测试的现存问题及对策》, 《广州大学学报(社会科学版)》 ,2003 年第 8 期,第
26 页。

孙修章:《 “普通话水平测试标准”的研制与实践》, 《语言文字应用》1992 年第 1 期,第 15 页。

“无文字凭借的部分(即说话项)的比例现阶段控制在 40%以内为宜。现行大纲规定的比例是 70:30,也
可以去掉原设计的‘选择判断项’后调整为 60:40。这两种比例应该维持相当一段时间。这是因为,这种
有文字凭借部分维持 60%或 70%的情况,可以促进应试者打好普通话的基础,使其凭借有文字依托的部分为
过渡,达到提高普通话口语水平的目的,这有利于普通话的普及与提高。 ”宋欣桥《试论普通话水平测试
(PSC)》,国家语言文字工作委员会普通话培训测试中心编《首届全国普通话水平测试学术研讨会论文集》,
语文出版社 2003 年版,第 7 页。
120
(五)试卷编制和题库建设
语言测试作为测试工具最终的体现形式是试卷,试卷是测试实施最直接的依凭,是测试
研发者、应试人、测试员的有形中介。试卷编制一般要经过选材、命题、审题、拼卷等技术
环节,计算机技术在大规模语言测试试卷编制中发挥着日益重要的作用。普通话水平测试试
卷编制经历了分散编制和建设全国性统一题库的发展历程。
1.原《测试大纲》时期的分散编制
在 2004 年新《测试大纲》实施前,测试试卷一直采用分散编制的模式,由省级测试机
构各自命题。虽然各省命题人遵循原《测试大纲》要求编制试卷,质量有一定保证,但试卷
编制效率不高,在测查要素均衡性、覆盖率,试卷规范度、通用性等方面也都不可避免存在
一些不足。为了克服以上缺点,云南省、上海市、湖北省等采用了统一命题的方式,使试题
质量有所提高。这些较高质量的试卷逐步汇集为各自省(市)域内的统一试卷库,为统计、
分析试卷数据提供了基础性资料,为全国性题库建设进行了先期探索。但就全国范围看,这
些探索还仅限于局部,远不能适应大规模国家级测试的需求。
2.新《测试大纲》时期的国家题库建设
(1)概况
题库是 20 世纪 70 年代教育测量领域的一项重要成果,并广泛应用于大规模语言测试。
普通话水平测试题库的专门研究和建设起步较晚,随着测试工作的快速发展,原有的人工为
主的命题方式已难以满足测试实践需求,在借鉴地方题库建设经验的基础上,研发符合新《测
试大纲》要求的国家题库成为迫切的课题。2002 年“普通话水平测试国家题库建设”课题
立项, 2004 年 9 月通过了教育部语用司和语信司组织的成果鉴定,为顺利实施新《测试大
纲》发挥了积极作用。
(2)题库的系统架构
普通话水平测试题库系统架构如图5–3所示:

图表 27 图 5–3 普通话水平测试题库系统架构图
(资料来源:PSC 国家题库建设课题组:《普通话水平测试国家题库制卷系统研制报告》,

《语言文字应用》2005年第2期,第65页。有修改。)
121
如图5–3所示,题库系统由4个子系统构成:控制系统、题库资料系统、制卷系统、试
卷查询输出系统。控制系统执行对整个系统的管理职能,实现对题库操作系统、程序系统、
数据库系统、自诊断系统的安全、日常维护,并对用户权限设置进行可靠的管控。题库资料
系统是整个系统的基础素材资料库,储存了《实施纲要》的全部内容,制卷系统所需的测查
元素全部来自与此。制卷系统执行试卷自动生成职能,是题库系统的核心子系统,按照《测
试大纲》规则,基于题库资料系统所提供的测查要素,自动拟制符合各项参数指标的标准试
卷,并最终汇集为测试试卷库。试卷查询输出系统执行试卷输出、查询及相关属性统计的功

能,是整个题库系统的终端部分和质量报告子系统。
(3)题库试卷主要参数
普通话水平测试题库对所拟制的试卷都提出了一定的参数,这些参数的设定对于保证试
卷等值和测试的公平性、可靠性具有重要作用。题库试卷主要参数包括以下内容:
参数①音节数:规定各题型所包含的音节数量。读单音节字词 100 个音节、读多音节词
语 100 个音节,朗读短文 400 个音节。
参数②字和词语分布:规定读单音节字词、读多音节词语两个题型所包含的字和词语分
布比例。以上两个题型中,70%为《词语表》[表一]字词,30%为[表二]字词。
参数③音节要素覆盖:规定读单音节字词、读多音节词语两个题型声、韵、调的覆盖。
以上两个题型中,每个声母出现次数不少于 3 次,每个韵母出现次数不少于 2 次,读单音节
字词 4 个声调各出现 25 次,读多音节词语 4 个声调出现次数大致均衡。
参数④音节互补:规定读单音节字词、读多音节词语基本互补。要求以上两个题型的各
自 100 个音节,除 uenɡ和 er 两个特殊的音节外,基本上应为不同的音节,即以上两个题
型不同音节总量为 198 个,考虑到读多音节词语中的音节控制难度,两个题型不同音节总
量最少不低于 195 个。为了检查该参数执行情况,可通过普通话水平测试声韵配合表进行
校验。
参数⑤词语音变:规定读多音节词语题型中,上声与上声相连的词语不少于 3 个,上声
与非上声相连的词语不少于 4 个,轻声不少于 3 个,儿化不少于 4 个(且为不同的儿化韵母)

参数⑥词语语法:规定词语考点 25 个,判断 10 组、量名搭配 10 组,语序或表达形式
判断 5 组;量名搭配要求有 1 个干扰项。
普通话水平测试国家题库可以高效率地反复生产高信度的、等值的试题,对促进测试的
标准化程度、保持测试稳定性和提高测试质量具有重要意义。


参见PSC国家题库建设课题组《普通话水平测试国家题库制卷系统研制报告》,
《语言文字应用》2005年第2
期,第64页。
122
三、普通话水平测试评分依据

评分依据是指由国家和地方测试机构制定,规定普通话水平测试评分体系、评分要素、
评分规则的学术依凭。评分是测试实践的成果实现环节 ,评分工作“是关系到考试的信度

的最要害的一个环节。” 对于大规模主观性测试而言,制定统一的评分依据,规定明确的评
分体系、评分要素、评分规则是保证测试信度的重要前提。
(一)《普通话水平测试大纲》是评分依据之源
《测试大纲》是普通话水平测试的基本学术依据,详细规定了普通话水平测试的分值、
评分要素和评分规则。《测试大纲》建立了测试评分系统的框架,为测试评分确立了根本依
据,本章第一节表 5–3、表 5–4 已详细列出,此不赘述。需要补充分析的是普通话水平测
试系统的总体特点,具体阐述如下:
1.评分系统是《等级标准》的量化指标系统
《等级标准》对测试等级表征进行了描述,基本属于质性评价,虽以“失分率”的形式
厘定了各等级分数线,但并未规定评分形制,也即并未形成量化指标体系,测试员不能据此
获得评分的操作性依据。
《测试大纲》构建了量化评分系统,并以该系统为中介,实现了量
化评价与质性评价的有效关联,使《等级标准》获得富有解释力的数字化表达。
2.评分体系采用百分制的计分体制
设计评分体系要考虑多种因素,比如测试的性质(主观性测试、客观性测试)、规模、
测试长度、测试员因素、评分难度等等。普通话水平测试是大规模主观性测试,其评分体系
采用百分制。百分制是教育测量领域中较常用的一种分数导出方式,记分方便,容易解释,
区别性强,且与普通话水平测试的测验长度比较协调。应试人百分制的得分不是简单的原始
分数和毫无意义的抽象数字,而是与《等级标准》产生关联的、具有标准参照实际意义的解
释性分数。
3.评分体系采用“半分立半综合”的评价框架
评分规则一般可分为分立式要素评分和整体性综合评分。前者是对答卷的各个要素分
别进行评分,然后再统计总分;后者是由测试员根据自己对答卷的总体印象给出一个综合的
分数。两种路径各有优劣,
“综合性评分路子是把语言放在交际实际中作为一个整体去评价,
符合第三代语言测试体系的观点。现代欧美多数语言考试主观题都按这条路子去评分。它的
主要问题是大面积考试很不容易控制评分的不一致,靠统一评分标准没有太大作用。分解性
评分路子可以把统一评分标准定得比较细比较死,借此控制评分的三个不一致。它的主要问
题是把语言分割对待,反映了一种分割式的语言观(atomistic view of language),尤其

是单纯按语言形式分解的分解性评分,不符合现代语言教学和测试的评分标准。” 因此,
“在
我国当前的现实情况下,大面积语言测试主观题的评分标准,恐怕只能(也应该)走一条半


李筱菊:《语言测试科学与艺术》
,湖南教育出版社 1997 年版,第 109 页。

李筱菊:《语言测试科学与艺术》
,湖南教育出版社 1997 年版,第 111 页。
123

综合半分解的路子,这是为了取得信度,也保证一定的效度。

普通话水平测试采用“半分立半综合”的评价框架。5 个测试项中读单音节字词、读多
音节词语、选择判断、朗读短文基本采用分立式要素评分,依据评分规则,对应试人各测试
项的每个评分要素分别进行量化统计,最后合成每一测试项的分数;命题说话基本采用整体
性综合评分,根据应试人说话整体判断语音面貌、词汇语法规范程度和流畅程度,并依据规
则赋值评分。“半分立半综合”的评价框架,可以较好体现每个测试项各自的测试目的和要
求,并保证测试信度和效度的协调。
4.评分体系采用“定量与定性相结合”的评价模式
总体上看,测试评分体系是以数字表达为外化特征的量化体系,但这并不意味着在评价
模式上只采用“定量评价”排斥“定性评价”。任何事物都是质和量的统一体,在测试实践
中“定量”和“定性”不能截然分开,例如,学术界一般都认为,读单音节字词、读多音节
词语和朗读短文的音节的评价属于典型的“定量评价”模式,但这种“定量”却是通过对音
节“正确、错误、缺陷”的“定性”实现的。又如命题说话“语音标准程度”的评价是典型
的“定性评价”模式,但在进行“语音标准程度”归档时,又是以出现的语言错误的“数量”
为参照的,在归档后还要依据规则给出一个合适的对应分数,这又是对“定性评价”进行的
“二次量化”。普通话水平测试就是在这种“定量与定性相结合”的模式中最终确定应试人
的测试分数和等级——而测试分数和等级则是更高层次的“定量与定性”的评价。
(二)地方评分细则
普通话水平测试在工作管理上实行属地管理原则,不少省份结合各自区域特点,制定了
省级评分细则,以利测试的具体实施。新《测试大纲》颁布后,全国有 23 个省份制定了评
分细则,评分细则具有积极的作用,但实践过程中也存在一些问题,须加以完善和提高。
1.评分细则与《测试大纲》的关系
从层级上讲,《测试大纲》是上位的主体性测试依据,评分细则是下位的辅助性测试依
据,必须严格遵循《测试大纲》,符合《测试大纲》评分体系的学理逻辑,以保证测试的权
威性和统一性。从功能上讲,评分细则和《测试大纲》各有其用,
《测试大纲》是基础测试
依据,对评分进行系统规定;评分细则属于具体测试依据,对评分标准进行阐释、细化和补
充。从特点上讲,《测试大纲》具有纲领性和框架性,评分细则具有从属性和补充性。
2.评分细则热点问题讨论
各省份评分细则中有一些内容是被普遍关注的,具有共性,分别讨论如下:
(1)读单音节字词、读多音节词语的评分细则问题
①语音错误与语音缺陷的概念
区分语音错误和语音缺陷是普通话水平测试的一个理论和实践贡献,这个贡献是语音评
定操作层面的,更是语言观即语言哲学范畴的,
“正确—缺陷—错误”连续统对语言测试、


李筱菊:《语言测试科学与艺术》
,湖南教育出版社 1997 年版,第 111~112 页。
124
语言教学、语言规划乃至语言本体都具有认识论的指导意义。就普通话水平测试而言,厘清
语音错误和语音缺陷这两个基本概念对于语音评定具有重要意义。但遗憾的是,虽有 14 个
省份对两个概念进行了阐释,却存在不少认识误区。
有的省份认为语音错误“是指把一个音(或语音成分)误读作另一个音(或语音成分)

的情况”(浙江细则), 或“指音节读音中有一个或几个以上的语音成分保留了方音语音”
(重庆细则)”;认为语音缺陷“指音节读音中有一个或一个以上的音节成分发音没完全达到
标准程度,听感性质明显不符”
(广西细则),或“指音节读音中有一个或几个以上的语音成
分处在方音向普通话过渡的状态”
(重庆细则)。
语音评定仅仅依靠语音学还不够,重要的是应建立音位学的观念,以普通话音位系统为
参照标准。语音错误是指把普通话语音系统中的一个音位发为另一个音位的现象;语音缺陷

是指未把普通话语音系统中的一个音位发为另一个音位,但尚未达到标准音位的现象。 有
一种似是而非的观点值得讨论,有的省份认为“语音错误,指把普通话中的一个音读成普通
话中的另外一个音,或读成非普通话中的一个什么音。
”(湖北细则)该表述似乎运用了音位
学方法,但实际上认识模糊。我们认为,“读成非普通话中的一个什么音”可能评定为语音
错误,也可能评定为语音缺陷,甚至视为语音正确。例如,将舌面前音 j、q、x 发为舌叶音
(非普通话音位),判定为语音缺陷为宜,不可判定为语音错误;又如,将轻声音节声母发
为浊化音,
“喇叭”的“叭”声母发为浊塞音[b](非普通话音位)而非清塞音[p],应判定
为语音正确,不宜判定为语音缺陷,更不能判定为语音错误。
“普通话音位”是划定语音错
误和语音缺陷的一个基本界性标准,但在实际评定时,复杂程度远甚于此,必须依靠具体的
分辨和厘定工作,这也正是评分细则的价值所在。音位学方法的忽视或误用,还直接导致对
具体语音错误、语音缺陷类型的归纳出现偏差,篇幅所限,此不详述。
②读多音节词语的轻重音格式
有 7 个省份细则明确对此做出规定,轻重音格式处理不当,均按语音缺陷评定。问题是
轻重音格式虽是一种客观存在,在实验语音学领域也有一些经典的研究报告,但一直存在争
论,双音节词语的轻重音格式,存在“前重”
“后重”
“前后等重”的认识分歧,三音节词语、
四音节词语就更为复杂。以双音节词语为例,一般认为有中重格式和重中格式区分的下例词
语:散步(中重)—散布(重中)、报到(中重)—报道(重中)、勘误(中重)—刊物(重
中),在非语流中的词内音节轻重程度,即在储备状态的轻重格式并不那么固定,如果把以
上词例均读为“前后等重”是符合普通话语感的。轻重音格式就感知范畴而言,“一些变化

在声学上有所表现,但在正常情况下人耳是很难分辨出来的”, 一些具体的词语也因词语结
构、语速、语体甚或个人风格等原因存在一定的可变性和复杂性。轻重音格式“重音、中音、


为节省篇幅和称说方便,本文以“省份+细则”名称称说;鉴于有的细则属于内部资料,本文不具体列出
页码。

王晖:《普通话水平测试评分细则论析》,《语言文字应用》2007 年第 4 期,第 102 页。

沈倍蕾、毛世桢:《普通话双音节非轻声词的轻重格式和声调组合》,第三届全国普通话水平测试学术研讨
会论文(未刊),2007 年。
125
次轻音、轻音”四度标示法,从操作角度看,可行性也不高,我们不能提供“轻重音韵律词
语表”可资参考。因此,目前条件下将轻重音格式列为测试要素的方案并不可取。当然,对
于较为固定的词语韵律,是完全可以评价的,但建议放在现有评分要素体系内加以处理。例
如“蜜蜂、饼干、台灯、唱歌、春秋”,如果读为前重,可以从前后字调值、调域变化的角
度判定为语音缺陷,不必非得引入“轻重音格式”这个难以从学理角度解释清楚的评分要素。
(2)关于朗读短文评分细则的问题
①“视程度”解析
新《测试大纲》与原《测试大纲》相比,朗读短文题型评分有显著变化,详见表 5–14:

图表 28 表 5-14 原《测试大纲》与新《测试大纲》朗读短文评分对比表

如表 5–14 所示,新《测试大纲》与原《测试大纲》相比有三个显著变化:一是增加
了“声母或韵母系统性语音缺陷”“流畅”两个测查要素,取消了“语速”测查要素;二是
更改了“语调偏误”
(原“方言语调”)和“停连不当”
(原“停顿、断句不当”)两个测查要
素名称;三是修改评价方式,在“声母或韵母系统性语音缺陷”
“语调偏误”
“停连不当”
“朗
读不流畅”等 4 个测查要素评分中,使用了“视程度”的表述方式。我们这里主要讨论对“视
程度”表述方式的理解。
有 9 个省份在评分细则中对“声母或韵母系统性语音缺陷”做出规定。大致有三种处理:
第一种,定量评分,如规定“每个系统扣 0.25 分(最多扣 2 分)”
(天津细则)。第二种,按
缺陷种类的数量定性评价,如规定“偶有缺陷不扣分。出现 1 类,扣 0.5 分;出现 2 类以上,
扣 1 分”
(上海细则)。第一种方式,改变了《测试大纲》的评价方式,分值也违背《测试大
纲》规定,是错误的。第二种方式完全以缺陷种类定性,也值得改进,缺陷类属本身的确定
是值得深入讨论和进一步明晰的问题。语音系统具有层次性,缺陷类属的统辖范围可宽可狭,

126
例如 “前鼻音偏后”的缺陷统计为几类的问题,ɑn、en、in、ün 算作 1 类,还是分别算作
4 类,或者根据有无介音语与 iɑn、uɑn、uen、üɑn 计为 2 类,抑或并入“前后鼻韵缺陷”
更大的 1 类?需要强调的是“视程度”实有所指,评分指向的是“系统性缺陷”,也即不是
零星的、分散的缺陷;第二“视程度”既包括质量规定性,也包括数量规定性,缺陷类型数
量相同,但偏误的严重程度不同,扣分当然可以不同,仅仅拘泥于缺陷类别的数量有失偏颇。
有 10 个省份评分细则对“停连不当”做出规定。天津细则采用完全量化方式,规定“未
造成歧义的停连不当,扣 0.1 分/个音节”;其他省份均采用以量定性方式,但各地量化差异
明显。规定较严的如“停连不当,1 次扣 0.5 分;2 次,扣 1 分;3 次及 3 次以上,扣 2 分”
(北京细则、江苏细则、广东细则)
;规定较宽松如“停连不当,
“1~3 次扣 0.5 分,3 次~
6 次扣 1 分,6 次以上扣 2 分”(重庆细则),“偶有 1 次不扣分,2—3 次扣 0.5 分,4—5
次扣 1 分,6 次以上扣 2 分”(上海细则)。同样是 3 次“停连不当”,有的省份扣 2 分,有
的省份扣 0.5 分,值得重视。我们认为“停连不当”着眼于对语篇的处理能力,特别看重是
否对语义理解造成肢解或误解,与偶尔误读造成的勘正或纠错造成的不连贯有所不同。与“声
母或韵母系统性语音缺陷”一样,“停连不当”的“视程度”既有数量的考量,也有质性的
考量,不宜太拘泥于数量。
有的省份在评分细则中对“回读”进行了详细规定。关于“回读”,新《测试大纲》并
未单列为一个评分要素,而是并入“朗读不流畅”评分要素以“视程度”的方式处理。但部
分省份的处理偏离了《测试大纲》的评价方式,如有的规定:每个回读音节扣 0.1 分(天津
细则);有的规定:每出现一次扣 0.3 分(北京细则)
。“回读”按音节数量扣分,当音节数
量较多时,统计不便,并入“朗读不流畅”进行定性评价,可以较好地解决这个问题。每出
现一次扣 0.3 分的做法,除了操作不便,还使得普通话水平测试评分体系复杂化,尤为不妥。
综上所述,“视程度”就其表述而言,属于模糊评价。各地在评分细则中着眼于操作,
进行了细密化的规定,有便于操作的一面,但忽视或淡化了“视程度”模糊评价的价值。
“处
理模糊概念是人的大脑的能力。……语言理论的某些方面是可以用来自模糊集论的方法进行

分析的。” 模糊评价体现了普通话水平测试定量与定性相结合的原则,加之采用“等次定位”
扣分方式,4 个测查要素中除了“声母或韵母系统性语音缺陷”分为 0.5 分/1 分两个扣分等
次,其余测查要素均分为 0.5 分/1 分/2 分三个扣分等次,这种“等次定位”评分是不难把
握的,太拘泥于所谓“量化”
“精确”,反而影响科学性和操作性。
②语气词“啊”音变
有7个省份评分细则把“啊”未根据具体语境变读判定为语音错误。学术界对“啊”音
变有很多成果,林焘先生和胡明扬先生,对“啊”音变的复杂关系以及影响因素进行了深入
调查和分析,对普通话教学和测试尤具启发意义。受两位先生启发,笔者撰文《必然性与或


L.A.Zadeh(札德):A Fuzzy-Set-Theoretic Interpretaton of Lingustic Hedges(“对语言限制词的
模糊集论的解释” ),载 Journal of Cybernetics(《控制论杂志》 ),1972 年第 2 卷第 3 期,第 4~5 页。转
引自伍铁平: 《模糊语言学》,上海外语教育出版社 1999 年版,扉页。
127
然性——论“啊”音变的教学与测试》
,详细讨论了“啊”音变的问题,并提出具体建议,
兹引述于下:
“1.书面材料不是‘啊’的,应按照书面字形读。……2.书面材料是‘啊’的,
应区分‘必然性’音变和‘或然性’音变。属于‘必然性’音变的‘啊’必须按照音变规则
变读,如[-n]之后的‘啊’变读为‘哪’[nA],[-i][-y][-ɑ]之后的‘啊’变读为‘呀’[iA]……。
其余的‘或然性’音变可以不发生音变,仍读作‘啊’ [A];也可以根据语速、语体读出
各种变化,但是一定要读得符合音变规律,否则应当视为语音错误。3.表胪列关系或强调

语气的‘啊’,无论书面字形写作‘啊’还是‘呀’,均应当读作‘呀’ [iA]。”
我们认为,各省评分细则对“啊”音变的规定失之于简单,不够科学,应当修正。
(3)关于命题说话评分细则的问题
①语音标准程度
在语音归档处理方面,为避免对高等级应试者扣分过严,不少省份的扣分起分点尝试从
0.5 分开始,并增设了 1.5 分的扣分档次(浙江细则、福建细则、湖北细则、广西细则)。
四项测试(免测选择判断测试)和五项测试对比实验表明,这种处理有其合理性。新《测试
大纲》语音归档,采取定量与定性相结合的评价方式,一些省份对于计量比较重视,在《测
试大纲》之外,规定了 16~30 次、20 次、30 次等等(江苏细则、广东细则、广西细则)诸
多情形。我们认为,计量并非越细密越好,量的统计,以能对应试者整体语音面貌进行定性
评价为宜。一些省份对基本用方言说话的,加大扣分分值,最多扣 20 分(广东细则),根据
不足,似无太大必要。有的省份除了规定错误数量,还规定缺陷类型数量,例如:“三档:
语音错误在 15 次以内,一般有一至两类系统性语音错误,或其他语音错误,三类系统性语
音缺陷。略有语调偏误。扣 3 分、4 分。”
(广西细则),如上文所言,语音系统具有层次性,
系统性语音错误类属的统辖范围并不能确定,不利于操作,这种规定不值得提倡。个别省份
把一档对应于一甲,二档对应于一乙及二甲的高分数段,三档对应于二甲及二乙高分段,四
档对应于二乙及三甲的高分数段,五档对应于三甲,六档对应于三甲低分段及三乙(重庆细
则)。普通话水平测试是“半分立半综合”的评价,每个题型都与最终等级相关,单凭一个
测试项与等级相关联的做法是错误的,应当纠正。
②词汇、语法规范程度
各地评分细则关于词汇、语法规范程度的主要问题,首先体现为对“偶有不规范的情况”
和“屡有不规范的情况”的量化指标差异明显。有的省份失之于宽,规定“5 次以下为偶有,
5 次以上为屡有”(天津细则);有的省份较严,规定“1~3 次为偶有,4 次及以上为屡有”
(浙江细则)。另外,某些省份对定量与定性原则的掌握较机械,例如规定“3 次以内(含 3
次),每次扣 1 分,4 次以上,扣 4 分”
(北京细则、江苏细则),
“3 次以内,出现 1 次,扣 1
分;出现 2~3 次,扣 2 分;4 次~5 次,扣 3 分;5 次以上,扣 4 分”(广东细则)。我们认
为,这种对失误情形不加以区别,仅以量的维度评定的方法不够科学。对词汇、语法规范程


王晖:
《必然性与或然性——论“啊”音变的教学与测试》,《长江学术》
,2012 年第 3 期,第 126~127 页。
128
度规定最细密的是上海市评分细则,“出现 3—4 次语病,或出现 1—2 次方言词语或方言语
法结构,扣 1 分;出现 5 次以上语病,或出现 3—4 次方言词语及方言语法结构,扣 2 分。
出现 5—6 次方言词语及方言语法结构,扣 3 分;出现 7 次以上方言词语及方言语法结构,
扣 4 分。”这种区分“失范”性质的处理思想值得称道,缺点是量化指标稍显机械。
③缺时
各地评分细则关于缺时问题的处理问题有二:一是量化指标机械,如有的省份规定:
“缺
时 40 秒至 60 秒可扣 3 分;缺时 20 秒至 39 秒可扣 2 分;缺时 5 秒至 19 秒可扣 1 分。缺时 1
分 01 秒至 1 分 29 秒可扣 4 分;缺时 1 分 30 秒至 1 分 59 秒可扣 5 分;缺时 2 分至 2 分 29
秒可扣 6 分。”
(广东细则)命题说话是连续语流或间歇性语流,如此看似绵密的规定,给操
作带来不便。第二个问题更为严重,某些省份突破了《测试大纲》的框架,规定说话时间不
足,
“语音面貌”
“词汇语法规范程度”和“自然流畅程度”降档处理(福建细则)。
《测试大
纲》缺时的规定,具有提示作用,若出现缺时情况,“判罚”已属重判,再给予降档处理不
仅过于严苛,而且于法无据。
④离题
《测试大纲》规定:“如发现应试人有明显背稿、离题、说话难以继续等表现时,主试

人应及时提示或引导。” 但离题本身并非测试的评分要素。一些省份的评分细则把离题列
为测试要素,扣分从 2~3 分(广西细则),到 3~5 分(浙江细则)不等。上海细则规定:
“对于应试人不按测试目的、要求说话的(如反复纠错、简单重复、背稿、离题等),测试
员应及时干预。干预无效,酌情扣 5—10 分。”北京细则规定:“对于应试人不按测试目的、
要求说话的(如反复纠错、简单重复、完全离题等),测试员应及时干预。干预无效,可终
止测试,本项测试成绩判为 0 分。”各省份对于离题评分的量化指标差异很大,在面测模式
下,测试员可以通过提问、告知引导应试人对话题进行修正和补充,多数应试人一般也会有
所矫正和补充,这种情形可以酌情扣 1~3 分,干预无效,酌情扣 5~10 分也是适宜的,但
终止考试需慎重。在计算机辅助测试模式下,无测试员引导干预,离题问题需要设计新的评
分方案,下文专门讨论。
3.建议
(1)明确评分细则制定的原则
地方制定评分细则应遵循以下原则:
①“上有所依”原则
制定评分细则必须根据上位测试依据——《测试大纲》。评分细则之于《测试大纲》

类似法律层级中下位法和上位法的关系,不可与《测试大纲》的评分体系相抵触,不是《测
试大纲》之外另起炉灶。有的省份甚至增减评分要素,改变评分框架体系,这对测试的统一
性和公平性有严重损害,是非常错误的。


《普通话水平测试大纲》 ,详参教育部语言文字应用管理司编《新时期语言文字法规政策文件汇编》,语文
出版社 2005 年版,第 225 页。
129
②“下有所系”原则
制定细则应联系各自省域的实际,特别是语言(方言)应用实际,提出具体的实施细则,
体现地域性和针对性。一些省份对评分细则合法性和必要性有疑虑,未制定评分细则;一些
省份虽制定了评分细则,但基本依循《测试大纲》,失去了评分细则的相对独立性,这些都
是应当避免的。
③科学性与操作性相结合的原则
科学性与可操作性相结合,既是制定评分细则的目标原则,也是制定评分细则的工作
原则。评分细则是《测试大纲》科学性与操作性相结合的原则的逻辑延伸,一些评分细则
基本概念界定和具体指标的科学性不足;有些细则过于突出量化指标,操作不便,应当修正
完善。
(2)明确评分细则制定的工作主体
评分细则制定的工作主体是省级测试机构还是省级语言文字工作机构,在测试管理依据
中未予明确,责权利不明晰,不利于此项工作的开展。评分细则制定是具体的业务工作,学
术属性突出,省级测试机构为工作主体较为适宜,建议今后在《测试管理规定》中对此补充
规定。
(3)规范评分细则制定程序,加强质量监控
应规范各省级测试实施机构评分细则制定程序,建议建立报请立项、起草、送审、审
查、备案、公布等一整套规范程序。在起草环节,应组织专家团队和工作班子,广泛征求测
试员意见建议,重视论证实践,杜绝“吾辈数人定则定矣”的简单工作方式。国家测试实施
机构应切实发挥业务指导和质量监控职能,加强对各省份评分细则工作的检查和监督,实行
备案审查制度,各省份评分细则应报国家测试机构审查,经审查批复后方可备案实施。
(三)计算机辅助测试评分细则
2009 年《计算机辅助普通话水平测试评分试行办法》对需要人工评分的“命题说话”
题型的评分进行补充性规定,与《测试大纲》相比最突出的变化是增加了“离题、内容雷同”

和“无效话语”两个评分要素。一些省份机辅测试评分细则对此变化做出相应的调整。
1.主要内容
各省份做出调整的方式有两种,一种是在原有省级评分细则的基础上,附加《机辅测试
评分办法》的相关内容,未进行实质性补充规定,如河北省机辅测试评分细则;第二种是对
《机辅测试评分办法》相关内容进行阐释和细化,具有“细则”的实质意义。就内容而言,
主要包括以下两个方面:
(1)对《机辅测试评分办法》内容的阐释
《机辅测试评分办法》规定:“离题、内容雷同,视程度扣 4 分、5 分、6 分。”“无
效话语,累计占时酌情扣分:累计占时 1 分钟以内(含 1 分钟),扣 1 分、2 分、3 分;累计


各省份计算机辅助普通话水平测试评分细则的名称不一,本文统称为“机辅测试评分细则”。
130
占时 1 分钟以上,扣 4 分、5 分、6 分;有效语语不满 30 秒(含 30 秒)
,本测试项成绩计为

0 分。” 由于是《测试大纲》评分系统的补充,
《机辅测试评分办法》采用《测试大纲》的
框架结构性表述体系,并未对以上两类评分要素进行详细解析,多数省份机辅测试评分细则
对此进行阐释说明。
“离题”,有的省份阐 释 为“应 试 人所 说 内 容 完 全不 符 合 规 定 的话 题 ”(陕西);
有 的 省份 阐 释 为 “应试人所说内容不符合规定的话题” (山东)
;有 的 省份 阐 释 为 “ 应
试人所说内容完全不符合或基本不符合规定的话题”
(江苏);有的省份则具化为“硬套、嫁
接命题,转移话题”
(广东)。
“内容雷同”有的省份阐 释 为“ 变 相 使用《 普 通 话水 平 测 试
纲 要》中 的 60 篇 短 文;使 用 报刊 、书 籍、网 络 等现 成 文 章 ;多 人 使用 一 篇 文 章 ;读
稿 ,同 一 应试 人 所 说 内 容前 后 雷 同 ”( 陕 西 、山 东 );有 的 省份 指“ 背 诵 他人 文 稿 、
多 人 说话 内 容 雷 同 ,朗 读 、 复 述 、改 编 他 人 文 稿” 等 现 象( 广 东 ) 。 “ 无 效 话语 ”
有 的 省份 指 “ 应 试 人的 话 语 与 要 测查 的 语 言 特 征无 关 , 无 评 判效 度 。 如 语 句不 断 重
复 、 反复 纠 错 、 读 秒、 唱 歌 、 念 诗、 数 数 字 等” ( 陕 西) ; 有 的 省 份指 “没有功效、
不起作用的话语。指语言冗余,有多余的重复或啰嗦话(山东)”;有 的 省份 指 “测试员
无法据此做出评分的内容,包括:重复相同或大体相同的内容;经常重复相同语句;口头
禅频密;简单重复”(云南)。
(2)对《机辅测试评分办法》评分的细化
《机辅测试评分办法》对“无效话语”评分规定得较为详细具体,对“离题、内容雷同”
则仅以“视程度”方式进行概括性规定,不少省份对此进行了操作性的补充规定。
关于“离题”的评分,有的省份规定以定性方式评分,例如规定“完全离题,扣 6 分;
基本离题,视程度扣 4 分、5 分”
(江苏);“基本离题或离题,扣 5 分、6 分;部分离题,
扣 3 分、4 分;少量离题,扣 1 分、2 分”(山东)。有的省份规定以定量方式评分,例如
规定 “围绕话题说话不足 1 分钟,扣 5~6 分;围绕话题说话不足 2 分钟,扣 3~4 分;离
题 1 分钟以内(含 1 分钟),扣 1~2 分”(广东);“应试人说话的内容与话题基本上没有
关联,或仅有一两句话与话题相关联的,可以判为离题,扣 6 分;应试人说话内容与话题相
关联的不足 1 分钟的,扣 4~5 分;应试人说话内容与话题相关联的不足 2 分钟的,扣 2~3
分”(浙江)。
关于“内容雷同”的评分,有的省份规定以定性方式评分“内容基本雷同,视程度扣 4~
6 分;内容部分雷同,视程度扣 1~3 分。”
(浙江);有的省份规定“直接或变相使用《普通
话水平测试纲要》中的 60 篇朗读短文,扣 6 分;其他内容雷同情况,视程度扣 4 分、5 分”
(江苏)。有的省份规定以定量方式为主(结合定性方式)评分“全篇有稿说话雷同(如个
人背诵他人文稿、多人说话内容雷同等)、有稿朗读雷同(包括朗读、复述、改编他人文稿)

扣 5~6 分:内容雷同在 1 分钟以上 2 分钟以内,扣 3~4 分;内容雷同在 1 分钟以内(含


《计算机辅助普通话水平测试评分试行办法》,全国普通话培训测试信息资源网,http://www.cltt.org/
zhengcefagui/2010053116.html。
131
1 分钟),扣 1~2 分。内容雷同 20 秒以上,扣 2 分;前后雷同(重复)扣 4 分; 全篇雷同、
全篇改编、雷同+离题三种情况扣 6 分”(广东)。
2.讨论和建议
各省机辅测试评分细则是对《机辅测试评分办法》的进一步阐释和补充,为各地计算机
辅助测试评分提供了可以操作的依据,具有积极的作用。但是各省机辅测试评分细则也存在
一些不足,主要问题如下:
(1)释义适恰性
多数省份机辅测试评分细则对《机辅测试评分办法》“离题、内容雷同”“无效话语”
进行了解析,大多比较准确,但也存在释义不够恰当之处。
例如在“离题”的阐释“应 试 人所 说 内 容 完 全不 符 合 规 定 的话 题 ”“ 应试人所说内
容完全不符合或基本不符合规定的话题”的表述中,
“完 全 不符 合 ”“基本不符合”的程度
限定不够准确,“离题”应指说话内容脱离指定话题范围的所有语言表征,如只规定“完
全 不 符合 规 定 的 话 题” , 会 使得 “ 离题”评分的“视程度”无所着落。
又 如 “ 无 效 话语 ” 的 阐 释 “没有功效、不起作用的话语。指语言冗余,有多余的重
复或啰嗦话”也不够准确。口语作为一种语体形式,与书面语不同的一个突出特点就是有相
对较多的冗余重复现象,并不是所有的冗余都构成评分要素,例如口语常用的提顿性的“呢”
“吧”或起衔接、转换作用的“等于是”“然后呢”等等,如非过度使用,是不应扣分的。
“无效话语”本意是指不能提供与话题内容有效关联的语言测查要素表征,如重复语句、数
数、读秒、唱歌、说外语、说方言等现象。
以上阐释均需做出更加严密和适恰的表述。
(2)评分规范性和操作性
《机辅测试评分办法》对“离题、内容雷同”和“无效话语”提出了评分框架和方法指
引,但一些省份机辅测试评分细则超出了其规定或违背了其引导的方向。
例如《机辅测试评分办法》规定“离题、内容雷同,视程度扣 4 分、5 分、6 分。”
而有的省则规定“基本离题或离题,扣 5 分、6 分;部分离题,扣 3 分、4 分;少量离题,
扣 1 分、2 分”。仅从评分角度看,这种调整有其合理之处,但与《机辅测试评分办法》“杜
绝恶意离题(例如只准备一道题目,以不变应万变)及背诵现成文章(例如名家名篇等)等

投机行为” 的设计初衷有所背离,从测试标准的一致性来说,这种处理也不值得提倡。
又如上文所述某省份规定,对“全篇雷同”(扣 5~6 分)
、“雷同在 1 分钟以上 2 分钟
以内”
(扣 3~4 分)、
“雷同在 1 分钟以内(含 1 分钟)
”(扣 1~2 分)、雷同 20 秒以上(扣
2 分)进行了详细的规定,这与《机辅测试评分办法》“视程度”这一表述所指引的定性评
价为主的方向不一致,操作起来也不够便利。
(3)评分要素系统性


孙海娜:
《浅析〈计算机辅助普通话水平测试评分试行办法〉》
,《语言文字应用》2010 年第 4 期,第 96 页。
132
《机辅测试评分办法》增加的评分要素是基于计算机辅助测试模式进行的统一规范性微
调,基本与《测试大纲》的评分系统相协调。不过有的省份机辅测试评分细则反映出评分要

素的系统性问题。例如“离题”和“内容雷同”因“同属说话内容失当” 《机辅测试评分
办法》将其一并考虑为一个测查要素,在赋值上是“视程度扣 4 分、5 分、6 分”
,而有的省
份把二者分立为两个独立的评分要素,均“视程度”扣“1~2 分、3~4 分、5~6 分”,这
无疑在评分系统的权重上进行了改变,这种做法是错误的。
不过“离题”和“内容雷同”统一为一个评分要素抑或分立为两个评分要素值得讨论。
有的省份规定“离 题 和内 容 雷 同 不 重复 扣 分 ” , 有 的 省份则规定“离题和内容雷同可以
重复扣分,但两项合计最高扣 6 分。”在操作中,各省份均是分立式操作,即“离题”和“内
容雷同”各自评价,计分时统一为一个评分要素,这么处理可避免评分体系过于繁复,但也
存在二者不同质的弊端。这个问题不是省级机辅测试评分细则造成的,根源在《机辅测试评
分办法》。
就评分系统而言,我们认为“离题”和“内容雷同”分离更为合理,“离题”是指向话
语有效性及其程度的问题,“内容雷同”背后是考试道德操守问题。为了使评分体系比较简
明,笔者建议设立“有效话语不足”评分要素,将人工测试模式的“缺时”
、机辅测试模式
的“离题”和“无效话语”均归并与此,另外保留“内容雷同”作为阻遏性和惩罚性评分要
素。这样可以将两种模式的“命题说话”评分整合简化为包括“语音标准程度、词语语法标
准程度、自然流畅程度、有效语料不足、内容雷同”等 5 个评分要素的统一系统。
以上建议是修补性的“补丁式”建议,并非解决“命题说话”测试项评分的最佳途径。
我们认为,评分系统固然对应试人具有有引导性,但更为根本的引导则是题型的变化。说话
真实性是制约目前“命题说话”的最大制约因素,现有“命题说话”题型提供了 30 个测试
用话题,某种意义上形成了封闭的话题范围,单向说话的形式又使受试人不易找到交流感,
机辅测试“人机交互”的形式加剧了这种无对象感,加之投机心理和侥幸心理,使得传统“面
测”几乎不出现的“无效话语”和较少出现的“离题、内容雷同”等现象屡见不鲜。笔者提
出以下建议:“说话”题型改为两部分,第一部分是“命题说话”,采取目前的测试方式(具
体话题题目需改进和完善),第二部分为临时性“任务型”话题,设置良好的交际情境引导
应试人完成话题任务。这种改变,保留了“命题说话”的指引性和有效反拨效应,同时增加
了“说话”的真实性和有效性,但会带来的测试科学性、稳定性、可操作性等问题,对题库
建设也提出了更高的要求,但无论如何这个方向值得深入研究与探讨,这或许是根据测试活
动矛盾规律,以系统思维的方法,解决普通话水平测试系统性问题的正确思路。


孙海娜:
《浅析〈计算机辅助普通话水平测试评分试行办法〉》
,《语言文字应用》2010 年第 4 期,第 96 页。
133
第六章 结语

测试依据是普通话水平测试所依凭的规则和标准,本文对普通话水平测试依据进行系统
研究,既包括理论研究,也包括史论研究和具体测试依据文本研究,旨在对测试依据的内涵、
外延及其范畴体系、内部层级,发展历程、发展特点与内在规律,以及测试依据对测试活动
的作用与影响,未来发展的方向等问题进行全方位的探索,在此基础上,形成完整、独立的
测试依据学术研究范畴。

一、主要结论

本文的主要研究结论如下:
(一)普通话水平测试活动要素构成理论是测试依据研究的重要理论指导。测试依据的
概念来源于姚喜双等提出的测试活动要素理论,该理论把测试活动分为测试主体、测试对象、
测试依据和测试手段等四个要素,四要素互相联系、互相作用构成测试实践活动。测试活动
要素构成理论从哲学角度阐释普通话水平测试活动,对普通话水平测试研究具有方法论的重
要意义,为本文测试依据的专题研究起到了理论指导作用。
(二)测试依据是测试活动的重要中介要素。本文在测试活动要素理论框架下,对测试
要素进行重构,将测试活动“四要素”调整为“三要素”—— 施测主体、受测对象和测试
中介,测试中介是联系主客体的“系体”,可分为测试依据和测试手段两个子要素,测试依
据是重要的测试中介要素,制约和规定着施测主体和受测对象的活动和行为,并对测试手段
进行管控,在测试活动中居于核心地位。
(三)测试依据是具有层级特征的立体的范畴体系。普通话水平测试依据范畴体系可分
为三个层级,包含 2 个一级范畴:管理依据和学术依据;4 个二级范畴:宏观管理依据、微
观管理依据、基础学术依据和具体学术依据;9 个三级范畴:法律法规依据、政策文件依据、
业务管理依据、其他管理依据、等级标准、测试大纲、实施纲要、命题依据和评分依据。本
文主张把管理依据纳入测试依据范畴框架,形成测试依据的完整格局。
(四)测试依据具有凭信性、规约性和层次性特征。凭信性体现为可凭性和可信性;规
约性体现为规约强制性和规约调适性;层次性体现为层次等级性和层次类型性。
(五)测试依据发展历程可概括为“两阶段五时期”
。第一阶段是酝酿探索阶段(1982
年~1994 年),第二阶段是实施发展阶段(1994 年至今)
。酝酿探索阶段划分为两个时期:
萌芽时期(1982 年~1988 年)和研发时期(1988 年~1994 年)。实施发展阶段划分为三个
时期:初创时期(1994 年~2000 年底),规范时期(2000 年底~2007 年)和拓展时期(2007
年至今)。测试依据发展历程的每个阶段、每个时期,都呈现管理依据和学术依据“双轮驱
动”的发展特征。
134
(六)管理依据是普通话水平测试的管理规则,对学术依据具有制约作用,而且与学术
依据一起对施测主体、受测对象和测试手段进行管控,使测试活动规范运行。法律法规依据
是保障普通话水平测试开展的法律、法规和规章的总和,是测试实施的保障性的依据,也是
制定其他测试依据的元依据,在测试依据体系中具有统辖的作用。政策文件依据是对普通话
水平测试具有权威性、导向性和规定意义的文件的总和,在测试依据体系中发挥着规划指导、
保障实施的重要作用。业务管理依据属于微观执行依据,是对普通话水平测试业务管理工作
进行规范的文件依据总和,是落实宏观管理依据的具体工作程序、工作方式、支撑手段、质
量监督等环节的业务性依据。
(七)学术依据是普通话水平测试的学术性规则,学术依据规定测试的框架内容、等级
设计、试卷构成、分数体系、命题规则、评分规则等,是实施测试所依凭的学科领域性规范
标准和执行标准的总和,是保障测试活动科学有效运转的重要依据。基础学术依据是开展普
通话水平测试根本性、支撑性的学术依凭,在测试实施中具有统摄作用和指导作用。具体学
术依据是开展普通话水平测试详细的操作性的学术依凭,使测试实施具有应用性、执行性作
用。普通话水平测试的《等级标准》
《测试大纲》
《实施纲要》以及命题依据和评分依据具有
相当高的科学性,但仍有改进和完善的空间。

二、创新之处

(一)本文首次提出普通话水平测试依据框架和三级范畴体系,并进行了较为系统的研
究,首次将管理依据纳入测试依据研究范畴,确立了管理依据与学术依据并立的新格局,拓
展了测试依据研究的领域。本文提出了测试依据术语子系统,明确了测试依据的学术内涵和
外延,增强了测试依据研究的理论张力。本研究初步搭建了较为完整的测试依据研究理论框
架,填补了测试依据专门研究的空白,拓展了普通话水平测试的学科研究方向。
(二)本文对测试活动构成要素理论进行再建构,提出测试活动“三要素”
(施测主体、
受测对象、测试中介)理论框架,突出了测试依据的“中介要素”特质,理论架构也更加简
明,深化了测试活动构成要素理论研究。本文提出测试依据发展历程“两阶段五时期”划分
法,不仅为测试依据研究提供了历时参照,也为测试发展史研究提供了新思路。
(三)本文对测试管理依据,包括法律法规依据研究、政策管理依据、业务管理依据的
内容、特点和作用进行了初步研究,使得测试管理依据具有了学术意义,这种研究不仅具有
学术拓荒价值,对完善《国家通用语言文字》、地方语言文字法规规章,以及修订普通话水
平测试的《测试管理规定》《测试规程》等具有现实参考价值。
(四)本文对测试学术依据,包括基础学术依据和具体学术依据进行了较系统的研究,
对《等级标准》
《测试大纲》
《实施纲要》的阐释尤为详细,对其不足也进行了分析,并提出
了改进建议。本研究对命题依据和评分依据进行了较深入的讨论,对测试题型、测试长度、
覆盖与分布、分值比重、试卷编制和题库建设的研究,以及对《测试大纲》评分体系、地方
评分细则和计算机辅助测试评分细则的研究,既有系统性论述,也有具化分析,还提出修订
135
和完善建议,为普通话水平测试学科和工作提供了理论和实践参考。

三、不足及改进方向

受研究能力和条件所限,本研究尚有诸多不足和有待改进之处。
(一)本文以测试活动构成要素理论为指导,并提出测试活动三要素框架,研究主要聚
焦于测试依据要素内部的研究,但对于测试依据与施测主体、受测对象两个活动要素以及测
试依据与另一中介要素——测试手段之间相互联系、相互作用、相互影响、相互制约的研究
涉及不多,挖掘不深,对测试活动整体发展规律以及内部动因的探讨相对薄弱。
(二)普通话水平测试是具有中国语言规划特色的国家通用语言测试,测试依据概念本
身也是这一本土化语言测试的产物,本研究以此为基点也合乎实际。但境内外语言测试众多,
本文对相关语言测试依据成果的借鉴较少,今后应加强与其他语言测试的比较研究,深化对
普通话水平测试依据本质规律的认识,获得有价值的新发现。
(三)对测试管理依据和学术依据的探讨尚属框架性探讨,需要进一步完善充实。有的
具体测试依据如《测试管理规定》
《测试大纲》的论述比较琐碎,需要进一步提炼和总结;
对命题依据和评分依据的探讨,提出了一些改善性建议,需要在理论凝练上下功夫,并在实
证研究方面有进一步的支撑。
以上不足,希望后继研究可以改善和提高。

136
参考文献

【中文参考文献】
阿兰·戴维斯著,任福昌、吴平、任莜萌译:《语言测试原理》经济科学出版社 1997 年版。

曹德和:《如何界定普通话的内涵与外延——学习〈国家通用语言文字法〉的思考》,
《安徽
大学学报(哲学社会科学版)》2011 年第 1 期。
曹国安:《语气助词“啊”的音变不必强求——与〈普通话水平测试大纲〉商榷》,《惠州学
院学报(社会科学版)
》2002 年第 5 期。
曹炼、陈学斌、廖海燕:
《普通话水平测试中词汇、语法规范的探讨》,
《华中师范大学学报
(人文社会科学版)2003 年专集》。
柴省三:《汉语水平口试信度的理论与实证研究》,《语言教学与研究》2003 年第 4 期。
陈乃华:
《国家语委和国家教委联合召开“七五”期间语言文字工作规划会议》,
《语文建设》
1986 年第 6 期。
陈小燕、刘慧:
《“普通话水平测试用朗读作品”字种数及音节覆盖率的计量研究》
,《广西师
范大学学报(哲学社会科学版)
》2012 年第 4 期。
陈章太:《语言规划研究》,商务印书馆 2005 年版。
陈章太:《略论汉语口语规范》,《中国语文》1983 年第 6 期。
陈章太:《普通话词汇规范问题》,
《中国语文》1996 年第 3 期。
陈章太:《论普通话水平测试等级标准》,《语言文字应用》1997 年第 3 期。
陈章太:《关于普通话水平测试的效度问题》,《中国语文测试》( 香港) 2002 年第 1 期。
程明:
《普通话水平测试试卷的科学编制及规范使用》,《语言文字应用》1997 年第 3 期。
戴梅芳主编:《普通话水平测试研究》,语文出版社 1997 年版。
戴梅芳:
《普通话水平测试研究综述》,戴梅芳主编《普通话水平测试研究》
,语文出版社 1997
年版。
《纲要》朗读作品选编课题组(刘彦执笔):《关于普通话水平测试用“朗读作品”的分析
报告》,《语言文字应用》2004 年第 3 期。
高廉平:
《“方言语调”及判定》,
《四川师范学院学报(哲学社会科学版)》1998 年第 3 期。
《关于颁布〈普通话水平测试等级标准(试行)的通知〉
》(国语[1997]64 号),教育部语
言文字应用管理司编《新时期语言文字法规政策文件汇编》
,语文出版社 2005 年版。
桂诗春:《语言测试:新技术与新理论》,《外语教学与研究》1989 年第 3 期。
《国家语言文字工作十年规划和“八五”计划纲要》
,王均主编《当代中国的文字改革》,当
代中国出版社 1995 年版。

137
国家语言文字工作委员会普通话培训测试中心编制:
《普通话水平测试实施纲要》,商务印书
馆 2004 年版。
国家语言文字工作委员会普通话培训测试中心编:《首届全国普通话水平测试学术研讨会论
文集》,语文出版社 2003 年版。
国家语言文字工作委员会普通话培训测试中心编:《第二届全国普通话水平测试学术研讨会
论文集》
,商务印书馆 2006 年版。
国家语言文字工作委员会普通话培训测试中心编:《第三届全国普通话水平测试学术研讨会
论文集》
,语文出版社 2009 年版。
国家语言文字工作委员会普通话培训测试中心编:《第四届全国普通话培训测试学术研讨会
论文集》
,语文出版社 2010 年版。
国家语言文字工作委员会普通话培训测试中心编:《第五届全国普通话培训测试学术研讨会
论文集》
,2012 年(会议论文集,未出版)。
国家语言文字工作委员会普通话培训测试中心、
《语言文字应用》编辑部合编:
《普通话水平
测试的理论与实践》,商务印书馆 1998 年版。
《国民经济和社会发展第九个五年计划期间国家语言文字工作计划》,《语文建设》1996 年
第 9 期。
韩其洲:《国家普通话测试回顾与展望——纪念开展普通话水平测试 15 周年》,国家语言文
字工作委员会普通话培训测试中心编《第四届普通话培训测试学术研讨会论文集》
,语文
出版社 2010 年版。
韩玉华:《香港考生在普通话水平测试“说话”中几种常见的偏误分析》,《语言文字应用》
2006 年第 3 期。
韩玉华:
《从认知语言学的角度浅析香港人普通话中的词汇偏误问题》,
《语言文字应用》2007
年增刊。
韩玉华:
《计算机辅助普通话水平测试试点地区的调查研究》
,《首都师范大学学报(社会科学
版)》2009 年增刊。
韩玉华:《普通话水平测试发展历程研究》,中国社会科学院研究生院博士学位论文,2012
年。
何文征:《加强普通话水平测试客观性》,《语文建设》1998 年第 9 期。
简启贤:《普通话水平测试单字试题中语素字对测试目标的影响》,
《语言教学与研究》2002
年第 4 期。
江蓝生:《简论语言文字立法的意义》,
《光明日报》2001 年 1 月 16 日,B04 版。
江友辉:
《PSC 单字、词语的计算机自动对比分析系统设计研究》,云南师范大学硕士学位论
文,2003 年。
教育部、国家语委关于印发《国家语言文字工作“十五”计划》的通知(教语用﹝2001﹞2

138
号)
,教育部语言文字应用管理司编《新时期语言文字法规政策文件汇编》,语文出版社
2005 年版。
教育部语言文字应用管理司编:《新时期语言文字法规政策文件汇编》,语文出版社 2005 年
版。
教育部语言文字应用管理司编:
《国家中长期语言文字事业改革和发展规划纲要(2012—2020
年)
》,语文出版社 2012 年版。
教育部语言文字应用管理司编:
《国家通用语言文字法律法规汇编》,语文出版社 2015 年版。
教育部语言文字应用管理司、中国语文现代化学会主编:
《新时期语言文字工作记事(1978~
2003)》,语文出版社 2005 年版。
金慧宁:《我们测试普通话的标准和方法》,
《语文建设》1988 年第 5 期。
金艳、郭杰克:
《大学英语四、六级考试非面试型口语考试效度研究》,
《外语界》2002 年第
5 期。
康健:
《普通话水平测试时间长度探析》,《成都教育学院学报》2003 年第 1 期。
雷峻:
《计算机辅助普通话测试的问题思考及技术对策》,
《武汉理工大学学报》2010 年第 7
期。
李德龙:《计算机辅助普通话水平测试“命题说话”评分标准的比较与探索》,《语言文字应
用》2014 年第 3 期。
李根芹:《普通话水平测试(PSC)要求简化多音字》
,《语文学刊》2002 年第 6 期。
李海英:《普通话水平测试(PSC)的社会语言学阐释》,齐鲁书社出版社 2005 年版。
李海英:
《PSC 测试能力构成及其影响因素的社会语言学分析》,国家语言文字工作委员会普
通话培训测试中心编《第四届全国普通话培训测试学术研讨会论文集》
,语文出版社 2010
年版。
李洪亮:《高校计算机辅助普通话水平测试规范化研究》,
《中国考试》2011 年第 10 期。
李清华:《论交际测试中的“真实性”》
,《外语界》2001 年第 6 期。
李翔、陈丽娟:
《浅谈行政手段在普通话水平测试中的保证作用》,云南省普通话水平测试中
心编《普通话水平测试工作文集》,语文出版社 1996 版。
李筱菊:《语言测试科学与艺术》,湖南教育出版社 1997 年版。
李宇明:
《关于普通话测试的思考》,上海市普通话培训测试中心编《普通话水平测试研究》

上海教育出版社 2002 年版。
李宇明:
《论普通话培训测试手段的现代化(代序)》
,国家语言文字工作委员会普通话培训测
试中心编《第二届全国普通话水平测试学术研讨会论文集》
,商务印书馆 2006 年版。
厉兵:
《普通话测试可行性分析》,
《语文建设》1988 年第 4 期。
廖广莉:《普通话水平测试中“朗读”扣分标准刍议》,《湘南学院学报》2004 年第 1 期。
廖平胜:《考试学原理》,华中师范大学出版社 2003 年版。

139
林茂灿、颜景助:《普通话的轻声与轻重音》,《语言教学与研究》1990 年第 3 期。
林杏光:《词汇语义和计算语言学》,语文出版社 1999 年版。
刘导生:《新时期的语言文字工作》,《语文建设》1986 年第 1、2 期。
刘冬冰:
《关于〈“PSC”大纲〉中“会话”项的思考》,
《河南教育学院学报(哲学社会科学
版)》2000 年第 1 期。
刘洪超、姜岚:
《PSC 机测与人工测试对比分析》,《现代语文(文学研究)》2011 年第 5 期。
刘慧:《对“选择判断”中“语序或表达形式判断”项的建议》,国家语言文字工作委员会普
通话培训测试中心编《第三届全国普通话水平测试学术研讨会论文集》
,语文出版社 2009
年版。
刘惠琼:《普通话水平未达二级乙等应试群的音错调查及相关表现特征分析》,《广州大学学
报(社会科学版)
》2009 年第 7 期。
刘健:
《普通话音系与 PSC 试题音子比率研究》,南京师范大学硕士学位论文,2005 年。
刘俐李:《普通话水平测试标准的音位学思考》,
《语文研究》2001 年第 1 期。
刘庆升:《计算机辅助普通话发音评测关键技术研究》,中国科技大学博士学位论文,2010
年。
刘庆升、魏思、胡郁、郭武、王仁华:
《基于语言学知识的发音质量评价算法改进》,
《中文
信息学报》2007 年第 4 期。
刘润清、韩宝成编著:《语言测试和它的方法》,外语教学与研究出版社 1991 年版。
刘照雄主编:《普通话水平测试大纲(修订本)》
,吉林人民出版社 1994 年版。
刘照雄主编:《普通话水平测试大纲(新修订本)》吉林人民出版社,2002 年版。
刘照雄:《推广普通话的重要举措——普通话水平测试简论》,
《语言文字应用》1994 年第 4
期。
刘照雄:《普通话水平测试的构想与实施》,
《语文建设》1996 年第 2 期。
刘照雄:《〈普通话水平测试大纲〉的编制和修订》,《语言文字应用》1997 年第 3 期。
刘照雄:《〈普通话水平测试实施纲要〉概述》,《语言文字应用》2004 年第 3 期。
刘照雄:《再论普通话水平测试的性质与特点》,
《语言文字应用》2008 年第 1 期。
卢开磏:《云南普通话水平测试的回顾与思考》,
《语文建设》1997 年第 5 期。
卢开磏:《普通话水平测试的经验、问题和对策》,《玉溪师专学报(社会科学版)》1998 年
第 2 期。
鲁允中:《普通话水平测试刍议》,
《语文建设》1987 年第 3 期。
马圣霞:《对 PST 中“命题说话”测试项评分系统改革的设想》,《海南师范学院学报(社会
科学版)
》2005 年第 3 期。
毛世桢:
《从 PSC 重新审视普通话》,国家语言文字工作委员会普通话培训测试中心编《首届
全国普通话水平测试学术研讨会论文集》
,语文出版社 2003 年版。

140
孟晖:
《从普通话水平测试谈新时期普通话的语音规范》,
《语言文字应用》2000 年第 1 期。
孟晖:
《普通话中儿母的“类”和“值”的语音规范》
,《北华大学学报(社会科学版)》2012
年第 5 期。
孟晖:
《普通话水平测试员评价标准研究》,中国社会科学院研究生院博士学位论文,2013
年。
倪海曙:《普通话要通过教学才能推广》,《倪海曙语文论集》,上海教育出版社 1991 年版。
聂丹:
《普通话水平测试研究概说》,语文出版社 2012 年版。
聂丹:
《基于概化理论的 PSC 分数误差探析》,国家语言文字工作委员会普通话培训测试中
心编《第四届全国普通话水平测试学术研讨会论文集》
,语文出版社 2010 年版。
聂丹:
《汉语口语测试任务难度影响探究》,中国社会科学院研究生院博士学位论文,2010
年。
聂丹:
《普通话水平测试话题难度及影响因素分析》,
《考试研究》2011 年第 3 期。
欧洲理事会文化合作教育委员会编:《欧洲语言共同参考框架:学习、教学、评估》,刘骏、
傅荣主译,外语教学与研究出版社 2008 年版。
齐影:
《对各省〈普通话水平测试评分细则〉中一、二项的思考》,
《语言文字应用》2007 年
增刊。
钱华:
《普通话测评“说话”项负面因素探析》,
《龙岩师专学报》2002 年第 4 期。
钱华:
《普通话水平测试“说话”项若干问题的分析与对策》,国家语言文字工作委员会普
通话培训测试中心编《首届全国普通话水平测试学术研讨会论文集》
,语文出版社 2003
年版。
钱华:
《普通话测评“时间限制”问题刍议》,《湖州师范学院学报》2003 年第 4 期。
钱华:《PSC“说话”测试的学理依据与界域定位》
,《浙江海洋学院学报(人文科学版)》2006
年第 3 期。
钱华:
《PSC 词汇语法评定与语用原则》,《长春师范学院学报》2006 年第 5 期。
钱华:
《PSC“说话”测试项的现状与改革设想》
,《绍兴文理学院学报》2007 年第 4 期。
乔丽华、朱青春:
《关于计算机辅助普通话水平测试的社会评估报告》,国家语言文字工作委
员会普通话培训测试中心编《第五届全国普通话培训测试学术研讨会论文集》
,2012 年(未
刊)

全国人大法律委员会:
《全国人大法律委员会关于〈中华人民共和国国家通用语言文字法(草
案)
〉审议结果的报告》,全国人大教科文卫委员会教育室、教育部语言文字应用管理司编
《中华人民共和国国家通用语言文字法学习读本》
,语文出版社 2001 年版。
全国人大教科文卫委员会教育室、教育部语言文字应用管理司编:
《中华人民共和国国家通
用语言文字法学习读本》,语文出版社 2001 年版。
单红、王颐嘉、乔丽华:
《普通话水平测试评分细则研究》,国家语言文字工作委员会普通话

141
培训测试中心编《第三届全国普通话水平测试学术研讨会论文集》,语文出版社 2009 年版。
上海市语言文字水平测试中心:《语言文字水平测试研究》,立信会计出版社 2010 年版。
沈倍蕾、毛世桢:
《普通话双音节非轻声词的轻重格式和声调组合》,第三届全国普通话水平
测试学术研讨会论文(未刊),2007 年。
宋欣桥编:
《普通话水平测试员实用手册》,商务印书馆 2000 年版。
宋欣桥编:
《普通话水平测试员实用手册(增订本)》
,商务印书馆 2004 年版。
宋欣桥主编:《香港普通话测试研究与发展》,商务印书馆(香港)有限公司 2007 年版。
宋欣桥:《普及普通话的语音标准框架》,《语文建设》1991 年第 10 期。
宋欣桥:《普通话水平测试评分的几个问题》,《语言文字应用》1997 年第 3 期。
宋欣桥:《普通话水平测试的评分差异》,《语文建设》1998 年第 9 期。
宋欣桥:《普通话水平的语言表征与相应的测试等级》,《语言文字应用》2000 年第 3 期。
宋欣桥:
《试论普通话水平测试(PSC)》,国家语言文字工作委员会普通话培训测试中心编《首
届全国普通话水平测试学术研讨会论文集》,语文出版社 2003 年版。
宋欣桥:
《创建国家普通话水平测试(PSC)的理论体系——纪念普通话水平测试(PSC) 开展
15 周年》,国家语言文字工作委员会普通话培训测试中心编《第四届全国普通话水平测
试学术研讨会论文集》,语文出版社 2010 年版。
宋欣桥、齐影:
《试论普通话“一级甲等”的等级表征》,宋欣桥编《普通话水平测试员实用
手册(增订本)》,商务印书馆 2004 年版。
孙海娜:《略论〈普通话水平测试实施纲要〉中的可轻读词语》,《语言文字应用》2007 年
第 2 期。
孙海娜:《普通话水平测试“一级甲等”评审的若干问题》,《语言文字应用》2007 年第 4
期。
孙海娜:
《浅析〈计算机辅助普通话水平测试评分试行办法〉
》,《语言文字应用》2010 年第
4 期。
孙修章:《“普通话水平测试标准”的研制与实践》,《语言文字应用》1992 年第 1 期。
田皓:
《普通话水平测试中的轻声评判》,《云梦学刊》2000 年第 6 期。
田晋音:《普通话水平测试中双音节词的轻重音问题刍议》,《益阳师专学报》1999 年第 2
期。
佟乐泉:《不断提高普通话水平测试的科学水平》,《语言文字应用》1997 年第 3 期。
童效杰:
《普通话水平测试环境影响被测的调查与分析》,
《玉溪师范学报》2008 年第 10 期。
屠国平:《普通话水平测试说话项评分的几个具体问题》,
《绍兴文理学院学报(哲学社会科
学版)》2002 年第 3 期。
屠国平:
《制定“PSC 评分细则”的原则与方法》,国家语言文字工作委员会普通话培训测试
中心编《首届全国普通话水平测试学术研讨会论文集》,语文出版社,2003 年版。

142
屠国平:《PSC 评分偏误再探》,《绍兴文理学院学报(哲学社会科学版)》2006 年第 4 期。
汪家镠:《关于〈中华人民共和国国家通用语言文字法(草案)的说明〉》,全国人大教科文
卫委员会教育室、教育部语言文字应用管理司编《中华人民共和国国家通用语言文字法学
习读本》
,语文出版社 2001 年版。
汪磊:
《试论普通话水平测试语料的选择原则》,
《语言文字应用》2005 年第 2 期。
汪顺玉、彭康洲:《语言测试真实性维度的再认识——兼谈考试效度的诠释》,《重庆工学院
学报》2009 年第 8 期。
汪张龙、易中华:
《计算机智能普通话水平测试系统原理与要求》,国家语言文字工作委员会
普通话培训测试中心编《第三届全国普通话水平测试学术研讨会论文集》
,语文出版社
2009 年版。
王晖:
《普通话水平测试阐要》,商务印书馆 2013 年版。
王晖:
《1994 年以来普通话水平测试研究概述》
,《语言文字应用》2003 年第 2 期。
王晖:
《〈普通话水平测试大纲〉修订的若干问题》,教育部语言文字应用研究所编《语言文
字应用研究论文集Ⅱ》
,语文出版社 2004 年版。
王晖:
《略论普通话水平测试的评分系统》,
《语言文字应用》2004 年第 3 期。
王晖:
《略论普通话水平测试中的词汇、语法问题》,国家语言文字工作委员会普通话培训测
试中心编《第二届全国普通话水平测试学术研讨会集》
,商务印书馆 2006 年版。
王晖:
《普通话水平测试评分细则论析》,《语言文字应用》2007 年第 4 期。
王晖:
《文白异读与语音规范》,《语言文字应用》2012 年第 2 期。
王晖:
《必然性与或然性——论“啊”音变的教学与测试》,《长江学术》2012 年第 2 期。
王晖、曹昭、云天骄:
《普通话水平测试发展历程的分期》,
《语言文字应用》2013 年第 4 期。
王佶旻:《汉语口语测试理论与实践》,北京师范大学出版社 2012 年版。
王佶旻:《外语口语测验的历史发展综述》,
《中国考试》2010 年第 3 期。
王均主编:
《当代中国的文字改革》,当代中国出版社 1995 年版。
王理嘉:《从官话到国语和普通话——现代汉民族共同语的形成及发展》,《语文建设》1999
年第 6 期。
王明东:《精确与模糊——也谈普通话的口语测试》,
《语文建设》1996 年第 5 期。
王芹春:《PSC 现场评定与录音评定的对比研究》,《菏泽医学专科学校学报》2012 年第 3 期
王渝光:《实验语音学:普通话水平测试等级标准》,云南大学出版社 2011 年版。
王渝光、杨瑞鲲、李洪平:
《语言信息处理与普通话水平测试》,云南大学出版社 2010 年版。
王渝光、陈典红、杨万兵:
《普通话水平测试题库建设的理论与实践》,
《语言文字应用》1997
年第 3 期。
王渝光、杨万兵:《普通话水平测试规范试卷的研制》,戴梅芳编《普通话测试研究》
,语文
出版社 1997 年版。

143
王渝光、姚一斌、李竹屏、陈典红:《普通话水平测试等级标准的声学研究和数据库建设》,
国家语言文字工作委员会普通话培训测试中心编《第二届普通话水平测试学术研讨会论文
集》
,商务印书馆 2006 年版。
王渝光、姚一斌、杨瑞鲲、蔡彦鹏、袁耘毅、李竹屏、陈典红:《计算机辅助普通话水平测
试评分系统研究》
,国家语言文字工作委员会普通话培训测试中心编《第三届普通话水平
测试学术研讨会论文集》,语文出版社 2009 年版。
王渝光、姚一斌、张雷、杨志明:
《现行普通话水平测试的质量评析与改进——兼答〈方言
区普通话测评中的负面因素〉一文》
,《语言文字应用》2002 年第 4 期。
王振亚:《现代语言测试模型》,河北大学出版社 2009 年版。
王志洁、冯胜利:《声调对比法与普通话双音组的重音类型》,
《语言科学》2006 年第 1 期。
魏建斌:
《计算机辅助普通话水平智能测试规范管理探究》,
《甘肃高师学报》2011 年第 2 期。
魏丽杰:《普通话水平测试“儿化”的把握》,《语文学刊》2006 年第 12 期。
魏思、刘庆升、胡郁、王仁华:
《普通话水平测试电子化系统》,
《中文信息学报》2006 年第
6 期。
文秋芳:《英语口语测试与教学》,上海外语教育出版社 1999 年版。
吴慧:
《影响普通话水平测试成绩的非语音因素探讨》,国家语言文字工作委员会普通话培训
测试中心编《第五届全国普通话培训测试学术研讨会论文集》,2012 年(未刊)。
吴积才、王渝光:《普通话标准化考试的理论与实践》,《语文建设》1989 年第 1 期。
吴静:
《CTT、IRT 和 GT 三种测验理论之比较》,
《黑龙江教育学院学报》2008 年第 12 期。
吴甜:
《计算机辅助普通话水平测试专用测试室标准化建设研究》
,国家语言文字工作委员会
普通话培训测试中心编《第五届全国普通话培训测试学术研讨会论文集》
,2012 年(未刊)

吴雪青:《PSC 朗读项“语调偏误”判定的依据》,《玉溪师范学院学报》2005 年第 8 期。
吴雪青:《关于 PSC 说话项测试的理性思索》,《西南科技大学学报》2008 年第 2 期。
伍铁平:《模糊语言学》,上海外语教育出版社 1999 年版。
伍巍:
《关于普通话水平测试内容与方法的思考》,《学术研究》2002 年第 12 期。
谢晖:
《普通话水平测试中轻声词语的规范》
,《首都医科大学学报(社会科学版)》,2011 年
增刊。
谢小庆、李航:
《关于 HSK(初中等)长度适当性的研究》,《语言教学与研究》1999 年第 1
期。
谢英:
《谈普通话水平测试中“词汇语法规范”项检测问题》,
《福建论坛(社科教育版)》2008
年专辑。
徐波、陈岩:《基于方言的 PSC 语音定性方法建构——以吴语甬江片方言为例》,
《浙江海洋
学院学报(人文科学版)》,2012 年第 4 期。
许光烈:《对普通话水平测试中字词测试的思考》,《汉字文化》2001 年第 2 期。

144
许光烈:《试论普通话水平测试的现存问题及对策》,
《广州大学学报(社会科学版)》
,2003
年第 8 期。
许嘉璐:《未成集——论新时期语言文字工作》,语文出版社 2000 年版。
许嘉璐:
《普通话水平测试研究序》
,戴梅芳主编《普通话水平测试研究》,语文出版社 1997
年版。
许嘉璐:《开拓语言文字工作新局面,为把社会主义现代化建设事业全面推向 21 世纪服务》
《语文建设》1998 年第 2 期。
许艳丽:
《普通话水平测试中“儿化韵”的规范问题》,
《沧州师范学院学报》2001 年第 1 期。
许艳丽:
《普通话计算机辅助测试与人工测试的差异比较》,
《沧州师范学院学报》2012 年第
2 期。
言实(王晖笔名):《关于普通话水平测试用普通话词语表的编制》
,《语言文字应用》2004
年第 3 期。
杨惠中、桂诗春:《语言测试的社会学思考》,《现代外语》2007 年第 4 期。
杨莉芳:《近二十年口语测试研究中存在的主要问题》,《外语教学》2006 年第 1 期。
杨绍林:
《谈谈普通话水平测试试卷的拟制》,
《成都师范高等专科学校学报》1996 年第 2 期。
杨绍林:《论普通话水平测试中轻声词语读音的判定》,国家语言文字工作委员会普通话培
训测试中心编《第三届全国普通话水平测试学术研讨会论文集》
,语文出版社 2009 年版。
杨绍林:
《论普通话水平测试中 AABB 式形容词读音的判定标准》
,《西华大学学报(哲学社会
科学版)
》2009 年第 5 期。
杨志明、张雷:
《用多元概化理论对普通话的测试》,
《心理学报》2002 年第 1 期。
姚喜双:《〈大纲〉修订和〈纲要〉研制的思考》
,《语言文字应用》2004 年第 3 期。
姚喜双:《推普工作的重要抓手——谈依法推进的普通话水平测试》,《语言文字应用》2010
年第 3 期。
姚喜双:《普通话水平测试若干问题研究》,
《云南师范大学学报(哲学社会科学版)》2011
年第 6 期。
姚喜双、韩玉华、聂丹、黄霆玮、孟晖:《普通话水平测试概论》,高等教育出版社 2011 年
版。
姚喜双、韩玉华、聂丹、黄庭玮、孟晖:《普通话水平测试常用术语》,语文出版社 2014 年
版。
姚一斌:
《普通话水平测试误差探究》,
《云南师范大学学报(哲学社会科学版)》2001 年第 8
期。
叶军、王颐嘉、周鸣之、乔丽华:
《计算机辅助普通话水平测试实施研究》,
《语言文字应用》
2007 年第 6 期。
易敏、怡梦、李佳颖:《关于儿化词语认知与语感的调查》,国家语言文字工作委员会普通

145
话培训测试中心编《第三届全国普通话水平测试学术研讨会论文集》
,语文出版社 2009
年版。
袁贵仁:《再接再厉,团结奋进,开创普通话水平测试工作新局面——在全国普通话水平测
试管理工作会议上的讲话》
,教育部语言文字应用管理司、国家语委普通话培训测试中心
编《全国普通话水平测试管理工作会议资料汇编》
,语文出版社 2004 年版。
云南省普通话水平测试中心编:《普通话水平测试工作文集》,语文出版社 1996 年版。
云南省普通话培训测试中心“普通话水平测试题库系统的改进与提高”课题组:
《普通话水
平测试题库系统的改进与提高实验研究报告》
(未刊)2001 年。
云天骄:
《普通话水平测试(PSC)和香港普通话水平考试(PSK)题型比较研究》
,中国社会
科学院研究生院硕士学位论文,2013 年。
张传曾:《普通话等级测试标准的音位学阐释》,
《语文建设》1998 年第 11 期。
张茀:
《云南省普通话水平测试科研述评》,云南省普通话水平测试中心编著《普通话水平测
试工作文集》
,语文出版社 1996 版。
张凯:
《语言测试理论及汉语测试研究》,商务印书馆 2006 年版。
张雷、侯杰泰、何伟杰、文剑冰、王渝光:
《普通话测试的录音评分可行性、信度及经济效
率》
,《心理学报》2001 年 2 期。
张蒲荣:《普通话水平测试中存在的问题》,
《宁波大学学报(教育科学版)》2002 年第 5 期。
章石芳:《“方言语调”探讨之一:关于词语轻重音模式》,《福建论坛(人文社会科学版)》
1999 年第 6 期。
赵伟国:
《信息技术与普通话水平测试》,国家语言文字工作委员会普通话培训测试中心编《首
届全国普通话水平测试学术研讨会论文集》,语文出版社 2003 年版。
赵伟国:
《PSC 计算机辅助测试模式初探》,国家语言文字工作委员会普通话培训测试中心编
《第二届全国普通话水平测试学术研讨会》,商务印书馆 2006 年版。
赵欣:
《普通话测试与教学中音变常见问题及对策》,
《零陵学院学报》2002 年第 4 期。
赵则玲:
《普通话水平测试中的“轻声”问题》,
《浙江师范大学学报(社会科学版)》2000 年
第 5 期。
《中国大百科全书·语言文字卷》
,中国大百科全书出版社 1988 年版。
中国社会科学院语言研究所词典编辑室编:
《现代汉语词典》,商务印书馆 2012 年版。
仲哲明:《普通话水平测试若干问题的讨论》,《语言文字应用》1997 年第 3 期。
周梅:
《普通话水平测试手段研究》,中国社会科学院研究生院博士学位论文,2014 年。
周中兴:《普通话语音测试中的目标无关性错误研究》,华东师范大学硕士学位论文,2007
年。
朱爱萍:
《对太原普通话中“语调偏误”的评分把握》,
《太原大学教育学院学报》2012 年增
刊。

146
朱楚宏:《关于普通话水平测试中方言词语的认定》,
《华中师范大学学报(人文社会科学版
2003 年专集》。
朱楚宏:
《试论单字试题在 PSC 中的语言学意义》,国家语言文字工作委员会普通话培训测试
中心编《第二届全国普通话水平测试学术研讨会》
,商务印书馆 2006 年版。
朱丽红:
《普通话水平测试的试卷问题》,
《首都师范大学学报(社会科学版)》,2009 年增刊。
朱丽红:《普通话水平测试免测“选择判断”项实证研究》,《沈阳师范大学学报(社会科学
版)》2014 年第 2 期。
朱盈梅:《PSC 试卷单音节字词测试题结构分析》,首都师范大学硕士学位论文,2009 年。
庄守常:《中师生普通话考核标准问题的探讨》,
《语文建设》1987 年第 3 期。
庄守常:《相对性与确定性——谈普通话的口语测试》,《语文建设》1992 年第 9 期。
PSC 国家题库建设课题组:
《普通话水平测试国家题库制卷系统研制报告》,
《语言文字应用》
2005 年第 2 期。

【英文参考文献】
Lyle F. Bachman,Fundamental Considerations in Language Testing,Shanghai Foreign

Language Education Press,1999.

Lyle F. Bachman,Adrian S. Palmer,Language Testing in Practice,Shanghai Foreign

Language Education Press,1999.

J.Charles Alderson,Caroline Clapham,Dianne Wall, Language Test Construction and


Evaluation ,Oxford University Press﹠ Foreign Langue Teaching and Reasearch
Press,2000.

【互联网资料】
《广播电视编辑记者、播音员主持人资格管理暂行规定》(国家广播电影电视总局令第 26
号),中华人民共和国中央人民政府网,http://www.gov.cn/gongbao/ content/2005/
content_63223.htm。
《国家语言文字工作“十一五”规划》
(教语用[2007]2 号)
,中华人民共和国教育部政府门
户网,http:// www.moe.edu.cn/publicfiles/business/htmlfiles/moe/moe_800/201001
/xxgk_78577.html。
《计算机辅助普通话水平测试试点业务指导意见(试行)》
(国语普测[2010]8号),全国普通
话培训测试信息资源网,http://www.cltt.org/zhengcefagui/20101210105.html。
《计算机辅助普通话水平测试评分试行办法》
(教语用司函[2009]5 号),全国普通话培训

测试信息资源网,http://www.cltt.org/zhengcefagui/2010053116.html。
《坚定不移沿着中国特色社会主义道路前进 为全面建成小康社会而奋斗》
,人民网(中国
147
共产党新闻网),http://cpc.people.com.cn/n/2012/1118/c64094-19612151.html。
《教育部历史沿革与职能》,新华网,http://news.xinhuanet.com/zhengfu/2003-02/25/
content_744527.htm 。
《教育部语用司关于推进计算机辅助普通话水平测试工作等有关问题的通知》(教语用司函
[2010]72号),中华人民共和国教育部政府门户网,http://www.moe.
gov.cn/s78/A18/yys_ left/moe_803/ s3133/201309/ t20130923_157634.html。
《中共中央关于深化文化体制改革推动社会主义文化大发展大繁荣若干重大问题的决定》,
人民网(中国共产党新闻网),http://cpc.people.com.cn/GB/67481/94156/231018/。
《中华人民共和国立法法》
(根据2015年3月15日第十二届全国人民代表大会第三次会议《关
于修改〈中华人民共和国立法法〉的决定》修正),中国人大网,http://www.npc.gov.cn/
npc/dbdhhy/12_3/2015-03/18/content_1930713.htm。

【其他资料】
教育部语言文字应用管理司文件《计算机辅助普通话水平测试操作规程(试行)》
(教语用司
函[2008]23 号。
北京、天津、河北、山西、内蒙古、辽宁、吉林、上海、江苏、浙江、安徽、福建、江西、
山东、河南、湖北、广东、广西、重庆、四川、贵州、云南、甘肃等 23 省(自治区、直
辖市)《评分细则》。

148
附录 A:教育部门普通话水平测试
政策文件依据简表
序号 时间 文件名称 发文单位 依据条文
教师和学生接受普通话水平测试和等级认定的
范围和办法,按国家语委、国家教委、广电部
关于加强高等院校 国家教委
《关于开展普通话水平测试工作的决定》
(国语
语言文字规范化工
1 1995.7 [1994]43 号)的要求执行,由各高等院校所在
作的几点意见(教高 国家语委
省(自治区、直辖市)的普通话水平测试委员
﹝1995﹞11 号)
会组织实施。与口语表达密切相关专业今后招
收新生应逐步实行加试普通话口语。
师范类专业和与口语表达密切相关的专业毕业
年级学生的普通话水平应达到二级乙等以上,
关于印发《职业中学 国家教委
其中北方话区学校毕业年级学生应有 40%以上
普通话教学基本要
2 1996.9 达到二级甲等以上,南方方言区学校毕业年级
求》的通知(教职 国家语委
学生应有 20%以上达到二级甲等以上。
﹝1996﹞14 号)
一般专业毕业年级学生的普通话水平应达到三
级甲等以上。
申报 1998 年对外汉语教师资格的人员,必须获
国家语委
得国家语言文字工作委员会颁发的二级甲等以
关于对 1998 年申报 语用司
上普通话水平等级证书。暂没有取得普通话水
对外汉语教师资格
平等级证书的,1998 年可申报对外汉语教师资
3 1998.5 人员进行普通话水 教育部对外
格,但必须获得相应的普通话水平等级证书后,
平测试的通知(国语 汉语教师资
才能领取对外汉语教师资格证书。
管﹝1998﹞5 号) 格审查委员
决定自今年起对申报对外汉语教师资格人员进
会办公室
行普通话水平测试。
教育行政部门公务员和学校管理人员的普通话
水平应不低于三级甲等,新录用公务员和学校
管理人员的普通话水平亦应达到上述标准。
各级各类学校和幼儿园以及其他教育机构的教
师应不低于二级乙等,其中语文教师和对外汉
关于进一步加强学
教育部 语教师不低于二级甲等,语音教师不低于一级
校普及普通话和用
乙等。
4 2000.2 字规范化工作的通
师范专业和其他与口语表达关系密切的专业的
知(教语用﹝2000﹞
国家语委 学生的普通话水平应经测试达到规定的等级。
1 号)
以少数民族语言授课为主的民族学校的师生的
普通话水平要求,由当地教育行政部门和语言
文字工作部门规定,其中汉语课教师的普通话
水平应不低于三级甲等。
1954 年 1 月 1 日以后出生的教师和教育行政部

149
门公务员,师范专业和其他与口语表达密切相
关专业的学生,均应参加普通话培训和测试。
师范专业和其他与口语表达密切相关专业的学
生,普通话达不到合格标准者应缓发毕业证书。
教师和行政人员普通话水平全面达标且整体水
平明显高于一般学校。
教育部、国家语委关
教育部 坚持把普通话水平达标列入学生毕业条件,学
于开展语言文字规
生普通话水平在普遍达标的基础上有较高的一
5 2004.4 范化示范校创建活
级达标率。
动的意见(教语用
国家语委 以少数民族语言为主要教学语言的学校,以汉
﹝2004﹞4 号)
语为教学语言的教师全部达到省级教育行政部
门规定的普通话达标要求。
对语言应用有特殊要求的岗位的工作人员应当
达到相应的普通话等级要求。其中对教师和广
关于印发《关于进一 电系统播音员、节目主持人要逐步实行持普通
步发挥城市的中心 教育部 话等级证书上岗制度。党政机关公务人员,解
作用,全面推进语言 放军和武警指战员,商业、邮电、文化、铁路、
6 1999.2
文字工作的意见》的 交通、民航、旅游、银行、保险、医院等主要
通知(教语用 国家语委 服务性行业从业人员,至少应该达到普通话三
﹝1999﹞1 号) 级水平,少量以口语表达为职业、直接面向社
会公众的服务性行业从业人员(如站、场、车、
机、船等)应该达到二级以上水平。
市级普通话培训测试机构健全并有专职工作人
员(2 分);对相关行业人员开展普通话和文字
应用培训测试工作,严格管理,注重质量(3 分)

按有关文件要求对在职公务员进行培训,应培
训人员普通话水平达到规定等级(8 分);将普
通话合格作为录用公务员的一项条件(4 分)。
关于印发《一类城市
教育部 播音员、节目主持人普通话水平达到规定等级,
的语言文字工作评
并做到持普通话等级证书上岗(8 分)。
7 2000.2 估标准(试行)》的
对在职教师进行普通话培训,在职教师普通话
通知(教语用
国家语委 水平达到规定等级(6 分);将普通话合格作为
﹝2000﹞2 号)
对教师进行业务考核和录用教师的一项条件(4
分)
;师范专业和其他与口语表达关系密切相关
专业的学生,普通话水平达到规定等级(4 分)

公共服务行业特定岗位人员(广播员、解说员、
导游员、话务员等)普通话水平达到规定等级
(5 分)。
关于印发《〈一类城 经编制部门批准建立市级测试中心(1 分);测
市的语言文字工作 试中心有专职工作人员 2—3 名(1 分)
;专职工
评估标准(试行)〉 教育部 作人员 1 名(0.5 分);全市普通话培训测试工
8 2000.2
实施细则》的通知 语用司 作已经启动(1 分)
;遵守培训测试管理规定(1
分)
;违反有关规定,酌情扣分。
(教语用司 对公务员开展了普通话测试,增加 1 分;人事

150
﹝2000﹞2 号) 部门规定把普通话合格作为公务员录用的参考
条件(2 分);各机关录用公务员时把普通话合
格作为参考条件(2 分)。
播音员、节目主持人全部参加测试(4 分),80%
参加(3 分),50%参加(1 分);测试达标率 80%
(4 分),达标率 50%(2 分)
,达标率 30%(1 分)

已经实施等级证书上岗制度,增加 1 分。
在职教师 80%参加过测试(3 分)
,50%参加过测
试(2 分),30%参加过测试(1 分);在职教师
50%以上测试达标(1 分);在职教师 80%以上测
试达标,增加 1 分;将普通话合格列入教师业
务考核内容并已实施(2 分),半数以上学校开
始实施(1 分);将普通话合格作为录用教师资
格要求并已实施(2 分),半数以上学校开始实
施(1 分);师范专业学生经测试普通话水平达
到规定等级(2 分)
,80%达到规定等级(1 分);
其他与口语表达关系密切相关专业的学生经测
试普通话水平达到规定等级(2 分),80%达到规
定等级(1 分);50%达到规定等级(0.5 分)。
公共服务行业特定岗位人员(广播员、解说员、
导游员、话务员等)经测试 80%达到规定等级(3
分)
,50%达到规定等级(2 分);30%达到规定等
级(1 分)。
要加强普通话培训测试工作,提高普通话培训
测试的科学化水平。各级语言文字工作机构要
加强对普通话培训测试工作的管理,适应社会
对普通话培训测试的更大需求,使培训测试工
作更加科学化。
关于印发首届全国
“普通话水平测试”是依据《普通话水平测试
推广普通话宣传周
等级标准》和测试大纲,评价个人掌握普通话
9 1998.5 宣传提纲、宣传口号 国家语委
规范程度和运用普通话能力的一种语言考试。
的通知(国语
按照国家有关主管部门的要求,师范院校、职
﹝1998﹞29 号)
业中学将普通话达标列入学生毕业条件,教师、
播音员、节目主持人等岗位人员均应达到规定
的等级并逐步实行持普通话等级证书上岗制
度。根据推广普通话工作形势发展的需要,测
试范围将逐渐扩大。

(注:本表内容根据教育部语言文字应用管理司编《新时期语言文字法规政策文件汇编》摘

录,语文出版社 2005 年版。)

151
附录 B:其他行业系统普通话水平测试
政策文件依据简表
序号 时间 文件名称 发文单位 依据条文

播音、主持、影视演员岗位的从业人员必须参加普
通话水平测试并达到国家规定的标准。
广电系统的普通话水平测试工作在国家语委的指导
下,由广电部根据统一的标准和要求组织实施。为
加强对测试工作的领导,广电部和各省、自治区、
直辖市广电厅(局)应成立普通话水平测试工作领
关于建立广播电影
导小组。
电视系统普通话水 广电部
各省、自治区、直辖市广电厅(局)应组建本系统
平测试工作领导小
1 1997.3 的普通话水平测试站并接受广电厅(局)普通话水
组和测试站的通知 国家语委
平测试工作领导小组的管理和本地语委指导。1.测
(广发人字
试站的职责(略);2.测试站的组建条件(略);3.
﹝1997﹞146 号)
测试站人员组成(略)

各地语委应对组建广电系统普通话水平测试站以及
该站开展工作给予有力支持,认真履行检查、监督、
管理职责,以切实保证测试质量。各地广电部门应
积极争取各地语委的指导,积极推进本系统普通话
水平测试工作。
播音员、主持人的管理是政府行为,各厅(局)组
织(人事)部门、总编室要共同来抓;普通话测试
工作要与当地语委密切配合,及时得到他们的支持
和指导。
持证上岗工作的指导思想要明确。
关于进一步做好播 省级(含省级)以上台 1998 年 1 月起对符合条件的
音员主持人持证上 人员先实施持证上岗,剩下的人员在三年内逐步达
1997. 广电部
2 岗工作的几点意见 到持证上岗。地(市)
、县级台的播音、主持人员普
12 人事司
(广人专字 通话达标问题,各地差异较大,但总的一条是标准
﹝1997﹞397 号) 不能降低,各省应在 1998 年 6 月份以前提出本省地
县级台播音员、主持人达到等级标准和实行持证上
岗的目标。
今后新进播音员、主持人,普通话必须经测试达标。
三年内测试仍不能达标的原播音员、主持人也将离
岗。
关于在检察系统做 要积极开展普通话培训测试工作。要主动争取当地
最高人民
好推广普通话工作 教育部门、语言文字工作委员会等部门的支持和配
3 1999.5 检察院
的通知(﹝1999﹞ 合,在检察人员中开展普通话培训测试工作,采取
办公厅
高检办发第 35 号) 各种措施和方式,不断提高干警讲普通话的水平。
4 1999.5 关于开展国家公务 人事部 通过培训,原则要求 1954 年 1 月 1 日以后出生的公

152
员普通话培训的通 务员达到普通话三级甲等以上水平;对 1954 年 1 月
知(人发﹝1999﹞ 教育部 1 日以前出生的公务员不作达标的硬性要求,但鼓
46 号) 励努力提高普通话水平。
国家语委 对方言地区或使用方言以及普通话不熟练的公务
员,要在认真调查研究的情况下,实施针对性培训,
要结合公务员的业务实际,制定普通话培训的长期
规划、达到的标准以及测试办法。
开展公务员普通话培训,各地可根据实际情况,采
取灵活多样的方式进行,具备条件的地方,可以进
行普通话水平测试。各级教育行政部门、语言文字
工作部门应在普通话培训、测试方面给予支持协助。
除需使用方言、少数民族语言和外语的场合外,金
中共中央
融系统所有员工在工作中均需使用普通话。直接面
关于加强金融系统 金融工委
向客户服务的员工,普通话水平应不低于国家语言
语言文字规范化工
5 2000.5 文字工作委员会颁布的《普通话水平测试等级标准》
作的通知(金融工 教育部
规定的三级甲等。
发﹝2000﹞8 号)
2001 年底前,临柜员工普通话水平应当达标,未达
国家语委
标的必须进行再培训。
除确需使用方言、少数民族语言和外国语言的场合
外,铁路系统的所有职工在工作中均应使用普通话。
直接面向旅客、货主服务的职工的普通话水平一般
应不低于国家语言文字工作委员会颁布的《普通话
水平测试等级标准》规定的三级甲等;站、车广播
关于进一步加强铁 铁道部 员的普通话水平应不低于二级甲等。
路系统语言文字规 各级管理部门应将普通话水平达标列入有关岗位的
6 2000.5 范化工作的通知 教育部 技术标准;从 2003 年起,站、车广播员应持不低于
(铁科教﹝2000﹞ 二级甲等的普通话等级证书上岗;铁路系统师范学
72 号) 国家语委 校的毕业生应按教育部和国家语委规定取得普通话
二级乙等以上的等级证书。
地方教育行政部门和语言文字工作部门要主动配合
铁路部门,在培训、测试、检查和编写教材、提供
宣传材料等方面给予支持。

除需要使用方言、少数民族语言和外语的场合外,
邮政系统所有员工在工作中均需使用普通话。营业
国家 员、投递员、邮储业务员、报刊发行员以及工作在

关于加强邮政系统 邮政局 呼叫中心、信息查询等直接面向用户服务的职工,


普通话水平不低于国家语言文字工作委员会颁布的
2000.6 语言文字规范化工
7 《普通话水平测试等级标准》规定的三级甲等;邮
. 作的通知(国邮联 教育部
运指挥调度人员、检查监督人员也应达到相应水平。
﹝2000﹞304 号)
各邮政部门应将普通话水平达标列入有关岗位的技
国家语委
术标准。
到 2001 年底,直接面向用户服务的职工普通话水平
应当达标,未达标的必须进行再培训。
除需要使用方言、少数民族语言和外语的场合外,
8 2001.4 关于认真做好信息 信息
信息产业系统的所有员工在工作中均需使用普通
153
产业系统语言文字 产业部 话。直接面向客户服务的一般员工,普通话水平应
规范化工作的通知 不低于国家语委颁布的《普通话水平测试等级标准》
(信部联办 教育部 规定的三级甲等标准;话务员的普通话水平不低于
﹝2001﹞242 号) 二级乙等。

国家语委 信息产业系统各级管理部门应将普通话水平达标列
入有关岗位的技术标准。
各地教育行政部门和语言文字工作部门要积极主动
为企业开展语言文字规范化工作提供业务指导和帮
助,在培训、测试、检查和编写教材、提供宣传材
料等方面给予支持。
除确需使用方言、少数民族语言和外语的场合外,
文化行政部门的公务员在工作中均应使用普通话。
公务员普通话水平一般应不低于国家语言文字工作
委员会颁布的《普通话水平测试等级标准》规定的
三级甲等。凡达不到标准的,要按照人事部、教育
关于在文化系统贯 部、国家语言文字工作委员会《关于开展国家公务
文化部 员普通话培训的通知》(人发﹝1999﹞46 号)要求
彻实施《中华人民
进行培训。
共和国国家通用语
9 2001.6 教育部 直接面向公众服务的工作人员应当具备使用普通话
言文字法》的通知
的能力,其中解说员、广播员经过培训应当达到二
(文政法发
国家语委 级甲等以上。
﹝2001﹞20 号)
1954 年 1 月 1 日以后出生的话剧演员和话剧表演专
业毕业生应接受普通话水平测试,达到普通话一级
水平,并逐步实行持证上岗制度。
教育行政部门和语言文字工作部门在培训、测试、
检查和编写教材、提供宣传材料等方面应予以大力
支持。
关于学习贯彻《中
华人民共和国国家 中国人民
演员、播音员、节目主持人等,普通话水平应达到
10 2001.6 通用语言文字法》 解放军
国家规定的等级标准。
的意见(﹝2001﹞ 总政治部
政宣字 12 号)

(注:本表内容根据教育部语言文字应用管理司编《新时期语言文字法规政策文件汇编》摘

录,语文出版社,2005年版。

154
后 记

本文是在导师姚喜双教授的指导下完成的,我首先要表达的是对姚老师深深的感激之情。
2011 年我考取了姚老师的博士研究生,但我和姚老师的师生“缘分”远早于此。2001 年姚
老师调任教育部语用所副所长兼国家语委普通话培训测试中心主任,是我的领导和“工作上
的导师”,姚老师把 30 岁的我推上国家级普通话水平测试员资格考核培训班讲台。2002 年
他提议我担任国家语委“十五”重点课题“普通话水平测试研究”的项目统筹和新《普通话
水平测试大纲》的学术秘书,指导我把研究方向聚焦于普通话水平测试领域。可以说 2011
年入师门之前,我已亲炙姚师教诲指导,获得学术锻炼,实属幸运!2011 年在考取姚老师
博士研究生的同时,我被选派参加中央国家机关干部人才援疆工作,这是一种全新的挑战。
老师一方面鼓励我不负重托、努力工作,另一方面为我制订有针对性的培养计划,争取做到
工作学业兼顾,还特别给予我的家庭以关怀,为我缓解后顾之忧。三年援疆期间,我在工作
和学术上获得一定成绩,荣立二等功,还出版了学术专著,这都离不开姚老师全方位的指导
和帮助,师恩深浓,老师的关怀和悉心教导是砥砺我前行的持久动力。
2014 年返京后,姚老师指导我博士论文的写作。姚老师治学崇实倡新,学风朴实严谨
又善于开创,他提出并创建了普通话水平测试学科,致力于普通话水平测试学科体系的建构,
本文选题就是在他提出的测试活动要素构成理论启发下确定的。姚老师培养学生注重因材施
教,论文写作过程中他提醒我注意宏观体系的把握和典型特征的概括,注意挖掘测试依据要
素的相互联系,因为姚老师了解我的特点与不足,这些提点对本文的写作尤有帮助。姚老师
知道我工作多,给了我相对宽松的培养环境和时间安排表,我终于在“读秒”声中,完成了
博士论文的写作,虽有诸多客观因素,我仍要为学业延宕向老师表示深深的歉意。
在此还应该感谢陈章太、仲哲明、傅永和、于根元、刘照雄、佟乐泉、厉兵、李宇明、
宋欣桥、苏金智、叶青等诸位先生的关心和指导,感谢张世平、魏晖、刘朋建、吕同舟等所
领导的支持,感谢张一清、郭龙生、谢俊英、王敏、肖航等同事的帮助,感谢聂丹、韩玉华、
孟晖、朱丽红、周梅、袁伟、李桃、常晓宇、张宠、周华、邓丹阳、张墨飞、姚敏等同门及
学友的关爱,特别感谢刘子琦老师、吴艳丹老师细致周到的教学服务和帮助,感谢国家语委
普通话培训测试中心同仁们的鼓励和支持。
论文初成,窗外正杏花烂漫,一早拍照发给父母。父亲回微信:“窗前杏花开,三树争
艳彩。硕果满枝头,还当报喜来。
”76 岁的老父,只有高小文化,用他特有的方式,传递给
我无以言表的亲情和力量,感谢我的爸爸妈妈和妹妹!最后,要感谢我的儿子王恺元,我刚
开始读博时,他还是小学生,我考取博士不久远赴新疆,启程前夜他曾关起门痛哭,第二天
又含泪微笑和我作别。我 2008 年到英国做过一年访问学者,2011 年开始又援疆三年,在最
需要陪伴成长的时期,我对他的照顾实在太少。好在恺元很懂事,也很争气,以自己优异的
表现推优升入著名的北京市二中,去年又以优异的成绩考入二中高中。读博期间,他成长了
155
很多,从需要爸妈陪伴、痛苦时趴在妈妈肩头哭泣的小男孩儿,成长为个头超过父亲,帮我
们分担很多家务的优秀中学生。感谢恺元,没有他给予的精神慰藉,我顺利完成学业是难以
想象的。至于妻子,我们相约彼此感念在心不言谢,妻子完成博士论文时是这样做的,我也
遵守我们的约定。
君子之志于道也,不成章不达。希望以此博士论文为起点,开始自己新的学术征程。

156
在学期间学术成果情况

一、专著(1 部)
1.《普通话水平测试阐要》,商务印书馆 2013 年 12 月出版。
二、论文(6 篇)
1.《必然性与或然性——论“啊”音变的教学与测试》,《长江学术》,2012 年第 2 期;
2.《文白异读与语音规范》,《语言文字应用》,2012 年第 2 期;
3.《普通话水平测试发展历程的分期》
(第一作者),
《语言文字应用》, 2013 年第 3 期;
4.《形容词生动形式音变的教学和测试》,《语言文字应用》, 2013 年第 4 期;
5.《普通话水平测试 20 年:三次浪潮和两方面创新》(执笔)
,《语言文字应用》
,2015
年第 1 期;
6.《试析交通标语的语言艺术标准——以修辞控效理论为视角》,《长江学术》2015 年
第 4 期。

157

You might also like