You are on page 1of 82

学校代码 10608

学 号 2012050103176
分类号 H12
密 级 公幵

Guangxi University for Nationalities


? 、、

碩士学位办文

《酉阳杂俎》词频及相关研究

研 究生姓 名:本壁孤

导 师姓名职 称i 海柳文教授

学 科专 业;汉语言文字学

所 厲学 院!文学院
年 级:2012级
论文完成时间:2015年4月
分类号: H12 密级: 公开

硕 士 研 究 生 学 位 论 文

论文题目 《酉阳杂组》词频及相关研究

专 业 汉语言文字学

研究方向 词汇与语法

研 究 生 李雪丹

指导教师 海柳文 教授

论文起止日期:2014 年 6 月至 2015 年 5 月
论文独创性声明

.本人郑重声明:所提交的学位论文,是本人在导师的指导下,独立撰写

完成的。除文中已经注明引用的内容外,本论文不含其他个人或其他机构己

经发表或撰写过的研究成果,也没有剽窃、抄袭等违反学术道德规范的侵权

行为。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标

明。本人愿意承担由本声明而引起的法律责任。

研宄生签名日期年/月丨7日
/

论文使用授权声明

本人完全了解广西民族大学有关保留、使用学位论文的规定。学校有权

保留并向国家有关部门或机构送交学位论文的复印件和电子文档,可以釆用

影印、缩印或其他复制手段保存、汇编学位论文。除在保密期内的保密论文

外,允许学位论文被查阅和借阅,可以公布(包括刊登)论文的全部或部分

内容。

研宄生签名:孝會母 日期:>/r年/月〗7曰
导师签名:^ 日期:>/r 年 月0
《酉阳杂俎》词频及其相关研究

摘 要

本文选取段成式《酉阳杂俎》作为论文的研究对象,运用语言学的相关理论
及借助计算机软件,对《酉阳杂俎》进行分词操作和词频统计,在词频的基础上,
分析《酉阳杂俎》中的特色词语。本文采用比较法、归纳法、定量分析和定性分
析相结合,历时和共时相结合的研究方法,对《酉阳杂俎》的词语进行客观描写。
通过对该书的词语进行统计分析,借助词频统计软件,制定出《酉阳杂俎》词表
和词频表;通过对该书中词语结构的分析,最终得到《酉阳杂俎》词语结构语料
库的相关数据,并且将其和《现代汉语常用 8000 词》进行比较,得出汉语发展
的一些规律。此外,本文还选取了该书中比较有特色的词语,包括同义词,同素
异序词和别称词,对其进行分类分析,探究其出现和形成的原因,从而更深刻地
反映汉语的发展脉络和规律。
全文总共分为六章。第一章绪论,主要介绍段成式的生平和交游情况、《酉
阳杂俎》的主要内容和学界对该书的研究情况;第二章《酉阳杂俎》分词和词语
标引,主要介绍分词依据以及词语标引准则等;第三章词频统计结果和分析,主
要介绍统计方法,对词频统计的结果进行分类分析,并且尝试对齐普夫定律加以
验证。第四章词语结构分析,主要描述《酉阳杂俎》中各类结构的词语进行分类,
归纳分析和总结,生成词语结构数据库的相关数据,并且将其和《现代汉语常用
8000 词》进行比较分析。第五章特色词语分析,主要分析同义词、同素异序词
语和别称词的类别和形成原因。第六章结语。

关键词:
《酉阳杂俎》;汉语词汇;分词;词频
LEXICAL STURDY OF YOU YANG ZA ZU AND RELATE
RESEARCH

ABSTRACT

Select the "You Yang Za Zu" as the research object, using the theory
of Linguistics and computer software to make word operation and
frequency statistics with" You Yang Za Zu ", then analyzes the
characteristic of the words. This paper mainly use the comparison,
induction, quantitative analysis and qualitative analysis, combine Last
with Total time research methods, describe the words in “You Yang Za
Zu”. Through analysis the words of the book, and use the software of
frequency statistics, to develop frequency table of “You Yang Za Zu";
through analysis the structural of the words in the book, and ultimately
get the date about the Term structure of the corpus of "You Yang Za
Zu" ,and then let it compares with "Modern Chinese used 8000 words",
try to describe the regular pattern in History of Chinese development. In
addition, we also chose and analysis some words which has rich
features , including synonyms, allotropy words and nicknames words, to
explore the reasons for the formation of its appearance and to more
deeply reflect the development of Chinese context and regular pattern.
The full text is divided into six chapters. The first chapter
Introduction, Introduces the life and Social Intercourse of Duan Chengshi,
The main contents of “You Yang Za Zu”, and some Information about
this book in current academic research. The second chapter, introduced
the word segmentation according to the standard and participles,
participles practice. The third Chapter the result of the Word frequency
statistics , mainly Introduces the methods of statistical and analysis the
results of the statistical classification of word frequency, and try to be
verified for Zipf's law. The forth chapter is words structure analysis,
mainly describe Lexical structure of "You Yang Za Zu" , inductive
analysis and summarize ,then establish the words corpus structure of
“You Yang Za Zu”. Furthermore we also put it compare with "Modern
Chinese common 8000 the word". The fifth chapter is the analyse about
characteristics words, the main analysis include the Category and Causes
about synonyms, allotropy words and nicknames words. The Sixth
chapter is Conclusions.
KEYWORDS: You Yang Za Zu; Participle; structure; word frequency
目 录

第一章 绪论……………………………………………………………1
第一节《酉阳杂俎》及其作者 ………………………………………1
第二节《酉阳杂俎》与近现代汉语词汇计量研究现状…………… 3
一、
《酉阳杂俎》研究现状……………………………………………3
二、 近现代汉语词汇计量研究现状…………………………………6
第三节 本论文的研究思路 ………………………………………… 7
第二章 《酉阳杂俎》分词和词语标引 …………………………… 9
第一节 词的概念及分词标准…………………………………………9
一、词的概念 ………………………………………………………9
二、分词标准 …………………………………………………… 10
第二节 分词实践 …………………………………………………16
一、软件分词 …………………………………………………… 16
二、人工干预分词 …………………………………………………18
第三节 词语结构标引 …………………………………………… 19
第三章 《酉阳杂俎》词频统计结果及分析 …………………… 21
第一节 词频统计的相关概念简介和统计方法介绍 …………… 21
第二节 《酉阳杂俎》词频统计结果分析 …………………………23
一、概述 …………………………………………………………… 23
二、高频词分析 …………………………………………………… 24
三、低频词分析 …………………………………………………… 25
四、利用《酉阳杂俎》的词频分布验证齐普夫定律 …………… 25
第四章 《酉阳杂俎》词语结构分析 …………………………… 31
第一节 单音节词分析 …………………………………………… 31
一、单音节词的数量分析 …………………………………………31
二、单音节词的词性分布情况统计分析 …………………………31
第二节 双音节及多音节词分析 …………………………………32
第三节 双音节词结构分析 …………………………………………33
一、单纯双音节词结构分析 …………………………………… 34
二、合成双音节词结构分析 …………………………………… 36
三、多音节词结构分析 ………………………………………… 46
第四节 《酉阳杂俎》词表与《现代汉语 8000 常用词频表》的对比分
析 ………………………………………………………48
一、音节长度的比较分析 ………………………………………49
二、复音词构词方式的比较分析 ………………………………49
第五章 《酉阳杂俎》中特色词语分析 ………………………51
第一节《酉阳杂俎》中同义词的归类分析 ………………… 51
一、同义词的界定标准 ………………………………………… 51
二、
《酉阳杂俎》同义词分析 ………………………………… 51
第二节《酉阳杂俎》中异序词的归纳分析 ………………… 56
一、
《酉阳杂俎》中同素逆序词的分析研究 ………………… 57
二、
《酉阳杂俎》中的同素异序词和现代汉语的比较分析 … 60
三、同素异序词语产生原因初探 ………………………………65
第三节《酉阳杂俎》别称词分析 ………………………………65
一、
《酉阳杂俎》别称词数量数据归纳 ………………………66
二、
《酉阳杂俎》别称词的来源分类 ………………………… 68
第六章 结语 ………………………………………………… 71
参考文献 ………………………………………………………… 72
第一章 绪论

第一节《酉阳杂俎》及其作者

段成式,字柯古,临淄人,唐穆宗时宰相段文昌之子。唐代文学家,生卒年
说法不一,大约于公元 803 年生于西川,于公元 864 年卒于长安,享年六十又一。
关于段成式的生平资料,《新唐书》和《旧唐书》都有一些相关介绍,今人方南
生在其《酉阳杂俎》点校本的后面也有较长篇幅的《段成式年谱》,对于了解段
成式的生平经历提供了很多资料。如《新唐书》在其祖父段志玄传中附有一段关
于段成式的介绍,从中可以得知,段成式最开始是由于家族关系推荫为校书郎而
走上仕途的。他从小就勤奋苦读,博学强记,喜欢畋猎。他的殚见洽闻,被当时
的人们广泛流传。他仕途平稳,由最初的校书郎,后来到尚书郎,吉州刺史,终
于太长少卿。闲暇之余喜欢写诗和小说,著有《杂俎》书数十篇。
在方南生的点校本《酉阳杂俎》的段成式年谱中,可以大概了解段成式一生
的履历。他由于父亲仕途需要随其辗转旅居,从而有比他人更为可贵的经历。他
2 到 3 岁在蜀地,然后又在长安呆了十三年,十九岁又随父赴任成都,之后又陆
续旅居于扬州、荆州等地,三十三岁丧父,他带领家人由成都赴长安,后来任职
于京洛间,曾任职秘书省校书郎、吉州刺史等官职,公元 859 年闲居襄阳等经历,
足迹可谓是遍布东南西北。这些看似流离的旅居经历,也为其文学创作创造了一
定的条件。三十三岁之前的生活经历为其在艺术审美的塑造和自信学养以及尚奇
性格的培养,创造了良好的环境。从《杂俎》的内容可知,不仅很多文人雅士,
与其交往密切,赠答唱和,如温庭筠和李商隐等,诗风相近,因他们都排行十六,
时人称之为“三十六体”1,而且山野匹夫也乐意向其叙说惊奇怪异之传闻。这
在很大程度上成就了他丰富的阅历和广博的见闻,同时,为《酉阳杂俎》的创作
奠定了良好的基础。
段成式在文学上的造诣,从创作数量看,与其他文人相比来说,并不是很可
观,总共创作诗歌五十多首,文章二十几篇,其中文章多以骈文为主,如《寺塔
记序》等。但是其成就在当时却是斐然的,从世人对“三十六体”的评价就可以
看出,其诗文有浓厚的文人底蕴以及高雅的文人风气。
《酉阳杂俎》是段成式大约在公元 860 年前后写成的一本笔记小说。全书分
1
李中华. 晚唐 “三十六体” 辨说[J]. 文学遗产, 2005 (2): 126-128.

1
为三十卷,前集二十卷,续集十卷,每卷分成数篇,且每篇都有不同的名目。如
卷一分为《忠志》、
《礼异》和《天咫》等篇。全书中各卷各篇都是按照内容进行
分类,主要记录涉及了风俗、宗教、动植物、历史、传说等。如卷十八《广动植
之三·木篇》,主要记录的是一些树木名称、产地以及相关的传说;续集卷五《寺
塔记上》主要写各地的寺名和建筑布局等。《杂俎》篇幅较长,全书十一万字,
包含的内容丰富多彩,不仅有对真实历史的记载,也有对一些缺乏可考依据的神
话传说的记录;不仅有作者亲身仔细观察以及从其友人之处所得的见闻轶事,也
有作者在典籍中阅读而得的逸闻趣事;全书不仅搜集了本土的事物,而且也囊括
了很多外国奇异的风俗传闻等。因此,从内容上来说,《杂俎》可谓是一本“百
科全书”。《杂俎》因其内容的“广博珍异”,受到广泛的好评和赞叹。如《四库
1
全书总目》称它为“小说之翘楚” ,鲁迅先生在《中国小说史略》称其“或录
密事,或叙异事,仙佛人鬼,至以动植,弥不毕载,以类相聚,有如类书。虽源
2
或出于张华《博物志》,而在唐时,则犹独创之作 。”
《杂俎》中记录的很多内容,
如动植物,中外逸闻趣事等对后世文人创作具有深远影响,很多文人作品中都有
引用该书的例子。
段成式的《酉阳杂俎》,书名常容易让人费解,不知“酉阳“和”
“杂俎”为
何意。“酉阳”是地名,据周登在其后序中所说,酉阳在荆州。传说秦人在小酉
山的石穴中藏书千卷,梁湘东王喜欢收藏书册,有“访酉阳之逸典”之语。段成
式因为其所著的笔记小说内容广泛,因此借 “酉阳逸典”的意义来自比该书。
“俎”是古代的一种器物,“杂俎”就是杂陈于俎的意思,用来比喻该书的内容
3
丰富,所以取名《酉阳杂俎》 。
《酉阳杂俎》最早毫无疑问是以手抄本流传的。有记载的最早的刻本应该是
周登于嘉定七年刻板印刷的《酉阳杂俎》前集二十卷。其后邓复、陈氏等对其进
行刊刻,广文彭氏于淳祐十年对其进行整理印刷。其中,邓复刊刻的本子是最全
的版本。到了明代,随着刊刻之风的盛行,《杂俎》出现了好多种明刻本。现在
流传的最常见的本子主要有四种刻本,如明万历年间的收录三十卷的脉望馆本,
收入《稗海》的二十卷的刻本等。

第二节 《酉阳杂俎》与近现代汉语词汇计量研究现状

一、 《酉阳杂俎》研究现状
中国大陆公开发表研究《酉阳杂俎》的文章大概在上世纪 80 年代,至今三

1
永瑢 纪昀等撰.四库全书总目[M].北京:中华书局,1995:1415.
2
鲁迅.中国小说史略: 释评本[M]. 上海文化出版社, 2005.第 60 页。
3
方南生.《酉阳杂俎》校点本[M].北京:中华书局,1981. 291 页。
2
十年来,学界发表的对其研究的文章大概有 70 多篇,还没有看到专著出现。这
些文章的研究大致可以分为两大类,一是作家研究,一是文本研究。作家研究主
要是涉及段成式的交游和创作两个方面;文本研究类涉及的角度主要有:版本流
传、文学研究、文化研究、语言研究以及对他书的影响力等。
1、 关于段成式的研究
从这一角度着手研究的文章大概有 3 篇,分别是:常恒畅《段成式交游
考》(湖南医科大学学报 2009 年 11 月第 11 卷第 6 期),这篇文章主要是写
段成式和与他交好的几位友人的往来经历以及他们对《酉阳杂俎》成书的贡
献与影响。其他类似研究还有:姚吉成、邢恩和《段成式交游补》(中国石
油大学胜利学院学报 2013 年 6 月第 27 卷第 2 期);方琳《段成式的交游与
创作》
(辽宁大学硕士论文 2013 年);还有许智银《段成式与唐代文学刍论》
(中国海洋大学学报 2012 年第 3 期);另外许智银还在他的博士论文《唐代
临淄段氏家族文化与文学研究》
(山东师范大学 2012 年博士论文)中从社会、
历史和文化的角度对段式家族进行了个案研究。
2、 《酉阳杂俎》的语言学研究
学界对这一方面的研究,主要是对该书的词汇进行研究。
《酉阳杂俎》的词汇很丰富,因此有很多学者对它的词汇很是感兴趣。
郭爽《<酉阳杂俎>新词新义研究》(华南师范大学 2002 年硕士论文),运用
静态描写和定量分析的办法,对书中的新词新义词语和离合结构词语进行分
析。刘传鸿《<酉阳杂俎>词汇研究》(南京师范大学 2003 年硕士论文),主
要分析其词汇特点以及对部分词进行训诂。孙露《<酉阳杂俎>偏正式复音词
探究》
(语言文学 2010 年 5 月第 2 卷第 39 期),从词义构成和词性构成两方
面对该书中的偏正式复音词进行分类。刘红丽《<酉阳杂俎>名词同义词研究》
(重庆广播电视大学学报 2011 年 12 月第 23 卷第 6 期),从语法层面、语义
层面和语用层面对部分词进行分析。刘传鸿《<酉阳杂俎>语词训释》(南京
师范大学学报 2002 年 6 月第 2 期)和《<酉阳杂俎>疑难词考释》
(语言研究
2003 年 9 月 23 卷第 3 期),前者选取了 12 个词语对其进行训释和补充,后
者对“羊”和“墨尿”进行考释。武振玉、梁浩《<酉阳杂俎>词语补释与方
校本补校》(吉林师范大学学报 2013 年 1 月第 1 期),对某些词进行考释补
充,并且对方校本的某些不足之处进行补校。
3、 《酉阳杂俎》的文献研究。
由于《酉阳杂俎》成书年代较为久远,且它具有深远影响,因此历朝历代对
其抄刻的人就有很多,避免不了在抄录过程中产生讹误的现象。因此为了能够更
好地对其进行研究,校勘就成了一件很重要的事。很多人在这方面孜孜追求着。

3
刘传鸿的两篇,《<酉阳杂俎>点校订补》(古籍整理研究学刊 2011 年 11 月第 6
期)和《<酉阳杂俎>校勘札记》
(温州大学学报社会科学版 2007 年 7 月第 20 卷
第 2 期),这两篇都是在方南生的校本的基础上,作者参照不同版本,对方南生
的校勘的不足之处进行订补。后来刘传鸿又根据这个,进而指出《汉语大字典》
的错误,写成论文《<汉语大字典><汉语大词典>失误指正—由<酉阳杂俎>中的一
则校勘所引起》。郑慧生《<酉阳杂俎>点校质疑》(河南大学学报 1993 年 7 月第
33 卷第 4 期),是较早对方南生的点校的不足之处进行质疑的文章。绩绪的《<
酉阳杂俎>断句错误一处》,指出方校本的一个断句错误。刘丹《<汉语大词典>
引<酉阳杂俎>书证研究》
(华东师范大学 2011 年硕士论文)。薛克翘的《<酉阳杂
俎>所记玄奘与<西域记>诸事》
(大连大学学报 2011 年 12 月第 32 卷第 6 期),主
要是对该书中记载的有关玄奘和《西域记》的资料进行点校,从而弥补校勘的不
足。
对《酉阳杂俎》最早进行版本研究的是方南生,他在 1979 年在福建师范大
学学报上发表了一篇题为《<酉阳杂俎>版本流传的探讨》的文章,在这里他认为
“《酉阳杂俎》二十卷,续集十卷”这种说法比较合理,指出稗海本和赵本最具
代表性,而且赵本更具有参考价值。之后的陈连山对《酉阳杂俎》在李朝成宗时
的刊刻情况的介绍的文章。
4、《酉阳杂俎》文学类研究
就目前来看,这类研究大致可以分为思想内容和艺术特色两个方面。
(1)思想内容方面的研究
这类研究主要就是对《酉阳杂俎》的内容进行挖掘,概括出其中蕴含的深
意。中国社会科学院的郑暋暻的博士论文《段成式的酉阳杂俎研究》(中国社
会科学院研究生院 2002 年博士论文)一文,对该书中各方面故事进行叙事分
析,从而总结出该书具有继承性、开放性和独创性。欧阳建发表在明清小说研
究上的《从酉阳杂俎看神怪小说的真谛》;庄大钧选取书中的某些故事写成的
《略谈酉阳杂俎中的齐鲁逸闻》
(德州师专学报 1995 年第 11 卷第 3 期)。王雪
艳《试论酉阳杂俎中的僧人形象》(青年文学家·文学评论 2013 年);韩钉钉
《段成式<诺皋记>的研究》
(集美大学 2011 年硕士论文);黄世佐《<酉阳杂俎>
中的本草资料及其贡献》(甘肃中医学院学报 1995 年 12 月第 12 卷第 4 期)。
在《酉阳杂俎》的思想内容的研究方面还有一个重要的点就是对《酉阳杂俎》
中的《叶限》的研究。这包括对《叶限》文本的研究以及对《叶限》中所涉及的
“灰姑娘”这一题材的研究。
对《叶限》文本的研究
刘晓春发表于中国文化研究上的《灰姑娘故事的中国原型及其世界性意义》

4
(1997 年 1 月);陆蓉发表于铜陵学院学报的《女人的鞋和脚的意义— 解读中
国版“灰姑娘”<叶限>》(2007 年 1 月)。
对“灰姑娘”题材的研究
这一方面的文章比较多,都是各自从不同的角度将中国“灰姑娘”故事和西
方的故事版本进行比较,从而让读者对于故事文本有更深刻的理解和认识,有助
于拓宽对该文本的研究视野和范围。
(2)关于艺术特征的研究
对《酉阳杂俎》用文学角度进行研究所涉及的另一方面就是对该书的艺术特
征进行研究。这类文章大概有以下这些:安正发发表于电影评介的《论酉阳杂俎
及其叙事特征》(2008 年第 20 期);汪文国《论酉阳杂俎的史性特征》(枣庄学
院学报 2013 年 2 月第 30 卷第 1 期);许银智《酉阳杂俎的文学人类学阐释》
(广
西民族大学学报 2012 年 5 月第 34 卷第 3 期)等诸文。他们大多是先对该书整体
做一描述,然后选取一个角度对其艺术特征进行分析,从而总结归纳出该书的特
点和价值。
5、《酉阳杂俎》的文化研究
对《酉阳杂俎》进行文化研究的文章比较多,大致把它分为《酉阳杂俎》与
佛教、《酉阳杂俎》与民俗民风和对外文化研究三大方面。
(1)《酉阳杂俎》与佛教的研究
这类文章目前找到的有 4 篇。夏广兴发表在钦州师范高等专科学校学报上的
《段成式酉阳杂俎与佛教》(2002 年 9 月第 17 卷第 3 期);杨田春《从段成式<
酉阳杂俎>看唐代佛道争锋》(黄冈师范学院 2013 年 8 月第 33 卷第 4 期);李德
华《唐代佛教寺院之子院浅析—以<酉阳杂俎>为例》。
(2)《酉阳杂俎》与民俗民风的研究
书中记载了很多当时的文化传统,可以说它对后人研究当时社会的文化具有
重要价值。如李晓霞发表的《<酉阳杂俎>中的鬼文化浅探》(辽宁工程技术大学
学报 2009 年第 2 卷)一文中,通过对《酉阳杂俎》中涉及鬼的内容进行分析,
探讨唐代鬼文化的一些内容;杨序的《酉阳杂俎中的鲸文化研究》(合肥学院学
报 2010 年 5 月第 27 卷第 3 期);汤夺先发表于华南师大学报的《从<酉阳杂俎·鲸>
看唐代的文身风俗》;姜川子的《从<酉阳杂俎>看唐朝婚俗》
(消费导刊·文化研
究),王小盾 潘玥的《从<酉阳杂俎>看唐代音乐》(音乐艺术);逯慧《从<酉阳
杂俎>看唐代底层民众的日常生活》
(临沂大学学报 2011 年 12 月第 33 卷第 6 期);
姚春华的《<酉阳杂俎>中晚唐科举士子的社会心态探微》(湖北职业技术学院学
报 2010 年 9 月第 13 卷第 3 期);葛莹莹的《从<酉阳杂俎>看唐代占梦文化》
(文
学教育·文学评论 2012 年 4 月)。

5
(3)《酉阳杂俎》与外国文化研究
唐朝的文化兼收并蓄,很具有开放性,这一点也可以体现在当时的文学作品
中,《酉阳杂俎》就是其中一个例子。有作者就从这一点入手对其进行研究。薛
克翘在《<酉阳杂俎>看中印文化交流》
(南亚研究 1992 年)一文中,主要探讨了
中国和印度在宗教和政治方面的交流和影响。
6、《酉阳杂俎》对其他作品的影响的研究
《酉阳杂俎》作为一本颇受赞誉的笔记小说,对前代作品肯定有传承,对后
面的作品肯定也会产生一些影响。这类文章有:杨义发表在齐鲁学刊上的《从酉
阳杂俎》到《夷坚志》(齐鲁学刊 1992 年第 2 期),通过二者的比较分析,从而
得出两者之间的传承关系。
从以往对《酉阳杂俎》的研究的梳理中可以看出,目前对《杂俎》的研究较
多地局限于文学和文化方面,挖掘的是它的文学价值和文化价值,而对其语言的
研究只是零星的几篇,而且缺乏对其全局深入的研究。本文主要是借助计算机辅
助研究的手段对其全书的词汇进行较为全面的研究,以期从中窥探近代汉语词汇
史发展的特点。
二、近现代汉语词汇计量研究
伴随着社会科技进步的发展,借助电子计算机相关科技进行语言学研究受到
了很多学者的喜爱和青睐。他们利用概率统计和相关计算机软件对专书的词汇分
布、词频统计等方面进行研究,从而试图更深层次地概括和揭示汉语词汇发展的
内在特点。现代对词汇计量研究的成果颇为丰硕。
1、论文类研究成果
张秋梅《<儿女英雄传>连词计量研究》(苏州大学 2009 年硕士毕业论文);
唐甜甜《<金瓶梅词话>颜色词计量研究》
(苏州大学 2014 年博士论文);王静《<
新编日语>的词汇计量研究》
(厦门大学 2007 年硕士毕业论文)
;刘秀梅《基于词
频统计的<老残游记>词汇研究》(广西民族大学 2014 年硕士毕业论文);陈梦曦
《<孝经>词频统计和词义关联分析》(黑龙江大学 2014 年硕士毕业论文);巫洁
《<儿女英雄传>程度副词计量研究》
(苏州大学 2010 年硕士毕业论文);刘琼《<
盛明杂剧>复音词研究》(广西师范学院 2011 年硕士毕业论文);张琴《<敦煌愿
文集>复音词研究》(南京师范大学 2012 年硕士毕业论文);何柳《<元朝秘史>
词频研究》(广西民族大学 2011 年硕士毕业论文);薛瑾《<儿女英雄传>时间副
词计量研究》(苏州大学 2014 年硕士毕业论文);尹雪璐《<红楼梦>程度副词计
量研究》
(河北大学 2011 年硕士毕业论文);洪琰《<儿女英雄传>词缀计量研究》
(苏州大学 2010 年硕士论文研究);张平《<儒林外史>语气词计量研究》(安徽
大学 2012 年硕士毕业论文);吕欣《<红楼梦>前八十回助词计量研究》(苏州大

6
学 2011 年硕士毕业论文);袁燕《<红楼梦>前八十回代词计量研究》(苏州大学
2011 年硕士毕业论文);杨梅《<红楼梦>前八十回程度副词计量研究》(苏州大
学 2011 年硕士毕业论文);高军《<金瓶梅词话> 词缀计量研究》
(苏州大学 2009
年硕士毕业论文);卿三伟《<搜神记>虚词研究》(四川师范大学 2011 年硕士毕
业论文);李蓉蓉《同义异形词的词频实验统计》(2004);邓路华《词频分析》
(1987);刘源《字词频统计与汉语分词规范》(1992);郭锐《词频与词的功能
的相关性》(2001);张晓英《<西游记>语气副词研究》(2005);孙清兰《调频、
低频词的界分及词频估计方法》
(1992);尹斌庸《词频统计的新概念和新方法》
(1994)等。
2、著作类研究成果
1995 年 11 月北大计算语言研究所研制的《现代汉语语法信息词典》,是这
一类研究中的杰出成果的代表。相关专著还有 1986 年陈爱文在北京大学出版社
出版的《汉语词类研究和分类实验》;北京语言出版社于 1996 年出版的《胡明扬
主编词类问题考察》;1987 年北京师范大学出版的,由何克抗和李大魁主编的《现
代汉语三千常用词表》;北京语言学院出版社出版的《现代汉语频率词典》以及
苏新春于 2001 年在厦门大学出版社出版的《汉语词汇计量研究》等。这些著作
都是在借助计算机这一先进技术的基础上,结合传统语言学理论对词汇进行分
析,从而得出汉语词汇的特点,对于词汇计量的发展做出了重要贡献。

第三节 本论文的研究思路

本文选择《酉阳杂俎》作为研究对象,是经过深思熟虑选择确定的。《酉阳
杂俎》篇幅较长,且内容包罗万象,语言异常丰富。文中涉及大片的名物词,音
译词和外来借词,而且还有很大部分的同义词,词汇特色明显。本文主要运用描
绘词汇学和语义词汇学的相关知识和理念,借助计算机辅助手段,结合计量研究
的方法,对《酉阳杂俎》的词汇进行全面分析和研究,制作《酉阳杂俎》的词汇
表,然后再对其进行静态研究和处理,以期在穷尽性地对词汇和语义的归纳和分
类处理的基础上,窥探《杂俎》的词汇全貌,总结出其词汇特点。
1、 研究方法
本文主要采用的研究方法有比较法、归纳法、定量分析和定性分析相结合的
方法。
2、 研究思路和步骤
第一:对底本进行筛选。通过对《酉阳杂俎》不同版本的仔细比对,最终选
择了方南生点校本《酉阳杂俎》(中华书局 1981 年出版),以此做为研究对象。

7
第二:电子文本的搜集和生成。在网上找到了《杂俎》的电子文本,省去人
工录入工作的繁琐。然后根据纸质本《杂俎》对电子文本进行校对,改正其在转
化过程中出现的错误和不妥之处,并且添补一些电脑无法识别的文字,使最终生
成的电子文本准确,和纸质版文本一致。
第三:对文本进行分词实践。本人先用计算机分词软件对文本进行分词,采
用的是中科院设计的 ICTCLAS 分词软件。但是可能是由于《杂俎》所处的时代超
出该软件处理的范围,或是选用的繁体的文本该软件不能识别,因此,分词的结
果错误颇多。于是我们又采用人工干预分词的方法,对文本进行分词处理,对其
进行词性标注等。
第四:把分词结果通过 word 文档中的转换和生成表格功能,将其转化为表
格,然后复制粘贴到 Excel 表格中,对词条从词性、词语的音节长度、构词形式
和是否异序等方面进行逐条分析。
第五:将分析处理完的词表进行排序,然后再借助程南昌设计的 Hyconc 软
件对其进行词频统计,从而得出《酉阳杂俎》词频分布表。然后对其分析,最终
得出结论。

8
第二章 《酉阳杂俎》分词和词语标引

第一节 词的概念及分词标准

一、词的概念

本文在分词实践前,首先分析了词的定义,然后通过词和词汇,词和短语这
两对概念的区别,深化对词的概念的理解。
(1) 词的定义
据黄伯荣、廖序东在《现代汉语》中的解释,词是语言中最小的能够独立运
1
用的语言单位 。词是由最小的音义结合体—语素组成的,是语言当中具有一定
意义能够指称现实现象的单位。
(2) 词和词汇的区别
词和词汇,不论是内涵还是外延方面,都是两个截然不同的概念。前文提及
词是语言中最小的独立运用的单位,而词汇(又称语汇),是一种语言里所有的
2
(或特定范围的)词和固定短语的总和 。词汇是比词范围要大很多的概念,内
容庞杂,包含的词可以多达数以万计。为了语料处理的需要,也是为了分析之便,
本文所谓的分词,其实就是分词汇,是对《杂俎》专书的词汇进行分析研究。
(3) 词和短语
词和短语都是语言单位,在句子中都可以充当成分。《现代汉语》教材中指
3
出,短语是在意义和语法两个方面上具有搭配功能但却没有句调的一组词 。因
此,短语是一个词组,短语和词都是音义结合体,能指代一定的意义,其区别主
要在于短语是比词更大一级的语言单位。虽然从概念和定义上看,词和短语的界
限很是分明清晰,但是在实际操作过程中,由于有些语言单位并不能完全称其归
属于哪一类,要将其分为词,却似乎归属短语也是可以的,特别是短语和一些复
合词,在概念界线上并不是非常明了,而是存在着千丝万缕的联系,容易边缘化,
因此,要对二者进行强硬的划分,有时也会显得过于生硬和牵强。比如,
“看到”
是一个词语,但是要是在中间加上“得”或“不”,
“看得到”、
“看不到”就成了
一个短语。为了保持语料的完整性,本文在实际分词中并没有将其作为短语划分,
而是看作一个完整的词。

1
黄伯荣 廖序东.现代汉语[M].高等教育出版社,2007. 253 页。
2
黄伯荣 廖序东.现代汉语[M].高等教育出版社,2007.250 页。
3
黄伯荣 廖序东.现代汉语[M].高等教育出版社,2007.59 页。
9
二、分词标准

本研究主要是参照刘开瑛《中文文本自动分词和标注》中“信息处理现代汉
1
语分词规范” 为参照,结合《酉阳杂俎》的词汇特点,为了分词方便,制定如
下分词标准:
(一) 名词
名词是汉语实词中的一个词类,在实词中占有重要比重。所谓名词,就是表
2
示人或事物的名称,包括时间和处所等在内的词 。根据《酉阳杂俎》的词汇特
点,本文将其分为以下几类:
1、 普通名词
这里所说的普通名词是指区别于专有名词以外的名词。
1.1 能明确指称一件事或一种事物或一种概念,具有某种具体意义的单
音节,我们划分为一个分词单位,如:
家,梨,玉,皮,水,人,孔,鸟,叶,蚓
1.2 意义结合紧密的二字名词或者三字名词,我们划分为一个分词单位,
如:
枝叶,桑树,石孔,石崖,高山,葫芦,石臼,石柱,竹作,冤气,鬼
书,幽冤,狐白,百姓,颜色,市门,风雨声,三从房,嗟叹声,郁金香,
瑞龙脑
1.3 名词前面加“老”、
“阿”
“小”等词缀的语言单位,我们将其划分为
一个分词单位,如:
老僧,老夫,老乌,阿师,阿梁,阿縒,阿贺,阿史,阿措,阿翁,阿
瞒,小女,小碧,小儿
1.4 在名词性成分后面加上“子”、“者”、“头”等后缀或者整体表示一
个完整的名词意思的成分,为了便于统计,我们将其划分为一个分词单位,
如:
师子,刀子,新妇子,月子,瞳子,蟢子,石子,鼓子,瓦子,石头,
膝头,斧头,指头,薪者,王者,道者,咒者,侍者,屠者,樵者,从者,
死者
1.5 为了统计和处理需要,我们将名词成分前面表示“许多”意项的“诸”
和“众”与名词成分一起作为一个分词单位进行处理,如:
诸蕃,诸君,诸王,众人,众物,众僧

1
刘开瑛. 中文文本自动分词和标注[M]. 商务印书馆, 2000.247 页。
2
黄伯荣 廖序东.现代汉语[M].高等教育出版社,2007.11 页。
10
1.6 方位词,虽是名词中的一种,但为了统计需要,我们将其专门作为一个
分词单位(与前面或后面名词意义紧密,且一起构成意义的方位词除外),如:
末,後,前,上,中,下,西北,南面
2、 专有名词
传统意义上的专有名词,不外乎就是人名、地名、集体或团体名称、书名或
作品名称以及一些抽象事物的名称等。鉴于《酉阳杂俎》本身的词汇特点,本文
在处理的过程中,界定的专有名词除了上述几类以外,还将年号、事物名称以及
一些宗教用语等作为专有名词进行处理。
2.1 关于人名,本文对其进行如下处理:
2.1.1 汉族名称包括姓和名的作为一个分词单位,如:
张干,王力奴,赵武建,李白,高力士,李夷简
2.1.2 姓氏和职称、官职或称号在一起的作为一个分词单位,如:
韩少卿,白舍人,邓夫人,马侍中,翟天师
2.1.3 表示人的称号、封号或者人的字号的词语,我们作为一个分词单位,
如:
良非,中伦,伯坚,惠延,天后,秦王,山人,涤阳道士,清河王,平陵王,
上卿侯,东明公,西明公,唐山人
2.1.4 文中表示宗教神仙名称或称号的词,我们作为一个分词单位,如:
阿修罗,耐犯宫主,纣绝天主,北斗君,北太帝君,玄妙玉女,太上老君,
九天上皇洞第一君,大千法王
2.1.5 文中出现的表示人的尊称或以姓氏代简称的词语,我们作为一个分词
单位,如:
老君,大王,来公,陛下,殿下,梁主,李公,田公,马,韩,韦生,列,
2.1.6 文中出现的皇帝的庙号或谥号,将其划分为一个分词单位,如
玄宗,魏明帝,韩晋公,汉高祖,汉元帝,明六世,太宗
2.2 关于地名的处理。
在《酉阳杂俎》的词汇处理过程中,我们认定的地名包括地名,街、坊、里
巷和景点的名称,还有佛教中的一些表示地点名称的词。
2.2.1 表示确切地点或者一定地理范围的名词,我们将其作为一个划分单
位,如:
徐州,波斯,大食,魏,梁,五印,西域,辽阳,洛阳,扬州,荆州,苏州,
洛中,木饮州,乌耗,岭南,东都,陕,汴
2.2.2 表示县、市名称的词,我们划分为一个分词单位,如:
郧乡县,高陵县,安丰县,介休县,高堂县,鲜卑城,洛阳城,江淮市,夔

11
州市
2.2.3 表示街、坊和里巷的名称,我们将其划分为一个分词单位,如:
昭国坊,大宁坊,德坊,靖恭坊,馆娃坊,长兴里,修行里,崇贤里,上邏
村,赵村,南李村,顾头村
2.2.4 文中表示景点和山川的名称的词,我们划分为一个分词单位,如:
望苑驿,庐山,青城山,衡岳,泰山,嵩山,巫山,金榆山,雁翅泊,洞庭,
半汤湖
2.2.5 文中表示佛教和道家中的地点的名称的词,我们作为一个分词单位,
如:
八寒八热地狱,鬘持天,波陀天,阿鼻地狱
2.3 《酉阳杂俎》有表示物品的多音节词语,鉴于处理需要,我们将其作
为专有名词进行处理,如:
药童昔贤子就宅煎,金平脱犀头匙筋,金银平脱隔馄饨盘,平脱着足叠子,
熟线绫接靿
3、 时间名词。
在《酉阳杂俎》词汇处理过程中,我们把表示一个时间点或者一个时间段的
词语,作为一个分词单位进行处理,如:
3.1 表示确切时间点的词语,我们作为一个分词单位,如:
冬至日,立春,是日,夏至日,当时,八月十五,夜中,庚申日,向晓,向
暮,人午时,五月五日,五更,诘朝,晨
3.2 表示一个时间段的词语,我们将其划分为一个分词单位,如:
须臾,卯年,太和九年,今夕,昨夜,久之,俄而,今日,今年,食顷,息
顷,刹那,前日,今朝,旬日,近代
(二) 动词
动词是实词中的一员,它表示动作、行为、心理活动等内容或存在、变化、
1
消失等状态 。
1、 单个表示动作的词,我们作为一个分词单位划分,如:
召,包,致,对,曰,令,监,死
2、 双音节动词语义结合紧密或使用稳定的词语,我们将其作为一个分
词单位处理,如:
进发,留心,总至,惊惧,惊异,乞命,回顾,箍桶,役力,祈雨,掉臂,
困辱,拜伏,设席,股慄,叩头,临镜,临产,连镳,敲落,杀人,狱具
3、 若动词前有形容词性等词语修饰整个动作的词语,我们将其和动词

1
黄伯荣 廖序东.现代汉语[M].高等教育出版社,2007.13 页
12
作为一个分词单位,如:
大笑,大言,微露,自言,具述,妄传,误杀
4、 单字动词后面加了“得”等助词组成的结构,我们将其作为一个分
词单位,如:
记得
5、 文中单字动词前有表示“相互”意义的“相”的修饰时,我们将其
作为一个分词单位,如:
相顾,相去,相传,相接,相随,相见,相负,相遇,相邀,相慰
6、 动词前面的否定副词,我们将其作为一个单独的分词单位划分,如:
不 成,不 及,不 待,不 见,不 去,不 怠,不 寝食,不 毛

(三) 形容词
1
表示状态或性质的词,叫做形容词 。
1、 单字形容词,作为一个分词单位,如:
怪,长,常,满,骏,圆,乱,高,大
2、 两个意义结合比较紧密的二字形容词,我们将其作为一个分词单位
进行处理,如:
神勇,长大,疯狂,晦冥,委顿,奢俭,调柔,差近,艳丽,聪悟,空洞,
炳焕,盤鬱,清越,端妙,绝世,狼藉,饥渴,雄雌
3、 重叠式的形容词,主要是“AA”式,我们一律作为一个分词单位,
如:
霏霏,蹙蹙,怏怏,草草,浑浑,隐隐,啖啖,殷殷,纷纷,涓涓,历历,
苏苏,蠕蠕,唯唯,栗栗,晖晖,如如
4、 单个形容词或重叠式形容词后面带诸如“然”的后缀的词组,我们
作为一个分词单位,如:
寂然,缺然,確然,岿然,豁然,惛然,瞿然,欣然,仡然,翕然,怅然,
拂拂然,了了然,依依然,摽摽然
5、 表示颜色的形容词或者词组作为一个分词单位,如:
红,黄,绿,紫,微红,正白,青黄,窃赤,窃黄,微赤,青赤,黑黄,青
翠,黄白
(四) 代词
代词是指具有代替、指示作用的语法单位,而且与所代替的词语具有相当的

1
黄伯荣 廖序东.现代汉语[M].高等教育出版社,2007.第 16 页
13
1 2
语法功能 。代词所反映的意义,是词和客体之间的关系上的特点 ,换句话说应
该就是指在语法意义上代替和被代替的关系。代词根据语法作用大致可以分为人
称代词,疑问代词和指示代词三类。在《酉阳杂俎》词汇研究过程中我们对代词
进行如下处理:
1、 单字可表示第一、第二、第三人称的代词,我们作为一个分词单位,
如:
我,尔,其,之,予,自,某,余,吾,或,汝,他,莫,甲,乙
2、 单字或双音节表示指示事物或人或事情的代词,我们将其划为一个
分词单位,如:
此,是,彼,焉,如此,本,茲,斯,其他
3、 表示疑问的单字代词或词组,我们作为一个分词单位,如:
何,争,谁,盍,否,如何,何乃,何如,多少,何故,何等
4、 为了方便语料的处理和统计需要,我们将单字代词后面加“等”或
“辈”表示复数意义的语法单位,作为一个分词单位进行处理,如:
汝等,我等,某等,此辈,我辈
(五) 数词
所谓数词,就是表示数的概念或者顺序次序的词。数词分为基数词和序数词
3

1、 我们将表示确切数字的基数词作为一个分词单位,如:
三,三十,二十,十二,一,亿兆
2、 当几个数词一起表示一个概数或约数意义的语法单位的,我们将其
作为一个分词单位进行处理,如:
数万,数十,十余,百余,数十万
3、 序数词,我们作为一个分词单位进行处理,如:
第八,第一,第二,第四
4、 数量词,在处理过程中,我们是将数词和量词分开处理的,如:
三 尺,三 丈,二十 里,六十四 种,二 勺,
(六) 量词
4
量词是表示计量单位的词 ,根据对象的不同,可以分为物量词和动量词两
大类。
1、 单字节的量词我们作为一个分词单位划分,如:

1
黄伯荣 廖序东.现代汉语[M].高等教育出版社,2007.第 27 页
2
陈爱文. 汉语词类研究和分类实验[M]. 北京大学出版社, 1986.第 55 页。
3
黄伯荣 廖序东.现代汉语[M].高等教育出版社,2007.第 19 页
4
黄伯荣 廖序东.现代汉语[M].高等教育出版社,2007.第 21 页
14
年,卷,尺,疋,束,倍,里,斛,扇,石,岁,品
2、 二字量词构成的复合式词组,我们也将其作为一个分词单位划分,
如:
由旬,方丈
(七) 副词
副词是指限制和修饰动词及形容词性的词语,表示程度、范围和时间等意义
1
的词 。在处理过程中,我们主要对其进行以下处理:
1、 单音节或双音节副词能够明确表示一种修饰意味的,我们将其划分
为一个分词单位,如:
岂,抑,尤,忽,果,又,皆,惟,始,甚,未尝,不已,不由,俄,未几,
无不,已经,比频,仿佛,少顷,再三,良久,激窣,毕形,次第,适来
2、 对于单字副词的重叠形式或在使用过程中起到副词作用的词组,我
们将其划分为一个分词单位,如:
渐渐,双双,往往,时时,一一,日日,朝朝,稍稍,不得不
(八) 拟声词
2
拟声词,也叫“象声词”,是指模拟声音的词 ,能够给人以身临其境的感官
体验。对于该类词,我们对其进行如下的处理:
1、 单字拟声词,我们将其划分为一个分词单位,在《酉阳杂俎》中这
一类拟声词很少,只有零星的几个,如“霍”。
2、 双音节的拟声词,在书中较多,我们将二字重叠的或者一起表示整
体意义的拟声词,分为一个分词单位,如:
萧萧,颯颯,磔磔,足足,嚇嚇,簌簌,啾啾,窣窣,窸窣,腷膊
(九) 叹词
3
叹词是表示感叹、呼唤和应答的词 。在《酉阳杂俎》一书中叹词比较少,
主要有“吁嗟”、
“ 吁”、
“ 嗟乎”等,我们在分词时,一律将其作为一个分词单
位处理。
(十) 介词
介词是虚词的一个类别。介词是指依附于实词或者短语的前面起标记作用的
4
语言单位 。在分词过程中,我们将介词作为一个分词单位进行处理,如:
于,为,以,自,与,在,被,由
(十一) 连词
1
黄伯荣 廖序东.现代汉语[M].高等教育出版社,2007.第 24 页
2
黄伯荣 廖序东.现代汉语[M].高等教育出版社,2007.第 30 页
3
黄伯荣 廖序东.现代汉语[M].高等教育出版社,2007.第 31 页
4
黄伯荣 廖序东.现代汉语[M].高等教育出版社,2007.第 37 页
15
1
连词是连接词和短语等,起连接作用的词 。在《酉阳杂俎》中连词几乎多
为单音节,也有几个双音节的情况。不管是哪种形式,我们都将其划为一个分词
单位,如:
固,而,乃,则,但,及,故,或,虽,于是
(十二)助词
助词是指附着于实词和短语或者句子等语言单位上面表示结构关系或动态
2
等语法意义的词 。
1、 单字或二字助词,我们作为一个分词单位进行处理,如:
之,诸,许,者,等,来,而已
2、 动词前面的“所”,我们在处理过程中,也将其独立作为一个分词单
位,如:
所 在,所 献,所 向,所 居,所 中
(十三)语气词
3
语气词是指在句尾表示语气或在句中表示停顿作用的词 。在语料处理过程
中,我们将语气词划分为一个分词单位,如:
也,乎,焉,无,矣,耳,耶,欤

第二节 分词实践

在《酉阳杂俎》的分词过程中,我们采用软件分词和人工分词相结合的方法,
取二者的长处,并且对于二者的不足之处互相补充,从而使得分词实践的结果更
为准确合理,为下文的分析工作打下良好的基础。

一、软件分词

在进行软件分词实践之前,我们先利用由厦门大学牵头设计的《汉字简繁文
4
本智能转换系统》 ,将前面校对好的繁体版《酉阳杂俎》转换成简体字体。通
过安装操作转换之后,我们发现,厦门大学的这个转换软件的使用非常方便快捷,
繁简转换的准确率能达到 99.99%。但是在使用中我们也发现了一些不足。

1
黄伯荣 廖序东.现代汉语[M].高等教育出版社,2007.第 38 页
2
黄伯荣 廖序东.现代汉语[M].高等教育出版社,2007.第 40 页
3
黄伯荣 廖序东.现代汉语[M].高等教育出版社,2007.第 45 页
4
该系统由厦门大学、教育部语言文字应用研究所、北京师范大学联合研发,由教育部、国家语言文字工
作委员会于 2012 年底启动、于 2014 年 7 月完成并通过专家鉴定。它克服了同类软件在“一简多繁”转换
情况下的不足。系统可同时进行字、词、专业术语、标点符号等多种转换,并提供了网站全部页面转换功
能。经中国中文信息学会评测,该系统在字级别简体到繁体的转换准确率达到 99.99%。
16
1、对于篇幅较大的繁体文本,特别是文本中具有较多异体字的时候,该软
件在文本转换过程中容易出现卡机的情况,不能顺畅地完成文本的转换。如在《酉
阳杂俎》中,“由来不窥象戏,试造旬日卽成,以此有限之心,逢事卽欲穿凿”
的“卽”,“ 数蔕簇开”的“蔕”; “衡山祝融峯下法华寺”的“峯”等。
2、对于一些在简体字中找不到替换对象或没有收录的词该软件会用方框表
示,如“視臆前微微有縱白斑之理,理色暖昧如纁,觜本之色微帶青白”中的“纁”,
转换结果就为“理色暖昧如 ”,在一定程度上影响文本转换的准确性。
3、该软件不能主动跳过不能转换的文字,继续完成可以转换的对象,而是
会出现如“队列为空”或者“超出范围值”等提醒。
在利用繁简转换软件生成简体版的《酉阳杂俎》文本之后,我们对文本中的
错误进行校对改正,确保语料的准确性。然后我们采用中国科学院计算机研究所
的 ICTCLAS 分词软件,对文本进行分词处理。在分词过程中,我们发现,虽然这
款分词软件在现代汉语语料处理中已经能达到 98.45%的准确率,但是在实际实
践过程中,分词结果还是因文本而异的,特别是在处理《酉阳杂俎》这样中古时
期的语料文本,分词结果很不理想,准确率才达到 53%左右。如:
贞观中,忽有白鹊构巢于寝殿前槐树上,其巢合欢,如腰鼓,左右拜舞称贺。上
日:“我常笑隋炀帝好祥瑞,瑞在得贤,此何足贺!”乃命毁其巢,鹊放于野外。
用 ICTCLAS 分词软件处理结果如下:
贞/n 观/g 中/f ,/w 忽/d 有/v 白/a 鹊/g 构/g 巢/n 于/p 寝/g 殿/g 前/f
槐树/n 上/f ,/w 其/r 巢/n 合欢/n ,/w 如/v 腰鼓/n ,/w 左右/m 拜/v 舞
/v 称/v 贺/g 。/w 上/f 曰/v :/w“/w 我/r 常笑/n 隋/t 炀/g 帝/g 好/a 祥
瑞/a ,/w 瑞/b 在/p 得/v 贤/g ,/w 此/r 何/r 足/d 贺/g !/w ”/w 乃/c 命
/n 毁/v 其/r 巢/n ,/w 鹊/g 放/v 于/p 野外/s 。/w
从上面我们可以发现,该分词软件对于如“贞观”“隋炀帝”等表示年号或
人名的专有名词无法正确划分。通过对分词结果的分析,我们将该分词软件在古
汉语语料处理中的错误归纳为以下几点:
1、对于该软件未收录词的处理存在误差。比如一些表示地名或者年号谥号
及人名的处理,如:
骨力干国:这本是一个音译过来的国名,该软件在分词过程中将它处理为“骨/g
利/n 干/v 国/n”,显然是不正确的。
口脂:在古代是指用以防止寒冬口唇开裂的唇膏,是一个词。但是在处理过程中,
该软件将其分开划分,是不正确的。
蜡脂:指的是古代以中国用于洁面的乳膏。在分词软件分词过程中,将其分开划
分为两个词也是不对的。

17
2、中古汉语词汇以单音节占主体,很多单音节词语能够独立表示一个或多
个完整的意思,和现代汉语不同,从而使得该软件在分词处理过程中出现误差。
如:
从而:在现代汉语里,它可以整体表示一个连词。但是,在中古汉语中,它们是
独立的个体。如在《酉阳杂俎》中,“食顷,出血斗余,众人疑向观者,令其父
从而求之”,在这里,“从”表示跟从,“而”是表示承接的一个词。而在该分词
软件分词过程中,将二者分为一个单位,显然是不对的。
人工:在现代汉语中是指“人为的,人造的”。在古代汉语词汇中,它们二者并
不表示一个词语,如“蜀人工于刺,分明如画”中,“人”应该和前面的“蜀”
所修饰的对象,而“工”在这里是指“擅长”的意思。而在软件分词过程中,该
句的分词结果为“蜀/b 人工/n 于/p 刺/v ,/w 分明/d 如/v 画/n ”,将“人
工”作为一个分词单位划分显然是不正确的。
3、在词性标注方面,很多词语身兼多种词性,因出现的不同语义环境而不
同,古代汉语相对于现代汉语又更为复杂。该分词软件在识别和标注同类词在不
同语义环境的不同词性上,存在缺陷。如:
将:在《酉阳杂俎》中,如“蜀将尹偃营有卒,晚点后数刻,偃将责之”中,前
一个“将”是名词,表示“軍将、将士”的意思,而后一个“将”是一个副词,
表示“将要”。但是在分词过程中,该分词软件将其词性一律标为“副词”。
综上可见,在完成分词软件自动分词之后,对这些电子语料再次施行人工干
预分词,显得极为重要。这样可以在很大程度上保证分词实践结果的准确性,便
于后期对各类数据的分析。

二、人工干预分词

在分词前,我们以 ICTCLAS 的词性标注集为参照,并且结合《酉阳杂俎》的


具体词汇情况,制定以下的词汇标注集,以便使得实际分词过程中规则更为可行,
如下:

18
词类 标引代码 词类 标引代码
名词 n 叹词 e
人名 nr 拟声词 o
地名 ns 区别词 b
其他专名 nz 连词 c
时间名词 t 介词 p
方位词 f 副词 d
形容词 a 助词 u
动词 v 状态词 z
数词 m 代词 r
量词 q 习用语 l
处所词 s 语气词 y
后接成分 k 标点符号 w
表 2-1
其中,地名包括地点名称和山河名称等;而其他专有名词则包括官职名、族
名和年号。
在分词过程中,由于《酉阳杂俎》中有很多词语现在已经不常用了,所以分
词过程中,我们还借助《汉语大词典》、江蓝生《唐五代语言词典》、王瑛《唐宋
笔记语辞汇释》等工具书,以免在分词过程中出现划分错误,确保分词的顺利进
行。
经过手动分词的结果如下:
貞觀/nz 中/f ,/w 忽/d 有/v 白鵲/n 搆巢/v 於/p 寢殿/s
前/f 槐樹/n 上/f ,/w 其/r 巢/n 合歡/v ,/w 如/v 腰鼓/n ,/w
左右/n 拜舞/v 稱賀/v 。/w 上/nr 曰/v :/w “/w 我/r 常/a 笑
/v 隋煬帝/nr 好/v 祥瑞/n ,/w 瑞/n 在/p 得/v 賢/a ,/w
此/r 何/r 足/v 賀/v !/w ”/w 乃/c 命/v 毀/v 其/r 巢
/n ,/w 鵲/n 放/v 於/p 野外/n 。/w

第三节 词语结构标引

由于本文是采用人工干预分词,是在 word 工作页面进行的,因此,在进行


词语结构标引之前,先把处理好的分词文本,先将其转换为 Excel 表格,然后在
工作表中完成音节长度及词语结构的标注。音节长度的标注主要分为单音节、双
音节和多音节三种。而词语结构的标注,本文以《现代汉语》的标准为参照,对

19
《酉阳杂俎》的词汇进行单纯词和合成词的划分。
根据黄廖本《现代汉语》中指出,由单个语素构成的词就叫做单纯词,由两
1
个或两个以上语素构成的词叫做合成词 。其中单纯词又分为连绵词(双声、叠
韵、其他)、叠音词、音译外来词;合成词分为复合式(联合式、偏正式、补充
式、动宾式、主谓式)、重叠式、附加式(前加式、后加式)。同时我们还对词语
的构成要素进行标注,如作色,动宾式,v + n。这样的分析,能够更全面地描
写和分析《酉阳杂俎》的词汇特征。

1
黄伯荣 廖序东.现代汉语[M].高等教育出版社,2007.第 257 页
20
第三章 《酉阳杂俎》词频统计结果及分析

第一节 词频统计的相关概念简介和统计方法介绍

在进行统计之前,需了解一下词频统计的相关概念。在制作《酉阳杂俎》的
词表时,本文把书中出现的词语称为词目(type),把每个词出现在文中的次数
称为词次(token),而把词语在书中出现的次数占总词次的比例称为词频。在分
析研究过程中,我们最后生成的《酉阳杂俎》的词表就是包括了词目、词次、词
频这三方面的内容,文后会附有《酉阳杂俎》词表。
在完成《酉阳杂俎》的语料校对和处理之后,借助计算机的相关软件对其进
行处理,以期得到《酉阳杂俎》的词表和词频数据。首先,把 Excel 表格中的词
语按照升序进行排序,得到了按照首字母的先后顺序排列的表格,然后选中词语
这一列,将其复制粘贴到 Word 文档中,将其保存为.doc 格式,命名为“文档 1”,
并且单独放在一个文件夹中。然后借助程南昌设计的计算机统计软件
1
HY2009YLCL ,对其进行词频统计,打开的软件界面如下:

用鼠标点击工具栏中的“字频与词频”,选择“中英文字频/词频(大规模)”,
会打开如下的窗口:

1
程南昌制作。
21
选择中文及英文词频统计,然后选择源文本目录(也就是之前文档 1 的保存
路径)和保存到的目录,然后点击“开始统计”。这样不到 10 秒钟我们就得到了
统计好的《酉阳杂俎》中各个词语的出现次数表,结果显示如下:
之,1847
有,1513
其,1106
不,1074
一,1059
曰,865
中,806
為,802
如,750
人,677
也,615
於,561
以,561
者,541
而,503
至,478
言,450
上,429
見,422
此,416
由于该软件生成的结果并不是表格形式,为了便于统计和操作,我们需要将

22
其先转换为 Excel 表格的形式。在文档中选中所有数据,然后点击“表格”中的
“将文本转换为表格”的子菜单,在“文字分隔位置”中选择“逗号,如下图所
示:

然后点击确定,就成功地将其转换为表格了。然后再将这一表格复制到
Excel 表格中,在第一行中插入一行,分别将字段命名为“词目、词次、词频”,
最后利用函数公式,计算得出每一个词在全书中的出现频率,得到《酉阳杂俎》
的词频表。

第二节 《酉阳杂俎》词频统计结果分析

一、概述

通过完成对《酉阳杂俎》进行语料校对、分词实践和计算机软件统计分类等
工作之后,得到了《酉阳杂俎》的词频表。最后生成的表格是将文中出现的标点
符号以及一些特殊符号除去之后的结果。通过统计整理,最后得出《酉阳杂俎》
总共有 81912 个词,不重复的词条总共有 15713 条。通过对《酉阳杂俎》全书语
料的整理和分析,得到了该书用词的较为详细的数据,可以大致划分得出其用词
的特点。本文不仅统计出词语的出现次数,计算出其在该书中的出现频率,而且
对于词语的音节长度和构词方式也做了较为详细的研究。
词频的数值,可以很直观明了地显示词语在专书中使用的活跃程度,研究专
书的词频,有利于更全面更透彻地了解该书的词语使用情况,以及该时代语言发
展的相关特点。在研究过程中,结合《酉阳杂俎》的词语特点,将研究所得到的
《酉阳杂俎》词频表,按照其词目的出现次数以及词频数值的高低,并根据《酉

23
阳杂俎》语料的整体情况出发,结合各个词目出现次数的不同特点,本文将词目
划分为高频词(词频值大于 0.122%,出现次数高于 100)、次高频词(词频值介
于 0.122%和 0.011%,出现次数介于 99 至 9)、次低频词(词频介于 0.0098%至
0.002%,出现次数在 9 至 2)、低频词(词频值低于 0.002%,出现次数为 1)。

二、高频词分析

根据前面所划分的用词分区的标准,我们得到了《酉阳杂俎》中 108 个高频


词:
之(1847) 有(1513) 其(1106) 不(1074) 一(1059) 曰(865)
中(806) 為(802) 如(750) 人(677) 也(615) 於(561)
以(561) 者(541) 而(503) 至(478) 言(450) 上(429)
見(422) 此(416) 所(394) 乃(388) 無(376) 因(351)
及(315) 在(304) 數(284) 出(279) 時(266) 可(266)
與(260) 大(254) 又(249) 下(247) 得(244) 日(244)
三(241) 名(231) 入(230) 亦(223) 令(217) 遂(215)
生(214) 忽(214) 僧(213) 云(209) 自(202) 二(199)
食(197) 矣(196) 嘗(195) 後(194) 長(194) 復(192)
謂(189) 知(185) 年(183) 死(180) 若(178) 前(175)
常(173) 則(170) 能(169) 尺(168) 方(163) 將(159)
皆(154) 五(154) 初(150) 是(149) 已(146) 或(146)
多(145) 取(144) 處(143) 色(139) 卽(139) 子(137)
餘(136) 事(134) 我(134) 去(130) 水(129) 四(126)
焉(126) 用(126) 六(125) 甚(125) 作(121) 今(121)
物(120) 兩(117) 每(116) 似(116) 葉(112) 欲(112)
必(110) 當(109) 呼(108) 悉(108) 家(107) 行(106)
形(105) 里(104) 未(104) 聲(104) 寸(102) 狀(100)
表 3-1
从上表可以看出,这 108 个高频词在《酉阳杂俎》中占总词目的比例不过是
0.69%,而累积覆盖率却达到了总词量的 38.2%,可见,这 108 个高频词在该书
中的使用非常活跃,覆盖率很高,而且也在一定程度上说明了这些词语在《酉阳
杂俎》中具有极强的表达能力,在使用过程中具有较高的稳定性。
从音节长度上看,不难发现这 108 个词语皆为单音节词语。可见,在唐代中
古汉语中,单音节词语在语言使用过程中仍然占有主导地位,这一语言趋势还未
发生大的改变。
我们从这 108 个高频词的词性与语料的关系,得出下表:

24
词类词性 实词 虚词

名词

动词

形 容
数词

量词

代词

副词

介词

连词

语 气
助词
词 目
24 33 5 8 3 6 14 3 7 3 2

比 例 22.2 30.6 4.5 7.4 2.8 5.5 13.0 2.8 6.5 2.8 1.9
(%) 73 27
表 3-2
从上表不难看出,在 108 个高频词中,动词,名词,副词所占的比例较高,
而从整体上看,不难看出当中实词占了绝大比例,数值高达 73%,而虚词仅占了
27%。

三、低频词分析

本研究中将出现次数为 1 的词目划分为低频词。在统计过程中,发现低频词
数量庞大,总共有 10459 条,占总词目的 66.56%。其中单音节词语有 857 条,
所占比例为 8.2%;双音节词语 7375 条,比例为 70.5%;多音节词语有 2227 条,
所占比例为 21.3%。
从上面的数据可以明显看出,从音节长度来看,低频词中各个音节长度类型
的词所占的比例和高频词的情况几乎是完全相反的。在低频词中,单音节的比例
很低,而双音节和多音节词语的比重却占有绝对优势。这些词虽然数量庞大,但
是出现次数却很低,因此,可以推测,这些双音词和多音词可能产生时间较晚,
在当时社会生活的使用中还比较不稳定,大众接受程度还有待发展,因此,出现
文中的这一种情况。但是,由此也可以看出,在汉语发展过程中,双音化的趋势
是语言发展的主流趋势。

四、利用《酉阳杂俎》的词频分布验证齐普夫定律

齐普夫定律是由美国哈佛大学的语言学教授齐普夫在上世纪三、四十年代提
出来的关于词频的理论。齐普夫教授在对不同英语文本的词频进行统计之后,发
现虽然这些文本的作者不同,而且行文风格也有很大的差异,但是在文本中的词
语出现的频次和它的等级之间存在着一定的联系。于是,齐普夫在整合了学界对
词频分析的相关研究的基础之上,提出了该定律。齐普夫定律包括第一定律和第
二定律。该定律自出现以来就一直受到社会各界的关注,也越来越多地被应用于

25
情报学、文献计量等方面的研究。学界很多学者也对其进行了深入的研究和验证,
从而推导出新的定律,如洛特卡定律等。但是齐普夫定律的提出是以以英语为代
表的印欧语系语言为研究对象的,对于世界上的其他语言的词频研究是否一样适
用,仍然不得而知。近些年来,国内有很多语言学家开始关注齐普夫定律在汉语
词频分析中的运用。本文将在前面《酉阳杂俎》词频研究工作的基础上,尝试着
对齐普夫定律进行验证。
1、 对齐普夫第一定律的验证
齐普夫第一定律的基本内容是:在一个篇幅较长的文本中,如果对它所有出
现的词语进行出现的次数和频率进行分析统计,然后按照频率的高低进行排列,
并且对其进行等级编号,即频次最高的等级为 1,紧挨着的等级为 2……,如果
用 Fr 表示该词语在文本中的频次,r 表示这个词在文本中的等级编号,C 表示一
个常数,那么三者一定会满足 Fr·r=C 的关系式。
下面本文以《酉阳杂俎》中 108 个高频词作为例子,尝试验证齐普夫第一定
律。
我们根据前面研究基础上的数据,应用齐普夫第一定律的公式,计算出各个
高频词对应的数据,整理得到下表:
排序 词 词次 词频 词频与序号乘积
1 之 1847 0.02254308451 0.02254308451
2 有 1513 0.01846653322 0.03693306645
3 其 1106 0.01349899917 0.04049699751
4 不 1074 0.01310843138 0.05243372553
5 一 1059 0.01292535273 0.06462676366
6 曰 865 0.01055753552 0.06334521310
7 中 806 0.00983742616 0.06886198311
8 為 802 0.00978860518 0.07830884148
9 如 750 0.00915393253 0.08238539276
10 人 677 0.00826294976 0.08262949763
11 也 615 0.00750622467 0.08256847142
12 於 561 0.00684714153 0.08216569838
13 以 561 0.00684714153 0.08901283992
14 者 541 0.00660303666 0.09244251330
15 而 503 0.00613923742 0.09208856125
16 至 478 0.00583410633 0.09334570131
17 言 450 0.00549235952 0.09337011180
18 上 429 0.00523604941 0.09424888932
19 見 422 0.00515061270 0.09786164136
20 此 416 0.00507738124 0.10154762486
21 所 394 0.00480886589 0.10098618366
22 乃 388 0.00473563443 0.10418395743
26
23 無 376 0.00458917151 0.10555094469
24 因 351 0.00428404042 0.10281697017
25 及 315 0.00384465166 0.09611629156
26 在 304 0.00371039399 0.09647024362
27 數 284 0.00346628912 0.09358980618
28 出 279 0.00340526290 0.09534736123
29 時 266 0.00324659474 0.09415124738
30 可 266 0.00324659474 0.09739784211
31 與 260 0.00317336328 0.09837426158
32 大 254 0.00310013182 0.09920421813
33 又 249 0.00303910560 0.10029048479
34 下 247 0.00301469511 0.10249963384
35 得 244 0.00297807938 0.10423277840
36 日 244 0.00297807938 0.10721085778
37 三 241 0.00294146365 0.10883415515
38 名 231 0.00281941122 0.10713762632
39 入 230 0.00280720598 0.10948103305
40 亦 223 0.00272176927 0.10887077088
41 令 217 0.00264853781 0.10859005029
42 遂 215 0.00262412733 0.11021334765
43 生 214 0.00261192208 0.11231264951
44 忽 214 0.00261192208 0.11492457160
45 僧 213 0.00259971684 0.11698725773
46 云 209 0.00255089586 0.11734120978
47 自 202 0.00246545916 0.11587658058
48 二 199 0.00242884343 0.11658448469
49 食 197 0.00240443294 0.11781721428
50 矣 196 0.00239222770 0.11961138505
51 嘗 195 0.00238002246 0.12138114534
52 後 194 0.00236781721 0.12312649514
53 長 194 0.00236781721 0.12549431236
54 復 192 0.00234340673 0.12654396329
55 謂 189 0.00230679100 0.12687350486
56 知 185 0.00225797002 0.12644632134
57 年 183 0.00223355954 0.12731289362
58 死 180 0.00219694381 0.12742274081
59 若 178 0.00217253332 0.12817946590
60 前 175 0.00213591759 0.12815505541
61 常 173 0.00211150710 0.12880193331
62 則 170 0.00207489137 0.12864326515
63 能 169 0.00206268613 0.12994922619
64 尺 168 0.00205048089 0.13123077674
65 方 163 0.00198945467 0.12931455353
27
66 將 159 0.00194063370 0.12808182395
67 皆 154 0.00187960748 0.12593370112
68 五 154 0.00187960748 0.12781330860
69 初 150 0.00183078651 0.12632426891
70 是 149 0.00181858126 0.12730068838
71 已 146 0.00178196553 0.12651955280
72 或 146 0.00178196553 0.12830151833
73 多 145 0.00176976029 0.12919250110
74 取 144 0.00175755505 0.13005907338
75 處 143 0.00174534980 0.13090123517
76 色 139 0.00169652883 0.12893619099
77 卽 139 0.00169652883 0.13063271982
78 子 137 0.00167211834 0.13042523068
79 餘 136 0.00165991310 0.13113313479
80 事 134 0.00163550261 0.13084020895
81 我 134 0.00163550261 0.13247571157
82 去 130 0.00158668164 0.13010789435
83 水 129 0.00157447640 0.13068154079
84 四 126 0.00153786066 0.12918029586
85 焉 126 0.00153786066 0.13071815652
86 用 126 0.00153786066 0.13225601718
87 六 125 0.00152565542 0.13273202168
88 甚 125 0.00152565542 0.13425767710
89 作 121 0.00147683445 0.13143826588
90 今 121 0.00147683445 0.13291510033
91 物 120 0.00146462920 0.13328125763
92 兩 117 0.00142801347 0.13137723966
93 每 116 0.00141580823 0.13167016550
94 似 116 0.00141580823 0.13308597373
95 葉 112 0.00136698726 0.12986378948
96 欲 112 0.00136698726 0.13123077674
97 必 110 0.00134257677 0.13022994679
98 當 109 0.00133037153 0.13037640971
99 呼 108 0.00131816628 0.13049846214
100 悉 108 0.00131816628 0.13181662842
101 家 107 0.00130596104 0.13190206513
102 行 106 0.00129375580 0.13196309134
103 形 105 0.00128155055 0.13199970707
104 里 104 0.00126934531 0.13201191232
105 未 104 0.00126934531 0.13328125763
106 聲 104 0.00126934531 0.13455060294
107 寸 102 0.00124493482 0.13320802617
108 狀 100 0.00122052434 0.13181662842
28
表 3-3
从上表的数据来看,除了前面六个词语之外,其他词语的词频和序号的乘积
大多围绕着 0.1 上下浮动。对于“C”是一个常数的论断,齐普夫在研究之初指
出“C”是一个等于 0.1 的常数,但是后来齐普夫在不断的研究分析过程中,有
对自己原来的论断进行了修改,将“常数”改为“参数”。因此,邱均平在他的
《信息计量学》一书中就提出,在齐普夫的定律中,
“C”表示的常数并不是恒定
不变的数值,而是指一个中心数值,也就是说文本中词频和序号的乘积所围绕着
1
波动的数值 。综上来看,
《酉阳杂俎》的高频词分布还是大致符合齐普夫第一定
律的。
2、 对齐普夫第二定律的验证
齐普夫的第二定律主要针对文本中的低频词的分布情况。这一条定律最早是
由 Andrew D. Booth 提出的,然后在其著作中将该定律称为齐普夫第二定律。它
的表达式为:In/I1=2/n(n+1),其中 n 表示词次,In 是表示出现次数为 n 的词语
的个数,I1 表示出现次数为 1 的词语的个数。
在《酉阳杂俎》语料中,各类次数的词语数量如下:
出现一次的词语数量 I1 有 10459;
出现两次的词语数量 I2 有 1985;
出现三次的词语数量 I3 有 825;
出现四次的词语数量 I4 有 469;
出现五次的词语数量 I5 有 285;
出现六次的词语数量 I6 有 221;
出现七次的词语数量 I7 有 155;
出现八次的词语数量 I8 有 119;
出现九次的词语数量 I9 有 115;
出现十次的词语数量 I10 有 83;
根据齐普夫第二定律的相关公式,本文对上述几类低频词进行预测值和实际
值的计算比较。
预测值: 实际值:
I2/I1=2/2(2+1)=0.32; I2/I1=1985÷10459=0.19
I3/I1=2/3(3+1)=0.17; I3/I1=825÷10459=0.08
I4/I1=2/4(4+1)=0.1 I4/I1=469÷10459=0.04
I5/I1=2/5(5+1)=0.07 I5/I1=285÷10459=0.03
…… ……

1
邱均平.信息计量学[M].武汉:武汉大学出版社,2007:138.
29
从上组数据中可以看出,在《酉阳杂俎》语料中,预测值≠实际值,而且实
际值均比预测值要小。因此,《酉阳杂俎》语料中的低频词分布机理不符合齐普
夫第二定律。之所以出现这种的情况,可能是和本文所选的文本有关。《酉阳杂
俎》中涉及很多专有名词,而且这些词语在文本中出现的次数几乎都为 1,这就
使得 I1 的数值很大。再则齐普夫定律是在研究英语的基础上总结出来的,对于
汉语的适用性可能还不太明确,而且《酉阳杂俎》是唐朝的笔记小说,语料属于
中古汉语范畴,和现代汉语相比具有一定的差异,从而对验证结果产生影响。

30
第四章 《酉阳杂俎》词语结构分析

第一节 单音节词分析

一、单音节词的数量分析

在《酉阳杂俎》中,总共有 3265 个单音节词目,占总词目的 20.8%。本文


对各类频次词语中的单音节词进行了统计,结果如下表:
单音节词
词频分布 高频词 次高频词 次低频词 低频词
词目数 108 927 1373 857
所占比例 3.31% 28.40% 42.03% 26.26%
表 4-1
这一个比例虽然不是很高,但是由于单音节词在高频词和次高频词中占据绝
对优势,因此,使得单音节词在《酉阳杂俎》中的词语使用中非常活跃。不仅如
此,单音节累积出现 61873 次。虽然从上表我们可以看到,高频词的单音节词目
占总词目的比例较低,但是由于这些高频词的出现次数都在 100 以上,多的甚至
达到 1000 多,因此,单音节在文中的累积出现次数如此之高,覆盖频率如此大
也就不足奇怪了。由此可见,在《酉阳杂俎》成书年代,在语言使用过程中,单
音节词语仍然具有绝对优势,在使用过程中具有极大的稳定性。

二、单音节词的词性分布情况统计分析

在《酉阳杂俎》一书中,单音节词数量很多,在全书中总共出现 61873 次。
在研究过程中,我们对其也进行了词性标注。因为在使用过程中,一些词语兼具
不同的词性,因此,为了使分析的数据更具有科学性和准确性,本文在统计过程
中采用单音节词在全书中出现的累积次数(包括重复出现的词语),作为分析对
象,而不是词目数据。经过统计分析,其结果如下图:

31
单音节词中各词类所占比例分布图

从上图可以看出,在全书的单音节使用过程中,作为动词和名词的单音节词
所占比例最多,拟声词和叹词的比例最少,几乎接近于 0。可以看出,在当时社
会背景下,单音节动词在语言使用过程中是非常活跃和稳定的。

第二节 双音节及多音节词分析

双音节和多音节词,在《酉阳杂俎》全书中,总共有不重复出现的词目有
12448 个,其中双音节有 9918 个,占总词目的比例达到 63.1%。我们对各个频次
的双音节数目进行了统计分析,结果如下表显示:
双音节词语
词频分布 高频词 次高频词 次低频词 低频词
词目数量 0 155 2388 7375
比例 0.00% 1.56% 24.08% 74.36%
表 4-2
从上表可以看出,在《酉阳杂俎》中,双音节词在各个频次词语中的使用情
况。各频次中双音节词目数占总词目的比例从高频词到低频词呈现不断上升的趋
势。低频双音词有 7375 个,占低频词词目的 70.51%。而在双音节词目总数中,
低频双音节词语又占了 74.36%,数量庞大,这两个数据相差甚小。这也正好说
明了,在《酉阳杂俎》的词语使用中,低频词主要是双音节词构成的,也从正面
说明了在当时双音节词的使用频率还比较低的语言情况。虽然单音节词语的数量
比双音节词语少,但是正是因为双音节词语在日常生活中的使用率较低,从而造
成数量庞大的情况。
多音节词在《酉阳杂俎》全书词目中共有 2531 个,占总词目的 16.1%。多
音节词以专有名词为主体,其他类别的词语数量有限。多音节词在各个频次词语
中的分布情况如下表所示:

32
多音节词
词频分布 高频词 次高频词 次低频词 低频词
词目数量 0 5 299 2227
比例 0.00% 0.20% 11.80% 88.00%
表 4-3
从上表可以看出,多音节词目大多集中在低频词中。
我们将《酉阳杂俎》中的单音节词目和双音节词目进行对比分析,得出以下
数据:
音节长度 单音节 双音节
词目总数 3265 9918
词目比例 20.8% 63.1%
累积次数 61873 16998
累积频率 75.53% 20.75%
表 4-4
从上表我们可以看出,虽然在全书的词目中,单音节词目与双音节词目在数
量上差距甚远,但是单音节词在全书的累积词次和累积频率方面的数量却占有绝
对的优势。也就是说在《酉阳杂俎》的语料中,单音节词是其主要组成部分。双
音节词虽然词目数量多,但是其累积频率并不高,这些数据也从某一方面说明了,
双音节词语在当时日常生活使用中频率偏低,大多集中在一些刚产生不久的新词
上,因此在数量上比单音节词更具优势。随着语言的发展,词语双音化的程度必
然会不断加强,双音节在语言使用过程中也肯定会扮演越来越重要的角色,这一
点是毋庸置疑的。

第三节 双音节词结构分析

双音节词,根据词语组成部分的结构关系,大致可以划分为单纯词和合成词
两大类。根据统计分析发现,在《酉阳杂俎》的语料中,单纯双音节词除了有由
一个语素构成的词语之外,还有一些双声,叠韵,双声叠韵,非双声叠韵,以及
一些音译外来词和表示声音的叠音词等。合成词则主要有复合词,附加式以及一
些两个相同语素重叠构成词语。复合词主要包括联合式、偏正式、补充式、主谓
式、动宾式几种类型,而附加式主要是前缀加词根和词根加后缀这两种构词类型。

33
一、双音节单纯词结构分析

1
由一个语素构成的词语叫做单纯词 。双音节单纯词根据语素间的关系以及
所表意义的不同,又可以分为双声、叠韵、非双声叠韵、叠音词等。下面本文对
其具体举例说明。
1、 双声词
双声词就是在一个单纯词中,组成词语的两个语素的声母相同的词。在《酉
阳杂俎》的语料中,这类词语不重复的词目数有 24 个,而在文中本类词语重复
的词语数目有 57 个。它们大多在文中充当名词,其次是形容词、副词、动词和
拟声词。
仿佛(词次:3):後有事,鬼仿佛夢中報之,以是獲財,欲至十萬而卒。
惆悵(词次:2):高僧獨惆悵,為與澄嵐隔。
恍惚(词次:9):顧況喪一子,年十七,其于魂遊,恍惚如夢,不離其家。
顛當(词次:4):顛當,成式書齋前,每雨後多顛當。
畢撥(词次:1):又青州防風子可亂畢撥。
琉璃(词次:4):琉璃瑪瑙,先以自然灰煑之令軟,可以雕刻。
2、 叠韵词
所谓叠韵词,就是组成单纯词的两个语素的韵基相同的词语。在《酉阳杂俎》
语料中,叠韵词不重复的词目有 50 个,而该类词语在文中重复出现的词语数目
有 97 个。如:
樗蒲(词次:2):據《博塞經》云:無齒為繩,三齒為雜繩。今樗蒲塞行十
一字。
齟齬(词次:1):少,遍身刺一蛇,始自右手,口張臂食兩指,繞腕匝頸,
齟齬在腹,拖股而尾及骭焉。
袈裟(词次:5):彼國人四時常焚香散花,繞樹作禮。唐貞觀中,頻遣使往,
於寺設供,並施袈裟。
抖擻(词次:1):徵釋門衣事,語須對:如象鼻,投牛耳。五納,三衣。慚
愧,抖擻。壞衣,嚴身。
葫蘆(词次:2):江西人有善展竹,數節可成器。 又有人熊葫蘆,雲翻葫
蘆易於翻鞠。
3、 非双声叠韵
这类词在语料中总共有 110 个,重复出现的有 503 个。例如:
阿膠(词次:1):婚禮,納綵有合歡、嘉禾、阿膠、九于蒲、朱葦、雙石、

1
黄伯荣 廖序东.现代汉语[M].高等教育出版社,2007.第 257 页。
34
綿絮、長命縷、乾漆。
蕭艾(词次:1):范傳正中丞舉進士,省試《風過竹賦》,甚麗,為詞人所
諷,然為從竹之簫,非蕭艾之蕭也。
委頓(词次:1):以竹杖打壻為戲,乃有大委頓者。
形虞(词次:1):阿魏,出伽闍那國,卽北天竺也。伽闍那呼為形虞,亦出
波斯國,波斯國呼為阿虞截。
4、 叠音词
叠音词就是指一些由单个语素难以形成具有确切意义的词,于是借助语素叠
加这种构词方式构成的有区别于重叠式的音节形式。这一类词在《酉阳杂俎》中
主要是作为拟声词,也有少数的形容词。它在语料中总共有 20 个不重复的词目,
总共重复出现的词语有 24 个。如:
簌簌(词次:1):頃間,聞南垣土動簌簌,崔生意其蛇鼠也。
磔磔(词次:1):經年,女伺其去,竊窺之,見其騰空如飛,火髪藍膚,磔
磔耳如驢焉,至地乃復人矣,驚怖汗洽。
啾啾(词次:3):葉中有小鼠數十,纔若皂莢子,目猶未開,啾啾有聲。
颯颯(词次:1):棺兩角忽颯颯風起,有沙迸撲人面。
5、 音译外来词
在《酉阳杂俎》中,有一部分的音译外来词。这在很大程度上与唐代开放的
风气有很大的关系。这些音译外来词在语料中总共有 55 个,重复出现的词语有
173 个。这类词大多都是名词。如:
律多(词次:1):一千六百刹那為一伽那,倍六十名橫呼律多,倍三十名為
一日夜。
彌勒(词次:2):焉耆國元日、二月八日婆摩遮,三日野祀,四月十五日遊
林,五月五日彌勒下生。
布施(词次:1):十二種離垢布施生此天,群鳥青影覆萬由旬。
那庚(词次:1):狡兔起前,上舉撾擊斃之,帝稱那庚,從臣皆呼萬歲。
由旬(词次:10):眴目間行百千由旬,洲有赤地黑玉銅康白等。
薝蔔(词次:1):一雨微塵盡,支郎許數過。方同嗅薝蔔,不用算多羅。
蒲萄(词次:8):蒲萄,俗言蒲萄蔓好引于西南。
瞿曇(词次:1):張屬福德天,姓瞿曇,形、祭如井。
浮屠(词次:2):昆吾國,累墼為丘,象浮屠,有三層,屍乾居上,屍濕居
下,以近葬為至孝。

35
二、合成双音节词结构分析

1
合成词,是指由两个或两个以上能够单独成词的语素构成的词 。合成词根
据词素间的不同关系,大致可以分为复合词、重叠词和派生词三大类。在《酉阳
杂俎》的语料分析过程中,我们对于不同构词类型的词语间的词素的性质进行了
详细系统的分析和统计。在《酉阳杂俎》中,这三类合成词构词方式中还包括丰
富多样的小类,我们将对各个类别构成方式的词语进行具体类别的分析和说明。
(一) 复合词
复合词,在《酉阳杂俎》中,这类词的构词方式主要有联合式、偏正式、
补充式、动宾式和主谓式五大类。这类词语在全书语料中数量很多,总共有 7415
个不重复词目,占总词目数的 47.2%。其中联合式词目有 1282 个,偏正式的词
目有 4825 个,补充式词目有 190 个,动宾式词目有 1011 个,主谓式的词目共
有 137 个。后面各个类别的词目总数之所以和复合词的词目总数不相同,是因
为在《酉阳杂俎》的语料中存在着一些同形异构的词语,我们将在后面对这类
词做详细说明。
1、联合式
联合式是由两个意义相近、相同或相反的词根并列组合而成的词,又称为并
2
列式 。在《酉阳杂俎》语料中,联合式词语的词目数占复合式词目总数的 17.28%。
联合式词语内部的结构方式比较丰富,我们将从以下几个方面对其进行分类分
析。
从构成词语的要素的语义角度来看的话,《酉阳杂俎》中联合式词语主要可
以分为同义或类义语素构成的联合式词语和反义语素构成的联合式词语两类。
(1) 相同或相近语义语素构成的联合式词语,如:
兵士(词次:1)、倉庫(词次:3)、財貨(词次:1)、差誤(词次:1)、柴
薪(词次:1)、塵坌(词次:1)、祠廟(词次:1)、殿宇(词次:1)、故舊(词
次:2)
、好尚(词次:1)、疾病(词次:1)、郎君(词次:23)、廬舍(词次:2)、
履屣(词次:2)、名號(词次:1)、奴僕(词次:2)、脯臘(词次:1)、山嶽(词
次:1)
、瞳目(词次:1)、帷幄(词次:1)、屋宇(词次:2)、錫賁(词次:1)、
馨香(词次:1)
(2) 两个反义语素构成的联合式词语,如:
出入(词次:6)、升降(词次:2)、往來(词次:4)、大小(词次:1)、公
私(词次:1)、功過(词次:1)、古今(词次:2)、還往(词次:1)、合離(词
1
黄伯荣 廖序东.现代汉语[M].高等教育出版社,2007.第 257 页。
2
黄伯荣 廖序东.现代汉语[M].高等教育出版社,2007.第 259 页。

36
次:1)
、寒溫(词次:2)、緩急(词次:1)、吉凶(词次:2)、老少(词次:1)、
近遠(词次:1)
根据词语的词性及构成语素的词性来看,联合式词语又可以分为以下几类:
(1) 名词
1) 两个名词语素联合构成名词。
这类构成方式在联合式名词中很常见,数量庞大,占很大的比重。如:
風浪(词次:1):婦人渡河無風浪者,以為己醜,不致水神怒。
腹背(词次:2):漁陽白,腹背俱白,大者五斤便兔,生徐無及東西曲。
弓矢(词次:4):戰用象牙排、野牛角為矟,衣甲弓矢之器。
斤鑿(词次:1):因開襆,有斤鑿數事,玉屑飯兩裹,授與二人,曰:“分
食此,雖不足長生,可一生無疾耳。”
津梁(词次:1):徵前代關釋門佳譜:何充志大宇宙,此子疲於津梁。
酒肉(词次:6):何軫,鬻販為業,妻劉氏,少斷酒肉,常持《金剛經》。
2) 两个动词语素联合构成名词。
居止(词次:1):其塔去人居止甚近,女常下視,其物在空中不能化形,
至地方與人雜。
舉止(词次:8):劉與杜省躬同年及第,有分,其婢舉止笑語,無不肖也。
寢食(词次:1):歸家,母尚存,悲喜日:“自失爾,我唯念《金剛經》,
寢食不廢,以祈見爾,今果其誓。”
食飲(词次:1):又日:一居人頭中,令人多思欲,好車馬,其色黑:一居
人腹,令人好食飲,恚怒,其色青;一居人足,令人好色,喜殺。七守庚申三尸
滅,三守庚申三尸伏。
3) 两个形容词语素联合构成名词。
溫涼(词次:2):什遂前,入,就牀坐,其女在户東立,舆什叙温凉。
賢聖(词次:3):觀音院兩廊,四十二賢聖,韓幹畫,元中書載贊。
祥瑞(词次:1):上日:“我常笑隋煬帝好祥瑞,瑞在得賢,此何足賀!”
凶衰(词次:1):時時預言人凶衰,皆謎語,事過方曉。成都有百姓供養
數日,僧不欲住,閉關留之。
朱紫(词次:2):引劉至一廳,朱紫數十,有與相識者,有已歿者,各相視
無言。
4) 名词语素和动词语素联合构成名词。
宴集(词次:1):魏袁翻曾在湖宴集,參軍張伯瑜諮公言:“向為血羹,頻
不能就。”
像設(词次:1):其家奉釋,有像設數十,遂置於像前。

37
(2) 动词
1) 两个动词语素联合构成动词。
安置(词次:1):因舉袖,袖中蠕蠕有物,左顧似有所命,日:
“可為安置。”
持念(词次:6):元和中,光宅坊百姓失名氏,其家有病者將困,迎僧持念,
妻兒環守之。
導引(词次:2):初入,二人在前導引,次二人並行,次一人擎牙箱、班
劍箱,別二十人具省服,從者百餘人。
雕刻(词次:3):琉璃瑪瑙,先以自然灰煑之令軟,可以雕刻。
調笑(词次:1):及坐,含睇調笑,逸態絕世。
2) 名词语素和形容词语素联合构成动词。
洞達(词次:2):道術中有天狐別行法,言天狐九尾金色,役於日月宮,有
符有醮日,可洞達陰陽。
3) 名词语素和动词语素联合构成动词。
風詠(词次:1):什素有才藻,頗善風詠,雖疑其非人,亦愜心好也。
網羅(词次:1):據劉餗《傳記》,有患應病者,問醫官蘇澄,澄言:“無
此方。吾所撰
《本草》,網羅天下藥可謂周,令試讀之。”
(3) 形容词
在《酉阳杂俎》的语料中,联合式形容词的构词类型主要为两个形容词联合
构成一个形容词。如:
高大(词次:4):石桂芝,生山石穴中,似桂樹而實石也。高大如絞尺,光
明而味辛,有枝條,搗服之,一觔得千歲也。
貴賤(词次:1):後魏俗競厚葬,棺厚高大,多用柏木,兩邊作大銅鐶鈕,
不問公私貴賤,悉白油絡幰輛車,迾素矟仗,打虜鼓。
甘甜(词次:2):殼上有刺,瓤至甘甜可食。
昏黑(词次:2):時已昏黑,坊卒直入,通黎之官閥。
2、偏正式
偏正式就是指构词的语素间是一种修饰关系,前一词根修饰或限制后一词根
1

《酉阳杂俎》中,偏正式可谓是主要的构词方式,其数量庞大,占总词目数的
30.72%。由于这类词语数目较多,为了便于分析,我们依据构词语素的词性及关
系,将偏正式主要分为定中式和状中式两大类,并且对各个大类进行分小类举例
说明。

1
黄伯荣 廖序东.现代汉语[M].高等教育出版社,2007.第 259 页。

38
(1)定中式偏正式词语。
这类词主要是指名词性的偏正式词语。根据构词语素的词性的不同,我们又
将其划分为以下几个小类。
1) 名词修饰名词,如:
肉食(词次:1):江淮有孟娘菜,並益肉食。
螯膠(词次:1):善苑國出百足蟹,長九尺,四螯.煎為膠,謂之螯膠,
勝鳳喙膠也。
柏棺(词次:3):洛陽奉終里多賣送死之具,涵言作柏棺莫作桑欀。
貝珠(词次:1):馬聽之始惑,卽為具肪玉、紋犀及貝珠焉。
2) 形容词修饰或限定名词构成名词,如:
白馬(词次:13):白馬甜榴,一實直牛。
薄冰(词次:1):在此雖有薄冰,亦不廢行,不似河冰一合,便勝車馬。
碧衣(词次:1):飛飛年才十六七,碧衣長袖,皮肉如脂。
便殿(词次:3):李白名播海內,玄宗於便殿召見。
3) 动词修饰限定动词,如:
爭取(词次:1):他囚爭取之,獄卒意藏刃,破視,內有字兩行云:
“法尚
應捨,何況非法?”
責怒(词次:1):夢天劉翁責怒,每欲殺之,白崔輒以報堅。
4) 动词修饰名词,构成名词的,如:
走兽(词次:1):飛鳥觸之墮,走獸遇之僵。
租課(词次:1):劉晏判官李邈,莊在高陵,莊客懸欠租課,積五六年。
坐像(词次:1):景龍二年,又賜真容坐像,詔寺中別建聖容院,是玄宗在
春宮真容也。
定中式偏正式词语如果从语义角度来看,它还可以分为以下几个小类:
1) 表示身份、职业的词语,后面主要是接“人”、“子”等。如:
優人(词次:2):威遠軍小將梅伯成以善占夢,近有優人李伯憐遊涇州,
乞錢得米百斛。
友人(词次:3):會昌二年,其友人陸休符,忽夢被錄至一處,有騶卒止之。
渔人(词次:4):南燕世,有漁人居水側,常聽鵝之聲,眾中有鈴聲甚清亮。
樂人(词次:1):其日合寺聞絲竹聲,竟無樂人入寺。
官人(词次:2):京宣平坊,有官人夜歸入曲,有賣油者張帽驅驢,馱桶不
避,導者搏之,頭隨而落,遂遽八一大宅門。
獄卒(词次:2):官陳修古員外言:西川一縣,不記名,吏因換獄卒木薪之,
天尊形像存焉。

39
樂工(词次:1):樂工賀懷智、紀孩孩,皆一時絕手。
2) 表事物状态的词语。这类词的前一词根大多描述后一词根的颜色、
质地或状态等。如:
古書(词次:2):建中末,書生何諷嘗買得黃紙古書一卷,讀之。
高山(词次:2):又有藥名咀賴羅,在高山石崖下。
凡人(词次:5):伯成佇思日:“凡人好反語,洗白馬,瀉白米也。
大樹(词次:7):韋顧大樹,枝幹童矣。
白馬(词次:13):其臣車駕白馬,入水不溺,中河而後白馬浮出,負一旃
檀鼓
及書一函。
3) 表示时间和方位的。这类词的前一语素大多是表示时间或者指明某
一方位,如:
昔日(词次:2):貧道嘗聽長老說,昔日有人亦嘗至此,懷五六枚,迷不得
出。
翌日(词次:6):翌日,因宴于郭外。
前日(词次:2):此島蝦合供大王此月食料,前日已追到。
右邊(词次:1):寺有韓幹畫下生幀彌勒,衣紫袈裟,右邊仰面菩薩及二師
子,猶入神。
4) 表事物的性质和用途的词语。这类词语前一语素主要用于指明后一
语素所指事物的用途和性质,如:
羹碗(词次:1):因裹一襆物,大如羹碗,戒無竊開。
花房(词次:2):花房嫩彩猶未乾。
5) 表示亲属称谓的词。这类词中,前一语素表示亲属关系修饰后一语
素,如:
表兄(词次:5):曾於表兄家轉《金剛經》。
表姨(词次:1):君在院中也,今欲與一兩女伴過至上東門表姨處,暫借此
歇可乎?
曾孫(词次:1):後摩揭陀國滿胄王,無憂之曾孫也。
從女(词次:1):綬長六丈六尺,從女九千,以丁亥日死。
從子(词次:1):韓愈侍郎有疏從子侄自江淮來,年甚少。
6) 表类属关系的词语。这类词语前一语素在类别或者逻辑上属于后一
语素,如:
禾苗(词次:1):天寶二年,平盧有紫蟲食禾苗。
槐樹(词次:6):京西持國寺,寺前有槐樹數株。

40
介蟲(词次:1):介蟲中唯牡蠣是鹹水結成也。
鵴鳥(词次:2):鵴鳥,武周縣合火山,山上有鵴鳥。
7) 表示领属关系的词语。这类词语主要是前一语素修饰后一语素,指
明后一语素所指事物的领属关系,如:
橘花(词次:1):葉似槐葉而長,花似橘花而大。
鷄卵(词次:13):有新羅種者,色稍白,形如雞卵,西明寺僧造玄院中有
其種。
(2)状中形偏正式词语
状中形偏正式词语,主要是表示谓词性的词语。在《酉阳杂俎》语料中,根
据语素的词性的不同,我们将其大致分为以下几类。
1) 形动联合构成偏正式的词语。如:
哀祈(词次:3)、哀请(词次:1)、安居(词次:2)、悲泣(词次:4)、博
览(词次:1)、博知(词次:1)、慚谢(词次:1)、常见(词次:7)、促装(词
次:1)
、独处(词次:3)、该悉(词次:2)、富有(词次:1)、厚葬(词次:1)、
久留(词次:1)、具陈(词次:4)、恳求(词次:1)、利涉(词次:2)、乱走(词
次:1)、密选(词次:1)、默念(词次:1)
2) 副动联合构成的偏正式词语。如:
大败(词次:1)、遍历(词次:1)、毕集(词次:1)、並坐(词次:1)、大
北(词次:1)、方知(词次:1)、忽至(词次:2)、極骂(词次:1)、立将(词
次:1)
、偶见(词次:2)、全尽(词次:1)、甚似(词次:1)、一如(词次:1)、
再拜(词次:4)
3) 名动联合构成的偏正式词语,如:
陛奏(词次:1)、表奏(词次:1)、笞責(词次:1)、蠹折(词次:1)、
酒醉(词次:1)、礼拜(词次:1)、礼谒(词次:1)、力举(词次:1)、模
铸(词次:1)、诺许(词次:1)、肉攫(词次:1)
3、 主谓式
所谓主谓式,也叫陈述式,前一词根语素指示被陈述的对象,后一词根语素
1
陈述前一词根 。在《酉阳杂俎》的语料中,这类构词方式的词语数量不多,仅
有 137 个,占复合词词目数 1.85%,仅占总词目数的 0.87%。
月明(词次:3)、秋深(词次:1)、年少(词次:5)、病愈(词次:2)、
风吹(词次:2)、风生(词次:2)、酒酣(词次:2)、雷震(词次:3)、毛
戴(词次:4)、毛起(词次:1)、梦觉(词次:5)、尸解(词次:2)、月满
(词次:1)

1
黄伯荣 廖序东.现代汉语[M].高等教育出版社,2007.第 260 页。
41
4、 动宾式
1
动宾式,是指前一词根语素表示动作,后一词根语素表示动作的承受对象 。
在《酉阳杂俎》的语料中,这一类构词方式还是很常见的,约占总词目数的 6.43%。
根据构词语素的词性分析,我们将其归纳为以下几个小类。
(1) 名词
1) 动名联合构成名词。
蔽膝(词次:1)、避役(词次:2)、藏钩(词次:5)、成衣(词次:1)、
赐品(词次:1)、弹棋(词次:4)、负子(词次:1)、叩齿(词次:1)、屏
风(词次:4)、送酒(词次:2)、蒸饼(词次:1)、列炬(词次:2)、踏歌
(词次:1)
2) 动形联合构成名词。
写真(词次:1)、中恶(词次:3)
(2) 动词
1) 动名联合构成动词。
上车(词次:3)、上山(词次:7)、设色(词次:5)、设斋(词次:3)、
署名(词次:1)、溯风(词次:1)、缩水(词次:1)、抬手(词次:1)、听
歌(词次:1)、托梦(词次:1)、玩月(词次:2)、无恙(词次:3)、写经
(词次:3)、掩面(词次:2)、饮酒(词次:12)、运斤(词次:2)、棹舟
(词次:1)、执手(词次:3)、治病(词次:1)、走马(词次:3)、作礼(词
次:10)
2) 动动联合构成动词。
观渔(词次:1)、临产(词次:1)、临别(词次:1)、留居(词次:1)、
卖卜(词次:2)、求救(词次:7)、求售(词次:1)、受教(词次:1)、託
生(词次:3)
3) 动形联合构成动词。
通灵(词次:1)、失明(词次:1)、如故(词次:4)、如旧(词次:11)、
求哀(词次:2)、磨莹(词次:1)、经久(词次:1)、界朱(词次:1)、稽
古(词次:1)、画彩(词次:1)、行善(词次:3)、点青(词次:1)
(3) 形容词
1)动名联合构成形容词。
得意(词次:3)、出众(词次:1)、具体(词次:1)、绝世(词次:4)、
如意(词次:2)、失望(词次:1)、随意(词次:2)、知书(词次:1)、脱

1
黄伯荣 廖序东.现代汉语[M].高等教育出版社,2007.第 260 页。
42
壁(词次:1)、无情(词次:1)、闪目(词次:1)、等身(词次:2)、好客
(词次:1)、
2) 动形联合构成形容词。
取次(词次:1)、出奇(词次:1)、好奇(词次:1)
5、 补充式
1
这类词是指后一词根语素补充说明前一词根语素 。这类词语在《酉阳杂俎》
中数量不多,仅有 190 个,占总词目数的 1.21%。根据构词语素的词性可以将其
归纳为以下几个小类。
(1) 名词
补充式构词法的名词数量很少,仅有零星几个,而且大多是量补式结构,即
名量结合表示名词类型,如:
骨节(词次:1)、虎群(词次:1)、粟粒(词次:1)、珠粒(词次:1)
(2) 动词
1) 动动联合构成动词。
沉入(词次:1)、飞出(词次:1)、摧坏(词次:1)、摧折(词次:1)、
击碎(词次:1)、剪除(词次:1)、磨灭(词次:1)、破裂(词次:1)、射
中(词次:2)、飞来(词次:3)、浮出(词次:1)、惊倒(词次:1)、敲落
(词次:1)
2) 动形联合构成动词。
烧干(词次:1)、升高(词次:1)、沾湿(词次:1)、醉饱(词次:1)、
爆破(词次:1)、冲破(词次:1)、烧死(词次:1)、病重(词次:1)、冻
死(词次:1)、墮死(词次:1)、饿死(词次:1)、击死(词次:1)、枯死
(词次:3)眠熟(词次:1)、蛻净(词次:1)、挠破(词次:1)
(二) 派生词
2
派生词又称为附加式,由词根和词缀构成 。根据词根和词缀的位置不同可
以分为前加式和后加式两种。在《酉阳杂俎》语料中,附加式这种构词方式还是
很常见的。派生词不重复词目总共有 228 个,占总词目数的 1.46%。
(1) 前加式派生词
这类词的构成方式是词头+词根,词头主要有“阿”、“第”、“老”、“小”
等,下面我们将对其进行分类描述。
1)“阿”作为词头的词语。这类词主要是表示人名和称呼等。
阿措(词次:8)、阿贺(词次:2)、阿莲(词次:1)、阿师(词次:2)、

1
黄伯荣 廖序东.现代汉语[M].高等教育出版社,2007.第 259 页。
2
黄伯荣 廖序东.现代汉语[M].高等教育出版社,2007.第 260 页。
43
阿翁(词次:1)、阿月(词次:1)、阿瞒(词次:1)、阿史(词次:1)
2)“第”作为词头的词语。这类词主要是序数词。
第八(词次:1)、第二(词次:7)、第七(词次:5)、第三(词次:5)、
第六(词次:1)第四(词次:3)、第五(词次:2)、第一(词次:7)
3)“老”作为词头的词语。“老”在这类词中并不具有实在意义,它大多
表示尊敬或亲切的意味,也有一些是自称。
老夫(词次:2)、老僧(词次:5)
4)“小”作为词头的词语
小碧(词次:1)、小儿(词次:2)、小女(词次:3)
5)“相”作为词头的词语
相去(词次:7)、相识(词次:8)、相望(词次:2)、相遇(词次:4)、
相见(词次:6)、相近(词次:2)、相类(词次:6)、相似(词次:3)、相
传(词次:8)、相触(词次:3)
(2) 后加式派生词
这类词的构词方式是词根+词缀,词语的后一构词语素是词缀。在《酉阳杂
俎》语料中,后缀主要有“者”、“然”、“面”、“子”等。
1)“者”作为后缀的词语
行者(词次:3)、病者(词次:9)、卜者(词次:3)、长者(词次:2)、
從者(词次:9)、卖者(词次:1)、猎者(词次:8)、死者(词次:6)
2)“然”作为后缀的词语
騞然(词次:2)、豁然(词次:2)、寂然(词次:2)、廓然(词次:2)、
怅然(词次:2)、焕然(词次:1)、惛然(词次:1)、怳然(词次:2)、巋
然(词次:1)、曝然(词次:2)、欣然(词次:8)
3)“都”作为后缀的词语
在《酉阳杂俎》中,有几个以“都”作为后缀,表示一种古代的动物的词语。
如:
鸟都(词次:3)、猪都(词次:2)、人都(词次:2)、山都(词次:1)
4)“子”作为后缀的词语
椀子(词次:1)、瞳子(词次:2)、亭子(词次:1)、骰子(词次:1)、
桃子(词次:1)、石子(词次:2)、瓮子(词次:1)、猧子(词次:2)、蟢
子(词次:1)、渔子(词次:5)、月子(词次:1)、瓦子(词次:2)
5)“头”作为后缀的词语
斧头(词次:1)、石头(词次:2)、膝头(词次:1)、指头(词次:1)
6)“老”作为后缀的词语

44
简老(词次:6)、昝老(词次:1)
7)“面”作为后缀的词语。
北面(词次:4)、东面(词次:2)、里面(词次:2)、南面(词次:3)
(三) 重叠式
1
重叠式是指由相同的词根组成的词 。这类词中的每一个语素都具有实在意
义,且可以单独成词。这类词在《酉阳杂俎》语料中,数量较少,仅有 52 个,
占总词目数的 0.33%。重叠式构成的词在句法中主要充当形容词和副词。下面
我们将对其按照词性划分进行分类分析。
(1) 相同词根重叠构成副词。
每每(词次:1)、处处(词次:2)、渐渐(词次:7)、日日(词次:4)、
稍稍(词次:2)、时时(词次:7)、往往(词次:30)、微微(词次:6)、
一一(词次:2)
(2) 相同词根重叠构成名词。这类词主要是指示人名或动物名词。
小小(词次:3)、些些(词次:1)、猩猩(词次:1)
(3) 相同词根重叠构成形容词。
苍苍(词次:1)、草草(词次:3)、憧憧(词次:1)、匆匆(词次:1)、
衮衮(词次:2)、昏昏(词次:1)、栗栗(词次:1)、苏苏(词次:1)、盈
盈(词次:1)、熒熒(词次:2)、田田(词次:1)、暾暾(词次:1)、涓涓
(词次:1)
(四)《酉阳杂俎》中各类双音节词语数据分析
通过上文对《酉阳杂俎》语料中的双音节的分类分析,整理统计得到各类双
音节词语的数据分布情况,如下表:
《酉阳杂俎》双音节词语结构分析
合成词
分类 单 纯
复合词 派 生 重 叠 其他

结构 联合 偏正 动宾 补充 主谓 词 词
词 目
339 1282 4825 1011 190 137 228 52 1858

比例 2.16% 8.16% 30.71% 6.43% 1.21% 0.87% 1.45% 0.33% 11.82%
合计 2.16% 47.38% 1.45% 0.33% 11.82%
表 4-5
从上表可以看出,在《酉阳杂俎》的双音节词语中,合成词的词目在总词目
中的比例很大,而其中复合式构词方法是最常见的,派生次之,重叠最少。

1
黄伯荣 廖序东.现代汉语[M].高等教育出版社,2007.第 260 页。
45
三、多音节词结构分析

《酉阳杂俎》中,多音节词语除了一些形容词和成语之外,其他多是专有名
词和一些事物的名称或别称。在整个语料中,多音节词目总共有 2530 个,占总
词目数的 16.1%。本文主要对除去专名和事物名称词之外形容词和成语进行分
析。
(一) 形容词
《酉阳杂俎》语料中的多音节形容词大多是 AA+然式。这类形容词数量有限,
在全文中只有 7 个,而且每一个在文中仅出现一次。如:
拂拂然(词次:1):行數里,旁有草如紅藍,莖葉密,無刺,其花拂拂然
飛散空中。
了了然(词次:1):山南有明鏡崖,石方三丈,魑魅行伏,了了然在鏡中。
洶洶然(词次:1):復掘三丈,遇盤石,下有水流洶洶然,遂鑿石穿水,
北流甚駛。
軒軒然(词次:1):李白名播海內,玄宗於便殿召見,神氣高朗,軒軒然
若霞舉,上不覺亡萬乘之尊,因命納履。
依依然(词次:1):溫凉畢,少遐詠騫贈其詩日:
“蕭蕭風簾舉,依依然可
想。”
熒熒然(词次;1): 入墓林約五六里,復聞樂聲在柏林上,及近樹,樹下有
火熒熒然,屍方舞矣。
摽摽然(词次:1):西壁逼之摽摽然。
(二) 成语
1
成语是指一种相沿习用,具有书面语色彩的固定短语 。在《酉阳杂俎》全
书中,总共有 50 个,占总词目数的 0.32%。
(1) 成语来源
我们对《酉阳杂俎》中的成语按照出处来源的不同,对其进行如下分类:
1) 历史故事。
这类词语大多出自《史记》等记叙人物传记或历史故事的史书中。
一抔之土:駱賓王為徐敬業作檄,極疏大周過惡,則天覽及“蛾眉不肯讓人,
狐媚偏能惑主”,微笑而已。至“一抔之土未乾,六尺之孤安在”,不悅曰:“宰
相何得失如此人。”
五侯九伯:梁劉孝儀食鯖鮓,曰:“五侯九伯,令盡征之。”
體無完膚:楊虞卿為京兆尹時,市里有三王子,力能揭巨石。遍身圖刺,體

1
黄伯荣 廖序东.现代汉语[M].高等教育出版社,2007.第 317 页。
46
無完膚。
白面書生:清河歎曰:“人不讀書,其猶夜行。二毛之叟,不如白面書生。”
狐疑猶预:少遐曰:“是,狐性多疑,鼬性多預,狐疑猶預,因此而傳耳。”
陶侃之意:馬僕射既立勳業,頗自矜伐,常有陶侃之意,故呼田悅為錢龍,
至今為義士非之。
2) 诗文语句。
五穀豐熟:三曰榖璧,白玉也,如粟粒,無彫鐫之跡,王者得之,五穀豐熟。
命在旦夕:胡僧利弟子腦,將為藥,欺天子言祈雨,命在旦夕,乞和尚法力
加護。”
直道而行:信曰:“庶子好為術數。”遂命更滿酌。君房謂信日:“相持何乃
急?”肇師曰:“此謂直道而行,乃非豆萁之喻。”
別有天地:奏曰:
“已深已極,鑿之不入,燒之不燃,叩之空空,如下天狀。”
抑知厚地之下,別有天地也。
3) 《酉阳杂俎》出现的新成语
本文判断是否是《酉阳杂俎》新出现的成语,基本依据是《汉语大字典》、
《汉语大词典》,同时还参照《唐五代语言词典》和《国学宝典》等。
瓊楼金闕:曾于江岸與弟子數十玩月,或日:“此中竟何有?”翟笑日:“可
隨吾指觀。”弟子中兩人見月規半天,瓊樓金闕滿焉,數息間不復見。
鱗鋏星鐔:鄭雲逵少時得一劍,鱗鋏星鐔,有時而吼。嘗在莊居,晴日藉膝
玩之。
禍在旦夕:忽一日,其君臣憂慼,士人怪問之。王泣曰:“吾國有難,禍在
旦夕,非駙馬不能救。”士人驚曰:“苟難可弭,性命不敢辭也。”
染蓝涅皂:經年,二女精神恍惚,夜常明燈挫針,染藍涅皂,未嘗暫息,然
莫見其所取也。
各个来源的成语在全文中所出现的词目数的数据分布情况,如下表所示:
来源类别 《酉阳杂俎》
历史故事 诗文语句
本书
词目数 22 18 10
所占成语词目数
44% 36% 20%
比例
表 4-6
(2)成语结构
在《酉阳杂俎》语料中的成语,以四字结构为主。我们在语料处理过程中,
对其成语的结构也进行了如下几种分类:
1) 并列式

47
我们有根据词语构成要素的关系上,对并列式的成语做了如下分类:
A、偏正+偏正,如:
瓊楼金闕、周妻何肉
B、动宾+动宾
出将入相、如梦如醉、染蓝涅皂、蒙袂輯履、攘臂嗔目
C、主谓+主谓
狐疑猶预、风清月朗
2) 偏正式
直道而行、万乘之尊、陶侃之意、三尺童子、拂衣而起
3) 动宾式
別有天地、不得其所
4) 主谓式
五穀豐熟、命在旦夕、計無所出、體無完膚、曲尽其妙、昼夜不息
5) 补充式
悲不自勝

第四节 《酉阳杂俎》词表与《现代汉语 8000 常用词频表》的对

比分析

从上文的分析论述中,可以看出,《酉阳杂俎》的语料在音节长度和构词方
式等方面具有以下特点。第一,单音节词语,虽然在词目数量上来说不及双音节
词语,但是累计覆盖率却远远超过了双音节词语。因此,可以得知在《酉阳杂俎》
时期,单音节词语在社会语言使用中仍然占据绝对优势。第二,虽然双音节词语
的累积出现次数不高,但是有一些原本单音节词语表示的词义,在文中出现了双
音节词语和单音节词语并存的现象,因此,这也在一定程度上说明了双音节词语
正一步一步登上历史舞台,在人们的日常生活交际过程中将扮演越来越重要的角
色。第三,在构词方法上,合成词词目占据很重的比重,而复合式词语中偏正式
构词方式是最常见的。为了在语料分析工作做得更加全面完善,从而对《酉阳杂
俎》的语料特点有更深层次的分析,我们将其词表与其他进行比较。经过比对和
筛选,我们最终选择了《现代汉语 8000 常用词频表》,与其进行比较,以期从
中对《酉阳杂俎》的用词特点及汉语的发展历史有更全面的了解。

48
一、音节长度的比较分析

我们在处理语料过程中,通过将《酉阳杂俎》中词目按照单音节、双音节和
多音节进行分类统计,得出其各类音节的词目数和比例,并且将它和前人做过的
《现代汉语 8000 常用词频表》中的各类音节词语数目进行比较,得出如下数据:
《现代汉语 8000 常用词频 《酉阳杂俎》词频表
表》
类别 单音节 双音节 多音节 单音节 双音节 多音节
词目数 2320 5786 334 3265 9918 2530
比例 27.49% 68.55% 3.96% 20.8% 63.1% 16.1%
表 4-7
从上表我们可以看出,通过比较,两个词频表中的各类音节词语的比重趋势
是一样的,但是并不是说在《酉阳杂俎》的时代,双音节已经是汉语的主要成员
了。《酉阳杂俎》中,双音节词目数这么多,不是说它在那时就已经在社会生活
中很活跃了,而正是这么多的数目,反而从一定侧面说明了双音节词语在当时发
展还不够稳定。这一点从前文我们统计过的单双音节的累积词频中也可以看出。
但是,从上面的表格也在另一方面说明了,双音化是汉语发展的一大不可逆转的
趋势,双音节词语在社会中的地位终将越来越重要。

二、复音词构词方式的比较分析

复音词构词方式统计
词表 现代汉语 8000 常用词频表 《酉阳杂俎》词频表
结构类别 词目数 比例 词目数 比例
单纯词 111 1.81% 339 2.16%
联合式 1626 26.41% 1282 8.16%
偏正式 2790 45.69% 4825 30.71%
动宾式 441 7.22% 1011 6.43%
补充式 462 7.57% 190 1.21%
主谓式 91 1.49% 137 0.87%
派生词 280 4.58% 228 1.45%
重叠词 63 1.03% 52 0.33%
其他 256 4.19% 1858 11.82%
表 4-8
从上表我们可以发现,两张词表中各类构词方式的词语数量在数据上表现具
有一定的差异性,这或许是因为《现代汉语 8000 常用词》中本是已经剔除专有
名词之后进行的统计,而《酉阳杂俎》由于其本身内容繁杂等因素,语料中有很
多的专有名词,就统计对象来说,前者具有更强的纯粹性,更能够充分反映汉语
49
的特点。因此,统计结果在数据表现形式上或多或少会具有一定的差异。但是二
者在各类构词方式的优选顺序方面还是比较一致的。两张词表中,所占比例占据
首位的构词方式都是偏正式,然后是联合式,排在第四的都是派生词,最末位的
是重叠词。二者不同的就是第三位的区别,《现代汉语 8000 常用词频表》中,
排在第三位的是补充式,而《酉阳杂俎》中,第三位的是动宾式这种构词方式,
且《酉阳杂俎》中,动宾式和补充式这两种构词方式的词目数相差很大。这可能
是因为在当时,动宾式构词方式得到了更多的发展,人们的接受程度比较高,因
此其能产性表现得比补充式的能产性要高。两张词表中派生词的数量差距不大,
数据很是接近,而且从派生词的构成要素的分析来看,从《酉阳杂俎》到《现代
汉语 8000 常用词》,派生词的结构比较稳定,词缀类别也比较一致,在一定程
度上说明了派生词内部发展的稳定性。重叠词由于其所指语义的局限性,无论是
在《现代汉语 8000 常用词频表》中,还是在《酉阳杂俎》词频表中,数量都微
乎其微。另外,单纯词的数量,在两张表中都很有限,仅仅占总词目比例的一小
部分,这也能够在一定程度上说明,无论是现代还是古代,双声、叠韵及叠音等
复音单纯词的构词方式的构词能力有限,不具有强大的能产性,未能在词汇发展
史上撑起属于自己的天地。

50
第五章 《酉阳杂俎》中特色词语分析

《酉阳杂俎》包含的词语异常丰富。该书中有大量的名物词,内容涉及社会
生活的各个层次。除此之外,还有很多的音译外来词、同义词、别称词、口语词
等,词汇特色很明显。为更全面的研究《酉阳杂俎》的词汇特色,进而深入了解
中古汉语的特点,下面将对文中的同义词、异序词和别称词进行归类分析。

第一节《酉阳杂俎》中同义词的归类分析

同义词,在历来都受到学界的重视,在其界定和专书同义词研究方面,已经
有了很多的著述。在《酉阳杂俎》的语料中,也存在很多的同义词,根据统计,
大概有 151 组。我们对其进行归类分析,以期对《酉阳杂俎》的词汇特色有更全
面的了解,从而也希望能够从侧面更深入地研究晚唐汉语甚至整个中古汉语的发
展状况。

一、同义词的界定标准

同义词在汉语发展史上具有重要的地位和影响作用,因此它也是历代学者研
究的宠儿。纵观历代学者对同义词的研究,可以发现,学界对同义词的概念定义
的界定标准众说纷纭,还存在着许多争议。有的学者认为一定是要多个义位相同
1
才称得上同义词 。郭锡良先生在其所编的《古代汉语》教材中指出,同义词是
2
就义项讲的,而不是指词汇系统 。王力先生也认为,同义词是词的某一意义相
3
同,而不是一定要很多意义相同相近 。由此可见,同义词判断的主要依据是义
位。在《酉阳杂俎》同义词语料处理过程中,我们依据王力先生的同义词界定的
观点,对语料进行判别,并且在辨析过程中也只限于同义词相同的义位,对于其
他的词汇意义不作考虑。

二、《酉阳杂俎》同义词分析

在语料处理过程中,本文主要从语义方面,即在具体语言表达中词语表达的
意义,同时借助一些字书的解释等资料,作为同义词的判定依据。有些学者认为
别称词和近义词都归属于同义词。在处理过程中,考虑到《酉阳杂俎》的特色,

1
黄金贵. 论同义词之 “同”[J]. 浙江大学学报 (人文社会科学版), 2000, 4: 012.
2
郭锡良, 何九盈, 唐作藩, 等. 古代汉语: 修订本[M]. 商务印书馆, 1999.
3
王力. 同源字典[M]. 商務印書館, 1982.
51
我们将别称词另外单独讨论。经过分析,我们在《酉阳杂俎》语料中总共归纳出
165 对同义词,其中单音节—单音节的有 60 组,占总数的 37.09%;单音节-双音
节的有 7 组,占总数的 3.31%;双音节-多音节的 99 组,占总数的 60.26%。从每
组的个数来说,每组包含两个的有 127 组,每组包含 3 个同义词的有 19 组,包
含 4 个的有 5 组,包含 5 个同义词的有 1 组。下面将对不同音节的同义词进行举
例分析。
(一) 单音节构成的同义词。
这类词语在《酉阳杂俎》的同义词语料中较为常见,如:
1、斧 斤
这两个词语在《酉阳杂俎》中的共同义位是表示“斧头”的这一义项,其中,
“斧”在文中总共出现 2 次,而“斤”表示“斧头”意义的总共出现 7 次。“斤”
除了这一义项外,还有量词的用法。
斧:十一曰皇后採桑鈎,細如箸,屈其末。十二曰雷公石,斧形無孔。諸寶
置之日中,皆白氣連天。
斤:因開襆,有斤鑿數事,玉屑飯兩裹,授與二人,曰:“分食此,雖不足
長生,可一生無疾耳。”
2、可 满
这组词在《酉阳杂俎》中的都能表示“满”的意义。其中,表示“满”的意
义的“可”在文中仅有 2 处。
可:又有王力奴,以錢五千召劄工,可胸腹為山、亭院、池榭、草木、鳥獸,
無不悉具,細若設色。公悉杖殺之。
满:李夷簡,元和末在蜀。蜀市人趙高好鬭,常入獄。滿背鏤毗沙門天王,
吏欲杖背,見之輒止,恃此轉為坊市患害。
“可”的这个义项,在很多文献中都有出现过。
《唐词典》也对其做出解释,
指明“可”有“尽、满”的意义。如,在唐代诗人刘禹锡的作品中,也可以看见
“可”的这一用法,“一方明月可中庭”,“可中庭”就是月光洒满中庭的意思。
3、犬 狗
在《酉阳杂俎》中,出现了“犬”“狗”这一组词,二者都是“狗”的意思。
其中,“犬”在文中总共出现了 17 次,而“狗”在文中出现了 16 次。“犬”比
“狗”早出现,但是从《酉阳杂俎》中的使用来看,二者在文中出现的次数相差
不大,表明在当时二者在人们的日常生活中的使用地位已经是相当的。
犬:大蟲皮,永寧王鹽鐡舊有大蟲皮,大如一掌,鬚尾斑點如犬者。
狗:劉大異之,令訪大將家獵狗,及監軍亦自誇巨犬,至皆弭耳環守之。
4、高 峩

52
这组词在《酉阳杂俎》中都表示“高”的意思。
高:貞元十四年,鄭、汴二州群烏飛入田緒、李納境內,銜木為城,高至二
三尺,方十餘里。
峩:見一人峩冠當殿,階下侍衛千數,悉長寸餘。
在这里,“峩冠”就是指“高帽”,“峩”即为“高”的意思。
5、种 植 莳
这组词在《酉阳杂俎》中都是“种植”的意思。
种:甘子,天寶十年,上謂宰臣日“近日於宮內種甘子數株,今秋結實一百
五十顆,與江南、蜀道所進不異。”
植:又見枯蔓堪為杖,大如指,五尺餘,持還本寺植之,遂活。
莳:三白草,此草初生不白,入夏葉端方白,農人候之蒔田,三葉白,草畢
秀矣。其葉似薯蕷。
“莳田”就是指把秧苗种到田里。在历代文献中都有其用例。在当今汉语方
言里,也依然保留着这种用法。如,客家话,“莳禾”等。不过,这三个词,在
《酉阳杂俎》语料中,“种”和“植”是出现次数较多的,而“莳”在意义使用
上更侧重与“移植”,在文中出现的用例较少。
6、 茹 食 嘰 噉
这组词的共同义位是“吃”。在《酉阳杂俎》中,“茹”总共出现了 4 词,
“食”出现了 6 次,“嘰”出现 1 次,“噉”出现了 5 次。
茹:蜀左營卒王殷,常讀《金剛經》,不茹葷飲酒。
食:又居半年,因與酪肉,悲泣不食,贊普問之,云有老母頻夜夢見。
嘰:茹、嘰,食也。
噉:其樹一年生無石子,一年生跋屢子,大如指,長三寸,上有殼,中仁如
栗黃,可噉。
7、 帽 冠 冕
这三个词語都是指“帽子”。在《酉阳杂俎》中也各有用例。
帽:南安蠻江蛇,至五六月,有巨蛇泛江岸,首如張帽,萬萬蛇隨之入越王
城。
冠:坐定,梁諸臣從西門入,着具服、博山遠遊冠,纓末以翠羽、真珠為飾。
冕:韋斌雖生于貴門,而性頗厚質,然其地望素高,冠冕特盛。
(二) 双音节和多音节构成的同义词组。
《酉阳杂俎》中有很多的双音节和双音节构成同义词组的词,数量在各类同
义词组中达到最多,可见,双音节词语在该书中的灵活性。
1、 大败 大北

53
这两个词语,都是“失败”的意思。在《酉阳杂俎》中,
“大败”和“大北”
出现的次数都为 1。
大败:蠻伏發,夾攻之,大敗,馬倒,中數十鎗而死。
大北:後吐蕃大北,獲生口數千。
2、尘坌 坌灰
这两个词的共同义项是“灰尘,尘埃”。其中,“坌”本身就具有“灰尘、
尘埃”的意义。
尘坌:監軍使覺,問高:“何事尚書獨不沾塵坌,豈遇異人獲至寶乎?”
坌灰:漢平陵王墓,墓多狐,狐自穴出者皆毛上坌灰。
3、 渔子 渔人
这两个词都是表示“渔人”这一身份的词。二者在构词法上也是相同的,都
是偏正式中的定中式。差别应该在于语体色彩不同,前者偏重于口语,而后者则
具有较强的书面语色彩。
渔子:異蟲,溫會在江州與賓客看打魚,漁子一人忽上岸狂走,溫問之,但
反手指背不能語。
渔人:韓方寤,夢身為魚在潭,有相忘之樂,見二漁人乘艇張網。
4、 棟宇 庐舍
这组词的共同义项就是“房屋”。构词方式都是联合式。
棟宇:今人每睹棟宇巧麗,必強謂魯般奇工也。
庐舍:華嚴院中,錦石盧舍立像,高六尺,古樣精巧。
5、 擢第 及第 登第
这组词都是“及第”的意思。其中,“及第”在文中出现了 6 次,“登第”
和“擢第”在文中各出现 1 次。
擢第:辛秘五經擢第後,常州赴婚。
及第:郎君明年芙蓉鏡下及第,後二紀拜相。
登第:相國同堂兄弟三人,曰石,曰程,皆登第宰執,唯福一人,歷七鎮使
相而已。
6、 离壁 脱壁 出壁
这组词都是形容一事物画得很逼真的意思。在《酉阳杂俎》中,三者出现的
次数均为 1,而且出现的语言环境都是和绘画或雕刻有关。
离壁:哭小小寫真連句 如生小小真,猶自未棲塵。榆袂將離壁,斜柯欲近
人。
脱壁:《吳畫連句》。慘淡十堵內,吳生縱狂跡。風雲將逼人,鬼神如脫壁。
出壁:又變形三魔女,身若出壁。

54
(三) 单音节和双音节构成的同义词组。
这类同义词组在《酉阳杂俎》中较少,数量有限。
1、 画 设色
这两个词在《酉阳杂俎》中都是作为动词,表示“画”。
画:訪於常侍柳公權,方知張萱所畫《石橋圖》也。
设色:又有王力奴,以錢五千召劄工,可胸腹為山、亭院、池榭、草木、鳥
獸,無不悉具,細若設色。
后一句中的“设色”,并不是指简单的“涂色”,而是说王力奴身上刻的刺青
图案栩栩如生,细致得就像画上去的一样。在《酉阳杂俎》中还有一例,更能凸
显“设色”的这一意义,如:“因請馬主遶市門一匝,馬醫隨之。忽值韓幹,幹
亦驚曰:
‘真是吾設色者。’”因此,
“设色”有动词“画”的意思,和前面的动词
“画”是同义词。
2、 粪 鬱栖
这组词在《酉阳杂俎》中都表示“粪壤”的意思。二者的区别在于前者口语
色彩浓厚,而后者较多见于书面語中。
粪:初,旁掘數十丈,遇一石門,固以鐵汁,累日羊糞沃之方開。
鬱栖:母徐衣其女衣,袖利刃行向池呼魚,魚卽出首,因斫殺之。魚已長丈
餘,膳其肉,味倍常魚,藏其骨於鬱棲之下。
3、旦 朝 晨 平旦 詰朝 詰旦
这组词都是表示“早晨”“清晨”的意思。
旦:唯齎紫礦、輕粉、朱紅,旦暮治其根。
朝:武衛斛律豐樂歌曰:朝亦飲酒醉,暮亦飲酒醉。
晨:有婢晨治地,見紫衣帶垂於寢牀下,視之,乃小奴蹶張其床而負焉。
詰朝:詰朝,命吏捕哭者訊之,信宿獄不具。
平旦:今歲已過,但請至此月二十一日平旦,微有東風,卽立之,庶可免也。
詰旦:張詰旦候芳,芳遽引視登。
从上文对《酉阳杂俎》语料中的同义词的整体数据的归纳以及个别同义词组
的分析,大致可以看出《酉阳杂俎》的同义词的一些特点。《酉阳杂俎》运用了
大量的同义词,在很大程度上和作者段成式追求出新有关。而且纵观这些同义词
词语出现的时间,可以发现,文中的同义词既有前代产生的,也有唐代才出现的,
因此,从中可以知道,同义词的大量出现和存在,正是词语在发展过程中的必然
现象。《酉阳杂俎》中出现了众多的同义词,但是,从出现频率来看,有些同义
词出现的次数仅为一次,而且这些同义词组出现的位置也不紧密,有些甲词出现
在前面,乙词却直到文章后面才出现,因此,段成式用那么多的同义词,或许并

55
不仅仅是为了避免词语重复,而是在一定程度上表现作者在创作的过程中追求新
异的特点。
根据对《酉阳杂俎》的同义词的分析,尝试归纳出《酉阳杂俎》文中同义词
的特点。第一,从同义词组的音节结构来看,同义词组的音节类型较为丰富,既
有单音节和单音节构成的同义词,也有单音节和双音节联合构成的,也有双音节
和双音节联合构成的,从而说明了该书中的同义词不仅数量较多,而且类型丰富,
更进一步说明《酉阳杂俎》中的同义词组具有丰富性的特点。第二,
《酉阳杂俎》
中的同义词,除了上述音节对应类型之外,还存在一些包含三项或三项以上的同
义词组,既有双音节词语,也有单音节词语,如“朝、旦、晨、平旦、诘旦、诘
朝”这一组同义词,就是单音节和双音节混合组成的,从这类词语中可以看出,
在《酉阳杂俎》中,一些和单音节词语同义的双音节词语正在慢慢地出现,这也
为后来双音节词语的大量出现和使用提供了一个契机。第三,在这些同义词组中,
通过分析其语素和同义词的构成,我们还发现,有些是上古产生的词语和中古产
生的词语组合,而有些是中古产生的新词新意的组合,因此,可以看出,《酉阳
杂俎》中众多同义词组的出现,是汉语发展的必然趋势,新词不断产生,甚至在
使用方面不断代替旧词,如此的新旧交替,促进了汉语词汇的发展。
通过对同义词组的分析,我们发现,段成式在《酉阳杂俎》的行文过程中,
由于书中涉及的内容较为广泛,相似的内容会比较多,大量的同义词组的使用,
在很大程度上增添了文章的生动性,避免由于相同的表述带来的枯燥无味的问
题,并且也在很大程度上丰富了《酉阳杂俎》的语言词汇。此外,大量的同义词
的使用,在很大程度上也体现了段成式在行文过程中追求新异的特点,这也为成
就该书丰富的语言词汇特色的一大因素。

第二节《酉阳杂俎》中同素异序词的归纳分析

同素异序词,是汉语在发展过程中出现的一种常见的语言现象。早在上古时
期,就已经出现,《诗经》中很多篇章就已经出现了一些同素异序的词语。同素
1
逆序词,又称为“倒字”,是指构词语素相同而顺序不同的一组双音节词语 。同
素逆序词是汉语发展史上的一种现象。它对于汉语发展史的研究具有重要贡献。
这类词语,在一定程度上客观地反映了汉语双音化的过程中的一种必然的过渡形
式,也体现了语素结合的灵活性和任意性。因此,同素异序词以其独特的特点,
吸引了广大学者的关注,学界对其研究的著述颇丰。在《酉阳杂俎》的语料分析
过程中,发现在该书中也存在着一些同素异序的词语。在这里,本文所说的同素

1
张巍. 中古汉语同素逆序词演变研究[D]. 复旦大学, 2005.
56
异序,不仅是 AB 和 BA 两种形式在该书都出现的词语,还包括一部分和现存汉语
顺序不同的词语。本文将对其进行归类分析,并且试着探讨其出现的原因,以期
对《酉阳杂俎》的词汇特点做更为全面的描写,更清楚掌握中古汉语的特点。

一、《酉阳杂俎》中同素逆序词的分析研究

通过对《酉阳杂俎》双音节词语语料的分析,在该书中找出 59 对同素异序
词。为了对《酉阳杂俎》的同素异序词有更多的了解,同时也希望对该书的用词
特点做更全面的分析,本文对该类词进行如下分类研究。
(一) 根据两序同见本书与否的分类
在通读全书和分析全书语料的基础上,发现《酉阳杂俎》的同素异序词,有
些是 AB 和 BA 两序共同在书中出现,而有一部分是在书中只出现一序,另一序不
出现。通过统计,根据两序同见该书与否对这些同素异序词进行分类。
1、 两序同见《酉阳杂俎》的词语
这类同素异序词在《酉阳杂俎》中共有 19 对,占同素异序词总数的 32.2%。
该书中的这类词语的意义用法大多相同或相似。
尸解—解尸 家人—人家 中夜—夜中 事故—故事
来往—往来 还往—往还 食饮—饮食 战斗—斗战
贤圣—圣贤 毛羽—羽毛 罢官—官罢 夕旦—旦夕
诺许—许诺 魅鬼—鬼魅 寝貌—貌寝 筋露—露筋
杖竹—竹杖 杖锡—锡杖 僧众—众僧
2、 只有一序见于《酉阳杂俎》的词语
这一类同素异序词,在该书中只见其中一种顺序,这类词在《酉阳杂俎》中
共有 40 对,约占同素异序词总数的 67.8%。我们将其整理列表如下(其中前面
的为书中所见的词序):
分福—福分 度尺—尺度 息利—利息 虚空—空虚
季冬—冬季 冬深—深冬 秋深—深秋 阔广—广阔
目瞚—瞚目 先祖—祖先 糖蜜—蜜糖 慰安—安慰
趺龟—龟趺 叫呼—呼叫 阻险—险阻 罚责—责罚
导引—引导 泥封—封泥 音声—声音 梁栋—栋梁
妒忌—忌妒 壤土—土壤 责怒—怒责 纁赤—赤纁
末歲—歲末 朗晴—晴朗 齐整—整齐 楚痛—痛楚
纫缝—缝纫 会朝—朝会 行出—出行 险绝—绝险
妙绝—绝妙 從自—自從 亏盈—盈亏 声名—名声
悔懊—懊悔 问讯—讯问 伤损—损伤 养驯—驯养
57
(二)按照构词方式的同素异序词语的分类
在《酉阳杂俎》一书中,同素异序词語都是复合双音词,因此,我们对各组
同素异序词语进行构词方式方面进行分类,以期得到更为详细的数据和资料,窥
探其词汇特点。
(1) 联合—联合式
这类是指构成同素异序的两个词语构词方式都是联合式。在《酉阳杂俎》一
书中,这类型的同素异序词最为常见,数量总共有 31 个,占同素异序词总数的
52.54%。这类同素异序词,语素的顺序变换之后,基本意义大多没有发生改变。
[来往—往来]
初為螢,稍稍芒起,大如彈丸,飛燭四隅,漸低,輪轉來往,去士人面纔尺
餘。
每令侍婢主尺牘,往來覆章,未嘗自札
[往还—还往]
予數見還往說,天后時有獻三足烏,左右或言一足偽耳。
某日夜来生日,岂可寂寞乎?皓与往還竸求珍货。
[夕旦—旦夕]
鳳,骨黑,雄雌夕旦鳴各異。
然家法整肅,其子允,課習經史,日加誨勵,夜分猶使人視之,若允習讀不
輟,旦夕問安,顏色必悅。
[食饮—饮食]
一居人腹,令人好食飲,恚怒,其色青。
明經趙業,貞元中,選授巴州清化縣令,失志成疾,惡明,不飲食四十餘日。
[齐整—整齐]
至明,見束薪長五寸餘,齊整可愛,積於竈上,地上危累蒸餅五枚。
[问讯—讯问]
因問訊,言更容上人十年在世,勉出生死。
(2)偏正—偏正式
构成这类同素异序词的词语的构词形式都是偏正式。在《酉阳杂俎》中,这
类同素异序词共有 17 个,占总数的 28.81%。
[家人—人家]
又失其弟,家人慟哭,詧獨不哭,日:“他亦甚快活,何用哭也。”
家人或唾之,又曰:
“我是汝家女婿,何敢無禮。”一稱烏郎,一稱黃郎,後
常與人家狎熟。
[僧众—众僧]

58
游及慈恩,初知官將倂寺,僧眾草草,乃泛問一二上人及記塔下畫跡,游於
此遂絕。
又問人間眾僧中,後食薏苡仁及藥,食此大違本教。
[杖竹—竹杖]
今之士大夫喪妻,往往杖竹甚長,謂之過頭杖。
以竹杖打壻為戲,乃有大委頓者。
[纁赤—赤纁]
臆前以白為地,微微有纁赤縱理。
(3)主谓—动宾式(动宾—主谓式)
这类同素异序词语,是主谓式和动宾式两种构词方式的词语组合而成的。在
该书中,总共有 5 对,占总数的 8.47%。
[尸解—解尸]
人死形如生,足皮不青惡,目光不毁,頭髮盡脫,皆尸解也。
又曰:白日屍解,自是仙,非解尸也。
[罢官—官罢]
和州劉錄事者,大曆中罷官居和州旁縣,食兼數人,尤能食鱠,常言鱠味未
嘗果腹。
邈因官罷歸莊,方欲勘責,見倉庫盈羨,輸尚未畢。
[诺许—许诺]
和子諾許,以及午为期,因酬酒值。
劉許諾,因為具之,經宿,木人失矣。
(4)主谓—偏正式(偏正—主谓式)
这类形式的同素异序词在《酉阳杂俎》中仅有两对,占总数的 3.39%,而且
两对在该书中都只出现“主谓式”的语素顺序。
[冬深—深冬]
嶺南有蟻,大於秦中螞蟻,結窠於甘樹,實時,常循其上,故甘皮薄而滑,
往往甘實在其窠中,冬深取之,味數倍於常者。
[秋深—深秋]
度竹籠高四尺,然後放長,秋深方去籠伐之,一尺十節,其色如金,用成弓
焉。
(5)补充—偏正式(偏正—补充式)
这类同素异序词在《酉阳杂俎》中共有 4 对,占总数的 5.08%。
[伤损—损伤]
初,不記過水,亦不知瘡,抬手捫面,血塗眉睫,方知傷損。

59
经过对书中的同素异序词分类的分析,得出各类同素异序词所占的比重,如
下图:

各类型同素异序词所占比重图

从上图可以看出,在《酉阳杂俎》中的同素异序词中,联合式的同素异序词
的数量最多,最常见,这和汉语发展的特点是一致的。因为两个语素的词语表示
的意思比较固定,联合式词语的语义大多是两个词语意思的叠加,且顺序调换之
后,意思也大多没有改变,因此,人们在日常生活的语言交际过程中,就容易根
据语言使用的需要,任意调换词语语素的顺序,从而使得这类同素异序词语数量
最多,最为常见和普遍。在《酉阳杂俎》中数量排在第二位的类型是偏正—偏正
式,接着是主谓—动宾式,补充—偏正式,最少的是偏正—主谓式。在《酉阳杂
俎》一书中,虽然同素异序词语的数量不算很多,但是却也是全书总词语数量庞
大的一个原因,更是汉语发展的一大特点的重要体现。

二、《酉阳杂俎》中的同素异序词和现代汉语的比较分析

同素异序词并不仅是古汉语里面的重要角色,在现代汉语的世界里,它还是
1
一种重要的修辞手段,是汉语中一种独特的构词方式 。因此,为了更好地了解
《酉阳杂俎》中同素异序词的发展演变情况,我们将其和现代汉语进行一个简单
的比较,主要是从日常使用和语义等方面对其进行描述,以期对《酉阳杂俎》的
词汇特色有更全面的描述,对汉语词汇的发展有更清晰的了解。
(一) 从使用方面进行比较
在现代汉语中,仍然存在着很多的同素异序词语,如:黄金—金黄,自私—

1
张德鑫. 谈颠倒词[J]. 汉语学习, 1995 (6): 18-22.
60
私自,红枣—枣红等,其中,有些是从中古时候就已经出现,一直沿用到现在的,
也有一些是近现代才出现的。不管是何时出现的,同素异序词都是汉语发展史上
的一个重要现象,对于了解汉语词汇发展脉络具有不可忽视的作用。因此,本文
对《酉阳杂俎》中的同素异序词和现代汉语使用中的语素顺序进行比较。比较结
果如下表(我们把在书中出现的语序形式成为 AB 式):
AB 式 BA 式 《酉阳杂俎》中的词序类型 现汉中的词序
分福 福分 AB BA
度尺 尺度 AB BA
息利 利息 AB BA
虚空 空虚 AB 两序并存
季冬 冬季 AB BA
冬深 深冬 AB BA
秋深 深秋 AB BA
闊廣 广阔 AB BA
目瞚 瞚目 AB BA
先祖 祖先 AB 两序并存
糖蜜 蜜糖 AB BA
慰安 安慰 AB 两序并存
趺龜 龜趺 AB BA
叫呼 呼叫 AB BA
阻险 险阻 AB BA
罚责 责罚 AB BA
导引 引导 AB 两序并存
泥封 封泥 AB BA
音声 声音 AB BA
梁栋 栋梁 AB BA
妒忌 忌妒 AB 两序并存
壤土 土壤 AB BA
责怒 怒责 AB BA
纁赤 赤纁 AB BA
末歲 岁末 AB BA
朗晴 晴朗 AB BA
齐整 整齐 AB 两序并存
楚痛 痛楚 AB BA

61
纫缝 缝纫 AB BA
会朝 朝会 AB BA
行出 出行 AB BA
险绝 絕险 AB BA
妙绝 绝妙 AB BA
從自 自从 AB BA
虧盈 盈亏 AB BA
聲名 名声 AB 两序并存
悔懊 懊悔 AB BA
问讯 讯问 AB 两序并存
伤损 损伤 AB 两序并存
养驯 驯养 AB BA
尸解 解尸 两序并存 BA
家人 人家 两序并存 两序并存
中夜 夜中 两序并存 BA
事故 故事 两序并存 两序并存
来往 往来 两序并存 两序并存
還往 往還 两序并存 BA
食饮 饮食 两序并存 两序并存
战斗 鬭戰 两序并存 AB
贤圣 圣贤 两序并存 两序并存
毛羽 羽毛 两序并存 BA
罷官 官罷 两序并存 AB
夕旦 旦夕 两序并存 BA
諾許 许诺 两序并存 BA
魅鬼 鬼魅 两序并存 BA
寝貌 貌寝 两序并存 AB
筋露 露筋 两序并存 BA
杖竹 竹杖 两序并存 BA
杖锡 锡杖 两序并存 BA
僧众 众僧 两序并存 BA
从上可以发现,《酉阳杂俎》的同素异序词语中,在现代汉语中两序并存的
仅有 14 例,其中《酉阳杂俎》一书中也是两序并存的有 5 例,占该书中两序并
存的同素异序词的 26.32%。而单序见于《酉阳杂俎》一书中的同素异序词,在

62
现代汉语中两序并存的有 9 例,其他的在书中单序出现的同素异序词语,在现代
汉语中几乎都是和书中出现的语素顺序相反。从上表我们可以看出,大多数的同
素异序词,在现代汉语中,仅保留了 BA 式,而淘汰了 AB 式。纵观汉语的发展史,
这种现象是符合汉语发展特点的。由此可见,随着汉语的发展,同素异序词语并
没有随着历史前进的脚步而终止,而是在汉语发展的大潮中不断奋力前行,蓬勃
发展,最终成为现代汉语中的具有特殊修辞作用的独具特色的语言现象。
(二) 从语义的演变方面对同素异序词语进行比较
汉语在历史的大潮中不断地发展,无论是语音,还是语义,都随着历史的变
迁不断发生着变化。词义的演变是词汇发展的一个重要体现。在《酉阳杂俎》一
书中的同素异序词,与现代汉语相比,在语义和词汇色彩等方面,大多数两种语
素顺序并存的词语,仍然是同义词的关系,如“来往”和“往来”等,但也有一
些词语或者是词性发生变化,或者是语义有了缩小和扩大的变化,也或者是在语
言色彩上有了与古代不同的发展。因此,本文为了能够更深入地了解该书中同素
异序词的发展的特点,对其演变进行描写。
词语是不断发展的,而语义作为词语的一个内容要素,也在历史长河中不断
发生着变化。同素异序词语作为语言发展史上的一个重要角色,也不例外。在《酉
阳杂俎》一书中的同素异序词中,很多词语随着语言的发展和历史的变迁,词汇
意义也有了相应的发展。
1、 基本语义相同的同素异序词。
一些同素异序词语,虽然是在古代和现代的语素顺序不一样,但是整体所表
达的语义,甚至是词性都还保持一致。这种情况在《酉阳杂俎》一书中的同素异
序词中还是很常见的。如:
导引—引导:这两个词无论是在古代还是现代,都是表示指引和引导的意思。
《酉阳杂俎·前集卷一》:“初入,二人在前導引,次二人並行。”在当前人们的
日常生活用语中,“引导“这种语素顺序更为常见。在《现代汉语大词典》中,
1
“引导”是指指引 。这两个词语的词性都是动词,词语搭配情况也相似。
贤圣—圣贤:这两个词语,无论在古代汉语中还是在现代汉语中,都可以作
为名词或形容词,指那些具有崇高道德品质的人才,语义在语言发展过程中并没
有发生很大的变化。如《酉阳杂俎·天咫》:
“遂珍重而去,行疾如飛,布亦意其
賢聖也。”
食饮—饮食:这组词语在汉语中都可以作为动词和名词,表示的意思也相同,
都是指吃的和喝的。二者的区别仅在于在现代汉语日常生活中使用的频率方面。
在现代汉语普通话中,说“饮食”的频率远远高于“食饮”,而“食饮”大多存

1
中国社会科学院语言研究所词典编辑室.现代汉语词典[M].北京:商务印书馆.2005:第 1627 页.
63
在于现代汉语方言中,如客家话。在客家人的日常生活中,常常将普通话中的“饮
食”说成“食饮”,“赚钱再辛苦,食饮也爱跟上去”(无论赚钱多辛苦,也要注
意饮食)。
讯问—问讯:这两个词语都是“问询、询问”的意思。如《酉阳杂俎》:
“因
問訊,言更容上人十年在世,勉出生死。”但是在现代汉语中,
“讯问”又可以表
示“审问”的语义,这是“问讯”所不具有的内容。因此,在日常使用过程中,
“讯问”的后面常常可以搭配其他名词性词语,表示讯问的对象或内容,而“问
讯”则一般不具有这样的用法,其后面一般不带宾语。
聲名—名声:这两个词语产生的时间大致相同,都为中古时期产生,而且二
者的意义也相同,都表示人的声望、名望。但是二者在词语搭配上有些许区别。
“聲名”可以和“远大”构成一个固定意义的词语,但是“名声”却不行,这也
就是二者的不同。
2、 语义发生变化的同素异序词。
随着语言的发展,很多词语的意义在不同的历史时期有了新的变化。语言发
展,使得大量的同义词语产生了,一些词语的某些语义就在长期的语言使用的优
胜劣汰竞争中消失了,而同时又受到语言使用的经济原则的影响,使该词语在旧
语义消失的同时又被赋予了新的意义,从而使语义发生了变化。《酉阳杂俎》的
同素异序词语中,有些在古代汉语中是一组近义词的词语,随着历史的发展,二
者原本相似的语义发生了变化,甚至是造成截然相反的语义。如:
事故—故事:在《酉阳杂俎》中,“事故”和“故事”是一组同义词,表示
“旧事,故事”的意思。如《酉阳杂俎》:“與邢劇談,多非人間事故也。”但是
随着语言的发展,
“事故”的语义发生了变化。在现代汉语中,
“事故”已经不再
表示“故事”所能表示的语义了,而是指一些突发事件,且多为不好的事情。而
“故事”在语言发展过程中,除了“旧事”这一基本意义外,又引申出“事情”、
“事端”等语义来,从而二者的语义便不再相同了。
音声—声音:虽然这两个词语都大约产生于中古时期,且在“声音”这一语
义上是同义词。但是在《酉阳杂俎》和现代汉语的比较中,这组词语的语义是不
同的。在《酉阳杂俎》中,“音声”这个词语共出现两次,都不是表示“声音”
这一义项,而是指“音乐”或“能歌善舞的音乐人”。如《酉阳杂俎》:“梁宴魏
使李騫、崔劼。樂作,梁舍人賀季曰:
‘音聲感人深也。’”在这里,
“音声”就是
指音乐。《酉阳杂俎》:“安祿山恩寵莫比,錫賁無數,其所賜品目有:桑落酒、
闊尾羊窟利、馬酪、音聲人兩部。”这里的“音聲人”就是指音乐伎人。而在现
代汉语中,“声音”并不能表示该种义项,只能表示动物或事物所发出的声响。
家人—人家:在《酉阳杂俎》中,这组词都有表示“家人”的意思,如“家

64
人頭痛、嚏咳者,服其藥,未嘗效也。”、
“忽見二小手出燈下,大言曰‘乞一錢’
家人或唾之,又曰‘我是汝家女婿,何敢無禮。’一稱烏郎,一稱黃郎,後常與
人家狎熟。”但是“人家”在该书中,除了“家人”的义项之外,还可以表示人
的屋子,如:
“時酷吏多令盜夜埋蠱遺讖於人家,經月,乃密籍之。”在现代汉语
中,二者的区别又更为明显。《现代汉语大词典》指出:家人是指父母兄弟姐妹
1
等亲属 ,而人家是个代词,既可以是他称也可以是自称,而且“人家”在自称
时,往往带有撒娇和娇嗔的语气,语体色彩也发生了一定的改变。

三、 同素异序词语产生原因初探

在汉语发展过程中,出现了很多的同素异序词语,而且很多都沿用到今。对
于这些同素异序词语的成因,在这里我们主要对其进行简单的分析探讨。从汉语
自身的发展规律来看,在上古汉语中,主要是单音节词语在语言世界里扮演重要
角色,占据重要地位,而汉语的发展规律和趋势是产生大量的复音词,走向复音
化,并且最终形成以复音节词语为主体的局面。在早期的复音节形成的过程中,
通常是以两个单音节词语结合作为复音节词语的组合形式,而原来的单音节词语
已经得到了充分的发展,各自都具有十分稳定的词汇意义和语法意义,在语义凝
固阶段,二者之间缺少语义上的粘结。因此,在复音节词语产生初期,复音节词
语内部的单音节词语的顺序并不是很稳定,经常可以发生字序颠倒的现象,从而
使得其语素顺序有了很大的灵活性和可动性。同时,大量同素异序词语的出现,
也是汉语走向复音化过程的必经阶段。同素逆序词语,形式上的主要区别在于词
序的不同,而词序是汉语中表示语法关系的一种重要手段。随着汉语的发展和语
言经济原则的约束,使得在人们日常生活中出现大量的读音相同的词语。因此,
改变词语的语素顺序,形成同素异序词语,用来区分不同的语法关系,成为了一
种重要的方式。同素异序词语,不仅仅是单纯地改变了语素的顺序,有时还会改
变词语的词性,如“适合—合适”,前者多做动词,后者多做形容词;有时也会
改变构词语素内部的关系,如“尸解—解尸”,前者是主谓式,而后者却变为动
宾式;有些也会改变词语的搭配,如“聲名—名声”等。这也就为大量同素异序
词语的产生提供了一定的可能和基础。此外,古代诗文语句为了追求押韵等原因,
也为同素异序词语的出现提供了一定的机会。对于同素异序词语形成原因的详细探
究,限于篇幅,这里就不再做探究了。

1
中国社会科学院语言研究所词典编辑室.现代汉语词典[M].北京:商务印书馆.2005:第 654 页.
65
第三节《酉阳杂俎》别称词分析

别称词是汉语发展过程能中出现的一种常见的特殊现象,是汉语词汇的一个
重要组成部分。所谓别称词,就是事物除了本称之外的另一种称呼。汉语别称词
在汉语发展和应用过程中具有不可忽视的重要作用。在《酉阳杂俎》一书中,发
现包含有大量的事物别称词。这些别称词在文中的间隔出现,为丰富该书丰富的
语汇特征做出了重要贡献。本文主要从其来源等方面对《酉阳杂俎》中的别称词
进行分析,并且试着分析归纳其产生的原因。

一、《酉阳杂俎》别称词数量数据归纳

《酉阳杂俎》一书涉及的内容非常广泛,词语类别包含社会生活的各个方面。
《酉阳杂俎》一书包含有一万多条的不重复词语,其中,经分析归纳,总共有
94 组,129 个别称词,占该书词语总数的 0.82%。具体数据如下表:
形虞、阿虞截 阿魏别称
辟邪 安息香树别称
多骨 白荳蔻别称
儲 飽惋别称
葉樹、思惟樹 贝多别称
漏 奔蜉的别称
蓽撥梨、阿梨訶口 蓽撥别称
婆淡 扁桃别称
守神 鳖的别称
托、餦餛 饼的别称
窟莽 波斯枣别称
忽野簷默、阿梨去伐 波斯皂荚别称
百劳 博勞别称
齊后、復育 蝉的别称
野狐鼻涕 虫名,螵蛸别称
蹙融 蹙戎别称
積雪草、連钱草 地钱别称
訓胡 惡鳥别称
項勃梨口 黼齊别称
楮 构的别称
逆旅 古代旅馆的别称
墮羿 鸛鶇别称
蒼鸆、逆鴿 鬼車鳥别称
竺乾 国名 印度别称
蝴螉 蜾贏,别称

66
海榴 海石榴别称
金杏 漢帝杏别称
獨搖、離母、赤箭 合離别称
昧履支 胡椒别称
阿月 胡榛子别称
唐已 黄腰别称
笆竹 棘竹别称
水栗、薢菪 芰的别称
田衣 袈裟别称
琵琶鱼 剑鱼别称
火老 将军别称
無義草 金灯别称
沙裹白 荊窠白别称
赤觜鳥、阿鳥鵴 鵴鳥别称
寒具 粔籹别称
三鬣松 孔雀松别称
王母甘桃、西王母桃 括蔞别称
赤鲜公、河伯健儿 鲤鱼别称
耶希 鹿的别称
蠻中藤子 蔓胡桃别称
夜明苔 蔓金苔别称
阿縒 沒樹别称
玄靈 命的别称
鶬麋鴰、九頭鳥、鴻鵠、嗽金鳥 鬼車鳥别称
古旃 牛的别称
羣漢樹 槃砮穡樹别称
籬頭溺 螃蝗别称
中金钱花 毗尸沙花别称
鼠耳、無心草 蚍蜉酒草别称
紫柰 苹果别称
阿蔀種 婆那娑樹别称
思惟樹、賓撥梨婆力叉、阿濕曷婆力叉、卑鉢羅 菩提树别称
草龍珠帐 葡萄别称
齊虚 齊暾樹别称
盆甑草 牽牛子别称
落蘇、崑崙瓜、伽子 茄子别称
魚伯 青蚨别称
蛇醫 蝾螈的别称
山臊、山駱 山魅别称
烽火樹 珊瑚别称
護火草 慎火樹别称
雞舌绿帙 尸肝别称
丹若、天漿 石榴别称
67
石脂水 石油别称
搔、沒鹽蟲 碎車蟲别称
具區 太湖别称
鈴下 太守的别称
鹿活草 天名精别称
蓴龜 蓴根别称
昔耶、垣衣、蘭香 瓦松别称
麗草、娃草、女草 葳蕤草别称
底称實、阿馬驛、底珍 无花果别称
噤婁、桓 无患木别称
黑暗 犀的别称
奴角 犀牛别称
塞蘆 席箕别称
主簿蟲 蝎的别称
神羊 獬豸的别称
白暗 牙的别称
乙 燕的别称
釣星 夜行遊女别称
諺 飴的别称
薝蔔花 栀子花别称
王蛛蜴、蛛母 蜘蛛别称
桑槿 朱槿别称
猴郎逹樹 紫薇别称
璇璣 北斗星的别名
杜宇 杜鹃别名
湖目 莲子别称
上表显示,在《酉阳杂俎》中的别称词,大多都是表示树名、草名、鱼名和
虫名等的词语。其中表示植物的 45 组,占别称词总数的 47.87%;表示动物的有
26 组,占别称词总数的 27.66%;表示其他的有 23 组,占别称词总数的 24.47%。

二、《酉阳杂俎》别称词的来源分类

语言作为一种交际工具,社会的发展为新词的出现提供了一定的可能和条
件,而人们日常生活的交际需要则使新词的产生和运用变为现实。在汉语的发展
过程中,别称词生成的途径和来源,可以说是纷繁复杂1。对各类别称词的来源
进行探索分析,可以更全面地了解和掌握该书中别称词的特点,对于认识全书的
词汇特点具有不可估量的意义。
(一) 来源于典故或神话传说。

1
许华. 汉语别称词的生成条件及使用范围探析[J]. 时代文学, 2009 (20).
68
在《酉阳杂俎》的别称词中,有一些是产生于古时的典故或者民间流行的神
话传说和故事。这类别称词有 4 组。如:
鹿活草是天名精的别称。传说刘炳在宋元嘉中射中一只鹿,把它剖开,掏出
五脏了,后来在它的肚子里塞满天名精,这只鹿竟然蹶然而起,活了。因此,天
名精有了“鹿活草”这个别称。
主簿虫,这是蝎子的一个别称。别称来源于段成式《酉阳杂俎》。在该书中
记载,江南本来没有蝎子的,有一位主簿将它放在竹筒里,带过江,于是江南就
有了蝎子。因此,蝎子也称为“主簿蟲”。
(二) 来源于方言和俗语。
这类别称词在《酉阳杂俎》中很常见,数量很多,总共有 34 组。它们大多
是因为各地方言不同或者俗称不同而形成的,如:
桑槿:重薹朱槿,似桑,南中呼為桑槿。
笆竹:棘竹,一名笆竹,節皆有刺,數十莖為叢,南夷種以為城,卒不可攻。
(三) 来源于对事物的某一特征或功效进行描摹而形成的别称词。
这类别称词的形成,大多是为了使事物的名称更能够直观明了地体现事物在
形状或颜色或功效等方面某一特征而出现的。这类别称词在《酉阳杂俎》中共有
27 组。
琵琶鱼:劍魚,海魚千歲為劍魚,一名琵琶魚,形似琵琶而喜鳴,因以為名。
琵琶鱼是剑鱼的别称,因为剑鱼的形状很像琵琶,而且喜欢鸣叫,因此取名为“琵
琶鱼”。
鼠耳:蚍蜉酒草,一曰鼠耳,象形也,亦曰無心草。在这里,鼠耳是蚍蜉酒
草的一个别称,得名于蚍蜉酒草的叶子像老鼠的耳朵。
赤觜鸟,是鵴鸟的一个别称。因为鵴鸟的觜赤如丹而得名。
辟邪:刻其樹皮,其膠如飴,名安息香。六七月堅凝,乃取之。燒之通神明,
辟眾惡。在这里,辟邪是安息香树的一个别称,因为烧安息香可以通神明,可以
辟邪恶,所以得名。
(四) 来源于文学作品的别称词。
这类别称词大多是文人在创作过程中,为了押韵或者求新需要而产生的。在
《酉阳杂俎》别称词中,这一类型的有 7 组。如“湖目”表示莲子,“田衣”指
称袈裟等。
(五) 来源于音译词的别称词。
《酉阳杂俎》一书涉及的内容颇为广泛,在时间涉及古今,空间上包含中外
的奇闻趣物。因此,在书中出现了很多的音译外来词。在别称词中,也有很多来
源于音译词。这类别称词总共有 20 个。

69
婆淡:偏桃,出波斯國,波斯呼為婆淡。婆淡是偏桃在波斯的名称,汉语将
其音译过来就成为了偏桃的一个别称。
阿梨去伐:波斯皂筴,出波斯國,呼為忽野簷默,拂林呼為阿梨去伐。在这
里,阿梨去伐是波斯皂荚的一个别称,是直接音译过来形成的。
昧履支:胡椒,出摩伽陀國,呼為昧履支。
(六) 来源于宗教的别称词。
在《酉阳杂俎》一书中,很多内容涉及佛教和道教的内容。在别称词中也有
两组是来源于佛教。
玄灵:命亦曰玄靈。在佛教中,命的一个别称为玄灵。
对上面各类别称词的数据分析,得出下面更为直观的表格,如图所示:
不同来源别称词所占比重分布图

由上表可以看出,《酉阳杂俎》中的别称词的来源主要集中在方言俗语、对
事物的描摹和音译三种类型中,其中方言俗语最多,其次为对事物描摹,最后是
音译词。
其实在汉语别称词的产生过程中,很多因素都会影响其发展。除了上述来源
之外,民族文化和文人心理等也是别称词产生的重要因素和来源。在语言的发展
过程中,很多词汇并不是因为它的构造具有很强的合理性,而是因为人们的约定
俗成,乐于接受和承认它,从而使得该词在社会生活中站稳脚跟,最终流传下来。
别称词也是如此。如果说最初文人的创作需要使它有了产生的契机和可能,那么
后来人们群众的接受和认可就是别称词大量存在的必要条件。《酉阳杂俎》中大
量别称词的使用,使得全书的词汇变得更为丰富,同时,在描述某一动植物的过
程中,运用生动形象的别称词,有利于增强全书的趣味性,同时也有助于将事物

70
的特征描摹得更为清晰形象。

第六章 结语

本文通过借助计算机软件和人工分词等步骤,对段成式《酉阳杂俎》进行分
词,并且运用语言学的相关理论知识对这些语料进行分析处理,然后借助计算机
词频统计软件对其进行词频统计,得出《酉阳杂俎》的词表和词频表(附后)。
通过对语料的分析,建立《酉阳杂俎》词语结构的语料库。最后本文还选取《酉
阳杂俎》中特殊词语,主要包括同义词、同素异序词语和别称词,对其进行分析
研究,得出各类词语的相关数据。通过上述分析,本文对《酉阳杂俎》一书的词
汇使用情况和特点,归纳如下:
1、在音节长度上,
《酉阳杂俎》一书中总共有 15713 条词条,其中单音节词
目有 3265 个,双音节和多音节词目总共有 12428 个。从这里可以看出复音节词
目在数量上相对于单音节词目具有绝对优势,但是在累计覆盖率方面,却远远不
及单音节词目。从各类频次的词目的音节长度来看,108 个高频词全部为单音节
词语。由此可见,在《酉阳杂俎》中,单音节词语仍然在当时社会生活的交际中
占据绝对优势,而复音节词语由于还处于新兴阶段,为大众接受的程度还有待提
高,从而使得全书中的双音节词语的词目数很多,但是出现频率普遍不高,甚至
很多出现 1 次的复音节词语。但是,从不同音节长度的词语的词目数量来看,复
音节词语的词目总数占据全书的绝大部分,这说明了实现双音化是汉语发展的必
然趋势,只是还需要一个相当长的时间不断发展才能实现。
2、从词语的结构上看,合成词占有绝对优势,不重复词目数总共达到 7725
个,而单纯词只有 339 个。在合成词当中,复合词在数量上远远超过派生词和附
加式,而在复合词中,又以偏正式和联合式这两种构词方式形成的词语为主。将
我们通过分析制成的《酉阳杂俎》词语结构数据表和《现代汉语 8000 常用词》
词频表相比,可以看出,二者在各类构词方式的优选顺序方面还是比较一致的。
两张词表中,比例数量排在前两位的都是偏正式和联合式。
3、从《酉阳杂俎》中的特色词语上看,大量同义词、同素异序词语和别称
词的使用,使得《酉阳杂俎》的语汇异常丰富,极大地增强了全书的趣味性。通
过对这三类词语进行分类分析,可以发现汉语发展的一些特点。
综上所述,《酉阳杂俎》的词频研究,不仅可以深入地分析和掌握该书的词
语特点和语言特色,了解当时社会生活交际中的语言使用情况,而且对于了解和
71
研究汉语史发展的特点及规律具有重要意义。

参考文献

一、著作类
[1]卞成林. 汉语工程词论[M].济南: 山东大学出版社, 2000.
[2]陈爱文. 汉语词类研究和分类实验[M].北京: 北京大学出版社, 1986.
[3]程湘清. 汉语史专书复音词研究[M]. 北京;商务印书馆, 2008.
[4]方南生.《酉阳杂俎》校点本[M].北京:中华书局,1981.
[5]方一新. 中古近代汉语词汇学[M]. 北京:商务印书馆, 2010.
[6]郭锡良, 何九盈, 唐作藩, 等. 古代汉语: 修订本[M]. 北京:商务印书馆,
1999.
[7]黄伯荣 廖序东.现代汉语[M].北京:高等教育出版社,2007.
[8]江蓝生, 曹广顺. 唐五代语言词典[M].上海: 上海教育出版社, 1997.
[9]李仕春. 汉语构词法和造词法研究[M]. 语文出版社, 2011.
[10]刘开瑛. 中文文本自动分词和标注[M]. 北京:商务印书馆, 2000.
[11]鲁迅. 中国小说史略: 释评本[M]. 上海:上海文化出版社, 2005.
[12]罗凤竹.现代汉语大词典[M].上海:上海辞书出版社, 2009.
[13]欧阳修,宋祁著.中华书局编辑部编.新唐书[M].北京:中华书局.2000
[14]启功. 汉语现象论丛[M]. 北京:中華書局, 1997.
[15] 邱均平.信息计量学[M].武汉:武汉大学出版社,2007
[16]苏新春. 词汇计量及实现[M]. 商务印书馆, 2010.
[17]苏新春.汉语词汇计量研究[M].厦门: 厦门大学出版社, 2002.
[18]王力. 同源字典[M]. 北京:商務印書館, 1982.
[19]张联荣. 古汉语词义论[M].北京: 北京大学出版社, 2000.
[20]中国社会科学院语言研究所词典编辑室.现代汉语词典[M].北京:商务印书
馆.2005.
[21]周光庆. 古汉语词汇学简论[M].广州: 华中师范大学出版社, 1989.
二、论文类:
[1]费洪晓, 康松林, 朱小娟, 等. 基于词频统计的中文分词的研究[J]. 计算
机工程与应用, 2005, 41(7): 67-68.
[2]符淮青. 现代汉语词汇 (增订本)[J]. 第二版), 北京: 北京大学, 2004.
[3]郭锐. 词频与词的功能的相关性[J]. 语文研究, 2001, 3: l-9.
72
[4]郭锐. 汉语词类划分的论证[J]. 中国语文, 2001, 6: 002.
[5]黄金贵. 论同义词之 “同”[J]. 浙江大学学报 (人文社会科学版), 2000,
4: 012.
[6]李中华. 晚唐 “三十六体” 辨说[J]. 文学遗产, 2005 (2): 126-128.
[7]林伦伦. 古汉语别称词初探[J]. 汕头大学学报 (人文社会科学版), 1987, 3:
001.
[8]孙露.《酉阳杂俎》偏正复音词研究[J].语文研究.2010,5.
[9]许华. 汉语别称词的生成条件及使用范围探析[J]. 时代文学, 2009 (20).
[10]杨运庚. 古代汉语同义词研究对同义关系的再界定[J]. 社会科学论坛,
2010 (7): 40-45.
[11]张德鑫. 谈颠倒词[J]. 汉语学习, 1995 (6): 18-22.
[12]张巍. 中古汉语同素逆序词演变研究[D]. 复旦大学, 2005.

73
致谢
时光荏苒如白驹过隙,三年的南国求学生涯即将逝去。在这毕业之际,回想起学校生活
的点点滴滴,依然历历在目,恍如昨日。三年的学习时光留给我太多的回忆,有奋斗的呐喊
和汗水,有喜悦的笑声,有放弃后不甘的哽咽声。这一切的一切,构成了我青春岁月里悦耳
动听的旋律。
看着手中的论文,不禁感慨万千。多少个日日夜夜对着电脑处理语料,为查找资料东奔
西走,为论文的撰写冥思苦想,寝食难安。这些的不易都随着论文的最终完成而烟消云散,
剩下的只是满心的喜悦。
论文的顺利完成得益于各位老师的辛勤指导和帮助。首先要感谢我的导师海柳文教授。
老师在三年里无论是生活还是学习上都给予我无微不至的关怀和悉心的教诲。尤其是在论文
撰写过程中,老师在选题的确定和写作方法等方面都给予细心的指导。印象最深的是无法找
到《酉阳杂俎》的繁体电子版文本,老师为了减轻我一个字一个字录入的繁琐工作,帮我一
页一页地扫描整本书,然后还帮我将扫描版的 PDF 格式的文本转换成 Word 文档。后面,老
师还强忍着病痛解答我在语料处理中遇到的种种问题。现在想来,只觉鼻酸眼热。难忘师恩,
谢谢恩师。同时,要感谢汪业全老师和叶桂郴老师。两位老师不仅在教学过程中将渊博的知
识传授与我,而且在论文撰写过程中也给予我宝贵的建议和修改意见,使得论文可以顺利完
成。谢谢汪老师和叶老师。其次要感谢师兄程南昌。师兄在百忙之中抽出时间对论文的修改
提出了很多的意见和建议,引导我从一个较新的理论出发,充实论文的内容,不断拓展论文
的深度。谢谢程南昌师兄。
同时,衷心感谢在民大求学三年遇到的老师们,盘美花老师、吴纪梅老师、张景霓老师、
康忠德老师、韦树关老师、黎曙光老师、陈孝玲老师等。能够聆听各位老师的教诲,感受老
师们治学精神和学术魅力,是我在民大的一大幸事和收获。在此,我想对各位老师说一声,
谢谢您,老师,辛苦了!此外,陈亮、蔡玉珠、符劲、赵倩钰等同窗,在生活上和学习上给
予我很大的鼓励和帮助,与我一起感受快乐,分享喜悦,困境时互相鼓励,互相打气。感谢
师弟师妹们的相伴与鼓励。遇到你们是我一生的幸运。当然也要感谢谢根超同学,长期以来
对我的支持与照顾。感谢三年的求学生活中在学业和生活中给予我指导、帮助和支持的老师
同学们,你们是我青春乐章中最动听的旋律和美好回忆。
最后,要感谢我的亲人,是你们的关爱和支持,才让我能够安心地在学校里学习,是你
们给予我不断前进的勇气。谢谢!
相思湖畔惹相思。临离别了才知道,心中有多不舍。但是不管怎样,既然选择了远方,

就只顾风雨兼程。关于民大的美好记忆,将永远成为我人生中一道靓丽的风景。

74

You might also like