定语顺序的
认知解释及其理论蕴涵
袁毓 林
本文尝试用信息量和认知处理策略来解释汉语中多项定语的排列顺序。首先从语义
聚合角度描写定语的排序规则: “对立项少的定语> 对立项多的定语”, 并从信息论角度进
行解释, 得出新的规则: “信息量小的定语> 信息量大的定语”。接着从信息加工难度和认
知处理策略角度进行解释, 得出更为概括的语序规则: “容易加工的成分> 不易加工的成
分”, 并用以解释部分主谓结构、同位结构和能愿动词连用, 以及汉语和英语中姓名等的
语序问题。最后, 讨论从这项研究中抽绎出的具有普遍意义的理论蕴涵: ( 1) 描写和解释
是互相推动、交替上升的; ( 2) 为了更好地理解形式和意义之间的关系, 语言结构可以从
数据结构的角度重新加以认识。
作者袁毓林, 1962年生, 语言学博士, 北京大学中文系副教授。
§0 引 言
对于句子中各种成分的排列顺序 ( w ordorder ) , 可以从不同的角度进行观察, 也可
以在不同的抽象层次上作出描写, 最终可以在不同的理论空间中获得解释。本文打算
从形式标记和形式类的次范畴及其语义聚合的角度考察汉语偏正结构中多项定语的排
列顺序, 尝试用信息量大小、意义可达性 ( accessibility ) 程度的高低等比较抽象的概
念来描写多项定语以及部分主谓结构、同位结构和能愿动词连用、汉语和英语中姓名
等的排列顺序, 并借助信息加工难度和在问题空间中的搜索策略等认知科学的理论来
解释多项定语等的排序问题, 希望由此探索一条基于信息加工心理学的研究语序的新
路子。最后, 从对定语顺序的描写和解释上揭示: ( 1) 描写和解释是互相推动、交替
上升的; ( 2) 为了更好地理解形式和意义之间的关系, 语言结构可以从数据结构的角
度重新加以认识。
·185·
§1 定语的信息量和排列顺序
1. 1 朱德熙 ( 1982) 把体词性偏正结构分为粘合式和组合式两大类。粘合式偏正
结构指名词、区别词和性质形容词直接 (即不带 “的”) 作定语的格式; 组合式偏正结
构包括: ( 1) 定语带 “的”的偏正结构, ( 2) 由数量词 (或指示代词加量词) 作定语
的偏正结构, ( 3)
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
示领属关系的偏正结构¹ 。为了方便, 我们称粘合式偏正结构中的
定语为粘合式定语, 称组合式偏正结构中的定语为组合式定语。当这两种定语在中心
语前共现时, 组合式定语一定在粘合式定语之前º。例如:
小的瓷碗儿~*小瓷的碗儿 瓷的小碗儿~* 瓷小的碗儿
如果暂时不考虑数量定语和领属定语, 那么上述的定语排序规律可以直观地表达
成: 带 “的”的定语在不带 “的”的定语之前。两类定语的这种排序规律是可以从句
法、语义、语用和认知上作出合理的解释的。从句法上看, 粘合式偏正结构的功能
(分布) 相当于一个单个的名词, 凡是单个的名词能出现的地方, 它也能出现。因此,
它既能替换粘合式偏正结构里的名词, 也能替换组合式偏正结构中的名词。而组合式
偏正结构的功能不同于单个的名词, 它只能替换组合式中的名词、不能替换粘合式中
的名词。这造成: ( 1) 组合式可以以粘合式为成分。例如:
小的瓷碗儿 瓷的小碗儿
0 0
1 2 1 2
直接成分 2是粘合式, 作组合式 0的中心语。也就是说, 组合式定语可以修饰粘合式
偏正结构。但是, ( 2) 粘合式不能以组合式为成分。例如:
*小瓷的碗儿 *瓷小的碗儿
0 0
1 2 1 2
直接成分 2是组合式, 它不能受粘合式定语 1的修饰。即粘合式定语不能修饰组合式
偏正结构。因此, 带 “的”定语一定在不带 “的”定语之前»。
从语义上看, 粘合式定语和中心语联系紧密, 在意念上是一个整体; 组合式定语
和中心语是一种临时组合, 两部分在意念上保持较大的独立性¼ 。因此, 粘合式偏正结
构经常用作某种特定事物的称谓方式, 从而在语用上获得了称谓性 ( appellat iv e) 的表
·186·
中国社会科学 1999 年第 2 期
¹ º » ¼ 参见朱德熙 《语法讲义》, 商务印书馆 1982 年版, 第 142—151 页。
达功能¹ 。例如:
中国朋友~中国的朋友 孩子脾气~孩子的脾气
这两类所表示的意义是很不一样的º。正因为粘合式偏正结构具有称谓性,可用以指称
某种特定的事物, 所以它有时就像专有名词, 没有相应的组合式偏正结构。例如:
公共汽车~* 公共的汽车 建筑面积~* 建筑的面积
毕业论文~* 毕业的论文 科研项目~* 科研的项目
从认知上看, 一个语言形式 (词语) 的意义不仅包括这个词语在人脑中形成的一
个情景 ( situation, 指一个概念或概念结构) , 而且包括这一情景形成的具体方式——
意象 ( imagery ) »。就偏正结构而言, 粘合式表达 (或激活) 的是一种单一性的意象,
它并不突显 ( salience) 定语所表示的性质; 组合式表达 (或激活) 的是一种复合性的
意象, 它突显中心语所表示的事物具有定语所表示的某种性质。这两类偏正结构在概
念结构上的差异是可以从句法上得到验证的。例如:
( 1) a. 便宜的塑料拖鞋 便宜的
b. 便宜的塑料的拖鞋 * 便宜的
( 2) a. 棕色的木头房子 棕色的
b. 棕色的木头的房子 * 棕色的
在 a 中, 只有一个突显的组合式定语, 可以用它来称代由粘合式偏正结构充当的中心
语; 在 b中, 两个组合式定语都是突显的, 不能只用一个突显的组合式定语去称代含
有突显定语的中心语。正因为粘合式偏正结构中没有突显成分, 所以它具有跟单个名
词一样的句法功能——单个名词能出现的地方它也出现, 单个名词能删除的地方它也
能删除。
综上所述, 组合式定语必须先于粘合式定语的排序规律可以从两类偏正结构的句
法功能上作出解释, 而这两类偏正结构的句法功能的不同又是可以从语义、语用和认
知上获得解释的。
1. 2 粘合式偏正结构的中心语之前可以有多项定语,这些粘合式定语的排列是有
严格的顺序的。例如:
大红球~*红大球 小木盆儿~* 木小盆儿
白木床~*木白床 小黑铁塔~* 铁黑小塔
但是, 要想描写这种语序规律却十分困难。陆丙甫 ( 1988) 尝试从定语的语义类型的
·187·
定语顺序的认知解释及其理论蕴涵
¹
º
» 详见沈家煊 《R. W . Langacker 的 “认知语法”》, 《国外语言学》1994年第 1期。
详见朱德熙 《语法讲义》, 第 142—144页。
参见陈琼瓒 《修饰语和名词之间的 “的”字研究》, 《中国语文》1955 年第 10 期; 陆丙甫
《定语的外延性、内涵性和称谓性》, 《语法研究和探索》4, 北京大学出版社 1988 年版。
角度, 把多项定语的顺序归纳为¹ : ( > 读作 “先于”)
时间> 形体> 颜色> 质料和功能
这种描写
方法
快递客服问题件处理详细方法山木方法pdf计算方法pdf华与华方法下载八字理论方法下载
比较直观, 但是有不明确的地方。例如:
农民棉花专家~* 棉花农民专家
当代青年语言学家~* 青年当代语言学家
这里的 “农民、棉花”很难归入上述几种语义类, “当代、青年”都可以归入时间这一
类, 但它们又有先后之别。
我们从充当定语的词语的语义聚合的角度进行观察, 发现多项粘合式定语的排列
遵循着一条极为简单的规律: 对立项少的定语排在对立项多的定语之前º。例如:
大红球 小木盆儿 小黑铁塔
小黄 大铝 大黄铜
白 铅 红钢
黑 铜 白石
绿 塑料 蓝木
⋯ 玻璃 ⋯水晶
⋯⋯ 水泥
⋯⋯
再如: “中等师范学校、古代哲学
思想
教师资格思想品德鉴定表下载浅论红楼梦的主题思想员工思想动态调查问卷论语教育思想学生思想教育讲话稿
、大号塑料防风大衣、新版袖珍英汉词典”等,
其中的定语都是按照对立项由少到多的顺序排列的。并且, 定语按对立项由少到多的
顺序排列的规律也可以对前引 “时间> 形体> 颜色> 质料和功能”的排序规则作出解
释。因为表示时间的聚合 “新、旧”是两项对立, 表示形体的 “大、中、小”是三项
对立, 表示颜色的 “红、黄、白、黑、蓝、绿⋯⋯”对立项在十项左右, 表示质料和
功能的聚合包含的对立项更多。
当两个定语的对立项的数目大致相等时, 它们可以互换位置。例如:
单人圆顶蚊帐~圆顶单人蚊帐 快速燃气热水器~燃气快速热水器
实用汉语语法~汉语实用语法 大型彩色记录片~彩色大型记录片
不过, 有时候也会碰到例外。比如:
瘦高个儿~* 高瘦个儿 白色长统袜子~*长统白色袜子
“瘦”和 “高”对立项数目相等, 但 “瘦”不能直接修饰 “个儿”, 因而只能作外层定
语。“白色”的对立项多于 “长统”, 但它不能直接修饰 “袜子”, 因而只能作外层定语。
·188·
中国社会科学 1999 年第 2 期
¹
º 这里暂不考虑音节数目对定语排序的影响。
参见陈琼瓒 《修饰语和名词之间的 “的”字研究》, 《中国语文》1955 年第 10 期; 陆丙甫
《定语的外延性、内涵性和称谓性》, 《语法研究和探索》4, 北京大学出版社 1988 年版。
可见, 语序规律无例外; 如果有例外, 那么一定是有原因可寻的。
马庆株 ( 1995) 发现, 作粘合式定语时, “大、小”类形容词一定在 “高、矮、胖、
瘦、宽、窄、粗、细⋯⋯”类形容词之前¹ 。例如:
大高楼~*高大楼 小矮个儿~* 矮小个儿
大粗绳~*粗大绳 小瘦猴儿~* 瘦小猴儿
大宽马路~* 宽大马路 小窄胡同~* 窄小胡同
大壮小伙子~*壮大小伙子 小细胳膊腿~*细小胳膊腿
从表面上看, “大、小”类形容词跟 “高、矮⋯⋯”类形容词一样, 都是两项对立。
事实上, 由于这两类形容词的语义结构不同, 因而其对立项的数目也不相同。“大、
小”类形容词表示单纯的极性对立 ( polar opposition) , 只有两个对立项; “高、矮
⋯⋯”类形容词除了表示极性对立之外, 还包含维度对立 ( dimension opposit ion) , 因
此有多个对立项。可以列表表示如下:
极 性 维 度 大 小
向 上 高 度 高 矮/低
向 下/里 长 度 深 浅
两 点 间 距 离 长 短
横 向 距 离 宽 窄
体 质 强 度 强/壮 弱
脂 肪 数 量 胖/肥 瘦
年 龄 数 量 老 少
横 剖 面 积 粗 细
从上表可以看出, 当我们说某人 “高”时, 除了有跟 “矮”构成的极性对立之外,
还有跟 “胖、瘦、壮、弱、老、少⋯⋯”等构成的维度对立; 说某条路 “长”时, 除
了有跟 “短”构成的极性对立之外, 还有跟 “宽、窄、直、弯、平、陡⋯⋯”等构成
的维度对立。可见, “大高楼”一类偏正结构仍然遵循着定语按对立项多少来排序的规
律。并且, 正因为 “高、矮⋯⋯”类形容词是属于同一语义聚合的, 所以它们在语法
分布上具有对立关系, 表现为: 它们不能以多项定语的形式修饰同一个中心语。例如:
*长宽马路~*宽长马路 * 长的宽的马路~* 宽的长的马路
*长的宽马路~* 宽的长马路 又长又宽的马路~又宽又长的马路
虽然马路有长和宽两个维度, 但因为 “长”和 “宽”属于同一语义聚合, 因此不能以
多项定语的形式共现。只有用“又⋯⋯又⋯⋯”格式把它们捆成一个单项定语之后, 它
·189·
定语顺序的认知解释及其理论蕴涵
¹ 马庆株: 《多重定名结构中形容词的类别和次序》, 《中国语文》1995年第 5期。
们才能一起修饰中心语名词。这个事实, 对理解句法和语义之间的关系是极富启发性
的。当然, 例外是不可避免的。比如, “瘦”和 “高”属于同一语义聚合, 但它们可以
多项定语的形式同现, 说成 “瘦高个儿”。我们先来比较下列相关形式:
瘦高个儿~* 瘦矮个儿 *胖高个儿~* 胖矮个儿
可见, “瘦高个儿”这种形式是不可类推的, 说它例外也许并不过分。
1. 3 组合式偏正结构的中心语之前也可以有多项定语, 这些组合式定语的排列也
是有严格的顺序的。例如:
( 1) 少有的最好的情形~* 最好的少有的情形
( 2) 说不出的痛苦的味道~*痛苦的说不出的味道
( 3) 去年刚分来的搞化学分析的小伙子~*搞化学分析的去年刚分来的小伙
子
( 4) 老舍写的叙述一个洋车夫的一生的小说~*叙述一个洋车夫的一生的老
舍写的小说
上例中, “少有的”跟 “常见的”相对、“最好的”跟 “较好的、很好的、极好的”等
相对, “说不出的”跟 “说得出的”相对, “痛苦的”跟 “幸福的、不幸的、焦虑的、浮
躁的、兴奋的”等相对, “去年刚分来的”跟 “今年⋯⋯、前年⋯⋯”等相对, “搞化
学分析的”跟 “搞技术革新的、搞模型设计的、搞企业管理的、搞党团工作的”等相
对, “老舍写的”跟 “鲁迅、郭沫若⋯⋯写的”相对, “叙述一个洋车夫”跟 “叙述一
个妇女、农民、工人、战士、国王、牧师、侠客⋯⋯”等相对。可见, 多项组合式定
语也是遵循对立项由少到多的顺序进行排列的。
当两个定语的对立项的数目大致相等时, 它们可以互换位置。例如:
最小的能自由运用的单位~能自由运用的最小的单位
会讲话的能使用工具的动物~能使用工具的会讲话的动物
事实上, 组合式定语在遵循对立项由少到多的排序规律方面远不如粘合式定语来
得严格。当两个组合式定语的对立项的数目相差不大或不明显时, 两种排列都是允许
的, 只是遵循排序规律的表达更为自然罢了。例如:
长方形的红木的桌子~红木的长方形的桌子
新做的翠绿色的旗袍~翠绿色的新做的旗袍
很年轻的研究甲骨文的学者~研究甲骨文的很年轻的学者
穿着破衣服的十分可怜的孩子~十分可怜的穿着破衣服的孩子
上面讨论了带 “的”的组合式定语的语序, 现在讨论可以不带 “的”的领属定语
和数量定语的语序。领属定语表示中心语的范围、指明言谈的论域 ( universe of
discourse) , 因此必须放在其他定语的前面。例如:
小王 (的) 用了多年的钢笔~* 用了多年的小王 (的) 钢笔
·190·
中国社会科学 1999 年第 2 期
我们班 (的) 最优秀的学生~* 最优秀的我们班 (的) 学生
表示时间、处所的定语只有通过话题化提升为主语后, 才能居于领属定语之前。例如:
( 5) 小王上学期的成绩不够理想 上学期, 小王的成绩不够理想
中国这几年的经济形势不错 这几年, 中国的经济形势不错
我们村大河东面的几十亩地全卖给外商了 大河东面, 我们村的几十
亩地全卖给外商了
我们班操场北边的那间活动室已经锁上门了 操场北边, 我们班的那
间活动室已经锁上门了
这样, 领属定语成了定语范围的标志, 在它之前的成分肯定不是定语。
指示代词和数量词充当的定语位置比较灵活, 但其最前面不能越过领属定语和处
所定语, 最后面不能越过粘合式定语。例如:
我家的三间草房~*三间我家的草房
周总理的一幅画像~一幅周总理的画像
朝鲜战场上的一些故事~* 一些朝鲜战场上的故事
在 “周总理的一幅画像”中, “周总理”是领属定语, 整个短语的意思是周总理拥有/
画的一幅画像。在 “一幅周总理的画像”中, “周总理”不是领属定语, 整个短语的意
思是一幅画着周总理的画像。可见, 句法位置对定语的类型有着严格的选择限制。
指示代词可以跟数量词合在一起, 也可以拆开来放在两处。不管是哪一种情况, 指
示代词必须放在数量词之前。例如:
他那一双又粗又黑的手~他那又粗又黑的一双手
小王那两支刚买的钢笔~小王刚买的那两支钢笔
这倒是符合对立项少的定语放在对立项多的定语之前的排序规律, 因为指示代词只有
近指 (这) 和远指 (那) 两项对立, 而数词和量词都可以构成多项对立。
必须说明,由于定语按对立项多少来排序的规律是建立在语义聚合的基础之上的,
因而这条规律对那些属于封闭聚合的定语比较有效、对那些属于开放或半开放聚合的
定语就不那么有效。比如, “急性心原性脑缺血综合症”、“双水内冷汽轮发动机”。因
为一般局外人对其中一些定语所属的语义聚合 (到底包含多少对立项) 缺少必要的了
解, 所以对这些定语的顺序安排很难作出评价。不过, 这倒也从反面证明定语的排序
跟定语所属的聚合的性质及其大小是正相关的 ( posit ively corr elated)。
1. 4 根据 Shannon ( 1948) 提出的理论, 一个信号 ( message) 所负载的信息量
( amount of info rmat ion) 并不取决于信号本身, 而是跟可供选择的信号的数目 ( the
number o f po ssible messages) 成正比的。因为, 那个实际出现的信号是从一个由可能
出现的信号组成的聚合中挑选出来的 ( the actual message is one selected f rom a set of
po ssible messages)。用Weaver ( 1949) 的话来说, 信息是对人们在选择信号时所拥有
·191·
定语顺序的认知解释及其理论蕴涵
的选择自由度的一种度量 ( informat ion is a measure of one's freedom o f choice w hen
one selects a message)。或者说, 信息是对通讯过程中的不确定性 ( uncer tainty ) 的一
种度量: 可供选择的可能性愈多, 那么不确定性就愈大; 同时, 这也意味着被选中的
那个信号负载着较多的信息量¹ 。因此, 从许多对立项中选出的一个符号 (比如词语或
单词中的一个字母) , 比从有限的对立项中选出的符号传递更多的信息。举一个例子,
假如遮住一个英语单词的最后一个字母, 让你猜REA 后面是什么。你有可能选择R、
L、D、M 或 P 作为所缺的字母, 因为其中每一个字母都能填进去, 从而构成一个合格
的单词。由于可供选择的对立项的数目是五, 因而猜出 “正确的”字母的可能性是五
分之一。因此, 在这里, “正确的”字母带有大量的信息。假如, 给出的是 EXI , 由
于惟一合适的字母是 T , 因而这个 “正确的”字母所传达的信息量就很小º。
回到我们的论题上来, 由此可以得出结论: 对立项少的定语所传达的信息量要小
于对立项多的定语。假如从这种观点出发, 那么对立项少的定语排在对立项多的定语
之前的语序规律就可以改写为: 信息量小的定语排在信息量大的定语之前。这样, 我
们就从信息论角度对定语的顺序作出了一种定量化的描写和解释。
§2 信息加工难度和认知处理策略
2. 1 上文证明, 多项定语是按照信息量由小到大的顺序进行排列的。从认知上看
就是把信息量小、容易加工的成分放在前面, 把信息量大、不易加工的成分放在后面。
它遵循着人类认知处理的一种最基本的策略: 先处理简单的、容易加工的信息, 后处
理复杂的、不易加工的信息。人们对这种认知策略 ( cognit iv e st rateg y) 是非常熟悉的,
比如, 善于考试的人都有一个经验: 先做容易的题目, 后做较难的题目。
就包含多项定语的偏正结构而言, 我们可以把中心语看做是一个问题空间
( problem space) , 把各项定语看做是对这个问题空间进行划分的标准和对问题空间中
的目标进行搜索 ( sear ch) 的线索和路径 ( path)。这样, 从信息加工心理学的角度看,
定语的排序问题就是一个优先选择什么属性来对问题空间进行划分、并沿着由这个属
性构成的路径进行搜索、从而找到目标的问题。比如, 在 “小红球”中, “球”表示一
个问题空间, 为了在这个问题空间中搜索到红颜色、小尺寸的球这个目标, 有两种划
分问题空间的方法, 从而也有两种相应的搜索路径。第一种办法, 首先按尺寸这个属
性把球空间划分成大、中、小三个子空间, 然后按颜色这个属性把每个子空间划分成
·192·
中国社会科学 1999 年第 2 期
¹
º 详见 L . Solso 著、黄希庭等译 《认知心理学》, 教育科学出版社 1990 年版, 第 93—95页。
参见 C. E. Shannon & W. Weaver ( 1949) , T he Mathematical Theory of Communication,
Univ er sity o f Illino is Pr ess, pp. 3—6, 18—22, 98—106。
红、黄、蓝、黑、白、绿⋯⋯大约六个子空间。在这种结构化的问题求解空间中, 先
沿尺寸的路径逐个搜索, 找到小尺寸的球那个子空间; 然后在这个子空间中沿颜色的
路径逐个搜索, 最终找到那个红颜色的球。这个球就是那个尺寸小的红球—— “小红
球”。第二种办法, 首先按颜色这个属性把球空间划分成红、黄、蓝、黑、白、绿⋯⋯
大约六个子空间, 然后按尺寸这个属性把每个子空间划分成大、中、小三个子空间。在
这种问题空间结构中, 先沿颜色的路径逐个搜索, 找到红颜色的球那个子空间; 然后
在这个子空间中沿尺寸的路径逐个搜索, 最终找到那个小尺寸的球。这个球就是那个
红颜色的小球—— “小红球”。这两种问题求解的空间结构的搜索路径可以图示于下:
第一种办法采用的是深度优先 ( depth-first ) 的搜索策略, 首先在路径少的子空间
中搜索, 期望通过较少次的搜索就能找到有用的线索。第二种办法采用的是广度优先
( breadth-f irst ) 的搜索策略, 首先在路径多的子空间中搜索, 期望凭运气一下子就撞上
较有用的线索, 从而缩短整个的搜索路径。比较而言, 广度优先的搜索有可能找到最
短的搜索路径, 从而具有较高的求解效率¹ 。比如, 在搜索图 b中, 碰巧第一次搜索就
碰上了红球这个跟目标相关的子目标, 接下来最多再搜索三次就准能找到目标——红
色的小球。但是, 人们通常还是乐于采用深度优先的搜索策略, 因为它可以保证即使
在最不走运的情况下, 也能通过有限次的搜索找到跟目标相关的子目标, 从而有信心
往下作更深的搜索, 直至找到目标。比如, 在搜索图 a中, 一开始, 最多搜索三次就准
能找到小球这个跟目标相关的子目标, 使人产生一种胜利在望的满足感。可见, 深度
优先作为一种认知策略在本质上是一种启发式的 ( heurist ic) 规则, 它以满意解
( sat isfying so lut ion) 为目标、而不追求最优解 ( opt imal solution)。
因此, 我们相信: 语序跟人类大脑中词汇和语义的组织方式 (即认知结构) 相关,
·193·
定语顺序的认知解释及其理论蕴涵
¹ 参见林尧瑞、马少平编著 《人工智能导论》, 清华大学出版社 1990 年版, 第 60—61 页。
也跟人们对大脑中词汇的检索 ( lex ical ret rieval ) 方式和对语义的提取 ( semant ic reco-
very ) 方式 (即认知过程) 相关。合适的语序安排无异于提供了一种较优的对问题空间
的求解结构, 为人们对语言信息的认知加工创造了便利条件。由于语序跟人类普遍的
认知结构和认知过程相关, 因而必然地会有一些语序在世界各语言中具有很大的普遍
性。比如, 英语中多项定语基本上也遵循信息量由小到大的排序规律 (例子从略)。
2. 2 通过考察, 我们发现: 许多语序现象都可以用信息量大小和认知加工策略等
概念来解释。比如, 姓和名的排列顺序, 在汉语中是先姓后名, 在英语中是先名后姓,
正好倒了一个个儿。从统计上看, 汉语的姓氏最多在四百个左右, 名字则至少有几十
万个。英语则正好相反, 名字非常少, 只有几百个; 姓氏则多得多, 至少也有几千个¹ 。
这样, 在汉语中, 姓氏的对立项少, 因而信息量小; 名字的对立项多, 因而信息量大。
在英语中, 名字的对立项少, 因而信息量小; 姓氏的对立项多, 因而信息量大º。可见,
不论是汉语还是英语, 姓和名的排列都遵守着信息量小的在前面、信息量大的在后面
的语序原则。当然, 除了这种认知原因之外, 姓名的顺序还跟语言的类型、民族的历
史和文化等因素相关。
语气词连用的顺序也可以从信息量的角度来作出解释。朱德熙 《语法讲义》把语
气词分为三组:
( 1) 表示时态的语气词, 包括: 了、呢 1、来着;
( 2) 表示疑问或祈使的语气词, 包括: 呢 2、吗、吧 1、吧 2;
( 3) 表示说话人的态度或情感的语气词, 包括: 啊、呕、 、 、呢 3⋯⋯
等。
朱先生指出, 这三组语气词在句子中的顺序是固定的, 即 ( 1) > ( 2) > ( 3)。例如:
( 1) > ( 2) : 下雨了吗? 轮到你了吧 1?
( 1) > ( 3) : 不早啦 ( = 了+ 啊) ! 还小呢 1 !
( 2) > ( 3) : 走啵 ( = 吧 2+ 呕) ! 好好说呗 ( = 吧 1+ ) !
( 1) > ( 2) > ( 3) : 已经有了婆家了呗 ( = 吧 1+ ) !
从统计上看, 这三种语气词的数量是有差别的。( 1) 最少, ( 2) 其次, ( 3) 最多, 至
少还包括 “着呢、罢了”和 “啊”的各种连读变体。因此, 语气词的连用也遵循按信
息量由小到大的顺序进行排列的语序规则。当然, 语气词连用的顺序规则还可以用语
义接近原则来解释。( 1)类语气词表示时态, 跟动词短语关系紧密, 所以紧跟在动词短
·194·
中国社会科学 1999 年第 2 期
¹
º 详见赵元任 《语言成分里意义有无的程度问题》, 见袁毓林编 《中国现代语言学的开拓和发
展——赵元任语言学论文选》, 清华大学出版社 1992 年版, 第 71—72 页。
我们统计了 《新英汉词典》(上海译文出版社 1985年版) 所附的 “常见英美姓名表”, 其中
可以作姓的约有1 600个, 可以作名的约有 900个。
语之后。( 2)类语气词表示疑问和祈使, 而疑问句和祈使句都可以看做是从陈述句上转
换出来的。因此, 表示疑问和祈使的语气词处于句子的较外层, 理应处在表示时态的
语气词之后。( 3)类语气词表示说话人的态度和情感, 而态度和情感都是附加在陈述句
和由它转换出来的疑问句和祈使句上的, 属于更为外围的成分, 所以处在最后。有意
思的是, 语气词的顺序跟副词的顺序大致对称。一般地说, 语气副词一定在时间副词
之前, 而表示疑问的 “是不是”和表示祈使的 “别”则介于两者之间。例如:
( 1) 她幸亏已经向领导请了假了。 ( 2) 你到底是不是去过上海了?
( 3) 你是不是马上就要去深圳? ( 4) 你到底是不是已经结过婚了?
( 5) 你到底是不是早有戒心了? ( 6) 你可千万别马上就走哇!
( 7) 你可别老是这样愁眉苦脸的!
上述语序排列情况, 可以归纳表示于下:
语气副词> 疑问祈使标志> 时间副词⋯动词⋯时态语气词> 疑问祈使语
气词> 情感语气词
可见, 副词和语气词的小类都是按照其跟谓语动词的语义关系的紧密程度由近及远地
进行排序的。这种语义接近原则也是可以从认知上得到解释的: 为了人脑信息加工的
方便, 意义联系紧密的成分尽可能挨得近一点儿, 以便人们通过词语的局部组合很快
地得出局部的语义解释, 从而使听、读者能从容地边听、读, 边理解。
马庆株 ( 1991) 指出, 处所词连用无论构成主谓结构还是偏正结构, 都遵循着一
条原则: 相对处所词在前, 绝对处所词在后¹ 。例如:
( 8) 首都北京~*北京首都 下一站故宫~*故宫下一站
( 9) 首府拉萨~*拉萨首府 母校北京大学~* 北京大学母校
( 8) 是主谓结构, ( 9) 是同位结构。这里的相对处所词 “首都、下一站、首府、母
校”都是索引词语 ( index expression) , 它们都需要上文或语境作参照才能有明确的所
指。比如, 要确定 “下一站”的所指, 必须先知道它是针对什么站而言的下一站, 并
且还必须知道行车的方向等情景特征。也就是说, 相对处所词对上文和语境的依赖性
大, 其参照点一定是已知的旧信息; 因此, 整个表达 “(西单的) 下一站”是认知加
工起来比较容易的旧信息, 宜于放在由绝对处所词表达的新信息 “故宫”之前。可资
比较的是北京地铁的英语报站: Nex t stat ion is Xizhimen, Xizhimen is nex t station. 绝
对处所词 “西直门”只有在上文提及 (即成为旧信息) 以后, 才能充当主语。有意思
的是, 从对立项多少、信息量大小的角度看, “首都”跟 “陪都”相对、“下一站”跟
“本站”相对⋯⋯; 显然地, 相对处所词的对立项少于绝对处所词, 相应地相对处所词
的信息量要小于绝对处所词。因此, 处所词连用也遵循信息量小的成分排在信息量大
·195·
定语顺序的认知解释及其理论蕴涵
¹ 马庆株: 《顺序义对体词语法功能的影响》, 《中国语言学报》第 4期, 商务印书馆 1991年版。
的成分之前的语序规则。
马庆株 ( 1991) 还指出, 时间词连用无论构成主谓结构还是同位结构, 一定相对
时间词在前、绝对时间词在后。例如:
( 10) 今天星期一~* 星期一今天 现在六点钟~*六点钟现在
( 11) 明天中秋节~* 中秋节明天 后天星期三~*星期三后天
( 10) 是主谓结构, ( 11) 是同位结构。原则上, 上文对于处所词连用顺序的解释也适
用于这里的时间词连用的顺序。
马庆株 ( 1991) 还指出, 两个绝对时间词连用构成主谓结构, 周期连续的时间词
在前、周期不连续的时间词在后。例如:
星期一三九~*三九星期一 20号头伏~*头伏 20号
这也可以从信息量上得到解释, 因为周期连续的时间词的复现率高、使用次数多, 所
以包含的信息量也就相应地小; 周期不连续的时间词复现率低、使用次数少, 所以包
含的信息量也就相应地大¹ 。
马庆株 ( 1991) 还指出, 周期连续的时间词连用构成主谓结构, 元素连续的时间
词通常在元素不连续的时间词的前面。例如:
星期天春分~春分星期天 4号清明节~清明节 4号
这种语序优势现象, 也可以从这两类时间词的复现率和信息量上得到解释。
从上文的讨论可以看出, 一个词语的信息量的大小除了跟它所处的语义聚合的大
小相关之外, 还跟它的使用频率相关。并且, 词语的使用频率跟其所处的语义聚合的
大小又是紧密相关的。一般地说, 对立项少的语义聚合, 其中每个成员可能获得较多
的出现机会; 对立项多的语义聚合, 其中每个成员的出现机会可能相应地要少一些。
2. 3 马庆株 ( 1988) 把能愿动词分为六类:
( 1) 可能动词 A类——可能
( 2) 必要动词——得 ( di)、应、该、应该
( 3) 可能动词 B类——会、可、可以、能、能够
( 4) 愿望动词——愿、愿意、情愿、想、想要、乐意、肯
( 5) 估价动词——值得、配
( 6) 许可动词——准、许
并指出, 当它们在句子中连用时遵循着下列次序: ( 1) > ( 2) > ( 3) > ( 4) >
·196·
中国社会科学 1999 年第 2 期
¹ 常用的词语, 由于其可预测的概率高 (即不确定性低) , 因而信息量就小。参见赵元任 《语
言成分里意义有无的程度问题》, 《中国现代语言学的开拓和发展——赵元任语言学论文
选》, 第 75页。
( 5) > ( 6) ¹ 。例如:
( 1) > ( 2) : 可能应该~* 应该可能
( 1) > ( 3) : 可能会~*会可能
( 1) > ( 4) : 可能愿意~* 愿意可能
( 1) > ( 5) : 可能值得~* 值得可能
( 2) > ( 3) : 应该可以~* 可以应该
( 2) > ( 4) : 应该愿意~* 愿意应该
( 2) > ( 5) : 应该值得~* 值得应该
这种排序规律也可以从信息量和认知策略上作出解释。从逻辑上看, ( 1) “可能”
表示介于肯定和否定之间的一种概率。假如肯定式 “明天下雨”和否定式 “明天不下
雨”都只含有一个比特 ( bit ) 的信息, 那么可能式 “明天可能下雨”所含的信息就小
于一个比特。因此, 包含 “可能”的肯定式和否定式可以在一个复句中连用, 而不会
引起逻辑矛盾 (即违反排中律)。例如: “明天可能下雨, 也可能不下”。可见, “可
能”包含的信息是极小的。根据上文的结论, 信息量小的成分容易加工, 那么, “可
能”应该排在其他能愿动词之前。从可能世界 ( possible wo rld) 的角度看, “可能”所
指涉的可能世界跟我们生活在其中的世界最接近, 信息加工起来比较容易, 是一个认
知上容易到达 ( access) 的普通世界。( 2) “应该”等必要动词所指涉的可能世界是一
种理想的世界, 它是跟某些道德的、法律的或宗教的等系统相联系的。比如, “她 18岁
了, 应该出嫁了”可以解释为: 在某个理想世界中, 18岁的她出嫁是真的。显然地, 在
信息加工时, 到达这种理想世界要比到达普通世界困难得多。这种可能世界是一种特
殊世界, 但对某一特定的群体 (国家、种族、教派⋯⋯) 来说, 它又是一个公共的世
界。( 3) “可以、能够”等动词所指涉的可能世界是一种关于个体的某种能力或条件的
世界, 比如, “他能够教中学”可以解释为: 在 “他”这个个体的能力世界中, 他教中
学是真的。( 4) “愿意”类动词所指涉的可能世界是一种关于个体的某种愿望的世界,
比如, “他愿意当系主任”可以解释为: 在 “他”这个个体的愿望世界中, 他当系主任
是真的。( 5) “值得”类动词所指涉的可能世界是一种说话人这个个体的信念世界, 它
是跟说话人对于某事的主观评价相联系的。比如, “这种现象值得我们研究”可以解释
为: 在说话人的信念世界中, 研究这种现象是真的º。( 3) ( 4) ( 5) 三类动词所指涉的
是一种特殊的、并且是针对个体的可能世界, 要进入这种可能世界、从而判断含有这
·197·
定语顺序的认知解释及其理论蕴涵
¹
º 关于能愿动词所涉及的可能世界, 请看 J. A llw ood, L .-G. Ander sson & O ¨. Dahl ( 1977) ,
L ogic in L inguistics, Cam br idge Univ er sity P ress, pp. 108—114。中译本 《语言学中的逻
辑》, 王维贤等译, 河北人民出版社 1984年版, 第 126—132 页。
参见马庆株 《能愿动词的连用》, 《语言研究》1988 年第 1 期。
种动词的命题的真假, 就必须知道相关个体的许多具体的信息, 因此, 从认知上看, 对
这类词进行信息加工是有一定的难度的。这五类动词所涉及的可能世界的类型和性质,
可以列表对比如下:
动 词 可能世界的类型
可 能 世 界 的 性 质
一般世界 特殊世界 公共世界 个体世界
可 能 普通世界 + - + -
应 该 理想世界 - + + -
能 够 条件世界 - + - +
愿 意 愿望世界 - + - +
值 得 信念世界 - + - +
从信息加工的角度看, 这五类动词的语义可达性 ( accessibility ) 是有很大差别的。
相对来说, 理解一般世界比特殊世界容易, 理解公共世界比个体世界容易。换句话说,
在认知处理方面, 一般世界和公共世界的语义可达性分别比特殊世界和个体世界要高。
如果按照这种度量办法, 那么 “可能”的语义可达性最高、信息加工起来最容易, 排
在最前面; “应该”类动词的语义可达性小于 “可能”、但大于其他三类动词, 信息加
工起来比较容易, 排在第二; “能够”、“愿意”、“值得”三类动词的语义可达性大致相
似、信息加工难度大致相同, 它们或者可以互为先后、或者不能共现。例如:
*能够愿意~*愿意能够 *可以值得~* 值得可以 * 愿意值得~*值得愿意
看来, 汉语中选择的是后一种可能性 (即 “不能共现”)。
“会”跟 “可能”一样, 是表示概率的动词。但是, “会”表示的概率要高于 “可
能”。试比较:
( 1) 小王明天可能来, 也可能不来 ( 2) *小王明天会来, 也会不来
“会”表示较大的可能性, 因此包含它的肯定式和否定式连用就违反了排中律, 从而造
成逻辑矛盾。也就是说, “会”的信息量大于 “可能”。根据语言成分按信息量由小到
大的顺序进行排列的原则, “可能”应该排在 “会”之前。例如:
小王明天可能会来~* 小王明天会可能来
另外, “会”有时态限制, 通常用在表示将来时态的句子中; 只有在疑问或否定的情况
下, 才能用在表示现在或过去时态的句子中。例如:
他现在不会在家的 他昨天晚上会呆在家里吗? 他会不会已经先走了?
也就是说, “会”除了有模态 (语气) 意义之外, 还含有时态意义。根据上文提出的表
示时态的词语必须紧靠谓语动词的原则, 当 “会”跟 “应该”类动词共现时, “会”应
该排在后面。例如:
小王应该会来的~*小王会应该来的
·198·
中国社会科学 1999 年第 2 期
可见, 一个词或一类词的语序安排有时会受到不同的语序原则的支配。这些不同
的语序原则之间是一种竞争关系, 谁获胜了就服从谁。至于这种竞争机制的具体细节,
我们还了解得不多。
综上所述, 语言成分的排列顺序跟它们在信息加工上的难易程度相关; 而充当各
种语言成分的词语的认知难度至少有两个衡量指标: ( 1) 所含信息量的大小, ( 2) 语
义可达性程度的高低。
§3 语序描写和解释的理论蕴涵
3. 1 从上文关于定语顺序的描写和解释上,可以抽绎出具有方法论价值的理论蕴
涵。其一, 合适的描写能导向充分的解释, 深刻的解释依赖于准确的描写。比如, 对
于 “小黑铁塔”一类多项粘合式定语的顺序, 可以根据定语的语义类型描写为:
R1: 尺寸> 颜色> 质料
但是, 它无法预测不属于这些语义范畴的粘合式定语的语序位置。并且, 为什么表示
尺寸的词 (大、小) 一定要排在表示颜色的词之前, 从这种直观的语序描写上是无法
获得解释的。只有换一个角度, 从定语的语义聚合的内部构成 (成员数目) 上考察, 才
能得出更为抽象并能导向深刻的解释的语序规律:
R2: 对立项少的定语> 对立项多的定语
事实上, R2已经对R1从语义聚合上作出了解释: 因为表示尺寸的语义聚合所含的成
员 (对立项) 数目少于表示颜色的语义聚合。但是, R2这种语序规则本身又是需要解
释的: 为什么对立项少的定语必须排在对立项多的定语之前? 这就引出了更富洞察力
( insight ) 的语序规律:
R3: 信息量小的定语> 信息量大的定语
R3可以看做是从信息论角度对 R2作出的一种解释: 因为对立项少的词语包含的信息
量小于对立项多的词语。如果把语言看做是一个自足的 ( self-contained) 系统, 那么R3
就是对定语顺序的一种最终的解释。但是, 如果从理解和生成的角度把语言看做是人
类信息加工的对象和产物, 那么 R3就只是一种高级的描写。因为 R3还需要从认知上
作出解释: 为什么信息量小的定语必须排在信息量大的定语之前? 于是, 引出了由人
类认知策略所决定的语序规律:
R4: 容易加工的定语> 不易加工的定语
R4是对 R3的一种认知解释: 因为信息量小的定语在认知处理时比信息量大的定语容
易加工, 所以根据先易后难的信息加工策略, 信息量小的定语应该排在信息量大的定
语之前。抽象一步把定语推广到其它句法成分上, 就可以导出语序的一般规律:
R5: 容易加工的成分> 不易加工的成分
·199·
定语顺序的认知解释及其理论蕴涵
可见, 一个词或一类词的语序安排有时会受到不同的语序原则的支配。这些不同
的语序原则之间是一种竞争关系, 谁获胜了就服从谁。至于这种竞争机制的具体细节,
我们还了解得不多。
综上所述, 语言成分的排列顺序跟它们在信息加工上的难易程度相关; 而充当各
种语言成分的词语的认知难度至少有两个衡量指标: ( 1) 所含信息量的大小, ( 2) 语
义可达性程度的高低。
§3 语序描写和解释的理论蕴涵
3. 1 从上文关于定语顺序的描写和解释上,可以抽绎出具有方法论价值的理论蕴
涵。其一, 合适的描写能导向充分的解释, 深刻的解释依赖于准确的描写。比如, 对
于 “小黑铁塔”一类多项粘合式定语的顺序, 可以根据定语的语义类型描写为:
R1: 尺寸> 颜色> 质料
但是, 它无法预测不属于这些语义范畴的粘合式定语的语序位置。并且, 为什么表示
尺寸的词 (大、小) 一定要排在表示颜色的词之前, 从这种直观的语序描写上是无法
获得解释的。只有换一个角度, 从定语的语义聚合的内部构成 (成员数目) 上考察, 才
能得出更为抽象并能导向深刻的解释的语序规律:
R2: 对立项少的定语> 对立项多的定语
事实上, R2已经对R1从语义聚合上作出了解释: 因为表示尺寸的语义聚合所含的成
员 (对立项) 数目少于表示颜色的语义聚合。但是, R2这种语序规则本身又是需要解
释的: 为什么对立项少的定语必须排在对立项多的定语之前? 这就引出了更富洞察力
( insight ) 的语序规律:
R3: 信息量小的定语> 信息量大的定语
R3可以看做是从信息论角度对 R2作出的一种解释: 因为对立项少的词语包含的信息
量小于对立项多的词语。如果把语言看做是一个自足的 ( self-contained) 系统, 那么R3
就是对定语顺序的一种最终的解释。但是, 如果从理解和生成的角度把语言看做是人
类信息加工的对象和产物, 那么 R3就只是一种高级的描写。因为 R3还需要从认知上
作出解释: 为什么信息量小的定语必须排在信息量大的定语之前? 于是, 引出了由人
类认知策略所决定的语序规律:
R4: 容易加工的定语> 不易加工的定语
R4是对 R3的一种认知解释: 因为信息量小的定语在认知处理时比信息量大的定语容
易加工, 所以根据先易后难的信息加工策略, 信息量小的定语应该排在信息量大的定
语之前。抽象一步把定语推广到其它句法成分上, 就可以导出语序的一般规律:
R5: 容易加工的成分> 不易加工的成分
·199·
定语顺序的认知解释及其理论蕴涵