logo
当前位置:首页 > 联盟故事 >语言与人(4)

语言与人(4)

发布时间:2022-01-30 21:11:48
作者:高度决定眼界

    我们每个人的大脑中都装有一部“心理词典”和一套“心理语法”,语言就是用语法规则组合起来的词语。若想领悟乔姆斯基的语言机制理论,我们首先要弄清这个理论是解决什么问题的。有些语法规则在婴儿诞生之初就存在于他们的大脑中,他们是天生的“语法专家”。

心理词典和心理语法

在自然界中,语法的基本原则显得并不自然。语法是一个典型的“离散组合系统”(discrete combinatorial system),即一组数量有限的离散元素(这里指的是单词)通过抽样、组合和排列,创造出一个更大的结构(这里指的是句子),而这个结构在特性上与它的构成元素完全不同。例如“人咬狗”这个句子,它在意思上不同于“人”“咬”“狗”这三个字,也不同于“狗咬人”这个文字全部相同但顺序颠倒的句子。在像语言这样的离散组合系统中,有限的元素可以生成数量无穷、特性无限的组合方式。自然界中另一个重要的离散组合系统是DNA的遗传密码。在DNA中,4种核苷酸组合成为64种密码子(codons),而这64种密码子则可以串联成无限数量的不同基因。许多生物学家都十分看重语法规则和基因组合之间的相似性。以遗传学术语为例,DNA序列中不但包含了“字母”(letters)和“标点”(punctuation),还可能是“回文”(palindromic)、“无义”(meaningless)或者“同义”(synonymous),或被“转录”(transcribed)和“翻译”(translated),甚至可以被储存于“文库”(libraries)中。免疫学家尼尔·耶尼(Niels Jerne)发表的诺贝尔奖获奖演说的题目就是:《免疫系统的生成语法》(The Generative Grammar of the Immune System)。

与之相对的是,我们在世界上看到的大多数复杂系统,如地质、调色、烹饪、声、光和气象等,都属于“共混系统”(blending system)。在共混系统中,组合体的特性是各元素特性中和的结果,而各元素则由于均分、混合而丧失了本身的特性。例如,将红色涂料与白色涂料混在一起,将得到粉红色的涂料。因此在共混系统中,组合体所能拥有的特性极其有限,如果要区分共混系统中数目繁多的组合体,就只能对其中的细微差异进行逐层甄别。由此可见,在整个宇宙中,最让我们印象深刻的两大开放式复杂构造——生命和心智都是基于离散组合系统,这或许并非巧合。许多生物学家认为,如果遗传不是以离散的形式出现,我们所谓的“进化”就不可能发生。

因此,语言的工作机制是:每个人的大脑中都包含了一部词典,它囊括了所有词语及其代表的概念,即“心理词典”(mental dictionary),此外还包含了一套遣词造句的规则,以便传达各个概念之间的逻辑关系,即“心理语法”(mental grammar)。我们将在下一章探索词语的世界,而本章的任务是剖析语法的构造。

语法是一套离散组合系统,这一事实产生了两个重要后果。第一个即是语句的浩瀚无穷。如果你走进美国国会图书馆,随便从一本书中挑出一个句子,那么你很可能无法再找到一个和它一模一样的句子,无论你在书海中翻腾多久。一个普通人能造出多少个句子?答案几乎是无法想象的。如果随机打断某个人的一句话,那么在被打断的地方,我们平均可以插入10个不同的词来续接这个句子,而没有语法或意义上的毛病(在句子的某些部位,我们只能插入一个词,而在其他一些部位,我们则有上千种选择,因此以10为平均数)。再假设句子的长度为20个词,那么从理论上说,一个人可以制造出至少1020个句子(也就是1后面加上20个0)。假设以每个句子被说出的时间为5秒来计算,即便一个人不吃不睡,也要花费100万亿年的时间来记住所有这些句子。而且,20个词的长度限制也显得过于苛刻。下面这个句子出自萧伯纳之手,长达110个词:

Stranger still, though Jacques-Dalcroze, like all these great teachers, is the completest of tyrants, knowing what is right and that he must and will have the lesson just so or else break his heart(not somebody else’s, observe), yet his school is so fascinating that every woman who sees it exclaims: “Oh why was I not taught like this!” and elderly gentlemen excitedly enroll themselves as students and distract classes of infants by their desperate endeavours to beat two in a bar with one hand and three with the other, and start off on earnest walks around the room, taking two steps backward whenever M. Dalcroze calls out “Hop!”

更为奇怪的是,尽管雅克-达克罗兹和所有那些伟大的教师一样,是一个彻头彻尾的专制者,但他知道什么是正确的教法,一定要这样上课,否则就会伤透心——注意,伤的可不是别人的心。然而,他的学校却具有无比的吸引力,每一个见过的女人都会说:“哎呀,为什么没有老师这样教过我呢?”而一些老大不小的绅士们则兴致勃勃地报名参加他的舞蹈班,他们竭尽全力地一手打着二拍、一手打着三拍,并认认真真地在教室里绕圈,当达克罗兹喊“跳”的时候,就立刻后退两步。他们的表现不免让班里的孩子们分心侧目。

的确,如果把70年的平均寿命撇在一边,我们每个人都能说出无限多的句子,这就像数学上存在无限多的整数一样。当你认为自己找到了最大的整数之后,只要加上个1,一个新的整数又出现了,所以句子的数量也一定是无限的。根据《吉尼斯世界纪录大全》(The Guinness Book of World Records)的记录,世界上最长的英文句子出自威廉·福克纳(William Faulkner)的小说《押沙龙,押沙龙!》(Absalom, Absalom!),该句长达1 300字。它的开头是:

They both bore it as though in deliberate flagellant exaltation ...

他俩都心甘情愿地承受它,如同宗教上的苦修……

然而,我完全可以用下面这个句子来打破这个纪录,为自己赚得不朽的名声:

Faulkner wrote, “They both bore it as though in deliberate flagellant exaltation ...”

福克纳写道:“他俩都心甘情愿地承受它,如同宗教上的苦修……”

但这个名声很快就会化为过眼云烟,因为别人可以用下面这个句子打败我:

Pinker wrote that Faulkner wrote, They both bore it as though in deliberate flagellant exaltation ...

平克写道,福克纳写道:“他俩都心甘情愿地承受它,如同宗教上的苦修……”

当然,这个纪录也会旋即被人打破:

Who cares that Pinker wrote that Faulkner wrote, They both bore it as though in deliberate flagellant exaltation … ?

谁在乎平克写道福克纳写道“他俩都心甘情愿地承受它,如同宗教上的苦修……”?

以此类推,这种“句子接力”可以永远继续下去。“有限域的无限应用”是人类大脑的一个特性,能使之区别于日常生活中的所有人工语言设备,比如会说话的玩具娃娃、能够提醒你关上车门的汽车以及声音甜美的电子语音信箱(“更多选择请按#号键”),它们依靠的都是固定列表中的预设语句。

语法构造的第二个后果是,它是一个独立自主、与认知无涉的代码。语法只告诉我们应该如何组合文字来表达意义,而这些规则与人们相互之间传达的具体意义无关。因此,我们常常会有这种体会:虽然一些句子并不符合英语的语法规则,但我们却可以从常识上理解它们。下面就是一些例句,虽然它们在语法上有问题,但意思却非常好懂:

Welcome to Chinese Restaurant. Please try your Nice Chinese Food with Chopsticks: the traditional and typical of Chinese glorious history and cultual.

欢迎来到中国餐馆。请用筷子品尝美味的中国菜肴:它代表了中国的辉煌历史和传统文化。

It’s a flying finches, they are.

它是一群飞雀。

The child seems sleeping.

这孩子好像睡着了。

Is raining.

正在下雨。

Sally poured the glass with water.

莎莉倒了一杯水。

Who did a book about impress you?

这本让你印象深刻的书是谁写的?

Skid crash hospital.

车辆打滑撞进了医院。

Drum vapor worker cigarette flick boom.

锅炉工人扔掷的烟头引发了爆炸。

This sentence no verb.

这个句子没有动词。

This sentence has contains two verbs.

这个句子包含两个动词。

This sentence has cabbage six words.

这句话删掉了6个字。

This is not a complete. This either.

这个不完整,那个也是。

这些句子都“不合语法”,但它们的问题与课堂上教授的分裂不定式(split infinitives)、悬垂分词(dangling participles)等语法错误无关,而是表现为这样一种现象:尽管这些句子的意思很好理解,但每个说英语的人都能下意识地判断出它们存在这样或那样的毛病。因此,所谓的“不合语法”,只不过是相对于我们头脑中用来翻译句子的固定代码而言的。面对一些语法不通的句子,我们有时会猜测它们的意思,但却不敢肯定我们的理解就符合说话者的本意。在这个问题上,计算机表现得更加苛刻,一旦碰到不合语法的句子,它就回答:“SYNTAX ERROR”(句法错误),以表示自己的不满,例如:

> PRINT(x + 1

*****SYNTAX ERROR*****

反之亦然,一些句子虽然毫无意义、不知所云,但却符合语法标准。乔姆斯基曾经杜撰过一个经典的句子,这也是他唯一一句入选《巴特利特引语词典》(Bartlett’s Familiar Quotations)的名言:

Colorless green ideas sleep furiously.

无颜的绿色念头狂怒地睡着。

这个特意杜撰的句子表明,语法和语义是相互独立的。不过,在乔姆斯基之前,已经有许多人意识到了这一点。流行于19世纪的“谐趣诗文”(nonsense verse and prose)就是以此为创作技巧的。下面是著名谐趣大师爱德华·李尔(Edward Lear)的两句诗:

It’s a fact the whole world knows,

That Pobbles are happier without their toes.

全世界都知道这回事,

没有脚趾头的泡泡更快乐。

马克·吐温也曾戏谑地模仿过一些作家笔下过于浪漫的景色描写,以讽刺那些文字的华而不实:

It was a crisp and spicy morning in early October. The lilacs and laburnums, lit with the glory-fires of autumn, hung burning and flashing in the upper air, a fairy bridge provided by kind Nature for the wingless wild things that have their homes in the tree-tops and would visit together; the larch and the pomegranate flung their purple and yellow flames in brilliant broad splashes along the slanting sweep of the woodland; the sensuous fragrance of innumerable deciduous flowers rose upon the swooning atmosphere; far in the empty sky a solitary esophagus slept upon motionless wing; everywhere brooded stillness, serenity, and the peace of God.

这是10月上旬一个清新宜人的早晨。丁香花和金链花沐浴着秋日的艳阳,灼灼其华,在半空中显露出它们鲜丽夺目的容颜,这是慷慨的大自然为那些没有翅膀的野生生灵架起的一座仙桥。这些生灵在树梢结巢,常在那里聚首。顺着一望无际、布满蓁莽的斜坡,落叶松和石榴树像燃烧着的紫色和蓝色的烈焰;落英缤纷,升腾起醉人的芳香,让人目眩神迷。在虚空深处,一根孤寂的食管安睡在静止的一侧;主宰四野的是沉寂、宁静与和平之神。

而且,几乎所有人都见识过刘易斯·卡罗尔(Lewis Carroll)在《爱丽丝镜中奇遇记》(Through the Looking-Glass and What Alice Found There)中写的《蛟龙杰伯沃基就诛记》:

And, as in uffish thought he stood,

The Jabberwock, with eyes of flame,

Came whiffling through the tulgey wood,

And burbled as it came!

One, two! One, two! And through and through

The vorpal blade went snicker-snack!

He left it dead, and with its head

He went galumphing back.

“And hast thou slain the Jabberwock?

Come to my arms, my beamish boy!

O frabjous day! Callooh! Callay!”

He chortled in his joy.

’Twas brillig, and the slithy toves

Did gyre and gimble in the wabe:

All mimsy were the borogoves,

And the mome raths outgrabe.

沉湎于冥思兮蚊龙乃出,

彼名杰伯沃基兮其目喷焰。

狂飙起兮彼出于丛林,

凛凛然兮天地为之抖颤。

挥刀而斩兮殊死之斗,

利刃闪闪兮直贯其首。

弃其尸于野兮凯歌高奏,

勇士归兮手提其头。

投身于吾怀兮勇哉吾子,

杰伯沃基乃汝所诛。

荣哉此时兮万岁!万岁!

彼拥其子而欢呼。

风怒兮阴霾满空,

滚滚兮布于西方。

雾霭范卓兮翻腾,

怒号兮直达上苍。

正如主人公爱丽丝所说:“它使我头脑里充满了各种各样的想法,只不过我说不清楚到底是怎么回事罢了。”虽然各种常识或知识背景都无法帮助我们理解这些诗句,但说英语的人都看得出,这些句子完全符合英语语法。凭借心里的语法规则,他们能够从中提炼出虽然抽象、但却八九不离十的大意。例如爱丽丝推测说:“不管怎么说,反正是什么人杀了什么东西。这一点我敢肯定。”在看过《巴特利特引语词典》中的乔姆斯基语录后,每个人都可以回答如下一系列问题:“什么东西在睡觉?它是怎么睡的?是一个东西在睡还是几个东西在睡?这些想法是什么样的?”


如何通过语法组合文字

潜藏于人类语言之下的语法到底是如何组合文字的?迈克尔·弗莱恩(Michael Frayn)在他的小说《罐头人》(The Tin Men)中提供了一种最简单的解释:按序排列。小说的主人公是某个自动化研究所的工程师,他必须设计出一个能够生成各种类似新闻故事的计算机系统,例如像“瘫痪女孩决心重返舞台”这样的励志报道。以下是他手工测试程序的情景,这个程序专门用来构造各种以皇室仪式为背景的故事:

他打开档案柜,从中挑出第一张卡片。上面显示“Traditionally”(传统地)一词。接下来就是在“coronations”(加冕)、“engagements”(约会)、“funerals”(葬礼)、“weddings”(婚礼)、“comings of age”(成年)、“births”(出生)、“deaths”(死亡)、“churching of women”(安产感谢礼)等卡片中随机抽取一张。昨天他选择的是“funerals”,随之被准确地引导到一张内容为“occasions for mourning”(哀悼的场合)的卡片上,今天他闭上眼睛,抽到了“weddings”,并被引导到一张内容为“occasions for rejoicing”(欢庆的场合)的卡片上。

接下来的逻辑选择是“The wedding of X and Y”(X与Y的婚礼),然后他面临两个选择:一个是“is no exception”(没有特别之处),一个是“is a case in point”(是一次特别的婚礼),而无论选择哪一个,后面都可以接“indeed”(事实上)。的确,无论以哪一种场合开头,比如加冕、死亡或者出生,戈德瓦塞尔(Goldwasser)都能以计算的方式轻松应对,但现在他也遇到了同样的瓶颈。他在“indeed”上停顿了下来,然后紧接着抽出了一张卡片,内容是:“it is a particularly happy occasion, rarely, and can there have been a more popular young couple”(这是一次特别欢乐的场面,真是难得一见,没有比他们更受大家喜爱的一对新人了)。

在接下来的选择中,戈德瓦塞尔抽到的是“X has won himself/herself a special place in the nations affections”(X已赢得了全国的民心),这使得他(或她)再接再厉,而“英国人民也已经从心里接纳了Y” 。

戈德瓦塞尔惊讶地发现, “fitting”(合适)一词还没有出现,这让他感到有些不安。但紧接着他就抽到了这张卡片:“it is especially fitting that”(特别合适的是)。

这个结果将他引导到“the bride/bridegroom should be”(新娘或新郎应该)这张卡片上。接下来他有大量的卡片可选:“of such a noble and illustrious line”(出自如此的名门望族)、“a commoner in these democratic times”(生于民主时代的平民家庭)、“from a nation with which this country has long enjoyed a particularly close and cordial relationship”(来自与本国长期保持着深厚友谊的国家)、“from a nation with which this countrys relations have not in the past been always happy”(来自一个与本国存在历史摩擦的国家)。

戈德瓦塞尔觉得,在上一次编造故事时,“fitting”一词的表现相当不错,因此他特意再次挑选了它,卡片的内容是“It is also fitting that”(也很合适的是)。紧接着出现的是“we should remember”(我们应该记住的是)和“X and Y are not merely symbols—they are a lively young man and a very lovely young woman”(X和Y不仅仅是两个符号——他们还是一对充满朝气、活泼可爱的年轻人)。

戈德瓦塞尔闭上眼睛,抽了下一张卡片,内容是“in these days when”(在……的日子里)。他沉思了一下,考虑是应该选“it is fashionable to scoff at the traditional morality of marriage and family life”(对传统的婚姻和家庭观念的嘲弄蔚然成风),还是选“it is no longer fashionable to scoff at the traditional morality of marriage and family life”(对传统的婚姻和家庭观念的嘲弄已经不再时髦)。戈德瓦塞尔决定选择后者,因为它的结构更加华丽繁复。

这台设备的学名叫“有限状态机”(finite-state)或“马尔可夫模型”(Markov model),不过我们姑且把它称为“字串机”(word-chain device)。这台机器拥有一大批词语列表(或者预设短语),以及一套在各个列表之间进行对应、筛选的操作规则。它的处理器会先在某个列表中选择一个单词,然后在另一个列表中再选择一个单词,依次类推,最终制造出一个句子。如果要理解他人说出的句子,这台机器只能以列表为参照,依次核对句中的每个单词。像弗莱恩这样的讽刺作家经常拿字串系统开涮,把它视为一种可以自动生产赘语冗辞的工具,例如有一种所谓的“社会科学术语生成器”(Social Science Jargon Generator),读者只需依次从以下三栏中各选出一个词,便可组成像归纳性聚合式相互依赖“inductive aggregating interdependence”这样听起来冠冕堂皇的术语。



最近我见过一台字串机,它可以自动生成书封上的宣传广告,另外还有一台字串机能够替代鲍勃·迪伦(Bob Dylan)编写歌词。

字串机是最为简单的一种离散组合系统,它可以从一组有限的元素中创建出无限的特定组合。尽管它的表现略显拙劣,但一台字串机可以生成无限数量的符合语法的英文语句,例如,一些最为简单的句式:“A girl eats ice cream”(一个女孩吃着冰激凌)或“The happy dog eats candy”(这只欢快的狗吃着糖果)。


这种句式包含着无限个句子,因为“happy”上的循环箭头标志着字串机可以任意重复“happy”一词的次数,例如“The happy dog eats ice cream”“The happy happy dog eats ice cream”等,以至于无穷。

当工程师准备建立一套符合特定顺序的字词组合系统时,他首先想到的必然是字串机。电话查询台的语音录音就是一个很好的例子,它事先录下10个数字的读音,并且每个数字的读音又分作7个音调(位于电话号码首位的数字是一个音调,位于第二位的数字又是一个音调,以此类推)。有了这70个录音,它就可以播报出1 000万个电话号码,再加上3位数的区号所产生的30个录音,一共可以组合成上亿个电话号码(不过在实际生活中,由于各项规定的限制,许多号码并不会被用到,比如说0和1不能作为电话号码的第一位数)。事实上,已经有人付出了极大的努力,希望为英语构建出一套巨大的字串模型。为了使它尽可能地符合现实情况,设计者将各个单词之间的转移情况与它们在英语中的衔接概率进行了匹配,例如“that”一词后面紧跟“is”的概率要大于“indicates”。研究人员通过两种方法建立了一个庞大的“跃迁概率”(transition probability)数据库:一是借助计算机对大量英语文献进行分析;二是向参加试验的志愿者播报一个或一系列单词,然后询问他们第一时间联想到的是哪个单词。一些心理学家表示,人类语言其实就是一个储存在大脑中的巨型字串。这个看法与“刺激-反应”理论不谋而合:一个刺激引发一个反应,在这里,反应就是嘴里说出的某个单词,而当说话者察觉到自己的反应时,这个反应又转变为新的刺激,引发他做出下一个反应,即说出后面的单词。

但事实上,正如弗莱恩在小说中描写的那样,字串机的工作原理是那么的拙劣可笑,这不能不引起我们的怀疑。如果将我们的语言机制看成一台字串机,那就等于说我们的大脑是如此的盲目无知、缺乏创意,以至于一台简单的机器就可以制造出无穷无尽且足以以假乱真的例句。而弗莱恩的小说之所以显得异常幽默,正是因为我们的语言机制与字串机并非一回事。所有人都相信,人类(包括社会学家和记者在内)并不是真正意义上的字串机,二者之间只不过是有几分相似而已。

然而,乔姆斯基认为,字串机理论不仅仅是一个值得怀疑的看法,在人类语言机制的问题上,它其实犯了一个根本性的错误。由此,乔姆斯基拉开了现代语法研究的序幕。在他看来,虽然字串机也属于离散组合系统,但它与语言机制有着根本区别。以下是它存在的三个问题,而这三个问题也恰好反映了语言机制的三个特性。

首先,一个英文句子与一串根据跃迁概率连接起来的英文单词截然不同,例如乔姆斯基的句子“Colorless green ideas sleep furiously”。乔姆斯基杜撰这个句子的目的,不仅是为了表示毫无意义的句子也可以符合语法,他同时还想说明,那些概率极小的字序连接也可以符合语法。在英语文本中,单词“colorless”之后紧跟“green”的概率显然为零。“green”之后紧跟“ideas”的概率也为零,再如“ideas”之后紧跟“sleep”,“sleep”之后紧跟“furiously”等,莫不如此。尽管如此,这一串文字仍然算得上是一个语法精当的英语句子。相反,如果一个人真的只根据跃迁概率来串联字词,他得出的字串恐怕会毫无语法可言。例如,假设你采用的方法是根据前4个单词来推测下一个最可能出现的单词,由此逐字逐词地生成一个字串,其中每个单词的出现都取决于它前面的4个单词,其 结果是:你将看到一堆莫名其妙的英语单词,而非一个英文句子。例如:“House to ask for is to earn our living by working towards a goal for his team in old New-York was a wonderful place wasn’t it even pleasant to talk about and laugh hard when he tells lies he should not tell me the reason why you are is evident.”

英文语句与英语字串的区别让我们明白了两个道理。第一,在学习语言的时候,人们学习的是如何将字词合理地排列,而不是机械地记住其前后顺序。人们是通过词性(如名词、动词等)的搭配原则来实现这一点的。换言之,我们之所以可以辨认出“colorless green ideas”这个短语,是因为它在形容词和名词的搭配上与“strapless black dresses”(无肩带的黑色裙子)这样的常见短语完全一致。第二,名词、动词和形容词的搭配并不是以首位相接的形式连成一串的,在句子的构建过程中,存在着一个整体蓝图或者框架,为每个单词设定了具体的安放位置。

如果字串机拥有足够的智慧,它或许可以解决这些问题。但乔姆斯基已经明确地驳斥了将人类语言视为字串的观点。他证明说,即使从理论上说,某些英语句型也无法由字串机来完成,无论这台字串机的功能有多强大,也无论它是否完全以概率表为准则。例如下面这两个句子:

Either the girl eats ice cream, or the girl eats candy.

这个女孩要么吃冰激凌,要么吃糖果。

If the girl eats ice cream, then the boy eats hot dogs.

如果这个女孩吃冰激凌,这个男孩就吃热狗。

乍看之下,这两个句子似乎很容易分解:


但字串机对此束手无策。在一个句子中,“Either”之后必须连接以“or”引起的分句,没有人会说“Either the girl eats ice cream, then the girl eats candy”。同样,“if”之后跟随的是“then”,没有人说“If the girl eats ice cream, or the girl likes candy”。但是,要满足句中早先出现的单词与稍后出现的单词之间的对应关系,字串机必须在逐字炮制句子的同时记住早先出现过的单词。而这就是问题所在:字串机是一个“健忘者”,它只能记住自己刚刚选取的单词列表,而无法记住之前的内容。当字串机运行到“or”或者“then”列表时,它根本记不清句子的开头到底是“if”还是“either”。当然,我们可以从制高点的位置居高临下地鸟瞰整个“路线图”,记住这台字串机在第一个岔口上所选择的道路;但对于在列表之间匍匐前进的字串机而言,要记住自己之前走过的道路却是不可能的事情。

或许你认为这只是一个很简单的问题,我们只须对字串机进行重新设计,让它可以记住自己先前选择的内容,例如,这台字串机能够将单词“either”和“or”以及它们中间可能出现的字序组合成一个大序列,再将“then”和“if”以及它们中间的字序组合成另一个大序列,然后再进行第三个序列的生成。例如:


然而,这一解决方案存在非常明显的问题:它产生出三个相同的“子网”(subnetwork)。显然在现实语境中,无论人们在“either”和“or”之间插入什么内容,它们都同样可以插入“if”和“then”之间,也可以插入“or”或“then”之后。但是,人类的这种能力乃是出自大脑语言机制的自然设计,而并非依赖于某位设计者精心编写的三组相同的指令集(或者貌似更加合理的是,儿童在学习该句的句式时必须分三次进行,先是“if”和“then”之间的序列,然后是“either”和“or”之间的序列,最后是“then”和“or”之后的序列)。

不过,乔姆斯基对这个问题看得更深。他表示,以上两个句子都可以嵌入其他任何句子之中,甚至包括它们自己在内:

If either the girl eats ice cream or the girl eats candy, then the boy eats hot dogs.

如果这个女孩要么吃冰激凌要么吃糖果的话,那么这个男孩就吃热狗。

Either if the girl eats ice cream then the boy eats ice cream, or if the girl eats ice cream then the boy eats candy.

如果这个女孩吃冰激凌,那么这个男孩要么吃冰激凌,要么吃糖果。

就第一个句子而言,字串机必须分别记住“if”和“either”,然后才能在稍后的过程中依次选择“or”和“then”。就第二个句子而言,它必须分别记住“either”和“if”,然后才能选择“then”和“or”来完成句子。从理论上说,位于句子开头部分的“if”和“either”的数量可以无限多,而每个“if”或“either”都需要一个“then”或“or”来完成句子。因此,分别列出每一个可供记忆的字串序列其实并没有多大意义,你必须为此记住无限个字串,而这显然超出了我们大脑的容量。

这种学术性的论证可能会让你颇感诧异。在现实生活中,没人会说出以“Either either if either if if”开头的句子,因此谁又会在乎这台语言机制的模拟装置是否能用“then…then…or…then…or…or”来完成句子呢?不过,乔姆斯基只是借用了数学家的研究方法,他将“either-or”与“if-then”的交替现象视为一种最简单的语言特性,即前后单词的“长距离依存关系”(long-distance dependencies),以便从数学上证明字串机无法处理这些依存关系。

事实上,这种依存关系在语言中比比皆是。人们时时刻刻都在用它,不但距离超长,而且经常一次数个,但字串机却做不到这一点。例如,语法学家常常用这个以5个介词结尾的句子为例:Daddy trudges upstairs to Junior’s bedroom to read him a bedtime story. Junior spots the book, scowls, and asks, “Daddy, what did you bring that book that I don’t want to be read to out of up for?”(父亲步履蹒跚地爬上楼,来到孩子的卧室,只为给孩子读一个睡前故事,孩子看见书,皱着眉头问道:“爸爸,你怎么把这本我不想听的书带上来了呢?”)这个孩子在说到“read”一词时,已经在脑海中形成了4个依存关系:“read”与“to”、“that book that”与“out of”、“bring”与“up”、“what”与“for”。不过,下面这个源于现实生活的例子或许更能说明问题,它出自某位读者写给《电视指南》(TV Guide)的一封信:

How Ann Salisbury can claim that Pam Dawber’s anger at not receiving her fair share of acclaim for Mork and Mindy’s success derives from a fragile ego escapes me.

·索尔兹伯里说,帕姆·道伯之所以没有因《默克与明蒂》的成功获得应有赞誉而生气,是源于她脆弱的自我。我不明白她为什么这样说。

显然,这位写信者在写到“not”时,脑海中一定形成了4个需要完成的语法结构:(1)“not”之后需要接动词的“-ing”形式(“her anger at not receivingacclaim”);(2)“at”之后需要接名词或动名词(“her anger at not receiving acclaim”);(3)单数主语“Pam Dawber’s anger”规定了它的动词(即其后第14个单词)也必须保持单数形式(Dawber’s anger…derives from);(4)以“How”开头的单数规定了它的动词(即其后第27个单词)也必须保持单数形式(How …escapes me)。同样,读者在理解这个句子时,也需要将这些依存关系牢记于心。从技术上讲,我们可以制造出一个能够处理这些句子的字串机,只要说话者需要记住的依存关系在数量上有具体的限度(比如说4个)。但是,这台机器的冗余度将大得不可思议,因为面对每一种依存组合,这台机器都必须对同一个字串进行重复复制,而这种依存组合的数量多达千计。即使耗尽我们的大脑,也无法记住这样的超级字串。


只有上帝才能造出一颗树

像字串机这样的“人工组合系统”与人类大脑这样的“自然组合系统”之间有着明显的区别,这种区别可以用乔伊斯·基尔默(Joyce Kilmer)的一句诗来概括:“只有上帝才能造出一棵树。”一个句子并不是一串字,而是一棵树。在人类的语法中,不同的单词被组合成一个个短语,就像树枝会合成树杈。这些短语都被赋予了名称,成为一个心理符号,而小的短语也可以组合成大的短语。

以“The happy boy eats ice cream”(这个快乐的男孩吃着冰激凌)为例:句首的三个单词“the happy boy”组成了一个名词短语。在英语中,名词短语(NP)是由一个名词(N)、一个前置冠词或限定词(det)以及若干个形容词(A)构成的,其中的限定词并非必要选项。这一描述可以用英语名词短语的定义规则来表示。根据语言学的标准记录法,箭头的符号表示“由……构成”,双括号表示“可有可无”,星号表示“数目不限”。不过,我之所以搬出这些规则,是为了说明所有语法信息都能用简单的符号来概括,你完全可以忽略这些记录法,只要看它下面的翻译文字就行:

NP →(det)A* N

一个名词短语是由一个可有可无的限定词、数目不限的形容词以及一个名词构成的。

这一规则可以用一个倒置的树来表示:


此外还有两个规则:一个用来定义英文句子(S),另一个用来定义谓语或动词短语(VP),它们都以名词短语为主要成分:

S → NP VP

一个句子是由一个名词短语加上一个动词短语构成的。

VP → V NP

一个动词短语是由一个动词加上一个名词短语构成的。

现在,我们需要的是一部心理词典,以确定每个词的词性归属(名词、动词、形容词、介词或限定词):

N → boy,girl,dog,cat,ice cream,candy,hot dogs

名词列表包含以下单词:boy(男孩)、girl(女孩)……

V → eats,likes,bites

动词列表包含以下单词:eats(吃)、likes(喜欢)、bites(咬)……

A → happy,lucky,tall

形容词列表包含以下单词:happy(快乐的)、lucky(幸运的)、tall(高)……

det a,the,one

限定词列表包含以下单词:a(某个)、the(这个)、one(一个)……

以上我所列出的这套语法规则被称为“短语结构语法”(phrase structure grammar),它通过将单词组合为短语来构成句子的各个分支,其形状就像一棵倒置的树:


这一看不见的超级结构其实是一个功能强大的设计,它负责将各个单词安放到适当的位置,且能够避免字串机带来的问题。该设计的核心要义是:这棵“树”是模块化的,就像电话插孔或者水管接头,诸如NP之类的符号就像一个个连接插头或者某种形状的配件。根据这套设计,一个组件(短语)能够轻松地插入另一个组件(更大的短语)的任意部位。一旦某类短语被语法规则所定义,并由此获得了一个类似插头功能的符号,它就无须再被定义。这类短语可以插入任何一个与其匹配的插座。例如,在上文列举的简单语法规则中,符号“NP”既可以充当句子的主语(S → NP VP),也可以充当动词短语的宾语(VP→ V NP),而在更具现实性的语法规则中,它也可以充当介词的宾语(near the boy),或者出现在领有短语之中(the boy’s hat)。此外,它还可以充当间接宾语(give the boy a cookie),或者用于句子的其他部分。这种“即插即用”的设计安排解释了人们为什么能够在句子的多个不同部位使用相同的短语。例如:

[The happy happy boy] eats ice cream.

这个快快乐乐的男孩吃着冰激凌。

I like [the happy happy boy].

我喜欢这个快快乐乐的男孩。

I gave [the happy happy boy] a cookie.

我给了这个快快乐乐的男孩一块饼干。

[The happy happy boy]’s cat eats ice cream.

这个快快乐乐的男孩的猫吃着冰激凌。

我们完全没有必要在懂得了“名词前面(而非后面)加上形容词可以构成主语”之后,再去学习什么样的名词和形容词可以构成宾语、间接宾语或领有短语。

还须注意的是,这种短语和插槽之间随意耦合的特点使得语法具有了自治性,它并不在乎字句的意义是否符合常理。由此可以解释的是,我们为什么能够写出并欣赏那些虽然合乎语法,但却不知所云的句子。我们的简单语法规则定义了各种诸如“colorless green”(无颜的绿色)之类的句子,例如:“The happy happy candy likes the tall ice cream”(这颗快快乐乐的糖果喜欢这个高大的冰激凌),并可以用来传递一些具有新闻价值的信息,例如“The girl bites the dog”(这个女孩咬了狗)。

最为有趣的是,这种短语结构的树状分支可以为整个句子的记忆和设计提供一个总体架构,这使得我们能够轻松地处理“if …then”“either …or”等嵌套式的长距离依存关系。你所需要的只是一个短语规则,这个规则中包含一个完全相同的短语类型,例如:

S → either S or S

一个句子可以由单词“either”加上一个句子,再加上单词“or”,再加上另一个句子构成。

S → if S then S

一个句子可以由单词“if ”加上一个句子,再加上单词“then”,再加上另一个句子构成。

这些规则是在一个符号中嵌入一个与之相同的符号(此处是在一个句子中嵌入另一个句子)。这种巧妙的方法可以生成无穷无尽的结构,逻辑学家称之为“递归”(recursion)。句中的各个片段井然有序地组合在一起,就像由同一个节点生长出来的不同分支。这个节点将每一组对应的“either”与“or”“if”与“then”连在一起,就像下面的三角形代表了许许多多的下层分支,如果充分展开的话,我们一定会被弄得晕头转向。


还有另一个理由让我们相信,每个句子都由一棵“心理树”(mental tree)组合而成的。到目前为止,我一直都在谈论将单词串连成句子的语法规则,而无视它们的含义。但是,在将单词组成短语的过程中,我们也必须将句子的语法规则与具体含义联系起来,而这则属于心语的内容。我们知道上面这个句子说的是一个女孩(而不是男孩)在吃冰激凌,一个男孩(而不是女孩)在吃热狗。我们还知道,男孩吃什么样的零食取决于女孩所吃的零食,而不是反过来。我们之所以知道这一切,是因为“女孩”和“冰激凌”、“男孩”和“热狗”被分别置于各自的短语中,而句中两个提及“女孩”的分句也被放置于一个短语中。一台字串机只懂得从前到后地逐字拼凑句子,但短语结构语法却使得单词之间的树状关联反映出心语中各个观念之间的相互关系。对人类来说,要将大脑中相互关联的种种想法和盘托出,并将其编码为一串发乎声、表于言的语链,这不能不说是一个工程问题,而短语结构正是这一问题的解决之道。

要弄清这一隐性短语结构如何决定了句子的含义的问题,我们不妨回顾一下第2章的内容。我们在第2章中谈到了“语言”有别于“思想”的一个具体原因:一个特定的语句可以表达出两种截然不同的意思。比如在“Child’s Stool Is Great for Use in Garden”这个例句中, “stool”一词就有两个含义,并因此与心理词典中的两个条目形成对应关系。但有时,即便句子中的每个单词都只有一个含义,整个句子也可能表达出两种不同的意思,例如格劳乔·马克斯(Groucho Marx)在电影《疯狂的动物》(Animal Crackers)中的一句台词:“I once shot an elephant in my pajamas. How he got into my pajamas I’ll never know.”(我曾在睡衣里射杀了一头大象,至于它是怎么跑到我睡衣里来的,我就不知道了。——此句也可以理解为:我曾射杀了一头穿着我睡衣的大象,至于他是怎么跑到我睡衣里来的,我就不知道了。)以下是从报纸上摘录的一些类似的歧义句:

Yoko Ono will talk about her husband John Lennon who was killed in an interview with Barbara Walters.

小野洋子将在接受芭芭拉·沃尔特斯的采访时谈及遇刺身亡的丈夫约翰·列侬。——也可以理解为:小野洋子将谈及在接受芭芭拉·沃尔特斯的采访时遇刺身亡的丈夫约翰·列侬。

Two cars were reported stolen by the Groveton police yesterday.

据格罗夫顿警方报告,昨天有两辆汽车被盗。——也可理解为:据报道,昨天有两辆汽车被格罗夫顿警方偷走。

The license fee for altered dogs with a certificate will be $3 and for pets owned by senior citizens who have not been altered the fee will be $1.50.

老年人为已经去势的犬类办理许可证的费用为3美元,为尚未去势的宠物办理许可证的费用为1.5美元。——也可理解为:尚未去势的老年人为已经去势的犬类办理许可证的费用为3美元,为其他宠物办理许可证的费用为1.5美元。

Tonight’s program discusses stress, exercise, nutrition, and sex with Celtic forward Scott Wedman, Dr. Ruth Westheimer, and Dick Cavett.

今晚的节目是与凯尔特人队前锋斯科特·威德曼、露丝·魏斯太摩博士和狄克·卡维特探讨压力、锻炼、营养以及性方面的问题。——也可以理解为:今晚的节目是探讨压力、锻炼、营养以及与凯尔特人队前锋斯科特·威德曼、露丝·魏斯太摩博士和狄克·卡维特做爱等问题。

We will sell gasoline to anyone in a glass container.

我们将用玻璃容器销售汽油。——也可以理解为:我们将把汽油卖给玻璃容器里的人。

For sale: Mixing bowl set designed to please a cook with round bottom for efficient beating.

出售搅拌碗,它拥有适合高速搅拌的圆形底部,这一设计令厨师爱不释手。——也可理解为:出售搅拌碗,它的设计令屁股浑圆、适合高速摆动的厨师爱不释手。

以上每个句子都有两种解释,它们分别源于句中单词所构成的不同树形图。以“discuss sex with Dick Cavett”(与迪克·卡维特谈性)为例,作者在写下这一短语时,是按照左边的树形来组装文字的(PP表示介词短语),性是讨论的对象,而且是与迪克·卡维特一起谈论的对象。


而另一种意思则源于右边的树形结构“sex with Dick Cavett”被视为一个单独的分支,因此,“与迪克·卡维特做爱”成了讨论对象。


    如果觉得文章对您有帮助,请转发此内容或关注公众号“高度决定眼 界”,里面有更多精彩内容。

图标 相关资讯