语言共性:一场殊途同归的进化

麻省理工学院的科学家们发现了一种新的“语言共性”。这个发现为乔姆斯基备受争议的普遍语法理论提供了依据。

麻省理工学院的科学家们发现了一种新的“语言共性”。这个发现为乔姆斯基备受争议的普遍语法理论提供了依据。

世界上的语言缤纷多彩,形式各样,犹如圣经中提到的“巴别塔”。关于各国语言是否都具有共性这个问题的争议由来已久,不同的声音此起彼伏。美国国家科学院院刊(PNAS)的一篇论文描绘了一种新的“语言共性”( language universals),即句子中相关联的概念会尽可能保持最近的距离,这样可以降低理解句子含义的难度。所有的语言都以这样一种方式组织语句的。

“语言共性”的提出有助于揭示人类认知的相关难题。各种语言共性为人类认知提供了新的角度。其最知名的支持者是诺姆·乔姆斯基。乔姆斯基认为,所有的语言都共享一套“普遍语法”(universal grammar),也称为原则与参数理论。普遍语法是人类所特有的语言知识体系,存在于正常人的大脑中。普遍语法包括一套普遍原则,利用这些原则,可以不断合成短语,同时也可以限制格条件原则过于强大;普遍语法还含有一系列参数,这些参数可以帮助和指导普遍原则更好地实施。这种普遍属性是基因遗传的结果,人的大脑中可能存在专门为语言服务的机制。

然而,一些研究人员认为关于语言共性存在的证据少之又少。从句子结构到人们用嘴说出来(不包括手语),每一个层面上都可能存在巨大的差异。没有一种真实的语言共性,就难以证明语言是一种特殊的认知程序。

这篇论文中,研究者用大量笔墨描绘了语言的这种倾向性:语法和语义关系紧密的词在句子中的位置会尽可能贴近。

事实上,句子里相关联的概念在距离上越接近,对于工作记忆的压力就越小。例如,形容词“老”(old)和名词“太太”(lady)两者关系很近,如果句子中将这两个词放在一起,那么很容易就能理解“老太太”这个整体概念了。

“约翰扔出去了厨房里陈旧的垃圾”(John threw out the old trash sitting in the kitchen)还是“约翰扔厨房的陈旧垃圾出去了”(John threw the old trash sitting in the kitchen out)?对于英语母语的人来说,第二个句子听起来怪怪的—因为人们习惯于把“扔”(threw)和“出去”(out)尽可能挨近放在一起。 这种缩减相关词在句中距离的过程叫做从属长度最小化(dependency length minimization,简称DLM)。

将概念不断地整合使句子更容易理解,每种语言都是这样进化的么?

研究人员建立了包含37种语言的样本数据库,对里面的语料进行研究和分析。根据DLM程度,数据库中每个句子都会被打分。句子中相关词之间的距离大小跟分数高低成正比,距离大则分数高,距离小则分数低。

研究人员将每个句子中的词序打乱,使得相关词之间距离呈随机分布。如果一种语言的DLM显著的话,那么实际句子中相关词的距离就会小于随机句子的距离,即实际句子的分数会显著低于随机句子的分数。

不出所料,研究者发现,语料库中的37种语言的从属长度都小于随机语言。在较长的句子中尤其明显。比如上文提到的两个句子——John threw out the trash和John threw the trash out,这两者DLM程度差别不大。而上文给出的更长的例句的DLM差别很明显。

不同语言之间DLM存在差异。德语和日语不只是靠词序来传达词之间关系,它们主要依靠各种格的标记来确定语义,而不是通过语序,使得它们的词序比英语更自由,因而它们并没有很显著的DLM。尽管如此,这些语言的得分仍是低于随机分数的。

建立一个语言数据库在实际操作过程中有很多困难。建立一个涵盖37种语言的语料库实属不易。尽管如此,有个问题还是回避不了:研究中的许多语言彼此之间都有联系,属于同一语系。所以还需开展更多关于语言相关性的研究,从不同语系中寻找样本,得出更科学更全面的结论。

热门文章HOT NEWS