千米小说网

千米小说网>牛津语料库 > 第五章 语言种类统计的一些问题(第1页)

第五章 语言种类统计的一些问题(第1页)

第五章语言种类统计的一些问题

在第二章中,我们比较了世界语言的使用人数,还比较了不同语系和地区的语言数目。两次比较的数据来源都是目前最权威的“民族语”,并且两次都假设计数方法相对清晰,计数行为意义深远。但事实上,这些默认的假设是否真正如此,远没有那么简单。

语言使用者的计算

说到语言使用者,有一点不得不提,那就是“民族语”中所列数据实际上是“世界范围内将该语言作为第一语言的使用者人数”。对一些“小”语种来说,这些数据的确可以反映该语言在现代人类中的重要程度,但有时候情况却没有那么简单。“民族语”所列的英语使用人数为3。28亿,这个数字将把英语作为第二(第三,等等)语言的1。67亿人全都排除在外了。印地语使用人数为1。82亿,这一数据也忽视了一个事实,即无论是使用人数还是使用频率,该语言的非母语使用者跟母语使用者均相差无几。

有的官方数据也考虑到了这些复杂情况。瑞士2000年的人口普查就问了两个语言相关问题:你最熟练掌握的语言是哪一种?你日常使用的是哪一种语言?以瑞士第四种官方语言罗曼什语为例,共有3。5万人称其为最熟练掌握的语言,“民族语”即采用了这一数字。但如果算上将其作为日常使用(居家、学校、办公)语言的人,这一数字会增加到6万,普查结果也提及了这一点。

在这方面,阿拉伯语的情况尤其复杂:将各种通俗阿拉伯语的变体全部相加,“民族语”所列数字为2。21亿人,尽管号称是阿拉伯世界第二大用于“教育、官方用途、文字材料以及正式演说”的语言,现代标准(书面)阿拉伯语也并未进入世界“最大”语言的榜单。同样地,因为伊斯兰教的关系,虽然很多人多多少少都会说点古典阿拉伯语,但该语言也未能进入榜单。因此,世界上到底有多少种语言?我们很难给出一个量化的确切答案,因为计数方法在很大程度上依赖于政治和社会因素。

数国旗

说到语言的数量,“民族语”的6909种显然不是一个准确数字,但说这话的前提是我们了解世界语言种类的计算原则。可能有人认为产生误差的原因跟其他普查差不多:可能“民族语”的计数员敲门的时候有的语言刚好“不在家”,或者是有些语言重名弄得我们很难确定它们到底是同一种还是好几种。但从理论上说,这些问题都可以解决,并且这样产生的误差应该不会很大。事实上,区别两种语言更多的是社会和政治因素,而非语言因素,并且“民族语”所列的很多数字所存在的更多是看法而非科学层面上的问题。

“民族语”的编者当然知道这些,他们在前言部分也对此有所说明。例如,关于语言个体的问题,他们提到:

语言的定义取决于定义语言的目的。有些人以纯粹语言学标准为依据,而有的人认为社会、文化和政治因素也应该被考虑在内。除此之外,关于到底什么才是语言独一无二的因素,语言使用者自身都有各自不同的看法。很多时候,相比语言因素,他们会更多考虑与传统和身份相关的因素。

但为了呈现数据,他们总得做些选择,而他们的选择也不无道理。有一点我们必须明确,他们的数据既非完全客观,也并非不可挑战。“6909”是看待世界语言多样性的一种方式,但同时也存在其他方式。本章的目标就在于考察造成这一问题困难重重的一些复杂因素。

已逝的马克斯·魏因赖希(MaxWeinreich)过去常说:“ashprakhizadialearmeyunaflot。”(所谓语言,不过就是拥有陆军和海军的方言)。他这话其实是在说意第绪语,因为没有与任何政治上的重大实体相联系,意第绪语长期以来都被认为是一种方言。把魏因赖希的妙语改一下,可以说:“所谓语言,不过就是拥有国旗的方言。”语言对应的是国家,而方言对应的是部落、城镇或是其他不太重要的群体。所谓欧洲“语言”和非洲“方言”,也存在这样一种暗示。语言要成为“语言”而不只是一种“方言”,通常都要具备国家、经济、文学传统、书写体系以及其他诸如权力、权威和文化等“配置”,纯粹的语言本身反而没那么重要。

例如,中国的广东话、客家话、上海话以及其他“方言”都属于汉藏语系,并且相互之间(尤其是同占支配地位的普通话相比)差异很大,如同罗曼语言中的法语、西班牙语、意大利语和罗马尼亚语之间的差别。这几种语言的使用者相互之间无法交流,但它们都属于“方言”,因为它们都与同一个国家相联系,共享一套书写体系,都在政府明确的政策规定中。同罗曼语言一样,可以将其细化为几个次级分组,归入不同的语系,主要部分见下页图8。这张地图只显示了最高级的语系分类,汉语普通话的使用范围覆盖了几个不同的次级分组。

汉语语言的不同之处涉及语言结构的方方面面,至少包括发音、音系、单词结构、句法和词汇。汉语的方块字对应词汇整体(或部分)而非直接对应其发音,从某种程度上来说,这种书写体系掩盖了上述语言结构的不同之处,发音不同的词在书写方式上完全相同。事实上,某些汉字只存在于某种语言中,书写体系并非如描绘的那般放之四海而皆准。但即便如此,在表达方式的多样性上,这一体系也比世界任何体系都更加包罗万象。

图8。中国汉语方言分布地图(大图请查看P202)

汉藏语言(普通话)——8。36亿(全世界);晋语(通常与普通话一组)——4500万;吴语——7700万;徽语(通常与吴语一组)——3200万;赣语——3100万;湘语——3600万;闽南话(包括台湾话)——6000万;客家话——3400万(全世界);粤语——7100万;平话(通常与粤语一组)——2000万)

虽说词汇只是语言的一个方面,但相对更容易呈现。为了说明汉语语言之间的差异,表6列出了一些日常词汇在不同语言中的差异。所有汉语语言的声调都各具特色,且发音与所标注音标也并非完全对应。表6没有呈现出来这些,但还是能帮读者大致了解汉语语言的差别到底有多大。

公认的“中文”(作为一个涵盖所有汉语语言的概念)其实建立在共享的书写体系、作为共通语的普通话的标准形式以及现代中国的政治统一体这些因素之上,单独的汉语方言没有各自的“国旗”“陆军”和“海军”。

相反,印地语和乌尔都语本质上属于同一体系(早先统称为“印度斯坦语”),但二者分属不同的国家(印度和巴基斯坦),拥有不同的书写体系和不同的宗教信仰。虽然在印度和巴基斯坦,受过良好教育的使用者之间的语言差异明显大于方言土语,但这种差别跟普通话和广东话的差别比起来仍然不大,甚至可以说是小巫见大巫。

表6 不同汉语语言词汇发音差异

这方面的一个极端例子是塞尔维亚-克罗地亚语(Serbo-)。该语言通常(直到20世纪90年代早期)被认为是一种单一语言,拥有不同的地方方言和书写体系,使用区域为南斯拉夫大部。塞尔维亚人(大部分属于东正教)使用西里尔字母,而克罗地亚人(大部分为罗马天主教)使用拉丁字母。南斯拉夫作为一个政治统一体,在分裂后的几年之内至少出现了四种新的“语言”(塞尔维亚语、克罗地亚语、波斯尼亚语和最近出现的黑山语)。但实际的语言学变化微乎其微,只是“陆军”和“海军”数量大幅增加了。

现在这四种语言都分别有自己的字典,虽然这些字典上的语言材料同先前的“塞尔维亚-克罗地亚语”并没有什么区别。塞尔维亚前总统斯洛博丹·米洛舍维奇曾因战争罪在海牙受审,按照程序,他要确认法庭已经用其母语宣读起诉书。他承认他能够理解起诉书中的指控,却否认法庭宣读使用了其母语。很显然,宣读人员带有波斯尼亚口音。

语言和方言

已完结热门小说推荐

最新标签