第二名汉语(普通话)
PǔTōNGHUà
13亿使用者
以汉语(普通话)为母语的人大约有9亿,比其他语言更多,此外还有4亿人以之为第二语言。中国大陆、中国台湾、新加坡和马来西亚是使用汉语(普通话)的主要国家及地区。过去,大多数华裔血统的移民使用普通话之外的其他汉语方言。今天,华人移民大多使用汉语(普通话)。
孔子自2004年以来,中国通过孔子学院积极推动汉语学习。截至2017年底,孔子学院在142个国家开办了516家分支机构。按该机构的说法,此前13年里,超过700万名学生修读了汉语言课程。从21世纪初以来,在这些机构之外,学汉语的受欢迎度也大有提升。
2汉语(普通话)
神奇的汉字
如果说,西班牙语是本书介绍的语言里最容易学的,汉语和日语恐怕要算最难学的。掌握汉语的声调,需要坚持不懈的努力,而错综复杂的日语敬语,也不太可能一下子就变成你的第二天性。然而,要不是因为它们书写系统复杂至极,它们大概不会跻身全世界最难学的语言之列。[1]在现代世界,再没有其他语言系统需要小学生和第二语言学习者去记忆更多的书写符号了。毫不夸张地说,汉字就像是围绕汉语的长城——诚然不是坚不可摧,但绝对叫人望而生畏。日语使用的字符尽管较少,但也找到了增加复杂性的巧妙方法,我们将在本章附录部分欣赏这一壮举。
如今,在西方的餐馆、报摊、互联网、包装材料,以及脖子、胳膊、脚踝、后背和人体其他部位(而且这种趋势越来越多)上,西方人很容易看到汉字的身影。用汉字文身却文出了意外的段子,这样的笑料早已众所周知:人们在他们的皮肤骄傲地宣称“疯狂腹泻”或者“棺材老兄”,还有一些人认为文字符毫无意义,或根本是上下颠倒。好在全世界绝大多数人看不出其中的差别。
我们当然没办法认识数百甚至上千个汉字(这需要几年的时间学习),但对其略知一二还是可行的。可不知什么原因,哪怕经过了数百年的接触,西方对中国文字的观念仍然为误解所缠绕。日语教授马歇尔·安戈(J。MarshallUnger)曾写过一本关于汉字的书,他说:“世界上恐怕没有哪门学科像汉字那样有这么多错误信息在传播,产生了那么多的误解。”让误解难以消除的关键在于,它们大多的的确确触及了真相的核心。我会首先提到这些核心,接着剥去不准确的外壳。
汉字(或日语)文身太容易搞错了。但上图是没问题的:这个字符的意思是“梦”或者“雄心”。
1。汉字书写是从上至下的
真实的部分:传统上,中文的确是按从上到下、从右到左的顺序书写的。如果没有纵向空间(比方说某些牌匾上),单行的文字也会从右往左书写。在今天的中国台湾、中国香港和海外华人社区,在报纸和书籍上从右向左纵向书写的方式仍不少见。采用这样排版的书籍,装订线也会在右侧,就跟阿拉伯语和希伯来语书籍一样。
在图书的书脊上,标题从上往下书写,每个字符的方向都是垂直的。这跟英语和其他欧洲语言的做法不同,后者的标题大多会旋转90度:英语、荷兰语和斯堪的纳维亚语的标题大多按顺时针旋转,但法语和西班牙语的标题则通常逆时针旋转,而德语似乎从来没拿准过主意。
但不只如此:如今,大多数中文都是从左往右横向书写和打印的。在中国大陆,别的顺序几乎找不到了;在其他地区,这种做法也越来越普遍。
2。汉字基本上就是图画
真实的部分:有些汉字是格式化的图画或物体,又或是相当直观地形象化表现概念。用不着太多的想象力,就能琢磨出“人”字表现的是一个人的两条腿,“二”字和它含义(两个)之间的关系。虽说不太明显,但我们很容易相信“木”字最开始是为了画出一棵树(这的确就是这个字的含义)的说法。另一些字符比较难以看出根源,比如“水”字。但有充分的历史证据表明,它最初的起源符号,是一条蜿蜒的河流,并以四点水滴或漩涡为装饰。
其他字符不是单一的象形文字或表意文字,而是两个或两个以上的偏旁合成。范例包括用两棵树(两个“木”)表示小树丛——“林”,三棵树表示“大树林”——森[2]。这一类字眼里经常拿来做例子的还有“休”,意思是“树荫”或“休息”:在树的左边,我们看见了“亻”(它是上面的“人”字符斜向一侧)。那么它想要表达的概念就是“人在树荫下休息”——这真是一个简洁而动人的解释,以至于许多专家认为它根本就是个故事。
现存为数不多的象形文字中蕴含着许多有趣的东西。据专家介绍,“蛋”的汉字“卵”所表现的东西,在阿拉伯语、俄语、西班牙语、德语和其他语言里都称作“子”(eggs),而在英语里称为“坚果”(nuts),但又不是从树上长出来的物体。
出于同样不太牢靠的研究,“母”字将“母亲”或“女性”的概念简化为一对立体派风格的胸部,并保留了完整的两颗**。又或者,从童稚领域来到数学,让我们猜猜“八”这个字为什么是这个样子。词源学家都同意,这个符号最初的意思是“分开”。有人声称,“八”也由此有了数字“8”的意思,因为这个数字太好分割了——它甚至能均分三次,因为8=23。这难道不是个十分可爱的解释吗?然而,主流学派认为,在历史上的某个时期,“分”和“八”的中文是同音字——也就是说,它们发音一样。
还有一个由两个象形符号组成的文字:兄(哥哥)。上面的方形是一个常见的元素,意思是“口”,而顶着它的两条腿,是“儿”字的变体。故此,“兄”就表示一个“有大嘴巴”的孩子。显然,在这个定义里,年长的兄弟就是对年幼弟妹发号施令的孩子。
但不只如此:绝大多数(大约98%)的汉字不是象形文字或类似的表意文字。不管你怎么使劲花时间观察它们,也无法根据任何跟现实生活中的相似之处琢磨出它们的意义。如果你能,那你只能感谢自己的创造力,因为它们并不是这么来的。
3。汉字已经存在了3500年
真实的部分:现存最古老的汉字铭文可追溯到公元前1500年,而自此以后,汉语的书面文字一直在发展,从未有过中断。故此,这么说是正确的:在中国,书写已经存在了3500年甚至更久。因为从最古老的出土文物可看出,它不是发明家试探性的不规则涂鸦,而是出自一位自信满满、使用成熟系统的书写者。
但不只如此:现代汉语读者无法理解这些古老的文字,因为最早的字符与今天完全不同(除了极个别的例外,比如“二”)。双方的差异大到在发现了最早的铭文之后,学者们用了好长一段时间才弄清它们代表了汉语书面文字。
但,且慢!如果汉语书面文字有着悠久且从未中断的传统,那么这本身不就证明了汉字已经存在了3500年的说法是正确的吗?没错,这是一种阐释方式。但要是按这种算法,拉丁文字存在的时间更长了——至少3800年,长可至5300年。这是因为拉丁字母从公元前1800年左右的近东地区(埃及或迦南)设计出第一套之后,同样未经中断地一直传承下来。第一套字母表主要由埃及象形文字(准确地说,由埃及象形文字里代表单个发音的一个小子集)构成。如果说象形文字可追溯到大约公元前3300年,照这样算,拉丁文字就有5300年的传承了。
诚然,这里有一点不同:在中国,书面文字和语言都经历了同一个逐渐发展的过程,而“我们”呢,这种说法只适用于书写系统。从埃及到近东、希腊、罗马,再到这本书,西方的书写传统从一种语言跳跃到另一种语言,甚至从一种语系跳跃到另一种语系,而且还跳跃了好几次。
4。汉字有50000个
真实的部分:50000这个数字,大概是根据1076年、1716年和1915年出版的3部著名字典计算出来的,它们每一部所包含的汉字都在47000~54000个。迄今为止,包含了最多数量汉字的出版物是2004年在中国台湾出版的《中华异体字字典》(DiaryofeseVariantForm),内中收录了多达106230个汉字。
但不只如此:这些字典里的许多字符仅在当地使用,或是特指高度专门化的含义,例如,只跟帆船匠人或者竹笛演奏者相关的字。还有一些字符是其他较常见字符的罕见或非常古老的写法。把它们都计算在内,就相当于说plough和plow(都是“犁”的意思)是两个不同的英文单词;thilke也是一个独立的单词,因为它在乔叟时代就存在了(它跟ilk相关,意思是现代英语里的“that”或“those”)。在2004年的那部厚厚的大字典里,最多只有18的汉字今天还在使用。即便如此,这也并不意味着一个受过教育的中国人能认识13000个汉字——哪怕他只认识这个数字的14,也没什么可害臊的。不过,字体设计师必须确保所有的字都能打出来。
5。方块字无从表明任何发音线索
真实的部分:方块字不是可靠的、系统的发音指南。老师说,刚开始学习汉语普通话的学生,只能一个字一个字地死记硬背正确读音。
但不只如此:大多数方块字都包含了读音线索。当然,不是所有线索都是正确的,而且这些语音线索也并不像人们想的那么牢靠,但至少它有点用。让我们用教科书最喜欢用的例子——“妈”字,来说明这是怎么回事。这里你必须知道的一点是,跟其他大多数方块字一样,它由两个元素构成。其中一部分在本例中,最左边的13是一个窄版的“女”字,意思是“女性”。这其实是“妈”字的来源,但还有一点必须要理解的是,如果某样东西来自一个方块字,它就不再是方块字了。一个方块字,包含两个部首(characteristics),它写在纸上,多多少少会变成方形,而且要发音。后者似乎是陈词滥调,但其实反而是问题的核心:“女”字本身要发音,但变成窄版的“女”字旁之后,就不发音了。至于右侧23的部分,是一个瘦版的“马”字。
现在,如果你不熟悉中文书写,你可能会怀疑“妈”的意思是“女的马”,也就是“雌马”。但这套系统不是这么运转的。处理这类复合汉字(中国人叫它“形声字”)的正确方法是,找到一个词,发音与它的一个组成部分相似,又有着与另一组成部分相关的含义。在本例中,“女性”元素给出了语义线索,“mǎ”元素提供了有帮助的语音信息:故此,待议方块字的意思是“母亲”,它的发音是mā,与“马”相同,只是声调不同。
练习阅读和书写汉字靠的是重复、重复,不断的重复。不过,如今人们越来越多地使用键盘来“写”字了。