当然,中国读者碰到“妈”字,不会每次都这样解决这道谜题,他们打小就把它记住了,所以现在他们就是知道。但至少,这仍是一道待解的谜题,而且它有助于中国孩子和外国学生记住该方块字。(顺便说一句,这种复合字符还澄清了另一个常见误解,也即“大多数方块字并未透露其含义”。)
当然,对不是复合字的方块字(比如“马”字),这种方法就不够用了,用语言学家莫大伟的话来说,它们“悄无声息地在纸面上坐着,威风凛凛”,“只有通过无数个小时的重复练习,才能记住”它们的发音。它们的词义也是一样,除了那些给出视觉线索的方块字。“马”字其实给出了视觉线索,因为它是从一匹马的形状演变而来的。四条腿(馬)依然清晰可见,右下角的笔画曾是一条尾巴。
这听上去似乎很容易(虽然按我的猜想,恐怕没几个人会觉得如此),这套双重线索系统还存在一些问题。其一是,哪一部分给出哪条线索并不清楚。在复合字里,语义成分既可以在左边(如“妈”的“女”字旁),也可以在右边(如“汝”),还可以在下边(如“婪”)、在上边(没找到合适的例子,女字似乎不得在上),甚至可以围在里边(如“威”)。好消息是,语义线索的数量是有限的:大多数线索(包括“女”字旁),都属于一份200来个偏旁部首的清单里。[3]故此,除非一个方块字同时包含了两个语义成分(这种情况并不罕见),否则,语义线索是可以辨识出来的。
另一个问题是,方块字的发音和它语音线索的发音之间,存在很大的可变性。有时,一切很完美,语音线索和实际发音一样。还有一些状况也可以接受两者的辅音和元音都一样,只是声调不同。“妈”就是这样,它的语音线索(“马”)发三声,而不是一声。但两者的相似之处往往存在很大的阐释余地。“闻”就是一个很好的例子。我们看到下边是一个微型的“耳”(它起源于一只耳朵的图画),发音跟英语的ear非常类似,读作ěr。它是“闻”字的语义元素,过去用来指“听”,但现在意思转移到了“气味,嗅”,这种情况真是令人不解。这个字的上半部分是清晰可见的“门”字,如果作为独立的方块字,它读作mén。但现在,它只是个语音线索,而且还是个不合格的语音线索,因为这个复合字读作wén。在历史的某个阶段,这两个方块字的发音大概更为接近,或许分别发音为mu?n和miu?n。不幸的是,它们渐行渐远,给我们留下了一个非常不完美的语音线索。
这远不是最糟糕的情况。还有些字的发音发生的变化太大了,根本无法识别出最初的相似性是什么。一些人相信,“休”(“荫凉”或者“休息”的意思)字背后的故事就是这样:不是一个人在树荫下休息,而是某个发音上的相似性,只可惜我们再也找不回来了。倒不是说这会削弱故事的吸引力,而是说,作为记忆工具来说,它没那么有用。
6。字就是词
真实的部分:实际上,所有的方块字都是有意义的,不像一些英语音节,比如der,本身并不表达任何意思,只充当单词的一部分(wonder、derby等)。许多方块字,在汉语(普通话)里都可以当作单词使用,或作为复合词的一部分。还有一些字,在现代语言里已不再常用,但在汉语的地域变体或历史变体中是常用的。
但不只如此:大部分汉语(普通话)词汇是复合词,由两个或两个以上的方块字构成。在今天的汉语里,大约88%的词语由不止一个方块字组成。在正文中,两个或两个以上方块字构成的词语所占比例较低,因为代词、介词和其他虚词等数量有限的单字词语出现得非常频繁。但在名词、动词和形容词中,单个方块字是极少的。
以“橡树”一词为例。第一个字“橡”可以单独视为一个词语,意思是“橡树”或“橡子”;第二个字的意思是“树”或“植物”。然而,一般来说,如果要指特定的这种树木,人们通常会使用复合词“橡树”而非单字“橡”。这是因为,“xiàng”这个发音下还包含了其他很多含义,如“雕像”“朝向”“大象”和“脖子”(颈“项”)。不过,因为所有这些同音字都对应着不同的方块字,故此,在纸上光写个“橡”字也就足够了,因为只有它,指的是树(或“橡子”,意思是“橡树的儿子或橡树的蛋”)。换句话说,“xiàng”有很多不同意思的同音字,说话时必须要阐明澄清,故此,人们为它加上了“树”。在书面上,这不见得随时需要,因为“橡”本身包含了所需的一切信息。但现代汉语(普通话)遵循口语,故此,“橡树”这个词用两个方块字来表示。不过,直到20世纪初,人们在书面语言里仍然经常省略“树”字,因为它当时以古典汉语而非当代口语为基础。
(顺便提一句,请注意,复合字和复合词是非常不同的两种东西。在第5条之下,我们看到指代“母亲”的“妈”字是个复合字,由一个语义成分加一个语音成分构成,但它不是一个复合词,因为它只由一个音节构成:mā。而在第6条下,我们遇到了“橡树”这个复合词。它由两个完整的方块字构成,而且两者都需完整发音。构成这一复合词的两个字,同时也都是复合字,但这只是巧合。)
7。所有的汉语分支,都采用相同的书写方式
真实的部分:直到1956年,各种汉语地方语言的使用者都使用(几乎)相同的汉字,并且通常有着相同的含义。故此,来自两种不同汉语方言地区的两个中国人(比如只会说普通话的北京人和只会说粤语的广东人),就算他们听不懂对方的语言,也能在书面上彼此理解。汉语下的方言差异非常大,人们说不定很难辨识出某个具体的单词,但只要把它写下来,问题就解决了。这就是为什么华语电影要配上中文字幕,比方说,以粤语为母语的人就算听不懂普通话,一般也能读明白。
直到今天,情况仍然基本一样,此外还多了另一个便利因素:所有人都在学校里学过普通话,因此,就算不会说普通话的人,也能读懂普通话。我们不妨用口音差异极大的英语母语人士,比如说阿巴拉契亚美式英语和说利物浦英式英语的人来做个比较。要是他们碰到理解障碍,也会把自己说的话写出来以澄清问题。当然,汉语普通话和粤语之间的差异比英语任何两种地方口音的差异都要大得多。
普通话(加英语)字幕是中国电影的标配。这是中国台湾地区的一部浪漫喜剧片,名叫《我的蛋男情人》(又名《爱情冻住了》),主角是一名厨师和他的狗。
但不只如此:汉语的不同方言,在书写时存在一些语法差异,比如词序和助词的使用。此外,一些方言,尤其是粤语,也针对普通话里没有的词语发展了特殊的方块字。另一方面,汉语的大多数方言很少会被付诸书面。
更重要的是,1956年之后,中国大陆简化了数千个汉字。与此同时,中国的香港和台湾地区保留了传统的繁体字。许多简体字的字形,跟繁体字不一样,有些人认得其中一种,但无法轻松认出另一种。
不过,总体来说,有关书面汉语的这个普遍观点,比本章所罗列的其他观点更站得住脚。
8。方块字很适合用来玩文字双关游戏
真实的部分:汉语普通话是玩文字双关游戏的理想语言,因为它蕴含着丰富的双关语资源:同音异形(义)字。
但不只如此:玩文字双关游戏的绝佳机会,并非来自方块字,而在于除了方块字之外的读音。在书面上,汉语(普通话)里的大多数同音异义词很容易区分。只要写出来,“theduckwhoordersabeerahebarteitonmybill’”[4]这样的双关笑话就根本站不住脚了,因为两个听起来同音的单词(如上文例子中,表示“喙”的bill和代表“账单”的bill),是用不同的方块字来表示的。
另一方面,在汉语(普通话)中,你偶尔可以使用一个不正确的方块字,与你打算说的那个字是谐音字,但仍能传达信息。这就像把TheNewWnuWhirled一样,计算机会被卡住,但大多数人类读者不会,至少不会卡太久。
9。那有没有可能抛弃方块字呢
真实的部分:不可否认,学习读写方块字比学习字母表要花更多的时间,不光把汉语当作第二语言的学习者是这样,对以汉语(普通话)为母语的人来说也是这样。
但不只如此:就算能证明转换到拉丁字母表是一桩极度有益的行动,事情也很难按这个方向发展。这倒不是因为中国文化特别保守(如某些东方学的陈词滥调所说),这是因为所有的文化在书写方面都是保守的。哪怕是极小的拼写改革,也会激发强烈的情绪。重大改革只有在革命时期才会出现——比如凯末尔领导下的土耳其。
中国人坚守他们“糟糕的书写系统”(这是《美国高等教育纪事报》的评价),会不会也有正确的地方呢?替代方块字最显而易见的选择是拼音,这是1949年之后设计出来的一套拉丁音标系统,学习汉语(普通话)的学生(他们使用拼音主要是为了找出方块字的发音)和母语人士(主要用于电话和计算机上输入方块字)对它都非常熟悉。尽管拼音煞费苦心地标明了每个音节的声调,如著名的四胞胎mā、má、mǎ、mà,但它无法区分大量的同音异形字,也即发音(包括声调)完全相同只是写法不同的字。故此,拼音会比方块字的书写方式造成更多的误解。
照道理说是这样。但且慢,别着急下结论:拼音里有一样方块字严重缺乏的东西,那就是空格。在汉语(普通话)里,我们所说的同音异形字,大多是发音相同的音节,而非词语。用方块字书写时,一个字到底是单独的一个词,还是一个更长词语的一部分,并不太明显。而在拼音里却没有这样的歧义。早些时候,我们提到“xiàng”可以是“橡”“像”“向”“象”和“项”,但实际上,汉语(普通话)人士并不光说一个“xiàng”来指代上述任一概念。他们更常用“xiàngshù”来指代“橡树”,用“dàxiàng”来指代“大象”,“jǐngxiàng”指代“颈项”,“diāoxiàng”指代“雕像”,“fāngxiàng”指代“方向”。汉语拼音可以立刻把这些词识别出来,而在方块字文本中,它们有可能只是两个碰巧挨在一起的字而已。故此,拼音产生歧义的余地,比乍看起来要小得多。汉学家威廉·汉纳(WilliamHannas)引用汉语语言学家的说法,指出只有不超过1%的汉语词语是同音异义的。他们发现了70个单音节词语,总共有164种不同的含义,有可能造成真正的混淆,以及39个同音的多音节词语,涉及82种含义。考虑到拼音是一种高度规律化的拼写系统,发音具有二重性的词语(也即同音异义词),写起来也一样。
然而,这个问题很容易解决。欧洲语言也有同音异义词,想想英语里的there、their和they’re(“那儿”“他们的”和“他们是”),rode、road和rowed(“骑”“路”和“划桨”),here和hear(“这儿”和“听”)。汉语(普通话)的同音字很容易通过书写区分,比如加上一个不发音的字母等方式;m(早晨)和m(哀悼)就是这样用不发音字母“u”来区分的。当然,这种辅助工具会提高孩子们学习拼音的难度。不过,跟记住方块字比起来,这还是太简单了。
甚至,根本就没必要增加这种额外的辅助工具。越南语同样有许多同音异义词。跟拼音不同,越南语甚至根本不对词语的界限做标记,因为音节通常都是分开书写的。即便如此,越南人似乎也对自己的书写方式感到满意。
10。现在,你已经知道关于方块字的所有知识了
恐怕并非如此。方块字跟其他书写系统的差异太大了,它们带来的问题,比我在这短短一章篇幅里能回答的要多得多。例如:在字典里,你会怎么按照某种顺序(请注意,我在这里没有使用“字母顺序”)来排列方块字所写的词语呢?(它涉及数笔画。)不把文字写出来,你怎样区分口语里的两个同音字?(提及使用该方块字的一个常见词语,类似“‘重量’的‘重’,不是‘种植’的‘种’”。)介绍一个方块字却不把它写出来,这能做到吗?(笔画本身有名字,但更常见的做法是将方块字的两个组成部分拆开来说,如本章第5个问题中所探讨。)布莱叶盲文怎么表现汉字?(用布莱叶盲文写拼音。)等等。
一经掌握,汉字可发挥出无限的创意用途:乐高玩具稍有挑战性,咖啡拉花师傅能为自己的艺术找到无限新思路。
此外,还有很多其他的迷思,包括:“每个方块字代表一个音节”(例外的情况有数百个,但官方并不接受大多数的例外),“人们不再创造新的方块字”(并非如此,人们仍在创造新的方块字,有些是正式的,有些是临时性质的)。此外还有一条:“日语同样是用汉字书写的”。
真的吗?这是个值得单独用上一章来探讨的问题。
附录 再谈日语
一套缺乏系统的书写系统
如果伦敦的国王十字车站可以有一个9?号站台(真的不只是在小说里),一本书当然可以有一章叫2b吧?我在这里插入一章的原因是,在进入世界上使用范围最广的语言之前,我想再谈谈另一位小号巨人——日语。这种语言有一个与众不同的地方,它的体系(既非魔法也非虚构)绝对比任何咒语、诅咒或魔符都更难学、更繁复。这里,我说的是日语的书写。我没有在“第13名日语”一章中讨论它的原因在于,它以中文方块字为基础,我们前面已经看到过,这本身就是一项很大的挑战。