“以中文方块字为基础”,不应阐释为“跟中文方块字几乎相同”,因为日本文字比汉字有着更多的死结和疙瘩——多到人们普遍认为,日语的书写系统是目前最为复杂的书写系统。那么,就让我们直接走近这堵看似不可逾越的日本文字之墙,看看我们能不能神奇地翻墙而过吧。
日语里的汉字(Kanji)以及它们怎样发音
日本最早的文本完全用中文方块字书写,它是公元5或6世纪由韩国学者引入的。和不再使用汉字的越南语和韩语不同,日语从未替换汉字,而是增加了一些插件。建立在中文方块字基础上的书写系统,绝不可能简单。但由于日语和汉语(普通话)在结构与基本词汇上都有着根本性的不同,汉字本来并不特别适合日语。故此,用汉字书写,对日语产生了深远的影响。
那么,日本人决定使用中文方块字之后(也叫作“汉字”,日语发音为“kanji”[5]),发生了些什么情况呢?首先,汉字的发音线索丧失了。如我们在前一章所见,大多数汉字由语义和语音成分(为读者提供了解其意思和发音的线索)组成。在日语里,语义成分保留得很好,但语音部分就不行了。毕竟,这些字符现在要用来表示日语而非汉语单词,在一种语言里发音相似的词语,在另一种语言里可不见得非得发音相似。跟我们回到经典的例子:如果“妈”字在外形上借用了“马”,这是因为在汉语(普通话)当中,“妈”和“马”这两个词的发音类似,可在英语里,它们发音一点也不像——在日语里也一样。故此,跟汉语比起来,孩子和外国学生更难于记住日语里汉字的视觉形象和正确的发音关系。为了让书写变得更容易,第二次世界大战后的若干届政府都公布过“常用汉字”名单,规范汉字的书写,限制汉字的总数量。即便如此,如今的常用汉字仍然多达2136个。在实践中,至少还会用到另外1000个汉字。
那么,学日语的学生必须掌握全部2136个汉字的正确发音吗?如果只需要学这么多个,那就好了。许多汉字都有不止一个“读音”,通常其中只有一个是真正的日语。例如,“手”可以发音为te,这是本土日语读法。但在复合词“着手”(按字面意思是“toud”,意思是“开始”)中,第二个汉字的发音是shu而不是te。shu来自几百年前的汉语发音,也就是这个词被借用到日语中时的发音。这个词的前半部分“着”,发音是chaku,来自一个早已过时的汉字发音chak。但还是老样子,这个汉字也可以代表一个本土日语单词,如在复合词“着物”(“kimono”,字面意思是“穿在身上的东西”)当中,它发音为ki。
“chakubutsu”是怎么几乎成了“kimono”的
日语里每个汉字都有两种完全不同的发音,一种是本土的,另一种是输入的。挺糟糕,是不是?但实际情况比这还要糟糕。一些汉字的本土读音不止一种,而是两种,甚至更多。更重要的是,很多汉字是从中国的不同时期和不同地区不止一次借用而来的,于是有多种不同的发音。这2136个“常用”汉字虽说不是个个都有多种发音,但很大一部分都有两种日常使用的发音,在专业术语(比如佛教著作当中)里还有另外一两种发音。例如,汉字“泳”,意思是“游泳”,它有一个本土发音,用拉丁方式拼写为OYO,而来自中文的发音是EI。在“泳ぐ”(动词,“游泳”的意思)里,它读作“OYOGU”,而在“泳法”(游泳姿势)中读作“EIHō”。如果用英语来举例,那就像是“swimming”(指游泳这一行为)和“natation”(指游泳姿势)的拼写方式一样。有些汉字以读法众多而著称,这方面的纪录由“生”字保持,它有10多种读音,光是在日语本土单词中就有9种,还有更多种借用自中文,其含义极为丰富:从“出生”到“生丝”,甚至“学生”。
这一切意味着,阅读日语是一个持续不断的决策过程:发音要根据语境来判断。“着物”一词读作“kimono”,也可以读成chakubutsu,但读成后者,它就不传达任何意义;读者必须读成kimono,它才表示“着物”。英语里也有几十个必须通过上下文来推断正确发音的单词。它们叫作“同形异义词”,其中包括sewer(可以分别跟lo(可以分别跟cow和low押韵)、著名的read(可以分别跟bead和bed押韵),以及为祝福我们本章的主人公,sake(可以分别跟make和Iraqi押韵)。但在英语里,一般的文本很少会出现这样的陷阱;而在日语里,绝大多数汉字都有着不同的读法。
是我说得太难,而实际上没那么难吗?毕竟,每当“手”是一个单独的词语时,它就读作te;而在复合词“着手”(shuchaku)就读作shu,因此最好关注整个词语而非单个字符。在英语里,多多少少也是这么做的,我们不知道“cha”这3个字母怎么发音,除非我们在单词里见到它:是CHARACTER(性格,?k?r?kt?r,cha读作k?)、CHAPTER(章节,?t??pt?r,cha读作t??)、E(香槟,??m?pe?n,cha读作??)、CHAOS(混沌,?ke??s,cha读作ke?)、CHAFE(摩擦,t?e?f,cha读作t?e?)、CHAISE(双轮马车,?e?z,cha读作?e?)、CHA-CHA(恰恰舞,?t?ɑ?t?ɑ?,cha读作t?ɑ?)、CHALK(粉笔,t???k,cha读作t??),还是GOTCHA(明白了,?ɡ?t??,cha读作??)(甚至UKKA或者CHALYBEATE)?没错——只不过,日语不像英语和其他大多数语言那样,在单词之间有界限:日语里没有空格。这也就是说,两个相邻的字符可能属于同一个词语,也可能不属于同一个词语。尽管如此,任何有经验的日语读者仍能分辨出哪些字符属于同一个词语,哪些不属于,只不过,这需要密切留心上下文。读日语就跟读包含了大量SEWER、READ、SOW和SAKE的英语句子一样。
来个快乐的词尾
尽管2000多个汉字是最难掌握的部分,但日语的错综复杂程度可不只如此。汉语里,单词没有语法结尾,故此,也就不需要汉字来书写。反过来说,日语有很多词尾,作者们很早就注意到,忽略词尾,会让日语文本近乎无法理解。该怎么办呢?
他们最初尝试的解决方法是使用一个发音听起来像是结尾的汉字,不管它到底是什么意思。为更好地理解这在实践中是什么样子,这里不妨想象一下我们用英语做同样的事。我们的语言也有一些语法结尾,比如-ing,故此,要是我们出于某种历史偶然采用了汉字书写,我们也会产生跟日本人同样的需求。那么,我们该怎样书写有-ing词尾的单词呢,如buying?“buy”本身是“買”(日语里“买”的汉字写法,汉语普通话的发音是mǎi,但在此处并无关系)。-ing部分有点成问题,因为没有哪个汉字发音是ing。但借用一种外国文字必然会涉及一定程度的妥协,所以,我们找一个发音是ying的字来对付着用:矨(而且完全不管它在汉语里是什么意思)。故此,買矨就成了“buying”的正确拼写。
说回日本,这种早期的解决方法有两点不便之处。首先,它使人难以判断一个汉字到底是代表它通常的含义还是仅仅是为发音而用。日本作家和读者已经习惯了大量的歧义,所以,要不是因为第二点不便,他们恐怕不会太过在意这个问题:一遍又一遍地添加复杂的字符,却仅仅是为了一个词尾,这是件繁复的苦差事。在我们虚构出来的例子里,矨或ying这个字符由9个笔画构成,其他许多字符的笔画还要多得多。
很快,书写者们就想到了点子:简化字符,只保留语法功能,这样它们就跟真正的汉字有了区别。这种做法,一笔(这是个比喻说法,虽然由此产生的符号远比最初的汉字简单,但大多数符号还是由若干笔画构成)解决了上面的两个问题。
今天,这些简化的符号统称为假名[6]。虽然它们的形式和用途随着时间的推移发生了改变,但它们仍然是日语书面文字的重要组成部分,仅次于汉字。从严格的实用角度来看,日语光是用假名就足够了,因为口语的每一个词语和句子都可以用假名书写,[7]不需要使用任何中文字符。1945年—1965年间,日本政府及语言委员会有意完全废除汉字。但文化视角与严格的实用角度很不一样,文学作家们成功地扭转了委员会的立场,进而影响了政府的态度。如今,在日本人眼里,一个人要是完全用假名写作,是缺乏文化修养的表现。情况并非一贯如此:虽然传统上,汉字拥有更高的声望,但1700年前的某一段时期,只使用假名写作,会让作者显得像是个文化水平极高的……女性(我们在第13章中看到的日语性别差异,也包括了当时的书面语言)。由汉字简化而成的假名,如今叫作平假名,是日语目前使用的两种假名系统中的一种。
等一下,两种不同的假名?但我刚才不是说,每一个日语单词,光用假名就够了吗?没错,我的确是这么说的。可日语还是有两种不同的假名:平假名和片假名。它们的样子几乎完全不同,但代表的却是完全相同的声音。46个平假名符号每一个都有对应的片假名,反之亦然。它们的区别(就跟字母表里的大小写字母的区别一样)不在于发音,而在于外表和功能。
从外表上说,平假名之所以叫作“平”(取其“光滑”之意)是有原因的。它的形状不是棱角分明的,而是弯曲的。它们带给书面日语独特的外观:中文是绝对印刷不出来つ、の或者お(分别读作tsu、no和o)的。片假名符号在中文里也不存在,但在他们眼里并不那么扎眼:刚才那三个平假名对应的片假名分别是ツ、ノ和オ。它们之所以称为“片”(取其“部分”之意),是因为它们取自其汉字源头的一部分(片段)。例如,“オ”来自“於”的左半部分。平假名的起源与此类似,但它以汉字草书为基础,而非印刷的方块字。
在功能上,两组假名也明显不同。平假名扮演了我们之前讨论过的重要角色,它阐明了词尾的语法(当结尾表示单词界限时,它也在某种程度上弥补了单词之间没有空格的问题);当字符由于某些原因使用不便时也会用平假名来代替,可能因为书写者不知道正确的字符,也可能是读者(例如儿童)无法识别它;平假名还会被用来书写没有字符的单词;最后,平假名有时会作为一种阅读辅助工具被放置在汉字旁边——有一个叫FURIGANA(“指出假名”)或YOMIGANA(“读出假名”)的练习就突显了字符的可有可无。
日语键盘聪明极了,你可以输入平假名或罗马字母,它们会把单词转换成你想要的任何形式:片假名、平假名甚至是汉字(但如果是汉字的话,一般需要你在若干个同音字里进行选择)。
另一方面,片假名的作用是标记我们认为“困难而陌生的单词”,让它们变得容易理解。这类词来自除了中文之外的外语,通过借用或单纯引用进入日语,如技术和科学术语,包括物种和矿物名称;以及“boom”(嘣)和“swoosh”(嗖)等拟声词。片假名还可以用来强调一个词语。一言以概之,平假名是一种语法和发音辅助手段,片假名在功能上跟我们的斜体字类似。
优雅和不那么优雅的杂技
假名系统的美妙之处在于,每个符号代表一个音节[8]。问题是,在现代日语里,有超过100个不同的音节,而假名数量仅为46个,外加额外的一些符号。两者的不匹配,靠着正字法杂技解决了,只是姿态并不都足够优雅。
比这些日文变音符更糟糕的是:“一个假名,一个音节”的规则,碰到元音和辅音之间还有个y音节的时候,就会失效,比如kya,它写作きゃ,明显包含了两个元素。但娴熟的日语读者这时只看到一个假名:右边的符号比左边小,故此被视为左边符号的一部分。换句话说,这两个元素共同构成了合成符(或连字),跟英语里的ch很像。合成符由两个符号组成,但代表一个声音,有若干种语言(包括日语,但不包括英语)都将它们视为不可分割的整体。
Irashunal,shaw(不可理喻?的确)
2000多个汉字(其中大多数有一个以上的发音);两套假名,各由100多个基本和复合符号构成,有时还会跟汉字并置——这显然足以让日语赢得“全世界最复杂的文字”称号了。但我们还没说完呢。
对我们大多数人来说,日语文本是一大片无法理解的海洋,有着幽暗的汉字波浪,以及颜色较浅的假名波峰。但每隔一阵子,我们又会看到一些熟悉的东西。首先是数字。更出人意料的,还有罗马字母。日语记者、博主、电子邮件写手和其他作者都觉得,偶尔加入用罗马字(他们这样称呼我们的字母表)写的词语完全是小事一桩。毕竟,他们的读者已经掌握了有这么多发音的符号,再加一份小小的附录(也就是我们的26个字母)也算不上什么。大部分用拉丁字母所写的单词,都是首字母缩写,有些是国际通用的,如km(千米)、CD或**S(短信),有些是基于英语的日语创作,如OB和OG(分别指男校友和女校友),OL是“officelady”(白领丽人),也即在办公室工作的女职员。
还有另一项复杂的因素:日文可以垂直书写,此时竖直方向可以从右至左排列,或是在水平方向上从左到右。这也就是说,有些日语书籍是朝左边翻页的,跟欧洲语言一样;另一些日语书籍却是朝右边翻页的,跟阿拉伯语和希伯来语一样。
我可以再问一次,为什么这套复杂的书写系统还没有得到合理的重构?答案跟前文一样:修补书面语言,不管是拼写规则还是文字选择,都会唤起我们大多数人的保守反应,这种反应,只有碰到巨大的社会动**时期才可能被克服。19世纪后半叶到20世纪上半叶,好几个组织都发起了假名或罗马字母运动,但都徒劳无功。到20世纪40年代末,研究得出了明确的证据,采用罗马文字的教科书不会影响小学生的成绩,甚至还可能提高成绩。由于这一结果有悖于研究人员的预期与期待,立刻被雪藏起来。不可理喻是吗?的确。但正如我们所见,语言事关国家认同和文化。
[2] 有许多汉字,据说是有意义的,但至少在现代汉语里,它不是一个独立的词。“森”字就是其中之一。英语里也能找到同一现象的一些例子:“olf”一词中的意思是“人”;“quickly”里的“ly”,源自一个意思是“身体”的单词;“receive”和其他一些动词里的“ceive”,据说曾经意味着“攫取、抓住”。有些语言学家喜欢在语言学里使用行话,他们把这些单词元素叫作“黏着语素”(boundmorphemes)。——作者注
[3] 严格地说,这份包含201~214个词条的清单里罗列的是“部首”,部首跟语义成分不是一回事,但就当前的目的而言,它是个足够好的近似品了。——作者注
[4] 按照字面直译,这句话的意思是:“鸭子点了一杯啤酒,对酒保说:‘记在我账单上。’”
[5] 在本章中,我会交替使用“字符”和“汉字”。我不会用“字符”来指代书面日语里的其他元素。——作者注
[6] 假名可以指单个符号(一个“字母”),也可以指单个符号所属的整套符号(也可以说是“字母表”)。——作者注
[7] 在书面日语中,有许多从汉语借用来的字词只能从书写上区分,它们的发音相同,但汉字写法不同。也就是说,除非上下文提供足够的线索,否则,大声朗读时,它们可能会让听众感到困惑。有人认为(比如我),让听者感到困惑的句子往往代表写得糟糕。从这个角度看,如果汉字的作用只是为了区分发音相同的词语的意思,那它对日语可谓弊大于利。——作者注
[8] 从技术的角度说,它构成了音节表,就像我们在前文看到的印地语文字一样。但更严格地说,它又不是音节表,因为一个符号并不代表一个音节,而是一个音拍(mora),它指的是时间的语言单位。大多数日语音节都跟音拍一致,但有些以辅音或长元音(用拉丁文写的长音符号是:ā、ō)结尾的词,是两个音拍,故此,Nippon由两个音节组成,但每一个音节分别是两个音拍;Tōkyō也一样。日本人的假名灵感来自梵语所用的婆罗米文字(其中每个符号代表一个音节)。梵语是印度佛教典籍使用的语言。——作者注