04听到声音HearingSound
听力的范围
能够听到声音并不是一件稀奇的事情,因为强大的声音会振动身体,就连单细胞生物也能感觉到。但是,能够像人类一样听得那么清楚,简直就是奇迹。功率10~15瓦的声音移动鼓膜的幅度比氢原子的直径还小,即使是功率这么小的声音,我们也能够轻松听到。
我们能够听到的声音的强度范围也同样令人惊异。人类可以听到的声音中,最安静的声音(听力阈值,0分贝)和疼痛阈值(约130分贝)之间的差距十分巨大——130分贝,这个数值相当于价值1000亿英镑的便士数量(1013)。
我们还可以听到相当广泛的频率范围:大约10个八度,比钢琴键盘还多几个。而对于远远低于和高于这一频率范围的声音,虽然我们无法真正听到,但却可以感觉到,这一点将在第6章做出解释。我们对于声音的频率有非常好的辨别能力:大多数人都能察觉到大约14个半音的差异;在理想条件下,我们甚至能够分辨大约112个半音的差别。相比之下,我们对声音方向性的判断能力则相当一般。即使在十分有利的条件下,我们也只能确定水平方向10°左右、垂直方向20°左右的声源的方向。在这方面,许多其他动物都远远超过了我们。
也许我们所有听觉能力中最令人惊叹的一点是,即使谈话的声音不到背景噪声水平的10%(假设背景噪声的频率分布很广),我们也能够听清楚:这远远超过任何机器的极限。
我们的耳朵有两种功能:听觉和平衡。平衡完全由半规管负责(见图14)。耳朵的其余部分就可以自由地根据我们的需求演化出最合适的系统。但我们的发声器官却不是这样,作为人类进化过程中出现相对较晚的器官,它必须自己挤进脸颊和下巴之间,并与它们共享之前用于呼吸、进食、舔舐、吮吸、亲吻和战斗的那些身体结构。不过,对一个训练有素的演员或技艺娴熟的歌手而言,他们的发声系统可以像斯特拉迪瓦里小提琴一样完美地工作。
图14 耳朵(中耳和内耳经大比例放大)
耳朵能听到什么
如图15所示,我们的听觉系统还没有进化到可以测量声音的物理功率。例如:短笛的最大功率约为0。08瓦,而长号的最大功率约为6瓦,但长号听起来比短笛更安静,这意味着长号演奏者必须比短笛演奏者更加用力(实际上短笛演奏者从来没有在任何常见乐曲中全力演奏过)。实际上,所有乐器的功率都很低。一个响亮的管弦乐队全力演奏的功率可能达到60瓦。如果这样的演奏持续两分钟,产生的能量足够煮开一汤匙的水。
图15 听力与频率的相关性
此外,这些能量从声源产生后会向各个方向传播,因此,如果你坐在离这样一个管弦乐队10米远的地方,只有不到0。01%的能量会到达你的鼓膜。实际上,鼓膜所探测到的不过是空气带来的一系列快速撞击,除了它们撞击的力度和到达的速度之外,这一过程并没有传递其他任何信息。我们之所以能够体验到一个充满情感和富有意义的声音世界,要归功于解剖学、电化学和神经学上都高度进化的处理系统的精确协调。
外耳:捕捉声音
耳郭是耳朵的可见部分,像漏斗一样,主要起着收集声音的作用。耳郭前后不对称的形式也有助于收集声音在传播方向方面的信息。一些哺乳动物的外耳可以移动,有助于他们感知声音的方向。虽然有些人也有这种能力,但这除了娱乐价值之外没有任何用途。
由于耳道是一个约3厘米长的圆柱体,而共振波长为这个长度的两倍,那么相对应的频率为3000赫兹左右。该频率能量的增加会导致其他频率能量的损失,因此耳道就像一个带通滤波器。
在耳道的末端是鼓膜,一个约1厘米宽的圆形皮肤盘。它与耳道呈一定角度倾斜,以最大限度地扩大其面积,从而接收尽可能多的能量。鼓膜略呈圆锥形,这使得它比扁平形状能传递更多的能量。3000赫兹以上的频率在鼓膜上不会形成共振,鼓膜的表面以一种混沌的方式运动;而对较低的频率而言,由于其波长比鼓膜尺寸大,因此鼓膜会做整体运动。因此,它能够以极小的滤波形式传输尽可能广泛的频率范围。实现这种近乎平坦的频率响应一方面是通过外耳的不对称形状,另一方面则依靠胶原纤维的内部支架。
鼓膜必须紧绷着,但是又不能僵硬,这一点很重要,是通过咽鼓管对内外部压力进行平衡实现的(我们通常将咽鼓管画成开放的,但通常情况下它并不是开放的,除非有明显的压力变化导致其打开,这时会产生一种独特的咔咔声)。
中耳:声音增强
鼓膜与三块被称为听小骨的微小(实际上是最小的)骨骼相连,这些骨骼占据着充满空气的中耳。它们的主要作用是将鼓膜宽而浅的运动转化为对第二层鼓膜的高压“轻敲”,这层膜叫作“圆窗”,也是进入内耳的通道。听小骨起了杠杆的作用,使力增加了1。5倍。然而,这种力增强的主要方式其实是通过鼓膜和圆窗的面积之比实现的,将力集中在一个更小的区域,从而将压力增加大约20倍。听小骨还通过听觉反射为内耳提供一些保护(见第8章)。
内耳:从声音到电流
内耳充满**,就像鼓膜把通过空气传播的声音转化为通过骨头传播的声音一样,圆窗可以将骨骼传播的声音转化成通过**传播的声音。声音将沿着一个被称为耳蜗的长约2厘米的盘管传播。在它的末端有一个孔(螺旋孔),声波通过这个孔后沿着第二根管道传播回来,第二根管道沿着第一根管道的延伸长度与其连接。当声波完成它的双程传播返回时,它必须被消除,否则它会反射回耳蜗干扰新到达的声波。所以,第二管终止于另一层膜——卵圆窗。当声波到达卵圆窗时,卵圆窗向外膨胀,将声能转化成热能,然后消散。
基底膜将声波转换成神经脉冲,它像长棍面包的馅料一样在耳蜗的管子之间流动。如果没有像蜗牛那样卷起来(拉丁语中,耳蜗即蜗牛),耳蜗中并排的管子就会长达5厘米。由于耳蜗的长度与声波的波长有关,因此所有哺乳动物的耳蜗长度都非常类似:大象的耳蜗也只比人类的长50%,所以卷曲可能只是一个节省空间的方式,不具有任何声学功能。小鼠和其他小型哺乳动物无法容纳全尺寸的耳蜗。它们的耳蜗长约1厘米,因此它们只能听到3~4个八度的音程,相比之下,我们和大多数其他大型动物都可以听到8~10个八度的音程。在基底膜上的是柯蒂氏器,其上生长了9排短毛(每排约400个),称为静纤毛(stereocilia)。这些短毛沿着膜的长度延伸,并且有神经纤维与它们相连。这些纤维聚集在一起形成听觉(耳蜗)神经,其将脉冲传递到大脑。
基底膜随着声波的敲击而运动。它的底部比尖端更硬更宽,这意味着较低频率的声音会引起靠近尖端部分的振**。这些振**导致静纤毛移动,然后附着有静纤毛的毛细胞向大脑发送电化学脉冲。由于大脑知道各个毛细胞的位置,它可以通过这种方式确定声音的频率(这被称为听觉系统的位置说)。然而,当声音低于1千赫时,整个基底膜都会振**。在这种情况下,一些其他的机制变得重要起来:静纤毛细胞随着声波脉冲发射信号。举例来说,对一个100赫兹的音调,静纤毛细胞每秒发射100次信号。
然而,细胞无法在一秒内发射超过500次信号。因此,为了应对更高的频率,它们面临的问题与一支装备了燧发枪的军队遇到的问题类似,如果说重新装弹需要一分钟,那么小队怎么能产生间隔10秒的持续的枪声呢?答案是将队员分成6组。第一组发射并开始装弹,10秒后第二组发射,以此类推。在第六组开火10秒后,第一组将完成装弹并将再次开火。毛细胞正是以这种方式分组工作的。假设第一组在声波周期达到峰值时向大脑发出信号,第二组则在该周期已经下降到最小值的一半时发出信号,第三组在周期最小值时发出信号,而第四组则在周期返回至最大值的一半时发出信号。以这种方式,这样的四个单元组可以对频率比其最大发射频率高4倍的音调进行响应。
基底膜上的毛细胞也以一种非常不同的方式协同工作。那些排在基底膜第八排或者更外层的毛细胞通过瞬时改变它们的长度来响应传入的声波。这种运动放大了内层毛细胞(唯一向大脑发送信号的毛细胞)上的立体纤毛的振动,因此产生了显著的放大效果。这样我们能够听到的声音的最低值又降低了40分贝(到了我们原本听觉下限的万分之一)。这种活动会产生微弱的声音,称为耳声发射。因为婴儿太小,无法说清他们是否听到或到底听到了什么,所以耳声发射对于确定婴儿听力系统的功能非常有用。此外,当内耳受到损伤时,耳声发射就会减弱,所以它们也是听力学专家检查听力情况的有效手段。这种声音太安静了(是件幸事),人基本上无法听见,所以要用非常灵敏的入耳麦克风进行测量。
神经与大脑:从客观到主观
从基底膜发出的神经信号并不是模仿声波,而是包含三个信息的编码消息,即:(a)有多少神经纤维在同时发射信号;(b)这些纤维沿着基底膜排了多远;(c)纤维信号发射的时间间隔是多久。大脑通过(a)和(c)可以提取响度信息,通过(b)和(c)可以提取音高信息。
图16 大脑中听觉、语言和言语活动的位置。主听觉区识别声音,布罗卡氏区既分析又生成语义元素,韦尼克区处理的是语音序列(听到的、发出的和记住的声音),缘上回负责发音,角回负责语义处理
我们还没有完全弄清在大脑的听觉和语言中枢(见图16)里发生了什么,但处理过程的第一阶段是从听觉神经的输入数据流中提取显著特征。这些特征被用来不断地更新、修改和精炼我们脑海中关于所听到的事物的模型,比如一个曲调、一句话,或者一段令人烦躁的引擎噪声。大脑通过预测声音接下来会怎么变化来测试模型的准确性。在预测的过程中,大脑会尝试确定声音的每个组成部分对于这段声音的含义所做出的贡献大小,这个过程被称为层次编码。例如,如果有人试图哼出《飞越彩虹》,哪怕他哼错了大部分调调,我们也能识别出这首歌,这也证明了我们在声音预测方面有惊人的能力。哺乳动物的大脑对传到耳朵里的声音的理解速度几乎令人难以置信——对一只狗说“松鼠”,如果它能听懂这个词,它几乎能瞬间对其做出反应。