计算遗传率的方法有很多。一种常见且相对简单的方法是比较同卵和异卵双胞胎的相似程度,这种方法的原理是,双胞胎的生长环境完全相同,而且从还在子宫里的时候就是如此,同时,这种环境因素的影响对同卵和异卵双胞胎都一样。由于同卵双胞胎的所有基因都相同[143],而异卵双胞胎平均只有一半基因相同,所以你会认为(通常可以观察出来)同卵双胞胎比异卵双胞胎更相似—不仅是外表,身高、血压等都是如此。利用这些数据进行一些简单的计算,就能求得方差,再用它来计算遗传率[144]。但无论如何计算,遗传率范围都在0(该群体中的某个特定变异与基因无关)到1(该变异完全由基因引起)之间,这一比率也可以用百分比表示。
不同性状的遗传率各不相同,但同一性状的遗传率也会因研究和群体而异。相对而言,人类身高的遗传率在多项研究中基本保持一致:在营养条件好的人群中,身高的遗传率为0。8,身高的变异大多是由遗传因素导致的。在中国,身高的遗传率相对较低,约为0。65。其中,基因仍然扮演着重要角色,但这一数值表明环境因素对身高的影响在中国可能比在美国等地更为明显。让我们来举一个环境影响的一个例子:假设你的母亲在怀你的时候营养不良,你小的时候营养也不是很好,那么你成年后的身高就很可能比预期要矮。研究那些在艰难时期长大的人便不难发现,环境对他们身高的影响更大,基因的影响则相对较小。
2000年前后,全基因组关联分析成为可能,到差不多2007年的时候,这种分析方法才真正流行起来。但全基因组关联分析学家们很快就发现了一个棘手的问题:遗传率缺失(missiy)。纵使他们付出了相当多的努力,到2010年,全基因组关联分析也只解释了5%的身高变异—距离我们预测的80%的遗传率还有很大差距!在过去十多年里,这一差距逐渐缩小了,但它仍然存在,还有不少变异亟待解释。迄今为止规模最大的关于身高遗传的研究是英国的生物样本库(theUKBiobank)项目,近50万英国志愿者为该项目捐赠了DNA样本,并提供了详细的个人及医疗信息。斯蒂芬·许[145]率领的研究团队利用这些宝贵数据解释了40%的身高变异—这是个了不起的成就,但距离仅凭DNA就能准确预测一个人的身高,这还远远不够。该研究团队开发了一种先进的算法,能够利用基因组数据预测身高,误差仅为几厘米。这听起来令人心动,但在实际应用中,这意味着我们的预测和实际身高的误差范围其实非常大。设想一下,一位证人在法庭上做证时说:“我认为那个人大约五英尺八英寸,上下误差一两英寸,但他实际上可能只有五英尺二英寸,也可能高达六英尺二英寸。”[146]许教授团队的这一研究也从侧面反映了一个事实,就身高的预测而言,即使研究更多的人、观察更多的基因标记,也不太可能提高预测的精确性—他们已经尽可能地采取了这种方法。除了身高,他们还用这一算法研究了受试者的受教育程度,以6分制进行评分,“大学学历”为6分满分。这种方法只解释了9%的“受教育程度”表型变异,但他们认为,如果开展更大规模的研究,或许有望解释更多的变异。
为什么即便是这样一项大规模研究也只能解释一部分表型变异呢?对于这一现象,目前主要有两种观点。第一种观点认为,传统的遗传率计算方法存在严重高估的问题—例如,最近有一项研究使用了冰岛人的数据,在计算遗传率时将全基因组数据也纳入其中,结果发现这样得出的遗传率比传统计算方法得出的值要低得多。以身高为例,用这种新方法计算出的遗传率为0。55,而非我们已知的0。8,这意味着许教授团队其实已经能够解释超过70%的身高变异了。对于体重指数(bodymassindex,BMI)[147],数值分别为0。65(旧方法)和0。29(新方法);受教育程度的遗传率则分别为0。43和0。17—差异显而易见。
第二种观点也许更有意思。这种观点认为,我们研究的所有这些性状背后都有大量未被发现的遗传变异,但它们大多影响轻微,即使我们研究大量人群也难以捕获。其实,这个观点并不新鲜,早在2018年它就迎来了自己的百年纪念。1918年,现代统计学的奠基人之一罗纳德·费希尔提出了无穷小模型(infinitesimalmodel),该模型假定,身高等可变性状受无穷多基因的控制,但每个基因对该性状的影响无穷小,此外,环境因素对性状的影响也不可忽视。当然,费希尔所说的“无穷多”并不是指基因的数量无限,只是思考这个问题的一种方式。
你可能并没有听说过费希尔,但在某些圈子里,他一直备受尊敬。这倒不是因为他提出的无穷小模型—以他的标准来看,这并不是个特别大的成就—而是因为他对统计学和遗传学理论所做的许多其他贡献。伊恩·马丁是一位科学家,曾经教我饲养小鼠[148],几年前退休了。2016年12月,悉尼大学授予伊恩兽医学荣誉博士学位,以表彰他对小鼠遗传学领域和学校的贡献。在学位授予仪式举行前的一个招待会上,伊恩详细地跟我讲述了他与费希尔相识的那段时间。当时,他还向费希尔展示过自己的一些研究成果,得到了费希尔的认可。伊恩在1962年获得博士学位,也就是费希尔去世那年,所以这肯定是半个多世纪以前的事了。显然对伊恩而言,这一切都历历在目,仿佛就发生在昨天。听闻我的挚友及恩师认识这位了不起的人,我的激动之情溢于言表。[149]
虽然意犹未尽,但我们还是要暂且放下这种对科学英雄的崇拜,平复心情,探讨一下环境因素对我们的影响。把环境因素对你健康的潜在影响比作一辆超速行驶的卡车,就相当清楚了。如果你得了某种传染病,你很可能会认为,环境因素(病毒、细菌、真菌或寄生虫)的影响显而易见,而且它就是导致你患病的唯一因素,如果你这么想的话可就错了。有些人的免疫系统本就擅长(或拙于)应对特定类型的感染。一个极端是,有的人几乎对艾滋病病毒感染免疫,就像我们在第八章中看到的那样;另一个极端则是那些患有遗传性免疫缺陷的人,他们的身体极易受到一些特定类型的感染,重者在任何感染面前都不堪一击。其他人则处于这两个极端之间。
宿主和感染源之间存在一种相互作用,而且就像我们的免疫系统存在差异那样,并非所有感染源都一样,所以这个等式的两边都可变。那些对流感有天然抵抗力的人如果感染了一种温和的流感病毒,甚至都不会觉察到自己生病了。对我们一般人而言,得了普通流感会让我们难受好几天,但很快就可以完全康复。如果免疫力差的人不幸感染了某种特别凶险的病毒,如在1918年(西班牙流感)和2009年(猪流感)肆虐全球的H1N1流感病毒,其后果将致命。
从遗传学角度来说,这种基因与环境之间相互作用的一大重要体现,就是环境因素对孕早期胎儿发育的影响。说到这种影响,沙利度胺可谓是个极端且臭名昭著的例子,但还有一些药物也可能对胎儿造成危害。异维A酸(isotretinoin),市面上称爱优痛(Ae)或罗可坦(Roae),是一种治疗痤疮的特效药。然而,如果女性在使用这种药物期间怀孕,胎儿就极有可能出现各种问题(身体畸形和智力障碍),尽管也有很多胎儿不会受到影响。一些用于治疗癫痫的药物也可能会对胎儿产生影响,这对患有严重癫痫、需要服用这些药物的女性来说,可能是个艰难选择。你认为应该让孩子承担这份风险,还是让母亲冒着癫痫发作的风险更换药物呢?
不仅仅是药物,酒精也可能会对发育中的胎儿造成严重危害,尤其是对大脑,支持这一结论的证据主要来自那些在孕期大部分时间大量饮酒的母亲所生的婴儿。我们尚不清楚孕妇是不是完全不能饮酒,有没有一个安全的酒精摄入量,所以在饮酒问题上我们给孕妇的建议往往相对谨慎。除此之外,怀孕期间吸烟同样可能导致胎儿流产或发育不良。怀孕期间的感染也是非常严重的问题—我们为备孕女性接种风疹(rubella)疫苗的主要目的,就是预防孕期风疹病毒感染。此外,还有很多其他感染也会对胎儿造成威胁(如最近才被归入这类情况的寨卡病毒感染)。患有糖尿病的母亲所生的孩子更有可能出现各种身体畸形,但如果母亲的糖尿病由怀孕导致(妊娠期糖尿病)就无须担心这个问题,因为她们患上这种特殊糖尿病的时候,腹中的胎儿已经完全成形。但这并不是说妊娠期糖尿病无害,它对母亲和孩子都构成了极大风险,只不过胎儿畸形不是风险之一罢了。
所有这些危险都是真实存在的,而且它们都有一个特点:不可预测。即便是沙利度胺,我们也无法肯定孕妇服用这种药物到底会产生何种影响。还有一个问题是,对于许多药物,并没有太多证据表明它们会对胎儿构成威胁。为此,近年来有越来越多的研究人员开始将目光转向这些药物,致力于分析和监测母亲在孕期服用这些药物对婴儿产生的影响。
尽管我们还不能完全理解为什么同样的危险因素会对有些婴儿造成严重影响,而有些婴儿却安然无恙,但我们有充分的理由认为这与基因变异有关。也许是胎儿体内的基因变异让他们免受伤害,可能是那些负责下达形成胳膊和腿的指令、保证发育中的四肢的血液供应的基因发生了变异,变得格外强大。也有可能是母体的基因变异保护了胎儿:也许母亲体内有一种基因变异,导致她的肠道无法很好地吸收沙利度胺,所以她血液中的沙利度胺含量永远也达不到对胎儿产生影响的程度。
总的来说,公众意识到母亲孕期的一些行为会对孩子造成伤害是一件好事。这样,女性在怀孕期间就会有意识地避免吸烟或饮酒,用药也非常谨慎。但就像很多事情都有两面性一样,这也可能是把双刃剑,我就曾碰到过这种情况。巴里是个四十岁出头的男性,患有智力障碍。他会走路,也能进行简单的交流,不过除此之外,生活上的大部分事情还是要依赖父母。他有个三十多岁的妹妹,最近刚刚怀孕,她担心自己的孩子也会有智力障碍,这就有了我们的会面。20世纪70年代,当巴里还是个孩子的时候,家人带着他四处求医,始终没能查出他到底患了什么病。一段时间之后,对那些照顾巴里的人来说,这个问题似乎变得不那么重要了,应对他日常出现的各种健康问题才是重中之重。直到有一天,巴里的妹妹又提起这个问题。当我看到巴里时,我就怀疑他患有某种染色体病,之后的检查结果也证实了这一点—他的一条染色体有大片缺失,这无疑是他问题的根源。
这一消息对巴里年近七旬的母亲意义非凡。巴里是她的第一个孩子,而在怀他的时候她曾亲手粉刷过婴儿房。所以自巴里发病后的那天起,她就陷入了无限的自责之中。她深信是自己当时误吸了粉尘,才让儿子的大脑出现了损伤,这一切完全是她造成的。几十年来,她一直背负着这种不必要的负罪感,这种感觉已经把她压得喘不过气来。所以当染色体检查结果出来的那一刻,她再也忍不住了。就像我见过的其他面临相同处境的人那样,此刻的她心潮澎湃,百感交集,既为原来这一切并不是自己的错感到如释重负,也为那个这么多年来对此深信不疑的自己难过感伤。
询问母亲的孕期情况是临床遗传学咨询的一个重要部分,因为它偶尔能为我们提供关于孩子病因的重要线索。即使父母跟我说的情况都显然与孩子的问题毫无关联,我也总会再问问有没有什么特别让他们耿耿于怀的事情,因为很多时候人们并不会主动提供这些信息。我曾在悉尼儿童医院的唇腭裂门诊工作多年,其间来看病的孩子要么患有唇裂要么患有腭裂,有的兼而有之。唇腭裂是一种软组织分裂的畸形,通常是胎儿在早期发育过程中分离的面部结构未能正常融合的结果。有时,这些孩子的唇腭裂由遗传病导致,如“软腭—心—面综合征”等染色体病或其他综合征。但我接诊的大多数孩子除了唇腭裂外都很健康。多亏了先进的现代唇腭裂修复手术,这些孩子术后通常都恢复得很好,特别是那些唇裂的孩子,手术留下的疤痕微乎其微。
但他们的父母仍然想知道这是怎么发生的,是不是他们的错。通常情况下,我在唇腭裂门诊做的最有用的事情不是给他们列举各种可能导致这种问题的原因,而是恰恰相反:不,你在工作中承受的压力不是造成你孩子唇腭裂的原因,你服用的抗生素也不是,你修打印机的时候手上不小心沾满了墨粉也不是问题的根源。
通常情况下,虽然我们无法将腭裂或先天性心脏病等疾病归结于某一特定原因,但我们可以弄清基因变异在其中发挥的作用。对于这两种疾病,我们知道在一些家族中,单个基因的变异是主要原因。在识别导致先天性心脏病的单基因变异上,我也尽了一份绵薄之力[150]。我的朋友托尼·罗肖利(TonyRoscioli)(遗传学领域的夏洛克·福尔摩斯,尤为擅长从基因数据中抽丝剥茧,揭示未被发现的基因与疾病之间的联系)则发现了一些与腭裂有关的基因。即便是这些“单基因”疾病,也不可预测—携带了同样的基因变异,出生在一个家族中的孩子可能患有严重的先天性心脏病,一出生就已回天乏力,而另一个家族中孩子的症状也许要轻得多,他的心脏甚至可能完全正常。
“这个孩子携带了一种可能致命的基因变异,但很幸运没有受到太大影响,而那个孩子就没有那么幸运,这种变异对他来说是致命的。”这乍一听根本站不住脚,但事实上这种观点是有充分科学依据的。在单个DNA分子的层面上,蛋白质和DNA相互作用的方式可能会有一些“摇摆不定”。基因活动的调控不仅仅是一个“开”或“关”的问题,有时开关会调到比平时更高的水平,有时又会卡在较低的水平上。如果细胞数量足够多,这种摆动可以达到平衡状态,所以(大部分情况下)几乎无关紧要。但如果这种“摇摆”发生在胚胎发育早期,在那几丛细胞决定它们命运的关键时期,其影响不容小觑。就像蝴蝶扇动几下翅膀就可以在数周后引发一场龙卷风一样,在胚胎发育早期的关键时刻,几个细胞的微小变化也可能彻底改变这个孩子的命运。
也就是说,人类疾病有各种各样的可能性。有些疾病就像出了车祸,或者受到沙利度胺副作用的影响那样,主要与环境有关,但与基因也不无关联—有利的基因变异可能会让你免受沙利度胺的影响,而不利的变异则可能让你在感染面前不堪一击。还有一些疾病主要由单个基因的变异引起—但也会受到其他基因以及环境因素的影响。在这之间,还有许多其他疾病,它们都是成千上万个微小的基因变异之间相互作用,以及与环境相互作用的结果。[151]
有了这一认识,我们就有可能利用基因标记来预测疾病和其他性状。也许一个利用全基因组关联分析找到的基因变异并不能提供多少关于你未来健康状况的信息,但如果把数百种这样的变异结合起来呢?你能把它们组合起来得到有意义的信息吗?答案是:在某种程度上可以。这就是所谓的“多基因风险评分”(polygenicriskscores,PRS),已被广泛应用于各种常见疾病的预测:中风、心脏病、糖尿病、各种癌症等。从本质上讲,这与斯蒂芬·许的研究团队预测人类身高的方法相同。一些比较成功的基于多基因风险评分的预测模型已经开始成为实用的医学检测工具。例如,可以将多基因风险评分与其他信息结合来计算女性患乳腺癌的概率,这一结果可能会影响她接受的乳腺癌筛查的类型。
但这并不意味着此类评分就一无是处—如果不能用于医学,拿来赚钱总可以。很多公司会提供这样的基因检测服务,检测你的DNA,并根据测试结果给你提一些关于生活方式及饮食的详细建议。如果你的基因背景与这些研究的受试者(主要是欧洲人)相同,那么分析出的结果或多或少有些参考价值。总的来说,这样的检测对个体的意义非常有限。在花钱做这样的检测之前,你不妨想一想,难道有可能收到这样一份报告吗:“你可以抽烟,可以不运动,吃富含糖和饱和脂肪的食物、少吃蔬菜也没什么问题。”再打个比方,如果拿到的报告说你的身体可能对酒精不耐受,倒不如自己小酌几杯看看有何反应来得明确[153]。这样的例子还有很多。
但这种“这东西没什么用”的论断,可能在一种情况下不适用—检测你的身体吸收药物的能力。人体内有相当多的基因参与药物的新陈代谢,但具体是哪些基因因人而异。我们中的一些人产生的药物代谢酶只能缓慢发挥作用,而且很难跟上节奏,而另一些人产生的这种酶活性很高,对药物具有很强的代谢能力,了解这些基因可能很重要。例如,如果你的身体代谢药物的速度很快,你可能需要服用比一般人更大的剂量,否则体内的药物浓度永远也达不到起效标准;如果你是个新陈代谢比较慢的人,药物可能会在你体内积聚并对你产生毒害,所以你需要比一般人更低的剂量。我们大多数人要么没有这种与药物代谢相关的基因变异,要么根本就不需要服用这些药物—问题在于,除了做基因检测或“亲身体验”以外,我们永远也无法知道自己到底属于哪一种。
大多数提供复杂疾病基因检测服务的公司只会告诉你,你的奶奶可能来自东欧[154],或者你应该多吃水果和蔬菜,诸如此类的信息。最坏的情况是,还有一些公司会建议你服用特定的膳食补充剂,说对你的健康有益……而且说巧不巧,他们那儿正好就有卖的。不过,大多数情况下,只要你不太把它们当回事,这种“娱乐性基因组学”倒也没什么害处,有时甚至还对你有所帮助。例如,如果你因为被告知患Ⅱ型糖尿病的概率比一般人高而开始注重饮食、加强运动,对你绝对有益无害。
正如我们在第六章和第八章看到的,迄今为止,我们只会在结果非常明确的情况下使用植入前基因检测—主要用于选择一个未患有家族中已知的某种遗传病或染色体异常的胚胎。和许多其他公司一样,基因组预测公司也提供这种单基因检测和染色体检测,与众不同之处在于,该公司还提供多基因风险评分检测。具体来说,他们会对你的胚胎进行检测,并提供糖尿病(胰岛素依赖型与非胰岛素依赖型)、心脏病、高血压和高胆固醇、各种癌症和身材矮小等的风险评分。有人曾提出疑问,这种检测到底能在多大程度上准确评估这些风险。根据该公司开发这一检测所参考研究报告的说法,检测精度可以用“曲线下面积”(areauhecurve)来衡量,而上述这些问题的这一数值都在0。58—0。71。在这一衡量体系中,1分代表完全准确的检测,而0。5分的准确率则相当于抛硬币。0。6—0。7分肯定比抛硬币要好,但如果一个被认为有可能患心脏病的人最后没有得病,你并不应该感到意外,反之亦然。
抛开技术问题不谈,我们先假设这种检测可以很好地做出预测。那这样的信息有用吗?如果你要在两个胚胎中选择,它们在别的方面完全相同,只不过其中一个可能不知道在什么时候会患上心脏病……这真的可以作为你选择的一个依据吗?
说得更具体一点,45岁以上的人中有三分之一[155]患有高血压,每11个人中就有1人患有糖尿病,五分之二的人胆固醇偏高。甲状腺疾病相对没那么常见—大约每200人中就有1人(主要是女性)因缺乏甲状腺激素而接受治疗。心脏病和中风导致了大约四分之一的死亡。我们中有一半人会在一生中的某个时候患上癌症,十分之三的人会死于癌症。
假如你现在坐在诊室里,你的生育专家给你看了你最近一次体外受精获得的四个胚胎的植入前基因检测结果。其中两个胚胎有严重的染色体异常,这可能意味着如果它们被植入,很可能会发生流产。即使它们顺利出生了,也可能会有严重残疾,活不了多久就会夭折。大多数人在这种情况下都会认为最好不要选择这些胚胎。
但心脏病绝对是坏消息,对吧?所以可能又有不一样的结果?
嗯……也许吧。别忘了,你未来的孩子自己也可以做一些事情来降低患心脏病的风险。这种基因导致的风险其实只是总风险中的一小部分,他们的生活方式—不吸烟、健康饮食、加强锻炼—以及医疗手段的干预,都可以降低这种风险。目前,医疗干预主要局限于密切监测血压和胆固醇(以及其他血脂),并在必要时予以治疗将其调控至正常值。而在你今天选择的胚胎长到45岁患上心脏病之前,很可能还会有更多其他选择。
尽管如此,你可能会认为,如果你的孩子无须担心所有这些问题那将是最好的,或者至少像大多数人那样,你可能还会担心他们患癌症的风险高不高。我可要提醒你一下,如果把癌症和心脏病算在一起,这两种病导致的死亡已经超过总死亡数量的一半。如果这项检测可以完美预测所有可能出现的健康问题,那可能也没几个胚胎可以供你选择了。你的家人是否有过上述任一问题?如果你患结肠癌的祖母、有心脏病的父亲,或者你患有糖尿病的堂(表)亲从来没有出生,你会认为这对他们、对世界来说更好吗?
当然,对这一问题也有一个反驳观点。假设你有两个胚胎而且必须选择一个,其中一个患中风的风险很高,另一个没有。除此之外,它们在这项检测涵盖的所有风险上的得分大致相同。它们中的任何一个都有可能成为一个出色的人,可能某些方面天赋异禀,对整个人类是一种恩赐。或者,它们是你我这样的普通人,但十分幸福,懂得爱与被爱。它们中的任何一个都可能患上某种严重疾病—如严重的精神疾病—这并不包含在你能够检测的范围内。既然这个未来孩子的其他所有信息对你来说都未知,那为什么不选择那个不太可能患中风的人呢?也许,65年之后,这个人将开始一段漫长而闲适的退休生活,而另一个人可能刚刚得了场毁灭性的中风,再也没办法说话了,身体的一侧也永远失去了知觉,他的退休生活只能在一家养老院度过。也许那时你早已离开了人世,但至少你有机会看着你的孩子长大成人,而不用担心某个未来可能发生的事情。这值吗?你想做这个检测吗?