从生长曲线到贫血阈值,临床标准假设了一个单一的人类原型。为什么我们仍在使用“一刀切”的健康指标?
当我的女儿十个月半大时,她被归类为“消瘦”,联合国儿童基金会(UNICEF)将其描述为“最直接、最明显且危及生命的营养不良形式”。我和妻子一直在努力让她增重,这一分类对我们来说无异于失败的宣告。她的出生体重处于较低范围,但并不令人担忧:六磅两盎司。她在一张图表上显示为一个点,彩色曲线描绘了最佳生长状态;我们被告知她在第15百分位。她很好地适应了母乳喂养,一个月内就跃升至第20百分位,然后是第26百分位。我们自豪地期待她的数据会稳步上升。然而,她又落后了。四个月时,她处于第12百分位;九个半月时,低于第5百分位。
我们的儿科医生感到担忧。减少扁豆和蔬菜奶昔的摄入,我们被警告;我们需要让宝宝摄入更多热量。酥油、花生酱——我们被要求将这些以及其它脂肪大量涂在她的食物上,并用母乳和配方奶送服。我们照做了。然而,当我们一个月后回来时,得知她的体重进一步下降——并进入了“消瘦”区域。
这就是营养不良的样子吗?她看起来正在茁壮成长。她快乐、爱冒险、社交活跃,不停地咿呀学语,并用挑逗的眼神吸引陌生人。她的脸颊像她喜欢吃的全脂酸奶搭配的多汁小柑橘一样饱满。虽然爬行较慢——滑动是她偏好的移动方式——但她达到了大多数其他里程碑。她也变得越来越长,从出生时的第12百分位增长到十个月时的第36百分位。
在《适应性:你的独特身体如何运作以及我们的生物学如何团结我们》(Avery出版社)一书中,杜克大学的进化人类学家赫尔曼·庞泽(Herman Pontzer)讲述了面对类似困境的经历。当庞泽访问肯尼亚北部的一个半沙漠村庄研究达萨纳赫牧民时,一位德国慈善机构代表告诉他,社区正遭受严重营养不良的打击。慈善工作者将达萨纳赫儿童的身高和体重绘制在世界卫生组织(W.H.O.)的图表上——与我们的儿科医生用来监测我女儿生长的相同图表——并确定超过三分之二的孩子营养不良。因此,家庭被纳入营养计划,并提供了高热量、工业加工的补充剂。然而,正如我女儿的情况一样,这些数字与普通观察结果不符。
“无论我们走到哪里,孩子们都在奔跑、玩耍、大笑,”庞泽写道。“他们就是孩子。他们似乎精力充沛,也不显得特别矮小或‘发育迟缓’。”他没有看到慢性饥饿的其他迹象,例如成年人肚腹膨胀或女性生育能力下降。孩子们很瘦,但以许多东非牧民典型的修长方式呈现。
当庞泽和他的团队追踪达萨纳赫儿童的生长情况时,他们发现了与W.H.O.曲线截然不同的模式。大约在两岁左右,这些孩子的身高增长率在世界上很少见。五岁时,他们的平均身高超过了欧洲和北美吃得很好的孩子。与此同时,他们体重增加得更慢,形成了有利于散热的苗条体型。德国慈善机构诊断出缺陷的地方,庞泽看到了适应。
《适应性》提供了一场引人入胜、信息丰富的探索,揭示了人类生物多样性的奥秘。通过展示我们变化多端的身体如何应对各种环境,它挑战我们重新思考普遍的健康基准。这些标准涵盖了我们如何定义营养不良和微量营养素缺乏,以及如何评估生长异常、代谢紊乱和心血管功能障碍的风险。它们驱动全球资金优先事项,塑造国际援助计划,并影响社会政策。它们指导个人临床评估,如我女儿的情况,并支撑广泛的统计数据:17%的人锌缺乏;近四分之一的亚太地区儿童发育迟缓。然而,这些基准建立在一个单一的人类健康形象之上——一个跨气候和遗传历史不变的典型智人模型。我们已经进入了神经多样性、精准医学和“生物个体化”的时代,但我们仍然假设营养不良在科隆和肯尼亚农村看起来是一样的。是时候超越“通用患者”模型了吗?
多年来,儿科医生依赖的婴儿和幼儿生长曲线存在明显且严重的缺陷。W.H.O.曾认可由美国国家卫生统计中心开发的标准,这些标准基于美国俄亥俄州黄泉市一个社区的数据。人们对其在美国其他地区乃至世界范围内的相关性提出质疑。但当W.H.O.于2006年发布新的儿童生长标准时,似乎我们终于有了一个真正的全球基准,该基准来自五大洲儿童的研究。
协调团队从六个遥远地点招募参与者:挪威奥斯陆、阿曼马斯喀特、巴西佩洛塔斯、印度新德里、加纳阿克拉以及我居住的城市——加利福尼亚州戴维斯。研究人员维持严格的纳入标准——只跟踪富裕、不吸烟母亲所生的母乳喂养儿童。由此产生的图表获得了显著的影响力。截至2011年4月,已有125个国家采用它们,联合国将其视为新的黄金标准。实施成本高昂,通常需要各国彻底改革儿童健康记录、重新培训医务人员并购买新的测量设备。
这些标准之所以看似权威,部分原因在于其宣称的普遍性。正如项目协调员在2006年所写,这些标准可以“用于评估世界各地的儿童,不论种族、社会经济地位和喂养类型”。协调员还指出,六个站点收集的数据之间存在“惊人的相似性”,这在“内在的种族或遗传变异”背景下,证实了“标准的普遍适用性”。
然而,真的有多少变异性呢?W.H.O.并未公布详细的种族信息,但在数据收集时,奥斯陆、佩洛塔斯和戴维斯的大多数居民是欧洲血统。非洲作为遗传多样性最多的大陆,仅由一个地点代表。太平洋岛民、美洲原住民,尤其是东亚和东南亚人群未被包括在内。
“惊人相似性”的说法也站不住脚。团队基于的事实是,在每个年龄段,每个站点儿童的平均身高都在总体平均值的半个标准差以内。但按照这种逻辑,正如印度儿科医生Harshpal Singh Sachdev最近在《美国临床营养学杂志》中指出的那样,两个站点可能相差一个标准差仍被视为等同。这就像说丹麦和台湾的成人平均身高表现出“惊人相似性”,尽管它们相差超过六厘米。在印度城市低收入家庭中,Sachdev指出,针对健康、卫生、营养和心理社会支持的雄心勃勃的干预措施未能将身高提高半个标准差,这表明站点之间的差异可能反映了不同的生理基线。
除了身高之外,从未发布过关于其他测量值的跨站点比较,包括体重对身高和体重对年龄的指标以及头围。然而,这些指标经常用于临床和跨国目的,并被视为具有普遍适用性。当W.H.O.报告称近六分之一的非洲儿童体重不足——或者《全球营养报告》称4540万五岁以下儿童“消瘦”时,公共卫生政策受到未经检验的假设的指导。
当我们的女儿第一次因体重不足被标记时,我和妻子并不知道这些。但我们怀疑她的体型可能不像图表暗示的那么异常。我妻子的家庭和我的家庭一样,从印度移民而来。询问后,我们发现许多南亚裔父母的孩子都非常小。在Reddit论坛如r/india和r/ABCDesis上,我们发现了父母们对同一问题的担忧。我妻子的两个表亲出生时比我们的女儿还要小。
事实证明,可信的研究证实了我们的怀疑。一系列由斯坦福大学牵头的研究分析了美国数百万次分娩,记录了“双重悖论”:墨西哥血统的美国本土妇女尽管风险状况高于印度血统的美国本土妇女,但她们生下低出生体重婴儿的可能性更低。这是许多与体型和营养相关的不一致之一。例如所谓的南亚谜题:印度、孟加拉国和尼泊尔在关键健康和发展指标上超过了大多数撒哈拉以南非洲国家,但其人口的身高(字面意义)仍不及撒哈拉以南非洲或非洲侨民。例如,海地的婴儿死亡率几乎是印度的两倍,人均GDP低30%,但只有6%的海地儿童被认为严重发育迟缓,而印度儿童的比例为14%。在东亚富裕国家和北欧国家之间,您也能找到类似的差异。日本和荷兰是世界上最富裕的国家之一,拥有顶级医疗服务和低疾病负担,但约7%的日本儿童符合发育迟缓的标准,而荷兰仅为约1%。
显而易见的结论是,除了生活水平之外的因素——包括生物遗传——是荷兰和海地儿童比日本和尼泊尔同龄人更高的原因。然而,许多研究人员对考虑这种可能性持谨慎态度。例如,在努力解决南亚谜题时,他们忙于调查露天排便、孕产妇营养和对长子的偏好的影响。一组经济学家研究了撒哈拉以南非洲低体重婴儿的死亡率是否扭曲了身高统计数据。
亚利桑那州立大学的人类学家丹尼尔·赫鲁什卡(Daniel Hruschka)表示,这些理论都无法解释差异。赫鲁什卡长期以来对身体测量感兴趣。“我认为自己相当健康,但如果使用BMI指南,我就算肥胖了,我一直想知道这对我的健康意味着什么?”他告诉我。这个问题启发他花了十多年时间剖析人体测量数据,结果揭示了一系列发人深省的发现。在他的2010年代研究中,他证实单一体重指数(BMI)临界值用于区分正常体重和肥胖体重时,会在身材较粗壮的人群(如太平洋岛民)中高估肥胖率,并在较苗条的人群(如南亚人)中低估肥胖率。此外,纤细模式中的相似性,如密切相关群体之间的相似性以及同一群体中儿童与成人之间的相似性,强烈表明遗传因素发挥了重要作用。2016年,赫鲁什卡和埃默里大学的人类学家克雷格·哈德利(Craig Hadley)估计,标准BMI临界值漏掉了大约5亿超重人群,其中包括仅在南亚的2.5亿人。
在研究肥胖后,赫鲁什卡将注意力转向身高。在他最具雄心的项目之一中,发表于2020年,他和前学生、现任职于犹他大学的约瑟夫·哈克曼(Joseph Hackman)分析了来自70个国家150万名儿童的测量数据。利用财富、卫生、营养和传染病暴露的数据,他们计算了每个国家的“基础”身高水平指数——即生活在类似环境条件下的儿童的起始身高。如果W.H.O.正确假设儿童的潜在身高在各地相同,那么基础身高水平测量应在各人群中保持一致。
结果并非如此。例如,印度儿童的基础身高与海地儿童相差超过一个标准差。即使在相同的环境中抚养,印度两岁儿童的预期身高比海地同龄儿童矮三厘米。当赫鲁什卡和哈克曼根据这些发现重新计算严重发育迟缓率时,海地的估计患病率增加了两倍以上,从6%增至20%。西非和中非也观察到了类似戏剧性的增长。看来,对生长曲线的依赖隐藏了非洲部分地区数百万例严重发育迟缓病例。
这些计算提出了另一个令人不安的可能性:其他地区的发育迟缓估计可能被夸大,导致不当的营养干预。Sachdev在2021年的一项研究中发现,根据W.H.O.标准被归类为“营养不良”的5至19岁印度儿童中,超过一半显示出肥胖的生物标志物。“从代谢角度来看,他们甚至营养过剩,”Sachdev告诉我。在儿科医生通常建议减少高热量食物的情况下,“我们却在推动它,”他说。
这种对人类变异的忽视不仅影响发展中国家的儿童,也影响发达国家的儿童。尽管W.H.O.的图表旨在发现“异常生长”,但它们经常错过欧洲儿童的生长障碍。令人难以忍受的是,五至十九岁儿童的图表仍基于几十年前的美国数据。在荷兰和瑞典,W.H.O.的图表仅能捕捉到五岁以上生长激素缺乏症儿童的约70%;而本国特定图表则能捕捉到约95%。在2016年对九个欧洲国家的研究中,W.H.O.的标准始终未能优于当地参考值——法国除外,因为该国自1979年以来未更新其生长曲线图。
因此,旨在保护儿童健康的图表可能在全球范围内失败,错过了高个族群的生长障碍,同时将较矮族群的正常发育病理化。孟买、马尼拉和明尼阿波利斯的父母都必须在一个不反映其子女生理现实的医疗系统中导航。一些需要护理的儿童可能被忽视;另一些则受到不必要的、可能有害的干预。
“我们的差异显而易见,甚至在表面也是如此,”庞泽在《适应性》中观察到。“为什么我们的内部会缺乏多样性?”这是一个合理的问题。我们不断面对这样一个事实:不同的环境有能力改变我们。我们知道,在高海拔地区训练的人会发展出更强的有氧能力,长期暴露于更多紫外线辐射的人群会发展出更深色的皮肤。庞泽列举了许多这样的例子,从东非狩猎采集者的生活方式保护他们免受心血管疾病,到东南亚海洋游牧民族的基因适应让他们每天能在水下待上几个小时。然而,国际组织继续以普遍的人体生理假设运作——实际上,这一假设与欧美模型惊人地吻合。
以贫血为例,这是一种血液携氧能力减弱的状况。W.H.O.在一份1959年的报告中首次提出了诊断临界值。随后的一个科学小组承认,这些血红蛋白浓度的测量值“是任意选择的”,因此在审查了五项研究后引入了新的临界值——涉及美国婴儿、怀孕的加拿大女性、挪威青少年男性、英国矿业山谷的成年人,显然还有瑞典人。(最后一组观测数据未公开,因此存在一些不确定性。)1968年提出的修订临界值,作者承认仍然“有些随意”,但必须划定界限。五十多年后,这些仍然是W.H.O.的指南,仅对儿童和孕妇进行了轻微修改。2023年《柳叶刀血液学》的一篇论文宣布近二十亿人贫血,依据的是1968年临界值的版本。
无数其他基准也有类似的故事。国际锌营养咨询小组(IZiNCG)定义的锌缺乏标准基于1976年至1980年间在美国收集的数据。记住这一点,当你听到超过十亿人缺锌的说法时。维生素D缺乏的临界值也主要基于涉及欧洲人和北美人研究,导致声称90%的印度人缺乏足够的维生素D,尽管该大陆阳光充足。
为什么要坚持普遍标准?部分原因是出于实用性。几十年来,建立特定人群的基准需要广泛的数据收集、统计建模和临床验证——这些努力对大多数国家来说过于昂贵。像W.H.O.这样的国际组织提供了可用的、尽管不完美的替代方案。但这些限制正在消失。随着庞大的调查数据集和先进的分析工具,像赫鲁什卡和哈克曼这样的研究揭示了可以为更量身定制的基准提供信息的人口级模式。同时,低收入和中等收入国家的科学家正在测试继承的全球临界值是否与当地现实相符。随着测量人类变异的障碍消除,一刀切模型的理由也随之削弱。
即使有了这些进展,庞泽怀疑不愿讨论生物变异的另一个原因是:“差异是危险的。”纵观历史,固有差异的主张助长了压迫,从奴隶制的正当化到穷人的强制绝育。善意的努力有时也会伤害边缘化群体。从1999年开始,一种衡量肾功能的标准方程包括“种族系数”,系统性地高估了黑人患者的肾健康。结果,许多黑人患者被延迟转诊给专家或被认为不符合肾移植等治疗条件。2021年,当国家肾脏基金会和美国肾脏病学会建议从这些计算中移除种族时,超过一百万美国黑人立即被重新分类为更严重的肾病阶段。
基于种族的医学失败并不是忽视生理多样性的理由。假装差异不存在并不能使它们消失;它只会驱使从业者依赖有缺陷的直觉。熟悉的种族类别在追踪祖先和遗传变异方面表现不佳。尼日利亚的约鲁巴人和埃塞俄比亚的本奇人都被视为黑人,但从基因上看,他们之间的距离比一个英国人和一个泰米尔人更远。与其坚持模糊差异的可疑分类,不如开发能够考虑人们的独特祖先和生活环境的方法。
一月份,我们庆祝了女儿的一岁生日。由于偶然的原因,我们为她的十二个月体检拜访了一位新儿科医生。我们信心满满。我们加大了喂养力度,满意地看着女儿的大腿变粗,圆滚滚的小肚子溢出了尿布腰带。诚然,每次去儿科医生办公室都带着同样的成就感——只是被令人不安的百分位数击碎。但这次她看起来特别胖乎乎。
“十七,”我妻子低声说道,抢了我的猜测。
“十六磅七盎司,”护士读着秤上的数字,眯着眼睛看着。不错,我想。
当儿科医生进来时,他递给我们熟悉的曲线图打印件,每张图上都有一个点代表我们的女儿:年龄别体重和身高别体重均为第六百分位。他问这些数字与她之前的测量值相比如何。当我们回答他时,他盯着图表,似乎在纠结情况的严重性。然后他说要将我们转介给营养师。
尽管他安排了六周后的体重检查和几项血液测试,但他并没有显得明显担忧。就好像他,像我们一样,看到了我们女儿的两个版本——眼前的她,快乐而充满活力,以及图表上的她,抽象地成为关注的原因。不知道该相信哪个,他把判决推迟给了别人。
这种不确定性是医学推断固有的。一个重婴儿可能只是骨架大;一个小婴儿,虽然苗条但强壮。然而,对普遍基准的依赖扩大了身体与其测量值之间的脱节。抗拒承认人群差异的这些标准常常将健康的身体标记为令人担忧,而忽略了营养不良的身体。结果,数亿人——通常在最贫穷的国家——被错误标签,而像W.H.O.生长标准这样的工具,试图适用于全人类,却证明不如本地替代方案有效。矛盾的是,这些努力有时会破坏自己的目标,掩盖甚至加剧最脆弱人群的痛苦。
二月中旬,我们与营养师进行了虚拟会面。她询问了我们的喂养习惯——哪些食物、何时、多少母乳喂养——并观看了我们的女儿从我妻子的膝盖爬到桌子上,伸手去抓电脑。营养师没有将我们转介给另一位专家,也没有纠结于百分位数。相反,她向我们保证我们的女儿没问题。娇小,是的,但“保持了自己的状态。”此外,她确认,许多印度儿童往往较小。不过,她建议我们继续好好喂养她,尽可能添加黄油等,保持警惕。
也许十年后,一刀切的曲线将让位于承认不同人群不同形态的标准,建议也将随之调整。但目前,我们生活在两种现实之间——电子表格上的数字和我们怀中的孩子。
(全文结束)

