
Raghav Sehgal 和 Albert Higgins-Chen 探讨了生物年龄钟为何会每天发生变化——以及这对长寿科学意味着什么。
生物年龄钟有望测量我们衰老的速度,并加速寻找长寿疗法。但在它们能够指导医学或临床试验之前,该领域必须面对一个根本性问题:这些时钟可靠且稳定吗?
在人类历史的大部分时间里,衰老都以一种方式衡量:时间。每年都在蛋糕上插上一根蜡烛,在日历上添上一个数字。然而,任何稍加留意的人都会发现,人们衰老的速度并不相同。有些人到了七十多岁依然健康活跃,而有些人却在几十年前就开始罹患慢性疾病。
科学家将实际年龄与身体状况之间的这种差距称为生物衰老。过去十年间,一种被称为生物年龄时钟的新型生物标志物已成为测量生物衰老最有力的工具之一。
这些生物钟通常基于DNA甲基化模式构建,有望量化我们的衰老速度。它们正被越来越多地用于预测疾病风险、评估生活方式改变以及评估干预措施是否能够延缓衰老过程本身。
但随着该领域迅速发展到在临床试验和长寿干预中使用这些工具,一个根本性问题变得不容忽视。
这些钟表的可靠性如何?
Matt Kaeberlein 博士在他著名的视频《 我做了 4 次不同的生物年龄测试并比较了结果》中提出了这个问题,我们在最近的研究论文中重申了这一点。该论文评估了 1000 多个样本中广泛使用的表观遗传衰老时钟的可靠性,我们发现答案比许多人认为的要复杂得多。
生物年龄钟的兴起
表观遗传时钟通过分析DNA甲基化模式来估算生物年龄。这些化学修饰调控基因表达,并在整个生命周期中系统性地发生变化。通过在大数据集上训练统计模型,研究人员可以根据这些模式以惊人的准确度预测年龄。
第一代生物钟主要侧重于预测实际年龄。后来的模型扩大了范围,试图捕捉死亡风险、生理衰退或个体衰老的速度。
如今,市面上已有数十种生物钟。有些试图概括全身衰老过程,而另一些则旨在捕捉生物衰退的特定方面。它们已成为快速发展的衰老科学领域的核心工具,该领域的研究人员致力于将衰老理解为一个可调控的生物过程。
现在许多研究都利用这些生物钟来评估饮食改变、药物或生活方式改变等干预措施是否可以延缓生物衰老。
但所有这些应用都依赖于一个关键假设。
测量本身必须稳定。
可靠性并非一个简单的概念。
可靠性听起来似乎是一个简单的属性,但实际上它包含多个层面。
其中一层是技术可靠性。这指的是对同一份生物样本进行重复测量是否能得出相同的结果。如果使用相同的实验室方法多次处理同一份DNA样本,那么可靠的生物钟应该得出几乎相同的年龄估算结果。
自 2022 年以来,大多数时钟在这方面表现良好 [ 1 ]。研究人员分析技术重复实验时,结果通常高度一致。
然而,仅凭技术上的一致性并不能保证生物标志物反映稳定的生物学特性。
更深层次的挑战是生物学可靠性。
生物学可靠性提出了另一个问题:如果我们在短时间内反复测量同一个人,我们是否能获得相似的生物学年龄估计值?
事情到这里就变得复杂多了。

当生物年龄波动时
在本研究中,我们使用从同一受试者身上采集的重复生物样本,评估了18种广泛使用的表观遗传时钟。目的是了解这些时钟在测量真实生物系统而非完全相同的实验室重复样本时,其稳定性如何。
我们观察到许多模型之间存在显著差异。生物年龄估计值在几小时或几天内采集的样本之间波动,平均而言,一天之内变化幅度可达5-10年,最高可达40年,如下图所示。(如下图所示,展示了一些著名的生物钟。)一些短期生理因素,例如昼夜节律或饮食,理论上不应改变生物年龄,但却会影响生物钟所依赖的甲基化信号。

这意味着,即使潜在的衰老过程没有发生实质性变化,一个人的生物年龄估计值也可能会发生变化。

我们使用组内相关系数 (ICC) 评估了四个独立数据集的生物学和技术可靠性,ICC 是衡量测量一致性的标准指标。ICC ≥ 0.90 被认为是优秀的,通常对应于重复样本间生物学年龄约 0-1 年的差异。ICC 值 ≥ 0.75 被认为是良好的,反映了约 0-3 年的波动。中等可靠性(ICC ~0.50-0.75)对应于约 3-5 年以上的差异,而较差的可靠性(ICC < 0.50)会导致显著的不稳定性,重复测量之间的差异通常超过 5-10 年。
在我们评估的生物钟中,只有一小部分在重复测量时表现出中等的生物学可靠性。或许最令人惊讶的发现是,技术可靠性并不能预测生物学可靠性。一些生物钟在实验室中重复测量同一样本时产生了几乎相同的结果,但在对同一受试者进行不同时间的测量时仍然存在波动。
换句话说,一个生物标志物在技术上可能完美无缺,但在生物学上却可能存在噪声。
为什么可靠性如此重要
这些发现对长寿领域具有重要意义。
许多研究现在将生物年龄的下降解读为干预措施延缓衰老的证据。但如果生物年龄的估计值本身就存在波动,那么解读这些变化就变得颇具挑战性。
想象一下,在一项临床试验中,一名参与者接受治疗后,其生理年龄减少了两年。由于缺乏高度可靠性,很难确定这种变化反映的是真正的生物学改善,还是仅仅是正常的测量误差。
同样的挑战也适用于将生物年龄与疾病风险联系起来的研究。如果生物标志物本身在不同测量中差异很大,那么它与健康结果的关联性可能会显得较弱或更不一致,尤其是在样本量较小的研究中。
因此,可靠性从根本上限制了任何衰老生物标志物的实用性。
预测性稍差但稳定性极高的时钟,最终可能比看起来功能强大但波动不定的时钟更有价值。
衰老生物标志物的转折点
生物年龄钟的快速发展是现代衰老研究中最令人振奋的进展之一。这些工具为我们提供了一个量化衰老生物学的视角,这在仅仅二十年前是无法想象的。
但该领域现在正进入一个新阶段。
多年来,生物钟研发的重点一直是预测准确性。研究人员一直致力于最大限度地提高生物钟与实际年龄、死亡风险或疾病结果的相关性。
展望未来,可靠性必须成为同等重要的优先事项。
生物钟需要通过重复的生物样本、不同人群和干预研究进行系统评估。研究人员必须更好地了解生理状态和环境暴露如何影响生物钟的测量。
简而言之,衰老时钟不仅应该被视为统计模型,还应该被视为临床测量。
临床测量需要稳定性。糖化血红蛋白(HbA1c)、胆固醇和血红蛋白在相似条件下应产生一致的结果。衰老生物标志物若要指导医疗决策或治疗研发,也需要达到类似的标准。
衡量衰老仅仅是开始
你的生理年龄可能在一夜之间改变,而你却不会衰老一天——这种想法既体现了这个新兴领域的希望,也体现了它的不确定性。
生物钟仍然是研究人类衰老的有力工具。它们使我们能够将衰老从一种观察现象转变为一种可测量并最终可改变的现象。
但测量仅仅是第一步。
如果这些生物标志物要指导临床试验、加速长寿疗法的研发并塑造预防医学的未来,那么该领域必须确保测量本身是可靠的。
准确性很重要。预测很重要。
但正如我们的工作所表明的那样,可靠性同样是一个重要的挑战,不容忽视。
关于拉加夫·塞加尔

拉加夫·塞加尔 (Raghav Sehgal) 是《福布斯》30 位 30 岁以下精英榜成员,也是耶鲁大学的教员,他致力于将人工智能应用于长寿科学研究。他的研究重点是利用多组学和多模态数据来理解和测量人类衰老,目标是开发具有临床应用价值的生物标志物。
他是SystemsAge的创始人,SystemsAge是首个临床应用的器官特异性衰老生物标志物,只需一次抽血即可量化11个器官系统的衰老情况。他还隶属于耶鲁大学癌症生物学项目,并担任健康长寿诊所的数据科学主任,致力于将衰老生物标志物转化为实际的临床应用。
与此同时,拉加夫还是LongevityTech.fund的首席科学家,为人工智能、数字健康和衰老科学交叉领域的投资提供咨询。他在学术界、产业界和初创公司拥有十余年的经验,其研究领域涵盖癌症预测、代谢健康和衰老,并在包括《自然》在内的顶尖期刊上发表过多篇论文。
关于陈阿尔伯特

阿尔伯特·希金斯-陈是耶鲁大学精神病学系的助理教授,也是该系的首席研究员。在密歇根大学攻读医学博士/哲学博士学位期间,他曾利用秀丽隐杆线虫研究调控衰老和寿命的基因。他是一位临床训练有素的精神科医生,曾运用衰老生物标志物研究心理健康和治疗如何影响衰老。目前,他致力于开发测量生物衰老过程和衰老干预措施效果的新方法。
🔗 https://longevity.technology/news/biological-clocks-age-within-a-day-without-you-aging/