许多生物过程,包括细胞衰老,在不同细胞类型和条件下表现出多样化的特征。由于缺乏明确的单一标志物,研究人员通常依赖于一组基因的表达来识别这些复杂的生物状态。然而,目前有多种方法可以将基因集表达总结为量化指标(即所谓的“生物学特征”),每种方法都有其独特的优点和局限性。目前还没有一个公认的框架来系统地评估这些方法在不同数据集上的表现。基于此,我们开发了markeR,一个开源、模块化的R软件包,它利用评分和富集分析方法来评估基因集作为表型标志物的潜力。 markeR能生成可解释的评估指标和直观的可视化结果,以便对基因特征进行基准测试,并探索它们与研究变量的关联。 作为一个案例研究,我们将markeR应用于25个RNA测序数据集中的9个已发表的衰老相关基因集,涵盖6种人类细胞类型和12种诱导衰老的条件。结果显示,基因集的表现差异很大:一些特征(例如SenMayo)在多种背景下都是稳健的衰老标志物,而另一些(例如MSigDB集合)则表现不佳。我们进一步将markeR应用于49种GTEx组织,揭示了组织和年龄相关的衰老信号差异。总而言之,这些发现强调了分子表型表征的复杂性,并展示了markeR在各种生物学背景下系统评估基因集的巨大潜力。
📎 来源:NAR genomics and bioinformatics | 查看原文