人类基因组学复旦、西安交大、中邦医科院等共同颁布首个中邦人群专属的泛基因组参考图谱

热点资讯 2024-04-06 20:11:27 0 人类基因组学  

  导读:人类基因组学正在见证从单一参考序列到泛基因组形式的持续范式转变,但亚洲血统的人群代表性不足。

  6月14日,由复旦大学、西安交大、中国医学科学院等26家单位联合发布的中国人群泛基因组联盟(CPC)一期研究进展,以“A Pangenome Reference of 36 Chinese populations”为题发表于《Nature》主刊。初步构建了首个中国人群专属的泛基因组参考图谱,为破译中国人群基因密码奠定基础,为“健康中国”“精准医学”战略提供支撑。

  在过去的二十年中,参考人类基因组序列已成为遗传和生物医学研究和应用的基础;然而,人们普遍认为,没有一个单一的参考序列可以代表全球种群的基因组多样性。一方面,高质量的人群特异性和单倍型解析基因组参考对于遗传和医学分析是必要的。另一方面,显然需要从单一的参考转向泛基因组形式,以更好地代表人类内部和人群之间的基因组多样性或等位基因变异。随着长读长测序技术和计算方法的进步,现在可以使泛基因组构建能够从大量不同基因组中捕获遗漏的变异。

  中国拥有巨大的遗传多样性,除了汉族多数外,还有55个官方承认的少数民族和相当数量的未被承认的民族。尽管测序技术的进步导致端粒到端粒单倍体组装T2T-CHM13的实现,但只有有限数量的中国基因组使用长读长DNA测序技术从头组装成高质量的单倍型序列。目前,仅有的两项关于中国泛基因组的研究仅限于汉族样本的短读长测序数据,因此迫切需要建立一个高质量的泛基因组参考,以更好地代表中国人群的巨大基因组多样性。

  中国泛基因组联盟(CPC)的目标是使用第三代测序技术对至少500个个体进行从头测序,以更好地检测和编目中国人群的序列变异。在这里,我们提出了基于CPC第一次测序工作(第一阶段)的中国泛基因组参考草案,报告了来自代表36个少数民族和6个汉族多数族群的58个核心样本的116个高质量的从头组装。

  中国泛基因组联盟的数据显示,当包括来自代表性不足的少数民族群体的个体时,新序列和缺失序列显著增加。缺失的参考序列富含古老的等位基因和基因,这些等位基因赋予与角质化、紫外线辐射反应、DNA修复、免疫反应和寿命相关的基本功能,这意味着在复杂的疾病定位中揭示人类进化和恢复缺失遗传力的巨大潜力。

  本次研究的最大成果,在于从技术上初步构建了我国人群的泛基因组参考图谱,此外还发现了在人类通用参考基因组上缺失的约1.9亿个碱基对的参考序列;新鉴定了约580万个点突变或小变异以及3.4万个结构变异,涉及大量潜在功能原件包括至少1367个蛋白质编码基因;并发现通用参考基因组上缺失的参考序列富集了适应性演化和起源于远古人类的遗传变异,并且与角质化、紫外线辐射应激、DNA修复、免疫反应以及寿命等表型或功能相关。

  “基因组结构变异大概是生物进化中从微观到宏观演变的关键遗传基础,也是最有可能连接渐变到跃变这个‘鸿沟’的进化密码。”复旦大学校长、中科院院士金力点评,“我相信通过对基因组结构变异的高精度解析,不但能大幅提升‘基因型-表型’关联分析的功效,而且有可能最终帮助我们理解生命演化中重要性状和功能产生的遗传基础和分子机制。”

  论文通讯作者、复旦大学生命科学学院教授徐书华表示,下一步,团队将继续扩大族群覆盖度和增加样本量、拓展研究广度和深度、发展核心算法和分析能力,解析新序列的表型及功能,“希望团结国内外更多优势研究力量,把第二期工作做得更好”。

  中科院院士、分子微生物学家赵国屏认为:“这一成果表明我国科学家在人类基因组学领域的研究水平得到了显著提升。我相信这项工作对我国的人类基因组学和医学中的复杂疾病遗传基础研究等领域会起到重要的推动作用。”

  注:本文旨在介绍医学研究进展,不能作为治疗方案参考。如需获得健康指导,请至正规医院就诊。

  本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。

版权声明

本文仅代表作者观点,不代表百度立场。
本文系作者授权百度百家发表,未经许可,不得转载。

分享:

扫一扫在手机阅读、分享本文

留言与评论 (共有 条评论)
验证码: