Nat Commun:樊少华/关玉婷/金力团队合作构建高分辨率汉族人群SV图谱,揭示SV的进化起源及表型效应
时间:2025-02-21 12:12:23 热度:37.1℃ 作者:网络
结构变异(SVs)通常指长度≥50bp的基因组改变,包含缺失、重复、倒位等多种类型,对人类遗传多样性的塑造起着关键作用。近年来,随着测序技术的迅猛发展,特别是短读长(SRS)和长读长(LRS)测序技术,已有多项研究表明SV可调控表型多样性并与局部适应性、疾病易感性相关,但当前绝大多数SV与表型或疾病的关联缺乏功能实验验证。全面且精准地解析SVs在不同人群中的特征、功能及演化规律,依旧是遗传学研究难题。
近日,复旦大学樊少华、金力团队与华东师范大学关玉婷团队等合作,在Nature Communications发表了题为“Long-read sequencing of 945 Han individuals identifies structural variants associated with phenotypic diversity and disease susceptibility”的文章。研究团队对945例汉族人群基因组进行长读长测序分析,鉴定出111,288个SVs,其中24.56%为具有潜在功能的新发现变异。结合群体表型、多组学数据及小鼠敲除模型,研究确定了位于WWP2、GSDMD基因上的两个关键SV,揭示了其对人类表型多样性和疾病易感性的潜在影响。总之,该研究为解析SV在人类演化、复杂性状形成及精准医学中的应用提供了新证据。
研究团队使用牛津纳米孔公司(ONT)的PromethION平台,对945例汉族个体进行全基因组测序。经严格的数据处理和质量控制,共检测到111,288个SV,每个样本平均含23,729个SV;并通过PCR、Sanger测序和高频率SV对比,验证了该SV数据集的高质量。特别地,研究团队发现大量未报道的SV(24.56%),多位于基因外显子、转录因子结合位点等功能区域。
特征分析显示,SV在亚端粒区域的密度高于其他区域,79.72%的SV断裂点与重复元件重叠,表明其在SV的形成过程中可能起着关键作用;SV的平均大小为1754bp,并且罕见SV显著大于常见SV。此外,SV的大小、频率与功能之间存在紧密关联。
图1. 汉族人群SV总结
研究团队结合千人基因组计划中的样本数据,古人类基因组、全球现代人类基因组数据以及黑猩猩基因组数据对上述SV进行基因分型,系统探究了汉族人群SV的演化轨迹。结果显示,2% SV(2,233个,涉及828基因)在人类与黑猩猩基因组中共享,表明其起源于物种分化前;5% SV(5,124个,1,692基因)为现代人类、尼安德特人和丹尼索瓦人共享,表明其形成于三者共同祖先时期;32% SV(35,649个,6981基因)为现代人类特有。
不同人群分布显示:11% SV为东亚人群特有(含汉族),而0.1% SV仅存在于现代人类与古人类中。值得注意的是,约20% SV(22,000个)为汉族人群特有且多为罕见变异,表明其可能为从头突变。上述结果揭示了SV在人类演化中的分层模式及群体特异性。
图2. 黑猩猩、古人类和现代人类中汉族SV多样性的分布
为探究SV的潜在功能影响,研究团队对SV进行基因注释。结果显示,51.24% SV位于基因间区,44.13%位于内含子区,4.63%与基因外显子重叠,部分外显子SV可能破坏基因功能。接下来,研究团队重点分析了两个与表型多样性和疾病易感性密切相关的因果SV。
其中一个SV是位于GSDMD基因长度约为2.2Kb的缺失变异,其在现代人类、古人类的共同祖先中就已存在。该SV删除了GSDMD最长的转录本的第一个外显子,破坏了增强子活性,从而导致GSDMD表达下调。研究团队结合人类表型、多组学数据,利用小鼠敲除模型对该SV进行分析。结果显示,该SV影响骨密度(BMD),并对顺铂诱导的急性肾损伤(AKI)具有一定的保护作用;有望成为评估多种疾病风险的预测生物标志物,在使用顺铂治疗癌症以及应对其他由GSDMD介导的器官损伤性细胞焦亡前,实现个性化风险分层。
图3. GSDMD基因座上的缺失与小鼠和人类BMD、AKI风险相关
另一个是位于WWP2基因内含子区的复杂SV,其是现代人类所特有的SV,由一个229bp的插入和一个354bp的缺失组成。该变异与一个可能在多种组织中发挥作用的增强子区域重叠,从而影响了WWP2基因的表达。进一步分析显示,该SV与多种表型(如体重、身高以及颅面特征)及免疫学特征相关,携带该变异的个体身高较矮、体脂百分比增加,并且在受到刺激时先天免疫反应增强。这一发现为深入理解人类的生长发育和免疫调节机制提供了新的视角。
图4. WWP2基因座上的复杂SV与多种表型和免疫反应相关
综上所述,研究团队基于长读长测序技术为945名汉族人构建了高分辨率的SV图谱,确定了大量先前未报道的变异,为人类遗传学研究提供了丰富的SV数据资源。此外,该研究结果也让人们对人类的进化历程和遗传多样性有了更深入的认识,揭示汉族SV起源是多方面的,其中一些可追溯到黑猩猩;还揭示了独特遗传背景与疾病易感性的关联,为个性化医疗和精准医学的发展提供了关键支撑。
参考文献:
Gong, J., Sun, H., Wang, K. et al. Long-read sequencing of 945 Han individuals identifies structural variants associated with phenotypic diversity and disease susceptibility. Nat Commun 16, 1494 (2025).
https://doi.org/10.1038/s41467-025-56661-9