台湾汉族人群HLA区域的表型组学特征及药物基因组学意义-文献解析

1. 领域背景与文献引入

文献英文标题:Phenomic landscape and pharmacogenomic implications for HLA region in a Taiwan Han Chinese population;发表期刊:Biomark Res;影响因子:未公开;研究领域:HLA遗传学与药物基因组学。

人类白细胞抗原(HLA)基因位于6号染色体主要组织相容性复合体(MHC)区域,具有高度遗传多态性,是调控免疫应答的核心基因。其变异不仅与自身免疫病(如类风湿关节炎)、感染性疾病的易感性密切相关,还直接影响药物不良反应(ADR)的发生风险——例如HLA-B58:01可显著增加别嘌醇诱导严重皮肤不良反应的风险。然而,HLA基因的直接测序成本高、多态性解析复杂,限制了大人群研究的开展;同时,HLA区域的连锁不平衡(LD)结构具有显著人群特异性,亟需构建人群特异性HLA基因型插补(imputation)参考面板*,以实现基于芯片基因型数据的HLA等位基因快速、准确推断。

针对台湾汉族人群,既往研究虽已构建基于台湾生物银行(TWB)第一代芯片(TWBv1)的HLA imputation参考面板(Huang等,2020),但未对HLA区域的表型组学特征(即HLA变异与多表型的关联)进行全面解析;且TWB后续推出的第二代芯片(TWBv2)包含更多HLA区域的稀有变异和功能位点,更适合精准解析HLA遗传结构。此外,台湾人群的HLA遗传多态性、表型关联及ADR相关HLA等位基因的携带率仍缺乏系统研究。基于此,本研究旨在利用TWBv2芯片数据,构建更准确的台湾汉族特异性HLA imputation参考面板,系统解析台湾人群HLA区域的遗传特征、表型组学关联及药物基因组学意义。

2. 文献综述解析

文献综述围绕“HLA的功能与研究限制→现有HLA imputation研究进展→台湾人群HLA研究的缺口”展开核心评述:
作者首先强调,HLA多态性是疾病易感性和药物反应的关键遗传因素,但直接测序的高成本限制了大人群研究;HLA imputation技术(通过芯片基因型数据推断HLA等位基因)为解决这一问题提供了可行方案,但需基于人群特异性参考面板以确保准确性。
现有研究的关键结论包括:① 欧洲、日本等人群的HLA表型组学研究已揭示HLA变异与免疫、代谢等多表型的关联;② 台湾既往研究(Huang等,2020)构建的TWBv1参考面板虽验证了HLA与类风湿关节炎的关联,但未覆盖TWBv2的新增变异,且未开展全面表型分析。
现有研究的局限性在于:① 缺乏台湾人群HLA区域的表型组学全景分析;② TWBv1参考面板对HLA区域变异的覆盖不足,难以精准解析稀有等位基因。
本研究的创新点:① 基于TWBv2芯片构建更准确的台湾汉族HLA imputation参考面板;② 首次系统解析台湾人群HLA区域的遗传特征(等位基因/单倍型频率)和表型组学关联(109个表型);③ 评估ADR相关HLA等位基因在台湾人群中的携带率,为药物基因组学临床应用提供数据支持。

3. 研究思路总结与详细解析

本研究以“构建参考面板→大队列imputation→遗传特征分析→表型关联研究→药物基因组学评估”为核心逻辑,目标是解析台湾汉族人群HLA区域的遗传与表型特征及药物基因组学意义,核心科学问题包括:台湾人群HLA等位基因/单倍型的频率分布、HLA变异与多表型的关联模式、ADR相关HLA等位基因的携带率。

3.1 台湾汉族特异性HLA imputation参考面板构建

实验目的:构建基于TWBv2芯片的台湾汉族HLA imputation参考面板,验证其准确性。
方法细节:纳入845例同时具有TWBv2芯片基因型数据和下一代测序(NGS)-based HLA分型数据(覆盖HLA-A、-B、-C、-DRB1、-DPA1、-DPB1、-DQA1、-DQB1 8个经典HLA基因)的台湾汉族样本,使用HIBAG R包(version 1.26.1)训练2-、4-、6-digit HLA等位基因的imputation模型;通过7:3随机拆分训练集与验证集,比较imputed HLA等位基因(后验概率≥0.5)与直接测序结果的一致性,评估模型准确性。
结果解读:参考面板表现出高准确性——2-、4-、6-digit HLA等位基因的平均准确性分别为99.3%、98.9%、99.1%(n=845,P<0.001);召回率(call rate)分别为99.5%、96.7%、97.9%,表明模型可稳定推断大部分HLA等位基因。
实验所用关键产品:HIBAG R包(version 1.26.1)、NXType™ NGS HLA typing kit(One Lambda)、Ion Chef™ system(Thermo Fisher)、Ion S5™ XL sequencer(Thermo Fisher)、TypeStream™ software v.1.1.0(One Lambda)。

3.2 大队列HLA imputation及遗传特征分析

实验目的:对59448例TWBv2样本进行HLA imputation,分析台湾人群HLA等位基因/单倍型频率。
方法细节:使用上述参考面板对59448例TWBv2样本进行HLA imputation;通过与等位基因频率数据库(AFND)中其他台湾队列(如Lai等的46682例骨髓捐献者、Wen等的710例脐血样本)的HLA频率对比,验证imputation结果的可靠性;使用haplo.stats R包(version 1.8.6)分析8个经典HLA基因的单倍型频率,并与南方汉族人群比较。
结果解读:imputed的HLA等位基因频率与其他台湾队列高度一致(如HLA-A33:03、HLA-B58:01的频率与Lai等的结果差异<1%);最常见的8基因单倍型为A33:03-C03:02-B58:01-DRB103:01-DQA105:01-DQB102:01-DPA101:03-DPB104:01(频率3.85%,n=59448);单倍型频率与南方汉族人群更相似(如A33:03-B58:01-DRB1*03:01的频率在台湾与南方汉族中均>3%),符合台湾人群的移民历史(主要源于中国东南沿海)。
实验所用关键产品:haplo.stats R包(version 1.8.6)、AFND数据库。


3.3 表型组关联研究(PheWAS)

实验目的:解析HLA变异与109个表型(55个二元表型、54个定量表型)的关联模式。
方法细节:纳入四类变异——biallelic单核苷酸变异(SNV)、插入缺失(indel)、imputed HLA等位基因(2-、4-、6-digit)及HLA氨基酸多态性(如HLA-B第138位氨基酸);使用REGENIE软件(version 2.2.4)进行关联分析:二元表型采用加性逻辑回归,定量表型采用加性线性回归(先对表型进行协变量校正和逆正态变换);多等位基因氨基酸多态性采用似然比检验(omnibus test);调整性别、年龄、年龄²及前10个主成分(PC)作为协变量;以p<5×10⁻⁸为全基因组显著阈值。
结果解读:共鉴定18136个显著关联(p<5×10⁻⁸),涉及26个表型——包括4个免疫相关二元表型(药物过敏、关节炎、哮喘、强直性脊柱炎)和22个定量表型(如红细胞计数、肺活量、总胆固醇);其中15个关联为新发现(如HLA-B第138位氨基酸变异与强直性脊柱炎,p=1.94×10⁻⁶²;rs9266290与药物过敏);关联模式显示:免疫表型主要与II类HLA基因(如HLA-DRB1)关联,血液学表型主要与I类HLA基因(如HLA-B、HLA-C)关联。
实验所用关键产品:REGENIE(version 2.2.4)、ANNOVAR注释工具。


3.4 药物基因组学分析

实验目的:评估台湾人群中已知ADR相关HLA等位基因的携带率。
方法细节:通过文献检索收集与严重ADR(如Stevens-Johnson综合征/中毒性表皮坏死松解症,SJS/TEN)相关的HLA等位基因(如HLA-C01:02、HLA-B58:01、HLA-B15:02),计算imputed队列中这些等位基因的携带者比例。
结果解读:台湾人群中ADR相关HLA等位基因的携带率较高——HLA-C
01:02(与甲唑胺诱导SJS/TEN相关)携带者占35.86%,HLA-B58:01(与别嘌醇诱导严重皮肤不良反应相关)占20.9%,HLA-B15:02(与卡马西平诱导SJS/TEN相关)占8.38%(n=59448)。
产品关联:领域常规使用HLA imputation工具(如HIBAG)和频率分析软件(如haplo.stats)。

4. Biomarker研究及发现成果解析

Biomarker定位

本研究的核心Biomarker为ADR相关HLA等位基因(如HLA-C01:02、HLA-B58:01、HLA-B15:02),其筛选逻辑为“文献检索已知ADR相关HLA等位基因→imputed台湾人群HLA数据验证→计算携带率*”,覆盖从“已知关联”到“人群验证”的完整链条。

研究过程

Biomarker来源:imputed的台湾汉族人群HLA等位基因数据(n=59448);
验证方法:与既往ADR关联研究的结论对比(如HLA-C*01:02与甲唑胺诱导SJS/TEN的关联已被Kim等(2010)验证);
特异性与敏感性:文献未明确提供,但大样本量(n=59448)确保携带率的可靠性。

核心成果

  1. 首次系统报告台湾汉族人群ADR相关HLA等位基因的携带率:HLA-C01:02(35.86%)、HLA-B58:01(20.9%)的高携带率提示台湾人群发生相关ADR的风险较高;
  2. ADR风险预测的潜在生物标志物:这些HLA等位基因可作为台湾人群ADR风险预测的生物标志物——例如HLA-B*58:01阳性者使用别嘌醇时需警惕严重皮肤不良反应;
  3. 新表型关联线索:发现HLA-B第138位氨基酸变异与强直性脊柱炎的新关联,为该疾病的生物标志物研究提供了新方向。

本研究构建的台湾汉族HLA imputation参考面板及表型组学数据,为台湾人群的HLA相关疾病研究、药物基因组学指导临床用药提供了重要基础。

特别声明

1、本页面内容包含部分的内容是基于公开信息的合理引用;引用内容仅为补充信息,不代表本站立场。

2、若认为本页面引用内容涉及侵权,请及时与本站联系,我们将第一时间处理。

3、其他媒体/个人如需使用本页面原创内容,需注明“来源:[生知库]”并获得授权;使用引用内容的,需自行联系原作者获得许可。

4、投稿及合作请联系:info@biocloudy.com。