Phenomic landscape and pharmacogenomic implications for HLA region in a Taiwan Han Chinese population

台湾汉族人群 HLA 区域的表型图谱和药物基因组学意义

阅读:19

Background

The human leukocyte antigen (HLA) genes, exhibiting significant genetic diversity, are associated with susceptibility to various clinical diseases and diverse in drug responses. High costs of HLA sequencing and the population-specific architecture of this genetic region necessitate the establishment of a population-specific HLA imputation reference panel. Moreover, there is a lack of understanding about the genetic and phenotypic landscape of HLA variations within the Taiwanese population.

Conclusions

We successfully delivered the HLA imputation for 59,448 Taiwanese subjects and characterized the genetic and phenotypic landscapes of the HLA variations. In addition, we quantified the estimated prevalence of the ADR-related HLA alleles in the Taiwanese population. The developed HLA imputation reference panel could be used for estimation of population HLA allele frequencies, which can facilitate further studies in the role of HLA variants in a wider range of phenotypes in the population.

Methods

We created models for a Taiwanese-specific HLA imputation reference panel. These models were trained with the array genotype data and HLA sequencing data from 845 Taiwanese subjects. HLA imputation was applied for 59,448 Taiwanese subjects to characterize the HLA allele and haplotype frequencies. Additionally, a phenome-wide association study (PheWAS) was conducted to identify the phenotypes associated with HLA variations. The association of the biallelic HLA variants with the binary and quantitative traits were evaluated with additive logistic and linear regression models, respectively. Furthermore, an omnibus test with likelihood-ratio test was applied for each HLA amino acid position in the multiallelic HLA amino acid polymorphisms to compare the difference between a fitted model and a null model following a χ2 distribution of n-1 degree of freedom at a position with n residues. Finally, we estimated the prevalence of adverse drug reactions (ADR)-related HLA alleles in the Taiwanese population.

Results

In this study, the reference panel models displayed remarkable accuracy, with averages of 99.3%, 98.9%, and 99.1% for 2-, 4-, 6-digit alleles of the eight classical HLA genes, respectively. For PheWAS, a total of 18,136 significant associations with HLA variants across 26 phenotypes are identified (p < 5×10-8), highlighting the pleiotropy feature of the HLA region. Among the independent signals, 15 are novel, including the association of HLA-B pos 138 variation with ankylosing spondylitis (AS), and rs9266290 and rs9266292 with allergy. Through an analysis spanning the entire HLA region, we identified clusters of phenotype correlations. Finally, the carriers of pharmacogenomic related HLA alleles, including HLA-C*01:02 (35.86%), HLA-B*58:01 (20.9%), and HLA-B*15:02 (8.38%), were characterized in the Taiwanese general population. Conclusions: We successfully delivered the HLA imputation for 59,448 Taiwanese subjects and characterized the genetic and phenotypic landscapes of the HLA variations. In addition, we quantified the estimated prevalence of the ADR-related HLA alleles in the Taiwanese population. The developed HLA imputation reference panel could be used for estimation of population HLA allele frequencies, which can facilitate further studies in the role of HLA variants in a wider range of phenotypes in the population.

文献解析

1. 领域背景与文献引入

文献英文标题:Phenomic landscape and pharmacogenomic implications for HLA region in a Taiwan Han Chinese population;发表期刊:Biomark Res;影响因子:未公开;研究领域:HLA遗传学与药物基因组学。

人类白细胞抗原(HLA)基因位于6号染色体主要组织相容性复合体(MHC)区域,具有高度遗传多态性,是调控免疫应答的核心基因。其变异不仅与自身免疫病(如类风湿关节炎)、感染性疾病的易感性密切相关,还直接影响药物不良反应(ADR)的发生风险——例如HLA-B58:01可显著增加别嘌醇诱导严重皮肤不良反应的风险。然而,HLA基因的直接测序成本高、多态性解析复杂,限制了大人群研究的开展;同时,HLA区域的连锁不平衡(LD)结构具有显著人群特异性,亟需构建人群特异性HLA基因型插补(imputation)参考面板*,以实现基于芯片基因型数据的HLA等位基因快速、准确推断。

针对台湾汉族人群,既往研究虽已构建基于台湾生物银行(TWB)第一代芯片(TWBv1)的HLA imputation参考面板(Huang等,2020),但未对HLA区域的表型组学特征(即HLA变异与多表型的关联)进行全面解析;且TWB后续推出的第二代芯片(TWBv2)包含更多HLA区域的稀有变异和功能位点,更适合精准解析HLA遗传结构。此外,台湾人群的HLA遗传多态性、表型关联及ADR相关HLA等位基因的携带率仍缺乏系统研究。基于此,本研究旨在利用TWBv2芯片数据,构建更准确的台湾汉族特异性HLA imputation参考面板,系统解析台湾人群HLA区域的遗传特征、表型组学关联及药物基因组学意义。

2. 文献综述解析

文献综述围绕“HLA的功能与研究限制→现有HLA imputation研究进展→台湾人群HLA研究的缺口”展开核心评述:
作者首先强调,HLA多态性是疾病易感性和药物反应的关键遗传因素,但直接测序的高成本限制了大人群研究;HLA imputation技术(通过芯片基因型数据推断HLA等位基因)为解决这一问题提供了可行方案,但需基于人群特异性参考面板以确保准确性。
现有研究的关键结论包括:① 欧洲、日本等人群的HLA表型组学研究已揭示HLA变异与免疫、代谢等多表型的关联;② 台湾既往研究(Huang等,2020)构建的TWBv1参考面板虽验证了HLA与类风湿关节炎的关联,但未覆盖TWBv2的新增变异,且未开展全面表型分析。
现有研究的局限性在于:① 缺乏台湾人群HLA区域的表型组学全景分析;② TWBv1参考面板对HLA区域变异的覆盖不足,难以精准解析稀有等位基因。
本研究的创新点:① 基于TWBv2芯片构建更准确的台湾汉族HLA imputation参考面板;② 首次系统解析台湾人群HLA区域的遗传特征(等位基因/单倍型频率)和表型组学关联(109个表型);③ 评估ADR相关HLA等位基因在台湾人群中的携带率,为药物基因组学临床应用提供数据支持。

3. 研究思路总结与详细解析

本研究以“构建参考面板→大队列imputation→遗传特征分析→表型关联研究→药物基因组学评估”为核心逻辑,目标是解析台湾汉族人群HLA区域的遗传与表型特征及药物基因组学意义,核心科学问题包括:台湾人群HLA等位基因/单倍型的频率分布、HLA变异与多表型的关联模式、ADR相关HLA等位基因的携带率。

3.1 台湾汉族特异性HLA imputation参考面板构建

实验目的:构建基于TWBv2芯片的台湾汉族HLA imputation参考面板,验证其准确性。
方法细节:纳入845例同时具有TWBv2芯片基因型数据和下一代测序(NGS)-based HLA分型数据(覆盖HLA-A、-B、-C、-DRB1、-DPA1、-DPB1、-DQA1、-DQB1 8个经典HLA基因)的台湾汉族样本,使用HIBAG R包(version 1.26.1)训练2-、4-、6-digit HLA等位基因的imputation模型;通过7:3随机拆分训练集与验证集,比较imputed HLA等位基因(后验概率≥0.5)与直接测序结果的一致性,评估模型准确性。
结果解读:参考面板表现出高准确性——2-、4-、6-digit HLA等位基因的平均准确性分别为99.3%、98.9%、99.1%(n=845,P<0.001);召回率(call rate)分别为99.5%、96.7%、97.9%,表明模型可稳定推断大部分HLA等位基因。
实验所用关键产品:HIBAG R包(version 1.26.1)、NXType™ NGS HLA typing kit(One Lambda)、Ion Chef™ system(Thermo Fisher)、Ion S5™ XL sequencer(Thermo Fisher)、TypeStream™ software v.1.1.0(One Lambda)。

3.2 大队列HLA imputation及遗传特征分析

实验目的:对59448例TWBv2样本进行HLA imputation,分析台湾人群HLA等位基因/单倍型频率。
方法细节:使用上述参考面板对59448例TWBv2样本进行HLA imputation;通过与等位基因频率数据库(AFND)中其他台湾队列(如Lai等的46682例骨髓捐献者、Wen等的710例脐血样本)的HLA频率对比,验证imputation结果的可靠性;使用haplo.stats R包(version 1.8.6)分析8个经典HLA基因的单倍型频率,并与南方汉族人群比较。
结果解读:imputed的HLA等位基因频率与其他台湾队列高度一致(如HLA-A33:03、HLA-B58:01的频率与Lai等的结果差异<1%);最常见的8基因单倍型为A33:03-C03:02-B58:01-DRB103:01-DQA105:01-DQB102:01-DPA101:03-DPB104:01(频率3.85%,n=59448);单倍型频率与南方汉族人群更相似(如A33:03-B58:01-DRB1*03:01的频率在台湾与南方汉族中均>3%),符合台湾人群的移民历史(主要源于中国东南沿海)。
实验所用关键产品:haplo.stats R包(version 1.8.6)、AFND数据库。


3.3 表型组关联研究(PheWAS)

实验目的:解析HLA变异与109个表型(55个二元表型、54个定量表型)的关联模式。
方法细节:纳入四类变异——biallelic单核苷酸变异(SNV)、插入缺失(indel)、imputed HLA等位基因(2-、4-、6-digit)及HLA氨基酸多态性(如HLA-B第138位氨基酸);使用REGENIE软件(version 2.2.4)进行关联分析:二元表型采用加性逻辑回归,定量表型采用加性线性回归(先对表型进行协变量校正和逆正态变换);多等位基因氨基酸多态性采用似然比检验(omnibus test);调整性别、年龄、年龄²及前10个主成分(PC)作为协变量;以p<5×10⁻⁸为全基因组显著阈值。
结果解读:共鉴定18136个显著关联(p<5×10⁻⁸),涉及26个表型——包括4个免疫相关二元表型(药物过敏、关节炎、哮喘、强直性脊柱炎)和22个定量表型(如红细胞计数、肺活量、总胆固醇);其中15个关联为新发现(如HLA-B第138位氨基酸变异与强直性脊柱炎,p=1.94×10⁻⁶²;rs9266290与药物过敏);关联模式显示:免疫表型主要与II类HLA基因(如HLA-DRB1)关联,血液学表型主要与I类HLA基因(如HLA-B、HLA-C)关联。
实验所用关键产品:REGENIE(version 2.2.4)、ANNOVAR注释工具。


3.4 药物基因组学分析

实验目的:评估台湾人群中已知ADR相关HLA等位基因的携带率。
方法细节:通过文献检索收集与严重ADR(如Stevens-Johnson综合征/中毒性表皮坏死松解症,SJS/TEN)相关的HLA等位基因(如HLA-C01:02、HLA-B58:01、HLA-B15:02),计算imputed队列中这些等位基因的携带者比例。
结果解读:台湾人群中ADR相关HLA等位基因的携带率较高——HLA-C
01:02(与甲唑胺诱导SJS/TEN相关)携带者占35.86%,HLA-B58:01(与别嘌醇诱导严重皮肤不良反应相关)占20.9%,HLA-B15:02(与卡马西平诱导SJS/TEN相关)占8.38%(n=59448)。
产品关联:领域常规使用HLA imputation工具(如HIBAG)和频率分析软件(如haplo.stats)。

4. Biomarker研究及发现成果解析

Biomarker定位

本研究的核心Biomarker为ADR相关HLA等位基因(如HLA-C01:02、HLA-B58:01、HLA-B15:02),其筛选逻辑为“文献检索已知ADR相关HLA等位基因→imputed台湾人群HLA数据验证→计算携带率*”,覆盖从“已知关联”到“人群验证”的完整链条。

研究过程

Biomarker来源:imputed的台湾汉族人群HLA等位基因数据(n=59448);
验证方法:与既往ADR关联研究的结论对比(如HLA-C*01:02与甲唑胺诱导SJS/TEN的关联已被Kim等(2010)验证);
特异性与敏感性:文献未明确提供,但大样本量(n=59448)确保携带率的可靠性。

核心成果

  1. 首次系统报告台湾汉族人群ADR相关HLA等位基因的携带率:HLA-C01:02(35.86%)、HLA-B58:01(20.9%)的高携带率提示台湾人群发生相关ADR的风险较高;
  2. ADR风险预测的潜在生物标志物:这些HLA等位基因可作为台湾人群ADR风险预测的生物标志物——例如HLA-B*58:01阳性者使用别嘌醇时需警惕严重皮肤不良反应;
  3. 新表型关联线索:发现HLA-B第138位氨基酸变异与强直性脊柱炎的新关联,为该疾病的生物标志物研究提供了新方向。

本研究构建的台湾汉族HLA imputation参考面板及表型组学数据,为台湾人群的HLA相关疾病研究、药物基因组学指导临床用药提供了重要基础。

特别声明

1、本页面内容包含部分的内容是基于公开信息的合理引用;引用内容仅为补充信息,不代表本站立场。

2、若认为本页面引用内容涉及侵权,请及时与本站联系,我们将第一时间处理。

3、其他媒体/个人如需使用本页面原创内容,需注明“来源:[生知库]”并获得授权;使用引用内容的,需自行联系原作者获得许可。

4、投稿及合作请联系:info@biocloudy.com。