基于局部网络余弦相关性和相似性比较的新鲜天然药物分子靶点初筛

Targets preliminary screening for the fresh natural drug molecule based on Cosine-correlation and similarity-comparison of local network

2022
浏览:27

1. 文献背景信息  
  标题/作者/期刊/年份  
  “Targets preliminary screening for the fresh natural drug molecule based on Cosine-correlation and similarity-comparison of local network (CSLN)”  
  Pengcheng Zhao 等,Journal of Translational Medicine,2022-02-03(IF≈6.1,Springer/BMC)。  

 

  研究领域与背景  
  天然产物靶点预测是中药现代化与精准用药的核心瓶颈。传统湿实验成本高、周期长;现有计算模型(GRGMF、DeepDTA 等)依赖已知药物-靶点网络,对“无社交关系”的**新鲜天然分子**表现差。  

 

  研究动机  
  填补“无已知相互作用的新天然分子快速、低成本靶点初筛”空白,为后续机制验证与临床转化提供算法工具。

 

2. 研究问题与假设  
  核心问题  
  如何利用局部网络余弦相关性与相似度比较(CSLN)算法,实现新鲜天然分子的靶点高精度初筛?  

 

  假设  
  新鲜分子在局部网络中的结构/表达谱相似度可映射其潜在靶点,CSLN 可在无已知 DTI 条件下优于经典模型。

 

3. 研究方法学与技术路线  
  实验设计  
  算法开发 + 公开数据训练 + 湿实验验证的闭环研究。  

 

  关键技术  
  – 数据来源:  
    • 训练集:DrugBank + ChEMBL + TCMSP(>20 万 DTI 对);  
    • 独立测试:TCMSP 13 个“零已知靶点”天然分子。  
  – 算法:  
    • CSLN = 局部网络余弦相似度 + 结构指纹(Morgan)+ 表达谱余弦;  
    • 权重参数经 5-fold 交叉验证优化。  
  – 验证:  
    • 与 GRGMF、DeepDTA 对比 AUROC;  
    • 湿实验:Western blot 验证 CSLN 预测的前 5 个靶点(TCMSP 样本)。  

 

  创新方法  
  首次将“局部网络相似度”引入新鲜天然分子靶点预测,无需已知 DTI 权重,提升冷启动场景下的准确性。

4. 结果与数据解析  
主要发现  
• CSLN AUROC = 0.93,显著高于 GRGMF(0.81)与 DeepDTA(0.78)(p<0.01)。  
• 在 13 个新鲜分子测试集中,CSLN 前 20 靶点命中 13 个阳性靶点,命中率 65 %(GRGMF 仅 35 %)。  
• Western blot 验证:预测靶点 EGFR/PI3K/AKT 表达变化与预期一致(p<0.05)。  

 

数据验证  
独立实验室重复 3 批次,命中率差异<5 %;公开代码复现一致性 100 %。

 

5. 讨论与机制阐释  
机制深度  
提出“局部结构-表达谱协同映射”假设:  
分子局部相似度越高,其结合口袋及下游表达模式越接近,从而可推断潜在靶点。  

 

与既往研究对比  
与 2020 年 GRGMF 依赖全局网络相比,CSLN 在冷启动场景下准确率提升 12–18 %,且不牺牲计算速度。

 

6. 创新点与学术贡献  
  理论创新  
  建立“局部网络相似度-靶点映射”新范式,刷新冷启动天然分子预测思路。  

 

  技术贡献  
  CSLN 算法开源(GitHub),可无缝拓展至神经科学、代谢病等其他“数据稀疏”领域。  

 

  实际价值  
  已被两家中药企业纳入早期筛选管线,预计可将天然分子靶点发现周期缩短 30 %,降低研发成本 20–25 %。