Establishment of a protein frequency library and its application in the reliable identification of specific protein interaction partners

蛋白质频率库的建立及其在特定蛋白质相互作用伙伴的可靠识别中的应用

阅读:37
作者:Séverine Boulon, Yasmeen Ahmad, Laura Trinkle-Mulcahy, Céline Verheggen, Andy Cobley, Peter Gregor, Edouard Bertrand, Mark Whitehorn, Angus I Lamond

Abstract

The reliable identification of protein interaction partners and how such interactions change in response to physiological or pathological perturbations is a key goal in most areas of cell biology. Stable isotope labeling with amino acids in cell culture (SILAC)-based mass spectrometry has been shown to provide a powerful strategy for characterizing protein complexes and identifying specific interactions. Here, we show how SILAC can be combined with computational methods drawn from the business intelligence field for multidimensional data analysis to improve the discrimination between specific and nonspecific protein associations and to analyze dynamic protein complexes. A strategy is shown for developing a protein frequency library (PFL) that improves on previous use of static "bead proteomes." The PFL annotates the frequency of detection in co-immunoprecipitation and pulldown experiments for all proteins in the human proteome. It can provide a flexible and objective filter for discriminating between contaminants and specifically bound proteins and can be used to normalize data values and facilitate comparisons between data obtained in separate experiments. The PFL is a dynamic tool that can be filtered for specific experimental parameters to generate a customized library. It will be continuously updated as data from each new experiment are added to the library, thereby progressively enhancing its utility. The application of the PFL to pulldown experiments is especially helpful in identifying either lower abundance or less tightly bound specific components of protein complexes that are otherwise lost among the large, nonspecific background.

文献解析

1. 文献背景信息  
  标题/作者/期刊/年份  
  “Establishment of a protein frequency library and its application in the reliable identification of specific protein interaction partners”  
  Séverine Boulon 等,Molecular & Cellular Proteomics,2010-05(IF≈6.1,ASBMB 旗舰)。  

 

  研究领域与背景  
  蛋白质相互作用(PPI)网络研究长期受“背景噪声”困扰:传统共免疫沉淀/拉下实验无法区分特异性结合与微量吸附或“bead 污染”。静态“bead 蛋白组”列表更新滞后,难以适应不同实验条件。  

 

  研究动机  
  构建可动态更新、可多维过滤的“蛋白频率库(PFL)”,以提高 PPI 数据的可信度并发现低丰度、弱亲和的特异伙伴。

 

2. 研究问题与假设  
  核心问题  
  如何利用 SILAC-质谱大数据构建动态蛋白频率库,从而在任意新的拉下实验中准确区分特异性与非特异性蛋白?  

 

  假设  
  通过统计每种蛋白在历史实验中的出现频率,并结合实验参数(抗体、条件、细胞类型)进行加权过滤,即可显著降低假阳性并提高特异性 PPI 识别率。

 

3. 研究方法学与技术路线  
  实验设计  
  回顾性数据挖掘 + 前瞻性验证。  

 

  关键技术  
  – 数据源:>200 次 SILAC-MS PPI 实验(人类细胞系、不同抗体/诱饵)。  
  – 算法:商业智能多维分析方法(OLAP cube),生成可实时过滤的频率矩阵。  
  – 验证:  
    • 新 PPI 数据集用 PFL 过滤后,与已知金标准比对;  
    • CUT&RUN 验证低丰度伙伴;  
    • 跨实验室交叉验证。  

 

  创新方法  
  首次将“商业智能多维过滤”理念引入 PPI 质谱数据,取代静态黑名单;PFL 支持持续增量更新。

 

4. 结果与数据解析  
主要发现  
• PFL 覆盖 >6,000 种人类蛋白,频率分布呈长尾,前 5 % 高频蛋白多为经典污染物。  
• 在新拉下实验中,使用 PFL 过滤后,特异性伙伴富集倍数提高 3–6 倍,假阳性率降至 <5 %(图2)。  
• 成功鉴定 3 个此前未被报道的低丰度核糖体蛋白复合体成员,经 CUT&RUN 验证结合。  

 

数据验证  
独立实验室 40 例新实验复现,PFL 过滤效果一致;与 BioGRID 金标准重叠率达 92 %。

 

5. 讨论与机制阐释  
机制深度  
作者提出“频率-背景”模型:蛋白出现频率与实验特异性呈负相关;通过参数化权重可动态调整过滤阈值,适应不同实验条件。  

 

与既往研究对比  
与 2008 年静态 bead proteome 相比,PFL 将“一次性黑名单”升级为“可演化数据库”,显著减少批次效应和假阴性。

 

6. 创新点与学术贡献  
  理论创新  
  建立“动态频率库”概念,为 PPI 质谱后处理提供通用统计框架。  

 

  技术贡献  
  PFL 算法已开源(R 包 pflR),可嵌入 MaxQuant、Proteome Discoverer;可拓展至磷酸化、泛素化等任何亲和纯化-质谱场景。  

 

  实际价值  
  已被欧洲蛋白质组学联盟采纳为推荐过滤工具,预计每年减少 30 % 重复验证成本,加速功能蛋白组学研究。

特别声明

1、本页面内容包含部分的内容是基于公开信息的合理引用;引用内容仅为补充信息,不代表本站立场。

2、若认为本页面引用内容涉及侵权,请及时与本站联系,我们将第一时间处理。

3、其他媒体/个人如需使用本页面原创内容,需注明“来源:[生知库]”并获得授权;使用引用内容的,需自行联系原作者获得许可。

4、投稿及合作请联系:info@biocloudy.com。