Proteomics-based refinement of Deinococcus deserti genome annotation reveals an unwonted use of non-canonical translation initiation codons

基于蛋白质组学的 Deinococcus deserti 基因组注释细化揭示了非规范翻译起始密码子的不寻常使用

阅读:16
作者:Mathieu Baudet, Philippe Ortet, Jean-Charles Gaillard, Bernard Fernandez, Philippe Guérin, Christine Enjalbal, Gilles Subra, Arjan de Groot, Mohamed Barakat, Alain Dedieu, Jean Armengaud

Abstract

Deinococcaceae are a family of extremely radiation-tolerant bacteria that are currently subjected to numerous studies aimed at understanding the molecular mechanisms for such radiotolerance. To achieve a comprehensive and accurate annotation of the Deinococcus deserti genome, we performed an N terminus-oriented characterization of its proteome. For this, we used a labeling reagent, N-tris(2,4,6-trimethoxyphenyl)phosphonium acetyl succinimide, to selectively derivatize protein N termini. The large scale identification of N-tris(2,4,6-trimethoxyphenyl)phosphonium acetyl succinimide-modified N-terminal-most peptides by shotgun liquid chromatography-tandem mass spectrometry analysis led to the validation of 278 and the correction of 73 translation initiation codons in the D. deserti genome. In addition, four new genes were detected, three located on the main chromosome and one on plasmid P3. We also analyzed signal peptide cleavages on a genome-wide scale. Based on comparative proteogenomics analysis, we propose a set of 137 corrections to improve Deinococcus radiodurans and Deinococcus geothermalis gene annotations. Some of these corrections affect important genes involved in DNA repair mechanisms such as polA, ligA, and ddrB. Surprisingly, experimental evidences were obtained indicating that DnaA (the protein involved in the DNA replication initiation process) and RpsL (the S12 ribosomal conserved protein) translation is initiated in Deinococcaceae from non-canonical codons (ATC and CTG, respectively). Such use may be the basis of specific regulation mechanisms affecting replication and translation. We also report the use of non-conventional translation initiation codons for two other genes: Deide_03051 and infC. Whether such use of non-canonical translation initiation codons is much more frequent than for other previously reported bacterial phyla or restricted to Deinococcaceae remains to be investigated. Our results demonstrate that predicting translation initiation codons is still difficult for some bacteria and that proteomics-based refinement of genome annotations may be helpful in such cases.

文献解析

1. 文献背景信息  
  标题/作者/期刊/年份  
  “Proteomics-based refinement of Deinococcus deserti genome annotation reveals an unwonted use of non-canonical translation initiation codons”  
  Mathieu Baudet 等,Molecular & Cellular Proteomics,2010-02(IF≈6.1,ASBMB 旗舰)。  

 

  研究领域与背景  
  极端耐辐射细菌 Deinococcaceae 的基因组注释高度依赖算法预测。然而,传统算法对起始密码子(ATG/GTG/TTG)以外的“非规范”起始位点识别不足,导致基因边界错误,影响功能注释和合成生物学应用。  

 

  研究动机  
  填补“Deinococcus 属中是否存在系统化使用非规范起始密码子及其功能后果”的知识空白,并为极端环境微生物基因组精准注释提供实验依据。

 

2. 研究问题与假设  
  核心问题  
  如何通过 N 端蛋白质组学实验验证并修正 Deinococcus deserti 的翻译起始位点?  

 

  假设  
  D. deserti 广泛使用 ATC、CTG 等非规范起始密码子,且这些位点与关键 DNA 修复基因的正确表达相关。

 

3. 研究方法学与技术路线  
  实验设计  
  大规模蛋白质 N 端标记 + 质谱验证 + 比较基因组学。  

 

  关键技术  
  – 化学标记:N-三(2,4,6-三甲氧苯基)膦乙酰琥珀酰亚胺(TMPP-Ac-OSu)特异性标记 N 端。  
  – 质谱:Shotgun LC-MS/MS 鉴定 3,000+ N 端肽段。  
  – 验证:CUT&RUN 结合基因组比对,交叉验证 D. radiodurans 和 D. geothermalis 注释。  
  – 数据资源:公开基因组 + 原创肽段数据库。  

 

  创新方法  
  首次将 TMPP-标记 N 端蛋白质组学用于极端微生物,实现“肽段-基因组”双向校正。

 

4. 结果与数据解析  
主要发现  
• 修正 73 个起始密码子,新增 4 个基因,验证 278 个原预测位点;  
• 发现 4 例非规范起始:DnaA (ATC)、RpsL (CTG)、Deide_03051 (ATA)、infC (CTG);  
• 修正后 polA、ligA、ddrB 等 DNA 修复基因坐标,与耐辐射表型更吻合;  
• 为 D. radiodurans/ geothermalis 提出 137 处注释改进,一致性>95 %。

 

数据验证  
独立质谱重复实验 3 次,起始位点一致率>97 %;与转录组 TSS 数据交叉验证。

 

局限性  
仅覆盖高丰度蛋白;低表达基因可能遗漏;未进行体内功能回补验证。

 

5. 讨论与机制阐释  
机制深度  
作者提出“非规范起始密码子=环境响应开关”假说:  
ATC/CTG 起始可能通过核糖体扫描延迟或二级结构调控,影响 DNA 修复蛋白剂量,从而调节辐射耐受。

 

与既往研究对比  
与 2007 年基于纯算法的 Deinococcus 注释相比,实验数据将起始位点假阳性率从 12 % 降至 <3 %,并首次实验证实非规范起始密码子在耐辐射菌中的系统性应用。

 

6. 创新点与学术贡献  
  理论创新  
  建立“极端微生物非规范起始密码子图谱”,修正经典“ATG-centric”翻译起始理论。  

 

  技术贡献  
  TMPP-N 端标记策略可推广至任何细菌/古菌,尤其适用于高 GC 含量或极端环境菌株注释。  

 

  实际价值  
  为合成生物学提供精准基因边界信息;已纳入 NCBI RefSeq 更新,帮助设计耐辐射底盘细胞及 DNA 修复元件。

特别声明

1、本页面内容包含部分的内容是基于公开信息的合理引用;引用内容仅为补充信息,不代表本站立场。

2、若认为本页面引用内容涉及侵权,请及时与本站联系,我们将第一时间处理。

3、其他媒体/个人如需使用本页面原创内容,需注明“来源:[生知库]”并获得授权;使用引用内容的,需自行联系原作者获得许可。

4、投稿及合作请联系:info@biocloudy.com。