RBS 翻译强度预测工具(InceptRBS)

本工具基于深度学习模型(Inception-CNN),对细菌(大肠杆菌)核糖体结合位点(Ribosome Binding Site, RBS)的 DNA 序列进行翻译强度预测、关键位点解释和新序列生成。

核心功能:

1. 预测(predict)—— 输入 17 bp 的 DNA 序列,预测其 RBS 翻译强度(0~1)以及在全部训练数据中的百分位排名。

2. 解释(explain) —— 基于 ISM(In Silico Mutagenesis,计算机模拟突变)算法,逐位突变序列并计算每个碱基对翻译强度的贡献度,定位关键功能区域。

3. 生成(generate)—— 基于爬山算法(Hill Climbing),自动设计高强度、低强度或目标强度的 RBS 序列,可用于合成生物学实验设计。

1. RBS 任务参数:

已解析序列数: 0,总碱基数: 0

DNA序列输入(用于 explain,支持100条 FASTA):



用法

  • RBS强度预测:模型只能处理17 nt的DNA序列(起始密码子上有17 nt),比如CTCGAGGAGATATACAT[ATG],应该输入CTCGAGGAGATATACAT。如果输入序列长度大于17 nt,会从5'端开始自动截断到17 nt。如果输入序列长度小于17 nt,会在序列末尾填充'N'碱基,直到长度为17 nt。为了确保结果的准确性,建议手动截取17 nt的序列。
  • RBS设计的时候,有两种模式:1. 带序列约束:仅支持单条序列,请把17 nt的序列中需要改变的碱基用'N'代替。2. 不带序列约束:不需要输入任何序列。模型会自动设计10条RBS序列。
  • 模型输出翻译强度(0~1)以及在全部训练数据中的百分位排名。
  • 候选关键区间的score表明它在多大程度上解释了序列的重要性(0-1)。

模型性能指标

---------------------------------------------------
指标                    训练集      测试集
---------------------------------------------------
R²                      0.945       0.911
MAE                     0.039       0.048
MSE                     0.004       0.006
---------------------------------------------------

R² 解释:模型可解释测试集 91.1% 的 RBS 强度方差,表明预测值与实验值高度一致,可用于指导 RBS 序列设计。

        

最后更新日期:2026-05-05

参考文献

Höllerer S, Papaxanthos L, Gumpinger AC, Fischer K, Beisel C, Borgwardt K, Benenson Y, Jeschek M. Large-scale DNA-based phenotypic recording and deep learning enable highly accurate sequence-function mapping. Nat Commun. 2020 Jul 15;11(1):3551. doi: 10.1038/s41467-020-17222-4. PMID: 32669542; PMCID: PMC7363850.