本工具基于深度学习模型(Inception-CNN),对细菌(大肠杆菌)核糖体结合位点(Ribosome Binding Site, RBS)的 DNA 序列进行翻译强度预测、关键位点解释和新序列生成。
核心功能:
1. 预测(predict)—— 输入 17 bp 的 DNA 序列,预测其 RBS 翻译强度(0~1)以及在全部训练数据中的百分位排名。
2. 解释(explain) —— 基于 ISM(In Silico Mutagenesis,计算机模拟突变)算法,逐位突变序列并计算每个碱基对翻译强度的贡献度,定位关键功能区域。
3. 生成(generate)—— 基于爬山算法(Hill Climbing),自动设计高强度、低强度或目标强度的 RBS 序列,可用于合成生物学实验设计。
1. RBS 任务参数:
已解析序列数: 0,总碱基数: 0
用法
- RBS强度预测:模型只能处理17 nt的DNA序列(起始密码子上有17 nt),比如CTCGAGGAGATATACAT[ATG],应该输入CTCGAGGAGATATACAT。如果输入序列长度大于17 nt,会从5'端开始自动截断到17 nt。如果输入序列长度小于17 nt,会在序列末尾填充'N'碱基,直到长度为17 nt。为了确保结果的准确性,建议手动截取17 nt的序列。
- RBS设计的时候,有两种模式:1. 带序列约束:仅支持单条序列,请把17 nt的序列中需要改变的碱基用'N'代替。2. 不带序列约束:不需要输入任何序列。模型会自动设计10条RBS序列。
- 模型输出翻译强度(0~1)以及在全部训练数据中的百分位排名。
- 候选关键区间的score表明它在多大程度上解释了序列的重要性(0-1)。
模型性能指标
---------------------------------------------------
指标 训练集 测试集
---------------------------------------------------
R² 0.945 0.911
MAE 0.039 0.048
MSE 0.004 0.006
---------------------------------------------------
R² 解释:模型可解释测试集 91.1% 的 RBS 强度方差,表明预测值与实验值高度一致,可用于指导 RBS 序列设计。
最后更新日期:2026-05-05
参考文献
Höllerer S, Papaxanthos L, Gumpinger AC, Fischer K, Beisel C, Borgwardt K, Benenson Y, Jeschek M. Large-scale DNA-based phenotypic recording and deep learning enable highly accurate sequence-function mapping. Nat Commun. 2020 Jul 15;11(1):3551. doi: 10.1038/s41467-020-17222-4. PMID: 32669542; PMCID: PMC7363850.