使用指南
输入要求
- 格式要求:标准FASTA格式,每个序列以">"开头,后跟序列标识符
- 序列数量:支持2-100条序列,建议3条以上获得更好的比对效果
- 文件大小:总输入不超过1MB,单条序列建议不超过10,000个残基
- 字符处理:自动过滤空格和非标准字符,支持大小写混合输入
- 序列类型:自动识别蛋白质、DNA、RNA序列类型
参数说明
颜色方案
- Clustal:经典配色,按氨基酸化学性质分类
- Taylor:基于氨基酸物理化学性质的配色
- Zappo:按氨基酸侧链性质分组配色
- Hydrophobicity:按疏水性强度渐变配色
- Nucleotide:专用于核酸序列的配色方案
显示选项
- 显示网格线:添加网格线便于位置定位
- 显示共识序列:在底部显示保守性统计
- 序列排序:按相似性自动排序序列
- 位置范围:指定显示的起始和结束位置
- 换行设置:控制每行显示的残基数量
算法特点
MUSCLE采用三阶段渐进式比对策略:
第一阶段:快速距离估算和引导树构建
第二阶段:渐进式比对生成初始多序列比对
第三阶段:迭代优化提高比对精度
参考文献
主要文献:
Edgar RC. MUSCLE: multiple sequence alignment with high accuracy and high throughput.
Nucleic Acids Research. 2004;32(5):1792-1797.
DOI: 10.1093/nar/gkh340