如何快速的找到转录因子和启动子的结合位点?

作者:解螺旋.子非鱼 解螺旋原创

首先,怎么确定启动子?

一般查阅外文文献,老外把从转录起始位点开始上溯2K-3K的区间算做是启动子。

然而,启动子这么长,怎么知道具体的结合位点序列?

冒着被老板炒鱿鱼的危险,小鱼今天就斗胆告诉大家这一行业秘笈:论如何预测转录因子小姐跟某基因先生的爱巢(启动子结合位点)在哪里。

以转录因子Nf-KB和Ankh基因为例,用UCSC在线网站锁定启动子范围, 在左栏选择Table browes。

在clade选择Mammal,genome选择Human,assmebly选择最新的数据库,gene中输入ANKH,在track中选择RefSeq Genes,在output format中选择sequence,点击get output,根据需要选择序列,选择genomic-submit。

选择Promoter/Upstream by 2000 bases,选Exons in upper case, everything else in lower case(外显子大写,其他小写)。

结果如下:大写字母是基因外显子区,大写字母前面的2000个小写字母就是预测的启动子区,复制粘贴保存到文本中。

当我们锁定了这一条街道以后,接下来就是敲定门牌号了,好紧张!

打开PROMO数据库,业界良心!首页就来送助攻:查找转录因子结合位点操作步骤。

如助攻提到的,先点击黄色左栏SelectSpecies,选择物种, 点击Submit。

再点击黄色左栏SelectFactors,选择转录因子, 点击Submit。

接着点击SearchSites,将之前锁定的启动子区序列粘贴到指定位置,点击Submit。

目标出现!

结果中的一个位点TGGGAAATACCT就是预测到的nf-kb结合在Ankh启动子的最佳位点。

小鱼还有话要说,同一个基因的启动子都是可长可短的,只是不同长度可能启动子的活性不一样。真核生物一般都是认为在第一外显子上游的2kb以内(也有2kb以外的)。转录因子不同的预测方法(除了PROMO,还可用Jaspar 、TFSEARCH、TRANSFAC等数据库)结果都不一样,最终只有实验验证的才准确。就像多少娱记苦心采访偷拍猜测都抵不过人家范爷大方发微博公开恋情来得真实和震撼。

2015-08-06