生命科学发展在现在,很多蛋白质都已经被研究过了或者正在被研究,对于已有前人研究基础的蛋白质,我们可以借助NCBI和UniProt了解蛋白的结构及翻译后修饰等相关信息,对于未被研究的蛋白质,我们可以借助一些预测网站或软件分析蛋白质的信号肽,疏水性,拓扑结构,等电点等信息。
多数氨基酸都有一个以上的密码子,通过E.coli密码子应用情况的分析表明一些密码子很少被使用,尤其是Arg,IIE,Leu,Gly,Pro等氨基酸的部分密码子。一个或多个tRNA的稀有或者缺少可能导致翻译的终止,
尽管含有少量稀有密码子不会给目的蛋白表达造成太大的影响,但是如果一个蛋白基因中含有多个或者成串稀有密码子的时候,目的蛋白的表达将会非常低。如果是基因是野生型的,我们最好先对其做个稀有密码子分析,如果密码子稀有的程度不高,可以使用Rosetta菌株用于表达这些含稀有密码子基因的目的蛋白。如果密码子稀有程度过高,最佳的处理方式是经过密码子优化后直接进行基因合成。
主要可能有两种原因,一种是大肠在加入IPTG等诱导剂后大肠停止生长或者裂解,这时候我们要考虑蛋白本身对该菌是有一定毒性的,这时候我们可以选择一些采用严紧控制的宿主菌株,比如带有pLysS的菌株。另外一种原因就是很令人头疼的了,当我们发现出现大面积摇瓶中细菌量逐渐降低甚至培养基回复到澄清状态,就应该怀疑噬菌体污染的可能性了。
有些蛋白质表达水平低,或者表达的大多是包涵体,通常情况下通过基因优化,载体及菌株的筛选,表达条件优化,诱导条件优化等可以有效增加蛋白的可溶性比率及表达量。
1.
密码子优化
密码子优化是根据大肠对密码子的偏好性进行优化筛选,一般选择使用频率大于20%的密码子。经过优化的基因序列能提高mRNA二级结构的稳定性,避免因为不充足的tRNA库导致翻译延迟,成熟前翻译终止,翻译移码和氨基酸错配。
2.
降低蛋白表达速率
通过降低IPTG的诱导浓度,降低蛋白的表达速率。通过调节促使肽链聚集的速率与其折叠速率平衡,有利于提高蛋白的可溶性表达。
3.
温度
37度的表达条件往往会使一些蛋白形成包涵体,而30度的表达条件则可能产生可溶的或者有活性的蛋白。在某些条件下(12-20度)延长诱导时间(过夜)会使溶解性蛋白的产量达到最大。
4.
细胞周质表达
我们可以选用一些将蛋白运输到细胞周质的载体。周质空间更有利于蛋白的正确折叠及二硫键的形成。常规选用的载体有pet22系列。但是我们要注意的是,有些蛋白并不适合于被运输到周质空间,比如一些与β-gal融合的周质的内部被证明是有毒的。
使用野生型基因在大肠杆菌表达中形成包涵体的概率是很高的,为了减少包涵体的形成,文明建议大家采用基因合成的方式获得基因。同时在实验中,结合降低诱导温度,例如12-20°C,降低IPTG浓度(0.01–0.1mM)并延长诱导时间,以及特殊培养基等手段获得更多的可溶蛋白。另外,我们需要分析蛋白本身是否疏水,如果蛋白本身的疏水性比较强,我们需要采用促溶标签融合表达蛋白来达到可溶的目的,如Trx,GST, NusA。但是形成包涵体也不是一个极坏的处境:往往包涵体表达量都非常高,而且纯化起来方便更容易获得高纯度的蛋白样品。对于一些需要蛋白去免疫动物制备WB类用途的项目来说,包涵体也是一个非常不错的选择。
得到一定量的包涵体后,可以尝试柱上复性或者透析/稀释复性,
柱上复性方式: 蛋白在变性状态下上柱后,使用一定浓度的尿素或盐酸胍、1mM还原型及0.2mM氧化型谷胱甘肽淋洗,随后用咪唑洗脱。
透析/稀释复性:在透析去除尿素的过程中加入还原型及氧化型谷胱甘肽
或者CHAPs等表面活性剂可以有助于蛋白的正确折叠。
主要原因有如下几个方面
1.
蛋白本身被降解了,可以存在一些不利于该蛋白稳定的蛋白酶
2.
翻译起始位点的问题:如果一个类似于核糖体结合位点(AAGGAGG)的序列加上适当的间隔序列出现在了ATG密码子上游,降解就会有可能出现。解决的方法可以采用两端都带有融合标签的载体,例如pET系列部分载体在N-端和C-端都有His-Tag融合标签。这样,全长蛋白就可以通过提高咪唑浓度,在洗脱时将截短蛋白与全长蛋白区分开。或者在蛋白两端采用不同标签,进而通过亲和纯化的方式得到全长蛋白。
3.
影响蛋白稳定性的另外一个因素是与N端Met相邻的氨基酸,即N端原则,当下列氨基酸出现在N端时: Arg、 Lys、Phe、Leu、Trp和Tyr 蛋白的半衰期较短,蛋白会存在不稳定降解的问题,特别是Leu,当它出现在第二个位置上时,蛋白极度不稳定。在选择克隆位点时, Nco I 和Nde I都是 是一个比较好的N端的克隆位点选择,而使用NdeI的时候就要特别留意Leu的出现。