Global
EN

【领康时代CDMO】应对大肠杆菌异源蛋白低表达或不表达难题的策略

服务资讯 2025-04-28

Strategies to overcome the challenges of low or no expression of heterologous proteins in Escherichia coli


Strategies to overcome the challenges of low or no expression of heterologous proteins in Escherichia coli


大肠杆菌表达作为基因工程中应用最广泛的宿主,具有快速生长、培养条件简单、分子工具丰富、易于遗传改造等优势。大肠杆菌表达系统已成功应用于生产多种重组蛋白药物,例如胰岛素、生长激素、干扰素等。但是部分外源基因在大肠杆菌中无法表达或表达水平很低,限制了新药开发和蛋白质工程的研究;部分毒性蛋白质会损害大肠杆菌细胞,导致生长抑制或死亡,影响了蛋白质的生产效率;部分蛋白质在大肠杆菌中错误折叠并聚集形成包涵体,难以进行纯化和功能研究。因此,本文总结导致大肠杆菌中重组蛋白表达失败的因素和提供解决这些问题的策略和方法。

01、重组蛋白表达过程

以大肠杆菌 BL21 (DE3) -T7 表达系统为例,在该系统中,靶基因的表达受载体上 IPTG 诱导的 T7 启动子的调节。大肠杆菌 BL21 (DE3) 的基因组经过工程改造,含有识别 T7 启动子的 T7 RNA 聚合酶基因,该基因受 PlacUV5由 IPTG 诱导的启动子控制。

向培养基中添加 IPTG 会触发 lacUV5 启动子的激活,从而导致特异性 T7 RNA 聚合酶的合成。随后,T7 RNA 聚合酶在 IPTG 的作用下识别并激活位于重组质粒上的 T7 启动子,以启动靶基因的高效转录,所得 mRNA 由宿主细胞的核糖体翻译以产生所需的重组蛋白。

重组蛋白表达过程


02、重组蛋白表达失败原因

·  蛋白质毒性

部分外源蛋白对大肠杆菌细胞具有毒性,会干扰细胞的正常生理过程,导致生长抑制甚至死亡。

例如,一些核糖核酸酶、DNA结合蛋白、激素受体等蛋白会损害细胞,使其无法正常生长和繁殖。蛋白质毒性是导致大肠杆菌表达失败的主要原因之一。

· 基因序列的影响

 密码子偏差: 不同生物对同一种氨基酸的编码存在差异,导致大肠杆菌中某些密码子(如稀有密码子)的利用率低,翻译效率低,最终导致蛋白质表达失败。

 mRNA结构: mRNA的结构会影响翻译的各个阶段,例如核糖体结合、翻译起始和肽链延伸。不利的mRNA结构,例如5’端结构复杂或存在阻碍翻译的序列,会导致蛋白质表达失败。

 · 宿主菌株的选择

 不同的大肠杆菌菌株具有不同的特性,例如蛋白折叠酶活性、蛋白酶活性等,这会影响外源蛋白的表达和折叠。

 · 表达系统

 不同的表达系统具有不同的优缺点,例如T7表达系统、lac表达系统等,选择合适的表达系统可以提高蛋白质的表达水平。

 · 培养条件

 培养条件,例如温度、pH、营养物质等,会影响大肠杆菌的生长和蛋白质的表达。

 这些因素相互作用,共同决定了外源蛋白在大肠杆菌中的表达水平。

03、解决大肠杆菌表达问题的策略

·  蛋白质毒性

- 控制表达水平: 选择合适的启动子和诱导剂,优化诱导条件,以降低外源蛋白的毒性。

- 分泌表达: 将外源蛋白与信号肽连接,将其分泌到细胞外,避免细胞毒性问题。

- 宿主菌株改造: 改造宿主菌株,例如添加蛋白酶抑制剂、蛋白质折叠酶等,提高宿主细胞的耐受性。

- 表达时间控制: 在诱导表达之前,先让细胞在非诱导条件下培养一段时间,让细胞适应外源蛋白的表达。

· 基因序列的影响

- 密码子优化: 使用密码子优化软件,将外源基因的密码子序列优化为宿主细胞更易利用的密码子序列,以提高翻译效率和折叠效率。

- mRNA结构预测和优化: 使用软件预测外源基因的 mRNA 结构,并根据预测结果进行优化,例如减少 5’端的二级结构,避免存在阻碍翻译的序列等。

- tRNA 补充: 使用带有稀有密码子 tRNA 的宿主菌株,例如 Rosetta 系列菌株,以解决稀有密码子导致的翻译问题。

· 其他因素

- 宿主菌株选择: 选择合适的宿主菌株,例如具有更高表达水平、更好折叠能力或更强分泌能力的菌株。

宿主菌株选择

- 表达系统选择: 选择合适的表达系统,例如分泌表达系统、膜蛋白表达系统等,以适应不同类型的蛋白质。

表达系统选择

- 培养条件优化: 优化培养条件,例如温度、pH、营养物质等,以提高外源蛋白的表达水平和细胞生长。

- 融合标签选择: 选择合适的融合标签,例如 MBP、SUMO、TrxA 等,以提高蛋白质的表达水平和溶解度。


融合标签选择

04、基于大数据和深度学习的综合优化方法

主要利用人工智能技术从大量已成功表达蛋白的数据中学习规律,并根据这些规律来预测和优化目标蛋白的表达。 具体来说,可以采用以下几种方法:

- 深度学习模型:利用深度神经网络构建模型,例如多层深度神经网络(MPEPE),通过对大量已成功表达蛋白的序列和表达水平数据进行训练,学习不同序列特征与表达水平之间的关系,从而预测目标蛋白在不同基因序列下的表达水平,并指导基因序列的优化。

- 集成学习方法:利用集成学习方法,例如梯度提升机(GBM)构建模型,结合多个模型的结果来提高预测的准确性。例如,SoluProt 就利用了 TargetTrack 数据库和 GBM 构建模型来预测蛋白的溶解度表达水平。

- 深度学习框架:利用深度学习框架,例如 DeepTESR,对翻译延伸短坡序列(TESR)进行优化。DeepTESR 通过学习 TESR 与蛋白表达水平之间的关系,预测 TESR 对目标蛋白表达的影响,并指导其优化。

- 结合其他方法:将深度学习模型与其他方法相结合,例如将 RNA 结构预测和编码优化相结合,以提高预测和优化目标蛋白表达的准确性。

05、总结

解决大肠杆菌表达问题的策略多种多样,需要根据外源蛋白的特性、宿主菌株的特性、表达系统的特性和培养条件的特性进行综合考虑。通过采取合适的策略,可以提高外源蛋白的表达效率和产量,满足生物制药、蛋白质工程等领域的需求。