在自然界中,几乎所有生物体的蛋白质都是由20种天然氨基酸组成,这些氨基酸的排列组合形成了种类和功能各异的蛋白质,进而让生物体可以执行复杂的功能。不同于20种天然氨基酸,非天然氨基酸具有多样化的侧链基团,可以赋予蛋白质更优的或全新的物理。因此,实现非天然氨基酸在生命体中的遗传编码,将有助于设计并构建出具有全新功能的蛋白质,甚至改造出全新形式的细胞和生命体,促进基础。然而在细胞或生命体中遗传编码非天然氨基酸困难重重。经过几亿年的进化,几乎所有的生命体都在使用同一套遗传密码表,并且表中的64个密码子都被充分地用于编码20种天然氨基酸,因此理论上没有空间可供非天然氨基酸的编码。
2024年6月7日,浙江大学林世贤实验室在Science杂志发表了题为Rare codon recoding for efficient noncanonical amino acid incorporation in mammalian cells的研究论文。该研究工作另辟蹊径, 提出使用特定的稀有密码子代替空白密码子用于遗传编码非天然氨基酸的新思路,设计并开发了名为“稀有密码子重编码”(Rare Codon Recoding, RCR)的非天然氨基酸编码体系 (图1) 。通过系统的工程改造和核酸序列的大数据模型预测,稀有密码子重编码技术以接近天然氨基酸的编码效率高效合成系列带有非天然氨基酸的功能蛋白质,并在哺乳动物细胞中首次成功合成带有6个位点非天然氨基酸和4种不同类型非天然氨基酸的蛋白质。
在这项研究中,研究者首先指出遗传密码扩展技术 (Genetic Code Expansion, GCE) 中非天然氨基酸的低效率编码是翻译释放因子的强劲竞争所致。因此可通过使用有义密码子替换终止密码子用于编码非天然氨基酸,来规避翻译释放因子的竞争。而有义密码子的冗余性为重新分配简并密码子用于编码新的氨基酸提供了操作空间。且在61种有义密码子中,存在一类使用频率低于1%的密码子——稀有密码子,稀有密码子往往对应较低水平的解码tRNA (Decoding-tRNA,Dec-tRNA) 。研究者提出通过设计鲁棒性强的重编码tRNA (Recoding-tRNA,Rec-tRNA) 用来竞争较弱的解码tRNA,以实现将稀有密码子高效重编码成为非天然氨基酸(图2)。
基于该设想,研究者认为用于编码非天然氨基酸的理想稀有密码子应具备以下特性:1)内源解码tRNA丰度低;2)在转录本上使用频率较低;3)对应的重编码tRNA可被对应的正交合成酶有效识别;4)其周围的序列可被理性改造用于提高重编码效率。基于这一思路,他们通过分析所有61种有义密码子的使用频率和内源解码tRNA丰度,筛选出7种具有重编码潜力的稀有密码子,并通过系列实验,确定了TCG是最具重编码潜力的稀有密码子。随后,研究者优化了TCG重编码系统在哺乳动物细胞中的非天然氨基酸编码效率,实现以接近天然氨基酸的编码效率表达系列带有非天然氨基酸的功能蛋白质。(图3)研究者同时证明在TCG重编码系统工作时,表达体系的宿主细胞能够维持正常的转录、翻译和增殖等功能。
对于稀有密码子重编码体系来说,重编码的选择性是关键因素。研究者采用了相分离表达体系,将靶蛋白转录本和重编码翻译元件聚集在特定“无膜细胞器”的空间中实现重编码【6】,降低了转录组上背景TCG的重编码水平。实验过程中,研究者发现TCG密码子周围的核酸序列严重影响其重编码效率。基于此发现,研究者利用了化学蛋白质组学手段对转录组中含有TCG密码子的核酸序列进行富集和定量分析;再结合线性回归算法,提出依据TCG密码子周围序列来预测重编码效率的回归模型;并验证了回归模型对于重编码效率提升的可行性和通用性。
最后,研究者发现稀有密码子重编码体系对于主要的非天然氨基酸翻译系统都有兼容性和通用性,验证了十余种被不同翻译系统识别的功能非天然氨基酸都可被稀有密码子重编码体系高效地重编码。并且,利用稀有密码子重编码体系,研究者还首次实现在单一蛋白质中同时编码多达6个位点和4种不同类型的非天然氨基酸,充分展示了稀有密码子重编码体系的优越性。
据悉,博士后丁文龙、博士生于微和博士后陈宇霖是论文的共同第一作者,林世贤研究员是本文的通讯作者。
浙江大学林世贤团队聚焦于中心法则的翻译过程,整合交叉学科的研究手段,探索tRNA和蛋白质修饰的生物学功能和工程改造,并致力于开发新型生物医药,用于重大疾病和罕见遗传病的诊疗。团队近五年在Science、Nat. Cell Biol.、Nat. Chem. Biol.、Nat. Chem.、Nat. Struct. Mol. Biol.等期刊发表研究成果。欢迎感兴趣的博士后和研究生联系并申请加入。
合成生物学通过人为设计和建造新的基因组和生物体,来解决医学、能源、环境、农业等问题。作为一个整合型的、交叉融合的学科,通过合成生物学合成的新型物质和材料,不仅与生、化、环、材等科学的基础研究紧密联系,还与国计民生密切相关。通过合成生物学的全新视野与社会需求的有机整合,有望生产一些更加优质高效、经济环保的产品,甚至是突破那些尚未被生产出来的产品。利用合成生物学方法生产有价值的功能小分子产品和药物的研究已取得了较好的进展,但利用合成生物学方法表达和生产带有特定修饰的大分子产品和药物仍处于起步阶段。生物大分子药物的绿色智造是国际医药产业的前沿,这一研究领域需要科学家更好地实现对翻译过程的合成生物学重构!
依托“合成生物学”重点研发专项,林世贤团队开发了一种名为稀有密码子重编码 (Rare Code Recoding, RCR) 的非天然氨基酸遗传编码新技术,对翻译过程开展了高效的合成生物学重构,以接近天然氨基酸的编码效率表达了多种带有非天然氨基酸的蛋白质。在近二十种不同类型的非天然氨基酸上,研究团队都证实了稀有密码子重编码技术的通用性,高效编码了带有生物正交基团,翻译后修饰和交联功能的非天然氨基酸。研究团队还在哺乳动物细胞中首次实现了6个位点非天然氨基酸和4种不同类型非天然氨基酸的同时遗传编码。最后,他们还发现嵌合苯丙氨酸翻译系统、大肠杆菌酪氨酸翻译系统和大肠杆菌亮氨酸翻译系统都可能以接近天然氨基酸的编码效率重编码各自的非天然氨基酸。这一技术体系为300多种非天然氨基酸的高效编码提供了合成生物学利器,为表达和生产带有特定修饰的大分子产品和药物提供了全新的路线。
现有的遗传密码子拓展技术 (Genetic Code Expansion,GCE) 的原理是依赖于向目标基因的特定位点引入空白密码子 (blank codon,即不赋予天然氨基酸内涵的密码子,最常用的为终止密码子) ,而后通过正交的氨酰-tRNA合成酶/tRNA对将非天然氨基酸引入到空白密码子处,实现非天然氨基酸的遗传编码。然而空白密码子或者终止密码子的使用不可避免地会在引入位点附近产生翻译释放因子与抑制性tRNA之间的激烈竞争,从而导致非天然氨基酸的低效编码和大量截短蛋白质的产生,该问题在哺乳动物细胞中尤为突出,极大地限制了非天然氨基酸编码技术在生物医学领域的广泛应用。
林世贤等成功开发了一种名为稀有密码子重编码 (Rare Code Recoding, RCR) 的非天然氨基酸遗传编码新技术。RCR在原理上与GCE不同,通过利用稀有密码子有效地规避了翻译释放因子的激烈竞争,从而解决了哺乳动物细胞中高效编码非天然氨基酸的瓶颈问题。他们通过系统的工程改造,建立了新型的大数据模型预测,在哺乳动物细胞中成功实现了以接近天然氨基酸编码效率,高效、高保真度地编码非天然氨基酸。有意思的是,论文进一步发现RCR技术能够兼容目前常用的几乎所有“正交氨酰-tRNA合成酶/tRNA对”,并利用重编码的“正交氨酰-tRNA合成酶/tRNA对”成功实现了十余种功能非天然氨基酸的重编码。经过过去二十多年的研究积累,人们利用GCE技术已经成功实现了300多种非天然氨基酸的遗传编码。RCR技术的突破理论上可将这300多种非天然氨基酸转移到稀有密码子重编码体系中,显著提升人们设计和合成带有非天然氨基酸蛋白质的能力。这一原创工作将为基于非天然氨基酸的蛋白质及生物医药研发开辟新的路径。