人工智能重塑生命密码:首次设计出超越自然界的基因编辑蛋白质

信息来源:
https://phys.org/news/2025-10-generative-ai-outperform-nature-proteins.html

科学家们首次利用生成式人工智能成功设计出比自然界现有蛋白质更高效的基因编辑工具,这一突破性成果将彻底改变癌症治疗和罕见疾病的基因疗法。巴塞罗那庞培法布拉大学、基因组调控中心与Integra Therapeutics公司的联合研究团队在《自然生物技术》杂志上发表的最新研究显示,人工智能不仅能够发现自然界中未知的生物多样性,更能创造出全新的功能性蛋白质。

这项研究的核心在于对PiggyBac转座酶系统的革命性改进。转座酶是一类能够将DNA序列精确"剪切"并"粘贴"到基因组中的酶类,在基因治疗中发挥着关键作用。研究团队通过计算生物勘探技术扫描了超过31000个真核基因组,发现了13000多个此前未知的PiggyBac序列,其中10种在人类细胞中表现出活性。这一发现本身就大大扩展了可用于基因编辑的天然工具库。

更令人瞩目的是,研究人员随后运用蛋白质大语言模型这一生成式人工智能技术,以发现的13000个序列为训练数据,成功设计出活性更强的全新转座酶。这些人工设计的蛋白质不仅保持了原有的功能特性,在某些应用场景中甚至超越了经过实验室优化的自然版本。

从生物勘探到智能设计的技术飞跃

PiggyBac 生物勘探。图片来源:自然生物技术(2025)。DOI:10.1038/s41587-025-02816-4

传统的蛋白质工程主要依赖于对自然蛋白质的修改和优化,这种方法虽然已经取得了显著成果,但受限于自然界中蛋白质的固有特性。此次研究采用的方法论代表了一个根本性的转变:从被动地利用自然资源转向主动地创造新的生物工具。

研究团队首先通过大规模计算筛选揭示了转座酶家族远比此前认知更为丰富的多样性。这种计算生物勘探技术利用先进的序列比对算法和功能预测模型,能够在海量基因组数据中识别出具有特定功能的蛋白质序列。在发现的13000多个新序列中,研究人员选择了代表性样本进行实验验证,结果显示其中约0.08%具有可检测的转座活性。

这一比例看似很低,但考虑到筛选的规模,实际上代表了数十种全新的功能性转座酶。更重要的是,这些新发现的酶在人原代T细胞中表现出了优异的活性,而T细胞正是CAR-T癌症免疫疗法的核心组成部分。

基于这些发现,研究团队训练了专门的蛋白质大语言模型。与处理自然语言的ChatGPT类似,这些模型学习了蛋白质序列的"语法规则",能够理解氨基酸组合与蛋白质功能之间的复杂关系。通过这种深度学习方法,人工智能能够生成全新的蛋白质序列,这些序列虽然在自然界中不存在,但遵循生物学的基本原理。

临床应用前景与技术挑战

这项技术突破对基因治疗领域具有深远的意义。当前的基因编辑技术虽然已经在某些疾病治疗中取得成功,但仍面临效率不高、安全性concerns和成本昂贵等问题。新开发的人工智能设计蛋白质有望在多个方面改善这些局限性。

在癌症治疗方面,改进的转座酶系统能够更高效地将治疗基因导入T细胞,提升CAR-T疗法的效果。研究数据显示,某些人工设计的转座酶在人原代T细胞中的活性显著超过现有的商业化版本,这可能意味着更少的细胞操作步骤、更短的制备时间和更低的治疗成本。

对于罕见疾病的基因治疗,精确和高效的基因导入更是至关重要。许多罕见疾病由单基因缺陷引起,理论上可以通过导入正确的基因版本来治疗。然而,现有技术的局限性使得这种"简单"的治疗方案在实践中面临巨大挑战。新的转座酶系统可能为这些患者带来新的希望。

研究还证明了人工智能设计的转座酶与FiCAT等先进基因编辑平台的兼容性。FiCAT技术能够实现更精确的基因组插入,结合高活性的转座酶,可能实现前所未有的基因编辑精度和效率。

尽管前景广阔,这项技术在走向临床应用之前还需要克服多重挑战。首先是安全性验证。人工设计的蛋白质需要经过严格的毒性测试和免疫原性评估,确保它们不会在人体内引起不良反应。其次是长期稳定性问题。新设计的蛋白质在体内环境中的稳定性和持续活性需要通过长期研究来验证。

人工智能驱动的生物技术新时代

这项研究代表了人工智能在生命科学领域应用的一个重要里程碑。它不仅展示了机器学习在理解和预测生物系统方面的强大能力,更重要的是证明了AI可以成为创造性的科研工具,而不仅仅是分析工具。

Integra Therapeutics首席执行官阿文西亚·桑切斯-梅希亚斯博士强调了这一成就的革命性意义:"这是我们第一次使用生成式人工智能来创建合成部件并扩展自然界的能力。"这种能力的意义远超单一的技术应用,它预示着一个新的科学范式的出现。

基因组调控中心的诺埃利亚·费鲁斯博士进一步阐释了这种技术的工作原理:"这些AI模型使用地球上所有已知的蛋白质序列进行训练,学习了蛋白质的内在语言或'语法'。使用这种语法,它们能够流利地'说'这种语言,产生保持结构和功能意义的全新蛋白质。"

这种"蛋白质语言学"的概念开启了生物工程的新可能性。传统上,蛋白质设计需要深入的结构生物学知识和复杂的物理化学计算。而基于大语言模型的方法则通过模式识别和统计学习,能够在不完全理解底层机制的情况下生成功能性蛋白质。

从更广阔的视角来看,这项技术的成功可能催化整个生物技术产业的转型。药物开发、工业酶设计、生物材料制造等多个领域都可能受益于这种AI驱动的蛋白质设计技术。随着计算能力的不断提升和算法的持续改进,人工智能设计的生物分子可能在未来几年内成为生物技术研究的标准工具。

然而,这种技术进步也带来了新的伦理和监管挑战。人工创造的生物分子需要新的安全评估标准和监管框架。国际科学界需要建立共识,确保这些强大的工具被负责任地使用,既要释放其治疗疾病的潜力,又要防范可能的风险。

展开阅读全文

更新时间:2025-10-07

标签:科技   人工智能   自然界   蛋白质   基因   编辑   密码   生命   序列   技术   生物   基因组   活性   功能   细胞

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By bs178.com 闽ICP备11008920号
闽公网安备35020302034844号

Top