AI还能加速新药研发?《自然・通讯》报喜,癌症与传染病新进展!

最近《自然・通讯》上发了个挺有意思的研究,美国伊利诺伊大学和范德堡大学的团队搞出个叫Lasso ESM的AI工具,专门用来预测“套索肽”的特性。

其实,这东西要是能用上,以后找癌症、传染病的新疗法,可能会快不少。

套索肽这玩意儿,是细菌自己合成的天然产物。

先跟你说它怎么来的,细菌里的核糖体先弄出一条线性的氨基酸链,之后特定的生物合成酶会把这条链折成“绳结”那样的结构。

就这么个结构,让它特别稳定,而且还能有抗菌、抗病毒甚至抗癌的本事。

范德堡大学的道格・米切尔,就是这个研究的联合负责人,他说套索肽既能当靶向特定受体的工具,还可能做成稳定的口服药。

你想啊,口服药对病人多方便,要是能稳定不轻易失效,那实用性就高多了。

本来想靠现有的AI帮忙研究套索肽,比如谷歌旗下Deep Mind搞的Alpha Fold,这AI在蛋白质预测领域名气不小,帮科学家省了不少时间。

但后来发现,它碰到套索肽就没辙了。

伊利诺伊大学的迪瓦卡尔・舒克拉也是联合负责人,他说因为套索肽那独特的绳结结构,现有的主流AI程序都没法有效预测它的结构。

其实也能理解,通用AI都是靠大量常见数据训练的,套索肽这种特殊结构的数据本来就少,它没学过,自然就“看不懂”。

套索肽是块“好料子”,可之前的AI都“啃不动”

早年间人们就发掘过套索肽的价值,比如1995年第一次分离出来的microcinJ25,就能抑制大肠杆菌生长。

而且因为它那绳结结构,能抵抗蛋白酶的降解,在肠道感染治疗里挺有潜力。

说穿了,细菌合成这东西,其实就是为了在生存竞争里占上风,用来对付其他微生物的。

跟传统的小分子药物比,套索肽的优势很明显。

一方面绳结结构能让它在人体内更稳定,不容易被代谢掉;另一方面它的氨基酸序列能精准结合靶点,这样副作用就能少很多。

现在很多药物要么容易失效,要么毒性大,套索肽刚好能补这些短板。

可问题在于,怎么预测它的特性?以前科学家只能靠实验一点点试,既费时间又费力气。

通用AI之所以搞不定,还有个原因是套索肽的实验数据太少。

Alpha Fold主要靠大量已知三维结构的数据训练,可套索肽的绳结区域涉及十到二十个氨基酸残基的复杂作用。

想靠实验解析它的结构,比如用X射线晶体衍射,得花六到十二个月,现在公开的结构数据还不到一百条。

而且套索肽的结构稍微变一点,活性就可能不一样,通用AI根本抓不住这种细微的变化。

另外,负责给套索肽“打结”的套索环化酶,跟肽的配对也没什么明显规律,以前想找合适的配对,只能一个一个试,效率低得要命。

LassoESM专啃“硬骨头”,靠的是“量身定制”的本事

既然通用AI不行,那研究团队就想着给套索肽搞个“专属AI”,这就是LassoESM的由来。

第一步得有靠谱的数据,米切尔团队先用生物信息学的方法,从不同微生物里筛选套索肽的序列,一下子找了好几千条。

但光多没用,数据得准,他们又一条条人工验证。

其实,这活儿肯定特别繁琐,他们得用质谱和核磁共振一起上,确认序列没问题,还得把那些结构不完整的假阳性序列去掉,最后大概剔除了15%的初始序列。

数据准备好了,接下来就是教模型“说话”。

舒克拉团队用了“掩码语言模型”的方法,简单说就是故意把肽序列的一部分藏起来,让模型去猜藏起来的是什么。

这么反复练,模型慢慢就摸清了自然界里套索肽绳结结构形成的规律。

舒克拉研究组的新晋博士米玄楠说,之前因为实验数据少,酶和肽之间的相互作用又复杂,预测套索肽特性一直是个大难题,现在有了Lasso ESM,这些问题就好办多了。

跟通用的蛋白质模型比,Lasso ESM走的是“小而精”的路子。

通用模型比如ESM-1b,训练数据有八百五十万条蛋白质序列,而LassoESM只用了五千条经过验证的套索肽序列。

他们还用上了迁移学习,先拿少量套索肽数据给模型打基础,再用一百组已经验证过的“肽-环化酶”配对数据微调,最后模型的预测准确率到了82%,而通用模型才只有51%。

其实,这种针对性的训练,比盲目堆数据管用多了。

现在LassoESM已经能派上用场了,最主要的就是预测套索肽和套索环化酶的配对。

不同的肽得找特定的环化酶才能“打结”,以前科学家得试二十种环化酶,花三个月才能找到合适的,现在用LassoESM,一周就能搞定。

舒克拉说,要是能摸清环化酶的底物范围,甚至改造环化酶,理论上就能把任意肽链都变成有高稳定性的套索结构。

有生物制药公司已经跟他们合作,用这个模型筛选抗肺癌套索肽的环化酶配对,原本预计一年的周期,现在三个月就能完成,研发成本直接降了不少。

未来这团队还想扩展模型的功能,比如给其他肽类天然产物,像抗菌肽、抗肿瘤肽之类的,也做定制化的语言模型,还想直接设计能靶向特定疾病相关蛋白质的新套索肽。

2023年全球肽类药物市场规模差不多有五百亿美元,主要集中在糖尿病和癌症领域,但现在的肽类药物大多是线性结构,稳定性不够。

要是LassoESM能帮着开发出更多稳定的套索肽药物,那对整个肽类药物领域都是个大好事。

说到底,LassoESM不光是解决了一个技术问题,更重要的是它让套索肽这种有潜力的分子,离真正用于治病更近了一步。

以前科学家只能像门外汉一样,慢慢摸索套索肽的奥秘,现在有了这个能“读懂”绳结语言的AI,就能从“破译者”变成“创造者”,用套索肽来对付癌症、传染病这些顽疾。

展开阅读全文

更新时间:2025-10-20

标签:科技   新药   传染病   癌症   自然   通讯   套索   结构   模型   数据   序列   伊利诺伊   蛋白质   团队   稳定   科学家

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By bs178.com 闽ICP备11008920号
闽公网安备35020302034844号

Top