
想象一下,如果我们的DNA不仅仅是那个标志性的双螺旋结构,而是一条布满“活结”的智能绳索,这些结在瞬间打上又在瞬间解开,无声地指挥着生命的交响乐。这听起来像是科幻小说,但这正是分子生物学领域最新的一项突破性发现。
来自高等经济大学(HSE University)等机构的国际科学家团队,利用人工智能技术成功绘制了第一张全面的DNA四链体(G-quadruplexes)图谱。这项发表在权威期刊《核酸研究》上的成果,不仅揭示了约36万个此前难以捉摸的微观结构,更重要的是,它发现这些“DNA结”在癌症细胞中扮演着截然不同的角色——它们从组织特异性的“管家”,变成了助推肿瘤无限增殖的“帮凶”。
长期以来,生物学家们一直被一个难题困扰:DNA四链体——一种由富含鸟嘌呤的区域折叠成的四股结状结构——虽然被认为在基因调控中至关重要,但它们太不稳定了。这些结构在基因组中形成和消失的速度极快,传统的全基因组测序技术往往只能捕捉到它们活动的零星片段,就像试图用老式相机拍摄高速飞行的子弹。
为了突破这一瓶颈,研究团队没有依赖传统的湿实验,而是转向了人工智能。他们使用了一个名为DNABERT的基因组语言模型,这就好比训练一个精通“DNA语言”的ChatGPT。研究人员利用世界上最大的经实验验证的四链体数据库EndoQuad对模型进行了微调,开发出了GQ-DNABERT模型。
这个AI模型的强大之处在于它不仅仅盯着DNA序列本身,还能“读懂”周围的上下文环境。高等经济学院生物医学研究与技术中心主任玛丽亚·波普佐娃(Maria Poptsova)解释道:“该模型评估DNA序列及其周围环境,以预测四链体可能形成的位置。”最终,AI预测出了大约36万个四链体结构,这个数字远远超过了此前任何实验方法所能检测到的极限,相当于为我们打开了一张全新的基因组高清地图。

科学家在实验室中将样品移液到托盘中,进行DNA检测。 盖蒂图片社
随着地图的展开,一个令人惊讶的规律浮出水面:这些“DNA结”并不是独行侠。科学家们首次证实,四链体倾向于成对出现,并且位置非常讲究。
它们通常分别位于基因的“启动子”区域(基因转录的起始点)和附近的“增强子”区域(放大基因活性的调节元件)。这两个位置的四链体就像是一对搭档,或者说是两把钥匙,它们在三维空间中相互配合,将基因的起始开关与远处的调节器连接起来,从而共同启动或增强基因的表达。
这种成对机制的发现,彻底改变了我们对基因调控的认知。过去我们以为基因开关是线性的、平面的,现在看来,它们更像是一个立体的、动态的折纸游戏。
然而,这项研究最引人深思的部分在于它对癌症机制的揭示。当研究人员将这张四链体图谱叠加到来自六种不同组织类型的单细胞测序数据上时,他们看到了健康细胞与癌细胞之间惊人的差异。
在健康的组织细胞中,这些成对的四链体扮演着尽职尽责的“管家”角色。它们主要调控那些具有组织特异性的基因——比如在大脑中,它们帮助神经元传递信号;在血液中,它们协助免疫反应;在肠道中,它们维持上皮细胞的功能。此时,它们是维持生命秩序的守门人。
但在肿瘤细胞中,情况发生了诡异的逆转。虽然四链体对的数量并没有显著变化,但它们控制的对象变了。波普佐娃指出,在癌细胞中,这些配对不再服务于特定的组织功能,而是转向了普遍存在的生长程序。它们开始疯狂地开启那些与细胞分裂和生长相关的基因,完全无视原本的组织属性。
换句话说,癌细胞“劫持”了这套精密的四链体调控系统。它利用这些“DNA结”作为加速踏板,驱动肿瘤无限制地增殖,而不再关心自己原本是肺细胞、肝细胞还是乳腺细胞。这种从“特异性分化”到“通用性生长”的转变,正是癌症难以治愈的核心机制之一。
这项发现的意义远不止于理论层面,它为未来的抗癌疗法提供了一个全新的靶向思路。目前的化疗往往是杀敌一千自损八百,因为它们攻击的是所有快速分裂的细胞。而如果我们能够开发出专门针对这些异常“四链体对”的药物——特别是那些在癌细胞中被错误激活的配对——我们就可能实现对肿瘤基因表达的精准阻断,而不影响正常细胞的功能。
这就像是找到了切断癌细胞通讯网络的剪刀。虽然距离临床应用还有很长的路要走,但GQ-DNABERT模型的建立和这张36万个节点的图谱,无疑为科学家们指明了方向。在这个由AI和生物技术交织的新时代,我们正在逐步看清生命最深处的奥秘,也正在掌握对抗疾病的更强大武器。
更新时间:2025-12-26
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-=date("Y",time());?> All Rights Reserved. Powered By bs178.com 闽ICP备11008920号
闽公网安备35020302034844号