中国科学家首次实现脑机接口实时合成汉语语句

图释:实时汉语解码脑机接口系统框架和电极贡献度表征

科学剃刀 | Science Razor

探索未知 · 理性的力量

刚刚,一项来自中国科学院的脑机接口研究,登上了国际顶刊《科学进展》(Science Advances)。这项研究成功实现了国际上首次针对汉语的脑机接口实时解码与语句合成。简单来说,他们让因脑卒中、渐冻症等疾病而无法说话的患者,有希望直接用‘想法’说出一句完整的汉语。

为何汉语脑机接口更具挑战

要让机器读懂大脑里的‘声音’,比想象中更难。国际上已有的突破主要针对英语。英语解码,可以近似看作是将脑信号‘翻译’成一个个独立的单词。

但汉语的‘游戏规则’完全不同。汉语是一种以单音节为主的声调语言。我们日常交流的数千个汉字,本质上是由约400个基础音节,加上阴平、阳平、上声、去声这四种声调组合而成。 也就是说,大脑在‘想说’一个汉字时,处理的不是一个整体的‘汉字概念’,而是‘音节+声调’这两个维度的信息。这对于脑机接口解码来说,是额外的复杂难题。

这项研究的核心突破,就在于它没有正面强攻‘解码所有汉字’这个庞大目标,而是巧妙地找到了一个稳定的‘中间解码单元’——汉语音节和声调。

他们如何‘读懂’汉语思维

研究团队的策略非常聪明。他们绕开了直接识别成千上万个汉字的‘硬骨头’,转而解码构成所有汉字基础的约400个音节和4个声调。

这套系统的工作流程可以这样理解:

首先,通过植入式的高通量柔性电极,以每50毫秒一个窗口的速度,采集大脑皮层中负责语言的高频电信号。

然后,系统会将脑电信号与发音的起始时刻对齐。一个专门设计的‘双流解码器’开始工作,它像两个并行的翻译官,一条通路分析发出什么音,另一条通路分析是第几声。

最后,将这两者得出的概率,与一个语言模型相结合,就像我们手机打字的联想输入,选出最可能构成的那句话。

整个过程实时进行,延迟极低。 实验数据显示,这套系统对394个汉语音节的纯神经解码平均准确率达到71.2%。解码一个音节仅需65毫秒,最终实时输出语句的速度达到了49.6字/分钟。这已经接近日常对话的语速。

突破在于汉语

在脑机接口帮助失语者‘说话’的赛道上,近年来的里程碑都基于英语。

2021年,美国团队实现了将想象中手写笔迹的脑信号解码为英文文本。 更早的突破则聚焦于解码英语语音相关的脑信号。这些研究证明了技术路线的可行性,但都建立在印欧语系的拼音文字逻辑上。

汉语的独特性,使得这些成果无法直接移植。 此次中国团队的成果,是这一国际前沿方向上至关重要的‘拼图’。它首次验证了针对单音节声调语言的解码模式是可行的,为全球超过十亿使用汉语的人群带来了直接希望。

它的影响远不止于‘说话’。在实验中,研究人员已经将解码出的语言转化为指令,实时操控了一只灵巧的机械手。这意味着,脑中的‘话’可以成为控制外部设备的通用指令。

研究者还让受试者通过系统,成功驱动数字分身并与人工智能大模型对话。这勾勒出一个未来图景:脑机接口可能成为人与数字世界、智能设备无缝交互的终极桥梁。

通向脑语互联的未来

回顾历史,从听懂指令到合成语音,人机交互的每一次进化,都让机器更懂我们。而脑机接口的终极目标,是跳过一切外部媒介,直接理解我们头脑中的意图。

这项关于汉语解码的研究,正是迈向这个宏大目标的关键一步。它解决的不仅是一个语言学的特殊问题,更验证了一种‘解码基础单元,再组合无限可能’的通用技术思路。

可以预见,未来融合了更精准的解码算法、更强大的语言模型和更自然的语音合成技术后,因疾病而沉默的人,将能重新用自己的音色和口吻与家人畅谈。

关于科学剃刀: 我们致力于传播最前沿的科学发现,涵盖物理、天文、量子力学及受控核聚变等领域。感谢您的关注与支持。

— 探索科学边界,洞察宇宙奥秘 —

展开阅读全文

更新时间:2026-01-14

标签:科技   汉语   语句   实时   接口   中国科学家   音节   汉字   声调   英语   语言   科学   系统

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight All Rights Reserved.
Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034844号

Top