“紫东太初” 全模态大模型发布搭建平台为产业赋能

央广网北京6月19日消息（记者卜叶）透过《月光曲》畅谈贝多芬的故事，在三维场景里实现精准定位，通过图像与声音的结合完成场景分析……

近日，在人工智能框架生态峰会2023上，中国科学院自动化研究所所长徐波正式发布“紫东太初”全模态大模型，并对外展示了新版本的新功能。

人类认知世界时，往往同时涉及语音、图像、文字等信息。机器需要实现更高水平的智能，就需要像人一样，发展贯通图、文、音等更多模态的大模型。自2019年起，中国科学院自动化研究所（以下简称“自动化所”）即坚持以“图-音-文”多模态技术为核心，确立多模态大模型布局，整合所内图像、文本、语音等研究方向的优势资源开展集团式攻关。

2021年9月，三模态大模型“紫东太初”发布，首次实现语音生成视频等功能，向发展通用人工智能迈出了坚实的第一步。

此次，基于1.0版本升级打造的2.0版本，在语音、图像和文本三模态的基础上，加入视频、传感信号、3D点云等模态数据，研究突破了认知增强的多模态关联等关键技术，具备全模态理解能力、生成能力和关联能力，面向数字经济时代加速通用人工智能的实现。

“紫东太初”2.0可以理解三维场景、传感信号等数字物联时代的重要信息，完成了音乐、图片和视频等数据之间的跨模态对齐，能够处理音乐视频分析、三维导航等多模态关联应用需求，并可实现音乐、视频等多模态内容理解和生成。从1.0到2.0，“紫东太初”大模型打通了感知、认知乃至决策的交互屏障，使人工智能进一步感知世界、认知世界，从而延伸出更加强大的通用能力

“紫东太初”2.0以自动化所自研算法为核心，以昇腾AI硬件及昇思MindSporeAI框架为基础，依托武汉人工智能计算中心算力支持，着力打造全栈国产化通用人工智能底座。长期以来，强大的算力支撑是约束我国人工智能发展的瓶颈之一，以“紫东太初”大模型为领头雁开展的创新实践将有力推动国产基础软硬件与大模型技术的适配，协同构建我国通用人工智能自主可控发展生态。

会上，徐波首次对外实时展示了大模型在音乐理解与生成、三维场景导航、信号理解、多模态对话等方面的全新功能。

目前，“紫东太初”大模型已展现出广阔的产业应用前景，在神经外科手术导航、短视频内容审核、法律咨询、医疗多模态鉴别诊断、交通违规图像研读等领域开始了一系列引领性、示范性应用。

在医疗场景，“紫东太初”大模型部署于神经外科机器人MicroNeuro，可实现在术中实时融合视觉、触觉等多模态信息，协助医生对手术场景进行实时推理判断。同时与北京协和医院合作，利用“紫东太初”具备的较强逻辑推理能力，尝试在人类罕见病诊疗这个挑战性医学领域有所突破。

徐波表示，自动化所以“紫东太初”大模型为基础，持续探索与类脑智能、博弈智能等技术路径的相互融合，最终实现可自主进化的通用人工智能。并将探索在更多领域发挥赋能价值，为促进我国数字经济快速发展贡献力量。

展开阅读全文

页面更新：2024-03-20

标签：太初中国科学院模型人工智能认知语音场景图像能力产业平台视频

1 2 3 4 5

“紫东太初” 全模态大模型发布搭建平台为产业赋能

国产AI大模型再突破产品与应用有望迎来释放

中国首次！西安交大参与打破20年“国外垄断”，成果最新登顶《自然》！

国产AI“先问”会看脸色

不卖白菜价！中国打响“稀土保卫战”，美国急了：技术不该有国界

微信上线新功能！网友：看完恍然大悟……

广西南宁“铁海联动”保障通航桥梁设备安全

与硅基芯片息息相关，“硅基胶体量子点片上发光研究”取得进展

机场回应航班取消未告知乘客：航司起飞前一分钟才通知

绿厂618最终战报出炉！多款新机卖爆，同价位产品力够硬是关键！

智能多链路聚合系统原理及优势

（经济）广州白云站钢结构全面封顶

线上线下买不停有吃有喝有故事

山东钢铁地产挂牌济南中锦置业40%股权及相关债权底价9.66亿元

香港交易所将于6月19日推出“港币–人民币双柜台”模式

「深度」走出停滞期，诞生新格局-房地产行业2023年中期策略

国产AI大模型再突破产品与应用有望迎来释放

西藏市场监管局举办培训班促肉制品产业健康发展

视频｜新京报记者直击巴黎航展-中国展台篇

以“网”链接数字未来-业内人士热议数字产业变革动力

东方通：计划年底前实现涉诈风险智能语音提醒等场景AI识

太原新建一座产业新城！住宅、商业、中小学...一应俱全！

海南儋州布局“湾区经济” 建设自贸港产业新城

周末日均8万人次坐火车来青！青岛的夏天“场景”更丰富

（经济）以“网”链接数字未来-业内人士热议数字产业变革

卫星化学：产业园项目资金来源主要为自有资金看好该行

“紫东太初” 全模态大模型发布 搭建平台为产业赋能

“紫东太初” 全模态大模型发布搭建平台为产业赋能