ACM图灵大会开幕王海峰解读文心大模型3.5最新进展

7月28日-30日，顶级学术会议ACM中国图灵大会在武汉举办，围绕“通用智能，人机共生”主题，图灵奖得主、中国科学院院士、企业代表等与会探讨尖端技术及人工智能发展，展望计算科学未来。百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰解读文心大模型的核心技术，阐述人工智能产业模式，为人工智能技术及产业发声。

飞桨开发者数量已达到750万

当前，人工智能已经成为新一轮科技革命和产业变革的重要驱动力量，而深度学习是其关键核心技术，具有很强的通用性，呈现出标准化、自动化、模块化的工业大生产特征，推动人工智能进入工业大生产阶段。大模型具有效果好、泛化性强、研发流程标准化程度高等特点，成为人工智能发展的主流方向。

百度在“芯片-框架-模型-应用”人工智能四层技术栈全面布局，自研的深度学习平台飞桨支撑了文心大模型的高效训练和推理，截至目前飞桨平台开发者数量已达到750万。

据了解，文心一言是百度自主研制的知识增强大语言模型，首先从数万亿数据和数千亿知识中融合学习得到预训练大模型，在此基础上采用有监督精调、人类反馈的强化学习和提示等技术，并具备知识增强、检索增强和对话增强等技术优势。

王海峰解读了文心大模型3.5的核心技术创新，通过飞桨与文心协同优化，文心大模型3.5实现了基础模型升级、精调技术创新、知识点增强、逻辑推理增强等，模型效果提升50%，训练速度提升2倍，推理速度提升30倍。

在基础模型训练上，采用了飞桨最先进的自适应混合并行训练技术及混合精度计算策略，并采用多种策略优化数据源及数据分布，加快了模型迭代速度，显著提升了模型效果和安全性。同时，百度研发团队创新了多类型多阶段有监督精调、多层次多粒度奖励模型、多损失函数混合优化策略、双飞轮结合的模型优化等技术，进一步提升模型效果及场景适配能力。

在知识增强和检索增强基础上，文心大模型3.5提出了“知识点增强技术”，使得模型能够更好地利用精细的知识点来提升理解生成等方面的能力，进而提升对世界知识的掌握和运用。

在推理方面，通过大规模逻辑数据构建、逻辑知识建模、多粒度语义知识组合以及符号神经网络技术，提升文心大模型3.5在逻辑推理、数学计算及代码生成等任务上的表现。

文心大模型3.5还新增了插件机制，包括官方插件百度搜索和ChatFile，使得文心一言能够生成实时准确信息和长文本摘要，拓展了大模型能力边界。

Comate帮助80%百度工程师提升编程效率，已吸引100多家伙伴

王海峰在演讲中展示了文心一言的问答对话、文案生成、行程规划等能力，以及在办公、会议、编码等场景的应用。

工作中，文心一言化身“超级助理”，帮助总结工作沟通要点，实时记录会议内容，形成会议议题、摘要及总结等关键信息，可以通过各类插件完成指令任务，包括查询日程、创建会议、设置待办、申请休假等，也可以在工程师编码过程中自动推荐和生成代码。据悉，目前这些功能已通过智能工作平台“如流”应用于百度的工作流程中，Comate智能编码伙伴帮助80%百度工程师提升编程效率，吸引100多家合作伙伴。

对于大模型的产业模式，王海峰表示，在文心一言这类大模型产业落地的进程中，可以采用“集约化生产，平台化应用”的模式，即具有算法、算力和数据综合优势的企业将模型生产的复杂过程封装起来，通过低门槛、高效率的生产平台，为千行百业提供大模型服务，支撑产业智能化升级。（张雨薇）

来源：光明网

展开阅读全文

页面更新：2024-03-07

标签：模型人工智能知识点能力会议产业知识数据平台技术王海峰

1 2 3 4 5

ACM图灵大会开幕王海峰解读文心大模型3.5最新进展

微信被曝内测“小绿书”！与小红书异曲同工，网友：别再让我们的内存更臃肿了

丝杠行业研究报告：价值量与壁垒较高，国内企业纷纷布局

太牛了！h2oGPT直接操作本地PDF、Excel、Word、图像、等文件！

植入式无线系统的发展，内在潜力与挑战，近场耦合技术的发展

5年涨价超3倍，每小时最高8元！共享充电宝为何越来越贵，前景如何

首次长三角水鸟同步调查结果出炉，共记录到水鸟109种

山东莱西市总工会：点燃航天梦童心筑未来

焦点：“中国横扫全球一半！”，美国又多了一个焦心事......！

宫颈内的“永生”细胞被复制5000万吨卖到世界各地，患者却毫不知情，世卫组织总干事谭德塞发声

科技圈炸了！“室温超导”引爆资本市场狂欢，人类的终极能源来了？

腾讯追加捐赠1亿元驰援抗汛救灾

南岳机场奋力打造湖南“最美支线机场”

中图网被困人员已被救出！河北涿州最新消息

新疆大石峡水利枢纽工程：大国重器引来大国工匠观摩

台风天气能开空调吗？专家给出建议这种情况不要开

植入式无线系统的发展，内在潜力与挑战，近场耦合技术的发

郭明錤：室温超导若能商业化，iPhone也能有量子计算机的能

OPPO多平台LOGO背景由绿色换成黑色

非程序员小白版本地部署ChatGLM2-6B +LangChain 个人

世界母乳喂养周 - 一图看懂母乳喂养10条核心知识，建议

武汉地震监测中心遭境外黑客攻击周鸿祎：目的是窃取地

我国特高压技术有多牛？中国标准就是世界标准，实力打脸西

高端技术横空出世！全球只有中国有权掌握，美国求购三次而

“星仔”陪你过暑假 -无线电科普活动激起青少年的科普

歌尔光学新一代VR/AR光学模组亮相2023VR&AR显示光

ACM图灵大会开幕 王海峰解读文心大模型3.5最新进展

ACM图灵大会开幕王海峰解读文心大模型3.5最新进展