邬贺铨院士:金融大模型改变了金融科技的范式

封面新闻记者 付文超

10月17日下午,百度世界·度小满金融大模型前沿发展论坛在北京召开,中国工程院院士邬贺铨在大会上表示“金融大模型改变了金融科技的范式,重塑金融行业的工作方式,改变了金融服务生态。”

据了解,目前金融大模型已经应用在金融资讯、产品介绍内容的文本自动生成,构建虚拟客服在线交互等方面,给用户提供更人性的服务,提升金融机构内容运营的效率。

邬贺铨认为,金融大模型的发展需要全行业共同参与,合作开发,“基础大模型多数从通用语料训练生成,通识能力强,可作聊天对话,但缺少行业专业知识,需要大模型提供方与垂直行业合作开发行业大模型”。

以度小满的开源金融大模型“轩辕”为例,它是将预训练数据(一般预训练、金融预训练)和指令数据(一般指令、金融指令)随机混洗到一个训练数据中进行混合微调,通过多阶段逐渐训练缓解预训练和微调间数据不匹配问题,提高模型的表达、理解、迁移和泛化能力。

度小满CEO朱光表示,“未来五年,生成式AI在金融领域的应用,将成为度小满最重要的战略方向。度小满将不断加大金融垂类大模型及应用的布局和投入,和业界一起把握机遇,推动新一轮金融科技发展浪潮。”

邬贺铨认为,金融大模型的发展目前仍面临着三方面挑战。首先是金融行业对数据安全性、隐私合规性都有着严格的要求。尤其是在风控方面,对时效性与精准性要求严格,而一般的基础大模型透明性、可信性、专业性不足,很难直接迁移为金融大模型。

第二点是金融大数据在成本与质量上的平衡问题。由于金融行业内的数据难以共享,因此金融大模型的数据规模远远不及通用语料,导致金融大模型难以产生“智能涌现”的效果。

第三则是本地私有部署需要自建算力设施,对软硬件产品有严格的信创要求,而且参数规模大则算力成本高。

对于金融大模型的落地应用途径,邬贺铨院士建议:一是从可控入手开发应用,例如智能客服、智能运营、写文章、写邮件等安全的领域出发。二是从人机混合智能切入,例如在初期阶段先让金融大模型与传统模型共存,经应用考验后再将金融大模型逐步替代传统模型。同时还可以通过变换场景,丰富大模型的场景迁移学习能力,或加入反事实的数据来测试,改进AI的学习本质,提高模型的泛化能力。也可以在金融大模型训练或微调时通过有监督学习思维链的模式,通过专家介入诱导它一步一步地进行思维推理。

【如果您有新闻线索,欢迎向我们报料,一经采纳有费用酬谢。报料微信关注:ihxdsb,报料QQ:3386405712】

展开阅读全文

页面更新:2024-03-19

标签:模型   语料   金融   小满   客服   范式   院士   指令   能力   智能   数据   行业   科技

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号

Top