大模型将彻底改变 AI 模型的开发模式

(报告作者:国泰君安分析师 李沐华、齐佳宏)

大模型将彻底改变 AI 模型开发模式;多模态输入将使应用场景进一步拓展,并加速模型自身的迭代;大模型能力将集中在 IT 巨头手中,小企业的机会在于前端应用。

大模型将彻底改变 AI 模型开发模式,使其能够触达更广泛的场景

虽然对于大模型的广泛讨论源自于聊天与内容生成,但其意义远不止于此。和小模型不同,大模型通过大语料训练,获得了很多先验的“知识”,在此基础上,我们可以在大模型的基础上通过迁移学习生成小模型。

相对于传统的小模型生成模式,新的模式能够大幅缩减特定模型训练所需要的算力和数据量,缩短模型的开发周期,并得到更好的模型训练效果。可以说,大模型的真正意义在于改变了 AI 模型的开发模式,将模型的生产由“作坊式”升级为“流水线”。而模型开发模式的转变,将使得 AI 技术能够更广泛地下沉到一些长尾场景。

多模态输入将使应用场景进一步拓展,并加速模型自身的迭代

一方面,多模态将拓展应用场景,比如模型可以通过对试卷上文字和图像的理解进行综合分析,得出题目答案,或是识别图片中的不合理元素。另一方面,多模态输入将使模型本身的能力获得增强,并解决更为复杂的问题。

如同人类感知世界的过程是通过输入文本、图片、视频等各类信息实现的。根据 Open AI 发布的结果,GPT-4 在处理复杂问题时的表现明显好于此前的 GPT-3.5。比如在模拟律师资格考试的任务中,GPT-4 的分数落在前 10%的考生中,而 GP4-3.5 的分数则落在了后 10%。

大模型能力将集中在 IT巨头手中,小企业的机会在于前端应用

大模型的开发需要非常强的综合实力,需要具备丰富的开发资源,即人才、专利等等;同时需要非常强的大语料获取能力,为模型训练提供数据支持;还需要充沛的算力资源,这意味着巨额的硬件投入。而上述资源往往被 IT 巨头掌握。对于小企业而言,其机会在于可以基于大模型的能力进行迁移学习生成针对自身应用场景的小模型,将模型能力进行行业落地。


以上内容仅供学习交流,不构成投资建议。详情参阅原报告。

精选报告来源:文库-远瞻智库

展开阅读全文

页面更新:2024-04-25

标签:模型   语料   模式   小企业   巨头   场景   能力   机会   报告   资源

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号

Top