揭秘!如何选出最适合自己的大模型?国内外大模型大比拼

自从ChatGPT横空出世以后,人工智能领域迎来了新的里程碑。ChatGPT作为一款由OpenAI开发的大型预训练语言模型,以其强大的自然语言处理能力和广泛的应用场景,迅速引起了全球范围内的关注和讨论,GPT-4,2023年3月15日震撼推出,这是一个大型多模态模型,不仅能够阅读文字,还能识别图像,并生成文本结果,Sora的推出更不可思议,同时国内国外雨后春笋搬的各种大模型,国内一众大佬对大模型众说纷纭,百度大佬最近接受采访时说 文心一言 已跟GPT4.0不相上下,其中中文已超越ChatGPT,其中还特意举了个例子以沁园春为词牌做诗一首,GPT4.0不知道是以四个开头还是5个字开头,然而百川智能模型王小川网络中互怼百度大佬活在幻觉中,好不热闹。是骡子是马拉出来溜溜就知道了,由于网络原因,国外的大模型就选基于GPT3.5的notion ai应用来测试。国内大模型就选“文心一言”,“腾讯混元大模型”,“通义千问”,“讯飞星火认知大模型”,“百川智能大模型”,“华为盘古大模型”。华为盘古大模型华为企业云的用户才能体验,就暂时不测了。选5个问题来对比国内的各个大模型的表现喽。

大模型又有细分,NLP语言大模型,CV大模型,多模态大模型,预测大模型,科学数据大模型;各大厂商发展比较成熟的是NLP语言大模型。

一、第一个问题来了?看看国内各种大模型的表现吧。

NLP大模型,CV大模型,多模态大模型,预测模型,科学计算大模型 5种大模型的区别,如何选择?

文心一言的答案:

腾讯混元模型的答案:

通义千问的答案:

字节跳动豆包答案:

讯飞星火认知大模型:

百川智能3.0大模型:

个人分析 文心一言胜出,答案更人性化,回答的也比较完整。从性能上比较基本答案都是秒出,讯飞星火有个加载过程。

二、第2个问题来了?看看国内各种大模型的表现吧。蓝牙耳机坏了,我去挂什么科?

文心一言的答案:

腾讯混元模型的答案:

通义千问的答案:

字节跳动豆包答案:

讯飞星火认知大模型:再次失望,竟然还是要去医院,而且效率还是比较慢,所以提问了2次,第2次回答还算可以

百川智能3.0大模型:再次感觉出答案的效率很快

个人分析 字节跳动豆包胜出,答案更完整,各种场景都给出了参考方案。条理也比较清楚,讯飞星火有点瑕疵,其他的大模型都没有太大的问题,解决掉刚出来时需要“去医院的”的问题。

三、第3个问题来了?看看文生图的功能,画一个老婆饼

文心一言的答案:

腾讯混元模型的答案:

通义千问的答案:

字节跳动豆包答案:无法画出来老婆饼

讯飞星火认知大模型:

百川智能3.0大模型:不支持

个人分析 文心一言胜出,效率跟答案都更好,输入同一种Promt,可以生成各种“老婆饼”,解决了画出一个老婆的问题, 如果是要批量生成图片啥的建议用 通义万相。

四、第4个问题来了?多轮对话能力,看看上下文的理解能力,提供3个问题给各个模型

1、问题一:我想去北京大学玩一下,有什么好的建议

2、问题二:从江西怎么去?

3、问题三:推荐一种最好的方案呢

文心一言的答案:

腾讯混元模型的答案:

通义千问的答案:

字节跳动豆包答案:豆包还是有优势,推荐视频更直观

讯飞星火认知大模型:

百川智能3.0大模型:出问题了,到第3个问题的时候变成了北京交通的大学,是不是token限制了的原因呢





个人分析 字节跳动豆包胜出,3个问题都要考察大模型上下文的理解能力, 上下文理解除了百川智能模型出了一点小问题,其他大模型都表现还行;但是感觉如果是要出去旅游做旅游攻略,字节跳动豆包毫无悬念胜出。

四、第5个问题来了?解决问题的能力,请作为一个DBA,设计一张物业员工表

文心一言的答案:

腾讯混元模型的答案:

通义千问的答案:

字节跳动豆包答案:

讯飞星火认知大模型:

百川智能3.0大模型:

个人分析 通义千问胜出,字节跳动豆包表现比较差,所以说各个大模型有个大模型的优缺点。百度大模型确实不占优势了。

总结:测试样本有限额,只能根据当前的情况做个大概总结,文心一言NLP语言测试的样本都没有什么问题,但是没有什么明显的优势,通义千问形成了产品矩阵,从NLP大语言模型,多态模型通义万相,通义听悟更能方便用户实现AI应用智慧场景及解决实际问题。字节跳动豆包也有自己的优势,比如旅游攻略方面,有推荐视频,更直观,而且旅游攻略更细。讯飞星火具体样本测试下来不太友好,效率相对慢一点,没有优势可言。可能讯飞星火我觉得可能还是在语音识别专业场景上,语音场景没测试到。百川智能跟大厂比还是差点,任重道远。华为盘古大模型由于要华为云用户才可以体验,下次有机会测试,Notion AI收费了也没测试到。后面AI还是要基于国内的大模型了,所以Notion AI就不测试了。腾讯混元模型差强人意。

展开阅读全文

页面更新:2024-03-19

标签:盘古   大佬   模型   华为   豆包   腾讯   字节   认知   国内外   答案   智能

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号

Top