自从ChatGPT横空出世以后,人工智能领域迎来了新的里程碑。ChatGPT作为一款由OpenAI开发的大型预训练语言模型,以其强大的自然语言处理能力和广泛的应用场景,迅速引起了全球范围内的关注和讨论,GPT-4,在2023年3月15日震撼推出,这是一个大型多模态模型,不仅能够阅读文字,还能识别图像,并生成文本结果,Sora的推出更不可思议,同时国内国外雨后春笋搬的各种大模型,国内一众大佬对大模型众说纷纭,百度大佬最近接受采访时说 文心一言 已跟GPT4.0不相上下,其中中文已超越ChatGPT,其中还特意举了个例子以沁园春为词牌做诗一首,GPT4.0不知道是以四个开头还是5个字开头,然而百川智能模型王小川网络中互怼百度大佬活在幻觉中,好不热闹。是骡子是马拉出来溜溜就知道了,由于网络原因,国外的大模型就选基于GPT3.5的notion ai应用来测试。国内大模型就选“文心一言”,“腾讯混元大模型”,“通义千问”,“讯飞星火认知大模型”,“百川智能大模型”,“华为盘古大模型”。华为盘古大模型华为企业云的用户才能体验,就暂时不测了。选5个问题来对比国内的各个大模型的表现喽。
大模型又有细分,NLP语言大模型,CV大模型,多模态大模型,预测大模型,科学数据大模型;各大厂商发展比较成熟的是NLP语言大模型。
一、第一个问题来了?看看国内各种大模型的表现吧。
NLP大模型,CV大模型,多模态大模型,预测模型,科学计算大模型 5种大模型的区别,如何选择?
文心一言的答案:
腾讯混元模型的答案:
通义千问的答案:
字节跳动豆包答案:
讯飞星火认知大模型:
百川智能3.0大模型:
个人分析 文心一言胜出,答案更人性化,回答的也比较完整。从性能上比较基本答案都是秒出,讯飞星火有个加载过程。
二、第2个问题来了?看看国内各种大模型的表现吧。蓝牙耳机坏了,我去挂什么科?
文心一言的答案:
腾讯混元模型的答案:
通义千问的答案:
字节跳动豆包答案:
讯飞星火认知大模型:再次失望,竟然还是要去医院,而且效率还是比较慢,所以提问了2次,第2次回答还算可以
百川智能3.0大模型:再次感觉出答案的效率很快
个人分析 字节跳动豆包胜出,答案更完整,各种场景都给出了参考方案。条理也比较清楚,讯飞星火有点瑕疵,其他的大模型都没有太大的问题,解决掉刚出来时需要“去医院的”的问题。
三、第3个问题来了?看看文生图的功能,画一个老婆饼
文心一言的答案:
腾讯混元模型的答案:
通义千问的答案:
字节跳动豆包答案:无法画出来老婆饼
讯飞星火认知大模型:
百川智能3.0大模型:不支持
个人分析 文心一言胜出,效率跟答案都更好,输入同一种Promt,可以生成各种“老婆饼”,解决了画出一个老婆的问题, 如果是要批量生成图片啥的建议用 通义万相。
四、第4个问题来了?多轮对话能力,看看上下文的理解能力,提供3个问题给各个模型
1、问题一:我想去北京大学玩一下,有什么好的建议
2、问题二:从江西怎么去?
3、问题三:推荐一种最好的方案呢
文心一言的答案:
腾讯混元模型的答案:
通义千问的答案:
字节跳动豆包答案:豆包还是有优势,推荐视频更直观
讯飞星火认知大模型:
百川智能3.0大模型:出问题了,到第3个问题的时候变成了北京交通的大学,是不是token限制了的原因呢
个人分析 字节跳动豆包胜出,3个问题都要考察大模型上下文的理解能力, 上下文理解除了百川智能模型出了一点小问题,其他大模型都表现还行;但是感觉如果是要出去旅游做旅游攻略,字节跳动豆包毫无悬念胜出。
四、第5个问题来了?解决问题的能力,请作为一个DBA,设计一张物业员工表
文心一言的答案:
腾讯混元模型的答案:
通义千问的答案:
字节跳动豆包答案:
讯飞星火认知大模型:
百川智能3.0大模型:
个人分析 通义千问胜出,字节跳动豆包表现比较差,所以说各个大模型有个大模型的优缺点。百度大模型确实不占优势了。
总结:测试样本有限额,只能根据当前的情况做个大概总结,文心一言NLP语言测试的样本都没有什么问题,但是没有什么明显的优势,通义千问形成了产品矩阵,从NLP大语言模型,多态模型通义万相,通义听悟更能方便用户实现AI应用智慧场景及解决实际问题。字节跳动豆包也有自己的优势,比如旅游攻略方面,有推荐视频,更直观,而且旅游攻略更细。讯飞星火具体样本测试下来不太友好,效率相对慢一点,没有优势可言。可能讯飞星火我觉得可能还是在语音识别专业场景上,语音场景没测试到。百川智能跟大厂比还是差点,任重道远。华为盘古大模型由于要华为云用户才可以体验,下次有机会测试,Notion AI收费了也没测试到。后面AI还是要基于国内的大模型了,所以Notion AI就不测试了。腾讯混元模型差强人意。
页面更新:2024-03-19
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号