普通人还在目瞪口呆的时候,科技巨头们已经开始加班搞竞品了

本文仅在今日头条首发,未发布其他任何平台,您的支持是我坚持创作的动力。

数码点评派之探索智能语言大模型

去年末,OpenAI突然发布了ChatGPT,一夜之间掀起了科技圈的热潮。这款能够进行数码点评、编程、帮助程序员修复BUG的语言模型,引发了人们的兴趣和热议。然而,在普通人仍在惊叹的时候,各大科技巨头已经开始竞相迎头赶上,因为在这个领域,落后就意味着被淘汰。

微软也不甘落后,迅速推出了NewBing,将GPT-3.5这一人类语言理解模型集成到自家搜索引擎上。由此,微软的Bing不再仅仅是一个搜索引擎,而是成为了一个能够进行联网搜索、上下文对话,甚至近乎全知全能的人工智能搜索引擎。

与此同时,谷歌发布了AI聊天机器人Bard,试图与ChatGPT一较高下。然而,Bard的表现却有些尴尬,不仅在发布会上出现错误回答,甚至在内测版中对一些问题的回答也显得自信过度。

这表明谷歌的训练量尚未达到应有的水平。

直到今年7月13日,谷歌才加入对中文语言的支持,但这一动作似乎来得有些晚。毕竟,百度的文心一言和讯飞的星火模型早已陆续开展测试,展现了其在语言模型领域的一些优势。

为了深入了解各大语言模型的表现,笔者展开了一场全面的比较测试。从实时信息搜索能力、中文理解能力到多模态识别能力,都经过了一系列的测试与对比。

在实时信息搜索能力方面,Bard、文心一言和星火模型都展现出了一定的水平,但文心一言在准确度上表现更为突出。

尽管在某些细节上存在错误,但文心一言的答案更为精确。而星火模型则在这一领域稍显欠缺。

就中文理解能力而言,Bard在简单语句的理解上表现尚可,但在应对复杂的双关和逻辑问题时显得力不从心。相比之下,文心一言和星火模型在中文理解方面都取得了更为显著的进展。

在多模态识别能力方面,Bard的识图和编程能力较强,甚至能将设计草图转化为实际代码。然而,其识别准确率尚未达到人类可以无条件信任的程度。

在识图环节,文心一言的表现较为稳定,而星火模型则显得相对有限。

虽然各大语言模型在不同领域表现出了一些优势,但总体来看,它们尚未突破"聊天问答"的框架,缺少引人瞩目的杀手级应用场景。未来,这些模型是否能成为智能手机助手、智能音响甚至是智能车机的一部分,还需要大厂们进一步的发展和探索。

综合来看,语言模型领域的竞争越发激烈,各家巨头都在努力提升其性能和功能。

展开阅读全文

页面更新:2024-05-01

标签:星火   微软   目瞪口呆   中文   普通人   模型   领域   能力   语言   搜索引擎   智能   测试   科技

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号

Top