普通人还在目瞪口呆的时候，科技巨头们已经开始加班搞竞品了

本文仅在今日头条首发，未发布其他任何平台，您的支持是我坚持创作的动力。

数码点评派之探索智能语言大模型

去年末，OpenAI突然发布了ChatGPT，一夜之间掀起了科技圈的热潮。这款能够进行数码点评、编程、帮助程序员修复BUG的语言模型，引发了人们的兴趣和热议。然而，在普通人仍在惊叹的时候，各大科技巨头已经开始竞相迎头赶上，因为在这个领域，落后就意味着被淘汰。

微软也不甘落后，迅速推出了NewBing，将GPT-3.5这一人类语言理解模型集成到自家搜索引擎上。由此，微软的Bing不再仅仅是一个搜索引擎，而是成为了一个能够进行联网搜索、上下文对话，甚至近乎全知全能的人工智能搜索引擎。

与此同时，谷歌发布了AI聊天机器人Bard，试图与ChatGPT一较高下。然而，Bard的表现却有些尴尬，不仅在发布会上出现错误回答，甚至在内测版中对一些问题的回答也显得自信过度。

这表明谷歌的训练量尚未达到应有的水平。

直到今年7月13日，谷歌才加入对中文语言的支持，但这一动作似乎来得有些晚。毕竟，百度的文心一言和讯飞的星火模型早已陆续开展测试，展现了其在语言模型领域的一些优势。

为了深入了解各大语言模型的表现，笔者展开了一场全面的比较测试。从实时信息搜索能力、中文理解能力到多模态识别能力，都经过了一系列的测试与对比。

在实时信息搜索能力方面，Bard、文心一言和星火模型都展现出了一定的水平，但文心一言在准确度上表现更为突出。

尽管在某些细节上存在错误，但文心一言的答案更为精确。而星火模型则在这一领域稍显欠缺。

就中文理解能力而言，Bard在简单语句的理解上表现尚可，但在应对复杂的双关和逻辑问题时显得力不从心。相比之下，文心一言和星火模型在中文理解方面都取得了更为显著的进展。

在多模态识别能力方面，Bard的识图和编程能力较强，甚至能将设计草图转化为实际代码。然而，其识别准确率尚未达到人类可以无条件信任的程度。

在识图环节，文心一言的表现较为稳定，而星火模型则显得相对有限。

虽然各大语言模型在不同领域表现出了一些优势，但总体来看，它们尚未突破"聊天问答"的框架，缺少引人瞩目的杀手级应用场景。未来，这些模型是否能成为智能手机助手、智能音响甚至是智能车机的一部分，还需要大厂们进一步的发展和探索。

综合来看，语言模型领域的竞争越发激烈，各家巨头都在努力提升其性能和功能。

页面更新：2024-05-01

微信紧急声明：没有的事！切勿扫码