潮评丨阿里大模型发布可以对比无需拉踩

继百度发布“文心一言”、360展示“360智脑”后，阿里也正式发布了大模型产品“通义千问”。4月11日，在2023阿里云峰会现场，阿里巴巴董事会主席兼CEO、阿里云智能总裁张勇表示，阿里巴巴所有产品未来将接入“通义千问”，进行全面改造；还称，阿里云将把AI基础设施和大模型能力向所有企业开放，共同推动AI产业的发展。

着眼长远看，阿里正式推出“通义千问”，无疑是中国AI大模型发展史上的标志性节点。这意味着，通用AI赛道有了更多“中国选手”。考虑到动辄超千亿参数的大模型研发不是个单一的算法问题，而是囊括了底层算力、网络存储、数据清洗与治理、AI框架、人类调优等多个方面的系统性工程，AI技术研发又攸关国家数字主权、未来科技竞争，不少中国科技企业加入AI大模型卡位战中，也是好事一桩。

可以看到，在阿里百度之外，腾讯“混元”、京东“言犀”、华为“盘古”、浪潮“源1.0”、商汤科技“日日新SenseNova”等AI大模型也都在跃跃欲试，这跟国外微软投资的OpenAI推出GPT-4、谷歌公布LaMDA和PaLM等大模型、Meta发布开源大模型LLaMA的激烈竞争节奏遥相呼应。在AI大模型被视作未来的Window、iOS、Android操作系统的背景下，科技公司们在AI上的“军备竞赛”，反映的是抢占AI技术及产业新底座的决心。

揆诸现实，在“文心一言”面世和“通义千问”问世后，国内舆论场中反应都极为强烈，这背后是国人对于中国科技企业淬炼出硬科技实力的厚重期许。不少人还会在测试过后，将现有的AI大模型们拉来“同框对比”，分析哪个更靠谱。这再正常不过：科技企业们既然将自家“孩子”抱出来，就免不了会受到外部凝视。这些类ChatGPT产品到底孰优孰劣，跟GPT-4又有多大差距，确实值得分析。在OpenAI的GPT大模型已取得先发优势的情况下，有差距也没什么，重要的是正视基础上的追赶。

就拿“通义千问”来说，阿里达摩院于2019 年就启动了大模型研发，在超大模型、语言及多模态能力、低碳训练、平台化服务、落地应用等多个方面做了许多探索，它也是多年前瞻技术厚积厚发的结果。鉴于这是世界首个突破10万亿参数的AI大模型，阿里还牵头搭建了国内规模最大的AI模型服务社区“魔搭”，“通义千问”必然承载起极高的期望值。它在多轮对话、文案创作、逻辑推理、多模态理解、多语言支持上的表现如何，理应接受现实检验。

对AI大模型加以对照合情合理，可也得警惕急功近利思维和刻舟求剑目光下的急于否定、盲目拉踩。AI大模型产品刚出来时，确实会出现很多不足，指出这些不足无可厚非，但要避免因不足将其技术能力直接全盘置否。

跟“看一张手绘草图，就能一秒生成网站”的“地表最强”AI大模型GPT-4比，不论是“文心一言”还是“通义千问”，都会存在差距。若没必要因为有差距就将“文心一言”说成ChatPPT，把“通义千问”加以嘲讽。

要知道，通用AI产品的特点就是有着明显的正向增强回路，用户用得越多，越能帮它丰富语料库，继而在迭代中不断完善自己。ChatGPT刚推出时也被说成是“CheatGPT”，可上线后的3个月中，OpenAI就根据用户反馈的数据对其进行了两次升级，这才有了更为强大的GPT-4。

对国产AI大模型来说，在测试阶段收集更多反馈数据，用于大模型迭代和后续研发，才是关键。对公众而言，在AI技术进步呈现出高度裂变式特征的当下，固然看这些大模型现在的样子，更要看它们几个月后的样子——它们的非线性进化速度可能惊人。

有媒体就讲到，在参与“通义千问”的定向邀测后，起初因“牛头不对马嘴”的对话结果感到失望，但第二天再输入同样的问题时，“通义千问”却给出了近乎完美的正确答案。

说到底，对于这些AI大模型时，我们不能抱着“昨天观”，而应秉持“后天观”。所谓的“后天观”是经济学家梁春晓提出的概念，在他看来，“在范式大转型的时代，束缚我们远见后天的，是一整套工业时代的知识体系、思维方式和基本假设，是无处不在的被工业时代格式化的感知和经验。所以，不能从今天规划明天，而要从后天规划明天。”“为了抵达明天，必须远望后天，否则明天只是又一个今天。从今天到明天很难，从后天到明天较易。”

秉持“后天观”，就得看到AI大模型的长期价值。在时下，仍有很多人认为“文心一言”“通义千问”们只是聊天用的，作用无非是对之前AI客服进行升级。这显然是种认知偏误：AI布道者李开复此前就预言，ChatGPT代表的AI 2.0将是提升21世纪整体社会生产力最为重要的赋能技术，“AI 2.0给行业带来的机会比过去任何的一个机会都大，比PC、手机时期带来的机会至少要大十倍。”

在将来，类ChatGPT类产品没准能作为“数字发电厂”，将大数据加工成水电能源，通过API接口以SaaS服务的方式输出给千行百业，最终帮助实体经济利用AI进行数字化转型。

这次阿里方面就明确，推出大模型后将“两条腿走路”：对内改造业务产品，向外做企业专属模型“底座”。而无论是接入阿里的电商、物流、生活服务等应用场景，还是以开放姿态向企业提供普惠的AI基础设施和大模型能力，让它们调用通义千问的全部能力去解锁智能客服、智能导购、智能语音助手、文案助手、AI设计师、自动驾驶模型等工具，对于实体企业获取数字化能力都大有裨益。毕竟，许多中小企业，需要的就是低门槛低成本的数字化工具。

当然，要实现这些美好的目标，还需要企业和科研机构通力合作，持久耕耘，在关键领域实现突破。科技发展可能带来的伦理冲突、隐私保护、知识产权保护等问题，亦须各界理性考量、提前防范、早立规矩，确保“科技向善”。当前，社会各方不妨为企业的创新提供包容的舆论氛围，切忌用短视性思维轻易否定或简单抹杀AI大模型的潜力与原力。

“转载请注明出处”

展开阅读全文

页面更新：2024-05-01

标签：阿里模型后天差距明天能力智能产品科技企业

1 2 3 4 5

潮评丨阿里大模型发布可以对比无需拉踩

这些不错的APP分享给你

消博会上论“元宇宙”：加速产业融合重构消费想象

有史以来最强的超新星爆炸

中国至今未掌握的7大核心技术，我们与美国、日本的差距有多大？

传媒概念：万亿风口！未来3年有望持续领涨的6支潜力龙头出炉！

素皮手机价格高？现在不到2K就能拿下！OPPO A1了解一下

抖音将关闭医疗健康认证账号私信、粉丝群互动功能

松江企业邦邦机器人参与编写《2023康复机器人行业研究报告》

钙钛矿光伏电池性能有望大增？只需加入这一“大自然的馈赠”……

三星良心发现？不，是长江存储来了！#国产

小黄车为什么会“黄掉”？

绿色建材下乡试点扩容

IPO雷达 - 青都旅游冲主板：收入不含景区门票，经营存多项风险

升幅为2020年四季度以来最高！这个指数为何大幅反弹？

山东82个区县2022年经济财政债务大盘点

中国至今未掌握的7大核心技术，我们与美国、日本的差距

松江企业邦邦机器人参与编写《2023康复机器人行业研究

陷立案调查，套现2.3亿元后，赛为智能董事长交班89年女儿

太钢集团被评定为山西省首批国际贸易型总部企业

全市唯一五星级！苏州国际科技园入选数字经济特色产业园

「央广网评」“三无产品”被包装成“30年陈酿” 如此

Rado瑞士雷达表推出全新库克船长高科技陶瓷镂空腕表

除了印度全都是苹果！中、美、印等八个国家最畅销智能手

看！消博会上的那些“黑科技”

Adobe新成员引关注，ChatGPT-4有多强？科技企业探讨生成式

潮评丨阿里大模型发布 可以对比无需拉踩

潮评丨阿里大模型发布可以对比无需拉踩