潮评丨阿里大模型发布 可以对比无需拉踩

继百度发布“文心一言”、360展示“360智脑”后,阿里也正式发布了大模型产品“通义千问”。4月11日,在2023阿里云峰会现场,阿里巴巴董事会主席兼CEO、阿里云智能总裁张勇表示,阿里巴巴所有产品未来将接入“通义千问”,进行全面改造;还称,阿里云将把AI基础设施和大模型能力向所有企业开放,共同推动AI产业的发展。

着眼长远看,阿里正式推出“通义千问”,无疑是中国AI大模型发展史上的标志性节点。这意味着,通用AI赛道有了更多“中国选手”。考虑到动辄超千亿参数的大模型研发不是个单一的算法问题,而是囊括了底层算力、网络存储、数据清洗与治理、AI框架、人类调优等多个方面的系统性工程,AI技术研发又攸关国家数字主权、未来科技竞争,不少中国科技企业加入AI大模型卡位战中,也是好事一桩。

可以看到,在阿里百度之外,腾讯“混元”、京东“言犀”、华为“盘古”、浪潮“源1.0”、商汤科技“日日新SenseNova”等AI大模型也都在跃跃欲试,这跟国外微软投资的OpenAI推出GPT-4、谷歌公布LaMDA和PaLM等大模型、Meta发布开源大模型LLaMA的激烈竞争节奏遥相呼应。在AI大模型被视作未来的Window、iOS、Android操作系统的背景下,科技公司们在AI上的“军备竞赛”,反映的是抢占AI技术及产业新底座的决心。

揆诸现实,在“文心一言”面世和“通义千问”问世后,国内舆论场中反应都极为强烈,这背后是国人对于中国科技企业淬炼出硬科技实力的厚重期许。不少人还会在测试过后,将现有的AI大模型们拉来“同框对比”,分析哪个更靠谱。这再正常不过:科技企业们既然将自家“孩子”抱出来,就免不了会受到外部凝视。这些类ChatGPT产品到底孰优孰劣,跟GPT-4又有多大差距,确实值得分析。在OpenAI的GPT大模型已取得先发优势的情况下,有差距也没什么,重要的是正视基础上的追赶。

就拿“通义千问”来说,阿里达摩院于2019 年就启动了大模型研发,在超大模型、语言及多模态能力、低碳训练、平台化服务、落地应用等多个方面做了许多探索,它也是多年前瞻技术厚积厚发的结果。鉴于这是世界首个突破10万亿参数的AI大模型,阿里还牵头搭建了国内规模最大的AI模型服务社区“魔搭”,“通义千问”必然承载起极高的期望值。它在多轮对话、文案创作、逻辑推理、多模态理解、多语言支持上的表现如何,理应接受现实检验。

对AI大模型加以对照合情合理,可也得警惕急功近利思维和刻舟求剑目光下的急于否定、盲目拉踩。AI大模型产品刚出来时,确实会出现很多不足,指出这些不足无可厚非,但要避免因不足将其技术能力直接全盘置否。

跟“看一张手绘草图,就能一秒生成网站”的“地表最强”AI大模型GPT-4比,不论是“文心一言”还是“通义千问”,都会存在差距。若没必要因为有差距就将“文心一言”说成ChatPPT,把“通义千问”加以嘲讽。

要知道,通用AI产品的特点就是有着明显的正向增强回路,用户用得越多,越能帮它丰富语料库,继而在迭代中不断完善自己。ChatGPT刚推出时也被说成是“CheatGPT”,可上线后的3个月中,OpenAI就根据用户反馈的数据对其进行了两次升级,这才有了更为强大的GPT-4。

对国产AI大模型来说,在测试阶段收集更多反馈数据,用于大模型迭代和后续研发,才是关键。对公众而言,在AI技术进步呈现出高度裂变式特征的当下,固然看这些大模型现在的样子,更要看它们几个月后的样子——它们的非线性进化速度可能惊人。

有媒体就讲到,在参与“通义千问”的定向邀测后,起初因“牛头不对马嘴”的对话结果感到失望,但第二天再输入同样的问题时,“通义千问”却给出了近乎完美的正确答案。

说到底,对于这些AI大模型时,我们不能抱着“昨天观”,而应秉持“后天观”。所谓的“后天观”是经济学家梁春晓提出的概念,在他看来,“在范式大转型的时代,束缚我们远见后天的,是一整套工业时代的知识体系、思维方式和基本假设,是无处不在的被工业时代格式化的感知和经验。所以,不能从今天规划明天,而要从后天规划明天。”“为了抵达明天,必须远望后天,否则明天只是又一个今天。从今天到明天很难,从后天到明天较易。”

秉持“后天观”,就得看到AI大模型的长期价值。在时下,仍有很多人认为“文心一言”“通义千问”们只是聊天用的,作用无非是对之前AI客服进行升级。这显然是种认知偏误:AI布道者李开复此前就预言,ChatGPT代表的AI 2.0将是提升21世纪整体社会生产力最为重要的赋能技术,“AI 2.0给行业带来的机会比过去任何的一个机会都大,比PC、手机时期带来的机会至少要大十倍。”

在将来,类ChatGPT类产品没准能作为“数字发电厂”,将大数据加工成水电能源,通过API接口以SaaS服务的方式输出给千行百业,最终帮助实体经济利用AI进行数字化转型。

这次阿里方面就明确,推出大模型后将“两条腿走路”:对内改造业务产品,向外做企业专属模型“底座”。而无论是接入阿里的电商、物流、生活服务等应用场景,还是以开放姿态向企业提供普惠的AI基础设施和大模型能力,让它们调用通义千问的全部能力去解锁智能客服、智能导购、智能语音助手、文案助手、AI设计师、自动驾驶模型等工具,对于实体企业获取数字化能力都大有裨益。毕竟,许多中小企业,需要的就是低门槛低成本的数字化工具。

当然,要实现这些美好的目标,还需要企业和科研机构通力合作,持久耕耘,在关键领域实现突破。科技发展可能带来的伦理冲突、隐私保护、知识产权保护等问题,亦须各界理性考量、提前防范、早立规矩,确保“科技向善”。当前,社会各方不妨为企业的创新提供包容的舆论氛围,切忌用短视性思维轻易否定或简单抹杀AI大模型的潜力与原力。

“转载请注明出处”

展开阅读全文

页面更新:2024-05-01

标签:阿里   模型   后天   差距   明天   能力   智能   产品   科技   企业

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号

Top