智象未来CEO梅涛:多模态领域竞争未定,模型数据商业化叠加

来源:中国报道

#活力中国调研行#【梅涛:大语言模型逐渐成头部者游戏,#多模态领域仍有机会#】#多模态大模型# 大语言模型竞争格局初定后,“百模大战”逐渐走入后半段,多模态有望成为下一阶段竞争的分水岭。

7月2日,《中国报道》记者走进合肥人工智能初创企业智象未来。2025年4月,智象未来自主研发的开源图像生成大模型 HiDream-I1 在国际权威榜单 Artificial Analysis 中24小时内实现登顶,并在图像质量、语义理解、艺术表现三大维度刷新行业纪录。目前,该模型已服务全球100多个国家和地区的2000多万名个人用户。

智象未来创始人兼CEO梅涛表示,近些年大语言模型基本都是在GPT的框架内,框架一旦固化,无论是美国还是中国,大语言模型都开始迅速收敛,该领域的竞争逐渐成为头部厂商拼规模的游戏。但在多模态领域还没有出现类似GPT—3的成熟模型,目前视频生成处于GPT—2到GPT—3的阶段。

Sora的出现确实让文生视频的能力上了一个台阶,但该产品基于的扩散模型(DiT) 仍有很多问题待解决。梅涛认为,在多模态大模型领域,还没有一家厂商的模型有绝对的优越性,属于多模态的“Chat GPT”时刻还未到来,大家仍有机会。

梅涛认为,现在多模态的竞争格局,除了模型之争,还有数据之争。各家厂商都在争取更多高质量、享有版权的数据。目前,智象未来已拥有70%的华语电影版权资源以及20万小时时长的版权视频。

“商业化也很重要。”梅涛指出,虽然目前多模态模型还未收敛,但不少视觉生成领域的AI厂家已成功找到盈利的商业模式。

“因而,现阶段多模态领域的竞争是模型、数据和商业叠加在一起的竞争,是综合实力的竞争。”梅涛说。

展开阅读全文

更新时间:2025-07-04

标签:科技   模型   领域   竞争   未来   数据   中国   语言   厂商   头部   视频

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By bs178.com 闽ICP备11008920号
闽公网安备35020302034844号

Top