阿里通义开源新模型，指定首尾图片可生成延时摄影、变身等特效视频

视频加载中...

潮新闻客户端记者张云山

4月17日晚，阿里开源通义万相首尾帧生视频14B模型，这是业界首个开源的百亿级参数规模首尾帧生视频模型，它可根据用户指定的开始和结束图片，生成一段能衔接首尾画面的720p高清视频，满足延时摄影、变身等更可控、更定制化的视频生成需求。用户可在通义万相官网直接免费体验该模型，或在GitHub、Hugging Face、魔搭社区下载模型本地部署后进行二次开发。

阿里开源通义万相首尾帧生视频14B模型

首尾帧生视频比文生视频、单图生视频的可控性更高，是最受AI视频创作者欢迎的功能之一，但这类模型的训练难度较大，对模型的指令遵循、视频内容与首尾帧一致性、视频过渡自然流畅性等均有高要求。

据介绍，基于现有的Wan2.1文生视频基础模型架构，通义万相首尾帧生视频模型进一步引入了额外的条件控制机制，通过该机制可实现流畅且精准的首尾帧变换；在训练阶段，团队还构建了专门用于首尾帧模式的训练数据，同时针对文本与视频编码模块、扩散变换模型模块采用了并行策略，这些策略提升了模型训练和生成效率，也保障了模型具备高分辨率视频生成的效果。

基于该模型，用户可完成更复杂、更个性化的视频生成任务，可以实现同一主体的特效变化、不同场景的运镜控制等视频生成。例如，上传相同位置不同时间段的两张外景图片，输入一段提示词，通义万相首尾帧生成模型即可生成一段四季交替变化或者昼夜变化的延时摄影效果视频；上传两张不同画面的场景，还可通过推进、拉镜、摇镜等运镜控制衔接画面，在保证视频和预设图片一致性前提下，同时让视频拥有更丰富的镜头。

今年2月，通义万相Wan2.1文生视频和图生视频模型开源后，迅速登上Hugging Face模型热榜和模型空间榜棒首，其在GitHub上已斩获超10k star，模型下载量超过220万，是开源社区热度最高的大模型之一。

通义万相首尾帧生视频

（图源受访者）

“转载请注明出处”

展开阅读全文

更新时间：2025-11-24

标签：首尾阿里下载量模型图片视频模块特效场景画面用户科技

1 2 3 4 5

阿里通义开源新模型，指定首尾图片可生成延时摄影、变身等特效视频

从触摸屏桌子到全球最强平板：微软Surface的50年进化史

印尼人民协商会议代表团到访华大集团

特斯拉全新人形机器人亮相

REDMI Turbo 4 Pro官宣下周发布：同档无敌

多人被处分！财政部通报

“水果第一股”洪九果品总部现状：22层办公室人去楼空，员工自救

全天仅成交9147亿元，A股资金交易情绪跌至冰点！成交额创“924”行情以来新低，连续两日不足万亿大关，A股地量就在眼前？

太疯狂！多只ETF紧急“谢客”，黄金还能上车吗？

4月18日，“高位资金净流出”的24名单出炉

菜鸟：无人车已在合肥获路权并投入市场

广汽集团投资成立企管新公司

4月18日兰州银行现1020万元大宗交易

同比增长4.2%！一季度全国财政支出持续增长

周五A股风云突变，周末大利好将至？这些板块抢先看！

【财富晚茶】沪二元股票-34：亨通股份：税后盈牛市翻倍投机投资

新华网(603888.SH)：新华网近期推出全场景可信AI解决方

王楚钦澳门最新视频，7个保镖包围着他，周围5米不许球迷靠

康鹏科技今日大宗交易成交885.66万股，成交额7650.73万

尚普咨询受邀参加广东宏工科技上市答谢酒会暨上市仪式

保税科技今日大宗交易折价成交870万股，成交额3288.6万

天虹科技取得沉积机台专利

央视一姐一条视频带火整座城的胃，扬州这两款美食被朱迅

数盾信息科技取得可靠远程卫星通信方法及通信系统专利

来看蒙娜丽莎、维纳斯、胜利女神，巴黎卢浮宫参观游记附

纬湃科技取得机动车辆控制设备相关专利