吊打pika！Google推出时空扩散模型的新型ai模型Lumiere

来源:Lumiere

Lumiere创建的视频展示了逼真的运动，甚至可以使用图像和其他视频作为输入来改善结果。在题为《用于视频生成的时空扩散模型》的论文中揭示，Lumiere的工作方式与现有的视频生成模型不同。它一次性生成视频的时间持续，而现有的模型则通过合成关键帧，然后进行时间超分辨率。

简单来说，Lumiere关注图像中物体的运动，而以前的系统则通过已经发生运动的关键帧进行拼接视频。

该模型能够生成最高80帧的视频。相比之下，Stability的Stable Video Diffusion分别为14和25帧。帧数越多，视频的运动就越流畅。

Lumiere文生视频

1.文生视频

和Pika、Meta和Runway等公司的一样，Lumiere同样具备文生视频功能，从动图可看到运动相对较为流畅自然。

lumiere图生视频

2.图生视频

lumiere允许用户上传一张图片并输入不同的指令让静态的图片直接生成视频，比如让一幅画里的女孩笑起来，让云朵飘动。

lumiere程序化生成

3.程式化生成

lumiere可以根据用户上传的图片作为参考元素，根据图片的特征结合提示词去生成和原图片有相似元素的视频

lumiere图片的局部动态化

3.局部动态

lumiere支持针对图片的特定元素或部分区域进行视频生成，比如让火焰跃动，让烟雾翻滚，只需要一个指令“animate”。

lumiere视频编辑

4.视频编辑

lumiere可以对上传的视频进行局部编辑，比如给视频中的人直接替换一套新衣服，给蜗牛的壳加上不同的花纹色彩。

据Google团队称，Lumiere在各种测试中均优于Pika、Meta和Runway等公司的竞争对手视频生成模型，包括零样本试验。

研究人员还声称，Lumiere的输出可以用于内容创作任务和视频编辑，包括使用经过微调的文本到图像模型权重进行视频修补和风格化生成（模仿所展示的艺术风格）。

为了达到这个目的，Lumiere利用了一种新的架构，称为时空U-Net。这通过模型的单次传递一次性生成整个视频的时间持续。

Google团队写道，这种新颖的方法提高了输出的一致性。论文中写道：“通过部署空间和（重要的是）时间的降采样和升采样，并利用预训练的文本到图像扩散模型，我们的模型通过在多个时空尺度上处理来直接生成全帧率、低分辨率的视频。”

Lumiere项目的目标是创建一个系统，使初学者更容易创建视频内容。

然而，论文承认了或许存在滥用的风险，特别是警告Lumiere等模型可能被用来创建虚假或有害的内容。

“我们认为，开发和应用检测偏见和恶意用例的工具是至关重要的，以确保安全和公平的使用，”论文中写道。

截至撰写本文时，Google尚未向公众提供该模型。但是，您可以在GitHub上的展示页面上探索各种示例生成。

展开阅读全文

页面更新：2024-02-14

标签：模型时空局部图像元素上传时间论文图片视频

1 2 3 4 5

吊打pika！Google推出时空扩散模型的新型ai模型Lumiere

A股：走势十分反常，传递了什么信息？明天行情分析！

伴有强烈腐臭气味

明天A股怎么走？我做了一个大胆的预判具体请看我的手绘预测图

美国“超级富豪”们纷纷入场！中国资本市场迎来一轮投资狂潮！

中国期货业协会发布《期货公司声誉风险管理规则》

国家统计局：1月份非制造业商务活动指数为50.7%

世界黄金协会:去年中国金饰消费需求达630吨比2022年增长10%

四川省政协委员田超：建议将儿童恶性肿瘤质子放射治疗费用纳入医保｜代表委员在这里

热词里的中国活力｜“三蹦子”等国货为何在海外实力“圈粉”？

大牛股凉了，重大财务造假!

一条两融爆仓朋友圈传开了，当下两融实情如何？监管密切关注

小舅子涉嫌违法犯罪，全家人银行账户却被冻结！当地公安局回复

大族激光：终止控股子公司大族封测分拆至创业板上市

耐人寻味

经济挑大梁，奏响新“粤”章建设海洋强省，打造海上新广东

CBA任骏威发球砸张镇麟耗尽时间，后者脱掉球衣直接离场

詹皇争议惨败！猛看数据表随后输24分不下场，垃圾时间8分4

男士必备的穿搭技巧，几组图片清晰明了，果然是一学就会

CBA任骏威发球砸张镇麟耗尽时间，后者脱掉球衣直接离场

38岁二胎宝妈哺乳期突然离世！此前发视频称发烧、喉咙巨

「2024/1/30」腊月早上好图片，30句暖心祝福短句，温馨早

这个世界是一个巨大的帕鲁班子 - 钛赞了视频周榜第1

北京旅游北京九大精华景点攻略，景点+门票+开放时间详情

花点时间狠狠的补一下自己的气血吧，让自己改头换面

动漫图像生成模型 Nijijourney 版本 6 发布了