ReVersion｜图像生成中的 Relation 定制化

新任务：Relation Inversion

今年，diffusion model和相关的定制化（personalization）的工作越来越受人们欢迎，例如DreamBooth，Textual Inversion，Custom Diffusion等，该类方法可以将一个具体物体的概念从图片中提取出来，并加入到预训练的text-to-image diffusion model中，这样一来，人们就可以定制化地生成自己感兴趣的物体，比如说具体的动漫人物，或者是家里的雕塑，水杯等等。

现有的定制化方法主要集中在捕捉物体外观(appearance)方面。然而，除了物体的外观，视觉世界还有另一个重要的支柱，就是物体与物体之间千丝万缕的关系（relation）。目前还没有工作探索过如何从图片中提取一个具体关系（relation），并将该relation作用在生成任务上。为此，我们提出了一个新任务：Relation Inversion。

如上图，给定几张参考图片，这些参考图片中有一个共存的relation，例如“物体A被装在物体B中”，Relation Inversion的目标是找到一个relation prompt 来描述这种交互关系，并将其应用于生成新的场景，让其中的物体也按照这个relation互动，例如将蜘蛛侠装进篮子里。

论文：https://arxiv.org/abs/2303.13495
代码：https://github.com/ziqihuangg/ReVersion
主页：https://ziqihuangg.github.io/projects/reversion.html
视频：https://www.youtube.com/watch?v=pkal3yjyyKQ
Demo：https://huggingface.co/spaces/Ziqi/ReVersion

ReVersion框架

作为针对Relation Inversion问题的首次尝试，我们提出了ReVersion框架：

相较于已有的Appearance Invesion任务，Relation Inversion任务的难点在于怎样告诉模型我们需要提取的是relation这个相对抽象的概念，而不是物体的外观这类有显著视觉特征的方面。

我们提出了relation-focal importance sampling策略来鼓励更多地关注high-level的relation；同时设计了relation-steering contrastive learning来引导更多地关注relation，而非物体的外观。更多细节详见论文。

ReVersion Benchmark

我们收集并提供了ReVersion Benchmark： https://github.com/ziqihuangg/ReVersion#the-reversion-benchmark

它包含丰富多样的relation，每个relation有多张exemplar images以及人工标注的文字描述。我们同时对常见的relation提供了大量的inference templates，大家可以用这些inference templates来测试学到的relation prompt是否精准，也可以用来组合生成一些有意思的交互场景。

结果展示

丰富多样的relation

我们可以invert丰富多样的relation，并将它们作用在新的物体上

丰富多样的背景以及风格

我们得到的relation ，还可以将不同风格和背景场景中的物体，按照特定的方式联系在一起。

同一个Relation，丰富多样的物体组合

展开阅读全文

页面更新：2024-03-13

标签：装进组合物体框架外观图像场景视觉关系更多图片

1 2 3 4 5

ReVersion｜图像生成中的 Relation 定制化

丰富多样的relation

丰富多样的背景以及风格

同一个Relation，丰富多样的物体组合

研究人员找到捕获未来潜在清洁能源的分子级解决方案

新华全媒+｜服贸会上看科技亮点

三七互娱入股AI编程公司硅心科技，持续完善“数字科技”领域布局

攻坚克难引得一泓清流润秦川

推动数字经济高质量发展丨浪潮集团：发挥数字技术优势全面投身数字强省建设

CVE29357 Microsoft SharePoint 身份验证绕过漏洞分析

5美元把一单货从中国发往美国，江小涓：智能物流是重要优势

「甘快看」兰州中川机场暑运“成绩单”：旅客吞吐量超366万人次较去年同比增长两倍以上

管道、风管工程如何创优？施工细部做法来了

打击“海水淡化”

向微信看齐？马斯克官宣：X将推出语音和视频通话功能

2023服贸会现场直击

文安县：全力打造雄东科技成果转化基地

石太铁路抢险工程取得重大进展

网恋美女变大叔？AI换脸技术给你上一课！

格力博：四季度会有大量新品面世，比如融合RTK+视觉技术的

红米K70至尊版惊艳亮相，超越视觉界限+5590mAh，引领科技

ATP年终总决赛揭开战幕，德约科维奇冲击更多“第一”

周冬雨的浅薄和葛优的无情堪称金鸡颁奖的经典场景

嘴哥与乔妹关系全面揭秘，乔妹前夫再爆内幕，嘴哥陷入困境

国足全新队长为啥是他？武磊：队伍正新老交替，老队员要承担

看似没关系，其实做过情侣的18对明星，都是同居多年遗憾分

建议收藏！码云上8个宝藏又有价值的开源图片编辑器，非常

只有微信才能看到美女吗？别让网友帮你修photoshop！搞笑

离了个大谱！印媒揭露印度登月造假？疑似PS中国登月图片发