ICCV 2025 | CMU 空间可变对焦：单次拍摄全场景清晰

作者丨我爱计算机视觉

来源丨我爱计算机视觉

编辑丨极市平台

大家好，今天小编想和大家聊一篇计算摄影领域的奇妙论文，获得ICCV 2025 最佳论文提名。你有没有想过，如果你的相机能一次拍摄，就让照片里的每一个角落都清晰无比，无论远近，那该多好？或者，能像变魔术一样，让焦点随着你的心意在画面上自由移动？来自卡内基梅隆大学的研究者们带来的这篇“Spatially-Varying Autofocus”，就让这个想法变成了现实。

论文标题: Spatially-Varying Autofocus
作者: Yingsi Qin, Aswin C. Sankaranarayanan, Matthew O'Toole
机构: 卡内基梅隆大学
论文地址: https://imaging.cs.cmu.edu/svaf/static/pdfs/Spatially_Varying_Autofocus.pdf
项目主页: https://imaging.cs.cmu.edu/svaf/

01 挑战传统摄影的极限

在传统摄影中，我们总是在跟“景深”作斗争。大光圈能带来美丽的背景虚化，但也意味着只有很窄一个平面上的物体是清晰的。想要获得一张从前到后都清晰（也就是“全清晰”，All-in-Focus, AIF）的照片，通常只有两种办法：要么缩小光圈，但这会牺牲进光量并可能导致衍射模糊；要么就得用“焦点堆栈”技术，也就是拍摄多张不同焦点的照片再合成，这对于动态场景显然无能为力。

计算摄影的发展为我们提供了新思路，但以往的方法也各有妥协。而这篇论文的目标，就是在保持大光圈和高分辨率的同时，用单次拍摄实现任意形状的焦平面，听起来是不是非常酷？

上图就展示了这种技术的效果：一张全清晰的照片，以及它背后那个神奇的、空间变化的自定义焦平面。

02 核心技术：会“分身”的计算镜头

为了实现这个目标，研究者们设计了一套非常巧妙的光学系统，名为“分裂式洛曼计算镜头”（Split-Lohmann computational lens）。这个名字听起来有点复杂，其实原理很清晰。

这个系统的核心在于“分裂”和“计算”：

可编程的变焦：它通过一个4f系统和一个位于傅里叶平面的空间光调制器（SLM），将传统洛曼透镜的两个立方相位板“合二为一”。通过在SLM上加载一个线性相位斜坡，就可以像滑动变焦环一样，精确地控制整个画面的焦点。
空间可变的局部对焦：最关键的一步来了。由于SLM上的每个像素都与相机传感器上的像素精确对应，我们可以在SLM上显示一个“空间变化”的相位斜坡图案。这意味着，画面的A区域可以应用一个焦距，B区域应用另一个焦距。这样一来，相机就获得了在同一个画面内不同区域同时对焦到不同距离的能力。

2.1 如何实现自动对焦？

有了硬件基础，还需要聪明的算法来告诉系统每个区域应该对焦到哪里。论文提出了两种互补的自动对焦算法。

第一种是基于对比度的搜索算法。它将图像分成小块，然后快速测试一系列离散的焦距设置，找到能让每个小块对比度最高的那个焦距。这个过程非常快，足以实现实时的全清晰预览。

第二种是更高效的基于相位的算法。它利用了散焦与图像相位之间的关系，通过分析两张稍微偏移焦点的照片，就能直接计算出每个像素精确的对焦距离。这种方法避免了大量的搜索，速度更快，精度也更高。

论文中展示的相机原型

原型相机的点扩散函数（PSF）展示了其在不同距离和视场位置的对焦能力

03 惊艳的效果与应用

理论说完了，我们来看看实际效果。这套系统不仅能拍出高质量的全清晰照片，还解锁了许多创意玩法。

3.1 自由形状的景深

比如，你可以让焦点沿着一条斜线、一条曲线，甚至是你指定的任意区域分布。上图就展示了对一个倾斜放置的凯旋门模型的不同对焦方式：全清晰、模拟沙姆定律（Scheimpflug principle）的斜向对焦，以及只让凯旋门本身清晰的选择性对焦。

3.2 “凭空”消除遮挡物

这是一个小编觉得最神奇的应用。想象一下，你想拍一个物体，但它前面隔着一层铁丝网。传统相机很难在拍清主体的同时完全忽略铁丝网。而利用这项技术，可以直接将焦点设置在背景上，让前景的铁丝网因为严重的散焦而变得模糊不可见，从而在光学层面就“消除”了它！

3.3 性能对比：优势显著

研究者们将他们的方法与其他全清晰成像技术进行了详细对比，包括传统的焦点堆栈、小光圈成像以及其他计算方法。

从定性对比（如上面的Planes和Flowers场景）可以看出，该方法在处理大景深和复杂场景时，清晰度和细节表现都非常出色，尤其是在避免小光圈带来的衍射模糊方面优势明显。

定量分析（如MTF曲线和性能随拍摄张数变化的图表）进一步证实了这一点。该方法仅需3步4张照片（用于相位对焦算法）就能达到甚至超越需要数十张照片进行焦点堆栈的效果，在效率和质量上都取得了巨大突破。

04 总结

总而言之，这项研究通过软硬件的协同创新，为计算摄影开辟了一个激动人心的新方向。它不仅解决了传统摄影中景深与光圈的矛盾，还赋予了相机前所未有的、控制光场的能力。大家对这个方法怎么看？欢迎在评论区留下你的看法！

展开阅读全文

更新时间：2025-11-06

标签：数码场景清晰空间相位光圈焦点照片景深论文焦距算法相机

1 2 3 4 5

ICCV 2025 | CMU 空间可变对焦：单次拍摄全场景清晰

01 挑战传统摄影的极限

02 核心技术：会“分身”的计算镜头

2.1 如何实现自动对焦？

03 惊艳的效果与应用

3.1 自由形状的景深

3.2 “凭空”消除遮挡物

3.3 性能对比：优势显著

04 总结

任天堂加速IP影视化：制作到投资都亲自把关，两年后陆续登上银幕

玉林（福绵）服装新品发布会举行

同样是130斤左右，“会打扮”与“不会打扮”的女人比，差距多大

干货收藏！20条钻石回收的硬核知识，看完秒变内行人（二）

吃过很多次亏后，才知道：“网购”和“实体店”的大衣差距有多大

全运会时尚之夜点亮广州海心桥喜迎十五运会

中国奢侈品市场：2025上半年营收利润双降，消费变了

国区 SNKRS 新鞋预告：除了新 AJ11，等很多年的这双鞋来了！

质驭都市：PEACEBIRD太平鸟2025冬季新品预览会

双十一，在直播间“抄底”黄金？

头发应该早上洗还是晚上洗？

只要你不坑人害人，坑你害你的人你也不去恨，不久老天就会收拾他

人间因你成天堂

人性最大的恶便是：有些人一边装好人一边让你遍体鳞伤

暗恋是无人看懂的哑剧

日本没想到，美国也没想到，如今的中国陕西省，已成为全球焦

每日微讯丨影石智能影像算法创新中心南京揭牌

抛售潮的焦点：全球芯片股大跌，5000亿美元市值“灰飞烟灭

利物浦1-0皇马热议焦点：维尔茨和谁擦出火花？阵型终达理

咖啡+文学跨界融合青羊老街区添新文化消费空间

多地发力打造冬季文旅消费新场景

美论坛：如果中国禁止美国加入中国空间站，美国是否能将其

中国空间站养鱼种菜溜小鼠，其他国在干啥？老外：决不能输给

神舟二十号飞船推迟返回：地球轨道上对航天器有潜在威胁

汪小菲一家成都度假，两姐弟照片又流出，小玥儿装扮太意外