人工智能"创造力"的真相:技术缺陷造就的意外产物

信息来源:
https://www.wired.com/story/researchers-uncover-hidden-ingredients-behind-ai-creativity/

斯坦福大学物理学家梅森·坎布和巴黎高等师范学院的朱利奥·比罗利在2025年国际机器学习大会上发表的最新研究揭示了一个令人震惊的发现:驱动DALL·E、Imagen和Stable Diffusion等图像生成工具的扩散模型所展现的"创造力",实际上并非真正的创新能力,而是其技术架构中固有缺陷的必然产物。这一发现不仅重新定义了我们对人工智能创造性的理解,更可能对未来AI研发和人类创造力研究产生深远影响。

研究团队通过精密的数学建模证明,扩散模型的所谓创造力是一个完全确定性的过程——即这些看似充满想象力的图像生成结果,实际上是由模型架构的技术限制直接且不可避免地产生的。这一发现解答了长期困扰AI研究界的一个核心悖论:为什么被设计为复制训练数据的系统,却能够产生前所未见的创新内容。

从生物学启发到AI突破

插图:Adrián Astorgano for Quanta Magazine

坎布对这一问题的洞察源于他对生物形态发生过程的长期关注。形态发生是指生命系统自我组装形成复杂结构的过程,这一现象可以通过图灵模式来理解——以著名数学家艾伦·图灵命名的理论模型。图灵模式揭示了细胞群体如何在没有中央控制机制的情况下,仅通过局部相互作用就能自发组织成不同的器官和肢体。

这种自下而上的组织方式通常运行良好,但偶尔会出现"错误"——比如产生多余手指的现象。当早期AI生成的图像频繁出现多手指人类时,坎布立即意识到这与生物发育过程中的异常现象极为相似。这个观察成为了他深入研究扩散模型工作机理的起点。

扩散模型的工作原理本质上是一个去噪过程。系统首先将图像转换为数字噪声——一堆不连贯的像素集合,然后通过复杂的算法将这些"碎片"重新组装。比罗利将这个过程比作"反复将一幅画放入碎纸机,直到只剩下一堆细小的灰尘,然后再将碎片重新拼凑起来"。

然而,令人困惑的是,这个看似简单的重组过程却能产生全新的、语义连贯的图像内容,而不仅仅是原有训练数据的机械复制。比罗利指出了这一现象的核心矛盾:"如果它们运行完美,它们应该只是记忆。但它们并没有——它们实际上能够生成新的样本。"

局部性与等变性的意外作用

研究发现,扩散模型展现创造性的关键在于其架构中的两个技术特性:局部性和平移等变性。局部性意味着模型一次只能关注一小块像素区域,无法同时处理整个图像。平移等变性则确保当输入图像发生位置移动时,生成的图像会做出相应的一致性调整。

梅森·坎布 (如图) 于 2022 年开始在 Surya Ganguli 实验室进行研究生学习。 摄影:Charles Yang

苏里亚·甘古利 (Surya Ganguli) 是斯坦福大学的物理学家。

长期以来,AI研究人员将这些特性视为技术限制——阻碍模型创建完美图像复制品的障碍。然而,坎布和比罗利的研究表明,正是这些被认为的"缺陷"赋予了扩散模型表面上的创造能力。

由于局部性的限制,扩散模型无法掌握图像的全局结构信息。它们只能专注于逐块生成图像内容,然后依靠被研究者称为"评分函数"的数学模型将这些片段自动拼接成完整图像。这个评分函数本质上是一种数字化的图灵模式,通过局部相互作用规则指导整体结构的形成。

这种工作方式导致了一个重要结果:模型并不关注特定图像块在最终图像中的确切位置,而是专注于生成在语义上合理的局部内容。当这些局部生成的内容通过评分函数组合时,就可能产生与训练数据不同但仍然连贯的新图像。

创造力的重新定义

荷兰拉德堡德大学计算机科学家卢卡·安布罗吉奥尼对这项研究给予了高度评价,认为"这篇论文的真正优势在于,它对一些非常重大的问题做出了非常准确的预测"。这一评价指向了该研究的更深层意义:它不仅解释了现有现象,更为预测和控制AI系统的创造性输出提供了理论基础。

这一发现对我们理解创造力本身具有重要启示。如果AI的创造性完全来源于技术架构的确定性结果,那么人类创造力是否也可能存在类似的底层机制?这个问题触及了认知科学和哲学的核心议题。

从实用角度来看,这项研究为改进AI图像生成技术指明了新方向。既然创造性源于特定的架构特征,研究人员就可以通过调整这些特征来精确控制模型的创新程度。这可能有助于解决当前AI生成图像中常见的问题,如解剖结构错误或不合理的物体组合。

研究还揭示了扩散模型与生物系统之间的深层相似性。就像生物发育过程中的图灵模式一样,AI图像生成也依赖于局部相互作用规则来产生复杂的全局结构。这种相似性不仅加深了我们对两个领域的理解,也为跨学科研究开辟了新的可能性。

技术发展的新视角

这项研究的影响远不止于理论层面。在ChatGPT引发生成式AI热潮的背景下,理解这些系统的内部工作机理变得越来越重要。随着AI技术被广泛应用于艺术创作、内容生成和创意设计等领域,准确理解其创造性的本质对于合理期待和有效利用这些工具至关重要。

研究结果表明,AI的"创造力"本质上是一种涌现属性——从简单的局部规则中产生的复杂全局行为。这一认识可能改变我们设计和训练AI系统的方式。与其试图直接编程创造性,研究人员可能需要关注如何设计合适的局部相互作用规则,让创造性作为系统属性自然涌现。

此外,这一发现也对AI安全和可控性研究具有重要意义。如果创造性是架构的确定性产物,那么理论上就可以预测和控制AI系统的创新行为。这为开发更加可靠和可预测的AI系统提供了新的理论基础。

从更广泛的角度来看,这项研究挑战了我们对创造力独特性的传统认知。长期以来,创造力被视为人类独有的高级认知能力,是区分人类与机器的重要特征。然而,如果AI的创造性可以通过确定性的技术机制来解释,那么人类创造力是否也存在类似的底层规律?这个问题可能重塑我们对人类认知独特性的理解。

坎布和比罗利的研究为我们提供了一个重要教训:有时候,系统的最有趣特性恰恰来自于我们最初认为的缺陷或限制。正是扩散模型的技术"不完美"——其局部性和等变性约束——创造了我们所感知的创造力。这提醒我们,在追求技术完善的过程中,保持对意外发现的开放态度可能同样重要。

展开阅读全文

更新时间:2025-08-30

标签:科技   人工智能   创造力   产物   缺陷   真相   意外   技术   图像   模型   创造性   局部性   系统   局部   人类   架构

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By bs178.com 闽ICP备11008920号
闽公网安备35020302034844号

Top