ChatGPT 和其他深度生成模型被证明具有不可思议的模仿能力。这些人工智能超级模特可以通过自动学习数以百万计的先前作品示例来创作诗歌、完成交响乐并创建新的视频和图像。这些极其强大且多功能的工具擅长生成与他们以前见过的所有内容相似的新内容。
但正如麻省理工学院的工程师在一项新研究中所说,如果你想在工程任务中真正创新,相似性是不够的。
“深度生成模型(DGM)非常有前途,但也存在固有的缺陷,”该研究的作者、麻省理工学院机械工程研究生 Lyle Regenwetter 说。“这些模型的目标是模仿数据集。但作为工程师和设计师,我们通常不想创建已经存在的设计。”
他和他的同事认为,如果机械工程师需要人工智能的帮助来产生新颖的想法和设计,他们必须首先将这些模型重新聚焦在“统计相似性”之外。
“许多模型的性能与生成的样本与模型已经看到的样本在统计上的相似程度明确相关,”合著者、麻省理工学院机械工程助理教授 Faez Ahmed 说。“但在设计中,如果你想创新,与众不同可能很重要。”
在他们的研究中,艾哈迈德和雷根韦特揭示了深度生成模型在解决工程设计问题时的陷阱。在自行车车架设计的案例研究中,该团队表明,这些模型最终会生成模仿以前设计的新车架,但在工程性能和要求方面却表现不佳。
当研究人员向 DGM 提出相同的自行车车架问题时,他们专门以工程为重点的目标而设计,而不仅仅是统计相似性,这些模型产生了更具创新性、性能更高的车架。
该团队的结果表明,以相似性为中心的人工智能模型在应用于工程问题时并不能完全转化。但是,正如研究人员在研究中强调的那样,通过仔细规划适合任务的指标,人工智能模型可以成为有效的设计“副驾驶”。
“这是关于人工智能如何帮助工程师更好更快地创造创新产品,”艾哈迈德说。“要做到这一点,我们必须首先了解要求。这是朝这个方向迈出的一步。”
该团队的新 研究最近出现在网上,并将发表在《计算机辅助设计》 杂志 12 月印刷版上 。这项研究是 MIT-IBM Watson AI 实验室的计算机科学家和 MIT DeCoDe 实验室的机械工程师合作进行的。该研究的合著者包括 MIT-IBM Watson AI 实验室的 Akash Srivastava 和 Dan Gutreund。
提出问题
正如 Ahmed 和 Regenwetter 所写,DGM 是“强大的学习者,拥有无与伦比的能力”来处理大量数据。DGM 是一个广义术语,指的是任何机器学习模型,经过训练可以学习数据分布,然后使用它来生成新的、统计上相似的内容。广受欢迎的 ChatGPT 是一种深度生成模型,称为大型语言模型 (LLM),它将自然语言处理功能融入到模型中,使应用程序能够生成真实的图像和语音来响应对话查询。其他流行的图像生成模型包括 DALL-E 和稳定扩散。
由于 DGM 具有从数据中学习并生成真实样本的能力,因此已越来越多地应用于多个工程领域。 设计师使用深度生成模型来起草新的飞机框架、超材料设计以及桥梁和汽车的最佳几何形状。但在大多数情况下,这些模型模仿了现有设计,而没有提高现有设计的性能。
“与 DGM 合作的设计师有点错过了这一点,即调整模型的训练目标以专注于设计要求,”Regenwetter 说。“因此,人们最终会生成与数据集非常相似的设计。”
在新的研究中,他概述了将 DGM 应用于工程任务的主要陷阱,并表明标准 DGM 的基本目标没有考虑到具体的设计要求。为了说明这一点,该团队引用了一个简单的自行车车架设计案例,并证明问题早在初始学习阶段就可能出现。当一个模型从数千个不同尺寸和形状的现有自行车车架中学习时,它可能会认为两个尺寸相似的车架具有相似的性能,而实际上一个车架中的微小脱节——太小而无法登记为统计相似性的显着差异指标——使框架比其他视觉上相似的框架弱得多。
超越“香草”
研究人员继续以自行车为例,看看 DGM 在从现有设计中学习后实际上会生成什么设计。他们首先测试了传统的“普通”生成对抗网络(GAN)——这种模型已广泛用于图像和文本合成,并且经过简单调整即可生成统计上相似的内容。他们在数千个自行车车架的数据集上训练了模型,其中包括商业制造的设计和由业余爱好者设计的不太传统的一次性车架。
一旦模型从数据中学习,研究人员就要求它生成数百个新的自行车车架。该模型产生了类似于现有框架的逼真设计。但这些设计都没有在性能上表现出显着的改进,有些设计甚至还稍逊一筹,框架更重,结构更差。
随后,该团队对另外两台专为工程任务设计的 DGM 进行了相同的测试。第一个模型是艾哈迈德之前开发的用于生成高性能翼型设计的模型。他构建这个模型是为了优先考虑统计相似性和功能性能。当应用于自行车车架任务时,该模型生成了比现有设计更轻、更坚固的逼真设计。但它也产生了物理上“无效”的框架,其组件不太适合或以物理上不可能的方式重叠。
“我们看到了明显优于数据集的设计,但也看到了几何上不兼容的设计,因为模型没有专注于满足设计约束,”Regenwetter 说。
该团队测试的最后一个模型是 Regenwetter 构建的用于生成新几何结构的模型。该模型的设计优先级与之前的模型相同,增加了设计约束的成分,并优先考虑物理上可行的框架,例如,没有断开或重叠的杆。最后一个模型产生了性能最高的设计,而且在物理上也是可行的。
艾哈迈德说:“我们发现,当模型超越统计相似性时,它可以提出比现有设计更好的设计。” “如果人工智能经过明确的设计任务训练,它就能证明人工智能可以做什么。”
例如,如果 DGM 可以考虑其他优先事项,例如性能、设计限制和新颖性,艾哈迈德预计“许多工程领域,例如分子设计和土木基础设施,将大大受益。通过揭示仅依赖统计相似性的潜在陷阱,我们希望激发多媒体之外的生成人工智能应用的新途径和策略。”