首页 综合 > 正文

AI完成用户的草图

充满人工智能的艺术构图工具正在迅速变得过时。来自麻省理工学院和IBM沃森人工智能实验室的科学家是来自麻省理工学院和IBM的科学家,他们将在未来十年共同追求人工智能技术。最近,一个允许用户上传任何照片并编辑建筑物、植物和固定装置外观的工具被详细介绍。今年3月,Nvidia在加利福尼亚州圣何塞举行的GPU技术大会(GTC)上推出了GauGAN。GauGAN是一个对抗性的人工智能生成系统,允许用户创建逼真的景观图像。

然而,来自加州大学伯克利分校、牛津大学和Adobe Research的研究人员希望通过交互式草图和填充技术进一步推动该领域的发展,这是一种机器学习系统,可以在用户绘制对象时向用户交互式推荐对象。这是在一篇新发表的关于印前服务器Arxiv.org的论文(“交互式草图和填充:多类草图到图像的翻译”)中描述的。

合著者写道:“[AI]图像翻译模型在获取抽象输入(如边缘图或语义分割图)并将其转换为真实图像方面表现出了非凡的成功。”“将它与用户界面相结合,使用户能够在目标域中快速创建映像。但是.对于很多人来说,可能很难在没有任何反馈的情况下完成线条画,因为未经训练的练习者通常会徒劳地画出徒手画出的物体及其部件、3D形状和透视图。因此,使用当前的交互式图像转换方法,可以通过编辑现有图像来获得逼真的图像,而不是从头开始创建图像。”

该团队使用一个多部分系统来解决图像生成的问题,其中包括从用户草图中建议对象形状,并提供成品预览。他们设计了形状和外观完成模块,根据草图更新建议的形状,并采用了GAN(由两部分组成的神经网络,由生成器和鉴别器组成,它们试图将生成的样本与实际样本区分开来。以帮助提高完整图像的准确性。

为了评估系统的鲁棒性,研究人员获得了两个开源数据集(edge2shoes,CelebA-HQ)用于对象渲染,它们的边缘被一个单独的AI模型简化为更类似于人类绘制的笔触。在测试形状和图像生成完成后,他们引入了一个更具挑战性的语料库,其中包含了来自流行的互联网搜索引擎的篮球、鸡肉、饼干、纸杯蛋糕、月亮、橙子、足球、草莓、西瓜和菠萝的200幅图像。研究人员表示,在所有测试中,该系统在大多数时间都能生成正确类别的图像,他们认为这是朝着完全端到端系统迈出的令人鼓舞的一步。

“[我们]有一个两阶段的交互式对象生成方法,其想法是围绕形状完成调解……这使得[AI模型]训练更加稳定,也使我们能够向用户提供粗略的几何反馈,用户可以根据自己的意愿选择它们进行集成。”他们写道。

值得注意的是,这并不是Adobe第一次涉足AI辅助艺术,在6月发表的一篇论文中,马里兰大学和Adobe Research的研究人员描述了一种新颖的机器学习系统LPaintB,它可以在不到15分钟的时间内复制达芬奇、梵高和约翰内斯维米尔风格的手绘画布。一分钟。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。