生成对抗网络(GAN)是一个由两部分组成的人工智能系统,它由一个生成样本的生成器和一个试图区分生成样本和真实样本的鉴别器组成。它有无数的用途,其中之一是生成合成数据。优步的研究人员最近在一篇题为“通过学习加速神经架构搜索”的论文中利用了这一点,提出了一种定制化的GAN(称为生成式教学网络(GTN)),它可以生成数据或训练环境,模型可以在测试目标任务之前从中学习。该论文指出,GTN与仅使用真实数据的方法相比,可以将搜索速度提高多达9倍,GTN与不使用“数量级”计算就可以实现最高性能的最新架构相比,具有竞争优势。
正如投稿作者在他们的博客帖子中解释的那样,大多数模型搜索需要“大量”资源,因为他们通过在数据集上训练模型来评估模型,直到模型的性能不再提高。这个过程可以在一个循环中对数千个或更多的模型架构重复,这在计算上是昂贵且耗时的。一些算法通过仅训练少量时间并将获得的性能作为真实性能的估计来避免成本,但是这种训练可以通过使用机器学习(GTN)创建训练数据来进一步加速。
GTN通过创造对学习过程有用的不切实际的数据取得了成功。他们可以组合关于许多不同类型对象的信息,或者将他们的训练集中在最困难的例子上,并且基于实际数据评估训练模型。此外,他们使用学习课程(一组按特定顺序排列的训练样本)来提高生成器的性能,生成器会产生一个无序的随机分布的样本。
在实验中,研究团队表示,根据流行的开源MNIST数据集,GTN训练的模型在32步(约0.5秒)内达到了98.9%的准确率。在这个过程中,他们一次拍摄了4096张张和成图像(不到图像的10%)(在MNIST训练数据集中)。在用于测量模型搜索性能的另一个数据集CIFAR-10上对其进行了评估。即使与优化后的真实数据学习算法相比,在同等性能水平下,模型的学习速度也比真实数据快4倍。此外,事实证明,GTN数据的性能通常可以预测真实的性能——也就是说,要获得与仅在GTN生成的数据上执行128步所获得的相同的预测能力,需要在真实数据上执行1200步。
“因为GTN可以更快地评估每个架构,他们可以在固定的计算预算内评估更多的整体架构。在每一种情况下,我们都证明了由GTN生成的数据比真实数据更快,并且可以带来更高的性能。即使我们给实时数据控制十天的计算时间,结果还是一样,而GTN只需要一天的三分之二。”“通过我们的研究,我们证明了GTN生成的训练数据创建了一个快速.方法与最新的算法竞争,但采用了完全不同的方法。在我们的……工具箱中拥有这个额外的GTN工具,可以帮助优步、世界各地的所有公司和所有科学家提高深度学习在每个应用领域的性能。”