通过像人类一样学习偏离已知信息,人工智能(AI)的“成像”算法可以从书面指令中识别出之前不可见的物体。
该算法由KAUST研究人员Mohamed Elhoseiny与中佛罗里达大学的Mohamed Elfeki合作开发,为人工想象和新动植物物种的自动分类铺平了道路。
Elhoseiny解释说,“想象力是人类智力的关键特征之一。它使我们不仅能够生产艺术和音乐等创意产品,还能够理解视觉世界。”
人工智能依靠训练数据来发展其识别物体并对其环境做出反应的能力。人类也可以通过积累经验来发展这种能力,但人类可以做AI做不到的事情。他们可以通过想象文字描述中的东西是什么样子,或者通过类似的推理,直观地推断出他们以前遇到过的物体的可能分类。在AI中,随着技术普及到复杂的实际应用中(新物体的错误分类或错误识别可能会带来灾难性的后果),这种对未知的想象能力变得越来越重要。
同样重要的是为真实世界可靠地训练AI所需的大量数据。用AI来训练哪怕是少量的世界上所有已知动植物物种的图像都是不可行的,更不用说无数未发现或未分类的物种了。
Elhoseiny和Elfeki的研究旨在开发所谓的零打击学习(ZSL)算法,以帮助在没有训练样本的情况下,根据类别描述识别以前不可见的类别。
Elhoseiny说:“通过将ZSL与人类创造力联系起来,我们为‘无形’类别建立了一个视觉学习过程的模型,观察到ZSL是识别无形的,而创造力是创造‘可爱的无形’,”Elhoseiny说。
从创意上来说,一个新的但是令人愉快或者“赏心悦目”的东西,一定是和现有的技术不一样的,但是它应该是那么的面目全非。同样的,Elhoseiny和Elfeki精心建模了一个学习信号,它以归纳的方式鼓励偏离所看到的课堂,但没有把它推得太远,以至于想象的课堂变得不现实,失去了所看到的课堂的知识传递。该算法在ZSL的最新基准上表现出持续的改进。
Elhoseiny说,“我们的方法可能的应用之一是识别未知物种。”“使用这项技术的人工智能可以在没有图片的情况下,只通过语言描述来帮助报告物种的目击事件。”