很多文章的报道都是由微观而宏观,今日小编讲给大家带来的关于Google通过开源框架改进了AI模型培训的资讯也不例外,希翼可以在一定的程度上开阔你们的视野!y有对Google通过开源框架改进了AI模型培训这篇文章感兴趣的小伙伴可以一起来看看
谷歌正在帮助研究人员寻求通过开放一个用于自己项目的强化学习框架来培训人工智能模型。
到目前为止,强化学习已被用于一些最令人印象深刻的AI演示,包括那些在Alpha Go和Dota 2击败人类职业游戏玩家的游戏。谷歌子公司DeepMind将其用于深度Q网络(DQN)。
建立强化学习框架需要时间和重要资源。为了使AI充分发挥其潜力,它需要变得更容易获得。
从今天开始,Google正在开辟基于TensorFlow的开源增强框架 - 它的机器学习库 - 可在GitHub上获得。
Google脑研究员Pablo Samuel Castro和Marc G. Bellemare在一篇博文中写道:
“灵感来自大脑奖励动机行为的主要组成部分之一,反映了神经科学与强化学习研究之间强烈的历史联系,该平台旨在实现能够推动激进发现的那种投机性研究。
此版本还包括一组协作,阐明如何使用我们的框架。“
Google的框架设计有三个重点:灵便性,稳定性和可重复性。
该公司为街机学习环境提供了15个代码示例 - 一个使用视频游戏评估AI技术性能的平台 - 以及四种不同的机器学习模型:C51,上述DQN,隐式分位网络和Rainbow代理。
强化学习是最有效的培训方法之一。如果你正在训练一只狗,提供治疗作为对所需行为的奖励是实践中积极强化的一个关键例子。
培训机器是一个类似的概念,惟独奖励被提供或保留为零和零而不是美味的商品或薪水。
“我们的希翼是,我们的框架的灵便性和易用性将使研究人员能够尝试新的思想,无论是渐进的还是激进的,”Bellemare和Castro写道。“我们已经积极地将它用于我们的研究,发现它使我们能够灵便地快速迭代许多想法。”
“我们很高兴看到更大的社区能够做到这一点。”