您当前的位置: 首页 > 旅游

DeepMind又立新功AI有了更强的想象力

2018-10-12 09:20:37

“想象力”是一种人类独有的能力   人类,可以在行动之前预想到后果,这是我们认知能力中一种强大的工具。

举例来说,当我们将玻璃杯放在桌子边缘时,我们很可能会考虑一下放得稳不稳,是否会掉下来。基于对后果的思考,我们可能会调整玻璃杯的位置,避免掉在地上打碎。

这种慎重性的思考本质上是“想象力”。这是一种人类独有的能力,也是日常生活中重要的工具。

如果我们希望算法实现同样的复杂行为,那么算法也必须能够“想象”,对未来进行推理。除此以外,算法必须利用这些知识构建计划。

在这个领域,我们已看到了丰富的成果,例如AlphaGo这样的程序。AlphaGo利用“内部模型”,分析每步操作会在未来带来什么样的结果,从而进行推理和计划。

这些内部模型非常强大,因为围棋是一种“完美的”环境。围棋有明确定义的规则,因此在几乎任何情况下都可以非常准确地预测结果。

然而,现实世界情况更复杂,规则没有明确定义,预期之外的结果常常会出现。即使是最聪明的人工智能系统,在这种复杂环境中展开想象都会是漫长而成本高昂的过程。

在两篇最新论文中,我们描述了一类新方法,让人工智能建立以想象力为基础的计划能力。我们还提出了一种架构,给人工智能系统提供新方式,去学习并构建计划,最大化任务效率。对于不完美模型,这些架构高效而健壮,可以利用灵活的策略去发挥想象力。

这两篇新论文是:

Imagination-Augmented Agents for Deep Reinforcement Learning

https://arxiv.org/abs/1707.06203

Learning model-based planning from scratch

https://arxiv.org/abs/1707.06170

我们介绍的这些人工智能系统受益于“想象编码器”。这种神经网络可以学会提取有用信息,用于未来的决策,同时忽略不相关的信息。

这样的人工智能系统拥有许多独特之处:

我们利用多种任务去测试提出的架构,包括解谜游戏《Sokoban》,以及一款太空飞船导航游戏。这两款游戏都需要前瞻性的规划和推理,因此是测试我们人工智能系统的绝佳环境。

在《Sokoban》游戏中,人工智能系统将盒子推到目标之上。由于盒子只能向前推,因此许多操作是不可逆的。

在太空飞船游戏中,人工智能系统必须按照固定次数去启动推进器,使飞船保持稳定。这样的操作需要适应不同星球的引力。因此,这是一种非线性的复杂持续控制任务。

为了限制这两种任务中的试错次数,每一关卡都用程序生成,而人工智能系统只能尝试一次。这就鼓励人工智能系统在现实环境测试之前,尝试不同的策略。

昨天,DeepMind创始人兼CEO哈萨比斯,还在访谈中提到想象力以及神经科学和人工智能的融合借鉴。他说:只有了解大脑,才能开发出更强的AI。而且也发了论文~

办公室玻璃隔墙
汕头金平一居室房价
手机可携式充电器图片
办公室盆景
金平二居室新楼盘
深圳手机视窗面板
办公室盆景租赁
汕头金平二居室房价
数码相机液晶显示保护面板图片
推荐阅读
图文聚焦