微软AI扮演的是Pac-Man女士的完美游戏

微软的人工智能系统之一征服了1980年代的视频游戏Pac-Man女士。

来自微软拥有的加拿大AI公司Maluuba的团队取得了最高的999,990分。

软件巨头说，游戏中部署的方法也可以用于教授AI代理人来执行复杂的任务来帮助人类。

不过，布里斯托大学计算机科学家Nello Cristianini教授听到一个警告。

“这是非常令人激动的，今天在AI发生了如此多的进展，但是我们应该记住，历史上AI并不总是能够将结果复制到游戏中，当将方法转移到现实世界的问题时，应该记住，我们是否谈论Jeopardy ，国际象棋，Go或者Pac-Man女士。“

Google的DeepMind AI 已经打败了Go的复杂游戏，被广泛视为AI研究领域的领军企业。

'高级经理'

蒙大拿麦吉尔大学计算机科学副教授Doina Precup表示，微软的胜利是一个重大成就。

她说：“许多试验AI的公司使用电子游戏测试他们的系统，但是Pac-Man女士是最难解决的问题之一。

在博客中，微软解释说，该团队使用了一种称为强化学习的人工智能技术来掌握Atari 2600版本的游戏。为了达到高分，团队将问题分解成AI代理商分发的小块。

该系统使用了超过150个代理商，每个代理商与其他代理商并行处理游戏。有些人成功地找到了一个特定的球团，而另外一些人则受到了阻止幽灵的控制。

然后，研究人员创建了一名“高级经理”代理人，接受了所有其他人的建议，并用它们来决定在何处移动Pac-Man女士。

它的决策是复杂的，所以，例如，如果100个代理人想要正确，因为这是最好的途径，他们的球团，但三个想离开，因为在右边是一个致命的鬼，它会给予更多的重量那些注意到鬼的人。

Maluuba的研究经理Harm Van Seijen表示，当每个代理人非常自发地行事时，最好的结果是实现的，而顶级代理人则考虑到了每个人的最佳选择。

他说：“一方面，根据所有代理人的喜好，合作是一个很好的相互关系，但同时每个代理只关心一个特定的问题。”

他已经发表了一篇关于该技术的文章 - 被称为“混合奖励架构”（Hybrid Reward Architecture） - 尚未被同行评议。

有些人可能会质疑为什么诸如AI这样的尖端技术就是在20世纪80年代设计的游戏上进行培训。

Maluuba的项目经理Rahul Mehrotra解释说，这是因为这样的游戏非常复杂，并且说：“很多从事AI的公司使用游戏来构建智能算法，因为你需要很多类似人类的智能功能打败游戏“。

街机版游戏的共同创始人之一，史蒂夫·戈尔森（Steve Golson）在博客中表示，帕特曼女士的设计是简单易玩，但几乎不可能征服，以便人们将更多的钱投入机器。

“你想[他们想想]哦，哦，我差不多了，我要再试一次。

AI研究人员越来越喜欢团队使用的强化学习技术。教学AI的另一个主要方法是通过监督学习，其中系统越来越好，因为它们被提供了更多的良好行为的例子。

通过强化学习，一个代理人获得积极和消极的反应，通过尝试和错误学习，最大限度地发挥积极的作用。

越来越多的强化学习被视为一种创造人工智能的方法，可以做出更自主的决策和执行更复杂的任务。

谢菲尔德大学的计算机科学家Noel Sharkey教授说，AI已经征服了另一个人类的游戏是“非常好的”，但也反映了克里斯蒂安尼教授的观点。

“这是对一般AI的另一个步骤，就像攀登珠穆朗玛峰一样，声称这是向遥远的星系旅行的另一个步骤。”

微软在处理AI时遇到过问题。

被称为Tay的Chatbot在2016年被发布在Twitter上被匆忙删除，被教唆发誓并进行种族主义评论。

责任编辑：丹丹

点击排行