首页 资讯 社会 经济 快讯 旅游 文化 时尚 娱乐 科技 石狮 快报

微软AI扮演的是Pac-Man女士的完美游戏

2017-06-16 10:57 来源:未知
 

微软的人工智能系统之一征服了1980年代的视频游戏Pac-Man女士。

来自微软拥有的加拿大AI公司Maluuba的团队取得了最高的999,990分。

软件巨头说,游戏中部署的方法也可以用于教授AI代理人来执行复杂的任务来帮助人类。

不过,布里斯托大学计算机科学家Nello Cristianini教授听到一个警告。

“这是非常令人激动的,今天在AI发生了如此多的进展,但是我们应该记住,历史上AI并不总是能够将结果复制到游戏中,当将方法转移到现实世界的问题时,应该记住,我们是否谈论Jeopardy ,国际象棋,Go或者Pac-Man女士。“

Google的DeepMind AI 已经打败了Go的复杂游戏,被广泛视为AI研究领域的领军企业。

'高级经理'

蒙大拿麦吉尔大学计算机科学副教授Doina Precup表示,微软的胜利是一个重大成就。

她说:“许多试验AI的公司使用电子游戏测试他们的系统,但是Pac-Man女士是最难解决的问题之一。

在博客中,微软解释说,该团队使用了一种称为强化学习的人工智能技术来掌握Atari 2600版本的游戏。为了达到高分,团队将问题分解成AI代理商分发的小块。

该系统使用了超过150个代理商,每个代理商与其他代理商并行处理游戏。有些人成功地找到了一个特定的球团,而另外一些人则受到了阻止幽灵的控制。

然后,研究人员创建了一名“高级经理”代理人,接受了所有其他人的建议,并用它们来决定在何处移动Pac-Man女士。

它的决策是复杂的,所以,例如,如果100个代理人想要正确,因为这是最好的途径,他们的球团,但三个想离开,因为在右边是一个致命的鬼,它会给予更多的重量那些注意到鬼的人。

Maluuba的研究经理Harm Van Seijen表示,当每个代理人非常自发地行事时,最好的结果是实现的,而顶级代理人则考虑到了每个人的最佳选择。

他说:“一方面,根据所有代理人的喜好,合作是一个很好的相互关系,但同时每个代理只关心一个特定的问题。”

他已经发表了一篇关于该技术的文章 - 被称为“混合奖励架构”(Hybrid Reward Architecture) - 尚未被同行评议。

“嘉清”

有些人可能会质疑为什么诸如AI这样的尖端技术就是在20世纪80年代设计的游戏上进行培训。

Maluuba的项目经理Rahul Mehrotra解释说,这是因为这样的游戏非常复杂,并且说:“很多从事AI的公司使用游戏来构建智能算法,因为你需要很多类似人类的智能功能打败游戏“。

街机版游戏的共同创始人之一,史蒂夫·戈尔森(Steve Golson)在博客中表示,帕特曼女士的设计是简单易玩,但几乎不可能征服,以便人们将更多的钱投入机器。

“你想[他们想想]哦,哦,我差不多了,我要再试一次。

AI研究人员越来越喜欢团队使用的强化学习技术。教学AI的另一个主要方法是通过监督学习,其中系统越来越好,因为它们被提供了更多的良好行为的例子。

珠穆朗玛峰

通过强化学习,一个代理人获得积极和消极的反应,通过尝试和错误学习,最大限度地发挥积极的作用。

越来越多的强化学习被视为一种创造人工智能的方法,可以做出更自主的决策和执行更复杂的任务。

谢菲尔德大学的计算机科学家Noel Sharkey教授说,AI已经征服了另一个人类的游戏是“非常好的”,但也反映了克里斯蒂安尼教授的观点。

“这是对一般AI的另一个步骤,就像攀登珠穆朗玛峰一样,声称这是向遥远的星系旅行的另一个步骤。”

微软在处理AI时遇到过问题。

被称为Tay的Chatbot在2016年被发布在Twitter上被匆忙删除,被教唆发誓并进行种族主义评论。

上一篇:协定为重振《希腊援助计划与货币基金组织的参与

下一篇:佳士得销售价格为137K美元,从塞勒姆女巫试用中稀释

责任编辑:丹丹

点击排行
推荐阅读