微软的人工智能系统之一征服了1980年代的视频游戏Pac-Man女士。
来自微软拥有的加拿大AI公司Maluuba的团队取得了最高的999,990分。
软件巨头说,游戏中部署的方法也可以用于教授AI代理人来执行复杂的任务来帮助人类。
不过,布里斯托大学计算机科学家Nello Cristianini教授听到一个警告。
“这是非常令人激动的,今天在AI发生了如此多的进展,但是我们应该记住,历史上AI并不总是能够将结果复制到游戏中,当将方法转移到现实世界的问题时,应该记住,我们是否谈论Jeopardy ,国际象棋,Go或者Pac-Man女士。“
Google的DeepMind AI 已经打败了Go的复杂游戏,被广泛视为AI研究领域的领军企业。
蒙大拿麦吉尔大学计算机科学副教授Doina Precup表示,微软的胜利是一个重大成就。
她说:“许多试验AI的公司使用电子游戏测试他们的系统,但是Pac-Man女士是最难解决的问题之一。
在博客中,微软解释说,该团队使用了一种称为强化学习的人工智能技术来掌握Atari 2600版本的游戏。为了达到高分,团队将问题分解成AI代理商分发的小块。
该系统使用了超过150个代理商,每个代理商与其他代理商并行处理游戏。有些人成功地找到了一个特定的球团,而另外一些人则受到了阻止幽灵的控制。
然后,研究人员创建了一名“高级经理”代理人,接受了所有其他人的建议,并用它们来决定在何处移动Pac-Man女士。
它的决策是复杂的,所以,例如,如果100个代理人想要正确,因为这是最好的途径,他们的球团,但三个想离开,因为在右边是一个致命的鬼,它会给予更多的重量那些注意到鬼的人。
Maluuba的研究经理Harm Van Seijen表示,当每个代理人非常自发地行事时,最好的结果是实现的,而顶级代理人则考虑到了每个人的最佳选择。
他说:“一方面,根据所有代理人的喜好,合作是一个很好的相互关系,但同时每个代理只关心一个特定的问题。”
他已经发表了一篇关于该技术的文章 - 被称为“混合奖励架构”(Hybrid Reward Architecture) - 尚未被同行评议。
有些人可能会质疑为什么诸如AI这样的尖端技术就是在20世纪80年代设计的游戏上进行培训。
Maluuba的项目经理Rahul Mehrotra解释说,这是因为这样的游戏非常复杂,并且说:“很多从事AI的公司使用游戏来构建智能算法,因为你需要很多类似人类的智能功能打败游戏“。
街机版游戏的共同创始人之一,史蒂夫·戈尔森(Steve Golson)在博客中表示,帕特曼女士的设计是简单易玩,但几乎不可能征服,以便人们将更多的钱投入机器。
“你想[他们想想]哦,哦,我差不多了,我要再试一次。
AI研究人员越来越喜欢团队使用的强化学习技术。教学AI的另一个主要方法是通过监督学习,其中系统越来越好,因为它们被提供了更多的良好行为的例子。
通过强化学习,一个代理人获得积极和消极的反应,通过尝试和错误学习,最大限度地发挥积极的作用。
越来越多的强化学习被视为一种创造人工智能的方法,可以做出更自主的决策和执行更复杂的任务。
谢菲尔德大学的计算机科学家Noel Sharkey教授说,AI已经征服了另一个人类的游戏是“非常好的”,但也反映了克里斯蒂安尼教授的观点。
“这是对一般AI的另一个步骤,就像攀登珠穆朗玛峰一样,声称这是向遥远的星系旅行的另一个步骤。”
微软在处理AI时遇到过问题。
被称为Tay的Chatbot在2016年被发布在Twitter上被匆忙删除,被教唆发誓并进行种族主义评论。
责任编辑:丹丹