• 33
谁才是星际争霸真正的王者?Facebook游戏机器人CherryPi不敌业余程序员
统计

2017-10-10 16:50:44 谁才是星际争霸真正的王者?Facebook游戏机器人CherryPi不敌业余程序员

开发《星际争霸》超级玩家给科技巨头们带来的不仅是满足感。

AI星球(微信IDai_xingqiu)】1010日报道 (编译:小白)

在遥远的银河系克鲁普星区,Facebook的异化虫大军正焦躁不安地徘徊在敌方大本营外。指挥官不明智地打开大本营大门后,Facebook的外星人部队一股脑冲进敌方阵营,大杀特杀。以上为人工智能研究中的游戏战斗场面。

上述血腥场面乃是刚刚于周日结束的年度《星际争霸》游戏比赛,参赛主体当然不是人类,而是AI软件机器人。Facebook悄悄地开发了一款名为CherryPi的机器人,由其AI研究实验室附属机构的八名研究员开发设计。

这场悄然无息的“太空战争”表明,Facebook正认真考虑与谷歌等人在人工智能领域的竞争。位于伦敦的谷歌AI研究部门DeepMind在去年名声大噪,其开发的AlphaGo软件在围棋比赛中击败了世界冠军。八月份,DeepMind宣布,公司下一个目标是《星际争霸2》。

Facebook参加的比赛,和大多数该领域的AI研究一样,使用的仍然是老版的星际争霸游戏。业内普遍认为,这个游戏相对于软件来说,比较难以掌握。Facebook的AI研究小组,根据网站所示,一共有80名研究员。该研究小组由纽约大学教授Yann LeCun领导,目前已经发布多篇研究论文,但却并未取得能与谷歌AlphaGo比肩的成就。Facebook曾发布过三篇与《星际争霸》游戏有关的研究论文,但在赢得游戏比赛方面从未宣布任何进展。

周日发布的最终结果表明:Facebook仍需努力。整个比赛一共有28位参赛者,CherryPi的最终排名为第六。前三名获胜机器人均由独立的业余编程爱好者开发。

Facebook的研究科学家Gabriel Synnaeve将CherryPi描述为在星际争霸这款游戏构建未来研究的“基准”。他说:“我们想知道CherryPi跟现有的机器人相比,表现如何,特别是测试它是否存在需要纠正的缺陷。”CherryPi已经完成了一项长期比赛。该比赛是在娱乐领域应用AI的学术会议AIIDE的一部分。Facebook同时也赞助了今年的比赛,出资购买了运行上千个机器人对决游戏所需的硬件。

自上世纪50年代,AI技术开始发展以来,井字游戏、西洋跳棋、象棋和围棋已然成为该领域测试新理念的首选。近来,这些游戏,除了测试新理念,还掺杂了一个严肃的商业目的——越来越多的公司开始使用AI来打磨他们的产品和服务。Facebook、谷歌等技术公司,无不使用AI来改善他们的广告定位和个性化系统,并支持诸如虚拟助手和增强现实等新产品。

《星际争霸》对AI研究员的吸引力不仅在于指挥战斗的乐趣,比如建造与建筑物等大的等离子炮。虽然电子游戏可能看上去比围棋或象棋更吸引人,但由于玩家的策略和动作并不受严格的棋盘限制,且需要密切关注对手行动,电子游戏也更加复杂。围棋棋盘上的有效位置数为1后面170个零。但是,研究人员估计,再加上100多个零或许能够勉强掌握《星际争霸》的复杂性。

今年比赛的冠军是一个名为ZZZKBot的机器人,开发者为来自澳大利亚珀斯的软件开发员Chris Coxe。Coxe之前曾在纳斯达克工作。开发工作皆由Coxe一人完成,为了省下更多时间用于开发研究ZZZKBot他还请了一段时间假。在最终结果公布的前一天,Coxe谦虚地说起自己的作品:“它不过是一个概念证明,源代码还不够完美。”

跟目前为止的所有《星际争霸》机器人玩家一样,在与中等水平的人类玩家对战中,ZZZBot还是稍逊一筹,并不能坚持多久。预测和指挥外星军队所需要的规划和记忆专长,远超当今软件的能力。

不过随着两大巨头科技公司都对游戏机器人表现出极大兴趣,业余程序员开发出最佳星际争霸游戏机器人的日子大概要逐渐远去了。纽芬兰纪念大学教授,也是AIIDE比赛的组织人,David Churchill预言,未来几年,星际争霸的机器人玩家领域将出现巨大变革。

Facebook和谷歌均表示,他们研究《星际争霸》的方式都跟大多数个人程序员不同。领先的机器人背后主要基于其设计者指定的规则和策略。Coxe认为,他的机器人的一个最佳功能是简单的学习,即该功能会针对每个机器人的玩法尝试预编程策略,并记下哪种策略效果好,然后在下一场比赛中预先准备。科技巨头们打算更加倚重机器学习,计划让机器人通过学习过往游戏的比赛数据或者重复试验,来培养他们自己的战略。Facebook并没有将论文中发布的理念构建到CherryPi中。而机器学习也正是使得谷歌的AlphaGo立于不败之地的关键。

或许,Facebook的机器人没能赢得《星际争霸》的冠军。但是大赛第二名机器人——PurpleWave的开发者Dan Gant,看出了CherryPi的潜力。大多数机器人,会根据对手的相对数量,来选择正面进攻或撤退。但是在最终结果公布前发布的视频中,Gant说,CherryPi仿佛知道什么时候可以快速行进,潜入敌方基地发起进攻。

不过,独立的机器人开发人员当然也不会一夜之间就消失——就像《星际争霸》也不会很快就被AI征服。“问题依然难以解决,”Churchill解释说,“接下来几年里,我认为,业余程序员开发的基于规则的机器人,仍将表现不俗。”他认为,机器人打败人类专业选手,至少还要等五年。但是,他也坦诚,可能用不了那么久。

Gant是来自纽约的一名软件开发人员。他为了开发PurpleWave专门请假了好几个月。他说,科技巨头的加入为比赛增加了另一重吸引力,带来了独特的学习机会。“你可以是Facebook,或者DeepMind,或者刚刚学习编程的小孩子,你在竞争环境中与之竞争,”他说,“你自己的努力,和自学的能力,限制了你自己的成就。”

开发《星际争霸》超级玩家给科技巨头们带来的不仅是满足感。谷歌表示,DeepMind的机器学习已经帮助公司的数据中心减少不少制冷费用。微软的一份机器学习研究报告说,预测用户什么时候会点击广告的准确率,只要提高0.1%就可以带来数亿美元的额外收入。而能够带领外星人粉碎人类指挥的军队的机器人,势必大有用处。

1、猎云网原创文章未经授权转载必究,如需转载请联系官方微信号进行授权。
2、转载时须在文章头部明确注明出处、保留官方微信、作者和原文超链接。如转自猎云网(微信号:ilieyun
)字样。
3、猎云网报道中所涉及的融资金额均由创业公司提供,仅供参考,猎云网不对真实性背书。
0
评论
相关阅读
推荐阅读
记者名字
{{item.author_display_name}}
{{item.author_user_occu}}
{{item.author_user_sign}}
×