1言九鼎,彩富人生

栏目导航
1彩网
联系我们
服务热线
4008-888-888
地址:深圳市龙华新区
当前位置:网站首页 > 1彩网 >
DeepMind的AlphaStar AI现在是一个完全成熟的星际争霸
浏览: 发布日期:2019-10-31

机器的崛起吸引了当今一步步接近现实,研究人员宣布,谷歌DeepMind供电AlphaStar AI现在已经取得了宗师在星际争霸的所有三场比赛2 AlphaStar为主的职业星际2选手的排名,但只作为一个神族选手,并且在更有利的条件。现在,研究人员说,AI可以在宗师级“专业批准的条件下”,并以相同的约束人类的球员,包括通过摄像头,并在其行动的频率,甚至更严格的限制观看比赛。

[ 123]“许多现实世界的应用需要人工坐席竞争,在复杂环境中的其他代理协调。作为一个敲门砖这一目标,星际争霸的领域已经成为一个N代表人工智能研究的重要挑战,因为其标志性和持久最困难的专业电子竞技及在其原料的复杂性和多智能体挑战方面的相关性,以现实世界中的地位”的解释。

“在十年,无数比赛的过程中,最强的代理商简化了游戏的重要方面,利用超人的能力,或采用手工制作子系统。尽管有这些优势,没有以前的经纪人已经接近顶部星际争霸选手的整体技能匹配。我们选择使用通用学习方法,原则上适用于其他复杂的领域,以解决星际争霸的挑战:多代理强化学习算法,从人类使用数据并不断调整策略和反击策略,通过每个深层神经网络所代表的不同的联赛中比赛剂。我们评估我们的代理,AlphaStar,在星际争霸2的完整的游戏,通过一系列对人类玩家的网络游戏。 AlphaStar是额定的在大宗师级别的所有三个星际种族及以上的正式排名人类玩家99.8个百分点。“

研究人员的解释,他们所使用的混合‘通用机器学习技术’,培养AlphaStar ,包括通过强化学习,多Agent学习,模仿学习神经网络,自我发挥,在这一过程中各有自己内在的优势和劣势。一个特别有趣的步骤是一组自制剧“代理人”的发展呼叫编辑联赛。自我发挥剂通常尽最大努力在任何时候都取胜,但是这不一定教或学习的最好方法。

“在现实世界中,玩家想在星际争霸改善可能会选择这样做通过与朋友合作,使他们能够训练特定的策略。因此,他们的训练伙伴是不是打战胜每一个可能的对手,而是将其暴露自己的朋友的缺点,帮助他们变得更好,更强大的球员,”研究小组解释

“联盟的主要观点是,玩赢是不够的。相反,我们既需要主要代理商,其目标是赢得与每个人,也是“拿一个为开发者代理球队”,专注于帮助主剂发展壮大通过暴露其FLAWS,而不是最大化自己的赢率。使用这种训练方法,目前联赛获悉其所有复杂的星际争霸II策略在终端到终端的方式,而不是我们的工作,这缝合通过多种方法和算法生成剂一起较早的化身。“[123 ]

强化学习也在开发AI发挥了重要作用。在“巨大的行动空间”星际争霸2使许多现有的强化学习技术无效,但“AlphaStar用来关闭政策强化学习一种新的算法,这使得它有效地从游戏由一个老政策起到更新其政策。“

我很高兴我们终于可以与世界分享。它是一个令人难以置信的经验与@DeepMindAI AlphaStar团队一起工作,它的一个巨大的荣幸地成为本论文的共同作者。感谢您对谁做出可能的一切!

关注1彩官网(www.bjgrh.com.cn)。


                  友情链接:亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博
亚博体育娱乐平台
亚博国际彩票
腾讯娱乐 一彩网 百度娱乐 一彩娱乐

1彩娱乐网

联系方式:4008-888-888

地址:深圳市龙华新区

Copyright © 2014-2018 1彩娱乐网 版权所有 Power by DedeCms丨备案号:粤ICP备12345678号-1丨技术支持:1彩网