启元 2:0战胜星际2顶级职业选手：启元AI一战成名！

科技资讯认证作者

2021-03-20 04:25:13

导语：AlphaGo之后，AI在世界人机大战中再次获胜。6月21日，在启元世界举办的第一届“星际AI顶级职业玩家挑战赛”中，启元“AI星际指挥官”以2:0击败星际争霸1/2全国冠军黄慧明、黄金总决赛冠军、人族最强选手李培南。与围棋相比，星际争霸是一个不完全的信息游戏，战争的迷雾对AI的战略规划、布局和决策提出了更高

AlphaGo之后，AI在世界人机大战中再次获胜。

6月21日，在启元世界举办的第一届“星际AI顶级职业玩家挑战赛”中，启元“AI星际指挥官”以2:0击败星际争霸1/2全国冠军黄慧明、黄金总决赛冠军、人族最强选手李培南。

与围棋相比，星际争霸是一个不完全的信息游戏，战争的迷雾对AI的战略规划、布局和决策提出了更高的要求。而在决策空室，围棋只有361种，星际2大概有1026种。所以更具挑战性的星际争霸成为了AI与人类竞争的下一个竞技场。

在人族第一场比赛中，AI星官只用了11分钟就让国家冠军杜明打GG。在这场比赛中，AI星官相当自信，进攻干净利落，直击心脏。

但是，TooDming在赛后毫不犹豫地称赞AI的策略和打法，让他学到了很多，也没有觉得自己在比赛中是在和一个虚拟机器人作战。

如果说TooDming更擅长对抗虫族，那么AI和最强人族玩家Time的对抗可以说是精彩绝伦。双方打了20分钟，现场解说员惊叹不已。时间显示了韩服6500最强人族的实力，而AI星官的宏观策略和微观操作并不逊色。然而最终，时代没能让AI星官玩GG。

赛后，《时代周刊》在推特上写道:“如果你不如别人，你就会屈服。”。

对于这个结果，AI星官的创始人兼陪练官也表示惊讶。虽然AI星官的决策能力最近呈指数级增长，但他们有信心击败TooDming，但对时间没有完全把握。AI星官独立应对和决策的能力显然超出了大家的预期。

那么，AI星官在这场比赛中表现如何？大家一起回顾一下亮点。

AI星指挥官:2:0胜利！

AI星际指挥官是奇源世界开发的一款agent，是一款具有自主学习和独立决策能力的AI，在虚拟世界中表现为数字人，在物理世界中表现为机器人。类似的代理包括AlphaGo和AlphaStar。

这个游戏采用三转制，以人族为战场。第一职业选手，绰号土豆明的黄慧明，在动物园电竞俱乐部工作，擅长虫族。自2006年成为职业明星玩家以来，共获得11次冠军，最高成绩是星际争霸I/II全国冠军。

第一轮的第一场比赛是保守的。AI星官率先发动两次攻击，TooDming成功防守。人族对抗中，谁先接手场外控制，谁就获得游戏的主导力量。但是在TooDming的并行挖掘过程中，出现了一点小错误。AI星官没有给对手任何机会。他瞬间抓住漏洞，直接击中心脏。比赛用了11分钟才结束。

第2回合东明调整了扩张模式，更加注重防守策略，而AI也及时调整，循序渐进，一层一层向前推进，而不是像前一局那样猛烈进攻。最终，图德明还是逃脱不了AI星际官方的打压。

据了解，AI星际军官已经掌握了260种打法，但这些打法往往具有普遍性，他们会根据真实的战斗场景做出相应的战略调整，这是人类无法预测的。后来在与时间的决战中，AI把这种意想不到的发挥发挥到了极致。

第二名选手李培南在凯子明电子竞技俱乐部打球，在韩服天梯上以6500多分成为世界顶级职业选手。2018年，他获得星际争霸1/2的黄金总决赛冠军，并在暴雪黄金总决赛中击败了图德明。

AI和时间之战可以说是全球直播挑战最强的战役。

在第一回合的比赛中，AI星官使用维京作为主战和控制单位，让所有人都大吃一惊。他之前从未见过这样的战术，这也让《时代周刊》直接失去了它。评论员说这种战术对人类玩家很有启发。

值得一提的是，在激怒TooDming之后，面对更强的时间，AI星官发出了“爱与和平”的对话框。不得不感叹其实时感知能力。

第2回合时间是最后一站，但是AI星官的打法让他感觉很迷茫，从左到右的多线程攻击让他只能继续防守。最后，资源储备明显不足。整场比赛结束后，看直播的网友表示，只有时间才能像AI一样抵御强攻。

有网友建议可以持续到20分钟，非常适合AI陪练官，一定会长得更快......

至于比赛的最终结果，AI星官的陪练官表示，2-0击败TooDming是意料之外的，但他最终2-0击败Time也是意料之外的。毕竟时间的力量是众所周知的。另外，这也是AI星际官20分钟的连续操作，顶住了长板的压力，做出了更好的反应和执行力。

利用AGI——星际争霸

而AlphaGo、AlphaStar等AI星际官员或代理人的出现，背后的意图并不是为了打败人类，而是通过与人类的对抗训练，让AI获得更好的自主学习和决策能力。由此得到的通用技术，可以帮助更复杂更广泛的实际应用场景，实现最终的通用人工智能。

这也是奇源世界、DeepMind、OpenAI等科技公司之所以选择在这里发力的重要原因，除了在AI训练最好的地方，共同选择了实时策略游戏。

为什么赌星际争霸？AlphaGo以3:0击败顶级职业围棋手李世石后，DeepMind研究人员开始攻击以不完全信息游戏为代表的实时策略游戏。

与Go/Texas Hold 'em相比，玩家可以观察对方的战略进攻，不完全信息游戏意味着玩家只能“探测”或“猜测”敌人的情况。这给决策带来很大的不确定性。

星际争霸的特点是典型的不完全信息。同时，作为一款经典的实时策略游戏，其复杂度成倍增加。

首先，从游戏角度来说，星际争霸并没有最好的策略。需要根据战争实际情况随时调整战略，扩大资源，在宏观经济和微观运行之间找到最佳平衡。所以在这场比赛中，我们也看到了AI星际打出了人类前所未见的战术。

此外，星际争霸还有更大数量的决策空，每分钟可以达到3000-4000次。特别是相对于同样是实时战略范畴的Dota，星际空间有很多可控的单位，比如采矿、造部队、侦查敌军、发动攻击等。不同单位在时间和数量上的不同组合，会对整个局势产生决定性的影响。

更重要的是，它的即时性要求玩家在毫秒内做出反应，这是与传统象棋最大的区别。

研究人员认为，星际争霸是对AI综合能力的一次巨大考验。其不完全信息决策、长期部署和实时对抗的特点与现实世界环境和需求非常相似。同时，它要求AI不仅要实时感知和识别环境，还要适应环境，做出成千上万个连续的决策。所以可以作为AI训练的最佳虚拟场景。

AI星际指挥官的创始人

但是，《星际争霸》真的是一个很难啃的骨头，直到最近几年，AI星际争霸才取得了一些突出的成绩。

在这次AI之星挑战赛之前，这个领域最突出的成就是DeepMind推出的AlphaStar。经过15年的技术研发，AlphaStar在2018年以5:0的比分击败了TeamLiquid的职业Star 2玩家TLO和最强神族玩家MaNa。然而在后来的展览赛中，MaNa成功扳回一局，杀死了AlphaStar。

这次AI星官以2:0的战绩击败了世界顶级职业选手Time，达到了与DeepMind相同的水平。但不同的是，启元世界只用了三年时间就发布了这么强大的AI星际军官，计算能力只占DeepMind的1%。

据研究人员称，工程和算法是AI星际官员的核心优势。通过最初的“数据生成-传输-消耗”的集成计算框架，他们将代理训练的数据吞吐率提高了10倍以上。此外，在算法方面，齐源自主开发的指挥官神经网络结构，结合高效的群体进化训练方法，不仅可以增强智能体的鲁棒性，还可以在计算能力有限的情况下实现智能体的快速进化。

短短三年时间，这家人工智能领域的创业公司不可小觑。

据了解，公司自成立以来，围绕星际争霸展开代理研究，创始人袁泉曾是阿里认知计算实验室的核心成员。同时，公司核心成员为BAT、网飞、IBM、HKUST、柏克莱等国内外知名高科技企业和一流大学。

这次AI星官大获全胜，标志着其代理技术的初步成熟。据研究人员介绍，AI星官背后的秘密武器“Agent Training云平台”已正式进入市场，并已广泛应用于交通调度、数字娱乐、公共技术、机器人等行业。

比如在交通调度中，agents可以成为交通调度员，每隔几秒钟自动调度优化红绿灯，可以大大缓解交通拥堵，实现真正的智能城市。

最后一个问题:如果实现了一般的人工智能技术，你最希望它能赋能解决哪个行业？

免责申明：以上内容属作者个人观点，版权归原作者所有，不代表趣投网立场！登载此文只为提供信息参考，并不用于任何商业目的。如有侵权或内容不符，请联系我们处理，谢谢合作！

当前文章地址：https://www.qthbsb.com/keji/639228.html 感谢你把文章分享给有需要的朋友！

上一篇：中国联通流量卡 19元/月中国联通“亲子卡”首发：3GB流量+100分钟语音下一篇：江苏赛麟造车之路就此落幕？江苏赛麟上海分公司被查封

启元 2:0战胜星际2顶级职业选手：启元AI一战成名！

相关文章