当前位置:趣投网 > 科技资讯 > 正文

启元 2:0战胜星际2顶级职业选手:启元AI一战成名!

导语:AlphaGo之后,AI在世界人机大战中再次获胜。6月21日,在启元世界举办的第一届“星际AI顶级职业玩家挑战赛”中,启元“AI星际指挥官”以2:0击败星际争霸1/2全国冠军黄慧明、黄金总决赛冠军、人族最强选手李培南。与围棋相比,星际争霸是一个不完全的信息游戏,战争的迷雾对AI的战略规划、布局和决策提出了更高

AlphaGo之后,AI在世界人机大战中再次获胜。

6月21日,在启元世界举办的第一届“星际AI顶级职业玩家挑战赛”中,启元“AI星际指挥官”以2:0击败星际争霸1/2全国冠军黄慧明、黄金总决赛冠军、人族最强选手李培南。

与围棋相比,星际争霸是一个不完全的信息游戏,战争的迷雾对AI的战略规划、布局和决策提出了更高的要求。而在决策空室,围棋只有361种,星际2大概有1026种。所以更具挑战性的星际争霸成为了AI与人类竞争的下一个竞技场。

在人族第一场比赛中,AI星官只用了11分钟就让国家冠军杜明打GG。在这场比赛中,AI星官相当自信,进攻干净利落,直击心脏。

但是,TooDming在赛后毫不犹豫地称赞AI的策略和打法,让他学到了很多,也没有觉得自己在比赛中是在和一个虚拟机器人作战。

如果说TooDming更擅长对抗虫族,那么AI和最强人族玩家Time的对抗可以说是精彩绝伦。双方打了20分钟,现场解说员惊叹不已。时间显示了韩服6500最强人族的实力,而AI星官的宏观策略和微观操作并不逊色。然而最终,时代没能让AI星官玩GG。

赛后,《时代周刊》在推特上写道:“如果你不如别人,你就会屈服。”。

对于这个结果,AI星官的创始人兼陪练官也表示惊讶。虽然AI星官的决策能力最近呈指数级增长,但他们有信心击败TooDming,但对时间没有完全把握。AI星官独立应对和决策的能力显然超出了大家的预期。

那么,AI星官在这场比赛中表现如何?大家一起回顾一下亮点。

AI星指挥官:2:0胜利!

AI星际指挥官是奇源世界开发的一款agent,是一款具有自主学习和独立决策能力的AI,在虚拟世界中表现为数字人,在物理世界中表现为机器人。类似的代理包括AlphaGo和AlphaStar。

这个游戏采用三转制,以人族为战场。第一职业选手,绰号土豆明的黄慧明,在动物园电竞俱乐部工作,擅长虫族。自2006年成为职业明星玩家以来,共获得11次冠军,最高成绩是星际争霸I/II全国冠军。

第一轮的第一场比赛是保守的。AI星官率先发动两次攻击,TooDming成功防守。人族对抗中,谁先接手场外控制,谁就获得游戏的主导力量。但是在TooDming的并行挖掘过程中,出现了一点小错误。AI星官没有给对手任何机会。他瞬间抓住漏洞,直接击中心脏。比赛用了11分钟才结束。

第2回合东明调整了扩张模式,更加注重防守策略,而AI也及时调整,循序渐进,一层一层向前推进,而不是像前一局那样猛烈进攻。最终,图德明还是逃脱不了AI星际官方的打压。

据了解,AI星际军官已经掌握了260种打法,但这些打法往往具有普遍性,他们会根据真实的战斗场景做出相应的战略调整,这是人类无法预测的。后来在与时间的决战中,AI把这种意想不到的发挥发挥到了极致。

第二名选手李培南在凯子明电子竞技俱乐部打球,在韩服天梯上以6500多分成为世界顶级职业选手。2018年,他获得星际争霸1/2的黄金总决赛冠军,并在暴雪黄金总决赛中击败了图德明。

AI和时间之战可以说是全球直播挑战最强的战役。

在第一回合的比赛中,AI星官使用维京作为主战和控制单位,让所有人都大吃一惊。他之前从未见过这样的战术,这也让《时代周刊》直接失去了它。评论员说这种战术对人类玩家很有启发。

值得一提的是,在激怒TooDming之后,面对更强的时间,AI星官发出了“爱与和平”的对话框。不得不感叹其实时感知能力。

第2回合时间是最后一站,但是AI星官的打法让他感觉很迷茫,从左到右的多线程攻击让他只能继续防守。最后,资源储备明显不足。整场比赛结束后,看直播的网友表示,只有时间才能像AI一样抵御强攻。

有网友建议可以持续到20分钟,非常适合AI陪练官,一定会长得更快......

至于比赛的最终结果,AI星官的陪练官表示,2-0击败TooDming是意料之外的,但他最终2-0击败Time也是意料之外的。毕竟时间的力量是众所周知的。另外,这也是AI星际官20分钟的连续操作,顶住了长板的压力,做出了更好的反应和执行力。

利用AGI——星际争霸

而AlphaGo、AlphaStar等AI星际官员或代理人的出现,背后的意图并不是为了打败人类,而是通过与人类的对抗训练,让AI获得更好的自主学习和决策能力。由此得到的通用技术,可以帮助更复杂更广泛的实际应用场景,实现最终的通用人工智能。

这也是奇源世界、DeepMind、OpenAI等科技公司之所以选择在这里发力的重要原因,除了在AI训练最好的地方,共同选择了实时策略游戏。

为什么赌星际争霸?AlphaGo以3:0击败顶级职业围棋手李世石后,DeepMind研究人员开始攻击以不完全信息游戏为代表的实时策略游戏。

与Go/Texas Hold 'em相比,玩家可以观察对方的战略进攻,不完全信息游戏意味着玩家只能“探测”或“猜测”敌人的情况。这给决策带来很大的不确定性。

星际争霸的特点是典型的不完全信息。同时,作为一款经典的实时策略游戏,其复杂度成倍增加。

首先,从游戏角度来说,星际争霸并没有最好的策略。需要根据战争实际情况随时调整战略,扩大资源,在宏观经济和微观运行之间找到最佳平衡。所以在这场比赛中,我们也看到了AI星际打出了人类前所未见的战术。

此外,星际争霸还有更大数量的决策空,每分钟可以达到3000-4000次。特别是相对于同样是实时战略范畴的Dota,星际空间有很多可控的单位,比如采矿、造部队、侦查敌军、发动攻击等。不同单位在时间和数量上的不同组合,会对整个局势产生决定性的影响。

更重要的是,它的即时性要求玩家在毫秒内做出反应,这是与传统象棋最大的区别。

研究人员认为,星际争霸是对AI综合能力的一次巨大考验。其不完全信息决策、长期部署和实时对抗的特点与现实世界环境和需求非常相似。同时,它要求AI不仅要实时感知和识别环境,还要适应环境,做出成千上万个连续的决策。所以可以作为AI训练的最佳虚拟场景。

AI星际指挥官的创始人

但是,《星际争霸》真的是一个很难啃的骨头,直到最近几年,AI星际争霸才取得了一些突出的成绩。

在这次AI之星挑战赛之前,这个领域最突出的成就是DeepMind推出的AlphaStar。经过15年的技术研发,AlphaStar在2018年以5:0的比分击败了TeamLiquid的职业Star 2玩家TLO和最强神族玩家MaNa。然而在后来的展览赛中,MaNa成功扳回一局,杀死了AlphaStar。

这次AI星官以2:0的战绩击败了世界顶级职业选手Time,达到了与DeepMind相同的水平。但不同的是,启元世界只用了三年时间就发布了这么强大的AI星际军官,计算能力只占DeepMind的1%。

据研究人员称,工程和算法是AI星际官员的核心优势。通过最初的“数据生成-传输-消耗”的集成计算框架,他们将代理训练的数据吞吐率提高了10倍以上。此外,在算法方面,齐源自主开发的指挥官神经网络结构,结合高效的群体进化训练方法,不仅可以增强智能体的鲁棒性,还可以在计算能力有限的情况下实现智能体的快速进化。

短短三年时间,这家人工智能领域的创业公司不可小觑。

据了解,公司自成立以来,围绕星际争霸展开代理研究,创始人袁泉曾是阿里认知计算实验室的核心成员。同时,公司核心成员为BAT、网飞、IBM、HKUST、柏克莱等国内外知名高科技企业和一流大学。

这次AI星官大获全胜,标志着其代理技术的初步成熟。据研究人员介绍,AI星官背后的秘密武器“Agent Training云平台”已正式进入市场,并已广泛应用于交通调度、数字娱乐、公共技术、机器人等行业。

比如在交通调度中,agents可以成为交通调度员,每隔几秒钟自动调度优化红绿灯,可以大大缓解交通拥堵,实现真正的智能城市。

最后一个问题:如果实现了一般的人工智能技术,你最希望它能赋能解决哪个行业?

免责申明:以上内容属作者个人观点,版权归原作者所有,不代表趣投网立场!登载此文只为提供信息参考,并不用于任何商业目的。如有侵权或内容不符,请联系我们处理,谢谢合作!
当前文章地址:https://www.qthbsb.com/keji/639228.html 感谢你把文章分享给有需要的朋友!
上一篇:中国联通流量卡 19元/月 中国联通“亲子卡”首发:3GB流量+100分钟语音 下一篇: 江苏赛麟 造车之路就此落幕?江苏赛麟上海分公司被查封