女关长郑平的荒诞人生
2025-12-31 18:57:39
DeepMind星际2 AI击败99.8%人类玩家!AlphaStar登上Nature杂志
距离星际争霸2官方宣布人工智能“AlphaStar”正式登陆游戏天梯已经过去三个多月,对于这位非人类选手的数据状态,“放养者”谷歌DeepMind一直显得死气沉沉,未发布任何声明报告。

然而就在人类玩家们沾沾自喜以为“AlphaStar”这只“鸡”凉掉了的时候,今日最新一期《Nature》杂志上刊登的一篇论文打了大家的脸:“AlphaStar”在战网上的排名已超越99.8%的活跃玩家,其三个种族(人族、异虫、星灵)都打进了地区前200名,也就是我们常说的“宗师”分段。

AlphaStar与此前有何不同?
在 DeepMind 的相关博客中,讲述了本次研究的四大更新进展:
一、AlphaStar 是通过与人类相同视角的摄像头来观察游戏地图,对AI的动作频率限制更为严格;
二、AlphaStar 可以用人虫神三大种族进行1v1对抗;
三、AlphaStar 训练自动化,不再是从以往的强化学习过的智能体开始,而是从监督学习的智能体开始训练;
四、AlphaStar 在天梯使用与人类玩家一样的地图,在对等条件下进行游戏。
AlphaStar的训练过程
论文中展示了AlphaStar的多主体增强学习算法:在该算法中,若干深度神经网络主体相互竞争,生成大量的持续适应性策略和对策。

比如在下方图片中,开始的蓝色方是需要赢的智能体对象,而红色方则是一个陪练的角色 (Exploiter) ,它不负责赢,但需要帮助核心智能体(蓝色方)暴露问题,让它变得更强。
我们可以把红色方看做是正在地堡Rush“Jim大神”,一开始他把蓝色方的“Zest”修死了

然而在训练过程中,一位名为“Stats”的绿色方学到了如何防守红色方的地堡Rush。

接着,绿色方能通过经济优势与兵种组合来击败蓝色方了,“Zest”你死的好惨啊....

然而最后,拥有不动如山防守的绿色方“Stats”,被一位新陪练:棕色方的“sOs”,通过一个正常开的隐刀战术所击败。

就像这样,多个智能体在相互竞争和协调合作的复杂环境中反复循环,AlphaStar变得越来越强大。
AlphaStar的未来
在论文发表后,人们都很想知道已经跻身顶级玩家行列的AlphaStar下一步要干什么?DeepMind CEO哈萨比斯表示:“星际争霸15年来一直是AI研究人员面临的巨大挑战,非常荣幸看到这项工作被《自然》杂志认可,我们正在以利用人工智能(AI)加速科学发现的道路上继续迈进。”
DeepMind也在博客中表示,AlphaStar的研究结果证明了通用学习技术可以扩展AI系统,它们能够在涉及多个参与者的复杂动态环境下工作。
AlphaStar的研究历程
早在2016年暴雪嘉年华现场,谷歌研究科学家Oriol Vinyals就登台简述了有关谷歌Deepmind人工智能与《星际争霸2》紧密合作的最新进展及未来的计划。他透露,谷歌正在研制新一代的人工智能,将在未来的《星际争霸2》中为玩家、甚至是全人类带来帮助,以及像不久前Alpha Go与人类对弈围棋一样,和人类挑战《星际争霸2》。

Oriol Vinyals向玩家说明了为什么会选择星际2,因为星际2是当今世界上最复杂的一款即时战略游戏,运营流程、战术运用、战争迷雾和针对、应激性操作这些不仅难度高,而且不像围棋那样套路固定,它需要根据对手的情况作出不同的改变。就如同搏击一般,招数只能让你掌握基础,而实战的千变万化则需要你通过经验的积累和扎实的基本功来千变万化。
所以对于DeepMind团队来说,这款游戏作为人工智能研发平台再适合不过了,人工智能在未来现实生活中想要帮助人类解决情况,自然会有许多难以预测的突发情况,所以它们必须要既作出正确的对策,还要根据实际情况细微的调整对策。

DeepMind选择星际2作为研究的原因:战争迷雾、操作空间、经济运营、及时性游戏、大局观、三个不同种族的互相对抗
谷歌的Deep Mind人工智能团队将会在未来把游戏列为研究的重要环节,相对于之前他们研发出的Alpha Go人工智能挑战人类围棋更多的是在信息收集上的技术。暴雪日后将开放分享《星际争霸2》的AI技术,供全世界科学家共同研究开发。
而在未来,谷歌将针对游戏《星际争霸2》开发新的人工智能,这种人工智能也会像世界顶级的职业选手发展挑战,重现围棋人机对决的一幕。与之前Alpha Go不同的是,未来《星际争霸2》的人工智能,将不仅仅是对抗,而是旨在辅助玩家能够把游戏玩的更好,为玩家和选手提升自身的实力水平提供帮助。未来的星际争霸AI,将用于实现现实世界在科技领域的发展和便利,成为人类日常生活中的好帮手。

2017月8月,《星际争霸2》开发团队正式公布了研究的最新进展:《星际争霸2》API(人工智能研究方向)现已推出,研究人员、游戏玩家以及业余爱好者可以共同使用这套由暴雪开发的机器学习框架,来对AI进行研究和训练,并最终加速实时战略游戏AI的研究。此外暴雪也宣布,会挑选出十万份匿名玩家的天梯比赛录像,以此来作为AI模仿训练的数据支撑。
此次举措意味着即使你不是科学家,而只是一个星际2玩家,也可以自己动手来构建任务与模型来解决目前AI研究方向挑战,并最终在游戏里来给暴雪提供反馈数据,协助星际2的AI学习提高。
最后谷歌声明,感谢暴雪提供的百万份天梯比赛录像,目前研发的自主学习AI尚处初级阶段,甚至在完整地图中,连脚本程式的简单电脑都打不过。而执行微操与预判战术只能在小地图中完成,并且需要耗费大量时间运算才能进行下一步。

而在《星际争霸II》的研究环境工具公布的几个月后,AlphaGo Zero创造者Julian Schrittwieser在 Reddit 上进行了网友答问活动上提出:星际争霸2比围棋更具挑战性。

网友:你们觉得围棋与《星际争霸II》谁的研究难度更大?最大的潜在技术障碍是什么?我们期待的正式更新什么时候能出来?
Julian Schrittwieser:我们开放《星际争霸II》的研究环境才过了几个星期,所以现在还处于早期阶段。星际争霸的行动空间毫无疑问要比围棋更具挑战性,而且需要观测的空间也要大得多。从技术角度而言,我认为最大的难点区别就是围棋是一个处于在完全的信息展示环境下的游戏,而星际争霸由于有着战争迷雾,所以信息情报并不完美。
依照研究人员所说,此时的《星际争霸II》AI尚处在早期阶段,它的研发难度比围棋更大。而在 AlphaGo Zero 诞生后,我们希望谷歌能以此为契机,在《星际争霸II》AI研究上再做突破。

直到2018年6月,DeepMInd才宣布了研究的最新进展,他们用关系性深度强化学习在星际2六个模拟小游戏(移动、采矿、建造等)中达到了当前最优水平,其中四个超过人族天梯大师组玩家。
2019年一月份,暴雪与谷歌DeepMind团队合作研究的星际争霸2人工智能“AlphaStar”正式通过直播亮相,在与人类职业选手对决的11场比赛中,AlphaStar凭借 10胜1负 的战绩大胜人类引起了社会各界的广泛关注。

鞭个尸,两位在 AlphaStar 征服人类前倒下的最初失败者:TLO、MaNa,历史会铭记他们。

而在今年七月份,星际争霸2官方放出重磅消息:AlphaStar将登陆欧服战网,匿名“走进”天梯匹配,与人类玩家进行对战并回收数据,以助于 DeepMind 的进一步研究。时隔一个月,坐镇欧服的领军人物,星际第一人 Serral 发文:我很确定确信几天前我搜到过 AlphaStar,它就是来搞笑的。

八月底在公布的AlphaStar对阵职业选手的录像中,AlphaStar(T)在与Serral(Z)对决16分钟后依旧不敌。现如今,AlphaStar已经是一位牌面十足的宗师组选手,接班侠也期待未来它能在 Serral 身上找回场子,成功复仇!
2025-12-31 18:57:39
2025-12-31 18:55:25
2025-12-31 18:53:11
2025-12-31 18:50:56
2025-12-31 18:48:42
2025-12-31 18:46:28
2025-12-31 18:44:13
2025-12-31 01:50:02
2025-12-31 01:47:48
2025-12-31 01:45:33
2025-12-31 01:43:19
2025-12-31 01:41:05
2025-12-31 01:38:50
2025-12-31 01:36:36
2025-12-31 01:34:21
2025-12-31 01:32:07
2025-12-31 01:29:53
2025-12-31 01:27:38
2025-12-31 01:25:24
2025-12-31 01:23:10