说真的,最近这些科技巨头们,在AI上动作特别多。我看到英伟达推出了一个基础模型叫NitroGen,据说能玩一千多个游戏。而且微软也在年初亮出了Muse,这是头一个用游戏数据训练出来的“世界模型”。还有更让人惊讶的,OpenAI居然想用5亿美元买下游戏公司Medal。xAI也放话了,要出那种完全是AI自己做的游戏,他们正在找游戏开发者来教Grok怎么玩。谷歌也没闲着,Genie 3和SIMA 2一个接一个地发布。Genie 3能生成游戏世界,SIMA 2能训练游戏里的AI。
大家可能会想,AI在游戏里不就是改改画面,自动写写剧情,或者让开发更快点吗?这些是直接能看到的应用。但是,更深层的原因是,游戏一直是AI发展路上一个很重要的**“学堂”和“试验场”**。它教会了AI很多东西。

智能溯源:游戏如何启蒙AI先驱
我们看看AI是怎么发展起来的。你可能会发现,游戏在AI很多关键时刻,都扮演了重要角色。就拿现在DeepMind的创始人,谷歌AI的大人物Demis Hassabis来说,他30年前的第一份工作,就是个游戏公司。那是1992年,他才16岁。他加入了Bullfrog Productions,做了个叫《Theme Park》的模拟经营游戏。他在游戏里给角色设计AI行为,让游戏里的NPC(非玩家角色)表现得像人一样。比如,一个游客会去玩游乐设施,饿了就找吃的,累了就休息。他还参与了《Black & White》这个“上帝”游戏。在那个游戏里,玩家可以扮演一个神,影响游戏世界和里面的生物。
这些经历让他开始思考:如果把**“智能”这个东西,放到游戏这种可以不断尝试、不断失败、不断学习的小世界**里,会发生什么?游戏世界是可控的,可以反复试验。AI能在里面学习,预测下一步会怎样。最近DeepMind有个纪录片叫《思考游戏》,里面就讲了AI是怎样在各种游戏里,一步步变得更聪明的。
从2010年开始,DeepMind做了一件很厉害的事。他们训练AI,让它只看屏幕上的像素和得分,就自己学会玩雅达利游戏。AI不需要人类告诉它规则。比如,在《打砖块》(Breakout)里,AI学会了控制挡板,把球反弹回去,而且它还学会了怎么让球打破最上面那层砖块,来获得更高的分数。在《太空侵略者》(Space Invaders)里,AI也学会了控制飞船躲避子弹,并发射炮弹消灭敌人。它自己找到了最佳的躲避和射击策略。后来,AlphaGo出现了,它打败了围棋世界冠军。接着是AlphaStar,它在《星际争霸2》里也赢了职业选手。OpenAI也让AI在《Dota 2》里和顶级玩家对战。还有《GTA 5》,这个游戏被用来训练自动驾驶汽车的AI。在游戏里,自动驾驶AI可以模拟遇到各种路况,比如堵车、突然出现的行人、不同天气等等。它可以在安全的环境下犯错,然后学习。可以说,几乎每次AI有大突破,都和游戏关系密切。
现在大模型发展到了一个新阶段。大家都在研究最前沿的世界模型和智能体。这些研究,也大多先从游戏环境开始。2018年有一篇很重要的论文,它提出了“世界模型”的概念,就是用一个赛车游戏来做训练环境。这个模型学习了赛车游戏里的物理规则和环境变化,然后就能预测接下来会发生什么。
现在很多大公司的世界模型,也主要在游戏里落地。比如,谷歌的Genie 3,你可以输入一段文字,它就能实时生成一个动态的游戏世界。而且这个世界你可以进去互动。李飞飞教授的World Labs,正用“空间智能”来重新做游戏开发和3D内容创作。腾讯的HunyuanWorld更厉害,你只要说一句话或给一张图,它就能生成一个3D世界。这个世界还能实时互动,AI甚至有“空间记忆”,能记住之前发生的事情。
在AI智能体训练这块,其实更早就开始了。早在2017年,腾讯AI Lab就和《王者荣耀》团队合作,做出了**“绝悟”。这个AI在游戏里,打败了职业战队。谷歌的SIMA 2**,目标是训练一个通用的智能体,它能适应各种不同的3D游戏。xAI也有个计划,他们要在2026年,请最顶尖的《英雄联盟》职业选手,来和他们的Grok 5对战。他们想看看AI的智能极限在哪里。
为何游戏是最理想的AI训练场?
为什么游戏会成为AI最喜欢的训练场?原因很简单。游戏就像一个规则很清楚的虚拟世界。在这个世界里,你做任何一个动作,都能立刻得到反馈。比如,你攻击敌人,它会掉血;你跳起来,角色就飞起来。这些反馈都是即时的。而且,游戏能生成大量的数据。比如,每一次玩家的操作,NPC的行为,游戏里的事件,都能记录下来。
换句话说,游戏提供了一个完全可以控制的环境。在这个环境里,我们能无限地生成数据。这正是我们用来构建“世界模型”最理想的条件。在游戏里,AI可以尝试各种策略,犯错,然后从错误中学习,而且不用担心真的会造成什么损失。这比在真实世界里训练AI,要安全、高效得多。比如,训练自动驾驶AI,在游戏里犯错只是游戏失败,但在真实世界里犯错,就可能出事故。
游戏:AI最理想的应用场景
当AI在游戏里学会了理解、规划和行动,这些能力最后会在哪里用到呢?答案还是游戏。
现在AI的发展,有点像走到了一个**“新阶段”。之前我们可能觉得,只要模型做得越大,数据越多,AI就会越厉害。但是现在发现,光靠这些,进步已经没那么大了。现在更缺的是,能让AI持续运行、不断试错、而且能真正创造价值的实际应用场景**。游戏就是这样的一个场景。它不仅是训练场,也是AI可以直接“上岗”工作的地方。
重塑玩家体验
以前我们玩游戏,体验大多是固定的。游戏里的NPC,它们做什么,都是提前写好的脚本。剧情也是按照设定好的几条路走,没有什么变化。游戏世界的规则,也都死死地写在代码里,不会变。但是,现在有了世界模型、智能体和多模态大模型,AI正在从根本上改变我们玩游戏的方式。这种变化,已经在很多全球的商业游戏里看到了。
AI首先直接让游戏里的NPC变得更真实。举个例子,瑞典Embark Studios的射击游戏《Arc Raiders》,里面就加入了AI NPC。这些敌人不再是只会冲锋的傻子,它们会根据战况,做出更自然、有回应的行动。比如,当它们发现玩家火力太猛时,会选择寻找掩体躲避;当玩家暴露弱点时,它们会组织攻击。它们会互相配合,看起来就像真的玩家一样。国内网易的《燕云十六声》也大量使用了智能NPC系统。游戏里的每个路人NPC,都有自己的“生活”。它们会去饭馆吃饭,会去市集买东西,甚至会在街上聊天。如果你和它们互动过,它们还会记住你。
而且,AI也开始扮演助手和教练的角色。《王者荣耀》就推出了**“语音灵宝互动”功能。玩家可以对着手机说话,唤醒AI,然后直接下指令。比如,你可以说:“给我买个复活甲”,或者“看看对面打野在哪儿”,AI就能帮你完成。这样你不用再频繁地手动点屏幕,可以更专注于操作。他们的AI教练系统“王者指挥官”,现在也在游戏里广泛使用了。它会分析玩家的打法,找出缺点,然后给出建议。比如,它会告诉你:“你刚才经济落后了,应该多去刷野。”它就像一个免费的私人教练,帮你提高技术。类似的功能也在《三角洲行动》的AI语音助手CC**和《英雄联盟手游》的智能助手系统里出现。它们在游戏对局中,能实时回答玩家关于地图、阵营或者玩法的问题。比如,你可以问:“我下一件装备出什么好?”或者“这个英雄怎么克制?”它们都会给你建议。
除了让体验更好,AI还开始和游戏的核心玩法结合起来。比如《和平精英》推出了一个有AI智能语音识别能力的战犬“布鲁斯”。这个战犬不光是帮手,它还是战术竞技里的一个新成员。它能听懂玩家说的自然语言指令。比如,你可以说:“布鲁斯,去前面探路”,或者“布鲁斯,帮我掩护一下。”它就能执行这些任务,比如去牵制敌人,或者去救助倒地的队友。它还影响着整个战局的策略。有了它,队伍可以有更多战术选择。
所以,从一开始启发AI,到后来训练世界模型,再到让玩家玩得更爽,甚至直接融入游戏玩法,游戏和AI总是紧密相连。游戏不仅是AI变得聪明最好的“小世界”,它也为AI技术落地提供了一个可以不断升级、能看到实际价值的地方。未来,随着AI能力越来越厉害,游戏还会扮演更重要的角色。它既是技术创新的前沿战场,也是我们看到智能和真实世界互动的一个预演。这场AI和游戏的双向奔赴,正在悄悄地,但很坚定地,定义着我们未来娱乐和智能的样貌。