游戏的矛盾发展和战略机遇
原文出处:游戏的矛盾发展和战略机遇
前言
原神、蛋仔、Palworld……成功的游戏从不是石头里蹦出来的,而是产业链、产业、产品层层矛盾叠加演化的复合结果。最终决定游戏形态的,就是作为外因的技术和作为内因的游戏问题这一对事物的矛盾运动。本文旨在围绕这个根本矛盾,阐述游戏发展的一般规律、这些规律的体现,并分析如何利用这些规律在电子信息技术发展的新阶段抓住机遇,实现长期增长。
我们这里主要围绕着“游戏形态”进行分析,针对中观和宏观的产业链、产业环境等问题则略过,以适当控制篇幅。
全文包括三个章节,其中:
第一章是基础理论框架,对理解后文比较关键;
第二章是在理论框架下,对游戏产业和具体游戏产品如何发展、为何发展的复盘;
第三章主要讨论新技术条件下各个层面的问题,包括:AI、XR等新一代技术展望,新技术条件下游戏产业和产业链层面的机会,及具体产品和产品细节如何借助新技术实现更好发展的讨论。
正文
第一章 技术基础决定游戏形态
一、技术基础和游戏形态的矛盾关系
游戏就是生成问题→解决问题的过程。玩家面对游戏问题的时候获取信息,解决游戏问题的时候获取成就感和经验。
比如扫雷:问题是雷在哪里,解决这个问题就要反复点开格子并结合展开的信息判断;又例如射箭:问题是如何把箭准确地射到靶心,解决这个问题就要练习握弓、稳定性、呼吸 等等。
创造/解决问题的实质是创造/消除信息熵。信息熵即事件的不确定性,或者说一个系统的混乱程度。事件不确定性越大,信息熵越大。消除信息熵的东西就是信息(比如天气预报)。
生物本能地反感信息熵,也本能地追逐信息熵的消除。这体现为对(1)信息(亦即使得信息熵消除的事物)、(2)做功以获取信息反馈这两者的偏好。信息得到满足之后,就要触发无聊状态,无聊则触发游戏行为。
在动物界,游戏行为就是动物自己创造信息熵、再由自己消除它的过程(比如猫追尾巴)。
游戏行为的生物基础,在于动物消除信息熵的过程需要做功,做功动用到身体机能,于是动物得到了锻炼。普通动物会利用既有环境和自己的身体机能创造游戏并解决游戏问题。例如猫会上蹿下跳,跳来跳去的位置是环境中已经存在的;猫面临的问题是“能不能跳上去”,解决问题的方法就是“跳一跳试试看”。跳得多了,猫就健壮,碰到敌人就跑得快。
因此游戏首先是动物锻炼自己的手段——不会游戏的动物面对随机威胁的时候,能力比不上平日通过游戏锻炼自己的动物;游戏能力差的动物比不上游戏能力强的动物,这些动物都被淘汰了。所谓游戏能力强,就是创造信息熵、解决信息熵的能力强,进而是理解、控制信息熵的能力强。理解信息熵就是要认识规律,知道不确定性如何产生;规律认识了,就可以控制事件发生的方式方法。
人理解信息熵能力最强的动物。我们制作工具来控制信息熵,比如衣服控制温度的不确定性、发电厂控制电力供给的不确定性,等等。人类的大部分游戏都是工具的游戏,例如纸飞机、标枪、足球、电子程序。工具支持游戏活动的基础在于其创造、展示、消除信息熵的性能。这些性能根本取决于技术水平——没有纸就没有纸飞机,没有计算机和显示设备就没有电子游戏。这些基于工具的游戏活动,和工具的形态是相互矛盾地定义着的——它的本质是信息熵的生成与消除,而非工具本身——于是我们既可以在现实中下围棋也可以设计围棋程序,但围棋棋盘和规则是同一个样子。
二、技术对电子游戏形态的决定性作用体现于游戏内在的基本矛盾结构
技术发展是社会整体生产力的体现,它游戏的发展而言是决定性的。
哪个技术发展得快、发展得好,我们就可以用它来更加精细操作信息熵,并用于信息熵的创造、展示、消除。人对自身身体、思维的操作也是广义上的技术,即运动能力和思维能力。
技术从物理层面对游戏形态的决定性体现在方方面面。例如赛车也是一种游戏,引擎就是这里很关键的部分。引擎运转速度越快,它的机械磨损越厉害、积累热量越快,整个物理系统就越不稳定。更好的引擎技术能在更高速度下保持较低的熵,运行更稳定,从而支持更高速的赛车游戏。GPU等等也是同理(请想一想超频的作用)。
技术决定游戏发展,是按特定规律运作的,不是拿随便一个技术和随便一个游戏一碰这个影响就发生了。这个规律就藏在游戏“生成问题→解决问题”的矛盾运动之中。
游戏的基本矛盾结构由“如何生成问题”和“如何解决问题”组成。围棋、赛车、RPG、MOBA等等,都要遵循这个基本矛盾结构。这里我们先给出它的示意图,然后解释其具体组成逻辑——

简单来说,生成问题和解决问题各有两个基本方面。于是两大维度加四个方面,合起来形成了四种基本的、和“鲁粤川淮”四大菜系一样的基本游戏形态——这些基本形态下面又要演化出种种更细分的形态,以及相互借鉴融合的形态,但万变不离其宗。
我们来看这些具体方面的含义:
解决问题的两个方面很容易理解:身体型和脑力型——简单来说就是打球和下棋的区别、音游和4X之间的区别。
生成问题的方式也有两种:题目式和博弈式。这部分很少人讨论,我们简单说明。
题目式的定义来自于“题目”。所谓题目,即一组固定于工具中的、特定的信息熵或信息熵生成机制;人们通过反复理解,理论上可以穷尽地消除这些信息熵(当然,存在玩家自身能力的软上限)。典型的题目式游戏包括拼图、九连环、射箭、模拟经营、沙盒、ARPG、音游。
博弈式:游戏工具本身不包含问题,需要玩家基于工具特性,实时地、相互地设计问题并解决问题的,称为博弈式。
第二章 电子信息技术决定游戏形态的发展方向(1950s-2020s)
一、复盘对象
“技术基础决定游戏形态、技术发展对游戏形态演化具有决定性作用”——1950年代至今,70年的电子游戏史,无处不体现这个规律。
电子游戏史和电子游戏产业史分析很大程度上是关于历史头部游戏的分析——这些头部游戏无一例外代表着最先进的产品形态,也往往占有绝大部分市场份额。手机平台的头部游戏想必大家已经非常熟悉了;这里补充一张80年代以来PC、主机的头部游戏总表,作为下文讨论的参考。由于空间有限,一些知名头部游戏不在表上,比如神秘海域、刺客信条、FIFA等等,但不影响讨论。

表中各款游戏按其销量系数展示,系数 = ln(百万份销量),以平滑GTA5等极端值,数据来源于wiki、vgchartz等公开渠道,均为单款游戏销量。
系数>5,销量超过150M,为历史级产品,仅2款:有GTA5、我的世界;
系数>4,销量超过54M,为划时代产品,仅4款:Wii Sports、PUBG、初代马里奥、马车8;
系数>3,表示销量超过20M,即通常意义上的“大爆款”,表中共43款,如动森、GTA4、上古卷轴5、COD6等;
系数>2,表示销量超过7M,表示“爆款”,包括模拟人生1、半条命1、文明5、糖豆人等;
系数>1.1,表示销量超过3M,即畅销产品,如上帝也疯狂、星际2、Forest、节奏光剑等。当然,在PC平台早期,这已经是划时代的高销量。
在表外的还有更早的一批雅达利甚至实验室时代的电子游戏,我们会合并分析。
读者将会看到,自1958年的Tennis for Two以来,头部游戏总是诞生于技术发展动能最大、相对其他技术最有比较优势的那个方向,头部游戏公司总是游戏界最先进生产力、技术力的代表。
二、技术对电子游戏形态发展的总体影响
(一)1950-1970:早期冷战电子技术
世界上第一个电子游戏是Tennis for Two(1958年,见下图),但严格意义上来说它不是计算机游戏。真正的第一款计算机游戏_Spacewar!_在1962年诞生于MIT,开发者是Steve Russell。此人师承Marvin Minsky(人工智能之父),而且曾经指导过Bill Gates和Paul Allen如何使用电脑。

这个时期的电子游戏还包括各种利用电力驱动的早期街机游戏,例如南梦宫(而后SEGA也进入了这个市场)的Periscope(1965),以及Ralph Baer开发的第一款以电视作为显示屏的Brown Box(1968)。

这个阶段的电子游戏无论从哪个方面讲都很不成熟。然而我们已经可以明显看到,这些游戏的形态——无论是形态突破还是形态限制——都高度取决于电子技术的发展情况。
由美国军方主导的一系列技术项目的快速进展,是电子游戏形态突破的主要原因。_Tennis for Two_的设备本来用于显示弹道_SpaceWar!_使用的电脑PDP-1则集成了当时比较先进的图形显示技术、算力技术和交互技术——这些技术的最初目标是为北美雷达监测系统提供算力和可视化的操作/信息展示界面。值得一提的是,在电子游戏的最早期,鼠标、手写板、摇杆、光枪等交互设备已经在军方的计算机系统普及开来——目的是操作屏幕上的战场信息。
游戏形态发展面临的限制也很明显:商业电子游戏需要的一切在当时几乎都不存在。
• 1958年之前世界上不存在集成电路,1960年仙童公司刚发明平面光刻技术,而所有这些半导体的主要民用场景是收音机。计算领域,民用计算机尚未推出,此时只有军用计算机和IBM等少数企业才能用得起的商用机(商业机的普及还要等待IBM在1965年推出的System360);
• 计算机图形学1959年才刚刚起步(始于IBM和GM合研的初代电子化CAD),1965年犹他大学的计算机图形学项目获得了美国国防部的第一笔资助,离它成为世界第一的图形学中心还要再等10年;
• 编程界——B语言直到1969年才发明出来,之前普遍使用的是为IBM7904开发的BCPL。简单来说,除了实验室里面的人没人知道怎么在计算机上编写游戏程序,也没有合适的计算机可供编写;
• 最要命的是,那个年代连电视机都不是很普及。“收音机是主要的电子消费品” = “电视机不是主要电子消费品”。当时的电视普遍质量差、功能少、节目不多、价格昂贵,更不要说什么外接游戏设备。
回归到游戏的基本形态来看,这个阶段的技术仅能勉强支撑身体型游戏。_Tennis for Two_让玩家用两个旋钮打球,算是竞争型;_SpaceWar!_本质上是一套随机的屏幕光标发生程序,算是磨炼型。

技术对游戏的决定性从一开始就定下来了。为什么冷战电子技术对游戏而言这么重要?简单来说,军事活动对信息熵容忍程度是最低的——任何军事活动想要胜利,从信息层面必须要对战场了如指掌并让对方一无所知,从物理层面必须制造对方难以恢复的混乱。早期电子游戏开发者无一例外参与过军事科技研究,也就是以最高的信息熵控制标准开发电子工具。这些工具的信息熵生成、展示、消除能力,一部分外溢出来,形成了最早的电子游戏。
(二)1970-1985:算力、交互和存储
这个阶段美日欧的半导体集群同时发力。大致有五个主线:
1) 集成电路技术快速发展,并逐步走向商用、家用;复杂功能设备逐渐走向小型化;
2) 图形计算快速发展,犹他大学成为了计算机图形学的世界级研究中心;
3) 电视机不断升级、像素和颜色显示能力逐步提高;音响能力、外接设备功能逐步成形;
4) 虚拟交互设备从军用逐步走向民用,摇杆、光枪、按钮等设备装到了家用电器上面。
5) 存储技术快速发展,磁带存储、卡带存储、CD存储依次登场;
这些技术的共同作用下,主机时代来临了。标志就是1972年Atari推出的Pong,以及其后一系列日美厂商发布的主机。第一批主机普遍以电视为显示屏,使用集成电路、虚拟交互设备,并采用嵌入式存储。
这个阶段最主流的游戏形式是磨炼型。它受益于两批技术:
芯片、图形计算和电视机的共同进步支撑了题目式游戏的发展——体现为玩家看到的游戏环境变得越来越庞大、丰富、精细、复杂,让更多、更复杂的问题和挑战能够在同一个游戏空间中组织起来——70~80年代主机和主机游戏最重要的几个卖点,就在于画面黑白转彩色、彩色更丰富、单屏游戏转滚轴、低速运动变高速运动。到了80年代后期,3D游戏已经出现并开始在街机厅那些较大号的游戏机上普及。
交互设备的革新主要促进了身体型游戏的发展:旋钮、摇杆,到十字键这些升级允许玩家更精细、直观地运用手指、手掌、肢体来操作游戏中的对象,提高了游戏操作的设计空间。

从这个时期开始,磨炼型就成了主机市场的万年铁大盘——从早期的Asteroids、Pitfall,到吃豆人、超级玛丽……70-80年代的头部游戏被磨炼型牢牢地占据着,囊括了RPG、平台跳跃、赛车、冒险、解谜、体育等几乎所有可能的方向,也锻炼了一批至今仍活跃在一线的白金制作人(他们到今天还在做磨炼型)。
主机形态和主机更新换代的基本范式也从这个时代固定下来——游戏题目的容纳和展示能力,以及身体交互。在过去40年中,所有主机厂对自身性能的吹嘘,都集中在其旗舰游戏的画面+游戏世界规模,或交互方案的先进性。
这里有一个问题,即如何看待在60~70年代,即主机发展的早期,博弈式游戏也曾经一度成为重要的头部类型?比如,成就雅达利的Pong,以及坦克大战等等。
虽然博弈式游戏曾经流行过,但它主要是特定文化和场景的产物:从主机诞生那一刻起,它就与电视机牢牢绑定——70~80年代的电视机营销是与美式客厅文化牢牢绑定再一起的,继而随着美国的影响力扩散到了欧洲和日本。中国在80~90年代也曾追捧过电视,甚至将电视作为炫耀或订亲的物件。
这种基于特定社会生活场景的游戏形态有其合理性,但也有局限性。在客厅用主机打电子乒乓球确实节省了空间和体力,但它的综合体验远不如现实,玩家总会觉得还不如直接去玩真实游戏。受限于客厅场景,这些游戏也很难形成跨区域、全国乃至全球性的联赛制度,这限制了博弈空间、博弈乐趣,以及通过高手比赛来吸引玩家的能力。
这个问题到什么时候开始解决呢?到了80~90年代初随着街机厅的流行才解决。街机厅能够聚集了一片区域的众多玩家,让博弈式游戏覆盖到更广泛的玩家;街机也是最早一批强调、放大交互感受的游戏机(例如街机赛车)。但街机厅也有它的问题,它舍弃了居家游戏的方便性、舒适性,而且比较昂贵、游戏比较难。因此,街机厅吸引的主要是追求画面、新奇体验,更喜欢竞争和排名的核心玩家;同时排斥了许多普通玩家。90年代,《拳皇》、《街霸》等等代表性的街机游戏销量不错,但远不及掌机上的《宝可梦》系列。
我们还要简单讨论一下存储技术的升级。
存储技术升级主要体现在两个方面。
一是存储技术的成长让游戏规模逐渐变大——这对题目式游戏来说是个利好。随着这个时期存储技术的不断升级,游戏规模不断成长。这里最重要的贡献者是索尼;索尼把在音乐和电视领域非常成熟的激光唱片技术用于游戏,并围绕大体量游戏做出了PS。直到PS3,索尼仍然在营销其主机的光碟播放能力。
二是游戏卡带的诞生——它让游戏的软硬件解耦,也让游戏硬件和软件的开发产生了分工。这相当程度上破除了游戏软件开发的硬件限制,游戏软件的创作者不再依附于游戏机公司。这大大激发了游戏创作者的积极性。
这个游戏软硬件大分工带来一系列后果:软件开发者可以直接面对市场意味着他们的身价得到了市场的公正评判——这一点推动了雅达利的核心员工出走并创办了动视。在动视成立的影响之下,一大批独立的、中小体量的游戏软件开发商雨后春笋般冒了出来。这些厂商的存在极大提升了游戏供给。但也像任何行业一样,这个阶段的游戏行业极度缺乏行业规范。厂商间抄袭非常严重,开发一款好游戏到最后可能赚不了几个钱。
游戏间抄袭一开始影响还不大。从需求侧来看,用户群体筛选烂游戏的机制还能勉强应付(那个时候没有多少像样的游戏媒体,更不要说社区评分机制,主要是靠口耳相传和相互推荐)。从供给侧看,这个时候游戏厂商的产能还是有限的,第三方厂商主要由雅达利等大厂的外流员工创办,基本品质还有保障。
宏观冲击以出人意料的方式打破了这个脆弱的供需平衡。从1979年到1982年,能源价格疯涨,美国经历了痛苦的供给侧通胀,而沃尔克领导的联储选择了大幅加息压降通胀率。利率上升导致的投资紧缩让美国本土制造业经历了大衰退,也让标普跌去了1/3的市值。

为了生存下去,大批传统企业开始试水做游戏——这几乎是他们唯一碰得到边的电子技术产业。短期内,游戏市场涌入了大量低质量供给,最终击穿了用户筛选烂游戏的机制。这件事情的结果就是雅达利大崩溃:游戏产品的严重供过于求和质量下降让用户开始觉得所有游戏都是骗钱的,并导致了行业出清。直到任天堂带头建立了严格的第三方游戏品控制度,游戏行业的信誉才恢复过来。
(三)1985-2000:芯片升级与决策AI、互联网、PC上的键鼠图形操作
我们谈到这个时期的游戏发展总是想到“PC游戏”——这一点并不准确,更准确的说法是,这个时期的核心技术突破——算力与决策AI、互联网、图形操作系统(及与之匹配的键鼠),都集成到了PC,所以沿着这几个技术方向实现的游戏突破也就必然地在PC上体现出来。
互联网和图形操作系统的发展史大家比较熟悉了。需要额外提到的是决策AI:
80-90年代,芯片技术的突破有两个大的成果。一个是RISC(精简指令集)芯片的整体理论和设计水平达到了商用,并催生了GPU这个划时代的产物;另一个是芯片制造工艺从量变到达了质变(亚洲四小龙功不可没),成本大幅下降,个人也能买得起用来支撑商业级别软件的算力。
芯片成本和性能的突破,除了让个人也用得起计算机,还让科学家有了采购大量芯片来试验AI架构的机会。自此AI发展进入了第一个黄金期:各种AI理论不断涌现,而IBM等企业也乐于设计更强的芯片和计算机来验证它们。一个重要的场景就是北美计算机国际象棋联赛——这个联赛卷出来一大批先进决策型AI,其巅峰成就则是1996年“深蓝”击败国际象棋大师卡斯帕罗夫(1988年“深思”败给了卡斯帕罗夫)。这个用棋类卷AI模型和算力的传统影响非常深远,可以说一直持续到GPT-3的出现;不过在我们所谈的这个时期,AI主要的影响还是在决策AI。
对游戏形态而言,这些技术突破带来的影响是全方位的。参考下表,这个时期在PC上诞生的头部游戏囊括了所有四大类型,包括主题公园(塑造型-模拟经营)、星际争霸(策略型-即时战略)、DOOM(磨炼型-单人FPS)、Quake(竞争型-多人FPS)……

仔细对比一下可以发现,这个时期PC头部游戏和主机头部游戏的根本区别就在于其技术模块的差异性,具体而言就是这个时期我们谈到的三大技术突破方向:芯片+AI、互联网、图形操作系统。
1)芯片升级与决策AI的发展给脑力型提供了基础
很显然,决策AI主要是为脑力型游戏的发展提供了帮助。当然,大多数PC游戏不需要做到“深蓝”的程度,不过相关思想和理论确实影响了一大批人。

当AI作为玩家对手时,PC上的战争游戏、策略游戏就诞生了。这类游戏源远流长,《大富翁》等等桌游就是典型(只不过不用AI而是用人脑来决策)——早期PC上的这类策略型游戏也往往是桌游的简单搬运。
更重要的变化发生在塑造型游戏,比如模拟城市、主题公园系列——AI在这里的作用不是玩家的对手,而是助手。即便以今天的标准来看,早期PC塑造型游戏也已经非常复杂,比如80年代推出的早期模拟城市就已经囊括了水电、交通、财政、居民满意度、突发事件等等系统,以及管理助手和提示系统。这些系统的叠加运作呈现出典型的混沌效应——每个系统单独看都非常简单,但放在一起就能源源不断地产生各种状况,为玩家提供充足的挑战空间(如何设计城市以应对所有状况)——直到今天这都塑造型游戏产生海量内容的最佳方式。当然,所有这些系统之所以能够在PC上被设计和实现,根源还是在于芯片制造和决策AI的发展达到了相当的水平。
这个方向的典型成果是《主题公园》、《过山车大亨》、《星际争霸》等等。
《过山车大亨》特别值得一提——它是直接用汇编代码写成的,程序运行极其稳定且几乎没有任何卡顿。在其他塑造型游戏普遍只能做抽象数值系统或简单对战的时候,《过山车大亨》能在同一个屏幕塞下几百个游客小人和各式各样的游艺设施。这体现了当时游戏界的编程实力,也体现了PC游戏市场已经大到足以吸引到顶尖程序员。

2)互联网对博弈式游戏的贡献
在现实世界中,博弈式游戏的根本在于博弈者——博弈者更多意味着博弈策略和操作更多元(源于人脑力和体力的不均质),双方生成和解决问题的丰富度也就更高,游戏就更长久。

互联网本来是为了对抗信息熵的非均质分布才出现的。最早的互联网技术是ARPANET,这个项目起源于我们上面提及的北美雷达防空系统,目的是将各个雷达站之间联系起来并让数据交叉验证,从而让指挥中心能够一次性获取高质量的区域雷达拼图。
互联网能把雷达站联系起来,当然也能把游戏者联系起来。自从互联网时代开始,电子游戏的博弈场景不再限于线下的游戏厅;所有接入互联网的人都可以参与。90年代的《红警》、《帝国时代》、《雷神之锤》等游戏都有着不错的联机体验。上表中的《Everquest》,则是最早一批网络MMO。
有意思的是,互联网概念的提出者和互联网游戏的提出者是同一个人——J.C.R.Licklider。Licklider是MIT的教授,也是一个通才+天才。他长期与美国国防部合作,在50年代末提出了共时系统(现代操作系统的鼻祖)和ARPANET的概念,还在主管美国国防部下属技术政策部门期间强力推进了相关项目。60年代中期,他跳到了刚成立不久的IBM研究院,帮助了System360的开发——为IBM在计算机行业的霸权奠定了基础。完成这项工作之后,他回到了MIT掌管Project MAC,这个项目开发出MULTICS和一众伟大技术,也培养出一批AI学大佬。1979年,Licklider和MIT一众学生成立了Infocom——这是世界上第一个网游公司;他们开发的_Zork_成为了第一个完全体的网络游戏(文字冒险)。
3)图形操作系统+键鼠操作让FPS成为可能
传统主机手柄的交互方式主要是针对一个游戏对象进行连续操作;对于平台跳跃、赛车、RPG、回合制卡牌这类要么操作对象单一、要么操作频率较低的游戏,交互方案是够用的。但想要用手柄操作多个游戏对象,就得中断对当前对象的操作→转移对象→移动并定位→操作下一个——这就非常痛苦了。

键鼠允许对整个2D平面的多个对象乃至区域进行快速复杂操作,这允许了人们在电子游戏中进行整体性的空间布局,进而为RTS的大发展提供了条件——RTS是最早一批横跨两大类型(竞争型和策略型)的游戏,对键鼠操作的要求极高,也包含大量的游戏内经济和单位布局的精确计算。
从FPS的发展我们能更清晰地看到技术发展动能和比较优势对塑造头部游戏的绝对意义:
早期PC在图形计算方面远不如同时代的主机和街机——用户花在PC上的预算相对有限,且相当一部分花在了显示屏、存储和办公场景——同时代的主机和街机则完全没有相关成本。这意味着当时绝大多数PC不会把图形计算能力作为主要卖点。这就导致PC在磨炼型上面,尤其是场景塑造能力上面相比主机和街机有着代差级别的劣势(存储能力还好一些)。
键鼠操作的优势让FPS成为可能。这个可能性被天才John Carmack敏锐地捕捉到了。在他之前,3D游戏的形态主要是飞行模拟(一个摇杆即可)。Carmack曾经开发过坦克对战游戏——这或许对他开发枪械对战游戏提供了灵感。总之,他成立了id公司,然后凭一己之力把计算机图形学推向更高峰。id在1992年推出《德军总部3D》(磨炼型-单人关卡FPS);这一款游戏就为id赚了几千万美元,并让id得以陆续推出一系列成功的FPS游戏。在Carmack历史性地发明了0x5F3759DF这个奇妙算法之后,再也没有人从实现角度质疑PC承载3D游戏场景的可行性了。
(四)2000-2008:芯片效能、网络普及、体感交互
这段时间的几个技术发展趋势大家比较熟悉,主要有三个方向:芯片效能提升、网速提升、交互范式改变。每一个大方向又可以分为几个不同的小阶段,每一个阶段都催生了一代头部产品。

这段时期最重要的是三个方向的技术突破——
1)互联网技术的突破和普及
这个时期的网络技术重点仍然是在固网,即从电话拨号逐步转向宽带和光纤。尤其地,97年亚洲金融危机之后,韩国和中国都提出扶持电信产业以把握新的经济增长点。韩国成为了世界上第一个部署ADSL的国家,中国则执行了规模巨大的电信基建计划。

PC仍然是最重要的互联网入口。互联网的快速普及让网民数量大幅上升,也让网络游戏变得炙手可热。随着网民越来越多,MMO和棋牌大厅就出现了。受限于PC性能和网络条件,早期MMO普遍较为简陋,多采用回合制等形态限制操作频率。为了弥补操作空间的不足,这些MMO在数值和策略方面进行加强,游戏变得越来越肝。正是这时候,网吧出现了一批熬夜打游戏的人。

主机也开始接入互联网。但主机联网游戏的发力方向和PC完全不同。
微软XBOX首创联网主机这个概念。由于主机相对PC最大的优势就是画面,微软推出了《HALO》——第一款可以联网作战的主机FPS。任何玩过初代《HALO》的人想必都被它宏大的场景塑造和精细的画面效果震撼过;与之对比,同时代的MMO画面(比如《Everquest》)简直可以说是简陋不堪(见下图)。


2)交互方式的革新
主要就是两项:模拟摇杆和体感手柄——两项都是任天堂的专利。
这方面没有太多需要解释的。模拟摇杆让主机玩家的操作空间从上下左右四个方向变成了整个圆圈。操作更加顺滑不仅让任天堂的游戏更加友好,还让FPS得以移植到主机平台。体感手柄则让整个身体操作的范畴从平面逻辑拓展到空间逻辑,催生了一大类新的游戏形态。Wii Sports是这里的代表,且至今仍是主机游戏销量难以逾越的巅峰。


3)图形算力和存储技术的发展
由NVIDIA和ATI引领的GPU技术革新降低了在PC上运行高品质3D游戏的成本;同时,PC的存储规模也在不断扩大。这两个技术的共同作用下,主机3A游戏开始向PC全面移植。
大致2005年左右,顶配PC图形算力就已经接近了主机水平。从此,主机3A游戏实现了全面跨端。除非主机厂商刻意垄断,没有什么3A游戏会选择不上PC平台。在两大平台用户群的支撑下,这个时代的3A游戏创下了娱乐产业史的里程碑——《COD》系列的单作收入超过了好莱坞大片。
这里面比较有代表性的是《COD4》和《GTA4》——两款本来只应出现在主机上的次世代3A大作。GPU支持高品质游戏跨端的好处很容易看出来:《GTA4》的PC端优化非常糟糕,却仍然挡不住玩家大肆购买。《COD》系列则在PC平台彻底扎稳脚跟,取代了原本属于《半条命》系列的地位。

PC平台的传统优势项目也获得了画面和游戏规模的升级,焕发出新的活力。典型如《模拟人生1》、《文明3》(《模拟人生1》一度是PC历史销量冠军)。这些脑力型游戏原本都是2D视角——在获得了充足的图形算力之后,《模拟人生2》和《文明4》升级到了3D,结合持续进化CPU和AI系统,吸引了一大批玩家购买续作(下图:两代《模拟人生》的画面进步)。《模拟人生》2、3代销量均超过了千万。

(五)2008-2015:早期智能手机、算力和网速的膨胀
这个时期的技术发展总体是以量变为主,不太出现此前一整块技术崛起的质变了。然而量变也能诱发质变。
这个时期最重要的变革是iPhone带来的。但从技术角度来看,早期智能手机的逻辑算力、图形算力、键盘操作、屏幕大小等等都无法和PC/主机竞争;2G~3G时代的网络也不能提供非常流畅的联机体验(iPhone经常出现信号问题)。
还是那句话:头部游戏总是诞生于技术发展动能最大、相对其他技术最有比较优势的那个方向。这个阶段的iPhone只有一个比较优势——交互的直观性。拜乔布斯所赐,这种比较优势在最开始就被拉到相当的高度(初代iPhone发布会几乎全部围绕着交互重构展开讲解)。尽管如此,这个比较优势仍然是纯交互性的,只能作用于身体型游戏,于是愤怒的小鸟、水果忍者甚至三消等等突出交互体验的磨炼型游戏就成为了头部。
这个所谓的头部,相比其他平台而言,体量仍然很小。对于大多数用户而言,智能手机是相当昂贵的,iPhone也好、N95也好,都价格不菲,且主要宣传的功能是拍照和上网——普通用户面临着和早期PC一样的预算问题。同时,几乎所有玩家都已经习惯了由3A和大型MMO引领的高品质端游市场,而智能手机在交互以外其他所有方面都不能达到主流游戏的开发和运行要求,这就又排除了相当一部分核心玩家。

游戏形态突破的主战场还是在端游。技术量变引发质变的特点在这个时期非常鲜明;谁能够充分利用好硬件技术的增量,谁就能制造出头部游戏。
GPU和CPU的进化是非常快的。我们经常谈摩尔定律,也经常忽略摩尔定律真正恐怖的地方——指数级增长的特征是越靠后,单位时间内增幅度越大。06年Intel Core初代刚刚发布,配置是单核1.67GHz;12年的Core第3代就达到了3GHz×4核;GeForce 8800和680分别在06年和12年发布,浮点运算能力增长了将近10倍。
算力的快速膨胀引发了题目式游戏内容规模的爆发。庞大且栩栩如生的虚拟世界不仅是3A游戏的主流而且是必备——《荒野大镖客》、《上古卷轴》、《FarCry》、《欧卡模拟》、《GTA5》等等一众标榜着游戏虚拟世界规模和复杂度的产品接二连三地登顶销售榜。
脑力型游戏也得益于算力膨胀。AI系统和AI系统生成内容的展现现在可以做到极致,比如《城市:天际线》、《文明5》等等。然而脑力型游戏的问题在于它门槛太高了,越是先进的AI反而越容易排除玩家。在巨型虚拟世界的冲击之下,这些游戏并没有成为玩家的首选。

博弈式游戏则极大受益于网络基础设施建设。宽带速率上升、光纤逐渐拓展,带来丢包和延迟率的下降,为MOBA、FPS等等多人同屏+高频操作的游戏冲出网吧、走向千家万户扫除了障碍。题目式+多人合作也借助互联网流行起来。最典型的就是《我的世界》:比起策划预制一大堆游戏问题和场景,《我的世界》选择了最原始的“搭积木”,让玩家自己创造出属于自己的内容。互联网对它的作用,就是原来只有一个人搭积木,现在可以一群人一起搭——于是各种巨大建筑物乃至红石电路组成的计算器出现在了游戏中,让它成为了“别人的世界”。
在同一个游戏世界内搭积木——看起来简单,对电脑性能的要求其实非常之高,这也是为什么这个本来非常直观甚至可谓幼稚的游戏形态,直到这个时候才在PC上流行起来。如此来看,《我的世界》实际上吃到了算力膨胀+网络建设的双重技术红利,不红几乎是不可能的。
在线玩家数量的突破还酝酿出《PUBG》这一代基于特殊规则的博弈式游戏。
PUBG的进化逻辑非常直白:到了这个时代,Online FPS玩家终于也能够享用大地图了。地图这么大,我们就要塞几百个人进去。但玩家发现,上百号人乱逛乱打的信息熵实在是太高,每一局游戏的体验都很随机,而且混乱的局面很容易让所有人都变得残忍暴戾,对新手极其不友好。如何控制这个信息熵呢?MOD制作者给出了答案:让我们使用缩圈+设立资源点的方式吧!
从这里看到,许多看上去是“灵光一闪”的创新背后,都有着深刻的技术动因:(1)没有算力和网络技术的进步,同屏玩家就不够多、地图区域就不够大,缩圈+资源点这两项设计就毫无用武之地;(2)没有在线玩家群体的膨胀,MOD制作者社区就的产出效率也会低很多——反过来,如果MOD制作者的数量和网络玩家数量比例是恒定的,那么玩家数量翻100倍,MOD制作者的数量、高质量点子的数量也会翻100倍。
和其他几个方向相比,身体型在这个时代几乎没有像样的游戏形态突破。体感手柄的技术突破红利吃完了,键鼠操作的上限也被挖掘得非常干净。几年间,市场上找不到什么Wii Sports这个等级的头部身体型游戏——这也从反面印证了技术突破对游戏形态突破和头部游戏塑造的决定性意义——在没有技术突破的情况下,即便是任天堂这样的顶级创新者也会走投无路,最后动作变形搞出个奇奇怪怪的Wii U。
(六)2015-2019:移动端的技术扩散
这个时期,技术仍然是量变地发展。量变的成果体现在三个方面:
一是移动端芯片也能够支持较为高质量的游戏场景。
这个红利被Switch完整地吃了下来(配合着任天堂一向擅长的交互设计)。随着《荒野之息》的发布,任天堂凭一己之力开拓出了全新的移动端3A市场。也是从《荒野之息》开始,人们对“在移动端玩到高水准游戏”的期待变得越来越高——相关供需持续发酵,最终成就了《原神》这类跨端大体量游戏。
传统端游在这个时期的关键词就是“卷”。游戏形态的结构性创新不多,既有框架下做延伸成为主流。《荒野大镖客2》、《战神》、《动森》等等几乎达到了题目式游戏体量的极限,在剧情、场景、美术、演出、手感、build、音乐、对话、物品等一切方面都与竞争对手拉开了几乎不可弥合的距离。
二是网络条件的进一步升级。
这段时期网络端游的发展逻辑则与PUBG非常类似:(1)有了一个巨大的空间;(2)想办法让玩家在里面有事可做;(3)找一个规则,控制大量玩家×高自由度导致的游戏内信息熵爆炸。这类游戏的形态演变在步骤(2)分化了——有两个方法让玩家在这些巨大的网络虚拟世界中有事可做:
一是往脑力型的方向去设计,在一个巨大的游戏场景中丢给玩家一大堆问题。在这个方向下,野外生存游戏异军突起。无论是《RUST》还是《森林之子》,玩家都需要在游戏中扮演一个几乎是野人一样的角色,一点点解决生存需求、安全需求、社交需求、尊重需求,最终达到自我实现……这个游戏结构和《MC》没有丝毫区别——把MC当中生存、安全、社交、尊重(公会制度)的每一个点放大,再加上一点点独特的包装或规则设定,《RUST》就诞生了。这些脑力型+巨大网络虚拟空间的反复调整演化持续到了今天,最终形成了《Palworld》这样地图巨大、游戏系统(亦即玩家需要决策的维度)层层嵌套的终极缝合怪。
二是往身体型的方向去设计,让玩家互相竞争。此时设计一套玩家竞争的外在限制就变得非常必要——《糖豆人》就完美契合这个方向,也顺利成为爆款。这个方向最后演化成了《蛋仔派对》这种形态:《蛋仔派对》本质上是一个极其巨大的虚拟世界,只不过按照房间和关卡分割成了零零碎碎的部分,每一个部分各有特色,但都处于相同的规则之下。

对于手机网游而言,这段时间可谓是难以复制的黄金时代。14-15年.中国三大运营商正式迈入4G时代;到了17年,电信联通的固网也基本完成了光进铜退。网络基建在短短3~4年内实现了跨越式提升,网络热点无处不在,wifi密码贴到了每一个公共场所里。随着网速提升、网费下降,以及国产智能手机出货量不断攀高,移动场景蓬勃发展,让智能手机成为了必需品。庞大的用户基数、良好的网络基建和技术积累、跨越基础门槛的手机算力三者齐备,让手游可以承载一些端游上的成熟玩法。剩下的故事,想必大家都非常熟悉了。
手游时代的另一面是手机交互的局限性。
归根到底,手机是为了接收和浏览信息设计出来的(拍照也算某种信息接收),不是为了大信息量操作。屏幕大小限制了信息摆放,也限制了手指操作空间。对许多手大、手指粗的人来说,使用键盘和鼠标不会导致信息误差,但精确在屏幕上操作就非常困难。
这两点使得手机游戏只能在操作和信息摆放上作简化。
对身体型游戏来说,操作简化有双重效果:一方面它让手游很难吸引硬核的磨炼和竞争型游戏玩家;另一方面,它吸引了更多普通玩家,尤其是此前因为电脑或网络性能不佳而无法接触硬核磨炼型和竞争型游戏的下沉市场用户。功过相抵,功反而还大一些。
对脑力型游戏来说这不是什么好消息。几乎所有脑力型都高度依赖信息展示,例如模拟经营、沙盒建造、SLG等等——信息量有限意味着问题有限,游戏形态突破就非常困难。简单来说,手机很难支撑3D空间感知。面临着一整个维度的缺损,手机脑力型游戏只能在数值和概率上面做文章。这也就是为什么到今天脑力型手游的头部仍然被各类卡牌、掷骰子和三消占据着(三消某种意义上代表了2D空间展示效率的极限)。同时,手机屏幕大小的限制使得这些游戏难以在原汁原味的情况下移植到手机上面——同样是造一个房子、管理一座城市、观察一处空间谜题,使用手机屏幕的效果比使用电脑屏幕差了太多。结果就是在端游上,一两个形态先进的脑力型游戏就能撑起一家公司或工作室(最知名的就是Sid Meier);在手游上,脑力型游戏很难做出形态创新,于是开始逐步依赖买量、氪金、社区甚至赌博。
(七)小结
20~23年间的技术变化我们合并到展望部分谈。
上述资料足以印证头部游戏总是诞生于技术发展动能最大、相对其他技术最有比较优势的那个方向——这个规律反映着技术和游戏之间矛盾运动的本质。
一方面,技术在不断发展,构成了各类游戏发展的外因;另一方面,游戏的形式在依据“生成问题→解决问题”的基本矛盾结构发展,每一种结构都是游戏往特定方向发展的内因。是内外因的共同作用,让某个既有的游戏形态在某个历史时期的技术背景下往某个特定的方向演化着。这种演化的成果则构成下个阶段游戏形态演化的基础,作为新的内因,与新的技术条件相结合,继续演化着。
到这里可能有读者会问为什么上面没有提到掌机。实际上任天堂和其他企业的掌机策略并不影响这些结论。把任天堂过去40年的财务数据拉出来看不难发现,它真正的高速增长期是红白机、超级任天堂、Wii、Switch这些头牌主机支撑的,而它们的共同特点就是具有技术比较优势,并能将其转化为最先进的游戏形态——红白机引入了经典十字+AB键,超级任天堂引入了L/R肩键,Wii引入了体感手柄,Switch则使用了joy-con。


这里尤其要说的是Switch——它并不是一个简单地升级了画面的掌机(或者说大号NDS),而是应当理解为一个以体感操作为主要卖点,而不是和PS、XBOX卷画面的完整的主机。Switch上面不仅有传统掌机游戏,也有创意和内容导向的大体量3A,比如《塞尔达》《动森》,更有《马里奥派对》、《Switch Sports》等等强交互的客厅派对游戏(和Wii一样)。与Switch相比,此前的GB、NDS等等掌机虽然也卖得很好,但这些掌机并没有利用什么技术发展的比较优势,而是想办法做成本的比较优势。看上图就知道,它们并没有为任天堂创造多大的回报,反而经常是把任天堂的利润和股东回报率往下拖。Wii的成功某种意义上被NDSL抵消了一部分,而WiiU甚至罕见地造成了亏损。
总结一下,我们在这里以时间顺序展示的技术和头部游戏类型之间的对应关系,请见下表——
|
时代 |
标志主机 |
PC技术比较优势 →头部玩法 |
主机技术比较优势 →头部玩法 |
|
80~94 |
红白机/GB |
键鼠精确性、逻辑运算 → 沙盘模拟类 |
图形算力、十字键 → 动作/冒险 |
|
95~99 |
GB/PS1 |
键鼠精确性、逻辑运算 → 模拟经营、RTS |
图形算力、手柄、便携化 → 动作/冒险/任天堂IP整体 |
|
00~05 |
GBA/PS2 |
键鼠精确性、逻辑运算、画面开始提升 → 模拟经营、RTS、FPS |
图形算力、手柄 → 动作/冒险/开放世界 |
|
06~09 |
Wii/PS3 |
逻辑运算、GPU能力上升、宽带速率上升 → FPS、开放世界、网游如魔兽世界 |
图形算力失去绝对优势、但体感手柄有加成 → Wii系列、体感系列 |
|
10~12 |
PS3后期 |
AI拉开差距、画面和主机趋同、光纤出现 → 开放世界RPG、MC、FPS对战 |
手柄手感加强,但综合体验和PC拉平: → 与PC的头部类型基本相同 |
|
13~16 |
PS4时代 |
GPU物理能力上升、网速升级(光进铜退) → MOBA、早期大逃杀 |
图形算力的性价比再次超越PC → 开放世界RPG、FPS |
|
17~19 |
Switch |
网络条件开始允许大规模同时在线 → BR、SOC |
高算力 + 移动化(Switch)分叉 → 开放世界RPG、任天堂系列 |
|
20~22 |
PS5 |
疫情导致技术停滞 → 缺乏重大玩法突破 |
|
对比智能手机游戏——
|
时代 |
标志主机 |
手机比较优势 →头部玩法 |
|
06~09 |
Wii/PS3 |
早期手机时代,电容屏触摸和陀螺仪(其实也是某种体感)成为技术比较优势 → 愤怒的小鸟、叠叠乐、水果忍者等强调滑动交互的玩法 |
|
10~12 |
PS3后期 |
3G基本普及、算力有所提升 → 回合制MMO、抽卡、消除、跑酷等 |
|
13~16 |
PS4时代 |
移动网络建设发力,但移动端图形算力还很不足 → MOBA、卡牌对战等 |
|
17~19 |
Switch |
掌机、手机的图形算力进一步上升,可以开始承载大世界多人,同时移动网基础设施的建设让Pokemon Go这种游戏成为可能;这个阶段的手游发展趋势很像PS3时期的PC → BR、卡牌、创新多人 |
|
20~22 |
PS5 |
手机算力进一步提升,开始能够承担比较复杂的计算和渲染功能 → 开放世界RPG |
三、技术对电子游戏形态的具体影响
上面的分析是站在长期视角来分析游戏形态在内外因共同作用下的矛盾发展过程。
实践中,游戏创作者接触的往往是一个具体的游戏形态甚至一个游戏当中的模块。我们从这个视角出发,再谈谈一个具体形态、一个模块,是如何利用一个相对较短的技术趋势发展自身的。
游戏形态纷繁复杂,我们很难穷尽所有例子。幸好,基本思路是不会改变的:从游戏基本矛盾结构抓起,分析它“生成问题→解决问题”的结构和细节;然后从这个结构出发,分析它可能长成什么样子,又是如何利用不同的技术条件实现了这些可能性。
(一)演化飞轮——以《GTA》系列为例
最初的《GTA1》只是一个平面追逐游戏,基本结构和许多同时代的赛车游戏,比如《极品飞车》没有太大区别:触发任务→开车逃跑并躲避警车追捕。这是一个典型的磨炼型游戏的架构。从游戏问题的角度来说,这个结构对应着三个相互连接的问题:(1)下一个任务是什么;(2)怎么驾驶手头的车辆;(3)如何应对警车追捕和道路上的各种突发状况——这是当时绝大多数赛车游戏的基本架构(1997年)。

短短几年间,GTA和其他所有带有城市+赛车的游戏拉开了巨大的形态差异。见下图:同样是2002年在PS2发布,《极品飞车》完全专注于车辆手感、碰撞效果和地图;而《GTA3》则率先制作出逼真的城市场景、任务、拟真的路人AI……形态的差异在随后的10年间拉得越来越开了。

这种变化总是有内因和外因。我们先看外因——
外因主要是技术的发展。简单回顾下:00年代初的三大技术发展重点是互联网、交互和G图形算力膨胀。
顺便一问:如果我们穿越回2000年,手握一个“城市中赛车跑任务”的游戏,我们会优先考虑哪个方向?
绝大多数传统赛车方向的游戏制作人选择充分利用互联网。理由很充分:90年代互联网泡沫积累了大量用户,且绝大多数用户都有一定消费能力(所谓“买得起电脑装得起网”)。到了90年代末~00年代初,PC在美欧日等地区已经比较普及,行业霸主微软则发布了XBOX并大力宣传主机联机体验。更重要的是,赛车本来就是人和人比赛才有乐趣——充分利用互联网不仅意味着拓宽用户盘子,还意味着能够增强游戏的博弈深度。
在这个思路下,包括《极品飞车》在内的一众头部赛车游戏开始全面拥抱网络对战系统。当然,图形算力的增强也很重要——这使得游戏画质越来越高、沉浸感越来越强、游戏世界可以越来越大并容纳更多样的赛道。不过,画面提升对游戏体验的作用是相对次要的,更多时候不过是营销噱头。手感、碰撞和更加真实的物理效果也受益于算力提升,却仍不如互联网带来的结构性变革重要。
随着联机体验的不断深化,赛车游戏的迭代“飞轮”基本定型了:更多玩家的参与要求设计各式各样不同手感的车辆→车辆数量的扩张对数值和手感调校提出了更高要求→形成了积累起来的资产→这些资产的不断积累允许游戏内存在更长的任务流程、解锁选项,并扩充了内容量→内容量的扩充吸引了更多玩家参与,并通过各类PvP和内容解锁来相互炫耀、竞技并形成某种社交关系。
GTA的制作者选择了另一条路——抓住图形算力的膨胀,把“题目”这个维度做好,打造一个充分逼真的游戏世界。
这条路的迭代飞轮其实非常简单。起点是想要做更多、更有特色的城市抢劫任务→这些任务不可能发生在同一个情形下,于是需要设计更多元化的城市场景(山区/城市→工业区/商业区)→形形色色的城市场景构成了越来越大的游戏地图,每一个地方都配备了各式各样能反映街区风貌的细节、NPC行为→游戏内的城市不仅越来越大,还越来越逼真→这就为形形色色的任务提供了更好的舞台和背景,支持任务变得更多、更有区分度。

于是,在差不多的底座之上,《GTA》和《极品飞车》等一众其他带有赛车追逐要素的游戏拉开了差距——《GTA》选择吃图形计算红利;《极品飞车》选择吃互联网红利。技术利用方向之所以不同,在于这两类游戏形态发展的内因,也就是我们说的迭代飞轮完全不一样。一个是围绕着题目的细节(《GTA》的抢劫任务),另一个则围绕着身体操作的细节(《极品飞车》的车辆和跑道手感)。


技术+迭代飞轮让《GTA》则长成了一个参天巨树;它卷题目量的方式几乎可以无限进行下去。当《GTA4》树立起题目式游戏的标杆之后,它摇身一变,在已经塑造得非常成熟的游戏世界之上加入了联网系统。此时,玩家在《GTAOL》所体验的就不仅是赛车那么简单了——几乎所有你能想到的游戏它都可以承载。这个系列除了车里的电台音乐,几乎不支付什么版权费用;相反,游戏中有无数影射、嘲讽现实世界正牌IP的事物,每一个都成了《GTA》自己的IP。游戏做得越多、影射得越多,它积累的护城河就越宽。
(二)从游戏形态到演化飞轮
最理想的情况下,某些技术能够推动游戏演化形成飞轮。然而不是所有游戏结构都能构成飞轮。所以要考察飞轮如何产生。
想要考察它,就必须将飞轮推动的游戏演化过程,还原到它的真实面貌——游戏形态演化的本质就是问题结构的不断生长,是问题不断复杂化的自然的、有机的连续过程。所谓技术造就飞轮,是技术在这些演化的某个方向或某一组方向上提供了充分的有利条件,让这个方向的演化变得非常突出。
我们来看几个例子——
1. 游戏问题结构是游戏形态发展的根本
生存问题是一大类题目式游戏的基础。围绕着“生存状况”出了问题,可以有各种各样的设定和细分,然后通向不同的游戏形态。下面有一个简单的进化分支树——

玩家在《GTA》也要解决生存问题(Mike被黑帮大佬威胁),在《Forest》里面也要解决生存问题。显然这两个游戏不一样。那我们就要问它们为什么不一样?《Forest》能否做成《GTA》这个样子(或者反过来)?
想要解决这个疑问,就不能简单地说“因为《GTA》是RPG、《Forest》是另外一个品类,所以两者天然不一样”——这种说法是循环逻辑,对我们把握规律、进行预测和推演没有任何作用。之所以容易陷入这个循环逻辑,在于我们只看到了“品类”的表象,甚至刻意将许多进化的细节塞到“品类”里面去。然而“品类”是一个只有足够多变化累积起来才会被玩家主观归纳出来的东西,它是跳跃的、不连续的;而真正的进化是更加连续的过程。
这有点像我们看物种进化——如果看不到黑猩猩、猴子乃至更早的部分,就会产生“人是突然蹦出来的”这个错觉。反过来说,人这个物种,本质上就是一系列进化方向的积累的成果——于是物种 = 进化选择的总和。我们要研究的是进化逻辑。
以上图为例,《GTA》当中玩家解决的不是一个干巴巴的生存问题,而是要在文明世界中解决一系列个人境遇导致的生存问题——这个问题结构导致《GTA》不可能像《Rust》那样让玩家自己去产出木屋和斧头——你已经在一个文明世界中,文明世界和这些基本生存问题是相互隔离的。
于是这产生了生存问题项下第一个大分化:解决生存问题,到底是依靠玩家自己搭建生产力,还是在已有文明系统的基础上通过接触人、获取人和组织的资源(包括历史上遗留下来的)来完成。
如果是前者,那么一套让玩家可以自己收集资源、制作工具的系统是非常重要的。这也就是几乎所有“野外生存”、“自然生存”的基础架构。
如果是后者,那么玩家必须已经在某种社会关系当中。但这仍然不能直接导向《GTA》这个游戏形态。例如,《HALO》当中的士官长也有他的社会关系,《上古卷轴》中的龙裔也有他的社会关系,但为什么这两个游戏就不能长成《GTA》的样子?为什么士官长要拿着MA5B自动步枪扫荡星盟基地?为什么龙裔要挨个做任务寻找强大的武器和力量?
简单来说是因为士官长和龙裔要处理的问题已经不是社会当中的了,而是处理对整个文明体系的整体性威胁(星盟、魔神)。因而他们不可能像社会中无法面对这些威胁的普通人那样,普通人也无法解决他们的问题。他们处于文明和威胁文明的事物之间,而他们的行动则是为了获取解决问题的手段。比如士官长出入枪林弹雨的主要原因是拿到先行者遗迹,或者阻止别人拿到先行者遗迹;龙裔的作用也类似。
那为什么士官长和龙裔不用自己去砍木头生火呢?是因为他们所生存的文明受到威胁,但毕竟文明还是在的——它提供了基础的生产力。士官长和龙裔是在不断利用既有文明成果——即各类工具、组织等等,来完成更大的任务,想办法获取更强的工具并达到更强的组织性。
《HALO》中的斯巴达中队、整个UNSC海军都在为士官长做后盾,让士官长可以计划周密地实施一系列行动,以便获取战术上的成功或抢到某些关键设置亦即战争工具的控制权——这个工具能够左右战局从而帮助消除文明面对的生存威胁——而当单单这个遗物不能解决问题或遗物落在敌人手里的时候,他们就要去清除某个阵营的敌人,拉拢该阵营,然后组成统一战线去击败更大的敌人。
《上古卷轴》的文明则较为松散,于是主人公的活动就很缺乏计划性。通常是主人公接触了某个人,听说哪里有一个组织(例如盗贼工会,或者某个强大的领主),便去接触。在接触这些组织的过程中,需要帮他们解决一些小问题。获得组织的支持之后,组织的回报通常是某件家传的宝物——这个宝物通常是有魔法的,或者是有什么buff——总之它是之前的文明为了解决某个重大问题制造出来,然后也可以用来解决当前的问题。当然,主人公在做这些事情的时候会积累经验、提升技能……
为什么《COD》当中没有面对文明的整体性威胁,却和《HALO》长得很像呢?答案也在问题结构当中。《COD》和《HALO》在展现军事机关当中个体遵从指令解决问题的过程,这个过程必然是类似的,必然是以任务序列的方式展现的。实际上,《COD》当中的威胁虽然不是针对整个人类文明,但至少是针对某个特定国家或政权——这就足以让军事机关介入。
《GTA》的问题不能是这种较大的组织——至少不是这些组织的整体。它更多是采取个人视角:几个人做的事情引发了问题→这个问题的解决需要另外几个人帮忙+一些工具→解决之后又牵扯到更多问题。
《HALO》中的士官长拿枪突突星盟,《GTA4》中的Niko开车追恐怖分子;士官长是为了拿到先行者遗迹的钥匙,Niko是为了拿到一个不可溯源的直升机;士官长拿到钥匙之后就要去突突重兵把守的地方把钥匙的力量发挥出来,Niko要开直升机追另一个直升机然后在空中用RPG把它打下来……有什么问题,就有什么解决问题的手段,继而有各种不同的游戏形态。玩家永远是在解决问题的过程中体验游戏并获取满足感。
2. 演化飞轮的实质是问题结构借助技术的快速扩张
我们看两个对比,《GTA》 vs 《上古卷轴》和《上古卷轴》 vs《暗黑破坏神》。这里用前者说明同样的技术可以加成到形态差异较大的游戏上面形成飞轮;后者用来说明形态差异相近的游戏因选择不同,一个形成了飞轮、另一个没有。
《GTA》的问题都是文明世界中的+社会环境下的+个体层面的+社会生存问题。所有这些社会生存问题都是人和人的冲突带来的。为什么会有这些问题?因为主人公突然被抛到一个新的社会关系中,而他旧有的处理方式已经无法适应新的环境——
《GTA4》的主人公Niko是一个东欧佣兵,他来到纽约投奔表兄,发现表兄已经深陷高利贷;像往常一样他用暴力手段解决问题,却引起了不断升级的暴力报复循环;最后他必须在牺牲兄弟和妻子之间作出选择。《GTA4》的整个主线流程就是不断升级的各类冲突。
《GTA5》有三个主人公,真正的核心Mike(几乎所有大型任务的负责人)过去是个抢匪,本来金盆洗手过日子,但其实他根本不具备处理美国现代社会种种家庭矛盾和中年危机的能力,于是一个火星点燃了他的冲动,让他回归到过去那种生活模式。重出江湖的Mike成了警方黑帮的问题,于是他们采取了一系列行动试图控制Mike这个问题;这些行动又变成Mike面对的问题,于是Mike要采取反制行动……
在这里面什么最重要?显然是不断延展的社会关系和社会结构最重要——而这恰恰是从《GTA4》开始Rockstar最出名的能力。
接下来就像我们之前所说,Rockstar选择了不断为这些社会关系和冲突设计专门的舞台,并因此把游戏越做越大。如果清洁工和飞行员有冲突,那么游戏中就应该有清洁工和飞行员的一整套内容,例如工作地点、制服、招聘公司、广告等等……继而,这些人应该本来就是在游戏中的,而不是只有玩家扮演的时候才会出现——那么游戏中就应该有按清洁工和飞行员逻辑活动的NPC。
随着图形计算和存储技术的进步,游戏世界可以变得非常大、非常精细。这对GTA系列来说再好不过——它能够提供越来越详细多元的舞台,即一个栩栩如生的虚拟都市。到了《GTA4》,舞台完全依靠策划去构想这个都市应该具有哪些区域已经不够用了,于是Rockstar的团队采取了完全的现实主义理念——纽约市长什么样子,我们就复刻什么。如此一来《GTA4》的游戏场景就变成了一个小纽约,里面的人、街道、铁路乃至气候都是纽约的剪影。
《上古卷轴》也利用了图形算力和存储规模的膨胀。
当然《上古卷轴》和《GTA》长得非常不一样。首先它说的是一个类似于《指环王》那样的魔法世界,有各个不同的种族和神灵。这个游戏里面既没有车也没有都市,还没有那么多形形色色的人。直到第五代,上古卷轴的NPC都以一种非常简陋的逻辑生活着。从实际体验来说,玩家绝大多数时间都是在战斗,然后捡装备、升级、合成材料……
从某种程度上说,《上古卷轴》和《暗黑破坏神》只有一线之隔——如果我们把这类游戏简单理解为按剧情探地图打怪捡装备然后解锁新的剧情……但为什么《暗黑破坏神》就没能走向这条路呢?
关键区别就在于《上古卷轴》和《暗黑破坏神》在“文明”这一点上的塑造。
《暗黑破坏神》理论上是有文明国家存在的,但它更多属于背景设定,只有当玩家进入到地图新区域、需要在一个城镇购买装备补给的时候你才会发现文明在那里为你提供了一些解决问题的工具。在游戏绝大多数时间中,玩家根本意识不到也不关心游戏中是否有个文明存在。
《上古卷轴》则不然。想要升级?你得有装备。想要取得装备?你就得完成某个任务。注意,在《上古卷轴》中,装备不是打死BOSS掉出来的,而是玩家探索某个遗迹、潜入某个地点、解决某个社会事件之后获取的——所有这些遗迹、地点、组织都“浸泡在”一整套故事当中。比如你想取得一把古代英雄的斧头,就会有这个英雄建立的、存续至今的战友团——玩家要去和他们搞好关系——这就是一系列小任务。关系搞好之后,你发现他们是被诅咒的人,于是要想办法破除这个诅咒,从而开启一个大任务。破除过程中玩家要探索各式各样的遗迹,拿到各种东西……每个东西都对应着一个遗迹,每个遗迹都有相对独特的设计(虽然也存在大量素材复用)。而当你不做任务的时候,游戏中NPC的对话 、散落在各处的书籍等等,也会反复提及这些古代英雄的故事。
随着算力和游戏规模的增长,《上古卷轴》系列也进入了飞轮。飞轮为它带来的是庞大的各类任务相关场景和文本量——四代中简陋、矮小的阿祖拉神像,在五代中变成了一座山。任务量翻了一倍的同时,整个五代游戏世界中到处都存在着这个神明的影子,包括对话、书本、小神龛、饰品等等。而每一个都存在这个神像的地方,总有一个小故事告诉你为什么这个地方的人喜欢这个它、为什么有人造了这个神像。追问下去,造神像的这个人会告诉你这个神像现在遭受威胁,让你去清除,清除之后可能会得到一个数值很差但词条不错的装备……

为什么《上古卷轴》和《GTA》两个系列的游戏,看起来完全不同,却都能利用到算力+存储的扩张?
比对两者的发展历程,我们看到最大的共同点就是游戏问题的不断延展。这两个游戏的基础都是让个人在一个文明社会的框架内去处理问题。从解决问题的手段来看两者相差巨大,一个用刀剑魔法一个用枪炮飞车——前者的进化其实更依赖数值系统,而后者偏向手感调校(《上古卷轴》系列几乎没有操作手感这一说)。然而从生成问题的视角来看,两者是完全相同的——玩家面对的是一系列发生在文明社会当中的课题,比如人与人的冲突、组织与组织的冲突、今人与古人的冲突、种族与种族的冲突,等等。
注意到所有这些冲突都需要其产生的特定时空和背景。冲突越多,所需的时空和背景就越多,进而就要在游戏中填充各种场景、文本、对话、素材……用这个思路来看,《GTA5》里面Franklin是个贫民区黑人,和他起冲突的Mike是一个富人区白人——冲突在这儿了,游戏中就得刻画Franklin和Mike的生活环境,进而需要在游戏中造出贫民窟和富人区;《上古卷轴5》里面Tullius是个帝国将军,和他起冲突的Ulfric是个野心勃勃的北境领主——那么游戏就得刻画帝国军的营地和北境领主的城堡,乃至双方一整套衣服、用语方式……
当游戏世界的种种细节丰富到一定程度之后,量变到质变就完成了。玩家不再觉得主人公的故事是这个世界中唯一存在的东西——游戏中自有一个世界,按照其本来的规律运转着,也就是所谓“天行有常”。
主人公的故事只是嵌入其中,甚至只是一个过客。这就形成了真正的以游戏世界中的种种故事和冲突及其具体展现(场景、文本、物件)构成的沉浸感——这个沉浸感的实质在于玩家在经历一些小的世界碎片之后会形成某种预期(比如特定的人会做特定的事情),然后在后续故事中这个预期被其他的碎片验证,最终所有这些碎片联系起来构成了一个巨大的网——这个网本来是游戏策划脑袋里的,通过游戏分发到了玩家这里。游戏策划是怎么弄出这些东西的?他自己要先沉浸在这一堆故事其中(否则就不可能写出合理的情节)。
这样一来我们就把游戏中“生成问题→解决问题”的发展焦点从脑力转向了题目量。
这一点非常关键。之所以《暗黑破坏神》没有像《GTA》、《上古卷轴》这样实现质变,就在于它还是聚焦于数值系统的发展,到最后只能是数值越来越多、系统越来越繁杂。
数值系统的粗暴性在于它把所有信息熵都收缩到比大小:玩家动BOSS也动,操作水平一定的情况下BOSS打中我和我打中BOSS的概率是一定的,那么打赢BOSS的核心就是让我削减他HP的速率×概率 > 他削减我HP的速率×概率。进而所有这类战斗数值系统就只有三个发展方向:HP、速率、概率(血条和抗性、攻击力和攻速、各类闪避和运动速度调整诸如加/减速或定身)。
问题结构对游戏形态演化的根本性作用就体现在这里——不仅是《暗黑》,就连《原神》也不能逃脱数值战斗系统的发展硬约束。数值系统越来越复杂的过程,就是把一个数值维度拆成几个子系统,然后去控制发展某个系统的边际效益,再把这些发展的过程以资源的方式散布在地图上。数值是打怪的基础,也是打怪的奖励……只有怪数值越来越高,这些奖励才有用武之地。为了拖延数值膨胀,系统只能越来越复杂,而复杂的数值系统对绝大多数玩家来说是非常劝退的。到最后只有最核心或最硬核的玩家能够经历这些筛选——在《暗黑2》的年代这可能行得通,在今天就未必了。
回过头来对比《暗黑》、《上古卷轴》两个系列。《暗黑》系列选择发展数值,把画质和效果作为陪衬。《上古卷轴》也发展数值,但更注重把数值发展的主线弱化、隐藏在故事和世界观背后。于是《暗黑》成了一个需要不断刷怪来增长数值的游戏,好不容易锻炼出来一些解决游戏中问题的能力(数值),会随着游戏进程迅速变得无效。这是玩家积累N把钥匙解一把锁的过程。
《上古卷轴》则不然,一些数值的积累便足以支撑玩家体验许多故事了,而每一个故事都有自己独立的问题。这些问题并不是数值化的,而可能是谜题、机关、情感选择等等——很简单的数值就能支撑所有这些体验——这是一把钥匙可以解N个锁。
回归到游戏“生成问题→解决问题”的本质——没有玩家能够拒绝自己有一点能力就能解决一大堆问题的成就感。

回归到演化飞轮的主题来看这两个游戏。
《暗黑》的数值系统在不断逼迫玩家发展解决问题的能力,而这个能力是非常单调的;《上古卷轴》则跟玩家说,解决问题的能力不重要,重要的是问题的结构。《上古卷轴》可以利用图形算力和存储规模的扩张让游戏的问题量和问题结构不断翻番,翻得越多、越丰富,玩家“一把钥匙开N把锁”的成就感就越强、沉浸感也越高。《暗黑》的数值系统却无法很好利用图形算力和存储规模的扩张——能看到怪物手上的老茧、爆炸从像素变成了粒子特效,和暗黑这个游戏生成→解决问题的哪一面都没有必然联系。这也意味着,只要《暗黑》团队还在固守“核心玩家”的体验去打磨数值,它就永远无法利用到图形算力和存储规模的技术发展去实现形态进化的飞轮。
有意思的是,《暗黑》没有做到的事情,《原神》却做到了。
《原神》也是个数值很重的游戏(体现在五星角色的强度上面),把数值系统拆得不能再碎——职业选择变成了配队,一个完整的技能树拆成了N个角色的N个技能和命座阶段,武器+N个词条变成了每个词条都有一个武器……不仅如此,《原神》还把数值挑战从主线体验中剥离出来,做了专门的深渊场景让玩家卷数值。
于是《原神》也成了“一把钥匙开N把锁”——这里的“一把钥匙”是玩家抽出来的五星角色(甚至可以不抽也行),N把锁则是各种各样的剧情任务。这些剧情任务分两种,一种是为了给玩家营销这些“锁”;另一种则是游戏沉浸感的载体,即在原神中各个社会整体或局部面临的各种问题。
有了这个基本结构,《原神》实际上用了和《上古卷轴》基本相同的演化飞轮,乘着图形算力和存储规模的扩张一跃成为形态最先进的游戏——只不过这次的技术突破是在移动端,而不是PC或主机。
(三)小结——游戏形态进化的几个关键问题
到这里我们做个小结:具体游戏形态的成长是内外因共同作用的结果。
内因是游戏“生成问题→解决问题”这个矛盾,只不过这里我们看得更细,看到这个矛盾中有许多小的矛盾环节,不同环节的发展会导致不同的分支;外因仍然是技术条件,只不过不同的技术条件会匹配到不同的小的内因的矛盾环节上。
内因:游戏内在的“生成→解决问题”的结构一般由几个相互关联的游戏问题组成,在合适条件下有可能形成一个闭环的、支持不断迭代的飞轮,而哪个环节是飞轮的起点、飞轮往什么方向转,往往取决于创作团队的基因。
外因:技术条件的改善,例如算力、通信、算法、存储、交互等等。一切内在的成长逻辑必须与外在技术条件结合才能形成真正的成长。这里的基础在于,游戏形态的内在逻辑总是围绕着游戏问题的生成和解决,即信息熵的生产和消除——只有技术到位了,信息熵才能够在理想的规模和精度下生成和消除。
第三章 新技术条件下的机会和挑战(2020-2040)
这一部分我们关注AI、XR等新技术条件对游戏的影响。关键在于,如何抓住这些技术与游戏产业、产品之间矛盾发展的主要方面来获取优势。这里既包括如何利用技术红利来获取产业链优势,也包括如何利用这些技术打造迭代飞轮,缔造新一代的头部游戏。
需要提前说明:一些技术和游戏形态关系很大,例如GPU和AI——这些技术的发展直接涉及人们能够如何操作信息熵,可以直接用到游戏问题的生成和解决。另一些技术则和游戏形态没有什么关系,比如区块链——它不影响任何游戏问题的生成和解决,只能提供一个支持交易的辅助模块。
我们这里只关注第一类技术,不关注第二类技术。同时,限于篇幅,我们这里聚焦于技术对游戏形态的影响。
一、未来一段时间较为重要的技术发展趋势
(一)算力进化范式重大革新——基于“存算一体”、“中枢化”、“脑区化”的高等生物结构
已经看到,摩尔定律已经不是反映芯片算力乃至全球计算系统算力增长的唯一规律。新的增长范式包括至少三点:“存算一体”、“中枢化”和“脑区化”。
三个新增长范式的充分实现将让全球算力进入到和高等生物类似的结构——所有单个节点的计算需求都将上传到一个统一的、不区分存储和计算的中枢进行,该中枢由一系列特定结构区域有机构成,每一个区域的效率都将远超单个节点的计算效率。
高等生物化将使得全球算力增长具备摩尔定律以外的第二条增长曲线。两者结合起来,实际算力的增长效率可能是摩尔定律翻倍,即从现在约18个月增长一倍提速到9个月增长一倍,甚至更多。
1. 脑区化
在很长一段时间内,Wintel联盟主导了芯片的发展,方法是凭借制程突破不断增加晶体管数量。随着GPU和手机芯片的发展,另一种范式出现了——除了简单增加晶体管数量,还可以通过改进晶体管的排布来针对性提高处理特定计算场景的效率。
如果说CPU和GPU的区分是“生物进化出了左右脑”,那么当前这类这类设计思路已经进入到“脑区”的范畴。典型如NVIDIA为特定渲染工作设计了专门的GPU架构,以极大化诸如光追、物理碰撞等更加细分的计算场景的效率。除了单个芯片外,脑区化还体现在计算中心使用全栈设计应对特定计算场景。
2. 中枢化
中枢化即云计算。云计算的基本特征是将大量计算任务统摄到单一计算中枢处理,从而降低成本。随着云计算技术的不断增强,用户将不再需要计算算力需求的具体类别,且具备完全的弹性。
3. 存算一体
存算一体架构旨在消除计算和存储之间的差别。它有赖于脑区化和中枢化两项技术的突破。存算一体将极大减少数据传输的需求,提高计算效率并降低能耗。越是脑区化和中枢化,计算需求就越能集中进行存算一体,它的威力就越大。
(二)通信技术——6G/7G
主要目的是支持全场景全真信息的超低延迟、超大容量、超高并发全球互联互通。叠加算力增长范式革新,单个用户将不再区分算力需求种类,计算中枢也不再面对绝对的波峰波谷。
(三)交互革新——XR操作
主要目的是提供基于全息场景的、可充分调节的沉浸式I/O交互。
当前交互技术的革新已经超越传统的硬件制造逻辑,开始与算力、算法、通信技术产生越来越多的融合。可见的最先进方案是Apple Vision Pro为代表的裸手投影——直接将用户现实中的双手投影到虚拟世界。这项技术结合了苹果自主设计的芯片技术、对多个XR头显内置摄像机和雷达的返回信息进行综合处理的AI等等。
脑机接口的安全性和伦理性有重大争议,这里暂且不予讨论。但需要注意的是,在肢体活动和视觉重建等特定的I/O场景,脑机接口的发展速度很可能比想象中要快。这是由其技术发展周期决定的——早在上世纪60-70年代,犹他大学已经展开了最早的一批脑机接口实验,让盲人成功看到了点阵图像。
(四)算法革新——AI、全真模拟
- AI——具体包括3个方面
1)多模态:即不再区分AI应对的场景,任何需求都提交给同一个AI处理;
2)高智能:难以分辨AI和人类生成内容的界限,同时生成超越人类想像的内容;
3)工具性:能够稳定、安全、合规地输出可靠内容。
- 全真模拟:对虚拟现实中物理规则进行高效、精确的模拟和操控。
AI的发展速度已经远超想像。几乎所有对AI发展速度表示略微悲观的看法都已经在极短时间内被验证失效。在18个月的时间内,AI已经从GPT-3.5这样可以流利对话但内容匮乏的阶段,成长到观看10个小时视频即可学会倒咖啡的程度。
预计未来AI的成长速度还会更快,以至于需要人工干预。这里的重大变化包括:
• AI开始自我迭代,这个迭代效率很可能已经远超人类工程师的设计效率;
• 多模态AGI具备在多种信息(文字、图片、视频)之间交叉学习印证的能力,其带来的AI能力成长可能是指数级的;
• 算力进化范式的改变将不断破除AI算力瓶颈;
• 交互革新将为AI提供更精确、更规整、更多维的数据;
• AI能够反哺上述所有领域,形成闭环迭代。包括全真模拟这类高度依赖数学等基础研究在内的其他算法,甚至交互设备的设计,都将极大受益于AI的成 长(AI已经在帮助解决最困难的数学问题、材料问题、生物问题)。**
二、新技术条件对游戏产业链的整体影响
我们重点看AI总体影响。这是因为AI是所有新兴电子信息技术中最重要、动能最大的一部分,而且其他所有相关技术,例如芯片、通信、图形计算、虚拟现实、动作捕捉等等,都已经或多或少地被统合到AI的发展进程当中。例如通信技术涉及大量数学问题,而最新的AI已经能够接近IMO金牌的水平;又比如苹果Vision Pro等最先进的XR设备和应用普遍基于AI技术实现空间计算。
去年3月面向IEG的整体性报告中已覆盖这个内容,现在看来结论不仅有效,而且已经有诸多案例证实。下面是这个报告的节选,略有补充——
这里有三个关键的中长期变化:
一是“好游戏”的门槛越来越低,会出现一个产能严重膨胀的UGC市场,2A将会由若干人完成、3A将会由数十人完成,而大团队将被迫发展4A乃至更高质量的游戏。
二是顶尖创意、人才、工具会越来越值钱,而中腰部乃至底端产能会加速被AI替代淘汰。唯一存活的机会是在转型过程中争取把握关键环节的生产要素优势。
三是这个过程会比过去任何一个时代对人力和既有护城河的替代都要快。如上所述,这是技术发展尤其是AI发展的指数增长对人为主体的传统生产模式发展的边际递减的根本差距所决定的。
(一)AI技术将加速大发展
当前流行的AI都是神经网络模型,本质上是一组大算力、大数据支撑的统计和映射架构。
参考互联网产业的发展节奏,AI当前所处的发展阶段,大致相当于90年代初期,即已在局部领域实现了颠覆性变革,正在迈向更多关键行业。
AI发展的根本目的是替代人力,当前已在常规信息搜集、内容生成等领域展现出对人力的高效替代。从客观结果来看,AI技术 ≈ 一种人力替代技术;AI部署 ≈ 部署替代性人力;高级别AI部署 ≈ 部署高级别人力。
AI替代人力的节奏取决于收益比,进而取决于替代难度和替代价值。替代难度取决于AI生成内容的信息密度,以数据→声音→图像→文本→视频、3D的顺序递增。替代价值取决于AI生成信息的价值,进而与价值可以挂钩的场景相关联。图像、文本两个领域得益于军民两用的高价值,在早期吸引了大量官方和民间的资金,实现了率先突破。
结合产业发展的规律,AI即将迎来类似90-00年互联网时期的大发展阶段。其中与游戏相关的几个基础性变化值得关注:
第一,图像和文本领域的AI发展将不断深化。由于技术相对成熟、价值经过验证,这些AI的发展将加速细分、标准化、产品化,预计在未来1年完成。
第二,视频和3D领域的AI发展将迅速突破。由于产业总体体量上升、资本将热衷于争抢优质技术筹码、寻求下一代标志性技术。这些AI的发展将进入快车道,预计在未来1~2年完成。
第三,基础设施将迅速完善并集中。AI专用芯片、计算平台等战略意义、规模效应明显的服务将在少数大厂和所在国政府的推动下加速整合集中,将在未来1年完成。
(二)AI技术将基于两层供需关系对行业进行改造
1. AI技术本身的供给更加集中、成本逐渐降低
AI技术的第一层供需围绕着AI技术本身展开。这类似于企业和大学之间围绕着人才展开的供需争夺。AI技术,尤其是底座大模型如GPT这类技术,可以看作是高素质人才的批量产出方;应用AI的企业则是人才的需求方。
第一层供需有三个关键趋势。
第一,供给方整体会变得越来越强势。
这有两方面原因。第一,AI供给方实际上能够“吸收”需求方的数据、方法论。需求越多,AI学习机会就越多,AI就变得越强,供给方的地位也就越高。第二,AI的发展速度正在变得越来越快,于是供给侧对需求侧能形成越来越大的替代压力。
第二,供给将形成金字塔型。和高素质人才一样,高级AI必将是中美争夺的热点。双方将被迫集中资源,实行接近于垄断的研发策略。目前美国已经完成这一聚集过程。
中低等级的AI则相对次要,会实现更充分的供给和竞争。整个行业可能很快会形成金字塔型的供给结构。
第三,综合成本将逐渐降低。高级AI的研发和部署和高素质人才一样相对昂贵。但总体而言,成本是逐渐递减的,且预计将加速递减。这是两个规模效应共同作用的结果。第一是算力投入规模化,变得相对便宜;第二是模型研发规模化,变得更加高效。
算力变便宜主要是半导体技术带来的。半导体厂商总是将资金投入到最有可能发展的领域;随着AI价值得到验证,半导体产业的投入会不断加大,经验累积效应将逐步显现。
模型变高效是科研界的经验积累效应带来的。AI的算力成本长期来看必须指数级上升是个假象;AI能力升级是算力和算法相互影响共同迭代的结果。实际上Google早在5年前就发布了超过1000亿参数的大模型,但效果并没有十分出众相对地,斯坦福团队在近期发布Alpaca模型,只用了一张A100显卡训练了3个小时,即基本达到了GPT-3.5左右的效能,成本仅600美元。
2. 被AI影响的常规产业,产业链“微笑曲线”的弧度会变大
AI技术的第二层供需围绕着被AI颠覆的产业展开。其中,使用AI技术的企业,是应用了大量高素质人才的产品供给方;需求方则是一般的消费者。
应用AI的常规产业,产业链“微笑曲线”的弧度会变大。微笑曲线,指产业上游的核心要素、核心组件,以及下游的品牌、服务、平台等等,附加价值会比中间的组装制造要高。AI让生产效率成倍增加、门槛成倍降低。这个场景在蒸汽机替代人力的过程中也出现过。在革命性生产力的注入下,制造环节替代性变高、竞争更激烈、附加价值变小。于是在市场总供给增加、市场进入门槛降低的背景下,拥有不可替代的上游技术和创意、或下游分销渠道是更加重要的。
电子游戏产业形成的微笑曲线会更陡峭。原因在于这个产业链本来就高度信息化,于是AI带来的制造环节提升会更明显、竞争更激烈。

另一方面,游戏产业形成的产品分层也会更多、更细致。对于游戏而言,AI对产品形态本身的刺激是更直接的,甚至构成体验的组成部分。
上游的核心要素既包括技术向的AI、引擎,也包括艺术向的顶尖艺术家、IP等。
下游的核心竞争力既包括品牌、商业化等运营向要素,也包括主机平台、云游戏这些技术向要素。
AI对游戏的作用机制,类似于工业革命时期生物选育对餐饮的作用、化工染料对服饰的作用、电子技术对音乐的作用。例如,化工染料的发明,不仅降低了服装成本,而且拓宽了颜色、材质的范围,刺激了设计灵感,让高中低端服装差距拉得更大。核心逻辑是一样的:对高端艺术品而言,技术进步不仅意味着生产效率增加,还意味着艺术挥洒的画布变大了,进而让高端产品可能走向更高端、更精美、更复杂——对行业整体而言,这相当于金字塔的高度增加,而从高处渗透下来的创意、生产模式,即底座部分,则会自动随之填充变大、变宽。

AI还可能创造全新的平台和商业模式。可能带动游戏走向成熟UGC领域、以社交、图片、短视频为代表的的高周转、流量式变现,或以快餐、快消、服饰为代表的超细分、快迭代的模式。
无论哪个行业,生产力变革总是让生产者和用户的市场匹配关系改变,进而推动商业模式变化。游戏的商业化亦紧贴生产力和生产组织形式不断演进。从买断制,到续作系列、再到DLC、F2P、GaaS……这和视频内容的付费模式演进几乎没有区别(从最早的买票看、到租光碟——国外一些酒店还有这种模式,最终逐步转向广告、点击、推广)。
这个演变的背后,是游戏生产能力的一次性使用、反复使用、连续使用;也是游戏行业整体产能从零散组织到大规模、有计划、长期性组织——AI无疑将为游戏开启这个方向上的新阶段。
(三)AI将深刻影响产业链存量格局,并催生新的增量机会
1. 微软的闭环策略即将产生挤压效应
微软对游戏产业的影响是双重的。一方面微软是AI和云方面的领袖,会从宏观牵引市场分化;另一方面微软也是游戏大厂,会夺取高价值生态位。
微软已经在AI+云能力下形成了一体两翼的布局,做到全产业链闭环。“一体”指的是微软云事业部提供的AI、图形优化、编程辅助等一系列先进工具;两翼则是微软一方工作室、及使用XGP等计划吸引的独立开发者。
这个布局的总思路,是用AI、云等开发资源的效率加成来吸引开发者,并大幅提升微软一方工作室的效能。而大工作室的实践和开发者社区将循环反馈给工具团队,从而形成更好的、更加定制化的工具。这些定制化的工具未必是引擎定制化,更有可能是直接体现在上下游两端AI能力的定制化上面。最终指向垄断优质内容创作团队,让头部团队开发依赖微软、分发也依赖微软。
基础能力
领先的AI、Azure云的初创者补贴计划、全链条的支持能力。
上游开发工具
1) 搭载Copilot的VS编程环境,提高开发效率,并已经集成UE5。
2) Simplygon图形优化方案,已在DarkTide、Halo、飞行模拟上使用。
3) Natvis等复杂数据结构透视模组,用于程序调试。
中游开发过程
4) 来自微软工作室的专业指导和帮助。
5) GPT-4、Dall-E 2等AIGC引擎的接口和定制。
6) 上XGP平台的全程支持(永劫无间用了半年左右完成PC转主机)。
下游运营工具
7) XBOX PlayFab综合性分析平台。
8) XGP提供的一揽子商业化解决方案。
其他常规布局
9) 对动视暴雪的并购,充实微软一方团队的游戏规模。大量游戏辅助工具将和一方团队对接迭代。
2. 微软眼下的布局将推动产业争夺上游核心要素、让PGC大厂相互挤压生存空间
中小厂商项目质量和竞争力的上升在1~2年即可观察到——当前最火的《帕鲁世界》就疑似大量运用了AIGC技术帮助生产,效果可见一斑。
AI为中小规模开发者注入的生产力可以迅速兑现,而大厂可能很难灵活调整基本认知、项目组织、规模和方向。在3~5年的时间内,索尼、EA、育碧等传统大厂的控制力可能会相对变弱。
对索尼而言,虽然微软很难一时改变PS和XBOX的玩家版图,但高质量游戏总供需的膨胀会稀释PS的影响力;不仅如此,索尼很难提供Copilot类似的生产力工具,索尼对市场的认知也可能被微软的市场监测AI替代掉。
EA、育碧等大厂面临的问题会更严重。AI不仅让独立中小厂商获得了在短时间内积累资产、上线高质量大项目的能力,从而削弱大厂3A产品的竞争力,还会大幅提高大厂团队出走创业的几率。过去的工业化流程、管线管理、人才集聚优势都需要检讨重塑。
最终只有上下游四类厂商会有更好的生态位。其他厂商会彻底丧失主动权。
上游来看:
第一是以任天堂、Take-two、米哈游为代表的、具有一流内容、审美方法论的厂商。这些厂商不仅不受AI冲击,反而是AI的训练学习样本。这些厂商很有可能走向类似于奢侈品集团的路线,即通过垄断高端创意人才,间接垄断高端产品和高端用户。在普遍消费升级的背景下,会做得越来越大。
第二是以微软、UE、Nvidia等掌握核心技术能力的厂商。所有人都要给他们交技术使用费。根据对全球TMT产业链1811家公司在过去7年收入和利润情况的复盘,尤其是针对头部公司的详细收入结构拆分,这些技术使用费是绝对要素,不可议价,而且对产业链其它环节的影响是决定性的(参见下图,详见全球游戏产业链复盘(17-23E) - KM平台 (woa.com))。

这两种厂商分别垄断了上游的创意+实现两个环节的关键生产要素。
下游来看,也有两种厂商会有良好生态位,即具有独特垄断性硬件或软件分发平台地位的厂商。
第一是以任天堂为代表的,拥有独特硬件能力的厂商。硬件开发是AI很难触碰学习到的。在硬件能够撑起基本盘的情况下,内容厂商用AI做出的供给越多,给硬件交平台的税也就越多。注意到这和传统硬件能力是不一样的,这也是索尼最有可能选择的路线(索尼和整个日本电子业界正在重金投入下一代XR研发)。
第二是以Valve为代表,拥有优势渠道的厂商。微软很难直接撼动Steam的地位,更可能在相当一段时间帮助Steam做得更大。
当前这四类厂商也有很高的行业地位。区别在于,今天大型工业化管线仍然有很好的发展,但未来PGC领域只有这四类厂商能有较好的发展。工业化管线的替代性会变高,附加值大幅下降。
3. AI会加速UGC的发展,形成巨大增量,并逼迫PGC卷度上升
纵观历史,在任何创意内容领域,无论是美食、服饰,还是音乐、视频,小体量UGC才是产业中后期增量的主要来源。此时为UGC提供工具和平台才是最重要的——预制菜、Google、iTunes、Facebook、TikTok等等本质上都是在吃这部分红利。
这个逻辑是:工具升级让内容制作门槛降低,于是UGC供给变多,高质量内容数量增加。进而,高质量UGC的总供给增加。市场总供给的增加会逼迫供给方选择差异化定位,于是各类产品会高度差异化,进而满足各种细分的用户需求。UGC生态的大规模崛起势必分散PGC用户的注意力,自然也将逼迫PGC卷度上升、进一步挤压PGC大厂的竞争力和话语权,并逼迫大厂侵入更上/下游领域。
游戏其实一直都在这个UGC化的进程当中:90年左右,专业游戏公司在制作游戏;00年左右,开始出现引擎和MOD体系,专业玩家可以参与到模块的开发;10年左右,MOD制作已经非常普遍、出现了Roblox这种UGC平台,但还相对比较原始,Indie游戏开始崛起;20年左右,MOD对游戏市场的贡献非常之大、而几乎所有大型厂商都在尝试UGC平台。
不难想象,在AI的帮助下,UGC市场会迅速崛起,就像智能手机那样激活网络图片和视频内容领域。而在如此之大的供需之下,一定会有厂商像抖音/剪映、以及Instagram这样,承担统一分发平台、关键UGC工具的生态位。不仅如此,AI能不断积累用户行为和思考习惯,从而谁掌握了供需任何一端,谁就有机会去做闭环,因为了解用户需求就能够帮助供给方更针对性产出内容、了解供给方的动向也相当于掌握了他们对用户需求的洞察。
这个方向的能力是综合的,路径并不唯一。我们这里仅以微软为例:微软的布局具备向这个方面进行拓展的能力(如下图)。

简单来说,这个市场最重要的是想办法增加有效供给。微软提供了这个雏形:
· 一方面是XGP平台部署AI,让AI从数据、留言、游戏内行为等多个角度分析用户的游戏需求和行为,并不断细化成游戏组件模块;
· 另一方面,把这些组件模块直接嵌入到搭载GPT系列的游戏引擎、编程环境当中,让UGC开发者能够迅速抓住市场潮流、满足用户需求;
· 在此基础上,将UGC分发全部云化,让玩家能够不下载就进行游戏,从而形成真正的流量;
· 最终,形成一个类似于抖音→剪映的、基于AI数据挖掘形成的UGC分发→创作闭环生态。
这个工作即便微软不做,其他厂商也会做。核心在于其他厂商只要想去对抗或复刻微软在上游的影响力,就要侵入AI支持的游戏生成和分发。任何相关产能一旦成形,必然是溢出的,也就必然会选择将这些能力投放到UGC市场上面。进而,寻求闭环生态就成了必然选择。
目前来看这个过程有三个主要的演进路线,包括:
1)微软的降维打击路线:即先跑通PGC层面的闭环,再把工具输出到UGC;
2)Roblox的平台升级路线:即先推出一个通用UGC工具,然后逐步增加这个工具的能力;
3)蛋仔的垂类突破模式:即先在一个局部形态完成P-UGC闭环,然后将工具的适用范围拓展到其他类别。
这三个类别依据各自厂商的禀赋有所差别,但有一点是共同的:它们普遍重视代码-注释的训练集积累。这个积累的目的是让AI能够判断“何种代码能够实现特定的游戏效果”,进而与用于市场侧的玩家偏好监测联系起来,让开发人员能够迅速借助AI实现玩家想要的东西。由于游戏开发的封闭性,这类信息通常是严格保密的。但随着copilot及同类免费工具在游戏开发者(尤其是中小规模开发者)当中的普及,将有大批代码中混入AI标记的游戏逐步推向市场,并获取玩家的反馈。预计未来1年左右,AI按照prompt自动生成具有特定效果游戏模块的功能即可问世。
三、新技术条件对具体游戏形态演化的影响
整个讨论的基础仍然是基于游戏生成问题和解决问题的基本矛盾。几个技术可能同时作用于同一个维度;一个技术也可能作用到好几个维度。
(一)对游戏矛盾结构中各个维度的影响
这里列出一些目前来看比较重要的影响方向。它们肯定不会穷尽所有的可能性,只是根据目前情况来看,将在未来1~3年内,亦即一波项目周期内产生巨大影响的部分潜在方向。更多方向的挖掘需要群策群力。

1. 对题目式的影响
“题目”包括不限于游戏的剧情发展、地图探索、战斗系统、数值结构、机关谜题、随机事件等等。题目式游戏的发展主要受益于三个方面:
1) 更先进的云游戏,允许在不区分终端类型的情况下扩大游戏规模;
2) 交互尤其是XR发展支持更有沉浸感和层次感的场景设置;
3) AI相关的游戏内容增加,可进一步划分为:
A. AI+PGC,用于解除顶尖创作者的产能限制。
B. MOD玩家、头部UGC生产者利用AI技术协助生成的AI+UGC;
C. 根据游戏内进程自主地动态地生成内容的AIEGC(AI Evolutively Generated Contents);包括各类游戏内资产的AIEGC,以及能够嵌入到游戏世界中、具有自主行动能力和交互逻辑的AIC(AI-Character,区别于传统NPC和AIGC)。
2. 对博弈式的影响
“博弈”的主要形式是游戏参与者在相同的规则和条件下,互相制造问题、解决问题的过程。这里既包括博弈对手,也包括博弈队友。博弈式主要受益于:
1)更强云技术支持下的跨端、跨大区博弈(交互方案对体验影响很大的除外);
2)更可控的AIC和可随游戏进程自主随机进化策略的AIC,以帮助游戏内博弈深度、博弈光谱的平滑和控制(已在MOBA等形态中有初步应用)。
3)“超人”AIC,即不对标、不模仿人类玩家策略,而是根据特定背景设定具有自主策略的AIC(例如动物AIC、僵尸AIC、超自然生物AIC等等)。
3. 对身体型的影响
身体型游戏,即玩家主要通过身体反应和肌肉记忆来解决问题。这类游戏要求玩家使用各种操作技巧来解决游戏问题,包括精细控制鼠标、键盘、手柄,以及听力/视觉等快速反应能力,等等。身体型游戏主要受益于:
1)类GPT对话、眼动追踪等技术带来的“非手部”的交互维度革新;
2)肢体交互革新,尤其是XR提供了空间/纵深操作的新维度;
3)算力和通信,尤其是云串流技术、先进芯片等技术的部署能够大幅降低交互设备重量。
4. 对脑力型的影响
脑力型游戏需要玩家基于数值、空间关系、逻辑推理等等方面进行策略选择和判断。这方面主要受益于:
1)XR视觉和更先进的物理引擎带来的变化,例如需要玩家对弹道、碰撞等进行更精确的计算和控制,或切换游戏世界物理规则,或基于更全面的空间关系解决谜题等;
2)算力进化和AI结合允许更多交叉影响的基础模块,以实现更强的、更逼真的混沌效应,例如将AIC嵌入到模拟类游戏当中;
3)AIC帮助实现的脑力对抗或分担——AIC既可以用来指导、帮助玩家进行任务管理,也可以是玩家管理的对象(作为传统基于数值和简单判断逻辑的NPC的升级)。
(二)对具体游戏形态的影响
篇幅所限我们谈一些要点,和大家一起讨论。这些讨论不可能也绝不应当覆盖所有的可能性。

1. 交互升维——打造磨炼型的成长飞轮
交互升维主要由AI动捕和AI场景还原技术等支撑,主要载体是以Vision Pro为代表的新一代XR设备。随着技术的发展,也可能出现某种利用手机摄像头或外设进行输入、使用传统屏幕或裸眼3D屏幕进行输出的混合态。但总地来说,这个场景主要还是依赖XR。
交互空间维度的上升意味着游戏的操作范式将发生彻底的改变。当前一切游戏的操作都是被“拍扁”的,比如开车的方向盘+油门刹车等等操作被简化为上下左右四个按键,劈砍、瞄准等动作被简化为鼠标/摇杆定位+点击/按键。还原到3D空间之后,一切操作都可还原到它原先的场景。
交互降维之后,用到的肌肉群更少、耗能更小、响应更快。交互升维之后,小肌肉群的模式可以得到保留,也可以采取完全拟真的设计语言,要求玩家以和现实世界中相同的方式操作游戏当中的各种工具。此时玩家用到肌肉群更多、耗能更大、响应更慢,对玩家整体协调性的要求更高,但也能极大提高沉浸感——这一点已经在《半条命:Alyx》和《地平线:山之呼唤》中得到了很好的证实。同时注意到,为了配合交互信息熵的上升,这些游戏普遍将游戏问题的发生频率和难度做了下调。
回归到生成问题→解决问题的基本框架:想要充分利用这个方向的技术进展,重点仍然应当是做好问题规模和挑战的平衡。在玩家对新交互范式适应能力尚不明确的情况下,可适当将重心放在场景营造上面,即先利用图形算力和存储规模常规扩张的红利,然后逐步地将重点转移到交互上面来——这也是《半条命:Alyx》的选择,即将重点放在场景营造和一系列小的、提供沉浸感的可交互对象的塑造,而不是要求玩家有非常高超的游戏内操作技巧。
基本飞轮如下图所示:玩家的乐趣是用各种各样的交互方式及其组合挑战问题→这些问题应当嵌入各个不同的场景之中→在场景中嵌入更多可解锁的交互模式和工具让玩家可以解决更多的问题。

例如,在《上古卷轴》这类游戏中,所有物理攻击手段只有碰撞和弹道两类。支撑碰撞攻击的包括匕首/长剑/重剑等等,弹道则包括法杖、弓箭等等。随着场景和挑战的解锁,玩家会获得更多武器,但这些攻击方式本质上相差不大。武器之间的区别更多是在数值——这也就是交互被“拍扁”的后果。
交互升维之后,则可以围绕着操作手感做出几乎无限的调整空间。随着剧情任务的不断推进,可以为玩家设计树枝→石头→弓箭→标枪→手枪→投石器→回旋镖等等武器。每一种武器都可以做空间范畴内的手感设定,例如标枪投掷出手的角度和抛物线的关系,等等。
与此同时,还可以为不同的游戏区域设计各种重力、风阻等属性,以进一步丰富问题的种类。所有这些环境属性本身也可以由游戏叙事牵引出来。例如在空气中投掷标枪会飞得很快,在水中投掷则飞得很慢,等等。如果允许玩家自行设计工具,这个工具会如何在游戏空间中展示它的物理属性、玩家如何操作这个工具会更有效,也是很有意思的问题。
从传统游戏形态的视角来看,这意味着《上古卷轴》、《Switch Sports》、《塞尔达》这三个游戏代表的三个超大盘将会在技术发展下产生融合,并由上述飞轮驱动。
2. AIC和AIEGC——构筑真正的虚拟世界
1)虚拟世界是开放世界的真身
AIC即完全基于AI驱动的游戏内角色;AIEGC即完全基于AI动态生成的游戏内环境。
一些分析将这两者与所谓“开放世界”联系起来。我不建议这样做,因为“开放世界”这个概念非常糟糕,以至于人们不得不反复讨论“究竟什么是‘开放世界’”,然后在七零八落的概念基础上谈论“如何构筑开放世界”——这种根基不牢的讨论很难说有什么指导意义。
所以我们不使用“开放世界”这个半吊子的概念,而是直接回归到“虚拟世界”。
虚拟世界就是世界的虚拟表现;游戏虚拟世界就是按照游戏的用途来有选择地设计虚拟世界。虚拟世界有两个特性:虚拟性和世界性。虚拟性意味着我们可以任意调整,世界性则意味着“天行有常”——即虚拟世界中的所有对象按照固有规律运转。一切看似“开放世界”的东西,都是游戏场景迈向虚拟世界过程中的某种不完全的变体。
比如,传统游戏中的NPC通常只是一个有人形建模和简单活动指令的对话器;如果能够和玩家一起战斗,已经是非常高级的事情了。再比如,在游戏中烧一堆火,把收集到的肉扔上去,肉不会自动变熟,而是需要玩家执行“煮饭”这个指令——这就是因为火、肉、变熟、做饭等等事物和运动分属相互独立运转的系统,而将这些系统联系起来并达成效果是玩家的工作。
许多游戏都试图打造更先进的“虚拟世界”。例如《GTA》、《上古卷轴》、《塞尔达传说》等游戏,通过NPC在不同场景下的行为反应、社会背景-场景-事件的关联性、游戏内环境的物理特性、玩家活动在空间上的自由程度等等方面,让玩家获取了“这个虚拟世界自有一套运转逻辑”的碎片化认知,但所有这些游戏的构筑都仍然是不完整的。
从广义的虚拟世界来看,这种不完整来自于算力的有限性,体现为虚拟世界内部的对象不能如真实世界这样普遍地、连续地相互作用,即所谓“一切事物之间皆有普遍联系”。从狭义的游戏虚拟世界来看,游戏对信息熵的控制也导致了这种不完整性——如果游戏世界的物理系统完全真实,那么光是防止在野外做饭时失火可能就要耗去玩家相当的精力。
但无疑地,游戏虚拟世界始终朝向着“天行有常”进发。所谓“各游戏要素在开放世界中进行融合”,是虚拟世界不断完善的一个侧面。
2)AIC和AIEGC对完善虚拟世界、构筑演化飞轮的作用
AIC即AI驱动的角色;AIEGC即游戏内容由AI来生成而不是由固定的预制代码生成——NPC和P/UGC内容都是预制的,它比起GPT-4这一代AI来说可靠性更高,但时代允许我们讨论应用工具性更好的高性能AGI的可能性。在未来一段时间,以多子系统耦合实现的涌现式将逐步和AIC/AIEGC融合,形成新的游戏形态。
使用AIC/AIEGC构筑飞轮可以是同步的。我们仍然以“生成问题→解决问题”的基本思路看待这两项技术。

AIEGC的加成比较简单,它主要是作用于题目生成。在中短期内应当使用它协助生成涌现式的环境内容。可以应用到的方面包括但不限于:(A)自然气候、由AIEGC判断结果的物理或化学反应(比如上面说过的把东西扔到火堆里)等;(B)虚拟世界中与个体AIC无关的社会运转部分比如网站内容、经济和政治系统、建筑和车辆、机构运转细节;(C)可动态响应的具体对象,例如ARPG中为玩家设下的机关按照不同难度自动生成、《SIMS》等游戏中的可购买物件自动上新、音游和三消关卡的动态难度调整等等。
这个方向的飞轮构筑可能类似于《GTA》或《塞尔达》系列,但更加平滑和可持续。玩家体验到的虚拟世界内容,例如虚拟城市中行人的种类、街区的发展,或游戏中的物理效果更新等等,不再依靠几年一个周期的版本进行更新,而是由AIEGC逐渐地补充到游戏当中。在一个好的底层程序构架基础上,AI能力的发展能够持续容纳这类AIEGC驱动的游戏虚拟世界完善过程。随着虚拟世界不断完善,玩家将体验到越来越多的涌现式内容,并产生基于沉浸感的粘性——这种粘性是长期付费的重要支撑。

AIC的应用范围就更广。它既可以作为问题来源,也可以作为解决问题的工具。

这里我们直接给出两个可能的飞轮——
左侧是面向题目式游戏的AIC飞轮。基本思路是将AIC及其相应的交互模式一个个嵌入场景,随着题目解答的进度顺序解锁。右侧是面向博弈式游戏的AIC飞轮,解锁顺序是博弈成果,例如积分、货币、或战利品等等。

实际上《SIMS》、《宝可梦》乃至最近的《塞尔达:王国之泪》和《Palworld》都已经形成了类似的飞轮。
以《SIMS》和《王国之泪》举例——两者都是典型的塑造型游戏,拥有一组具备混沌效应的底层数值和动作系统,支持NPC或自制工具的活动。对《SIMS》来说(尤其是3代之后),随着游戏进程推进,玩家可以为游戏中的SIMS小人解锁越来越多的性格、梦想、人际关系、职业发展、兴趣爱好等等,而每个系统的发展都会带来更丰富的SIMS小人活动逻辑,让游戏内容的涌现性更强,前往下一个阶段的过程变得更有乐趣。对《王国之泪》来说,自搭工具对应着《SIMS》当中的SIMS小人,各个工具的零部件则类似SIMS小人的子系统,操纵工具挑战关卡类似于让SIMS小人实现一个又一个梦想——虽然游戏形态大相径庭,但两者的飞轮结构是基本相同的——那就是利用极其先进的某种编程技术使得诸多系统模块能够很好地耦合在一起,从而使得诸多系统的交相作用能够形成涌现式的内容,再把这些支持涌现式内容的子系统分散于游戏的各个进程或区域当中。

《宝可梦》则是根据博弈成果解锁NPC的典型——《Palworld》则在此基础上,将解锁的NPC本身变成了解决玩家在游戏中各类生存问题的工具,让它兼具解决战斗问题和生存问题的双重意义,也成倍地提升了其价值感。

所有上述飞轮中的NPC均可以换成AIC,并呈现出更强的涌现式内容。例如著名的“斯坦福小镇”实验即用作驱动SIMS小人。对宝可梦、塞尔达的拼装物而言,则可考虑AIC技术驱动的“非人类逻辑反应”模块,以及AIC驱动的环境反应模块。
AIC驱动的“非人类逻辑反应”模块已经在其他游戏中有雏形。典型如《任天狗》和《孢子》——这两款游戏的基本问题结构就是:非人NPC有自身的行动逻辑→玩家理解逻辑并行为→获取NPC正面反馈。这些模块在过去的NPC行动构建方式下通常是比较简单的,根本原因是人很难完全理解或充分想像非人生物究竟会如何行为——新一代AGI通常具备比较强的发散思维和临场反应能力。
拟人反应或特定方向的AIC反应也可以作为游戏问题或问题解决的部分。例如《动物森友会》、《GTA》等游戏当中都设置了大量的可交互NPC,充实玩家在游戏中的探索和情感陪伴体验(《GTA4》早在2008年就设计了一系列“女友”剧情作为主线外的补充)。随着GPT-5的到来以及GPT+视频/表情/语音合成/情绪识别等一系列技术的不断进展,这些AIC将有机会成为满足游戏内玩家社交和情绪陪伴需求的重要补充,也可以作为RP或SLG当中玩家处理各类复杂策略问题或深入扮演角色的优秀助手。

AIC驱动的环境反应模块则是当前AI-BOT的有力补充,可以借此为身体型游戏打造飞轮。
AI-BOT已经有多个应用方向,此处不再赘述。值得注意的是,《艾尔登法环》已经出现了在较为复杂场景下由AI-BOT辅助玩家战斗的机制——当然这个机制主要是利用了既有BOT的代码,缺乏灵活性和适应性。但其延伸出来的“斗蛐蛐”形态(即利用游戏预制BOT进行“BOSS vs BOSS”对战)值得关注。
“斗蛐蛐”之所以能够成立,在于状态机BOT的决策深度到达一定程度时相互作用产生的涌现效应。当前这类BOT仅仅能做数值处理,还不能处理文本或更复杂的信号——这就为下一代AGI的部署提供了空间。
以《艾尔登法环》为例,将现有BOT升级为AGI驱动的AIC之后,这些AIC理应不仅对固定模式的一些数值化的动作给出反应,还能够处理谈话、挑衅、请求甚至手势,并视战斗/漫游/警戒等不同场景,动态地选择和构成不同的行动策略,以应对更多元化的挑战(可能由AIEGC+AIC带来)。这很类似于完全由人类玩家进行的线上/线下合作PvE或PvP——这种情况下语言、手势等信号是最有效率的沟通方式,而这些沟通能够极大地丰富临场的游戏体验。
相应的飞轮应当由AIC的反应机制为核心迭代点。这些反应机制嵌入到各类挑战或AIC的相应人设和故事背景当中,由玩家随着游戏进程收集 → 收集之后玩家可以与更多AIC进行多元交互,而不同的AIC会因为同样的交互给出不同的反应组合 → 这些组合将影响游戏进程和走向,结合AIEGC可能生发出更丰富的后续场景 → 促进游戏在AIC设定、故事、场景方面的进一步丰富和扩大。

结 语
到这里这篇文章已经够长了,干巴巴的东西也够多了,我们换个视角。
游戏在技术条件下进化和生物的进化没什么太大区别。比如一群鹿,可以是往跑得更快去进化,也可以是往鹿角更硬、更尖去进化——赛车游戏既可以往《GTA》这个方向进化,也可以往《地平线》这个方向去进化。技术和游戏之间的关系,与大自然和特定生物之间的关系很相似。从个体角度出发,似乎是个体在利用自然条件壮大自身;从自然出发,所有个体都不过是被其挑选的对象。
什么进化方向好,什么方向能让一个鹿群茁壮成长,既不能只看这种鹿过去的变异过程,觉得它一直在长角那以后也长角,也不能只统计某个地区的气候和种群,觉得过去鹿一直在变少那以后也要变少,而是要综合起来看。即便是同一种鹿,放到气候不同、群落不同的地方,进化方向也是不同的。我们之前往往过于注重或相信,一定要踩中那个特定的变异点,或者觉得哪头鹿不错就把它喂得胖胖的,而忽视了让鹿群有空间和时间充分突变的这个过程,这是需要扭转的。其实在一些环节和领域,不采取这种“计划经济”、“大干快上”的形式,只是抓原则、抓理念、抓纪律、抓执行,反而更能取得成效。
简言之,最终鹿的数量、喂养鹿的资源的数量,对于种群整体的生存而言都不是决定因素。基因突变数量——准确说是能够经受自然环境挑选的、有效的基因突变的数量,才是最重要的。我们的一切工作都应该是制造尽可能多样的、有效的基因突变。
总地来说,本文的目的是揭示技术发展对游戏形态“突变”、乃至技术发展对头部游戏诞生的决定性作用。希望这篇文章能基于这些对“天时”的理解,促进更多的突变,帮助提升整个种群的长期生存率。
在撰写本文时,一个大原则就是要使用本质的、辩证的分析方法,不能犯过度简化的、割裂的、狭隘的错误。
所谓过度简化,就是把事物发展的逻辑看成是单向的、线性的,而不是复杂的、发散的。
喜欢过度简化是人性弱点——在信息量爆炸的时候,人人都想掌握某种公式化的处理方法。然而现实就是复杂的,而在越来越复杂。试图把登月火箭的原理总结成窜天猴的产品介绍一定要出大问题。最终,过度简化一定导致对“一击必中”的错误信仰——这就容易把整个种群适应大自然的机会赌在某几个基因点上面,找几只类似的鹿拼命养,最终降低鹿群整体的存活率。甚至是为了“一击必中”,强行把这个靶子画得大大的,最终指鹿为马。
割裂就是把事物之间看成是没有联系的,然后强行拼凑起来鼓捣出一个逻辑。
割裂则一定导致对大气候的错误判断,认为一个事物和另一个事物之间没有关系。这就好比在生物界,看到非洲象比猛犸象的牙短、东北虎比剑齿虎的牙短,就说整个生物进化中最能提升存活率的是牙要变短。如果再看到从猴子到猩猩、从恐龙到哺乳动物的过程,他就要说真正重要的是脑容量,或者脑容量和牙齿长短一样重要。许多分析看起来是综合的,但细看下来发现却是互不相干观点的大杂烩,要么就是一团浆糊,那它还是割裂的。
狭隘就是只看一个局部的空间或时间,然后草率得出结论。
这是典型的散户习惯。散户的特点就是只盯着一个板块看,只看日线不看月线,只看过去不看未来——这都是错误的。散户逻辑也能支撑一些结论,比如散户也会说美股要涨要跌,可他说的时机和程度,往往和实际相差很大。他说马上要涨,我们要等一等;他说要大涨,我们也要怀疑一下。
认知局限总会存在,但也总能破除,祝愿并期待我们的视角越来越宽广、基础越来越扎实、分析越来越透彻、决策越来越科学。
限于篇幅,笔者同步做的一些相关的研究,例如经济和产业链的“地利”的研究,以及如何看待并照顾“鹿群”的研究并没有放进来。不过笔者坚信,在所有可以被称为“长期红利”的事物中,技术一定是最有意义,也是最能可持续地生成增量的,值得单独一篇文章专门说明。
PS:对本文内容如果有问题或感兴趣的,欢迎直接联系作者:@charleslliu。
本文第一、第二章主要节选自作者所著的《游戏的历史分析》,即将正式出版。正式版书中将包含更多话题,例如游戏的生物起源、古代到工业革命时期的游戏发展、社会经济基础和游戏的关系、游戏玩家和游戏制作者的关系、文化和政策的影响等,期待与各位早日见面。