【游戏矩阵】游戏测试:如何避免恶意数据
原视频:

主讲人:Adriaan de Jongh
这篇文章提供了对原视频的全面分析。在紧跟视频内容的同时,它还包括我自己对所提出的概念的解释和扩展,对游戏设计的艺术进行了更深入的探索。

1. 什么是恶意数据
在游戏设计领域,游戏测试通常被认为是一个基本环节。开发过程的这一关键阶段往往囊括了游戏的高潮,提供了对其设计成败的第一瞥。游戏测试可以揭示最初的隐患是否转化为不可预见的优势,或者快速修复是否蜕变为不可预见的挑战。然而,对于许多独立游戏设计师来说,游戏测试被视为一种带有忧虑的必要性——一种不可避免的、带来真相的对峙时刻。
在这里,接受对一个自己深陷其中的作品的批评通常不是主要的挑战。这个障碍,虽然一开始可能令人生畏,但随着时间和经验的积累,是可以克服的。目前更重要的问题是独立游戏设计师普遍使用传统的游戏测试方法。这些传统的方法,如寻找游戏测试者、执行游戏测试、收集反馈和部署分析,往往会导致模糊和混乱的数据--往往是矛盾的和具有挑战性的解释。这种类型的数据在这里被描述为 "恶意数据",这个术语象征着它对游戏设计过程的有害影响。
恶意数据不仅使游戏开发的过程复杂化,而且还削弱了游戏测试的吸引力。因此,本论述的目的是根据几年来从七个不同游戏的开发中收集到的见解来研究避免恶意数据的问题。这一分析将挑战一些围绕游戏测试的传统智慧,并提供替代性的观点。它打算促进一个更有价值和有组织的游戏测试过程,从而减轻恶意数据的影响。
讨论以结构化的形式进行,首先解释了什么是恶意数据,它的起源,如何规避它,以及如何进行更有价值的游戏测试。在这个时候,有必要区分一下,QA和游戏测试,尽管看起来是相关的,但从根本上说是游戏开发的不同方面。QA强调的是游戏的功能,而游戏测试关注的是体验的质量。
恶意数据的概念是通过《Hidden Folks》游戏测试中的一个轶事来阐释的。对游戏中一个物体的交互机制的混淆突出了恶意数据的后果。对游戏者反馈的误解导致了一个解决方案的实施,该方案减弱了游戏的吸引力,而不是增强了它。这个案例强调了误导性数据如何导致错误的决策,从而使游戏变得更糟。
恶意数据是游戏测试阶段的一个副产品,它可能是误导性的、不明确的和分散注意力的。恶意数据的后果可能包括错误的决策、游戏质量的下降和开发周期的延长。因此,理解和规避恶意数据是创造一个成功的游戏和优化游戏测试过程不可或缺的。
2. 导致恶意数据的八个因素

2.1 物理位置
游戏测试中的恶意数据可能来自多种因素,其中物理位置是一个重要因素。游戏测试的环境对所获得的数据有深刻的影响。例如,在游戏《Fingal》的测试过程中,著名设计师John和Brenda Romero在公开活动中提供了批评性的反馈,而在家里的私人轻松环境中,这些反馈可能会有很大不同。
同样地,像《Hidden Folks》和《Bounden》这样的游戏也记录了基于游戏环境的不同的玩家行为。基于活动的游戏测试常常导致更快、更不彻底的游戏,这对游戏设计产生了负面的影响。在《Bounden》的案例中,这导致了游戏的重复性,因为设计受到了最初几分钟游戏的过度影响。
为了减少由于物理位置而引入的恶意数据,使游戏测试环境与游戏的预期环境相一致是至关重要的,无论是家庭、本地多人游戏的聚会,还是其他合适的地点。因此,物理位置在实现准确、有用的游戏测试反馈方面起着关键作用。

2.2 测试者的多样性
潜在玩家的多样性使得在游戏设计中必须有广泛的测试人群。在《Hidden Folks》的早期游戏测试中,基于游戏背景的不同反应强调了这种多样性的重要性。自我认同的游戏者和非游戏者对游戏中的其他元素,如对话框,有不同的感知。这种解释上的差异延伸到其他元素和人口统计学上,如年龄和游戏习惯。
为了减少这种恶意数据,游戏测试不应局限于特定的群体。每个人,无论他们的游戏背景或人口统计学,都可以提供有价值的见解。扩大测试群体,包括来自不同背景、游戏经验、年龄组和文化背景的个人,可以增强对不同玩家如何与游戏互动和感知的了解。这种多样化的反馈提供了对潜在玩家反应的更全面和准确的表述,从而导致游戏设计和开发的改进。

2.3 你的介绍
第三个方面与你的游戏介绍有关。在独立游戏开发者中,一个常见的错误是在允许测试者参与游戏之前进行完整的游戏介绍,包括故事、控制和目标。这种做法是有害的,因为它有可能忽略了玩家在没有这种说明的情况下可能遇到的重要绊脚石。
为了规避这个错误,避免详尽的介绍是有益的。让测试人员独立地浏览游戏,从而模仿实际的玩家体验。这样的策略提供了关于用户界面、控制和游戏介绍的宝贵见解。
然而,披露游戏仍在开发中,可以减轻测试者的压力,鼓励诚实的反馈。其目的是观察测试者在哪里遇到困难,而没有任何预先的指示,从而确保真实的数据收集。
2.4 表面问题
第四点是 "表面问题"。这些是游戏设计中明显的挑战,但由于其持续的性质而经常被忽视。一个表面问题的例子可能是不同类型的玩家之间的难度差异,或者过度关注一个细节,例如角色的跳跃,而忽略了更广泛的问题,例如多人游戏所需的控制器数量。
这些问题虽然看起来无关紧要,但会导致玩家的负面体验。随着时间的推移,反复接触这些问题会使开发者产生一种盲目性,从而忽视了游戏体验的关键方面。
为了规避这些问题带来的恶意数据的出现,开发者应该以整体的玩家体验评估为目标。避免以狭窄的焦点、细分的游戏测试或特定的假设进行测试。实施频繁的游戏测试以产生全面的数据,从而能够识别和缓解被忽视的表面问题。

2.5 游戏测试过程中的改变
第六点涉及到在游戏测试之间改变游戏构建的做法,这在某种程度上是有争议的。在游戏测试过程中可能会出现影响玩家体验的问题,例如,游戏的分层问题或一个意外的默认设置屏幕。这些小故障虽然可以快速修复,但会影响玩家的参与度和提取的数据,导致玩家有可能提前放弃游戏。
与游戏开发者的传统建议相反,这个问题可以通过在游戏测试过程中对游戏构建进行修改而得到缓解。在测试之间转移目标或禁用某些功能可以极大地提高这些环节的价值。这种适应和修正的做法有可能导致更有效地解决这些障碍。

2.6 反馈
第七个考虑因素涉及到对测试者反馈的解释。测试者经常就他们欣赏的方面、不欣赏的方面以及他们未能理解的元素表达他们的情绪。然而,游戏设计者的任务是筛选各种意见以分离出基本问题。测试者可能会提出对核心问题有误解的感知问题。
例如,《Hidden Folks》最初版本中的用户界面问题就说明了这个难题。许多测试者建议目标不应该一直停留在屏幕上,从而导致了一个允许用户界面面板被隐藏的修改。虽然没有提出进一步的投诉,但几乎没有任何测试者使用这一功能。最终,人们发现问题不在于目标的持续存在,而在于UI面板的巨大尺寸遮挡了屏幕。
这个例子强调了从所提供的反馈中辨别出根本问题的重要性。这个反馈过滤过程是有效的游戏测试的一个关键技能。因此,设计师应该深入研究测试者评论背后的 "本质",以便更好地理解所提出的问题。

2.7 调查
第七个方面与调查有关,这是第二手数据的典型来源。传统的评级可能没有足够的指导意义,不能提供解决具体游戏问题所需的清晰度。例如,一星评价无法为如何改善糟糕的游戏性提供实质性的指导,这会让游戏设计师猜测潜在的解决方案。
此外,开放式的调查问题往往导致解决问题的建议,但这些建议可能没有揭示问题的真正根源。一个例子是,玩家在第3关挣扎的原因不是因为难以找到 "约翰",而是因为没有认识到拖动一辆车就能发现 "约翰 "的能力。反馈中没有任何建议直接暗示了这个核心问题。
此外,玩家对游戏的认知经常在游戏过程中发生变化,导致对应反映了游戏过程接近尾声时的情绪和挫折感。因此,为了减轻调查和问卷中无益的二手数据的风险,应该采用其他更费力但可靠的方法来收集玩家反馈。

2.8 在线游戏测试
我们讨论的第八个方面与在线游戏测试有关,这个过程经常充斥着恶意数据,这意味着误导或无益的信息,可能导致错误的游戏设计决策。开发者经常从同事、朋友或beta测试者那里征求反馈。然而,由此产生的反馈的解释性模糊性可能会扭曲对游戏设计挑战的理解。
有各种策略可以从在线测试者那里获得有用的数据,然而每一种策略都有其自身的缺陷。直接提问是最直接的方法;然而,它往往会产生最无益的、二手的数据。从这种方法得到的反馈往往是回顾性的和以解决方案为导向的,缺乏具体性,不能阐明根本问题。因此,由于这种方法的质量普遍不高,我们主张远离这种方法。
游戏分析是另一种选择,尽管它也存在障碍。例如,为了有效地利用分析法,开发者必须首先假设他们试图了解的东西。它可以揭示定量的措施,如找到目标所需的时间,但它未能阐明措施背后的原因。因此,设计者仍然只能猜测——这种做法是恶意数据的代名词。
另一种普遍的分析技术是漏斗分析,跟踪玩家从一个级别到另一个级别的进展。虽然它可以显示出玩家在哪里下降,但它同样没有解释原因,导致我们回到了猜测的领域。
热力图是一种更有空间感的分析方法,提供了一个更细化的玩家互动视图。然而,它们仍然无法观察到实际的游戏过程。另一方面,游戏记录提供了一个更接近于第一手经验的方法。虽然这种记录仍然包含一些恶意数据,但它们允许开发者看到玩家所做的事情,并听到他们同时的评论。
尽管有潜在的隐患,游戏录音可以成为提取关卡流程、时间和其他特定游戏元素信息的宝贵工具。然而,对技术设置的要求可能会阻止一些潜在的测试者,特别是那些不太精通技术的人。它还需要投入大量时间来彻底审查录像。
总之,每一种收集在线游戏测试数据的方法都有产生恶意数据的可能性。认识并驾驭这些潜在的陷阱,对于寻求有效理解和改进他们的游戏设计的开发者来说是一项关键的技能。
3. 以最小的努力组织游戏测试
3.1 游戏测试的开销和最小化的策略
尽管游戏测试很重要,但它可能是一个耗费时间和资源密集的过程。它涉及到招募测试人员、设置测试环节、收集和分析数据,以及根据反馈实施修改。这种开销可能是一个很大的负担,特别是对于小型开发团队或那些日程或预算紧张的团队。
然而,有一些策略可以最大限度地减少与游戏测试相关的开销。一种方法是精简招募过程。这可能涉及到保持一个潜在的测试人员库,可以在需要时调用,而不是为每个环节招募新的测试人员。另一个策略是尽可能地将数据收集和分析自动化。例如,开发人员可以使用软件工具来跟踪玩家在测试过程中的行为并生成报告。
此外,开发者可以根据开发阶段和游戏的性质来确定游戏测试工作的优先次序。在开发早期,测试核心机制和游戏循环可能更重要,而后期阶段可能更注重内容、平衡和抛光。通过将游戏测试工作集中在最需要的地方,开发者可以最大限度地利用他们的资源。

3.2 电子邮件模板和提醒的使用
沟通是游戏测试的一个重要方面。开发人员需要与测试人员沟通,以安排测试课程,提供指示,并收集反馈。这种沟通可能很耗时,特别是在处理大量测试人员的时候。
简化这一过程的方法之一是使用电子邮件模板。这些模板可以用来向测试人员发送标准化的通信,节省时间并确保包括所有必要的信息。例如,一个测试会议的邀请可能包括时间和地点的细节,访问游戏的说明,以及开发者希望测试的信息。
除了电子邮件模板外,还可以使用提醒,以确保测试人员了解即将到来的测试会议和他们需要采取的任何行动。这些提醒可以自动化,减少开发人员的行政负担,并帮助确保测试会议顺利进行。
3.3 其他游戏测试结构
虽然传统的游戏测试会议,即测试人员在开发人员的监督下进行游戏,是很有价值的,但也有一些替代结构,可以提供不同的见解,减少开销。
3.3.1 远程游戏测试
测试者在他们自己的时间里玩游戏,并通过电子邮件或在线表格提供反馈。这种方法的资源密集度比传统的会议要低,因为它不需要物理位置或开发人员的存在。它还允许更灵活的时间安排,这在处理不同时区的测试者或有不同时间的测试者时可能是有益的。
3.3.2 集体游戏测试
多个测试者同时进行游戏并讨论他们的经验。这可以提供对游戏的社会动态的洞察力,揭示玩家如何相互学习,并产生更广泛的反馈。它也可以更有效地利用资源,因为可以在一次会议中收集多个测试者的反馈。
3.3.3 纵向游戏测试
同样的测试者在较长的时间内玩该游戏。这可以揭示玩家的体验是如何随时间演变的,玩家是如何参与长期目标或进展系统的,以及保留和重玩性因素是如何发挥的。虽然这种方法需要测试者的长期承诺,但它可以提供单次游戏测试不可能获得的深刻见解。

4. 总结
从有效的游戏测试中收集到的洞察力可以改变开发过程中的游戏规则。它们为玩家的体验提供了一个独特的视角,揭示了玩家是如何与游戏互动的,他们喜欢什么,以及什么让他们感到沮丧。这种理解可以为设计决策提供信息,确保游戏提供令人满意的、有吸引力的体验。因此,非常鼓励游戏开发者在他们的工作中应用这些洞察力。通过避免恶意数据,以最小的努力组织游戏测试,并利用所讨论的策略,开发者可以提高他们游戏测试过程的有效性。这不仅减少了所需的努力,也带来了更好的玩家体验,最终促进了游戏的成功。
我将在今后的文章中继续深入研究游戏设计的迷人世界。如果你觉得这个话题很吸引人,请关注我,以获得更多的见解。我也欢迎你对游戏设计的想法和建议。让我们一起探索和学习吧 :)
英文原文:https://www.reddit.com/r/leveldesign/comments/141euyq/game_matrix_analysis_of_gdc_2017_playtesting/