欢迎光临散文网 会员登陆 & 注册

鼠标瞄准相关的生理、心理和人机交互概念简介

2021-11-17 16:30 作者:勉強上手  | 我要投稿

在实践中,理论知识不一定能直接提升个体的操作水平,但往往能帮助个体更好地总结和交流经验,从而间接地提升社区的整体水平。正如一个空气动力学专家不一定是一个好的飞行员,但空气动力学知识对飞行员群体来说还是有益的。

FPS瞄准社区中已经有了不少方法论,但绝大部分的方法论都停留在对主观经验的描述上,缺少一些生理和心理学的基础,各种方法论的效果也缺乏实证研究。本文的目标是介绍一些与瞄准相关的基础生理、心理和人机交互概念,为读者建立一个简单的知识框架,以帮助读者更好地发现、理解和总结高效的方法论。

本文同时也作为一个简单的文献导读,展示和讨论了一些作者觉得有意思的文献结果。值得注意的是,下文提到的文献中的实验参与者大多没有经过专门的训练,与瞄准社区中的样本还是有一定差异的,且众所周知,“重复实验在生命科学中并不一定可靠”,读者不必对文中的数据和讨论太过认真。

另外,由于作者的专业方向跟生理和心理学基本不沾边,提到的文献大多也只看了摘要、导论和图表就断章取义,下文中难免有大量错漏,有了解的读者不妨在评论指出。


1. Fovea(中央凹)

Fovea(中央凹)是视网膜中心的一片很小的区域,这一区域的视觉最为敏锐。Fovea对应的视角大约在1-2度,在眼睛距离屏幕70cm的情况下,这一视角大约对应屏幕上1-3cm的范围。我们可以通过注视屏幕上一点,将指针从远处移向这一点直至可以看清指针的细节来感知fovea对应的屏幕区域大小。


讨论:在需要精确视觉信息的时候(如做精细微调时),我们希望目标处于fovea对应的视角范围内。


2. Fixation(注视)和Saccade(扫视)

为了更好地利用中央凹的分辨能力,眼睛会不断改变注视的位置以观察到更多的细节。每次改变注视的位置后,视线都会在一小块区域大致停留一段时间以获取足够的信息,这一停留的行为称为fixation(注视)。每次fixation之间眼睛的移动被称为saccade(扫视)。如果读者见过鸡在四处张望时鸡头一顿一顿的样子,大概就能理解fixation和saccade的行为模式,只不过鸡可能需要通过转动脖子来改变fixation的位置,而人只需要动动眼睛。值得一提的是,在fixation期间,眼睛并不会完全静止,而是会保持微小的移动。有研究指出在视野中保持相对静止的目标会在视野中逐渐消失,这一现象称为retinal stabilization[2](通常需要在实验中让目标跟着视线动,人很难做到眼睛完全不动)。

正常状态下fixation平均持续时间为150ms到300ms。在一项对CSGO玩家的研究[1]中发现,业余玩家在游戏中看得到敌人和看不到敌人时的平均fixation时间分别为482.40ms和321.09ms,而职业玩家则分别为713.71ms和559.73ms。对于意料之外的刺激(如目标突然改变位置),saccade需要先花费大约200ms来准备(initiate)(类似于施法前摇),然后花费15-100ms来将视线移动到目标上[2]。


讨论:

1) 现实中我们将手指向目标的时候会将眼睛看向目标,同时把手向目标移动,这一过程中只需要一次saccade。但在FPS游戏中,如果我们先看向目标(此时目标远离屏幕中心),再把准心移到目标上(此时目标在屏幕中心,视线远离屏幕中心),在接下来的微调时我们还要再把视线移回屏幕中心(假设我们需要这么做),这将需要两次saccade。如果两次saccade都需要200ms来initiate,这样的瞄准过程将是相当低效的。尽管我没有找到有心理准备的saccade需要多长时间intiate,但我尝试了一下尽可能快地在两个目标之间切换视线,对我来说还是相对缓慢和疲劳的。从另一方面考虑,我们也不可能在第一次粗瞄时通过把眼睛看向目标来获取很精确的视觉信息(看向目标时远离视线的准心信息就模糊了)。因此我觉得在FPS游戏中,通过移动鼠标把游戏中视角转动到目标附近处,同时(或稍微提前)把眼睛看向屏幕中心准备微调的瞄准方式或许会更高效。在第一次粗瞄的质量达到一定水平的情况下(能把目标和准心放到fovea附近),这一方式每次只需要0或1次saccade(取决于眼睛之前的位置),并且在微调前有更长的fixation时间来获取准心和目标的准确相对位置,避免微调时丢失准心或目标的情况。

2) 没有必要过于紧张地让目标或准心静止在视野中,这样可能反而会在某种程度上引起retinal stabilization(真的可能吗?)。

3) 更新:关于眼睛该怎么看有一些不同的观点,感兴趣的可以看看评论区里的讨论。


3. Psychological refractory period(PRP)(心理不应期)

PRP指的是人在对一个刺激进行反应以后,需要间隔一段时间才能对第二个刺激进行反应的现象(相当于每一次对刺激进行反应后都会有一个施法后摇,结束后才能执行对下一个刺激的反应)。PRP的原因可能在于神经系统中的某些部分只能串行地执行任务,在遇到需要快速连续反应的任务时会阻塞,了解CPU流水线的读者应该不难理解。在一些实验项目中,PRP体现为在两次刺激间隔小于200-400ms时,对第二次刺激反应时间会随着两次刺激间隔时间的减小而增加[3]。PRP会受到任务类型、紧张程度(越紧张越长)、疲劳程度(越疲劳约长)和年龄(年龄越大越长)等因素的影响。


讨论:

1) PRP的存在并不意味着我们的任何两个动作之间间隔不能小于200ms(快速连点按键的间隔很容易少于这一时间),这是因为两个动作之间不一定有对刺激进行反应的过程(连点按键时我们不需要在触觉感受到第一次按键按下后再发出按第二下的指令),也就不一定会触发PRP。

2) 瞄准中的很多失误都可能与PRP有关。如我们在clicking微调时会遇到明明看清了准心和目标的相对位置,但反应却慢半拍的情况;在变向跟枪时也会遇到明明看清目标变向了,但手却不受控制的情况。这些情况可能是由上一次反应的PRP导致的。

3) 为了减少PRP的影响,我们可以:a)提升瞄准动作的质量,减少瞄准中靠反应修正的次数。如打clicking项目时,第一次粗瞄的动作应干净利落,在准心靠近目标前尽量不要再次调整,以避免这一调整引起的PRP对后续微调的影响。打跟枪项目时,每次修正动作不仅要把准心放到目标上,还应保证修正后鼠标的速度能轻松地(不需要调整地)跟住目标一段距离,以在两次修正之间(即第一次修正的PRP“后摇”结束前)尽可能地打出伤害。b)在瞄准时尽量放松,减轻紧张程度和疲劳程度,从而减少PRP时间。

4) “确认”的实质是什么?“确认”是瞄准社区中关于静态小目标clicking项目(如sixshot)一种技巧,指的是微调后要看到准心和目标重合再执行点击动作。关于确认的实质我有两种可能的理解,一是如字面意思一样在受到准心和目标重合的视觉刺激后再靠反应执行点击操作;二是在微调时实际上是靠预判准心和目标重合的时机来执行点击动作,但通过训练瞄准的动作使得微调前后准心和目标在较长的一段时间内保持较低的相对速度,从而增加对点击时机预判的容错率,其间接的产物就是我们在点击时有足够的时间看到准心和目标重合。从bardoz的1w6ts项目世界纪录视频来看,我倾向于认为他是以第二种方式进行微调的。逐帧播放bardoz世界纪录的60fps视频可以发现,他在微调动作开始(此时准心往往还没有与目标重合)和点击之间往往只有5-10帧的间隔,对应于80-170ms的时间,仅对一次完整的从视觉刺激到手部点击的反应来说就已经很极限了,考虑到微调动作PRP的可能影响,第一种方式将更加难以实现。作为参考,humanbenchmark反应时间项目的极限大概在110ms左右(SpiffyCheese用兴奋剂的13次平均成绩是112.7ms)。

5) 关于bardoz的1w6ts世界记录视频,我们还可以注意到他从第一次粗瞄基本停下到微调动作开始之间往往也只有4-8帧的间隔,可以推测他是靠经验在准心完全停下之前就预判了需要的微调,以此达到了如此极限的速度。

6) 考虑到bardoz平均每个目标只用了约330ms,一个更激进的猜测是,bardoz的(微调->点击->视角移动到下一个目标附近)只用了一次反应。

7) 当然,就算上述推测均成立,也并不意味着在练习时有意识地在看到准星和目标重合后再执行点击操作是错误的。这样的练习或许有助于我们养成习惯,在点击前保持准星和目标之间较低的相对速度,从而提升决定点击时机的容错率。


4. Intermittent Control(间歇控制模型)

在PRP的基础上,研究者建立了一种关于用鼠标指针点击目标这一行为的间歇控制数学模型[4-6](作者之一Byungjoo Lee也参与了对CSGO玩家的研究[1])。简单来说,这一模型是说在瞄准的过程中,人会每隔一段时间通过外界输入的刺激(如目标和指针的位置、速度)预测一小段时间后目标和指针所在的位置,调整接下来手部的发力。每一次受到刺激调整发力的过程称为一个子动作(submovement),整个瞄准点击过程由数个子动作组成。

[1]中的数据表明CSGO玩家在使用步枪射击时从瞄准到开枪平均只有约2个子动作(平均有一次微调),在使用狙击枪射击时则只有平均不到1.5个子动作(如果我没理解错他的数据的话)。


讨论:

1) 从间歇控制模型和CSGO职业玩家的表现来看,瞄准过程中我们调整发力的机会十分有限(只有一到两次),因此在动作之前应该尽可能精确地获取目标和准心的相对位置和相对速度,提升每次动作的质量。

2) 间歇控制模型中反馈是离散的,这表现为在跟枪时我们不可能连续地根据目标运动来反应调整,预判是难免的。这种预判行为很早就在实验中被发现了,被称为proactive control,可参考[11](为什么这种研究也能发PRL?)。


5. Fitts's Law(费茨法则)

在FPS游戏中用鼠标瞄准目标的行为是典型的人机交互行为,而费茨法则是人机交互领域最有影响力的法则之一。考虑一个简单的任务:鼠标指针与目标的距离为D,目标的宽度为W,费茨法则认为将鼠标指针移动到目标上所需的时间可以用MT = a + b * log(D / W + 1)来估计,其中a和b是与操作者和外设有关的常数,ID = log(D / W + 1)称为这一任务的难度指标。

费茨法则来源于信息论,有着简单的直观解释。假设目标宽度为W,指针距离目标D,我们可以通过将指针向目标移动(D / W)个目标宽度的距离来把指针放到目标上,这相当于向计算机发送了(D / W)这一信息,而(D / W)这一信息则需要大约log(D / W)个二进制数字表示。也就是说,我们瞄准点击的过程实际上是向电脑发送了大约log(D / W)信息量的信息。假设系统的延迟为a(人的反应时间加上外设延迟等因素),用手向电脑传输信息的带宽为(1 / b),则传输这一信息所需的总时间大约就是a + b * log(D / W)。

尽管费茨法则有着相当的局限性,但由于其相当的简洁和优美,研究者们常常将其用于比较各种人机交互方式(如鼠标vs摇杆、手vs脚)的交互效率(b越小,效率越高)。


讨论:

1) 按照费茨法则,一次瞄准的效率似乎比二次瞄准(粗瞄加微调)更高。考虑MT = a + b * log(D / W)的近似,一次瞄准所需的时间是a + b * log(D / W),而二次瞄准所需的时间是a + b * log(D / W') + a + b * log(W' / W) = 2 * a + b * log(D / W),其中W'是粗瞄后准心与目标的距离。当然,我们知道实践中在小目标的任务上二次瞄准的效率往往更高,这就体现了费茨法则在这一任务上的局限性。在人机交互的学术界已有针对这一局限性的研究,如[7]。

2) 1w6ts的ID不超过7(视准心和目标的距离而定)(按103HFOV的屏幕距离算的,按角度算可能也差不多,懒得算了)。


6. Control-display gain(CD gain)(控制显示增益)(灵敏度)

灵敏度是FPS瞄准社区永恒的话题之一,在人机交互领域自然也少不了对灵敏度的研究。在人机交互领域,灵敏度通常用control-display gain表示,指的是指针在屏幕上移动的距离和鼠标在鼠标垫上移动距离之比。[8]中的结果表明,只有极低(1)或极高(12)的CD gain才会对移动鼠标点击目标所需的时间造成显著影响。


讨论:

1) 尽管[8]中只有1和12的CD gain才对瞄准时间有显著影响,但实际上在CD gain大于6时就会显著地增加高ID(大于7)任务中的overshooting现象,这是我们通常不希望看到的,不妨把相对合理的CD gain定在2-6之间。

2) 以103HFOV时27英寸显示器上sixshot中的微调过程为例(比如准心到目标在2cm以内)做一个不严谨的估算(按屏幕距离算的,有可能算错),1的CD gain大概对应CSGO中270的edpi,也就是说CSGO中540-1620edpi对大部分人来说应该都是相对合理的(与常见edpi惊人地符合)。

3) 有研究表明人手操作鼠标的分辨率大概在700-1400dpi[9],因此1600以内的鼠标dpi可能就足够了。


7. 手臂流、手腕流和手指流

有研究[10]指出,当限制人只能使用手臂、手腕或手指时,这三个部位的信息传输效率(1 / b)是相似的,在允许同时使用三者时信息传输的效率最高。也就是说纯粹的手臂流、手腕流和手指流表现可能是差不多的,综合地利用三者才能达到最好的效果。


8. Precision grip(指握?)和power grip(趴握?)

在解剖学中,precision grip主要指的是类似于握笔姿势的由手指主导的握法,power grip指的则是类似抓住水瓶的姿势一样更有力的握法。[12]中比较了各种情况下precision grip和power grip的耐久性和精准度。其中,在以各自握法50%MVC(最大肌力)发力且手腕处于自然位置的情况下,precision grip和power grip的耐久性是类似的,power grip略高于precision grip。在放松(20%MVC)的情况下precision grip的精度高于power grip(错误率4%vs6%);power grip发力(40%MVC)时的精度要显著低于放松(20%MVC)时的精度(错误率12%vs6%)。


讨论:

1) precision grip和power grip并非严格对应指握和趴握,不过鉴于它们各自的发力有相似之处,或许这些结果对握姿的讨论还是有一定参考价值的。

2) 考虑到precision grip和power grip的差异可能主要来自于使用肌肉群的倾向性不同,而在使用鼠标的实践中应该不会出现绝对的precision grip或power grip,因此下面讨论中的各种握法主要指的是使用相应肌肉群的倾向。

3) 考虑到power grip的MVC更大,在操作鼠标这一行为中,power grip的耐久性可能会显著地更高,因而更有利于高强度的练习。

4) 在手腕处于不自然位置时,precision grip和power grip的耐久性都会显著地降低。因此对于游戏强度较高的玩家来说,最好尽量让手腕处于自然的位置。

5) power grip发力时的精度显著低于放松时的精度。尽管precision grip的精度在发力和放松时并没有显著的差异,但应该可以推断放松时的耐久度更高(虽然[12]没有做这一实验),故各种握法的玩家都应该尝试一下用较放松的方式游戏。

6) 考虑到放松和自然姿势的重要性,建议在选择外设时优先选择可以使自己保持放松和自然状态的外设。

    

9. Declarative memory(陈述性记忆)、procedural memory(程序性记忆)和motor learning(运动学习)

陈述性记忆和程序性记忆是我们对长期记忆的一种分类方式。下面摘自百度百科:

程序性记忆是指如何做事情的记忆,包括对知觉技能、认知技能和运动技能的记忆。这类记忆往往需要多次尝试才能才能逐渐获得;在利用这类记忆时往往不需要意识的参与。

而陈述性记忆是指对有关事实和事件的记忆。它可以通过语言传授而一次性获得。它的提取往往需要意识的参与,如我们在课堂上学习的各种课本知识和日常的生活常识都属于这类记忆。例如在学习游泳之前,我们可能读过有关的一些书籍,记住了某些动作要领,这种记忆就是陈述性记忆;以后我们经过不断练习,把知识变成了运动技能,真正学会了在水中游泳,这时的记忆就是程序性记忆。

关于瞄准技能的记忆应该属于程序性记忆:我们在实战时不会在脑中计算鼠标移动距离与视角转动角度的关系,甚至也不会有意识地思考手要向左移还是向右移,而是直接根据视觉反馈下意识地移动鼠标。在社区中流行的这幅图就很好地还原了上述过程在瞄准训练中的对应:我们通过学习和总结得到关于高效瞄准方式的陈述性记忆,然后在练习中将陈述性记忆转化为程序性记忆,熟练后的表现就是瞄准技能上的提升。


Motor learning是研究运动技能学习的领域,在维基百科的介绍中,我们常说的肌肉记忆(muscle memory)就是motor learning的一个通称。关于motor learning我其实并没有找到很有意思的文献,一篇稍有意思的是[13],说的是在对儿童的棒球投球训练中,同时强调速度和动作规范性的组比同时强调精准度和动作规范性的组在速度和精度上都提升得更快。在这里我把速度理解成动作的流畅度,如果这篇论文的结论也适用于瞄准训练,那么一个合理的推测是在瞄准训练中也应该更注意动作的流畅度和规范性。其实这与上文在PRP的讨论中提到的点也是不谋而合的。另一篇稍有意思的是关于Aimlab玩家Gridshot成绩的大数据分析[14]。从[14]的结论看,每天50-70次的练习对Gridshot这一项目来说可能是效率较高的。


番外:Genetic and environmental contributions to the acquisition of a motor skill[15]

Abstract: PRACTICE, with feedback, is a fundamental variable that influences the aquisition of motor skills: with it, everyone improves, but some improve more than others. This simple fact has led to frequent debate over the relative importance of genetic and environmental influences on motor learning. In principle these factors could influence subjects' initial level of proficiency, their rate of improvement or their final level of attainment. The problem has been investigated using the rotary pursuit (RP) task, in which subjects learn to track a rotating target with a stylus; this is a factorially pure task which is relatively unaffected by cognitive or verbal factors. Earlier studies of twins reared together indicated that heredity was the primary factor responsible for individual differences in motor skill. Here we have studied learning in a sample of monozygotic (MZA) and dizygotic (DZA) twins who had been reared apart. Heritability of performance was high even in the initial phase, and increased with practice. The rate of learning was also significantly heritable. We propose that the effect of practice is to decrease the effect of environmental variation (previous learning) and increase the relative strength of genetic influences on motor performance.


参考:

[1] Park, E., Lee, S., Ham, A., Choi, M., Kim, S., & Lee, B. (2021, May). Secrets of Gosu: Understanding Physical Combat Skills of Professional Players in First-Person Shooters. In Proceedings of the 2021 CHI Conference on Human Factors in Computing Systems (pp. 1-14).

[2] Purves D, Augustine GJ, Fitzpatrick D, et al., editors. Neuroscience. 2nd edition. Sunderland (MA): Sinauer Associates; 2001. Types of Eye Movements and Their Functions.

[3] Pashler, H. (1994). Dual-task interference in simple tasks: data and theory. Psychological bulletin, 116(2), 220.

[4] Park, E., & Lee, B. (2020, April). An Intermittent Click Planning Model. In Proceedings of the 2020 CHI Conference on Human Factors in Computing Systems (pp. 1-13).

[5] Martín, J. A. Á., Gollee, H., Müller, J., & Murray-Smith, R. (2021). Intermittent control as a model of mouse movements. ACM Transactions on Computer-Human Interaction (TOCHI), 28(5), 1-46.

[6] Do, S., Chang, M., & Lee, B. (2021, May). A Simulation Model of Intermittently Controlled Point-and-Click Behaviour. In Proceedings of the 2021 CHI Conference on Human Factors in Computing Systems (pp. 1-17).

[7] Chapuis, O., & Dragicevic, P. (2011). Effects of motor scale, visual scale, and quantization on small target acquisition difficulty. ACM Transactions on Computer-Human Interaction (TOCHI), 18(3), 1-32.

[8] Casiez, G., Vogel, D., Balakrishnan, R., & Cockburn, A. (2008). The impact of control-display gain on user performance in pointing tasks. Human–computer interaction, 23(3), 215-250.

[9] Bérard, F., Wang, G., & Cooperstock, J. R. (2011, September). On the limits of the human motor control precision: the search for a device’s human resolution. In IFIP Conference on Human-Computer Interaction (pp. 107-122). Springer, Berlin, Heidelberg.

[10] Balakrishnan, R., & MacKenzie, I. S. (1997, March). Performance differences in the fingers, wrist, and forearm in computer input control. In Proceedings of the ACM SIGCHI Conference on Human factors in computing systems (pp. 303-310). 

[11] Ishida, F., & Sawada, Y. E. (2004). Human hand moves proactively to the external stimulus: an evolutional strategy for minimizing transient error. Physical review letters, 93(16), 168105.

[12] Finneran, A., & O'Sullivan, L. (2013). Effects of grip type and wrist posture on forearm EMG activity, endurance time and movement accuracy. International Journal of Industrial Ergonomics, 43(1), 91-99.

[13] Engelhorn, R. (1997). Speed and accuracy in the learning of a complex motor skill. Perceptual and motor skills, 85(3), 1011-1017.

[14] Listman, J. B., Tsay, J., Kim, H. E., Mackey, W. E., & Heeger, D. J. (2021). Long-term Motor Learning in the Wild with High Volume Video Game Data. bioRxiv.

[15] Fox, P. W., Hershberger, S. L., & Bouchard, T. J. (1996). Genetic and environmental contributions to the acquisition of a motor skill. Nature, 384(6607), 356-358.

鼠标瞄准相关的生理、心理和人机交互概念简介的评论 (共 条)

分享到微博请遵守国家法律