本文档是由来自Universidad Industrial de Santander的Luis Bautista、Fernanda Maradei和Gabriel Pedraza三位研究者共同撰写,发表于2023年的 International Journal on Interactive Design and Manufacturing (IJIDeM) 期刊上的一篇系统性综述论文。文章标题为“Strategies to Reduce Visual Attention Changes While Learning and Training in Extended Reality Environments”,旨在探讨在扩展现实(Extended Reality, XR)环境中进行学习和训练时,如何通过特定的策略来减少由视觉注意力切换引发的认知负荷。
本文旨在回顾现有文献,归纳总结用于减少或管理XR学习/训练环境中注意力变化的有效策略,并分析这些策略对用户认知负荷和任务表现的影响。其核心研究问题是:在利用XR技术为学员提供信息的教学环境中,应用了哪些策略来减少空间注意力变化和降低认知负荷?
研究背景源于当前工业4.0背景下,以计算机为基础(CBT)和基于仿真(SBT)的训练模式广泛应用,而XR(包括虚拟现实VR、增强现实AR、混合现实MR)技术在其中扮演着重要角色。然而,XR技术的一个关键限制是可能因界面信息呈现不当,导致学员需要频繁切换视觉注意力,从而造成认知负荷过载,影响学习和训练效果。认知负荷理论(Cognitive Load Theory, CLT)认为,不必要的外部认知负荷会占用有限的工作记忆资源,阻碍学习。特别是“分散注意效应”(Split-Attention Effect),即当学习者必须同时关注多个分离的信息源并对其进行心理整合时,认知负荷会增加。尽管在传统多媒体学习(如纸质材料、桌面电脑)中对此效应已有研究,但在三维、沉浸式的XR平台上,其影响和应对策略尚不完全明确。
本综述遵循了Kitchenham和Petersen提出的系统性文献综述方法学,以确保研究的严谨性和可重复性。其具体工作流程如下: 首先,研究者定义了明确的研究问题,并采用PICOC框架确定了研究范围。随后,围绕“认知效应”、“用户活动”、“技术”和“交互性”四组关键词构建了详细的检索字符串。在1990年至2022年的时间范围内,这些检索词在EBSCO、Web of Science (WoS)和Scopus三个主要学术数据库中进行了检索,初步获得了13,762篇文献。 接着,通过严格的纳入和排除标准进行筛选。纳入标准包括:评估认知负荷/心理努力/绩效的实验研究、使用XR或多媒体作为展示平台的教学材料、针对18-50岁人群等。排除标准包括:非实验性研究、综述、涉及认知障碍或未成年参与者的研究等。筛选过程包括标题筛选、摘要筛选和全文详细分析三个阶段,最终从53篇高质量研究中提取数据。 在分析和分类阶段,研究者设计了一个数据提取模板,对筛选出的研究进行了系统编码。他们将识别出的策略根据其减少“分散注意”的核心因素分为三大类:与空间整合相关的策略、与视觉属性使用相关的策略、与内容分割相关的策略。此外,他们还提取了每项研究的研究目标、教学领域、活动类型、使用的XR技术、显示设备、参与者设备经验水平及知识水平、图形用户界面(GUI)特征以及实验结果(如认知负荷测量、任务完成时间、错误率、学习效果)等信息。为了确保综述的有效性,研究者还从描述有效性、理论有效性、解释有效性和可重复性四个方面评估了研究过程,采取了诸如创建参考文章集、双重检查数据提取等措施来控制偏倚。
通过对53项精选研究的综合分析,本文梳理出三大类用于减少XR环境中注意力变化的策略,并总结了各类策略的应用效果、适用条件及局限性。
第一大类:空间邻近性策略 该策略基于认知负荷理论中的“空间邻近原则”(Spatial Contiguity Principle),旨在通过减少信息源之间的空间距离来降低整合信息的心理努力。综述识别出三种空间呈现格式: 1. 非整合格式:信息源在空间上分离。研究发现,尽管在某些XR任务中,用户可能通过加快操作速度来“补偿”这种分离,从而表现出较好的任务绩效,但这往往伴随着更高的总体认知负荷、挫折感,并且不利于知识的长期保持和迁移。约38%的研究使用了此格式。 2. 整合格式:信息源紧密相邻。这是最常用的策略(72%的研究),尤其在AR环境中效果显著。研究普遍表明,整合格式能有效减少认知负荷、缩短任务完成时间,并能改善学习效果。这是因为用户倾向于将邻近的信息作为一个整体单元进行处理,减少了工作记忆的搜索和匹配负担。 3. 主动整合格式:要求学员通过交互(如拖拽)将分离的信息源整合到一起。有研究指出,对于高难度、高复杂度的教学材料,主动整合比静态整合格式能带来更显著的绩效提升(高达75%)。 影响空间邻近效应的条件:研究发现,该策略的效果受到多种因素调节:1) 学习者先验知识:对低知识水平的学习者效果更显著;2) 任务复杂性:对复杂任务效果更好;3) 信息表征格式:文本-文本、文本-图形整合比图形-文本整合效果更好;4) 设备特性:不同显示设备(如头戴式显示器HMD vs. 大型显示器)可能影响策略的有效性。
第二大类:视觉属性策略 此类策略通过使用特定的视觉线索来引导和聚焦注意力,从而减少不必要的视觉搜索。 1. 编码:主要是颜色编码(40%的研究),即对相关信息源使用相同的颜色。这能帮助学习者快速建立信息间的关联,在AR环境中被证明能有效降低认知负荷并提升绩效。但研究也提示,同时使用的颜色不宜过多(建议不超过5种),且颜色感知可能受设备显示技术(如光学透视OST与视频透视VST)和环境光照影响。形状编码(19%的研究)通常作为颜色编码的补充。 2. 信号提示:通过视觉元素直接标记或指示关注点。 * 直接信号提示:使用方框、圆圈、高亮等几何元素框选或突出目标对象(23%的研究)。这在AR中应用广泛,能有效降低认知负荷和提升绩效。标签的使用是关键,研究表明,标签应垂直于用户视线,连接线应尽可能短且不遮挡目标。 * 符号信号提示:使用箭头、圆点等符号指引方向或位置(21%的研究)。箭头是最常用且有效的符号,能显著减少任务时间和错误。此外,还有研究使用“光环”(Halo)或“雷达波纹”等技术来指示视野外的目标。 * 动画信号提示:使用微妙的动画(如闪烁、移动、旋转)吸引注意力。研究表明,动画在视野边缘区域的效果优于颜色和形状,且不需要跟踪用户视线。 策略选择与任务类型:视觉属性策略的选择与任务类型密切相关。例如,对于搜索任务,可能需要扩大视觉引导范围;而对于比较任务,则应将信息局限在较小视野内,尽管这仍会引发注意力切换,但因搜索范围固定,认知处理模式不同。
第三大类:内容分割策略 当教学内容过于庞大复杂时,一次性呈现会导致认知超载。内容分割策略旨在将信息分解为更小的、可管理的部分。 1. 分段呈现:将操作步骤分步展示(9%的研究)。这在AR中被证实能提升用户绩效。 2. 渐进式揭示:隐藏非即时需要的详细信息,用户可通过交互(如点击图标)按需查看。 3. 超链接:在相关元素间建立可点击的链接,让用户控制信息的关联与呈现。研究表明,这种方法有时比整合格式更有效,因为它赋予了学习者控制权。 然而,内容分割也可能带来风险,即过度分割可能违反空间邻近原则,重新引入分散注意问题。因此,需要平衡,例如遵循“标签文字不超过5个词”等简洁性原则。
研究发现与讨论 本综述的深入分析揭示了以下重要发现: 1. 研究现状:目前大多数XR研究侧重于评估用户绩效,专门深入评估认知负荷的研究相对较少。这凸显了本综述的价值,即为XR教学设计者提供了亟需的认知效应参考依据。 2. 技术应用倾向:AR是最常用于学习和训练的XR技术(55%的研究),其次是VR(25%)。头戴式显示器(HMD)是最主要的显示设备(57%),因其解放双手的特性适合操作任务。 3. 用户画像:XR学习和训练材料主要面向设备使用经验浅和领域知识水平低的初学者。这表明XR技术特别适用于入门阶段的知识与技能传授。 4. 策略组合应用:在实际研究中,策略常被组合使用以增强效果。例如,空间整合格式常与颜色编码或信号提示结合,以获得更佳的学习或绩效结果。 5. 策略效果的不确定性:综述指出,部分策略(特别是空间邻近原则)对学习效果的影响存在混合结果,这可能与研究设计、测试方法、参与者差异等因素有关。这提示未来需要更多在XR环境下针对认知负荷和学习的精细研究。
结论与意义 本文通过对现有文献的系统性回顾,成功识别并归类了在XR学习与训练环境中用于减少视觉注意力变化的三组主要策略:空间邻近性策略、视觉属性策略和内容分割策略。研究详细阐述了每种策略的具体实施方法、实证效果以及适用条件与局限。
本研究具有重要的理论和实践价值: * 理论价值:它将经典的多媒体学习认知理论(如认知负荷理论、空间邻近原则)延伸并具体化到三维、沉浸式的XR环境中,探讨了传统原则在新媒介下的适用性、变异性和新的约束条件(如设备视野、三维空间坐标、深度感知),为后续理论研究提供了基础和方向。 * 实践价值:本文为XR教学材料、特别是其图形用户界面(GUI)的设计者提供了一份基于实证的实用指南。设计者可以根据教学目标(学习 vs. 训练)、任务类型(搜索 vs. 比较)、用户特征(知识水平)和技术平台(AR/VR/MR,设备类型),参考文中总结的策略及其效果来优化界面设计,从而主动减少不必要的注意力切换,降低学员的认知负荷,最终提升学习和训练的效率与效果。
研究亮点 1. 全面性与系统性:这是首篇系统性地聚焦于“减少XR环境中注意力变化策略”的文献综述,检索范围广,筛选流程严谨,涵盖了1999年至2022年的关键研究。 2. 清晰的策略分类框架:提出了一个逻辑清晰、易于理解的三维策略分类体系(空间、视觉、内容),并对每类下的子策略进行了细致梳理。 3. 强调条件性与情境性:研究不仅列出策略,更深入分析了各种策略效果的影响因素(如用户知识水平、任务类型、设备特性),强调了“没有放之四海而皆准”的设计方案,体现了科学的审慎态度。 4. 揭示研究空白:明确指出了当前该领域研究存在的不足,即针对XR环境下认知负荷的深度评估研究仍然匮乏,尤其是结合眼动追踪等客观测量手段的研究,为未来研究指明了方向。
这篇综述论文是一份对于教育技术、人机交互和XR应用开发领域的研究者及实践者都具有高度参考价值的学术资料,它架起了认知科学与XR教学实践之间的桥梁。