《中国管理科学》(Chinese Journal of Management Science)第32卷第3期于2024年3月发表了一篇由合肥工业大学管理学院李祥文、宋程、丁帅及其合作者(关联教育部过程优化与智能决策重点实验室及数据科学与智慧社会治理哲学社会科学实验室)完成的学术论文,题为“人机协同决策中的人因能力评估研究”。这篇论文直面人工智能(AI)时代,特别是在高风险复杂决策环境中,如何实现高效、稳定的人机协同(Human-Machine Teaming, HMT)这一核心挑战。论文的核心论点是:传统的人机协同系统设计往往基于“人始终处于理想状态”的假设,忽略了人的生理、心理及认知状态在实际任务中是动态波动的这一关键事实。这种波动会严重影响人的决策效能,进而损害整个人机协同系统的可靠性与性能。因此,为了实现从“人适应机器”到“机器适应人”的根本性模式转变,必须让机器能够在线感知、评估并适应人的动态能力状态。为此,作者创新性地提出了“人因能力”(Human Factors Capacity)这一核心概念,并构建了一套完整的理论框架、计算模型与评估方法。
一、 核心概念:人因能力的提出与内涵
论文首先清晰地界定了“人因能力”。它并非指人类固有的、静态的智力或技能,而是特指在人机混合的复杂决策环境下,由机器通过对人的多项素质进行综合测度所识别出的、反映其当前身心状态与决策效能潜力的一个动态指标。具体而言,人因能力建立在三大素质基础之上: 1. 生理素质:影响人体活动方式和效率的内在规定性,主要通过四大生命体征(心率/心率变异性、血压、呼吸频率、体温)以及心电(ECG)等指标度量。 2. 应激素质:个体面对威胁或挑战时的应对状态,主要通过皮质醇、脑电(EEG)、皮电活动(EDA)等生理心理指标衡量。 3. 认知素质:人脑处理信息的基础能力,如信息查询、推理、空间识别、注意力分配与维持等,主要通过认知测评量表(如DXC-W量表)或软件进行测度。
人因能力具备四个主要特征:可度量性(可通过设备与量表量化)、个体差异性(因人而异)、动态性(随任务、环境、时间实时变化)以及强关联性(人的三大素质内部、人-机-环境之间紧密耦合)。这一定义标志着研究视角从机器被动执行指令,转向机器主动感知并适应人的状态,是实现智能化、个性化人机协同的关键理论基石。
二、 学术背景与研究动机
论文的学术背景植根于人工智能技术的飞速发展及其在医疗、交通、军事等关键领域的深度融合。尽管AI在计算、搜索、优化等方面优势明显,但在归纳、推理、非结构化决策等方面仍无法完全替代人类。因此,人机协同决策(Human-Machine Collaborative Decision-Making)成为发挥混合智能优势的必然模式。然而,当前研究存在显著不足: * 对人的状态忽视:多数系统设计基于技术逻辑,假设人类决策者状态恒定,忽略了疲劳、压力、情绪等因素导致的认知功能波动。 * 测量与评估缺失:缺乏对生理、心理、认知素质的综合感知手段、可行的计算模型以及动态的评估体系。 * 协同模式僵化:现有简单交互模式无法适应复杂动态环境中人对决策支持需求的实时变化。
因此,本研究旨在打破这一瓶颈,其核心目标是:通过定义和量化“人因能力”,建立一套使机器能够“读懂”人当前状态的理论与方法体系,从而动态调整人机协同策略(如任务分配、决策权重),最终提升整个人机系统的决策效能、可靠性与适应性。
三、 论文核心框架与主要观点
论文的主体部分围绕构建人因能力评估的完整方法论展开,主要观点层层递进:
观点一:构建人因能力的可计算数学模型是量化评估的基础。 为将抽象的人因能力转化为机器可处理的信息,作者提出了一个基于场景和任务的度量模型:C = f(X, Y, Z)。其中,C代表人因能力有效值;X、Y、Z分别代表生理素质指标集合、应激素质指标集合和认知素质指标集合;f则是特定决策任务中各项指标到能力值的映射函数。这一模型明确了评估的输入(多模态指标)和输出(单一能力值),为后续的指标融合与计算提供了数学框架。针对各指标量纲不同的问题,论文提出了使用隶属函数(极大型、极小型)进行标准化预处理,并建议采用乘法合成法进行指标集成,强调各指标发展的均衡性,即任一指标的严重短板都会显著拉低综合能力值。
观点二:需采用多模态融合的方法对人因能力三大指标进行精准测度。 论文详细阐述了各项素质的具体测度方式,体现了多学科方法融合的特点: * 生理素质测度:结合可穿戴设备(如E4腕带采集心电、心率)与非接触式设备(如通过面部视频,利用远程光电容积脉搏波描记术rPPG技术提取心率、呼吸率等)。后者无侵入、无干扰的优势,更适合长时间或移动状态下的监测。 * 应激素质测度:可采用标准化应激诱发程序(如特里尔社会应激测试TSST),同步采集EDA、ECG、皮肤温度等信号;也可探索基于面部视频rPPG信号的非接触式应激识别方法。 * 认知素质测度:主要依靠认知测评量表(如DXC-W、蒙特利尔认知评估量表MoCA)或专项测试软件,在任务执行前后进行评估,测量信息查询、推理、注意力等维度的准确率与反应时间。
这些测度方法的选择依据在于其可靠性、实时性以及与决策任务的相关性,共同构成了人因能力评估的数据来源。
观点三:提出融合主观问卷与客观数据分类的人因能力综合评估方法。 获得人因能力计算值后,如何对其进行有效分类和评估是关键。论文提出了一个主客观相结合的评估框架: 1. 主观分类:采用NASA-TLX等成熟的主观工作量问卷,评估操作者在任务中的脑力需求、体力需求、挫折感等,将主观感受量化为能力分类的参考标准(高、中、低)。 2. 客观分类:基于可计算模型得到的客观能力值,采用基于证据推理的分类器进行处理。该分类器能够融合来自能力值、任务表现等多源证据,并处理评估中的不确定性。文中提到可使用单层感知器优化算法来训练分类器参数,以实现对能力值的高、中、低三分类。最终,将客观分类结果与主观问卷结果进行比对与融合,提升分类的准确性。
观点四:通过建立评价方程验证模型,并以高风险的军事决策场景进行应用示例。 为验证所提方法的有效性,论文: * 提出了建立人因能力评价方程的思路,即使用多元线性回归等方法,探寻生理、应激等实时指标数据集与人因能力客观分类结果之间的映射关系,从而可用于未来对新数据的预测。 * 提供了一个具体的应用场景设想——有人机/无人机协同对抗。在此高风险军事决策中,飞行员承受巨大身心负荷。论文设想通过可穿戴与非接触设备实时监测飞行员的生理心理指标,结合任务前后的认知测试,动态计算其“人因能力值”。当系统检测到飞行员能力下降时,可自动调整智能辅助决策系统的介入程度和策略(例如,从提供建议转为更多接管部分决策),从而在飞行员状态不佳时保障整体作战效能。论文建议通过对比实验(有无噪声干扰、有无基于人因能力的辅助决策)来验证该方法提升决策有效性的价值。
四、 研究展望与论文价值
在结论部分,论文对人因能力的未来研究方向进行了展望,包括:在更复杂情境下(航空、核电等)深化人因能力特征分析;研究人因能力随环境、任务的动态演化规律;在评估模型中纳入个体特质、情绪变化、风险偏好等更多维度,以提升模型的准确性和适应性。
本论文的重要价值体现在: 1. 理论创新:首次系统性地提出并定义了“人因能力”这一契合新一代人机协同需求的核心概念,为相关研究提供了统一的理论锚点。 2. 方法论贡献:构建了从概念、特征、测度、计算模型到评估方法的完整方法论链条,具有重要的系统性和可操作性。 3. 应用导向:紧密联系智能医疗、军事作战等高价值、高风险应用场景,指明了研究成果转化为实际生产力的明确路径。 4. 前瞻视野:呼应了人工智能从感知物理世界到感知人类状态的演进趋势,为构建真正“以人为中心”的混合智能系统提供了关键思路。
总结而言,李祥文、宋程、丁帅等人的这篇研究,是一篇具有前瞻性和系统性的重要学术论文。它敏锐地抓住了当前人机协同决策领域从“技术驱动”迈向“人本驱动”转型过程中的核心科学问题。通过创立“人因能力”理论体系,论文不仅为学术界开辟了一个富有潜力的研究方向,也为工业界和国防领域设计下一代自适应、高鲁棒性的人机协同系统提供了宝贵的理论依据与实践框架。