本文为发表于2024年8月《机械设计》期刊(Journal of Machine Design,Vol.41, No.8)的一篇学术综述论文。论文标题为《智能座舱人机交互设计关键技术研究进展》(Research progress on key technologies of intelligent cockpit human-computer interaction design)。作者团队主要来自陕西科技大学设计与艺术学院(王伟伟、顾炎辉、余隋怀、温志强、朋启钊),合作单位包括淮阴工学院设计艺术学院(顾炎辉)以及西北工业大学工业设计与人机工效工业和信息化部重点实验室(余隋怀)。该研究得到了陕西省创新能力支撑计划(2021PT-025)和陕西高校“青年杰出”人才支持计划项目(2020-50)的支持。
论文的核心主题是全面梳理和评述智能座舱领域人机交互(Human-Computer Interaction, HCI)设计的关键技术及评测方法。作者指出,随着新能源汽车产业和信息技术(如人工智能、5G、物联网)的飞速发展,智能座舱已从传统注重功能与舒适性的空间,演变为集信息处理、娱乐、安全于一体的智能化、多模态化、自然交互的移动空间。然而,该领域仍面临人机交互自然度不足、系统稳定性、多模态信息融合以及深层意图理解等挑战。为了应对这些挑战,并为相关研究提供清晰的技术发展脉络,本文提出了一个三层智能座舱人机交互模型,并以此框架为基础,系统性地综述了相关的信息输入与输出技术,以及人机交互的测评方法。
论文的第一个主要观点是提出了一个包含感知层、信息交互层和认知与决策层的三层智能座舱人机交互模型,为理解现有技术和指导未来研究提供了结构化框架。作者认为,该模型能够动态记录用户和环境数据,并通过实时感知、认知决策及交互反馈,帮助学者梳理复杂的交互过程。感知层作为输入端,负责通过视觉、听觉、触觉、嗅觉、生理传感器(如肌电图EMG、脑电图EEG传感器)和车身传感器采集多模态数据。认知与决策层则利用这些数据监测用户行为与状态(如情绪、疲劳),预测用户意图,并生成相应的评估与决策策略(如场景自适应、行为干预策略)。信息交互层则在决策层的指导下,通过视觉、听觉、触觉、嗅觉等单模态或多模态融合的方式,执行与舱内用户或舱外环境的信息交互。这个模型清晰地划分了智能座舱人机交互系统的数据流与功能层级,将以往分散的技术研究纳入一个统一的逻辑体系中。
论文的第二个主要观点是系统梳理了智能座舱多模态信息交互的关键技术,并分为信息输入与信息输出两大技术体系进行阐述。在信息输入技术方面,作者重点评述了三种前沿技术。其一,图像识别交互技术:得益于计算机视觉和深度学习,该技术在人脸、表情、动作(如驾驶姿态、肌肉疲劳)识别方面取得进展。例如,刘景轩等将卷积神经网络(CNN)与Transformer编码器结合以提升肌肉疲劳识别精度;屈乐乐等提出了融合全局空间注意力、长短时特征提取和增强CNN的三通道人体动作识别技术。其二,可穿戴信息交互技术:该技术融合柔性元件、传感器与通信技术,能监测人体生理状态(如心音异常)和运动意图,为智能座舱提供更自然、个性化的交互通道。例如,周维新等开发了基于长短期记忆(LSTM)神经网络的可穿戴心音诊断芯片。其三,声场感知识别技术:通过麦克风阵列、毫米波振动监测等手段实现声源定位和特定动作识别。例如,Xiong等提出的基于毫米波全场振动监测的“毫米声”技术,能有效克服复杂声学环境中的干扰,实现多声源同步感知。在信息输出技术方面,论文评述了三种核心技术。其一,信息可视化交互技术:通过将座舱产生的大数据转化为直观的图像,辅助用户认知规律,实现监控与决策支持。关键技术包括数据采集处理、可视化展示及交互设计。其二,混合现实(Mixed Reality)技术:结合虚拟现实(VR)与增强现实(AR),为用户提供沉浸式体验。关键技术涉及感知(如眼动追踪)、计算和显示,在导航、信息叠加等方面有应用潜力。其三,人机对话交互技术:基于语音识别和自然语言处理(NLP),实现自然语音控制。研究重点在于提升语音情感识别准确率(如高鹏淇等提出的ASGRU-CNN模型)和在复杂场景下的鲁棒性(如王超等提出的语音质量自适应方法)。这部分综述表明,当前技术发展已能实现多通道的信息感知与丰富的反馈形式,但作者也指出,从“识别行为”到“理解并响应行为背后的真实意图”,以及如何生成有效的交互反馈与补偿策略,仍是待深入研究的难点。
论文的第三个主要观点是探讨了智能座舱人机交互设计的测评方法,强调了评测对于驱动设计创新的重要性,并指出了评测重心从传统可用性向复杂环境适应性的转变。作者首先通过数据分析指出,近年来关于智能座舱人机交互测评的研究论文数量显著增长,反映了该领域对科学评估的日益重视。随后,文章重点介绍了四种关键的测评项目。第一,可用性测评:在实际或模拟驾驶环境中观察用户操作,评估系统易用性、错误率和满意度。第二,认知负荷测评:通过眼动追踪、心率监测等手段量化用户在使用系统时的注意力分散和心智负担,其核心是评估交互设计是否影响驾驶安全。徐江等的研究建立了结合具身认知、功能效用和情境价值的多维指标体系来测评认知负荷。第三,多模态交互兼容性测评:评估语音、手势、触屏等多种交互方式之间的协同与无缝切换能力,确保交互模式在不同场景下的自然流畅。第四,动态环境适应性测评:评估系统在不同驾驶条件(如昼夜、城乡道路)下的交互性能与用户感知,这要求系统具备应对环境不确定性的能力,张明悦等提出的自适应软件技术方案即针对此类问题。作者总结,未来评测技术的发展趋势将更加注重用户体验、智能化测评工具的应用以及个性化测评的结合,旨在全面提升智能座舱的交互效能、安全性和用户满意度。
论文的第四个主要观点,即结论与展望部分,总结了智能座舱人机交互技术的价值、现状与未来方向。作者认为,文中综述的各项关键技术是智能座舱的核心竞争力,它们的融合使人机沟通更加自然高效,显著优化了用户体验并提升了行车安全。然而,当前研究在深层意图理解、交互决策以及技术产业化方面仍存在差距。展望未来,随着5G、物联网和人工智能技术的持续发展,智能座舱将变得更加智能化和个性化,并与自动驾驶系统深度融合,从根本上重塑驾驶体验。持续创新的人机交互设计测评技术将为这一进程提供保障,推动智能座舱不断突破现有边界,最终为用户提供更安全、便捷、愉悦的驾乘体验。
本文的重要价值与意义在于:首先,它提出了一个具有概括性和指导性的三层交互模型,为智能座舱人机交互研究建立了清晰的理论框架。其次,它对多模态信息交互的关键技术进行了全面、系统的梳理与归纳,涵盖了从感知输入到决策输出的完整链条,并引用了大量最新研究成果,为领域内学者和工程师提供了宝贵的技术参考与发展现状图景。最后,它特别强调了人机交互测评的重要性,并系统分类了测评方法,指出从“以系统为中心”到“以用户及环境适应性为中心”的测评理念转变,对于推动智能座舱从技术可行走向用户体验卓越具有关键的指导作用。整体而言,这篇综述论文不仅是对过去研究成果的总结,更是对未来研究方向和应用挑战的深刻洞察,对推动智能座舱人机交互领域的学术研究和技术应用发展具有重要的参考价值。