分享自:

通过多模态接口在自动驾驶车辆操作驾驶领域中通知接管请求和关键事件的研究

期刊:30th International Conference on Intelligent User Interfaces (IUI '25)DOI:10.1145/3708359.3712126

本文档属于类型a(单篇原创研究论文),以下为学术报告内容:


《Crying Jaywalker! 通过多模态界面在自动驾驶汽车操作域中通知接管请求与关键事件》研究报告

一、作者与发表信息

本文由Filippo Gabriele Pratticò, Lorenzo ValenteFabrizio Lamberti(均来自意大利都灵理工大学自动化与信息工程系)合作完成,发表于 2025年ACM智能用户界面国际会议(IUI ‘25)

二、学术背景

科学领域:本研究属于人机交互(HCI)自动驾驶汽车(Autonomous Vehicles, AVs)的交叉领域,聚焦SAE Level 3(L3)条件自动化驾驶下的驾驶接管请求(Take-Over Request, TOR)与关键事件(如行人闯红灯)的通知机制设计。
研究动机:L3自动驾驶允许驾驶员执行非驾驶相关任务(Non-Driving Related Tasks, NDRTs),但需在系统提示时接管车辆。现有研究多关注TOR通知,但对车辆自主处理的关键事件(如紧急制动)的同步通知缺乏探索。两者共存可能导致驾驶员混淆或反应延迟,威胁安全性。
研究目标:评估不同模态(视觉、听觉、多模态)在关键事件通知中的效果,探究其对TOR清晰度、紧急度感知的影响。

三、实验流程与方法

研究通过虚拟现实(VR)驾驶模拟器完成,分为以下步骤:

  1. 实验设计

    • 五种通知条件
      1. 基线(B):无关键事件通知;
      2. 视觉(V):使用增强现实挡风玻璃显示(AR-WSD)的3D边界框高亮行人;
      3. 听觉(S):语音提示(“Braking! Jaywalker detected”);
      4. 视觉+语音(VS):V与S结合;
      5. 视觉+抽象音效(VA):V结合非语音提示音。
    • TOR设计:统一采用多模态(视觉进度条+语音+抽象音效)通知,模拟系统故障或超出运行域(ODD)的场景。
  2. 模拟系统开发

    • 硬件:HTC Vive Pro头显、六自由度运动平台(Atomic A3)、力反馈方向盘(Fanatec Clubsport)。
    • 软件:基于Unity引擎开发,集成虚拟城市场景“Windridge City”,优化帧率至90fps以减少晕动症。
    • NDRT任务:驾驶员观看TEDx演讲视频(占用视觉与听觉通道),系统在关键事件触发时暂停或降低视频音量。
  3. 用户实验

    • 被试:24名持驾照≥3年的意大利母语者(男女比例15:9,平均年龄27.5岁)。
    • 流程
      1. 熟悉阶段:5分钟无事件驾驶;
      2. 正式实验:拉丁方顺序平衡五种条件,每次驾驶约20分钟,包含3次TOR和4次行人事件;
      3. 数据收集:每次驾驶后填写问卷,评估信任度(7项Likert量表)、用户体验(UEQ+量表)、通知适当性(紧急度、清晰度等)。
  4. 数据分析

    • 统计方法:Friedman检验(非参数)与Wilcoxon事后检验,效应量采用Cohen’s d。
    • 交互作用分析:通过双因素ANOVA检验关键事件与TOR通知的感知关联性。

四、主要结果

  1. 信任度

    • VS条件显著提升整体信任(p=0.017, d=0.44)和系统可预测性(p=0.047, d=0.37),归因于“语音+视觉”的双通道信息强化。
  2. 关键事件通知效果

    • 清晰度:VS最佳(p<0.001, d=4.3),显著优于单模态(如V的d=2.15)。语音解释(“what+why”)提升理解。
    • 紧急度:VS与VA最高(p<0.001),但VA伴随更高厌烦度(p=0.016, d=0.67),因抽象音效可能干扰NDRT。
  3. 对TOR的间接影响

    • 紧急度感知:VS条件下TOR的紧急度评分降低(p=0.01, d=0.44),表明多模态关键事件通知可能削弱TOR的优先级感知。
  4. 用户偏好

    • 综合排名:VS > S ≈ VA > V > B(p<0.001),但部分用户因VA的厌烦感倾向S(纯语音)。

五、结论与价值

  • 科学价值
    1. 验证了多模态界面(VS)在L3自动驾驶中平衡信息清晰度与紧急度的优势;
    2. 揭示了关键事件与TOR通知的竞争性关系,为HMI设计提供冲突管理依据。
  • 应用价值
    1. 建议车辆HMI采用“AR视觉+简洁语音”的复合通知,避免抽象音效;
    2. 需优化TOR的紧急感设计以抵消关键事件的干扰。

六、创新点

  1. 首次系统评估关键事件与TOR通知的共存效应,填补了L3自动驾驶HMI的研究空白;
  2. 高保真VR模拟系统:整合运动平台与空间音频,提升了生态效度;
  3. 动态交互分析:通过双因素ANOVA揭示通知模态间的优先级竞争机制。

七、局限与展望

  1. 局限性:未测试手持设备NDRT场景,且实验依赖模拟环境;
  2. 未来方向:探索触觉反馈、更复杂事件类型(如多车交互),并在实车中验证效果。

本报告基于原文内容提炼,未添加个人观点。如需进一步细节(如统计表格或实验场景截图),可参考原文 supplementary materials。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com