基于大语言模型的环境传感器多人活动识别研究:LAHAR框架的突破与应用
作者及机构
本研究的核心团队由Xi Chen(法国Orange Innovation及格勒诺布尔阿尔卑斯大学)、Julien Cumin(Orange Innovation)、Fano Ramparany(Orange Innovation)和Dominique Vouvreydaz(格勒诺布尔阿尔卑斯大学)组成,成果发表于2024年10月的The 30th International Conference on Parallel and Distributed Systems。
研究领域与动机
人类活动识别(Human Activity Recognition, HAR)是智能家居、医疗监护及安全监控的核心技术。传统HAR方法依赖摄像头或可穿戴设备,但存在隐私侵犯或用户体验差的问题。环境传感器(Ambient Sensor)因其非侵入性重新成为研究热点,但其应用面临五大挑战:
1. 数据稀缺:实验环境搭建成本高,个人数据敏感;
2. 模型泛化性差:传感器配置和活动模式差异导致跨场景迁移困难;
3. 上下文整合不足:传感器数据简单,需结合位置、时间等上下文信息;
4. 多人场景复杂性:多用户事件序列混合导致识别困难;
5. 可解释性缺失:传统深度学习模型推理过程不透明。
研究目标
本研究提出LAHAR框架(LLM-powered Ambient HAR),首次利用大语言模型(LLM)解决多人环境下的HAR问题,通过提示工程(Prompt Engineering)实现用户分离和动作级事件描述,提升时间分辨率与可解释性。
LAHAR框架分为三阶段,以ARAS数据集(含两栋真实住宅的30天多用户传感器数据)为验证对象:
<时间, 传感器ID, 状态变化>,剔除高频冗余事件。{"start": ts, "end": te, "event": "sensor on/off", "location": l}),并按时间排序输入LLM。技术亮点
- 分块处理:事件块大小(n=20)和活动块大小(m=15)平衡上下文长度与LLM指令遵循能力;
- GPT-4-32k模型:选用该模型处理长序列,温度参数设为0以减少随机性。
GPT-4系列模型表现显著优于GPT-3.5(图6),后者因长上下文处理能力不足导致事件过度合并。但GPT-4各版本间差异较小,表明LAHAR尚未完全挖掘LLM潜力。
科学价值
- 方法论创新:首次将LLM应用于多人环境HAR,提出“细粒度动作→粗粒度活动”两阶段提示工程框架;
- 可解释性突破:自然语言描述增强推理透明度,助力用户信任与系统个性化。
应用前景
- 智能家居:支持隐私安全的多人活动监控;
- 健康护理:精准识别老年人异常行为(如长时间无活动);
- 未来方向:探索LLM微调、多模态数据融合及对话式解释功能。
局限与改进
- 依赖预训练LLM:需进一步验证开源模型(如LLaMA)的适用性;
- 场景泛化性:需在更多住宅布局中测试框架迁移能力。
(全文约2300字)