分享自:

基于特征选择的自适应传感器部署用于室内热舒适性预测

期刊:Building and EnvironmentDOI:10.1016/j.buildenv.2026.114510

本研究由来自美国新泽西理工学院(Mohammad Saleh Nikoopayan Tak, Zijian Zhu, Yanxiao Feng)和宾夕法尼亚州立大学(Julian Wang, Neda Ghaeili Ardabili)的研究团队完成,其成果于2026年发表在建筑环境领域知名期刊《Building and Environment》上。

这是一项旨在通过数据驱动方法优化室内热舒适预测传感器部署策略的原创性研究。研究隶属于智能建筑、室内环境质量与建筑能源管理交叉领域。当前,基于机器学习的数据驱动模型在预测热舒适方面取得了显著进展,但这些模型的洞察很少被转化为优化的传感器部署策略,而后者直接关系到室内数据测量的质量。传统的“一刀切”式物理模型(如PMV)以及多数仅聚焦于预测准确性的机器学习研究,均未能有效解决如何根据情境动态配置传感器以平衡成本、覆盖面和预测可靠性的问题。同时,大规模的公开热舒适数据库(如ASHRAE Global Thermal Comfort Database II)为深入分析特征重要性提供了可能,但将其洞察转化为可操作的传感器部署指南的研究仍属空白。因此,本研究旨在填补这一“从预测到部署”的鸿沟,提出一个集成特征分析与配置优化的框架,将机器学习模型的解释性结果直接转化为物理传感器部署蓝图和自适应运行逻辑,以指导构建节能、以人为本、情境感知的传感网络。

本研究的工作流程系统而严谨,可分为五个主要环节:数据准备与预处理、预测模型开发与特征解释、传感器配置优化分析、季节性特征转移分析以及空间可迁移性验证。

第一环节是数据准备与预处理。研究数据来源于包含超过10万条记录的ASHRAE Global Thermal Comfort Database II。为了进行传感器定位优化,研究进行了严格筛选:首先,选择了一组聚焦的预测变量(包括环境参数如不同高度的空气温度、速度,以及人员参数如代谢率、衣物热阻等);其次,为确保分析完整性,仅保留了所有关注变量均无缺失值的观测样本;最后,将热感觉投票(TSV)的响应变量限定为-3到+3的整数,从而将其构建为一个分类任务。经过此严格筛选,最终的建模数据集包含了约1900条来自美洲和大洋洲空调办公室环境的观测数据。这一数据缩减并非随机,而是聚焦于那些配备了能捕获垂直热梯度(如头、腰、踝部温湿度)和详细代谢历史(如过去10、20、30、60分钟活动)的高密度仪器的高质量研究。预处理还包括通过相关性热图和方差膨胀因子(VIF)分析处理多重共线性。研究识别出多个高度相关的变量组(如不同高度的温度、不同高度的风速、不同时间段的短期代谢率),并确立了后续分析的策略:在构建基础解释模型时,每组选择一个代表性变量(如通用空气温度ta、头部高度风速vel_h、10分钟活动activity_10);在进行传感器配置优化搜索时,则系统地测试每组内不同变量组合的预测效能,以确定最优搭配。

第二环节是预测模型开发与特征解释。研究采用XGBoost算法构建热感觉分类预测模型。在约1900条数据上,按7:3比例划分训练集和测试集,并通过10折交叉验证和随机搜索进行超参数调优。最终模型在测试集上达到了84.51%的准确率,科恩卡帕系数为0.795,表明其具有良好的预测性能。研究的核心创新在于超越简单的特征重要性排名,深入进行特征解释。研究采用了SHAP(Shapley Additive Explanations)分析方法,以量化每个特征对单个预测的贡献,并揭示特征间的条件依赖关系。首先,通过特征重要性(Gain)分析确认了空气温度(ta)、相对湿度(rh)和头部高度风速(vel_h)等环境变量是主要预测因子。其次,通过SHAP依赖图揭示了关键的非单调和交互效应:1) 空气速度的冷却效应在低至中等速度(0.1-0.2 m/s)时达到峰值,随后减弱,这可能是由于在实际观测中,更高的风速往往与更热的触发条件相关联;2) 相对湿度的冷却效应(低湿度带来凉爽感)在中等凉爽温度(22-24°C)下最为显著,而在更热条件下减弱。此外,消融分析(Ablation Analysis)表明,保留六个核心变量(ta, vel_h, rh, clo, age, met)即可保持模型较高的准确率和较低的损失,而室外参数和性别等特征贡献相对次要。

第三环节是传感器配置优化分析。这是将特征洞察转化为具体部署方案的关键步骤。研究将问题形式化为一个受约束的特征选择问题。基于预处理中识别的三个相关变量组:温度组(6个候选:ta, ta_h, ta_m, ta_l, top, tr)、风速组(4个候选:vel, vel_h, vel_m, vel_l)和短期代谢组(4个候选:activity_10/20/30/60)。对于这96种可能的组合(每组选一个变量),在固定其他7个背景变量(如年龄、rhclo等)的情况下,分别训练XGBoost模型并评估其准确率。该过程重复10次以验证鲁棒性。主要结果发现了两类高性能的传感器“三元组”:1) 在50%的试验中,最优组合为通用空气温度(ta)+ 头部高度风速(vel_h)+ 10分钟代谢率(activity_10);2) 在40%的试验中,最优组合为操作温度(top)+ 低处风速(vel_l)+ 10分钟代谢率(activity_10)。这为物理部署提供了直接蓝图:当使用ta作为主要温度指标时,应搭配头部高度的风速传感器;当使用top(综合了辐射影响)时,搭配低处风速传感器效果更佳。同时,短期代谢活动(activity_10)被一致证明是最具预测力的代谢指标。

第四环节是季节性特征转移分析。为了验证特征重要性的情境依赖性,研究按季节(夏、冬、热/湿、凉/干)计算了各特征的平均绝对SHAP值。结果揭示了显著的特征层次动态变化:在夏季,短期代谢活动(activity_10)超越空气温度成为最重要的预测因子,表明在高温高冷负荷下,瞬时代谢波动对热感觉的影响比微小的室温调整更大。在冬季,空气温度重回首位,但activity_10仍位居第二。而在过渡季节(凉/干和热/湿),衣物热阻(clo)成为仅次于温度的第二重要因素,表明这些季节的舒适度更多由居住者的被动适应行为(增减衣物)决定。这一发现为自适应传感策略提供了核心依据:传感重点应随季节变化,极端季节需优先监测人员活动,过渡季节则应更关注行为适应。

第五环节是空间可迁移性验证。为了评估所提传感器框架的普适性,研究进行了“留一城市出”交叉验证。将数据按地理气候分为蒙特利尔(冷/温带)、汤斯维尔(热/湿)和卡尔古利(热/干)三组。使用之前确定的高性能传感器组合(ta, rh, vel_h及固定背景变量)进行训练和测试。结果表明,模型在预测未见过城市的样本时,加权平均准确率仍达到83.6%,即使是在用仅包含澳大利亚城市的数据训练去预测加拿大蒙特利尔冬季场景的挑战下,准确率也维持在81.42%。这证明了所选环境特征捕捉了热舒适的普适性物理驱动因素,而非站点特定的统计相关性。

本研究的主要结论是,成功建立了一个将数据驱动的特征优化与自适应传感器部署直接联系起来的框架。该框架不仅识别了“部署哪些传感器”(如top+vel_l+activity_10的最佳组合),还通过SHAP分析揭示了“何时以及为何这些传感器重要”(如季节性的特征层次转移、空气速度的非单调效应)。这为实现智能建筑系统中节能、以人为中心、情境感知的传感网络提供了方法论和具体指导。其科学价值在于将机器学习可解释性研究从静态的重要性排名推进到动态的、情境依赖的规则生成,推动了智能建筑设计从数据密集型预测向数据智能型操作的范式转变。应用价值则体现在为楼宇管理系统(BMS)提供了可操作的自适应控制逻辑蓝图(例如,夏季优先基于活动预冷,冬季结合活动调整供暖,过渡季节放宽控制死区以允许衣物适应),并提出了分层次的工程实施策略,帮助管理者在预测性能提升与实施复杂性之间做出最优权衡。

本研究的亮点可概括为:1) 核心创新:首次系统地将特征选择分析与物理传感器部署决策及自适应激活逻辑相链接,填补了从预测模型到实际操作的关键空白。2) 方法论突破:深入运用SHAP分析,超越了静态特征排名,揭示了特征间复杂的条件依赖关系和季节性动态变化,为生成上下文感知规则奠定了基础。3) 具体产出明确:不仅提供了理论框架,还输出了具体的“传感器三元组”最优配置建议、季节性的特征优先级列表以及可直接集成到BMS的自适应控制逻辑建议(如基于条件触发权重调整)。4) 实用导向:进行了详尽的传感器配置搜索和复杂度-性能权衡分析,为实际工程部署(如新建或改造项目中传感器的选型与布置)提供了数据驱动的决策支持,强调了在有限预算下优先部署高边际效益传感器(如风速传感器)的策略。5) 验证充分:通过严格的留一城市出交叉验证,初步证明了所提传感器框架在不同气候区域间的可迁移性,增强了其普适性价值。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com