分享自:

基于增量热偏好学习的室内空气质量与能源性能耦合模型预测控制:办公室环境实验验证

期刊:SustainabilityDOI:10.3390/su18010240

学术研究报告:一种基于增量热偏好学习的耦合室内空气质量与能源性能的模型预测控制框架在办公环境中的实验验证

一、 研究团队与发表信息

本研究的主要作者包括刘佳莉 (北京工业大学)、黄晓佳 (中国中元国际工程有限公司,通讯作者)、南添晨 (中国中元国际工程有限公司)、刘祎樵 (中国五冶集团有限公司)、高思佳 (北京工业大学)、崔颖 (马来亚大学) 和潘嵩 (北京工业大学)。研究团队由来自中国高校、工程设计公司和马来西亚大学的科研人员与工程师组成,体现了产学研结合的特点。

该研究成果以学术论文的形式,于2025年12月25日在线发表在瑞士学术出版机构MDPI旗下的期刊《Sustainability》(2026年,第18卷,第240期)上。文章标题为“Model Predictive Control for Coupled Indoor Air Quality and Energy Performance Based on Incremental Thermal Preference Learning: Experimental Validation in Office Environments”。

二、 研究背景与目标

本研究属于建筑环境与能源工程、智能建筑控制交叉领域。现代城市居民超过70%的时间在室内度过,室内环境质量,尤其是室内空气质量 (Indoor Air Quality, IAQ),对人类健康与舒适至关重要。同时,建筑能耗中供暖、通风与空调 (Heating, Ventilation and Air Conditioning, HVAC) 系统占据了主要部分。传统的HVAC控制策略往往依赖于预设的时间表和最大占用率假设,未能充分利用实时的人员信息,导致能源浪费与舒适度不足。虽然以人为中心 (Occupant-Centric Control, OCC) 的控制理念旨在平衡个性化舒适度与能源效率,但现有策略通常孤立地优化热舒适或IAQ,鲜有研究将动态学习的热偏好与预测性IAQ约束结合起来,进行舒适、健康与能源性能的联合优化。

因此,本研究旨在解决当前研究的几个关键空白:1) 大多数OCC框架仅关注热舒适或IAQ的单一目标;2) 热偏好学习通常在离线状态下进行,缺乏在线更新机制以捕捉长期偏好漂移;3) 控制设计与实际人员行为脱节,未能充分利用长期现场数据(如启停模式、开窗行为)的洞察。针对这些问题,本研究以北京某办公楼为对象,提出并验证了一个集成的、数据驱动的模型预测控制 (Model Predictive Control, MPC) 框架。该框架的核心目标是实现热舒适、IAQ和能源性能的三目标协同优化,通过增量学习个体热偏好,并结合CO₂预测,在保障室内环境质量的同时,最大化降低HVAC系统能耗。

三、 详细研究流程与方法

本研究是一个包含现场数据采集、行为分析、模型构建、控制器开发与仿验证的系统性工程。其工作流程主要分为以下几个步骤:

1. 现场测量与数据采集: 研究对象为北京一栋办公楼23层的开放式办公室(约80平方米,10人)和会议室(约60平方米,12人)。监测活动持续了整整12个月(2022年11月至2023年10月),覆盖了完整的采暖季和制冷季。采集的数据包括: * 室内外环境参数: 使用普仁PRSENS多参数环境监测传感器和自动气象站,以30分钟为间隔记录室内外温度、相对湿度、室内CO₂浓度以及室外光照强度。传感器技术参数在文中详细列出。 * 人员状态: 使用青萍 (Qingping) 动作与环境光传感器,通过被动红外技术检测运动,以10秒为间隔记录,用于推断空间占用状态。连续无运动超过30分钟则判定为无人。 * 设备状态: 使用青萍门窗开合传感器监测窗户状态(开/关);使用青萍蓝牙温湿度计监测空调送风温度和运行时长。

2. 典型能耗场景与人员行为分析: 研究对收集到的大量运行数据进行了深入分析,以理解实际运行中的低效模式。 * 启停时间分析: 统计分析了空调室内机在冬夏两季每日首次启动和最终关闭的时间分布。结果发现显著的行为惯性:开放式办公室中约85%的空调在冬季上班前启动,其中31%提前超过100分钟;约65%在冬季下班后延迟关闭超过50分钟,约20%甚至整夜运行。会议室的使用则更不规则,空调常在下班后仍持续运行。 * 开窗行为分析: 定义了开窗率(打开窗户数/总窗户数)。数据显示,无论在冬夏,办公时间内开放式办公室的窗户有超过90%的时间处于“半开”(50%开窗率)状态。更关键的是,在超过70%的工作时段内,空调运行与开窗行为同时存在,这种“一边开空调一边开窗”的模式导致了明显的能源浪费。 * 能耗场景聚类分析: 采用K-means聚类算法,结合归一化的空调设定温度、开窗率以及编码后的操作行为(如提前启动、中途激活、整夜未关),对冬夏两季开放式办公室和会议室的典型VRV运行场景进行了分类。例如,冬季开放式办公室被聚为4类场景,揭示了不同的温度设定、启停时间和开窗习惯组合。这些聚类结果作为数据驱动的行为原型,为后续设计监督控制规则和定义MPC的边界条件提供了实证基础。

3. 增量学习热偏好模型开发: 为了捕捉个性化的热舒适需求,研究开发了一个基于增量朴素贝叶斯 (Incremental Naive Bayes) 分类器的热偏好学习模块。 * 数据与标签: 模型利用历史室内外温湿度及送风条件数据作为特征。热偏好标签 (y) 来源于用户通过空调控制面板进行的设定值覆盖操作,分为三类:偏爱更冷 (prefer cooler)、无变化 (no change)、偏爱更暖 (prefer warmer)。 * 模型训练与更新: 使用一整年的现场数据进行初始训练,这对于捕捉季节性偏好漂移、保证模型全年泛化能力至关重要。随后,模型支持在线增量更新,当新的用户覆盖操作发生时,仅需更新类先验概率和似然值,无需在全量历史数据上重新训练,计算轻量。 * 代价矩阵: 为了解决数据中“无变化”类别占绝大多数(超过98%)的类别不平衡问题,并区分不同误分类的严重程度,研究中引入了一个代价矩阵。例如,将“偏爱更冷”误分类为“偏爱更暖”(方向相反)的代价设为最高(4分),而将其误分类为“无变化”的代价设为中等(a=1分)。这迫使模型更加关注对少数但重要的非中性偏好类别的正确识别。 * 输出: 模型最终输出每个测试房间个性化的、季节性的温度偏好区间,作为硬性舒适度约束提供给MPC模块。学习结果显示,开放式办公室冬季偏好区间为[20.4, 26.3]°C,夏季为[24.1, 28.0]°C;会议室冬季为[18.0, 26.6]°C,夏季为[22.2, 28.0]°C。

4. 模型预测控制模块构建: MPC模块是控制框架的核心,负责进行多步预测和滚动优化。 * 预测模型: * 室内温度模型: 采用基于物理先验的灰箱RC(电阻-电容)网络模型来表征室内热动态。为开放式办公室和会议室分别构建了包含外墙、内墙、相邻房间、室外环境、太阳辐射、内部得热和HVAC系统影响的RC网络结构图。 * 室内空气质量模型: 以CO₂浓度作为IAQ指标,建立了基于质量平衡的CO₂动态模型。模型中考虑了人员呼出的CO₂(与人数成正比)和新风稀释作用。 * 参数辨识: 使用遗传算法 (Genetic Algorithm) 对上述两个模型中的未知参数(如热阻、热容、人体CO₂排放速率等)进行辨识。在Python 3.13中实现,设置种群规模600,最大迭代200次。辨识出的参数值均在ASHRAE标准规定的物理合理范围内。 * 控制器设计: * 优化问题: MPC在预测时域 (10小时,40个步长) 内,以最小化HVAC能耗为目标函数,同时施加两组硬约束:1) 室内温度必须在增量学习得到的热偏好区间内;2) 室内CO₂浓度必须低于1000 ppm(依据ASHRAE标准)。优化变量包括温度设定点和新风量。 * 监督规则层: 这是一个重要的补充层,包含三条规则:1) 基于占用状态的HVAC启停控制(无人时关闭);2) 行为感知规则,抑制从聚类分析中识别出的低效模式(如不必要的提前启动、长时间后运行、同时开窗和制冷);3) 手动覆盖优先,确保用户任何时候的手动调整都能立即生效,且相关数据会被记录用于更新热偏好模型。 * 可行性处理: 针对系统启动初期或极端天气下可能出现的优化问题不可行情况,设计了约束松弛策略(如前30分钟放宽温度区间±1°C和CO₂上限至1200 ppm)。

5. 仿真验证与性能评估: 由于直接测量实际能耗存在困难,研究采用Python与EnergyPlus协同仿真的方法来评估控制策略的性能。 * 模型验证: 选取典型冬日和夏日,比较实测室内温度与EnergyPlus仿真结果的逐时平均偏差,结果显示偏差在±10%以内,验证了仿真模型的准确性。 * 基线设置: 设置了基于固定设定点的参考控制策略作为比较基准。基线策略的设定温度源自一年现场测量中用户调整的典型值(开放式办公室:冬季28°C,夏季22°C;会议室:冬季28°C,夏季24°C),并采用固定的运行时间表,代表了传统的规则控制。 * 性能指标: 对比MPC策略与基线策略在维持室内温度在舒适区间、控制CO₂浓度低于1000 ppm以及HVAC能耗三个方面的表现。

四、 主要研究结果

1. 行为分析结果: 现场数据分析清晰揭示了办公建筑中普遍存在的能源管理低效问题。提前启动、延迟关闭、整夜运行以及空调与自然通风同时运行是主要的浪费来源。聚类分析进一步将这些杂乱的行为归纳为有限的几种典型“场景”,量化了不同行为模式对运行参数的影响,为设计有针对性的监督控制规则提供了直接依据。

2. 热偏好学习结果: 增量朴素贝叶斯模型成功地从历史交互数据中学习到了个性化的、随季节变化的温度舒适区间。后验概率密度分布显示,不同热偏好类别对应的室内温度范围确实存在差异,验证了从行为数据中推断舒适边界的可行性。虽然“无变化”类别占主导,但模型通过代价矩阵增强了对“偏爱更冷/暖”这类关键少数类别的敏感性。

3. 控制性能结果: Python-EnergyPlus协同仿真结果表明,所提出的集成MPC框架在各方面均显著优于基线控制策略。 * 热舒适与IAQ保障: 在冬夏两季的仿真中,MPC策略成功地将室内CO₂浓度维持在1000 ppm以下,同时将95%以上的室内温度控制在个性化学习得到的舒适区间内。仅在系统启动初期有短暂的温度越界,随后迅速稳定。 * 节能效果: 与固定设定点的基线策略相比,MPC策略实现了显著的节能: * 开放式办公室: 冬季能耗降低66%,夏季能耗降低56%。 * 会议室: 冬季能耗降低44%,夏季能耗降低57%。 这些节能效果主要归因于MPC能够预测未来负荷,动态调整设定点和新风量,避免不必要的过度冷却/加热,并减少低效运行模式。

4. 鲁棒性验证: 研究还测试了在人员数量估计存在误差(±20%, ±30%, ±50%)时控制器的表现。结果显示,在±20%的估计误差内,系统能通过反馈校正机制维持IAQ达标,能耗惩罚被限制在5%以内,显示了良好的鲁棒性。

这些结果层层递进:行为分析揭示了问题并指导了控制器设计;热偏好学习提供了个性化的舒适约束;MPC在此约束下进行优化,仿真结果最终验证了该集成框架在同时提升舒适度、IAQ和能效方面的有效性和优越性。

五、 研究结论与价值

本研究成功开发并验证了一个集增量热偏好学习、模型预测控制和行为感知监督规则于一体的创新HVAC控制框架。该框架的核心贡献在于突破了现有OCC策略往往单一优化的局限,首次将在线更新的个性化热舒适边界基于CO₂预测的室内空气质量约束在MPC中进行了硬性耦合与协同优化

其科学价值体现在提出了一种可复现的、数据驱动的建筑控制方法学,它将长期现场行为数据分析、机器学习与先进过程控制紧密结合,为真正实现“人-建筑”自适应交互提供了系统性的解决方案。在应用价值上,该框架在不牺牲(甚至提升) occupant 舒适度与健康的前提下,为办公建筑带来了巨大的节能潜力(仿真中节能率达44%-66%),有助于缓解因人员行为不确定性带来的运营低效,支持建筑运营的长期可持续目标。

六、 研究亮点

  1. 三目标协同优化: 首次在MPC框架中将动态学习的个体热舒适、室内空气质量和能源效率作为硬约束和目标进行统一优化,实现了真正的多目标协同控制。
  2. 增量式在线学习: 采用增量朴素贝叶斯分类器,使热偏好模型能够随着用户的新交互而持续在线更新,捕捉长期偏好变化,克服了传统离线学习模型的静态局限性。
  3. 强实证基础与行为融合: 基于长达一年的高粒度现场实测数据,不仅用于模型训练,更通过深入的聚类分析提取典型能耗场景,并将这些行为洞察直接转化为监督控制规则,使控制器设计紧密贴合实际运行工况。
  4. 完整的系统集成与验证: 研究涵盖了从数据采集、行为分析、算法开发到仿真验证的全流程,并通过与代表性基线策略的对比,全面评估了框架在环境控制质量和节能效益上的性能,论证充分。

七、 其他有价值内容

研究在讨论中也坦率指出了当前工作的局限性,并为未来研究指明了方向:1) 案例研究仅限于北京某办公楼的两个VRF系统房间,结论在不同气候区、不同HVAC系统(如混合模式、辐射系统)及多区域异质环境中的普适性有待验证;2) 未来可融入更精确的 occupancy 检测、更丰富的个性化学习、多目标参数整定,并补充使用后主观评估来增强用户中心验证;3) 可探索更具表达力的在线模型和自动特征选择策略;4) 建议将基于时间表的 thermostat 控制和CO₂需求控制通风作为基准策略进行更严格的对比。这些思考体现了研究的严谨性和开放性。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com