关于《座席移動を伴う個人差空調システムに関する研究:制御ロジックが執務者の満足度に与える影響》的学术研究报告
本研究由日本东京大学的神谷洋介、谷口景一朗、村上弘晃、赤司泰義教授团队,与ダイキン工業株式会社 (Daikin Industries, Ltd.) 的佐藤大輔、松井伸樹共同完成。论文《Proposal of a human-centric air conditioning system with seat changes : comparative evaluation of satisfaction based on control logic variations》于 2025年12月 发表在《日本建築学会環境系論文集》(Journal of Environmental Engineering, AII, Vol. 90, No. 838)上,是该领域内一项具有创新性和实用价值的研究成果。
一、 学术背景与动机
本研究的核心科学领域为建筑环境与设备工程,特别是室内热舒适(Thermal Comfort)与个性化环境控制。传统空调系统的一大挑战是难以应对个人热舒适偏好的显著差异。尽管标准如PMV-PPD(预测平均投票-预测不满意百分比)模型提供了理论指导,但现实中办公室内对同一热环境(如26℃)仍有高达30%的用户感到不满。这源于两个主要原因:一是个人生理与心理偏好差异巨大;二是即使系统追求均匀送风,由于空调出风口、室内布局(如家具、周边设备等“インテリア・ペリメータ”)的影响,室内实际温度与照度分布不均,导致提供给用户的局部环境与其期望不符。另一方面,个人空调(Personal Air Conditioning)虽被证明有效,但因需要在每个工位安装设备,存在初始成本高昂的难题。
与此同时,新型工作方式如“フリーアドレス”(自由工位)或“ABW (Activity-Based Working)”日益普及。在这种模式下,员工可以根据任务和心情自由选择工作位置和时间。理论上,通过主动的“座席移動”(工位移动),员工可以寻找到更适合自己热偏好的微环境,从而提升舒适度。然而,工位移动本身会给员工带来负担,且在自由选择和ABW模式下,除了热环境,照明、噪音、家具设计、个人隐私等多种定性因素同样影响选择意愿。因此,理想的系统需要既能匹配个性化热偏好,又能最小化用户负担,并综合考虑其他环境与非环境因素。
基于以上背景,本研究旨在提出并验证一种创新型的人本中心空调系统。该系统巧妙地将“座席レコメンド”(工位推荐)与“空調フィードバック”(空调反馈控制)相结合。当用户报告“热”或“冷”时,系统可选择:a) 工位推荐:推荐一个更符合其当前热偏好(例如更凉爽或更温暖)的工位,引导其移动,从而在不改变整体温度分布的前提下改善其局部环境。b) 空调反馈控制:调整用户所在区域最近空调机的设定温度,直接改变其周围的热环境。前者无需改变全局温度场,但需要用户移动;后者用户无需移动,但可能影响同一空调区域内的其他用户。本研究的核心目标是探索如何最优地组合这两种控制手段,并综合考虑移动负担、动态热特性及非热因素,最终最大化用户的“総合満足度”(综合满意度)。
二、 研究详细流程
本研究采用了实验与模拟仿真相互验证、逐步深入的复合研究流程,共包含四个主要阶段,系统性地解决了从基础规律探索到高级算法验证的一系列问题。
第一阶段:工位移动特性与“综合满意度”阈值的基础实验
第二阶段:集成大语言模型(LLM, Large Language Model)的工位推荐系统验证实验
第三阶段:基于规则的控制逻辑多智能体仿真(MAS, Multi-Agent Simulation)验证
rcm-t/rcm-e:优先推荐,但仅当存在温度差/环境差异达标的工位时才推荐,否则转为空调反馈,旨在避免无效移动。hybrid系列:根据不满程度(如“非常热” vs “有点热”)决定操作,旨在减少不必要的移动。conf:当同一空调区域内短时间内出现相反诉求(如一人报热一人报冷)时,启动工位推荐,让偏好不同的人物理分离。temp-lim:为各区设置温度上下限,当空调反馈导致某区温度趋于均质化(触及限值)时,改为工位推荐,旨在主动维持必要的温度差异(温度むら)。temp-resp:核心是考虑热环境的动态特性。当一次空调反馈操作后,用户周边温度在15分钟内变化不足(<0.1℃),则判定该位置“响应迟缓”,后续对该用户的申诉转为工位推荐,避免用户困在无效反馈中。第四阶段:高级算法(DRL与LLM)控制逻辑的仿真验证
zero-shot(仅根据当前状态决策)和三种few-shot模型(分别在提示词中加入过去1天、1周、1个月的“案例研究”历史数据作为参考,并让LLM对自身决策进行事后评估以生成新案例)。LLM的提示词要求其基于当前全室状态,推理比较“执行空调反馈”和“执行工位推荐”两种操作在未来几十分钟的可能后果,然后选择更优操作。temp-resp、conf)在平均综合满意率和平均工位移动次数上的差异。三、 主要研究结果
第一阶段结果:成功量化了工位移动获得满意度的关键阈值。SVM分析表明,当移动前后的温度差达到1.3℃以上,或照度差达到160勒克斯(lx)以上,或两者的复合效应达到等效水平时,用户对此次移动感到“满意”的可能性显著提高(图7)。这为后续仿真中智能体的“满意度”判定提供了客观、数据驱动的标准。
第二阶段结果:在考虑定性因素的工位推荐中,集成LLM的系统相较于随机推荐系统,显著提升了用户对“光环境舒适性”的评价(图11)。自由描述分析证实,眩光(Glare)是常见不满因素。这表明LLM能够有效利用用户的文本反馈,理解并规避诸如“下午西晒刺眼”等传感器难以直接量化的问题,从而做出更优推荐。然而,在热环境舒适性、声环境舒适性和综合满意度上,LLM的加入并未显示出统计学上的显著优势。分析认为,这可能是因为热、声环境动态变化快,而实验收集的每个工位的描述性数据(平均仅6.2条)尚不足以让LLM充分捕捉其动态特性。
第三阶段仿真结果:揭示了不同控制逻辑的效能差异及其内在原因。 1. 热舒适率:单纯空调反馈(fb)或混合逻辑(hybrid)虽然减少了移动,但容易导致室内温度分布“平坦化”,无法同时满足喜热和喜冷的用户,因此热舒适率提升有限。而能主动维持温度差异的逻辑(如conf, temp-lim, temp-resp)和纯工位推荐逻辑(rcm)能保持较高的热舒适率。 2. 综合满意率:纯工位推荐逻辑(rcm)虽然热舒适率高,但由于频繁移动且部分移动不满足“满意度阈值”,导致用户对移动本身不满,综合满意率反而较低。关键发现是:同时实现“维持温度差异”和“抑制不必要工位移动”的逻辑,才能获得最高的综合满意率。其中,temp-resp逻辑表现突出,因为它不仅考虑了维持温度差异(通过temp-lim思想),还创新性地引入了对热环境动态响应特性的考量,避免用户滞留于空调响应缓慢的“死区”,从而在仿真中实现了较高的综合满意率(图15)。
第四阶段高级算法结果: 1. DRL表现最佳:经过训练的DRL控制器实现了86.9%的平均综合满意率,相较于定常运行(无干预)提升了35%,且优于所有测试的规则逻辑和LLM逻辑(表7)。这表明,在拥有准确环境模型和充足训练的情况下,DRL能够自动学习到超越人工设计规则的、考虑长期收益的复杂控制策略。 2. LLM在仿真中的表现:LLM-based控制器(最佳版本few-shot(1周))也将综合满意率提升至83.3%(较定常运行提升31%),证明了其在缺乏历史数据(zero-shot)或仅有少量数据时仍能有效决策的能力。然而,few-shot模型并未像预期那样显著优于zero-shot模型,且随着“学习”时间跨度增加,其决策反而更倾向于工位推荐(移动次数增加)。分析指出,这可能是由于提示词长度膨胀导致推理质量下降,以及在总结历史案例时丢失了空调反馈的动态特性信息。这揭示了LLM在把握潜在定量变量方面可能存在局限。
四、 研究结论与价值
本研究系统性地提出并验证了一种结合工位推荐与空调反馈的人本中心个性化空调系统。主要结论如下: 1. 阈值确立:明确了工位移动带来满意感所需的最小环境改善阈值(温度差1.3℃/照度差160lx),为系统设计提供了关键参数。 2. 控制原则:成功的控制逻辑需协同优化多个目标:维持室内有益的温度差异、最小化用户不满意的工位移动次数、并考虑座席点热环境的动态响应特性。单纯的推荐或反馈,或简单的混合策略均非最优。 3. 算法效能:在数据与模型允许的情况下,基于深度强化学习(DRL)的控制逻辑能实现最高的综合满意度提升(+35%),展现出自主学习和优化复杂序列决策的强大能力。 4. LLM的角色:大语言模型(LLM)在整合难以量化的定性因素(如用户主观偏好、眩光问题)方面具有独特优势,即使在数据较少的情况下也能显著提升系统性能(+31%),特别适用于光环境等定性因素主导的优化。但其在精确处理定量动态过程方面需与其它技术结合。
该研究的科学价值在于,首次在一个统一框架内,通过实验与仿真相结合的方式,量化了工位移动的满意度机制,并全面对比评估了从规则基础到人工智能(DRL, LLM)等多种控制范式的效能,揭示了各自适用的场景与优势。其应用价值巨大,为未来智能办公环境,尤其是ABW和自由工位型办公室的空调系统设计提供了全新的技术路径和具体的工程指导。系统无需在每个工位安装昂贵的个人空调设备,通过巧妙利用现有空调系统和工位流动性,以较低的改造成本实现了个性化热舒适的提升。
五、 研究亮点
temp-resp逻辑及DRL的学习过程,都体现了对建筑热惰性和空调系统响应延迟这一重要动态特性的关注,使控制系统更贴近物理现实。六、 其他有价值内容
研究最后对三类控制逻辑(规则基础、DRL基础、LLM基础)的特性进行了对比总结(表8),并指出了未来研究方向:增加样本量以探究辐射温度、季节热历史等其他因素与综合满意度的关系;探索对LLM进行微调以更好地理解定量因素;开发融合三类逻辑优势的混合控制系统;将系统扩展到多空调协同控制、风速风向调节等更复杂的场景,以增强其实用性和普适性。