基于座位推荐与空调反馈的以人为本空调系统：控制逻辑对员工满意度的影响研究

分享自：
基于座位推荐与空调反馈的以人为本空调系统：控制逻辑对员工满意度的影响研究

建筑与土木工程
工程学
期刊:日本建築学会環境系論文集DOI:https://doi.org/10.3130/aije.90.617
【点击此处】阅读全文、收藏及针对性提问
关于《座席移動を伴う個人差空調システムに関する研究：制御ロジックが執務者の満足度に与える影響》的学术研究报告
本研究由日本东京大学的神谷洋介、谷口景一朗、村上弘晃、赤司泰義教授团队，与ダイキン工業株式会社 (Daikin Industries, Ltd.) 的佐藤大輔、松井伸樹共同完成。论文《Proposal of a human-centric air conditioning system with seat changes : comparative evaluation of satisfaction based on control logic variations》于 2025年12月 发表在《日本建築学会環境系論文集》（Journal of Environmental Engineering, AII, Vol. 90, No. 838）上，是该领域内一项具有创新性和实用价值的研究成果。
一、 学术背景与动机
本研究的核心科学领域为建筑环境与设备工程，特别是室内热舒适（Thermal Comfort）与个性化环境控制。传统空调系统的一大挑战是难以应对个人热舒适偏好的显著差异。尽管标准如PMV-PPD（预测平均投票-预测不满意百分比）模型提供了理论指导，但现实中办公室内对同一热环境（如26℃）仍有高达30%的用户感到不满。这源于两个主要原因：一是个人生理与心理偏好差异巨大；二是即使系统追求均匀送风，由于空调出风口、室内布局（如家具、周边设备等“インテリア・ペリメータ”）的影响，室内实际温度与照度分布不均，导致提供给用户的局部环境与其期望不符。另一方面，个人空调（Personal Air Conditioning）虽被证明有效，但因需要在每个工位安装设备，存在初始成本高昂的难题。
与此同时，新型工作方式如“フリーアドレス”（自由工位）或“ABW (Activity-Based Working)”日益普及。在这种模式下，员工可以根据任务和心情自由选择工作位置和时间。理论上，通过主动的“座席移動”（工位移动），员工可以寻找到更适合自己热偏好的微环境，从而提升舒适度。然而，工位移动本身会给员工带来负担，且在自由选择和ABW模式下，除了热环境，照明、噪音、家具设计、个人隐私等多种定性因素同样影响选择意愿。因此，理想的系统需要既能匹配个性化热偏好，又能最小化用户负担，并综合考虑其他环境与非环境因素。
基于以上背景，本研究旨在提出并验证一种创新型的人本中心空调系统。该系统巧妙地将“座席レコメンド”（工位推荐）与“空調フィードバック”（空调反馈控制）相结合。当用户报告“热”或“冷”时，系统可选择：a) 工位推荐：推荐一个更符合其当前热偏好（例如更凉爽或更温暖）的工位，引导其移动，从而在不改变整体温度分布的前提下改善其局部环境。b) 空调反馈控制：调整用户所在区域最近空调机的设定温度，直接改变其周围的热环境。前者无需改变全局温度场，但需要用户移动；后者用户无需移动，但可能影响同一空调区域内的其他用户。本研究的核心目标是探索如何最优地组合这两种控制手段，并综合考虑移动负担、动态热特性及非热因素，最终最大化用户的“総合満足度”（综合满意度）。
二、 研究详细流程
本研究采用了实验与模拟仿真相互验证、逐步深入的复合研究流程，共包含四个主要阶段，系统性地解决了从基础规律探索到高级算法验证的一系列问题。
第一阶段：工位移动特性与“综合满意度”阈值的基础实验
研究对象与方法：此阶段为预实验，旨在探明何种条件下进行工位移动能让用户感到满意，从而为后续仿真中的“满意度”判定提供定量依据。研究在大学校园内一间124.44平方米的ABW风格房间内进行。房间被部署了密集的传感器网络，包括11个壁面传感器、24个工位传感器（分为A、B两类），用于实时监测温度、湿度、照度和CO2浓度，并使用UWB（Ultra Wide Band）传感器追踪人员位置。13名工学部学生（男11，女2，年龄22-25岁）作为被试用在日常使用该空间。
实验流程：开发了一款平板电脑应用程序，当用户感到“热”、“冷”、“暗”或“眩目”时，可通过应用报告，系统则会根据当前传感器数据推荐一个可能改善该问题的空闲工位。用户可以选择是否移动。每次移动后，需立即填写问卷，使用7级李克特量表（Likert Scale）评价移动后的“综合满意度”。实验期间，为创造必要的环境梯度（便于测试移动效果），空调被设定为维持室内温度差异的模式（最冷区22℃，最暖区26℃）。
数据分析：研究者将问卷回答中“5:稍微满意”至“7:非常满意”归类为“满意”，其余为“不满意”。然后，分析了移动前后温度差、照度差与“满意/不满意”结果之间的关系。关键分析方法采用了支持向量机（SVM, Support Vector Machine） 进行分类，以找出能可靠预测“满意”的环境差异阈值。SVM的超参数通过网格搜索（Grid Search） 进行优化以获得最高准确率。
本阶段使用的特殊方法/设备： 异构传感器融合系统：集成了多种商用传感器（温湿度、CO2、照度）和UWB人员定位系统，所有数据统一格式后在本地服务器汇聚，避免了依赖外部云服务，提高了系统可靠性和隐私性。
实时应用程序：开发了连接传感器、空调与用户的交互式平板应用，模拟了真实系统的运作流程。
机器学习分类：使用SVM这一监督学习算法，从实验数据中自动提取关键阈值，而非仅凭统计平均值或主观假设。
第二阶段：集成大语言模型（LLM, Large Language Model）的工位推荐系统验证实验
研究对象与方法：此阶段旨在验证LLM在考虑难以量化（定性）的工位选择因素（如对眩光、桌面布局、个人喜好的主观描述）方面的有效性。参与者为18名工学部学生（男13，女5，年龄22-26岁）。实验在相同物理环境下进行，但引入了LLM（使用GPT-4o模型）。
实验流程：首先，收集了被试对不同工位的自由描述反馈（如“这个位置下午阳光刺眼”、“喜欢靠窗安静”等）。这些文本被输入GPT-4o进行摘要提炼，生成每个用户和每个工位的特征摘要（定性概要）。在后续实验中，比较了两种系统：1) 无LLM系统：当用户报告不舒适时，仅从满足基本热/光条件（如“更凉爽的座位”）的工位中随机推荐一个。2) 有LLM系统：将当前用户的不满内容、其个人偏好摘要、各候选工位的特征摘要，甚至房间平面图信息，通过精心设计的提示词工程（Prompt Engineering） 输入GPT-4o。提示词遵循 “思维链（Chain-of-Thought）” 方式，要求模型逐步推理，最终输出一个最优推荐工位及其理由。
数据分析：比较两组实验中用户移动后对热环境、光环境、声环境舒适性及综合满意度的评分差异，并进行显著性检验。同时，分析自由描述反馈中的常见不满因素。
本阶段使用的特殊方法： LLM与物理系统的集成：创新性地将通用大语言模型GPT-4o作为决策模块，处理传感器无法直接获取的定性信息（用户偏好、工位主观特点），实现了基于自然语言理解的个性化推荐。
结构化提示词设计：采用CoT等高级提示技术，引导LLM进行符合逻辑的环境推理和决策，而非简单的内容生成。
第三阶段：基于规则的控制逻辑多智能体仿真（MAS, Multi-Agent Simulation）验证
研究目的：在可控的仿真环境中，大规模、系统性地比较不同“工位推荐”与“空调反馈”组合策略（即“控制逻辑”）对综合满意度的影响。目标是找出有效的设计原则。
仿真环境构建：基于第一阶段实验环境，构建了一个高保真的多智能体仿真环境。 环境模型：照度分布和外气温度直接使用实测数据。温度分布模型通过一个四区（对应四台空调）的线性动态方程（公式1）来模拟，该方程考虑了各区温度、外气温、空调输入热量（根据设定温度计算）和人员数量（产热），并通过非线性最小二乘法拟合了实验数据，时间步长为1分钟。
智能体（Agent）模型：模拟了9个具有不同热、光偏好的用户（智能体）。每个智能体拥有独特的温度/照度阈值（基于实验数据计算），用于判断“热”、“冷”、“舒适”等状态。它们的行为逻辑（图13）包括：每隔15分钟根据周边环境更新状态，若感到不舒适则向系统“报告”；收到系统指令后，若为工位推荐则立即移动。移动是否“满意”则严格依据第一阶段实验发现的阈值（图7）判定：只有当前后环境差异（温度差≥1.3℃ 或 照度差≥160lx）达标，且移动后状态处于“舒适”区间，才被判定为“综合满意”。
仿真流程与逻辑设计：设计了14种不同的规则控制逻辑进行比较（表4），从简单的“只进行空调反馈（fb）”或“只进行工位推荐（rcm）”，到复杂的复合逻辑。例如： rcm-t/rcm-e：优先推荐，但仅当存在温度差/环境差异达标的工位时才推荐，否则转为空调反馈，旨在避免无效移动。
hybrid系列：根据不满程度（如“非常热” vs “有点热”）决定操作，旨在减少不必要的移动。
conf：当同一空调区域内短时间内出现相反诉求（如一人报热一人报冷）时，启动工位推荐，让偏好不同的人物理分离。
temp-lim：为各区设置温度上下限，当空调反馈导致某区温度趋于均质化（触及限值）时，改为工位推荐，旨在主动维持必要的温度差异（温度むら）。
temp-resp：核心是考虑热环境的动态特性。当一次空调反馈操作后，用户周边温度在15分钟内变化不足（<0.1℃），则判定该位置“响应迟缓”，后续对该用户的申诉转为工位推荐，避免用户困在无效反馈中。
数据分析：每种逻辑运行10次仿真（随机种子不同），计算两个核心指标：“热舒适率”（处于热舒适状态的时间比例）和 “综合满意率”（处于“综合满意”状态的时间比例）。
第四阶段：高级算法（DRL与LLM）控制逻辑的仿真验证
研究目的：鉴于规则逻辑设计复杂且难以覆盖所有情况，本阶段探索利用机器学习自动学习最优控制策略。
仿真方法： DRL（深度强化学习，Deep Reinforcement Learning）方法：采用PPO（近端策略优化，Proximal Policy Optimization） 算法。状态空间包括工位占用情况、各点温度、用户申诉信息等；动作空间是为申诉者选择一个新工位编号或执行空调反馈（动作0）；奖励是每日结束时的综合满意率（为避免初期学习陷入局部最优，初期额外给予基于满意/不满意人数差的中间奖励）。模型在仿真环境中训练50万回合。
LLM-based 方法：将GPT-4o作为核心控制器接入仿真环境。设计了四种模式：zero-shot（仅根据当前状态决策）和三种few-shot模型（分别在提示词中加入过去1天、1周、1个月的“案例研究”历史数据作为参考，并让LLM对自身决策进行事后评估以生成新案例）。LLM的提示词要求其基于当前全室状态，推理比较“执行空调反馈”和“执行工位推荐”两种操作在未来几十分钟的可能后果，然后选择更优操作。
数据分析：比较DRL、LLM各版本与之前表现优秀的规则逻辑（如temp-resp、conf）在平均综合满意率和平均工位移动次数上的差异。
三、 主要研究结果
第一阶段结果：成功量化了工位移动获得满意度的关键阈值。SVM分析表明，当移动前后的温度差达到1.3℃以上，或照度差达到160勒克斯（lx）以上，或两者的复合效应达到等效水平时，用户对此次移动感到“满意”的可能性显著提高（图7）。这为后续仿真中智能体的“满意度”判定提供了客观、数据驱动的标准。
第二阶段结果：在考虑定性因素的工位推荐中，集成LLM的系统相较于随机推荐系统，显著提升了用户对“光环境舒适性”的评价（图11）。自由描述分析证实，眩光（Glare）是常见不满因素。这表明LLM能够有效利用用户的文本反馈，理解并规避诸如“下午西晒刺眼”等传感器难以直接量化的问题，从而做出更优推荐。然而，在热环境舒适性、声环境舒适性和综合满意度上，LLM的加入并未显示出统计学上的显著优势。分析认为，这可能是因为热、声环境动态变化快，而实验收集的每个工位的描述性数据（平均仅6.2条）尚不足以让LLM充分捕捉其动态特性。
第三阶段仿真结果：揭示了不同控制逻辑的效能差异及其内在原因。 1. 热舒适率：单纯空调反馈（fb）或混合逻辑（hybrid）虽然减少了移动，但容易导致室内温度分布“平坦化”，无法同时满足喜热和喜冷的用户，因此热舒适率提升有限。而能主动维持温度差异的逻辑（如conf, temp-lim, temp-resp）和纯工位推荐逻辑（rcm）能保持较高的热舒适率。 2. 综合满意率：纯工位推荐逻辑（rcm）虽然热舒适率高，但由于频繁移动且部分移动不满足“满意度阈值”，导致用户对移动本身不满，综合满意率反而较低。关键发现是：同时实现“维持温度差异”和“抑制不必要工位移动”的逻辑，才能获得最高的综合满意率。其中，temp-resp逻辑表现突出，因为它不仅考虑了维持温度差异（通过temp-lim思想），还创新性地引入了对热环境动态响应特性的考量，避免用户滞留于空调响应缓慢的“死区”，从而在仿真中实现了较高的综合满意率（图15）。
第四阶段高级算法结果： 1. DRL表现最佳：经过训练的DRL控制器实现了86.9%的平均综合满意率，相较于定常运行（无干预）提升了35%，且优于所有测试的规则逻辑和LLM逻辑（表7）。这表明，在拥有准确环境模型和充足训练的情况下，DRL能够自动学习到超越人工设计规则的、考虑长期收益的复杂控制策略。 2. LLM在仿真中的表现：LLM-based控制器（最佳版本few-shot（1周））也将综合满意率提升至83.3%（较定常运行提升31%），证明了其在缺乏历史数据（zero-shot）或仅有少量数据时仍能有效决策的能力。然而，few-shot模型并未像预期那样显著优于zero-shot模型，且随着“学习”时间跨度增加，其决策反而更倾向于工位推荐（移动次数增加）。分析指出，这可能是由于提示词长度膨胀导致推理质量下降，以及在总结历史案例时丢失了空调反馈的动态特性信息。这揭示了LLM在把握潜在定量变量方面可能存在局限。
四、 研究结论与价值
本研究系统性地提出并验证了一种结合工位推荐与空调反馈的人本中心个性化空调系统。主要结论如下： 1. 阈值确立：明确了工位移动带来满意感所需的最小环境改善阈值（温度差1.3℃/照度差160lx），为系统设计提供了关键参数。 2. 控制原则：成功的控制逻辑需协同优化多个目标：维持室内有益的温度差异、最小化用户不满意的工位移动次数、并考虑座席点热环境的动态响应特性。单纯的推荐或反馈，或简单的混合策略均非最优。 3. 算法效能：在数据与模型允许的情况下，基于深度强化学习（DRL）的控制逻辑能实现最高的综合满意度提升（+35%），展现出自主学习和优化复杂序列决策的强大能力。 4. LLM的角色：大语言模型（LLM）在整合难以量化的定性因素（如用户主观偏好、眩光问题）方面具有独特优势，即使在数据较少的情况下也能显著提升系统性能（+31%），特别适用于光环境等定性因素主导的优化。但其在精确处理定量动态过程方面需与其它技术结合。
该研究的科学价值在于，首次在一个统一框架内，通过实验与仿真相结合的方式，量化了工位移动的满意度机制，并全面对比评估了从规则基础到人工智能（DRL， LLM）等多种控制范式的效能，揭示了各自适用的场景与优势。其应用价值巨大，为未来智能办公环境，尤其是ABW和自由工位型办公室的空调系统设计提供了全新的技术路径和具体的工程指导。系统无需在每个工位安装昂贵的个人空调设备，通过巧妙利用现有空调系统和工位流动性，以较低的改造成本实现了个性化热舒适的提升。
五、 研究亮点
问题定义新颖：将“工位移动”作为一种积极的、可调控的“环境调节资源”纳入空调系统框架，与传统的设备控制并列，开创了人本环境控制的新思路。
评价指标全面：提出了“综合满意度”这一核心指标，它不仅包含传统热舒适，还涵盖了用户对“移动行为本身”的满意度以及其他环境因素（光、声）的舒适度，更贴合真实场景下的用户体验。
方法论系统严谨：采用“基础实验探阈值 → LLM实验验定性 → 多智能体仿真筛规则 → 高级算法求最优”的递进式研究流程，实验与仿真环环相扣，相互验证，结论坚实。
技术融合前沿：创新性地将大语言模型（LLM） 和深度强化学习（DRL） 这两大人工智能前沿技术应用于建筑环境控制领域，并清晰评估了它们在解决该领域问题上的特性、优势与局限性。
考虑动态特性：提出的temp-resp逻辑及DRL的学习过程，都体现了对建筑热惰性和空调系统响应延迟这一重要动态特性的关注，使控制系统更贴近物理现实。
六、 其他有价值内容
研究最后对三类控制逻辑（规则基础、DRL基础、LLM基础）的特性进行了对比总结（表8），并指出了未来研究方向：增加样本量以探究辐射温度、季节热历史等其他因素与综合满意度的关系；探索对LLM进行微调以更好地理解定量因素；开发融合三类逻辑优势的混合控制系统；将系统扩展到多空调协同控制、风速风向调节等更复杂的场景，以增强其实用性和普适性。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问