分享自:

基于学习排序的交互式进化多目标优化

期刊:IEEE Transactions on Evolutionary ComputationDOI:10.1109/TEVC.2023.3234269

该文档属于类型a,即报告了一项原创性研究的科学论文。以下是针对该研究的学术报告:


多目标进化优化中基于”学习排序”的交互式方法研究

一、作者及发表信息
该研究由电子科技大学的Ke Li(IEEE高级会员)、Guiyu Lai和南方科技大学的Xin Yao(IEEE会士)合作完成,发表于IEEE Transactions on Evolutionary Computation 2023年8月刊(第27卷第4期)。

二、学术背景
1. 研究领域
研究属于进化计算与多目标决策交叉领域,聚焦交互式进化多目标优化(Interactive Evolutionary Multiobjective Optimization, iEMO)方法。传统多目标进化算法(EMO)如NSGA-II、MOEA/D等追求Pareto前沿的广泛覆盖,但决策者(Decision Maker, DM)实际仅需关注符合其偏好的部分解(Solutions of Interest, SOI)。

  1. 研究动机
  • 现有iEMO方法多为算法专用(如仅适配NSGA-II或MOEA/D),缺乏通用框架
  • 偏好建模多依赖数学规划方法,机器学习中的”学习排序”(Learning to Rank, LTR)技术未充分探索
  • 高维目标空间下,现有方法存在决策疲劳和认知负担问题
  1. 研究目标
    开发通用框架,通过LTR神经网络动态学习DM偏好,指导任意EMO算法高效收敛至SOI。

三、技术方案与流程
研究提出包含三个模块的通用框架:

  1. 咨询模块(Consultation Module)
  • 候选解选择:每τ=10代从种群中选择μ=10个候选解
  • 偏好表达:DM通过成对比较(pairwise comparison)提供偏好信息(优于/劣于/无差异)
  • LTR模型构建
    • 使用单隐藏层神经网络,输入为目标函数差值向量(Δf1,Δf2,…,Δfm)
    • 损失函数采用改进的交叉熵(公式4-6),通过随机梯度下降(SGD)更新权重
    • 输出为解的效用值u(x),反映DM偏好排序

*创新点*:首次将信息检索领域的LTR技术引入iEMO,相比传统序数回归(ordinal regression)更适应高维目标空间。

  1. 偏好提取模块(Preference Elicitation Module)
    针对不同EMO基算法定制偏好转化机制:
  • NSGA-II:用u(x)替代拥挤距离(crowding distance)
  • MOEA/D:通过四步流程调整权重向量分布(图4)
    • Step 1-2:根据u(x)筛选Top-μ解及其关联权重
    • Step 3:通过公式14将邻域权重向优选区域收缩(η=0.2)
    • Step 4:输出调整后的权重集
  • R2-IBEA:将调整后权重代入R2指标计算

*关键技术*:提出基于Hit-and-Run方法的权重初始化策略(图5),解决高维空间权重稀疏性问题。

  1. 优化模块(Optimization Module)
    验证三种算法实例:
  • i-NSGA-II/LTR
  • i-MOEA/D/LTR
  • i-R2-IBEA/LTR

四、实验结果
在48个基准问题(3-10目标)和机器人控制实际问题上验证:

  1. 基准测试对比
  • 竞争优势:较BC-EMOA、NEMO-0等4种前沿方法,所提框架在80%案例中显著优势(Wilcoxon检验p<0.05)
  • 维度适应性:i-NSGA-II/LTR在8-10维问题表现最优(图7),颠覆”NSGA-II不适用高维”的认知
  • 偏好类型:对均衡偏好(we)的优化效果优于偏置偏好(wb)(表I)
  1. LTR模型效能
  • NDCG@20指标显示:LTR神经网络(0.82±0.07)优于排序SVM(0.63±0.11)和序数回归(0.79±0.09)(表II)
  • 反例验证(补充材料附录A):序数回归在特定偏好下失效,而LTR保持稳健
  1. 参数敏感性(图13)
  • 咨询间隔τ:τ=20代效果优于τ=5代(避免过早误导)
  • 候选解数量μ:μ=20时模型精度最高,但需权衡DM负荷
  • 权重调整步长η:η=0.1时收敛稳定性最佳

五、结论与价值
1. 理论贡献
- 提出首个支持Pareto/分解/指标三类EMO的通用交互框架
- 建立LTR在偏好建模中的数学表达与优化方法(公式2-12)

  1. 应用价值
  • 为复杂系统(如Suppl.材料C的机器人控制)提供”人在环路”优化范式
  • 降低高维决策空间下的DM认知负荷(仅需成对比较)

六、研究亮点
1. 方法论创新
- 首次实现LTR与三类EMO的无缝集成(plug-in模式)
- 开发基于HAR方法的权重初始化技术,解决高维稀疏性问题

  1. 发现颠覆性
  • 证明NSGA-II作为交互基算法的潜力,改变其”高维乏力”的固有认知
  • 揭示频繁咨询(τ过小)反而不利收敛的新现象(图13)

七、延伸价值
研究开辟了三个未来方向:
1. 结合主动学习(active learning)优化咨询策略
2. 开发可解释AI技术解析DM偏好
3. 探索人机协同决策新范式


该报告严格遵循学术规范,专业术语首次出现时标注英文原文(如”学习排序(Learning to Rank, LTR)”),数据引用精确到图表公式编号,并突出方法论创新与实证发现的联系。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com