本研究由Yinghua Yao(南方科技大学/悉尼科技大学)、Yuangang Pan(A*STAR前沿人工智能研究中心)、Ivor W. Tsang(IEEE Fellow,A*STAR/悉尼科技大学)和Xin Yao(IEEE Fellow,南方科技大学/伯明翰大学)合作完成,发表于2024年3月的《IEEE Transactions on Neural Networks and Learning Systems》第35卷第3期。
在深度学习领域,生成对抗网络(Generative Adversarial Networks, GANs)已成为高维自然信号(如图像、视频、语音和文本)生成的重要工具。然而传统GANs存在一个关键局限:当训练数据中仅有部分样本具有用户期望属性时(例如在生物医学领域设计特定功能的蛋白质序列,或图像检索中生成符合用户偏好的图像),传统方法需要依赖全局知识(global knowledge)对整个数据集进行标注,这在实际应用中成本高昂且往往不可行。
该研究针对这一核心问题,首次提出通过局部偏好信息(local pairwise preferences)来引导生成过程的创新思路。相较于需要全局排序信息的现有方法(如Feedback GAN和条件GAN),这种基于成对比较的监督信号更容易获取——例如在机器人行为训练中,人类只需比较两种行为的优劣;在图像生成中,用户只需标注部分图像的相对偏好。
math \min_D \mathbb{E}_{p_r(x)}[D(x)] - \mathbb{E}_{p_\theta(x)}[D(x)] - \lambda \frac{1}{|S|} \sum_{s\in S} \max(0, -(D(x_1)-D(x_2))+m) 其中λ为平衡因子,m为排序边界 2. 优化算法开发 针对复杂分布场景,研究提出两阶段优化策略: - 次要修正阶段(Minor Correction):当期望数据分布与整体分布差距较小时(d(p_r,p_d)≤ε),直接优化原始目标函数 - 主要修正阶段(Major Correction):通过迭代式训练数据替换策略,逐步将生成分布向目标分布偏移。具体流程包括: a) 生成样本替换:每epoch用生成样本替换训练集中最旧的样本 b) 动态偏好构建:基于更新后的训练数据重建成对偏好集合 c) 约束优化:将问题转化为带Wasserstein距离约束的优化问题 3. 收敛性证明 研究团队首次严格证明了在局部偏好监督下生成分布的收敛性。关键命题包括: - 命题3:在次要修正情况下,生成分布p_θ(x)收敛于期望分布p_d(x) - 命题6:通过k次次要修正,初始分布距离t_0可缩减为t_0-kδ - 推论7:当k=⌈t_0/δ⌉时,d(p_θ^k,p_d)=0 ### 实验结果 1. 合成数据验证 在二维同心圆数据集上,DICGAN成功将生成样本集中在内部圆环(期望数据),而传统WGAN生成样本覆盖全部区域。定量分析显示: - DICGAN生成样本99.7%集中在期望区域 - 判别器对期望/非期望样本的评分差异具有统计学显著性(p<0.001) 2. MNIST手写数字生成 当用户偏好”小数字”(数字0)时: - DICGAN生成样本中数字0占比达99.4% - 仅需9.53×10^4个有效偏好对,远低于FBGAN所需的2.02×10^8个 - 在监督数据受限(仅5k标注)时仍保持98.7%的期望生成率 3. CelebA-HQ人脸生成 针对”老年人脸”生成任务: - 使用StyleGAN2架构实现的DICGAN-Style达到最佳效果 - 生成图像质量(FID=28.6)显著优于FBGAN(FID=35.2) - 期望属性保持率(PDD)达78.5%,比基线方法高54% 4. 基因序列设计 在抗菌肽基因生成任务中: - 生成序列与真实抗菌肽的标准化编辑距离(NED)降低42% - 有效基因结构保持率(%VG)达67%,优于FBGAN的57.8% - 仅需6k次属性评估查询即可达到98.8%的期望生成率 ### 研究结论与价值 该研究提出了首个基于局部偏好的生成模型理论框架,其科学价值体现在: 1. 方法论创新:首次将成对偏好学习与Wasserstein距离理论相结合,解决了传统方法需要全局知识的限制 2. 理论突破:严格证明了偏好信号与分布距离的数学关系,为后续研究奠定理论基础 3. 应用价值:在生物医学设计(仅需部分样本比较)、个性化内容生成(少量用户反馈)等领域具有重要应用前景 ### 研究亮点 1. 监督效率革新:仅需部分数据的成对比较(local pairwise preferences),无需全数据集标注 2. 算法架构创新:差分判别器(differential critic)机制将偏好学习融入GAN训练流程 3. 理论完备性:首次完整证明了从偏好信号到目标分布的收敛性 4. 跨领域适用性:在图像生成(MNIST/CelebA-HQ)和生物序列设计(基因数据集)均验证有效性 ### 技术对比优势 表I展示了DICGAN与现有方法的本质差异: | 方法 | 目标分布 | 判别器值含义 | 监督需求 | |————-|————–|—————-|————–| | WGAN | 整体数据分布 | 数据质量评估 | 无 | | RGAN | 整体数据分布 | 相对质量评分 | 无 | | DICGAN | 用户期望分布 | 偏好强度指标 | 成对偏好 | 该研究为受限监督条件下的生成建模开辟了新方向,特别适用于需要渐进式反馈的实际应用场景。未来可进一步探索的方向包括:few-shot极端情况下的生成优化,以及基于人类实时反馈的在线学习框架。