这篇文档属于类型a,即报告了一项原创性研究。以下是对该研究的学术报告:
该研究由Zhiguang Yang、Lu Wang、Chun Gan、Liufang Sang*、Haoran Wang、Wenlong Chen、Jie He、Changping Peng、Zhangang Lin和Jingping Shao共同完成,研究机构为京东(JD.com)。该研究尚未明确提及发表的期刊及时间,但文档末尾标注了“2024, Association for the Advancement of Artificial Intelligence (www.aaai.org)”,推测可能将在2024年发表于AAAI相关会议或期刊。
该研究属于在线广告系统领域,特别是实时广告系统中的广告和创意(creative)排序问题。随着AI生成内容(AI-generated content, AIGC)技术的发展,广告主能够以极低成本生成大量创意内容。然而,如何在实时广告系统中为每个用户个性化选择最相关的创意,成为当前的主要挑战。现有方法通常采用串行排序(serial ranking)的方式,限制了创意模块的效果和效率。因此,本研究首次提出了一种在线并行估计广告和创意排序的新架构,以及相应的离线联合优化模型,旨在提升个性化创意建模的精度,同时降低系统延迟。
研究的目标是优化在线广告系统中的广告和创意排序,以提升点击率(CTR)和每千次展示收益(CPM),同时减少响应时间(RT)。具体问题定义为:在给定用户、广告和创意的情况下,通过排序模型预测用户点击广告的概率,并选择最优的广告和创意组合进行展示。
研究提出了三种广告和创意排序的架构:
- Post-CR:创意排序模块在广告排序模块之后运行,仅对广告排序模块输出的广告进行创意排序。
- Pre-CR:创意排序模块在广告排序模块之前运行,为所有广告候选集进行创意排序。
- Peri-CR:本研究提出的新架构,将广告排序模块和创意排序模块并行运行,显著降低了端到端延迟,并为每个模块提供了更多时间预算以支持更复杂的建模。
为了弥补在线排序模块无法感知创意信息的缺陷,研究设计了一个离线联合优化模型(Joint Optimization of Ad and Creative, JAC)。该模型结合了广告和创意的特征,通过联合反馈训练实现CTR预测的协同优化。具体包括:
- 广告排序子模型(AR):采用深度交叉网络(Deep Cross Network, DCN)和Transformer架构,输入丰富的用户和广告特征,预测广告级别的CTR(pCTR_ad)。
- 创意排序子模型(CR):采用较小的多层感知机(MLP)网络,输入较少的用户、广告和创意特征,并利用AR的输出进行创意级别的CTR(pCTR_c)预测。
研究提出了一种新的离线评估指标——归一化模拟点击率(Normalized Simulated CTR, NSCTR),用于评估创意排序模型的性能。NSCTR通过归一化样本中的广告分布,解决了传统模拟点击率(Simulated CTR, SCTR)指标的不稳定性问题。
研究在京东的真实广告系统日志数据集上进行了广泛的实验,数据集包含约180亿条训练样本和3亿条测试样本。实验分为离线和在线两部分:
- 离线实验:评估了JAC模型在创意排序和广告排序任务中的性能,使用NSCTR、AUC和GAUC作为评估指标。
- 在线实验:通过A/B测试评估了Peri-CR架构在CTR、CPM和响应时间方面的表现。
本研究提出了一种创新的在线并行广告和创意排序架构(Peri-CR),以及离线联合优化模型(JAC),显著提升了在线广告系统的性能和效率。具体贡献包括:
1. 首次实现了创意排序模块与广告排序模块的并行估计,显著降低了系统延迟。
2. 提出了JAC模型,通过联合优化广告和创意的CTR预测,提升了排序精度。
3. 优化了创意排序的离线评估指标(NSCTR),增强了离线与在线性能的相关性。
4. 通过广泛的实验验证了所提方法在CTR、CPM和响应时间方面的优越性。
研究还探讨了未来研究方向,包括进一步优化联合排序模型、改进离线评估指标,以及将AIGC技术整合到实时创意生成中。这些方向为在线广告系统的持续优化提供了重要思路。