分享自:

基于大语言模型对齐的地理项目标记化用于本地生活推荐

期刊:Association for the Advancement of Artificial Intelligence

学术研究报告:基于LLM对齐的地理感知项目标记化框架LGSID在本地生活推荐中的应用

一、作者与发表信息
本研究的核心作者团队来自快手科技(Kuaishou Technology)和独立研究机构,包括Hao Jiang、Guoquan Wang、Donglin Zhou(实习期间完成)、Sheng Yu等,通讯作者为Guorui Zhou。论文于2025年11月提交至预印本平台arXiv(编号arXiv:2511.14221v1),尚未正式见刊,但已引起推荐系统领域的广泛关注。

二、研究背景与目标
科学领域:本研究属于推荐系统与自然语言处理的交叉领域,聚焦于结合大语言模型(LLM, Large Language Model)与地理信息的本地生活服务推荐场景。
研究动机:传统基于ID的推荐方法依赖协同过滤信号(Collaborative Filtering),难以捕捉物品间的真实空间关系(如距离感知)。尽管现有文本化方法通过提示设计(Prompt Design)生成语义ID(Semantic ID),但单纯注入位置信息无法解决细粒度空间特征建模问题。例如,系统可能因缺乏地理感知而推荐距离过远的餐厅(如北京用户被推荐上海餐厅)。
研究目标:提出LGSID框架,通过强化学习(RL)对齐LLM的地理感知能力,并设计分层地理标记化策略,以生成兼具语义泛化能力和空间约束的推荐结果。

三、研究方法与流程
研究分为两个核心模块,具体流程如下:

1. RL-Based Geographic LLM Alignment(基于强化学习的地理LLM对齐)
- 奖励模型训练
- 数据构建:基于用户行为数据,计算物品间的哈弗辛距离(Haversine Distance),采用密度感知的硬负采样策略(Density-Aware Hard Negative Sampling)生成负样本。
- 列表式建模(List-wise Modeling):通过多提示错配(Prompt Mismatching)生成输入序列,将物品文本属性与负样本位置组合,输入LLM获取嵌入表示(Embedding)。
- 损失函数:使用加权二元交叉熵(Weighted Binary Cross-Entropy)优化奖励模型,软标签(Soft Label)根据距离排序动态分配。

  • G-DPO算法(Geographic Direct Preference Optimization)
    • 混合数据采样:结合领域协同对(Domain Collaborative Pairs)和地理约束对(Geographic Constrained Pairs),利用用户共现行为(Co-occurrence)增强协同信号。
    • 对齐目标:通过相似性正则化(Similarity Regularization)平衡语义准确性与地理感知,损失函数包含DPO损失(Eq. 6)和对比损失(Eq. 7),权重参数λ=155。

2. Hierarchical Geographic Item Tokenization(分层地理项目标记化)
- 初级标记生成
- 特征融合:将地理坐标(经纬度)、行政区划(省/市/区)、品牌和类别等特征加权拼接(Eq. 9),通过MiniBatch K-Means生成第一层地理标记(Primary Tokens)。
- 残差标记优化
- 量化策略:对残差层(l≥2)采用可学习的聚类中心,通过欧氏距离分配(Eq. 10-12),最小化重构损失(Eq. 13)。
- 正则化:引入基于KL散度的熵正则项(Eq. 15),防止聚类崩溃(Cluster Collapse)。

四、实验结果与贡献
1. 性能提升(RQ1)
- 判别式推荐:在快手本地生活数据集上,LGSID使DIN、DIEN等模型的AUC提升3.6%-6.8%(如DIN从0.5859升至0.6276)。
- 生成式推荐:在Tiger和OneRec模型中,Hit@5相对提升27.01%和18.63%,NDCG@5提升24.94%。

2. 地理感知分析(RQ2-RQ4)
- 对齐效果:G-DPO将省份覆盖度(Province Coverage@5)从0.8716提升至0.9905,城市覆盖度(City Coverage@5)从0.7342提升至0.9173。
- 可视化验证:T-SNE显示对齐后聚类中心与真实地理标签的归一化互信息(NMI)从0.0137提升至0.8644。

五、研究价值与创新点
科学价值
- 首次将RL-based对齐引入LLM的地理感知优化,提出G-DPO算法解决语义与空间的平衡问题。
- 分层标记化策略为高维语义表示与离散空间特征的融合提供了新范式。

应用价值
- 可应用于外卖、本地服务等空间敏感场景,解决长尾物品曝光不公平问题。代码已开源(GitHub: jianghaopg11/lgsid)。

六、研究亮点
1. 方法创新:结合列表式奖励模型与混合采样策略,显著提升LLM对细粒度距离的敏感性。
2. 工程贡献:在百万级候选池中实现高效负采样,验证了工业级数据下的可行性。
3. 可解释性:通过层级标记分布(如图5)证明地理与语义特征的协同优化机制。

七、其他发现
- 参数敏感性实验显示,相似性权重λ=1.8时取得最优权衡(表6)。
- 消融研究证实,密度感知采样对近距离敏感性的提升贡献最大(Town Coverage@5提升83.64%)。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com