本文是一篇关于搜索和推荐系统中多样化技术的综述文章,由Haolun Wu、Yansen Zhang、Chen Ma、Fuyuan Lyu、Fernando Diaz和Xue Liu共同撰写,发表于2023年1月的ACM期刊。文章的主要目的是系统地总结和分类搜索和推荐系统中的多样化度量和方法,并为未来的研究提供方向。
随着在线信息的爆炸式增长,用户能够访问大量的在线产品和服务。为了缓解信息过载并加速信息获取,检索系统(Retrieval Systems)应运而生,并在现代社会中扮演着重要角色。搜索和推荐是检索系统中最重要的两个领域,它们都可以被视为输出有序列表的排序系统。搜索系统旨在从资源集合中检索与用户查询相关的实体,而推荐系统则主要利用用户与物品的交互历史来预测用户的个性化兴趣,从而推荐潜在满意的物品。
长期以来,相关性(Relevance)主导了搜索和推荐系统的研究,系统的核心是衡量其是否能够检索到与用户查询相关的物品。然而,仅仅关注相关性可能会损害系统中多个利益相关者的效用。例如,在推荐系统中,高相关性可能导致推荐冗余或非常相似的物品,从而引发“过滤气泡”(Filter Bubble)问题,长期来看会损害用户的满意度。此外,高相关性还可能导致曝光不公平,少数热门物品和提供者占据了绝大部分的曝光机会,使得新进入者或不太受欢迎的提供者难以吸引用户,最终可能导致垄断,损害市场的健康发展。
因此,近年来,除了相关性之外,许多其他标准也受到了广泛关注,其中多样性(Diversity)是最受关注的一个。多样化的搜索和推荐不仅可以增加满足用户多样化需求的可能性,还能帮助增加物品的曝光,尤其是那些不太受欢迎的提供者。考虑到多样性在维持一个满意和健康的信息检索市场中的关键作用,本文对搜索和推荐系统中的多样性定义、度量和技术进行了全面的综述。
本文的主要贡献包括: 1. 系统化分类:首次提出了一个统一的分类法,用于分类搜索和推荐系统中的多样化度量和方法。 2. 最新文献总结:收集了80多篇相关文献,总结了搜索和推荐系统中的多样性类型、度量和技术。 3. 开放性问题讨论:识别了当前研究中的开放性问题,并讨论了未来的研究方向,以激发更多关于搜索和推荐系统中多样性的研究。
文章将搜索和推荐系统中的多样性分为两大类:外在多样性(Extrinsic Diversity)和内在多样性(Intrinsic Diversity)。
在推荐系统中,多样性通常分为个体层面多样性(Individual-level Diversity)和系统层面多样性(System-level Diversity)。个体层面多样性关注每个用户的推荐列表中的物品多样性,而系统层面多样性则关注整个系统中推荐物品的多样性。
文章将搜索和推荐系统中的多样化度量分为两类:与相关性无关的度量(Relevance-oblivious Metrics)和与相关性相关的度量(Relevance-aware Metrics)。
文章将增强多样性的方法分为离线方法(Offline Approaches)和在线方法(Online Approaches)。
文章最后总结了当前研究中的开放性问题,并提出了未来的研究方向。例如,如何更好地平衡相关性和多样性,如何设计更高效的多样化算法,以及如何在实际系统中实现多样性等。
本文为搜索和推荐系统中的多样性研究提供了一个全面的综述和分类框架,帮助研究人员快速了解该领域的最新进展和开放性问题。文章不仅总结了现有的多样化度量和方法,还提出了未来的研究方向,具有重要的学术和应用价值。
本文是一篇关于搜索和推荐系统中多样化技术的综述文章,系统地总结了多样性的定义、度量和方法,并提出了未来的研究方向。文章为研究人员提供了一个全面的框架,帮助他们快速了解该领域的最新进展和开放性问题,具有重要的学术和应用价值。