近日,实验室硕士生冯跃博作为第一作者的论文"Drift-Aware Incremental Token Adaptation with Collaborative Semantics for Generative Recommendation"被The 49th International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR 2026) 会议录用。
生成式推荐通常采用两阶段流水线:可学习的分词器将物品映射为离散Token序列(即标识符),自回归生成式推荐模型(GRM)基于这些标识符进行预测。近期的分词器进一步引入协同信号,使具有相似用户行为模式的物品获得相似的编码,从而显著提升推荐质量。然而,现实环境持续演化:新物品导致标识符冲突与偏移,新交互引发现有物品的协同漂移(如共现模式和流行度的变化)。完全重训分词器和GRM通常代价高昂,而朴素微调分词器会改变大多数现有物品的Token序列,破坏GRM已学习的Token-嵌入对齐。为平衡协同分词器的可塑性与稳定性,我们提出DACT框架,通过漂移感知的选择性适配策略,在适应协同信号演化的同时保持GRM Token嵌入知识的稳定性。在三个真实数据集和两种代表性GRM上的实验表明,DACT持续优于基线方法。
会议简介

ACM SIGIR (International ACM SIGIR Conference on Research and Development in Information Retrieval) 是信息检索领域的顶级国际学术会议,是中国计算机学会推荐的A类国际学术会议。SIGIR汇集了来自学术界和工业界的研究人员,共同探讨信息检索、搜索和推荐系统等领域的前沿研究。今年,该会议计划于2026年7月20日至24日在澳大利亚墨尔本召开。本届SIGIR会议共收到1271篇有效投稿,其中234篇论文被接受,录用率18.4%。
论文简介
面向生成式推荐的漂移感知增量更新框架

论文链接:https://doi.org/10.1145/3805712.3809645
代码仓库:https://github.com/HomesAmaranta/DACT
生成式推荐将推荐任务重新建模为序列生成任务,大多采用两阶段设计:可学习分词器(如RQ-VAE)将物品映射为离散的层次化Token序列作为标识符,生成式推荐模型(GRM)基于这些Token进行自回归生成与预测。近期研究将协同过滤模型中的协同信号注入分词器,确保用户行为模式相似的物品获得相似的Token序列,从而大幅提升推荐效果。
然而在真实系统中,新物品和新交互持续涌入,带来两大挑战:(1)分词器未见过新物品,导致标识符冲突与偏移;(2)新交互反映了底层变化,包括物品流行度的变化和共现模式的演化。如果Token不能自适应更新以反映这种协同漂移,过时的标识符将无法代表物品最新的协同特征,成为GRM性能的关键瓶颈。

图1 协同信号漂移举例
在协同感知分词器的增量学习中,如何准确识别经历显著协同语义漂移的物品子集,并设计机制选择性地更新其标识符,同时严格约束静止物品?本文将此称为"漂移感知的选择性适配策略",旨在通过适应演化的协同信号实现可塑性,同时确保生成式推荐模型Token嵌入知识的稳定性。
方法概述
我们提出DACT(Drift-Aware Continual Tokenization),通过两个阶段捕获并适应协同漂移:
第一阶段:漂移感知的分词器适配
协同漂移识别模块(CDIM):与分词器端到端联合训练,通过模式记忆和注意力机制,为每个物品预测漂移置信度分数。该模块维护可学习的关键槽(表示漂移模式)和值槽(表示更新策略),通过比较前一时期和当前时期的潜在表示与最新协同嵌入的对齐程度来构造查询向量,最终输出漂移置信度。
差异化更新策略:基于CDIM预测的漂移置信度,选取置信度最高的top-K物品作为漂移集合,其余为静止集合。对漂移物品,鼓励其自由适应最新协同信号;对静止物品,引入锚定正则化约束其潜在表示保持稳定,防止破坏GRM已学习的Token-嵌入对齐。
全局编码分配稳定性约束:通过KL散度惩罚所有物品在第一层码本的分配分布偏移,保持标识符整体稳定。

图2 DACT自适应更新框架
第二阶段:层次化编码重分配
采用"松到严"的策略:第一层始终重新分配编码以捕捉显著的协同漂移;更深层仅在第一层编码发生变化时才触发重新分配,否则保持不变。这一设计过滤了潜在空间中的微小波动,稳定了大多数标识符。
实验结果
我们在三个Amazon真实数据集(Beauty、Tools、Toys)上,使用两种代表性GRM backbone(TIGER和LC-Rec)进行了广泛实验,结果展示在表1和表2中:
表1 DACT在TIGER上的表现

表2 DACT在LC-Rec上的表现

可以发现:DACT的表现优于其他基线方法,有效平衡了可塑性与稳定性。此外,我们做了进一步的消融实验,说明DACT的每一个模块都是不可或缺的,如图3所示。

图3 DACT上的消融实验
我们进一步验证了DACT能否感知协同信号的演化,并据此微调分词器以适应协同信号漂移。为量化分词器捕获演化协同信号的能力,我们计算了每个时期量化嵌入与当前时期协同过滤嵌入之间的余弦相似度,并报告所有物品的平均值。我们对比了两种设置:冻结分词器(不做任何更新)和DACT更新后的分词器,结果如图4所示。

图4 量化嵌入和协同嵌入的余弦相似度变化对比图
对于冻结分词器,相似度随时间稳步下降,反映出初始语义空间与不断演化的协同信号之间的错位日益加剧——即协同漂移的存在。相比之下,DACT在各时期保持了相对稳定的相似度,表明其能有效适应最新的协同模式。
为更直观地理解DACT如何处理具体的漂移实例,我们从Tools数据集中选取了200个物品,使用t-SNE对其第1时期的协同过滤嵌入进行可视化,如图5所示。物品按其在编码本第一层的令牌分配着色,星形标记代表对应的编码嵌入。在两个子图中,大多数物品都位于其所分配令牌的编码嵌入附近,说明第一层令牌总体上能捕获主导的协同信号。然而,在图5(a)中(冻结分词器),圆圈标注的物品偏离了其原始编码嵌入,转而更接近其他编码嵌入,表明它们的协同语义在第1时期已发生漂移。而在图5(b)中,DACT将这些漂移物品重新分配到与其当前协同过滤嵌入更匹配的令牌,从而将标识符适配到最新的协同信号。

图5 物品潜在表示可视化
讨论
1. 协同漂移识别的挑战
我们的实验发现,在识别和应对协同漂移时存在两个主要挑战:(1)漂移边界的模糊性。协同信号的演化是一个渐进的过程,物品从"静止"到"漂移"之间并不存在明确的分界线。CDIM虽然通过端到端学习漂移模式来预测漂移置信度,但在漂移程度较轻微的边界区域,仍可能出现误判,导致部分轻微漂移的物品未被及时更新,或将噪声波动误识别为真实漂移。(2)冷启动物品的不稳定性。新物品由于交互数据有限,其协同嵌入本身就具有较大的不确定性。在这种情况下,CDIM难以准确区分新物品的协同信号变化究竟是由真实的用户偏好演化引起,还是仅仅源于初始交互数据的稀疏性和噪声。
2. 对实际系统的潜在影响
尽管DACT的核心设计聚焦于分词器端的增量更新,其影响会通过更新的标识符传递到整个推荐系统。首先,通过选择性更新而非全量重训,DACT大幅降低了计算开销,使得工业级推荐系统可以在有限的计算预算下实现更频繁的模型更新。其次,DACT通过稳定大多数物品的标识符,避免了大规模令牌重分配对在线服务造成的干扰,有助于维护推荐系统的服务稳定性。最后,DACT对漂移物品的及时适配能够帮助系统更快地捕捉到季节性趋势、突发事件等带来的用户行为变化,从而提升推荐的时效性和准确性。
3. 研究的局限性与未来方向
我们从以下三个方面阐述了研究的局限性与潜在改进方向:(1)漂移检测方面:当前CDIM通过top-K选择策略划分漂移与静止物品,这种固定比例的划分可能无法适应漂移强度随时间动态变化的场景。未来可探索自适应阈值机制,根据当前时期的整体漂移程度动态调整选择比例。(2)信号来源方面:本研究目前仅考虑了基于用户行为的协同信号漂移。未来可拓展至多模态信号的联合漂移检测,如结合物品内容特征的变化(如价格调整、描述更新)与协同信号的演化进行综合判断。(3)评估方面:实验基于三个Amazon数据集的离线评估,虽然验证了方法的有效性,但尚未在大规模工业级实时系统中进行部署测试。未来需要在更大规模、更长时间跨度的在线环境中评估DACT的实际效果。
总结
本研究的主要贡献如下:
我们研究了生成式推荐中协同感知分词器的增量学习问题,指出了现有方法忽略物品协同语义漂移的关键不足,并提出了漂移感知的选择性适配问题定义。
我们提出了DACT框架,通过协同漂移识别模块(CDIM)端到端地估计物品级漂移置信度,实现对漂移物品与静止物品的差异化更新策略,并结合层次化编码重分配策略有效平衡了可塑性与稳定性。
我们在三个真实数据集上使用两种代表性生成式推荐模型(TIGER和LC-Rec)进行了广泛实验,结果表明DACT在相同设置下持续优于强基线方法,验证了其在协同漂移环境下的有效性与高效性。
我们进一步通过消融实验、可视化分析和效率对比,深入分析了各组件的作用机制,讨论了协同漂移识别的挑战及未来研究方向,为生成式推荐的持续学习提供了新的视角。
如果您对本文内容感兴趣,可与通讯作者联系: zhangpeng_@fudan.edu.cn
实验室相关论文
[1] Jiahao Liu, Dongsheng Li, Hansu Gu, Peng Zhang, Tun Lu, Li Shang and Ning Gu. Unbiased Collaborative Filtering with Fair Sampling. SIGIR 2025.
[2] Mingzhe Han, Dongsheng Li, Jiafeng Xia, Jiahao Liu, Hansu Gu, Peng Zhang, Ning Gu, Tun Lu. FedCIA: Federated Collaborative Information Aggregation for Privacy-Preserving Recommendation. SIGIR 2025
[3] Jiahao Liu*, Xueshuo Yan*, Dongsheng Li, Guangping Zhang, Hansu Gu, Peng Zhang, Tun Lu, Li Shang and Ning Gu. Improving LLM-powered Recommendations with Personalized Information. SIGIR 2025.
[4] Jiahao Liu, Dongsheng Li, Hansu Gu, Tun Lu, Peng Zhang, Li Shang and Ning Gu. Triple Structural Information Modelling for Accurate, Explainable and Interactive Recommendation. SIGIR 2023.
[5] Jiahao Liu, Yiyang Shao, Peng Zhang, Dongsheng Li, Hansu Gu, Chao Chen, Longzhi Du, Tun Lu, Ning Gu. Filtering Discomforting Recommendations with Large Language Models. WWW 2025.
如果您对我们实验室的相关工作感兴趣,欢迎访问我们的网站:
协同信息与系统实验室(CISL)
实验室网站主页:https://cscw.fudan.edu.cn/
实验室Github主页:https://github.com/FudanCISL

评论 0