科研速递 | 大模型强化学习研究被人工智能顶级国际会议IJCAI 2026主会录用

近日，团队的论文 SRJudge: Empowering Large Language Models with Selective Reasoning for Fine-Grained Knowledge Concept Tagging 被人工智能顶级国际会议IJCAI 2026 主会收录。该研究提出SRJudge方法，协同大小模型与强化学习，赋予大语言模型选择性推理能力，以实现细粒度知识概念标注。

Bremen, Germany, 15-21 of August 2026

摘要：现阶段虽可直接依托大型语言模型（LLM）完成知识概念标注，但候选规模过大易引发高维空间下的决策难题，导致模型难以从海量候选概念中精准筛选出目标概念。为解决上述挑战，本研究提出一种新颖的SRJudge方法，赋予大语言模型动态选择性推理能力，并依托融合剪枝机制改进的GRPO强化学习算法与动态任务奖励函数，协同大小模型实现细粒度知识概念标注。同时，本研究构建生物与物理两个高质量学科数据集。实验结果表明，SRJudge在多个基准数据集上均显著优于现有最优方法，充分验证了该方法的有效性与优越性。

（欢迎star该项目）项目开源地址：https://github.com/Nicozwy/SRJudge

引用信息：Zhiwei Yang, Jiahua Yang, Huiru Lin, Xing Chen, Quanlong Guan. SRJudge: Empowering Large Language Models with Selective Reasoning for Fine-Grained Knowledge Concept Tagging. IJCAI 2026.

科研速递 | 大模型强化学习研究被人工智能顶级国际会议IJCAI 2026主会录用

评论 0

近期热门动态

下一篇