1
点赞
0
评论
0
转载
收藏

科研速递 | 大模型强化学习研究被人工智能顶级国际会议IJCAI 2026主会录用

近日,团队的论文 SRJudge: Empowering Large Language Models with Selective Reasoning for Fine-Grained Knowledge Concept Tagging 被人工智能顶级国际会议IJCAI 2026 主会收录。该研究提出SRJudge方法,协同大小模型与强化学习,赋予大语言模型选择性推理能力,以实现细粒度知识概念标注

Bremen, Germany, 15-21 of August 2026

摘要:现阶段虽可直接依托大型语言模型(LLM)完成知识概念标注,但候选规模过大易引发高维空间下的决策难题,导致模型难以从海量候选概念中精准筛选出目标概念。为解决上述挑战,本研究提出一种新颖的SRJudge方法,赋予大语言模型动态选择性推理能力,并依托融合剪枝机制改进的GRPO强化学习算法与动态任务奖励函数,协同大小模型实现细粒度知识概念标注。同时,本研究构建生物与物理两个高质量学科数据集。实验结果表明,SRJudge在多个基准数据集上均显著优于现有最优方法,充分验证了该方法的有效性与优越性。

 

(欢迎star该项目)项目开源地址:https://github.com/Nicozwy/SRJudge

 

引用信息:Zhiwei Yang, Jiahua Yang, Huiru Lin, Xing Chen, Quanlong Guan. SRJudge: Empowering Large Language Models with Selective Reasoning for Fine-Grained Knowledge Concept Tagging. IJCAI 2026.

声明:本内容系学者网用户个人学术动态分享,不代表平台立场。

暨南大学 广东智慧教育研究院
SCHOLAT.com 学者网
免责声明 | 关于我们 | 联系我们
联系我们:
返回顶部