实验室论文获AAAI2026录用
来源: 郝天永/
华南师范大学
53
4
0
2025-11-18

实验室杨起豪同学一作论文获人工智能顶级会议AAAI2026录用。

 

 

Qihao Yang, Xuelin Wang, Jiale Chen, Xuelian Dong, Yuxin Hao, Tianyong Hao. HSKBenchmark: Modeling and Benchmarking Chinese Second Language Acquisition in Large Language Models through Curriculum Tuning. AAAI 2026 Artificial Intelligence for Social Impact Track. 2025 (CCF-A)

 

简介:语言习得对于揭示人类语言智能的本质至关重要,并已成为提升大语言模型可解释性的新兴研究视角。然而,在伦理和实践层面均难以实施需要控制人类学习者语言输入的实验,这为语言习得建模(特别是汉语二语习得领域)的可验证性与可扩展性带来挑战。尽管大语言模型提供了可控且可复现的替代方案,但目前仍缺乏支持分阶段建模与评估的系统化基准。为解决这些问题,提出首个面向汉语二语习得的分阶段建模与写作能力评估基准HSKBenchmark。该基准涵盖HSK3-6级,包含676万字符的真实教材语料、1.6万条合成指令数据、30个测试主题及基于语言学的评估体系。为模拟人类习得轨迹,提出课程调整框架,使大语言模型按从初级到高级的路径进行学习。鉴于写作中的语言输出是观测二语习得发展的关键视角,我们建立了从语法项目覆盖率、写作错误、词汇复杂度、句法复杂度到整体评分的多维评估体系,并基于万名汉语二语学习者的作文微调出HSKAgent以实现自动化评估。大量实验结果表明,HSKBenchmark不仅能有效建模汉语二语习得过程,还可作为动态写作评估的可靠基准。我们微调后的大语言模型写作能力已达到高级人类学习者水平,并展现出类人的习得特征。HSKBenchmark、HSKAgent及相关模型参数将作为基础工具与资源,为语言习得建模与大语言模型可解释性研究开辟新路径。

 

迄今为止,杨起豪同学已发表ICASSP(CCF-B)、ACL(CCF-A)、IJCAI(CCF-A)、EMNLP(CCF-B)、AAAI(CCF-A)论文及其他国际论文9篇。


登录用户可以查看和发表评论, 请前往  登录 或  注册
SCHOLAT.com 学者网
免责声明 | 关于我们 | 联系我们
联系我们: