近日,北京师范大学人工智能与未来网络研究院团队博士生梅雅欣在城市计算领域的研究论文《PG-DyRA: Potential-Game Guided Multi-Agent Collaboration for Dynamic Urban Resource AlLocation.被数据挖掘与数据科学领域顶级会议 The 32nd ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD 2026) Research Track接收。该工作第一作者为2023级博士研究生梅雅欣,指导老师为王田教授,共同作者包括北京师范大学秦慧玲博士、王晨豪副教授、贾维嘉教授,以及西南交通大学郑宇教授。
Yaxin Mei, Huiling Qin, Chenhao Wang, Weijia Jia, Yu Zheng and Tian Wang. PG-DyRA: Potential-Game Guided Multi-Agent Collaboration for Dynamic Urban Resource AlLocation. In the 32nd ACM SIGKDD Conference on Knowledge Discovery and Data Mining, 2026 (accepted).
会议简介
KDD(The ACM SIGKDD Conference on Knowledge Discovery and Data Mining)是数据挖掘与数据科学领域公认的顶级国际学术会议之一,为中国计算机学会(CCF)推荐的A类会议。KDD 2026将于2026年8月9日至8月13日在韩国济州岛举办。本届大会Research Track二轮有效投稿3252篇,接收率约为18.5%。

01.研究背景与挑战
交通调度、物流配送、应急响应,这些城市公共资源的高效分配,直接关乎数百万市民的日常生活。然而在现实部署中,每个移动单元不仅受制于有限的服务容量、能量预算与移动速度,更面临严苛的信息壁垒:感知成本与隐私法规使得智能体只能“看见”周边邻居,却无从得知全局态势。如何在“看不全、算不清”的条件下,让多个智能体自发走向全局最优?这是现有方法面临的核心难题。

图:现有工作与我们工作的对比
02. 解决方案
本文提出PG-DyRA框架,将动态资源分配问题建模为势博弈。通过以边际贡献为核心设计个体效用函数,从理论上严格证明每个智能体独立最大化自身效用,即可驱动系统收敛至与全局最优等价的纳什均衡,解决了去中心化方法缺乏收敛保证的问题。
为在局部可视条件下实现这一理论保证,PG-DyRA设计了双分支意图推理网络,可见智能体分支借助轨迹注意力机制建模同伴行为,不可见智能体分支则通过时空需求残差推断全局容量分布。结合两阶段训练策略,系统无需任何智能体间通信即可完成高效协调。

图:PG-DyRA框架图
03. 实验评估
为验证PG-DyRA的有效性,在三个真实城市数据集(Happy Valley、NYCTaxi、DHRD-SE)及一个合成数据集SYN上开展了系统性实验,涵盖主题公园人流量、城市交通与外卖物流等多类典型城市资源调度场景。实验采用任务覆盖率(TCR)与能量消耗率(ECR)作为核心评价指标。实验结果表明,PG-DyRA在所有数据集上均取得最优表现。此外还进行了消融实验、超参数实验等。PG-DyRA始终保持稳定优势,且在资源受限场景下领先幅度进一步扩大,体现出边际贡献优化机制对资源约束的天然适应性。

表:不同方法在TCR和50%任务覆盖率下的ECR上的性能表现

图:超参数敏感实验
04. 结论
本研究提出了PG-DyRA框架,通过将动态城市资源分配建模为势博弈,以边际贡献为核心实现了个体效用与全局目标的精确对齐。借助双分支意图推理网络与两阶段训练策略,PG-DyRA在局部可视与无通信的严苛约束下,有效解决了可见与不可见智能体的意图建模难题,在保证去中心化收敛性的同时显著提升了任务覆盖效率与能量利用水平,为物理约束与信息约束并存的城市公共资源智能调度提供了兼具理论保证与可行性的解决方案。
学者网

评论 0