21
点赞
2
评论
12
转载
我要入驻

SCHOLAT数据智能开放实验室最新成果在计算机系统领域顶会ASPLOS 2026发表

收录于合集: # 学术快讯

      近日,华南师范大学SCHOLAT数据智能团队在计算机系统领域取得突破。团队关于异构计算与操作系统内核优化的研究论文 “LAIKA: Machine Learning-Assisted In-Kernel APU Acceleration” 被计算机系统领域国际顶级会议 ACM Conference on Architectural Support for Programming Languages and Operating Systems (ASPLOS 2026) 录用为常规论文(Regular Paper)。ASPLOS 是计算机系统领域享有盛誉的顶级学术会议,与ISCAMICROHPCA并称为体系结构领域的四大顶会,属于CCF A类会议。ASPLOS高门槛、高难度著称,它强调计算机体系结构、编程语言和操作系统三个核心方向的交叉融合,要求研究成果打通软硬件栈。本次会议竞争异常激烈,全球共有840篇投稿,仅录用89篇,录用率低至10.6%

      该论文第一作者为计算机学院2024级硕士研究生卓浩铭,计算机学院李丁丁教授为指导老师,林荣华副研究员与汤庸教授为共同作者。论文提出LAIKA框架,针对集显架构(APU)特性,设计了跨内核态、用户态与设备态的三域共享内存机制(AShm),实现了真正的零拷贝(Zero-Copy数据传输,并结合持久化内核(APK)技术消除了启动开销。实验表明,该方案在无需昂贵专用设备的前提下,将端到端推理延迟降低了9.7倍,且整机功耗仅为独立显卡方案的28.9% 。这一成果为构建高效、绿色的计算系统提供了全新思路。

       随着智能化应用深入操作系统内核,如何高效利用硬件资源成为关键挑战。现有的主流方案多依赖昂贵的独立显卡(dGPU),但在处理内核级高频、低延迟任务时,PCIe总线的数据传输瓶颈导致效率低下。学者网团队并未盲目追求堆砌专用硬件,而是另辟蹊径,深入挖掘商用通用硬件(Commodity Hardware)的潜力。论文提出的LAIKA框架,针对集显架构(APU)特性,设计了跨内核态、用户态与设备态的三域共享内存机制(AShm),实现了真正的“零拷贝(Zero-Copy)”数据传输,并结合持久化内核(APK)技术消除了启动开销。实验表明,该方案在无需昂贵专用设备的前提下,将端到端推理延迟降低了9.7倍,且整机功耗仅为独立显卡方案的28.9% 。这一成果证明了通过精妙的系统软件设计,通用硬件平台同样能跑出世界级的性能,为构建高效、绿色的计算系统提供了全新思路。

  值得一提的是,第一作者卓浩铭作为一名在读硕士生,能够在系统领域公认硬骨头的顶级会议上发表成果,充分展现了计算机学院在计算机系统底层人才培养方面的长期坚持和卓越质量。

--------------------------------------------------------------------------

关于学讯通
学者网官方学术媒体,聚焦学术动态、政策解读与资源分享,支持关联学者主页,是科研信息高效获取与交流的平台。

关于机构号
学者网为学术团队、实验室等机构提供的专属账号,可发布科研动态、会议/招聘等内容,支持多管理员协作,助力机构链接学界资源、扩大学术影响力。

点击前往入驻学者网机构号


评论 2

李伟生 2025-11-26 22:18:38
👍👍👍
陈万德 2025-11-26 20:38:38
👍👍👍
学者网消息官方发布号
返回顶部