2025年第5期SCHOLAT数智论坛暨实验室组会

实验室于2025年6月3日于计算机学院231会议室召开2025年第5期SCHOLAT数智论坛暨实验室组会,会议由汤庸老师担任主持人,实验室内15名学生做汇报。

首先由林喜佳同学做《基于社交网络的图神经网络推荐系统研究》内容的报告。汇报指出社交推荐通过利用社交关联增强个性化推荐效果,但受无关或虚假社交关系影响,推荐准确性受损。为此,提出基于扩散模型的社交去噪推荐框架RecDiff,通过图扩散处理与对比学习,提升推荐的准确性和可靠性。

1 林喜佳同学做《基于社交网络的图神经网络推荐系统研究》内容的报告

第二项报告是王怡嘉同学的《基于社交网络的学者影响力最大化研究》。汇报中提到,随着学术社交平台的普及,学者间的合作、引用与推荐行为形成了复杂的学术社交网络,影响知识传播与资源分配。学者影响力是评估其学术地位与科研价值的重要依据,精准建模和最大化研究具有重要意义。王怡嘉同学的汇报内容包括基于先验增强的自适应图嵌入与强化学习的影响力最大化方法,以及在不同扩散模式下对不同方法的性能比较。此外,汇报中还探讨了整合学者的H指数、科研成果数量、被引次数等多维数据的可能性,与社交网络影响力最大化模型相结合,深入分析学者的影响力。

2 王怡嘉同学做《基于社交网络的学者影响力最大化研究》内容的报告

第三项报告是钟志杰同学的《论文工作与进展》。主要介绍了一种使用对比学习方法对图数据进行扰动的框架,包括基于LLM的节点文本属性增强、节点删除、边的删除和增加等操作,并对相关数据集进行了介绍和实验验证。钟志杰同学计划继续完善实验并撰写论文。

3 钟志杰同学做《论文工作与进展》内容的报告

第四项报告是张路明同学的《基于动态学术社交网络的推荐系统研究》。研究目的是构建一个精准的推荐系统,以应对学术信息平台中存在的问题,比如学者难以全面掌握学术领域的最新动态和潜在合作对象。报告中提到了各种推荐方法,包括基于内容的、基于结构的和基于图神经网络的推荐方法,还提出了一个名为ATSPN的动态图神经网络模型,这个模型具有自适应剪枝策略和结构感知时序编码器,旨在消除冗余边的影响,提升推荐的准确性。最后,张路明同学总结了研究成果,并展望了未来将这些方法应用到学者智库推荐系统中的潜力。

4 张路明同学做《基于动态学术社交网络的推荐系统研究》内容的报告

第五项报告是方文李同学的《基于爬虫的学者数据更新》。之前团队爬取了若干学校学者主页,数据库保存有24000余条学者信息,但数据自保存后未更新过,因此需要建立持续更新机制。学者个人主页分为两类,一类可直接获取内容,目前已编写单线程脚本更新数据;另一类需多次加载,暂时未解决。对于需多次加载的情况,方文李同学后续设想获取各urlxhr地址,分别请求后合并结果再处理。

5 方文李同学做《基于爬虫的学者数据更新》内容的报告

第六项报告是纪少杰同学的《学者画像》。纪少杰同学对智能问答界面进行了功能增强,引入学者画像侧边栏。基于AI回复内容,系统将智能匹配并自动呈现关联学者的深度画像。用户可直观探索其头衔词云、研究热力图及学术生涯时间轴,全面洞察学者专长、贡献与发展轨迹。该侧边栏支持灵活切换,使用户在获取信息的同时,获得更全面、可视化的知识探索体验。

6 纪少杰同学做《学者画像》内容的报告

第七项报告是梁艺霖同学《学者智库数据可视化》。学者智库爬取了全国985211计算机院系高校学者的学者主页信息,要挖掘数据的价值首先要进行可视化分析,而我针对学者信息设计了9款可视化工具。第一种是学者名片,展示了学者的基础信息包括姓名、职称、个人简介等,在头像右侧设计了对学者成果的研究领域分析条形图。第二种是学术关系知识图谱,用于探索研究领域、学者与论文之间的关联网络。第三种是学术影响力趋势分析,展示近十年论文发表量、H指数与被引用次数变化趋势。第四种是学术影响力辐射地图,展示学者合作机构、发表论文等所在地区。第五种是学术多维评价仪表盘,展示几个核心评估指标。第六种是滚动展示学者最新发表的研究论文与成果。第七种是用雷达图和柱状图展示成果类型分布和数量。第八种是基于历史数据的趋势预测与生存分析。第九种是学者对比分析工具。

7 梁艺霖同学做《学者智库数据可视化》内容的报告

罗世权硕士汇报了《基于neo4j的学者与论文节点影响力计算方法》,其工作在Neo4j中构建了以学者为中心的学术成果网络的基础上,通过设计让影响力从期刊和会议-论文,学者的路线,进一步设计了学者与论文节点的影响力算法,提升了学者推荐的精确度。其算法具备了可扩展性,加权组合多因素考量,动态传播等多个优点。

图8 罗世权硕士汇报《基于neo4j的学者与论文节点影响力计算方法》

田浩硕士汇报了《知识图谱数据维护》,报告了自己当前数据维护的工作对于编码乱码,非法 URL HTML 冗余,字段不统一,空值混乱等问题的处理。以及定期数据清洗的日程安排逻辑,表示该任务应层层递进,以确保数据质量和系统架构持续优化。

图9 田浩硕士汇报《知识图谱数据维护》

唐双姣硕士汇报了《基于学者网数据的学术社交网络特征分析》,从学者维度验证了弱联系在跨圈层信息传播中的桥梁作用。同时,从学术产出数据分得出学者网具有明显的马太效应,最后,在学讯维度,平台信息生态正从用户主导的社交传播机构驱动的结构发布演化。不同账号来源在内容主题、传播周期与沉淀价值上表现出系统性差异,构成即时发布长尾扩散的互补机制。总而言之,学者网社交图呈现明显的“小世界 + 无标度”结构特征,信息在整体上具备高效扩散能力,且少数高连接度用户在结构中占据核心地位。

图10 唐双姣硕士汇报《基于学者网数据的学术社交网络特征分析》

姚润彬硕士汇报了《基于高校智库的学者信息可视化》,利用智库高校学者数据,实现了学者信息可视化,完成了个人信息展示,学术研究陈列,研究方向展示,相关学者推荐等多个模块的实现,并兼容中英两个版本。

图11 姚润彬硕士汇报《基于高校智库的学者信息可视化》

郑政硕士汇报了《学者网数据安全汇报》,阐释了数据保护的重要性,分析了学者网可能涉及的数据安全问题如XSS攻击,敏感数据处理,Doss攻击,线程安全问题,数据备份和恢复,数据操作的监控以及其应对措施。

图12 郑政硕士汇报《学者网数据安全汇报》

卢泓钢学士汇报了《基于学者网搜索日志的信息可视化》,从搜索次数,搜索设备,搜索类别,搜索内容四个维度分析了学者网的用户访问数据,得出学者网用户主要以pc端访问为主,主要搜索学者用户和学者动态的结论,其中搜索的主要关键词为国际会议,机器学习,期刊征稿和广东若干大学名称。

图13 卢泓钢学士汇报《基于学者网搜索日志的信息可视化》

梁永燊学士汇报了《学术信息采集工具的开发进展与展望》,报告了当前实现的收集整理期刊、会议的分级信息;针对论文数据的多标准分级描述与匹配,并根据该描述进行排序和筛选;学术成果数据的可选择性导出;生成学术成果数据的年份统计图等工作进展,最后提出如简历形式的学术成果可视化目标。

 

图14 梁永燊学士汇报《学术信息采集工具的开发进展与展望》

第十五项报告是李树鹏同学的《基于学者人口统计特征的学术表现差异分析——来自身份证信息的实证研究》。研究基于学者身份证信息,分析人口统计特征与学术表现的差异。文件指出国家正通过构建适应新质生产力的科技人才体系解决关键领域人才短缺问题,现有研究存在样本偏差和纵向追踪不足,而本研究旨在通过量化学术人才分布的结构性矛盾,为学术相关政策制定中的公平性优化提供建议,并提出了设立西部人才专项基金、改革年龄限制性政策等具体建议。研究局限性在于样本的学生群体偏多,目前仅处于数据分析阶段。

15 李树鹏同学做《学者智库数据可视化》内容的报告

汤老师在总结中提出了重要指导。首先,他强调研究要以问题驱动,聚焦具有科学价值的核心挑战,避免低效重复。其次,他鼓励同学们在研究中追求创新与突破,力争产出具有影响力的成果。最后,他提出要推动科研成果转化,加强产学研结合,让研究真正服务于实际应用。此次会议为实验室成员明确了方向,激励大家在学术研究和实践应用中取得更大进展。

编辑:李若琳,魏玲玲,陈映欣
审核:陈映欣

登录用户可以查看和发表评论, 请前往  登录 或  注册
SCHOLAT.com 学者网
免责声明 | 关于我们 | 用户反馈
联系我们: