11
点赞
0
评论
8
转载
我要入驻

[CIKM'25] 一个全面的多模态去中心化在线社交网络数据集FediData

复旦大学网络大数据实验室牵头完成的论文FediData: A Comprehensive Multi-Modal Fediverse Dataset from Mastodon,于2025年11月发表于第34届ACM国际信息与知识管理会议(CIKM'25)的Resource Track。该数据集针对去中心化在线社交网络(Decentralized Online Social Networks,简称DOSN)中数据分散且多模态内容缺乏统一标准的问题,基于代表性去中心化社交网络Mastodon,设计并构建了一个包含用户个人资料、文本、图像及社交互动等多模态信息的综合数据集。FediData不仅整合了分布在Mastodon不同实例中的用户数据,还提供了高质量的用户标注和规范化的数据结构,为DOSN用户行为分析、多模态学习及去中心社交网络相关研究提供了坚实的数据基础。论文中,作者设计了主题建模、情感分析、社交机器人检测、图像理解等多项任务以验证FediData的实用性,并系统评估了现有最先进方法在该数据集上的表现,揭示了DOSN特有的挑战和难点。所有数据和文档均已公开发布于Zenodo平台,方便学术界和工业界的研究者使用。

本论文作者包括实验室博士生高敏同学和实验室硕士生杜浩然同学和文雯同学,共同作者包括宾夕法尼亚州立大学段强老师。论文共同通讯作者为复旦大学计算与智能创新学院王新老师和陈阳老师。

论文下载链接URL:
https://dl.acm.org/doi/10.1145/3746252.3761634

欢迎关注和使用FediData数据集:
https://zenodo.org/records/15621244

 


复旦大学网络大数据实验室长期从事网络大数据、在线社交网络、智能互联网、城市计算、大语言模型等相关方向研究,和多位来自不同国家的国际顶尖教授有密切合作,研究工作得到国家、上海市和多家知名企业资助。
近期热门新闻
[HSSC'25] 开源超图结构分析工具箱EasyHypergraph
916 2025-11-11 21:16:57
返回顶部