课题组本科生国际TOP期刊发表论文

课题组2017级本科在读学生杜甜在基于分量属性关系网络的多元时间序列聚类研究中取得了新的重要进展,研究成果发表在中科院分区一区TOP期刊《Expert Systems with Applications(ESA)上发表了题为《Multivariate time-series clustering based on component relationship networks》的论文。《Expert Systems with Applications》被认为是计算机科学与数据挖掘领域极具重要性的国际期刊之一,在202012月最新中科院SCI期刊分区中,ESA的计算机科学分区为1top期刊,其影响因子为5.452

在时间序列数据聚类分析领域中大多数研究主要聚焦于单变量时间序列由于多元(多变量)时间序列存在分量属性的高维性其维度众多且数量庞大传统算法不能有效地应用于多元时间序列的聚类分析。有鉴于此,该研究针对目前多元时间序列聚类分析方法存在的问题, 提出了一种基于分量属性关系网络的多元时间序列聚类方法. 通过从分量属性的角度构建反映时间序列数据对象之间关系的网络(Complex Network), 使得多元时间序列数据对象集合被转化为一个综合关系网络, 网络节点代表多元时间序列数据对象, 网络边表示多元时间序列之间的相关关系. 同时, 为了降低时间序列之间的形态异步近似性, 使用一种基于惩罚系数的动态时间弯曲改进方法对各分量属性序列进行相似性度量, 结合K近邻思想(K Nearest Neighbors, KNN)为各分量属性序列构建分量关系网络, 通过计算各边的权重系数将其整合为综合关系网络, 进而获得综合关系网络的邻接权重矩阵. 最后, 利用非负矩阵分解算法(Nonnegative Matrix Factor)获得社区隶属度矩阵(Community membership matrix)和连接矩阵(Connection matrix), 结合模糊聚类思想(Fuzzy Clustering)为各节点分配社区, 以实现多元时间序列的聚类分析。具体的网络构建过程如下图所示:

 

该项研究方法具有现有多元时间序列聚类研究所不包含的一些优点。这些优点包括:(1)充分利用了多元时间序列各分量属性间的复杂关系, 实现了多元时间序列从时空域到拓扑域的转换, 维护了多元时间序列的多路性质, 为多元时间序列的形态挖掘提供了新的途径;(2)提出了一种基于惩罚系数的动态时间弯曲改进算法, 能够有效度量形态异步近似性序列之间的距离, 提升了传统DTW算法的准确性;(3)对算法涉及的参数进行了详细讨论, 用数值实验的方式说明了所提方法的稳健性, 即该项研究的方法对参数值不存在强依赖性.

本项研究与李海林教授发表在《Pattern Recognition(PR)期刊上的《Multivariate time series clustering based on complex network》共同代表了李海林教授课题组的未来发展方向。该研究得到了国家自然科学基金、福建省自然科学基金的支持。文章链接:https://doi.org/10.1016/j.eswa.2021.114649


登录用户可以查看和发表评论, 请前往  登录 或  注册
SCHOLAT.com 学者网
免责声明 | 关于我们 | 用户反馈
联系我们: