会议专题

基于符号表示的时间序列聚类方法

时间序列广泛存在于现实世界中,准确地对时间序列进行聚类是很重要的.很多应用于聚类的相似度量方法已经被提出,并广泛地应用于各种问题中,但是由于它们在处理有时间偏移的度量上的劣势,很多方法并不能很好地适应时间序列,如欧氏距离度量方法,而大多数的相似序列在时间上并不是完全同步的,所以造成许多基于传统相似度量的聚类方法在时间序列上的不适应.提出了一种新的时间序列表示方法,并相应提出了对这种新的表示的相似度量方法,基于这种表示和对它的相似度量可以采用层次聚类等聚类策略来对时间序列进行聚类.最后通过对股票数据的聚类实验,证明了这种新的表示方法能够准确地表示序列本身的特征,并且将它应用在对时间序列聚类中,能得到比以前提出的方法更好的聚类精度。

时间序列 聚类 相似度量 符号表示 时间偏移度量

左新强 靳晓明

清华大学软件学院,北京,100084

国内会议

2005第一届中国分类技术与应用研讨会(CSCA)

北京

中文

66-70

2005-09-23(万方平台首次上网日期,不代表论文的发表时间)