会议专题

电子商务中交易数据库的二次聚类算法

在电子商务运行过程中,每天的业务都会产生大量数据,这些信息被Web服务器自动收集并经过处理转换为交易数据库,从交易数据库中可以通过不同的数据挖掘方法发现知识,聚类分析就是其中之一.现有的聚类算法大多用于数值型数据,很少涉及交易数据的聚类.由于交易数据库通常包含数百甚至数千的数据项,将交易数据库转换为高维数据库,会导致问题,使得大多数聚类算法不能适用. 本文研究大规模交易数据库中的聚类问题,提出了一种二次聚类算法一CATD,对交易进行聚类,从中发现相似的购买模式。本文第2节详细地描述了二次聚类算法CATD的过程,然后给出了算法的复杂性分析,最后总结全文。

电子商务 交易数据库 二次聚类算法

陈安 陈宁 周龙骧

中国科学院软件研究所软件工程技术研究开发中心,北京,100080;中国科学院科技政策与管理科学研究所,北京,100080 中国科学院数学与系统科学研究院,北京,100080

国内会议

第十九届全国数据库学术会议

郑州

中文

126-128

2002-08-26(万方平台首次上网日期,不代表论文的发表时间)