会议专题

基于关联规则挖掘的中文网页体裁模式发现

本文探讨基于关联规则挖掘的中文网页体裁模式发现问题。通过链表结构,将文档集转换为适用于关联规则挖掘的事务数据库,保证了事务数据库出现的词条项按照在文本中出现的顺序排列,实现了Apriori关联规则算法。实验结果表明,这对于某些类别的体裁模式发现有比较好的效果.

文本分类 体裁模式 关联规则 中文网页 网页体裁 事务数据库 数据挖掘

吴楚坤 吴扬扬

华侨大学计算机科学系,福建,泉州,362021

国内会议

2008年全国理论计算机科学学术年会

西安

中文

134-136,141

2008-09-19(万方平台首次上网日期,不代表论文的发表时间)