基于关联规则挖掘的中文网页体裁模式发现
本文探讨基于关联规则挖掘的中文网页体裁模式发现问题。通过链表结构,将文档集转换为适用于关联规则挖掘的事务数据库,保证了事务数据库出现的词条项按照在文本中出现的顺序排列,实现了Apriori关联规则算法。实验结果表明,这对于某些类别的体裁模式发现有比较好的效果.
文本分类 体裁模式 关联规则 中文网页 网页体裁 事务数据库 数据挖掘
吴楚坤 吴扬扬
华侨大学计算机科学系,福建,泉州,362021
国内会议
西安
中文
134-136,141
2008-09-19(万方平台首次上网日期,不代表论文的发表时间)