会议专题

维基百科的文本聚类方法分析

  维基百科作为一部资源共享的百科全书,其信息抽取的有效性和准确性在学术和应用领域都备受关注。基于维基百科的文本聚类方法更是成为研究热点,并且取得了一系列初步成果。本文总结了文本聚类的相关问题,结合文本聚类的一般过程分析了维基百科的信息挖掘方法和其文本聚类形式对维基百科内容质量的影响,最后总结了维基百科文本聚类方法存在的问题以及未来的发展方向。

维基百科 文本聚类方法 信息挖掘技术

王莹 刘杨

哈尔滨工程大学计算机科学与技术学院,哈尔滨150001 哈尔滨工程大学自动化学院,哈尔滨 150001

国内会议

中国电子学会信息论分会2009年研究生学术交流会

三亚

中文

100-104

2010-03-01(万方平台首次上网日期,不代表论文的发表时间)