基于小波分析的电子文献分类
文献数据的自动化分类,将在数字图书馆中占据越来越重要的地位.一般采用基于支持向量机的核方法,在标准测试集合上进行文献数据分类,具有某些不足.该方法存在文献向量规模庞大、核函数非正交且多义、重现率计算耗时等缺陷;不使用数字图书馆的真实数据测试,算法的实际说服力不强.为了解决这些问题,采用词汇扩展对文献向量进行预处理,得到少而精、正交无歧义的新文献向量;对文献向量按照语义排序,提高访问和计算速度;借助小波核将文献映射到L2空间进行文献分类.采用中国学术期刊网的真实分类数据,从摘要信息和全文文献两个角度进行验证,结果表明该方法优于核方法,具有一定的理论研究和实际应用价值.
电子文献 分类管理 小波分析 性能评价
张开选
山东大学图书馆 250100
国内会议
福建泉州
中文
280-292
2013-09-24(万方平台首次上网日期,不代表论文的发表时间)