基于潜在语义差异的医学网页分类

摘要：

通过分析潜在语义索引的各种模型提出一种新的潜在语义差异模型。将医学网页中的文本抽取出来并分别采用全局模型、局部模型和差异模型进行表示,利用SVM算法进行分类并计算分类正确率和F<,1>指标。实验发现:在差异模型表示下,分类正确率和F<,1>指标较全局模型有明显提高,某些情况下较局部模型分类结果也有提高。

关键词：潜在语义索引差异模型文本分类 SVM算法

作者: 米晓芳秦洋王立宏宋宜斌

作者单位: 烟台大学计算机学院,烟台,264005

会议类型: 国内会议

会议名称: 2007年北京地区高校研究生学术交流会

会议地点: 北京

会议语种:中文

页码: 332-337

在线出版日期: 2008-01-01（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于潜在语义差异的医学网页分类