虚点:一种减少特征值鸿沟的方法
基于向量空间模型的分类方法是目前各种分类方法广泛使用的文档结构表示方法,在对基于向量空间模型的分类方法的研究发现,基于向量空间模型的分类方法存在不合理之处,即特征值之间的“鸿沟”,这种鸿沟会导致向量空间模型中两点之间的距离的计算出现偏差,本文介绍了一种使用虚点的方法,这种方法消除了特征值之间的鸿沟,使得分类的效果得到了提高。该方法是通过重新定义特征权重,调整向量空间模型中点的特征值,即相当于重新定义向量空间中的点,这样的点是相对于原来向量空间模型中的点的矫正映射,即就好像是虚拟点一样,最后问题归结为计算向量空间模型中的点与虚拟点的映射函数。理论分析表明虚点方法能提高基于向量空间模型的分类方法的效果,在SVM中运用虚点方法的实验结果表明,运用虚点方法的SVM的精确度得到了提高,这种结果验证了本文提出的虚点方法的有效性。
虚点 分类算法 特征权重 向量空间模型
林游龙 余智华 程学旗 刘悦
中国科学院计算技术研究所,北京,10080;中国科学院研究生院,北京,100190 中国科学院计算技术研究所,北京,10080
国内会议
黑龙江镜泊湖
中文
636-643
2010-08-12(万方平台首次上网日期,不代表论文的发表时间)