一种基于SVM的可视化文本分类的方法
提取特征的方法与文本的语言有关。文本数据向量的维数一般非常大,如何减小维数是获得有效的知识模型的重要问题之一。在将文本训练数据集合转换为一组二值分类数据集时,应该考虑文本分类与转换成的二值分类问题的一致性间题。对于应用SVM技术的文本分类,选择适当的内积核可以帮助获得有效的分类算法。对数据对象的可视化表示可以帮助用户直观地认识数据对象中隐含的一些信息,此有助于明确认识不同的分类对象在分类中的作用。在决策函数应用的过程中,交互式可视化方法的运用可以帮助更为方便直观地确定一些影响分类学习的参数。用户能够启发式地确定系统的参数以影响学习的过程,这种方式有助于学习机确认用户的意图。
SVM技术 文本分类 可视化 决策函数
胡俊 黄厚宽
北京交通大学计算机与信息技术研究所,北京,100044
国内会议
厦门
中文
347-349,356
2004-10-14(万方平台首次上网日期,不代表论文的发表时间)