会议专题

文本挖掘系统的可视化方法研究

本文介绍了作者在开发文本挖掘系统时,针对高维文本向量的可视化降维方法的研究情况。将文本挖掘系统获取的数百维的高维文本向量通过可视化降维算法转化为二维平面上便于人眼直接观察的点,有助于人们通过肉眼观察快速地判断感知大量文本在内容上的相似程度。该技术可以在一定程度上作为传统的文本浏览和搜索技术的有益扩充。本文简要介绍了该领域已经存在的几种典型方法,描述了作者通过分析实验并且结合实际系统的具体情况采用的有效算法,给出了几种方法在实验后得到的对比数据和效果图,指出了各种方法在不同方面的优劣对比。

文本向量 可视化降维算法 文本浏览 搜索技术

高飞 荆继武 向继

信息安全国家重点实验室(中国科学院研究生院),北京 100049

国内会议

2007年全国网络与信息安全技术研讨会

青岛

中文

309-315

2007-07-18(万方平台首次上网日期,不代表论文的发表时间)