基于两层阈值的话题/报道表示模型
根据中文新闻报道的特点,分析了信息增益的缺陷,对比了文本证据权,并用文本证据权的算法思想改善其缺陷,提出了基于两层阈值的特征选择算法,设计并实现了基于两层阈值的话题/报道表示模型.根据话题检测与跟踪评测结果,基于两层阈值的话题/报道表示模型的最好性能比基于信息增益的模型提高了3.321%,证明了新的算法和模型具有更好的性能。
信息处理 文本证据权 特征选择算法 表示模型 两层阈值
李胜东 吕学强 魏震 施水才
廊坊燕京职业技术学院计算机工程系,廊坊065200 北京信息科技大学网络文化与数字传播北京市重点实验室,北京100101 廊坊燕京职业技术学院财经系,廊坊065200
国内会议
武汉
中文
117-120,130
2013-11-01(万方平台首次上网日期,不代表论文的发表时间)