会议专题

基于两层阈值的话题/报道表示模型

根据中文新闻报道的特点,分析了信息增益的缺陷,对比了文本证据权,并用文本证据权的算法思想改善其缺陷,提出了基于两层阈值的特征选择算法,设计并实现了基于两层阈值的话题/报道表示模型.根据话题检测与跟踪评测结果,基于两层阈值的话题/报道表示模型的最好性能比基于信息增益的模型提高了3.321%,证明了新的算法和模型具有更好的性能.

新闻报道 信息增益 两层阈值 文本证据权 特征选择算法

李胜东 吕学强 魏震 施水才

廊坊燕京职业技术学院计算机工程系,廊坊 065200 北京信息科技大学网络文化与数字传播北京市重点实验室,北京 100101 廊坊燕京职业技术学院财经系,廊坊 065200

国内会议

2013年第四届中国计算机学会服务计算学术会议

湖北恩施

中文

117-120,130

2013-08-04(万方平台首次上网日期,不代表论文的发表时间)