会议专题

基于两层阈值的话题/报道表示模型

根据中文新闻报道的特点,分析了信息增益的缺陷,对比了文本证据权,并用文本证据权的算法思想改善其缺陷,提出了基于两层阈值的特征选择算法,设计并实现了基于两层阈值的话题/报道表示模型.根据话题检测与跟踪评测结果,基于两层阈值的话题/报道表示模型的最好性能比基于信息增益的模型提高了3.321%,证明了新的算法和模型具有更好的性能。

信息处理 文本证据权 特征选择算法 表示模型 两层阈值

李胜东 吕学强 魏震 施水才

廊坊燕京职业技术学院计算机工程系,廊坊065200 北京信息科技大学网络文化与数字传播北京市重点实验室,北京100101 廊坊燕京职业技术学院财经系,廊坊065200

国内会议

湖北省计算机学会2013年学术年会

武汉

中文

117-120,130

2013-11-01(万方平台首次上网日期,不代表论文的发表时间)