基于二元切分的互联网新闻主题词自动提取研究
为了更准确地得到互联网新闻主题词,本文在研究中,借鉴了基于二元自动切分的索引机制。在新闻主题词提取时,选用二元切分,并充分利用新闻自身的文体特性,弱化了对字典的依赖,强化了对二元词的位置信息的处理。实验证明该方法是一种简单有效的获取新闻主题词,包括未登录词的方法。
二元自动切分 互联网新闻 主题词 索引机制 未登录词
孙宏纲 陆余良
合肥电子工程学院网络工程系 合肥 230037
国内会议
苏州
中文
187-190
2007-12-07(万方平台首次上网日期,不代表论文的发表时间)