会议专题

面向传媒语言语料库的关键词自动抽取研究

本文根据广播电视语言及其关键词的特点,提出通过建立过滤词典过滤垃圾串直接切分短语,并将切分好的短语序列作为关键词候选,进而对其进行各种权重因子的加权计算,最后根据统计结果按序抽取关键词的研究策略,构建了一个名为“传媒语言语料库关键词自动抽取”的软件系统。经过封闭和开放测试,该系统达到了实用性的要求。

自动抽取 关键词 传媒语言语料库 短语切分 过滤词典

吴继媛 孙淳 侯敏

中国传媒大学 北京 100024

国内会议

第五届全国青年计算语言学研讨会(YWCL 2010)

武汉

中文

338-344

2010-10-11(万方平台首次上网日期,不代表论文的发表时间)