面向传媒语言语料库的关键词自动抽取研究
本文根据广播电视语言及其关键词的特点,提出通过建立过滤词典过滤垃圾串直接切分短语,并将切分好的短语序列作为关键词候选,进而对其进行各种权重因子的加权计算,最后根据统计结果按序抽取关键词的研究策略,构建了一个名为“传媒语言语料库关键词自动抽取”的软件系统。经过封闭和开放测试,该系统达到了实用性的要求。
自动抽取 关键词 传媒语言语料库 短语切分 过滤词典
吴继媛 孙淳 侯敏
中国传媒大学 北京 100024
国内会议
武汉
中文
338-344
2010-10-11(万方平台首次上网日期,不代表论文的发表时间)