会议专题

基于TFIDF的专业领域词汇获取的研究

针对目前专业词典的建设中如何获取专业词汇这一问题.本文采用了TFIDF算法求加权词频,按词频高低确定专业领域词汇的方法,并针对这一思路给出了在体育领域内研究的样例,同时对这一设想作了预期评估和展望.

TFIDF 词频 前景语料 背景语料 自然语言处理 词汇获取

刘桐菊 于浩 杨沐昀

哈尔滨工业大学计算机系(哈尔滨)

国内会议

第一届学生计算语言学研讨会

北京

中文

263-267

2002-08-01(万方平台首次上网日期,不代表论文的发表时间)