会议专题

从汉语文本中提取主题的三种方法和一个实验

自然语言的灵活性和多样性,使得让计算机从文本中抽取主题十分困难的问题。该文介绍了三种从汉语文本中抽取主题的方法。第一种方法基于部件词典,第二种方法基于主题词词典,第三种方法基于统计方法。为了测试三种方法,研究人员设计了三个独立的系统。实验结果是启发性并令人鼓舞的;每种方法都能在一定程度上抽取出反映主题的字串。然而,也许需要结合这些方法的优点得到一种更好的方法。

主题提取 部件词典 主题词典 统计方法

韩客松 王永成

上海交通大学(上海)

国内会议

第十四届全国计算机信息管理学术研讨会

甘肃敦煌

中文

112~121

2000-08-01(万方平台首次上网日期,不代表论文的发表时间)