从汉语文本中提取主题的三种方法和一个实验
自然语言的灵活性和多样性,使得让计算机从文本中抽取主题十分困难的问题。该文介绍了三种从汉语文本中抽取主题的方法。第一种方法基于部件词典,第二种方法基于主题词词典,第三种方法基于统计方法。为了测试三种方法,研究人员设计了三个独立的系统。实验结果是启发性并令人鼓舞的;每种方法都能在一定程度上抽取出反映主题的字串。然而,也许需要结合这些方法的优点得到一种更好的方法。
主题提取 部件词典 主题词典 统计方法
韩客松 王永成
上海交通大学(上海)
国内会议
甘肃敦煌
中文
112~121
2000-08-01(万方平台首次上网日期,不代表论文的发表时间)