会议专题

文本网络表示研究

文本表示是文本信息处理的基础问题,目前常用的文本表示模型没有考虑文本中词汇间的关系,在表示文本时损失了大量的文本结构信息,而这些文本结构信息对于理解文本是至关重要的。本文提出了用词汇网络来表示文本,保留了文本结构,并根据词汇间关系的不同层次,依次介绍了共现网络-语法网络-语义网络。将文本网络表示方法应用在文本分类中,检验了模型的表示能力。实验结果表明,文本网络表示方法要优于向量空间模型。

文本信息 文本表示 语言网络 语义网络 词汇网络

刘建毅 王菁华 王枞

北京邮电大学智能科学技术研究中心,100876

国内会议

中国人工智能学会第12届全国学术年会

哈尔滨

中文

914-919

2007-11-20(万方平台首次上网日期,不代表论文的发表时间)