文本网络表示研究
文本表示是文本信息处理的基础问题,目前常用的文本表示模型没有考虑文本中词汇间的关系,在表示文本时损失了大量的文本结构信息,而这些文本结构信息对于理解文本是至关重要的。本文提出了用词汇网络来表示文本,保留了文本结构,并根据词汇间关系的不同层次,依次介绍了共现网络-语法网络-语义网络。将文本网络表示方法应用在文本分类中,检验了模型的表示能力。实验结果表明,文本网络表示方法要优于向量空间模型。
文本信息 文本表示 语言网络 语义网络 词汇网络
刘建毅 王菁华 王枞
北京邮电大学智能科学技术研究中心,100876
国内会议
哈尔滨
中文
914-919
2007-11-20(万方平台首次上网日期,不代表论文的发表时间)