会议专题

面向依存文法分析的搭配抽取方法研究

本文通过对经分词和词性标注的大规模语料库(1.8GB)的统计,计算出语料库中出现的词对个数、距离及方差,并应用t检验的改进方法,得到了词对之间的“搭配强度系数”值R,以此来衡量它们之间这种搭配关系的强弱.这一系数直接面向依存文法分析,以得到到一个句子中各个词的搭配关系强弱序列表,以后将要从此表中得到依存文法树.目前我们可以在智能搜索引擎等多种场合找到此种方法的应用.

搭配强度系数 依存文法 智能搜索引擎 搭配抽取

车万翔 刘挺 秦兵 李生

哈尔滨工业大学信息检索组(黑龙江)

国内会议

全国第六届计算语言学联合学术会议

太原

中文

153-159

2001-08-04(万方平台首次上网日期,不代表论文的发表时间)