词语搭配在文本中的分布特征
确定搭配候选的观察窗口是词语搭配自动抽取工作的基础。该文首先在大规模汉语语料中统计了名词、动词、形容词的搭配词语的分布情况,得出抽取这三类词搭配词语的最佳观察窗口。然后,进行了搭配自动抽取的对比实验,结果表明利用搭配词语的分布特征可以显著提高自动抽取的准确率和召回率。最后,该文得出两点结论:(1)搭配的分布与具体语言相关:(2)搭配的分布与其中的词类和语法关系相关。
词语搭配 词汇获取 语料库语言学
孙宏林
大学计算语言学研究所,北京语言文化大学语言信息处理研究所
国内会议
北京
中文
230~236
1998-09-01(万方平台首次上网日期,不代表论文的发表时间)