术语自动提取中的领域度计算方法研究
术语自动提取是自然语言处理的主要内容之一,主要包括:单元度的计算和领域度的计算两方面.其中,领域度计算是术语自动提取区别于一般的新词发现等的关键步骤之一.本文详细阐述了术语自动提取中领域度的计算方法.通过综合利用领域部件信息和领域语料库的分类信息,借助机器学习方法探索了领域度的计算方法.选取计算机领域语料进行实验,并对实验结果进行了分析.实验结果表明,增加领域度信息后可以在很大程度上提高术语提取的准确率.
术语提取 领域度 领域部件 自然语言处理
张秦龙 穗志方 丁万松
北京大学计算语言所,北京,100871
国内会议
沈阳
中文
229-234
2006-08-15(万方平台首次上网日期,不代表论文的发表时间)