基于WEB的计算机领域新术语的自动检测

摘要：

本文主要介绍”基于WEB的计算机领域新术语的自动检测”算法的设计和实现。随着计算机技术的迅猛发展,英语中每天者会出现大量的该领域的新术语,如何将这些新兴术语及时发现并纳入到汉语中来,是一个迫切而非常有意义的工作。该算法正是基于这一需求而设计实现的。其核心思想是,首先通过语料库的比对,找到”自某一时间点”以来在计算机类语料库中新出现的词语,即候选新术语,它们满足新术语的第一个特征;然后通过考查候选新术语在时间上的频度曲线,找到其中被广泛地应用,而非昙花一现的词语,确定为新术语。

关键词：自然语言处理自动检测 N元词串语料库 WEB检测

作者: 刘知远孙茂松

作者单位: 清华大学计算机科学与技术系,清华信息科学与技术国家实验室,北京 100084

会议类型: 国内会议

会议名称: 第九届全国计算语言学学术会议

会议地点: 大连

会议语种:中文

页码: 515-521

在线出版日期: 2007-08-06（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于WEB的计算机领域新术语的自动检测