基于统计的中文词分类

基于统计的中文词分类在语音识别、汉字智能输入等自然语言处理领域有着重要的应用。该文以平均互信息作为评价函数,对大规模的语料库进行统计,采用自顶向下分裂和从下而上合并相结合并的方法进行自动分类,得到较好的分类结果,可以在基于类的语言模型中作为词类使用。
中文词分类 语音识别 汉字智能输入 自然语言处理 自动分类
赵石顽 夏莹 马少平
智能技术与系统国家重点实验室,清华大学计算机系(北京)
国内会议
合肥
中文
2753~2756
2000-06-01(万方平台首次上网日期,不代表论文的发表时间)