藏文短语及其嵌套短语的提取
本文提出一种自动提取藏文短语及其嵌套短语搭配的算法,它通过采用基于统计长短语内词语之间的触发共现和基于句法特征规则相结合的处理策略,利用数据挖掘中的Apriori算法和FTP Tree数据存储结构,克服了N-gram统计语言模型在藏文短语搭配提取中没有考虑语言本身结构特性的缺陷,实验结果表明,短语提取的准确率和召回率都有很大的提高.
藏文短语 嵌套短语 数据挖掘 短语搭配
毋建军 张俊林 孙乐 吴健 次仁罗布 陈俊杰
太原理工大学,计算机与软件学院,太原,030024;中国科学院软件研究所开放系统与中文信息处理中心,北京,100080 中国科学院软件研究所开放系统与中文信息处理中心,北京,100080 西藏大学,拉萨,850000 太原理工大学,计算机与软件学院,太原,030024
国内会议
北京
中文
153-160
2006-11-21(万方平台首次上网日期,不代表论文的发表时间)