会议专题

蒙古文停用词和英文停用词比较研究

  该文采用联合熵算法(Union Entropy,UE)初步确定了蒙古文停用词,接着从初步确定的蒙古文停用词中去掉蒙古文实体名词及同形异义词,再通过对英文停用词和蒙古文停用词的词性比较。确定了蒙古文停用词表。最后用蒙古文停用词表和英文停用词表进行了文档信息检索的对比实验。实验结果表明。用该文所述方法确定的蒙古文停用词表进行蒙古文文档检索。比用英文停用词翻译成蒙古文进行蒙古文文档检索的准确率更高。

蒙古文停用词 信息检索 英文停用词 联合熵算法 特征提取

巩政 关高娃

内蒙古大学计算机学院,内蒙古呼和浩特 010091

国内会议

第十三届中国少数民族语言文字信息处理学术研讨会

呼和浩特

中文

35-38

2011-07-29(万方平台首次上网日期,不代表论文的发表时间)