蒙古文停用词和英文停用词比较研究
该文采用联合熵算法(Union Entropy,UE)初步确定了蒙古文停用词,接着从初步确定的蒙古文停用词中去掉蒙古文实体名词及同形异义词,再通过对英文停用词和蒙古文停用词的词性比较。确定了蒙古文停用词表。最后用蒙古文停用词表和英文停用词表进行了文档信息检索的对比实验。实验结果表明。用该文所述方法确定的蒙古文停用词表进行蒙古文文档检索。比用英文停用词翻译成蒙古文进行蒙古文文档检索的准确率更高。
蒙古文停用词 信息检索 英文停用词 联合熵算法 特征提取
巩政 关高娃
内蒙古大学计算机学院,内蒙古呼和浩特 010091
国内会议
呼和浩特
中文
35-38
2011-07-29(万方平台首次上网日期,不代表论文的发表时间)