现代维吾尔语词干词类标注标记集验证性研究
本文以维吾尔语小学语文教材语料为验证对象,使用从语法语义相结合角度制定的《现代维吾尔语词干词类标注标记集》,对维吾尔语小学语文教材词干进行了词性标注,验证该标记集规范的可行性、适应性和可靠性.本文根据现代维吾尔语的基本特点,以现有的标记集规范为依据,词干的语法语义相结合,对小学维吾尔文语文教材进行了词性标注验证性实验。在小学维吾尔文语文教材中,总共有143764个词语,词干种数是28133种。语法语义相结合的1345种标记集对小学语文教材词干标注满足率进行具体试验,”信息处理用现代维吾尔语词干词类标注标记集”的顶层设计符合现代维吾尔语特点和计算机信息处理要求。第一层语法角度考虑、共14种,第二层开始语法框架基础上语义角度进行第三、四层,在设计每一层时,考虑了适应性和扩建性,提出比较科学的层次,基本满足构建通用信息处理用现代维吾尔语词干词类标注熟语料库,提供科学、有效、可行和规范,并作为新疆维吾尔语词干标注标记集标准打下良好的基础,提供科学依据,进一步优化后,可以推荐地方标准,下一步提升国家标准层面提供科学依据。
现代维吾尔语 词干标注 词类标注
艾孜尔古丽 米尔夏提 玉素甫·艾白都拉
新疆师范大学计算机科学与技术学院,新疆维吾尔自治区 乌鲁木齐 830054 新疆大学信息科学与工程学院,新疆维吾尔自治区 乌鲁木齐 830046
国内会议
中国中文信息学会2015学术年会(CIPS2015)暨第十四届全国计算语言学学术会议(CCL2015)、第三届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD2015)
广州
中文
1-7
2015-11-13(万方平台首次上网日期,不代表论文的发表时间)