藏文文本规范问题讨论

摘要：

藏语文本规范化是指通过对藏文文本上下文分析,把其中的数字、简写符号或者特殊语义块识别出来,给出它们在规范化藏文词表的规范写法。本文针对在藏语语音合成中遇到的藏文文本问题,对藏文文本规范化进行了界定；给出了藏文词汇排序算法的数据结构和流程；研究了藏语非规范文本块类型、模式,藏文文本分析器、藏文文档结构、文本块语义形式和数据流程；对非规范藏文文本进行文本块切分,通过词法分析器和语义识别器,实现藏文文本规范化。

关键词：藏文文本规范化词汇排序算法词法分析器语义识别器

作者: 于洪志杨博

作者单位: 西北民族大学,中国民族语言文字教育部重点实验室兰州,730030 太原科技大学,太原,030024

会议类型: 国内会议

会议名称: 第七届中文信息处理国际会议

会议地点: 武汉

会议语种:中文

页码: 526-532

在线出版日期: 2007-10-13（万方平台首次上网日期，不代表论文的发表时间）

会议专题

藏文文本规范问题讨论