藏文文本规范问题讨论
藏语文本规范化是指通过对藏文文本上下文分析,把其中的数字、简写符号或者特殊语义块识别出来,给出它们在规范化藏文词表的规范写法。本文针对在藏语语音合成中遇到的藏文文本问题,对藏文文本规范化进行了界定;给出了藏文词汇排序算法的数据结构和流程;研究了藏语非规范文本块类型、模式,藏文文本分析器、藏文文档结构、文本块语义形式和数据流程;对非规范藏文文本进行文本块切分,通过词法分析器和语义识别器,实现藏文文本规范化。
藏文文本 规范化 词汇排序算法 词法分析器 语义识别器
于洪志 杨博
西北民族大学,中国民族语言文字教育部重点实验室兰州,730030 太原科技大学,太原,030024
国内会议
武汉
中文
526-532
2007-10-13(万方平台首次上网日期,不代表论文的发表时间)