会议专题

TIP-LAS:一个开源的藏文分词词性标注系统

TIP-LAS是一个开源的藏文分词词性标注系统,提供藏文分词、词性标注功能.该系统基于条件随机场模型实现基于音节标注的藏文分词系统,采用最大熵模型,并融合音节特征,实现藏文词性标注系统.经过试验及对比分析,TIP-LAS藏文分词系统词性标注系统取得了较好的实验效果,系统的源代码可以从网上获取.希望该研究可以推动藏文分词、词性标注等基础工作的发展,提供一个可以比较、共享的研究平台.

藏文分词系统 词性标注系统 音节特征 条件随机场模型 最大熵模型

李亚超 江静 加羊吉 于洪志

甘肃省民族语言智能处理重点实验室(西北民族大学),甘肃 兰州730030

国内会议

中国中文信息学会2015学术年会(CIPS2015)暨第十四届全国计算语言学学术会议(CCL2015)、第三届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD2015)

广州

中文

1-8

2015-11-13(万方平台首次上网日期,不代表论文的发表时间)