基于类型论的汉语分词系统TTCS
针对汉语分词中的未登录词识别和歧义消除这两个瓶颈问题和目前方法的不足,将类型论的思想引入到汉语分词领域中,提出了类型匹配模型,以类型论函数贴合为主要算法,融合了全切分、统计,前后缀识别信息等多种技术手段,将分词、未登录词识别、歧义消除,词典的动态扩充有机的融合到一个统一的理论模型当中.在此理论框架的基础上,最后实现了基于类型论的汉语分词系统TTCS.
类型匹配 汉语分词 歧义消除 未登录词 TTCS系统
高东平
中国医学科学院医学信息研究所,北京100020
国内会议
重庆
中文
61-66
2011-06-11(万方平台首次上网日期,不代表论文的发表时间)