基于汉语多词块的语料库研究
组块分析是自然语言的处理研究领域中新近出现的一个语言处理策略,它能有效降低句法分析的难度。本文在汉语多词块描述体系的基础上,阐述了汉语多词块库中块的结构,并对库中块的各种标记进行了深入地统计和分析。经过测试,汉语多词块库是一个较准确的参照库,在今后汉语多词块的自动识别研究中,可以很好地得到应用。
汉字处理 汉语词块 词块识别 数理语言学
钟立军 李茹 彭洪保
山西大学 计算机与信息技术学院,山西 太原 030006
国内会议
太原
中文
261-267
2008-07-23(万方平台首次上网日期,不代表论文的发表时间)