基于“动态流通语料库”进行“有效字符串”提取的初步研究
本文提出了“有效字符串”的概念,试图找到从大规模中提取这种字符串的新方法.主要是以“流通度”理论为核心,通过对语料进行周遍切分并辅以“复合词典系统”,计算字符串的“流通度”.最终得到一个能够动态更新的词表.目前的方法还是试验性的,并且借鉴了前人丰富优秀的研究成果.
流通度 字符串 语料库 字符串提取
隋岩 张普
北京语言文化大学语言信息处理研究所(北京)
国内会议
太原
中文
494-499
2001-08-04(万方平台首次上网日期,不代表论文的发表时间)