一种改进的基于海量智能分词的中文自动分词算法
本文提出了一种基于海量智能分词的中文自动分词新算法,该算法不依赖于现有词库,通过文本过滤和词频统计的方法进行中文自动分词,可以发现不限长度和不限领域的新词。自编软件进行的测试结果表明该方法有助于提高中文自动分词的准确度。
智能分词 中文自动分词 词频统计 文本过滤 计算方法
赵琳瑛 赵捧未
西安电子科技大学经济管理学院,陕西,西安,710071
国内会议
广州
中文
97-100
2007-11-01(万方平台首次上网日期,不代表论文的发表时间)