会议专题

中文分词在邮件过滤系统中的应用

针对邮件文本分词效果较差的特点,提出采用一种改进的最大匹配法来进行中文分词的方法.该方法对于普通的邮件文本和一些具有特定格式的邮件文本都可以进行有效的分词;文中Φ<”2>统计法生成新词,对词典起到了动态更新的作用,提高了分词的精度和准确度.两种方法在邮件过滤系统中结合应用,使分词的误分率低于0.025.

中文分词 邮件文本 邮件过滤 最大匹配法

林珊 宁国宁 赵之霖

华南理工大学广东省计算机网络重点实验室(广东广州)

国内会议

第二届全国搜索引擎和网上信息挖掘学术研讨会(SEWM2004)

广州

中文

112-116

2004-11-12(万方平台首次上网日期,不代表论文的发表时间)