基于二元切分和模糊集的垃圾邮件中组合歧义词识别算法

摘要：

本文给出了一种基于逆向最大二元切分和模糊集的中文垃圾邮件中组合歧义字符串的识别算法:根据词在句子中出现的概率,训练生成新的核心字典.针对单一邮件,运用逆向最大匹配生成可能字符串,提取字串附近一个阈值范围内的字组成论域,通过改进的二元切分法提取可能存在的词,在论域上定义模糊集进行描述,构造隶属函数并计算贴近度,判别是否属于字符串.

关键词：二元切分词模糊集垃圾邮件字符串

作者: 郭溢沫

作者单位: 天津师范大学计算机系,300074

会议类型: 国内会议

会议名称: 中国电子学会第十一届青年学术年会

会议地点: 济南

会议语种:中文

页码: 1202-1205

在线出版日期: 2005-09-01（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于二元切分和模糊集的垃圾邮件中组合歧义词识别算法