大规模实时垃圾短信过滤系统
垃圾短信是近年来困扰手机用户和运营商的一大难题。设计了一种垃圾短信监控和过滤系统,根据短信发送行为特征、短信文本内容等特点,采用实时过滤和离线分类相结合地方法进行高效短信过滤。系统中创新性地提出了双层Hash方法,并将多种基于统计学习的文本分类方法应用于短信过滤。相比传统方法而言,本系统在过滤效率和准确率两方面均获得大幅度提升。
文字信息处理 垃圾短信 过滤系统 统计学习 文本分类
黄文良 李石坚 陆冠中
中国联合通信有限公司浙江公司 浙江大学计算机学院
国内会议
乌鲁木齐
中文
239-246
2007-09-12(万方平台首次上网日期,不代表论文的发表时间)