5G消息中不良文本消息识别技术研究
5G消息通信能力极大增强,其中单条文本消息可达千字,消息的即时交互性更强,并且不良消息中常充斥大量变体字,这给现有的不良文本消息识别技术带来挑战。本文调研了关键词策略匹配技术和人工智能模型两种不良文本识别方法,总结了它们的优缺点,并针对上述挑战提出了考虑关键词上下文区间约束的策略匹配技术、跨消息关键词匹配技术和无监督分词技术,可以显著增强5G消息中不良文本识别的效果。
不良文本识别 策略匹配 关键词匹配 分词技术
杜雪涛 张晨 杜刚 王红雨
中国移动通信集团设计院有限公司,北京100080
国内会议
北京
中文
40-44
2021-09-01(万方平台首次上网日期,不代表论文的发表时间)