产品质量食品安全互联网舆情监控系统信息提取方法研究
本文提出了一种基于文本块的信息提取算法.通过对网页结点的遍历操作,逐一分析相关结点是否含有算法关注的文本块,再通过相似性识别判断其与网页主题的相关程度,最后获得网页的主体内容.用户可以快速地得到媒体网站的新闻内容,准确度超过90%,可对相关的新闻报道进行甄别与筛选.
信息提取 相似性判断 产品质量 食品安全
陈华 单红霞 方军 韩鹏程 杜军平
国家质检总局信息中心 北京邮电大学计算机学院智能通信软件与多媒体北京市重点实验室,北京100876
国内会议
北京
中文
814-818
2009-10-01(万方平台首次上网日期,不代表论文的发表时间)