会议专题

一种基于web的新闻文本抽取方法

设计了一种基于样本学习的新闻抽取方法,能够通过人工分析样本新闻网页源代码来制定和修改抽取规则,然后再让系统根据抽取规则进行信息的自动抽取工作,并选取了几个门户网站的新闻数据进行了实验。测试结果表明该方法具有较高的准确率,性能可以满足实用要求。

抽取规则 新闻网页 新闻抽取 新闻数据

朱建华

解放军南京政治学院上海分院军事信息管理系,上海,200433

国内会议

第二十四届全国计算机信息管理学术研讨会

南宁

中文

139-144

2010-11-01(万方平台首次上网日期,不代表论文的发表时间)