会议专题

商品价格数据的两种WEB挖掘算法比较

  其他网络商店的商品实时价格是Web商店店主所关注的重要数据,Web数据挖掘使得这一需求变为现实。通过正则表达式算法与分词算法的比较研究,给出了基于正则表达式的商品价格抽取算法和基于分词的网站目录树抽取算法、HTML网页商品抽取算法与商品价格抽取算法。应用系统的实践表明,正则表达武算法的挖全率与正确率较低,而分词算法的挖全率与正确率都达到99%以上,完全满足应用需求,同时可以为商品的市场预测与分析提供依据。

商品价格数据 市场预测 Web数据挖掘 正则表达式算法 分词算法

王红艳 朱全银 严云洋 钱进

淮阴工学院计算机工程学院,江苏淮安 223003

国内会议

2011年江苏省人工智能学术会议

徐州

中文

168-172

2011-10-22(万方平台首次上网日期,不代表论文的发表时间)