基于词频离群分布的在线评论产品属性抽取
基于文本词频分布的zipf定律,将评论挖掘中的产品属性抽取问题转化为识别评语中的词频分布离群点,并且提出新的产品属性抽取方法.该方法首先从产品评论文本中识别出词频分布中的离群词,并将其作为候选的产品属性词,然后通过合并和过滤候选产品属性词得到最终的产品属性词.该方法比以往基于规则或者基于概率的方法更加简单高效.将该方法应用于亚马逊网站的3种产品的属性抽取,实验结果表明该方法在精确度上取得令人满意效果.
文字信息处理 在线评论 产品属性抽取 产品评论挖掘 词频离群分布
黄威 周佳利
华中科技大学管理学院,武汉 430074
国内会议
上海
中文
443-447
2011-12-02(万方平台首次上网日期,不代表论文的发表时间)