会议专题

基于多标记学习的汽车评论文本多性能识别

针对汽车产品评论文本中出现的多方面性能,提出一种基于多标记学习的汽车评论文本多方面性能识别方法.首先,结合文本挖掘方法,利用多标记文本特征选择方法选取特征,将非结构化的文本转化为结构化的多标记数据集.在此基础上,使用4种多标记分类方法,对待识别的评论文档标注一个或多个方面标记.最后,以8种多标记评价指标评估方面识别的性能.在新浪汽车评论语料上的实验表明,方面识别的子集准确率达到了95%,验证了方法的可行性.

文本处理 多性能识别 多标记学习

张晶 李德玉 王素格

山西大学 计算机与信息技术学院,山西 太原 030006 山西大学 计算机与信息技术学院,山西 太原 030006;山西大学 计算智能与中文信息处理教育部重点实验室,山西 太原 030006

国内会议

中国中文信息学会2015学术年会(CIPS2015)暨第十四届全国计算语言学学术会议(CCL2015)、第三届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD2015)

广州

中文

1-10

2015-11-13(万方平台首次上网日期,不代表论文的发表时间)