会议专题

基于文法特征的无监督能愿词挖掘方法研究

本文提出了一种基于文法的无监督方法,挖掘中文里的能愿词,这些能愿词可以成为识别人们意图和愿望的重要特征。例如“能够”,“必须”,“宁愿”等等。另外,本文还介绍了在大规模中文博客资源中自动提取并标注能愿词的方法。实验验证,该方法的正确率和召回率分别可达74.25%和76.03%。在此基础上,本文根据推演公式提出了对中文能愿词进行迭代挖掘的思想。

数据挖掘 倾向性分析 能愿词 文法特征 无监督

洪宇 张剑峰 杨跃辉 姚建民 朱巧明

苏州大学计算机科学与技术学院,苏州 215006

国内会议

第六届全国信息检索学术会议

黑龙江镜泊湖

中文

497-504

2010-08-12(万方平台首次上网日期,不代表论文的发表时间)