基于加权序列的微博文本特征研究
针对微博文本篇幅所限、信息密度过低等特点,提出了基于加权序列的微博文本特征表示模型,在TextRank算法的基础上,重新设计了节点选取策略,充分利用了所有可能的微博信息;并提出了2种加权算法,对原始的排序结果进行加权处理,使得权重更具梯度.实验结果表明,相较于其他基于统计的特征表示模型,提出的基于加权序列的特征表示模型,在朴素贝叶斯分类中具有更高的准确率.
微博文本 特征表示 节点选取 加权序列
徐严康 向阳 张波 张骐
同济大学电子与信息工程学院 上海201804 上海师范大学信息与机电工程学院 上海200234 神华和利时信息技术有限公司 北京 100010
国内会议
太原
中文
250-255
2014-09-19(万方平台首次上网日期,不代表论文的发表时间)