会议专题

面向短文本热点数据发现的研究

在采用传统文本算法处理微博等短文本信息时,因微博自身具有的信息主动推送、噪声点信息较多和时间特征性强等特点,往往会碰到处理效率低下,准确率低等问题.本文针对这些问题进行了深入分析后,提出了包括信息焦点度、相关度和活跃度的多维度评价模型.实验结果证明,提出的多维度评价模型在短文本热点数据发现上达到了较好的性能.

短文本 热点数据发现 多维度评价模型 焦点度 相关度 活跃度

杜雨航 欧明栋 崔鹏

清华大学计算机系 北京100084

国内会议

第六届中国智能计算大会

开封

中文

161-168

2012-05-25(万方平台首次上网日期,不代表论文的发表时间)