基于相对频次的标签相关性判断优化研究
本文以标签与认知的基本关系为基础,提出了一种基于相对频次的改进策略,在标签预处理的基础上,计算每一个标签的相对频次,并将其最高数值赋为1,进而对其他结果进行归一化处理;之后,根据预先设定的阈值筛选出相关标签集合。并以社会化标注社区“豆瓣电影”的675351位用户的标签数据为例进行实验,以验证策略的效果.结果显示,该策略使得标签相关性判断的效果得到了显著改善.其中,对于频次不小于5的标签,策略的召回率大幅提升,由79.63%升至89.36%;准确率虽有略微下滑,由93.33%降至92.02%,但仍保持在较高水平.
标签数据 相关性判断 阈值筛选 相对频次
林鑫 周知 仇蓉蓉
武汉大学信息管理学学院,武汉,430072
国内会议
第五届全国情报学博士生学术论坛暨2015中国信息资源管理论坛
北京
中文
1-10
2015-10-01(万方平台首次上网日期,不代表论文的发表时间)