会议专题

基于Simhash的题目去重与搜索

本文通过试卷题目的例子指出了去重的重要性。具体分析了Simhash中通用相似检测算法和LSH(Localility-sensitive Hashing)技术。

试卷题目 去重处理 通用相似检测算法 搜索技术

丁文鹏

光量子

国内会议

第九届中国大数据技术大会

北京

中文

1-19

2015-12-10(万方平台首次上网日期,不代表论文的发表时间)