专家证据文档识别无向图模型
专家证据文档识别是专家检索的关键步骤。融合专家候选文档独立页面特征以及页面之间的关联关系,提出了一个专家证据文档识别无向图模型。该方法首先分析各类专家证据文档中的词、URL链接、专家元数据等独立页面特征以及候选专家证据文档间的链接和内容等关联关系;然后将独立页面特征以及页面之间的关联关系融入到无向图中构建专家证据文档识别无向图模型;最后利用梯度下降方法学习模型中特征的权重,并利用吉布斯采样方法进行专家证据文档识别。通过对比实验验证了该方法的有效性。实验结果表明,该方法有较好的效果。
专家证据文档 专家检索 独立页面特征 专家元数据 无向图模型
毛存礼 余正涛 吴则建 郭剑毅 线岩团
昆明理工大学信息工程与自动化学院,昆明,650500
国际会议
昆明
中文
342-354
2014-05-01(万方平台首次上网日期,不代表论文的发表时间)