基于改进孪生网络结构的相似法律案例检索研究
针对现有的基于孪生网络结构的文档相似度计算方法大多将整个文档看成模型的输入序列,易导致数据稀疏的问题,提出利用层级注意力机制来改进孪生网络结构中的文档表示。针对基于层级注意力机制的孪生网络计算模型在输入时有可能忽略文档中重要句子的问题,进一步提出一种引入文档内容压缩的两步骤文档相似度计算方法。利用开发的法律案例文档相似度标注数据集进行实验,结果表明所提方法明显优于基于长短期记忆模型的孪生网络计算模型。
文档相似度计算 孪生网络 注意力机制 文档内容压缩
李兰君 周俊生 顾颜慧 曲维光
南京师范大学计算机科学与技术学院,南京210023
国际会议
2018自然语言处理与中文计算国际会议(NLPCC2018)
呼和浩特
中文
1-7
2018-08-26(万方平台首次上网日期,不代表论文的发表时间)