地质报告文本自动标引技术方法分析
随着近些年地质工作的进展,我国积累了大量的地质资料,其中包含大量的地质报告文本.由于这些地质报告文本中的内容冗余,文字量巨大,这使得人们快速准确的获取文本标引词的难度大大增加.本文以固体矿产资源地质勘查报告文本为例,分析总结了固体矿产资源地质勘查报告文本的用词特点、句式特点、结构特点.针对这些特点,分析选择适用于地质报告文本的自动标引方法,并初步提出了适合于地质报告文本的自动标引设计方案.
地质报告 自动标引 用词特点 句式特征 文本结构
朱陈文 陈建国 王成彬
中国地质大学地质过程与矿产资源国家重点实验室,湖北武汉 430074;中国地质大学(武汉)资源学院,湖北武汉 430074 中国地质大学地质过程与矿产资源国家重点实验室,湖北武汉 430074;中国地质大学(武汉)资源学院,湖北武汉 430074;中国地质大学(武汉)紧缺矿产资源勘查协同创新中心 430074
国内会议
长沙
中文
211-217
2016-10-21(万方平台首次上网日期,不代表论文的发表时间)