会议专题

地质报告文本自动标引技术方法分析

随着近些年地质工作的进展,我国积累了大量的地质资料,其中包含大量的地质报告文本.由于这些地质报告文本中的内容冗余,文字量巨大,这使得人们快速准确的获取文本标引词的难度大大增加.本文以固体矿产资源地质勘查报告文本为例,分析总结了固体矿产资源地质勘查报告文本的用词特点、句式特点、结构特点.针对这些特点,分析选择适用于地质报告文本的自动标引方法,并初步提出了适合于地质报告文本的自动标引设计方案.

地质报告 自动标引 用词特点 句式特征 文本结构

朱陈文 陈建国 王成彬

中国地质大学地质过程与矿产资源国家重点实验室,湖北武汉 430074;中国地质大学(武汉)资源学院,湖北武汉 430074 中国地质大学地质过程与矿产资源国家重点实验室,湖北武汉 430074;中国地质大学(武汉)资源学院,湖北武汉 430074;中国地质大学(武汉)紧缺矿产资源勘查协同创新中心 430074

国内会议

第十五届全国数学地质与地学信息学术研讨会

长沙

中文

211-217

2016-10-21(万方平台首次上网日期,不代表论文的发表时间)