中文术语粒度对其区分能力测度的影响分析
[目的]比较中文术语粒度对不同字段的术语区分能力(Term Discriminative Capacity,TDC)、测度的影响。[方法]将术语区分能力测度应用于题名、关键词、摘要和附加关键词的术语质量评估,在对照组和实验组中使用方差分析对不同学科、字段及术语粒度的TDC进行差异检测。[结果]当关键词和附加关键词未经处理时,在TDC上的表现为:题名>摘要>附加关键词>关键词;当术语粒度为词时,附加关键词的表现提升,题名>附加关键词>摘要>关键词。[局限]实验数据仅包含5个人文社会科学学科,样本代表性可能存在不足。[结论]中文术语粒度和字段在术语区分能力测度上相互作用,各字段的术语粒度统一为词可降低字段因素的影响。
术语区分能力 术语粒度 学术资源检索系统 自动标引
熊欣 王昊 张海潮 张宝隆
南京大学信息管理学院 南京210023;江苏省数据工程与知识服务重点实验室 南京210023
国内会议
兰州
中文
143-152
2019-07-10(万方平台首次上网日期,不代表论文的发表时间)