基于LDA模型的人工智能领域前沿识别研究
[目的/意义]前沿识别是文献计量学的重要研究领域,目前主要采用引文和词频分析方法,引文分析法在时间上存在滞后性,词频分析法则缺乏语义支持和关联.为此,本文基于LDA模型和社会网络方法构建前沿识别指标体系,用于人工智能领域的前沿主题识别研究.[方法/过程]数据来源于2013-2017年Scopus数据库收录的人工智能领域期刊论文及CCF推荐的A类会议论文.从数据分析到主题识别均采用Python语言实现.首先,基于LDA模型进行主题识别.然后,遴选前沿特征指标,构建前沿识别指标体系.最后,筛选出人工智能领域前沿主题及中介中心性较强的主题词.[结果/结论]基于LDA模型识别出45个主题,遴选出的前沿识别指标体系主要包括主题强度、主题新颖度和中介中心性三个指标,筛选出人工智能领域16个前沿主题及10个中介中心性较强的主题词,经专家评价识别准确率达到81.25%,该前沿识别指标体系可以较为准确地识别出前沿研究.
人工智能 LDA模型 社会网络 研究前沿
秦萍 朱立波 谢婷
南京航空航天大学科技信息研究所;南京航空航天大学工业和信息化智库评价中心 南京航空航天大学科技信息研究所
国内会议
重庆
中文
57-73
2019-04-26(万方平台首次上网日期,不代表论文的发表时间)