会议专题

应用LDA主题模型的Web API分类研究

Web API是Web应用程序接口的简称,通常使用半结构化的HTML语言来描述.Web API作为轻量级的Web服务,因为其简单、轻便和容易调用等特点,而受到广泛欢迎.随着互联网上发布的Web API数量的迅速增长,Web API的发现成为了一项具有挑战性的工作.对Web API进行高效、准确的分类,可以为Web API的发现提供有效的帮助.然而,由于Web API数量的庞大,对它们的分类是一项工作量相当大的任务.因此考虑了Web API的名称、描述、标签等信息,使用LDA(Latent Dirichlet Allocation)主题模型对Web API文本进行建模,得到Web API文本的主题分布,然后运用自动分类方法,对Web API进行分类.在1197个Web API文档集合上进行15个类别的分类实验表明,基于LDA主题模型的Web API分类算法比传统的基于向量空间模型的分类方法效果更好.

互联网应用程序接口 文档主题生成模型 主题分布 自动分类方法

谢芬方 刘建勋 唐明董 周栋 曹步清

湖南科技大学知识处理与网络化制造湖南省普通高校重点实验室,湖南湘潭411201

国内会议

第六届中国计算机学会服务计算学术会议

咸宁

中文

217-224

2015-11-07(万方平台首次上网日期,不代表论文的发表时间)