会议专题

一种基于信息检索技术识别重复缺陷模式的方法

缺陷模式是对常见代码缺陷的统一描述。缺陷模式库收集这些模式,并为基于缺陷模式的静态代码分析工吴的研发提供支持。当用户向缺陷模式库添加新缺陷模式时,经常发生重复提交的现象,造成库中缺陷模式的冗余。提出了一种基于信息检索技术识别重复缺陷模式的方法,通过计算自然语言信息的相似度,发现语义相近的缺陷模式。实验表明,该方法能在节省用户和审核员精力的同时,有效地减少重复缺陷模式的数量。此外,还时缺陷模式的表示形式进行了设计,以有利于降低重复缺陷模式的数量。

缺陷模式 自然语言处理 信息检索

吴倩 王千祥

北京大学信息科学技术学院软件研究所 北京 100871 高可信软件技术教育部重点实验室

国内会议

2008全国软件与应用学术会议(NASAC”08)

广州

中文

508-511,563

2008-11-11(万方平台首次上网日期,不代表论文的发表时间)