一种基于信息检索技术识别重复缺陷模式的方法
缺陷模式是对常见代码缺陷的统一描述。缺陷模式库收集这些模式,并为基于缺陷模式的静态代码分析工吴的研发提供支持。当用户向缺陷模式库添加新缺陷模式时,经常发生重复提交的现象,造成库中缺陷模式的冗余。提出了一种基于信息检索技术识别重复缺陷模式的方法,通过计算自然语言信息的相似度,发现语义相近的缺陷模式。实验表明,该方法能在节省用户和审核员精力的同时,有效地减少重复缺陷模式的数量。此外,还时缺陷模式的表示形式进行了设计,以有利于降低重复缺陷模式的数量。
缺陷模式 自然语言处理 信息检索
吴倩 王千祥
北京大学信息科学技术学院软件研究所 北京 100871 高可信软件技术教育部重点实验室
国内会议
广州
中文
508-511,563
2008-11-11(万方平台首次上网日期,不代表论文的发表时间)