中文文档与源代码间关联关系提取方法的研究
软件包括软件文档和源程序代码,发现和维护软件文档与源代码间的关联关系,对程序理解、软件维护、需求跟踪等许多软件工程活动提供很大的帮助。本文提出了一种提取中文软件文档与源代码间的关联关系的方法,根据中文软件文档和源代码的特征,在潜在语义索引模型的基础上使用了三种策略:引入项目数据词典辅助中文分词和中英文的翻译、将文档按类型分层以实现反馈、调整代码中的特征项的权值。实验结果表明,三种策略可以在提取阀值C相同的情况下,提高查全率10%~30%;在查全率不变的情况下提高查准率5%~20%。
信息检索 可跟踪性链 逆向工程 中文文档
韩晓东 王晓博 刘超
北京航空航天大学计算机学院,北京 100191
国内会议
南宁
中文
912-916
2009-07-17(万方平台首次上网日期,不代表论文的发表时间)