×

基于多特征权重分配的源代码搜索优化

消耗积分:1 | 格式:rar | 大小:0.95 MB | 2018-04-17

分享资料个

  在软件开发过程中,代码复用是提高软件开发效率的重要手段。目前,互联网中积累了大量的开源代码,如知名开源库GitHub、OSChina、CodePlex等。在编制程序时,程序员可以对这些开源代码进行复用,从而降低开发成本。代码搜索是对其复用的前提。如何从开源软件中准确地提取高质量的代码资源并复用到软件产品中,是提高软件开发效率需要解决的重要问题。

  针对代码搜索算法输入的不同形式,当前已经出现了基于关键字、接口、输入输出等形式的开源代码搜索引擎。不同于其他输入形式的搜索方法,由于方法签名是开发者通过一些能表达方法功能的词语根据驼峰命名法则命名的,所以基于关键字的搜索在匹配方法签名时往往更能体现方法功能的匹配;但针对面向对象语言开发的开源软件,当前基于关键字的搜索没有考虑其源代码具有多种代码特征,或者只考虑了用户查询语句与方法签名的单一匹配而忽视了源代码的其他重要特征如注释、类名等。比如源代码注释是对代码功能的描述,其中含有能体现方法功能的大量信息,这些信息对搜索特定功能的源代码是有帮助的。同理,类名中也含有少量体现代码功能的信息,而且源代码中各特征之间会有一定的联系。匹配时不能仅仅匹配单一方法名或者将多个代码特征转化成纯文本进行搜索而不考虑各代码特征的重要度,因此,将方法签名、源代码注释、方法体等代码特征结合起来应用于代码搜索中。
 

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论(0)
发评论

下载排行榜

全部0条评论

快来发表一下你的评论吧 !