结合文本和抽象语法树比对的源代码同源性鉴别系统的研究与设计

来源 :北京邮电大学 | 被引量 : 5次 | 上传用户:iamssisy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机产业的不断发展,计算机软件所带来的巨大经济效益和社会效率,使得软件的价值越来越被人们所重视。如何保护软件的知识产权,维护软件开发者的合法权益,是值得研究的问题。源代码同源性鉴别技术能够为软件的知识产权提供很好的凭证。所谓源代码同源性鉴别是指比较两个或多个软件系统的源代码,找出它们的相同或相似之处,为软件知识产权提供有力的证据。目前,源代码同源性鉴别技术主要分为两大类,一类是源代码文本层面的鉴别技术,另一类是源代码语法结构层面的鉴别技术。基于文本的鉴别技术,其原理是比较源文件的字符,从而得到源文件的相似度,该技术实现简单,针对低级的代码抄袭手段,检测效果良好,已有很多成熟的工具。基于语法结构的鉴别技术,其思想是将源代码的语法结构抽象为语法树,通过比较语法树得到源文件的相似度,是一种深层次的鉴别技术,能够检测出比较复杂的代码抄袭,但由于其实现复杂,目前可利用工具较少。同源性的综合度量是一个比较新的领域,如何有效合理地综合利用多种同源性鉴别技术的分析结果是值得研究的课题。综合评价的技术分为定量和定性两种,都有各自适用的场景。本文在充分的理论研究和大量的实验基础上,设计了一种源代码同源性鉴别系统。该系统实现了基于文本和基于抽象语法树这两个层次的同源性鉴别,并提出利用多元线性回归分析和层次分析两种综合度量算法,从定量和定性角度,对两种同源性鉴别技术的分析结果进行综合度量,使得鉴别结果更加完善。
其他文献
通过地表地质调查和钻井资料,对第四纪洞庭盆地南部赤山隆起及其西侧安乡凹陷的沉积和地貌特征进行研究,进而探讨二者的升降过程。赤山隆起为居于洞庭盆地南部的小型抬升断块
现今社会已全面进入信息时代,图书馆也进入了一个全新的时代,因此与之相关的各个方面都进入了新阶段的探索中。在图书馆与图书供应商之间的合作上,本文强调建立双方持久稳定
随着造纸业的迅猛发展,造纸机运行车速的高速提升,对其压榨部脱水提出了越来越高的要求。而造纸机的脱水关键部件是压榨部,其最佳压榨形式为靴式压榨。通常情况下对于不同纸
摘 要 目的:探讨中药配合交锁髓内钉在治疗股骨干骨折中的应用及其疗效。方法:将32例股骨干骨折患者,采用锁髓内钉内固定治疗,术后给予自拟中药汤剂,每日2次口服,3个月为1个疗程。结果:所有患者随访8~26个月,术后30例对位、对线满意,骨折平均愈合时间18周,4例延迟愈合,无主钉或锁钉断裂,无肢体短缩、功能障碍,优28例,良3例,中1例,优良率96.9%。结论:中药配合交锁髓内钉是治疗股骨干骨折的
在电子期刊资源二次开发的基础上,建立中文期刊资源导航系统,借助于统一检索平台,将电子期刊资源检索系统与馆藏OPAC有效链接,使读者在一个入口、通过一次检索即可获取全方位的不