【摘 要】
:
目前,在国内外高校教育中,作业抄袭现象普遍,尤其是在计算机类课程中,源代码抄袭的情况更加严重。因此,对源代码抄袭检测技术的研究具有重要意义。本文研究了现有系统以及现
论文部分内容阅读
目前,在国内外高校教育中,作业抄袭现象普遍,尤其是在计算机类课程中,源代码抄袭的情况更加严重。因此,对源代码抄袭检测技术的研究具有重要意义。本文研究了现有系统以及现存检测算法,发现这些算法和系统存在着的不足。例如,多数系统只提供一种检测算法,不同的检测算法的适用范围是不同的,用户不能够根据自身需要选择合适的检测算法。在实际检测中,本文同时也发现了一些因素会给检测带来噪音,影响相似度的计算。例如,大量重复的变量声明语句,以及抄袭者对源代码的改动。本文设计并实现了一个源代码抄袭检测系统PlagiarismChecker,其包含四种检测算法。用户可以选择不同的算法及这些算法组合进行检测,可以设置相似度阈值过滤结果,还可以利用PlagiarismChecker提供的系统接口方便地实现及应用新的检测算法。本文提供了一个Web应用Catcher提供在线的源代码检测服务,以邮件形式返回检测结果。本文通过实验证明了PlagiarismChecker是有效的,它能够比原有系统检测出更加多的抄袭作业对。针对实际检测中存在的噪音问题,在基于抽象语法树的检测算法上,本文提出使用归一化算子解决这个问题。本文设计并实现了五个算子,证明了能够通过归一化算子这种方式有效消除噪音。本文同时改进了PlagiarismChecker系统,使得系统能够很方便地添加新的算子,可以应对新发现的抄袭手法。
其他文献
近年来,港口物流促进区域经济发展成为热议的话题,尤其是京津冀协同发展策略提出以来,环渤海湾的港口物流的发展就成了热点中的热点。通过发展港口物流,不仅可以使该行业的成
目的比较腹腔镜根治性膀胱癌切除术后行回肠膀胱术和输尿管皮肤造口术的疗效。方法选择行腹腔镜根治性膀胱癌切除术后患者90例,随机分为A组和B组,均45例。A组采取回肠膀胱术,
2018年,传媒生态、媒体业态和媒介形态都随着技术的发展而发生一系列的变革。各类传播平台走向移动化、社交化、视频化、智能化的进程中,出现了许多新情况、新问题。本文梳理
混合蛙跳算法是2003年由Eusuff和Lansey提出的一种基于群体智能的生物进化算法。该算法具有概念简单、参数少、计算速度快、全局寻优能力强、易于实现的特点,目前在水资源网
<正> 祖国医学关于脾胃为人体气血生化之源,“后天之本”的认识是颇深刻的。但脾胃在人体中究竟居于何种地位呢?我认为:在体内“阴阳消长”,“气血生化”,的生理性矛盾运动中
<正> 脏腑学说中有关脾胃的论述内容丰富,是祖国医学的重要遗产之一。脾胃学说的代表著作首推元代李东垣的《脾胃论》与《内外伤辨》二书,既继承了前代学说又提出新的见解,有
哥特式小说始于十八世纪后期的英国,是浪漫主义文学的一个特殊流派。尽管哥特式小说只是作为一种边缘文学被时常提及,然而其身影在文学延续发展的流程中一再地浮现并一直延续
南宋李东垣所著《脾胃论》一书问世后,“内伤脾胃,百病由生”的理论,对中医治疗慢性衰弱性“内伤”疾病开辟了广阔的前景。后世医家批评东垣“擅用辛燥升补”的为数不多,但
随着城市规模的急速扩张和人口的过度集中,大中型城市的交通拥堵问题已经成为制约城市发展的主要因素。城市快速路的修建可以有效缓解大中型城市交通拥堵问题。但是随着城市
随着我国的民事诉讼审判方式改革的深入进行,保障当事人的辩论权的充分实施,可以强化当事人的程序主体地位,防止突袭性诉讼,确保诉讼的正当性,提升法院裁判的既判力和当事人