【摘 要】
:
验证码又称为全自动区分计算机和人类的图灵测试。目前,验证码在各类网站中,就是被用于区分恶意机器和合法人类用户的一层安全防御机制。网站中目前部署最多的验证码包括文本验证码、图像验证码,由于基于图像的验证码需要更大的带宽和更多的平台限制,所以文本验证码是目前验证码中部署应用最广泛的验证码。目前对于文本验证码的识别,大都还使用基于字符分割的识别算法,这种算法每识别一种验证码,就需要精心设计一个特定的分割
论文部分内容阅读
验证码又称为全自动区分计算机和人类的图灵测试。目前,验证码在各类网站中,就是被用于区分恶意机器和合法人类用户的一层安全防御机制。网站中目前部署最多的验证码包括文本验证码、图像验证码,由于基于图像的验证码需要更大的带宽和更多的平台限制,所以文本验证码是目前验证码中部署应用最广泛的验证码。目前对于文本验证码的识别,大都还使用基于字符分割的识别算法,这种算法每识别一种验证码,就需要精心设计一个特定的分割算法,过程十分的繁琐,且不具备不同验证码之间的普适性。随着深度学习技术的逐渐成熟,问题就会产生:首先,是否存在一种算法,无需预处理和字符分割,就可以端到端的整体识别验证码,其次就是,该算法是否具有良好的通用性和高效性。本文对上述的两个问题进行了深入的研究和探讨,本文的主要研究工作分为以下两部分内容:(1)提出一个端到端单步识别验证码的通用算法。从最早期的简单无噪声的文本验证码相继被研究者们破解后,验证码形式就逐步的向复杂的、难以辨认的方向发展。验证码图像中包含了复杂的图片背景干扰、字符粘连、扭曲,字符与字符之间难以找到一个有效的分割方法,这些都会给整体识别验证码带来一定的困难,所以为了能够最终达到较高的通用性和高效性,本文结合深度卷积神经网络,提出一个整体识别验证码的算法,该算法只需将验证码原图作为输入,经过训练可以直接得到输出,免去了预处理的流程,这也是该算法最大的优势之一。(2)验证该算法的通用性和有效性。首先,在线上验证码上验证该算法。挑选谷歌、百度、Yandex、微软验证码,用该算法进行识别。同时还从全球网站点击量排名前50的网站中挑选出的8个网站,包括11种不同形式的验证码。对于线上验证码,破解率为79.0%到98.3%。其次,在模拟生成的验证码上评估本文提出的方法。本文设计了一个验证码的生成系统,并用该系统生成了多种复杂度高的验证码,其中包括组合所有抵御机制、中文大字符集、图像风格迁移、选择机制、双层机制的验证码等。识别准确率在3.31%到99.97%,识别速度在0.14秒内。实验结果表明该算法具有高效性和实时性。本文还提出了一个通用的模型,可以使用一个模型同时识别多种不同的验证码。最后,本文对未来文本验证码的设计上提供了新的方向和建议。
其他文献
海冰在全球气候系统中扮演着重要的角色,通过影响大洋温盐环流以及大洋表面的物质、能量和辐射平衡从而影响全球气候。合成孔径雷达(Synthetic Aperture Radar,SAR)具有全天时、全天候工作能力,能够实时获取大面积的观测数据,成为海冰监测的重要手段。目前,我国正在开展地球同步轨道合成孔径雷达(Geosynchronous Synthetic Aperture Radar,GEO SA
协作通信技术因能扩大通信范围以及提高传输效率被广泛应用在无线通信领域,而选择协作分集方法又因其精简灵活的优点,成为协作通信领域重要研究方向,该方法优势在于降低了协
随着经济的发展,环境问题日渐突出,也驱动着研究者对亲环境行为(proenvironmental behavior/environmentally responsible behavior)进行更深入的研究。当前,物质主义已经成
光扫频激光器(Optical Frequency-Swept Laser,OFSL)相比较于传统的射频扫频激光器,具有扫频速率快、扫频宽度大等优点,因此它在光纤通信、光传感与光成像等方面具有很多的应
苯巴比妥(Phenobarbital,PHN)属于巴比妥类的镇静及安眠药,由于该药可促进动物生长而被一些饲料企业或畜禽养殖场滥用为动物饲料添加剂,从而导致畜禽产品PHN残留超标,不仅对人体的生理机能造成危害,甚至致敏、致畸等。随着国家对饲料与食品安全严格的监督管理,制备可有效从食品样品的复杂基质组成中准确富集与分离PHN痕量待测物的新型固相萃取材料,建立准确、高效与快捷检测动物源性食品中PHN残留
幼儿园时期的学前教育几乎关系着幼儿今后的身心健康发展,更对于幼儿在进入小学阶段学习前的基础有着重要的意义。为此,在幼儿园的教学就显得尤为重要。在新课改的不断深入下
随着云技术和机器学习研究的不断发展,二者相结合的新型云计算服务形式——机器学习即服务开始涌现出来。用户可以通过云服务提供商的数据存储和计算资源来解决用户本地资源受限的问题。通过这种形式用户可以利用云端更加强大的计算能力来进行机器学习模型训练任务,同时对于云服务提供商部署的、已经训练好的模型,用户也可以按需使用这些模型完成预测任务。这种形式覆盖了很多应用场景,如目前已经出现云服务提供商和医学研究机构
阅读理解监控(comprehension monitoring)是阅读理解元认知控制的一个方面,是个体评估其对信息理解状况的过程。阅读理解监控指导读者的认知使其理解传入的文本信息,是读者对
近年来,抗生素在禽畜中的应用日渐广泛,食物中抗生素残留问题,是人们不可忽视、必须严肃对待的重要问题。万古霉素和去甲万古霉素同属糖肽类抗生素,作为抗菌的“最后一线药物”,其药性较强,在其它抗生素对病菌无效时会被使用,被广泛应用于细菌感染的治疗和动物生长。我国禁止万古霉素的兽用,国家卫生部也将万古霉素列入“可能违法添加的非食用物质”名单中。目前国内外关于肉制品、饲料、牛奶、奶粉中万古霉素的检测方法报道
我国实施西部大开发战略政策以来,重庆市某区各种类型的复合型产业逐步整合优化,创新经济动力水平层次不断扬升,交通枢纽变得越来越便捷,车辆数量稳步递增,与此同时频频发生