视频内容审查系统的设计与实现

来源 :南京大学 | 被引量 : 0次 | 上传用户:lele
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,用户能够在互联网平台中随意发布视频内容,这些内容可能存在多种违规问题,平台需要对其进行审查。传统条件下以人工审查视频内容为主,这种方式准确度较高,但是随着平台的发展、用户生成内容数量的上升,人工审查的高成本与低效率已经远远不能满足要求。因此企业平台需要一个自动化视频内容审查系统,并且该系统能够在大数据量高并发的场景下保持准确性与高性能。目前新兴的趋势是使用神经网络识别视频内容中的违规问题,这是自动化审查的核心工作,但是已有的自动化审查系统在企业级应用中存在以下三个问题。一是视频内容违规识别准确度不高。已有的审查系统使用单个神经网络审查视频整体内容,但视频包含文本、音频、图像等多维内容,其中包含的违规问题类型复杂,仅靠单个神经网络难以覆盖视频中所有维度内容的违规问题。二是系统性能无法支撑大数据量级的高并发请求。已有的审查系统在面对十万级日吞吐量的情况下存在审查延时较长、资源消耗较高的缺陷。三是已有的审查系统缺少接入控制。系统无法标识并管理业务方,业务方可以随意接入审查系统,未经批准的接入请求会浪费系统资源,严重影响正常的审查流程。基于以上背景,本文设计并实现了一个面向高并发请求的视频内容审查系统。本系统使用微服务模式与责任链模式,为了解决上述问题构造了四个服务,分别是视频内容审查服务、视频流预处理服务、接入控制服务、内存缓存服务,具体如下:·针对违规识别准确度不高的问题,本文设计并实现了视频流预处理服务和视频内容审查服务。视频流预处理服务拆分视频内容,包括抽取视频中图像帧、提取音频并转换为文字。视频内容审查服务将上述拆分内容分发到不同的神经网络,每个神经网络只识别特定维度内容的特定违规类型,获得拆分内容的违规识别结果后,再结合已有的视频整体内容违规识别,综合所有识别结果能够有效提高准确度。此外,视频内容审查服务收集审查原始数据与结果数据作为训练数据,用于后续训练神经网络,持续提升违规识别的准确度。·针对高并发下系统性能不足的问题,本文设计并实现了高性能的视频内容审查服务和内存缓存服务。视频内容审查服务中使用消息队列进行异步通信降低阻塞;使用Redis数据库缓存数据包降低存取耗时;使用责任链模式将长链路抽象为任务链,多线程并发异步运行,提高系统审查性能。系统中各服务均多机部署,提升分布式处理能力。内存缓存服务将系统元数据缓存在内存中,避免系统频繁请求数据库导致的性能瓶颈,该服务通过触发器和定时器保证内存缓存的时效性。·针对系统缺少接入控制的问题,本文设计并实现了接入控制服务,该服务用于管理审核接入的业务方,为每个业务方抽象出一个接入点,审查时使用接入点标识业务方,过滤未经批准的接入请求,保证审查服务的正常流程。此外,本服务也能为业务方提供定制化的配置能力,并在视频内容审查服务中根据业务方的配置给出定制化反馈。视频内容审查系统已经在国内知名互联网平台上线运行,目前运行稳定,为两百位业务方提供服务,日吞吐量峰值达到五十万。
其他文献
硅烷偶联剂是一类含有两种不同化学性质基团的有机硅化合物,其分子一端是可水解的基团如烷氧基,另一端通过碳链与硅原子相连。硅烷偶联剂可以将性质差异很大的有机材料和无机材料偶联起来,制备出高性能的复合材料。但是在使用过程中,硅烷偶联剂会释放出挥发性小分子化合物,如甲醇、乙醇等,这会对环境和操作人员造成一定的影响。本文的研究目的就是将硅烷偶联剂水解制备出稳定的不含低分子醇的硅烷水溶液,并在水性体系使用。首
掌指关节炎是类风湿性关节炎的一种,具有起病隐匿、发展缓慢的特点,早期的主要临床表现为滑膜炎,该疾病如果不能得到及时的诊治,患者的骨骼会受到影响,临床症状也会由较轻的关节肿胀、疼痛演变为关节病变、关节功能丧失,严重情况下甚至有可能导致残疾。得益于无创伤、成像快、成本低等优点,超声检测已经成为临床上早期诊断掌指关节滑膜炎的主要手段。目前超声图像的阅片、评级工作仍然依靠专业医生人工完成,因而诊断不可避免
网络中包含大量数据,并且这些数据中蕴含着有价值的信息。网络大数据挖掘是利用数据挖掘相关技术从网络大数据中提取模式和知识,例如从网络中的用户历史行为数据中挖掘用户的兴趣信息、在网络时序数据中识别异常数据。目前研究人员已经成功地将深度学习技术应用于网络大数据挖掘的研究工作中,相比于传统的统计学算法,基于深度学习技术的算法的性能具有显著的提升。变分自编码器是一种深度生成模型,并且已经成功地被研究人员应用
燃烧反应遍布于日常生活中,也广泛存在于火力发电、冶炼金属、航空航天等工业化进程中。而火焰是燃烧反应的“可见形态”,对火焰温度场的研究既可以用来探索燃烧反应的演化规律、解释燃烧现象的本质特征,又可以给节能环保提供重要的科学依据。现如今,成熟的温度场测量方法所测的结果大多是二维的。而研究人员在这些方法上,通过搭建复杂的大型系统、经过繁琐的计算步骤,实现了特定火焰三维温度场的重建,但是这些三维温度场重建
超声测距已经被广泛应用于各类移动设备的定位和追踪。超声测距技术的发展对于下一代应用诸如虚拟现实/增强现实、人机互动以及室内定位等至关重要。相比于基于视觉以及基于射频信号的方案,本工作选择了基于声波的方案有以下考虑1)声波传播速度是电磁波的百万分之一,相比之下能实现更高的精度。2)得益于普遍集成的扬声器和麦克风,很多商用设备可以支持场景构建。3)采样率低、计算性能要求低、硬件价格低,因此处理成本比较
经典通信的安全性是基于求解大数问题的困难性,而随着计算机算力的增加乃至量子计算机的出现,经典通信的安全性受到了严重的威胁。而量子通信技术却可以从根本上保证通信的无条件安全性。近30年来,量子通信的研究不管是理论上还是实验上都取得了丰硕的成果。本文针对量子通信,分别研究了双方情景下的量子密码协议和多方情景下的量子网络通信,主要的内容如下:1)基于测量设备无关和错误估计,提出了两个新颖的双方量子通信协
在我国反洗钱领域,人民银行会定期对证券公司的交易数据进行稽查,要求公司上报洗钱交易数据。人民银行发掘真实洗钱数据并且与公司上报数据进行比对,如果公司存在漏报、误报的情况,则进行大额罚金处罚。其中,股票交易数据属于结构化数据,存储在关系型数据库中。由于表结构复杂,表与表之间关系繁多,可疑数据难以准确定位。因此,证券公司需要构造数据对自身交易合规监控软件进行测试。当前,测试数据通过反洗钱专员根据反洗钱
深度学习的成功依赖于大规模具有精确标记的数据。获取数据真实标记需要大量人力物力,代价昂贵。实际应用中标记通常由众包等廉价方式收集所得,往往带有噪声。如果盲目地使用带噪标记数据进行学习,深度神经网络的性能会受到严重影响。因此,如何处理噪声标记近年来成为研究热点。基于小损失准则(small-loss criterion)的样本选择方法是当前深度学习中处理噪声标记使用最为广泛的方法之一。这一准则从带噪标
日冕物质抛射物(Coronal Mass Ejection,简称CME)是在太阳大气中发生的最猛烈的爆发活动之一,通常携带大量的高能粒子,对空间环境和人类活动有着很大的影响。研究CME的活动迹象,有利于更加清晰地了解它们的运动过程,从而进行空间天气预警,降低灾害。目前的CME编目主要为手工制作和传统图像处理生成,手工编目具有明显的主观性和耗时性,而传统方法的识别结果总是存在一些误差。深度学习在目标
异质界面广泛存在于光电子器件中,对器件的性能起着至关重要的作用,是当今微电子技术蓬勃发展的基础。界面工程为提高有机场效应晶体管(organic field-effect transistors,OFETs)的器件性能以及开发新功能提供了一条有效且充满潜力的途径。目前,自组装分子单层(self-assembled monolayers,SAMs)用来修饰有机场效应晶体管中的关键界面已成为一种应用广泛