基于轻量级卷积神经网络的单目深度预测研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:bueryuyu33
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
单目深度预测是计算机视觉领域中一项具有挑战的任务,而且在3D重建中占据着重要的组成部分。随着卷积神经网络的出现,使用深度学习进行单目深度预测得到愈来愈好的实验效果。但是,随着精度的提高,卷积神经网络模型的参数变得十分庞大。由于计算资源和内存的限制,将庞大神经网络广泛应用显得十分困难。因此利用轻量级的神经网络进行单目深度预测的想法应运而生,本论文基于轻量级卷积神经网络来研究单目深度预测问题,本论文主要的内容如下:设计了一种轻量级神经网络结构和新的损耗函数用于单目深度预测。首先,利用Mobile Net V2中的倒置瓶颈模块,设计了一种轻量级解码器和跳过-卷积-结合模块,构造了一种新的编码-解码的神经网络。接着,构造了一种新的损耗函数来训练卷积神经网络。与基于大型神经网络的单目深度预测结果相比,本文的网络模型在减少网络模型参数和计算复杂度的情况下能保证预测的精度。与基于轻量级神经网络模型的单目深度预测模型Fastdepth相比,除了延时稍差外,本模型深度预测精度、模型参数和计算复杂度均优于Fastdepth。利用加深加厚的Mobile Net V2、Mix Conv以及Efficient Net,设计了新的轻量级神经网络进行单目深度预测,计算复杂度和阈值精度的超越了剪枝前的Fastdepth。利用稀疏深度和单目图像作为输入,基于增加模型增加通道数和层数的方法设计了新的轻量级卷积神经网络,在引入较少的计算复杂度的同时大幅度地提高了单目深度预测的精度,新设计的神经网络在参数和计算复杂度方面优于先前的模型,而且在NYU Depth V2数据集上获得了较好的精度。将新设计模型应用于深度补全任务,取得了较好的实验效果。
其他文献
图像分割是一种关键的计算机视觉技术,其将图像的像素分为不同的具有区别性事务的块。多层次图像分割是图像分割方法的一种,可捕获目标的所有尺度,故被广泛运用到语义分割和区域建议生成等计算机视觉场景。多层次图像分割的结果可表示成树形结构,图像中目标根据分割粒度不同,分布在树中不同层次。尺度感知是从目标的多个分割尺度中捕获其合理分割尺度,是多层次图像分割方法实现图像分割的关键。本文基于已有多层次图像分割方法
20世纪20、30年代的摩登上海,是中西文化的交流场域,书籍设计作为一种文化载体不仅反映了时代的审美,更是成为那个时代的文化表征。文化的大熔炉也为中国现代书籍设计提供源源不断的创作资源,而叶灵凤作为那个文化场域的跨文化译介者,在受到从清末到民初繁杂的文艺思潮影响后,所做的书籍设计也成为了那个时代的表征。就将西方元素本土化的这一创造性过程,叶灵凤承担了一位审美现代性与启蒙现代性的推者,其创造性不仅在
网络是一种有用的模型工具,许多现实中的复杂系统都可以借助网络模型来进一步研究。社区是网络中一种重要的结构性质,它是由网络中联系紧密的节点构成的集合。同一个社区内的节点具有某种共性,因此社区体现了网络的局部特性,能够帮助人们挖掘和分析网络中所蕴含的知识。社区发现是检测网络中社区的主要方法,然而网络往往规模庞大且结构复杂,社区间的分界线不明显等为社区发现带来了巨大挑战。为了解决这些问题,本论文从重叠和
学位
轻型载货汽车在城市道路的公路运输中扮演着重要角色,而与此同时,消费者对载货汽车的品质有越来越高的要求,消费者越来越关注汽车行驶的平顺性与舒适性,使得车辆的振动性能成
乳腺癌是全世界范围内威胁女性健康最主要的癌症之一,而超声(US)是乳腺结节的主要影像学检查和术前评估之一。然而,在超声诊断领域,由于良性和恶性乳腺结节图像的相似表现形式,这使得诊断结果在很大程度上依赖于医生的经验判断。而且具有不同资历的医师的诊断准确性相差高达30%,因此,很容易导致误诊并增加不必要的穿刺活检率。近年来随着计算机科学的不断进步和医学方面的数据集的不断丰富,计算机辅助的医学诊断逐渐成
随着信息时代的不断进步以及电子产品的全民化普及,网络上代表着用户情感和观点的短文本内容呈现爆炸式的增长,传统的基于深度学习的中文情感倾向分类方法无法完全挖掘出这些评论的商用价值。为此,本文研究了中文评论短文本的情感倾向以及与互动率的关系,并设计实现了一个评论情感倾向与互动率预测系统。本文针对电影新闻相关的在线短文本评论数据,首先提出了一个基于LSTM的前融合情感倾向分类模型PF-LSTM,实现了不
目标跟踪作为计算机视觉领域的重要分支,已经广泛应用于智能视频监控、自动驾驶、军事侦察、医学诊断等领域。传统的目标跟踪算法在面对目标快速移动、模糊、物体形变、光照变化等复杂场景的时候,有着很大局限性。随着深度学习的发展,一系列基于深度学习的目标跟踪算法逐渐被提出,这些算法凭借着卷积神经网络强大的特征提取能力,极大地提高了目标跟踪的精度,在面对复杂场景时也有着更好的鲁棒性。但是基于深度学习的跟踪算法网
Hadoop作为典型的开源分布式数据存储处理框架,已成为商业化处理大数据的工具之一。Hadoop平台的应用与发展面临着诸多问题,其中Hadoop安全已成为关注的重点。Hadoop平台在数据分布式存储和并行处理过程中存在着一些安全漏洞,恶意用户利用安全漏洞获取数据或针对平台进行攻击,威胁着存储在平台的敏感数据和个人隐私。本文针对Hadoop平台的安全威胁与安全机制进行了分析与研究,主要的工作如下:(
振动数据采集系统凭借其高效、可靠、低成本和非入侵性等特点,在大型民用基础工程的结构健康监测系统中得到了广泛的应用。通过对振动信号分析,提取出的特征值可以为监测人员提供早期的警报,以便进行及时地维护。本文在研究了国内外相关知识的基础上,提出了一种基于FPGA+ARM的多通道振动数据同步采集系统,并且基于本文设计的硬件平台上实现了动态位移特征值的有效计算,本文主要工作如下:1.本文确定了多通道振动数据