局部增强的多特征融合深度学习模型研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户：kimimoomoo

【摘要】

：

【作者】

：

刘镇

【机构】

：

北京邮电大学

【出处】

：

北京邮电大学

【发表日期】

：

2021年01期

【关键词】

：

特征提取唇读局部增强多特征融合

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着数十年数据、硬件、理论、技术为科技闭环的飞速发展,人机智能交互朝着更加智能、便捷、自然的方式不断发展。特征提取算法作为人机交互领域发展的基石,在本质上决定了机器感受客观世界的能力。唇读任务作为人机交互领域最具挑战的课题之一,旨在通过观察说话人的唇部动作获得说话内容。特征提取模型在唇读任务具有非常重要的研究价值,在源头上决定了唇读模型整体性能的上限。为了促进唇读的工业落地,提高唇读模型的性能就显得尤为重要,其中对模型性能最重要的模块就是提取唇部特征的特征提取算法。分析唇读特征提取模型的发展历史,挖掘唇读特征的空间、时序特性,立足于当前特征提取模型进行研究。唇读任务具有整体协同的空间强相关性,仅仅依靠局部特征的累积无法更好地进行表征这种特性,本文提出全局特征,通过全局特征和局部特征的相互传播来增强局部特征之间的联系,达到整体协同的目的。唇读任务同样具有强时序性,具体表现在连续发音、中文同音字等现象。本文引入光流思想来提取唇读时序特征,意在增强整体特征的时序性。由于时序结构和原有网络存在异构的问题,多特征融合的问题随之产生。本文最后比较了三种多特征融合算法,选取最优性能的算法作为多特征融合算法。为了验证本文三个改进点的有效性,最终的融合架构分别与局部特征复用的ResNet增强版本DenseNet、引入光流空间增强唇读特征时序性的双流网络进行比较,本文中的融合架构获得了更加优秀的性能。这也从结果上证明了唇读特征具有强相关的空间性和时序性,本文提出的模型也能更好地表征唇读特征。

其他文献

LEO卫星网络中基于网络拥塞预测的TCP拥塞控制算法研究

随着通信技术的快速发展,卫星通信技术日益成熟,低轨（Low Earth Orbit,LEO）卫星网络逐渐融入到下一代网络基础架构中,其能为移动通信、导航和气象等领域提供各种服务。但是低轨卫星网络中的链路非稳定性以及频繁的网络拓扑切换,导致网络链路的高动态性,造成现有的TCP拥塞控制机制难以提供稳定的高吞吐量性能、高自适应的传输性能。本文分别针对低轨卫星网络链路的非稳定性、链路高动态性的特点提出了如

学位

低轨卫星网络TCP拥塞控制高动态非稳定

波前像差仪在屈光不正检查中的应用

近年来,人眼视觉和成像质量的评价研究逐渐受到了眼科医生的重视.目前临床上使用较多的视光检查方法,包括视力检查、主客观屈光验光、对比敏感度等,都是以大脑知觉为基准,通过对客观物理刺激进行主观评价的心理物理学方法,通常会受到被测试者的情绪、心理状态及理解力等因素的影响.此前波前像差仪在临床上主要用于检测眼的高阶像差,用于个性化角膜切削手术方面,因此大量的研究报道也集中于此,相比较而言,对人眼低阶像差(即“眼的屈光状态”)的测量研究则很少.本文旨在探讨Visionix L80波前像差仪在屈光不正检查中的应用,希

期刊

屈光不正波前像差仪

局部增强的多特征融合深度学习模型研究

其他学术论文