【摘 要】
:
手势交互是一种简单、自然、高效的人机交互方式,也是近年来自然人机交互研究的热点。对于简单手势交互场景,静态手势分类和手部姿态估计已满足交互场景需求,但近年来,随着VR、AR、元宇宙等概念提出,对手势交互场景也提出了更高的需求,比如实时且精确的动态手势识别、虚拟人物驱动、虚拟物品穿戴等。对手部语义的理解是手势交互系统设计的核心,为更好满足上述交互场景需求,我们将对手势交互相关基础算法进行研究,具体包
论文部分内容阅读
手势交互是一种简单、自然、高效的人机交互方式,也是近年来自然人机交互研究的热点。对于简单手势交互场景,静态手势分类和手部姿态估计已满足交互场景需求,但近年来,随着VR、AR、元宇宙等概念提出,对手势交互场景也提出了更高的需求,比如实时且精确的动态手势识别、虚拟人物驱动、虚拟物品穿戴等。对手部语义的理解是手势交互系统设计的核心,为更好满足上述交互场景需求,我们将对手势交互相关基础算法进行研究,具体包括基于骨架序列的手势识别,人手三维网格重建及轻量化应用。(1)针对骨架序列手势识别任务中,卷积算法中固定采样策略和远距离特征传递困难的问题,我们提出一种可变骨架序列特征提取模块DPM(Deformable Pose Module),通过额外的偏移量预测支路,自适应地对关键点、关键帧偏移量进行预测,实现更有效的特征采样。我们在多个手势公开数据集进行实验并均取得目前最好的识别结果,并且多重消融实验证明,我们提出的模块对噪声数据具有更强的鲁棒性和更好的多尺度特征捕获能力。(2)针对人手三维网格重建任务中的编-解码器方案,解码器只基于编码器输出单一尺度特征进行解码重建的局限性,我们探索了多尺度特征聚合对人手网格重建影响,提出基于多尺度特征聚合人手网格重建框架MS-HMRecon(Multi-Scale Hand Mesh Reconstruction)。我们尝试了多种多尺度特征聚合策略,包括:1)引入PAN(Path Aggregation Network),丰富编码器多尺度图像特征表达;2)对当前基于螺旋卷积的解码器进行优化,提出一种融合多尺度感受野的高效螺旋卷积解码器DSC(Dilated Spiral Conv);3)设计了多支路解码器结构,相比基于编码器输出单一尺度特征的重建方式,多支路结构可以充分利用不同层次图像特征实现更精细的网格恢复。在公开数据集Frei HAND上与现有公开算法进行对比,我们提出的重建算法取得目前最高重构精度。(3)针对应用中移动端人手三维网格重建需求,提出轻量化人手网格重建框架Light-HMRecon(Light Hand Mesh Reconstruction)。我们对Mobile Net V2中提出的逆残差模块进行重新设计,提出Rep LKIR(Rep-Large Kernel-Inverted Residual),结合大卷积核及模型重参数化方法,以少量计算量和参数量增幅为代价大幅提升模型性能。我们基于Rep LKIR实现了Light–HMRecon中各模块的轻量化,并结合移动端推理引擎NCNN完成模型部署。经过我们深度优化的Light-HMRecon,计算量约600M MACs,参数量约2.6 M,在i Phone 12 A14处理器上,推理速度超过100 FPS,基本实现实时交互的需求。
其他文献
<正>侵华日军"731"细菌部队进行细菌试验人员之来源大部分是由关东宪兵队"特殊输送"的。所谓"特殊输送",就是侵华日军关东宪兵队所属各宪兵队、宪兵分队、宪兵分遣队,将秘密逮捕的反满抗日者直接进行秘密审讯,然后将审讯报告逐级上报关东宪兵队司令部,经司令官批准并下达"特殊输送"的指令后,秘密地将其输送给"731"部队,进行惨无人道的细菌试验,直至残暴地杀害。从1938年至1945年,"特殊输送"人员
中共中央办公厅、国务院办公厅发布的《关于加强和改进乡村治理的指导意见》指出,农村集体经济组织构成了乡村治理的关键环节,亟需在完善和提升乡村治理的宏观框架内进行整体升级。农村集体经济是乡村的基本经济制度和物质基础,与农民切身利益直接相关。集体经济组织则是借助“一肩挑”的干部任职方式和集体产权制度改革两项举措,嵌入乡村治理场域中,与乡村权力配置和运行方式相互作用,对乡村治理产生深刻影响。本文以ZX村为
新时期,城镇化和工业化的不断推进要求国土空间更高强度开发,进而导致国土空间开发与保护格局显著重构。国土空间冲突加剧、土地资源利用粗放、建设用地扩张无序、优质耕地被占用的现象普遍,各类自然资源耗竭以及生态环境污染等问题愈发突出,发展与保护之间的矛盾日益凸显。在国土空间开发进程中,资源环境承载能力是限制国土空间开发的主要因素,而国土空间开发无序也带来各种各样资源环境问题,如资源约束趋紧、环境质量恶化、
表情是人际交往过程中情感表达的重要方式,也是情感计算中一个流行的研究领域。目前深度卷积神经网络无论是在实验室还是自然环境下的表情数据集中都取得了不错的表现。但这些方法一般基于通用的图像分类网络,因此往往需要大量的参数进行实现;其次表情识别的环境是多变的,但这些网络并没有很好的特征提取的方法;另外面对越来越复杂的表情识别任务,人工设计一个性能良好的表情识别模型越来越需要大量的时间成本和经验指导。因此
改革开放以来,国家将发展重心放在城市建设上,致使城乡经济长期处于非均衡化的发展态势,中心城区建设发展日渐集约紧凑,与此同时,农村地区基础设施不完善,居民点用地持续扩张等问题日渐严重,人地矛盾不断制约农村发展,导致城乡差距进一步扩大。农村居民点用地是农村人地关系的直接表现形式,实施科学合理的农村居民点用地规划对区域农村发展模式具有宏观调控作用。故本研究从市级角度出发,根据研究区的地方特色以及发展状况
治理有效是乡村治理提出的重要目标,创新乡村治理机制对实现乡村治理有效和我国乡村振兴战略的实施具有重要意义。目前创新治理实践呈现多元化态势,其中以“道德银行”模式为载体的治理机制受到了广泛关注。鉴于此,本文从历史脉络和政策变迁两个方面,梳理出基层政村关系大致分为依附性、竞争型、协同型三个阶段,是基层社会治理的基本问题,也是构建共建共治共享的社会治理新格局的内在要求。本文运用案例研究法和访谈法,根据实
吕梁山位于黄土高原东岸,作为山西省的生态屏障,也是省内重要的生态功能区,因其地理位置特殊,区域生态环境较为脆弱,长期以来受到高度关注。土壤污染、水土流失等一系列的生态风险突出;随着城镇化进程加快,人地矛盾日趋尖锐,区域生态安全隐患加大,影响山区人民的生活质量和社会经济的可持续性发展。本研究利用吕梁山2000、2010和2020年土地利用现状数据、社会经济等数据,基于景观生态学和遥感原理,运用Arc
婴幼儿时期是人类大脑发育最快的阶段,大脑的总容量将扩大到其初期体积的两倍。在这个期间,大脑在结构和功能上都是动态发展的,其功能将逐步完善,包括视觉、动作,以及一些高阶认知功能如自我意识、空间注意力和工作记忆等。对于婴幼儿脑发育的分析,包括认知能力评估和脑龄预测等,可以作为早期脑发育正常/异常分析和神经精神疾病诊断的重要生物标志物。婴幼儿大脑存在多个不同功能的脑区,以及具有复杂拓扑结构的神经元连接网
社会救助制度是社会保障体系的重要组成部分,具有保障国民基本生活、维护社会稳定和促进社会发展的重要功能。作为党中央提出的“五个一批”中“社会保障兜底一批”的组成部分,社会救助在治理绝对贫困中发挥了重要的兜底保障作用。进入以相对贫困治理为重点的后脱贫时代,贫困治理形势复杂多样,社会救助制度的发展面临着挑战,处于救助需求多元、资源整合和扩容增幅的关键时期,迫切需要政府和社会力量的通力协作。然而当前我国社