三维表情识别中的张量表示及分解算法与理论研究

来源 :北京交通大学 | 被引量 : 1次 | 上传用户:narflgvdh1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
表情是人们日常交流中表达情感的主要方式,随着互联网的日益普及和人工智能的不断发展,表情识别技术一直备受关注。本文以三维表情为研究对象,结合流形学习方法和张量分解技术,针对基于张量表示的特征提取算法进行了研究。论文的主要工作包括:(1)结合三维曲面的几何特性,在三维表情数据中不仅提取了传统中常用的深度图,还通过局部曲面拟合计算了每个数据点处的法向量和曲率,将它们映射到二维空间后得到了 5种特征图像,以此作为表情的特征描述。实验结果表明,这些几何特征能够有效地改善识别结果。(2)结合张量数据的特点及流形学习方法,提出了基于张量距离的正交张量边界Fisher分析算法。该算法首先基于张量距离来寻找样本近邻,并根据图保持嵌入准则得到优化模型,然后在此目标下求解一组基张量以得到样本的低维表征。与传统的欧式距离相比,张量距离更能反映高阶数据之间的相似性,它不仅考虑了样本间对应元素的关系,也充分考虑了样本自身的空间结构,使得学习到的流形更加接近表情空间的真实流形,有助于识别率的提高。通过实验发现,该算法能够达到较好的识别效果。(3)考虑到表情发生时脸部肌肉运动的局部性,提出了基于距离加权的正交张量边界Fisher分析算法,该算法将特征图像进行了分块,并结合熵加权的思想给每个子块赋予不同的权值,通过子块张量距离的加权和来衡量样本之间的距离,有利于构建准确反映数据集内在结构的图模型,提高算法的鉴别能力。实验结果证明了该算法的有效性。(4)针对本文提出的算法设计了一个三维表情识别系统,能够很直观的展现各算法的识别结果。系统包括了预处理区、训练区、测试区和显示区四大部分。
其他文献
目的:系统评价ADAM17蛋白在胃癌中的表达及其与临床病理特征的相关性。方法:以胃癌(gastric cancer)的主题词及自由词、去整合素-金属蛋白酶17(ADAM17)的主题词及自由词在Pub
农村经济的发展不仅是国民经济发展的基础,也是社会持续发展的“基石”,在此过程中农村金融的发展十分关键,作为正规金融体系的补充,民间金融机构的发展不容忽视,截至2016年6
在这篇文章中,我们设n维流形M具有黎曼度量g和正交联络▽,且引用Cartan关于正交联络的一些结论来做一些工作。在第一章中,我们介绍E.Cartan工作,即他把正交联络的挠率张量分
含分数布朗运动的线性模型的研究是概率统计分析中一个很重要的研究课题,其模型参数的有效估计特别是方差的估计,在计量经济与金融方向也有着广泛的应用.本文主要是对含分数
《国家中长期教育改革和发展规划纲要(2010-2020年)》指出,要“推动普通高中多样化发展。促进办学体制多样化,扩大优质资源。推进培养模式多样化,满足不同潜质学生的发展需要
随着工业化的高速发展,越来越多的环境问题已开始在全球范围内凸显。环境污染问题已成为当今世界所面临最严峻的问题之一,国家范围内环保政策的制定与实施是人们日益关注的焦
改革开放以来,为严厉打击贪污腐败行为,解决调查取证环节遇到的诸多障碍,我国推出了一种具有中国特色的特殊措施——“双规”。行使双规的权力机构并非执法部门,而是中国共产
目的:通过研究磷脂酶Cβ1(Phospholipase Cβ1,PLCβ1)在肝细胞癌(hepatocellular carcinoma,HCC)细胞和组织中的表达及其与临床特征的关系,探讨其对HCC细胞增殖及预后的影响。方
变频调速驱动系统的直流侧需要滤波器实现前后端的功率解耦。常见的无源直流侧滤波器有含铝电解电容的LC型滤波器和大量薄膜电容组成的C型滤波器,直流侧滤波器中的电容称为DC-link电容。电容作为电力电子变换器中最脆弱的器件之一,其可靠性评估对系统的安全可靠运行具有重要意义。已有文献讨论过单个变频调速驱动系统中DC-link电容的可靠性。在大多数应用中,常常是多台变频调速驱动并联挂网运行。在多变频调速驱
学位
随着社会的进步发展,商业银行的员工绩效考核管理备受关注,各大商业银行绩效考核机制尚待完善,如何加强员工管理、提高业绩、完善绩效考核制度成为一个迫切性的研究课题。本