【摘 要】
:
在虚拟教学中,授课教师的地位举足轻重,而虚拟教师授课主要通过直观的面部表情传递信息,因此面部合成的实效性至关重要。但传统的面部表情合成方法,存在因驱动复杂拓扑结构模型出现的局部失真、细微表情欠缺现象,因计算量较大带来的延迟现象等。为此本文基于面部高质量建模和面部表情实时驱动两部分关键技术进行了深入研究,有效提升了合成面部的真实性和实时性。在三维面部建模方面,本文在传统纹理映射的基础上针对拼接重合点
论文部分内容阅读
在虚拟教学中,授课教师的地位举足轻重,而虚拟教师授课主要通过直观的面部表情传递信息,因此面部合成的实效性至关重要。但传统的面部表情合成方法,存在因驱动复杂拓扑结构模型出现的局部失真、细微表情欠缺现象,因计算量较大带来的延迟现象等。为此本文基于面部高质量建模和面部表情实时驱动两部分关键技术进行了深入研究,有效提升了合成面部的真实性和实时性。在三维面部建模方面,本文在传统纹理映射的基础上针对拼接重合点较少、侧脸效果失真、衔接处拼接效果差等不足提出了基于正面及左右侧面照片的纹理合成方法。通过设定一个标准纹理模板,基于四角网格的图像变形算法、仿射变换进行分区域映射,建立出更具真实感且与表演者高相似度的面部纹理。生成模型后,针对模型与表演者面部特征点之间的匹配度低、特定器官容易出错的问题,提出了建立模型特定器官特征点局部坐标系的方法对模型的特征点数据进行优化,实现了模型与表演者面部的精确高质量匹配。在面部实时驱动方面,本文针对传统方法生成复杂面部表情时局部失真、延迟等问题,提出了基于肌群分布的径向基函数(Radial-Basis Function,RBF)插值变形人脸表情驱动算法。将面部划分成三个区域分别进行插值,根据肌肉模型选取控制点,减少非必要的面部数据,优化了面部合成效率,从而提高了表情重构的实时性。为了实现逼真的面部表情合成,使模型的皱纹等细微面部特征更加接近真实表情,提出了一种创建皱纹表的纹理合成方法,该方法可以根据目标表情,提取并合成适当的表情性皱纹,最终得到更贴合表演者的细微表情特征。为了验证本文提出算法的有效性,本文展示了12个较为复杂表情的合成效果,并完成了多种表情驱动算法下合成表情的精度和速度对比。实验结果表明,本文提出的基于正面及左右侧面照片的纹理合成算法、基于肌群分布的RBF面部表情驱动算法和细微表情合成算法生成的人脸不论是在质量上还是在时效上均满足虚拟教师系统需求,并已推广至大中小学教育、宣传片制作等领域。
其他文献
随着时代进步科技发展,控制理论从经典控制理论发展到现代控制理论再到现如今与人工智能技术的结合,无不是人类科技进步史上重要的里程碑。本文意在通过一种通用的技术手段,将先进的控制算法应用到可编程逻辑控制之中,解决控制实践和控制理论脱节问题,做好衔接从而促进两方面共同发展。本文对过程控制中的液位控制系统相关理论进行介绍,基于质量守恒定律完成了单容和双容液位系统控制模型的建立并推导出传递函数和状态空间方程
施工升降机作为高层建筑施工中主要的载人载货机械设备,其运行状态的健康状况直接决定了高层建筑施工的效率和安全性。随着物联网与“工业4.0”时代的到来,对施工升降机进行健康化、智能化管理的需求也日趋迫切。因此,面向分布在异地的各种类型施工升降机设计通用的远程监控系统,并进一步对监控平台采集到的数据进行深层次数据挖掘,通过建立行之有效的健康评价模型,评估设备的运行状态,给出设备维护、更新的科学性指导意见
经过近几十年的发展,我国终于跻身于世界制造与出口大国的行列。五轴数控技术是航空航天、船舶、模具、高精密仪器等军用与民用装备领域的关键技术,也是我国由世界制造大国迈向世界制造强国的重要基石。五轴数控技术的出现能充分发挥数控技术在自动化加工方面的潜力与优势,但它同时也是数控领域中实现难度较高的技术之一。我国五轴数控技术总的来看仍然落后于发达国家,比较典型的如面向五轴数控加工的NURBS样条插补技术。因
随着现代制造业的高速发展,人们对于数控机床加工精度的要求也越来越高,电主轴作为数控机床的核心部件,其固-热耦合特性的好坏影响了机床加工精度的高低。本文以传热学、热弹性力学、摩擦力学等理论为基础,分析了电主轴单元的固-热耦合机理,并在固-热耦合特性的基础上提出了电主轴冷却系统的改进方案。得到成果如下:基于Jones轴承模型,建立了综合考虑热效应和离心力效应的角接触球轴承载荷-位移模型,对轴承的固-热
如今,目标识别算法在计算机视觉研究的领域中依然是热门的方向,但目标识别算法的应用面临着巨大的挑战。现有的目标识别算法大多数是在高功耗、高性能的GPU平台上应用,才能达到高识别速度的要求。而针对一些功耗和资源受限的特定场景,尤其是要求强实时性的场景。部署目标识别算法就变得非常困难。为了解决这一问题,一部分研究者通过优化目标识别算法,减少目标识别算法的参数量和降低目标识别算法的计算量,这一类的算法被称
建筑行业在我国经济发展中占据重要地位,它创造了大量的GDP,同时也提供了大量的就业岗位。然而传统的建设工程领域中存在诸多问题。如因为设计不足导致的变更频繁,生产效率较低,资源浪费较为严重等问题突出。因此在我国的建设工程项目中,有75%以上的项目超支严重,70%以上的项目进度超期。针对上述问题,本课题提出了针对BIM技术的项目管理,将BIM技术引入到EPC项目的成本管理中,有针对性的解决EPC项目设
随着人工智能,深度学习越来越多的引人注目,图文匹配就是其中的一项任务。图文匹配任务是指给定一个图像和众多文本内容,要求机器在对图像理解的基础上对图像和文本进行匹配,选出和图片最接近的一段文字。图文匹配涉及语义理解、图像检测与识别、知识推理等相关技术,要求机器以人类的方式来理解图像,这也是人们对人工智能的期望。因此对提升机器人等人工智能系统的智能程度具有十分重要的作用。通常来说,图文匹配任务需要同时
随着互联网的发展,越来越多的人喜欢在探索新兴趣点(POI)的同时,使用签到(Check-ins)的方式将其分享给基于位置的社交网络(LBSN)上的其他用户。通过分析用户的签到数据,基于LBSN的推荐算法可以挖掘出用户的潜在行为模式,为用户推荐其可能会感兴趣的兴趣点。但是由于LBSN中包含的兴趣点遍布世界各个角落,从如此多的兴趣点中准确找到用户可能会喜欢的兴趣点是非常困难的。并且面对庞大的数据量,计
在种植牙领域,植牙前方案规划具有十分重要的意义,它直接影响着种植手术的结果。基于CBCT数据与三维牙模扫描数据的自动模拟种植牙系统提供一种缺失牙参数计算方法,可以大大提升植牙规划效率,提高手术成功率;还提供一种半自动的种植参数可视化方法,加强了系统的灵活度和可操作性。针对目前植牙规划效率较低的问题,本文提出了一种基于CBCT数据与三维牙模数据的缺失牙参数计算方法,首先对CBCT数据进行基本的三维重
深度学习已在计算机视觉和自然语言处理两大领域都获得了巨大的成功。视觉问答(Visual Question Answering,VQA)作为横跨计算机视觉和自然语言处理两大领域的引用,是指给出一个语句问题和一个对应的图片,需要智能系统能够理解图片,在此基础上对问题做出回答。随着数据量的爆发式增长,作为视觉问答其中的一个应用,如何根据问题,在一个图集中找到对应的图片,根据图片再给出回答是一个亟需解决的