基于MRI发音器官的三维建模

来源 :天津大学 | 被引量 : 0次 | 上传用户:hyman_han
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音是信息传播的重要方式,那么言语是如何生成?人机交互中机器人将如何与人交流等等问题早已经在国际上进行了大量的研究,但是基于中文普通话的研究还很少。本文基于MRI图像对中文发音语料库进行了三维建模,试图去揭示中文发音器官的运动特性。本文使用MRI(磁共振成像)扫描仪采集了104组不同发音状态下的头部断层图片,这些断层图片蕴含着声道三维信息,但是缺少口腔中骨质信息(牙齿)。利用CBCT(锥形束计算机断层成像)对于骨质结构具有较好成像功能这一优点,将CBCT获取上下牙的数据叠加到MRI图像中,弥补了MRI缺少骨质结构的这一缺点,从而对声道进行三维建模。在勾勒发音器官轮廓时,我们考虑了发音器官的生理边界,来保证发音器官的标注的准确性。同时,我们参考了发音器官的解剖结构,主要选定了骨质结构的边界作为锚点,以确保不同发音状态下器官标注的一致性。标注过程中有些器官从单一视角难以得到完整的轮廓信息,我们通过不同视角对发音器官进行标注,然后再将器官轮廓数据进行融合,最终得到完整的发音器官。我们使用大量的点来标注发音器官轮廓。器官表面由众多的顶点表征,形成点云数据,这些离散点之间按照一定的规则进行排序,最后点与点之间进行连接,形成表面三角形的三维网格来逼近发音器官的表面形状。采用线性成分分析法对构建的三维几何模型抽取了少量的控制参数(下颚2个,舌头3个,上下唇各2个,软腭2个,咽腔壁3个),实验结果表明使用这些控制参数可以有效的描述发音器官的位置和运动形态,重构均方根误差均小于0.2cm。
其他文献
发展清洁能源是我国能源发展的必然选择,也是实施可持续发展国家战略的必然要求。在一定政策的支持下,我国清洁能源占比突破20%,清洁化进程加速,产业规模不断壮大。然而,我国
螺旋波在不同的物理、化学和生物系统中普遍存在.周期外场,比如极化电场,尤其是具有旋转对称性的圆极化电场可对螺旋波动力学产生重要影响.本文综述了极化电场对可激发介质中
本文从伦理层面 ,以边缘人的本质属性与全面发展为切入点 ,指出边缘人的主体建构必须建立在道德伦理基础之上。同时 ,本文论述了边缘伦理学研究对人文学科发展的影响和推动 ,
随着现代医学的快速发展,乡镇卫生院在医学领域里肩负的责任越来越重。检验医学在疾病的诊断、分析、治疗、预防等方面发挥着巨大作用,为现代乡镇卫生院医疗水平和服务质量的
我国是一个农业大国,有近9亿人口生活在农村,建立健全农村社会医疗保障机制,既是发展社会主义市场经济的需要,也是全面建设小康社会的重要内容,还是建立和谐社会不可缺少的"
试验采用单因素筛选试验对酵母菌固态发酵处理玉米秸秆等农副产品制备酵母培养物的发酵条件进行了研究。结果表明,酵母培养物的适宜固态发酵条件为接种量0.10%、含水量50.0%