可视语音合成相关论文
本文着眼于语音可视化,目的在于揭示真人的发音运动。首先,通过电磁发音仪(Electro Magnetic Articulography,EMA) AG500,以200帧/......
多媒体技术的发展使人类获取、处理信息的手段发生了质的飞跃,人机交互的方式越来越便捷、有效、人性化。多通道信息融合的研究正是......
当前可视语音合成技术研究的难点之一在于如何建立合理的口形描述模型,以及口形内唇的特征点定位。本文采取口形检测、口形分割、口......
具有真实感的语音同步可视语音合成是人机交互领域一个重要的研究方向,将具有语音动画的人头用在教学、广播、电子商务等领域,可提高......
人脸的计算机模拟长期以来一直是计算机图形学以及人机交互中非常活跃的研究领域,逼真的面部合成是计算机图形学中最根本的问题之......
提出了基于可视语音合成的3D通信技术概念。通信双方利用文本交换信息,用户终端采用可视语音合成技术对接收到的文字进行人物化朗......
为实现可视语音合成和双模态语音识别,需要建立符合条件的双模态语料库。该文提出了一种汉语双模态语料库的建立方法。根据视频中......
聊天室是人们在网上交流的一种重要手段,由于硬件设备、网络带宽的限制,目前广泛使用的聊天室只能基于文本和语音,不能基于人脸形象。......
为实现可视语音合成,建立符合条件的双模态语料库,提出双模态语料自动选取算法。根据视频中唇部发音特征,对已有的三音子模型归类,......
语音合成(speech synthesis)是指将文字转化为语音的一类技术,是实现人机语音交互系统的核心技术之一。而可视语音合成(visual spe......
为了合成具有真实感的视频序列,该文提出一种基于汉语视频三音素的可视语音合成方法。根据汉语的发音规律和音素与视素的对应关系,......
可视语音合成又称语音动画合成,是指根据给定的文本或语音,合成出与文本或语音相对应的脸部图像序列,加深人们对语言内容的理解。......
传统单音素对音节内部和音节之间的协同发音影响采用相同处理方法,为此,分析音节内部和音节之间两种不同协同发音现象对可视语音合......
在已经实现的"一个MPEG-4兼容的人脸动画系统"和基于KD2000的"一个MPEG-4兼容的语音动画系统"的基础上,又设计并实现了"一个基于SAP......
多媒体技术的蓬勃发展使媒体之间交互作用的研究越来越受到人们的关注。可视语音研究是媒体交互作用研究中的一个重要研究方向。在......