唇读中序列口型的分类

来源 :中文信息学报 | 被引量 : 31次 | 上传用户:lxget
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文针对汉语中所有声韵母发音序列中的连续口型提出了一种口型分类的思路。在建立了覆盖所有声韵母的汉语双模态语料库的基础之上 ,本文提出了一种两次分类的方法 ,对语料库中的图像进行唇的分割、定位及特征提取 ,并依靠选择的特征 ,将声韵母的发音序列中的口型聚为 15类。本文的目的是在此分类的基础上 ,明确唇读识别阶段的状态数 ,减小搜索的空间 ,提高收敛速度
其他文献
机读字典蕴藏着非常丰富的词汇语意知识,这些知识可由自动化方式粹取出来,有效地利用在各种自然语言处理相关研究上.本研究提出一套方法,以英文版的WordNet作为基本骨架,结合
本文在对语音识别中基于自适应回归树的极大似然线性变换(MLLR)模型自适应算法深刻分析的基础上,提出了一种基于目标驱动的多层MLLR自适应(TMLLR)算法.这种算法基于目标驱动
在社会经济的发展进程中,播音行业取得了巨大的进步,同时也对播音主持提出了更高的要求。在信息化时代,播音的受众范围呈现持续扩大的趋势,使得播音行业的竞争压力很大,而播
汉字内码向ISO/ IEC 10646过渡是实现计算机用文字编码统一的必然趋势,但目前在一段时间内仍将存在多种汉字内码并存的情况,所以实现汉字内码的自动识别是保证汉字多内码并存
本文对自然言语的韵律组织中的不确定性及其对合成语音自然度的影响进行了初步探讨,并在此基础上,提出在韵律预测中用最小错误概率准则代替传统的最大生成概率准则,从而在预