唇读中序列口型的分类 - 开源共享论文下载平台 - 信丰网

唇读中序列口型的分类

来源 :中文信息学报 | 被引量 : 31次 | 上传用户：lxget

【摘要】

：

本文针对汉语中所有声韵母发音序列中的连续口型提出了一种口型分类的思路。在建立了覆盖所有声韵母的汉语双模态语料库的基础之上 ,本文提出了一种两次分类的方法 ,对语料库中的图像进行唇的分割、定位及特征提取 ,并依靠选择的特征 ,将声韵母的发音序列中的口型聚为 15类。本文的目的是在此分类的基础上 ,明确唇读识别阶段的状态数 ,减小搜索的空间 ,提高收敛速度

【作者】

：

单卫姚鸿勋高文

【机构】

：

哈尔滨工业大学计算机科学与工程系

【出处】

：

中文信息学报

【发表日期】

：

2002年01期

【关键词】

：

唇读双模态语料库口型聚类语音识别 Lipred Bimodal Database Mouth Shape Classification Voice Rec

【基金项目】

：

国家高技术研究发展计划(863计划)，国家自然科学基金

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文针对汉语中所有声韵母发音序列中的连续口型提出了一种口型分类的思路。在建立了覆盖所有声韵母的汉语双模态语料库的基础之上 ,本文提出了一种两次分类的方法 ,对语料库中的图像进行唇的分割、定位及特征提取 ,并依靠选择的特征 ,将声韵母的发音序列中的口型聚为 15类。本文的目的是在此分类的基础上 ,明确唇读识别阶段的状态数 ,减小搜索的空间 ,提高收敛速度

其他文献

以词汇知识驱动的词网自动对映

机读字典蕴藏着非常丰富的词汇语意知识,这些知识可由自动化方式粹取出来,有效地利用在各种自然语言处理相关研究上.本研究提出一套方法,以英文版的WordNet作为基本骨架,结合

期刊

词汇知识词汇网络机读字典统计处理属类词自动对映自然语言处理WordNetmachine readable dictionarystatisti

基于目标驱动的多层MLLR自适应算法

本文在对语音识别中基于自适应回归树的极大似然线性变换(MLLR)模型自适应算法深刻分析的基础上,提出了一种基于目标驱动的多层MLLR自适应(TMLLR)算法.这种算法基于目标驱动

期刊

计算机应用中文信息处理语音识别模型自适应自适应回归树极大似然线性变换computer application Chinese informatio

播音主持言语交际与情感表达策略分析

在社会经济的发展进程中,播音行业取得了巨大的进步,同时也对播音主持提出了更高的要求。在信息化时代,播音的受众范围呈现持续扩大的趋势,使得播音行业的竞争压力很大,而播

期刊

播音主持语言交际情感表达

多文种环境下汉字内码识别算法的研究

汉字内码向ISO/ IEC 10646过渡是实现计算机用文字编码统一的必然趋势,但目前在一段时间内仍将存在多种汉字内码并存的情况,所以实现汉字内码的自动识别是保证汉字多内码并存

期刊

计算机应用中文信息处理多文种环境汉字内码识别算法computer application Chinese information processin

自然言语的韵律组织中的不确定性及其在语音合成中的应用

本文对自然言语的韵律组织中的不确定性及其对合成语音自然度的影响进行了初步探讨,并在此基础上,提出在韵律预测中用最小错误概率准则代替传统的最大生成概率准则,从而在预

期刊

计算机应用中文信息处理言语韵律的不确定性单元选择最小错误准则computer application Chinese information pr

其他学术论文