语音触发SOC芯片的软硬件协同设计及低延时方案

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:youyouwoyou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,非接触式人机交互以其方便快捷的特点受到广泛关注。而自然语言作为人类主要的沟通方式,其与机器识别技术相结合的交互方式因具有非接触式交互的诸多优点成为人工智能领域的研究热点之一。随着语音识别技术的进步,人们已经可以通过简单的语音指令让机器系统完成相应的操作。随着移动互联网的兴起,语音交互技术在移动终端也得到了广泛应用。但移动终端往往采用电池供电,而长时间处于识别状态将消耗大量的能量,因此移动终端系统往往采用按键或者屏幕触摸的方式来激活语音交互系统。藉此,人们提出设计一款低功耗语音触发芯片来解决长时间识别的问题。但是,低功耗同时又制约了语音触发芯片的计算能力。如何在有限的计算能力下,提供快速、准确的识别结果成为一种挑战。本文通过研究MFCC特征提取过程、GMM-HMM语音识别算法和VAD检测算法,在详尽分析算法各步骤的运算时间和主要运算的基础上,根据分析的结果提出了一套低延时的优化方案。该低延时优化方案包括硬件优化和软件优化。硬件上,采用SRAM作为程序空间载体,加速CPU取指的速度;设计硬件乘加运算和单高斯似然度计算单元,加速主要耗时的计算。软件上,则采用了空间换时间的方式,利用查找表、多项式拟合和合并相同HMM状态的概率计算等方法降低系统识别的时延。基于该优化方案,本文通过利用软硬件协同方法,设计了一款以AndesCore N10为核心的语音触发SOC芯片,并完成了对基于该芯片的语音触发系统进行测试。本文设计的SOC芯片采用TSMC 0.13um工艺制作,核心为AndesCore N10.,外设包括高精度Sigma-Delta ADC,GPIO,SPI等模块。基于该SOC芯片的语音触发系统平均时延为9.952ms,识别率和误识别率分别为95.5%和0.5%。在日常办公环境下,系统误触发次数小于1次/天。研究结果对于进一步推进语音触发芯片在移动终端应用具有较好的参考价值。
其他文献
目的非小细胞肺癌(NSCLC)是恶性程度和死亡率极高的肿瘤,吉非替尼(gefitinib)是近年来研发的一种新的分子靶向药物,本文旨在系统评价吉非替尼治疗表皮生长因子受体(EGFR)基因突变的晚
能源变革的不断深化对电力系统,特别是中低压配电系统产生了重要的影响,各种分布式能源、储能设备以及柔性负荷大范围接入配电系统,使传统配电网正逐步发展成为主动配电网,对
脑机接口能够在没有人体自身运动系统和神经系统的帮助下,在大脑与其它机器之间建立一条通道,它在科研、医疗、军事以及娱乐方面都有着很广泛的应用。P300Speller是脑机接口
继承法的颁布实施迄今已有30余年,恰逢中国改革开放,此间中国社会发生了巨大的变化:社会财富激增;家庭结构改变;生育观念更新;法治现代化程度不断提高;《中华人民共和国物权
城市公交是城市居民的重要出行方式之一,在城市道路交通中占有举足轻重的地位。近年来,有关公交车换道行为的研究愈加深入,其中,公交车的进站换道行为因其常发性和强制性,容
锂离子电池负极材料中,硅具有最高的理论储锂容量(4200 mAh/g),超过传统石墨(372 mAh/g)的10倍,是最有希望的高性能锂离子电池负极材料之一。然而硅在充放电过程中存在严重的
大量临床数据表明,患有同种癌症的不同患者,由于病人基因的特异性,对同一种治疗手段或药物往往有不同的反应。因此考虑基因特异性影响的靶向药物治疗已成为一种新兴的癌症治
毛霉菌可侵犯鼻腔、鼻窦、眼眶乃至颅内,且起病较隐袭,早期易被忽视,一旦侵犯颅内,则预后不良,死亡率很高。如能及早确诊,给予手术清除及全身抗真菌药物治疗,可以治愈。本文报告了1