嵌入式流媒体处理器体系结构技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:muyiwenwu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
嵌入式流媒体处理是研究如何利用有限的无线网络带宽和移动端机的计算和存储资源实现实时与可靠的流媒体传输的嵌入式应用技术领域。开发嵌入式流媒体处理器是实现这一目标的主要途径,也是嵌入式流媒体处理技术的研究重点和研究热点。 嵌入式流媒体处理器在单个SoC(System-on-a-Chip)芯片上实现了音频和视频等流媒体信号的采集、转换、编码、存储、解码、输入/输出等完整的嵌入式流媒体处理功能,具有速度快、集成度高、功耗低等优点。它在军事侦察、移动通讯、无线监控、可视电话等诸多领域有广阔的应用前景。虽然新的流媒体标准和SoC设计技术不断成熟,但要在单个SoC芯片上实现流媒体处理系统的功能,仍面临着设计复杂性高、灵活性强、设计约束苛刻、设计周期短等诸多挑战。 本文基于国际流行的嵌入式流媒体处理器系统结构框架,采用了融合算法定制和指令集扩展两种体系结构的设计思想,对计算复杂度较高的算法部分采用定制体系结构实现,对实时性要求不很高的新算法采用面积开销较小的扩展指令集进行加速和及时更新,以期在实时性能、灵活性和低功耗上取得最佳的折衷。文中重点研究了MPEG-4流媒体关键算法的定制体系结构和流媒体指令集扩展体系结构等基础和核心技术,还深入研究了基于层次平台的嵌入式流媒体SoC高层软硬件协同设计方法。取得的主要研究成果如下: 1.提出了一种基于Wallace树的分散式DCT/IDCT体系结构。该体系结构首先将DCT/IDCT中的常系数乘加运算分散为部分积加法运算,然后通过共享公共子表达式减少加法数量,最后用优化的Wallace树汇总部分积以计算最终结果。它不依赖于ROM(Read Only Memory)和乘法器,用面积开销小的低位宽加法器、移位器和4-2压缩器,实现了乘法密集的DCT/IDCT算法。它最大程度地发掘了DCT和IDCT之间的相容性,充分地共享和重用了中间数据及硬件资源。该DCT/IDCT体系结构消耗了10,605个逻辑门和1024位转换存储器,能够工作在300MHz下,可以达到300M像素/秒的吞吐率,其时序-面积性能较已有的DCT/IDCT体系结构有了明显的改善。 2.提出了一种支持最新快速运动估计算法的可配置并行阵列运动估计引擎CPAME(Configurable Parallel Array Motion-estimation Engine)。该运动估计引擎设计了三种可变延时单元以支持多种不同尺寸的搜索模式,设计了SAD(Sum of Absolute Differences)引擎以加速独立预测点的检查,并通过软硬件协同的工作模式来支持灵活的快速运动估计算法。CPAME引擎的特点包括:利用延时单元进行数据重用,降低了访存带宽;在SAD计算结构和模式搜索结构之间共用硬件资源,节省了硬件面积;关闭不用的PE(Processing Element)处理单元,减小了动态功耗。在视频编码质量相近的前提下,该体系结构的计算性能比流行的16PE阵列低功耗全搜索体系结构提高了约15倍。
其他文献
招苏台河吉林段为辽河重污染支流,以发展农业为主的产业结构使流域内非点源污染十分严重。采用输出系数法与地理信息系统(GIS)技术相结合,对2003-2012年流域农业非点源污染的组成
我们看到一个题目以后,习惯于顺着题目的意思往下做,但是这样做有时会非常麻烦。如果我们从后往前倒着做,也就是运用“倒推”的方法来解决问题,可能会更快捷简便一些。请看下
计算:(1)1/2+1/4+1/8+1/16;(2)1/4+1/8+1/16+1/32;(3)1/3+1/6+1/12+1/24。我是这样解的观察一下,上面三道题有什么特点?容易看出:每个分数的分子都是1,后面一个分数是前面一
养老金入市是目前大家比较关注的热点话题,政府与大部分学者都认为养老金入市势在必行,但是在养老金如何入市,如何控制其中可能存在的风险等一些具体问题上,还存在着一些分歧。我国可借鉴的经验有限,本文通过对美国、英国养老金入市经验、教训的介绍,对我国养老金入京后的监管有着一定的借鉴作用。  养老金入市  美国经验 英国经验 监管  放眼全球,老龄化问题都在日渐严重,我国也是如此,如何保持养老金的保值增值不
期刊
在信息化、高新技术突飞猛进的时代,医院的发展离不开信息化技术的广泛支持。药剂科作为医院重要的一部分,不可避免地受到计算机网络和电子信息化带来的影响。随着医院药学的发