面向视觉SLAM的异构处理架构关键技术研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:jasmineonbridges
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,即时定位与地图构建(Simultaneous Localization And Mapping,SLAM)受到极大关注且被广泛使用在多个领域。例如,视觉SLAM算法在虚拟现实(Virtual Reality,VR)、增强现实(Augmented Reality,AR)、无人机领域、无人驾驶以及机器人定位导航方面都起到了关键性的作用。视觉SLAM算法对实时性要求很高,并且它通常部署于嵌入式系统。但嵌入式系统对功耗有严格限制,因此,如何为视觉SLAM提供所需的性能,同时又可以满足嵌入式系统功耗要求,是设计人员面临的巨大挑战。图形处理器(Graphics Processing Units,GPU)通常被用作视觉SLAM的重要处理引擎,找到合理的硬件配置参数对于提升视觉SLAM的能效至关重要。本文分析GPU各个设计参数对性能和功耗的影响,发现为视觉SLAM设计节能GPU的指导原则是采用“较多的流式多处理器(Streaming Multiprocessor,SM),足够的流式处理器(Streaming Processor,SP)和寄存器以及较小的缓存(Cache)”。然后,本文进行大规模设计空间探索,并使用两项指数模型拟合帕累托边界。此外,本文构建了基于梯度提升决策树的设计模型以预测给定设计参数下系统的性能和功耗,从而消除了GPU设计人员进行昂贵的系统仿真的需要。实验表明,本文基于梯度提升决策树的模型可以实现<3%的平均百分比误差,优于其他机器学习模型。在嵌入式系统中,深度学习加速器作为专门面向深度学习所设计的硬件受到广泛关注。相比于传统的中央处理器(Central Processing Unit,CPU)与GPU等通用型芯片,它具有更高的能效优势。此外,基于深度学习的位姿估计方法也取得比传统方法更高的准确率。为了更有效利用嵌入式系统的硬件资源,本文提出了一种面向视觉SLAM的软硬件协同设计方法,在软件层次采用基于深度学习方法进行视觉SLAM中的位姿估计,在硬件层次设计了包含深度学习加速器的异构处理架构。实验表明,对于不同的数据集,这一软硬件协同设计方法相较于在GPU上的经典方法,其性能平均提升了44%,平均功耗降低了39%。此外,本文进一步为该异构架构设计了流水工作模式,增强了GPU与深度学习加速器之间的并行性,系统的性能又进一步提高了10%,功耗进一步降低了8%。嵌入式系统通常采用共享内存架构,在集成深度学习加速器后,会导致内存竞争的加剧。本文研究了GPU与深度学习加速器的访存特点,发现了GPU的高度执行并行性与深度学习加速器的高度执行规律性使得他们分别具有不同的内存延迟容忍度。因此,本文提出了基于部件访存特点的内存调度策略,根据内存延迟容忍度的高低,动态调整访存请求优先级,从而避免在产生内存竞争时所带来的性能下降。实验表明,该内存调度策略在将性能平均提高70%、功耗平均降低48%的同时,公平性提高约100%。
其他文献
近日,清溢光电在接受投资机构调研时表示,目前合肥清溢的新产能正进入爬坡阶段,产线的设备匹配比较均衡,有利于后续产能开出。合肥清溢的生产制作能力主要针对AMOLED/LTPS等中高端产品。随着涂胶线的投产,预计明年上半年半透膜掩膜版(HTM)产品能通过客户验证并实现量产。据了解清溢光电主要募投项目"合肥清溢光电有限公司8.5代及以下高精度掩膜版项目"系由合肥清溢光电在合肥新站高新技术产业开发区
期刊
茉莉花茶因其馥郁鲜灵的花香而受到消费者的青睐。目前,离体茉莉花及花茶窨制过程中挥发性成分的变化趋势与茉莉花释香机理尚未明确。本研究首先以离体茉莉花为材料,观察其开放吐香过程;再以不同工艺窨制过程中的茉莉花及茶坯为研究对象,采用GC-MS绝对定量分析方法,研究了茉莉花及茶坯挥发性成分含量的动态变化;最后采用分子生物学分析手段,探究与香气释放相关的四种酶(SAMT、HGMR、PAL、FPPS)的活性及
目前,移动互联环境下累积了海量短文本数据(如微博、评论、搜索查询、客服问答等),其中蕴含丰富语义知识,但文本海量化造成了“数据泛滥,知识匮乏”的窘境。因而,对海量短文本数据进行语义解析建模(如特征抽取、模式匹配)与分类以发现数据中存在的隐式关联及依赖关系,从而识别出最终可被人为理解的高层语义知识是极具研究价值和商业价值的课题。但通常,短文本受限于长度因素,其具有词频共现度低、语言不规范、上下文依赖
目的本文以基于微博的情感分析为研究方向,采用词典与机器学习相结合的方式,提出一种多特征的情感分析方法,以求更客观真实地呈现用户情感,进一步提高微博情感分析的准确率。方法通过对国内外针对情感分析特征选择的研究和情感分析方法的研究,结合微博平台和微博文本内容的特点,完成主题特征、行为特征、文本特征三个特征指标的选取。采用LDA主题识别模型、ROST内容挖掘系统对文本数据的主题特征情感值进行计算,通过微
随着气候变化和能源问题的日渐加剧,发展传统化石燃料的替代品已经迫在眉睫,清洁能源的开发和利用成为解决当前危机的重要举措。光催化技术可以将可持续的太阳能转化为更加便捷、高效的化学能。尤其是光催化分解水技术利用太阳光作为反应驱动力,将水分解成氢气和氧气,而氢气是一种零污染、可存储运输的新能源形式。此外,氢能还可以通过直接燃烧释放出大量的热量,并且除水以外不会产生其他的副产物。因此探寻一种太阳能转化效率
随着我国城市化进程的不断加快,地上空间难以继续承受城市建设的扩张速度,开发城市地下空间已然成为今后土地利用的发展方向。我国各城市的地下基础设施建设工程正在不断开展,然而,由于地层的自然缺陷和人为破坏,开发城市地下空间的施工过程中事故频发。因此,利用物探技术先行了解地层结构具有重要意义。瞬变电磁法具有穿透性强、成像分辨率高、无损探测等特点,针对城市地下空间结构的调查具有明显优势,但传统的瞬变电磁探测
随着现实中工作复杂性的提升,传统单轮式移动机器人系统已无法满足人类的需求,多轮式移动机器人协同作业已经成为了未来发展趋势。轨迹跟踪和编队控制是多移动机器人协同控制领域内两个研究热点,受到国内外学者广泛关注。目前,有关轨迹跟踪控制问题的大多数研究成果只考虑了渐进跟踪收敛的情况,意味着无法知道准确的轨迹跟踪收敛时间,导致多轮式移动机器人系统的有限时间轨迹跟踪控制问题还没有得到很好的解决;针对系统无全局
随着现代机械制造技术向着智能化、柔性化、一体化和高度自动化方向的发展,要求数控机床在高速、重载的情况下仍能保持高精度、低噪声、高可靠性和长寿命等特点。滚珠丝杠副作为数控机床关键功能部件之一,其摩擦磨损量很大程度上决定了数控机床的精度和寿命。滚珠丝杠副在高速运转时,由于轴向载荷、相对滑动、表面粗糙度等,都会造成不同程度的表面磨损,这将对滚珠丝杠副造成精度、可靠性及寿命的降低等,使得对滚珠丝杠副的接触
学位
近些年来,脉冲电流处理技术已被广泛应用于材料研制与改进中,成为了众多研究者关注的热点。但脉冲电流技术离工业应用还有较长的路要走,研究者们一般在凝固状态下施加脉冲电流,目前对直接向不锈钢的熔融状态下施加脉冲电流处理的机理尚不明确,关于脉冲电流对熔融状态下金属性能所产生影响的作用机制也尚无定论。并且关于脉冲电流处理技术对材料微观组织的影响仍缺乏系统而深入的研究,尤其关于脉冲电流对材料的织构以及夹杂物的