社交场景下图像显著性计算方法研究

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:baichuan817
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
得益于人类的视觉注意机制(Visual Attention Mechanism,VAM),当人眼观看日常生活中的图像数据时,往往能够快速聚焦于场景中令人感兴趣的区域。如果让计算机像人类一样能够快速找到表征图像主要内容的区域,将有效提高图像处理效率和提升计算机的场景理解水平,为人们提供更及时、更智能化的服务。图像显著性计算正是为了能在计算机上模拟人类视觉注意力机制而衍生出的一个研究领域。图像显著性计算通常借鉴生物学和认知心理学分析视觉机理的一些理论成果,使用计算建模的方法提取图像中的视觉显著区域。经过二十多年的发展,图像显著性计算研究取得了重大进展,很多算法在一些通用数据集上已经表现出接近人类的水平。但大多数显著性计算方法在复杂场景中的表现仍有待提高,尤其在富含高级视觉线索的社交场景中。社交场景在日常生活中随处可见,包含丰富的社交先验信息,而这些先验特征往往是计算机难以感知的,因此研究社交场景下的图像显著性计算对推动该领域的发展和应用具有十分重要的意义。本文借鉴认知心理学、神经生物学中视觉注意机制的理论成果,结合眼动实验数据分析结论,对社交场景下图像显著性计算方法进行研究,主要工作如下:(1)构建社交场景图像数据集GS232,基于认知心理学相关理论,通过分析眼动数据分布规律探索社交场景中人类视觉注意机制的形成机理。本工作收集232幅社交场景下的图像刺激样本,设计眼动实验获取有效眼动数据,其中每幅图像采集了10名观测者在3种不同视觉任务下的眼动数据;根据认知心理学相关理论的指导,对眼动数据进行统计分析,归纳出人脸、视线特征在社交场景显著性形成中的线索。(2)提出一种社交场景下基于先验知识特征融合的图像显著性计算方法,构建针对社交场景的有效显著性模型。本工作根据社交场景眼动数据分析结果,对社交场景中自顶向下的视觉注意机制进行建模,用人脸检测器Pyramid Box提取人脸特征,用Gaze Net获取视线特征,并结合高斯混合模型(Gaussian Mixture Model,GMM)生成自顶向下的显著图;利用遗传算法将自顶向下的显著图与基于底层特征的自底向上显著图进行融合,得到更符合场景特性的显著性表达。(3)提出一种图像基准扫视路径生成策略,探索社交场景下图像扫视路径的合理生成方法。本工作从动态显著性的角度展开研究,探索一种基准扫视路径生成策略,为社交场景图像数据集生成不同任务之下的扫视路径;并结合社交场景先验信息改进一种扫视路径生成算法,生成的扫视路径与基准扫视路径更为吻合。
其他文献
中国现代体育观与美育观一样,皆发轫于国族救亡年代。为了强兵御侮,洋务重臣在十九世纪中后期引进了西方现代兵操,开启了中国现代体育;随后的维新派以及革命党人,虽对体育的
在皮革工业中,皮革材料性能参数的检测对其加工工艺的参数制定和工艺选择有着重要指导意义,根据国家标准规定,当皮革试样缓慢受热收缩时产生0.15mm的微小形变(位移)的时刻即为皮革收缩的开始时刻,而此时刻所对应的温度定义为该皮革试样的收缩温度。所以对微小位移量的实时准确检测是皮革收缩温度参数检测过程中的主要技术难题。因此在陕西省科学技术发展计划项目基金的支持下,我们设计了一款基于机器视觉的皮革收缩温度
含铝复合固体推进剂燃烧时,铝颗粒在燃面会发生团聚,燃烧生成大粒径的液相含铝凝团。大尺寸的液相含铝凝团在燃烧流场的作用下,导致发动机出现二相流损失、熔渣沉积以及绝热层烧蚀加剧等问题,甚至会堵塞喷管喉部,带来严重后果。因此,解决铝粉燃烧团聚问题对于提高固体推进剂的综合性能非常重要。本论文合成了全氟辛酸铁(Fe(PFO)_3),对其结构及性质进行了表征。首先研究了Fe(PFO)_3对高氯酸铵热分解的影响
癫痫是一种慢性的神经疾病,影响着全球约1%的人口。癫痫是由局部脑区不正常的电活动引起的,其急促、反复的发病特点,不但会影响患者的生活,甚至会对患者的生命造成危害。目前
目的通过研究人类白细胞抗原(Human Leucocyte Antigen,HLA)与风热疮之间的相关性来了解风热疮的发病机制,起到未病先防的作用,可降低发病率,也为临床治疗提供免疫学基础,同时为实现精准医学提供科学依据。另一方面研究风热疮的中医证型与HLA之间的相关性,有助于我们从基因水平认识中医的证,从微观学角度对风热疮的中医辨证提供一种更加准确、便捷的诊疗方式。方法通过搜集整理有关文献,按照
近年来,随着全国新课改工作的不断推进深入,各学科的传统教学模式都发生着极大的变化,不仅课堂主体从教师转换到了学生,传统的教学观念和固化教学方式也正面临着巨大的转变,需要更多的反思与突破。身处信息化时代,如何将技术与教育深度融合,使得课堂教学最大化地促进学生的个性化发展成为了教育领域研究的焦点之一。在此背景下,本研究基于CTCL“学习”范式,关注学生在进行具体课程学习前的认知起点,并以初中语文文言文
随着医学成像技术和光声技术的不断融合,人工智能技术的不断进步提高了光声成像数据的精确度以及临床试验的合理性,生命科学及基础医学相关设备的升级换代大幅度提高了检测效率和准确度。超分辨成像技术正在帮助医生和研究人员在面对医学挑战时不断突破和创新。超分辨成像是医生和研究人员观测各种生命数据的一种新型技术,而多维超分辨成像仪器是观测人员使用这一技术的载体。在超分辨成像仪在外观设计过程中需要设计者考虑到,如
说话人识别在生物识别技术中是一个非常重要的任务,具有远程验证的独特优势,并且获取途径简单、成本低廉。因此,说话人识别技术的应用范围非常广泛,几乎可以应用到人们日常生
现代科学领域,对微位移和微振动的要求不断提高,迫切的需要微米级,甚至纳米级的精度。压电陶瓷材料,因为具有响应速度快、控制精度高、成本低等优点,近年来得到了广泛的应用。然而,其本身具有严重的率相关迟滞非线性特性,使得对其建模和控制困难。本文以压电作动器为控制对象,利用迟滞非线性系统中的系统重复性,设计迭代学习控制器来进行迟滞补偿以实现纳米级高精密跟踪控制。文章从迟滞非线性系统建模、迭代学习控制策略设
近年来,二维材料由于其优异的电学和光学性能,引起了广泛的关注。二维材料的研究对象极其丰富,包括石墨烯、黑磷、六方氮化硼、过渡金属二硫化物和拓扑绝缘体等。利用这些二