【摘 要】
:
交通驾驶环境是一个复杂多变的动态场景,信息错综复杂。经验丰富的驾驶员受人的视觉选择性注意机制影响,能从大量的交通场景信息中迅速搜索到对驾驶任务重要的关键信息,分析并做出预判,保证行车安全。近年来,交通场景的视觉显著性检测技术越来越受到人们的重视。通过分析驾驶员的注意分布,并对其进行建模,从而预测驾驶场景中显著性区域和目标。目前,大多数研究都是针对白天交通场景的预测,然而,由于光线不足、光源干扰,夜
论文部分内容阅读
交通驾驶环境是一个复杂多变的动态场景,信息错综复杂。经验丰富的驾驶员受人的视觉选择性注意机制影响,能从大量的交通场景信息中迅速搜索到对驾驶任务重要的关键信息,分析并做出预判,保证行车安全。近年来,交通场景的视觉显著性检测技术越来越受到人们的重视。通过分析驾驶员的注意分布,并对其进行建模,从而预测驾驶场景中显著性区域和目标。目前,大多数研究都是针对白天交通场景的预测,然而,由于光线不足、光源干扰,夜间的驾驶场景比白天更为复杂和危险。建立夜间交通场景中驾驶员的注意分布模型,可以提高以人为中心的驾驶辅助系统的安全性能。论文的主要内容分为以下三个部分:第一部分,本论文建立了一个夜间交通视频显著性数据集。本文分析了当前交通显著性数据集的局限性,随后,针对夜间交通场景设计了眼动实验。该实验记录了30名有经验的驾驶员模拟日常驾驶观看视频的眼动数据,从而建立了一个可供深度学习方法训练和测试的夜间交通视频显著性数据集。该数据集包含自下而上的外源刺激和自上而下的驾驶员内源注意信息。第二部分,在所构建的数据集上,本文创建了一种基于convLSTM的动态视觉显著性模型NTDSD。该模型选用convLSTM来提取交通视频的时间信息,利用金字塔技术增强空间特征,采取Attention机制更有效地融合时空特征。与其他模型相比,该模型对驾驶员所关注的主要目标预测更准确、更集中。此外,该模型能有效地捕捉行人和自行车等微小物体的运动特性,能更好地检测暗光下的次目标。第三部分,本论文提出了一个基于时空视听的夜间交通场景视觉显著性预测模型NTDSD-VA。本论文设计了视觉模块和听觉模块,同步提取视频、音频特征,并尝试将自上而下的听觉特征融入预测网络中,构建视听多模态的注意力预测网络。结果表明,该模型能够准确预测与驾驶任务相关的主要目标和次要目标。本论文进一步设计了消融实验来探究听觉模块的贡献,并对于听觉模块没有达到预期效果的原因进行了剖析。本论文构建的夜间交通视频的显著性检测数据集,可供后续的交通驾驶场景中的注意力预测和深度学习模型计算使用。同时,本论文提出的模型从多角度多模块对夜间驾驶场景的视觉显著性检测做出了不同尝试,为后续的显著性检测提供了可选择的发展方向。
其他文献
建立可以与人类进行自然交流的智能聊天机器人一直是人工智能领域的巨大挑战。特别是开放域对话系统长期受到语料库和建模方法的限制,难以实现没有任何场景及话题约束的自由聊天。随着深度学习与大数据技术的发展,一种基于深度学习的回复生成方法被提出。该方法建立的聊天机器人可以与聊天者就任意感兴趣的话题进行聊天,具有良好的扩展性。然而这种基于深度学习模型的序列到序列的建模方法利用的是最大似然概率来生成回复语句的每
精神分裂症(Schizophrenia,SCZ)是一种具有严重危害性的慢性精神类疾病,可能给个人及家庭甚至社会带来沉重负担。目前,SCZ的病因和发病机制不完全清楚,临床主要依靠医生经验及患者与家属的病情陈述进行诊断与疗效评估,缺乏客观的评判指标。因此,寻找SCZ的客观电生理标志物以改善SCZ诊断及疗效评估,具有重要的临床意义。临床治疗SCZ主要以抗精神分裂症药物为主。本文针对服用氯氮平的SCZ患者
为了实现半实物射频仿真系统中近场效应误差更高效与更高精度的修正,获得三元组单元馈电的精确控制参数。本文系统的分析了已建立的修正流程和相关原理,针对现行方案存在的优化精度有限且计算效率低的问题提出对应的改进思路,从高精度智能反演算法和高效电磁正演建模两方面对修正方案进行了系统的优化设计和验证考察。对于修正方案中初始幅、相参数提取所涉及的反向优化算法,结合坡印廷矢量公式分别研究了基于PSO算法和PSO
无监督域适应(Unsupervised domain adaptation,UDA)是一种通过从有标注的源域里获得知识,并把知识迁移到缺乏标注的目标域上的机器学习方法。现主流域适应研究关注于对齐两个域的特征分布,借此希望在源域训练的分类器能适用于目标域数据。但这些方法通常存在两个缺陷:(1)分类器偏向源域数据:大部分UDA方法只考虑最小化两个域的差异和源域的分类损失,而不对分类器施加其他约束。所以
目前,人们对于情感的表达尤为重视,中老年人喜好看新闻短评,时不时会发表自己的态度和观点;年轻人喜好在微博、知乎等平台分享所见所闻。以及一些短视频社交软件的不断涌现,比如抖音、Vlog等,人们表达情感的欲望更加强烈,情绪在生活中的作用也越来越不容忽视。良好的情绪,能帮助自己更好地完成工作;消极的情绪,对身体机能有一定伤害的同时,甚至还会影响健康人格的形成。随着疫情防控常态化,人们对心理健康的关注度上
社交网络信息传播速度快、范围广、即时性强,吸引海量用户通过社交网络分享社会消息、讨论现实事件。社交网络事件通常是现实事件在网络空间的映射,因此研究社交网络热点事件预测具有重要意义与价值。例如,预测热点事件能够辅助相关部门管控谣言传播,避免社会恐慌,维护公共安全。用户在社交网络发布的信息以文本内容为主,文本与事件热度相关性高,并且相较其它事件相关数据更易获取,是事件预测的重要数据基础。然而文本数据价
机器学习是人工智能研究中的关键技术,在医学健康方面有着广泛的应用前景。心血管疾病(Cardiovascular Diseases,CVD)是目前世界上对人类社会造成严重健康威胁的疾病。采用机器学习方法对CVD风险进行精确地预测,可以有效识别高风险患者及危险因素,及时采取相应的干预措施并帮助医疗机构优化资源分配,具有重要的现实意义。针对CVD风险预测,本文进行了以下几个方面的研究工作:(1)研究了基
随着我国社会智能化进程的不断推进,人工智能被应用到越来越多的领域和应用场景,同时由于自动化识别需求的提升,手写汉字图像的自动化识别成为了当下计算机视觉领域的研究聚焦点。本论文针对手写汉字由于字符疏密不同和连笔交叠导致的检测定位困难问题,完成了基于深度学习的离线手写汉字检测算法的构建;同时由于汉字数量过于庞大,且手写字形复杂多变导致的识别分类困难问题,完成了基于深度学习的离线手写汉字识别算法的构建;
随着互联网信息技术的不断向前发展,人们所要面对和处理的数据信息也日益增多,大量且繁杂的信息阻挠了有效信息的传递,在互联网中找到自己感兴趣的内容宛如大海捞针。对于用户和商家而言,推荐系统可以有效地将物品和用户的信息关联在一起,从而实现高效的推送,创造价值。传统的协同过滤算法中所采用的矩阵分解方式在构建用户物品交互矩阵上存在一定的局限性,导致算法限制了矩阵分解的表现力。本文通过采用度量分解与深度学习相
食道癌作为生活中常见的一种癌症,其发病率和致死率都已经排在靠前的位置。当前诊断食道癌的影像主要有电子胃镜、超声内镜、计算机断层扫描、核磁共振等。医生在分析医疗影像时依赖于经验和专业技术,在诊断工作中容易出现耗时费力、精确度不高等问题。为了提升食道癌的确诊率,保障患者的生命健康,急需一种高效快捷的方式来辅助医生进行诊断。深度学习在图像处理领域已经取得了良好的成绩,它能够有效地对图像进行识别、分类以及