融合语义信息的视频摘要生成

来源 :北京航空航天大学学报 | 被引量 : 0次 | 上传用户：suzengbiao

【摘要】

：

任务旨在通过生成简短的视频片段来表示原视频的主要内容,针对现有方法缺乏对语义信息探索的问题,提出了一种融合语义信息的视频摘要生成模型,学习视频特征使其包含丰富的语义信息,进而同时生成描述原始视频内容的视频摘要和文本摘要。该模型分为3个模块:帧级分数加权模块、视觉-语义嵌入模块、视频文本描述生成模块。帧级分数加权模块结合卷积网络与全连接层以获取帧级重要性分数;视觉-语义嵌入模块将视觉特征与文本特征映

【作者】

：

滑蕊吴心筱赵文天

【机构】

：

北京理工大学计算机学院,北京 100081

【出处】

：

北京航空航天大学学报

【发表日期】

：

2021年03期

【关键词】

：

视频摘要视觉-语义嵌入空间视频文本描述视频关键帧长短期记忆(LSTM)模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

乳腺癌子宫内膜转移一例并文献复习

目的探讨乳腺癌子宫转移的诊断及治疗方法。方法回顾性分析山东大学齐鲁医院（青岛）收治的1例乳腺癌子宫内膜转移患者的临床特征及诊疗经过，并进行文献复习。结果该患者有乳腺癌家族史，首发症状为异常阴道流血，继发严重贫血，已存在淋巴结、卵巢、子宫及子宫颈转移，淋巴结穿刺活组织检查诊断为乳腺浸润性小叶癌。临床查体及影像学检查未发现乳腺癌原发灶。为止血及改善贫血行姑息性子宫+双附件切除术，术后行化疗，疗效评价为

期刊

乳腺肿瘤免疫组织化学子宫转移生殖道肿瘤

基于多特征图像视觉显著性的视频摘要化生成

如何高效提取视频内容即视频摘要化,一直是计算机视觉领域研究的热点。简单通过图像颜色、纹理等特征进行检测已无法有效、完整地获取视频摘要。基于视觉注意力金字塔模型,提出了一种改进的可变比例及双对比度计算的中心-环绕视频摘要化方法。首先,以超像素方法对视频图像序列进行像素块划分以加速图像计算;然后,检测不同颜色背景下的图像对比度特征差异并进行融合;最后,结合光流运动信息,合并静态图像与动态图像显著性结果

期刊

视频摘要化视觉注意力金字塔视频显著性关键帧提取相似性判断

履带车辆传动系统主轴抗疲劳结构设计研究

为解决起步工况下履带车辆传动系统主轴低周疲劳失效的问题,基于主轴材料力学性能试验获得了塑性变形阶段真应力应变关系;以主轴实测扭矩为输入载荷分析了初始设计主轴的Mise

期刊

主轴渐开线花键弹塑性特性低周疲劳

基于混合网络的异源遥感图像变化检测

为了更加准确地进行异源遥感图像的变化检测任务,提出了一种基于混合网络的异源遥感图像变化检测算法。利用伪孪生网络提取异源遥感图像块间空间维度的变化特征,利用早期融合网络提取异源遥感图像块间光谱维度的变化特征,将2支网络提取的特征进行融合,并将融合后的变化特征输入到sigmoid层进行二分类检测。同时,在伪孪生网络中加入对比损失函数,通过优化对比损失函数,使得在特征空间中,未变化图像对的空间特征差异更

期刊

变化检测异源伪孪生网络早期融合网络对比损失函数

基于FPGA无人机影像快速低功耗高精度三维重建

现有无人机(UAV)影像三维重建方法在功耗、时效等方面无法满足移动终端对低功耗、高时效的需求。为此,在有限资源FPGA平台下,结合指令优化策略和软硬件协同优化方法,提出一种基于FPGA高吞吐量硬件优化架构的无人机航拍影像快速低功耗高精度三维重建方法。首先,构建多尺度深度图融合算法架构,增强传统FPGA相位相关算法对不可信区域的鲁棒性,如低纹理、河流等区域。其次,结合高并行指令优化策略,提出高性能软

期刊

低功耗FPGA三维重建相位相关软硬件协同优化

融合语义信息的视频摘要生成

其他学术论文