【摘 要】
:
图像分类是机器学习和模式识别领域中一个十分重要的研究热点,其目的是基于标签已知且完整的图像数据集训练一个分类器,并对新样本的标签进行预测和分类。传统的图像分类问题
论文部分内容阅读
图像分类是机器学习和模式识别领域中一个十分重要的研究热点,其目的是基于标签已知且完整的图像数据集训练一个分类器,并对新样本的标签进行预测和分类。传统的图像分类问题通常是单标签分类问题,即一张图片仅对应一个类别标签。然而,现实世界的图像往往具有多义性,即一张图片通常和多个类别标签相关联。针对传统的单标签学习框架难以解决的多义性问题,通过给样本对象明确地指定一组相关类别标签的标签子集,多标签学习框架应运而生。现有的大多数多标签学习算法都是假设训练样本的标签集是完整的,然而,在实际应用中,训练样本的标签往往是不完整的。并且,训练样本的标签通常采用人工标注,耗时又耗力,而且由于人工标注存在主观性,标签语义存在歧义,致使训练样本的部分标签漏标、缺失。随着互联网和社交媒体的发展,大量由用户标注并上传的图像数据唾手可得,但是这些图像数据往往存在标签缺失问题。如何利用这些容易获取却具有标签缺失问题的数据来训练一个健壮、有效的多标签分类算法,仍然是一个亟待解决的问题。本文主要研究针对存在标签缺失问题的多标签图像分类问题,主要研究内容如下:1.利用标签间固有的关联性以及示例间的相似性,提出了一种基于示例级和标签级关联的多标签图像分类算法。该算法首先采用线性重组策略计算每个示例与其近邻示例间的相似性,其次采用标签矩阵的低秩表示挖掘标签间的高阶关联性,然后采用一种加权最小二乘损失函数保证给定标签与预测标签的一致性,最后,通过拉普拉斯流形正则化联合两种关联以及损失函数构建最终的目标函数。在多个图像数据集上的实验证明,该算法能够有效处理标签缺失问题。2.基于低秩特征映射与低秩标签恢复,提出了一种针对标签缺失问题的双重低秩的多标签图像分类算法。该算法首先假设算法的特征映射系数矩阵具有低秩性,来挖掘特征空间中的标签关联。然后假设标签关联矩阵是一个低秩矩阵,来挖掘标签间的高阶关联性,并同时利用低秩的标签关联恢复原标签矩阵的缺失标签。然后通过保证预测标签与恢复后的标签之间的一致性,将标签关联的提取、标签恢复与模型的训练结合到一起。最后通过正则化引入示例级的关联性。
其他文献
心电图(ECG)是一种广泛用于反映心脏状况的无创检测方法,通过ECG可以进一步了解心脏状况和诊断各种心脏疾病,仔细检查其行为对于检测心律失常是必不可少的,基于深度学习的ECG
随着经济社会的快速发展,我国建筑行业进入了一个新的发展阶段,建筑业的兴旺蓬勃给建材行业带来了新的机会,行业竞争也日趋激烈。而作为建材行业重要组成部分的中小型建材企
变电站监控系统已经迅速普及,其设备操作便捷,信息传输迅速,是保障电力系统安全运行的基础。目前的变电站系统普遍实现了综合自动化,这种自动化系统需要很强的站内通信能力,
如今,中俄两国之间各领域的合作不断向前推进发展,各类交流的项目陆续落实,两国之间相似的发展战略也让中俄未来的合作发展有了更加广阔的舞台。随着中俄关系日益发展,两国医疗领域开展了广泛合作,取得了丰硕的成果。现如今许多俄罗斯人来中国寻医,笔者对这种现象产生了研究兴趣,在俄罗斯网站上查阅了医疗领域相关资料,浏览到本次翻译报告主要素材视频,即《医疗保健2.0—罕见病》。本报告翻译素材《医疗保健2.0—罕见
目的:探讨Ghrelin调控GSK-3 β/β-catenin信号通路介导的神经病理性疼痛的机制。方法:采用随机数字表法将雄性Sprague Dawley大鼠随机分为正常对照组(naive control group,N 组)、假手术组(sham operation group,S 组)、CCI 组(Chronic constriction injury by loose ligation of
图像拼接技术因其能够把多张图像拼接融合形成一张新的图像,已经成为数字图像处理领域一个越来越受欢迎的的研究热点之一,它应用的范围包括虚拟现实技术、人工智能识别、无人
研究背景:超声引导下射频消融(Radiofrequency ablation,RFA)由于其微创、安全、可近期多次重复治疗等优点,已成为<3cm肝癌的主要治疗方法之一,随着肝癌直径增大,射频消融术后肿瘤完全消融坏死率下降明显,而消融不完全是术后复发的危险因素之一,因此,射频消融多被局限于治疗肿瘤直径<5cm的肝癌患者。Goldberg1996年发现,肿瘤内部及周边丰富的血流灌注可快速带
计算机多媒体技术的发展为人类社会带来了诸多机遇,同时也给社会安全带来了挑战。数字视频作为生活中常用的网络媒介,在用于娱乐的同时也面临着被修改的风险,有些修改出于恶
随着物联网(Internet of Things,Io T)的快速发展,射频识别(Radio Frequency Iden-tification,RFID)技术作为物联网的关键技术受到越来越广泛的关注,成为科研工作者的研究热
多变量时间序列(MTS:multivariate time series)分类是根据已知MTS提取特征或者训练模型将未知的MTS标记上已知标签的过程,该工作是当前数据挖掘和模式识别领域最具挑战性的