【摘 要】
:
作为聚类分析的一大分支,子空间聚类由于其在高维数据条件下表现出的优异性能引起了国内外的广泛关注。而深度学习和子空间聚类理论的结合,则让这种通过将高维数据映射至低维子空间,获取自表达矩阵以进行谱聚类的算法在速度和准确性上提升到一个新高度。然而,当前的深度子空间聚类算法在准确性上仍有进步空间,其局限于理论本身所带来对数据量的限制,导致信息量缺失,影响了算法的泛化性和鲁棒性;此外,其无法良好学习原始高维
论文部分内容阅读
作为聚类分析的一大分支,子空间聚类由于其在高维数据条件下表现出的优异性能引起了国内外的广泛关注。而深度学习和子空间聚类理论的结合,则让这种通过将高维数据映射至低维子空间,获取自表达矩阵以进行谱聚类的算法在速度和准确性上提升到一个新高度。然而,当前的深度子空间聚类算法在准确性上仍有进步空间,其局限于理论本身所带来对数据量的限制,导致信息量缺失,影响了算法的泛化性和鲁棒性;此外,其无法良好学习原始高维数据的分布,导致高维数据的低维分布无法保持与原始数据的一致性,聚类性能被特征表达能力所约束。针对上述问题,我们提出两种基于生成对抗网络(Generative Adversarial Network,GAN)的增强式深度子空间聚类网络——双重生成对抗深度子空间聚类网络(Deep Subspace Clustering via Dual Adversarial Generative Networks,DSC-DAG)与自监督生成对抗深度子空间聚类网络(Self-Supervised Deep Subspace Clustering with Adversarial Generative networks,S^2DSC-AG):1)在DSC-DAG中,我们使用对抗训练来学习高维数据及低维子空间数据的分布,并由此将随机采样的噪声转化为高维合成数据,及再次转化的低维合成数据,利用联合优化的方式突破数据规模,同时引入子空间对抗学习,在子空间层面提炼表征;2)在S^2DSC-AG中,我们融合合成数据与真实数据,引入自监督信息学习,利用两种差异性矩阵进行协同优化,从而促使特征提取器获取区分度高的低维子空间;我们从理论和实验层面分析了这两种算法的内在联系,并证明其在原理和目标上存在等效性。我们在多个真实数据集上设计大量针对性实验,在准确率(ACC)、标准互信息(NMI)和纯度(PUR)等量化指标上两种方法均优于当前最优聚类算法,证明了我们的优化算法的有效性和泛化性;同时,多种可视化图像直观地证明了其可训练性,及提升聚类性能的可解释性。
其他文献
空战过程中对目标飞行器轨迹的精准预测,能够大幅提升我机取得空中优势的能力。为此,本文针对现有的各类轨迹预测算法求解出的基准预测值,提出了一种通用性强,计算耗时短,精度提升高的基于Transformer模型的预测误差补偿(Transformer-based Prediction Error Compensation,TFPEC)方法,以进一步提高轨迹预测结果的准确性。首先在基准预测值的基础上,建立了
二冲程发动机的功率较高、动力性能较好以及结构简单可靠等优点,使其在众多领域都有着广泛应用。但二冲程发动机在工作过程中,由于其结构特点以及工作环境等影响,使得气缸特别容易磨损。珩磨工艺作为气缸生产的最后一道工序,也是对气缸寿命影响最大的一道工序,为了提高二冲程发动机的使用寿命以及改善排放,对于二冲程发动机气缸珩磨工艺的研究就显得非常必要。本文以某二冲程发动机生产企业引入气缸珩磨工序为研究对象,在对二
随着互联网以及云计算等信息技术的不断发展,信息化应用已经渗透到我们日常生活的各方面。“十四五”规划指出,加强个人信息保护和扩大数据开放共享对加快信息化建设意义重大。然而当前信息化应用中,用户个人信息泄露的安全问题时有发生。主要是由于用户在实现身份确权时个人信息被不同服务与应用重发收集以及用户为了简化繁杂的账号管理问题而使用单一的账号和密码,这些都增大了用户个人信息和账号泄露的风险。数据共享方面则存
物联网技术的蓬勃发展给人们的生活带来了极大的便利和帮助。GSMA指出到2025年全球的物联网设备数量将达到250亿级别。物联网设备采集的大量数据蕴藏着重要的信息资源,可通过技术挖掘分析产生对人类生产生活有意义的信息。物联网数据一般存储于第三方云服务,并由云服务商提供存储和共享服务。由于传统第三方云服务商的中心化特点,再加上用户对云服务商的不信任,物联网数据的共享存在以下安全问题:第一,物联网数据容
电致变色“智能窗”具有对太阳光的照射以及热辐射选择性吸收或透过的特点,可以大幅度降低建筑中的能耗、缓解资源紧缺问题。目前制备的全固态电致变色器件仍然无法满足实际应用需求。本论文针对如何提高薄膜与器件的光学调制幅度、循环寿命,缩短着色、褪色响应时间等问题,采用磁控溅射方法制备WO3、NiOx电致变色薄膜,通过调控沉积工艺参数、Cu掺杂等方式改善薄膜的电致变色性能。搭建了全固态电致变色器件ITO/WO
良好的数字病理图像质量是数字病理学准确应用的前提。为提出应用性更强的数字病理图像质量问题的检测方法,本文把数字病理图像的质量检测问题分为切片级和图片级。切片级质量问题包括对焦错误、载玻片压片偏移、虚拟位置与实际位置偏移,这些问题会导致全视野数字病理切片不可用。图片级质量问题指全视野数字病理切片中存在的不可用的图像区域。针对三种切片级质量问题,本文提出了检测的方法。首先,对焦错误问题的检测依赖于图像
随着物联网新型应用场景的不断发展和通信需求的日益提高,接入网络的移动终端设备和通信数据量呈指数式增长,无线通信网络的性能也面临着更高的要求。一方面,现有的移动终端设备和无线节点多为电池供电,有限的续航能力成为制约通信网络寿命和可靠性的关键因素;另一方面,持续增长的通信业务量带来了巨大的能量消耗。此外,随着基站和接入点增多,基础承载网络的容量面临着更高的需求,无线通信的基础网络架构部署也亟需优化。因
根据Tyler提出的氧插入机理,复合氧化物中的氧空位可被视为天然的赝电容储能点位,本身具有氧空穴结构的烧绿石型复合氧化物是一类具有很大潜力的电化学储能材料,可以通过在其A位或B位掺杂低价元素来调控氧空穴的浓度,从而增加电荷储存位点。为了改善当前柔性超级电容器存在的工作电压有限、能量密度低等问题,本论文采用静电纺丝技术结合低温煅烧制备了具有较高电化学储能性能的烧绿石型无机复合氧化物(La2Ti2O7
纤维素是地球上含量最丰富的天然高分子碳水化合物,采用化学法、机械法或化学与机械相结合等方法可制备出尺度较小的微纳米纤维素(Micro-nano Cellulose Filaments),尤其是纳米纤维素具有较大的比表面积、高强度、高长径比和低热膨胀系数等特点,在食品、化妆、烟草、涂料和造纸等领域具有广泛的应用。本文以漂白针叶木浆为原料,通过羧甲基化预处理结合超声波处理的方法制备出具有高长径比的微纳