【摘 要】
:
无监督表示学习指利用无监督机器学习或深度学习方法获得实体或者样本稠密低维实值向量表达。随着大数据时代到来和相关技术的不断积累,如何从数据中学习更高层次和更抽象的特征表示成为了新的研究热点。然而不同数据本身结构特性不同,因此需要结合数据本身的特点来设计无监督表示学习方法。本文则聚焦于时间序列数据和多视角数据的深度表示学习研究。在时间序列数据范畴,之前的工作大多忽略时间序列的动态性(长期或短期的时间依
论文部分内容阅读
无监督表示学习指利用无监督机器学习或深度学习方法获得实体或者样本稠密低维实值向量表达。随着大数据时代到来和相关技术的不断积累,如何从数据中学习更高层次和更抽象的特征表示成为了新的研究热点。然而不同数据本身结构特性不同,因此需要结合数据本身的特点来设计无监督表示学习方法。本文则聚焦于时间序列数据和多视角数据的深度表示学习研究。在时间序列数据范畴,之前的工作大多忽略时间序列的动态性(长期或短期的时间依赖特征),并且忽略利用聚类约束来提升表示学习的质量,将两个任务割裂开来。对于多视角数据而言,如何建模多视角数据的一致性特征和互补性特征同时降低特征表示的非冗余性是一个挑战。针对以上问题,本文结合时间序列数据和多视角数据本身特点提出对应的无监督表示学习的深度神经网络。1)针对时间序列数据,本文提出了一种面向时间序列聚类的表示学习框架,以同时优化时间序列特性表示和聚类。在时间序列特征提取模块中,使用递归神经网络(RNN)进行单步时间序列预测用来捕获时间动态特征并保持其局部结构。RNN输出层的参数被视为基于模型的动态特征,然后被输入到自监督的聚类模块中以获得预测的标签。为了建立这两个模块之间的连接,使用谱分析将相似的特征约束为具有相同的伪标签,同时设计分类器,将预测的标签与伪标签对齐。通过迭代更新模型参数和伪标签来训练模型。实验在85个UCR数据集进行,实验结果和可视化分析都验证了模型的有效性。2)针对于多视角数据,本文提出了从多视角数据中提取不同视角的共享的(一致的)特征和视角内特有的(互补的)特征的网络框架。对于视角间共有特征的建模,引入一致性损失以约束视图之间学习到一致性的表示,同时引入一种特征分离机制,该机制通过学习共享特征与原始特征之间的差异来提炼视图特有的特征,结合正交性约束减少共享特征和私有特征之间冗余性。最后,结合视角间共享特征和视角内的私有特征,以获取多视图数据的统一表示并将其应用于下游任务。实验在13个常见的多视角数据集进行。实验表明,本文提出的模型学习的表示,在分类和聚类任务上达到了最好的性能,并且可视化分析也证明了该多视角表示学习方法的有效性。
其他文献
聚对苯二甲酸二乙酯(PET)是一种典型的线性热塑性树脂材料,被广泛用于制造纤维,薄膜和饮料瓶。然而,PET为人类带来生活便利的同时也对全球环境造成不利影响,因为其难被降解,造成了严重的白色污染。最近,学者们经分子改造获得了一个快速降解PET的耐热角质酶,本研究在大肠杆菌BL21(DE3)中重组表达了该角质酶,研究了其相关酶学性质,并使用物理手段(超声波辅助)和生物手段(分子改造)来促进LCC降解P
在众多生信分析问题中,生物序列k-mer频次信息因蕴含着关键的序列特征,被序列比对、重复检测、序列校正、物种鉴定、motif发现及序列纠错等众多生信软件所采用,是其应用中不可或缺的一步。面对大规模序列数据分析,k-mer频次信息的存储空间消耗及统计速度慢带来的问题变得不可忽视。本文针对当前k-mer频次统计工具内存及磁盘空间消耗大的缺点,根据组装后序列数据统计规律,提出了一套内存消耗低、运行速度快
在一段文本中,一个实体可以有多种不同形式的实体表述,这些实体表述之间的关系被称为共指关系。共指消解任务的目标就是将文本中具有共指关系的对象整合到一起,从而消除指代表述的歧义性,增强机器对自然语言的理解。表述检测和共指关系计算是共指消解的关键步骤,当前端到端的模型实现在此方面还存在可优化空间。在表述检测方面,当前模型有着最大长度限制,其表述计分函数也可进一步细化,由于表述检测任务与共指消解任务存在着
由于传统混凝土材料抗拉强度低,变形能力差,节点、相邻梁柱端钢筋布置密集,该区域混凝土浇筑质量难以保证等原因,使得节点极易发生界面劈拉破坏或者剪切破坏、保护层剥落,混凝土框架结构梁端或柱端钢筋先达到屈服发生破坏,并导致在地震后结构产生较大的残余变形,相关功能难以恢复。工程用水泥基复合材料(ECC),是一种新型的高性能纤维增强复合材料,具有优良的延性、微裂缝控制特性和能量吸收能力。为了提升梁柱节点抗震
钢经渗硼处理后可获得高温硬度高,抗高温氧化和耐磨性能好等优越性能的渗硼层,具有广阔的应用前景。然而渗硼层脆性大,抗冲击性能差,是限制其应用扩展的关键。本文通过在40Cr Ni Mo钢基体上电镀Fe-Ni合金渗硼,来促进韧性较好的(Fe,Ni)2B相的形成,并在渗硼层/基体界面的梳齿间形成部分γ-(Fe,Ni)来缓冲渗硼后的淬火热处理应力。对电镀Fe-Ni合金样品用多种渗硼方法所获得的渗硼层的组织结
电压水平是标志电网运行状态的重要运行指标,电网各节点电压随负荷的不同而变化,当电压超过规定数值时,将影响电网安全、经济、稳定运行。系统无功功率变化,也会导致电网电压水平波动。为保证电网各节点具有合格的电压和一定的功率因数,必须对电网采取有效的电压调节和无功功率补偿措施。无功功率补偿一般采用并联电容器实现,而节点电压调节采用有载调压变压器实现,同时,无功功率补偿也影响节点电压水平,需要在电压控制中综
随着5G移动通信时代的到来,毫米波在通信系统中的应用正变得越来越广泛,而具有优异性能的毫米波天线是毫米波通信系统中不可或缺的部分。毫米波具有频谱宽、波长较短使得所需的天线尺寸较小等优点,是无线通信的理想频段。包括5G通信系统在内的毫米波移动通信设备目前正朝着宽带和高度集成的方向发展,这就要求毫米波天线要和毫米波系统的其他部分(如芯片、封装、基板和机壳等)集成来实现集成天线,以便提高系统集成度。本文
近年来,移动智能设备大量普及,给人们的生活带来了极大的便利,服务提供商也积累了大量的用户轨迹数据。由于轨迹数据具有丰富的时空信息,轨迹数据集的公开和发布对智能交通、科学研究、商业分析和政府管理等方面有重要的价值。然而如果服务提供商直接发布原始数据,会造成用户的轨迹隐私泄露,被攻击者推断兴趣爱好、行为模式和家庭住址等敏感隐私。为了安全发布数据,学者们提出了大量轨迹隐私保护方法,但是许多方法忽略轨迹的
5G移动通信自提出以来就受到了业界的广泛关注,其包括Sub-6GHz的低频段和毫米波频段。而毫米波频段具有带宽大、电路体积小等优势,相比于低频段可以显著提升通信速率,因此成为了5G应用场景下的研究热点。本论文主要研究5G毫米波通信模块的构架、链路指标,以及基于商用毫米波芯片的前端模块研制。本文的主要研究内容包括:1.研究射频前端模块基本架构,并对收发链路的主要性能指标进行了阐述。基于5G通信重大项
在现实生活中,人类在通过“五感”来接触世界时,大约80%都是来自视觉。视觉是人类感知和了解世界的最直接方式,客观地还原真实的世界是人们不断努力的一个方向。随着科学技术的进步和社会的不断发展,人们的生活水平也在不断的提高,传统的二维平面图像的信息已经不能满足人们的需求。传统的二维图像显示技术只能简单从某个角度某个侧面反映景物的特征,所能表现的深度信息严重的匮乏,因此具备高质量的三维立体图像显示技术应