【摘 要】
:
单细胞RNA测序(scRNA-Seq)技术的进步使研究人员能够分析基因组范围内的转录谱,并以单个细胞的分辨率解决生物学问题。其中聚类是scRNA-Seq数据分析的一个重要步骤,其主要作用是用来找寻细胞类型的数量以及揭示每种细胞类型的转录组学特征,聚类是细胞异质性以及细胞分化等研究的关键问题。但由于近年来scRNA-Seq技术的飞速发展,单细胞数据呈指数增长,且现有的scRNA-Seq聚类方法存在着
论文部分内容阅读
单细胞RNA测序(scRNA-Seq)技术的进步使研究人员能够分析基因组范围内的转录谱,并以单个细胞的分辨率解决生物学问题。其中聚类是scRNA-Seq数据分析的一个重要步骤,其主要作用是用来找寻细胞类型的数量以及揭示每种细胞类型的转录组学特征,聚类是细胞异质性以及细胞分化等研究的关键问题。但由于近年来scRNA-Seq技术的飞速发展,单细胞数据呈指数增长,且现有的scRNA-Seq聚类方法存在着数据的高丢失率和维数灾难,因此开发能够满足单细胞数据特性的聚类方法具有重要的意义。本文基于机器学习对单细胞RNA-Seq聚类方法进行研究,研究内容如下:1.我们提出一种新的基于深度学习自编码网络的聚类模型sc BKAP。首先,使用基因过滤器剔除在大于95%的细胞中都不表达的基因。其次,使用自编码网络对筛选后的scRNA-Seq数据集进行重构,得到重构后的表达矩阵,降低原始数据中丢失值对整体模型精度的影响。再次,使用M3drop算法对重构后的数据进行特征选择,运用PHATE算法提取数据中的主要信息以及寻找原始高维数据的低维表达,达到数据降维的目的。最后,利用二分K均值算法对聚类细胞以获得结果,并与原始数据的真实细胞标签进行对比来评价模型的性能。在19个真实的scRNA-Seq数据集和2个模拟的数据集上测试了sc BKAP的性能,并与9种先进的聚类方法进行了比较,根据四种评价指标的结果表明,sc BKAP模型在聚类结果上优于其它方法。2.我们提出一种新的基于生成对抗网络的聚类模型ISGAN。首先,ISGAN对单细胞RNA-Seq数据集进行过滤筛选,目的是删除数据中在大于95%的细胞中表达值均为0的基因。其次,使用引入了Wasserstein距离的生成对抗网络对筛选后的scRNA-Seq数据进行插补并得到插补后的表达矩阵,WGAN的目的是通过插补来消除数据中dropout值的影响。再次,使用PCA降维算法对插补后的数据进行预降维,目的是提取插补数据中的主成分,为主要降维算法的运行提供便利。而后,使用ISOMAP算法进行降维以及去噪。最后,使用改进的自适应谱聚类算法对降维后的数据进行细胞聚类,得到最终的聚类结果,并于真实的细胞标签进行对比来评价模型的聚类性能。我们将ISGAN与其它9种先进的聚类方法在19个真实单细胞RNASeq数据集以及2个模拟的数据集上运行以得到聚类结果并进行对比,根据四种聚类评价指标(NMI,ARI,HOM与AMI)的结果表明,ISGAN模型拥有最好的聚类性能。
其他文献
为提高机器人复杂场景下的目标抓取能力,本课题以串联机器人抓取传送带上运动的堆叠物体为例,设计了基于视觉的机械臂目标跟踪与抓取方法,并对方法中的目标检测及跟踪抓取等关键技术进行了研究。首先概述了机器人定位抓取方法及关键技术的研究现状,引入了研究内容及研究框架。通过分析机器人抓取的任务及难点设计了基于立体视觉的抓取方案,并对方案中的立体视觉进行了原理分析及实验验证。然后对融合深度学习的目标检测技术进行
传统的有机溶剂脱硫能耗高、副反应多,离子液体蒸汽压低、溶解性好,可作为具有良好性能的脱硫剂。本文首先总结了用于吸收硫化氢(H2S)的常规离子液体、功能性离子液体以及铁基离子液体,从提高溶解H2S能力和降低黏度两方面探讨了提高脱硫性能的离子液体所应具备的结构。最终选用了x FeCl3/[bmim]Cl(x=0.6、0.8、1.0、1.2和1.4)作为本文的脱硫剂。使用无水FeCl3和[bmim]Cl
为了提高机械零部件表面的润滑性与耐磨性,本文采用ESD-03B型电火花堆焊修复机,基于同时提升涂层的耐磨和润滑性能,在45钢的表面间隔沉积制备出石墨-硬质合金自润滑涂层。对制备的自润滑涂层表面及截面形貌采用SEM进行分析,利用有限元分析软件Workbench对摩擦过程中产生的应力温度等进行了仿真模拟,采用HSR-2M往复摩擦磨损试验机对石墨-硬质合金自润滑涂层进行摩擦磨损实验,并分析其摩擦磨损性能
研究深海生物种类、密度、分布等情况,对寻找天然气水合物,比较不同区域生物多样性,维护深海生态平衡,以及后续评价资源开发和环境影响具有重要意义。但是深海生物数量多、密度大、特征低,利用人工识别方法来识别生物种类和统计生物数量耗时费力且准确度低。针对如何快速准确地检测深海生物这一问题,本文从分形维数和卷积神经网络两个角度出发,分别对深海生物图像进行了特征提取和识别,主要研究工作如下:(1)针对目前国内
水产养殖业在我国拥有着悠久的发展历史。21世纪,随着高新技术的不断发展,水产养殖业正面临着一次彻底的技术变革,由以经验为主的传统养殖业向以技术为依托的现代养殖方式转变。在行业的转变过程中,传统养殖业存在的问题慢慢的显现出来。由于物联网相关产品体系的不断发展,传统的数据采集、存储及养殖方式渐渐的不适用于行业的发展,养殖数据的采集、融合、存储和分析问题慢慢浮出水面。为了帮助养殖从业人员和科研人员解决海
区块链是一种融合了密码学技术、智能合约、共识机制、P2P网络等多种技术的新型应用模式。其具备去中心化、不可篡改等特性,可以在并非完全可信环境下实现点对点交易。交易机制是区块链的核心部分,承担保证交易正确和数据一致性的任务,以及促进共识稳定有效的任务。当前应用最为广泛的是公链和联盟链。在公链中,由于大多采用工作量证明机制,导致交易成本过高以及共识时间难以掌握的问题。而且长时间交易成本过高会导致平台交
声波在水下环境中具有良好的传播特性,是目前应用最广泛的水下通信方式。然而,也存在可用带宽有限、传播时延大、多径衰落等问题。正交频分复用(Orthogonal Frequency Division Multiplexing,OFDM)是一种并行的多载波调制技术,它将信道划分为若干窄带正交子信道进行信息传输,提高了传输速率与频谱利用率,成为高速水声数据传输研究热点之一。信道估计技术可以通过估计信道状态
文章用内容分析法归纳了72篇文献内容并遴选其中28篇作为参考文献,分析了基于知识管理的学习型组织定义内涵及研究框架,并从结合机理、理论基础、构建机理、实践应用四方面阐述了国内基于知识管理的学习型组织研究进展:结合机理包括结合动因和结合方式,前者涉及环境性动因、关联性动因、异同性动因,后者涉及组织系统观、组织生态观;理论基础包括知识链、知识螺旋和组织学习理论;构建机理涵盖学习型组织的知识管理模型构建