【摘 要】
:
转录组学数据的快速积累为生物学和病理学行为预测提供了新的视角。然而,由于这些数据集的规模大,完整的转录组学数据分析是非常困难和低效的。因此,如果我们对这些数据执行分类模型,则将花费大量时间并增加成本。这需要一些初始的预处理步骤来减少数据集的维数而不丢失信息。从复杂的转录组数据中提取有意义的或关键的特征可减少转录组学数据的维数和复杂性,并提取关键性特征以预测生物学和病理学行为,例如肿瘤原发部位预测。
论文部分内容阅读
转录组学数据的快速积累为生物学和病理学行为预测提供了新的视角。然而,由于这些数据集的规模大,完整的转录组学数据分析是非常困难和低效的。因此,如果我们对这些数据执行分类模型,则将花费大量时间并增加成本。这需要一些初始的预处理步骤来减少数据集的维数而不丢失信息。从复杂的转录组数据中提取有意义的或关键的特征可减少转录组学数据的维数和复杂性,并提取关键性特征以预测生物学和病理学行为,例如肿瘤原发部位预测。降维后的数据表示可以提升模型性能,可以用于生物标记物发现,样品分类和疾病过程解释,为精准医学铺平了道路。针对上述问题,本课题主要做了以下三个方面的工作:1.LINCS转录组学数据治理管道LINCS-Extract。针对LINCS转录组学数据的实验类别严重不平衡的问题,本章提出了LINCS转录组学数据治理管道LINCS-Extract,通过统计分析LINCS数据集筛选出满足本课题所需要的数据。2.基于自编码器的深度表示学习模型TDRL。针对LINCS转录组学数据集具有高维度,复杂性高,噪声量大等问题,本章提出了一个转录组数据表示模型TDRL。TDRL模型基于本章提出的多通道自编码器(MCAE),结合了本章提出的新的损失函数decol_loss,并且在训练过程中,学习率采用warmup预热和指数衰减策略。3.基于转录组学数据的肿瘤原发部位预测模型DTPS。针对目前肿瘤原发部位预测方法相对较差的性能和有限的样本可用性等问题,本章提出了一种基于转录组学数据的肿瘤原发部位深度学习预测模型DTPS。DTPS模型结合TDRL模型的转录组学数据表示,只需经过微调即可直接用于基于深度学习的肿瘤原发部位预测。
其他文献
金、银纳米材料的可调等离子体性能使其成为最广泛使用的金属纳米粒子。但其有限的稳定性限制了它们在生物医学领域的发展。其中,银纳米粒子(AgNanoparticles,AgNPs)差的抗氧化性和潜在的生物毒性限制了它的使用,而金纳米粒子(AuNanoparticles,AuNPs)虽然具有更强的化学惰性,但是高温环境下仍不可避免的会团聚变形。为了在苛刻外部环境下,维持AuNPs、AgNPs的等离子体性
电气化交通、能源互联网、新一代移动通信等产业的发展转型对电力电子设备提出了更高的要求,如更高效率、更高功率密度和更高可靠性,而现有硅基功率半导体器件的性能难以满足发展需求。碳化硅(Silicon carbide,SiC)MOSFET具有高开关速度、低导通损耗、高热导率等优异特性,将广泛应用于中大功率场合的高效、高功率密度变换器设计,具有广阔的应用前景。然而,SiC MOSFET在应用过程中面临着高
全局固定优先级(Global Fixed Priority,GFP)多处理器调度可实现实时嵌入式系统的多任务并行,但增加了实时分析难度。解决GFP多处理器调度实时分析的关键是找到一个临界时刻,因为该临界时刻可导致最坏响应时间(Worst Case Response Time,WCRT)。然而,在目前实时分析基础理论条件下,抢占式的GFP多处理器调度尚未能找到临界时刻,故无法从理论上证明出最优解,这
随着社会经济和科技的快速发展,环境污染以及能源可持续使用等问题渐渐得到重视,人们对居住环境的要求也日益提高,既要得到高品质、健康的生活环境,又要减少能源的消耗。利用废热回收的新风供给技术能够减弱能耗大和保证较高品质新风之间的矛盾,但是以往的换热器存在热效率较低、能源消耗大等问题,从而限制了换热器的发展和应用。膜式全热交换器能够在能耗较小的情况下引入室外新风,达到节能效果的同时又可以减小系统的能耗;
随着云存储的迅速发展,云上数据安全问题引起越来越多的关注。传统云数据审计方案采用第三方机构对用户数据进行完整性审计,且默认第三方机构是绝对可信的,但实际情况下第三方机构和云服务商一样无法信赖。针对这种情况,本文对云存储数据完整性验证方案开展相应研究,并结合区块链技术提出了相应的解决方案。首先针对传统三方验证模型中第三方审计机构的信任问题,采用具备去中心化和不可修改等特性的区块链作为具体的第三方审计
随着“一带一路”的不断拓展和外向型经济的不断深化,越来越多的企业选择“走出去”,通过海外并购的方式获取资源、拓展市场以提高自身的竞争力。成功的跨国并购能帮助企业提升品牌、改进技术、扩大市场,相反,失败的并购则可能导致企业财务风险增加、企业利益受损。海外并购对企业会产生积极或者是消极的影响,需要通过绩效的变化来体现。因此,分析企业跨国并购的动因,并对并购后的绩效进行评价,有助于全面了解企业并购面临的
复杂异形曲面是一类形状非结构化、曲率突变且边缘检测较难的曲面。航空发动机涡轮叶片作为航空发动机的关键组成部分,是一类典型的复杂异形曲面工件,其三维点云处理是三维测量的关键步骤,直接影响着后续加工、打磨精度。本文针对航空发动机叶片等复杂异形曲面工件的精密测量过程中的点云预处理、分割、平滑与重建等算法开展研究,解决了其测量加工过程中精度低、实时性差、鲁棒性不强等问题。本文主要研究内容如下:1)面向高端
号召外来务工人员加入志愿服务的队伍既可以充分调动可利用的资源,使一些外来务工人员由“受助者”向“助人者”转变,同时也能够增加外来务工人员对于城市社区的认同感和归属感。笔者在实习的过程中发现,在一些外来人口聚集的区域,部分外来务工人员对志愿者的认知程度比较低,对志愿服务不了解,参与志愿服务的积极性不高。社区在志愿者培育方面存在志愿人员固定,新鲜血液匮乏;缺乏比较系统的培育方案;志愿服务质量不高,只能
柬埔寨旅游业在吸引全世界的目光同时,也为柬埔寨带来丰厚的旅游经济收入,为柬埔寨融入和适应世界经济一体化创造了必要的条件。暹粒省是柬埔寨暹粒省的省会,也是世界最著名的旅游胜地之一,也是中国游客重要的旅游目的地,中国游客成为柬埔寨旅游产业发展的重要力量。在游客消费的清单组成中,旅游购物是消费者的重要支出部分,也是提高旅游消费水平的重要途径。中国游客在旅游消费过程中的支出不仅仅局限于酒店、餐饮,还在购物
基于移动机器人的场景三维重建和重定位是后续路径规划、导航及跟踪问题的重要基础,其中高效构建高精度且鲁棒的全局离线地图至关重要。无论是工业界还是学界,利用双目相机提供的冗余观测,可以极大地提升视觉里程计的可靠性和精度。尽管视觉里程计相对于过往取得了不少进步,但是在视觉离线建图和视觉重定位这两个领域中,现有业内的开源方案并没有充分发挥多传感器的优势,这导致了场景构图不准确,重定位不够鲁棒。因此基于视觉