【摘 要】
:
长链非编码RNA(lncRNA)是近年来肿瘤基因组学研究的热点,特指一类种类繁多的核糖核酸分子。lncRNA参与多项生物学过程,其功能主要集中在两方面:组装蛋白复合物,与其它非编码RNA竞争结合。基于lncRNA的关键功能以及相关病理实验,lncRNA的突变和失调可以被证实与多种人类重大疾病存在强关联性。因此,lncRNA与疾病的关联预测工作可助力疾病的诊断与治疗,具有广阔研究前景。迄今为止,众多
论文部分内容阅读
长链非编码RNA(lncRNA)是近年来肿瘤基因组学研究的热点,特指一类种类繁多的核糖核酸分子。lncRNA参与多项生物学过程,其功能主要集中在两方面:组装蛋白复合物,与其它非编码RNA竞争结合。基于lncRNA的关键功能以及相关病理实验,lncRNA的突变和失调可以被证实与多种人类重大疾病存在强关联性。因此,lncRNA与疾病的关联预测工作可助力疾病的诊断与治疗,具有广阔研究前景。迄今为止,众多计算方法已经被应用于lncRNA与疾病的关联预测工作中。一些方法难以集成差异化的多数据源,采用拼接、融合特征向量以预测lncRNA与疾病之间的关联,往往忽略不同数据源之间的潜在关联和噪声,使得特征融合不充分、不均衡,最后导致特征向量维度爆炸、模型训练过拟合或欠拟合,且在模型训练过程中其精度有待于提高,关键超参数的调优存在效率低等问题。本文提出自适应多网络融合学习预测框架Bi-Aero LDA及Aero LDA,预测lncRNA与疾病之间的关联。首先,本文分别采用疾病语义高斯相似性、lncRNA功能高斯相似性、基因Jaccard相似性计算,融合多数据源信息并分别构造疾病相似性网络、lncRNA相似性网络、关联基因融合的疾病相似性网络、关联基因融合的lncRNA相似性网络,并采用重启随机游走算法分别获取各子网络中节点的扩散状态;其次,本文采用Diffusion Component Analysis方法结合奇异值分解方法对扩散状态进行特征融合和维度压缩;最后,本文将融合后的网络特征输入到极端梯度提升模型进行迭代训练,同时还利用粒子群算法对极端梯度提升的关键超参数进行全局优化,以构建Bi-Aero LDA和Aero LDA预测框架。在模型评估实验章节中,本文策略不仅与几类策略相比具有更好性能,而且在预测已知疾病与lncRNA关联和预测新疾病任务中获得较优结果。另外,为了进一步验证两组框架的预测性能,本文选取乳腺癌、卵巢癌、前列腺癌、结直肠癌四种人类重大疾病进行案例研究分析来验证其有效性。
其他文献
原花青素也称缩合单宁,是植物中一类重要的次生代谢物质,可以帮助植物抵抗多种生物和非生物胁迫,并且在人体中可以作为天然的抗氧化剂,其含量对作物品质和人类健康具有重要影响。原花青素在植物中的合成与分布具有严格的组织特异性,尽管其与花色苷同属于类黄酮合成途径,且共用了大部分生物合成过程,但一定存在精细的调控网络分别控制着它们的合成与积累。目前,针对原花青素的研究主要聚焦在双子叶植物的营养器官和果实中,而
苦豆子(Sophora alopecuroides L.)别名为苦豆草、苦甘草,属于豆科槐属草本植物,主要分布于我国甘肃、宁夏和新疆等地区。主要含有生物碱、黄酮、香豆素等化学成分。其为我国新疆哈萨克族的传统药材,主治湿热痢疾、妇科炎症以及皮肤瘙痒等疾病。本实验对苦豆子地上部分化学成分进行了系统研究。以干燥的苦豆子地上部分为材料,采用70%乙醇热回流提取方法进行提取,提取物按极性依次萃取,对不同极性
采用硫酸镍作为化学镀镍镀液的主盐,直接在铸造法制备的镁合金AZ91基体上进行化学镀镍,并对镀层进行腐蚀试验、形貌观察和能谱分析。结果表明,镀镍沉积速率随着施镀时间的增加而增大再减小,镀镍时间为1 h时镀速达到1.42μm/h。在3.5%Na Cl溶液中浸泡4 h后,镀镍镁合金AZ91的腐蚀速率随着施镀时间的增加而减小,镀镍时间为1 h的镁合金腐蚀速率最小,为0.063μm/h,比未镀镍镁合金的腐蚀
细胞衰老是指细胞脱离细胞周期并不可逆地丧失增殖能力后进入的一种相对稳定的状态,是正常细胞的必然归宿。细胞衰老的过程会伴随着包括细胞周期停滞、染色质结构改变、分泌表型改变以及通透性降低和胞内物质沉降等多种改变。癌基因RAS等多种诱因诱导的细胞衰老伴随着衰老相关的异染色质凝集(senescence-associated heterochromatic foci,SAHF)的产生,是细胞衰老的一个重要的
财富是人类生存和发展过程中不可缺少的东西,是人类一生追求的重要目标。在人类社会发展过程中,人们渴望财富、创造财富、拥有财富和享受财富。与此同时,人们也对“财富是什么”,以及“是什么创造了财富”与“财富应该如何分配和消费”等问题形成了一些基本的认识和观点,这就是财富观。财富观是一个历史的范畴。在当代中国发展语境中,人们的财富观是不断演变、深化和发展的。近年来,与市场经济发展相伴而生的资本逻辑,开始对
在矫治颅面部错(牙合)畸形方面,(牙合)平面的作用非常突出,是评估矫治成功与否的关键标准之一。(牙合)平面偏斜主要表现为两侧(牙合)平面不在同一水平位置。其形成原因复杂,研究表明,(牙合)平面偏斜与咬合力、咬合接触面积、咀嚼运动、颞下颌关节形态,甚至头颈姿势位有关。常见(牙合)平面偏斜与下颌偏斜关系主要为同侧偏斜,也有少部分患者为对侧偏斜。临床上非手术矫正(牙合)平面偏斜一直是治疗难点。本文就(牙
长链非编码RNA(long non-coding RNAs,lncRNAs)是一类长度超过200个核苷酸的非编码RNA,研究表明lncRNAs能够在多个层面调控基因的表达水平。近些年的研究发现lncRNAs参与了肝脏糖脂代谢调控,并在糖尿病表型中起着重要的调节作用,对lncRNAs进行更深的研究或许可以使其作为分子标志物或使糖尿病及其相关并发症的治疗应用成为可能。然而,关于Glucagon诱导的l
G蛋白(guanine nucleotide-binding proteins),又称为GTP结合蛋白,是具有GTP水解酶活性的一类信号转导蛋白,定位于细胞质膜内侧。三聚体G蛋白(Heterotrimeric G protein)是由α、β、γ三种亚基组合形成,每种亚基又有多种亚型,不同亚型间的组合及其下游效应决定了G蛋白功能的多样性。在5种Gβ亚基中,Gβ2在发育中的大脑皮质中高度表达。我们实验
公安部公布的数据显示,2020年我国汽车保有量高达3.72亿辆。机动车驾驶人达4.56亿人。如此巨大的汽车数量,使得交通事故发生的频率居高不下,根据国家统计局近三年发布的《中国统计年鉴》数据统计,我国交通事故年均死亡人数6.3万,交通事故发生数23.19万次。在这些交通事故中,有超过两成是由疲劳驾驶引起的,因此设计并实现一个高效的疲劳检测方法对预防疲劳驾驶有着重要意义。本文使用计算机视觉技术,设计
近年来,越来越多的生物学实验和临床报告表明,长非编码RNA(lncRNA)在生物体RNA中占有很大比例,在细胞生长发育、基因表达调节、替代剪接、核组织等各种生物过程中起到关键作用。lncRNA异常表达或功能障碍与各种复杂的人类疾病密切相关,因此预测lncRNA-疾病的关联对疾病的诊断和治疗是必要的。lncRNA和人类复杂疾病的数目繁多,而验证lncRNA-疾病之间相关性的生物实验耗时周期长且昂贵,