数据挖掘技术在蛋白质生物标志物发现中的应用

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:liuyong19840815
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质组学的高速发展为发现癌症生物标志物带来了广阔的前景。本研究基于质谱数据的高维度和稀疏性,利用数据挖掘技术搭建了一套完整的蛋白质生物标志物发现工作流程——PBMiner。该流程由四大模块组成:数据预处理、特征筛选、分类模型构建以及分类模型评估,最终筛选出特定的生物标志物组合。我们将PBMiner应用于弥漫大B细胞淋巴瘤质谱数据,确定了由六个蛋白(PALD1、TBC1D4、TNFAIP8、CMAS、MME和PTPN1)组成的生物标志物。利用该组合分别构建随机森林模型和非线性SVM模型,在训练集和测试集上受试者工作特征(ROC)曲线下面积(AUC)都等于1,能够完全正确区分弥漫大B细胞淋巴瘤的两个亚型。我们还将PBMiner应用于肺腺癌质谱数据,确定了由19个蛋白(ABCF1、LAMC1、SRP72、OLFML1、AGER等)组成的生物标志物。利用该组合构建的随机森林模型,在训练集和测试集上的AUC分别为1和0.99,区分癌和癌旁的准确率高于97.5%。综上,PBMiner为发掘潜在的诊断和分子分型蛋白标志物提供了快速有效的方案。
其他文献
小分子药物探针,是药物靶标蛋白发现和新活性分子发现的强有力工具。在保留药物分子活性基团的情况下,通过修饰引入特定的报告基团等片段,这样设计得到的分子不仅具有和药物分子相似的生物活性,而且还能通过化学生物学手段提供分子层面的海量活性分子与靶标蛋白之间相互作用的信息,从而进行靶标蛋白发现、确证研究或指导药物发现。设计合成一个有效的、理想的药物分子探针,关键两个前提:1.经过修饰后探针分子活性能够保持;
肽脱甲酰基酶是一种金属蛋白酶,它存在于原核生物及真核生物的线粒体、叶绿体中,是蛋白质合成过程中的关键酶。原核生物的肽脱甲酰基酶是一种新型抗菌药物靶标,其抑制剂有望成为对抗“超级细菌”的新型抗生素。近年来,研究人员发现人源肽脱甲酰基酶(Hs PDF)在多种癌细胞中过度表达,抑制Hs PDF可以有效抑制癌细胞增殖,因此,Hs PDF被视为一种新的抗肿瘤靶标。尽管已有数百种肽脱甲酰基酶抑制被报道,但由于
Sigma受体家族是不同于阿片受体的一类独特的受体。现已有研究证明其亚型sigma-1受体配体具有促进神经再生功能,有助于神经退行性疾病的治疗。本文在本课题组发现的sigma-1受体高亲和力配体12的基础上,以提高血脑屏障透过性为目的进行研究。依据经典sigma-1受体配体药效团模型的特征,结合sigma-1受体晶型结构中关键氨基酸残基与化合物的相互作用,合成了新型的3-烷氧基异噁唑-5-酰胺类s
随着现代社会的急速发展与无线通信的广泛推广,对大容量数据的高速传输的需求不断扩大,有限的通信频谱资源日渐紧缺。近年来研究指出,不同轨道角动量模式数的涡旋电磁波间具有正交性,能够同时在相同频率上传输不同的信号。因此,携带轨道角动量的电磁波可以实现数据信道增强,能够有效地解决目前通信领域在信道资源方面遇到的瓶颈。电磁超表面技术自被提出以来,便成为一个实现调控电磁波的重要新方式。电磁超表面具有体积小、成
电化学氧还原反应(ORR)因其在金属空气电池和质子交换膜燃料电池中的应用而引起人们的广泛关注。贵金属Pt基催化剂(PMG)作为有着良好催化活性的阴极催化剂,却因稀缺性、反应动力学缓慢等缺点限制了其大规模应用。Fe基催化剂拥有含量高、价格低等特点,成为极具应用前景的非贵金属(PMG-free)电催化剂。但是Fe-N/C催化的中间产物H2O2会与Fe2+发生Fenton反应,破坏碳基质,严重影响催化剂
双语或第二语言学习的经历往往伴随着大脑结构和功能的改变,而结构改变通常和功能变化息息相关。但是,以往的研究没有直接探索二语学习者大脑结构连接、语言控制任务下的有效功能连接之间的关系,以及二者是否会对语言控制的行为表现产生影响。在本研究中,75名汉-英双语被试在核磁共振设备中执行图片命名任务,先后采集他们大脑在任务下的功能核磁共振成像(fMRI)数据和高角分辨弥散权重成像(HARDI)数据。根据对f
学位
物理概念一致性是指学生对于物理概念的理解不随着外在条件的变化而产生变化的能力,它是衡量学生对概念理解程度的关键。物理概念和规律贯穿于整个高中物理学习过程中,由于高中物理概念有较高的抽象性,学生对于物理概念的理解往往只停留在较浅的层次上,因此大部分学生往往不具备物理概念的一致性。因此研究高中生在答题时所表现出来的概念一致性水平,并基于提高学生概念一致性的目的进行相应的教学干预是十分必要的。本文根据国
学位
近年来,缺血性脑卒中的发病率升高并呈现年轻化的趋势,成为最具威胁人类健康的疾病之一。本课题针对缺血性脑卒中开展基于中药活性成份的药理学研究,我们前期研究结果发现,羟基红花黄色素A(Hydroxysafflor yellow A,HSYA)在8mg/kg、16mg/kg浓度下对脑缺血损伤有较好治疗效果,但在16mg/kg剂量下不良反应多,4mg/kg剂量下疗效不明显。因此,我们结合临床上红花或远志的