基于动态规划和支持向量机的蛋白结构域预测

来源 :复旦大学 | 被引量 : 0次 | 上传用户:a81569476
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了两个新的蛋白结构域预测系统,PPSAA-Domain和KemaDom,这两个系统分别采用基于模板的预测方法和从头算的预测方法。 首先,我们设计了一个新的基于模板的蛋白结构域预测系统PPSAA-Domain。该系统框架(Framework)包含三个主要步骤:第一,用自己提出的Profile-Structurealignment方法(PPSAA)比较两个不同蛋白之间的相似性;第二,用我们给出的PPSAA-Template算法在已知蛋白结构域数据库中查找相似模板;第三,用我们提出的以贪心方法为主要思想的GreedyCombination算法对第二步得到的模板进行组合以达到结构域预测。该系统框架解决了当前基于模板方法无法模拟低同源性(remotehomology)结构域的问题。 其次,作为对基于模板方法的补充,我们设计了一个新的从头算预测方法,KemaDom。该方法利用基于子空间特征的SVM(支持向量机,SupportVectorMachine)集成模拟氨基酸上下文信息(10calcontext),这种集成方法可以增加预测的多样性。在特征抽取方面使用生物知识,二级结构、氨基酸溶剂可及性和物理化学特性作为学习器的输入单元。在CATH数据集和CAFASP4数据集上,实验结果表明我们的方法在整体性能上要优于目前已有的从头算方法。最后,我们还将该方法做成网页服务器,科研和商业用户都可以免费使用。
其他文献
石油勘探开发是石油工业的重要部分,直接决定了石油产量,在石油勘探开发过程中,会采集到大量的三维地震数据。 本文根据三维地震数据特点,围绕海量数据的读取和运算、数据的管
防火墙与入侵检测作为保障网络安全的重要技术手段被广泛应用,但现有的安全方案往往将防火墙与入侵检测系统分开单独使用,这样不能满足网络安全整体化、立体化的要求。 实现
当今信息技术发展迅速,为无线传感器网络(WSN,wireless sensor network)的发展创造了良好的环境。传感器网络有着广泛的应用,并存在大量的研究,WSN已慢慢融入到人类生活的各
现有的网络编码与P2P技术结合的数据分发方案对网络性能有所限制,若信源节点以网络的组播容量来确定数据的发送速率将会导致大量链路空闲浪费网络资源,然而源节点的发送速率
科技的进步和信息技术的发展使世界进入了前所未有的全球化时代,未来企业要想在竞争中立于不败之地,必须能够纵观历史和洞察未来趋势,以快速做出决策,而快速决策来自于对市场、客
无线传感器网络用于收集和传输环境数据,由大量无线的低功耗小传感器组成。这些微小的传感器节点具有数据处理、通信和感应部件。通常,传感器节点的价格都很便宜,以便于能够
虚拟机(Virtual Machine,VM)是相对我们平常所用的实际的计算机而言的一个概念,它是一个假想的模拟实际计算机进行工作的软件系统,同真实计算机一样,虚拟机有自己的中央处理器,指
为遏制当前校园内盛行的学生为完成作业相互抄袭之风,我们开发了一个论文甄别系统。这个系统利用现有的网络搜索引擎下载与学生上交的论文相关的文章,并自动把学生论文和下载
由于经典的粗糙集理论不能处理原始数据资料中的遗漏信息以及含有连续属性的数据,需要对这些数据进行补齐和连续属性离散化才能用于知识获取。因此数据预处理在粗糙集理论应用
进入新世纪以来,计算机技术、传感器技术得到迅速的发展,无线传感器网络开创了一个全新的研究领域,是学术界研究的热门课题。无线传感器网络在军事、国防安全和商业领域已经