基于数据挖掘技术的蛋白质结构分类的研究

来源 :暨南大学 | 被引量 : 0次 | 上传用户:liongliong525
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质结构分类分为多个层次,如何对蛋白质结构进行定量分类和自动分析是目前研究的重点。本文选择蛋白质二级结构数据为主要的研究对象,应用数据挖掘技术和机器学习中的动态规划理论进行蛋白质结构分类。介绍一种新的蛋白质结构分类方法——PSSC,该方法的核心算法是STRIDE算法和ISSA算法,核心步骤是创建分类模型。该分类模型包括构建CATH分类树、计算蛋白质结构相似度、利用统计方法制定分类标准三步。在对蛋白质结构进行四个层次的分类中,应用已有的RMBS、Z-Score结构比对算法和本文新提出的ISSA结构比对算法获得分类参数。最后,介绍自行开发的PSSC分类科学计算软件,并指出需要完善之处和解决方案。
其他文献
由于密码产品本身的特殊性,各国对密码产品的进口、出口及使用都制定了政策和规定。在中国,所有对商用密码产品研究、生产、销售及使用都必须严格遵守《国家商用密码管理条例》
H.323和SIP是国际电联电信分会(ITU-T)和Interned工程任务组(IETF)制定的两条标准。H.323是用于提供多媒体实时通信的系统标准。它体现了一种集中式、层次式的控制模式。可以
随着P2P技术和商业应用的发展,P2P技术受到前所未有的重视。它可以说是一种网络结构的思想,从一定意义上讲P2P技术并非一种简单的计算机技术,而是一种传播技术。它使得网络信息
我的论文题目为“文本自动分类系统的研究与实现”,该项目得到了国家自然科学基金、北京市自然科学基金的资助。本文是对我研究生期间所作研究工作的总结。Internet的快速发展
学位
Ad Hoc无线移动网络由于其灵活性和实用性近年来受到越来越多的关注,各种Ad Hoc网络路由协议的提出及相关的性能分析评价也成为学术界的研究热点。随着组播业务需求的增长,先
科技资源一般包括:人才素质、产业基础、实验设备、资金、信息等,能为科技发展提供方便的资源都属于科技资源。它是科技创新的物质基础,用于反映一个地区的科技发展状况。管理部
网格是把整个Internet整合成一台巨大的超级计算机,实现各种资源的全面共享。网格的用户和开发人员经常需要监控系统的运行以发现未知的性能问题,从而及时发现故障的根源,分析系
因特网的飞速发展推动着城域网的发展,电信运营商对城域网提出了更高的要求,一种新的城域网技术——弹性分组环技术应运而生。 随着宽带接入网络的发展,对宽带接入服务器
电气化铁道运输提速,对牵引供电系统及设备提出了更高的安全可靠性要求。电气设备的停电预防性检修由于诸多客观原因,并不能完全杜绝设备在运行中发生事故。为了能够有效地提