同源寡聚蛋白质的信息熵分类方法

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:civili1844
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类基因组计划已进入到后基因组时代,对蛋白质结构和功能的研究和预测成为其主要的研究方向之一。由于通过实验确定蛋白质的结构和功能速度较慢,而且会遇到一些目前无法解决的困难。因此探索利用理论及计算方法来从氨基酸序列快速地推断出蛋白质的结构和功能具有重要意义。本文从氨基酸序列出发,研究了同源寡聚蛋白质分类,主要工作如下: 本文介绍了特征提取方法和同源寡聚蛋白质分类的研究现状,并对同源二聚体和同源非二聚体蛋白质使用了基于伪氨基酸组成成分特征提取和信息熵方法进行分类研究。伪氨基酸组成成分特征提取方法以传统的氨基酸组成成分为基础,又考虑了不同层次残基之间的相互影响,包含了蛋白质序列的许多信息,根据这一特点,本文使用了伪氨基酸组成成分作为特征提取方法。FDOD方法是基于信息熵的信息离散性度量函数,它和叉熵之间存在内在的联系,文中对它们之间的关系进行了研究,并在叉熵的基础上对多分布偏差度量进行了进一步的思考。由于FDOD是叉熵的一种形式,因此在它的基础上根据特征向量的提取情况,对同源寡聚蛋白质进行分类。其分类能力比使用子序列分布为2的FDOD方法要好。 本文中在原数据集中随机抽取一些数据构建了一个子数据集,并使用同样的方法对子数据集进行分类。比较了两个数据集的分类结果,表明数据集的大小对分类系统的影响较大。同时,对伪氨基酸组成成分特征提取方法的中权重因子的选取进行了讨论,说明它可用于调节氨基酸序列次序信息对分类系统的影响程度,在计算中可根据结果的优劣适当选取。
其他文献
在对月球采样返回任务需求及探测器系统任务剖面进行分析的基础上,设计并研制了一种轻量化、大负载、高精度、宽采样范围月球采样机械臂系统。该系统主要由4自由度机械臂及两
重金属污染作为一个严重的环境问题越来越受到人们的关注。利用重金属超量积累植物对污染土壤或水体进行修复的技术,被称为植物修复。植物修复技术以其投资少、效率高、易操
石墨烯在实验上的成功制备掀起了低维纳米材料的研究热潮。石墨烯具有优异的光学、电学和力学特性,被认为是一种在未来具有颠覆革命性的材料,在下一代的电子器件、能源存储设
社交媒体的出现对人们的生活工作学习产生了深远影响。高校公选课有助于提高学生优化知识结构、提升综合素质,但跨专业选课也为教学内容设计和课堂管理带来难度。针对这一问
传统能源的日益枯竭,以及新能源汽车和便携式电子设备的快速发展,促使人们致力于开发各种高效的绿色能源存储技术。超级电容器由于能量密度高、循环寿命长、充放电速度快以及
目的了解医院获得性铜绿假单胞菌感染的临床分布特点及耐药性,以指导临床合理使用抗菌药物提供依据。方法收集2010年1月-2012年12月住院患者标本中分离出的1 814株铜绿假单胞
本文重点研究了电力期货市场的风险规避作用,指出电力期货市场的风险规避作用是通过套期保值交易将风险转移给了期货市场中的投机者,实现了个体的避险。与此同时,期货市场通
在经济全球化的背景下,世界各国之间的交往日益密切。在亚洲地区具有历史传统的中韩两国间的交流也随着政治,经济合作和文化交流等进入全球化时代,世人瞩目,蓬勃发展。但这些交流都离不开翻译,从这个意义上讲,可以说高级翻译专业人才的培养,对促进两国政治,经济,文化交流,对促进社会发展,起着非常重要的作用。但中韩两种语言属于不同的语系,句子结构有很多不同之处,这些会给中韩翻译带来一定的困难。特别是,在韩语句子
外电场作用下的分子涉及很多范围,例如结晶环境、表面分子、或置于外电场中的分子、电场诱导二阶谐波产生、弱电场产生振动频率位移、高压开关中用气体进行电弧控制、辐射场
背景 急性肺损伤(Acute Lung Injury,ALI)/急性呼吸窘迫综合征(Acute Respiratory Distress Syndrome,ARDS)是严重感染、创伤、休克等肺内外疾病后出现的以肺泡毛细血管损伤为主