基于主成分分析和神经网络的蛋白质糖基化位点的预测

来源 :中南林业科技大学 | 被引量 : 0次 | 上传用户:kittyangie
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机科学和生物科学的不断发展,生物信息学这门学科已成为当下生命科学和自然科学的重大前沿领域之一,同时也是21世纪自然科学的核心领域之一,其研究重点主要体现在基因组学和蛋白组学两个方面。糖基化是蛋白质翻译后重要修饰过程之一,更是蛋白组学研究的重要内容。鉴于已知的糖蛋白结构十分有限,而新的糖蛋白结构层出不穷,借助计算智能技术对糖基化位点进行预测和分析在蛋白质组学中具有十分重要的意义。主成分分析(PCA)是一种数据特征提取技术,它能将数据从高维降到低维,降维后保存了数据的主要信息,从而使数据更容易处理,且提高了分析效率传统的神经网络方法已被应用预测蛋白质糖基化位点,其预测的准确性主要依赖于特征向量的维数(蛋白质序列的长度),并随着蛋白质序列长度的增加而提高,但神经网络的结构变得越来越复杂,增加了计算运行成本。为了解决这一问题,本研究提出了一个主成分分析和BP神经网络相结合的新方法对O-连接糖基化位点进行预测和分析。首先用PCA提取主成分以降低输入特征向量的维数,然后用神经网络预测一个特定的蛋白质序列是否被糖基化。本研究主要围绕以下几个方面进行开展:(1)首先从阐述蛋白质糖基化的知识入手,着重介绍了稀疏编码,并将其作为本研究中蛋白质序列的编码方式。(2)采用主成分分析技术完成数据的预处理,在充分利用原始信息的基础上,将样本数据从高维降到低维,从而使神经网络在下一步的预测中更具效率。(3)提出一种基于PCA和BP神经网络的蛋白质O-糖基化位点预测的算法,对此算法进行了详细的分析和设计。为了更好的验证这种算法的有效性,本研究方法与传统BP算法的实验结果进行了对比。实验表明,采用了本研究提出的新方法具有以下优点(1)网络的收敛速度明显加快,大大的降低了运算时间;(2)糖基化位点的预测的准确性明显提高,说明结合了主成分分析技术的BP神经网络在蛋白质糖基化位点的预测方面具有很大的优势。
其他文献
通过Gleeble-3800热模拟试验机测定了该低碳微合金管线钢的静态(无热变形)和动态连续冷却相变曲线,并通过光学显微镜和电子显微镜对连续冷却后的组织进行了详细观察和分析。发
摘要:[目的]探讨不同木薯品种在朱砂叶螨刺吸胁迫下的生理生化指标变化,为木薯的抗螨品种选育提供理论依据。[方法]田间调查华南8号、南植199和华南205等3个木薯品种朱砂叶螨的种群数量;采用盆栽法比较接螨叶片(处理)与健康叶片(对照)的叶绿素、可溶性糖、可溶性蛋白、脯氨酸和丙二醛(MDA)含量及超氧化物岐化酶(SOD)和过氧化物酶(POD)活性等生理生化指标差异。[结果]不同木薯品种的朱砂叶螨种群
实验研究了热处理工艺对1Cr16Ni3Cu1MoWV钢组织和性能的影响。研究表明,该钢种经(1 070℃、1h油冷)+(-192℃、2h)+(500℃、2h)处理后,抗拉强度(Rm)与屈服强度(ReL)分别为1570、1165 MPa,
针对无缝钢管轧机各机架的轧制条件及轧辊所应具备的主要性能,指出了穿孔机架、轧管机架、定减径及矫直机架轧辊在材质选择上应考虑的因素,提出了各机架轧辊应选用的材质及其硬
手机扬声器等音频设备的仿真对于音频信号的输入输出优化和音频信号在人机交互等方面的发展十分重要。手机微型扬声器的设计涉及到许多领域,其中最关键的是手机扬声器发声过
综合性辞典是一种兼具语文辞典、百科辞典双重功能的工具书.中型综合性辞典按照普及性质的辞典要求设计,以浅显通俗、简明实用为基本定位.坚持辞典编纂的基本原则,着重突出实
【目的】构建双价抗虫基因表达载体并转化水稻,为选育广谱、高抗转基因抗虫水稻提供技术参考。【方法】构建半夏凝集素基因(pta)和苏云金杆芽孢菌基因(Bt)两个抗虫基因的双价表达