【摘 要】
:
随着后基因组时代的进入,作为蛋白质组学的一项分支,蛋白质亚细胞定位研究的热度与日俱增。蛋白质亚细胞定位研究中,基于蛋白质氨基酸序列的特征表达在定位预测阶段扮演着重
论文部分内容阅读
随着后基因组时代的进入,作为蛋白质组学的一项分支,蛋白质亚细胞定位研究的热度与日俱增。蛋白质亚细胞定位研究中,基于蛋白质氨基酸序列的特征表达在定位预测阶段扮演着重要角色;很大程度上,它决定了亚细胞定位结果的好坏。提取蛋白质特征表达以后,通常会面临“小样本,高维数”的问题;因此,为了降低计算开销、减少数据噪声及增强小样本数据集的鲁棒性,使用降维算法处理高维特征表达是必要的。基于此,本文对蛋白质亚细胞定位中的特征表达与降维算法进行了深入研究与分析。本文的主要工作及创新之处概括如下:1.蛋白质有4种基本的、分类性能依次递增的单特征表达:氨基酸组成(AAC)、二肽组成(DipC)、伪氨基酸组成(PseAAC)和位置特异性得分矩阵(PSSM)。为了提高蛋白质亚细胞定位预测准确率,构造信息量丰富的特征表达是有效的方法之一。为此,本文新提出了一种先加权后相加的特征融合模型,通过融合多种单特征表达以形成新型复合特征。实验结果表明该复合特征表达所包含信息量大于被融和的单特征表达。其次,本文基于PSSM提出了一种新特征表达——相关性位置特异性得分矩阵(CoPSSM),经实验验证,CoPSSM的分类性能优于常用的PseAAC和 PSSM。2.核主成分分析(KPCA)与核线性判别分析(KLDA)是两种常用的非线性降维算法。实际应用中,不同的核函数及其不同的核参数将会对降维效果产生显著影响。基于此,本文先研究了单核函数及复合核函数的降维效果区别;而后,针对最优核参数的选取,本文新提出了一个距离判别准则,以将无监督降维算法KPCA改进为半监督降维算法。其次,基于遗传算法(GA),本文新提出了一个优化算法——二分贪心遗传算法(DGGA)去结合新提出的距离判别准则以对KLDA中的核参数进行优化搜索,从而对蛋白质亚细胞进行定位预测。实验结果表明,本文所提的距离判别准则及DGGA优化算法是有效的。
其他文献
近年来,超声波技术早已应用于工业领域的方方面面,在除垢、清洗、催化等方面有着广阔的发展空间。在超声波除垢方面,利用了超声波在液体中产生的空化效应。超声波在液体中发
目的:整理研究15株钩丝孢属真菌的形态特征,并进一步筛选出高产蛋白酶活性和杀线虫活性菌株,对其进行产酶条件和生长条件优化,为进一步研究钩丝孢属真菌杀线虫的分子机制奠定基石,为植物寄生线虫的生物防治提供参考。方法:对15株钩丝孢属真菌进行培养,包括中华钩丝孢1株、尖钩钩丝孢1株、多孢钩丝孢1株、奇妙钩丝孢1株、极小钩丝孢2株、线虫钩丝孢2株、螺旋钩丝孢3株及未知钩丝孢4株,并对部分菌株进行详细形态描
随着化学工业的快速发展,水体污染及其危害已成为人们日益关注的环境问题。水体污染的治理问题已引起了研究人员的广泛关注。凹凸棒石是一种资源丰富、易于开采、成本低廉的
中心波长为1542 nm的全固态连续单频激光器具有低噪声、对人眼安全、波长位于铟镓砷等探测器的探测灵敏区及光纤和大气传输的低损耗窗口等优良特性,在光纤通信、人眼安全激光测距以及国防军事等领域均有重要的应用需求。此外,位于1542 nm附近的乙炔分子吸收线是国际计量局推荐的几种光频标准之一,因此可调谐的全固态连续单频1542 nm激光器在光频标的研制及其在光纤中的长距离分发等方面亦具有非常重要的应用
电致化学发光(Electrogenerated chemiluminescence,ECL)是一门应用十分广泛的分析技术,常用在食品分析、生化分析、环境监测和临床诊断等领域,它不仅结合了光分析所具有的高灵
随着核能的发展,放射性废水的处理成为亟待解决的环境问题之一,是人们广泛关注的焦点。铀具有强化学毒性及放射性,可以通过食物链累积,进入人体的循环系统,引起肾衰竭、甲状
本学位论文主要研究带马氏切换扩散过程的稳定性和树上p-Laplacian主特征值的估计问题.针对R_+× S上的带马氏切换的扩散过程(X_t,Λ_t)t≥0.本学位论文研究了该过程的指数稳定性,包括带马氏切换扩散过程的指数遍历的判别条件和指数遍历速率的显式估计.首先,利用Lyapunov函数理论,无穷小生成元和M-矩阵理论给出(X_t,Λ_t)t>0指数遍历的两种判别方法.其次,在固定环境Λ
能源问题和环境问题一直是近些年来的关注热点,世界各国致力于新能源的开发和利用。氢能因为能量密度高,无污染,可再生等优点,被认为是未来最有发展前景的能量载体。电解水制氢因为制备的氢气纯度高,技术相对比较成熟受到广泛青睐,但是工业上电解水制氢电压(1.8-2V)比理论上的电解水电压(1.23V)高很多,造成了极大的能量损失,能量损失主要来源于阴阳极催化剂的过电位。众所周知,贵金属Pt及其化合物是很好的
以内蒙古四子王旗农牧交错带栗钙土、灰褐土和草甸上三种土壤类型下草地和耕地为研究对象,采用野外调查与室内分析相结合的方法,对0—10 cm 土层土壤团聚体组成特征及其稳定性、土壤有机碳、各粒径团聚体有机碳含量和各粒径团聚体对有机碳的贡献率进行了对比分析。结果表明:栗钙土区耕地与同地点草地相比,>3 mm粒径团聚体含量下降了12.69%~59.12%,≤0.25 mm粒径团聚体含量升高了 22.
核电作为一种对人类和环境没有严重危害且较为成熟的电力供应技术,是解决能源危机的潜在动力来源。然而,核能的日益发展耗费了巨大的资源,也导致了大量的核废料产生。铀作为