基因预测的数字信号处理方法研究

来源 :新疆师范大学 | 被引量 : 0次 | 上传用户:heixue5555
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着人类基因组计划的实施,Gene-bank数据库里的基因组序列急剧增长,若要对这些急速膨胀的数据进行完整的分析处理,以及对DNA序列上的基因结构进行完整的注释,则需要高效的方法来揭示这些数据的内涵,并从中获得对人类更有用的信息。尽管近年来该领域的研究已经积累了一些成果,但针对生物学的复杂性和特异性而言,设计高效算法仍然是数学、计算机科学及生物学等交叉领域研究的热点问题。本文是从数字信号处理的角度出发来研究基因预测的方法,这类方法是利用蛋白质编码区的典型特征“三周期性”来预测基因序列的编码区,即编码蛋白的总傅里叶光谱在N/3频率处有一个峰值,而非编码区没有明显的峰值,因此可以来预测DNA序列的编码区部分。此方法的具体步骤是:先将碱基序列转换成字符序列,然后对此进行傅里叶变换,出现峰值的部分为编码区,否则为非编码区。但是由于傅里叶变换带来了大量的噪声,因此会出现很多伪峰值,使得预测结果不是很理想。所以本文通过去除噪声来提高基因预测的效率。小波变换可以去除傅里叶变换所带来的高频噪声,但是对于第一个外显子较短,三周性不明显的序列,则需要用FIR数字滤波器进行去除。由于已有的FIR数字滤波器在设计上存在缺陷,所以本文在FIR滤波器原有设计的基础上进行改进,并将小波变换和FIR数字滤波器进行有效的结合,建立了一种新型的基因预测方法,并把这种方法应用到抗逆基因序列的预测中。经实验证实,该新方法可行有效并且效率较高,且不需要基因组序列的任何先验知识,易于推广应用。
其他文献
设(M,g)是n维光滑流形,φ∈C∞(M)是M上的正函数,于是g=φ2g上定义了一个新的度量g,它能够保持向量间的夹角不变,称为光滑流形的共形变换.本文分别给出了广义Riemann流形、gR
本文研究如下拉格朗日坐标下一维非等熵的可压缩Navier-Stokes-Korteweg方程的柯西问题:{vt-vx=0vt+p(v,θ)x=(μ(v,θ)vx/v)x+Kx,(Cv-θ/2kθθv2x/v5)θt+p(v,θ)vx=((a)(v
发展方程是微分方程领域的一个重要分支,由于它在生物学、力学及其他各学科中可以有效的用来描述事物的变化过程与时间的关系,因而吸引了许多爱好者的研究兴趣.而在自然界中周
Water eutrophication has become a worldwide environmental problem in recent years. Once a water body is eutrophicated, it will lose its primary functions and su
支持向量机(support vector machine,SVM)是建立在核函数基础上的机器学习算法,在模式识别,模式回归等领域有着广泛的应用。不同的核函数,同一核函数不同的核参数,对于SVM泛化能