论文部分内容阅读
生物信息学(Bioinformatics)中的氨基酸和密码子的进化是生命起源的核心问题.而密码子使用偏好(codon usage bias)是基因或基因组的方言,与基因的结构功能乃至蛋白质的结构都有着本质的联系.它们在研究基因表达、基因识别、寻找药物靶点和探讨蛋白质结构与功能上都有着广泛的应用.本文以这两方面为重点展开研究,具体工作如下:
在第二章,基于同义密码子域的逐步细化思想(stepwise subdivision)和通用密码子表的网络结构(network structure),论文提出了一种新的氨基酸进化模型,并且把所得的氨基酸进化次序与经典的共进化理论(co-evolution theory)所给出的次序相比较,在验证了共进化理论正确性的同时,又提出了关于氨基酸和密码子进化的几点建议.
在第三章,基于共进化理论和不同密码子位置上的不同核苷酸之间的突变概率,论文提出了衡量密码子用法非对称性的最优方案ADCT,并且在密码子序列比较和计算机辅助基因识别(gerie identification)方面进一步验证了它具有的优势.
在第四章,证明了密码子适应指数(CAI)、香农熵(Shanoon Entropy)和密码子效率数( EffectiVe Number of Codons) 之间的相关性(correlation),证明了N<,c><**>比N<,c><*>和N<,c>更有效,更无偏.第二个问题是Fuglsang在2005年提出来的,至今没解决.证明了基因组序指数S的“负熵”的作用,并讨论了S和H的分段等价性的来源.这两个问题是张春霆等(21305)提出来的.
在最后一章,根据氨基酸的理化距离(physics-chemical distances)和密码子之间的突变概率(mutation frequencies),论文提出了一个新的“密码子挥发度”(codonvolatility) 度量方案.同时,也展示了新方案在序列相似性分析上具备的优势.