一种基于遗传算法的转录因子结合位点识别方法

来源 :东北师范大学 | 被引量 : 0次 | 上传用户:sakurzhe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为一种重要的转录调控元件,转录因子结合位点的识别已经成为当前的研究热点。准确的预测、识别算法有助于人们识别不同转录因子的目标基因,进而研究转录因子结合位点在上游调控区中的位置对转录调控的影响。转录因子的结合位点不是唯一的,为某一转录因子的结合位点建立一个统一的表述模型,称为Motif。目前的转录因子结合位点识别方法就是基于为已知的转录因子结合位点建立Motif模型,在基因组序列中对同类位点进行预测。本文研究了遗传算法在处理转录因子结合位点识别问题方面的可行性,提出了一种新的方法——基于遗传算法的转录因子结合位点识别方法(GATFBS)。遗传算法是模拟自然界生物进化过程的计算模型,是一种自组织与自适应的人工智能技术。作为一种全局优化搜索算法,遗传算法以其简单通用、鲁棒性强,适于并行处理以及应用范围广等显著特点,日益受到普遍重视。本文将遗传算法与转录因子结合位点识别问题相结合,以一致性序列模型作为保守序列Motif的描述模型,通过对Motif序列与待测序列的局部序列比对问题进行编码,将其转化成搜索空间中的优化问题,利用遗传算法来搜索最优解,预测转录因子的结合位点。本文算法的实现采用的是C++语言,应用该方法进行了Motif与待测序列的比对,通过实验证明了其可行性和有效性,并通过适当调节控制参数,有效地抑制了遗传算法的未成熟收敛问题。文章最后对算法的实验结果进行了分析,并对算法进行了评价,实验结果表明,这种新的方法是有效的,它在占用少量内存的情况下能够准确地识别出待测转录因子结合位点。
其他文献
规划识别是人工智能领域近年来发展起来的一个重要分支。规划识别是指根据观察到的智能体的片断的、琐碎的动作来推断智能体的目标及它的规划,从而预测智能体未来的动作序列
在保证内容传输的安全方面,目前大多数运营商采用条件接收(Content Access,CA)或数字版权管理(Digital Rigthts Management,DRM)技术来实现,但是根据国际知识产权联盟(IIPA)2
虚拟现实(Virtual Reality)技术是当代信息科学的前沿研究领域。VR综合应用了计算机图形学、计算机视觉等多个学科领域的关键技术,在计算机中营造出一个虚拟的环境,使用户产
随着实时应用对效率要求的不断提高,以及移动通信技术的快速发展和移动计算机的大量普及,由移动计算和实时应用结合传统数据库技术而形成的移动实时数据库系统已成为数据库领
UML作为面向对象分析和设计建模语言的标准,有广泛的应用和扩展背景,通过UML的扩展机制使其支持面向方面状态图的建模,但UML建模的状态图采用的是自然语言描述及图表结构,缺