基于群体智能的基因表达数据双聚类的研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:hangxujie
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高通量基因微阵列技术的出现,产生了大量的基因表达数据。这些数据在追踪生物过程,基因规则发现以及病理分析中有着至关重要的作用。通常,研究人员通过聚类来挖掘相关的基因集合,然后进行生物学上的整理和分析。然而,由于基因表达数据独特的数据结构和背后的生物意义,倾向于找到全局模式的传统聚类方法并不能很好的找出符合要求的具有局部模式的聚类。于是,更符合基因表达数据特点的双聚类分析被引入进来。当前,对于将群智能算法运用到双聚类分析的研究仍存在或多或少的问题。一方面是群智能算法本身的缺陷所致,如有可能陷入局部最优等;另一方面是没有能将群智能的特点与双聚类分析有机的结合起来,如选取合适的评价指标进行单目标或多目标的寻优。本文基于布谷鸟搜索算法、萤火虫算法和细菌觅食算法等群智能优化算法,从算法结合以及多目标优化等方面进行基因表达数据双聚类的分析研究。本文旨在解决当前双聚类算法的聚类质量差和生物意义不明显等问题。论文的主要工作包括:(1)提出基于布谷鸟搜索算法和萤火虫算法的混合双聚类算法(Cuckoo Search and Firefly Algorithm hybrid Biclustering,CSFAB)。考虑到布谷鸟算法和萤火虫算法可以看作互补的关系,前者具有较强的全局寻优能力,而后者具有较快的收敛速度,于是本文尝试将两者结合。首先,通过实验确定了有效的结合策略,然后将布谷鸟搜索算法的全局搜索能力与萤火虫算法的快速收敛能力有效地结合起来。CSFAB算法可以显著地提高搜索速度和范围,同时能够跳出局部最优解和找到包含不同基因的双聚类,从而提高双聚类的多样性。与CSB、FAB和PSOB等算法比较,实验表明CSFAB算法的双聚类质量和生物意义更优。(2)提出基于多目标细菌觅食算法的双聚类算法(Multi-Object Bacterial Foraging Algorithm Biclustering,MOBFOB)。因为双聚类分析可以看作多目标优化问题,本文将传统的单目标细菌觅食算法依据基因表达数据双聚类分析的特点进行了改进,主要包括:1)对于互不支配时,较优解的确定;2)根据种群中各自的被支配次数排序;3)引入外部占优解集,增加多样性。该算法使用多目标细菌觅食算法,同时优化均方残差和体积等双聚类质量评价指标,找到占优的双聚类解集。通过对双聚类的质量评价指标和生物富集分析,证明了MOBFOB算法能够有效且快速地找到具有显著生物意义的双聚类。
其他文献
人工智能和物联网的高速发展推动了室内定位技术和无线信号、智能算法的紧密结合。人们对位置服务的需求日益增加,尤其在复杂的室内环境中常需获得物体的位置信息。因此,低成
坦克行驶时由于路面激励引发坦克火炮结构产生机械振动,这种振动响应将会对坦克火炮射击精度产生巨大的不利影响,因此研究坦克火炮的振动规律及振动测试方法,对提高坦克的命
在推荐系统研究领域,协同过滤推荐算法的应用和研究最为广泛,在一些推荐任务中取得一定成效。但是,协同过滤推荐算法单一考虑了用户的评分数据,存在数据稀疏性和冷启动问题,
由于大量的工件存在着缺陷且绝大多数以工业CT(Computed Tomography)图像的形式呈列,因此,工业CT图像缺陷的检测(识别与定位)及分割是一个重要的研究课题。目前,利用DL(Deep
随着物流业的不断发展,各地煤炭物流企业如雨后春笋般出现。面对蓬勃发展的市场前景和残酷的竞争环境,作为煤炭物流企业,只有转变原有观念,积极分析快速响应,才能在激烈的竞争中保持领先。然而,物流经营在具体实践仍然存在诸多风险,假设没有完善的风险防控体系,一旦出现问题,将给物流企业造成难以估量的损失。因此,如何全面地识别和监控物流业务开展过程中可能出现的风险,并进行有效地防控,已然成为物流企业所必须应对的
20世纪末是人类历史发展的重大节点之一。一方面,经济全球化到来,各国的经济活动突破了国家的界限。主要表现为:商品贸易自由往来,人才和资金频繁流动,跨国公司也在世界范围
不平衡学习是机器学习的重要研究内容之一。不平衡数据在类别分布上呈倾斜分布,通常情况下少数类具有更高的价值,但在多数类的影响下,传统的机器学习算法对少数类的识别率较
眼睛不仅是观察世界的重要窗口,也肩负着反映身体表征特性的重要职责。眼睛底部的视网膜血管特征是多种疾病判断的重要依据。然而,视网膜血管的结构复杂多样,常常导致难于观
空间技术的发展极为迅速,在现代化战争中空间平台的作用愈来愈显著。各国都在大力地研发空间技术和空间武器,以提高本国在信息化战争中的实力。本课题以空间攻防中采用反卫星
网络技术与计算机技术的快速发展,便捷了地理空间数据获取与分发,使得地理空间数据广泛应用于卫星导航、城乡规划与建设、防震减灾系统等国民经济与国防建设的众多领域。地理