论文部分内容阅读
对于模式识别系统而言,不同的训练样本在建立分类模型时所起的作用不同,以往的蛋白质关联结构预测方法都是从样本集中随机选取一部分样本作为分类器的训练样本,这将降低蛋白质关联结构分类器的预测精度,为改善训练样本对预测精度的影响,本文提出一种基于样本选择及BP神经网络的蛋白质关联结构预测方法.该方法选取与蛋白质关联结构相关的属性进行编码,并采用样本选择技术从编码后的样本集中选取一定的高质量样本构建预测模型,从而有效地对蛋白质关联结构进行预测.本文根据提出的编码方式对从蛋白质数据库PDB中获取的200个蛋白质进行编码,然后用最近邻算法选择训练样本,并使用BP神经网络建立相应的预测模型.实验结果表明,进行训练样本选择能够有效提高蛋白质关联结构的预测精度.