论文部分内容阅读
在海洋鱼类胚胎冷冻保存试验中,试验材料的获取带有很强的季节性,试验数据获取难度较大,很难取得大样本数据。采用目前常用的8种抗冻剂在6种不同浓度和3种平衡时间下的全组合方案将高达3745050之多,是常规试验设计所无法完成的。如何能从有限的试验数据中找出毒性低且渗透性强的组合抗冻剂方案是本文的研究目标,而支持向量机是专门研究在有限样本下学习规律的学习机器,具有良好的泛化性能,在很多领域得到了很好的应用,但在抗冻剂毒性试验设计方面尚没有报道。
相同浓度及平衡时间下,组合抗冻剂要比单一抗冻剂毒性低。本文是要挑选出多种抗冻剂按照不同浓度配比并平衡不同时间后,能够达到较高孵化率的试验方案。根据孵化率的高低分为三个档次,是典型的三分类问题。在前期已获得的单一抗冻剂毒性试验数据的基础上,采用由台湾大学林智仁教授等开发的LIBSVM和BSVM软件包中的多分类算法,对已有数据训练出.二个分类的判别模型,然后用这个模型对由领域专家组织的待测组合抗冻剂试验方案的结果进行预测,并在预测结果的基础上从各类中随机挑选出部分试验方案进行生物试验验证,同时将试验数据添加到原训练数据集,使学习机获得组合抗冻剂的知识,然后再训练,修正模型,再预测,经过几轮训练、预测、验证、再训练、再预测、再验证的过程,使学习机获得组合抗冻剂的有关知识,就可以在由系统生成的待测方案中为生物试验提供比较准确的预测了。
支持向量机中,不同的核函数和不同的参数组合以及不同的分类算法对于分类的准确性是有一定影响的。经对比分析,研究中采用了径向基核函数,并借助网格搜索策略来寻找最佳的参数组合。对两个软件包中的多分类算法作了深入全面的对比分析,在不同的数据样本和参数组合下,BSVM软件包都获得了比LIBSVM软件包更高的准确率,且差异明显,初步认为BSVM软件包更适于本研究课题,但因采集到的生物试验数据有限,最终适宜模型及开发平台的认定还有待进一步的生物试验来论证。结果表明支持向量机为生物试验设计提供了一种新的可行的思路和方法。