论文部分内容阅读
医药学研究领域中存在大量的决策分析,如初治完全缓解的急性白血病患者生存时间最长的时缓解时间和治疗时间水平、诊断试验最优决策界值、公共卫生资源的最优分配、动物疾病模型的造模条件选择、药物有效成分最优提取条件确定等优化问题都属于决策分析。决策分析就是利用目标函数对目标变量进行评价,研究决策变量可行组合所构成的决策方案集,何种组合为优,从而确定满足条件的最优决策。单目标优化只有唯一最优解,而某些含约束条件的单目标优化,其解不具有唯一性。传统方法采用直接法、等高图法、最速下降法、列举法等,但都存在较大的主观性或者局部最优。多目标优化通过对各子目标的折衷处理,寻找一组可选的、非受控的、最佳解决方案集,称为Pareto最优解集,也就是说在需要考虑所有目标时,搜索空间中没有其他方案能优于它们。实际应用中,决策者往往希望提供不止一种的选择方案。传统方法常将多目标问题转化为一个或一系列的单目标优化问题来完成,目标规划法、乘除法、线性加权组合法和功效系数法的优化解,往往是在某一个目标上最优,而在另一个目标上可能是最差的,不能保证所有目标都存在最优解,且它们只能提供唯一解,这也是困扰运筹学界一个有待攻关的问题。近年发展起来的遗传算法(genetic algorithm,GA)是模拟生物自然进化过程的随机优化搜索方法,遵循达尔文生物进化学说,认为生物后代的繁衍,既有遗传也有变异,依“优胜劣汰”原则使生物种群不断进化。研究表明:遗传算法擅长全局搜索,可以有效地避免局部最优,为单目标优化提供全局最优解。用于多目标优化时,能够对代表整个解集的种群不断进化,以内在并行的方式搜索多个非劣解;另外,通过调整算子,在每次运行中都可获得一组Pareto最优解集,为决策者提供一个选择空间。因此,对于多目标优化的多准则、难以处理的大规模、高度复杂化的搜索空间,遗传算法是非常适合的。本课题在介绍遗传算法原理和方法的基础上,利用英国Glasgow大学软件工程师陈益开发的Matlab外挂SGALAB工具箱,研究医药学研究领域中几个最优决策界值选择的优化问题。本课题的研究内容主要有:第一部分单目标遗传算法效果分析及应用研究对标准测试函数f1(x)=x2、f2(x)=(x-2)2,x∈[0,2],分别进行最大优化。结果显示:在x∈(0,2)范围内,搜索的目标函数值等于或接近4,与函数唯一解有较好的近似度。提示:单目标优化结果达到了测试函数理论值水平,所用SGALAB beta5程序是合理的;由于遗传算法的随机性,应用中可多运行几次,选择目标函数值最大或取平均水平作为最优解方案。在此基础上,重点研究初治完全缓解的急性白血病患者生存时间最长以及患者生存时间不低于24个月,持续缓解时间和巩固治疗时间的水平;同时研究了目标变量无约束、模型略复杂、决策变量可控的芦丁最优萃取条件。结果显示:持续缓解时间达到72.4个月、巩固治疗时间达到41.1个月,患者最长可以活满78.3个月。初治完全缓解的急性自血病患者生存时间不低于24个月,则持续缓解时间不低于19.1个月,或巩固治疗时间不低于30.1个月。在三棱超临界CO2萃取芦丁工艺的最优试验条件研究中,结果提示:萃取压力18Mpa、萃取温度45℃、改性剂用量36ml、改性剂体积分数为0.95、静态平衡时间30min、动态萃取时间45min,芦丁萃取量可以达到5.5023ug/g,与试验结果中最高萃取量的8号试验相比,提高了10.68%。第二部分多目标遗传算法及效果分析对测试函数f1(x)=x2、f2(x)=(x-2)2,x∈[0,2],进行两目标最大的优化。结果显示:决策变量x的Pareto非劣解基本在两函数交叉点附近分布,该处是x的最优选择范围;多目标遗传算法(MOGA)、小生境遗传算法(NPGA)、非劣分类遗传算法(NSGA)、改进的非劣分类遗传算法(NSGAⅡ)95%可信区间包含了交叉点解,向量评估遗传算法(VEGA)的x偏向较大取值一侧;非劣解前端光滑地沿曲线分布;五种多目标遗传算法搜索的子目标函数值、决策变量x的Pareto非劣解平均水平尚无统计学差异(F值均为0.184、P值均小于0.001);NPGA解的变异度大、多样性好,MOGA、NSGA精度高,VEGA给出始末端处的非劣解较多。提示:对于互为冲突的两目标优化,可以首选MOGA、NPGA、NSGA,其次选择NSGAⅡ,而VEGA的结果可作为参考;应用中,据实际问题的需要,在给出的Pareto非劣解方案中,选择合适的满意解或者平均水平作为最优解。由于搜索结果符合测试函数的数学理论,认为所用多目标遗传算法程序具有合理性。第三部分多目标遗传算法在最佳诊断决策界值选择中的应用研究流行病诊断试验需要在灵敏度、特异度最大前提下确定最优决策界值。传统方法取灵敏度与特异度函数交叉点作为最优决策值,根据实际需要来看,该法存在一定的局限性。本章对可疑贫血患者红细胞平均体积(MCV)决策界值的研究显示:五种多目标遗传算法的目标函数值、MCV决策水平尚无统计学差异,且都包含交叉点,但各方法变异度不同,MOGA、NPGA提供的解多样性好,因此,对灵敏度与特异度相互冲突的两目标优化,MOGA、NPGA仍是首选的方法。如果治疗缺铁性贫血的疗法效果好,对无病者的健康没有严重影响,费用不高,可以要求诊断的灵敏度高,选择以MOGA 8号方案,即MCV<84 fl诊断为贫血,其灵敏度76.5%,特异度50.0%。也可以选择MOGA的平均水平作为决策界值,即MCV<81 fl诊断为贫血,其灵敏度61.8%,特异度68.2%。本课题增加约登指数、灵敏度特异度和、灵敏度特异度积的目标函数研究优化效果,但从进化结果看,不同目标数间结果尚无统计学差异。提示:应用中抓住问题的主要目标,就可以达到研究目的。诊断试验决策界值选择与成本关系密切,需要确定使成本最小的ROC最佳工作点,再通过模型计算决策界值。因为难度较大,应用中成本问题往往被忽视。本课题将其转化为:①ROC曲线最佳工作点处切线截距intercept=se-slope·(1-sp)最大,②ROC曲线最佳工作点处切线斜率与ROC曲线斜线相等,即constraint=-abs(df(1-sp)-slope)最大,利用遗传算法进行两目标优化。结果显示:当成本比为0.25,MCV<88.5 fl诊断为贫血,诊断试验的灵敏度为94.1%、特异度为30.3%;当成本比为0.5,MCV<82.0 fl诊断为贫血,灵敏度为70.6%、特异度为63.6%;当成本比为0.75,MCV<78.0 fl诊断为贫血,灵敏度为50.0%、特异度为77.3%;当成本比再增大时,确定的红细胞平均体积决策水平更低,方法的灵敏度降低,应用的价值不大。遗传算法与数学求导结果很近似,在大部分指标上尚无统计学差异,其中以MOGA、NPGA、NSGAⅡ结果更为满意,其次是NSGA,对于相互冲突的两目标优化,VEGA不作为首选,可以作为补充。由于遗传算法不要求对优化问题的性质作深入的数学分析,其效果优于双正态模型。第四部分基于多目标遗传算法的疾病预后判断标准的选择研究表明,流行病诊断试验方法也可用于疾病预后判断标准的选择,在不考虑成本比时,对于严重头外伤患者脑脊液同工酶——肌氨酸激酶(CK-BB)预后判断的决策界值选择,选择2目标结果较好,2目标五种遗传算法的搜索效果尚无统计学差异。如果损伤早期有较好的预防措施,可以选择MOGA 15号方案,即CK-BB>91(U/L)为预后不良,其灵敏度为85.4%,特异度为42.1%。考虑成本比时,MOGA、NPGA、NSGAⅡ的效果较满意。结果提示:成本比为1.0,CK-BB>86U/L预后不良,诊断试验的灵敏度为87.8%,特异度为42.1%;成本比为2.0,CK-BB>159U/L预后不良,灵敏度为73.2%,特异度为73.7%;成本比为3.0,CK-BB>233U/L预后不良,灵敏度为58.5%,特异度为84.2%。这些结果为临床医生针对具体治疗措施的效果,对患者预后进行合理判断提供了参考。由于严重头外伤患者不良预后的发生率为68.3%,成本比的可行取值范围在0.1~4.0;可疑贫血患者的患病率是34.0%,成本比的可行取值范围是0.1~1.5。提示:某些文献提到成本比取值范围为0.5~2.5,可认为是一个常用的可行取值范围,应用中应考虑先验概率水平和研究目的,对成本比作出合理选择。第五部分基于遗传算法的药物有效成分最优提取条件确定本章利用微波萃取五味子提取工艺的资料,研究浸膏得率(%)、五味子醇甲含量(%)、五味子总木脂素含量(%)、五味子醇甲转移率(%)四个相互竞争的多目标优化,结果显示:VEGA给出始末端处的解较多、最大目标函数值较大,因此,对于多个相互竞争的优化问题,首选VEGA,其次可以考虑NSGA、NSGAⅡ;这三种方法的五味子醇甲、五味子总木脂素都达到了单目标最大目标函数值的77%以上,确定的最优提取条件的效果高于试验中任何一个方案。由于五味子醇甲转移率可通过五味子醇甲来计算,利用前3个评价指标作为目标函数,就可以达到很好的效果。若以三目标NSGAⅡ11号方案看,50克五味子饮片粉碎79目,加入4.5倍的89%乙醇,在703W微波下萃取8分钟,浸膏得率22.06%、五味子醇甲5.06%、五味子总木脂素11.83%。