论文部分内容阅读
近几年,中国糖尿病患者增加的越来越快,已经严重影响国民健康。研究表明亚健康容易诱发糖尿病,糖尿病又经常伴有相关并发症,不及时地预防、治疗会给患者和国家带来沉重的负担。亚健康缺少客观判断规则、糖尿病潜伏期较长,单纯依靠人工诊断是一项很大的工程,给我国医疗体系带来很大压力。因此,利用数据挖掘技术训练智能辅助诊断模型成为当下研究热点。BP(Back Propagation)神经网络和支持向量机(Support Vector Machine,SVM)常用来建立疾病预测模型,但BP网络易陷入局部极值、SVM对参数依赖严重,导致性能不理想。因此,本文以BP网络和SVM为研究对象,分别建立高精度的亚健康和糖尿病诊断模型。具体工作内容和创新点如下:(1)重点介绍了BP网络和SVM的基本原理,并分析了现有的改进方法。(2)采集国家临床医学科学数据中心的糖尿病数据集,完成了数据预处理工作,生成特定格式的训练样本。(3)针对遗传算法(Genetic Algorithm,GA)的早熟问题,提出一种基于概率扰动和半初始化策略改进的GA算法。该算法利用扰动策略增加种群多样性,半初始化从根本上改变个体在全局最优解的比较过程中的局限性。同时,针对BP网络的局部极小化问题,提出一种基于改进GA算法优化的BP算法,并建立亚健康状态诊断模型。实验表明:本文提出的基于改进GA算法和BP神经网络的组合模型效果最好,亚健康分类准确率为96.05%,比传统模型提高了2.83个百分比。(4)针对粒子群算法(Particle Swarm Optimization,PSO)易陷入局部极值、后期震荡严重的问题,提出一种基于动态权重和动量项策略的改进粒子群算法(Improved particle swarm optimization,IPSO)。IPSO算法利用基于距离的动态权重和莱维飞行策略避免过早收敛,引入动量项减缓后期震荡。同时,针对SVM对参数依赖严重的问题,提出一种基于IPSO算法改进的SVM,并训练糖尿病诊断模型。实验表明:本文提出的基于IPSO算法和SVM的组合模型效果最好,对糖尿病的分类准确率为92.74%。(5)基于Java语言和Spring MVC框架,设计并实现了一个智能辅助诊断系统。在该系统中,用户可以登录并自主完成亚健康诊断和糖尿病预判,帮助医生快速诊断,同时也验证了本文算法在实际应用中的可行性。