论文部分内容阅读
脑卒中作为一种常见的神经系统疾病,由于其高发病率,高死亡率,高致残率和高复发率的特点,严重影响着人们的正常生活。经颅多普勒(Transcranial Doppler,TCD)技术由于具有无创性、便捷性和准确性等特色及优点,是医疗界经常采用的早期辅助诊断脑卒中的方式。目前,医护人员对脑卒中TCD数据的分析常采用人工判读结合临床经验诊断的方式,但该方式易受主观判断及是否具备丰富经验等因素的影响。近年来,如何通过对脑卒中TCD数据的准确分析,实现快速精确的辅助诊断脑卒中,已成为国内外专家重要的研究方向之一。随着人工智能技术的发展,将其用于医疗辅助诊断逐步成为提高医疗诊断效率新的发展趋势。因此如何采用人工智能技术对脑卒中患者的TCD数据进行智能分析,以提高脑卒中诊断准确率和效率,成为近年的研究热点。本文的主要目的是针对脑卒中TCD数据进行分类研究。所开展的工作主要包括脑卒中TCD数据库的搭建、非平衡脑卒中TCD数据集分类模型的构建以及大数据场景时分布式分类模型的构建三大内容。具体研究内容如下:设计并搭建了基于Django架构的脑卒中TCD数据库。该数据库的设计采用B/S架构,主要包括前端界面设计、Django框架开发和MySQL数据库的设计等。根据后续需求,本文对数据库的核心模块进行了开发和测试,实现了对脑卒中TCD数据的采集整理功能。提出了一种适用于脑卒中TCD非平衡数据集分类的改进模糊支持向量机模型。通过分析研究传统模糊隶属度函数的设计方法,对已有的模糊隶属度函数进行改进,利用信息熵作为衡量样本点不确定性的标准,并结合非平衡调节因子,提高了模糊支持向量机对少数类样本的分类能力。通过对公共非平衡数据集和脑卒中TCD非平衡数据集进行分类实验,证明了本文方法可以有效地处理脑卒中TCD非平衡数据集。与一般的模糊支持向量机相比,在所选公共数据集中,采用该方法的模型分类性能都有所提高,最高可达17.99%,对脑卒中TCD非平衡数据集,分类性能最高可提升3.26%。设计并实现了大数据分布式处理架构Hadoop平台的搭建,完成了所需分布式编程模型的构建。为了满足对脑卒中TCD数据进行分类研究,本文利用实验室的硬件设施,构建了Hadoop分布式处理平台,保证实验的高效可靠。一方面设计了基于SVM的分布式网格寻优算法,实验表明在同样准确率的前提下,分布式网格寻优算法可以有效缩短训练时间。另一方面设计了SVM分布式编程模型,研究了训练时间与脑卒中TCD数据集大小之间的关系,验证了基于Hadoop分布式处理架构处理大规模脑卒中TCD数据的可行性。