论文部分内容阅读
听力疾病对人们的生活、学习、事业造成极大的不便,同时对其家人也会有一定的影响。目前,听力研究在国内发展仍然比较缓慢,多数人做的都是关于数学统计方面的工作,但是很少做关于听力的数据挖掘。
数据挖掘中主要的分类模型有决策树方法,神经网络方法,贝叶斯分类方法等。通过建立相应的分类模型我们可以发现听力学中的一些“有趣的知识”。譬如,根据以往的患者症状记录对其进行分析建立模型,对未知患者的耳病进行预测等。
本文在采用UCI听力数据的基础上,先后采用神经网络及决策树方面对数据进行实验分析。通过分析对比发现两者之前有着很大的互补空间,神经网络方法具有比决策树方法更强的理解能力,却因为其黑箱性而难以理解;决策树算法的分类结果显示为树型结构而具有良好的可理解性,并且通过适当修剪稳健性也很好,但是其精确能力却比不上神经网络,并且当数据变量太大时候,其精准性会越来越差稳健性也会随之下降。
本文在研究两种模型优缺点的基础上,提出了基于神经网络构建决策树模型的组合模型方法,其过程为,先利用神经网络对样本进行预先处理,在神经网络处理后的结果之上再建立决策树模型,使得组合模型的精准性达到了92.5%比决策树的90%得到了提高,同时测试集的准确率也达到了92%比神经网络的稳健性要高出许多。继承了决策树易于理解健壮性强的优点。