论文部分内容阅读
本文应用自组织映射网络(SOM,Self-Organizing Map)和K—Means相结合的方法对用药后的抑郁症大鼠DNA的芯片样本进行聚类,从而得到不同治疗抑郁症的药物(利血平、开郁安神胶囊)对抑郁症治疗的效果。
本文首先分析了数据预处理阶段、特征提取阶段、分类器设计阶段以及聚类阶段常用的一些算法和原理,比较了这些算法、原理的优缺点,并在此基础上提出了:用看家基因调整数据的方法来进行数据预处理,用fislaer准则的思想和基于距离的判据来进行特征提取,用SOM与K—Means相结合的方法来做分类器和聚类。
在系统的评价阶段,本文得出的结论如下:从系统处理数据的速度(即从数据的输入到输出的耗时多少)来说,本系统最终用了8秒的时间,处理速度较快、从得出的结果是否易于理解来说,本系统提供了图形化的用户界面方便了用户的理解、本文的所提出的聚类方法的正确率为87.5%,结果的精度较高并且具有生物学的合理解释、本系统与WEKA系统的聚类算法进行比较的结论是:本系统在处理数据的速度上优于WEKA但在精度上略低于WEKA。