医学数据组合因素分析系统开发与应用

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:qqqqq770627
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前医学研究人员进行数据分析的主要流程存在诸多弊端:(1)特征挑选的过程主观性强自动化程度低,难以挑选出最优组合特征;(2)对于非线性公式,难以做到得出准确的分类回归公式;(3)仅使用SPSS等统计软件来验证,难以证实决策模型的准确性。针对存在的上述问题,开发出一个用于医学数据分析的应用软件DataAnalysis。其主要功能有:(1)数据预处理:包括数据离散化、缺失数据处理、数据类型转换等功能;(2)数据可视化:能够对原始数据和处理后的数据进行简单的二维可视化显示;(3)特征提取:进行有监督和半监督特征子集选取和单特征评价,能有效选出具有强标准能力的特征子集;(4)分类决策:能够对数据进行有监督和半监督分类诊断;(5)结果评价:能够对特征选取和分类结果的优良进行评价比较,如有十次交叉验证法、留一法等测试方法,分类精度评价通常指标:分类正确率、多次分类精度标准差、kappa测试、ROC等。应用所开发的DataAnalysis软件,与多家医院开展相关医学应用研究。与华中科技大学协和医院合作研究颈椎骨龄定量分期法(QCVM)(153个检测指标)的建立;与华中科技大学校医院开展老年痴呆综合评价(53个检测指标)量化分析。目前已能够从这两个数据集中分别选取10个左右的检测指标(特征)建立辅助诊断模型。已有的诊断模型包括:神经网络、逻辑回归、线性回归、决策树等。并在相应的测试数据集上达到了80%以上的诊断精度,初步取得了一些具有医学应用价值的研究成果。
其他文献
随着多媒体技术、建模仿真技术和网络通信技术等一系列信息技术的发展,虚拟实验在诸多学科的作用越来越显著。而传统的单学科虚拟实验系统在实现上没有统一的标准,实现方法差异
实时数据库被广泛应用于市场预测、制造工程监控、传感器网络、军事指挥系统等领域,这些应用产生的数据往往存在不确定性。而传统的实时数据库不能有效管理不确定数据,因此有必
当下物联网领域最主要的非接触式通信技术就是射频识别。但射频识别的应用受到很多不确定因素的影响,其中最主要的是信道冲突问题,也就是常说的标签碰撞。为了解决碰撞问题,研究
在以机械磁盘为存储介质的计算机系统中,数据读写操作的效率和可靠性将直接影响整个计算机系统的性能和稳定性。为了在存储介质的读写速度、容量以及成本价格方面做出权衡,现代
随着网络技术的飞速发展,特别是P2P技术的普及,数字媒体的复制和传播变得更加容易,相应的媒体内容的版权保护问题变得更加复杂,因此迫切需要更为先进的数字版权保护技术来加强节
日志型文件系统保证了在服务器宕机时能够通过日志进行快速的文件系统一致性检查和恢复,因此被广泛使用。但文件系统日志存在对文件系统性能,尤其是写性能造成了一定的影响。而
随着云计算时代的到来,越来越多的数据被放在云端统一向用户提供相应的服务,如何保证数据实时在线、可服务已经成为一个重要的研究方向。目前,服务高可用性的研究仍处在初级阶段
由于RDF(Resource Description Framework)数据具有表达灵活,数据交换方便等优点,其数据量在以惊人的速度增长。传统的RDF数据存储系统或以关系数据库为存储后端,或以本地存储方式
光盘认证系统是网络认证服务思想的一个实现案例,它给红光高清播放机提供了通过网络认证获取音视频光盘播放密钥,并且按次计费的服务。在此基础上,扩展的网络认证服务器实现了更
随着互联网的迅速发展和信息技术的广泛应用,由网络产生的数据量越来越庞大,而联机分析处理作为存储和分析数据的主要技术,需要存储与处理的数据量也相应的成倍增长,同时要面对巨