基于机器学习的几种医学数据处理方法研究

来源 :清华大学 | 被引量 : 0次 | 上传用户:junior9919
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
医学的发展离不开广泛的相关学科的支持。随着信息科学的发展,如何利用信息技术更好地为医学实践和医学科研服务,已经越来越为人们所关注。信息科学在医学研究,如实验设计、数据分析等方面的应用将为疾病的预防、诊断、治疗和保健提供重要的途径和手段。机器学习是当前计算机科学和信息科学的重要前沿学科之一。本文将机器学习的理论、技术和方法与医学数据处理问题相结合,开展了深入的研究,取得了以下成果:1.提出了应用于Meta分析的混合随机效应模型。该模型具有描述真实效应量复杂分布的能力,是对传统模型的重要改进。在MCMC算法框架下,设计了有效的模型参数学习算法。混合随机效应模型应用于两个尼古丁替代疗法戒除烟瘾的Meta分析任务中,发现疗效的真实效应量具有复杂的分布模式,并分析得到影响疗效的重要因素。2.提出了多变量的均值和标准差信息定量集成问题:MS信息学习。在EM框架下,设计了利用MS信息估计概率密度函数的学习算法:MSEM。模型可以用于分析不同条件下变量的分布特性;可以有效地刻画多个变量之间的统计依赖关系;可以对实验未观测指标的均值和标准差进行预测。实验广泛收集了健康个体和类风湿病患者的神经内分泌免疫系统中多种激素和细胞因子水平的MS信息,并利用MSEM算法进行深入分析,发现了一些有意义的模式。3.将非线性降维方法Isomap引入到高维医学矢量数据的处理中。在Isomap算法的基础上,建立了一种新的监督非线性降维算法:SIsomap。算法的两个版本SIsomap1和SIsomap2可分别应用于监督变量为连续属性和两类类别标签的情况。提出了基于SIsomap2和RBF神经网络的分类器设计方法。在肺癌基因数据、糖尿病病理数据等多个高维医学数据上的成功应用,证实了方法有效性。4.从机器学习的角度认识双对照重复测量数据的整体评价问题,发现该问题与模式识别问题之间的对应关系,并由此建立了一种实用的评价算法。对两组药理学重复测量数据的实验结果表明,该算法适用于多实验组、多指标、小样本的重复测量数据整体评价问题。
其他文献
奥古斯丁出于对基督教上帝的维护,试图通过对自由意志的设定,来消解善与恶之间的二元对立。对奥古斯丁而言,基于古希腊哲学中神秘主义的传统所陷入的困境来维护上帝的权威成
<正>1922年直系军阀控制下的北京政府是个多事之秋,连续几届内阁短命倒台,其中曾被社会舆论看好的"好人政府"更是以短暂的执政时间、一事无成的执政成就而成为世人笑柄。"好
近几年海洋环境污染问题突出,为维护海洋的生态安全和资源的可持续利用,必须加强对海域生态环境的监测。基于卫星遥感数据,建立遥感反演模型,实现水质遥感监测系统,构建广东
目前,我国MCN(Mutli-Channel Network,多频道网络播放平台,简称MCN)模式的发展,仍处于起步阶段。但随着内容产业的进步,处于资本“风口”的MCN模式备受青睐,MCN机构数量迅速增多。MCN模式对内容产业链的影响主要体现在上游内容中的议价环节。它通过参与构建流量生态圈,来激发网络内容活力,从而推动整个内容生态的发展。本文首先介绍了MCN模式生产传播方面的概况,以生产主体与生产
为了探讨湘南丘陵低山区马尾松飞播林地土壤微生物的分布规律和土壤肥力综合评价方法 ,于 2 0 0 0年 12月 2 0日采集到湖南醴陵市大林乡 5个马尾松飞播林标准林地土壤样品和
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield