论文部分内容阅读
神经科学的快速发展,大数据的产生和云计算的突破,给研究工作者带来了新的机遇;但与此同时,又不得不面临资源整合的挑战。CBRAIN云平台的出现不仅解决了大数据、云计算以及工具包管理等问题,而且提供了简单易用的图形界面,用户无需编程经验即可完成数据的处理、分析和共享。然而,CBRAIN平台仍存在诸多不足:数据格式不够规范;缺少脑网络分析模块。动态因果模型(Dynamic Causal Modeling,DCM)作为探究脑区之间因果效应(有效连接)的一种脑网络方法,其基于生理模型的优点得到了不少科学家的关注,但是缺点是模型的计算时间呈指数级增长,需要强大的计算能力作为支撑。因此为了加速数据分析,本文在已有的平台上进行改进,完成了以下的工作:(1)为了更好地管理神经影像数据,使用了标准化数据格式BIDS(Brain Imaging Data Structure),引入了预处理工作流fMRIPrep,部署并测试在云平台上的性能表现;(2)使用虚拟化技术Singularity对DCM的源代码和运行环境进行编译和打包,部署并测试大规模尺度上DCM的可行性;(3)以PPMI(Parkinson’s Progression Markers Initiative)上帕金森病(Parkinson’s Disease,PD)和健康对照(Healthy Controls,HC)的功能磁共振(functional MRI,fMRI)数据为例,使用云平台实现预处理加速和应用大规模DCM进行脑网络分析。令有效连接作为特征,使用特征选择方法对特征进行降维并筛选出特征子集,接着为了改进数据不平衡和过拟合的问题,提出了过采样的方法,并通过多个分类器进行准确率的评估;(4)最后使用统计相关方法,分析特征子集和PD患者临床量表之间的相关性。实验结果表明,云平台能够在不同程度上提高数据预处理的能力,而且大规模DCM分析的测试结果表明,模型复杂的程度越高,平台在计算能力上的优势越明显。进一步分析大规模DCM得到的特征子集,发现分类的准确率优于现有的研究,并且部分特征子集与临床量表呈显著地负相关,这表明特征具备一定的生理意义,可以为PD的早期诊断提供帮助。本文通过大规模DCM分析,证明了云平台在计算能力上的优越性及应用复杂模型的可行性和有效性,解决了传统计算机硬件性能不足的问题,为之后更多复杂理论的计算奠定基础。