论文部分内容阅读
大脑含有约1011个神经元,这形成了高维的神经元网络。在神经科学中,如何处理高维的神经元动网络力学数据是一个非常重要的问题。本文发展了有效的处理高维神经元脉冲序列的统计方法。数据的结构可以从平均值、二阶关联直至高阶关联的角度来描述。本文研究了在最大熵原则下神经元数据的低阶结构与高阶结构的关系。这里提到的最大熵模型是一个广泛应用在各个领域的统计方法。一个只用平均值和二阶关联信息的二阶最大熵模型可以很好地重构大脑中多个区域神经元发放脉冲序列的分布,因为二阶最大熵模型只用到二阶结构,所以它大大简化了数据的复杂度。本文的研究目的是解释二阶最大熵模型的应用机制。本文针对这个问题做出了三个贡献:第一,发现一个广泛用来反映二阶最大熵模型效果的指标具有误导性,这给出了一个例子来说明不慎重使用熵来解释现象会导致错误的结果;第二,应用微扰分析找到了一个二阶最大熵模型可以重构神经元发放分布的可能机制,并在数值模拟和多电极实验数据中验证了我们提出的机制;第三,我们提出的机制解释有助于指导实验人员使用最大熵模型处理神经元数据。通过对最大熵的研究可以知道二阶关联信息对于神经元的高维数据的处理非常重要,而利用二阶关联信息来处理神经元网络数据的统计方法有待发展,这也是大家所关注的重要问题,特别是对于在短时间内(几百毫秒)连续记录得到的脉冲序列。本文另一个研究目的是发展可以处理短时间记录得到的高维神经元数据的方法。基于对神经元数据结构的认识,我们提出了一个对神经元数据预处理的办法,分别将网络中的每个神经元数据在时间上的关联转化为神经元空间上的关联,使得其能够在时间上独立。在此基础上,我们应用统计学中高维的两样本假设检验来探测神经元网络对不同刺激的编码差异。我们的创新之处在于,通过我们的方法可以处理短时间内采样到的神经元网络的高维数据。随着技术发展,实验中可以同时记录越来越多神经元的发放分布,并且实验中往往只能记录短时间内的神经元活动,所以这项研究对实验处理短时间内记录的高维数据有很大的现实意义。