基于深度学习的神经影像学:一项验证性研究外文翻译资料
2021-12-19 21:54:36
英语原文共 13 页
基于深度学习的神经影像学:一项验证性研究
Sergey M. Plis Devon Hjelm
The Mind Research Network University of New Mexico
Albuquerque, NM 87106 Albuquerque, NM 87131
s.m.plis@gmail.com dhjelm@mrn.org
Ruslan Salakhutdinov Vince D. Calhoun
University of Toronto The Mind Research Network
Toronto, Ontario M5S 2E4 Albuquerque, NM 87106
rsalakhu@cs.toronto.edu vcalhoun@mrn.org
摘要:深度学习方法最近在分类学习和表征学习方面已经取得显著的进展。这些工作对于大脑成像和神经学科的发现来说非常重要,这些方法使得大脑移植成为有力的竞争者,从某种程度上来说,深度学习模型的灵活解释了这种方法的成功。然而,这种灵活性使得移植到新地方的过程成为一个困难的参数优化问题。在这项工作中,我们证实可以通过应用深度学习方法来模拟大脑成像数据的结果(可行参数范围)。这些方法包括深度置信网络及其构块—受限玻尔兹曼机器。我们还描述了一种新型的基于高维数据可视化的约束方法。结果表明,深度学习方法能够学习生理上的重要特征,对神经影像学有着很大的潜力。
关键字:磁共振成像;功能磁共振成像;内在网络;分类;无监督学习
1引言
大脑成像和神经学科最主要的目的之一是基于数据的提高对研究系统的理解,同时也是许多自然学科主要目的之一。在我们的例子中,这相当于从非入侵测量推断脑结构和功能,进而对其进行特征描述。大脑成像领域已经从解剖图和图谱到以数据为主的特征学习方法。例如:基于种子相关性[2]、典型相关性分析[29]和独立成分分析(ICA)[21,1]。这些方法非常成功地揭示了已知的大脑特征[3](支持其可信度)、恢复和区分患者和控制[25](帮助诊断和了解疾病)的功能,并在一场“静息革命”后揭示无控静息实验的数据的一致性[31,26]
分类通常作为检查正确性的工具,因为我们学习的重点是大脑,一个完美的预言不仅要解释其结论是正确的,而且还要给出得到这些结论的方式。
深度学习方法通过提高现有技术的分类准确度打破了语音,信号,图像,视频和文本挖掘和识别领域的记录。到目前为止,有时会超过30%。而在过去十年间,仅仅只有1-2%的提高[17.18]。它们与其他分类器的区别在于自动特征学习在很大程度上有助于提高准确性的数据。目前,这似乎是最佳的解决方案,是一种理想的脑成像工具。
深度学习另一个显著的特征是模型的深度。基于已经主导神经图像领域的浅层模型所获得的特征学习的结果,目前还尚不清楚深度会有什么好处。考虑到多模态学习的状态,在这种状态下,假设模型对于分析模态[23]是相同的,或跨模态关系在混合系数的(浅)水平上来寻求的[20],越深层的模型越适合跨模态关系的直观概念,比如,基因和表型上的关系应该是间接的,发生在更深的概念层面。
在这项工作中,我们展现了在功能性磁共振成像和结构性磁共振成像(fMRI和sMRI)上应用深度学习方法的最新进展。我们是通过以下方式是验证这一应用的可行性:(a)通过调查深层次生成模型的构建块(受限玻尔兹曼机器(RBM))[16]是否与ICA(这种类型的代表物)存在竞争(第二节);(b)检查深度对结构MRI数据深度学习分析的影响(第3.3节);(c)发现大规模数据(通过神经成像标准)在结构上的方法和价值(第3.4节)。 浅层模型(a)中特征学习的性能的测量可与现有方法和已知的大脑生理学相比较。然而,当对更深层的模型进行研究时,这种方法不能使用。正如我们进一步证明的,分类精度也不能提供完整的图像。为了能够可视化深度的影响并且深入了解学习的过程,我们引入了一种灵活的满足嵌入的约束方法,这种方法允许使得约束的复杂性可控(第3.2节)。有意地选择局部约束,使得我们能够反映深度置信网络(DBN)[14]学习和数据应用的转变,并且获得额外的洞察力。
2一种用于特征学习的浅层置信网络
在研究DBN的深度对fMRI和sMRI数据的学习显示出好处之前,我们总是想要知道这个家族中的浅层模型(单个隐藏层),即RBN,是否满足该领域的期望。正如引言提及地那样,许多方法应用于神经影像数据中,从而来进行特征学习。我们将继续与ICA进行更广泛地比较,将其作为神经影像学领域的值得信赖的方法。与RBM相似,ICA依靠地是二分图结构,或者说ICA甚至是一个sigmoid 函数 ,就像我们比较的infomax ICA[1]的情况一样。注意与RBM的不同之处在于:ICA将其权重矩阵应用到时间维度(较短的),并独立于空间维度。相反的,RBM将其权重矩阵(隐藏单元“感知域”)应用到高维空间维度(图2)。
2.1受限玻尔兹曼机器
受限玻尔兹曼机器(RBM)是一个马尔可夫随机场,它模拟数据分布,用可见V和隐藏变量h之间的二分图上的吉布斯分布对其进行参数化[10],其中是归一化项(分区函数),是系统的能量。在fMRI数据下,每个可见变量都是具有实值近似高斯分布的fMRI扫描的体素,在这种情况下,能量被定义为:
(1)
其中和是偏差,是以偏差为中心的每个可见变量的抛物线收容函数的标准差。一般来说,参数需要与其他参数一起学习。然而,在实践中,每个体素的分布标准化为零平均值和单位方差会更快更有效[24]。许多选择会影响RBN从fMRI中学习获得表征的解释质量。通过对L1正则化来鼓励稀疏特征,并对隐藏单元使用基本设置——双曲正切非线,这有助于结果进行时空解释。RBM模型进一步的信息可在[15,16]找到。
图1:用广泛使用的分解技术比较特征及其时间进程的RBM模型精度
2.2合成数据
在本章节,我们对RBM和SMF模型与合成数据进行了比较,然后对RBM和infomax ICA在真实的fMRI的数据上进行了更深入的比较。
图1(a)显示了RBM,ICA,PCA,sPCA和稀疏NMF对所有重叠数据集真实SM和TC预测的平均相关性。考虑SM和TC的估计,RBM和ICA有着最佳的整体表现。虽然NMF也很好地估计了SM,可能是由于非负性约束,它在TC上的表现较差。基于这些结果和GIFT ICA的高度采用,我们将使用GIFT ICA作为与RBM进行比较的基准。
图1(b)显示了一个样本全套真值以及RBM和ICA估计值。总的而言,RBM和ICA都能够估算SM,使得大多数SM估计值与地面相匹配值的空间相关性超过0.3。当估计的“最佳匹配”不符合此空间相关性标准时,将其标记为失败匹配。
对于一个样本数据集,在所有模拟数据集中,RBM的失败匹配平均为1.87plusmn;2.41,ICA平均为1.01plusmn;1.53。当通过从分析中去除失败匹配来计算失败的匹配时,所有合成数据集的结果显示RBM和ICA的性能类似(图1c),对于重叠度较高的SM,ICA有轻微(尽管具有统计显着性)的优势。对于TC估计,RBM有优势,RBM和ICA也显示了FNC的可比性能。
2.3fMRI数据的应用
图2:aBBM借助fMRI数据来进行特征学习和计算时间进程。可见单位是体素,隐藏单位接受场覆盖fMRI体积。
这项工作中使用的数据来自28名(其中有5名女性)健康参与者,所有参与者均在哈特福德医院给予书面知情且获得IRB的同意和补偿。
第一项:所有受试者在听觉任务(AOD)期间都进行了扫描,这项任务涉及在一系列标准和新颖声音中检测到不常见的目标声音。
第二项:扫描是在哈特福德研究所的奥林神经精神病学研究中心进行的医院采用西门子Allegra 3T专用头部扫描仪,配备40 mT / m梯度和一个标准正交头线圈[4,9]。AOD包括两次8分钟的运行,以及最终数据集的249次扫描。1 [9]中提供了有关参与者的更多详细信息;2 [4]和[9]中更详细地描述了该任务;3用于最终数据集。使用SPM5软件包[12]对数据进行后处理。使用inrialign[11]进行校正,并将其分为53times;63times;46个体素。将完整的fMRI数据集在平均值以下被屏蔽,数据集中的平均图像被删除,得到了一个完整的数据集,大小为70969个体素,体积为6972卷。然后将每个体素标准化为零均值和单位方差。
RBM用70969高斯可见单元和64个双曲正切隐藏单元构建(详见附录)。选择学习率的超参数ε(可工作范围[1times;10 -4,1times;10 -3]的0.08)和L1重量衰减参数lambda;(可工作范围[1times;10 -2,1times;10 -1]的0.1)作为在训练过程中显示重建误差减少和跨度减少的指标。然后对RBM进行大约100个周期的大小为5的训练,以允许参数完全收敛。
在翻转信号接收后,我们识别并标记与大脑有关的空间特征。在我们在AFNI[5]的帮助下识别并标记了与大脑区域相对应的空间上不同的特征,不包括白质,脑室或伪影相对应的特征。(例如运动,边缘)。
图三:由ICA和RBM在大脑内部网络。
我们将fMRI时间序列标准化为平均零,并在前馈模式下使用训练有素的RBN来计算每个fMRI特征的时间序列。 这样做是为了更好地与ICA进行比较,在PCA预处理中除去均值。
工作流程如图2所示,图3显示了所得特征与Infomax ICA获得的特征进行比较。一般而言,RBM与ICA具有竞争性。这并不奇怪,因为L1使用了正则化,有着更局部的特征。 此外,特征相关矩阵(未示出)的块结构与ICA相比,能够提供更具生理支持的分组。也许是因为ICA加强空间独立性,从而微妙地影响时间进程及其相互关系。我们观察了ICA(http://www.nitric.org/projects/gift)的可比运行时间和RBM的GPU实现(https://github.com/nitissrivastava/deepnet)。
3验证深度效果
由于RBM结果显示了与最新技术(或更好)竞争的性能,因此我们继续研究模
资料编号:[4387]