探讨阿尔茨海默病(AD)患者的左右侧海马影像组学特征,建立和比较左右侧海马的影像组学分类模型,并分析其在AD患者诊断中的价值。
前瞻性对照研究。纳入2016年9月—2018年6月在浙江省人民医院记忆专科门诊就诊的59例AD患者为AD组,健康促进中心44名志愿者为正常对照组(NC组)。采用GE 3.0 T MR成像系统对两组受试者行全脑扫描,分别获取三维磁化准备快速梯度回波成像序列(MPRAGE)。使用一种基于学习的可变形模型对左右侧海马进行分割。对分割后的左右侧海马两组数据分别进行特征计算和特征选择,基于选择的特征建立logistic回归模型。
经过计算后两组数据分别得到385个特征。左右侧海马数据经过特征选择后分别剩下5个特征。右侧海马logistic回归模型评价指标的准确性、曲线下面积、特异度、灵敏度、阳性预测值、阴性预测值分别为0.69、0.74、50%、83%、68%、70%,左侧海马分别为0.75、0.83、79%、72%、81%、69%。
海马的影像组学特征具有作为诊断AD的生物标志物的潜力。左侧和右侧的海马影像组学模型有助于AD的诊断,其中左侧海马模型的诊断价值高于右侧。
版权归中华医学会所有。
未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。
除非特别声明,本刊刊出的所有文章不代表中华医学会和本刊编委会的观点。
阿尔茨海默病(Alzheimer disease, AD)是一种中枢神经系统进行性神经退化性疾病,也是老年性痴呆的最常见原因,严重地影响着患者的生活质量。海马结构在人类的认知方面起着关键作用,尤其是情景记忆[1]。海马结构通常被认为是AD病理过程中最易受累的区域[2]。一些MRI研究发现,在AD阶段海马发生萎缩及一些微观结构和功能的改变[3,4,5]。影像组学是近年来发展迅速的一项新兴肿瘤诊断和辅助检测技术,目前已在多种肿瘤及非肿瘤疾病中对影像组学展开了初步探索[6,7,8,9,10]。影像组学也是AD研究领域的热点之一;然而,关于AD的影像组学研究大多是对纹理分析进行探讨[11,12],很少涉及影像组学分类模型的构建。本研究中,笔者采用前瞻性对照研究方法,将使用人工智能平台(artificial intelligent kit, A.K) ,分别以双侧海马作为感兴趣区(region of interest, ROI),对三维结构T1WI的MRI处理分析,进行AD患者的影像组学特征识别及分类模型构建,旨在为AD的精准诊断提供影像依据。
2016年9月—2018年3月,浙江省人民医院记忆诊所招募AD受试者为AD组,医院健康促进中心的志愿者作为正常对照(normal controls, NC)组。
AD组纳入标准:符合美国国立神经病学、语言障碍及卒中研究所和AD及相关疾病协会关于AD的诊断标准[13],具有核心临床表现(认知功能障碍、精神行为异常、日常生活自理能力下降),有生物标志物(MRI、PET、脑脊液、基因)支持诊断。排除标准:(1)突发起病,早期出现步态不稳、癫痫、行为异常;(2)局灶性体征,早期锥体外系症状、体征;(3)非AD痴呆、严重抑郁、脑血管病、中毒或代谢异常、MRI示内侧颞叶信号异常与感染或血管损害一致。
NC组纳入标准:(1)无神经缺陷,如听力或视力丧失;(2)无神经或精神疾病,如中风、癫痫或抑郁症;(3)常规颅脑MRI无梗死、出血或肿瘤等证据;(4)简易智能精神状态量表(mini-mental state examination, MMSE)评分≥28分。NC组排除标准:(1)脑卒中;(2)脑外伤;(3)脑肿瘤、帕金森病、癫痫等引起记忆障碍的神经系统疾病;(4)严重贫血、高血压、糖尿病等系统性疾病;(5)精神疾病史;(6)MRI T2-FLAIR序列上呈高信号病灶,直径>5 mm。
共收集67例AD患者和50名志愿者,因MR扫描过程中头部运动或其他原因导致扫描未完成而排除了8例AD受试者和6名志愿者,最终纳入AD组59例和NC组44例。两组受试者均为右利手。所有受试者接受了病史采集、实验室检查、神经心理测试、体格检查和头颅MR扫描,神经心理测试包括MMSE和蒙特利尔认知评估量表(Montreal cognitive assessment, MoCA)。本研究经浙江省人民医院伦理委员会批准(2012KY002) ,受试者均签署知情同意书。
采用美国GE公司Discovery MR 750 3.0 T MR扫描仪进行影像数据采集。为排除相关的颅脑疾病,首先进行常规颅脑MRI扫描,包括T1WI、T2WI、T2-FLAIR和DWI。然后采集三维T1磁化准备快速梯度回波成像序列(magnetization-prepared rapid gradient echo, MPRAGE);扫描参数:TR 6.7 ms,TE 2.9 ms,TI 450 ms,翻转角度12°,FOV 256×256 mm2,层厚/层距=1/0 mm,矩阵256×256,一共采集192层矢状面图像。
应用一个"高效的基于学习的可变形模型"(该自动分割方法由美国北卡罗莱纳大学教堂山分校医学影像中心的工程师命名,目前尚没有公共的在线软件推出)进行海马结构的分割[14]。采用该方法建立一个联合分类和回归模型来预测海马的位置。在训练阶段,采用提取的特征来训练结构化的随机森林分类器;在测试阶段,提取的特征被输入到训练的分类器中,以预测每个海马的分割,并通过训练的模型对预测的分割进行迭代改进。最后,海马形状模型逐渐变形到目标图像上,以适应目标海马。使用这个模型分别分割出了双侧的海马结构。
首先,将AD组和NC组的原始三维T1-MPRAGE数据批量导入A.K软件中,然后批量导入双侧海马结构的ROI。在参数选择窗口中选择相应的特征参数,包括直方图、形状参数、Haralick、灰度共生矩阵(grey level co-occurrence matrix, GLCM)和游程长矩阵(run-length matrix, RLM)。在与GLCM和RLM参数有关的窗口步长中选择了1、4和7。直方图特征主要是通过对病变区域灰度或亮度信息的统计,进而研究病变区域灰度信息的整体分布。形状参数主要用数学方法描述病变区域的形状特征,并试图描述病灶的形状紧致性。GLCM以不同方向和概率的统计像素为特征得到共生矩阵,然后量化共生矩阵的分布,以描述病灶的复杂性、变化程度、纹理粗细度等信息[15]。Haralick的特点也是基于GLCM提取相应的特征,选择了有四个方向(0°、45°、90°、135°)的GLCM,步长为1,然后计算平均值的总和[16]。RLM的特点是通过计算不同方向和步长连续出现的像素的概率来获得长度矩阵,以描述病变的复杂性、变化程度和纹理粗细度[17]。经过计算,左右两侧海马数据分别提取了385个特征。为每个受试者数据添加表示NC组和AD组的标签"0"和"1"。
根据左侧和右侧海马的计算特征,分别进行了两次特征选择。预处理分为三步:用均值代替了异常值;随机划分设置训练集占比0.7,测试集占比0.3;通过标准化的方法消除每个特征列的单位限制。特征选择步骤如下:(1)采用独立样本t检验得出AD组和NC两组间差异有统计学意义(P<0.05)的特征,再从预处理后的数据中使用秩和检验选择出差异有统计学意义(P<0.05)的特征,然后将t检验和秩和检验各自选出的特征取并集。(2)应用相关分析进一步降维。将筛选阈值设置为0.9,并选择Spearman秩相关系数,在任意两个特征列之间进行相关分析;当相关系数大于0.9时,去掉两个高度相关特征其中的一个。(3)应用LASSO回归模型来降维,降维方式选择交叉验证;该方法适用于高维数据的回归分析,在线性回归的函数上增加一个L1惩罚项,使一些回归系数变为0,以达到降维的效果。
首先加载训练集和测试集数据。使用机器学习中的logistic回归的方法建立了AD诊断的分类模型,即logistic回归模型,并基于右侧和左侧海马的选择特征建立了两个分类模型。将线性函数的结果设为自变量,输入到sigmoid函数中,然后根据输出的概率P来确定分类。
特征选择和模型构建中使用的统计学方法均为A.K软件自带的统计方法。应用SPSS 22.0统计软件进行数据分析。服从正态分布的计量资料以±s表示,采用独立样本t检验来评估AD组与NC组的年龄、受教育程度和MMSE评分差异。计数资料采用χ2检验。以P<0.05为差异有统计学意义。
AD与NC两组受试者在性别、年龄、受教育年限上差异无统计学意义(P值均>0.05);而MMSE评分,AD组明显小于NC组,差异有统计学意义(P<0.01)。见表1。
组别 | 例数 | 年龄(岁) | 性别(男/女) | 受教育年限(年) | MMSE评分(分) |
---|---|---|---|---|---|
AD组 | 59 | 69.08±11.53 | 20/39 | 6.05±3.79 | 16.27±5.91 |
NC组 | 44 | 65.43± 9.70 | 20/24 | 7.09±3.38 | 29.14±0.77 |
统计值 | t=1.700 | χ2 = 1.417 | t=-1.442 | t=-14.340 | |
P值 | >0.05 | >0.05 | >0.05 | <0.01 |
注:AD为阿尔茨海默病;NC为正常对照;MMSE为简易智能精神状态量表
右侧海马总共提取了385个特征,应用单因素方差分析+秩和检验后还剩197个特征,相关性检验后剩下73个特征,使用LASSO降维后最终选择的特征数为5,见图1, 图2, 图3。左侧海马总共提取了385个特征,独立样本t检验+秩和检验后还剩191个特征,相关性检验后剩下65个特征,使用LASSO降维后最终选择的特征数为5,见图4, 图5, 图6。
注:a为ClusterProminence_AllDirection_offset1_SD; b为InverseDifferenceMoment_AllDirection_offset7; c为ClusterShade_angle135_offset7; d为ClusterShade_AllDirection_offset1_SD; e为HaralickCorrelation_angle135_offset4
注:a为VolumeCount; b为uniformity; c为nverseDifferenceMoment_AllDirection_offset1_SD; d为GreyLevelNonuniformity_AllDirection_offset1;e为ShortRunHighGreyLevelEmphasis_AllDirection_offset4_SD
两侧海马模型在分类器的构建过程中,选择的方法是logistic回归模型,所选特征数分别为5。右侧海马分类模型的评价指标准确性、AUC、特异度、灵敏度、阳性预测值和阴性预测值分别为0.69、0.74、50%、83%、68%和70%,见图7;在左侧海马分别为0.75、0.83、79%、72%、81%和69%,见图8。由于训练集和测试集AUC很接近,两侧海马模型的拟合度均较好,左侧的准确性和AUC更高。
注:红色代表正常组测试集,蓝色代表病例组测试集,水平线以下的红色区域和以上的蓝色区域代表了正确的预测,水平线以上的红色区域和以下的蓝色区域代表了错误的预测
本研究中,在AD组和NC组中应用A.K软件进行特征提取并选择与双侧海马密切相关的高阶特征,基于这些高阶特征建立区分AD和NC的基于海马结构的logistic回归模型。从logistic回归模型的ROC曲线可以看出,构建的影像组学分类模型显示出了较好的诊断价值。有趣的是,模型的准确性和AUC值显示,左侧海马模型的诊断价值高于右侧。
影像组学方法已应用于一些包括AD在内的神经精神类疾病的研究。一项关于自闭症谱系障碍的影像组学研究发现,右侧海马、胼胝体、左侧脉络丛和小脑白质的纹理特征在患者和正常对照之间存在明显差异[18]。一些纹理分析的研究发现,AD患者和正常对照在胼胝体和丘脑等结构之间存在纹理差异[11,12]。一些模型构建和机器学习的方法也逐渐成为影像组学研究的热点,如一项影像组学研究建立了随机森林分类器用于注意力缺陷多动障碍的诊断和分型[10]。另外,有研究者提出了利用功能连接诊断精神分裂症的影像组学研究[19]。然而,在AD的影像组学研究中,对于模型构建和机器学习的方法鲜有涉及。本研究是第一个运用海马影像组学特征建立模型来区分AD和正常对照的影像组学研究,目前国内外未见报道。
本研究中选择的10个特征参数分别反映了AD组和NC组在图像灰度值分布、纹理特征及空间异质性等方面的差异。在右侧海马结构的5个选择特征中,"HaralickCorrelation_angle135_offset4"和"InverseDifferenceMoment_AllDirection_offset7"是GLCM参数,描述了海马微观结构的复杂性、变化程度和纹理粗细度等信息;"ClusterShade_AllDirection_offset1_SD"、"ClusterProminence_AllDirection_offset1_SD"和"ClusterShade_angle135_offset7"是纹理参数,它描述了海马结构的表面情况,如平滑、粗糙等。在左侧海马结构的5个选择特征中,"ShortRunHighGreyLevelEmphasis_AllDirection_offset4_SD"和"GreyLevelNonuniformity_AllDirection_offset1"是RLM参数,它描述了图像的粗糙度或平滑度等信息;"VolumeCount"和"uniformity"是直方图参数,它以定量的方式描述、比较了海马生物指标的分布;"InverseDifferenceMoment_AllDirection_offset1_SD"是GLCM参数,它同样描述了海马微观结构的复杂性、变化程度和纹理粗细度等信息。从海马结构中提取的这些特征都是反映高阶影像模式和更多图像异质性的深层特征,两组之间影像组学特征的差异可能反映了AD患者海马中微观结构的异质性分布,笔者认为这些差异可能与受试者的临床认知评分存在一定的相关性。神经影像学研究正在突破对海马结构的粗略成像,转向对海马亚区的精细成像[20]。最近一项关于人类海马的复杂定量蛋白组学研究发现,在AD的不同阶段,有372种蛋白质的表达方式发生了改变[21]。笔者推测,在AD患者中,海马蛋白表达方式的改变与海马影像组学特征变化之间可能存在某种联系。结构MRI研究表明海马结构异常可以作为早期认知损伤的神经影像标志[22]。一些MRI研究表明,AD患者左右两侧海马的功能连接和体积都存在异常变化[23,24]。有趣的是,本研究中也发现左侧海马影像组学模型的诊断价值高于右侧。一些研究也发现在AD患者中,左侧海马的萎缩程度要大于右侧海马[25,26],在一定程度上支持了我们的结论。
总之,海马的影像组学特征及分类模型具有作为诊断AD的生物标志物的潜力。上述影像组学流程方便可行,有利于AD患者的诊断及指导个体化治疗方案的制订。但本研究的样本量相对较小,统计分析可能会有一定的偏倚;虽然两组在年龄和性别比上没有显著统计学差异,但是并没有达到完全的1∶1匹配,所以不能完全排除其对研究结果的影响。关于AD海马结构的影像组学研究还需要大规模多中心研究,同时也需要在影像基因组学的方向上进行突破。