眼底图象中视盘异常的自动检测:一种深度学习方法外文翻译资料
2022-12-17 14:43:08
英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料
眼底图象中视盘异常的自动检测:一种深度学习方法
Hanan S. Alghamdi12, Hongying Lilian Tang2, Saad A. Waheeb3, Tunde Peto4
1计算和信息技术学院阿卜杜拉国王大学吉达沙特阿拉伯2计算机科学系,萨里大学吉尔福德英国3国王费萨尔专家医院,吉达沙特阿拉伯4国立卫生研究所生物医学研究中心眼科医院NHS信托基金会和伦敦大学眼科研究所、英国伦敦
摘要:视盘(OD)是视网膜图像的关键结构。它可作为检测糖尿病视网膜病变(DR)或视网膜静脉阻塞患者青光眼等多种疾病及OD新血管形成相关变化的指标。OD对于定位黄斑和主血管拱廊等结构也很重要。现有的OD定位方法大多是基于规则的,要么利用OD的外观特征,要么利用OD与主血管拱廊之间的空间关系。OD异常的检测是通过检测出血等病变或通过测量杯盘比来完成的。因此,这些方法导致复杂和不灵活的图像分析算法,限制了它们在流行病学研究或视网膜或视神经疾病筛查中获得的大型图像集的适用性。本文提出了一种基于端到端监督的OD异常检测模型。OD最具信息性的特征是直接从视网膜图像中学习,并适用于手头的数据集。实验结果验证了该方法的有效性,并显示了其潜在的应用前景。
关键词:眼底图像,视盘,级联分类器,深度学习,卷积神经网络
1 介绍
自动眼底图像分析最近受到了广泛的关注。这种方法的主要目标是能够准确和及时地分析大型图像集,例如在DR筛选方案或在眼睛流行病学研究中获得的图像集。在分析病理 征象的图像之前,识别象外径这样的地标性特征是必不可少的。近年来,针对OD的检测提出了几种图像分析技术[4,5]。早期的方法利用外径的外观特征,如形状和亮度。外径在视网膜正常情况下比较明亮,呈圆形,然而,视网膜在病理情况下可能有不同的表现形式。这些早期的方法简单、快速,在正常高质量图像中表现良好[17,2]。然而,在大规模的图像集中,这些方法可能会失败,因为OD外观的多样性,伪影的存在,疾病引起视盘特征的改变和亮度的损伤,如渗出物或脉络膜玻璃膜疣。由于视网膜中的血管是由OD产生的,因此更可靠的方法建议使用血管结构来定位OD。这些方法还利用了外径引起的独特的弧形血管拱廊,以抛物线状的[5]曲线环绕黄斑。结果表明,基于血管造影的方法在病理图像[2]中具有较强的鲁棒性。复杂性、计算成本和对血管分割的依赖性是这些方法的主要缺点,限制了它们的可伸缩性。此外,其中一些方法只在小数据集上进行了测试,这些数据集没有包含足够多的图像来代表大规模研究和筛选方案中发现的广泛0Ds。图1显示了在DR筛选过程中获得的眼底图像示例。在一些图像中,OD可能不是一个明亮的或完整的圆形物体,它可能是部分不可见的。利用主要的血管拱廊也可能是不切实际的,因为它不明显,被覆盖或已病理改变。因此,OD特征难以定义有效可靠的规则,需要对OD特征进行抽象、高层次的理解。OD异常的检测表明存在一-种不同的疾病,而不是DR筛查的目的。青光眼影响视盘及其周围区域。杯盘比测量(CDR)常被用来检测青光眼,并在确诊后监测病情。此外,此外,检查静脉和动脉是否向椎间盘边缘移位、视盘旁萎缩弧和视盘出血也有助于确定异常。当发现这些症状时,在做出最终诊断之前,患者将被转介到青光眼的其他体征和症状的评估中。在这项工作中,我们提出了一种基于端到端学习的OD定位和异常检测模型,不采用任何预先假设。相对于基于规则或其他经过手工特性训练的机器学习模型,深度学习模型的主要优势之-是能够准确地处理以前不可见的数据,即泛化。卷积神经网络(CNNs)就是以卷积滤波器的形式学习特征的一类模型。在大数据集[22]中,神经网络是有效实现鲁棒图像分类的主要方法。我们的提议的模型由两个连续的深度学习体系结构组成。通过高效的多分类器和深度CNNs学习0D全局特征,提取OD区域。然后将这些提取的区域传递到第二层优化的深度CNNs中,学习异常特征表示。本文的其余部分组织如下。在第二节中,我们介绍了OD异常检测的相关文献。第3节解释了我们提出的方法。实验评价见第4节。结论见第5节。
图1 眼底图像中视盘的不同表现
2 相关工作
目前,视盘异常检测最常用的方法是估计杯盘比(CDR)。杯的强度是许多作者使用的主要特征。在[13]中,CDR是通过在外径中心附近得到的垂直剖面来测量的,并通过阈值化来平滑计算杯形边缘。在[14]中估计CDR和ISNT比值,并将其传递给SVM分类器。在[15]中CDR,ISNT比率和计算视盘中心与视神经头特征之间的距离,并传递给前馈神经网络分类器。这种方法的主要缺点是依赖于杯状体的强度,由于病变可能围绕在椎间盘周围,杯状体和盘状视网膜边界模糊,在许多图像中可能是模糊和不确定的。一些人建议利用更多的特征,如血管扭结集成[17]、超像素特征[16,12]和像素级分割[18,21]。虽然这些方法比基于强度的方法更可靠,但它们都侧重于估计CDR来诊断显示视盘中潜在的青光眼迹象。然而,CDR并不是许多眼科医生判断异常的唯一考虑因素,在评估CDR方面,甚至在人类评估专家 [19]之间也存在显著分歧。该方法通过对数据的动态学习来解决上述问题。
3 提出方法
3.1预处理
训练前,对训练集中的每一幅图像进行归一化处理,即减去图像的均值,再除以标准差。然后对数据集进行增白,以提高性能。美白使特征尺度正常化,使他们更容易建模[9]。图2显示了0D和非OD候选区域预处理阶段的结果。从训练集中提取的平均图像如图2-g所示。
图2 OD定位CNN模型的预处理实例。(a)原始非OD区域(b)a的归一化图象(c)a的白化图象(d)原始OD区域(e)d的归一化图象(f)d的白化图象(g)均值图象
3.2模型概述
我们的方法包括两个基于连续学习的OD定位和异常评估模型。我们提出的总体架构模型如图3所示。利用从眼底图像中自动获取的特征,得到OD区域。CNNs是功能学习的强大模型。然而,利用深度CNN对全眼底图像进行多尺度扫描检测OD,计算量大,检测速度慢。因此,为了实现快速的OD检测,我们提出将级联分类器与CNN相结合,实现有效的OD定位。训练OD异常检测器,将检测到的OD区域划分为三类;正常,可疑和不正常。
图3 提出的模型架构
3.3级联分类器
级联分类器已成功应用于实时目标检测。它基于弱分类器集成的思想,通过训练简单的特征来快速检测目标。AdaBoost集成算法用于训练分类器和特征选择,因为每个分类器都被限制为选择单个矩形特征,很好地对积极和消极对象进行分类。haar类特征提取自一种称为积分图像[20]的有效图像表示。利用矩形子窗口对图像进行扫描,提取特征。这些特征用于将级联分类器训练成阶段。在每个阶段,训练一个分类器来检测积极的例子和拒绝消极的例子。被拒绝的子窗口将不作任何进一步的处理。因此,后续的分类器只考虑前一个分类器所传递的候选区域,从而变得越来越复杂。在本文中,我们使用了3170个OD正例和9700个0D负例来训练级联Adaboost分类器。从不同的资源中收集了完整的图像来模拟各种各样的眼底图像。
3.4 CNN学习OD特征表示
CNNs使用与经典人工神经网络(ANN)相同的构建单元,即具有可学习权重和偏差的神经元。然而,在CNNs中,特征被学习成复制检测器的特征图。与人工神经网络相比,这使得CNNs中需要学习的参数更少。这种优势使得对具有层次结构、复杂和有效特征的深度模型的训练更加容易。CNNs的性能在很大程度上取决于其体系结构,即层的数量和每层的深度和宽度。CNNs由三种层类型组成卷积层、池化层和全连接层。卷积层由组织成特征图的复制特征检测器组成。每个特征检测器都连接到其输入层的一个小空间区域,并延伸到整个输入的深度。权值在同一特征图中的检测器之间共享。池化层通过将卷积层划分为非重叠窗口并为每个窗口分配一个值来减小卷积层的大小。最大值和平均值是池最常用的方法。通过汇聚层减少卷积层的大小,可以用更少的计算成本学习更多的特性。完全连接层与ANN层非常相似,其中每个神经元都连接到前一层的所有神经元,每个连接都有一个非共享权值。CNN架构中最后一个完全连接的层将所有卷积和池化结果合并到一个类概率向量中。在这项工作中,我们训练了两个CNNs将RGB图像分为0D类和非OD类,然后将OD类分为正常可疑类和异常类。体系结构如图3所示。该网络由五个卷积层组成。在每个卷积层之后执行最大池操作来对数据进行下采样。全连接层结合所有层的结果来预测输出。训练从随机初始化权向量开始。然后通过CNN层将输入的图像转发到100个批次的大小。最后一层通过阈值化输出用于确定图像类的类概率。利用地面真实值与预测值之间的误差,通过梯度下降反向传播对权值进行更新。这个过程的目标是使平均输出误差最小化。为了可视化模型的识别能力,OD定位模型的第一卷积层输出和异常检测器输出如图4所示。
图4 将第一层卷积滤波器应用于测试图象的可视化(a)OD的图象(c)非OD图象(b,d)OD定位模型中第一个卷积滤波器的输出(e)正常OD图象(g)异常OD图象(f,h)异常检测器中第一个卷积滤波器的输出
4 实验评价
4.1 数据库
在以下数据集_上对提出的OD定位方法进行了评估。驱动[8]、 凝视[9]、DIARETDB1[10]和MESSIDOR[11]1是公开可用的数据集。而 HAPIEE、KENYA和PAMD则是与Moorfields眼科医院阅读中心合作,在获得个别研究许可的情况下,从各种基于人群的研究中收集的数据集。特别是,HAPIEE收集自立陶宛(东欧)、肯尼亚(非洲);还有来自意大利(欧洲)的帕迪。KFSH是与费萨尔国王专科医院合作从沙特阿拉伯(中东)收集的数据集。利用5781 幅图像对OD定位模型进行了评价。PAMD和HAPIEE中的ODs由三个类标签标注;正常,可疑和异常,并在本工作中用于培训和评估异常检测器。
4.2 结果与讨论
利用Matlab对级联分类器在2.9 GHz Intel Core i7上进行了13个阶段的训练。所有阶段的总训练时间为17.3分钟。然而,先前未观测到的图像的平均预测时间只有0.034秒。实验结果表明,该级联分类器具有足够的分类能力,能够很好地处理由高质量的正常图像组成的数据集。然而,在其他显示可变图像条件的数据集中,性能明显下降,这就证实了需要通过CNNs学习更多的鉴别特征,如图4(a-d)所示。图5显示了使用该方法进行OD检测的示例。表1给出了OD检测方法的评价结果。如图4(e-h)所示,模型能够学习0D异常特征表示的高级复杂特征。结果如表2所示,显示了深度学习特征的识别能力。所获得的灵敏度验证了该方法的有效性,并显示了其潜在的应用前景。
图5 通过提出的外径定位得到视盘
5 结论
提出了一种新的OD异常检测方法。我们的检测器是完全监督和利用快速计算功能和深度CNN滤波器。目前的研究结果表明,该方法具有快速、强大的OD定位能力和较高的灵敏度。在未来,我们的目标是通过开发其他CNN和自动编码器架构来提高模型的特异性。我们还研究了训练前和数据扩充以及考虑多个分类器的影响。
表1不同图像集的OD定位精度
表2 提出的OD异常检测器的性能表现
参考文献:
1. Almazroa, A. et al. Optic Disc and Optic Cup Segmentation Methodologies for
Glaucoma Image Detection: A Survey. , Journal of Ophthalmology, ID: 180972,
2015.
2. Raja, J. Benadict R., C.G. Optic Disc Localization Methdodologies in Retinal
Images: A review ,Journal of Chemical Information and Modeling, vol. 53 pp.
1689-1699, 2015.
3. Yaniv T., et al.DeepFace: Closing the Gap to Human-Level Performance in Face
Veri_cation. Conference on Computer Vision and Pattern Recognition, p. 8, 2014.
4. Chuang W., et al. Level Set Segmentation of Optic Discs from Retinal Images
Journal of Medical and Bioengineering, vol. 4, no. 3, pp. 213220, 2015.
5. Dongbo Z. and Yuanyuan Z., Novel Accurate and Fast Optic Disc Detection in
Retinal Images with Vessel Distribution and Directional Characteristics IEEE
Journal of Biomedical and Health Informatics, vol.20, no.1, pp. 333342, 2014.
6. Alex K., Ilya S., and G. Hinton, ImageNet Classi_cation with Deep Convolutional
Neural Networks, Advances In Neural Info
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[20499],资料为PDF文档或Word文档,PDF文档可免费转换为Word