基于PCA的Unet网络用于新冠肺炎CT图像分割
来源:用户上传
作者:余后强 徐怿�[ 徐静蕾 陈瑶 汤小丽
摘 要:为了对新冠肺炎CT图像进行精确分割,在Unet模型基础上,设计了一种基于主成分分析的改进Unet模型。在提出的方法中,先用PCA对新冠肺炎CT图像进行特征预提取,以去除图像中的噪声等因素干扰,获得更本质的特征。然后将产生的特征图像作为原始图像输入Unet中进行分割。同时,在网络层中进行BN处理。这个联合了PCA和Unet的改进模型记为PCA-Unet。实验表明,相比于单纯使用Unet,PCA-Unet有更好的表现。在视觉印象上,PCA-Unet能够更准确地分割出感兴趣区域,更接近于金标准。在定量比较上,PCA-Unet在四项指标上都获得了优势。
关键词:新冠CT图像;主成分分析;Unet;BN
中图分类号:TP18 文献标识码:A文章编号:2096-4706(2022)20-0094-04
The Segmentation of CT Images of COVID-19 Using Unet Network Based on PCA
YU Houqiang, XU Yifan, XU Jinglei, CHEN Yao, TANG Xiaoli
(School of Mathematics and Statistics, Hubei University of Science and Technology, Xianning 437100, China)
Abstract: In order to segment CT images of COVID-19 accurately, an improved Unet model based on principal component analysis (PCA) is designed on the baseline of Unet model. In the proposed method, PCA is firstly used to extract the features of CT images of COVID-19, which can remove the interference of noise and other factors in the images and obtain more essential features. Then, as the original images, the generated feature images are input into Unet for image segmentation. Meanwhile, BN processing is carried out in the network layer. This improved model combining PCA and UNET is called PCA-Unet. The experimental results show that PCA-Unet has better performance than using Unet alone. In terms of visual impression, PCA-Unet can segment the interesting region more accurately, which is closer to the gold standard. In quantitative comparison, PCA-Unet has gained advantages in four indicators.
Keywords: CT images of COVID-19; principal component analysis; Unet; BN
0 引 言
2020年初新冠肺炎的突然爆l,对全球数十亿人的生活造成了重大影响。如何快速准确地对疑似患者进行筛查及诊断,成为医学界面临的重大课题[1]。研究表明,新冠患者的胸部CT图像具有独特的影像学表现,且不同阶段表现形式差别较大[2]。由于CT图像数量巨大,且需要具有丰富临床经验的专业性放射科医生进行判断,读片的过程非常耗时耗力。为此,利用计算机辅助诊断(CAD)可以极大减少临床医生的工作量,帮助提高诊断的敏感性和特异性。对于经验较少的医生也能帮助他们更加准确地进行诊断,确定更加适合的治疗方案。目前基于深度学习的自然图像分析和研究已取得了良好效果,但医学图像由于受到患者隐私、注释昂贵、数据不平衡、图像更加复杂等因素影响,深度学习的应用还处于快速发展之中。这些应用主要包括医学图像去噪、分割、增强、配准、融合、分类等[3-5]。分割作为图像的预处理过程,对之后的配准、融合、分类等起着重要的临床指导作用。如何对医学图像进行精准分割,一直是国内外众多学者研究的热点。
近些年,随着人工智能技术的飞速发展,基于深度学习的图像处理技术得到了广泛应用。在图像分割领域,许多深度模型被提出来并获得了良好效果。对于医学图像,0laf Ronneberger等[6]在2015年提出了Unet模型用于生物医学图像分割。该模型基于全卷积神经网络思想,采用编码-解码的对称框架,结构优美,形如字母“U”,因而称为Unet模型。一经提出,Unet就在医学图像分割上表现不俗,超过了很多传统模型以及深度分割模型,得到了广泛应用,并有了很多变体。众多学者沿用Unet的核心思想,通过加入新的模块或者其他设计理念对其进行改造,并应用到自己领域。
在本文中,我们将对新冠肺炎CT图像进行分割。临床显示,新冠CT影像呈现出磨玻璃影,而传统分割算法仅根据肺部区域的灰度、形态、纹理等信息,难以将对比度相似的软组织区别开来。基于Unet的特点,我们将基于该模型对新冠肺炎CT图像进行自动分割。但原始的Unet存在一些不足,比如层数较浅、使用sigmoid作为激活函数容易在数据绝对值较大时出现过饱和现象,导致梯度爆炸或消失,这对于模型的训练是非常不利的。同时,在模型训练中,样本量的大小也起着很大的影响。样本太少,容易过拟合。对于新冠肺炎,当前能采集到的CT图像数据比较有限,如何在小样本的情况下训练Unet,也是面临的挑战。
nlc202211211558
为了解决以上问题,我们将首先对CT影像数据进行特征预提取,从而减少原始图像中噪声等因素的影响,保留更本质的特征,并能获得更多的特征图像,这些图像对于之后的Unet模型不仅能增加训练样本集,还能加速网络的训练过程。为了对新冠CT图像进行特征预提取,我们建立了一个两层的主成分分析(Principal Component Analysis, PCA)网络[7]。在该网络中,简单的PCA运算首先运用于训练集上以获得卷积核,随后原始图像与卷积核进行卷积运算产生图像的输出特征。相比于一些CNN模型,由于没有正则化参数或者数值优化求解等过程,该网络训练起来非常简单,在特征提取方面却很有效。
基于PCA在自动提取图像本质特征方面强大的能力,我们将其与Unet相结合。利用PCA产生的特征图像作为训练集用于Unet模型的训练。同时,为了抑制Unet在训练中使用sigmoid作为激活函数导致模型容易陷入过拟合或局部最小值问题,我们将在网络层中使用Batch Normalization(BN)[8]思想,即对每个隐含层的数据分布都进行归一化到标准正态,这样处理可以缓解梯度衰减的问题。通过这两方面的改进,新构造的模型能够克服原始Unet中存在的一些不足,更好的用于CT图像的分割,这种联合PCA和Unet的混合模型记为PCA-Unet。
1 方法介绍
在本节中,根据新冠CT图像的特点,提出了一个联合主成分分析(Principal Component Analysis, PCA)网络与Unet的混合模型用于对新冠CT图像进行分割。该模型如图1所示,输入的原始CT图像将首先进入PCA模型,通过与其中的PCA滤波器进行卷积操作,产生相应的特征图像。这些特征图像将作为训练集输入到Unet模型中,进行深度特征提取,然后根据Unet最后的Softmax层,得到输入图像的分割图。下面详细介绍PCA-Unet各部分的构造过程。
1.1 PCA网络的计算过程
PCA网络由两层构成,原始图像进入PCA模型中,首先会与第一层的滤波器进行卷积,产生第一阶段的特征图。然后每一个特征图又与第二阶段的滤波器进行卷积,产生第二阶段的特征图。所有这些特征图即是PCA网络的最终输出。在PCA网络中,仅仅滤波器需要通过训练得到。下面就PCA的卷积过程进行详细描述。
1.1.1 第一个卷积层的计算
假设训练图片的数目为K,所有阶段的图像块大小均为k1×k2。对于第p张训练图片,按照像素点顺序逐次进行块采样并去均值化之后再向量化。将所有的向量按照原像素点的顺序排列到一起,得到该张图片对应的矩阵Ap=[ap,1,ap,2,…,ap,s],其中ap,s是第s个去均值化后的图像块对应的向量,S是该张图片产生的图像块数目。通过对训练集中每张图片做相同的处理,可得到训练集对应的矩阵A=[A1,A2,…,AK]∈Rk1k2×SK。然后对矩阵A进行PCA运算,目的是通过寻找一系列的标准正交矩阵来最小化重构误差:
式中L1是第一层滤波器的个数,是大小L1×L1的单位矩阵,代表Frobenius范数。该式子的求解就是经典的主成分分析问题,它求出的L1个解就是AAT的前L1个特征值,相应的特征向量为:
这里,ql(AAT)代表AAT的第l个特征向量。式(1)求出的L1个特征向量就是第一层的卷积核。
1.1.2 第二个卷积层的计算
类似于深度神经网络(Deep Neural Networks, DNNs),多层PCA滤波器也可以级联到一起,用于提取更深层次的特征。在第一个卷积层产生的所有输出作为第二个卷积层的输入,然后重复几乎相同的计算方法,产生的L2个特征向量就是第二层的卷积核。
1.1.3 输出层的处理
对于第p张训练图片,经过第一个卷积层后获得L1个输出,记为。第一层的每个输出又作为输入层,进入第二个卷积层后,产生L1个相应的输出,记为。这些特征图像将作为训练集,输入Unet中进行训练。
1.2 Unet模型的计算过程
Unet模型为对称结构,由左右两部分构成。左边部分为特征提取,类似VGG结构,通过四个连续卷积块操作,将原始572×572×1的图像编码成28×28×1 024的特征图。Unet的右边部分为上采样过程,采用全卷积思想,通过四次上采样,将编码后的28×28×1 024的特征图像逐步扩大至388×388×2的图像尺寸。Unet由于增加了skip connection结构,使得在每一级上采样过程中,能够将底层特征与高层特征融合,保留了高层特征所包含的高分辨率等细节信息,因此提高了图像分类精度。为了避免Unet训练过程中出现的过拟合问题,我们采用了BN思想。当有m个mini-batch时,假设输出值为B=(x1,x2,…,xm),
先对该数据进行标准化处理,转化为,其中每个分量,这里μB为平均值,σB为标准差,为极小因子,用于防止分母为零。之后再进行缩放与微调,,λ,δ可通过BN层进行学习。通过对每一层神经网络卷积后再施行BN处理,可加快收敛速度,优化训练过程。
2 实验及分析
2.1 实验所用数据集及评价指标
在本节中,我们将测试所提算法的有效性。本研究所用新冠肺炎CT图像来源于湖北省咸宁市中心医院采集的真实临床数据,共360例。三位临床影像医生参与了损伤区域的识别和标记,其中300个数据用于训练,剩下的60个用于测试,所有图像裁剪成256×256尺寸。
对于本研究中提出的PCA模型,经过测试,发现在PCA模型中,使用两个卷积层就能够取得良好的特征提取效果。如果网络进一步加深,计算量会显著增加,但去噪效果提升很小,因此我们使用两个卷积层进行特征预提取,两层的滤波器个数都设置为12,训练图像块的大小设为7×7。
nlc202211211558
为了定量评估分割效果,我们使用四个指标,分别是分割结果与标签的交并比(Itersection over union, Iou)、精确率(Precision, Pre)、特异度(Specificity, Spe)与召回率(Recall, Rec),它们计算公式如下:
这里TP,FP,TN,FN分别是像素点的真阳性数量、假阳性数量、真阴性数量和假阴性数量。
图2为使用PCA模型产生的特征图像。第一行为原始新冠CT图像,第二行为原图与PCA进行第一层卷积产生的前三张特征图像,第三行为原图与PCA进行第二层卷积产生的前三张特征图像。
2.2 实验结果
本实验随机选择两张真实新冠CT图像进行测试,如图3所示,左边图像记为A,右边图像记为B。从两张图像可以看到在肺部有明显的磨玻璃影,用蓝色方框圈出。本研究将分别使用Unet和PCA-Unet对这两块区域进行分割,并定量比较分割结果。
图4给出了测试图像A的分割结果。可以看出,与金标准相比,Unet方法虽然能实现较好的结果,但当背景部分干扰较大时难以很好的拟合磨玻璃影的轮廓。而PCA-Unet方法分割结果较佳,能将磨玻璃影部分清晰地分割出来,更接近金标准。
同时,从表1的定量结果可以看出,PCA-Unet比Unet在四个评价指标上都具有优势。因此,不论是从主观印象还是客观指标都可以看出,对于新冠CT图像A,PCA-Unet比Unet有更好的分割表现。
另外,图5给出了测试图像B的分割结果。从图中可以明显看出,本文提出的方法更接近金标准,更能把磨玻璃影的轮廓拟合出来。
类似的定量结果可以从表2中看出,除了在召回率这一项指标上,PCA-Unet落后于Unet之外,在其他三项指标上,PCA-Unet都占有优势。综合测试图像A和B的分割结果,可以看出,PCA-Unet具有较好的鲁棒性,比单独使用Unet有更优良的分割表现。
3 Y 论
在本研究中,针对Unet模型的一些不足,我们提出了使用PCA进行特征预提取,然后再输入Unet进行训练的联合模型。同时,在网络层中使用BN技术进行处理。通过这些改进,提出的模型相比原始的Unet在新冠CT图像分割上获得了更好的效果。从视觉印象上,使用本文方法获得的分割轮廓更接近金标准。在四项定量指标上,本文方法也几乎全面超过了Unet。这些结果对于基于CAD的临床诊断具有一定的现实意义,能够帮助临床医生更好的进行图像分析。
参考文献:
[1] CHEN N,ZHOU M,DONG X,et al. Epidemiological and clinical characteristics of 99 cases of 2019 novel coronavirus pneumonia in Wuhan,China:a descriptive study [J].Lancet 2020:395(10223):507C513.
[2] CHUNG M,BERNHEIM A,MEI X,et al.CT imaging features of 2019 novel coronavirus (2019-ncov) [J].Radiology,2020,295(1):202-207.
[3] 赵丽亚.肿瘤手术导航中图像分割与配准方法研究 [D].北京:北京工业大学,2016.
[4] SUMMERS R M.Deep learning lends a hand to pediatric radiology [J].Radiology,2018,287(1):323-325.
[5] NOMURA Y,HIGAKI T,FUJITA M,et al. Effects of iterative reconstruction algorithms on computer-assisted detection (CAD) software for lung nodules in ultra-low-dose CT for lung cancer screening [J].Academic Radiology,2016,24(2):124-130.
[6] RONNEBERGER O,FISCHER P,BROX T. U-Net:Convolutional networks for biomedical image segmentation [C]//MICCAI 2015:Medical Image Computing and Computer-Assisted Intervention. Cham:Springer,2015:234C241.
[7] HAN C T,JIA K,GAO S H,et al.Pcanet:a simple deep learning baseline for image classification [J].IEEE Trans Image Process,2015,24(12):5017-32.
[8] IOFFE S,SZEGEDY C. Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shift [J/OL].(2022-07-02).https://arxiv.org/abs/1502.03167.
作者简介:余后强(1979―),男,汉族,湖北咸宁人,副教授,博士,主要研究方向:应用数学。
nlc202211211558
转载注明来源:https://www.xzbu.com/1/view-15442406.htm