关键词:
深度学习
细粒度分类
注意力机制
多输入网络
摘要:
宫颈癌是威胁女性健康的第四大癌症。根据WHO2018年全球癌症观测数据库显示,在2018年全球大约有570000例宫颈癌病例与311000例死亡病例,死亡率达到54.56%。提前筛查宫颈癌,可以使得该癌症得以提前发现。这有助于宫颈癌的治疗以及降低死亡率。液基薄层细胞检测(Thinprep Cytologic Test,TCT)已经成为筛查宫颈癌的主要方法。由于单个薄片上的细胞数量有成千上万个,具有丰富经验的病理专家在阅片时会出现不少漏检与误检的情况。自动阅片技术可以辅助医生完成宫颈癌筛查过程,不但可以减少漏检率和误检率,而且可以提高检测效率。精确的筛选出异常宫颈细胞是自动阅片的关键技术。筛选异常宫颈细胞常用的方法有传统的检测方法、卷积神经网络与目标检测等方法。这些方法可以达到一定的筛查精度,但是仍然有一些检测问题没有得到解决。一般情况下在同一幅图像中,异常细胞核的尺寸与正常细胞差异较大,而现阶段的目标检测方法没有在分类阶段保持宫颈细胞统一的尺寸特征。正常宫颈细胞与异常宫颈细胞都属于宫颈细胞的子类,它们之间的相似度较大,因此宫颈细胞分类任务属于细粒度分类。对于单个细胞,不易判断它是否异常,需要通过与同一幅图像上的周围细胞对比后才易判断它的类别,而目前的分类方法一般每次只输入一个细胞图像,并没有利用与周围细胞对比的方式。本文重点用深度学习方法解决上述问题,并且从目标检测、细粒度分类和多输入网络等三个方面来提高宫颈细胞的分类准确率。具体的工作内容包括以下三部分:1.设计了一种基于Mask R-CNN的深度神经网络MACD R-CNN,解决了Mask R-CNN在分类分支中没有统一保持细胞的大小与形态等特征这一问题。首先在Mask R-CNN的分类分支中,它从不同大小的Ro I生成与输入相同大小的特征图。这部分特征图的细胞核将会有不同程度的形变。我们设计了一个固定的提议模块,以生成固定大小的细胞核特征图,从而可以将新的细胞核特征用于分类。然后我们使用注意力机制来融合原始Ro I和固定大小的Ro I特征。最后我们增加了卷积层的深度,以进一步提高细胞分类的准确性。实验表明,MACD R-CNN可以有效提高异常细胞检测的性能。2.提出了弱监督分类模型MNTNet,解决了因宫颈细胞变化多样、环境复杂且异常细胞与正常细胞相似度较大这样的困难分类问题。目前的细胞分类方法性能仍然不够理想,而MNTNet引入了细粒度分类思想对于上述问题有较好的效果。我们采用了反二叉树设计方式,首先在左右子节点上分别使用空间注意力机制与通道注意力机制学习不同的特征,再通过父节点的合并操作融合左右子特征,最后利用根节点的特征实现细胞分类。在Herlev数据集与SIPa KMe D数据集上的实验结果表明,我们提出的MNTNet方法的准确率超越了目前先进的方法。3.提出了MINDDR-CNN-Shortcut多输入细胞分类网络,解决了普通分类网络不能利用整幅图像中宫颈细胞的特征对比与联系的问题。MINDDR-CNNShortcut网络是一个多输入单任务网络,用来检测异常宫颈细胞。MINDDRCNN-Shortcut的主要贡献为:首先适应多幅图像同时输入;其次增加CBAMNDDR模块,使子网络的特征融合更为平滑;最后将各个子网络CBAM-NDDR输出的特征图连接到一起,并进一步融合各个子网络的特征。实验表明,我们提出的MINDDR-CNN-Shortcut网络能够学习一幅图像中多个细胞的特征,比单网络模型具有更高的准确率。深度神经网络是实现计算机辅助自动判别诊断技术的重要工具。在使用深度学习技术解决宫颈细胞分类问题时不仅需要了解宫颈细胞类别与特点,而且要结合一定的病理知识。本文通过分析目前的异常宫颈细胞检测方法存在的问题,将深度学习技术与宫颈细胞的特征和病理知识相结合,提出了一些新的检测方法。这些方法不但可以提高宫颈癌细胞的检测效率而且可以提高其检测精度。