论文部分内容阅读
糖尿病视网膜病变(糖网)是糖尿病最为严重并发症之一,也是导致视力损伤或失明的主要病因之一。临床上,利用眼底图像进行定期的分类筛查和尽早的诊疗是控制病情发生、发展最有效的手段。当前糖网筛查主要依靠眼科医师人工地检查和分析眼底图像上的异常病变(如微动脉瘤、出血斑和硬性渗出),从而对其进行诊断与分类,这颇为费时费力,也制约了糖网筛查的大规模实施。此外,庞大的筛查人群和稀缺的眼科医师也成为了大规模糖网筛查开展的瓶颈。因此,利用眼底图像基于计算机技术的糖网自动分类方法能够快速有效地识别眼底图像中的糖网病变并对其进行分类,不仅可以将医生从繁重的人工阅片工作中解脱出来,更能有效地提高糖网筛查的准确性、客观性和快速性,对减少患者的视力损伤,促进我国大规模糖网筛查的实施,具有重要的临床价值和社会效益。
目前许多的学者和专家已对糖网自动分类方法展开了大量的研究,由于依赖病灶检测的糖网分类方法具有良好的临床解释性,所以现阶段的研究多集中在基于相关病灶检测的糖网分类方法上,但这些方法的研究中很少关注不均衡数据分类、数据集标注信息不完备及其引发的多源数据分布不一致等问题对分类性能的影响,这使得传统的监督性分类方法很难获得高的准确率。为此,本文从这些问题出发,围绕基于眼底图像的糖网自动分类方法的实现,从微动脉瘤的检测、糖网的二类诊断、糖网的多分类以及糖尿病黄斑水肿的多分类等四个方面展开研究。本文的主要工作包括:
(1)针对微动脉瘤检测中的不均衡数据分类问题,提出一种基于自适应升采样集成学习的微动脉瘤检测方法。该方法首先利用数学形态学及区域生长方法检测疑似微动脉瘤,而在疑似病灶的分类上,为了减少由不平衡数据引入的分类偏差,本文提出了自适应升采样算法,它能够自适应地决定每个少数类样本需要合成样本的数量,并将其分别与提升、装袋和随机子空间等集成框架结合,构建了三种基于自适应升采样的集成分类模型,进而实现疑似病灶的分类。通过对国际公开的E-ophtha数据集进行验证,并将提出的算法与当前主流一些方法进行性能对比与分析,实验结果显示了提出的方法在解决不均衡数据分类问题上的优势和有效性。
(2)针对糖网诊断中数据集病灶标注信息缺失的问题,提出一种基于多核多示例学习的糖网诊断方法。该方法将多示例学习算法引入到糖网诊断中,将检测的红色病灶视为多示例学习模型中的示例,而将整幅眼底图像视为示例包,进而采用基于核图结构进行多示例学习建模,并将其融入多核学习的架构中,建立基于多核图的多示例分类模型对健康图像和糖网病变图像进行分类。通过国际公开的MESSIDOR数据集的实验验证表明,提出的方法在无需提供病灶标注的情况下,能够高效自动地对糖网病变进行诊断,从而既能避免医学图像中标注病灶的费时费力,又可以免除分类算法中假阳性去除的问题,获得较好的效果。
(3)针对糖网分类中的不均衡数据分类和多源数据分布不一致问题,提出一种基于代价敏感的半监督集成的糖网分类方法。该方法首先将包含微动脉瘤与出血斑的疑似红色病灶区域检测出来;其次,在疑似病灶的分类上,为了解决目标数据集无病灶标记的问题,本文采用半监督学习技术,根据K近邻样本的一致性和高置信度采样的策略预测无病灶标记样本的类别,并将其与基于代价敏感的支持向量机进行结合,以Bagging的方式构建基于代价敏感的半监督Bagging分类模型,进而实现疑似微动脉瘤与出血斑的分类;最后,依据各病灶的数量将糖网划分为四个级别。通过对国际公共数据集MESSIDOR进行糖网分类评估,并与领域内其他算法进行了性能对比,全面系统地证明算法的有效性。
(4)针对糖尿病黄斑水肿分类中的视盘、黄斑和硬性渗出的检测难点,提出一种基于黄斑与硬性渗出检测的糖尿病黄斑水肿分类方法。该方法首先利用融合多特征的视盘定位算法进行视盘的定位,并采用一种基于区域信息的活动轮廓模型获得精细的视盘轮廓;然后,设计一种基于模板匹配的黄斑检测算法以检测黄斑的中心;其次,结合局部区域分割的策略和矢量量化的技术进行疑似硬性渗出的分割,继而利用基于自适应升采样的半监督Bagging分类算法实现疑似硬性渗出的分类;最后,基于硬性渗出与黄斑中心的空间距离将糖尿病黄斑水肿分为三个级别。通过对国际公共数据集MESSIDOR进行糖尿病黄斑水肿分类评估,并与一些领域内的方法进行了性能比较,实验结果证明了提出方法具有较高的准确率和鲁棒性。
目前许多的学者和专家已对糖网自动分类方法展开了大量的研究,由于依赖病灶检测的糖网分类方法具有良好的临床解释性,所以现阶段的研究多集中在基于相关病灶检测的糖网分类方法上,但这些方法的研究中很少关注不均衡数据分类、数据集标注信息不完备及其引发的多源数据分布不一致等问题对分类性能的影响,这使得传统的监督性分类方法很难获得高的准确率。为此,本文从这些问题出发,围绕基于眼底图像的糖网自动分类方法的实现,从微动脉瘤的检测、糖网的二类诊断、糖网的多分类以及糖尿病黄斑水肿的多分类等四个方面展开研究。本文的主要工作包括:
(1)针对微动脉瘤检测中的不均衡数据分类问题,提出一种基于自适应升采样集成学习的微动脉瘤检测方法。该方法首先利用数学形态学及区域生长方法检测疑似微动脉瘤,而在疑似病灶的分类上,为了减少由不平衡数据引入的分类偏差,本文提出了自适应升采样算法,它能够自适应地决定每个少数类样本需要合成样本的数量,并将其分别与提升、装袋和随机子空间等集成框架结合,构建了三种基于自适应升采样的集成分类模型,进而实现疑似病灶的分类。通过对国际公开的E-ophtha数据集进行验证,并将提出的算法与当前主流一些方法进行性能对比与分析,实验结果显示了提出的方法在解决不均衡数据分类问题上的优势和有效性。
(2)针对糖网诊断中数据集病灶标注信息缺失的问题,提出一种基于多核多示例学习的糖网诊断方法。该方法将多示例学习算法引入到糖网诊断中,将检测的红色病灶视为多示例学习模型中的示例,而将整幅眼底图像视为示例包,进而采用基于核图结构进行多示例学习建模,并将其融入多核学习的架构中,建立基于多核图的多示例分类模型对健康图像和糖网病变图像进行分类。通过国际公开的MESSIDOR数据集的实验验证表明,提出的方法在无需提供病灶标注的情况下,能够高效自动地对糖网病变进行诊断,从而既能避免医学图像中标注病灶的费时费力,又可以免除分类算法中假阳性去除的问题,获得较好的效果。
(3)针对糖网分类中的不均衡数据分类和多源数据分布不一致问题,提出一种基于代价敏感的半监督集成的糖网分类方法。该方法首先将包含微动脉瘤与出血斑的疑似红色病灶区域检测出来;其次,在疑似病灶的分类上,为了解决目标数据集无病灶标记的问题,本文采用半监督学习技术,根据K近邻样本的一致性和高置信度采样的策略预测无病灶标记样本的类别,并将其与基于代价敏感的支持向量机进行结合,以Bagging的方式构建基于代价敏感的半监督Bagging分类模型,进而实现疑似微动脉瘤与出血斑的分类;最后,依据各病灶的数量将糖网划分为四个级别。通过对国际公共数据集MESSIDOR进行糖网分类评估,并与领域内其他算法进行了性能对比,全面系统地证明算法的有效性。
(4)针对糖尿病黄斑水肿分类中的视盘、黄斑和硬性渗出的检测难点,提出一种基于黄斑与硬性渗出检测的糖尿病黄斑水肿分类方法。该方法首先利用融合多特征的视盘定位算法进行视盘的定位,并采用一种基于区域信息的活动轮廓模型获得精细的视盘轮廓;然后,设计一种基于模板匹配的黄斑检测算法以检测黄斑的中心;其次,结合局部区域分割的策略和矢量量化的技术进行疑似硬性渗出的分割,继而利用基于自适应升采样的半监督Bagging分类算法实现疑似硬性渗出的分类;最后,基于硬性渗出与黄斑中心的空间距离将糖尿病黄斑水肿分为三个级别。通过对国际公共数据集MESSIDOR进行糖尿病黄斑水肿分类评估,并与一些领域内的方法进行了性能比较,实验结果证明了提出方法具有较高的准确率和鲁棒性。