论文部分内容阅读
随着现代医学成像技术的快速发展,医学影像已经成为重要的辅助诊疗技术。但是,随着各种医学成像设备比如CT、MR、DSA、DR,以及大量计算机技术融合到影响诊断中,医学影像资源的有效利用已经成为了一个非常迫切的问题。医院每天产生海量的医学图像,如果能够对影像类别进行自动标注,可以在很大程度上减少医生的工作量,也能够提高医学影像的使用效率。医学影像分类已经成为一个非常迫切的需求。传统的基于内容的图像分类方法大多基于图像的全局特征,比如颜色、纹理、形状特征等,这些方法虽然已经取得了不错的分类性能,但由于思路单一,这种分类方法的发展受到了很大的限制。词袋模型的基本思想是利用词典构建文本集的单词-文档共现矩阵。将词袋模型应用到图像领域中,可以构建出视觉词袋模型,这样文本领域中的算法就可以引入到图像领域,使两个领域能够得到有机的结合。学科间的相互交叉融合,对于各学科的发展都能提供新的思路,这对于两个学科的发展都能起到促进作用。本文将词袋模型成功应用到医学影像分类问题中,基本思想是,首先提取图像的SIFT特征,然后将所有的特征聚类,生成视觉词汇表,根据这个词汇表构建每幅图像的视觉单词表示,最后输入到支持向量机中进行训练和测试。实验表明,词袋模型在很大程度上提高了医学影像分类的精度。为了解决词袋模型速度慢的问题,本文引入了kd-tree算法来改进词袋模型的速度。通过kd-tree算法来构建视觉词汇表的高维索引,然后利用该索引来计算每幅图像的视觉单词表示。实验表明,这种方法大大提高了构造图像视觉单词表示的速度,从而提高了词袋模型的速度。和文本领域类似,把词袋模型应用到医学影像领域同样存在着多义词和同义词问题。本文通过把词袋模型与PLSA主题模型结合来解决词袋模型中的同义词和多义词的问题,这使得基于词袋模型的分类方法在精度上得到了进一步提高。