基于词袋模型的医学影像分类的研究与实现

来源 :东北大学 | 被引量 : 5次 | 上传用户:D_boy85
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代医学成像技术的快速发展,医学影像已经成为重要的辅助诊疗技术。但是,随着各种医学成像设备比如CT、MR、DSA、DR,以及大量计算机技术融合到影响诊断中,医学影像资源的有效利用已经成为了一个非常迫切的问题。医院每天产生海量的医学图像,如果能够对影像类别进行自动标注,可以在很大程度上减少医生的工作量,也能够提高医学影像的使用效率。医学影像分类已经成为一个非常迫切的需求。传统的基于内容的图像分类方法大多基于图像的全局特征,比如颜色、纹理、形状特征等,这些方法虽然已经取得了不错的分类性能,但由于思路单一,这种分类方法的发展受到了很大的限制。词袋模型的基本思想是利用词典构建文本集的单词-文档共现矩阵。将词袋模型应用到图像领域中,可以构建出视觉词袋模型,这样文本领域中的算法就可以引入到图像领域,使两个领域能够得到有机的结合。学科间的相互交叉融合,对于各学科的发展都能提供新的思路,这对于两个学科的发展都能起到促进作用。本文将词袋模型成功应用到医学影像分类问题中,基本思想是,首先提取图像的SIFT特征,然后将所有的特征聚类,生成视觉词汇表,根据这个词汇表构建每幅图像的视觉单词表示,最后输入到支持向量机中进行训练和测试。实验表明,词袋模型在很大程度上提高了医学影像分类的精度。为了解决词袋模型速度慢的问题,本文引入了kd-tree算法来改进词袋模型的速度。通过kd-tree算法来构建视觉词汇表的高维索引,然后利用该索引来计算每幅图像的视觉单词表示。实验表明,这种方法大大提高了构造图像视觉单词表示的速度,从而提高了词袋模型的速度。和文本领域类似,把词袋模型应用到医学影像领域同样存在着多义词和同义词问题。本文通过把词袋模型与PLSA主题模型结合来解决词袋模型中的同义词和多义词的问题,这使得基于词袋模型的分类方法在精度上得到了进一步提高。
其他文献
期刊
随着移动通信网络规模的不断扩大以及市场竞争的日趋激烈,提供多样化、层次化的业务已成为运营商提高服务水平和赢得竞争的重要手段之一.电信运营的发展也从单一的基础网络的
随着信息技术的发展,将计算机技术应用到教育测量中改变了传统的以纸笔为工具的测量手段,给教育测量带来了巨大的变革。计算机辅助测试通过测试软件对测量对象测量并给出合理的
随着计算机技术的日新月异,社会信息化的不断发展,数据库的使用已经融入到人们的日常生活.随之而来的问题就是,面对不同的用户,如果保证数据库的信息的安全性,同时又能保证一
用户的偏好会随着时间的变化而发生改变,这种现象被称之为用户偏好漂移,用户偏好漂移的存在使得推荐系统为用户做出符合用户偏好的推荐变得困难。推荐系统如果没有考虑到用户偏
随着计算机互联网技术的不断发展,计算机网络日趋复杂和庞大,网络上的各种服务体系和它们的管理也变得越来越复杂。目录服务以其层次化的结构、面向对象的数据模型、可扩展性和