论文部分内容阅读
随着国内网民数量逐年上升和电子商务技术的发展,网络购物市场逐年扩大,而服饰鞋包类商品是在整个网络购物市场中交易最多的商品。大众越来越认可通过购衣网站购买服装商品这种购物模式,在线购衣成为人们选购服装的重要途径之一。现在,在线购买服装正在成为越来越受人们欢迎的购物模式。在诸如淘宝、凡客、亚马逊等在线购物网站,人们通过输入如“白色短袖雪纺连衣裙”这样的一些关键字去搜索他们喜欢的服装,通过对搜索记录的浏览筛选出最满意的商品购买。但是若买家对服装的描述不准确,将会造成买家耗费大量的时间去挑选合适的服装,加之现在网络上的服装商品越来越多,这种情况经常发生。为了提高人们的搜索体验,很多互联网公司投入到对利用图像视觉特征进行搜索的研究中,但是单纯的利用底层视觉特征又会造成图像语义的缺失,鉴于此,本文利用网络购物网站的服装图像及卖家对商品的标注信息,通过特征提取及图像聚类实现图像到商品关键描述词的映射,根据映射到的关键描述词去进行检索,最终完成了基于图像服装检索系统的设计和实现。本文的主要研究内容如下:(1)在收集在线购物网站服装商品图像及其文本描述信息的基础上,通过对相关技术的调研,利用特征提取和聚类算法实现了服装图像聚类,并根据聚类结果及得到的图像相对应的文本描述信息实现图像视觉特征到关键字映射,建立了图像视觉特征与其语义之间的联系。(2)通过对传统k-means聚类算法的研究和分析,对该算法进行了一定程度的改进,利用待聚类数据集的相异度矩阵确定初始聚类中心及K值,并将改进的聚类方法应用于服装图像的聚类,实验证明,本文改进的方法相对于传统的k-means方法对本文提取的服装图像的特征聚类更有效。(3)利用成熟的基于关键字的图像检索技术,整合图像特征提取、关键字映射等模块,设计并实现了基于图像的服装检索系统,通过将用户提供的图像映射到关键字实现检索,是一种基于图像语义的检索系统。本系统在Eclipse环境下采用java语言完成开发。