论文部分内容阅读
随着互联网的迅猛发展,互联网媒体类型越来越丰富,其内容也越来越多。在信息爆炸时代,从庞大的数据中筛选出有价值的信息就显得尤为迫切。面向指定媒体类型的金融信息推荐系统,旨在通过对互联网媒体类型中的tent/html类型进行分析,筛选出金融相关的信息,并基于协同过技术推送给用户感兴趣的消息,该系统的主要功能包括数据采集,数据分析及存储,信息推荐,信息展示等。协同过滤技术是目前推荐系统中应用最早和最为成功的技术之一,它的基本思想是:根据用户对内容或者信息的偏好,发现内容或信息本身的相关性,或者是发现用户的相关性。虽然现今针对推荐的相关研究已比较成熟,但真正想要把它应用在实际场景中,还需要数据采集,和初始化的工作,这两项不做好,再好的推荐模型和算法都无计可施。如今关于推荐算法的研究都是基于开源组织提供的结构化数据,其数据形式往往都非常简单,清晰。但在实际的应用中,数据的状态不会像实验数据中那样理想,特别当面对互联网媒体类型中的text/html类型时,因为这种类型的数据是半结构化的,问题就显得尤为突出。本文通过对推荐平台的设计和实现,证明了本文中数据采集,数据初始化方法,以及推荐模式在针对特定媒体类型进行运用时的有效性。