论文部分内容阅读
当前互联网时代,数据被赋予新时代新能源;数据以爆发式进行增长,在电商行业中客户越来越重视与网站之间的交互。通过对数据的分析与挖掘,以及合理地运用这些分析成果,可以为客户提供最好的服务。在现有的查询推荐方法中用户的查询意图准确性与数据的稀疏性是影响查询推荐效果重要因素。现有方法中大多以用户查询点击表征为主,忽略了用户的兴趣行为信息。同时对于查询点击数据间的稀疏性未能很好的解决。通过对于电商网站上用户的查询点击行为进行分析,为用户在查询时提供更加个性化的商品查询词推荐。在推荐系统下,但仍面临着诸多挑战和问题,例如海量数据高并发下传输一致性与稳定性、海量数据存储计算和扩展性问题、原生的数据稀疏性问题,以及用户分析行为系统时效性的问题等等。为了针对上述查询推荐方法与推荐系统中存在的问题,针对电商领域,在云计算技术背景下,提出电商商品的查询推荐系统。在现有的查询推荐方法中,如何使用户的兴趣行为与查询行为相结合是存在的问题。为了优化系统查询推荐效果,在电商场景下用户兴趣行为较为丰富,同时查询点击行为较为稀疏的特点,提出一种基于查询与兴趣的查询推荐方法。在融合用户查询点击行为表征的同时,引入用户在电商网站进行兴趣交互时的行为,解决用户行为节点构成子图的流通度较低问题。在推荐系统中,消息队列是应用于日志采集、消息分发、日志处理场景下较多的组件。为了改进查询推荐系统中的时效性,在消息队列Kafka任务出现的两端吞吐性能不平衡问题与其中任务故障/宕机后消息重复消费的问题下,提出了一种基于消息队列吞吐比值的资源分配方法。该方法以多源主题的发布-订阅消息模型为基础,进行任务的管理与消息的分发。最后本文基于云计算技术设计并实现了一个电商商品查询推荐系统,包括了数源子系统、任务管理子系统、非关系型数据存储子系统、服务监控子系统。根据所提出的基于查询与兴趣的电商查询推荐方法对于现有查询推荐方法进行改进,同时对于推荐系统下的消息队列模型进行优化,将其加入多源主题消费与管理层与缓冲层。实现系统中消息队列任务的管理与资源分配。测试结果表明文中所构建的基于云计算的电商商品查询推荐系统能够应对个性化、低延时的查询需求,体现了云环境下系统的并行处理能力与可靠性。