【摘 要】
:
在互联网飞速发展的今天,网络信息复杂繁多且越来越参差不齐,对于当前的图书出版机构来说,编辑人员的出版选题策划方式跟不上网络化发展,出版机构对图书出版市场分析不准,不
论文部分内容阅读
在互联网飞速发展的今天,网络信息复杂繁多且越来越参差不齐,对于当前的图书出版机构来说,编辑人员的出版选题策划方式跟不上网络化发展,出版机构对图书出版市场分析不准,不能满足用户个性化需求,使得消费者购书需求降低、图书库存负载、经济效益下降等问题。使用大数据技术发掘书籍的相关信息并提取和分析它必不可少。图书评价信息中存在消费者对图书产品特征的评价意见,如何得到图书评价信息并从图书评论中高效地提取到有价值的信息且进行个性化推荐成为本文的研究重点。本文提取了某网站的图书评论为数据来源,通过图书缺失数据填充,观点句识别,特征提取及对图书评论进行情感分析得到图书评论挖掘结果并通过个性化推荐,帮助消费者及生产商作出科学的决策。本文首先通过网络爬虫技术,抽取网站上的图书评论信息,构建原始评论数据集;使用提出的KIEM算法来填充具有缺失数据的原始评论数据集;利用细粒度情感分析方法,提出一个新的情感分析方法---情感推荐指数算法(ARIA),有针对性的选取出版物的评价对象及其属性分析读者情感倾向,充分考虑句子中没有明显的情感词,但是句子是隐形情感句对情感的影响,对有情感词的书评情感进行分析和无情感词的书评情感进行分析,并对情感倾向进行加权计算,得出读者对出版物正面,负面的评价数量,通过“引入权重值—加权求和—计算比值”的算法步骤,得出情感推荐指数。利用改进的推荐算法有效提高相似度的计算精度,解决数据稀疏性问题,达到提高推荐的精准度和个性化的目的,更精准的把握图书出版市场及用户需求,减少图书库存积压,实现出版物的更精准化,个性化推荐,增加出版产业经济效益。
其他文献
本文从装备培训需求出发,通过分析受训人员的KSA能力,采用问卷调查和专家分析法确定受训人员能力评价的维度及其要素,并通过特征值法确定受训人员能力评价维度及要素的权重,
随着社会的进步和时代的发展,互联网已经成为当今社会的一个时代标志。各行各业在大数据时代都要顺应时代发展不断革新,作为企业管理中最重要的人力资源管理也迎来了新的机遇
按照绩效标准阐述了顶尖科技创新人才的概念,分析了顶尖科技创新人才的成长规律。文中指出,顶尖科技创新人才的成长取决于主观能动因素和客观积极因素的共同作用。
蒸汽驱是胜利油田稠油油藏提高采收率的有效手段,由于条件差异大,蒸汽驱生产效果相差大。为进一步推广应用蒸汽驱技术,总结了胜利油田蒸汽驱特点,明确了胜利蒸汽驱主控因素包
全球变暖背景下区域气候变化响应已引起学术界的高度关注,将气候变化与干旱趋势相结合进行研究具有理论意义。利用衡阳盆地1981-2013年的逐日气温和降水量,综合分析衡阳盆地的
国内近年出版的有关英语修辞与写作的书籍不少,在谈比喻修辞时大都仅限于分类界说,举例说明。这种静态、孤立的处理易使读者误认为比喻修辞不过如此肤浅。其实,比喻修辞是一
股利分配政策是公司财务管理的重要内容之一,在股份制企业经营决策中占有重要地位。合理的股利分配政策不仅是保证证券市场对投资者具有持续吸引力的关键,而且有利于上市公司
提出了以加速度计和磁传感器为测量元件进行角度测量的方法,并对该测量方法的原理进行了探讨,同时对油井侧斜原理中关键的俯仰角及横滚角的拾取方向进行了仿真,结果表明,这种角度
非正式组织作为一种松散、自由、不正式的组织,广泛存在于企业内部。它是否会对其成员的行为、态度和工作效率乃至对成员工作绩效产生影响,这亟待研究。鉴于此,通过对企业内
近年来,由于在汽车装配中采用了撞击式螺母拆装机,而这种机具有时不能保证装配质量,因此车轮螺母松动甚至甩轮的事故时有发生。为了防止这类事故,我单位采取了一些措施,现介