基于微博数据的电影票房预测研究

被引量 : 0次 | 上传用户:ww337799
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交网络的快速发展,越来越多的研究人员开始关注如何利用社交媒体数据预测现实社会将要发生的事件。社交媒体中蕴含着与用户思想、行为相关的海量数据,深入挖掘相关信息并将其应用到预测恐怖活动、国家选举、社会突发事件等热点问题正成为当前研究的热门课题之一,这类研究对指导政府行为、商业活动、生产生活都具有十分重要的意义。本文以微博数据预测电影票房为例,深入探究社交媒体预测现实事件的可行性和准确性。本文首先介绍了电影票房预测的研究背景和意义,并从早期预测和实时预测两方面分析了电影票房预测的研究现状。在后续的章节中,文章介绍了微博的发展历程和特点以及微博数据的抓取、清洗。然后我们提出了基于微博数量特征、情感强度和宣传营销特征等多项特征分量融合的预测输入模型,并引入多元线性回归模型、BP神经网络模型、支持向量机模型对预测输入模型的准确性进行验证。本文的主要研究内容和创新点如下:1.在微博数据清洗阶段,提出了去除僵尸粉、广告用户和临时用户的算法,有效减少异常数据,提高了预测精度;2.提出了基于情感强度的微博用户行为分析方法,将用户的情感倾向和情感的激烈程度相结合,更准确地判定用户对特定电影的喜好程度;3.对微博营销内容分析归类后提出将投资方、院线、演员的宣传行为作为重要的参考因素加入预测模型;4.在对微博特征分析分类的基础上,提出了基于数量特征、情感强度特征和宣传特征的多特征预测输入模型;5.针对微博中出现的异常数据,提出了改进的BP神经网络,在输入层和隐含层之间加入记忆层,减少异常数据对实验结果的影响,提高预测模型的容错能力。在实验仿真阶段,文章对影响票房的各个特征分量进行分析,找出其相关性,并对比分析不同预测模型和不同预测方法对预测准确度的影响。实验验证了本文提出的预测模型与现有预测方法相比具有较高的准确性和容错能力。同时实验得到一系列重要结论,对电影投资拍摄、影院排片和电影早期宣传营销等提供了理论指导。
其他文献
当今社会处于知识急剧膨胀和科技飞速发展的时代,知识更新周期变短,“活到老学到老”的终身学习成为人们普遍接受的一种学习理念。随着智能手机、平板电脑等智能手持终端的普
2005年9月浙江省开始推广应用农民信箱,开化县积极落实措施,宣传推广应用农民信箱。一是规范注册农民信箱用户,建立县、乡、村级联络体系;二是强化服务,扩大影响;三是重点培
Blog作为一种新的生活方式、新的工作方式和新的学习方式已经被越来越多的人所接受,并且它正在改变传统的网络和社会结构。采用MVC模式设计实现了一个简单的博客系统,让MVC模
随着经济的快速发展和综合国力的不断提高,股票投资逐渐成为人们生活中的重要组成部分,同时股价的预测也逐渐成为金融者们分析和研究的重点。股票市场是一种极其复杂的系统,
随着全球资源紧张,环境污染问题的日益严重,充分开发工业废弃物的二次利用价值,发展循环经济是解决该矛盾的一个有效途径。本文以硫酸法钛白粉生产时的工业副产绿矾为原料,利
多年以来,学界对泥质黑陶的关注大多聚焦于山东地区,少有对其它地区泥质黑陶的研究。本文以长江中下游流域为背景,从泥质黑陶的起源与发展,泥质黑陶的实用功能,泥质黑陶的社
超导电缆接头承担着电流在电缆之间的连接作用,是保证超导磁体稳定运行的关键技术之一,其性能直接影响着电缆与磁体的失超电流衰退率和运行稳定性。本文针对中科院近代物理研
随着海洋监视需求与日俱增,海洋监视技术发展受到越来越多国家的重视。星载合成孔径雷达(Synthetic Aperture Radar,SAR)已广泛应用于大范围海洋监视,特别地,其全天时、全天
随着我国社会经济的发展,城市化进程日益加剧,带来了环境污染等一系列社会问题。近年来,我国人民的生活水平不断提高,人们对室内装饰的要求也越来越高。各大城市人口急剧膨胀
随着我国工业化水平和人民生活水平的进一步提高,对电力需求不仅体现在数量上,而且对电能的质量要求愈来愈高。配网自动化是实时远程监视、控制、协调配电网终端上运行的各类