论文部分内容阅读
随着国民经济的飞速发展,人民生活水平不断提高,娱乐需求也不断上升。越来越多的观众选择走进电影院感受电影带来的视觉冲击和精神愉悦。国内电影市场因此极速扩张,吸引了越来越多的资本进入这一领域。但是电影作为文化产品,影响票房的不可控因素很多,投资回报率难以估计。因此提前预测一部电影的票房,并帮助电影相关方合理配置资源,降低投资风险具有重要的意义。互联网的飞速发展产生了大量和电影相关的网络数据,用其预测电影票房是票房预测领域结合信息技术领域的一个研究热点,也是本文的研究出发点。首先,文章在分析了国内外大量关于电影票房预测研究的基础上,提出了电影票房预测的基本流程和概念模型,并在此基础上研究了票房预测所需的相关理论与关键技术,包括常用预测模型、数据约简方法、聚类算法、数据获取技术,为之后的研究提供了理论以及技术指导。其次,在分析了票房影响因素以及新浪微博、百度搜索引擎、豆瓣电影网站三个网络平台特征的基础上,依据指标设计原则,建立了包括2个一级指标14个二级指标的票房预测指标体系,并逐个研究了指标的量化方法。再次,在分析了现有人工神经网络票房预测模型存在的问题之后,提出了RST-K-means-BP预测模型。该模型集成使用了BP神经网络、粗糙集理论和聚类分析三种数据处理方法,首先将通过粗糙集约简后的指标作为神经网络输入层节点,然后使用K-means聚类分析将样本数据分类,最后再针对不同的类别分别建立BP神经网络模型进行预测。这种结合删除了冗余属性,简化了神经网络结构,提升了网络的训练速度以及模型的预测精度。最后,文章使用从网络中获取的200条真实数据对RST-K-means-BP预测模型进行了实证分析,实验结果证明了RST-K-means-BP预测模型在预测精度和效率两方面较单一的BP神经网络模型都有了很大程度的提升。同时文章以某部未上映的电影为例,预测其最终票房,并对电影前期运营宣传工作提出了建议。应用实例表明本研究能够为电影相关方提供一定的决策支持,在预测领域具有较好的研究前景和应用价值。