论文部分内容阅读
电影首映日票房影响着电影院线首映日后的排片计划,直接影响后续放映日票房,对总票房有重要影响。没有准确的首映日票房预测,电影院线难以对首映日合理排片,易于出现当日高空座率或座位不足,进而影响总票房。映前一周是首映日票房预测和依据预测结果排片的重要时点。因此,提出适合于映前一周的首映日票房预测方法具有重要现实意义。在预测变量类别少,可用数据不足的情况下进行预测是映前首映日票房预测的难点。为实现对首映日票房预测,需要对映前电影票房影响因素和适用算法的研究。首映日票房预测是对电影票房预测方法和需求预测方法的丰富,具有一定理论意义。针对映前一周电影首映日票房预测做了以下3方面研究。首先提出映前电影竞争和消费意图的量化方法。与映后电影票房预测不同,电影映前未产生票房实际数据,也没有观众口碑信息。这两类数据是目前映后电影票房预测方法中最常用数据。因此,映前票房预测可使用的信息类别远少于映后预测。为解决这一问题,考虑将映前可获取的竞争和消费意图信息纳入预测变量。从档期内高票房电影和同类型电影出发,量化上映电影竞争;从社交网络用户显式和隐式消费意图出发,量化潜在观众消费意图。其次,提出一种考虑竞争和消费意图的结合Lasso和XGBoost算法的票房预测方法。在上述研究结果基础上结合电影基本信息,建立了映前电影首映日票房预测变量集。随后在票房预测中引入结合Lasso和XGBoost算法的票房预测算法。充分考虑电影竞争和消费意图带来预测变量增多,易产生过拟合和预测精度下降问题。为解决该问题,在变量选取阶段应用Adaptive-Lasso算法进行特征抽取,缩减预测变量维度,降低训练时间。在预测阶段应用XGBoost算法,提高预测精度和预测稳定性。利用收集的10部电影数据检验,结果表明,在消费意图识别中使用SVM模型和经领域迁移训练后的CIMM模型对社交网络中存在的电影消费意图有较好的判别准确性;提出的结合Lasso和XGBoost的电影首映日票房预测方法与多元线性回归,支持向量回归等传统电影票房预测方法相比,有5%以上的预测精度优势,同时拥有更低的运算耗费;考虑电影竞争和消费意图后的预测准确性高于未考虑的情形。实验结果证明基于竞争和消费意图的电影首映日票房预测方法更适用于电影首映日票房预测。