【摘 要】
:
针对使用网络购物搜索量数据建立预测模型时的变量选择问题,提出一种基于连续小波变换(CWT)及其逆变换的聚类方法。算法充分考虑了搜索量的数据特征,将原始序列分解成为不同
【基金项目】
:
天津哲学社会科学规划项目(TJTJ13-002)
论文部分内容阅读
针对使用网络购物搜索量数据建立预测模型时的变量选择问题,提出一种基于连续小波变换(CWT)及其逆变换的聚类方法。算法充分考虑了搜索量的数据特征,将原始序列分解成为不同时间尺度下的周期成分,并重构为输入向量。在此基础上通过加权模糊C均值(FCM)方法进行聚类。变量选择是根据聚类后每个分类中的关键词隶属度函数值确定的,选择效果通过我国居民消费价格指数(CPI)的预测模型进行验证。结果表明,搜索量序列具有不同长度的周期成分,聚类后同组关键词具有明显的商品类型一致性。与其他变量选择方法相比,基于小波重构序列聚类的预测模型具有更高的预测精度,单步和三步预测相对误差仅为0.389 1%和0.543 7%,预测变量也具有清晰的经济含义,因此特别适用于解决大数据背景下高维预测模型的变量选择问题。
其他文献
掌握新闻获取方式与采访技巧是记者高质量完成采访任务的必要手段。记者不但要从政治嗅觉,网络技术、观察生活等方面获取新闻线索,更要在采访中要与采访对象之间形成有效的交
橡胶挤出机的温度控制直接影响着挤出制品的性能和质量,精确测控挤出过程的温度能够有效降低能源消耗、提高生产效率和延长挤出设备的连续工作周期等。随着橡胶工业的持续发
传统基于载荷分析和流量监测的DNS隧道检测手段误报率高且不能有效应对新型DNS隧道木马,为此提出一种基于通信行为分析的DNS隧道木马检测方法.从DNS会话的视角对比分析DNS隧
日前,国家质检总局、国家标准委发布新版《快递封装用品》系列国家标准,此次发布的新标准,根据减量化、绿色化、可循环要求,对原有标准的相关方面进行了补充完善,其中的绿色
教育叙事研究自20世纪90年代被介绍到中国以来,无论是理论界还是实践界皆有许多人参与,在中国形成叙事研究的热潮。一些学者认为探究普适性教育规律的教育科学研究疏离了教育
本文采用文献资料法和逻辑分析法,站在政府环境行为立场上,从生态环境的经济特性角度对丹江口水源地生态敏感区生态环境建设存在问题的原因进行探究分析,并提出相关思路与建
<正>猪蓝耳病(PRRS)于1987年在养猪业发达国家发生,现已遍及全球。我国于1996年由哈尔滨兽医研究所首次分离到蓝耳病病毒(PRRSV),从而证实了本病在我国的存在。十几年来,蓝耳
酚类化合物作为一类重要的化学工业基本原料,被应用于各种工业制造中,在焦化、煤气、化工等行业中都会产生大量含酚废水,是一类典型的有机污染物。由于含酚废水来源广、数量大、
<正>经外周静脉穿刺的中心静脉导管(PICC)是由外周静脉(贵要静脉、肘正中静脉、头静脉)穿刺插管,并使其头端位于上腔静脉或锁骨下静脉内的深静脉导管植入术。PICC可用于:(1)
目的:回顾分析2009—2011年我院住院患者氟喹诺酮类药应用及耐药情况,促进合理用药。方法:调查2009—2011年我院氟喹诺酮类药用药量、用药金额、用药频度(DDDs)、耐药情况等,