基于互联网金融异构信息挖掘的热点发现与追踪

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:SBRBWD0801
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,沪深A股市场上涌现出了许多热点概念,例如2015年上半年期间,“国企改革”、“互联网金融”、“一带一路”、“沪港通”等概念相继成为热点并频繁出现。相关个股在某一概念、热点背景下,往往在短期内有较好的市场表现。如何抓住这种市场上的热点、概念带来的投资机会,是量化研究领域非常关心的问题。本课题围绕A股市场热点发现这一问题,从互联网海量金融数据中挖掘出当前市场的热点个股以及相关板块,追踪市场热点的发展过程,并向投资者提供有价值的市场信息。本课题研究的主要内容如下:互联网金融异构信息获取及预处理:主要分为三大类信息,第一类是A股实时行情数据,主要包括A股市场股票的每日价格涨跌和成交量;第二类是A股财务信息及板块分类;第三类是个股舆情数据,主要包括新闻数据和股吧数据。获取这些数据后,通过进一步去噪,优化,提炼等处理,将原始的非结构化的金融数据处理为结构化数据,为后续系统的构建提供准确的数据保障。基于排名聚合算法的热点发现:本文把市场热点发现问题转化为排名聚合问题,从市场的热度信息中挖掘热度指标,将热度指标转化为热度排名,并采用排名聚合方法将众多的热度排名转化为综合热度排名,从热度排名信息中发现市场热点。本文主要研究了一类基于无监督的排名聚合算法,并从行情、股吧、新闻三个维度进行热度计算,搭建了一套完善且有效的热点发现模块。基于时间序列预测方法的热点追踪:完成热点发现模块后,从热度时间序列信息出发,研究市场上的热点变化规律。根据历史热度序列去预测未来热度序列正是时间序列预测所研究的内容。本文主要研究了时间序列预测方法和排名学习方法在热点追踪问题中的应用。综上所述,本文使用数据挖掘技术从海量金融数据中挖掘当前市场正在炒作的热点个股以及相关板块,追踪市场热点的发展过程,并向投资者提供有价值的市场信息。
其他文献
目的探讨连续性肾脏替代疗法(CRRT)的护理。方法在1999年1月至2001年5月期间对18例急性肾功能衰竭(ARF)和多脏器衰竭(MSOF)患者,利用CRRT治疗,做好防止出血、感染、管路阻塞等
运用功能强大的CAE软件——ANSYS对MG32t-38m龙门起重机进行模态分析;通过模态分析,从静态和动态两个方面对起重机进行评价,以验证龙门起重机是否满足刚度设计基本要求及安全性
“《‘无废城市’建设试点工作方案》印发以来,各省积极推荐‘无废城市’候选城市,我部会同相关部门筛选确定了11个城市作为‘无废城市’建设试点,分别为广东省深圳市、内蒙
本文通过对双向轮内套的工艺性分析、加工工艺的制定和相关的数控加工程序的编写,以及对加工过程中精度达不到要求的原因进行了分析,为今后加工轮内套提供了质量保证。
本试验旨在评定初花期多花黑麦草在生长肉兔上的营养价值。试验选取60日龄平均体重(2.20±0.32)kg的健康新西兰兔24只,随机分为2组,每组12个重复,每个重复1只。试验饲粮采用
国内外文献报告,急性心肌梗塞约30%有恶心、呕吐、便秘、腹胀,而胃膨胀、腹部积气,又可使冠脉血流减少,加重心肌梗塞,造成恶性循环。因此,治疗肠胀气、腹胀,不仅是治标,亦为
期刊