论文部分内容阅读
大数据是当前技术应用与研究的热点内容,实质是从数据层面对价值信息进行挖掘和分析,而信息是投资者进行投资活动的重要依据和基本前提。随着技术的发展,我们能够获取的数据越来越多,精确程度也不断提高,从分钟数据到高频甚至超高频逐笔数据,这不仅仅是缩短了数据的时间间隔,最重要的是将所有的交易信息包含在数据中,对数据的深入挖掘和分析,将能够最大程度地反映信息融入市场的过程,并体现投资者进行交易的过程及不同投资者之间的相互影响,为价格发现提供了更为准确的研究依据。除了市场交易本身反映的信息价值外,投资者都身处互联网时代,网络信息对投资者也产生了巨大影响,同时也是投资者获取信息的主要途径,媒体报道的信息将直接影响大多数投资者的投资行为,投资者对网络信息的关注直接反应了投资者预期和交易偏好,大数据技术的发展,使得我们可以从这些纷繁复杂的海量互联网数据中获取重要的价值信息,这对于揭示投资者行为有重要意义。本文以大数据作为新的研究方向,从市场微观结构、行为金融学、投资者有限注意等理论出发,研究了日内高频数据反映的信息结构,并通过挖掘互联网数据对投资者行为与资产价格关系进行分析。具体内容主要是以下四个方面:第一部分,知情交易对资产价格行为的影响。首先,通过知情交易刻画中国市场的信息非对称情况,并初步研究非对称信息下投资者行为与资产价格行为。研究以存款准备金率变动的公告日期为研究事件,通过对平衡交易和非平衡交易建模,将PIN的测度精确到日内,考察股票市场中知情交易与非知情交易到达率的相互影响,并研究事件前后知情交易者和非知情交易者的投资行为的变化过程,在研究过程中对不同规模的公司进行了检验。第二部分,投资者关注度与IPO抑价的影响研究。基于中国股票市场的新股发行抑价现象,通过IPO前后互联网数据的变化情况,确定投资者关注度大小,并针对IPO前高关注度的股票检验了上市后股票收益的变化情况,分析了两者之间的关联性,进一步确定了投资者关注对股票价格的影响时间,以此验证互联网信息对IPO抑价的解释能力和影响程度。第三部分,媒体信息对股票收益的影响研究。考察了互联网信息对股票收益的影响,并分别对交易时间和非交易时间的影响程度进行了比较。首先,建立了一套较完整的互联网数据挖掘系统,对主要证券信息的网站内容进行了抓取,并进行了结构化存储,依据研究的关注点确定了检索关键词和媒体关注度的测度方法。然后,针对不同规模的公司比较了每日媒体关注度与收益之间的关系,并在此基础上对互联网数据进行了细化,精确到分钟,按照交易时间和非交易时间对信息进行了分类,研究两者对股票收益的影响程度。在研究过程中还对比了抓取数据与百度指数间的一致性,以验证抓取数据是否能够体现投资者关注,及其准确性。第四部分,分析师关注度与投资者交易行为。首先对分析师评级报告类型和内容进行分类,并构造静态面板,研究深度报告和一般报告中个股的下一期收益情况,观察中国市场上投资者关注对评级报告内容的选择,同时分析投资者在评级报告发布后的交易行为,并对该行为是否能够造成对股票市场的波动以及影响程度进行研究,为更清晰的认识投资者交易行为和进行市场监管决策提供依据。